JP2021003108A - 癌の状態を判定する方法とシステム - Google Patents

癌の状態を判定する方法とシステム Download PDF

Info

Publication number
JP2021003108A
JP2021003108A JP2020128392A JP2020128392A JP2021003108A JP 2021003108 A JP2021003108 A JP 2021003108A JP 2020128392 A JP2020128392 A JP 2020128392A JP 2020128392 A JP2020128392 A JP 2020128392A JP 2021003108 A JP2021003108 A JP 2021003108A
Authority
JP
Japan
Prior art keywords
cancer
tumor
biological sample
methylation
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020128392A
Other languages
English (en)
Inventor
チャン,カン
Kang Zhang
ホウ,ルイ
Rui Hou
チェン,リャンホン
Lianghong Zheng
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Youhealth Biotech Inc
University of California
Original Assignee
Youhealth Biotech Inc
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Youhealth Biotech Inc, University of California filed Critical Youhealth Biotech Inc
Publication of JP2021003108A publication Critical patent/JP2021003108A/ja
Priority to JP2022024038A priority Critical patent/JP2022078120A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

【課題】個体の癌種を判定するための方法及びキットの提供。【解決手段】個体の生体サンプルからメチル化プロファイルを作成する方法であって、メチル化プロファイルは、バイオマーカーのデータを含み、方法は、(a)メチル化プロファイルのバイオマーカーについて生体サンプルから由来する処理されたゲノムDNAのメチル化状態を検出する工程と、(b)メチル化プロファイルのバイオマーカーの検出されたメチル化状態に基づいてメチル化プロファイルを生成する工程と、を含む、方法。【選択図】図1A

Description

本出願は、2015年1月18日に出願された米国仮出願第62/104,785号の利益を主張し、2015年12月31日に出願された米国出願第14/986,520号の継続出願である。両出願は参照により本明細書に組み込まれる。
<配列表>
本出願は配列表を含んでおり、これはEFS−WebによってASCIIフォーマットで提出されており、参照により全体として本明細書に組み込まれる。上記のASCIIコピーは2016年1月12日に作成され、49697−701.601_SL.txtと命名され、846キロバイトのサイズがある。
癌は世界の死因の第一位であり、年間の症例は2012年の1400万から今後20年間で2200万まで増加すると予想されている(WHO)。場合によっては、診断方法は、患者が既に症状を呈した後になって初めて始まり、高価で、侵襲性で、かつ時間を消費する手順となる。加えて、到達できない領域があるため正確な診断が妨げられることが往々にしてある。さらに、癌の高い病的状態と死亡率は診断の遅さと関連している。
本明細書では、ある実施形態において、個体の癌種を判定するための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが開示されている。いくつかの実施形態において、本明細書では、癌の早期発見のための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが記載されている。追加の実施形態において、本明細書では、癌の非侵襲的検出のための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが記載されている。さらなる追加の実施形態において、本明細書では、様々な癌の段階の識別のための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが記載されている。他の実施形態において、本明細書では、個体の癌の予後の判定、処置応答の予測、および処置応答のモニタリングのための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが記載されている。さらなる実施形態において、本明細書では、CpGメチル化プロファイルデータベースの生成と、CpGメチル化データを生成する際に使用されるプローブのための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが記載されている。
本明細書では、ある実施形態において、癌CpGメチル化プロファイルデータベースの生成のためにCpG癌メチル化データを利用するためのコンピューティングプラットフォームが開示され、コンピューティングプラットフォームは、
(a)プロセッサ、メモリモジュール、オペレーティングシステム、および、生体サンプルのセットからCpGメチル化データを生成するためのデータ収集アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムを含む第1のコンピューティングデバイスを含み、
データ収集アプリケーションが、
(1)生体サンプルのセットからCpGメチル化データを生成するために配列決定装置を作動させるように構成された配列決定モジュールであって、上記セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、配列決定モジュールと、
(2)データ受信モジュールとを含み、
該データ受信モジュールは、
(i)第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットであって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルは同じ生体サンプル源に由来する、第1のペアのCpGメチル化データセット;
(ii)第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットであって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、第2のペアのCpGメチル化データセット;および、
(iii)第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットであって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、第3のペアのCpGメチル化データセットを、受け取るように構成され、
上記コンピューティングプラットフォームは、
(b)プロセッサ、メモリモジュール、オペレーティングシステム、および癌CpGメチル化プロファイルデータベースを生成するためのデータ分析アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムを含む第2のコンピューティングデバイスを含み、
データ分析モジュールを含むデータ分析アプリケーションが、
(1)第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットからペアワイズのメチル化差異データセットを生成するように、および、
(2)癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析するように、構成され、
(i)機械学習法は、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、
(ii)癌CpGメチル化プロファイルデータベースはCpGメチル化プロファイルのセットを含み、CpGメチル化プロファイルはそれぞれ癌種を表す。
いくつかの実施形態において、ペアワイズのメチル化差異データセットを生成することは、(a)第1のペアのデータセット内の第1のデータセットと第2のデータセットの間の差を算出すること;(b)第2のペアのデータセット内の第3のデータセットと第4のデータセットの間の差を算出すること;および(c)第3のペアのデータセット内の第5のデータセットと第6のデータセットの間の差を算出すること、を含む。いくつかの実施形態において、ペアワイズのメチル化差異データセットを生成することは、さらに第1のペアのデータセットの算出された差、第2のペアのデータセットの算出された差、および第3のペアのデータセットの算出された差に基づく。
いくつかの実施形態では、機械学習法は半教師あり学習法、または教師なし学習法を含む。いくつかの実施形態では、機械学習法は、以下の1つ以上から選択されたアルゴリズムを利用する:主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデル。
いくつかの実施形態では、CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される。いくつかの実施形態では、データ分析モジュールは、CpGメチル化データを生成するために次世代配列決定方法によって抽出されたゲノムDNAを分析するようにさらに構成される。いくつかの実施形態では、次世代配列決定方法は、デジタルPCR配列決定方法である。
いくつかの実施形態では、メチル化プロファイルは、表15−18からなる群から選択された、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表15からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表16からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表17からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表18からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。
いくつかの実施形態において、メチル化プロファイルは、以下から選択される少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、または200以上のバイオマーカーを含む:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。
いくつかの実施形態では、メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む。いくつかの実施形態において、メチル化プロファイルは、以下から選択される、少なくとも10、20、30、40、50、または100以上のバイオマーカーを含む:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044。
いくつかの実施形態では、メチル化プロファイルは、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から選択された少なくとも1、2、3、または4つのバイオマーカーを含む。
いくつかの実施形態では、癌種は固形癌タイプまたは血液系悪性癌種である。いくつかの実施形態では、癌種は転移癌種、または再発性あるいは難治性癌種である。いくつかの実施形態では、癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍、びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む。いくつかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄性白血病、膀胱癌、乳癌、脳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、消化器癌、神経膠腫、神経膠芽腫、頭頚部癌、腎癌、肝臓癌、肺癌、リンパ性腫瘍形成、黒色腫、骨髄性腫瘍、卵巣癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。いくつかの実施形態では、癌種は、膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。
いくつかの実施形態では、対照データセットはメチル化プロファイルのセットを含み、各々の上記メチル化プロファイルは、知られている癌種から得られた生体サンプルから生成される。
いくつかの実施形態では、生体サンプルは無細胞の生体サンプルを含む。いくつかの実施形態では、生体サンプルは循環腫瘍DNAサンプルを含む。いくつかの実施形態では、生体サンプルは生検サンプルを含む。いくつかの実施形態では、生体サンプルは組織サンプルを含む。
いくつかの実施形態では、プロセッサと、メモリモジュールと、機械可読命令を実行するように構成されたオペレーティングシステムと、および癌CpGメチル化プロファイルデータベースを生成するための分析アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムとを含む、コンピューティングシステムが本明細書に記載され、分析アプリケーションが、
(a)以下を受け取るように構成されたデータ受信モジュール:
(1)第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットであって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、第1のペアのCpGメチル化データセット;
(2)第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットであって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、第2のペアのCpGメチル化データセット;および、
(3)第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットであって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、第3のペアのCpGメチル化データセット;ならびに、
(b)
(1)第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットからペアワイズのメチル化差異データセットを生成する;および、
(2)癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する、ように構成されたデータ分析モジュールを含み、
(i)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、
(ii)癌CpGメチル化プロファイルデータベースはCpGメチル化プロファイルのセットを含み、CpGメチル化プロファイルはそれぞれ癌種を表す。
本明細書では、ある実施形態において、癌CpGメチル化プロファイルデータベースを生成するためのコンピュータにより実施される方法が開示され、
該方法は、
a.配列決定方法によって生体サンプルのセットからCpGメチル化データを生成する工程であって、セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
b.第1のプロセッサを用いて、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットを取得する工程であって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、工程と、
c.第1のコンピューティングデバイスを用いて、第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットを取得する工程であって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
d.第1のコンピューティングデバイスを用いて、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットを取得する工程であって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、工程と、
e.第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットから、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成する工程と、
f.癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する工程を含み、
(1)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、および、
(2)癌CpGメチル化プロファイルデータベースは、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す。
いくつかの実施形態では、工程e)はさらに、(a)第1のペアのデータセット内の第1のデータセットと第2のデータセットの間の差を算出すること、(b)第2のペアのデータセット内の第3のデータセットと第4のデータセットの間の差を算出すること、および(c)第3のペアのデータセット内の第5のデータセットと第6のデータセットの間の差を算出すること、を含む。いくつかの実施形態では、工程e)は、第1のペアのデータセットの算出された差、第2のペアのデータセットの算出された差、および第3のペアのデータセットの算出された差から、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成することをさらに含む。
いくつかの実施形態では、機械学習法は半教師あり学習法、または教師なし学習法を含む。いくつかの実施形態では、機械学習法は、以下の1つ以上から選択されたアルゴリズムを利用する:主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデル。
いくつかの実施形態では、CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される。
いくつかの実施形態では、メチル化プロファイルは、表15−18からなる群から選択された、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表15からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表16からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表17からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表18からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。
いくつかの実施形態において、メチル化プロファイルは、以下から選択される少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、または200以上のバイオマーカーを含む:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。
いくつかの実施形態では、メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む。いくつかの実施形態において、メチル化プロファイルは、以下から選択される少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、または100以上のバイオマーカーを含む:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044。
いくつかの実施形態では、メチル化プロファイルは、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から選択された少なくとも1、2、3、または4つのバイオマーカーを含む。
いくつかの実施形態では、癌種は固形癌タイプまたは血液系悪性癌種である。いくつかの実施形態では、癌種は再発性または難治性の癌種である。いくつかの実施形態では、癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍、びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む。いくつかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄性白血病、膀胱癌、乳癌、脳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、消化器癌、神経膠腫、神経膠芽腫、頭頚部癌、腎癌、肝臓癌、肺癌、リンパ性腫瘍形成、黒色腫、骨髄性腫瘍、卵巣癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。いくつかの実施形態では、癌種は、膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。
いくつかの実施形態では、対照データセットはメチル化プロファイルのセットを含み、各々の上記メチル化プロファイルは、知られている癌種から得られた生体サンプルから生成される。
いくつかの実施形態では、生体サンプルは無細胞の生体サンプルを含む。いくつかの実施形態では、生体サンプルは循環腫瘍DNAサンプルを含む。いくつかの実施形態では、生体サンプルは生検サンプルを含む。いくつかの実施形態では、生体サンプルは組織サンプルを含む。
いくつかの実施形態では、個体の癌診断のコンピュータにより実施される方法が本明細書で記載されており、
該方法は、
a.第1のプロセッサを用いて、第4の癌の生体サンプルと第4の正常な生体サンプルから生成された第4のペアのCpGメチル化データセットを取得する工程であって、第4の癌の生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第7のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第8のデータセットを形成し、および第4の癌の生体サンプルと第4の正常な生体サンプルが同じ生体サンプル源に由来する、工程、
b.第1のプロセッサを用いて、第5の正常な生体サンプルと第6の正常な生体サンプルから生成された第5のペアのCpGメチル化データセットを取得する工程であって、第5の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第9のデータセットを形成し、第6の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第10のデータセットを形成し、および第4の正常な生体サンプル、第5の正常な生体サンプル、および第6の正常な生体サンプルが異なる、工程、
c.第1のプロセッサを用いて、第5の癌の生体サンプルと第6の癌の生体サンプルから生成された第6のペアのCpGメチル化データセットを取得する工程であって、第5の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第11のデータセットを形成し、第6の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第12のデータセットを形成し、および第4の癌の生体サンプル、第5の癌の生体サンプル、および第6の癌の生体サンプルが異なる、工程、
d.第2のプロセッサを用いて、第4のペアのデータセット、第5のペアのデータセット、第6のペアのデータセットから第2のペアワイズのメチル化差異データセットを生成する工程、および、
e.上記の癌CpGメチル化プロファイルデータベースを用いて、第2のペアワイズのメチル化差異データセットを分析する工程であって、第2のペアワイズのメチル化差異データセットと癌CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルとの間の相関は、個体の癌種を判定する、工程、を含む。
いくつかの実施形態では、第1のプロセッサは第1のコンピューティングデバイス上にあり、第2のプロセッサは第2のコンピューティングデバイス上にある。いくつかの実施形態では、方法は診断された癌種に基づいた処置レジメンを実行する工程をさらに含む。
いくつかの実施形態において、本明細書では、個体において原発腫瘍を転移癌と区別する、コンピュータにより実施される方法が記載されており、
該方法は、
a.第1のプロセッサを用いて、第4の癌の生体サンプルと第4の正常な生体サンプルから生成された第4のペアのCpGメチル化データセットを取得する工程であって、第4の癌の生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第7のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第8のデータセットを形成し、および第4の癌の生体サンプルと第4の正常な生体サンプルが同じ生体サンプル源に由来する、工程、
b.第1のプロセッサを用いて、第5の正常な生体サンプルと第6の正常な生体サンプルから生成された第5のペアのCpGメチル化データセットを取得する工程であって、第5の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第9のデータセットを形成し、第6の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第10のデータセットを形成し、および第4の正常な生体サンプル、第5の正常な生体サンプル、および第6の正常な生体サンプルが異なる、工程、
c.第1のプロセッサを用いて、第5の癌の生体サンプルと第6の癌の生体サンプルから生成された第6のペアのCpGメチル化データセットを取得する工程であって、第5の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第11のデータセットを形成し、第6の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第12のデータセットを形成し、および第4の癌の生体サンプル、第5の癌の生体サンプル、および第6の癌の生体サンプルが異なる、工程、
d.第2のプロセッサを用いて、第4のペアのデータセット、第5のペアのデータセット、第6のペアのデータセットから第2のペアワイズのメチル化差異データセットを生成する工程、および、
e.上記の癌CpGメチル化プロファイルデータベースを用いて、第2のペアワイズのメチル化差異データセットを分析する工程であって、第2のペアワイズのメチル化差異データセットと癌CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルとの間の相関は、個体において原発腫瘍を転移癌と区別する、工程、を含む。
いくつかの実施形態では、本明細書において、個体の癌の進行をモニタリングする、コンピュータにより実施される方法が記載されており、
該方法は、
a.第1のプロセッサを用いて、第4の癌の生体サンプルと第4の正常な生体サンプルから生成された第4のペアのCpGメチル化データセットを取得する工程であって、第4の癌の生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第7のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第8のデータセットを形成し、第4の癌の生体サンプルと第4の正常な生体サンプルが同じ生体サンプル源に由来する、工程、
b.第1のプロセッサを用いて、第5の正常な生体サンプルと第6の正常な生体サンプルから生成された第5のペアのCpGメチル化データセットを取得する工程であって、第5の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第9のデータセットを形成し、第6の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第10のデータセットを形成し、および第4の正常な生体サンプル、第5の正常な生体サンプル、および第6の正常な生体サンプルが異なる、工程、
c.第1のプロセッサを用いて、第5の癌の生体サンプルと第6の癌の生体サンプルから生成された第6のペアのCpGメチル化データセットを取得する工程であって、第5の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第11のデータセットを形成し、第6の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第12のデータセットを形成し、および第4の癌の生体サンプル、第5の癌の生体サンプル、および第6の癌の生体サンプルが異なる、工程、
d.第2のプロセッサを用いて、第4のペアのデータセット、第5のペアのデータセット、第6のペアのデータセットから第2のペアワイズのメチル化差異データセットを生成する工程、および、
e.上記の癌CpGメチル化プロファイルデータベースを用いて、第2のペアワイズのメチル化差異データセットを分析する工程であって、第2のペアワイズのメチル化差異データセットと癌CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルとの間の相関は、個体において癌が進行しているかどうかを示す、工程を含む。
いくつかの実施形態では、個体は、第1の癌の生体サンプルと第1の正常な生体サンプルを受ける前に処置を受けた。
いくつかの実施形態では、本明細書において、個体の癌の進行を判定する、コンピュータにより実施される方法が記載されており、
該方法は、
a.第1のプロセッサを用いて、第4の癌の生体サンプルと第4の正常な生体サンプルから生成された第4のペアのCpGメチル化データセットを取得する工程であって、第4の癌の生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第7のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第8のデータセットを形成し、第4の癌の生体サンプルと第4の正常な生体サンプルが同じ生体サンプル源に由来する、工程、
b.第1のプロセッサを用いて、第5の正常な生体サンプルと第6の正常な生体サンプルから生成された第5のペアのCpGメチル化データセットを取得する工程であって、第5の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第9のデータセットを形成し、第6の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第10のデータセットを形成し、および第4の正常な生体サンプル、第5の正常な生体サンプル、および第6の正常な生体サンプルが異なる、工程、
c.第1のプロセッサを用いて、第5の癌の生体サンプルと第6の癌の生体サンプルから生成された第6のペアのCpGメチル化データセットを取得する工程であって、第5の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第11のデータセットを形成し、第6の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第12のデータセットを形成し、および第4の癌の生体サンプル、第5の癌の生体サンプル、および第6の癌の生体サンプルが異なる、工程、
d.第2のプロセッサを用いて、第4のペアのデータセット、第5のペアのデータセット、第6のペアのデータセットから第2のペアワイズのメチル化差異データセットを生成する工程、および、
e.上記の癌CpGメチル化プロファイルデータベースを用いて、第2のペアワイズのメチル化差異データセットを分析する工程であって、第2のペアワイズのメチル化差異データセットと癌CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルとの間の相関は、個体における癌の予後を決定する、工程を含む。
いくつかの実施形態では、癌の予後は癌の段階に相関する。いくつかの実施形態では、癌の予後は癌の段階に相関しない。いくつかの実施形態では、癌の予後は、個体において処置反応が出る可能性を示す。
本明細書では、ある実施形態において、複数のプローブを含むプローブパネルが開示され、各プローブは式Iのプローブであり、
式中、
Aは第1の標的結合領域であり、
Bは第2の標的結合領域であり、および、
Lはリンカー領域であり、
Aは、SEQ ID NOs:1−1775から選択された配列の5’末端から位置1で始まる少なくとも30の連続的なヌクレオチドに対して少なくとも70%、80%、90%、95%、または99%の配列同一性を有し、
Bは、SEQ ID NOs:1−1775から選択された同じ配列の3’末端から位置1’で始まる少なくとも12の連続的なヌクレオチドに対して少なくとも70%、80%、90%、95%、または99%の配列同一性を有し、
LはAに結合し、および、
BはAまたはLのいずれかに結合する。
いくつかの実施形態では、LはAに結合し、BはLに結合する。いくつかの実施形態では、複数のプローブは少なくとも10、20、30、50、または100以上のプローブを含む。いくつかの実施形態では、複数のプローブは、CpGメチル化データを生成するために溶液ベースの次世代の配列決定反応に使用される。いくつかの実施形態では、溶液ベースの次世代の配列決定反応は、小滴デジタルPCR配列決定方法である。いくつかの実施形態では、各プローブはCpG部位に相関する。いくつかの実施形態では、Lは10−60、15−55、20−50、25−45、ならびに30−40のヌクレオチド長さである。いくつかの実施形態では、Lはさらにアダプター領域を含む。いくつかの実施形態では、アダプター領域は、各プローブを識別するために使用される配列を含む。
本明細書では、ある実施形態において、命令が保存される非一時的なコンピュータ可読媒体が開示され、非一時的なコンピュータ可読媒体は、プロセッサによって実行されるとき、以下を含む工程を行う:
a.配列決定方法によって生体サンプルのセットからCpGメチル化データを生成する工程であって、セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
b.第1のプロセッサを用いて、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットを取得する工程であって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、工程と、
c.第1のコンピューティングデバイスを用いて、第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットを取得する工程であって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
d.第1のコンピューティングデバイスを用いて、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットを取得する工程であって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、工程と、
e.第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットから、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成する工程と、
f.癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する工程であって、
(1)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、および、
(2)癌CpGメチル化プロファイルデータベースは、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す、工程。
いくつかの実施形態では、工程e)はさらに、(a)第1のペアのデータセット内の第1のデータセットと第2のデータセットの間の差を算出すること、(b)第2のペアのデータセット内の第3のデータセットと第4のデータセットの間の差を算出すること、および(c)第3のペアのデータセット内の第5のデータセットと第6のデータセットの間の差を算出すること、を含む。いくつかの実施形態では、工程e)は、第1のペアのデータセットの算出された差、第2のペアのデータセットの算出された差、および第3のペアのデータセットの算出された差から、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成することをさらに含む。
いくつかの実施形態では、機械学習法は半教師あり学習法、または教師なし学習法を含む。いくつかの実施形態では、機械学習法は、以下の1つ以上から選択されたアルゴリズムを利用する:主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデル。
いくつかの実施形態では、CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される。
いくつかの実施形態では、メチル化プロファイルは、表15−18からなる群から選択された、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表15からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表16からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表17からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。いくつかの実施形態では、メチル化プロファイルは、表18からなる群から選択された、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、または100のバイオマーカーを含む。
いくつかの実施形態において、メチル化プロファイルは、以下から選択される少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、または200以上のバイオマーカーを含む:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。
いくつかの実施形態では、メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む。いくつかの実施形態において、メチル化プロファイルは、以下から選択される少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、または100以上のバイオマーカーを含む:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044。
いくつかの実施形態では、メチル化プロファイルは、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から選択された少なくとも1、2、3、または4つのバイオマーカーを含む。
いくつかの実施形態では、癌種は固形癌タイプまたは血液系悪性癌種である。いくつかの実施形態では、癌種は再発性または難治性の癌種である。いくつかの実施形態では、癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍、びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む。いくつかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄性白血病、膀胱癌、乳癌、脳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、消化器癌、神経膠腫、神経膠芽腫、頭頚部癌、腎癌、肝臓癌、肺癌、リンパ性腫瘍形成、黒色腫、骨髄性腫瘍、卵巣癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。いくつかの実施形態では、癌種は、膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。
いくつかの実施形態では、対照データセットはメチル化プロファイルのセットを含み、各々の上記メチル化プロファイルは、知られている癌種から得られた生体サンプルから生成される。
いくつかの実施形態では、生体サンプルは無細胞の生体サンプルを含む。いくつかの実施形態では、生体サンプルは循環腫瘍DNAサンプルを含む。いくつかの実施形態では、生体サンプルは生検サンプルを含む。いくつかの実施形態では、生体サンプルは組織サンプルを含む。
本明細書において、ある実施形態では、個体における癌の存在を判定する方法が開示され、該方法は、(a)脱アミノされたヌクレオチドを含む処置されたゲノムDNAを生成するために、抽出されたゲノムDNAを脱アミノ化剤で処理する工程であって、抽出されたゲノムDNAが個体からの生体サンプルから得られる、工程、(b)処置されたゲノムDNAからの表20から選択された1つ以上のバイオマーカーを含むメチル化プロファイルを生成する工程、および、(c)メチル化プロファイルを対照と比較する工程であって、メチル化プロファイルと対照との間の相関が個体における癌の存在を判定する、工程、を含む。
いくつかの実施形態では、メチル化プロファイルは、表15−18から選択された1つ以上のバイオマーカーをさらに含む。
いくつかの実施形態では、メチル化プロファイルは、以下から選択された1つ以上のバイオマーカーをさらに含む:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。
いくつかの実施形態において、比較する工程は、(i)第1の正常なサンプルのメチル化プロファイルと処置されたゲノムDNAのメチル化プロファイルとの間の第1の差;(ii)第2の正常なサンプルのメチル化プロファイルと第3の正常なサンプルのメチル化プロファイルとの間の第2の差;および、(iii)第1の原発性癌サンプルのメチル化プロファイルと第2の原発性癌サンプルのメチル化プロファイルとの間の第3の差、を含むペアワイズのメチル化差異データセットを生成する工程をさらに含む。いくつかの実施形態において、比較する工程は、メチル化プロファイルを生成するために機械学習法により対照を用いてペアワイズのメチル化差異データセットを分析する工程をさらに含む。いくつかの実施形態において、比較する工程は、個体の癌種を判定する工程をさらに含む。いくつかの実施形態では、機械学習法は、以下の1つ以上から選択されたアルゴリズムを利用する:主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデル。
いくつかの実施形態において、生成する工程は、プローブを用いて1つ以上のバイオマーカーの各々を交配させ、および、1つ以上のバイオマーカーの各々のメチル化を定量化するためにDNA配列決定反応を行う工程をさらに含む。いくつかの実施形態では、DNA配列決定反応はデジタルPCR反応である。
いくつかの実施形態では、対照は正常なサンプルのメチル化プロファイルを含む。いくつかの実施形態では、対照は、癌サンプルのメチル化プロファイルを含む。
いくつかの実施形態では、癌種は固形癌タイプまたは血液系悪性癌種である。いくつかの実施形態では、癌種は転移癌種、または再発性あるいは難治性癌種である。いくつかの実施形態では、癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍、びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸腺癌(READ)などの直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む。いくつかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄性白血病、膀胱癌、乳癌、脳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、消化器癌、神経膠腫、神経膠芽腫、頭頚部癌、腎癌、肝臓癌、肺癌、リンパ性腫瘍形成、黒色腫、骨髄性腫瘍、卵巣癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。いくつかの実施形態では、癌種は、膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。
いくつかの実施形態では、生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む。いくつかの実施形態では、生体サンプルは生検サンプルである。いくつかの実施形態では、生体サンプルは無細胞の生体サンプルである。
癌を抱える個体の治療を選択する方法であって、該方法は、(a)本明細書に記載される方法に従って個体の癌種を識別する工程と、(b)工程(a)に基づいて、癌種に適した治療を選択する工程とを含む。
個体において原発腫瘍を転移癌と区別する方法であって、該方法は、(a)脱アミノされたヌクレオチドを含む処置されたゲノムDNAを生成するために、脱アミノ化剤を用いて抽出されたゲノムDNAを処理する工程であって、抽出されたゲノムDNAが個体からの生体サンプルから得られる、工程と、(b)処置されたゲノムDNAからの表20から選択された1つ以上のバイオマーカーを含むメチル化プロファイルを生成する工程と、(c)メチル化プロファイルを対照と比較する工程であって、メチル化プロファイルと対照との間の相関は個体において原発腫瘍を転移癌と区別する、工程、を含む。
個体における癌の進行をモニタリングする方法であって、該方法は、(a)脱アミノされたヌクレオチドを含む処置されたゲノムDNAを生成するために、脱アミノ化剤を用いて抽出されたゲノムDNAを処理する工程であって、抽出されたゲノムDNAが個体からの生体サンプルから得られる、工程と、(b)処置されたゲノムDNAからの表20から選択された1つ以上のバイオマーカーを含むメチル化プロファイルを生成する工程と、(c)メチル化プロファイルを第2のメチル化プロファイルと比較する工程であって、第2のメチル化プロファイルが、第1の生体サンプルを得る前に個体から得られた第2の生体サンプルから得られた処置されたゲノムDNAから生成され、第1のメチル化プロファイルと第2のメチル化プロファイルとの間の差は癌が個体において進行したかどうかを示す、工程を含む。
本明細書では、ある実施形態において、上記のプローブパネルを含むキットも開示されている。
ある実施形態において、本明細書では、上記の方法を含むサービスがさらに開示されている。
<参照による組み込み>
本明細書で言及される全ての出版物、特許、および特許出願は、あたかも個々の出版物、特許、または特許出願が引用によって組み込まれるよう具体的かつ個別に示されるかのような同程度まで引用により本明細書に組み込まれる。
本発明の新規な特徴は添付の請求項で具体的に説明される。本発明の特徴および利点のより良い理解は、本発明の原理が用いられる実施形態を説明する以下の詳細な説明と、以下の添付図面とを引用することによって得られるであろう。
本明細書に開示される方法、プラットフォーム、およびシステムの概観を例証する。 本明細書に開示される方法、プラットフォーム、およびシステムの概観を例証する。 本明細書に開示されるコンピュータシステムの略図を例証する。 無細胞DNAの尿からの収率を例証する。尿中の無細胞DNAは、1mlの尿当たり1−30ngの間で変動した。これは血漿中で観察される濃度の約1/5である。その範囲は様々な個体からのサンプル間で異なり、さらに、他の因子、例えば、性別、特定の疾患状態に依存する。 尿からの無細胞DNA収率に対する尿安定緩衝液(USB)の効果を例証する。尿サンプルは、USB緩衝液または別の市販の緩衝液画線と混合後に14日間室温で維持された。14日後に、緩衝液を含まないサンプルからのゲノムDNAの放出は高いDNA収率をもたらした。しかし、USBまたは画線緩衝液は細胞DNAの放出を防いだ。 様々な作用濃度のUSBを使用して、DNAの収率を例証する。尿中の尿安定緩衝液の様々な比率でのDNAの収率は、市販の画線緩衝液または緩衝液を含まないものと比較して、USB緩衝液が尿に対する希釈比1:10〜1:50で作用することを例証している。 尿と比較して血漿中の胎児DNAについて検出シグナルの倍率変化(fold change)を例証する。4mlの血漿と尿の出発サンプルから始めて、男性の胎児DNAのシグナルは、男性に特異的なSRY遺伝子を備えたq−rt PCRによって無細胞DNA中で検知された。シグナルは同じ量を用いた尿よりも血漿の方で約2−8倍強い。 様々な時間点で1人の肺癌患者からの尿と肺流体中の無細胞DNAの収率を例証する。肺流体中の平均的な無細胞DNAは約130ng/mLであり、尿中では約20ng/mLである。 様々な癌種においてメチル化プロファイルに関連する教師なし階層的クラスタリングとヒートマップを例証する。 様々な癌種における基準メチル化プロファイルに関連した教師なし階層的クラスタリングとヒートマップを使用して、同じ組織タイプ内の様々なタイプの癌を区別するために利用されるメチル化プロファイルを例証する。図9Aで例証されるようなヒートマップは、1409のマーカーに基づいた511のLGG、138のGBM、および150の正常な脳組織サンプルから得られる。 様々な癌種における基準メチル化プロファイルに関連した教師なし階層的クラスタリングとヒートマップを使用して、同じ組織タイプ内の様々なタイプの癌を区別するために利用されるメチル化プロファイルを例証する。図9Bで例証されるようなヒートマップは、926のマーカーに基づいた311のLUAD、359のLUSC、および74の正常な肺組織サンプルから得られる。 様々な癌種における基準メチル化プロファイルに関連した教師なし階層的クラスタリングとヒートマップを使用して、同じ組織タイプ内の様々なタイプの癌を区別するために利用されるメチル化プロファイルを例証する。図9Cで例証されるようなヒートマップは、716のマーカーに基づいた321のKIRC、226のKIRP、および205の正常な腎臓組織サンプルから得られる。 腫瘍状態と腫瘍段階に従って階層化されるように、LGG、KIRP、KIRC、LUSC、およびLUADを含む様々なタイプの癌の患者の全生存を予測するために利用されるメチル化マーカーを例証するグラフを示す。 腫瘍状態と腫瘍段階に従って階層化されるように、LGG、KIRP、KIRC、LUSC、およびLUADを含む様々なタイプの癌の患者の全生存を予測するために利用されるメチル化マーカーを例証するグラフを示す。 メチル化ベースの生存分類がドライバー変異状態と相関することを例証する。図11Aは、メチル化プロファイルとLGGにおけるドライバー遺伝子突然変異に関連する、教師なし階層的クラスタリングとヒートマップを例証する。 メチル化ベースの生存分類がドライバー変異状態と相関することを例証する。図11Bは、PCA値とIDH突然変異の組み合わせに従ってLGGを抱える患者の5年の生存曲線を示す。 メチル化ベースの生存分類がドライバー変異状態と相関することを例証する。図11Cは、メチル化プロファイルとLIHCで頻繁に変異した遺伝子に関連する、教師なし階層的クラスタリングとヒートマップを例証する。 メチル化ベースの生存分類がドライバー変異状態と相関することを例証する。図11Dは、メチル化プロファイルとKIRCで頻繁に変異した遺伝子に関連する、教師なし階層的クラスタリングとヒートマップを例証する。 マッチした正常な組織と比較して、乳癌または肝臓癌のいずれかの高メチル化遺伝子の差次的発現を比較するヒートマップを例証する。 マッチした正常な組織と比較して、乳癌または肝臓癌のいずれかの高メチル化遺伝子の差次的発現を算出するために探索コホート(discovery cohort)としてTCGAからのRNA−seqデータを例証する。 マッチした正常な組織と比較して、乳癌または肝臓癌のいずれかの高メチル化遺伝子の差次的発現を算出するために探索コホートとしてTCGAからのRNA−seqデータを例証する。 マッチした正常な組織と比較して、乳癌または肝臓癌のいずれかの高メチル化遺伝子の差次的発現を算出するために探索コホートとしてTCGAからのRNA−seqデータを例証する。 メチル化パターンが遺伝子発現プロファイルや癌行動と相関することを例証するグラフを示す。qPCRを使用して、乳癌と肝臓癌におけるメチル化された遺伝子の差次的なmRNA発現が判定された。腫瘍サンプル中のmRNA発現は、同じ患者に由来する近くの正常な組織中の発現に標準化された。結果は、複数のサンプル(n=3−7)の発現の平均的なパーセント変化として示され、各サンプルは3回の技術的な複製中に行われる。サンプルはすべて、遺伝子発現がメチル化とは逆に変化するかどうかを判定するために、ウィルコクソン符号順位検定を使用して統計的分析のためにまとめてプールされ;予測されたように、プールされたサンプル上のp値は、1.21x10−21であるとわかった。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15Aと図15FはそれぞれのCpGメチル化部位を例証する。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15Bと図15Gは、形質導入された操作された遺伝子または対照細胞がヌードマウスに注入された後に、切除されて測定された腫瘍を示す。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15C、図15E、図15H、および図15Jは、操作された遺伝子を形質導入された細胞対対照による、インビトロのコロニー形成を示す。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15Dと図15Iは、これらの腫瘍の経時的な定量化された成長を示す。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15C、図15E、図15H、および図15Jは、操作された遺伝子を形質導入された細胞対対照による、インビトロのコロニー形成を示す。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15Aと図15FはそれぞれのCpGメチル化部位を例証する。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15Bと図15Gは、形質導入された操作された遺伝子または対照細胞がヌードマウスに注入された後に、切除されて測定された腫瘍を示す。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15C、図15E、図15H、および図15Jは、操作された遺伝子を形質導入された細胞対対照による、インビトロのコロニー形成を示す。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15Dと図15Iは、これらの腫瘍の経時的な定量化された成長を示す。 乳癌細胞株成長の阻害に対する操作された遺伝子の効果を例証する。操作された遺伝子は、乳癌細胞株に形質導入された。図15C、図15E、図15H、および図15Jは、操作された遺伝子を形質導入された細胞対対照による、インビトロのコロニー形成を示す。 結腸癌に関連するDNAメチル化シグネチャーを例証する。311のCpGマーカーのパネルを備えた435のTCGA検体(結腸癌:390;正常な結腸:45)のメチル化プロファイルに関連した、教師なし階層的クラスタリングとヒートマップ。各列は個々の患者を表し、各行は個々のCpGマーカーを表す。 結腸、肺、および肝臓の癌に関連するDNAメチル化シグネチャーを例証する。2793のCpGマーカーに基づいた、1108のTCGA検体(結腸癌:390;正常な結腸:45;肝臓癌:238;正常な肝臓:50;肺癌:311;正常な肺:74)のメチル化プロファイルに関連した、教師なし階層的クラスタリングとヒートマップ。各列は個々の患者を表し、各行は個々のCpGマーカーを表す。 中国人の原発性および転移性の結腸癌、肝臓癌、および肺癌に関連したDNAメチル化シグネチャーを例証する。104のマーカーに基づいた567の原発腫瘍検体のメチル化プロファイルに関連した、教師なし階層的クラスタリングとヒートマップ。 カプラン・マイヤー曲線で結腸腺癌(COAD)患者の全生存を予測するために使用されるメチル化マーカーを例証する。図19Aは、メチル化プロファイルに従って階層化された5年の生存率を示す。Pca値>0(n=127)の群は、Pca値<0(n=145)(P=0.007)の群(42%)よりも生存確率(81.2%)が改善された。 カプラン・マイヤー曲線で結腸腺癌(COAD)患者の全生存を予測するために使用されるメチル化マーカーを例証する。図19Bはメチル化プロファイリングに従って階層化された第1−II期の患者の5年の生存率を示す。Pca値を>0(n=73)の群は、Pca値<0(n=77)(P=0.007)の群(51.3%)よりも生存確率(100%)が改善された。 カプラン・マイヤー曲線で結腸腺癌(COAD)患者の全生存を予測するために使用されるメチル化マーカーを例証する。図19Cはメチル化プロファイリングに従って階層化された第III−IVの患者の5年の生存率を示す。Pca値>0(n=49)の群は、Pca値<0(n=66)(P=0.01)の群(42%)よりも生存確率(81.1%)が改善された。 カプラン・マイヤー曲線で結腸腺癌(COAD)患者の全生存を予測するために使用されるメチル化マーカーを例証する。図19Dはメチル化プロファイリングに従って階層化された第2期患者の5年の生存率を示す。Pca値>0(n=51)の群は、Pca値<0(n=58)(P=0.029)の群(53.4%)よりも生存確率(100%)が改善された。 カプラン・マイヤー曲線で結腸腺癌(COAD)患者の全生存を予測するために使用されるメチル化マーカーを例証する。図19Eはメチル化プロファイリングに従って階層化された第3期患者の5年の生存率を示す。Pca値>0(n=34)の群はPca値<0(n=46)(P=0.021)の群(57.2%)よりも生存確率(94.1%)が改善された。 ドライバー突然変異状態と相関するメチル化ベースの生存分類を例証する。図20Aは、Pca値に従ってCOADを有する患者の5年の生存曲線を例証する。 ドライバー突然変異状態と相関するメチル化ベースの生存分類を例証する。図20Bは、遺伝子突然変異に従ってCOADを有する患者の5年の生存曲線を示す。 ドライバー突然変異状態と相関するメチル化ベースの生存分類を例証する。図20Cは、Pca値と遺伝子突然変異の組み合わせに従ってCOADを有する患者の5年の生存曲線を例証する。 ドライバー突然変異状態と相関するメチル化ベースの生存分類を例証する。図20Dは、メチル化プロファイルとCOAD中の頻繁に変異する遺伝子に関連する、教師なし階層的クラスタリングとヒートマップを示す。 ドライバー突然変異状態と相関するメチル化ベースの生存分類を例証する。図20Eは、全生存に有意に関連する遺伝子のP値を例証する。 ドライバー突然変異状態と相関するメチル化ベースの生存分類を例証する。図20Fは、突然変異状態と患者の生存との間の関連性を例証する(P値はログランク検定によって推定された)。 患者のコホート特性を例証する。 qPCRを使用して判定された結腸癌における差次的なメチル化遺伝子のmRNA発現を例証する。腫瘍サンプル中のmRNA発現は、同じ患者に由来する近くの正常な組織中の発現に標準化された。結果は、複数のサンプル(n=3−7)の発現の平均的なパーセント変化として示され、各サンプルは3回の技術的な複製中に行われる。サンプルはすべて、遺伝子発現がメチル化とは逆に変化するかどうかを判定するために、ウィルコクソン符号順位検定を使用して統計的分析のためにまとめてプールされ;予測されたように、プールされたサンプル上のp値は、1.21x10−21であるとわかった。 結腸癌細胞株成長の阻害に対するPCDH17の効果を例証する。PCDH17はHCT116細胞へ形質導入された。図23AはCpGメチル化プロファイルを例証する。 結腸癌細胞株成長の阻害に対するPCDH17の効果を例証する。PCDH17はHCT116細胞へ形質導入された。図23Bは、形質導入された操作された遺伝子または対照細胞がヌードマウスに注入された後の腫瘍の切除と測定を示す。 結腸癌細胞株成長の阻害に対するPCDH17の効果を例証する。PCDH17はHCT116細胞へ形質導入された。図23Cは、これらの腫瘍の経時的な定量化された成長を示す。 結腸癌細胞株成長の阻害に対するPCDH17の効果を例証する。PCDH17はHCT116細胞へ形質導入された。図23Dと図23Eは、操作された遺伝子を形質導入された細胞対対照による、インビトロのコロニー形成を示す。 結腸癌細胞株成長の阻害に対するPCDH17の効果を例証する。PCDH17はHCT116細胞へ形質導入された。図23Dと図23Eは、操作された遺伝子を形質導入された細胞対対照による、インビトロのコロニー形成を示す。 AML対正常な血液におけるメチル化プロファイルに関連する、教師なし階層的クラスタリングとヒートマップを例証する。 複製コホート中のAML対正常な血液サンプルにおけるメチル化プロファイルに関連する、教師なし階層的クラスタリングとヒートマップを例証する。 ALL対正常な血液サンプルにおけるメチル化プロファイル(示されたカラースケールに従って)関連する、教師なし階層的クラスタリングとヒートマップを例証する。 メチル化プロファイルが白血病のサブタイプを区別することができることを例証する。階層的クラスタリングとヒートマップはALL、AML癌種に関連する。 メチル化マーカープロファイルを例証する。図28Aは、AMLの患者の5年の全生存を予測することができるメチル化マーカーを示し、図28Bは、ALLの患者の5年の全生存を予測することができるメチル化マーカーを示す。 メチル化マーカープロファイルを例証する。図28Aは、AMLの患者の5年の全生存を予測することができるメチル化マーカーを示し、図28Bは、ALLの患者の5年の全生存を予測することができるメチル化マーカーを示す。 結腸癌組織と正常な結腸組織サンプル(Farsite)の両方で4つの典型的なCpG部位(cg06747543、cg15536663、cg22129276、およびcg07418387)のメチル化比率を例証する。 転移性結腸癌組織サンプル、原発性の結腸癌標準サンプル、および正常なリンパ球ゲノムDNA標準サンプル中の5つの典型的なCpG部位のメチル化比率を例証する。 結腸癌に由来する無細胞DNA(cfDNA)サンプルからのメチル化シグネチャーを示す。図31Aは、ゲノムcfDNAのメチル化領域を示し、図31BはゲノムcfDNAのメチル化されていない領域を例証する。 結腸癌に由来する無細胞DNA(cfDNA)サンプルからのメチル化シグネチャーを示す。図31Aは、ゲノムcfDNAのメチル化領域を示し、図31BはゲノムcfDNAのメチル化されていない領域を例証する。 結腸癌に由来する無細胞DNA(cfDNA)サンプルからのメチル化シグネチャーを示す。図31Cは、3人の患者(2043089、2042981、および2004651)、正常なcfDNA標準サンプル、原発性の結腸組織の標準サンプル、および正常な血液標準サンプルからのCpG部位cg10673833のメチル化比率を例証する。患者2043089と2042981は原発性の結腸癌を抱え、患者2004651は転移性結腸癌を抱えている。 原発性の肝臓、乳房、および肺の癌に関するメチル化プロファイルを示す。図32Aは、肝臓癌cfDNAサンプル、正常なcfDNAサンプル、原発性肝癌の組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)におけるCpG部位cg00401797のメチル化比率を示す。 原発性の肝臓、乳房、および肺の癌に関するメチル化プロファイルを示す。図32Bは、乳癌cfDNAサンプル、正常なcfDNAサンプル、原発性の乳癌組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)におけるCpG部位cg07519236のメチル化比率を示す。 原発性の肝臓、乳房、および肺の癌に関するメチル化プロファイルを示す。図32Cは、肺癌cfDNAサンプル、正常なcfDNAサンプル、原発性肺癌組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)におけるCpG部位cg02877575のメチル化比率を示す。 原発性の結腸癌と正常なサンプルを区別する、2つの様々なプローブを示す。図33Aは、3人の結腸癌患者のcfDNAサンプル、正常なcfDNAサンプル、原発性の結腸癌組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)からのCpG部位cg10673833とメチル化プロファイルを標的とするプローブCob−2を示す。3人の患者(2043089と2042981)の2人は原発性の結腸癌を抱えている。残りの患者(2004651)は転移性結腸癌を抱えている。 原発性の結腸癌と正常なサンプルを区別する、2つの様々なプローブを示す。図33Bは、2人の原発性の結腸癌患者(2043089と2042981)のcfDNAサンプル、正常なcfDNAサンプル、原発性の結腸癌組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)からのCpG部位cg07974511とメチル化プロファイルを標的とするプローブBrb−2を示す。 乳癌患者からのcfDNAの分析を示す。4つのプローブ:Brb−3(図34A)、Brb−4(図34B)、Brb−8(図34C)、およびBrb−13(図34D)が使用された。cfDNAの原発性の乳癌のメチル化比率は、正常なcfDNAサンプル、原発性の乳癌組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)と比較された。 乳癌患者からのcfDNAの分析を示す。4つのプローブ:Brb−3(図34A)、Brb−4(図34B)、Brb−8(図34C)、およびBrb−13(図34D)が使用された。cfDNAの原発性の乳癌のメチル化比率は、正常なcfDNAサンプル、原発性の乳癌組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)と比較された。 乳癌患者からのcfDNAの分析を示す。4つのプローブ:Brb−3(図34A)、Brb−4(図34B)、Brb−8(図34C)、およびBrb−13(図34D)が使用された。cfDNAの原発性の乳癌のメチル化比率は、正常なcfDNAサンプル、原発性の乳癌組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)と比較された。 乳癌患者からのcfDNAの分析を示す。4つのプローブ:Brb−3(図34A)、Brb−4(図34B)、Brb−8(図34C)、およびBrb−13(図34D)が使用された。cfDNAの原発性の乳癌のメチル化比率は、正常なcfDNAサンプル、原発性の乳癌組織の標準サンプル(ゲノムDNA)、および正常なリンパ球標準サンプル(ゲノムDNA)と比較された。 2つのプローブ、cob_3とbrb_13からの49人の患者の組織サンプル中の転移性結腸癌の検出を示す。 2つのプローブ、cob_3とbrb_13からの49人の患者の組織サンプル中の転移性結腸癌の検出を示す。 PCAとICAのフィルタリングを用いる本明細書に記載される分析法を例証する。 トレーニングコホートの臨床病理的な特性を示す。 検証コホート1の臨床病理的な特性を示す。 検証コホート2の臨床病理的な特性を示す。 脳、腎臓、および肺の癌のサブタイプの臨床病理的な特性を示す。 中国人のコホートにおける原発性の乳癌、肝臓への乳癌転移、正常な乳房、肝臓癌、および正常な肝臓組織に関連するDNAメチル化シグネチャーを示す。128のマーカーに基づいて126の腫瘍と75の正常な検体のメチル化プロファイルに関連する、教師なし階層的クラスタリングとヒートマップ。カラーの棒は相対的なメチル化を示す。 メチル化に基づく生存分類がドライバー突然変異状態と相関することを例証する。図42Aは、PCA値と遺伝子突然変異状態の組み合わせに従ったLIHC患者の5年の生存曲線を例証する。 メチル化に基づく生存分類がドライバー突然変異状態と相関することを例証する。図42Bは、PCA値と遺伝子突然変異状態の組み合わせに従ったKIRC患者の5年の生存曲線を例証する。 BRCA(図43A)とLIHC(図43B)における遺伝子発現に対する様々な選択された差次的なメチル化CpGマーカーの関係を例証する。散布図上の各ドットは、対応する遺伝子の発現に対してプロットされた指定のCpGマーカーのメチル化レベルに相当する。パネルの第1行は、遺伝子発現の減少と相関する癌における高メチル化されたCpG部位を示し、パネルの第2行は、遺伝子発現に影響するようには見えなかった癌における高メチル化されたCpG部位を示し、パネルの第3行は、散布図上の関連する癌における高メチル化されたCpG部位を示す。各ドットは、対応する遺伝子の発現に対してプロットされた指定のCpGマーカーのメチル化レベルを表す。パネルの第1行は、遺伝子発現の減少と相関する癌における高メチル化されたCpG部位を示し、パネルの第2行は、遺伝子発現に影響するようには見えなかった癌における高メチル化されたCpG部位を示し、パネルの第3行は、関連する癌における高メチル化されたCpG部位を示す。 BRCA(図43A)とLIHC(図43B)における遺伝子発現に対する様々な選択された差次的なメチル化CpGマーカーの関係を例証する。散布図上の各ドットは、対応する遺伝子の発現に対してプロットされた指定のCpGマーカーのメチル化レベルに相当する。パネルの第1行は、遺伝子発現の減少と相関する癌における高メチル化されたCpG部位を示し、パネルの第2行は、遺伝子発現に影響するようには見えなかった癌における高メチル化されたCpG部位を示し、パネルの第3行は、散布図上の関連する癌における高メチル化されたCpG部位を示す。各ドットは、対応する遺伝子の発現に対してプロットされた指定のCpGマーカーのメチル化レベルを表す。パネルの第1行は、遺伝子発現の減少と相関する癌における高メチル化されたCpG部位を示し、パネルの第2行は、遺伝子発現に影響するようには見えなかった癌における高メチル化されたCpG部位を示し、パネルの第3行は、関連する癌における高メチル化されたCpG部位を示す。 TCGAと中国人患者のコホートの臨床病理的な特性を示す。 TCGAと中国人患者のコホートの臨床病理的な特性を示す。 遺伝子発現に対する差次的にメチル化されたマーカーの関連付けを示す。散布図上の各ドットは、対応する遺伝子の発現に対してプロットされた指定のcgマーカーのメチル化レベルを実証した。第1のラインパネルは遺伝子発現の減少と相関する高メチル化を示し、第2のラインパネルはメチル化レベルが遺伝子発現レベルと相関しなかったことを示し、第3のラインパネルは、メチル化レベルが遺伝子発現レベルとはなんの関係もなかったことを示した。 2つの異なる結腸癌プローブ(Cob−2とCob−9)を使用して、2つの例示的なCpG部位(CpG部位1とCpG部位2)のメチル化プロファイルの変化を例証する。 外科手術後の4人の患者にサンプル(患者2045021、2044629、2044645、および2045021)における結腸癌プローブCob−2とCob−9に関するメチル化プロファイルの変化を例証する。 様々な癌の段階のサンプルにおける結腸癌プローブCob−2とCob−9についてのメチル化プロファイルの変化を例証する。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、および甲状腺癌を含んでいる。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。 乳癌、結腸癌、肝臓癌、肺癌、および正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。
癌は、細胞増殖と細胞死のバランスの調節不全に結びつく、1つ以上の突然変異または遺伝子の修飾によって引き起こされた細胞の成長異常を特徴とする。DNAメチル化は、腫瘍抑制遺伝子の発現を停止させ、第1の新生物の変化の1つとして現れる。新生物の組織と血漿で見られるメチル化パターンは均質性を実証し、例によっては、感受性診断のマーカーとして利用される。例えば、cMethDNA分析は、転移性乳癌を分析するために使用されるとき、約91%敏感でかつ約96%特異的であることがある研究で示されてきた。別の研究では、それが転移性結腸癌の患者の大きなコホートにおいてKRAS遺伝子突然変異を同定するために使用されるとき、循環腫瘍DNA(ctDNA)は約87.2%敏感で、約99.2%特異的であった(Bettegowda et al., Detection of Circulating Tumor DNA in Early− and Late−Stage Human Malignancies. Sci. Transl. Med, 6(224):ra24. 2014)。さらに同じ研究によると、ctDNAは、進行型の膵臓、卵巣、結腸直腸、膀胱、胃食道、乳房、黒色腫、肝細胞、および頭頚部の癌の患者の>75%で検知可能であることが実証された(Bettegowda et al)。
さらなる研究によれば、CpGメチル化パターンは腫瘍の進行と相関することが実証されている。例えば、乳癌メチル化パターンに関するある研究では、P16高メチル化は初期段階の乳癌と相関することが分かったが、TIMP3プロモーター高メチル化は後期乳癌と相関していた。加えて、BMP6、CST6、およびTIMP3プロモーター高メチル化は、乳癌においてリンパ節への転移と関連付けることが示されている。
いくつかの実施形態では、DNAメチル化プロファイリングは、癌検出のための体細胞突然変異分析と比較して、より高い臨床的感受性とダイナミックレンジを提供する。他の例では、変化したDNAメチル化シグネチャーは、特定の癌について処置応答の予後と相関することが示されている。例えば、ある研究によれば、重度の直腸癌の患者の群では、患者の予後を予測するために10の差次的にメチル化された領域が使用されることが例証されている。同様に、血清中のRASSF1A DNAメチル化測定は、異なる研究で乳癌患者のアジュバント療法を受ける患者の予後不良を予測するために使用された。加えて、SRBC遺伝子高メチル化は、異なる研究においてオキサリプラチンで処置された結腸直腸癌の患者の予後不良に関連付けられた。別の研究は、ESR1遺伝子メチル化がタモキシフェンを受け取る乳癌患者の臨床反応に相関することを実証した。さらに、ARHI遺伝子プロモーター高メチル化は、タモキシフェンで処置されていない乳癌患者の長期生存の予測因子であることが示された。
例によっては、DNAメチル化プロファイリングアッセイは特定の癌種に適合する。場合によっては、DNAメチル化プロファイリングアッセイは、汎癌設定下では様々な癌種を識別しない。さらなる例では、低サンプル濃度条件(例えばng濃度条件)下では、DNAメチル化プロファイリングアッセイは、高サンプル濃度条件と比較すると、再現性に欠けており、感受性が低い。
本明細書では、個体における癌種を判定する方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが開示されている。いくつかの実施形態において、本明細書では、癌の早期発見のための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットも記載されている。追加の実施形態において、本明細書では、癌の非侵襲的検出のための方法、システム、非一時的なコンピュータ可読媒体、サービスおよびキットを含んでいる。また追加の実施形態において、本明細書では、様々な癌の段階の識別のための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが記載されている。他の実施形態において、本明細書では、個体における癌の予後の判定、処置応答の予測、および処置応答のモニタリングのための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットが記載されている。さらなる実施形態において、本明細書では、CpGメチル化プロファイルデータベースを生成するための方法、システム、プラットフォーム、非一時的なコンピュータ可読媒体、サービス、およびキットと、CpGメチル化データを生成する際に使用されるプローブとが記載されている。
<患者の癌状態の測定>
DNAメチル化は、ヌクレオチド塩基シトシンのC5位置とアデニンのN6位置でのメチル基の結合である。アデニンのメチル化は主として前核生物で生じるが、シトシンのメチル化は前核生物と真核生物の両方で生じる。例によっては、シトシンのメチル化はCpGジヌクレオチドモチーフで生じる。他の例では、Hがアデニン、シトシン、またはチミンである場合、シトシンメチル化は例えばCHGとCHHのモチーフで生じる。例によっては、1つ以上のCpGジヌクレオチドモチーフまたはCpG部位は、CpGジヌクレオチド中で豊富な短鎖DNA配列であるCpGアイランドを形成する。例によっては、CpGアイランドは、すべてのヒト遺伝子のおよそ2分の1の5’領域中にある。CpGアイランドは、常にではないが典型的には約0.2から約1kbの長さである。シトシンメチル化はさらに5−メチルシトシン(5−mCyt)と5−ヒドロキシメチルシトシンを含む。
シトシンヌクレオチドが直鎖のグアニンヌクレオチドの隣で生じる場合、CpG(シトシン−リン酸塩−グアニン)またはCGモチーフはDNA分子の領域を指す。例によっては、CpGジヌクレオチド中のシトシンは、5−メチルシトシンを形成するためにメチル化される。例によっては、CpGジヌクレオチド中のシトシンは、5−ヒドロキシメチルシトシンを形成するためにメチル化される。
<CpGメチル化プロファイルデータベース>
いくつかの実施形態では、複数のCpGメチル化データが生成され、CpGメチル化プロファイルデータベースへ統合される。例によっては、CpGメチル化プロファイルデータベースは、本明細書に記載される方法、システム、非一時的なコンピュータ可読媒体、サービス、またはキットを用いる基準データベースとして利用される。例によっては、CpGメチル化プロファイルデータベースは、各CpGメチル化プロファイルが癌種(例えば乳癌、結腸直腸癌、脳癌など)と相関するCpGメチル化プロファイルのライブラリを含んでいる。場合によっては、各々の上記CpGメチル化プロファイルは、癌のサブタイプ(例えば、三種陰性の乳癌、結腸直腸腺癌、星状細胞腫など)にさらに相関する。
いくつかの実施形態では、図1Aで例証されるように、CpGメチル化プロファイルデータベースは生成される。例によっては、ゲノムDNA(例えば核DNAまたは循環DNA)は、生体サンプルから分離され、その後、抽出されたゲノムDNA(101)を生成するために脱アミノ化剤によって処置される。例によっては、抽出されたゲノムDNA(例えば、抽出された核DNAまたは抽出された循環DNA)は、CpGメチル化データ(102)を生成するべく配列決定分析のための提出前のDNAフラグメントの1セットを生成するために、1つ以上の制限酵素で随意に処置される。その後、CpGメチル化データは、CpGメチル化プロファイルデータベース(105)を生成するために、機械学習/分類プログラム(103)に入力される。
例によっては、生体サンプルのセットは生成され、その後、機械学習/分類プログラム(103)に入力される。例によっては、生体サンプルのセットは2、3、4、5、6、7、8、9、10、20、30、またはそれ以上の生体サンプルを含む。例によっては、生体サンプルのセットは2、3、4、5、6、7、8、9、10、20、30またはそれ以上の正常な生体サンプルを含む。例によっては、生体サンプルのセットは2、3、4、5、6、7、8、9、10、20、30またはそれ以上の癌の生体サンプルを含む。場合によっては、生体サンプルのセットは第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルは異なる。場合によっては、3ペアのデータセットが生成され、ここで、3ペアのデータセットは、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットであって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、第1のペアのCpGメチル化データセット;第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットであって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、第2のペアのCpGメチル化データセット;および、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットであって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、第3のペアのCpGメチル化データセットを含む。例によっては、各々の上記ペアのデータセット内の差が算出され、その後、差は機械学習/分類プログラム(103)に入力される。場合によっては、第1のペア、第2のペア、および第3のペアのデータセットからのペアワイズのメチル化差異データセットが生成され、その後、癌CpGメチル化プロファイルデータベース(105)を生成するために、機械学習/分類法(103)によって対照データセットまたはトレーニングデータセット(104)の存在下で分析される。場合によっては、機械学習法は、トップスコア(例えばt検定値、β検定値)に基づき、複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含む。場合によっては、癌CpGメチル化プロファイルデータベース(105)は、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す。
いくつかの実施形態では、第1のバイオマーカーパネルは癌の存在を検知するために使用される。例によっては、少なくとも追加のバイオマーカーパネル、例えば、少なくとも2、3、4、5、または6以上のバイオマーカーパネルが癌種を判定するために使用される。例によっては、少なくとも追加のバイオマーカーパネル、例えば、少なくとも2、3、4、5、または6以上のバイオマーカーパネルは、随意に癌の段階を判定するために、原発性癌を転移癌のサブタイプと識別するために、癌の進行のモニタリングするために、癌の予後を判定するために、または処置レジメンをモニタリングするために、使用される。
いくつかの実施形態では、CpGメチル化プロファイルデータベースは基準データベースとして癌種の診断に使用される。例によっては、癌診断用の基準データベースとしてのCpGメチル化プロファイルデータベースの使用は、図1Bで例証されるとおりである。例によっては、ゲノムDNA(例えば核DNAまたは循環DNA)は生体サンプルから単離され、その後、抽出されたゲノムDNA(111)を生成するために脱アミノ化剤によって処置される。例によっては、抽出されたゲノムDNA(例えば、抽出された核DNAまたは抽出された循環DNA)は、CpGメチル化データを生成するために、配列決定分析向けの提出のためのDNAフラグメントのセットを生成するために、1つ以上の制限酵素で随意に処置される。CpGメチル化データはさらに分析され、所望のCpGメチル化プロファイル(112)へコンパイルされる。所望のCpGメチル化プロファイルは、機械学習/分類プログラム(114)に随意に入力され、その後、CpGメチル化プロファイルデータベース(115)内のCpGメチル化プロファイルと比較される。CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルと所望のCpGメチル化プロファイルとの間のマッチが癌種を示す。
例によっては、CpGメチル化プロファイルデータベースは、転移癌のサブタイプから原発性癌を判定するための、または癌の進行のモニタリングのための基準データベースとしても使用される。
いくつかの実施形態では、CpGメチル化プロファイルデータベースは生検サンプルのCpGメチル化データから生成される。例によっては、CpGメチル化プロファイルデータベースは組織サンプルのCpGメチル化データから生成される。例によっては、CpGメチル化プロファイルデータベースは無細胞の生体サンプルからのCpGメチル化データから生成される。例によっては、CpGメチル化プロファイルデータベースは、循環腫瘍DNA(ctDNA)サンプルからのCpGメチル化データから生成される。
<バイオマーカー>
いくつかの実施形態では、正常な組織と比較されると、本明細書に記載されたバイオマーカー(またはマーカー)は癌において差次的にメチル化される。いくつかの実施形態では、バイオマーカーは、例えばCpGメチル化部位、メチル化状態、メチル化指標、メチル化プロファイルなどのメチル化シグネチャーを示すまたは表す。例によっては、バイオマーカーのパネルは、例えば、メチル化プロファイル、1つ以上の遺伝子のメチル化などの生成されるメチル化シグネチャーの一群を例証する。場合によっては、バイオマーカーは、診断のツールとして個々にまたはまとめて、あるいは、バイオマーカーパネルとして組み合わせるかまたは形質転換させて利用される。いくつかの実施形態では、バイオマーカーは、場合によっては基準メチル化プロファイルなどの1つ以上の遺伝子のメチル化プロファイルとさらに比較して、1つ以上の遺伝子内で評価され、これが癌状態の特徴付けをもたらす。
いくつかの実施形態では、メチル化プロファイルまたは1つ以上のバイオマーカーのメチル化シグネチャーに基づいて癌種を判定するための方法、システム、プラットフォーム、および非一時的なコンピュータ可読媒体が本明細書に記載されている。いくつかの実施形態では、1つ以上のバイオマーカーが癌の早期発見のために利用される。追加の実施形態では、1つ以上のバイオマーカーが癌の非侵襲的検出に使用される。さらなる追加の実施形態では、1つ以上のバイオマーカーが様々な癌の段階の識別のために使用される。他の実施形態では、1つ以上のバイオマーカーが、癌の予後の判定、処置応答の予測、および/または処置応答のモニタリングのために使用される。
いくつかの実施形態において、本明細書では、CpGメチル化プロファイルデータベースを生成するための方法、システム、プラットフォーム、および非一時的なコンピュータ可読媒体も記載されている。いくつかの実施形態では、1つ以上のバイオマーカーはCpGメチル化プロファイルデータベースの生成のために利用される。
いくつかの実施形態では、本明細書に記載されたバイオマーカーは、表15に示されるものを含んでいる。いくつかの実施形態では、本明細書に記載されたバイオマーカーは、表15、16、17、および/または18で開示されたバイオマーカーを含んでいる。いくつかの実施形態では、本明細書に記載される方法、システムまたは非一時的なコンピュータ可読媒体は、癌種を判定するために表15、16、17、および/または18のバイオマーカーの1つ以上を使用する。いくつかの実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌の早期発見のために表15、16、17、および/または18のバイオマーカーの1つ以上を使用する。追加の実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌の非侵襲的検出のために表15、16、17、および/または18のバイオマーカーの1つ以上を使用する。またさらなる実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌の様々な段階を識別するために表15、16、17、および/または18のバイオマーカーの1つ以上を使用する。他の実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌の予後の判定、処置応答の予測、および/または処置応答のモニタリングのために表15、16、17、および/または18のバイオマーカーの1つ以上を使用する。いくつかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄性白血病、膀胱癌、乳癌、脳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、消化器癌、神経膠腫、神経膠芽腫、頭頚部癌、腎癌、肝臓癌、肺癌、リンパ性腫瘍形成、黒色腫、骨髄性腫瘍、卵巣癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。いくつかの実施形態では、癌種は、膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。
いくつかの実施形態では、本明細書に記載されたバイオマーカーは以下を含んでいる:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、またはcg26017930。いくつかの実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌種を判定するために以下のバイオマーカーの1つ以上を使用する:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg2
1031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。いくつかの実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌の早期検出、癌の非侵襲的検出、癌の様々な段階の識別、癌の予後の判定、処置応答の予測、および/または処置応答のモニタリングのために、以下のバイオマーカーの1つ以上を使用する:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。いくつかの実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌種を判定するために、以下のバイオマーカーの1つ以上を使用する:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20
847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)。いくつかの実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌の早期検出、癌の非侵襲的検出、癌の様々な段階の識別、癌の予後の判定、処置応答の予測、および/または処置応答のモニタリングのために、以下のバイオマーカーの1つ以上を使用する:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)。いくつかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄性白血病、膀胱癌、乳癌、脳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、消化器癌、神経膠腫、神経膠芽腫、頭頚部癌、腎癌、肝臓癌、肺癌、リンパ性腫瘍形成、黒色腫、骨髄性腫瘍、卵巣癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。いくつかの実施形態では、癌種は、膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。
幾つかの実施形態では、本明細書に記載されるバイオマーカーは、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555を含む。幾つかの実施形態では、本明細書に記載される方法、システム、または非一時的コンピュータ可読媒体は、癌種を判定するためのバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555の1つ以上を使用する。幾つかの実施形態では、本明細書に記載される方法、システム、または非一時的コンピュータ可読媒体は、癌の早期発見、癌の非侵襲的検出、癌の異なるステージの識別、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのための、バイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555の1つ以上を使用する。幾つかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄白血病、膀胱癌、乳癌、脳癌、子宮頸癌、肝内胆管癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、胃腸癌、神経膠腫、膠芽腫、頭頸部癌、腎臓癌、肝臓癌、肺癌、リンパ性腫瘍、黒色腫、骨髄性腫瘍、卵巣癌、膵臓癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。幾つかの実施形態では、癌種は、膀胱癌、乳癌、子宮頸癌、肝内胆管癌(CHOL)、結腸癌、食道癌、頭頸部癌、腎臓癌、肝臓癌、肺癌、膵臓癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。
幾つかの実施形態では、パネルは、本明細書に記載されるバイオマーカーの1つ以上を含む。幾つかの事例では、パネルは、表15または表16から選択される1つ以上のバイオマーカーを含む。幾つかの事例では、パネルは、表17または表18から選択される1つ以上のバイオマーカーを含む。幾つかの事例では、表15−18は、癌または正常なサンプルのマーカーパネルを表わす。幾つかの場合では、表15および16は、癌サンプルのマーカーパネルを表わす。幾つかの場合では、表17および18は、癌サンプルのマーカーパネルを表わす。
幾つかの事例では、パネルは、以下の1つ以上のバイオマーカーを含む:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。
幾つかの事例では、パネルは、以下の1つ以上のバイオマーカーを含む:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)。
幾つかの実施形態では、パネルは、1つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555を含む。幾つかの実施形態では、パネルは、2つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555を含む。幾つかの実施形態では、パネルは、3つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555を含む。幾つかの実施形態では、パネルは、4つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555を含む。幾つかの実施形態では、パネルは、バイオマーカーcg25574765、cg25490145、cg18384097、cg2592275、1およびcg17126555を含む。幾つかの実施形態では、パネルは、1つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg2592275、1およびcg17126555から成る。幾つかの実施形態では、パネルは、2つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から成る。幾つかの実施形態では、パネルは、3つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から成る。幾つかの実施形態では、パネルは、4つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から成る。幾つかの実施形態では、パネルは、バイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から成る。幾つかの実施形態では、パネルは、バイオマーカーcg25574765を含む。幾つかの実施形態では、パネルは、バイオマーカーcg25490145を含む。幾つかの実施形態では、パネルは、バイオマーカーcg18384097を含む。幾つかの実施形態では、パネルは、バイオマーカーcg17126555を含む。幾つかの実施形態では、パネルは、バイオマーカーcg25922751を含む。幾つかの実施形態では、パネルは、1つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555、および随意に表15、表16、表17、表18、及び/又はバイオマーカーcg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、
cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される1つ以上のバイオマーカーを含む。
幾つかの実施形態では、パネルは、表20からの1つ以上のバイオマーカー、および随意に表15、表16、表17、表18、及び/又はバイオマーカーcg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される1つ以上のバイオマーカーを含む。
幾つかの実施形態では、パネルは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含む。幾つかの事例では、パネルは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含み、ここでバイオマーカーは、表15、16、17、及び/又は18から選択される。幾つかの事例では、パネルは、表15、16、17、及び/又は18のいずれかから選択される、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーまたはマーカーを含む、約5つ以上のバイオマーカーを含む。
幾つかの実施形態では、パネルは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含み、ここでバイオマーカーは表15−16から選択される。幾つかの事例では、パネルは、表15−16から選択される、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーまたはマーカーを含む、約5つ以上のバイオマーカーを含む。
幾つかの実施形態では、パネルは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含み、ここでバイオマーカーは表17−18から選択される。幾つかの事例では、パネルは、表17−18のいずれかから選択される、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーまたはマーカーを含む、約5つ以上のバイオマーカーを含む。
幾つかの実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌種を判定するための、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。幾つかの実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の早期発見のための、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、
30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。追加の実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の非侵襲的検出のための、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。さらに追加の実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の異なるステージの識別のための、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。他の実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのための、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。
幾つかの実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌種を判定するための、表17及び/又は表18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。幾つかの実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の早期発見のための、表17及び/又は表18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。追加の実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の非侵襲的検出のための、表17及び/又は表18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。さらに追加の実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の異なるステージの識別のための、表17及び/又は表18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。他の実施形態では、本明細書に記載される方法、システム、または非一時的コンピュータ可読媒体は、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのための、表17及び/又は表18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、
30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。
幾つかの実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌種を判定するための、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250またはそれ以上のバイオマーカーcg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930を含むパネルを使用する。
幾つかの実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の早期発見、癌の非侵襲的検出、癌の異なるステージの識別、癌の予後の判定、治療反応の予測、及び/又は治療反応モニタリングのための、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250またはそれ以上のバイオマーカーcg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930を含むパネルを使用する。幾つかの事例では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、またはそれ以上のバイオマーカーcg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)を含むパネルを使用する。
幾つかの実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌種を判定するための、1、2、3、4、またはそれ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555を含むパネルを使用する。幾つかの実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の早期発見、癌の非侵襲的検出、癌の異なるステージの識別、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのための、1、2、3、4、またはそれ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555を含むパネルを使用する。
幾つかの実施形態では、CpGメチル化プロファイルのデータベースは、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含む。幾つかの実施形態では、CpGメチル化プロファイルのデータベースは、表17−18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含む。幾つかの事例では、CpGメチル化プロファイルのデータベースは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、 800、850、900、950、1000またはそれ以上のバイオマーカーを含む。幾つかの事例では、CpGメチル化プロファイルのデータベースは、cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、
cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、またはそれ以上のバイオマーカーを含む。幾つかの事例では、CpGメチル化プロファイルのデータベースは、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から選択される、1、2、3、4またはそれ以上のバイオマーカーを含む。
<メチル化プロファイル>
本明細書に記載されるメチル化プロファイルは、DNAの分子内の1つ以上のバイオマーカー(または遺伝子座)のメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、本明細書に記載されるメチル化プロファイルは、表15、16、17、及び/又は18の1つ以上のバイオマーカーのメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、本明細書に記載されるメチル化プロファイルは、1つ以上のバイオマーカーcg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930のメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、本明細書に記載されるメチル化プロファイルは、1つ以上のバイオマーカーcg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)のメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、本明細書に記載されるメチル化プロファイルは、1つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555のメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、DNAメチル化のデータは、限定されないが、CpG部位のメチル化指標、領域内のCpG部位のメチル化密度、隣接する領域にわたるCpG部位の分布、1つを超えるCpG部位を含む領域内の1つ以上の個々のCpG部位のためのメチル化のパターンまたはレベル、CpGメチル化の欠如、及び/又は非CpGメチル化を含む。幾つかの事例では、メチル化プロファイルは、1セットのCpG部位のメチル化指標、1セットの領域内のCpG部位のメチル化密度、1セットの隣接する領域にわたるCpG部位の分布、1セットの1つを超えるCpG部位を含む領域内の1つ以上の個々のCpG部位のメチル化のパターンまたはレベル、1セットのCpGメチル化の欠如、1セットの非CpGメチル化、またはそれらの組み合わせを含む。幾つかの事例では、メチル化プロファイルはまた、本明細書でメチル化フィンガープリントまたはメチル化シグネチャーとも呼ばれる。
幾つかの実施形態では、メチル化プロファイルは、表15、16、1、及び/又は187から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含む。幾つかの事例では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌種を判定するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの場合では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌の早期発見のために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの場合では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌の存在の検出のために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌の非侵襲的検出のために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、異なる癌のステージの識別のために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。
幾つかの実施形態では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルは、組織サンプルからもたらされる。幾つかの事例では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルは、無細胞のDNA(cfDNA)サンプルからもたらされる。幾つかの場合では、表15、16、1、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルは、循環腫瘍DNA(ctDNA)サンプルからもたらされる。
幾つかの実施形態では、表15から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌種を判定するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、表16から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌種を判定するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの場合では、表17から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌種を判定するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの実施形態では、表18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、癌種を判定するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。
幾つかの実施形態では、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、生体サンプル中の癌の存在を検出するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、この後、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含む少なくとも第2のメチル化プロファイルが、癌種を判定するために、および随意に癌の異なるステージの識別、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。
幾つかの実施形態では、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、生体サンプル中の癌の存在を検出するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、この後、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164
、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含む少なくとも第2のメチル化プロファイルが、癌種を判定するために、および随意に癌の異なるステージの識別、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、第1のメチル化プロファイル及び/又は第2のメチル化プロファイルは、cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含む。
幾つかの実施形態では、表20から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、生体サンプル中の癌の存在を検出するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、この後、表20から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含む少なくとも第2のメチル化プロファイルが、癌種を判定するために、および随意に癌の異なるステージの識別の、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。
幾つかの実施形態では、表20から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含むメチル化プロファイルは、生体サンプル中の癌の存在を検出するために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、この後、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含む少なくとも第2のメチル化プロファイルが、癌種を判定するために、および随意に癌の異なるステージの識別、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。
幾つかの事例では、30%、40%、50%、60%、70%、80%、90%または95%を超えるゲノムまたはそれ以上を包含するメチル化プロファイルは、メチロームと見なされる。幾つかの事例では、メチロームは、表15、16、17、及び/又は18から選択されるバイオマーカーのパネルから生成される。幾つかの場合では、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌種を判定するために、本明細書に記載されるメチロームを使用する。追加の場合では、方法、システム、または非一時的コンピュータ可読媒体は、癌の早期発見のために本明細書に記載されるメチロームを使用する。幾つかの事例では、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の非侵襲的検出のために本明細書に記載されるメチロームを使用する。追加の事例では、方法、システム、または非一時的コンピュータ可読媒体は、異なる癌のステージを識別するために、本明細書に記載されるメチロームを使用する。さらに追加の事例では、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の予後の判定する、治療反応を予測する、及び/又は治療反応をモニタリングするために、本明細書に記載されるメチロームを使用する。
幾つかの事例では、メチル化状態またはメチル化レベルは、特定のヌクレオチド、またはDNAの一部内のヌクレオチドでのメチル化の存在、欠如及び/又は量を示す。幾つかの事例では、特定のDNA配列(例えば、本明細書に記載されるようなバイオマーカーまたはDNA領域)のメチル化状態は、配列中のすべての塩基のメチル化状態を示すか、または配列内の塩基対のサブセットのメチル化状態(例えば、シトシンのメチル化状態または1つ以上の特定の制限酵素認識配列のメチル化状態)を示すことができるか、あるいは配列内のどこでメチル化が生じるかの正確な情報を提供することなく配列内の局所的なメチル化密度に関する情報を示すことができる。幾つかの実施形態では、メチル化の状態/レベルは、異なるサブタイプまたは腫瘍実体を区別するために使用される。幾つかの事例では、特定のDNAメチル化パターンは、高転移能の腫瘍と低転移能の腫瘍を区別し、それによって、処置レジメンの調整(tailoring)が可能になる。
幾つかの事例では、DNA配列内の1つ以上のCpGメチル化部位でのメチル化状態は、非メチル化部位、完全にメチル化された部位及び/又はヘミメチル化部位を含む。幾つかの場合では、メチル化プロファイルの集合は、メチル化パネルを作成するために、例えば、個体の群あるいは腫瘍の型または特徴のためのメチル化プロファイルを表わすために使用される。幾つかの事例では、高メチル化は、正常な対照DNAサンプル内の対応するCpGジヌクレオチドで見られる5−mCytの量に対する、試験DNAサンプルのDNA配列内の1つ又は複数のCpGジヌクレオチドでの5−mCytの存在の増加に対応する平均のメチル化状態である。幾つかの場合では、低メチル化は、正常な対照DNAサンプル内の対応するCpGジヌクレオチドで見られる5−mCytの量に対する、試験DNAサンプルのDNA配列内の1つ又は複数のCpGジヌクレオチドでの5−mCytの存在の減少に対応する平均のメチル化状態である。
幾つかの実施形態では、各々のゲノムの部位(例えばCpG部位)に対するメチル化指標は、その部位をカバーする読み取りデータの総数にわたる部位でメチル化を示す配列読み取りデータの割合を指す。幾つかの事例では、領域のメチル化密度は、領域内の部位をカバーする読み取りデータの総数で割ったメチル化を示す領域内の部位での読み取りデータの数である。幾つかの場合では、領域のCpGメチル化密度は、領域内のCpG部位(例えば、特定のCpG部位、CpGアイランド内のCpG部位、またはより大きな領域)をカバーする読み取りデータの総数で割ったCpGメチル化を示す読み取りデータの数である。例えば、ヒトゲノム中の各100kbのビンに対するメチル化密度は、100kbの領域にマッピングされた配列読み取りデータによってカバーされたすべてのCpG部位の割合としてのCpG部位での(メチル化されたシトシンに対応する)転換されていない(unconverted)シトシンの総数から判定される。幾つかの場合では、この分析はまた、他のビンのサイズ、例えば50kbまたは1Mbなど)に対しても行われる。幾つかの事例では、領域は、ゲノム全体あるいは染色体または染色体の部分(例えば染色体腕)である。幾つかの場合では、CpG部位のメチル化指標は、領域がそのCpG部位のみを含むときの領域に対するメチル化密度と同じである。幾つかの場合では、メチル化されたシトシンの割合は、領域内の分析されたシトシン残基(つまり、CpG関連(context)以外のシトシンを含む)の総数にわたってメチル化される(例えば、亜硫酸水素塩転換などの脱アミノ化処置後に転換されない)と示されるシトシン部位「C’s」の数を指す。幾つかの場合では、メチル化指標、メチル化密度およびメチル化されたシトシンの割合は、メチル化レベルの例である。
幾つかの実施形態では、メチル化プロファイルの判定は、DNAサンプルからの少なくとも約1、5、10、15、20、25、30、35、40、50、75、or 100、150、200、250、300、400、500、750、1000、2000、2500、3000、4000、5000、7500、10000、20000、25000、30000、40000、50000、75000、100000、200000、300000、400000、500000、600000 and 700000を超えるCpG部位のメチル化状態の判定を含む。本実施形態の一態様では、メチル化プロファイルは、約1から約500,000のCpG部位のメチル化状態から生成される。
幾つかの実施形態では、メチル化プロファイルは生検サンプルに由来する。幾つかの事例では、メチル化プロファイルは組織サンプルに由来する。幾つかの事例では、メチル化プロファイルは無細胞の生体サンプルに由来する。幾つかの事例では、メチル化プロファイルは循環腫瘍DNA(ctDNA)サンプルに由来する。
<対照>
本明細書に記載される様々な方法論は、値、レベル、特徴、特性、性質などを、適正な対照、対照サンプル、または対照として本明細書で交換可能に言及される、適切な対照と比較する工程を含む。幾つかの実施形態では、対照は、患者から得られた細胞、組織、臓器、またはサンプル中で判定された、値、レベル、特徴、特性、性質などである。幾つかの事例では、細胞、組織、臓器、またはサンプルは、正常な細胞、組織、臓器、またはサンプルである。幾つかの場合では、細胞、組織、臓器、またはサンプルは、癌の細胞、組織、臓器、またはサンプルである。例えば、本発明のバイオマーカーは、影響されない個体または正常な対照個体、あるいは被験体の影響されない家族からのサンプル中のそれらのメチル化レベルに関して分析される。別の実施形態では、対照は、患者に治療(例えば癌治療)を開始する前に、または治療レジメン間に判定された、値、レベル、特徴、特性、性質などである。さらなる実施形態では、対照は、予め定義された値、レベル、特徴、特性、性質などである。
幾つかの実施形態では、対照は、患者のサンプルが比較される、癌の1つの型に相関する本発明の1つ以上のバイオマーカーのメチル化プロファイルである。幾つかの事例では、対照は、表15、16、17、18及び/又は20の1つ以上のバイオマーカーのメチル化プロファイルである。幾つかの事例では、対照は、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930の1つ以上のバイオマーカーのメチル化プロファイルである。幾つかの事例では、対照は、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555の1つ以上のバイオマーカーのメチル化プロファイルである。
幾つかの事例では、対照は、陽性対照、例えば、癌サンプルから得られたメチル化プロファイルであるか、または陰性対照、例えば、正常なサンプルから得られたメチル化プロファイルである。幾つかの事例では、対照はまた、トレ−ニングセットまたはトレ−ニングデータセットとも呼ばれる。
<検出方法>
幾つかの実施形態では、疾患または疾病(例えば癌)の進行においてバイオマーカー(つまり、DNAの領域/フラグメントまたはゲノムDNAの領域/フラグメント(例えば、CpGアイランドを含む領域/フラグメント))のメチル化の状態/レベルを測定し、検出し、判定し、特的し、および特徴づけ、それ故、疾患または疾病の発症、存在または状態を診断するために、多くの方法が利用される。
幾つかの事例では、メチル化プロファイルは、個体から分離された生体サンプルから生成される。幾つかの実施形態では、生体サンプルは生検である。幾つかの事例では、生体サンプルは組織サンプルである。他の事例では、生体サンプルは無細胞の生体サンプルである。他の事例では、生体サンプルは循環腫瘍DNAサンプルである。一実施形態では、生体サンプルは、循環腫瘍DNAを含有する無細胞の生体サンプルである。
幾つかの実施形態では、(本明細書でマーカーとしても言及される)バイオマーカーは組織サンプルから得られる。幾つかの事例では、組織はあらゆる細胞に対応する。異なる型の組織は、異なる型の細胞(例えば、肝臓、肺、血液、結合組織など)に対応するが、正常細胞対腫瘍細胞にも対応する、または腫瘍形成の様々なステージで腫瘍細胞に、または置き換えられた悪性腫瘍細胞に対応する。幾つかの実施形態では、組織サンプルはさらに、臨床サンプルを包含し、培養物、細胞上清、臓器などに細胞も含む。サンプルはまた、免疫組織化学的検査による病態解析または研究のために調製された、臨床的または病理学的な生検から調製されたブロックなどの、新鮮凍結した及び/又はホルマリン固定した、パラフィン包埋した組織ブロックを含む。
幾つかの実施形態では、バイオマーカーは液体サンプルから得られる。幾つかの実施形態では、液体サンプルは、血液および生体由来の他の液体サンプル(限定されないが、末梢血、血清、血漿、腹水、尿、脳脊髄液(CSF)、痰、唾液、骨髄、滑液、房水、羊水、耳垢、母乳、気管支肺胞洗浄液、精液、前立腺液、カウパー腺液または我慢汁、女性の潮吹きの液体、汗、 涙、嚢胞液、胸膜液および腹膜液、心膜液、腹水、リンパ液、粥状液、乳糜、胆汁、間質液、月経、膿汁、皮脂、嘔吐物、膣分泌物/フラッシング液(flushing)、滑液、粘膜分泌物、水様便、膵液、副鼻腔からの洗浄液、気管支肺吸引液、胚盤胞腔液(blastocyl cavity fluid)、または臍帯血を含む。幾つかの実施形態では、生体液は、血液、血液製剤または血液分画、例えば血清または血漿である。特定の実施形態では、サンプルは血液サンプルを含む。別の実施形態では、血清サンプルが使用される。別の実施形態では、サンプルは尿を含む。幾つかの実施形態では、液体サンプルはまた、遠心分離、濾過、沈殿、透析、クロマトグラフィー、試薬での処置、洗浄、または特定の細胞集団の濃縮などによって、それらの調達後にあらゆる方法で操作されたサンプルを包含する。
幾つかの実施形態では、バイオマーカーは、正常サンプル(例えば、疾患のない正常または対照の組織、あるいは正常または対照の体液、便、血液、血清、羊水)において、最も重要なことに健全な便、血液、血清、羊水または他の体液において、メチル化または非メチル化される。他の実施形態では、バイオマーカーは、例えば、正常サンプルと比較して、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、またはでの約100%の(それぞれ)増加したメチル化頻度で、癌を有する又はそのリスクのある患者からのサンプル中で低メチル化または高メチル化される。一実施形態では、サンプルはまた、癌を有する又はそのリスクのある同じ患者の以前に得られたサンプル分析と比較して、特に疾患の進行と比較して、低メチル化または高メチル化される。
幾つかの実施形態では、メチロームは、上に記載されたバイオマーカーなどの、1セットのバイオマーカーを含む。幾つかの事例では、生体(例えばヒト)の腫瘍のメチロームに対応するメチロームは、腫瘍メチロームとして分類される。幾つかの場合では、腫瘍メチロームは、生体サンプル中で腫瘍組織または無細胞の(またはタンパク質がない)腫瘍DNAを使用して判定される。対象のメチロームの他の例は、DNAを体液へと寄与する臓器のメチローム(例えば、脳、乳房、肺、前立腺および腎臓、血漿などの組織のメチロームなど)を含む。
幾つかの実施形態では、血漿メチロームは、動物(例えばヒト)の血漿または血清から判定されたメチロームである。幾つかの事例では、血漿および血清が無細胞のDNAを含むため、血漿メチロームは、無細胞の又はタンパク質がないメチロームの例である。血漿メチロームはまた、腫瘍および他の対象のメチロームの混合物であるため、混合メチロームの例である。幾つかの事例では、尿メチロームは、被験体の尿サンプルから判定される。幾つかの場合では、細胞メチロームは、患者の細胞(例えば、脳、肺、乳房などの臓器からの組織細胞)から判定されたメチロームに対応している。血液細胞のメチロームは、血液細胞メチローム(または血液メチローム)と呼ばれる。
幾つかの実施形態では、DNA(例えば、抽出されたゲノムDNAまたは処理されたゲノムDNAなどのゲノムDNA)は、市販のキットの使用を含む、当該技術分野で芳醇の手段によって単離される。簡潔には、ここで対象のDNAは細胞膜によってカプセル化され、生体サンプルは、酵素的、化学的、または機械的な手段で破壊および溶解されなければならない。幾つかの場合では、その後、例えば、プロテイナーゼKでの消化によって、DNA溶液からタンパク質および他の汚染物質を取り除かれる。その後、DNAは溶液から回収される。そのような場合、これは、塩析、有機抽出または固相担体へのDNAの結合を含む様々な方法によって実行される。幾つかの事例では、方法の選択は、時間、費用および必要とされるDNAの量を含む幾つかの因子による影響を受ける。
ここで、サンプルDNAは、膜に囲まれておらず(例えば、血液または尿などの無細胞のサンプルから循環するDNA)、DNAの単離及び/又は精製に対して当該技術分野で標準的な方法が、随意に使用される(例えば、Bettegowda et al. Detection of Circulating Tumor DNA in Early− and Late−Stage Human Malignancies. Sci. Transl. Med, 6(224): ra24. 2014を参照)。そのような方法は、タンパク質変性試薬、例えばカオトロピック塩(例えば塩酸グアニジンまたは尿素);または洗剤、例えばドデシル硫酸ナトリウム(SDS)、臭化シアンの使用を含む。代替方法は、限定されないが、含むが、エタノール沈澱またはプロパノール沈殿、とりわけ遠心分離による、減圧濃縮を含む。幾つかの場合では、当業者は、フィルタ装置などの装置を活用する(例えば、限外濾過、シリカ表面または膜、磁気微粒子、ポリスチロール微粒子、ポリスチロール表面、正帯電表面、および正帯電膜、帯電膜、帯電表面、帯電したスイッチ膜、帯電したスイッチ表面)。
幾つかの事例では、核酸が抽出されると、当該技術分野で既知の手段によって、メチル化分析が行われる。様々なメチル化分析手順が、当該技術分野で知られており、本発明を実行するために使用されてよい。これらのアッセイは、組織サンプル内の1つの又は複数のCpG部位のメチル化状態の判定を可能にする。さらに、これらの方法は、メチル化された核酸の絶対的または相対的な定量化に使用されてもよい。そのようなメチル化アッセイは、他の技術の中でもとりわけ、2つの主要な工程を含む。第1の工程は、(i)亜硫酸水素塩での処置、(ii)メチル化特異的な結合、または(iii)メチル化特異的な制限酵素などの、メチル化特異的な反応または分離である。第2の主要な工程は、(a)Taqman(登録商標)などのPCR(配列特異的な増幅)、(b)未処理の及び亜硫酸水素塩処理したDNAのDNA配列決定(c)(環状ライゲーションおよび切断を含む)色素修飾したプローブのライゲーションによる配列決定、(d)ピロシーケンス、(e)単一分子の配列決定、(f)質量分光法、または(g)サザンブロット分析などの様々な方法による、(i)増幅および検出、または(ii)直接検出を含む。
さらに、亜硫酸水素塩変換されたDNAから増幅されたPCR産物の制限酵素消化、例えば、Sadri and Hornsby(1996, Nucl. Acids Res. 24:5058− 5059)、またはCOBRA (Combined Bisulfite Restriction Analysis)(Xiong and Laird, 1997, Nucleic Acids Res. 25:2532− 2534)によって記載される方法が使用されてもよい。COBRA分析は、少量のゲノムDNAにおいて特異的遺伝子の遺伝子座でDNAメチル化レベルを判定するのに有用な定量的メチル化アッセイである。簡潔には、亜硫酸水素ナトリウム処理されたDNAのPCR産物のメチル化依存性の配列の差を明らかにするために、制限酵素消化が使用される。メチル化依存性の配列の差は、Frommer et al.(Frommer et al, 1992, Proc. Nat. Acad. Sci. USA, 89, 1827−1831)によって記載された手順に従って、標準の亜硫酸水素塩処理によってゲノムDNAへと最初に導入される。その後、対象のCpG部位に特異的なプライマーを使用して、亜硫酸水素塩変換されたDNAのPCR増幅が実行され、その後、制限酵素消化、ゲル電気泳動法、および特定の、標識されたハイブリダイゼーションプローブを使用する検出が実行される。元のDNAサンプル中のメチル化レベルは、広範囲のDNAメチル化レベルにわたって直線的に定量的な方法で、相対量の消化および未消化のPCR産物によって表わされる。さらに、この技術は、顕微解剖されたパラフィン包埋した組織サンプルから得られたDNAに確実に適用され得る。COBRA分析用の典型的な試薬(例えば、典型的なCOBRAベースのキットで見られかもしれない)は、限定されないが、特異的遺伝子用のPCRプライマー(またはメチル化変更されたDNA配列またはCpGアイランド);制限酵素および適切な緩衝液;遺伝子ハイブリダイゼーションオリゴ(oligo);対照ハイブリダイゼーションオリゴ;オリゴプローブ用のキナーゼ標識化キット;および放射性ヌクレオチド、を含む。さらに、亜硫酸水素塩転換試薬は、DNA変性緩衝液;スルホン化緩衝液;DNA回収試薬またはキット(例えば、沈殿、限外濾過、アフィニティーカラム);脱スルホン化緩衝液;およびDNA回収成分、を含み得る。
一実施形態では、選択されたCpG部位のメチル化プロファイルは、メチル化に特異的なPCR(MSP)を使用して判定される。MSPは、メチル化感受性の制限酵素の使用とは無関係に、CpGアイランド内のCpG部位の事実上あらゆる群のメチル化の状態を評価することを可能にする(Herman et al, 1996, Proc. Nat. Acad. Sci. USA, 93, 9821− 9826; 米国特許番号第5,786,146号、第6,017,704号、第6,200,756号、第6,265,171号(Herman and Baylin); 米国特許公開番号2010/0144836(Van Engeland et al);これらは、それら全体が引用によって本明細書に組み込まれる)。簡潔には、DNAは、非メチル化の、メチル化されていないシトシンをウラシル変換するために、亜硫酸水素ナトリウムなどの脱アミノ化剤によって修飾され、続いて、メチル化対非メチル化のDNAに特異的なプライマーで増幅された。MSP分析用の典型的な試薬(例えば、典型的なMSPベースのキットで見られかもしれない)は、限定されないが、特異的遺伝子用のPCRプライマー(またはメチル化変更されたDNA配列またはCpGアイランド)、最適化したPCR緩衝液およびデオキシリボヌクレオチド、および特異的プローブを含む。ColoSure(商標)試験は、ビメンチン遺伝子のメチル化のMSPの技術および測定に基づいた結腸癌に対する市販の試験である(Itzkowitz et al, 2007, Clin Gastroenterol. Hepatol. 5(1), 111−117)。代替的に、当業者は、Fackler et al. Fackler et al, 2004, Cancer Res. 64(13) 4442−4452;またはFackler et al, 2006, Clin. Cancer Res. 12(11 Pt 1) 3306−3310によって記載されるような、定量的マルチプレックスメチル化に特異的なPCR(QM−PCR)を使用し得る。
一実施形態では、選択されたCpG部位のメチル化プロファイルは、MethyLight及び/又はHeavy Methyl Methodを使用して判定される。MethyLightおよびHeavy Methylアッセイは、PCR工程後にさらなる操作を必要としない、蛍光ベースのリアルタイムPCR(Taq Man(登録商標))技術を利用する、高スループット定量的メチル化アッセイである(Eads, C.A. et al, 2000, Nucleic Acid Res. 28, e 32; Cottrell et al, 2007, J. Urology 177, 1753, 米国特許第6,331,393号 (Laird et al)、これらの内容はそれら全体が引用によって本明細書に組み込まれる)。簡潔には、MethyLightプロセスは、標準手続きによって、亜硫酸水素ナトリウム反応においてメチル化依存性の配列の差の混合プールに変換されるゲノムDNAの混合サンプルから始まる(亜硫酸水素塩プロセスは、非メチル化シトシン残基をウラシルに変換する)。その後、蛍光ベースのPCRは、「バイアスをかけられていない(unbiased)」(既知のCpGメチル化部位を重複しないプライマーを用いる)PCR反応、または「バイアスをかけられ(biased)」(既知のCpGジヌクレオチドを重複するPCRプライマーを用いる)反応のいずれかで実行される。幾つかの場合では、増幅プロセスのレベルまたは蛍光検出プロセスのレベルのいずれか、あるいはその両方で、配列識別が生じる。幾つかの場合では、MethyLightアッセイは、ゲノムDNAサンプル中でメチル化パターンに対する定量的試験として使用され、ここで、配列識別がプローブハイブリダイゼーションのレベルで生じる。この定量的バージョンでは、PCR反応は、特定の推定上のメチル化部位を重複する蛍光プローブの存在下でバイアスがかけられていない増幅を提供する。入力DNAの量に対するバイアスがかけられていない対照が、プライマーもプローブもCpGジヌクレオチドを覆っていない反応によって提供される。代替的に、ゲノムのメチル化に対する定性試験が、既知のメチル化部位を「カバーしていない(cover)」対照オリゴヌクレオチドを用いて(「MSP」技術の蛍光ベースのバージョン)、または潜在的なメチル化部位をカバーするオリゴヌクレオチドを用いて、バイアスがかけられていないPCRプールの調査(probing)によって達成される。MethyLight分析用の典型的な試薬(例えば、典型的なMethyLightベースのキットで見られかもしれない)は、限定されないが、特異的遺伝子用のPCRプライマー(またはメチル化変更されたDNA配列またはCpGアイランド);TaqMan(登録商標)プローブ;最適化されたPCR緩衝液およびデオキシリボヌクレオチド;およびTaqポリメラーゼ、を含む。MethyLight技術は、肺癌(epi proLung BL Reflex Assay);結腸癌(epi proColon assay and mSEPT9 assay)(Epigenomics, Berlin, Germany)PCT公開番号WO 2003/064701(Schweikhardt and Sledziewski)に対する市販の試験に使用され、これらの内容は、それら全体が引用によって本明細書に組み込まれる。
定量的MethyLightは、ゲノムDNAを変換するために亜硫酸水素塩を使用し、メチル化された部位は、メチル化に依存しないプライマーを備えるPCRを使用して増幅される。2つの異なるフルオロフォアを用いるメチル化および非メチル化の部位に特異的な検出プローブは、メチル化の同時の定量的測定を提供する。Heavy Methyl技術は、DNAの硫酸水素塩転換から始まる。次に、特異的な遮断薬は、非メチル化DNAの増幅を防ぐ。メチル化されたゲノムDNAは遮断薬に結合せず、それらの配列が増幅される。増幅された配列は、メチル化特異的プローブで検出される(Cottrell et al, 2004, Nuc. Acids Res. 32:e10、これらの内容は、それら全体が引用によって本明細書に組み込まれる)。
Ms−SNuPE技術は、DNAの亜硫酸水素塩処置に基づいた特定のCpG部位でのメチル化の差の評価、その後の単一ヌクレオチドのプライマー伸張のための定量方法である(Gonzalgo and Jones, 1997, Nucleic Acids Res. 25, 2529−2531)。簡潔には、ゲノムDNAは亜硫酸水素ナトリウムと反応させられて、5−メチルシトシンを変更させずに非メチル化シトシンをウラシルに変換する。その後、亜硫酸水素塩変換されたDNAに特異的なPCRプライマーを使用して、望ましい標的配列の増幅が実行され、結果として生じる産物が、分離され、対象のCpG部位でのメチル化分析のための鋳型として使用される。幾つかの場合では、少量のDNAが分析され(例えば、顕微解剖された病理部分)、その方法は、CpG部位でのメチル化状態を判定するための制限酵素の利用を回避する。Ms−SNuPE分析用の典型的な試薬(例えば、典型的なMs−SNuPEベースのキットで見られかもしれない)は、限定されないが、特異的遺伝子用のPCRプライマー(またはメチル化変更されたDNA配列またはCpGアイランド);最適化されたPCR緩衝液およびデオキシリボヌクレオチド;ゲル抽出キット;陽性対照プライマー;特異的遺伝子用のMs−SNuPEプライマー;(Ms−SNuPE反応用の)反応緩衝液;および放射性ヌクレオチド、を含む。さらに、亜硫酸水素塩転換試薬は、DNA変性緩衝液;スルホン化緩衝液;DNA回収試薬またはキット(例えば、沈殿、限外濾過、アフィニティーカラム);脱スルホン化緩衝液;およびDNA回収成分、を含み得る。
別の実施形態では、選択されたCpG部位のメチル化状態は、差次的な結合ベースのメチル化検出方法(Binding−based Methylation Detection Methods)を使用して判定される。差次的にメチル化された領域の識別のための1つのアプローチは、メチル化されたDNAを捕捉することである。このアプローチはタンパク質を使用し、ここで、MBD2のメチル結合ドメインは、抗体(MBD−FC)のFcフラグメントに融合される(Gebhard et al, 2006, Cancer Res. 66:6118−6128;およびPCT公開番号WO 2006/056480 A2(Relhi)、これらの内容はそれら全体が引用によって本明細書に組み込まれる)。この融合タンパク質は、従来のメチル化特異抗体よりも幾つかの利点を有する。MBD FCは、メチル化されたDNAに対するより高い親和性を有し、二本鎖DNAに結合する。最も重要なことに、2つのタンパク質は、DNAに結合する方法において異なる。メチル化特異抗体はDNAに確率的に結合し、これは、バイナリアンサー(binary answer)だけが得られることを意味している。一方、MBD−FCのメチル結合ドメインは、それらのメチル化状態にかかわらずDNA分子に結合する。このタンパク質−DNA相互作用の強度は、DNAメチル化のレベルによって定義される。ゲノムDNAの結合後、塩濃度が増加する溶出液を用いて、非メチル化およびメチル化のDNAを分画し、より制御された分離を可能にする(Gebhard et al, 2006, Nucleic Acids Res. 34: e82)。結果的に、メチル(Methyl)−CpG免疫沈降法(MCIP)と呼ばれるこの方法は、メチル化レベルに従ってゲノムDNAを濃縮するだけでなく、分画し、これは、非メチル化DNA分画も調査されるべきであるときに特に有用である。
代替的な実施形態では、5−メチルシチジン抗体が、メチル化したDNAに結合し、それを沈殿させる。抗体は、Abeam(Cambridge, MA)、Diagenode(Sparta, NJ)またはEurogentec (c/o AnaSpec, Fremont, CA)から入手可能である。メチル化されたフラグメントは、分離されると、メチル化されたCpGアイランド回収アッセイ(MIRA)またはメチル化されたDNA免疫沈降法(MeDIP)などのマイクロアレイベースの技術を使用して配列決定され得る(Pelizzola et al, 2008, Genome Res. 18, 1652−1659; O'Geen et al, 2006, BioTechniques 41(5), 577−580, Weber et al, 2005, Nat. Genet. 37, 853−862; Horak and Snyder, 2002, Methods Enzymol, 350, 469−83; Lieb, 2003, Methods Mol Biol, 224, 99−109)。別の技術は、部分的に溶かされた分子のメチル−CpG結合ドメインのカラム/分離である(MBD/SPM, Shiraishi et al, 1999, Proc. Natl. Acad. Sci. USA 96(6):2913−2918)。
幾つかの実施形態では、メチル化の検出のための方法は、ゲノムDNAをランダムに剪断する及びランダムに断片化する工程、メチル化依存性またはメチル化感受性の制限酵素を用いてDNAを切断する工程、および続いて、切断した又は切断していないDNAを選択的に同定及び/又は分析する工程を含む。選択的な同定は、例えば、切断した及び切断していないDNAを(例えばサイズによって)分離する工程、および切断された又は代替的に切断されていない対象の配列を定量化する工程を含むことができる。例えば、米国特許第7,186,512号を参照。代替的に、該方法は、制限酵素消化後に無傷なDNAを増幅させる工程を含むことができ、それによって、増幅された領域において制限酵素によって切断されなかったDNAを単に増幅させる。例えば、米国特許第7,910,296号;第7,901,880号;および第7,459,274号を参照。幾つかの実施形態では、増幅は、遺伝子特異的なプライマーを使用して実行され得る。
例えば、メチル化されていない場合にDNA認識配列で優先的または実質的に切断または消化するメチル感受性酵素がある。したがって、非メチル化DNAサンプルは、メチル化DNAサンプルよりも小さなフラグメントへと切断される。同様に、高メチル化DNAサンプルは切断されない。対照的に、メチル化される場合にのみDNA認識配列で切断するメチル感受性酵素がある。当該技術の方法での使用に適した、非メチル化DNAを消化するメチル感受性酵素は、限定されないが、Hpall、Hhal、Maell、BstUIおよびAcilを含む。幾つかの事例では、使用される酵素は、非メチル化配列CCGGのみを切断するHpallである。他の事例では、使用される別の酵素は、非メチル化配列GCGCのみを切断するHhalである。両方の酵素は、New England BioLabs(登録商標),Inc.から入手可能である。非メチル化DNAのみを消化する2つ以上のメチル感受性酵素の組み合わせも使用される。非メチル化DNAのみを消化する適切な酵素は、限定されないが、完全にメチル化された5’−GATC配列で単に切断する、Dpnl、およびDNAを含有する修飾されたシトシン(5−メチルシトシンまたは5−ヒドロキシメチルシトシン、あるいはN4−メチルシトシン)を切断する及び認識部位’5...PumC(N4o−3ooo)PumC...3’で切断する、McrBC(エンドヌクレアーゼ)を含む(New England BioLabs, Inc., Beverly, MA)を含む。特定部位でDNAを切断するために選択された制限酵素のための切断の方法および手順は、当業者に周知である。例えば、New England BioLabs、Pro−Mega Biochems、Boehringer−Mannheimなどを含む、制限酵素の多くのサプライヤーは、特異的な制限酵素によって切断されたDNA配列の状態およびタイプについての情報を提供している。Sambrook et al.(Sambrook et al. Molecular Biology: A Laboratory Approach, Cold Spring Harbor, N.Y. 1989を参照)は、制限酵素および他の酵素を使用する方法の概説を提供している。
幾つかの事例では、メチル化依存性の制限酵素は、メチル化された認識配列で又はその近位でDNAを切断または消化するが、認識配列がメチル化されてないときに同じ配列で又はその近くでDNAを切断しない、制限酵素である。メチル化依存性の制限酵素は、メチル化された認識配列で切断された酵素(例えばMcrBC)および認識配列ではなく近くの配列で切断された酵素(例えばDpnl)を含む。例えば、McrBCの認識配列は、5’RmC(N40−3000)RmC3’であり、ここで、「R」はプリンであり、「mC」はメチル化されたシトシンであり、および「N40−3000」は、制限事象が観察された2つのRmCの半分の部位間の距離を示す。 McrBCは、一般に、片方の半分の部位またはもう片方の半分の部位の近くで切断するが、切断位置は、典型的に、幾つかの塩基対(メチル化された塩基からおよそ30の塩基対)にわたって分布する。McrBCは、時に半分の部位両方の3’、時に半分の部位両方の5’、および時に2つの部位間で切断する典型的なメチル化依存性の制限酵素は、例えば、McrBC、McrA、MrrA、Bisl、Glal、およびDpnlを含む。当業者は、本明細書に記載される制限酵素の相同体およびオルソログを含む、メチル化依存性の制限酵素も、本発明での使用に適していることを認識する。
幾つかの場合では、メチル化感受性の制限酵素は、非メチル化認識配列で又はその近位でDNAを切断するが、認識配列がメチル化されるときに同じ配列で又はその近位で切断しない、制限酵素である。典型的なメチル化感受性の制限酵素は、例えば、McClelland et al, 22(17) NUCLEIC ACIDS RES. 3640−59 (1994)に記載されている。認識配列内のシトシンが位置C5でメチル化されるときにそれらの認識配列で又はその近くでDNAを切断しない適切なメチル化感受性の制限酵素は、例えば、Aat II、Aci I、Acd I、Age I、Alu I、Asc I、Ase I、AsiS I、Bbe I、BsaA I、BsaH I、BsiE I、BsiW I、BsrF I、BssH II、BssK I、BstB I、BstN I、BstU I、Cla I、Eae I、Eag I、Fau I、Fse I、Hha I、HinPl I、HinC II、Hpa II、Hpy99 I、HpyCH4 IV、Kas I、Mbo I、Mlu I、MapAl I、Msp I、Nae I、Nar I、Not I、Pml I、Pst I、Pvu I、Rsr II、Sac II、Sap I、Sau3A I、Sfl I、Sfo I、SgrA I、Sma I、SnaB I、Tsc I、Xma I、およびZra Iを含む。認識配列内のアデノシンが位置N6でメチル化されるときにそれらの認識配列で又はその近くでDNAを切断しないメチル化感受性の制限酵素は、例えば、Mbo Iを含む。当業者は、本明細書に記載される制限酵素の相同体およびオルソログを含む、メチル化感受性の制限酵素も、本発明での使用に適していることを認識する。当業者はさらに、その認識配列で又はその近くでシトシンのメチル化の存在下において切断に失敗するメチル化感受性の制限酵素が、その認識配列で又はその近くでアデノシンのメチル化の存在に非感受性であり得ることを認識する。同様に、その認識配列で又はその近くでアデノシンのメチル化の存在下において切断に失敗するメチル化感受性の制限酵素は、その認識配列で又はその近くでシトシンのメチル化の存在に非感受性であり得る。例えば、Sau3AIは、その認識配列で又はその近くでメチル化されたシトシンの存在に感受性である(つまり切断に失敗する)が、その認識配列で又はその近くでメチル化されたアデノシンの存在に非感受性である(つまり切断する)。当業者はまた、幾つかのメチル化感受性の制限酵素が、それらの認識配列他のDNA包含(encompassing)の1つ又は両方の鎖上の塩基のメチル化によってブロックされ、一方で、他のメチル化感受性の制限酵素が、両方の鎖上のメチル化によってのみブロックされるが、認識部位がヘミメチル化される場合に切断することができることを認識する。
代替的な実施形態では、アダプターが、ランダムに断片化されたDNAの端部に随意に加えられ、その後、DNAは、メチル化依存性またはメチル化感受性の制限酵素で消化され、続いて、無傷なDNAは、アダプター配列にハイブリダイズするプライマーを使用して増幅される。この場合、DNAの増幅されたプールにおいて特定の遺伝子の存在、欠如または量を判定する、第2の工程が実行される。幾つかの実施形態では、DNAは、リアルタイムの定量的PCRを使用して増幅される。
他の実施形態では、該方法は、ゲノムDNAの集団内の標的配列において平均のメチル化密度を定量化する工程を含む。幾つかの実施形態では、該方法は、遺伝子座中の潜在的な制限酵素の切断部位の少なくとも幾つかのコピーを、切断されないままにすることが可能である条件下で、ゲノムDNAをメチル化依存性の制限酵素またはメチル化感受性の制限酵素と接触させる工程;遺伝子座の無傷なコピーを定量化する工程;および増幅された産物の量を対照DNAのメチル化の量を表わす対照値と比較する工程であって、それによって、対照DNAのメチル化密度と比較して遺伝子座中の平均のメチル化密度を定量化する工程、を含む。
幾つかの事例では、DNAの遺伝子座のメチル化の量は、遺伝子座を含むゲノムDNAのサンプルを提供し、メチル化感受性またはメチル化依存性のいずれかである制限酵素を用いてDNAを切断し、およびその後、無傷なDNAの量を定量化する又は対象のDNA遺伝子座で切断されたDNAの量を定量化することによって判定される。無傷な又は切断されたDNAの量は、遺伝子座を含むゲノムDNAの最初の量、遺伝子座中のメチル化の量、およびゲノムDNAにおいてメチル化される遺伝子座中のヌクレオチドの数(つまり分画)に依存する。DNA遺伝子座中のメチル化の量は、無傷なDNAまたは切断されたDNAの量を、同様に処理されたDNAサンプル中の無傷なDNAまたは切断されたDNAの量を表わす対照値と比較することによって判定され得る。対照値は、メチル化されたヌクレオチドの既知の又は予測された数を表わすことができる。代替的に、対照値は、別の(例えば、正常な、非疾患の)細胞中の同じ遺伝子座または第2の遺伝子座からの無傷な又は切断されたDNAの量を表わすことができる。
遺伝子座中の潜在的な制限酵素の切断部位の少なくとも幾つかのコピーを、切断されないままにすることが可能である条件下で、少なくとも1つのメチル化感受性またはメチル化依存性の制限酵素を使用し、続いて、残りの無傷なコピーを定量化し、および量を対照と比較することによって、遺伝子座の平均のメチル化密度が判定され得る。メチル化感受性の制限酵素が、遺伝子座中の潜在的な制限酵素の切断部位の少なくとも幾つかのコピーを、切断されないままにすることが可能である条件下で、DNA遺伝子座のコピーに接触される場合、残りの無傷なDNAは、メチル化密度に正比例し、それ故、サンプル中の遺伝子座の相対的なメチル化密度を判定するために対照と比較され得る。同様に、メチル化依存性の制限酵素が、遺伝子座中の潜在的な制限酵素の切断部位の少なくとも幾つかのコピーを、切断されないままにすることが可能である条件下で、DNA遺伝子座のコピーに接触される場合、残りの無傷なDNAは、メチル化密度に反比例し、それ故、サンプル中の遺伝子座の相対的なメチル化密度を判定するために対照と比較され得る。そのようなアッセイは、例えば、米国特許第7,910,296号に開示される。
メチル化されたCpGアイランドの増幅(MCA)技術は、ゲノムDNA中の変更されたメチル化パターンをスクリーニングするために、およびこれらの変更に関連する特異的配列を分離するために使用され得る方法である(Toyota et al, 1999, Cancer Res. 59, 2307−2312,米国特許第7,700,324号(Issa et al)、これらの内容はそれら全体が引用によって本明細書に組み込まれる)。簡潔には、それらの認識部位におけるシトシンのメチル化に対する異なる感受性を有する制限酵素は、恣意的にプライミングされたPCR増幅の前に、一次腫瘍、細胞株、および正常組織からのゲノムDNAを消化するために使用される。差次的なメチル化を示すフラグメントは、PCR産物を高分解能のポリアクリルアミドゲル上で分解した後に、クローン化され、配列決定される。その後、クローン化されたフラグメントは、これらの領域の差次的なメチル化を確証するサザン解析のためにプローブとして使用される。MCA分析用の典型的な試薬(例えば、典型的なMCAベースのキットで見られかもしれない)は、限定されないが、恣意的なプライミングゲノムDNA用のPCRプライマー;PCR緩衝液およびヌクレオチド、制限酵素および適切な緩衝液;遺伝子ハイブリダイゼーションのオリゴまたはプローブ;対照ハイブリダイゼーションのオリゴまたはプローブ、を含む。
追加のメチル化検出方法は、例えば、米国特許第7,553,627号;第6,331,393号;米国特許番号12/476,981;米国特許公開番号2005/0069879号;Rein, et al, 26(10) NUCLEIC ACIDS RES. 2255−64 (1998); and Olek et al, 17(3) NAT. GENET. 275−6 (1997)に記載されるこれらの方法を含む。
別の実施形態では、選択されたCpG部位のメチル化状態は、メチル化感受性高分解能融解(Methylation− Sensitive High Resolution Melting)(HRM)を使用して判定される。最近、Wojdacz et al.は、メチル化を評価する技術としてメチル化感受性高分解能融解を報告した(Wojdacz and Dobrovic, 2007, Nuc. Acids Res. 35(6) e41; Wojdacz et al. 2008, Nat. Prot. 3(12) 1903−1908; Balic et al, 2009 J. Mol. Diagn. 11 102− 108;および米国特許公開番号2009/0155791 (Wojdacz et al)、これらの内容はそれら全体が引用によって本明細書に組み込まれる)。様々な市販のリアルタイムPCRマシンが、Roche LightCycler480、Corbett Research RotorGene6000、およびthe Applied Biosystems 7500を含むHRMシステムを有する。HRMは、Candiloro et al.(Candiloro et al, 2011, Epigenetics 6(4) 500−507)によって記載されるようなピロシーケンスなどの他の増幅技術と組み合わせられてもよい。
別の実施形態では、選択されたCpG遺伝子座のメチル化状態は、質量分析法を使用する分析のために増幅された標的を生成する最適化されたPCR増幅反応を含む、プライマー伸張アッセイを使用して判定される。アッセイもマルチプレックスで(in multiplex)行うことができる。質量分析法は、差次的にメチル化された調節エレメントに関連付けられたポリヌクレオチドの検出のための特に有効な方法である。ポリヌクレオチド配列の存在は、検出された信号の質量を対象のポリヌクレオチドの予期された質量と比較することによって確証される。特定のポリヌクレオチド配列に対する相対的な信号強度、例えば、スペクトル上の質量ピークは、特異的対立遺伝子の相対的な集団を示し、それ故、データからの直接の対立遺伝子比率の計算が可能になる。この方法は、PCT公開番号WO 2005/012578 A1(Beaulieu et al)に詳細に記載され、これは、その全体が引用によって本明細書に組み込まれる。メチル化分析のために、亜硫酸水素塩を導入されたメチル化依存性のCからTへの配列変化を検出するためのアッセイが採用され得る。これらの方法は、スループットをさらに増加させ、プライマー伸張反応のための1反応当たりのコストを減少させるために、単一のウェルにおいて多重増幅反応および多重プライマー伸張反応(例えば、多重均質のプラーマー質量伸張(multiplexed homogeneous primer mass extension)(hME)アッセイ)を実行するのに特に有用である。
DNAメチル化分析のための他の方法は、制限酵素ランドマークゲノムスキャニング法(RLGS, Costello et al, 2002, Meth. Mol Biol, 200, 53−70)、メチル化−感受性の発現差解析(MS−RDA、Ushijima and Yamashita, 2009, Methods Mol Biol 507, 1 17−130)を含む。相対的なメチル化技術のための包括的な高スループットアレイ(CHARM)は、WO 2009/021141(Feinberg and Irizarry)に記載されている。クロマチン免疫沈降(Chromatin Immunoprecipitation)のオンチップ(ChlPチップ)またはメチル化DNA免疫沈降のオンチップ(MeDIPチップ)を含む、Roche(登録商標)NimbleGen(登録商標)マイクロアレイ。これらのツールは、黒色腫、肝臓癌および肺癌を含む様々な癌の適用に使用されている(Koga et al, 2009, Genome Res., 19, 1462−1470; Acevedo et al, 2008, Cancer Res., 68, 2641−2651; Rauch et al, 2008, Proc. Nat. Acad. Sci. USA, 105, 252−257)。硫酸水素塩転換、パッドロックプローブのハイブリダイゼーション、環状化、増幅およびメチル化の高スループット検出のための次世代または多重の配列決定などの他の方法が報告されている(Deng et al, 2009, Nat. Biotechnol 27, 353−360; Ball et al, 2009, Nat. Biotechnol 27, 361−368;米国特許第7,611,869号(Fan))。硫酸水素塩酸化に代わるものとして、Bayeyt et al.は、チミジンと反応させることなく5−メチルシトシンを酸化させ、その後、PCRまたはピロシーケンスが続く、選択的酸化剤を報告した(WO 2009/049916(Bayeyt et al))。
これらの技術に対するこれらの言及は、それら全体が引用によって本明細書に組み込まれる。
幾つかの事例では、定量的増幅方法(例えば、定量的PCRまたは定量的線形増幅)は、制限消化後に増幅プライマーに隣接した遺伝子座内の無傷なDNAの量を定量化するために使用される。定量的増幅の方法は、例えば、米国特許第6,180,349号;第6,033,854号;および第5,972,602号に加えて、例えば、DeGraves, et al, 34(1) BIOTECHNIQUES 106−15 (2003); Deiman B, et al., 20(2) MOL. BIOTECHNOL. 163−79 (2002);およびGibson et al, 6 GENOME RESEARCH 995−1001 (1996)に開示されている。
メチル化の特異的な方法での核酸の反応または分離後に、幾つかの場合での核酸は、配列ベースの分析を受ける。例えば、1つの特定の黒色腫のゲノム配列が、良性の対応物と比較して高メチル化または低メチル化されることが判定されると、このゲノム配列の量を判定することができる。続いて、この量は、標準の対照値と比較され、黒色腫に対する指標として働くことができる。多くの事例では、当業者に周知の幾つかの核酸増幅手順のいずれかを使用して、核酸配列を増幅することが望ましい。具体的には、核酸増幅は、増幅されている核酸配列に相補的な配列を含む核酸コピーの化学的または酵素的な合成である(鋳型)。本発明の方法およびキットは、米国特許第5,525,462号(Takarada et al);第6,114,117号(Hepp et al);第6,127,120号(Graham et al);第6,344,317号(Urnovitz);第6,448,001号(Oku);第6,528,632号(Catanzariti et al);およびPCT公開番号WO 2005/111209(Nakajima et al)に記載される方法などの、当業者に既知の核酸増幅または検出の方法を使用し得、これらすべては、それら全体が引用によって本明細書に組み込まれる。
幾つかの実施形態では、核酸は、当業者に周知の方法論を使用して、PCR増幅によって増幅される。しかしながら、当業者は、リガーゼ連鎖反応(LCR)、Q−レプリカ増幅、ローリングサークル増幅、転写増幅、自家持続配列複製法、核酸配列ベースの増幅(NASBA)(これら各々は十分な増幅を提供する)などの、任意の既知の方法によって、増幅が達成され得ることを認識する。特定のメチル化パターンを表わす、技術の配列の存在を質的に実証する、またはサンプル中のこの特定のゲノム配列の量を定量的に判定するために、随意に、分枝したDNA技術も使用される。Nolteは、臨床サンプル中の核酸配列の直接の定量化のための分枝したDNAシグナル増幅を調査している(Nolte, 1998, Adv. Clin. Chem. 33:201−235)。
PCRプロセスは、当業者に周知であり、例えば、逆転写PCR、ライゲーションPCR、デジタルPCR(dPCR)、またはドロップレットデジタルPCR(ddPCR)を含む。PCRの方法およびプロトコルの調査については、例えば、Innis et al, eds., PCR Protocols, A Guide to Methods and Application, Academic Press, Inc., San Diego, Calif. 1990;米国特許第4,683,202号(Mullis)を参照。PCRの試薬およびプロトコルも、Roche Molecular Systemsなどの、商用ベンダーから利用可能である。幾つかの事例では、PCRは、熱安定酵素を用いる自動化プロセスとして実行される。このプロセスでは、反応混合物の温度は、自動的に、変性領域、プライマーのアニーリング領域、および伸張反応領域を通って循環させられる。この目的に特に適したマシンは市販で入手可能である。
幾つかの実施形態では、Invader(登録商標)技術などの侵襲性の切断反応を使用して、増幅された配列も測定される(Zou et al, 2010, Association of Clinical Chemistry (AACC)(2010年7月28日にポスター発表) , "Sensitive Quantification of Methylated Markers with a Novel Methylation Specific Technology;および米国特許第7,011,944号(Prudent et al))。
適切な次世代の配列決定技術が広く利用可能である。例は、以下を含む:454 Life Sciencesのプラットフォーム (Roche, Branford, CT)(Margulies et al. 2005 Nature, 437, 376−380); lllumina's Genome Analyzer, GoldenGate Methylation Assay、またはInfinium Methylation Assays、即ちInfinium HumanMethylation 27K BeadArrayまたはVeraCode GoldenGateのメチル化アレイ(Illumina, San Diego, CA; Bibkova et al, 2006, Genome Res. 16, 383−393;米国特許第6,306,597号および第7,598,035号(Macevicz); 第7,232,656号(Balasubramanian et al.)); Bio−RadからのQX200(商標) Droplet Digital(商標) PCR System;またはDNA Sequencing by Ligation, SOLiD System (Applied Biosystems/Life Technologies;米国特許第6,797,470号, 第7,083,917号, 第7,166,434号, 第7,320,865号, 第7,332,285号, 第7,364,858号,および第7,429,453号(Barany et al); the Helicos True Single Molecule DNAの配列決定技術(Harris et al, 2008 Science, 320, 106−109;米国特許第7,037,687号および第7,645,596号(Williams et al);第7, 169,560号(Lapidus et al);第7,769,400号(Harris)),単一の分子、Pacific Biosciencesのリアルタイム(SMRT(商標))技術、および配列決定(Soni and Meller, 2007, Clin. Chem. 53, 1996−2001);半導体配列決定(Ion Torrent; Personal Genome Machine);DNAナノボール配列決定;Dover Systems (Polonator)からの技術、およびナノポアベースの戦略(例えば、Oxford Nanopore, Genia Technologies, and Nabsys)などの、増幅を必要としない、またはそうでなければ配列決定前に天然DNAを変換する(例えば、Pacific Biosciences and Helicos)技術を使用する配列決定。これらのシステムは、並列様式で多重化の高次(high orders)で標本から分離された多くの核酸分子の配列決定を可能にする。これらのプラットフォームの各々は、核酸フラグメントのクローン的に拡張された又は増幅されなかった単一分子の配列決定を可能にする。特定のプラットフォームは、例えば、(i)(環状ライゲーションおよび切断を含む)色素修飾したプローブのライゲーションによる配列決定、(ii)ピロシーケンス、および(iii)単一分子の配列決定を含む。
ピロシーケンスは、ヌクレオチド取り込みで放出されたピロリン酸塩の検出に依存する、合成による配列決定に基づいた核酸配列決定の方法である。一般に、合成による配列決定は、一度に1つのヌクレオチドで、その配列が求められている鎖に相補的なDNA鎖を合成する工程を含む。研究用の核酸は、固体担体に固定され、配列決定プライマーでハイブリダイズされ、DNAポリメラーゼ、ATPスルフリラーゼ、ルシフェラーゼ、アピラーゼ、アデノシン5’ホスホ硫酸およびルシフェリンでインキュベートされ得る。ヌクレオチド溶液は、連続して加えられ、除去される。ヌクレオチドの正しい取り込みによってピロリン酸塩が放出され、これは、ATPスルフリラーゼと相互作用し、アデノシン5’ホスホ硫酸の存在下でATPを生成しルシフェリン反応を刺激し、これによって、配列決定を可能にする化学発光シグナルが生成させる。ピロシーケンス用のマシンおよびメチル化特異試薬は、Qiagen, Inc. (Valencia, CA)から入手可能である。また、Tost and Gut, 2007, Nat. Prot. 2 2265−2275を参照。ピロシーケンスに基づいて当業者によって使用され得るシステムの一例は、一般に以下の工程を含む:研究用の核酸にアダプター核酸をライゲートし、研究用の核酸をビーズにハイブリダイズする工程;エマルジョン中の研究用の核酸においてヌクレオチド配列を増幅させる工程;ピコリットルの多重ウェルの固体担体を使用して、ビーズを選別する工程;およびピロシーケンスの方法論によって、増幅されたヌクレオチド配列を配列決定する工程(例えば、Nakano et al, 2003, J. Biotech. 102, 117−124)。そのようなシステムは、本明細書に記載されるプロセスによって、例えば、本明細書に記載されるプロセスによって生成された最初の増幅産物への異種核酸のライゲーションによって生成された増幅産物を指数関数的に増幅させるために使用され得る。
<プローブ>
幾つかの事例では、プローブパネルの1つ以上のプローブが、上に記載された核酸配列決定の方法に使用される。幾つかの事例では、プローブパネルの1つ以上のプローブは式Iのプローブを含み:
式中:
Aは、第1の標的結合領域であり;
Bは、第2の標的結合領域であり;および
Lは、リンカー領域であり;
ここで、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも30の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含み;Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも12の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含み;Lは、Aに結合され;およびBは、AまたはLのいずれかに結合される。
幾つかの事例では、LはAに結合され、BはLに結合される。幾つかの場合では、A、B、およびLは、式Iaで例証されるように結合される:
幾つかの場合では、複数のプローブは、少なくとも10、20、30、50、100、200、500、1000、1500、1775、1800、2000、またはそれ以上のプローブを含む。幾つかの場合では、複数のプローバ(probers)は、10、20、30、50、100、またはそれ以上のプローブを含む。
幾つかの実施形態では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも35の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも40の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも45の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも50の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも55の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも60の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも65の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも70の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも80の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも90の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。
幾つかの実施形態では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも14の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも15の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも18の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも20の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも22の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも25の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも28の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも30の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも35の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも40の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも45の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも50の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも55の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも60の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも65の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも70の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも80の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。幾つかの場合では、Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも90の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含む。
幾つかの事例では、複数のプローブは、CpGメチル化のデータを生成するために次世代の配列決定反応に使用される。幾つかの事例では、複数のプローブは、CpGメチル化のデータを生成するために溶液ベースの次世代の配列決定反応に使用される。幾つかの事例では、次世代の配列決定反応は、以下を含む;454 Life Sciencesのプラットフォーム (Roche, Branford, CT); lllumina's Genome Analyzer, GoldenGate Methylation Assay、またはInfinium Methylation Assays、即ちInfinium HumanMethylation 27K BeadArrayまたはVeraCode GoldenGateのメチル化アレイ(Illumina, San Diego, CA; Bio−RadからのQX200(商標) Droplet Digital(商標) PCR System;DNA Sequencing by Ligation, SOLiD System (Applied Biosystems/Life Technologies);the Helicos True Single Molecule DNAの配列決定技術;半導体配列決定(Ion Torrent; Personal Genome Machine);DNAナノボール配列決定;Dover Systems (Polonator)からの技術、およびナノポアベースの戦略(例えば、Oxford Nanopore, Genia Technologies, and Nabsys)などの、増幅を必要としない、またはそうでなければ配列決定前に天然DNAを変換する(例えば、Pacific Biosciences and Helicos)技術を使用する配列決定。幾つかの事例では、溶液ベースの次世代の配列決定反応は、ドロップレットデジタルPCR配列決定の方法である。
幾つかの事例では、各プローブは、CpG部位に相関する。幾つかの事例では、各プローブは、表15−18、及び/又は20から選択されるバイオマーカー(例えばCpG部位)に相関する。幾つかの事例では、各プローブは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択されるバイオマーカーに相関する。幾つかの事例では、各プローブは、cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)から選択されるバイオマーカーに相関する。幾つかの事例では、各プローブは、cg25574765、cg25490145、cg18384097、cg25922751およびcg17126555から選択されるバイオマーカーに相関する。
幾つかの事例では、Lは、長さが10と60、15と55、20と50、25と45、および30と40の間のヌクレオチドである。幾つかの事例では、Lは、長さが約15、20、25、30、35、40、45、50、55またはで60のヌクレオチドである。
幾つかの事例では、Lはさらにアダプター領域を含む。幾つかの事例では、アダプター領域は、各プローブを同定するために使用される配列を含む。
幾つかの実施形態では、プローブパネルの1つ以上のプローブは、SEQ ID NO:1−2333から選択される配列に対して少なくとも50%、60%、70%、80%、90%、95%、98%、または99%配列同一性である配列を含む。幾つかの実施形態では、プローブパネルの1つ以上のプローブは、SEQ ID NO:1830−2321から選択される配列に対して少なくとも50%、60%、70%、80%、90%、95%、98%、または99%配列同一性である配列を含む。幾つかの事例では、プローブパネルの1つ以上のプローブは、SEQ ID NO:1830−2321から選択される配列に対して約100%配列同一性である配列を含む。幾つかの事例では、プローブパネルの1つ以上のプローブは、SEQ ID NO:1830−2321から選択される配列から成る。幾つかの場合では、プローブパネルの1つ以上のプローブは、デジタルPCR配列決定の方法で利用される。幾つかの場合では、プローブパネルの1つ以上のプローブは、ドロップレットデジタルPCR(ddPCR)配列決定の方法で利用される。
<CpGメチル化のデータ解析方法>
特定の実施形態では、バイオマーカーパネルのマーカーのために測定されたメチル化値は、数学的に組み合わされ、組み合わされた値は、基礎的な問診に関連づけられる。幾つかの事例では、メチル化されたバイオマーカー値は、任意の適切な技術水準の数学的方法によって組み合わせられる。マーカーの組み合わせを疾患状態に関連づけるための周知の数学的方法は、判別分析(DA)(例えば、線形、二次、正規化のDA)、判別関数分析(DFA)、カーネル法(例えばSVM)、多次元尺度構成法(MDS)、ノンパラメトリック法(例えばk最近傍分類器)、PLS(部分最小二乗)、ツリーベースの方法(Tree−Based Methods)(例えば、Logic Regression、CART、ランダムフォレスト法、ブースティング/バギング法(Boosting/Bagging Methods))、一般化線形モデル(例えばロジスティック回帰分析)、主成分ベースの方法(例えばSIMCA)、一般化加法モデル、ファジイ論理ベースの方法、ニューラルネットワークおよび遺伝的アルゴリズムベースの方法のような方法を利用する。当業者は、本発明のバイオマーカーの組み合わせを評価するために適切な方法を選択する際に問題はない。一実施形態では、例えば、CRCを診断するために、本発明のバイオマーカーの組み合わせの相関するメチル化状態において使用される方法は、DA(例えば、線形、二次、正規化の判別分析)、DFA、カーネル法(例えばSVM)、MDS、ノンパラメトリック法(例えばk最近傍分類器)、PLS(部分最小二乗)、ツリーベースの方法(例えばLogic Regression、CART、ランダムフォレスト法、ブースティング法)、または一般化線形モデル(例えばロジスティク回帰分析)、および主成分分析から選択される。これらの統計方法に関連する詳細は、以下の参考文献で見られる:Ruczinski et al., 12 J. OF COMPUTATIONAL AND GRAPHICAL STATISTICS 475−511 (2003); Friedman, J. H., 84 J. OF THE AMERICAN STATISTICAL ASSOCIATION 165−75 (1989); Hastie, Trevor, Tibshirani, Robert, Friedman, Jerome, The Elements of Statistical Learning, Springer Series in Statistics (2001); Breiman, L., Friedman, J. H., Olshen, R. A., Stone, C. J. Classification and regression trees, California: Wadsworth (1984); Breiman, L., 45 MACHINE LEARNING 5−32 (2001); Pepe, M. S., The Statistical Evaluation of Medical Tests for Classification and Prediction, Oxford Statistical Science Series, 28 (2003);およびDuda, R. O., Hart, P. E., Stork, D. O., Pattern Classification, Wiley Interscience, 2nd Edition (2001)。
一実施形態では、各メチル化パネルに対して関連付けられた結果は、疾患または腫瘍型の正状態に対するそれらの相関性、例えば、p値検定またはt値検定あるいはF検定によって格付けされる。その後、格付けされた(第一合致、つまり低いp値またはt値)マーカーが、続いて選択され、特定の診断値に達するまでメチル化パネルを加えられる。そのような方法は、例えば、確率差異t検定を使用する、メチル化パネル、またはより広範囲には、幾つかのクラスの中で差次的にメチル化された遺伝子の同定を含む(Wright G. W. and Simon R, Bioinformatics 19:2448−2455,2003)。他の方法は、バイオマーカーパネルに含まれるバイオマーカーを判定するために使用される有意水準を指定する工程を含む。指定された閾値未満の単変量のパラメトリックな有意水準でクラス間で差次的にメチル化されるバイオマーカーは、パネルに含まれている。指定された有意水準が、十分な偽発見率を除外することができるほど十分に小さいかどうかは重要ではない。幾つかの問題では、特徴として使用されるバイオマーカーパネルに関してより寛容である(liberal)ことによって、より良い予測が達成される。幾つかの場合では、パネルは、生物学的に解釈可能であり、臨床的に適用可能であるが、これらは、含まれるバイオマーカーがより少ない場合に限られる。交差検証に類似して、バイオマーカー選択は、交差検証プロセスで作成された各トレ−ニングセットのために繰り返される。予測誤差の不偏推定値を提供することが、その目的である。新しい患者のサンプルデータとともに使用するためのメチル化パネルは、メチル化選択の適用に起因するパネルおよび「既知の」メチル化情報の分類器、または対照メチル化パネルである。
将来のサンプルのクラスを予測するためにメチル化プロファイルを利用するモデルも使用することができる。これらのモデルは、Compound Covariate Predictor(Radmacher et al. Journal of Computational Biology 9:505−511, 2002)、Diagonal Linear Discriminant Analysis (Dudoit et al. Journal of the American Statistical Association 97:77−87, 2002)、Nearest Neighbor Classification (also Dudoit et al.)、およびSupport Vector Machines with linear kernel (Ramaswamy et al. PNAS USA 98:15149−54, 2001)に基づき得る。モデルは、確率差異t検定によって評価されるように与えられた有意水準(例えば0.01、0.05または0.1)で差次的にメチル化されたバイオマーカーを組み込んだ(Wright G. W. and Simon R. Bioinformatics 19:2448−2455, 2003)。交差検証、好ましくは一個抜きの交差検証を使用する、各モデルの予測誤差が推測され得る(Simon et al. Journal of the National Cancer Institute 95:14−18, 2003)。各々の一個抜きの交差検証のトレ−ニングセットに対して、バイオマーカー選択プロセスを含む、モデル構築プロセス全体が繰り返される。モデルに対する交差検証されたエラー率の推定値が、ランダム予測から予想される値より著しく低いかどうかも評価されてもよい。クラスラベルはランダムに並べ替えられ得、その後、一個抜きの交差検証プロセス全体が繰り返される。有意水準は、真のメチル化データとともに得られた交差検証されたエラー率を上回らないエラー率を与えるランダム置換の割合である。
別の分類法は、Bo and Jonassen (Genome Biology 3(4):research0017.1−0017.11, 2002)によって記載された貪欲な対の方法(greedy−pairs method)である。貪欲な対のアプローチは、トレ−ニングセット上のそれらの個々のtスコアに基づいてすべてのバイオマーカーを格付けすることから開始する。この方法は、クラスを識別するために一緒にうまく作用する対のバイオマーカーを選択することを試みる。
さらに、メチル化プロファイルを利用するためのバイナリツリー分類器(binary tree classifier)が、将来のサンプルのクラスを予測するために使用され得る。ツリーの最初のノードは、クラスの合計セットの2つのサブセットを区別したバイナリ分類器を組み込んだ。個々のバイナリ分類器は、確率差異t検定によって評価されるように有意水準(例えば0.01、0.05または0.1)でバイオマーカーの中で差次的に発現されたバイオマーカーを組み込む「サポートベクターマシン」に基づく(Wright G. W. and Simon R. Bioinformatics 19:2448−2455, 2003)。すべての考えられ得るバイナリ分割のための分類機が評価され、選択される分割は、交差検証された予測誤差が最小であるためのものである。その後、そのプロセスは、前のバイナリ分割によって判定されたクラスの2つのサブセットのために続いて繰り返される。バイナリツリー分類器の予測誤差は、ツリー構築プロセス全体を交差検証することによって推測され得る。この全体的な交差検証は、Simon et al. (Simon et al. Journal of the National Cancer Institute 95:14−18, 2003)によって記載されるような、各ノードでの最適な分割の再選択および各々の交差検証されたトレ−ニングセットに使用されるバイオマーカーの再選択を含む。サンプルの小片が保留され(withheld)、残りのサンプル上でバイナリツリーが発展され、およびその後にクラスのメンバーシップが保留されたサンプルに対して予測される、数倍の交差検証が行われる。これを数回繰り返し、その度に異なるパーセンテージのサンプルを保留する。サンプルは、断片的な試験セットへとランダムに分割される(Simon R and Lam A. BRB−ArrayTools User Guide, version 3.2. Biometric Research Branch, National Cancer Institute)。
したがって、一実施形態では、各バイオマーカーに対して関連付けられた結果は、b)疾患または腫瘍型の正状態に対するそれらの正しい相関性、好ましくはp値検定によって格付けされるバイオマーカーが、d)それらの格付けの順に選択される工程を含むことも可能である。
追加の実施形態では、転写速度、mRNAレベル、翻訳速度、タンパク質レベル、生物活性、細胞の特性または性質、遺伝子型、表現型などの、値、レベル、特徴、特性、性質などの、因子は、患者の癌状態の詳しい分析を可能にするために、患者に療法を施すことに加えて、その前に、間に、またはその後に利用され得る。
<特異性および感受性>
状態を正確に予測する診断テストの力は、アッセイの感受性、アッセイの特異性、または受信者動作特性(「ROC」)曲線下面積として一般に測定される。感受性は、試験によって陽性と予測される真陽性のパーセンテージであり、特異性は、試験によって陰性と予測される真陰性のパーセンテージである。ROC曲線は、1−特異性に応じた試験の感受性を提供する。ROC曲線下面積が大きければ大きいほど、試験の予測値は強力である。試験の有用性の他の有用な尺度は、陽性適中率および陰性的中率である。陽性適中率は、実際に陽性であるという試験結果が出る人の割合である。陰性的中率は、実際に陰性であるという試験結果が出る人の割合である。
特定の実施形態では、本発明のバイオマーカーパネルは、少なくともp<0.05、p<10−2、p<10−3、p<10−4またはp<10−5の異なる癌状態の統計的有意差を示し得る。これらのバイオマーカーを使用する診断テストは、少なくとも0.6、少なくとも約0.7、少なくとも約0.8、または少なくとも約0.9のROCを示し得る。バイオマーカーは、影響されない個体(または正常な対照個体)および癌において差次的にメチル化され、各癌種に対するバイオマーカーは、差次的にメチル化され、それ故、癌状態の判定を助けるのに有用である。特定の実施形態では、バイオマーカーは、本明細書に記載される方法を使用して患者サンプル中で測定され、例えば、予め定義されたバイオマーカーレベルと比較され、癌状態に関連づけられる。他の実施形態では、患者サンプル中のバイオマーカーの組み合わせの相関性は、例えば、予め定義されたバイオマーカーパネルと比較される。また別の実施形態では、患者サンプル中の1つ以上の遺伝子のメチル化プロファイルは、腫瘍の型または状態または癌状態に関連づけられた、差別的にメチル化されたと特定された遺伝子のメチル化プロファイルと比較される。特定の実施形態では、測定値は、その後、陽性の癌状態と陰性の癌状態を区別する、関連する診断量、カットオフ値、または多変量モデルスコアと比較され得る。診断量は、患者が特定の癌状態を有しているとして分類される値を超える又はそれ未満のエピジェネティックなバイオマーカーの測定された量を表わす。当該技術分野で十分に理解されるように、アッセイで使用される特定の診断上のカットオフ値を調節することによって、診断医の優先度に依存して診断アッセイの感受性または特異性を増加させることができる。特定の実施形態では、特定の診断上のカットオフ値は、例えば、異なる癌状態にある患者からの統計学的に有意な数のサンプル中のバイオマーカーの高メチル化または低メチル化の量を測定し、カットオフ値を望ましいレベルの特異性および感受性に合わせることによって判定され得る。
<癌>
幾つかの実施形態では、本明細書には、癌を検出する、特徴づける、及び/又は予測するための、上に記載される1つ以上のバイオマーカーの使用が開示される。幾つかの事例では、バイオマーカーは、癌を判定する、特徴づける、認定する、及び/又は評価するために、診断テストにおいて使用される。幾つかの場合では、バイオマーカーは、表15、16、17、18及び/又は20に示されるものを含む。
幾つかの事例では、癌は固形腫瘍または血液系悪性腫瘍である。幾つかの事例では、癌は、癌腫、肉腫、リンパ腫、または白血病である。幾つかの事例では、癌は、未処置の癌、または特定の治療薬によって処置されていない癌である。幾つかの事例では、癌は、存在する位置または臓器を起源とし、別の位置からその位置に転移しなかった腫瘍である、一次腫瘍または原発性癌である。幾つかの事例では、癌は転移性癌である。幾つかの場合では、癌は、再発性または難治性の癌である。
幾つかの事例では、腫瘍または癌は、胃で、血液、リンパ節、肝臓、脳/神経芽細胞腫、食道、気管、胃、腸、結腸、直腸、肛門、膵臓、咽喉、舌、骨、卵巣、子宮、子宮頸部、腹膜、前立腺、精巣、乳房、腎臓、肺、または皮膚、結腸直腸、膀胱、頭頚部、鼻咽頭、子宮内膜、胆管、経口、多発性骨髄腫、白血病、軟部組織肉腫、胆嚢、内分泌、中皮腫、ウィルムス腫瘍、十二指腸、神経内分泌、唾液腺、喉頭、絨毛癌、心臓、小腸、眼、胚細胞癌などから生じる。
幾つかの事例では、腫瘍または癌は、限定されないが、以下を含む:急性リンパ芽球性白血病(ALL);急性骨髄白血病(LAMLまたはAML);副腎皮質癌(ACC);AIDS関連の癌;AIDS関連のリンパ腫;肛門癌;虫垂癌;星状細胞腫;非定型奇形腫/ラブドイド腫瘍;基底細胞癌;膀胱または膀胱尿路上皮の癌(BLCA);脳幹神経膠腫;脳の軽度神経膠腫(LGG);脳癌(脳幹神経膠腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、星状細胞腫、頭蓋咽頭腫、上衣芽細胞腫、上衣腫、 髄芽腫(meduUoblastoma)、髄様上皮腫、中間分化型松果体実質腫瘍、テント上原始神経外胚葉性腫瘍および松果体芽腫を含む);乳房または脳の浸潤癌(BRCA);気管支腫瘍;バーキットリンパ腫;未知の原発部位の癌;カルチノイド腫瘍;未知の原発部位の癌腫;中枢神経系の非定型奇形腫/ラブドイド腫瘍;中枢神経系胚芽腫;子宮頸部扁平上皮癌および子宮頸部腺癌(CESC)癌;小児癌;肝内胆管癌(CHOL);脊索腫;慢性リンパ球性白血病;慢性骨髄性白血病;慢性骨髄増殖性疾患;結腸(腺癌)癌(COAD);結腸直腸癌;頭蓋咽頭腫;皮膚T細胞リンパ腫;内分泌膵島細胞腫;子宮内膜癌;上衣芽細胞腫;上衣腫;食道癌(ESCA);感覚神経芽腫;ユーイング肉腫;頭蓋外胚細胞腫瘍;性腺外胚細胞腫瘍;肝臓外胆管癌;胆嚢癌;胃癌;消化管カルチノイド腫瘍;消化管間質細胞腫瘍;消化管間質腫瘍(GIST);妊娠性絨毛腫瘍;多形神経膠芽腫、神経膠腫(GBM);ヘアリーセル白血病;頭頸部癌(HNSD);心臓癌;ホジキンリンパ腫;下咽頭癌;眼内黒色腫;島細胞腫;カポジ肉腫;腎臓嫌色素性(KIHC)の腎臓明細胞癌(KIRCおよび腎臓乳頭細胞癌(KIRP))を含む、腎臓癌;ランゲルハンス細胞組織球症;喉頭癌;口唇癌;肝細胞癌(LIHC)、肺腺癌(LUAD)および肺扁平上皮癌(LUSC)を含む、肝臓癌;リンパ性腫瘍 びまん性大細胞型B細胞リンパ腫(DLBC);悪性線維性組織球腫の骨癌;髄芽腫;髄上皮腫;黒色腫;メルケル細胞癌;メルケル細胞皮膚癌;中皮腫(MESO);原発不明の転移性頸部扁平上皮癌;口腔癌;多発性内分泌腺腫症;多発性骨髄腫;多発性骨髄腫/形質細胞腫瘍;菌状息肉腫;骨髄異形成症候群;骨髄増殖性腫瘍;鼻腔癌;鼻咽腔癌;神経芽細胞腫;非ホジキンリンパ腫;非黒色腫皮膚癌;非小細胞肺癌;口腔癌;口腔癌;口腔咽頭癌;骨肉腫;他の脳および脊髄の腫瘍;卵巣漿液性嚢胞腺癌(OV)などの卵巣癌;卵巣上皮癌;卵巣胚細胞腫瘍;卵巣低悪性度腫瘍;膵臓腺癌(PAAD)などの膵臓癌;乳頭腫症;副鼻腔癌;副甲状腺癌;骨盤癌;陰茎癌;咽頭癌;褐色細胞腫と傍神経節腫(PCPG);中間分化型松果体実質腫瘍;松果体芽腫;下垂体腫瘍;形質細胞腫瘍/多発性骨髄腫;胸膜肺芽腫;原発性中枢神経系(CNS)リンパ腫;原発性肝細胞癌;前立腺腺癌(PRAD)などの前立腺癌;直腸腺癌(READ)などの直腸癌;腎癌;腎細胞(腎臓)癌;腎細胞癌;呼吸器癌;網膜芽細胞腫;横紋筋肉腫;唾液腺癌;肉腫(SARC);セザリー症候群;皮膚黒色腫(SKCM);小細胞肺癌;小腸癌;軟部組織肉腫;扁平上皮癌;頸部扁平上皮癌;胃腺癌(STAD)などの胃癌;テント上原始神経外胚葉腫瘍;T細胞リンパ腫;精巣癌の精巣胚細胞腫瘍(TGCT);咽喉癌;胸腺癌;胸腺腫(THYM);甲状腺癌(THCA);移行上皮癌;腎盂および尿管の移行上皮癌;栄養膜腫瘍;尿管癌;尿道癌;子宮癌;子宮癌肉腫(UCS)および子宮体癌(UCEC)などの子宮癌;ブドウ膜黒色腫(UVM);膣癌;外陰癌;ワルデンストレーム高ガンマグロブリン血症;またはウィルムス腫瘍。
幾つかの実施形態では、癌は、胃腸癌、癌、肝細胞癌、肝臓癌、消化管間質腫瘍(GIST)、食道癌、膵臓癌または結腸直腸癌を含む。幾つかの事例では、癌(例えば一次腫瘍)は、急性リンパ芽球性白血病(ALL)、急性骨髄白血病(AML)、膀胱癌、乳癌、脳癌、子宮頸癌、結腸癌、結腸直腸癌、子宮内膜癌、胃腸癌、神経膠腫、膠芽腫、頭頸部癌、腎臓癌、肝臓癌、肺癌、リンパ性腫瘍、黒色腫、骨髄性腫瘍、卵巣癌、膵臓癌、前立腺癌、扁平上皮癌、卵巣癌、胃癌、または甲状腺癌を含む。幾つかの事例では、癌は、リンパ性腫瘍、頭頸部癌、膵臓癌、子宮内膜癌、結腸または結腸直腸の癌、前立腺癌、神経膠腫または他の脳/脊髄の癌、卵巣癌、肺癌、膀胱癌、黒色腫、乳癌、骨髄性腫瘍、精巣癌、胃癌、子宮頸癌、腎臓、肝臓癌、または甲状腺癌を含む。幾つかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄白血病、膀胱癌、乳癌、脳癌、子宮頸癌、肝内胆管癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、胃腸癌、神経膠腫、膠芽腫、頭頸部癌、腎臓癌、肝臓癌、肺癌、リンパ性腫瘍、黒色腫、骨髄性腫瘍、卵巣癌、膵臓癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。幾つかの実施形態では、癌種は、膀胱癌、乳癌、子宮頸癌、肝内胆管癌(CHOL)、結腸癌、食道癌、頭頸部癌、腎臓癌、肝臓癌、肺癌、膵臓癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。幾つかの事例では、癌はALLである。幾つかの事例では、癌はAMLである。幾つかの事例では、癌は脳癌である。幾つかの事例では、癌は結腸癌である。幾つかの事例では、癌は肺癌である。幾つかの事例では、癌は乳癌である。幾つかの事例では、癌は前立腺癌である。幾つかの事例では、癌は膀胱癌である。幾つかの事例では、癌は子宮頸癌である。幾つかの事例では、癌は肝内胆管癌(CHOL)である。幾つかの事例では、癌は食道癌である。幾つかの事例では、癌は頭頸部癌である。幾つかの事例では、癌は腎臓癌である。幾つかの事例では、癌は肝臓癌である。幾つかの事例では、癌は膵臓癌である。幾つかの事例では、癌は褐色細胞腫と傍神経節腫(PCPG)である。幾つかの事例では、癌は直腸癌である。幾つかの事例では、癌は肉腫である。幾つかの事例では、癌は皮膚癌である。幾つかの事例では、癌は胃癌である。幾つかの事例では、癌は甲状腺癌である。
幾つかの事例では、癌はリンパ腫である。リンパ腫は、リンパ系と呼ばれる免疫系の一部の癌を指す。これは、一般に非ホジキンリンパ腫およびホジキンリンパ腫へと分類される。
幾つかの事例では、癌はリンパ性腫瘍である。リンパ性腫瘍は、本明細書で使用されるように、Bリンパ球またはTリンパ球の悪性の変化から生じる腫瘍を指し、限定することなく、あらゆる型のリンパ腫を含む。リンパ腫の2つの主要な型は、ホジキン病および非ホジキンリンパ腫である。ホジキン病は、4つの主要な型のみを含む比較的単純な疾患である。対照的に、非ホジキンリンパ腫(NHL)は、以下のサブタイプを含む、様々な型のリンパ腺癌に適用される用語である;前駆B細胞リンパ腫、小リンパ球性リンパ腫/慢性リンパ球性白血病、辺縁帯リンパ腫(結節性辺縁帯リンパ腫、節外性MALT、脾臓)、ヘアリーセル白血病、濾胞性リンパ腫、マントル細胞リンパ腫、びまん性大細胞型B細胞リンパ腫、バーキットリンパ腫、未分化大細胞リンパ腫、末梢性T細胞リンパ腫、および菌状息肉腫。幾つかの実施形態では、非ホジキンリンパ腫と密に関連していないが本明細書に含まれている他のリンパ系腫瘍は、急性リンパ芽球性白血病、リンパ形質細胞リンパ腫、T細胞慢性リンパ球性白血病/前リンパ球性白血病、および容易に分類されないリンパ起源の他の癌を含む。
幾つかの事例では、癌は頭頸部癌である。頭頸部癌は、唇、口腔(口)、鼻腔(鼻内部)、副鼻腔、咽頭および喉頭を含む、上気道消化管中で開始する生物学的に類似した癌の群である。頭頸部癌の90%は、これらの領域の粘膜内層(上皮)から生じる、扁平上皮細胞癌(SCCHN)である。頭頸部扁平上皮癌(HNSCCの)は、頭頸部癌の大部分を構成し、この解剖領域全体にわたって粘膜表面から生じる。これらは、鼻腔、副鼻腔、口腔、鼻咽腔、口腔咽頭、下咽頭、および喉頭の腫瘍を含む。
幾つかの事例では、癌は、膵臓癌または膵癌である。膵臓癌は、限定されないが、腺癌、腺扁平上皮癌、印環細胞癌、肝様癌、コロイド癌、未分化癌、破骨細胞様巨大細胞を有する未分化癌、および島細胞癌を含む、膵細胞に由来する。
幾つかの事例では、癌は子宮内膜癌である。子宮内膜癌は、子宮(子宮内膜)の内側から生じる悪性腫瘍である。該用語は、限定されないが、子宮体癌および子宮内膜腺癌を指す。本明細書で使用されるような子宮内膜癌はまた、 漿液性乳頭状癌、明細胞癌、乳頭状の類内膜癌、および粘液性癌腫などの、他の周知の細胞型を含む。
幾つかの事例では、癌は、結腸直腸癌または腸癌とも呼ばれる、結腸癌である。結腸癌は、大腸(結腸)または直腸(結腸端)において生じる悪性腫瘍を指し、腺癌を含む、結腸、直腸、および虫垂における癌性増殖を含む。腺組織に由来する又は明確に定義された腺構造を示す上皮由来の腫瘍である腺腫は、結腸直腸癌に先行する。
幾つかの事例では、癌は前立腺癌である。前立腺癌は、前立腺から生じる細胞の抑制されない(悪性腫瘍)増殖を説明する。
幾つかの事例では、癌は、腎癌とも呼ばれる、腎臓癌である。腎臓癌は、腎臓細胞が悪性(癌)になり、制御不能に増殖し、腫瘍を形成する、疾患である。最も一般的な腎臓癌は、腎臓中の小さな管(細管)の内側に最初に現われ、これは腎細胞癌である。
幾つかの事例では、癌は甲状腺癌である。甲状腺癌は、濾胞性または傍濾胞の甲状腺細胞から生じる癌を指す。
幾つかの事例では、癌は神経膠腫である。神経膠腫は、脳または脊椎で開始し、上衣腫(脳室上衣細胞由来の神経膠腫)、星状細胞腫(星状細胞由来の神経膠腫)を含む、膠細胞及び/又はその前駆体から生じ、多形神経膠芽甲状腺腫(glioblathyroida multiforme)、乏突起膠腫(乏突起膠細胞由来の神経膠腫)および(異なるタイプの膠からの細胞に由来する)乏突起星細胞腫などの、混合膠腫を含む、癌の種類を指す。
幾つかの事例では、癌は卵巣癌である。卵巣癌は、卵巣から生じ、限定することなく、漿液性卵巣癌、非侵襲性卵巣癌、混合表現型卵巣癌、粘液性卵巣癌、子宮内膜卵巣癌、明細胞卵巣癌、漿液性乳頭状卵巣癌、Brenner細胞、および低分化腺癌を含む、腫瘍の一群である。
幾つかの事例では、癌は肺癌である。肺癌は、限定されないが、小細胞肺癌、組み合わさった小細胞癌、非小細胞肺癌、肉腫様癌、唾液腺腫瘍、カルチノイド腫瘍、腺扁平上皮癌、胸膜肺芽腫およびカルチノイド腫瘍を含む、肺の組織中の抑制されない細胞増殖を指す。
幾つかの事例では、癌は膀胱癌である。膀胱癌は、膀胱の悪性腫瘍の幾つかの型のいずれかを指し、限定することなく、移行上皮癌、扁平上皮癌、腺癌、肉腫および小細胞癌を含む。
幾つかの事例では、癌は黒色腫である。黒色腫は、メラニン細胞中で開始する癌のあらゆる形態を指す。黒色腫は、限定されないが、以下のサブタイプを含む:悪性黒子、悪性黒子型黒色腫、表在拡大型黒色腫、末端性ほくろ性黒色腫、粘膜の黒色腫、結節型黒色腫、ポリープ状黒色腫、線維形成性黒色腫、無色性黒色腫、軟組織黒色腫、および転移性黒色腫。
幾つかの事例では、癌は乳癌である。乳癌または悪性乳房腫瘍は、一般的に、乳房組織から、最も一般には、乳管または乳管にミルクを供給する小葉の内側から生じる癌に対する一般名として使用される。免疫組織化学的検査によって検出されるそれらの受容体状態、特にエストロゲン受容体(ER)、プロゲステロン受容体(PR)の存在または欠如、およびHER2/neuの発現(正常な発現/低発現対過剰発現)のレベルに依存して、乳癌は、ER陽性(ER+)乳癌、ER陰性(ER−)乳癌、PR陽性(PR+)乳癌、PR陰性(PR−)乳癌、HER2陽性(HER2+)乳癌(HER2を過剰発現する癌)、HER2陰性(HER2−)乳癌(正常レベルのHER2または低発現HER2を発現する、または検出可能なレベルのHER2を発現しない癌)、ホルモン受容体陰性の乳癌、つまり、エストロゲン受容体とプロゲステロン受容体のいずれも有さない乳癌(ER−/PR−乳癌と省略される);および三種陰性乳癌、つまり、エストロゲン受容体とプロゲステロン受容体のいずれも有さず、HER2の正常な発現/低発現を有する(または検出可能なレベルの発現が欠如した)乳癌(ER−/PR−/HER2−乳癌と省略される)に分割され得る。それらの遺伝子発現パターンに依存して、幾つかの事例における乳癌は、ルミナールサブタイプA乳癌、ルミナールサブタイプB乳癌、正常様乳癌、HER2+乳癌および基底細胞様乳癌に分割される(Sorlie et al. (2001) Proc. Nat. Acad. Sci. 98: 10869−10874)。ルミナールAおよびBのサブタイプは、ほとんどが陽性ERである。対照的に、HER2+乳癌は、HER2アンプリコンに関連付けた遺伝子の高発現の増加を示し、正常様乳癌は、正常な乳房組織の分子の特徴を共有する。
幾つかの事例では、癌は骨髄性腫瘍である。骨髄性腫瘍は、骨髄細胞系列、例えば顆粒球(例えば、好中球、好酸球、および好塩基球)または単球に由来する骨髄性(骨髄球性または骨髄性)白血病の細胞の癌を含む。幾つかの実施形態では、骨髄性腫瘍は、慢性骨髄性白血病、急性骨髄性白血病、慢性好中球性白血病、慢性好酸球性白血病、および 骨髄異形成症候群を含む。
幾つかの事例では、癌は精巣癌である。精巣癌は 睾丸の癌である。幾つかの実施形態では、精巣癌は、限定されないが、 セミノーマ、非セミノーマ、絨毛癌、胎児性癌、未熟型奇形腫、卵黄嚢腫瘍、ライディッヒ細胞腫およびセルトリ細胞腫、PNET、平滑筋肉腫、横紋筋肉腫、および中皮腫などの悪性癌を含む。
幾つかの事例では、癌は胃癌である。胃腫瘍または胃癌は、例えば、腺癌(びまん型および腸型など)、およびリンパ腫、平滑筋肉腫、および扁平上皮細胞癌などの、それほど普及していない形態を含む、胃の腫瘍または癌を指す。
<追加方法>
特定の実施形態において、本明細書には、患者において癌を進行させるリスクを判定する方法が提供される。バイオマーカーのメチル化のパーセンテージ、量またはパターンは、様々なリスク状態(例えば高、中、または低)の特徴である。癌を進行させるリスクは、関連するバイオマーカーのメチル化状態を測定し、その後それらを分類アルゴリズムに提示する又はそれらを基準量、つまり、特定のリスクレベルと関連付けられるメチル化された(または非メチル化の)バイオマーカーの予め定義されたレベルまたはパターンと比較することによって、判定される。
<癌重症度の判定>
別の実施形態において、本明細書には、患者における癌の重症度を判定する方法が提供される。癌の特定のステージまたは重症度は、バイオマーカーの高メチル化または低メチル化の特性レベルあるいは1セットのバイオマーカー(パターン)の相対的な高メチル化または低メチル化のレベルを有し得る。幾つかの場合では、癌の重症度は、関連するバイオマーカーのメチル化状態を測定し、その後それらを分類アルゴリズムに提示する又はそれらを基準量、つまり、特定のステージと関連付けられるメチル化されたバイオマーカーの予め定義されたメチル化のレベルまたはパターンと比較することによって、判定される。
幾つかの実施形態では、表15、16、17、18及び/又は20から選択される1つ以上のバイオマーカーが、患者の癌の重症度を判定するために利用される。幾つかの場合では、表15から選択される1つ以上のバイオマーカーが、患者の癌の重症度を判定するために使用される。幾つかの場合では、表16から選択される1つ以上のバイオマーカーが、患者の癌の重症度を判定するために使用される。幾つかの場合では、表17から選択される1つ以上のバイオマーカーが、患者の癌の重症度を判定するために使用される。幾つかの場合では、表18から選択される1つ以上のバイオマーカーが、患者の癌の重症度を判定するために使用される。
幾つかの場合では、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される1つ以上のバイオマーカーが、患者の癌の重症度を判定するために使用される。
幾つかの場合では、cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)から選択される1つ以上のバイオマーカーが、患者の癌の重症度を判定するために使用される。
幾つかの場合では、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から選択される1つ以上のバイオマーカーが、患者の癌の重症度を判定するために使用される。
<癌の予後の判定>
一実施形態において、本明細書には、患者の癌の経過を判定する方法が提供され、癌経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。時間とともに、バイオマーカーのメチル化の量か相対量(例えばパターン)は変わる。例えば、バイオマーカー「X」および「Y」の高メチル化または低メチル化は、癌を有する幾つかの事例において増加される。それ故、癌または非癌への時間にわたるメチル化の増加または減少いずれかの、これらのバイオマーカーの傾向は、疾患の経過を示す。したがって、この方法は、少なくとも2つの異なる時間点(例えば、第1時間および第2時間)で患者における1つ以上のバイオマーカーのメチル化のレベルまたは状態を測定する工程、およびもしある場合に変化を比較する工程を含む。癌の経過は、これらの比較に基づいて判定される。
幾つかの実施形態では、表15、16、17、18及び/又は20から選択される1つ以上のバイオマーカーは、患者の癌の経過を判定するために利用され、癌の経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。幾つかの場合では、表15から選択される1つ以上のバイオマーカーは、患者の癌の経過を判定するために利用され、癌の経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。幾つかの場合では、表16から選択される1つ以上のバイオマーカーは、患者の癌の経過を判定するために利用され、癌の経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。幾つかの場合では、表17から選択される1つ以上のバイオマーカーは、患者の癌の経過を判定するために利用され、癌の経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。幾つかの場合では、表18から選択される1つ以上のバイオマーカーは、患者の癌の経過を判定するために利用され、癌の経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。
幾つかの場合では、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される1つ以上のバイオマーカーは、患者の癌の経過を判定するために使用され、癌の経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。
幾つかの場合では、cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)から選択される1つ以上のバイオマーカーは、患者の癌の経過を判定するために使用され、癌の経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。
幾つかの場合では、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から選択される1つ以上のバイオマーカーは、患者の癌の経過を判定するために使用され、癌の経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。
<患者管理>
癌状態を認定する方法の特定の実施形態では、方法はさらに、状態に基づいて患者の処置を管理する工程を含む。そのような管理は、癌状態の判定後に続く医師または臨床医の行動を含む。例えば、医師が癌の診断または予後を行う場合、モニタリングの特定のレジームが続く。その後、本発明の方法を使用する癌の経過の評価に、特定の癌治療レジメンが必要とされる。代替的に、非癌の診断には、患者が患う具体的な疾患を判定するための更なるテストが続く。随意に、診断テストが癌状態に関する不確定な結果を与える場合、更なるテストが要求される。
幾つかの実施形態では、表15、16、17、18及び/又は20から選択される1つ以上のバイオマーカーは、癌状態を認定するために利用される。幾つかの場合では、表15から選択される1つ以上のバイオマーカーは、癌状態を認定するために使用される。幾つかの場合では、表16から選択される1つ以上のバイオマーカーは、癌状態を認定するために使用される。幾つかの場合では、表17から選択される1つ以上のバイオマーカーは、癌状態を認定するために使用される。幾つかの場合では、表18から選択される1つ以上のバイオマーカーは、癌状態を認定するために使用される。
幾つかの場合では、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される1つ以上のバイオマーカーは、癌状態を認定するために使用される。
幾つかの場合では、cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)から選択される1つ以上のバイオマーカーは、癌状態を認定するために使用される。
幾つかの場合では、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から選択される1つ以上のバイオマーカーは、癌状態を認定するために使用される。
<医薬品の治療上の有効性の判定>
別の実施形態において、本明細書には、医薬品の治療上の有効性を判定する方法が提供される。これらの方法は、薬物の臨床試験を実行することの他に、薬物に関する患者の進行をモニタリングすることにも有用である。
治療または臨床試験は、特定のレジメンにおいて薬物を投与する工程を含む。幾つかの事例では、レジメンは、時間にわたる薬物の単回投与または薬物の複数回投与を含む。医師または臨床研究者は、投与の経過にわたる患者または被験体に対する薬物の効果をモニタリングする。薬物が疾病に対する薬理学的影響を有する場合、本発明のバイオマーカーの1つ以上の高メチル化または低メチル化の量または相対量(例えば、パターンまたはプロファイル)は、非癌のプロファイルへと変更される。
幾つかの事例では、処置の経過の間に、患者における1つ以上のバイオマーカーのメチル化状態の経過が続く。したがって、この方法は、薬物治療を受ける患者における1つ以上のバイオマーカーのメチル化レベルを測定する工程、および(例えば、異なる癌状態に対応するバイオマーカーの予め定義されたメチル化レベルとの比較によって)そのレベルを患者の癌状態と関連付ける工程を含む。この方法の一実施形態は、薬物治療の経過の間の少なくとも2つの異なる時間点(例えば、第1時間および第2時間)で1つ以上のバイオマーカーのメチル化レベルを判定する工程、およびもしある場合にバイオマーカーのメチル化レベルの変化を比較する工程を含む。例えば、1つ以上のバイオマーカーのメチル化レベルは、薬物投与の前後に又は薬物投与の間の2つの異なる時間点で測定される。治療の効果は、これらの比較に基づいて判定される。処置が有効である場合、1つ以上のバイオマーカーのメチル化状態は正常に向かう傾向があり、処置が有効でない場合、1つ以上のバイオマーカーのメチル化状態は、癌の徴候に向かう傾向がある。
幾つかの実施形態では、表15、16、17、18及び/又は20から選択される1つ以上のバイオマーカーは、医薬品の治療上の有効性を判定するために利用される。幾つかの場合では、表15から選択される1つ以上のバイオマーカーは、医薬品の治療上の有効性を判定するために使用される。幾つかの場合では、表16から選択される1つ以上のバイオマーカーは、医薬品の治療上の有効性を判定するために使用される。幾つかの場合では、表17から選択される1つ以上のバイオマーカーは、医薬品の治療上の有効性を判定するために使用される。幾つかの場合では、表18から選択される1つ以上のバイオマーカーは、医薬品の治療上の有効性を判定するために使用される。
場合によっては、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、及びcg26017930から選択される1以上のバイオマーカーは、医薬品の治療効力の判定のために使用される。
場合によっては、cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、及びcg00025044から選択される1以上のバイオマーカー(表20)は、医薬品の治療効力の判定のために使用される。
場合によっては、cg25574765、cg25490145、cg18384097、cg25922751、及びcg17126555から選択される1以上のバイオマーカーは、医薬品の治療効力の判定のために使用される。
<癌の状況を確認する(Qualifying)ための分類アルゴリズムの生成>
幾つかの実施形態において、根本的な問診に関連付けられるバイオマーカーパネルのマーカーについて測定されたメチル化値を分析するのに、1以上のパターン認識方法が使用される。場合によっては、生体サンプルが、疾患の証拠が無い患者、全身性の癌を示す患者、又は生化学的な再発を示す患者に由来するものであるという可能性を絞り出すために、同様に、これら疾患の状況及びタイプ、特に原発腫瘍のタイプを区別するために、パターン認識方法は、メチル化レベルの線形結合、又はメチル化レベルの非線形結合を含む。場合によっては、モデル及び/又はアルゴリズムは、機械可読フォーマットで提供され、且つ、メチル化レベル又はメチル化プロファイルを疾患の状況と関連付けるために、及び/又は患者或いは患者の分類について治療法(treatment modality)を指定するために使用される。
幾つかの実施形態において、複数の標的についてのメチル化レベルの分析は、アルゴリズム又は分類子の使用を含む。アレイデータは、当該技術分野で既知の及び本明細書に記載される技術を使用して、管理され、分類され、且つ分析される。場合によっては、複数の標的についてのメチル化レベルの分析は、プローブセットのモデリングとデータの前処理を含む。幾つかの例において、プローブセットのモデリング及びデータの前処理は、Robust Multi−Array(RMA)アルゴリズム又は変異体GC−RMA、RMA、Probe Logarithmic Intensity Error(PLIER)アルゴリズム、又は変異体iterPLIERを使用して導き出した。相違又は強度のフィルタは、例えば、<10の標準偏差、又は標準化されたデータ範囲の<100の強度単位の平均強度それぞれを備えた標的配列の除去により、RMAアルゴリズムを使用して前処理データに適用される。
幾つかの実施形態において、次に、「既知のサンプル」又は「対照」などのサンプルを使用して生成されるデータが、分類モデルを「トレーニングする」ために使用される。「既知のサンプル」は、例えば、罹患していない又は癌を患っていない「正常な」サンプルからの適切な対照(例えばバイオマーカー)、及び/又は既知の腫瘍組織のタイプ又は段階、或いは癌の状況からの適切な対照(例えばバイオマーカー)などの、予め分類されたサンプルである。分類モデルを形成するために使用されるデータは「トレーニングデータセット」と呼ばれる。場合によっては、分類モデルを形成するために使用されるトレーニングデータセットは、生データ又は前処理データを含む。一旦トレーニングされると、分類モデルは、未知のサンプルを使用して生成されたデータにおけるパターンを認識する。幾つかの例において、次に分類モデルは、未知のサンプルをクラスに分類するために使用される。これは、例えば、特定の生体サンプルが、特定の生物学的条件(例えば、罹患した対罹患していない)に関連しているかどうかを予測するのに有用である。
モデルは、一旦構築され且つ検証されると、エンドユーザーにアクセス可能となるようにパッケージ化される。例えば、このことは、モデルが中に埋め込まれる、表計算アプリケーション又は視覚表示の代替形態の実装、統計ソフトウェアパッケージのスクリプト記述、又は情報技術スタッフによるハードコードされたアプリケーションへのモデルのリファクターリングに関与する。
幾つかの実施形態において、分類モデルは、任意の適切なデジタルコンピュータ上で形成され、且つ使用される。適切なデジタルコンピュータは、Unix(登録商標)、Windows(登録商標)、又はLinux(登録商標)をベースとするオペレーティングシステムなどの、任意の標準又は専用オペレーティングシステムを使用する、超小型、小型、又は大型コンピュータを含む。質量分析計を利用する実施形態において、使用されるデジタルコンピュータは、対象のスペクトルを作成するために使用される質量分析計とは物理的に分離され、或いは、質量分析計に繋がれている。
本発明の実施形態に従う、トレーニングデータセット及び分類モデルは、デジタルコンピュータにより実行又は使用されるコンピュータコードにより具体化される。コンピュータコードは、光学又は磁気のディスク、スティック、テープなどを含む任意の適切なコンピュータ可読媒体に保存され、且つ、R,C、C++、ビジュアルベーシックなどを含む任意の適切なコンピュータプログラミング言語で書くことができる。
上述の学習アルゴリズムは、既に発見されていたバイオマーカーのための分類アルゴリズムを発達させるのに、且つ、新たなバイオマーカーを見つけるのに有用である。次に分類アルゴリズムは、単独又は組み合わせて使用されるバイオマーカーのために診断価値(例えばカットオフポイント)を提供することにより、診断テストのための基礎を形成する。
<コンピュータシステム、プラットフォーム、及びプログラム>
幾つかの態様において、本明細書に記載されるものは、本明細書に記載される1以上の方法を実施するための手段が提供されるコンピュータシステム又はプラットフォームに関係する。幾つかの実施形態において、コンピュータシステムは、(a)方法を実施するためにコンピュータシステムの動作を制御するのに適用される少なくとも1つのコンピュータプログラムを含む少なくとも1つのメモリを含み、前記方法は、(i)DNAメチル化データ、例えば、CUPのメチル化プロファイル及び1以上の原発腫瘍のメチル化プロファイルを受け取る工程、(ii)CPUのメチル化プロファイルと原発腫瘍のメチル化プロファイルとの同一性の程度を判定する工程を含み、前記コンピュータシステムは更に、(b)コンピュータプログラムを実行するための少なくとも1つのプロセッサを含む。幾つかの実施形態において、プラットフォームは1以上のコンピュータシステムを含む。
本明細書に記載される別の態様は、本明細書に記載される1以上の方法に従い工程を実行するためにコンピュータシステムを制御するためのコンピュータプログラムに関係する。
幾つかの実施形態において、コンピュータシステムはコンピュータを持つシステムを指し、そこではコンピュータが、コンピュータを動作するためにソフトウェアを具体化するコンピュータ可読媒体を含んでいる。場合によっては、コンピュータシステムは、1以上の汎用又は専用プロセッサ、揮発性及び不揮発性メモリ装置を含む関連するメモリを含んでいる。場合によって、コンピュータシステムのメモリは、本発明に従い専用システムを作るために、又は本発明に従い方法を実行するためのシステムを実装するために、コンピュータシステムの動作を制御するためのソフトウェア又はコンピュータプログラムを保存する。場合によっては、コンピュータシステムは、Intel又はAMD x86をベースとするシングルコア又はマルチコア中央処理装置(CPU)、ARMプロセッサ、又はデータを処理するための同様のコンピュータプロセッサを含む。場合によっては、CPU又はマイクロプロセッサは、Intel Pentiumプロセッサ、Intel 8051プロセッサ、RISC又はMISSプロセッサ、Power PCプロセッサ、又はALPHAプロセッサなどの、任意の従来の汎用シングルチップ又はマルチチップのマイクロプロセッサである。場合によっては、マイクロプロセッサは、デジタル信号プロセッサ又はグラフィックスプロセッサなどの任意の従来の又は専用プロセッサである。マイクロプロセッサは典型的に、従来のアドレス線、従来のデータ線、及び1以上の従来の制御線を有している。以下に記載するように、本発明に従うソフトウェアは、専用システム上で、又は、DOS、CPM、Windows、Unix(登録商標)、Linix、又は他のオペレーティングシステムを持つ汎用コンピュータ上で実行される。幾つかの例において、システムは、コンピュータプログラム、ソフトウェア、及びデータを保存するためのディスクメモリ及びソリッドステートメモリなどの不揮発性メモリ、及び、プログラム及びソフトウェアを実行するための高速ラム(ram)などの揮発性メモリを含む。
幾つかの実施形態において、コンピュータ可読媒体は、コンピュータによりアクセス可能なデータを保存するために使用される任意の記憶装置、同様に、コンピュータによりデータへのアクセスを提供するための他の手段を指す。記憶装置タイプのコンピュータ可読媒体の例は、磁気ハードディスク;フロッピーディスク;CD−ROMとDVDなどの光ディスク;磁気テープ;メモリチップを含む。本発明の様々な実施形態に有用なコンピュータ可読物理記憶媒体は、任意の物理的コンピュータ可読記憶媒体、例えば、ソリッドステートメモリ(フラッシュメモリなど)、磁気及び光学のコンピュータ可読記憶媒体及び装置、及び他の持続的な記憶技術を使用するメモリを含み得る。幾つかの実施形態において、コンピュータ可読媒体は、コンピュータプログラムとデータがコンピュータによりアクセスされることを可能にする任意のタンジブル媒体(tangible media)である。コンピュータ可読媒体は、コンピュータ可読命令、プログラムモジュール、プログラム、データ、データ構造、及びデータベース情報などの情報を保存することができる任意の方法又は技術で実施される、揮発性及び不揮発性であり、取り外し可能及び不可能なタンジブル媒体を含み得る。本発明の幾つかの実施形態において、コンピュータ可読媒体は、限定されないが、RAM(ランダムアクセスメモリ)、ROM(読取り専用メモリ)、EPROM(消去可能なプログラマブル読取専用メモリ)、EEPROM(電気的に消去可能なプログラマブル読取専用メモリ)、フラッシュメモリ又は他のメモリ技術、CD−ROM(読み取り専用コンパクトディスクメモリ)、DVD(デジタル多用途ディスク)又は他の光記憶装置媒体、磁気カセット、磁気テープ、磁気ディスク記憶装置又は他の磁気記憶装置媒体、他のタイプの揮発性及び不揮発性メモリ、並びに、情報を保存するために使用され得且つ前述の任意の適切な組み合わせを含むコンピュータにより読み取ることができる他のタンジブル媒体を含む。
幾つかの例において、本明細書に記載される1以上の方法は、独立型コンピュータ上で、又はネットワーク化されたコンピュータシステム或いはコンピューティングプラットフォームの一部として実施される。独立型コンピュータにおいて、全てのソフトウェアとデータは、ローカルメモリ装置上に存在し得、例えば、光ディスク又はフラッシュメモリ装置は、本発明を実施するためのコンピュータソフトウェア、同様にデータを保存するために使用され得る。代替的な実施形態において、ソフトウェア又はデータ、或いはその両方は、リモート装置へのネットワーク接続を通じてアクセスされ得る。1つのネットワーク化されたコンピュータシステム又はコンピューティングプラットフォームの実施形態において、本発明は、遠隔及び/又は中心に位置する場所に保存されるデータ及びリソースに接続するために、インターネット又はプライベートネットワークなどの公衆通信回線上のクライアント−サーバー環境を使用する。この実施形態において、ウェブサーバーを含むサーバーは、オープンアクセス(pay as you go)、又は本発明に従い提供される情報へのサブスクリプションをベースとするアクセスの何れかといった、アクセスを提供することができる。クライアントサーバー環境において、ウェブブラウザなどのクライアントソフトウェア又はプログラムを実行するクライアントコンピュータは、ネットワーク上のサーバーに接続する。クライアントソフトウェア又はウェブブラウザは、データと情報を入力し、且つデータと情報へのアクセスを受け取るために、本発明のユーザー用のユーザーインターフェースを提供する。場合によっては、クライアントソフトウェアは、ローカルコンピュータディスプレイ又は他の出力装置上で見られ、且つ、ユーザーがコンピュータキーボード、マウス、又は他の入力装置の使用により情報を入力することを可能にすることができる。サーバーは、クライアントがデータを入力し、本発明に従いデータを処理し、及びユーザーへデータを出力するのを可能にすると同様に、ローカル及びリモートコンピュータリソースへのアクセスを提供する、1以上のコンピュータプログラムを実行する。例えば、ユーザーインターフェースは、分析からのデータ、例えば基準の多能性肝細胞の母集団及び/又は対象の多能性肝細胞の母集団の標的遺伝子のDNAメチル化データレベル又はDNA遺伝子発現レベルのエントリーを許可する、テキストボックスなどのアクセス要素、同様に、コンピュータ可読媒体上でコードされた命令の実行後にプロセッサへと送信され且つそれにより利用可能とされるスコアカード、又はデータとの比較の結果のグラフィカルな読み取りを提供することができるディスプレイ要素を含む、グラフィカルユーザーインターフェースを含み得る。本明細書で使用されるように、用語「ソフトウェア」は「プログラム」と互換的に使用され、コンピュータを動作するための定法を指す。ソフトウェアの例は、ソフトウェア;コードセグメント;命令;コンピュータプログラム;及びプログラムドロジックを含む。
幾つかの実施形態において、基準として使用される、原発腫瘍からのメチル化プロファイルは、データベースから電子的に又はデジタルに記録され、注釈され、及び検索され得、前記データベースは、限定されないが、ゲノム、ESTs、SNPS、Traces、Celara、Ventor Reads、Watson reads、HGTSなどのGenBank(NCBI)タンパク質及びDNAデータベース;ENZYME、PROSITE、SWISS−2DPAGE、Swiss−Prot及びTrEMBLデータベースなどのSwiss Institute of Bioinformaticsのデータベース;Melanieソフトウェアパッケージ又はExPASy WWWサーバーなど、SWISS−MODEL、Swiss−Shop及び他のネットワークベースの計算道具;Comprehensive Microbial Resourceデータベース(The institute of Genomic Research)を含む。場合によっては、結果として生じる情報は、ゲノム内の、及びゲノムの中の基準データ又は遺伝子又はタンパク質の間の相同性を判定するために利用される、リレーショナルデータベースに保存される。
幾つかの実施形態において、システムは、判定モジュールにおいて判定される配列情報を基準データと比較するよう動作する比較のために、様々な利用可能なソフトウェアプログラム及びフォーマットを使用する、「比較モジュール」においてデータを比較する。1つの実施形態において、比較モジュールは、1以上のエントリーから1以上の基準データパターンまでの配列情報を比較するために、パターン認識技術を使用するように構成される。比較モジュールは、パターンの比較のために既存の市販で入手可能な又は自由に利用可能なソフトウェアを使用して構成され得、且つ行なわれる特定のデータ比較のために最適化され得る。比較モジュールはまた、例えば、DNA配列におけるCpGメチル化部位の存在又は不在の検出;メチル化のレベルの決定を含み得る、配列情報に関連するコンピュータ可読情報を提供することができる。
幾つかの実施形態において、比較モジュールは、予め定義された基準、又はユーザーにより定義された基準によりコンピュータ可読形態で処理され得る、コンピュータ可読の比較結果を提供することで、ディスプレイモジュールを用いてユーザーにより要求されるように保存され且つ出力され得る比較結果に部分的に基づくコンテンツを含む報告を提供する。幾つかの実施形態において、ディスプレイモジュールは、ユーザーのために比較結果に部分的に基づくコンテンツの表示を可能にし、ここでコンテンツは、対象のCUPのメチル化プロファイルの腫瘍細胞のメチル化プロファイルとの比較の結果を示す報告である。
幾つかの実施形態において、ディスプレイモジュールは、エンドユーザーのために比較結果に部分的に基づく報告又はコンテンツの表示を可能にし、ここでコンテンツは、CUPのメチル化プロファイルの、選択された原発細胞のメチル化プロファイルの比較の結果を示す報告である。本発明のこの態様及び他の全ての態様の幾つかの実施形態において、比較モジュール、又は本発明の他のモジュールは、リレーショナルデータベース管理システム、World Wide Webアプリケーション、及びWorld Wide Webサーバーを実行するオペレーティングシステム(例えばUNIX(登録商標)、Windows)を含み得る。World Wide Webアプリケーションは、データベース言語文[例えば、Standard Query Language(SQL)文]の生成に必要な実行可能コードを含む。実行可能なコードは、埋め込まれたSQL文を含み得る。加えて、World Wide Webアプリケーションは、ポインターを含有し、且つ、サーバー、同様にサービスのユーザーの要求へとアクセスされねばならない様々な外部及び内部のデータベースを含む様々なソフトウェア実体へと対処する、構成ファイルを含み得る。構成ファイルはまた、万が一サーバーが2つ以上の別個のコンピュータ上に分布されると、必要とされ得るように適切なハードウェアへのサーバーリソースのための要求を指示する。1つの実施形態において、World Wide WebサーバーはTCP/IPプロトコルを支援する。このようなローカルネットワークは時に、「イントラネット」と呼ばれる。そのようなイントラネットの利点は、それらが、The Cancer Genome Atlas(TCGA)又はInternational Cancer Genome Consortium(ICGC)などのWorld Wide Web(例えば、GenBank又はSwiss Pro World Wide Web site)上にある公衆のドメインデータベースとの容易な通信を可能にするということである。故に、本発明の特定の実施形態において、ユーザーは、ウェブブラウザ及びウェブサーバーにより提供されるHTMLインターフェースを使用して、インターネットデータベース上に存在するデータに(例えば、ハイパーテキストリンクを介して)直接アクセスすることができる。本発明の他の実施形態において、HTTP、FTP、SSH、及びVPNベースのインターフェースなどの他のインターフェースは、インターネットデータベースに接続するために使用され得る。
幾つかの例において、コンピュータ命令は、ソフトウェア、ファームウェア、又はハードウェアにおいて実施され、情報処理システムのモジュールにより着手される任意のタイプのプログラムされた工程を含む。場合によっては、コンピュータシステムは、ローカルエリアネットワーク(LAN)又は広域ネットワーク(WAN)に接続される。ローカルエリアネットワークの1つの例は、インターネットへのアクセスを含む、企業のコンピューティングネットワークであり得、これに対して、データ処理システムを含むコンピュータ及びコンピューティングデバイスが接続される。1つの実施形態において、LANは、通信のための工業規格の伝送制御プロトコル/インターネットプロトコル(TCP/IP)のネットワークプロトコルを使用する。伝送制御プロトコル(TCP)は、コンピュータシステムの中に信頼性があり、接続指向のトランスポート層リンクを提供するためのトランスポート層プロトコルとして使用され得る。ネットワーク層はトランスポート層にサービスを提供する。2路のハンドシェイク方式(two−way handshaking scheme)を用いて、TCPは、コンピュータシステムの中の論理的接続を確立し、維持し、且つ終了するための機構を提供する。TCPトランスポート層は、そのネットワーク層プロトコルとしてIPを使用する。加えて、TCPは、各メッセージを持つ宛先及びソースのポートを含むことにより、単一の装置上で実行する複数のプログラムを区別するために、プロトコルポートを提供する。TCPは、バイトストリームの伝送、データフロー定義、データ認識、失われた又は破損したデータの再送、及び単一のネットワーク接続を介した複式接続の多重化などの機能を実行する。最終的に、TCPはデータグラム構造に情報を閉じ込める原因である。代替な実施形態において、LANは、国際基準局の開放型システム間相互接続、IBMのSNA、NovellのNetware、及びBanyan VINESを含むがこれらに限定されない、他のネットワーク規格に従うことができる。
幾つかの実施形態において、比較モジュールは、予め定義された基準、又はユーザーにより定義された基準によりコンピュータ可読形態で処理され得る、コンピュータ可読データを提供することで、ディスプレイモジュールを用いてユーザーにより要求されるように保存され且つ出力され得る、検索されたコンテンツを提供する。本発明の幾つかの実施形態に従い、コンピュータ化したシステムは、コンピュータモニター、タッチスクリーン、又はビデオディスプレイシステムなどのディスプレイモジュールを含むか、それらに動作可能に接続され得る。ディスプレイモジュールは、ユーザー命令がシステムのユーザーに提示されること、システムへの入力を確認すること、及びシステムがユーザーインターフェースの一部としてユーザーに結果を表示することを可能にする。随意に、コンピュータ化したシステムは、システムによる情報出力の印刷されたコピーを生成するために、印刷装置を含むか、又はそれに動作可能に接続され得る。
幾つかの実施形態において、World Wide Webブラウザは、ユーザーが情報を入力し、要求を構築し、且つ検索されたコンテンツを表示するためにシステムと相互に作用することを可能にするための、ユーザーインターフェースを提供する。加えて、システムの様々な機能モジュールは、ユーザーインターフェースを提供するためにウェブブラウザを使用するよう適用され得る。ウェブブラウザを使用して、ユーザーは、データベースなどのデータソースから検索データに関する要求を構築し、比較とパターン照合を実行するために比較モジュールと相互に作用することができる。ユーザーは、システムと相互に作用してシステムに本発明の方法を実行させるためのグラフィカルユーザーインターフェースに従来利用される、ボタン、プルダウンメニュー、スクロールバーなどのユーザーインターフェース要素を指示し、且つそれらをクリックすることができる。ユーザーのウェブブラウザにより作成された要求は、DNAメチル化レベルと遺伝子発現レベル、検索されたコンテンツに関連する関連情報を提供し、この情報を処理し、結果を出力するために利用され得る1以上のデータベースのクエリを生成するための要求を処理又はフォーマットすることができるウェブアプリケーションへとネットワーク上で送信され得る。
<サーバー>
幾つかの実施形態において、本明細書に提供される方法は、サーバー又はコンピュータサーバー上で処理される(図2)。幾つかの実施形態において、サーバー(401)は、シングルコアプロセッサ、マルチコアプロセッサ、又は、並行処理のための複数のプロセッサである、中央処理装置(CPU、「プロセッサ」とも称す)(405)を含む。幾つかの実施形態において、制御組立体の一部として使用されるプロセッサは、マイクロプロセッサである。幾つかの実施形態において、サーバー(401)はまた、メモリ(410)(例えば、ランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ);電子記憶装置ユニット(415)(例えばハードディスク);1以上の他のシステムと通信するための通信用インターフェース(420)(例えばネットワークアダプタ);及び、キャッシュ、他のメモリ、データストレージ、及び/又は電子表示装置アダプターを含む周辺機器(425)を含む。メモリ(410)、記憶装置ユニット(415)、インターフェース(420)、及び周辺機器(425)は、マザーボードなどの通信バス(実線)を介してプロセッサ(405)と通信状態にある。幾つかの実施形態において、記憶装置ユニット(415)は、データを保存するためのデータ記憶装置ユニットである。サーバー(401)は、通信用インターフェース(420)の補助によりコンピュータネットワーク(「ネットワーク」)(430)に動作自在につながれる。幾つかの実施形態において、追加のハードウェアの補助によりプロセッサも、ネットワークに動作自在につながれる。幾つかの実施形態において、ネットワーク(430)は、インターネット、イントラネット及び/又はエクストラネット、インターネットと通信状態にあるイントラネット及び/又はエクストラネット、テレコミュニケーション、又はデータネットワークである。幾つかの実施形態において、サーバー(401)の補助によりネットワーク(430)は、サーバー(401)につながれたデバイスがクライアント又はサーバーとして作用するのを可能にする、ピアツーピアのネットワークを実施する。幾つかの実施形態において、サーバーは、ネットワーク(430)を通って運ばれた電子信号を介して、コンピュータ可読命令(例えば、デバイス/システム動作プロトコル又はパラメータ)、又はデータ(例えば、センサー測定値、代謝物質の検出から得た生データ、代謝物質の検出から得た生データの解析、代謝物質の検出から得た生データの解釈など)を送受信することができる。更に、幾つかの実施形態において、ネットワークは例えば、国境線にわたってデータを送受信するために使用される。
幾つかの実施形態において、サーバー(401)は、ディスプレイ又はプリンタなどの1以上の出力装置(435)と通信状態、及び/又は、例えばキーボード、マウス、又はジョイスティックなどの1以上の入力装置(440)と通信状態にある。幾つかの実施形態において、ディスプレイはタッチスクリーンディスプレイであり、その場合、ディスプレイ装置と入力装置の両方として機能する。幾つかの実施形態において、異なる及び/又は追加の入力装置は、アナンシエイタ(enunciator)、スピーカ、又はマイクロホンなどとして存在する。幾つかの実施形態において、サーバーは、例えば、Windows(登録商標)、MacOS(登録商標)、又はUnix(登録商標)、或いはLinux(登録商標)の様々なバージョンの何れか1つなどの、様々な動作システムの何れか1つを使用する。
幾つかの実施形態において、記憶装置ユニット(415)は、本明細書に記載される装置、システム、又は方法の動作に関連したファイル又はデータを保存する。
幾つかの実施形態において、サーバーは、ネットワーク(430)を通って1以上のリモートコンピュータシステムと通信する。幾つかの実施形態において、1以上のリモートコンピュータシステムは、例えば、パーソナルコンピュータ、ラップトップ、タブレット、電話、スマートフォン、又は携帯情報端末を含む。
幾つかの実施形態において、制御組立体は単一のサーバー(401)を含む。他の状況において、システムは、イントラネット、エクストラネット、及び/又はインターネットを通じて互いに通信する複数のサーバーを含む。
幾つかの実施形態において、サーバー(401)は、装置動作パラメータ、プロトコル、本明細書に記載される方法、及び潜在的な関連の他の情報を保存するのに適している。幾つかの実施形態において、そのような情報は、記憶装置ユニット(415)又はサーバー(401)に保存され、そのようなデータはネットワークを通じて送信される。
<キット及び製造品>
別の態様において、本発明は、癌の状況を検出及び/又は特徴付け、及び/又はCpGメチル化プロファイルのデータベースの生成のためのキットを提供し、該キットは、本明細書に記載される1以上のサンプルのメチル化の状況/レベルを検出又は測定するために複数のプライマー又はプローブを含む。そのようなキットは、幾つかの例において、本発明のメチル化バイオマーカー配列の少なくとも1つをハイブリダイズする少なくとも1つのポリヌクレオチド、及び遺伝子メチル化の検出のための少なくとも1つの試薬を含む。メチル化の検出のための試薬は、例えば、硫酸水素ナトリウム、マーカー配列がメチル化されない場合にマーカー配列の生成物である配列にハイブリダイズするよう設計されたポリヌクレオチドの検出のための試薬(例えば、少なくとも1つのC−U変換を含む)、及び/又は、メチル化に敏感な又はメチル化に依存する制限酵素を含む。場合によっては、キットは、アッセイにおける使用に適したアッセイ機器の形態で固形支持体を提供する。幾つかの例において、キットは、キット中に、ポリヌクレオチド、例えばプローブに随意に結合される、検知可能なラベルを更に含む。
幾つかの実施形態において、本発明のキットは、本発明のバイオマーカーのDNA領域の少なくとも一部を特異的に増幅することができる、1以上(例えば1、2、3、4、又はそれ以上)の異なるポリヌクレオチド(例えばプライマー及び/又はプローブ)を含む。幾つかの例において、キットはプローブパネルを含み、そこでは、前記プローブパネル内の各プローブは、SEQ ID NOs:1−1775のプローブとの60%−99%の配列同一性を含む。随意に、増幅部分にハイブリダイズすることができる1以上の検知可能に標識化したポリペプチドも、キットに含まれる。幾つかの実施形態において、キットは、2、3、4、5、6、7、8、9、10、又はそれ以上の異なるDNA領域或いはその部分を増幅するのに十分なプライマーを含み、及び随意に、増幅DNA領域又はその部分それぞれにハイブリダイズすることができる検知可能に標識化したポリヌクレオチドを含む。キットは更に、メチル化に依存する又はメチル化に敏感な制限酵素及び/又は亜硫酸水素ナトリウムを含み得る。
幾つかの実施形態において、キットは、本発明のバイオマーカーのDNA領域から少なくとも1つのシトシンの変換されたメチル化及び/又は変換された非メチル化配列の存在を定量化するために、亜硫酸水素ナトリウム、全ゲノム増幅のためのプライマーとアダプター(例えば、遺伝子断片にライゲート又は他に結合され得るオリゴヌクレオチド)、及びポリヌクレオチド(例えば、検知可能に標識化したポリヌクレオチド)を含む。
幾つかの実施形態において、キットは、本発明のバイオマーカーのDNA領域の少なくとも一部のコピーを定量化するために、メチル化を感知する制限酵素(例えば、メチル化に依存する制限酵素及び/又はメチル化に敏感な制限酵素)、全ゲノム増幅のためのプライマーとアダプター、及びポリヌクレオチドを含む。
幾つかの実施形態において、キットは、本発明のバイオマーカーのDNA領域の少なくとも一部のコピーを定量化するために、メチル化結合部分、及び1以上のポリヌクレオチドを含む。メチル化結合部分は、メチル−シトシンに特異的に結合する分子(例えばポリペプチド)を指す。
例は、制限酵素又はそのフラグメントを含み、これは、DNA切断活性を欠いているが、メチル化DNAや、メチル化DNAに特異的に結合する抗体などに結合する能力を保持している。
幾つかの実施形態において、キットは包装材料を含む。本明細書で使用されるように、用語「包装材料」は、キットの構成要素を収容する物理構造を指し得る。幾つかの例において、包装材料は、キット構成要素の無菌状態を維持し、且つ、そのような目的に共通して使用される材料(例えば、紙、段ボール(corrugated fiber)、ガラス、プラスチック、箔、アンプルなど)で作られている。アッセイのパフォーマンスに有用な他の材料は、試験管、ホールピペットなどを含むキットに含まれている。場合によっては、キットはまた、本明細書に記載されるアッセイの何れかにおけるこれらの試薬の1以上の使用のための書面による指示書を含む。
幾つかの実施形態において、キットはまた、緩衝剤、防腐剤、又はタンパク質/核酸安定化剤を含む。場合によっては、キットはまた、本明細書に記載されるような反応混合物の他の構成要素も含む。例えば、キットは、本明細書に記載されるような熱安定性DNAポリメラーゼの1以上のアリコート、及び/又はdNTPの1以上のアリコートを含む。場合によっては、キットはまた、遺伝子座の個々の対立遺伝子を抱く鋳型DNA分子の既知量の対照サンプルを含む。幾つかの実施形態において、キットは負の対照サンプル、例えば、遺伝子座の個々の対立遺伝子を抱くDNA分子を含まないサンプルを含む。幾つかの実施形態において、キットは正の対照サンプル、例えば、遺伝子座の個々対立遺伝子の1以上の既知量を含むサンプルを含んでいる。
<特定の用語>
他に定義されない限り、本明細書で用いる全ての技術用語及び科学用語は、請求される主題が属する技術分野における当業者によって、一般に理解されるものと同じ意味を有する。前述の一般的な記載及び次の詳細な記載は、典型的且つ例示的なものにすぎず、請求された任意の内容を限定するものではないことが理解される。本出願において、単数形の使用は、特に別記しない限り複数を含む。明細書と添付の特許請求の範囲に使用されるように、単数形「a」、「an」、及び「the」は、他にその内容が明確に指示しない限り、複数の指示対象を含むということに留意しなければならない。本出願において、「又は」の使用は、特に明記しない限り、「及び/又は」を意味する。更に、用語「含んでいる(including)」の使用は、「含む(include)」、「含む(includes)」、及び「含まれる(included)」といった他の形態と同じく、制限はない。
本明細書で使用されるように、範囲及び量は、特定の値又は範囲の「約(about)」として表わすことができる。「約」は正確な量も含む。従って、「約5μL」は「約5μL」、及び「5μL」も意味する。通常、用語「約」は、実験誤差内にあると予想される量を含む。本明細書に使用されるセクションの見出しは、構成上の目的のためのみのものであり、記載された主題を制限すると解釈されるものではない。
本明細書で使用されるように、用語「個々」、「被験体」、及び「患者」は、任意の哺乳動物を意味する。幾つかの実施形態において、哺乳動物は、ヒトである。幾つかの実施形態では、哺乳動物は、非ヒトである。
「部位」は、一つの部位に相当し、これは、単一の基本位置、又は関連付けられた基本位置の群、例えばCpG部位であり得る。「遺伝子座」は、複数の部位を含む領域に相当する。幾つかの例において、遺伝子座は1つの部位を含む。
本明細書で使用されるように、用語「比較すること(comparing)」は、患者のサンプルにおける1以上のバイオマーカーのメチル化の状況、比率、レベル、又は遺伝子局在化が、どのようにして標準又は対照のサンプルにおける1以上の対応するバイオマーカーのメチル化の状況、比率、レベル、又は遺伝子局在化に関連するのかについての評価を行うことを指す。例えば、「比較すること」は、患者のサンプルにおける1以上のバイオマーカーのメチル化の状況、比率、レベル、又は細胞局在化が、標準又は対照のサンプルにおける1以上の対応するバイオマーカーのメチル化の状況、比率、レベル、又は細胞局在化と同じになるか、それよりも多く又は少なくなるか、或いは異なるのかを評価することを指す場合もある。1つの実施形態において、用語「比較すること」は、複数の標準又は対照のサンプルとの比較(同じ、それ以上又はそれ以下、或いは異なる)における1以上のサンプルの評価を指す。
用語「統計的に有意な」又は「有意に」は、統計的有意性を指し、通常、標準より下、或いは更に下のマーカーの濃度の2つの標準偏差(2 SD)を意味する。この用語は差が存在するという統計的な証拠を指す。これは、帰無仮説が実際に真である場合に、帰無仮説を拒む決定を下す可能性として定められる。この決定はp値を用いて頻繁に下される。
用語「予後」又は「予測する」は、癌、疾患、又は腫瘍のタイプを進行させる危険性の予想又は計算、及び、患者がどのように回復するのか、そして回復の可能性が存在するかどうかを指す。「癌の予後」は通常、癌及び/又は患者の起こり得る経過又は結果の予想又は予測、癌の発生又は再発の危険性の評価、処置法の決定、又は治療効果又は反応の判定を指す。予後は、個体の情報、同様に、人口データ、生存者の反応率、家族又はその他の遺伝子情報などの個体の情報に対して比較を行うための外部のデータを使用することができる。「予後」はまた、特に疾患、特に特定の腫瘍性疾病、又は腫瘍のタイプの特定の治療の治療結果を予測するために疾患進行を予測することに照らして使用される。治療の予後は、例えば、成功の可能性(即ち、疾患の治癒)、又は疾患の重症度の特定レベルまでの減少の可能性を予測するために使用される。通常の概念として、この目的のためにスクリーニングされたマーカーは、好ましくは、予測される治療に従い処置された患者のサンプルデータに由来する。マーカーのセットも、治療結果又はポジティブな疾患進行の出現について患者をモニタリングするために使用され得る。
用語「癌のレベル」又は「癌の状況」は、癌が存在するかどうか、癌の段階、腫瘍の大きさ、転移があるかどうか、身体の全体の腫瘍組織量、癌の位置及び/又は原因、及び/又は癌の重症度の他の測定を指す。癌のレベルは数字又は他の文字であり得る。場合によっては、レベルはゼロである。場合によっては、癌のレベルはまた、突然変異又は多くの突然変異に関連する前癌状態又は前癌症状(状態)を含む。
本明細書で使用されるように、用語「処置すること(treating)」及び「処置(treatment)」は、疾患の少なくとも1つの症状の減少又は疾患の改善、例えば有益又は所望の臨床結果を被験体が受けるように、有効な量の組成物を被験体に投与することを指す。本発明の目的のために、有益又は所望の臨床結果は、検出可能又は検出不可能なものにかかわらず、限定されないが、1以上の症状の緩和、疾患の範囲の減少、疾患の安定(例えば、悪化しない)状態、又は疾患進行の遅延又は減速、疾患状況の改善又は軽減、及び寛解(部分的又は全体的のいずれか)を含む。幾つかの実施形態において、処置することは、処置を受けない場合に予期される生存と比較して生存を延ばすことを指す。幾つかの例において、処置は予防処置を含む。代替的に、疾患の進行が減少又は止められる場合に、処置は「有効」である。幾つかの実施形態において、用語「処置」はまた、処置を受けない場合に予期される生存と比較して生存を延ばすことを意味する。処置を必要とする人は、疾患又は疾病を既に患っていると診断された人、同様に、遺伝的感受性、又は疾患又は疾病に起因する他の要因により疾患又は疾病を進行させると思われる人を含み、他の要因の限定されない例としては、被験体の体重、食事、及び健康が、糖尿病を進行させると思われる被験体に起因し得る要因である。処置を必要性とする人はまた、医学的又は外科的な注意、ケア、又は管理を必要とする被験体を含む。被験体は通常、病気になっている又は負傷している、又は人口の平均人員に比べて病気になる危険性が増している、或いはそのような注意、ケア、又は管理を必要としている。
更なる綿密な仕上げなしで、当業者は、前述の記載を用いて、本判明を最も完全な程度にまで利用することができると考えられる。以下の実施は例示的なものにすぎず、方法はどうであれ、開示の残りを限定するものとして、解釈されるべきではない。
これら実施例は、例示目的のためのみに提供され、本明細書で提供される請求項の範囲を制限するものではない。
<実施例1−非侵襲的診断のための尿からの無細胞DNAの抽出>
<安定化及びストック>
<承認>
このプロジェクトはSYSUのIRB及びSichuan Universityにより承認されている。インフォームドコンセントを全患者から得る。患者がインフォームドコンセントに署名した後、腫瘍と正常組織を得る。
3つの工程:尿安定緩衝液(Urine stable buffer)−遠心分離−上清の凍結
<尿安定緩衝液>
尿安定緩衝液を、尿DNA安定化及び無細胞DNAの保護により処方した。防腐剤は尿の中の細胞を安定させ、ゲノムDNAの放出を妨げて、高品質の無細胞DNAの分離を可能にする。尿安定緩衝液において集められたサンプルは室温で14日までの間、安定しており、好都合なサンプルの収集、移送、及び貯蔵を可能にする。
尿安定緩衝液の処方:
2.2%のクエン酸ナトリウム
0.8%のクエン酸
0.245%のデキストロース
500mMEGTA
1%のグルタルアルデヒド又は1%のホルムアルデヒド
<遠心分離>
尿サンプルを15分間、高速(例えば11,000xg)で遠心分離し、上清を核酸抽出のために使用する。これにより、サンプルから細胞物質及び細胞の核酸を除去する。
<ストック>
長期的なストックのために上清を−20から−80℃で維持する。
手順:
1.円錐管に40mlまでの尿を移す。
2.尿1mlごとに、50μlの尿安定緩衝液を加える。逆チューブにより10回より多く、尿混合物を十分に混合する。尿に尿安定緩衝液を加えて混合した後、尿を周囲温度で14日まで保存することができる。
3.15分間11000xgで遠心分離する。
4.ペレットをかき乱すことなく、新たな円錐管に尿の上清を注意深く移す。
5.その後、無細胞の尿(尿の上清)をストックとして−20から80℃で維持し、又はDNA抽出のために処理する。
<DNA抽出>
4つの工程:溶解−結合−洗浄−溶出
<サンプルの溶解>
尿サンプルをプロテイナーゼKとDNA溶解緩衝液の存在下、高温の非常に変性の条件下で溶解して、それと共に、DNaseの不活性化、及び結合タンパク質、脂質、及びベシクルから核酸の完全な放出を確実なものとする。
<DNAの結合>
溶解後の尿から放出された核酸を、シリカ膜のカラム又はビーズへと選択的に結合する。
Bing Bufferを添加することにより結合条件を調整して、循環する核酸のシリカ膜への最適な結合を可能にする。その後、溶解物を真空圧力により引き抜くと、溶解物をシリカ膜上に移し、大量の循環する核酸を小さなシリカ膜上で吸収する。
結合バッファーの塩及びpH条件により、幾つかの例においてPCR及び他の下流の酵素反応を阻害する、タンパク質及び他の汚染物質はシリカ膜上で保持されないことが確実となる。
<洗浄>
核酸は膜に結合したままである一方、汚染物質は3つの洗浄工程中に効率的に洗い流される。
<純粋な核酸の溶出>
高度に純粋な循環する核酸を、一回の工程で溶出緩衝液において溶出する。
<核酸の収量と大きさ>
Qubit ds DNA HSキット又は定量的な増幅方法を、収量の判定のために使用する。収量は、サンプルの容積と、サンプル中の循環する核酸の濃度に依存する。サンプルから得た循環するDNAとRNAの絶対収量は、サンプルと異なる個体との間でかなり変動し、また他の要因、例えば性別や特定の疾患状況に依存する。この手順を使用して精製された循環する核酸の粒度分布を、アガロースゲル電気泳動法により確認する。
<実施例2−尿からの遊離循環無細胞DNAの分離>
QIAamp Circulating Nucleic Acid Kitを使用し、4mlの尿から、上清を尿安定緩衝液の混合物により処理して、上述のように遠心分離する。尿サンプルは新鮮である又は凍結されており、後に室温に釣り合う。
<手順>
1.50mlのチューブ(提供されない)の中へ500μlのQIAGENプロテイナーゼKをピペットで移す。
2.50mlのチューブに4mlの尿を加える。
3.4mlの緩衝液ACL(必要とされるような担体RNAを含む)と1.0mlの緩衝液ATLを加え、キャップを締め、30秒間パルス攪拌により混合する。
4.60℃で30分間インキュベートする。
5.実験台上でチューブを配して、キャップを弛める。
6.溶解物に9.0mlの緩衝液ACBを加えて、キャップを締め、15−30秒間パルス攪拌により徹底的に混合する。
7.氷の上で5分間、溶解物−緩衝液ACBをインキュベートする。
8.QIAvac 24 Plus上で、VacConnectorにQIAamp Miniカラムを挿入する。開いたQIAamp Miniカラムに20mlのチューブ伸展具を挿入する。サンプルの漏出を回避するために、チューブ伸展具がQIAamp Miniカラムにしっかり挿入されていることを確かめる。
9.QIAamp Miniカラムのチューブ伸展具に、工程7の溶解物を注意深く適用する。真空ポンプのスイッチを入れる。全ての溶解物がカラムを通って完全に引き抜かれると、真空ポンプのスイッチを切り、圧力を0mbarにまで解放する。チューブ伸展具を注意深く除去且つ廃棄する。
10.QIAamp Miniカラムに600μlの緩衝液ACW1を適用する。カラムの蓋を開いた状態にし、真空ポンプのスイッチを入れる。全ての緩衝液ACW1がQIAamp Miniカラムを通って引き抜かれた後、真空ポンプのスイッチを切り、圧力を0mbarにまで解放する。
11.QIAamp Miniカラムに750μlの緩衝液ACW2を適用する。カラムの蓋を開いた状態にし、真空ポンプのスイッチを入れる。全ての緩衝液ACW2がQIAamp Miniカラムを通って引き抜かれた後、真空ポンプのスイッチを切り、圧力を0mbarにまで解放する。
12.QIAamp Miniカラムに750μlのエタノール(96−100%)を適用する。カラムの蓋を開いた状態にし、真空ポンプのスイッチを入れる。全てのエタノールがQIAamp Miniカラムを通って引き抜かれた後、真空ポンプのスイッチを切り、圧力を0mbarにまで解放する。
13.QIAamp Miniカラムの蓋を閉じ、それを真空マニホルドから除去し、VacConnectorを廃棄する。(工程8から取っておいた)きれいな2mlの収集チューブにQIAamp Miniカラムを入れ、3分間全速力で(20,000xg;14,000rpm)遠心分離する。
14.新しい2mlの収集チューブにQIAamp Miniカラムを入れ、蓋を開き、56℃で10分間アセンブリをインキュベートして、膜を完全に乾燥する。
15.きれいな1.5mlの溶出チューブにQIAamp Miniカラムを入れ、工程14の収集チューブを廃棄する。QIAamp Miniカラムの膜の中心に20−150μlの緩衝液AVEを注意深く適用する。蓋を閉じ、室温で3分間インキュベートする。
16.1分間全速力で(20,000xg;14,000rpm)遠心分離を行い、核酸を溶出する。
遊離循環無細胞DNAを緩衝液AVEの中で溶出し、増幅反応での使用、又は15−30℃での貯蔵の用意を行う。精製された核酸には、タンパク質、ヌクレアーゼ、及び他の不純物がない。分離されたDNAは、PCR、アレイ、メチル化の検出などに理想的なものである。
<実施例3−メチル化マーカーの生成>
<データソース>
The Cancer Genome Atlas(TCGA)を含む様々なソースからDNAメチル化データを得た。Infinium 450Kのメチル化アレイを使用して、485,000の部位のメチル化状況を生成した。追加データは、以下のGSEデータセット:GSE46306、GSE50192、GSE58298、及びGSE41826からのものであった。腫瘍及びその対応する正常組織に関するメチル化プロファイルを分析した(表1)。
メチル化データファイルを、走査された各ビーズの比率値を備えたIDATフォーマットで得た。Bioconductorのminfiパッケージを使用して、これらデータファイルをベータ値と呼ばれるスコアに変換した。
全てのサンプルに関するベータ値を得た後、20のデータセット全てにわたり存在しなかったマーカーを除去した。
<各比較におけるトップマーカーの識別>
癌種に特異的なシグネチャーの識別を、特定の癌種とその周囲の正常組織との間の対でのメチル化差異、2つの異なる癌種間の差異、同様に、2つの異なる正常組織間の差異を比較することにより、達成した。全ての485,000CpGのメチル化部位を、1100の腫瘍サンプル及び231の一致した隣接する正常組織サンプルのトレーニングコホートにおいて調査した。
他の群ごとに対する各群のプロファイルを比較した。上記に列挙した合計20の癌の群(表1)と共に、合計2019/2=190の異なる群の比較を行った。450kのマーカーを全て、R遺伝子フィルタ(genefilter)パッケージにおいてcolttests()関数を使用して、1つの群から他の群まで比較した。この分析は、t−統計値を持つp値、及び比較において各マーカーに関するカテゴリ間の平均メチル化画分における差異を生成した。この比較後、マーカーを選別し、t−統計値の絶対値によりランク付けして、2つのカテゴリ間に区別することができる可能性が高いマーカーを識別した。各比較からの上位10のマーカーを、再検証分析のために選択した。190の比較群と共に、10x190=1900のマーカーを将来の分析のために選択した。複製を除去した後、958の固有のマーカーを、4000の腫瘍及び1000の正常組織の検証コホートにおいて試験された全癌パネルのために選択した。その後、このパネルを使用して、肺、乳房、肝臓、及び結腸直腸の癌患者、及び癌の無い患者の血漿及び体液サンプルを調べて、その診断上及び予後の値を検証した。メチル化パターンを、このパネルにおけるマーカーの発現遺伝子の発現プロファイルに関連付けた。
<各比較における上位10のマーカーに関する加重値の計算>
主成分分析を、統計環境における関数:prcomp()を使用して、各比較群における上位10のマーカーに適用し、各群の第1の主成分における加重値を抽出し、その加重値を各群において10の対応するマーカーと一致させた。マーカーを持つ加重値の190の群が存在する。
<変数の生成>
データにおけるサンプルの各々に関する190の変数を生成した。加重値/マーカーの組み合わせを使用して、各変数Vを、以下の方程式を用いて計算した:
ここで、Wは加重値であり、Mは、対応するマーカーの0から1までのメチル化ベータ値である。
寸法が(2)190の変数ごとの(1)サンプルの数である場合に、マトリックスを生成した。
<サンプルの分類>
上述のマトリックスを使用してサンプルを分類した。ロジスティック回帰、最近傍(NN)、及びサポートベクターマシン(SVM)を含む、本明細書で使用される様々な分類アルゴリズムがある。
Rに関するkernlabライブラリを使用し、サポートベクターマシンを生成した。Crammer、Singerのアルゴリズムは、Weston、Watsonのアルゴリズムよりもわずかに結果が優れていた。分析において、4つの起こり得るタイプの分類誤差を確認した。
1.誤った組織。これは結腸組織が肺組織として識別される場合に生じる。
2.偽陰性
3.偽陽性
4.正しい組織及び予後。誤った癌種。例えば、これは、腎臓の明細胞癌が腎臓の乳頭状の細胞癌として識別される時のものである。
3つの方法を使用して結果を検証した。最初の2つを最後の工程により確認した。
1.サンプルを5等分に分け、そのうち4つをトレーニングに使用し、5番目の部分を使用して結果を試験した。
2.1つを除いて全てのサンプルがトレーニングに使用される場合、Leave one outのシナリオを使用した。one left outを試験に使用した。それらを全て試験するまで、各サンプルのためにこれを繰り返した。
3.2段階の複製研究において、プロセスの始めにサンプルを2つのセットに分けた。トレーニングセットにより、最も高いt検定スコアとのそれぞれの比較において10のマーカーを確認した。その後、これらマーカーを使用して主成分を生成し、次にこれら変数を使用してSVMを生成した。その後、得られたマーカーを試験セットに適用し、主成分とSVMの結果を生成した。
これらの方法の各々により、予測精度は95%より上であった。組織誤差の数は1%未満であった。特異性は約95%であり、感受性は試験データセットにより約99%であった。
加えて、ICAと組み合わせたPCAも適用した。ICAにおいて、構成要素のプロセスは、予め指定されたノイズターム無しで測定されたメチル化値へと合計すると仮定されるが、幾つかの構成要素は、データ中の1以上のタイプの「ノイズ」として表わされる。例えば、この場合、変数の数(例えば、117Kのメチル化値)は、サンプルの数(例えば、7706のサンプル)よりもはるかに多かった。ICAが入力データから不混合マトリックス(unmixing matrix)を習得するのに十分なサンプルの数を必要としたため、場合によっては次元縮退が生じることなく行われるICA分解は、まとまらなかった。この工程は更に図36で示され、以下のように議論される:
教師無し学習−パート1:マーカー選択
このパートは、合計の生のマーカースペース(117K)から、Nの最も有益なマーカー(例えば、Nは5000である)を選択することであった。これにより、連続する血液サンプルのカテゴリ化用に血液細胞をサンプリングするために、資金効率が良く正確なマーカーのアレイを調査した。更なる修飾は、血液細胞のサンプリングにおいて信号対ノイズ比(SNR)を増加させるために、N値を増大させ、又は同じセットのマーカーを複製する(即ち、2つの異なる位置に5000のマーカーの各々を配する)ことを含んでいた。
工程1:独立成分分析(ICA)
ICAは、入力データのマトリックスX(7176×117K)を立体的に独立したソースのマトリックスUへと直線的に混合しない、「不混合」マトリックスWを見出し、ここでU=WXである。推測されたソースのマトリックスU(成分活性化)の行は、マーカーの各々に沿った相当するICの波形であった。この工程では、ICA分析は更なる分析のために7176の成分を戻した。ICAにおいて、成分のプロセスは、予め指定された雑音項無しで測定されたメチル化値へと合計すると仮定されるが、幾つかの構成要素は実際に、データ中の1以上のタイプの「ノイズ」を含むか、又はそれを表し得る。
工程2:成分活性化へのZ変換標準化
7176のICの中の各マーカーの寄与を適正に評価するために、成分活性化へのZ変換標準化を適用した。具体的に、成分活性化(Uの1つの行)はそれぞれ、その平均を取り除き、標準偏差によりその値を分割して、ゼロ平均と単位差異を得た。この手順は、いわゆるZ値において標準化された成分活性化U(即ち、マーカー加重値)を生成した。
工程3:各成分に関するZスコア化したマーカーのランク付け
この工程は、7176の成分の各々に対する117Kのマーカーの重要性を識別することであった。各成分について、絶対的なZ値に従うマーカーを全て、各マーカーに1から117Kまでのラベルを付けるようにしてランク付けした。「1」としてラベル付けされたマーカーは、最も寄与されたことを示す一方で、「117K」としてラベル付けされたマーカーは最も重要ではなかった。この工程の後、各マーカーを7176の値に関連付け、その各々は、7176の成分の各々への寄与を示した。
工程4:全ての成分の中で上位のNの寄与したマーカーの検索
この工程は、117KからNの最も重要なマーカーを検索することであった。検索は、任意の成分による「1」として標識化されたマーカー、その後、任意の成分による「2」として標識化されたマーカーなどの収集から始まった。検索は、完全に収集された、所望の数の寄与したマーカーで終わった。
パート2:ICAに基づく特徴抽出
最も寄与したマーカー(117Kから5000)を選択した後、特徴として処置された成分を得るためにマーカーをトリミングしたマトリックス(7176×5000)へのICA分解(上述のもの)を適用した。ICA分解前に、主成分分析(PCA)を利用して、寸法を7176から25に減らした。故に、この工程におけるPCAとICAは、血液サンプル分類のために35×5000の特徴マトリックスを生成した。
パート3:血液サンプル分類
k最近傍(KNN)及びサポートベクターマシン(SVM)を比較した後、放射基底関数(RBF)のカーネル関数を備えたSVMは、KNNより性能が優れており、93.99%の分類性能を戻して、30の分類から7176のサンプルのうち1つを正確に認識した(KNN=91.54%、K=5)。
生のマーカー全体(117K)を使用して得た95.55%の分類性能を比較して、マーカーをトリミングしたマトリックスは同等の性能(93.99%)を戻した。
<DNA/RNA分離及び定量的PCR>
患者と組織の特徴:一致した隣接する正常組織を対照として使用した。これらの正常組織を、癌の証拠のない組織構造により確認した。
腫瘍及び相当する遠くの部位のサンプルを、外科的腫瘍切除を受ける患者から得て、使用するまでサンプルを−80℃で冷凍保存した。サンプルからのDNAとRNAの分離を、AllPrep DNA/RNA Miniキット(Qiagen,Valencia,CA)を使用して実行し、RNAをオンカラムのDNase消化にさらした。Nanodrop 2000(Thermo Scientific)を使用してRNAを定量化し、製造業者の指示に従いiScript cDNA合成キット(Bio−rad,Inc)を使用して、各サンプルの200ngのRNAを相補DNA合成のために使用した。簡潔に、サンプルを、25℃で5分間、42℃で30分間、その後85℃で5分間、インキュベートした。7500 Real Time PCRシステム(Applied Biosystems)の上で遺伝子特異的なプライマー及びPower SYBR Green Master Mixを使用して、40サイクルの増幅によりqPCRを実行した。測定を三通りに行い、内因的なACTBレベルに標準化した。発現における相対的な倍率変化を、ΔΔCT方法(サイクル閾値<30)を使用して計算した。3つの複製に基づいてデータを平均±s.dとして示す。
<ゲノムワイドメチル化のプロファイリングは、癌における特異的メチル化のシグネチャーを識別した>
癌種に特異的なシグネチャーを識別するために、特定の癌種とその周囲の正常組織との間のメチル化の差異、異なる癌種間の差異、同様にペアワイズの様式で2つの正常組織間の差異を、比較した。肺癌(腺癌及び扁平上皮癌)及び結腸と直腸の癌の2つのNSCLC亜型を含む、12種類の癌の患者のトレーニングコホートのゲノムワイドDNAメチル化プロファイルを、Illumina 450,000 CpGメチル化マイクロアレイを使用して分析した。12の腫瘍群と9の正常組織群を含む、合計21の組織群により、合計2120/2=210の固有のペアワイズの比較を、実行した。R遺伝子フィルタパッケージにおいてcolttests()関数を使用して、450kのマーカーを、1つの群からの群まで比較した。t−統計量によりマーカーを最低のp値にランク付けし、各群における各比較と上位10のマーカーとの間の平均メチル化画分における最大の差異を、再検証分析のために選択した。190の比較の後、958の固有の非冗長マーカーを全癌パネルとして生成した。統計環境における関数::prcomp()を使用して、主成分分析を各比較群における上位10のマーカーに適用することにより各マーカーに重みをかけ、各群の第1の主成分における加重値を抽出し、その加重値を各群において10の対応するマーカーと一致させた。これらのマーカーを使用して、ニューラルネットワーク、ロジスティック回帰、最近傍(NN)及びサポートベクターマシン(SVM)を含む様々なアルゴリズムによりサンプルを分類し、その全ては一貫した結果を生成した。SVMを使用する分析は、最も確固としていることが分かり、それ故、全ての後の分析に使用された。これら958の上位ランクのCpG部位を、癌及び正常なサンプルにおいて教師無し様式で示した。
階層的クラスタリングは、高い特異性と感応性を持つ癌種を区別することができた。癌の存在及び部位の識別が最大の臨床的有用性を提供する可能性が高いと仮定して、同じ組織から生じる癌を、アルゴリズムの有効性を評価する目的のために組み合わせた。組み合わせた腫瘍は、結腸と直腸の癌、肺の扁平上皮細胞癌と腺癌、腎臓の乳頭状の明細胞癌、及び軽度の神経膠腫と多形性神経膠芽腫を含んでいた。アルゴリズムは、結腸と直腸の癌を除き同じ組織から生じる癌を区別するのにかなり有効であり、これはおそらく、これら腫瘍における同様の生物学を反映している。トレーニングコホートは、2852の癌サンプルと1278の標準とで成っていた。4130のうち4087、又はサンプルの98.9%を、癌又は正常として正確に識別した。癌サンプルのうち2つだけを、癌ではあるが誤った組織として正確に識別した。癌に関する総合感受性は99.5%であり、個々の癌の間で一貫していた一方で、特異性は97.8%であり、より多くの変動が組織間にあった。特に、前立腺と甲状腺の両方は、74.1%と75%の低特異性を有しており、これはおそらく、アルゴリズムにおける制限、トレーニングに利用可能な小さいサンプル数、又はこれら組織における低悪性度の悪性腫瘍の高い罹患率を反映する。アルゴリズムが癌を識別する能力を、1220の癌と550の正常なサンプルから成る独立したコホートにおいて検証した。このコホートにおいて同様の結果を達成し、サンプルの98.7%を癌又は正常として正確に識別し、4つの癌サンプルのみを誤った組織であると識別した。検証コホートにおける総合感受性と特異性はそれぞれ98.9%と98.4%であり、トレーニングコホートにおけるものと非常に類似する予測特性を有していた。全体として、これら結果は、悪性腫瘍の存在、同様にその起源の部位も識別する際に、これらメチル化パターンの丈夫な性質を実証する。
<その遺伝子発現パターンに関連付けられた癌メチル化プロファイル>
DNAメチル化が遺伝子発現の不可欠な後成的レギュレータであるとすれば、コホートにおける遺伝子発現との、腫瘍対正常組織における部位遺伝子の差動的なメチル化の相関性を調査した。具体的に、上述のアルゴリズムにおける悪性腫瘍の存在を予測したメチル化部位が対象であった。癌種における高メチル化を示した上位のマーカーを、その一致した正常組織の相当物におけるものと比較した場合に選択し、乳房、肝臓、肺、及び結腸の癌におけるそれらの対応遺伝子を確認した。これらの遺伝子の差動的発現を計算するために発見コホートとしてTCGAからのRNA seqデータを利用し、癌組織収集物を検証コホートとして使用した。ほぼ全ての遺伝子は、正常なものに比べて提示された著しいCpGの高メチル化を選択し、減少された発現をこれら遺伝子の各々において観察した。ウィルコクソンの符号順位検定を使用して1.21x10−21のp値を判定した。幾つかの例において、選択された遺伝子は発癌性に関連していた。
<早期癌の診断のための全癌パネル>
8000のメチル化マーカーの検証及び癌患者の第2コホートにおけるそれらの検証後、早期癌を検出するためのそれらの使用を、血漿と尿における調査する無細胞腫瘍DNAにより調査した。
<実施例4−共通の癌の診断及び予後における全癌メチル化マーカー>
<承認>
The Cancer Genome Atlas(TCGA)のデータを、TCGAのウェブサイトからダウンロードした。このプロジェクトはSYSUのIRB及びSichuan Universityにより承認された。インフォームドコンセントを全患者から得た。患者がインフォームドコンセントに署名した後、腫瘍と正常組織を得た。
<データソース>
初期のトレーニングセット及び第1の試験セットからのDNAメチル化データを、The Cancer Genome Atlas(TCGA)から得た。1150の患者腫瘍及び一致した正常組織サンプルの検証コホートと同様に、4032の腫瘍及び一致した隣接する正常組織サンプルのトレーニングコホートに関するメチル化データを含む、臨床的特徴及び分子プロファイリングを、TCGAから得た。West China Hospital及びSun Yat−sen University Cancer Centerからの亜硫酸水素塩配列決定方法を使用して、810人の中国人の癌患者の別個の検証コホートを得た。研究コホートにおける患者の臨床的特徴を、表2、及び図37−図40に列挙する。一致した隣接する正常組織サンプルを、同じ患者から腫瘍と同時に集めて、組織構造により癌の証拠を持たないことを確認した。Infinium 450Kのメチル化アレイを使用して、485,000の部位のメチル化状況を生成した。追加データは、以下のGSEデータセット:GSE46306、GSE50192、GSE58298、及びGSE41826からのものであった。メチル化データファイルを、走査された各ビーズの比率値を備えたIDATフォーマットで得た。Bioconductorのminfiパッケージを使用して、これらデータファイルを、ベータ値と称されるスコアに変換した。全てのサンプルに関するベータ値を得た後、20のデータセット全てにわたり存在しなかったマーカーを排除した。
<全癌マーカーセットの生成>
特定の癌種とその相当する正常組織との間のペアワイズのメチル化差異、2つの異なる癌種間の差異、同様に、2つの異なる正常組織間の差異を比較することにより、癌種に特異的なシグネチャーを識別し、合計12の組織群は6の腫瘍群と6の正常組織群とを含んでいる。患者のサンプルを、一致した隣接する正常組織を含む6つの異なる組織からのTCGAを表示する9つの癌種から、トレーニング及び検証のコホートへと、無作為に分けた。これを行うために、合計1211/2=66の固有のペアワイズの比較を行なった。Illumina 450,000 CpGメチル化マイクロアレイを使用して、450kのマーカーを、R遺伝子フィルタパッケージにおいて[カラムt検定]colttests()関数を用いて群ごとに比較した。t−統計量により最低のp値を持つマーカー、及び各群における各比較間の平均メチル化画分における最大の差異をランク付けし、各群における上位10のマーカーを再検証分析のために選択した。450の比較の後、432の固有の非冗長マーカーを全癌パネルとして生成した。これら432の上位ランクのCpG部位を、各癌種及び正常なサンプルにおいて教師無し様式で示した(図8)。
この様式でのCpG部位の差動的メチル化に従う、これらサンプルの階層的クラスタリングは、起原となる癌組織、同様にTCGAトレーニングコホートにおける正常組織を区別することができた(表3)。全体的な正確な診断割合は99.2%であった。その後、これらマーカーを、97.9%の同様の正確な割合で、TCGA検証コホートに適用した(表4)。中国人癌患者の独立した第3のコホートにおいても結果を確認し(表5)、正確な割合は95.2%であり、TCGAから別個の人種的及び地理的な背景における代替的な重亜硫酸塩配列決定技術を使用して、メチル化分析を実行した(軽度の神経膠腫(LGG)と多形性神経膠芽腫(GBM)の適切な数は中国人コホートにおいて入手可能ではなかった)。
20の乳癌転移、及び30の結腸直腸癌の肝転移を調べた。原発性乳癌、原発性結腸直腸癌、原発性肝癌、及び正常な肝臓と比較した、これら転移の階層的クラスタリングを図41に図示する。この分析は、19/20の乳癌転移と29/30の結腸直腸癌転移の診断を示した(表5)。2つの誤診を正常な肝臓と識別し、これは誤差の原因が組織汚染であったことを示唆している。
アルゴリズムは、悪性腫瘍の組織起源と、同じ組織から生じる癌とを区別した。組織学的な亜型は治療の選択と予後に関係する。故に、組織学的な亜型を起源となる共通の組織と区別するアルゴリズムの能力を、軽度の神経膠腫(LGG)対多形性神経膠芽腫(GBM)(図9A、表6)、肺腺癌(LUSC)対扁平上皮癌(LUAD)(図9B、表7)、及び腎臓の明細胞(KIRC)対腎臓の乳頭状細胞癌(KIRP)(図9Cと表8)について、更に調べた。組織学的な亜型の教師無し階層的クラスタリングを例示するヒートマップを図9A−9Cにおいて示し、メチル化に基づく分類の結果を表6−8に示す。これらメチル化シグネチャーは、TCGAコホートにおける脳癌の97.6%、肺癌の95.5%、及び腎臓癌の98%において、組織学的な亜型を正確に確認することができた。不正確な分類の大多数は、癌であるが誤った組織学的な亜型を正確に識別し、サンプルの1%未満は正常組織として誤認された。
<各比較における上位10のマーカーに関する加重値の計算>
主成分分析を、統計環境における関数:prcomp()を使用して、各比較群における上位10のマーカーに適用し、各群の第1の主成分における加重値を抽出し、各群において10の対応するマーカーと一致させた。マーカーを持つ加重値の45の群が存在する。これらのマーカーを使用して、ニューラルネットワーク、ロジスティック回帰、最近傍(NN)及びサポートベクターマシン(SVM)を含む様々なアルゴリズムによりサンプルを分類し、その全ては一貫した結果を生成した。SVMを使用する分析は、最も確固としていることが分かり、それ故、全ての後の分析に使用された。
各腫瘍群について、サンプルを、結果として生じるメチル化シグネチャーに基づき2つの群に分け、それらの生存を、カプラン=マイヤー曲線を使用して示した(図10A−図10B)。腫瘍段階、及び処置後に残る腫瘍の存在に基づく亜群も、分析した。これらメチル化プロファイルは、調べられる全ての腫瘍のタイプ及び大半の亜群における生存の大きな統計的有意差を予測することができた。様々な特異的な結果は、潜在的に臨床的に有意であると分かった(stood)。全てのLGG患者、同様に腫瘍が残存する患者において、メチル化は、特に好ましい生存を持つ個体の亜群を識別した(図10A−図10B、P<0.001)。腎臓の明細胞癌(KIRC)において、分析は、処置の後に腫瘍が残存していない患者における比較的優れた生存を持つ群と比較して、相対的に生存が乏しい患者の小さな亜群を識別した(86.3%vs34.8%)(図10A−図10B)。KIRPにおいて、アルゴリズムは、処置後に腫瘍が残存する患者、又は疾患が進行した段階にある患者の亜群において、特に予後が乏しい患者を識別した(図10A−図10B)。統計的に有意であるが、この効果の規模の評価は、少ない数のこのような群により限定される。処置後に腫瘍が残存していないLUAD患者の亜群は更に、大抵の患者と比較して特に好ましい予後を持つと確認され(図10A−図10B)、このことは、これらの患者の再発率の割合が低いことを示唆している。最終的に、LUSCにおいて、メチル化パターンは、処置後に腫瘍が残存しない患者の亜群における、同様に優れた生存を予測した(図10A−図10B)。これらの結果は、生存を予測し、及び、上述の様々な実施例において、多かれ少なかれ積極的なモニタリング又は処置を必要とし得る患者の群を識別する際に、補体組織構造に対してメチル化パターンを使用する可能性を強調する。
体細胞突然変異がメチル化シグネチャーのみに付加的な予後の情報を加えたかどうか、又はメチル化シグネチャーが体細胞突然変異と相互に関連したかどうかを試験するための実験を行った。3つの癌種(LGG、LIHC、及びKIRC)において、DNAメチル化ベースの予測が体細胞突然変異と相互に関連すること、及び、メチル化の組み合わせと体細胞突然変異の分析とが、5年の生存の予測のために改善されたパフォーマンスを提供することを、見出した。体細胞突然変異の分布及び相対度数を図43A−図43Bに示す。LGGについて、IDH1又はIDH2の何れかにおける突然変異は、一般的且つ相互に排他的であり、突然変異はIDH2よりもIDH1においてより頻繁に生じた。IDH1又はIDH2の突然変異は、改善された予後を予測するメチル化シグネチャーを持つサンプルの92%で存在し、これに対し、予後不良を予測するメチル化シグネチャーにおいては42%しかなかった(図11A)。興味深いことには、IDH2突然変異は、予後不良を予測するメチル化シグネチャーを持つ群全てにおいては観察されなかった。一意的に、腫瘍のタイプに関する体細胞突然変異の中で、IDH1/IDH2の状況は独立して、メチル化シグネチャーに加えて改善された予後を予測した(図11B)。IDH1及び正のメチル化シグネチャーは優れた予後を予測したが、IDH2突然変異は、より優れた生存さえも予測するように思われる。サンプルセットにおけるIDH2突然変異体において死亡は観察されなかったが、この観察は22のサンプルの大きさにより限定される。IDH1とIDH2の突然変異は、LGGにおいて一般的であると知られ、この腫瘍において優れた予後を示しており、LGGを欠くIDH1/2突然変異は、GBMにかなり類似する臨床的挙動を実証する。IDH1とIDH2は、細胞における代謝プロセスに関係し、これら遺伝子における突然変異は、mCpG部位のヒドロキシル化と脱メチル化に干渉すると考えられている。著しくは、予後を予測するメチル化シグネチャーは、体細胞突然変異にも、HER2とER/PR発現を含む組織学的マーカーにも関連しなかった。
LIHCについて、体細胞突然変異の総数は、より悪化した予後を予測するメチル化シグネチャーに関連した(図11C)。KIRCについて、図11Dは、メチル化プロファイル及び頻繁に突然変異した遺伝子に関連する、教師無し階層的クラスタリング及びヒートマップを示し、図42Aは、体細胞突然変異の総数がより悪化した予後を予測するメチル化シグネチャーに関連したことを示す。加えて、メチル化シグネチャーと、3つの遺伝子(BAP1、TP53、及びPTCH1)の1つの体細胞突然変異との組み合わせを使用して、予後を予測し(図42B、p<0.0001)、その他に好ましい予後を持つこの癌において特に生存が乏しい小さな亜群を識別した。
<その遺伝子発現パターン及び機能に関連付けられた癌メチル化プロファイル>
遺伝子発現と相互に関連付けられた、腫瘍対正常組織における遺伝子中の部位の差動的なメチル化を更に調査した。正常組織において平均メチル化値が<5%であり、且つ癌組織においては>50%であるトップマーカーを選択し、これは癌と正常組織の両方におけるメチル化と遺伝子発現のレベルの優れた相関性を示した。TCGAからのRNA−seqデータを使用して、これら遺伝子の差動的発現を計算した(図15A)。CpG高メチル化は、正常なサンプルに比べて癌において観察され、対応遺伝子においては反対に発現が減少していた。新しく発見された腫瘍抑制因子機能により識別された遺伝子を更に試験した。ZSCAN18を選択して、癌の生物学に対するその機能的関連性を試験し、ZNF502は乳癌の病因に関係していた。ZNF502は、逆に遺伝子発現が減少している乳癌において高メチル化される(p=xx、p=xx)(図15A−図15E)。加えて、ZNF502発現は乳癌において抑止され、細胞培養物及びヌードマウスにおける腫瘍増殖を減少させると観察された(図15G)。同様に、FUZにおけるメチル化レベルは、逆に遺伝子発現レベルが減少した肝臓癌において増大し、細胞培養物とヌードマウスにおいて腫瘍増殖を阻害すると示された(図15F−図15J)。
<変数の生成>
データにおけるサンプルの各々に関する45の変数を生成した。加重値/マーカーの組み合わせを使用して、各変数Vを、以下の方程式を用いて計算した:
ここで、Wは加重値であり、Mは、対応するマーカーの0から1までのメチル化ベータ値である。
寸法が(2)190の変数ごとの(1)サンプルの数である場合に、マトリックスを生成した。
<サンプルの分類>
上述のマトリックスを使用してサンプルを分類した。ロジスティック回帰、最近傍(NN)、及びサポートベクターマシン(SVM)を含む、本明細書で使用される様々な分類アルゴリズムがある。全ての後の分析に、SVMを用いる分析を使用した。
Rに関するKernel−Based Machine Learning Lab(kernlab)を使用し、サポートベクターマシンを生成した。最良の結果は「RBF」カーネルを伴う。Crammer、Singerのアルゴリズムは、Weston、Watsonのアルゴリズムよりもわずかに結果が優れていた。分析において、4つの起こり得るタイプの分類誤差を確認した。
1.不正確な組織;例えば結腸組織が肺組織として識別される。
2.偽陰性;例えば、肺癌は正常な肺として識別される。
3.偽陽性;例えば、正常な結腸は結腸癌として識別される。
4.正確な組織、不正確な癌種;例えば、腎臓の明細胞癌は、腎臓の乳頭状の細胞癌として識別される。
3つの方法を使用して結果を検証した。
1.サンプルを5等分に分け、そのうち4つをトレーニングに使用し、5番目の部分を使用して結果を試験した。
2.1つを除いて全てのサンプルがトレーニングに使用される場合、Leave one outのシナリオを使用した。one left outを試験に使用した。それらを全て試験するまで、各サンプルのためにこれを繰り返した。
3.2段階の複製研究:プロセスの始めにサンプルを2つのセットに分けた。トレーニングセットにより、最も高いt検定スコアとのそれぞれの比較において10のマーカーを確認した。その後、これらマーカーを使用して主成分を生成し、次にこれら変数を使用してSVMを作成した。得られたマーカーを試験セットに適用し、主成分とSVMの結果を生成した。
<腫瘍DNA抽出>
新しく凍結した健全な又は癌の組織の片からのゲノムDNA抽出を、製造業者の推奨に従いQIAamp DNA Mini Kit(Qiagen)により行った。およそ0.5mgの組織を使用し、平均5μgのゲノムDNAを得た。DNAを−20℃で保存し、調製の1週間以内に分析した。
<FFPEサンプルからのDNA抽出>
様々な修飾でQIAamp DNA FFPE Tissue Kitを使用して、凍結したFFPEサンプルからのゲノムDNAを抽出した。DNAを更なる分析のために−20℃で保存した。
<ゲノムDNAの重亜硫酸塩変換>
製造業者のプロトコルに従いEZ DNA Methylation−Lightning(商標)キット(Zymo Research)を使用し、1μgのゲノムDNAをビス−DNAに変換した。結果として生じるビス−DNAは、〜200−3000bpの粒度分布を有しており、ピークは約〜500−1000bpであった。ビス−DNAの深い配列決定、及び、CH(非CG)ジヌクレオチドのT変換に対するCの比率の分析によって確認されるように、重亜硫酸塩変換の効率は、>99.8%であった。
<分子反転(パッドロック)プローブにより捕捉されるビス−DNAの深い配列決定による第2の検証コホートのDNAメチル化レベルの判定>
癌組織と正常組織との比較の何れかにおいてメチル化レベルが著しく異なったCpGマーカーを使用して、配列決定のためのパッドロックプローブを設計した。パッドロック捕捉とビス−DNAの配列決定は、修飾によりG. Church and colleagues (Porreca GJ, Nat Methods. 2007 Nov; 4 (11):931−6.)及びK. Zhang and colleagues (Diep, D Nat Methods. 2012 Feb 5;9(3):270−2, Deng, J. et al. Nat. Biotechnol. 27, 353−360 (2009))によって開発された技術に基づく。
<プローブの設計と合成>
パッドロックプローブを、ppDesignerソフトウェア(Diep, D, Nat Methods. 2012 Feb 5;9(3):270−272)を使用して設計した。捕捉した領域の平均長は70bpであり、CpGマーカーは捕捉した領域の中心部に位置する。CpGマーカーの未知のメチル化状況により導入されたバイアスを妨げるために、CGジヌクレオチドを欠いた配列内に捕捉アームを排他的に位置付けた。アーム間のリンカー配列は、等しい長さのプローブを生成するために、Csの可変的な伸展により分離された増幅プライマーのための結合配列を含んでいた。プローブの平均長は91bpであった。プローブは、6−bpの固有の分子識別子(UMI)配列を組み込み、個々の分子捕捉事象の識別と、DNAメチル化レベルの正確なスコア付けを可能にした。
標準の商業上の合成方法を使用して、プローブを別個のオリゴヌクレオチドとして合成した。捕捉実験のために、プローブを混合し、製造業者の推奨に従いT4 PNK(NEB)によりインビトロでリン酸化して、P−30 Micro Bio−Spinカラム(Bio−rad)を使用して精製した。
<ビス−DNAの捕捉>
20ngの重亜硫酸塩に変換されたDNAを、1X Ampligase緩衝液(Epicentre)を含む20μlの反応物において、定められたモル比のパッドロックプローブと混合した。DNAに対するプローブの最適なモル比は、20,000:1であると実験的に判定した。蒸発を妨げるために、反応物を50μlの鉱油で覆いかぶせた。DNAに対してプローブをアニールするために、95℃で30秒の変性の後、毎秒0.02℃の割合で55℃にゆっくりと冷却した。ハイブリダイゼーションを、55℃で15時間にわたり放置することで完了させた。アニールされたアーム間の間隙を満たすために、以下の5μlの混合物を各反応物に加えた:2UのPfuTurboCxポリメラーゼ(95℃で3分間予め活性化した(Agilent))、0.5UのAmpligase(Epicentre)、及び1X Ampligase緩衝液中の250pmolの各dNTP。55℃で5時間のインキュベーションの後、反応物を94℃で2分間変性させて、氷の上で即座に冷却した。5μlのエキソヌクレアーゼ混合物(20UのExoI及び100UのExoIII、共にEpicentre由来)を加え、一本鎖DNA分解を37℃で2時間行い、その後、94℃で2分間酵素不活性化を行った。
部位特異的捕捉の環状の生成物を、別個のサンプルへのバーコーディングを付随するPCRにより増幅した。パッドロックプローブ内のリンカーDNAに特異的なプライマーを用いて増幅を行い、その1つは特異的な6bpのバーコードを含んでいた。両方のプライマーは、Illuminaの次世代の配列決定アダプター配列を含んでいた。PCRを以下のように行った:次のサイクルを使用して、1X Phusion Flash Master Mix、3μlの捕捉されたDNA、及び200nMの最終[c]のプライマー:10s@98℃、8Xの(1@98℃、5s@58℃、10s@72℃)、25Xの(1@98℃、15s@72℃)、60s@72℃。PCR反応物を混合し、結果として生じるライブラリは、有効な捕捉(〜230bp)を含み、且つAgencourt AMPure XPビーズ(Beckman Coulter)を使用して「空の」捕捉(〜150bp)を除外するように選択された大きさであった。Illuminaフローセルアダプタープライマー(P及びP7)を使用してPCRによりライブラリの純度を確認し、Qubit dsDNA HSアッセイ(Thermo Fisher)を使用して濃度を判定した。MiSeqとHiSeq2500システム(Illumina)を使用してライブラリを配列決定した。
<捕捉範囲の均一性の最適化>
本来のパイロット捕捉実験の深い配列決定は、最も効果的なプローブと非効果的なプローブにより捕捉された読み取りの数の間の有意差を示した(>0.2の平均の範囲を持つ捕捉領域の60−65%)。これを改善するために、相対的な効率を配列決定データから計算し、プローブを調整されたモル比で混合した。これにより捕捉均一性を、>0.2の平均範囲で領域の85%に増大させた。
<配列決定データの分析>
幾つかの修飾と共にソフトウェアツールbisReadMapper (Diep, D, Nat Methods. 2012 Feb 5;9(3):270−272)を使用して、配列決定の読み取りのマッピングを行った。初めに、各配列決定の読み取りからUMIを抽出し、添付して、D.D.により豊富に提供されるカスタムスクリプトを用いてFASTQファイル内のヘッダーを読み取った。Bowtie2を使用して、あたかもCが全てメチル化されず、且つヒトゲノムのインシリコで変換されたDNA鎖へとマッピングされたかのように、また、あたかもCが全てメチル化されなかったかのように、読み取りを飛行中に変換した(Langmead B, Salzberg S. Fast gapped−read alignment with Bowtie 2. Nature Methods. 2012, 9:357−359)。本来の読み取りを単一のUMIのために統合且つフィルタ処理し、即ち、同じUMIを運ぶ読み取りを廃棄して、1つの読み取りを残した。パッドロックプローブが設計される全てのCpGマーカーのために、メチル化頻度を抽出した。任意のサンプルにおける20未満の読み取りを持つマーカーを分析から除外した。この結果、メチル化レベルが約5%以上の精度で判定される〜600CpGのマーカーがもたらされた。
<DNA/RNA分離及び定量的PCR>
腫瘍及び相当する遠くの部位のサンプルを、外科的腫瘍切除を受ける患者から得て、使用するまでサンプルを−80℃で冷凍保存した。サンプルからのDNAとRNAの分離を、AllPrep DNA/RNA Miniキット(Qiagen,Valencia,CA)を使用して実行し、RNAをオンカラムのDNase消化にさらした。Nanodrop 2000を使用してRNAを定量化し、製造業者の指示に従いiScript cDNA合成キット(Bio−rad,Inc)を使用して、各サンプルの200ngのRNAを相補DNA合成のために使用した。簡潔に、サンプルを、25℃で5分間、42℃で30分間、その後85℃で5分間、インキュベートした。7500 Real Time PCRシステム(Applied Biosystems)の上で遺伝子特異的なプライマー(表9)とPower SYBR Green PCR Master Mixを使用して、40のサイクル増幅によりqPCRを実行した。測定を三通りに行い、内因的なACTBレベルに標準化した。発現における相対的な倍率変化を、ΔΔCT方法(サイクル閾値<30))を使用して計算した。3つの複製に基づいてデータを平均±s.dとして示す。
コホートにおける腫瘍対正常組織の遺伝子発現との、遺伝子におけるCpG部位の差動的メチル化の相関性を更に調査した。乳癌又は肝臓癌の何れかにおいて高メチル化を示した上位の差動的にメチル化したCpGマーカーを、その一致した標準組織のものと比較した際に選択した。一致した正常組織と比較してこれら遺伝子の差動的発現を計算するために、TCGAからのRNA−seqデータを発見コホートとして利用した(図12と図13A−図13C)。RT−qPCRを使用し、癌組織収集におけるこれら遺伝子の発現を検証コホートとして特徴化した(図14)。これら高メチル化遺伝子の各々において発現の減少を観察した。
<腫瘍異種移植片>
制度上及び国際的な動物の規則に従い、全ての動物研究を行った。Sun Yat− Sen University Cancer Center及びWest China HospitalのInstitutional Animal Care and Use Committeeにより、動物プロトコルは承認された。メスの無胸腺BALB/cヌードマウス(4−5週齢、18−20g)を、供給業者(Guangdong Province Laboratory Animal Center, Guangzhou, China)から購入した。腫瘍細胞を100μlの無血清培地において懸濁し、マウスに皮下注射した。最大の腫瘍の大きさが10mm以上として定められる腫瘍量に到達するまで、腫瘍の増殖を3日ごとに診察によりモニタリングした。キャリパーを使用して腫瘍の大きさを測定し、腫瘍容積を以下の方程式に従って計算した:腫瘍容積(mm)=(長さ(mm)×幅(mm))×0.5。典型的なデータを、1つの実験群当たり5匹のマウスから得た。一元の繰返し測定ANOVAにより統計分析を行った。
<実施例5−DNAメチル化をベースとするシグネチャー、並びに、結腸癌及びその転移の診断及び予後>
<承認>
Sun Yat−Sen University Cancer Center及びWest China HospitalのIRBにより、この計画は承認された。インフォームドコンセントを全患者から得た。患者がインフォームドコンセントに署名した後、腫瘍と正常組織を得た。
<不顕性癌>
未知の起原の転移性腺癌の患者をこの研究に登録した。患者は、進行性の体重減少、疲労、及び虚弱を提示した。精密検査は、詳細な履歴、骨盤、直腸、精巣組織を含む完全な検査、CBC、CMP、UA、便潜血を含む研究所試験、組織検査、撮像、内視鏡検査を含んでいた。
<患者と組織の特徴>
目的は結腸癌とその転移を診断することであったので、肝臓と肺が転移の最も頻繁な部位である場合、結腸癌に加えて肝臓癌と肺腺癌のための正確な癌シグネチャーを生成することが必要とされた。それ故、2487の癌患者及び正常な患者を研究した(表10と図21)。同じ患者に由来する隣接した正常組織を対照として使用した。これら正常組織を、癌の証拠の無い組織構造により確認した。患者の特徴を図44A−図44Bに要約する。
<癌マーカーセットの生成>
癌種の特異的なシグネチャーを識別するために、比較を行い、特定の癌種と、肝臓癌及び肺癌に関するその周囲の正常組織との間のメチル化差異を識別する。3つのペアワイズの比較解析を、癌に特異的及び組織に特異的なメチル化シグネチャーの生成のために行った:1)特定の癌種と、その相当する正常組織との間のペアワイズのメチル化差異、2)2つの異なる癌種間の差異、及び3)2つの異なる正常組織間の差異。3の腫瘍群と3の正常組織群を含む、合計6の組織群により、合計15の固有のペアワイズの比較(65/2)を、実行した。Illumina 470,000 CpGメチル化マイクロアレイを使用して、450,000のマーカーを、R遺伝子フィルタパッケージにおいて[カラムt検定]colttests()関数を用いて1つの比較ごとに使用した。マーカーを、t−統計量試験により判定されるように最低のp値、及び各比較の間の平均メチル化画分における最大の差異の両方によりランク付けし、再検証分析のために各群における上位10のマーカーを選択した。15の比較の後、127の固有の非冗長マーカーを全癌パネルとして生成した。
異なる癌種間の差異、同様にペアワイズの様式で3つの正常組織間の差異も、比較した。TCGAから1108人の患者のトレーニングコホートのゲノムワイドDNAメチル化(Illumina 470,000 CpGメチル化マイクロアレイを使用して得られる)プロファイルの分析を実行した。786の固有の非冗長マーカーを全癌パネルとして生成した。これら786の上位ランクのCpG部位の階層的クラスタリングを、939癌の及び169正常なサンプルにおいて教師無し様式で示した(図16)。別の311のマーカーを含む939の癌及び169の正常なサンプルを使用して、その後、異なる癌種(結腸、肝臓、肺癌)を比較した(図17)。
階層的クラスタリングは、各癌種を互いに区別、及び正常組織と区別することができた。TCGAサンプルをトレーニングコホートと試験コホートへと無作為に分け、トレーニングコホートは939の癌サンプル及び169の正常なサンプルから成っていた。トレーニングコホートの階層的クラスタリングを使用して、メチル化パターンに基づき癌種と正常組織を区別した(表11A)。939の癌サンプルのうち926と、169の正常なサンプルのうち166を正確に識別し、98.6%の総合感受性と99%の特異性を得た。各個体の癌において、一貫した高い特異性且つ感受性を観察した(表11A)。アルゴリズムが癌を識別する能力を、393の癌と52の正常なサンプルから成る、別個のTCGA試験コホートにおいて検証した(表11B)。このコホートにおいて同様の効果を達成し、サンプルのうち384を癌として正確に識別し、47を正常として正確に識別した。この検証コホートにおける全体的な正確な割合は96.9%であった。その後、このアルゴリズムを、323の癌と283の正常なサンプルから成る、別の試験コホートにおいて試験した(表11C)。再度、全体的な正確な診断割合は95.9%であった。次に生成する配列決定プラットフォームを用いてサンプルの第3のコホートを試験し、それにより、プラットフォームのバイアス又は組織的誤差の可能性を減少させた。結腸直腸癌の肝転移の33の事例及び結腸直腸癌の肺転移の34の事例について、サンプルの93.9%と94.1%をそれぞれ正確に識別した。4つの誤診されたサンプルを、侵された臓器の正常組織として予測し、これは、誤診につながる組織生検の汚染可能性を示唆している。
次に、癌、及び転移における原因の組織の存在を判定するためにメチル化シグネチャーを使用する可能性を調査した。中国人患者のコホートからの様々な正常及び癌病変のサンプルを集めた(表10)。このシグネチャーは、肝臓、肺、及びリンパ節の転移性病巣における癌の原因を再現性よく識別することができる。更に、未知の原因の癌のパネルを試験して、全てを原発性の結腸腺癌から予測することができることが分かった(図18)。
<各比較における上位10のマーカーに関する加重値の計算>
主成分分析を、統計環境におけるprcomp()関数を使用して、各比較群における上位10のマーカーに適用し、各群の第1の主成分における加重値を抽出し、各群において10の対応するマーカーを持つ加重値と一致させた。全体でマーカーを持つ加重値の45の群が存在する。これらのマーカーを使用して、ニューラルネットワーク、ロジスティック回帰、最近傍(NN)及びサポートベクターマシン(SVM)を含む様々なアルゴリズムによりサンプルを分類し、その全ては一貫した結果を生成した。SVMを使用する分析は、最も確固としていることが分かり、それ故、全ての後の分析に使用された。
メチル化のパターンが特定の腫瘍の根本的な生物学における差異を反映し得るので、メチル化シグネチャーが結腸直腸、肺、及び肝臓の癌患者のコホートにおける全生存を予測する能力を、調査した。各癌について、5年で生存又は死亡する患者を比較し、主成分分析(PCA)を用いて、5年生存率を予測するメチル化シグネチャーを導き出した。結腸癌コホート及び各亜群に関する著しく異なる全生存を、段階に基づいて予測した(図19A−図19E)。メチル化シグネチャーは、全ての患者に関して、優れた予後の群において81.2%の5年のOSを、これに対し予後不良群においては42%を予測した。段階I−IIの結腸癌患者の亜群の分析において(図19B)、5年の時点で100%のOSを持つ患者、これに対し51.3%しかない患者の群を識別した。これらの結果は、これら腫瘍のメチル化プロファイリングが、予後の予測、及び処置選択の潜在的な誘導において著しい役割を果たし得ることを示唆している。体細胞突然変異の分布及び相対度数を図45に示す。
<データソース>
DNAメチル化データを、The Cancer Genome Atlas(TCGA)、Infinium 450Kメチル化アレイを使用して生成された485,000の部位の分析、及び以下のGSEデータセットからの追加データを含む、様々なソースから得た:GSE46306、GSE50192、GSE58298、及びGSE41826。腫瘍及びその対応する正常組織に関するメチル化プロファイルを分析した。メチル化データファイルを、走査された各ビーズの比率値を備えたIDATフォーマットで得た。Bioconductorのminfiパッケージを使用して、これらデータファイルを、ベータ値と称されるスコアに変換した。全20のデータセットにわたり存在していない任意のマーカーに関するベータ値を排除した。
<変数の生成>
データにおけるサンプルの各々に関する45の変数を生成した。加重値/マーカーの組み合わせを使用して、各変数Vを、以下の方程式を用いて計算した:
ここで、Wは加重値であり、Mは、対応するマーカーの0から1までのメチル化ベータ値である。寸法が(2)190の変数ごとの(1)サンプルの数である場合に、マトリックスを生成した。
<サンプルの分類>
上述のマトリックスを使用してサンプルを分類した。ロジスティック回帰、最近傍(NN)、及びサポートベクターマシン(SVM)を含む、本明細書で使用される様々な分類アルゴリズムがある。その全てが、一貫した結果を生成した。しかし、SVMを使用する分析はかなり優れており、より堅固なものであり、それ故、全ての後の分析に使用された。
Rに関するKernel−Based Machine Learning Lab(kernlab)を使用し、サポートベクターマシンを生成した。最良の結果は「RBF」カーネルを伴う。Crammer、Singerのアルゴリズムは、Weston、Watsonのアルゴリズムよりもわずかに結果が優れていた。分析において、4つの起こり得るタイプの分類誤差を確認した。
1.不正確な組織;例えば結腸組織が肺組織として識別される。
2.偽陰性;
3.偽陽性;
4.正確な組織及び予後、不正確な癌種。
結果を検証する3つの方法を使用した:
1.サンプルを5等分に分けた。4つの部分をトレーニング用に使用し、5番目の部分を結果の試験のために使用した。
2.1つを除いて全てのサンプルがトレーニングに使用されるleave one outシナリオを利用して、除外された群を試験した。それらを全て試験するまで、各サンプルのためにこれを繰り返した。
3.2段階の複製研究:プロセスの始めにサンプルを2つのセットに分けた。トレーニングセットにより、最も高いt検定スコアとのそれぞれの比較において10のマーカーを選択した。その後、これらマーカーを使用して主成分を生成し、結果として生じる変数を使用してSVMを作成した。次に、得られたマーカーを試験セットに適用し、主成分とSVMの結果を生成した。
これらの方法の各々により、予測精度は95%より上であった。組織誤差の数は1%未満である。特異性は約95%であり、感受性は試験データセットにより約99%であった。
<腫瘍DNA抽出>
約0.5mgの組織から始めて、ゲノムDNAを、製造業者のプロトコルに従いQIAamp DNA Mini Kit(Qiagen)を使用して抽出した。腫瘍及び相当する正常且つ転移した組織サンプルの両方を使用し、平均で5μgの総DNAを得た。DNAを−20℃で保存し、調製の1週間以内に分析した。
<FFPEサンプルからのDNA抽出>
様々な修飾でQIAamp DNA FFPE Tissue Kitを使用して、FFPEサンプルからのゲノムDNAを抽出した。DNAを−20℃で保存し、調製の1週間以内に分析した。
<ゲノムDNAの重亜硫酸塩変換>
製造業者のプロトコルに従いEZ DNA Methylation−Lightning(商標)キット(Zymo Research)を使用し、健康な組織、腫瘍組織、及び転移組織からの1μgのゲノムDNAをビス−DNAに変換した。Tape Station分析(Agilent)に基づき、結果として生じるビス−DNAは、〜200−3000bpの粒度分布を有しており、ピークは約〜500−1000bpであった。ビス−DNAの深い配列決定、及び、CH(非CG)ジヌクレオチドのT変換に対するCの比率の分析によって確認されるように、重亜硫酸塩変換の効率は、>99.8%であった。
<分子反転(パッドロック)プローブにより捕捉されるビス−DNAの深い配列決定によるCpGメチル化の定量化>
癌組織と正常組織との比較の何れかにおいてメチル化レベルが著しく異なったCpGマーカーを使用して、配列決定のためのパッドロックプローブを設計した。パッドロック捕捉とビス−DNAの配列決定は、修飾によりG. Church and colleagues (Porreca GJ, Nat Methods. 2007 Nov; 4 (11):931−6.)及びK. Zhang and colleagues (Diep, D Nat Methods. 2012 Feb 5;9(3):270−2, Deng, J. et al. Nat. Biotechnol. 27, 353−360 (2009))によって開発された技術に基づく。
<プローブの設計と合成>
パッドロックプローブを、70bpの平均捕捉領域長さによりppDesignerソフトウェア(Diep, D, Nat Methods. 2012 Feb 5;9(3):270−272)を使用して設計した。CpGマーカーは、捕捉した領域の中心部内に位置していた。外部CpGマーカーの未知のメチル化状況により導入された意図しないバイアスを妨げるために、捕捉アームは、CGジヌクレオチドを欠いた領域内に排他的に位置していた。増幅プライマーのための結合配列を含んでいたリンカー配列により、捕捉アームを接続した。Csを繰り返す可変的な伸展を、長さが平均91bpであるプローブを生成するためにプライマー部位の間に挿入した。プローブは、6−bpの固有の分子識別子(UMI)配列を組み込み、個々の分子捕捉事象の識別と、DNAメチル化レベルの正確なスコア付けを可能にした。
標準の商業上の合成方法を使用して、プローブを別個のオリゴヌクレオチドとして合成した。捕捉実験のために、プローブを混合し、製造業者の推奨に従いT4 PNK(NEB)によりインビトロでリン酸化して、P−30 Micro Bio−Spinカラム(Bio−rad)を使用して精製した。
<ビス−DNAの捕捉>
20ngの重亜硫酸塩に変換されたDNAを、1X Ampligase緩衝液(Epicentre)を含む20μlの反応物において、定められたモル比のパッドロックプローブ(実験的に定められるように、1:20,000)と混合した。その後、蒸発を妨げるために、反応物を50μlの鉱油(Sigma)で覆いかぶせた。DNAを95℃で30秒間変性させ、その後、1秒につき0.02℃の割合で55℃に冷却し、プローブがDNAに対してアニールすることを可能にした。ハイブリダイゼーションを、55℃で15時間にわたり放置することで完了させた。捕捉領域を重合するために、以下の5μlの混合物を各反応物に加えた:2UのPfuTurboCxポリメラーゼ(95℃で3分間予め活性化したC(Agilent))、0.5UのAmpligase(Epicentre)、及び1X Ampligase緩衝液中の250pmolの各dNTP。55℃で5時間のインキュベーションの後、反応物を94℃で2分間変性させて、氷の上で即座に冷却した。5μlのエキソヌクレアーゼ混合物(20UのExoI及び100UのExoIII、共にEpicentre由来)を加え、一本鎖DNA分解を37℃で2時間行い、その後、94℃で2分間酵素不活性化を行った。
部位特異的捕捉の環状の生成物を、別個のサンプルへのバーコーディングを付随するPCRにより増幅した。パッドロックプローブ内のリンカーDNAに特的なプライマーを使用して増幅を行い。そのうちの1つは、全てのプローブと、その他固有の6つのbpバーコードを含むものの上にある共通の増幅プライマー部位であった。両方のプライマーは、Illuminaの次世代の配列決定アダプター配列を含んでいた。PCRを以下のように行った:次のサイクルを使用して、1X Phusion Flash Master Mix、3μlの捕捉されたDNA、及び200nMの最終[c]のプライマー:10s@98℃、8Xの(1@98℃、5s@58℃、10s@72℃)、25Xの(1@98℃、15s@72℃)、60s@72℃。5μlの各PCR反応物を混合し、結果として生じるライブラリは、有効な捕捉(〜230bp)を含み、且つAgencourt AMPure XPビーズ(Beckman Coulter)を使用して「空の」捕捉(〜150bp)を除外するように選択された大きさであった。Illuminaフローセルアダプタープライマー(P及びP7)を使用してPCRによりライブラリの純度を確認し、Qubit dsDNA HSアッセイ(Thermo Fisher)を使用して濃度を判定した。MiSeqとHiSeq2500システム(Illumina)を使用してライブラリを配列決定した。
<捕捉範囲の均一性の最適化>
本来のパイロット捕捉実験の深い配列決定は、最も効果的なプローブと非効果的なプローブにより捕捉された読み取りの数の間の有意差を示した(>0.2の平均の範囲を持つ捕捉領域の60−65%)。これを改善するために、相対的な効率を配列決定データから計算し、プローブを調整されたモル比で混合した。これにより捕捉均一性を、>0.2の平均範囲で領域の85%に増大させた。
<配列決定データの分析>
幾つかの修飾と共にソフトウェアツールbisReadMapper(Diep, D, Nat Methods. 2012 Feb 5;9(3):270−272)を使用して、配列決定の読み取りをマッピングした。初めに、各配列決定の読み取りからUMIを抽出し、添付して、D.D.により豊富に提供されるカスタムスクリプトを用いてFASTQファイル内のヘッダーを読み取った。Bowtie2を使用して、あたかもCが全てメチル化されず、且つヒトゲノムのインシリコで変換されたDNA鎖へとマッピングされたかのように、また、あたかもCが全てメチル化されなかったかのように、読み取りを飛行中に変換した(Langmead B, Salzberg S. Fast gapped−read alignment with Bowtie 2. Nature Methods. 2012, 9:357−359)。本来の読み取りを単一のUMIのために統合且つフィルタ処理し、即ち、同じUMIを運ぶ読み取りを廃棄して、二重の読み取りを除外した。パッドロックプローブが設計される全てのCpGマーカーのために、メチル化頻度を抽出した。任意のサンプルにおける20未満の読み取りを持つマーカーを分析から除外した。この結果、メチル化レベルが約5%以上の精度で判定される〜600CpGのマーカーがもたらされた。
<DNA/RNA分離及び定量的PCR>
腫瘍及び相当する遠くの部位のサンプルを、外科的腫瘍切除を受ける患者から得て、使用するまでサンプルを−80℃で冷凍保存した。サンプルからのDNAとRNAの分離を、製造業者の推奨に従いAllPrep DNA/RNA Miniキット(Qiagen,Valencia,CA)を使用して実行し、RNAをオンカラムのDNase消化にさらした。Nanodrop 2000(Thermo Scientific)を使用してRNAを定量化した。製造業者の指示に従いiScript cDNA合成キット(Bio−rad,Inc)を使用して、各サンプルの200ngのRNAをcDNA合成のために使用した。7500 Real Time PCRシステム(Applied Biosystems)の上で遺伝子特異的なプライマー(表9及び12)とPower SYBR Green PCR Master Mixを使用して、標準40サイクルの増幅プロトコルによりqPCRを実行した。実験を三通りに行い、内因的なACTBレベルに標準化した。発現における相対的な倍率変化を、ΔΔCT方法(サイクル閾値<30))を使用して計算した。3つの複製に基づいてデータを平均±s.dとして示す。
DNAメチル化が遺伝子発現の不可欠な後成的レギュレータであるとすれば、遺伝子発現との、腫瘍対正常組織における部位遺伝子の差動的なメチル化の相関性を、我々のコホートにおいて調査した。具体的に、上述のアルゴリズムにおける悪性腫瘍の存在を予測したメチル化部位が対象であった。癌種における高メチル化を示した上位のマーカーを、その一致した正常組織の相当物におけるものと比較した場合に選択し、結腸癌におけるそれらの対応遺伝子を識別した。検証コホートとしてこれら遺伝子及び癌組織の収集の差動的発現を計算するために、TCGAからのRNA−seqデータを発見コホートとして利用した(図20A−図20F及び図22)。選択された遺伝子の大多数は、正常なものに比べて著しいCpGの高メチル化を提示し、減少された発現をこれら遺伝子の各々において観察した。ウィルコクソンの符号順位検定を使用して1.21x10−21のp値を判定した。重要なことに、選択された遺伝子は、発癌性において重要であると知られており、悪性腫瘍の予測因子としてこれらマーカーの生物学的な検証を提供する。驚くほどではないが、これら選択された遺伝子は、全て抑止され、既知の腫瘍抑制因子、並びに幾つかの新しく発見された遺伝子の両方を含む。PCDH17は、癌生物学への機能的関連性を試験するために選択される。PCDH17(cg02994463)は、反対に遺伝子発現が減少した結腸癌において高メチル化される。ヌードマウスにおける細胞培養及び腫瘍形成アッセイにおけるコロニー形成アッセイにより、PCDH17の発現増加は、細胞培養及びインビボにおいて癌増殖を抑止すると示された(図23A−図23E)。
<細胞株>
ヒト結腸直腸癌株DLD−1をATCCから得た。この細胞株をトランスフェクトして、GFP、又は所望のGFP融合構成物、及び純度で分類されるFACSを安定して発現させた。10%のFBS、1%のペニシリン−ストレプトマイシン、及び1%の非必須アミノ酸で補われたDMEMにおいて、細胞を維持した。
<クローン形成法の方法>
上述の培養条件下で増殖した細胞をトリプシン処理し、自動細胞計数器を使用して計数した。500の細胞を、6−ウェルプレートの各ウェルに蒔き、コロニーの形成を可能にした。7−10日後、細胞を10%のv/v酢酸/メタノールに固定し、0.1%のクリスタルバイオレットで染色した。三重のウェルから計数するマニュアルにより、コロニーの数を判定した。
<軟寒天アッセイ>
1%のノーブル寒天(Gifco)を、42℃で20%のFBS、2%のPen−Strep、及び2%の非必須アミノ酸により、各細胞株についてそれぞれ2Xの培地において0.5%に希釈した。0.5%の寒天培養培地の混合物1.5mLを、6−ウェル皿の各ウェルに播種し、45分間室温で冷却した。上述の培養条件下で増殖された細胞をトリプシン処理し、自動細胞計数器を使用して計数し、2X培地において4000の細胞/mLに希釈した。0.6%のノーブル寒天を、0.3%の終末濃度になるまで、42℃で等量の希釈された細胞と混合した。1.5mLを、下の寒天層の上にある各ウェルに播種し、45分間室温で冷却した。プレートを37℃で増殖させ、100μLの培地を週に2回加えた。3週間後、コロニーを10%のv/v酢酸/メタノールで固定し、0.005%のクリスタルバイオレットで染色した。各細胞株の構築物について三重のウェルから計数するマニュアルにより、コロニーの数を判定した。
<腫瘍異種移植片>
制度上及び国際的な動物の規則に従い、全ての動物研究を行った。Sun Yat−Sen University及びWest China HospitalのInstitutional Animal Care and Use Committeeにより、動物プロトコルは承認された。メスの無胸腺BALB/cヌードマウス(4−5週齢、18−20g)を、供給業者(Guangdong Province Laboratory Animal Center, Guangzhou, China)から購入した。腫瘍細胞を100μlの無血清培地において懸濁し、マウスに皮下注射した。腫瘍の増殖を3日ごとに診察によりモニタリングした。キャリパーを使用して腫瘍の大きさを測定し、腫瘍容積を以下の方程式に従って計算した:腫瘍容積(mm)=(長さ(mm)×幅(mm))×0.5。3−4週後に、全ての動物を屠殺し、異種移植片を採取した。典型的なデータを、1つの実験群当たり5匹のマウスから得た。一元の繰返し測定ANOVAにより統計分析を行った。
<実施例6−共通のタイプの白血病の診断及び予後におけるDNAメチル化マーカー>
<承認>
The Cancer Genome Atlas(TCGA)のデータを、TCGAのウェブサイトからダウンロードした。このプロジェクトは、Guangzhou Women and Children Center, west China hospitalのIRBにより承認された。インフォームドコンセントを全患者から得た。患者がインフォームドコンセントに署名した後、腫瘍と正常組織を得た。
<患者の特徴>
臨床的特徴と分子プロファイリングは、232のAML 161 ALL及び647の正常な血液サンプルを含む研究コホートに関するメチル化データを含む。研究コホートにおける患者の臨床的特徴を表13に列挙する。
<データソース>
初期のトレーニングセット及び第1の試験セットからのDNAメチル化データを、The Cancer Genome Atlas(TCGA)から得た。Infinium 450Kのメチル化アレイを使用して、470,000の部位のメチル化状況を生成した。中国人癌患者の第2のコホートのDNAメチル化データを、重亜硫酸塩配列決定方法を使用して得た。
<各比較における上位10のマーカーに関する加重値の計算>
主成分分析を、統計環境における関数:prcomp()を使用して、各比較群における上位10のマーカーに適用し、各群の第1の主成分における加重値を抽出し、各群において10の対応するマーカーと一致させた。マーカーを持つ加重値の45の群が存在する。これらのマーカーを使用して、ニューラルネットワーク、ロジスティック回帰、最近傍(NN)及びサポートベクターマシン(SVM)を含む様々なアルゴリズムによりサンプルを分類し、その全ては一貫した結果を生成した。SVMを使用する分析は、最も確固としていることが分かり、それ故、全ての後の分析に使用された。
<サンプルの分類>
上述の機械学習方法を使用して、ALL、AML、及び正常な血液サンプルを分類した。ロジスティック回帰、最近傍(NN)、及びサポートベクタマシン(SVM)を含む、本明細書で使用される様々な分類アルゴリズムがある。その全てが、一貫した結果を生成した。全ての後の分析に、SVMを用いる分析を更に使用した。
Rに関するKernel−Based Machine Learning Lab(kernlab)を使用し、サポートベクターマシンを生成した。最良の結果は「RBF」カーネルを伴う。Crammer、Singerのアルゴリズムは、Weston、Watsonのアルゴリズムよりもわずかに結果が優れていた。分析において、4つの起こり得るタイプの分類誤差を確認した。
1.不正確な組織;
2.偽陰性;例えば、ALLは正常な血液として識別される。
3.偽陽性;例えば、正常な血液はALL又はAMLとして識別される。
4.正確な組織、不正確な白血病のタイプ;例えば、ALLはAMLとして識別される。
<腫瘍DNA抽出>
新しく凍結した健全な又は癌の組織の片からのゲノムDNA抽出を、製造業者の推奨に従いQIAamp DNA Mini Kit(Qiagen)により行った。およそ0.5mgの組織を使用し、平均5μgのゲノムDNAを得た。DNAを−20℃で保存し、調製の1週間以内に分析した。
<ゲノムDNAの重亜硫酸塩変換>
製造業者のプロトコルに従いEZ DNA Methylation−Lightning(商標)キット(Zymo Research)を使用し、1μgのゲノムDNAをビス−DNAに変換した。結果として生じるビス−DNAは、〜200−3000bpの粒度分布を有しており、ピークは約〜500−1000bpであった。ビス−DNAの深い配列決定、及び、CH(非CG)ジヌクレオチドのT変換に対するCの比率の分析によって確認されるように、重亜硫酸塩変換の効率は、>99.8%であった。
<分子反転(パッドロック)プローブにより捕捉されるビス−DNAの深い配列決定による第2の検証コホートのDNAメチル化レベルの判定>
癌組織と正常組織との比較の何れかにおいてメチル化レベルが異なったCpGマーカーを使用して、配列決定のためのパッドロックプローブを設計した。パッドロック捕捉とビス−DNAの配列決定は、修飾によりG. Church and colleagues (Porreca GJ, Nat Methods. 2007 Nov; 4 (11):931−6.)及びK. Zhang and colleagues (Diep, D Nat Methods. 2012 Feb 5;9(3):270−2, Deng, J. et al. Nat. Biotechnol. 27, 353−360 (2009))によって開発された技術に基づく。
<プローブの設計と合成>
パッドロックプローブを、ppDesignerソフトウェアを使用して設計した。捕捉した領域の平均長は70bpであり、CpGマーカーは捕捉した領域の中心部に位置する。CpGマーカーの未知のメチル化状況により導入されたバイアスを妨げるために、CGジヌクレオチドを欠いた配列内に捕捉アームを排他的に位置付けた。アーム間のリンカー配列は、等しい長さのプローブを生成するために、Csの可変的な伸展により分離された増幅プライマーのための結合配列を含んでいた。プローブの平均長は91bpであった。プローブは、6−bpの固有の分子識別子(UMI)配列を組み込み、個々の分子捕捉事象の識別と、DNAメチル化レベルの正確なスコア付けを可能にした。
標準の商業上の合成方法を使用して、プローブを別個のオリゴヌクレオチドとして合成した。捕捉実験のために、プローブを混合し、製造業者の推奨に従いT4 PNK(NEB)によりインビトロでリン酸化して、P−30 Micro Bio−Spinカラム(Bio−Rad)を使用して精製した。
<ビス−DNAの捕捉>
20ngの重亜硫酸塩に変換されたDNAを、1X Ampligase緩衝液(Epicentre)を含む20μlの反応物において、定められたモル比のパッドロックプローブと混合した。DNAに対するプローブの最適なモル比は、20,000:1であると実験的に判定した。蒸発を妨げるために、反応物を50μlの鉱油で覆いかぶせた。DNAに対してプローブをアニールするために、95℃で30秒の変性の後、毎秒0.02℃の割合で55℃にゆっくりと冷却した。ハイブリダイゼーションを、55℃で15時間にわたり放置することで完了させた。アニールされたアーム間の間隙を満たすために、以下の5μlの混合物を各反応物に加えた:2UのPfuTurboCxポリメラーゼ(95℃で3分間予め活性化したC(Agilent))、0.5UのAmpligase(Epicentre)、及び1X Ampligase緩衝液中の250pmolの各dNTP。55℃で5時間のインキュベーションの後、反応物を94℃で2分間変性させて、氷の上で即座に冷却した。5μlのエキソヌクレアーゼ混合物(20UのExoI及び100UのExoIII、共にEpicentre由来)を加え、一本鎖DNA分解を37℃で2時間行い、その後、94℃で2分間酵素不活性化を行った。
部位特異的捕捉の環状の生成物を、別個のサンプルへのバーコーディングを付随するPCRにより増幅した。パッドロックプローブ内のリンカーDNAに特異的なプライマーを用いて増幅を行い、その1つは特異的な6bpのバーコードを含んでいた。両方のプライマーは、Illuminaの次世代の配列決定アダプター配列を含んでいた。PCRを以下のように行った:次のサイクルを使用して、1X Phusion Flash Master Mix、3μlの捕捉されたDNA、及び200nMの最終[c]のプライマー:10s@98℃、8Xの(1@98℃、5s@58℃、10s@72℃)、25Xの(1@98℃、15s@72℃)、60s@72℃。PCR反応物を混合し、結果として生じるライブラリは、有効な捕捉(〜230bp)を含み、且つAgencourt AMPure XPビーズ(Beckman Coulter)を使用して「空の」捕捉(〜150bp)を除外するように選択された大きさであった。Illuminaフローセルアダプタープライマー(P及びP7)を使用してPCRによりライブラリの純度を確認し、Qubit dsDNA HSアッセイ(Thermo Fisher)を使用して濃度を判定した。MiSeqとHiSeq2500システム(Illumina)を使用してライブラリを配列決定した。
<捕捉範囲の均一性の最適化>
本来のパイロット捕捉実験の深い配列決定は、最も効果的なプローブと非効果的なプローブにより捕捉された読み取りの数の間の有意差を示した(>0.2の平均の範囲を持つ捕捉領域の60−65%)。これを改善するために、相対的な効率を配列決定データから計算し、プローブを調整されたモル比で混合した。これにより捕捉均一性を、>0.2の平均範囲で領域の85%に増大させた。
<配列決定データの分析>
幾つかの修飾によりソフトウェアツールを使用して、配列決定の読み取りのマッピングを行った。初めに、各配列決定の読み取りからUMIを抽出し、添付して、D.D.により豊富に提供されるカスタムスクリプトを用いてFASTQファイル内のヘッダーを読み取った。Bowtie2を使用して、あたかもCが全てメチル化されておらず、ヒトゲノムのインシリコで変換されたDNA鎖にマッピングされたかのように、また、あたかもCが全てメチル化されないかのように、読み取りを飛行中に変換した。本来の読み取りを単一のUMIのために統合且つフィルタ処理し、即ち、同じUMIを運ぶ読み取りを廃棄して、1つの読み取りを残した。パッドロックプローブが設計される全てのCpGマーカーのために、メチル化頻度を抽出した。任意のサンプルにおける20未満の読み取りを持つマーカーを分析から除外した。この結果、メチル化レベルが5%以上の精度で判定される〜600CpGのマーカーがもたらされた。
<ゲノムワイドメチル化のプロファイリングは、白血病における特異的メチル化のシグネチャーを識別した>
白血病のタイプに特異的なシグネチャーを識別するために、ALL又はAMLと、正常な血液サンプルとの間の全ゲノムのメチル化差異を、ペアワイズの様式で比較した。最も大きなメチル化差異を持つCpGマーカーをランク付けした。これら50の上位ランクのCpG部位を、AML対正常な血液サンプルにおいて教師無し様式で示した(図24)。AMLを正常な血液サンプルから分化させた(図24、表14A)。研究成果を、中国人AMLコホートにおいて更に繰り返した(図25と表14C)。同様に、ALLを正常な血液サンプルから分化させた(図26、表14B)。総合すると、これらのデータは、CpG部位の差動的メチル化が、特異性及び感受性により特定の白血病のタイプを正常な血液と区別することができたことを実証した(表14)。総合感受性は約98%であり、特異性は約97%であった。全体として、これらの結果は、白血病の特定のタイプの存在を識別する際に、これらメチル化パターンの堅固な性質を実証する。
<メチル化プロファイルは異なる白血病間を区別することができる>
この方法は、白血病の特定のタイプと正常な血液サンプルとを区別する能力を有しており、それ故、ALL及びAMLに関して骨髄から生じる白血病癌の異なるタイプ(ALL及びAML)を区別するアルゴリズムの能力を調査した(表14C)。各腫瘍の亜型を、90%より上の感受性と特異性により区別した(図27)。共に、これらの結果は、組織学的な亜型の正確な癌診断のためにメチル化パターンを使用する効果を実証する。
<メチル化プロファイルは予後と生存率を予測する>
主成分分析(PCA)を使用して各白血病の亜型(AMLとALL)を分析し、生存(具体的に診断から5年での生存vs死亡)を予測したメチル化シグネチャーを識別した。
各白血病のタイプについて、サンプルを、結果として生じるメチル化シグネチャーに基づき2つの群に分け、それらの生存を、カプラン=マイヤー曲線を使用して示した(図28A−図28B)。これらメチル化プロファイルは、ALL及びAMLにおける生存の大きな有意差を予測することができた。
<実施例7−デジタル液滴PCRによる組織及び無細胞DNAサンプルの分析>
<無細胞DNAサンプルのプロセス>
血漿サンプルを4℃で5分間、1500gで遠心分離して、細胞残屑を除去した。遠心分離後、製造業者のプロトコルに従いQIAamp Blood DNA Mini Kit(Qiagent)を使用して、リンパ球の無いDNA(cfDNA)を上清から抽出した。
製造業者のプロトコルに従いEZ DNA Methylation−Lightning(商標)キット(Zymo Research)を使用し、ゲノムDNAをビス−DNAに変換した。ビス−DNAを更に、Qubit(商標)ssDNAアッセイキットを使用して定量化した。
<腫瘍組織からのゲノムDNAサンプルのプロセス>
新しく凍結した健全な又は癌の組織の片からのゲノムDNA抽出を、製造業者の推奨に従いQIAamp DNA Mini Kit(Qiagen)により行った。およそ0.5mgの組織を使用し、平均5μgのゲノムDNAを得た。DNAを−20℃で保存し、調製の1週間以内に分析した。
製造業者のプロトコルに従いEZ DNA Methylation−Lightning(商標)キット(Zymo Research)を使用し、1μgのゲノムDNAをビス−DNAに変換した。結果として生じるビス−DNAは、〜200−3000bpの粒度分布を有しており、ピークは約〜500−1000bpであった。
<液滴デジタルPCR(ddPCR)>
製造業者の推奨(Bio−Rad)に従いQX200(商標)液滴デジタルPCRシステムを使用して、液滴デジタルPCR(ddPCR)を実行した。ddPCRを、Bio−Radの推奨された2工程の熱循環プロトコルにより実行した。プライマー及びプローブの配列を表17−18に示す。約1ngから約20ngのビス−DNAサンプルを、約0.4−0.8μMのフォワード及びリバースプライマー、及び約0.2μMの各プローブとの反応それぞれのために使用した。QuantaSoft(Bio−Rad)を使用してデータ分析を行った。
<メチル化プロファイリングは癌種と癌の亜型を区別する>
結腸癌組織と正常な結腸組織サンプル(Farsite)の両方で4つの典型的なCpG部位(cg06747543、cg15536663、cg22129276、およびcg07418387)のメチル化比率を、図29に示す。各バーは平均24のサンプルを表わす。CpG部位cg14519356と共に、これらの4つのCpG部位を、肺に転移した結腸癌組織サンプルにおいて更に分析した。図30は、転移性結腸癌組織サンプル、原発性結腸癌標準サンプル、及び正常リンパ球ゲノムDNA標準サンプルにおける、これらの5つのCpG部位のメチル化比率を示す。cg15536663とcg14519356のメチル化比率は、それぞれの原発性結腸癌標準サンプルに対する転移性結腸癌サンプル間の比較において同様である。しかし、cg06747543、cg22129276、及びcg07418387のメチル化比率は、それぞれの原発性結腸癌標準サンプルに対する転移性結腸癌サンプル間の比較において異なる。同様に、これら5つのCpG部位のメチル化比率はまた、それぞれの正常リンパ球ゲノムDNA標準サンプルに対する転移性結腸癌サンプル間の比較においても異なる。5つのCpG部位のメチル化比率は、転移性結腸癌、原発性結腸癌、及び正常リンパ球のサンプルの間の異なるメチル化パターンを示す。
結腸癌由来の無細胞DNA(cfDNA)サンプルからのメチル化シグネチャーを図31A−図31Cに示す。図31Aは、ゲノムcfDNAのメチル化領域を示し、図31Bは、ゲノムcfDNAの非メチル化領域を示す。図31Cは、3人の患者(2043089、2042981、及び2004651)、正常なcfDNA標準サンプル、原発性結腸組織標準サンプル、及び正常な血液標準サンプルからのCpG部位cg10673833のメチル化比率を示す。患者2043089及び2042981は、原発性結腸癌を有しており、患者2004651は転移性結腸癌を有している。
原発性の肝臓癌、乳癌、及び肺癌に関するメチル化プロファイルを、図32A−図32Cに示す。図32Aは、肝臓癌cfDNAサンプル、正常なcfDNAサンプル、原発性肝癌組織標準サンプル(ゲノムDNA)、及び正常リンパ球標準サンプル(ゲノムDNA)におけるCpG部位cg00401797のメチル化比率を示す。図32Bは、乳癌cfDNAサンプル、正常なcfDNAサンプル、原発性乳癌組織標準サンプル(ゲノムDNA)、及び正常リンパ球標準サンプル(ゲノムDNA)におけるCpG部位cg07519236のメチル化比率を示す。図32Cは、肺癌cfDNAサンプル、正常なcfDNAサンプル、原発性肺癌組織標準サンプル(ゲノムDNA)、及び正常なリンパ球標準サンプル(ゲノムDNA)におけるCpG部位cg02877575のメチル化比率を示す。図33A−図33Bは、原発性の結腸癌と正常なサンプルを区別する、2つの様々なプローブを示す。図33Aは、3人の結腸癌患者のcfDNAサンプル、正常なcfDNAサンプル、原発性の結腸癌組織標準サンプル(ゲノムDNA)、及び正常なリンパ球標準サンプル(ゲノムDNA)からのCpG部位cg10673833とメチル化プロファイルを標的とするプローブCob−2を示す。3人の患者(2043089と2042981)の2人は原発性結腸癌を抱えている。残りの患者(2004651)は転移性結腸癌を抱えている。cg10673833のメチル化比率は、cfDNAの原発性結腸癌サンプルとcfDNA転移性結腸癌サンプルとの比較において異なり、一方でcfDNA転移性結腸癌サンプルと原発性結腸癌組織標準サンプルとのメチル化比率は、同様である。図33Bは、2人の原発性の結腸癌患者(2043089と2042981)のcfDNAサンプル、正常なcfDNAサンプル、原発性結腸癌組織標準サンプル(ゲノムDNA)、及び正常なリンパ球標準サンプル(ゲノムDNA)からのCpG部位cg07974511とメチル化プロファイルを標的とするプローブBrb−2を示す。CpG部位cg07974511では、cfDNA結腸癌サンプルと原発性結腸癌組織標準サンプルとの間のメチル化比率は同様であるが、正常なcfDNAサンプルと正常リンパ球標準サンプル(ゲノムDNA)とのメチル化比率とは異なる。
図34A−図34Dは、乳癌患者からのcfDNAの分析を示す。4つのプローブ(Brb−3、Brb−4、Brb−8、及びBrb−13)を使用した。cfDNAの原発性乳癌のメチル化比率を、正常なcfDNAサンプル、原発性の乳癌組織標準サンプル(ゲノムDNA)、及び正常なリンパ球標準サンプル(ゲノムDNA)と比較した。4つのプローブは全て、cfDNAサンプルにおける乳癌の存在を検出することができた。
図35Aと図35Bは、2つのプローブ、cob_3とbrb_13が、49人の患者の組織サンプル中の転移性結腸癌を検出できることを示す。図35Aは、cob_3プローブを使用して、結腸癌組織標準サンプル、肺癌組織標準サンプル、及び正常な肺組織標準サンプルとの比較における、49人の患者のメチル化プロファイルを示す。49人の患者の約47人の患者のメチル化比率は、正常な肺組織標準サンプルのメチル化比率と比較してかなり高かった。brb_13プローブを使用した図35Bにおいて、49人の患者の約30人の患者が、正常な肺組織標準サンプルのメチル化比率と比較してかなり小さいメチル化比率を有していた。
<実施例8−メチル化プロファイリングは処置を区別する>
血漿サンプルを実施例7に記載されるように処理した。図46は、2つの異なる結腸癌プローブ(Cob−2とCob−9)を使用して、2つの例示的なCpG部位(CpG部位1とCpG部位2)のメチル化プロファイルの変化を例証する。図47は、外科手術後の4人の患者のサンプル(患者2045021、2044629、2044645、及び2045021)における結腸癌プローブCob−2とCob−9に関するメチル化プロファイルの変化を例証する。4人の患者のサンプルのメチル化プロファイルは、正常なcfDNAサンプルのメチル化プロファイルと比較した場合、cob−2プローブを使用して別個のプロファイルを示す。cob−9プローブについて、メチル化プロファイルは、4人の患者サンプルと正常なcfDNAサンプルとの間で類似したままである。
<実施例9−メチル化プロファイリングは癌の段階を区別する>
血漿サンプルを実施例7に記載されるように処理した。図48は、様々な癌の段階のサンプルにおける結腸癌プローブcob−2とcob−9についてのメチル化プロファイルの変化を例証する。
<実施例10−メチル化プロファイリングは、正常なサンプルと腫瘍細胞の無いDNAサンプルとを区別する>
血漿サンプルを実施例7に記載されるように処理した。図49A−図49Jは、19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位(cg02874908、cg08098128、cg10542975、cg11252953、cg11334870、cg13911392、cg23130731、cg23612220、cg25432518、及びcg25922751)のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、及び甲状腺癌を含んでいる。
図50は、乳癌、結腸癌、肝臓癌、肺癌、及び正常な血液サンプルに関する約280のCpG部位(バイオマーカー)のメチル化プロファイルの変化を例証する。
表19は、CpG部位cg25922751に関する癌種の各々に関するP−値を示す。
<実施例11−表>
表15と16は、本明細書に記載される方法、システム、非一時的なコンピュータ可読媒体、又はキットの1つ以上と共に使用されるCpG部位を示す。
表17と18は、本明細書に記載される方法、システム、非一時的なコンピュータ可読媒体、又はキットの1つ以上に有用なCpG部位及びプローブを示す。
表20は、本明細書に記載される方法、システム、非一時的なコンピュータ可読媒体、又はキットの1つ以上に有用なCpG部位(又はCpGマーカー)を示す。
本発明の好ましい実施形態が本明細書中で示され且つ記載されてきたが、このような実施形態はほんの一例として提供されるものであることは、当業者に明らかであろう。多数の変形、変化、及び置換は、本発明から逸脱することなく、当業者によって現在想到される。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用されるかもしれないことを理解されたい。以下の特許請求の範囲は本発明の範囲を定義するものであり、この特許請求の範囲及びその同等物の範囲内の方法及び構造は、それにより包含されることが、意図されている。

Claims (56)

  1. 個体における癌の存在を判定する方法であって、
    該方法は、
    (a)脱アミノされたヌクレオチドを含む処置されたゲノムDNAを生成するために、抽出されたゲノムDNAを脱アミノ化剤で処理する工程であって、抽出されたゲノムDNAが個体からの生体サンプルから得られる、工程、
    (b)処置されたゲノムDNAからの表20から選択された1つ以上のバイオマーカーを含むメチル化プロファイルを生成する工程、および、
    (c)メチル化プロファイルを対照と比較する工程であって、メチル化プロファイルと対照との間の相関が個体における癌の存在を判定する、工程、を含む、方法。
  2. メチル化プロファイルは、表15−18から選択された1つ以上のバイオマーカーをさらに含む、請求項1に記載の方法。
  3. メチル化プロファイルは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択された1つ以上のバイオマーカーをさらに含む、請求項1または2に記載の方法。
  4. 比較する工程は、
    (i)第1の正常なサンプルのメチル化プロファイルと処置されたゲノムDNAのメチル化プロファイルとの間の第1の差;
    (ii)第2の正常なサンプルのメチル化プロファイルと第3の正常なサンプルのメチル化プロファイルとの間の第2の差;および、
    (iii)第1の原発性癌サンプルのメチル化プロファイルと第2の原発性癌サンプルのメチル化プロファイルとの間の第3の差、
    を含むペアワイズのメチル化差異データセットを生成する工程をさらに含む、請求項1に記載の方法。
  5. 比較する工程は、メチル化プロファイルを生成するために機械学習法により対照を用いてペアワイズのメチル化差異データセットを分析する工程をさらに含む、請求項1または4に記載の方法。
  6. 比較する工程は、個体の癌種を判定する工程をさらに含む、請求項1、4、または5のいずれか1つに記載の方法。
  7. 機械学習法は、主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデルの1つ以上から選択されたアルゴリズムを利用する、請求項1−6のいずれか1つに記載の方法。
  8. 生成する工程は、プローブを用いて1つ以上のバイオマーカーの各々を交配させ、および、1つ以上のバイオマーカーの各々のメチル化を定量化するためにDNA配列決定反応を行う工程をさらに含む、請求項1−7のいずれか1つに記載の方法。
  9. 癌種は固形癌タイプまたは血液系悪性癌種である、請求項1−8のいずれか1つに記載の方法。
  10. 癌種は転移癌種、または再発性あるいは難治性癌種である、請求項1−9のいずれか1つに記載の方法。
  11. 癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍 びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸腺癌(READ)などの直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む、請求項1−10のいずれか1つに記載の方法。
  12. 生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む、請求項1−11のいずれか1つに記載の方法。
  13. 癌を抱える個体の治療を選択する方法であって、該方法は、(a)請求項1−12の方法に従って個体の癌種を識別する工程と、(b)工程(a)に基づいて、癌種に適した治療を選択する工程とを含む、方法。
  14. 癌CpGメチル化プロファイルデータベースの生成のためにCpG癌メチル化データを利用するためのコンピューティングプラットフォームであって、
    前記コンピューティングプラットフォームは、
    (a)プロセッサ、メモリモジュール、オペレーティングシステム、および、生体サンプルのセットからCpGメチル化データを生成するためのデータ収集アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムを含む第1のコンピューティングデバイスを含み、
    データ収集アプリケーションが、
    (1)生体サンプルのセットからCpGメチル化データを生成するために配列決定装置を作動させるように構成された配列決定モジュールであって、前記セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、配列決定モジュールと、
    (2)データ受信モジュールとを含み、
    該データ受信モジュールが、
    (i)第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットであって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、第1のペアのCpGメチル化データセット;
    (ii)第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットであって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、第2のペアのCpGメチル化データセット;および、
    (iii)第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットであって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、第3のペアのCpGメチル化データセット、を受け取るように構成され、
    前記コンピューティングプラットフォームは、
    (b)プロセッサ、メモリモジュール、オペレーティングシステム、および癌CpGメチル化プロファイルデータベースを生成するためのデータ分析アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムを含む第2のコンピューティングデバイスを含み、
    データ分析モジュールを含むデータ分析アプリケーションが、
    (1)第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットからペアワイズのメチル化差異データセットを生成するように、および、
    (2)癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析するように、構成され、
    (i)機械学習法は、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、
    (ii)癌CpGメチル化プロファイルデータベースはCpGメチル化プロファイルのセットを含み、CpGメチル化プロファイルはそれぞれ癌種を表す、コンピューティングプラットフォーム。
  15. ペアワイズのメチル化差異データセットを生成することは、
    (a)第1のペアのデータセット内の第1のデータセットと第2のデータセットとの間の差を算出すること、
    (b)第2のペアのデータセット内の第3のデータセットと第4のデータセットとの間の差を算出すること、および
    (c)第3のペアのデータセット内の第5のデータセットと第6のデータセットとの間の差を算出すること、を含む、請求項14に記載のコンピューティングプラットフォーム。
  16. 機械学習法は、主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデルの1つ以上から選択されたアルゴリズムを利用する、請求項14または15に記載のコンピューティングプラットフォーム。
  17. CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される、請求項14−16に記載のコンピューティングプラットフォーム。
  18. 配列決定装置は、CpGメチル化データを生成するために次世代配列決定方法によって抽出されたゲノムDNAを分析するようにさらに構成される、請求項14−17のいずれか1つに記載のコンピューティングプラットフォーム。
  19. 次世代配列決定方法は、デジタルPCR配列決定方法である、請求項18に記載のコンピューティングプラットフォーム。
  20. メチル化プロファイルは、表15−18からなる群から選択された、少なくとも10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む、請求項14−19のいずれか1つに記載の方法。
  21. メチル化プロファイルは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される少なくとも10、20、30、40、50、100、または200以上のバイオマーカーを含む、請求項14−20のいずれか1つに記載のコンピューティングプラットフォーム。
  22. メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む、請求項14−21のいずれか1つに記載のコンピューティングプラットフォーム。
  23. 癌種は固形癌タイプまたは血液系悪性癌種である、請求項14−22のいずれか1つに記載のコンピューティングプラットフォーム。
  24. 癌種は転移癌種、または再発性あるいは難治性癌種である、請求項14−23のいずれか1つに記載のコンピューティングプラットフォーム。
  25. 癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍 びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む、請求項14−24のいずれか1つに記載のコンピューティングプラットフォーム。
  26. 対照データセットはメチル化プロファイルのセットを含み、各々の前記メチル化プロファイルは、知られている癌種から得られた生体サンプルから生成される、請求項14−25のいずれか1つに記載のコンピューティングプラットフォーム。
  27. 生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む、請求項14−26のいずれか1つに記載のコンピューティングプラットフォーム。
  28. 癌CpGメチル化プロファイルデータベースを生成するためのコンピューターにより実施される方法であって、
    前記方法は、
    a.配列決定方法によって生体サンプルのセットからCpGメチル化データを生成する工程であって、セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
    b.第1のプロセッサを用いて、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットを取得する工程であって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、工程と、
    c.第1のコンピューティングデバイスを用いて、第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットを取得する工程であって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
    d.第1のコンピューティングデバイスを用いて、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットを取得する工程であって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、工程と、
    e.第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットから、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成する工程と、
    f.癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する工程を含み、
    (1)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、および、
    (2)癌CpGメチル化プロファイルデータベースは、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す、コンピューターにより実施される方法。
  29. 工程e)はさらに、
    (a)第1のペアのデータセット内の第1のデータセットと第2のデータセットとの間の差を算出すること、
    (b)第2のペアのデータセット内の第3のデータセットと第4のデータセットとの間の差を算出すること、および
    (c)第3のペアのデータセット内の第5のデータセットと第6のデータセットとの間の差を算出すること、を含む、請求項28に記載のコンピューターにより実施される方法。
  30. 機械学習法は、主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデルの1つ以上から選択されたアルゴリズムを利用する、請求項28または29に記載のコンピューターにより実施される方法。
  31. CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される、請求項28−30のいずれか1つに記載のコンピューターにより実施される方法。
  32. メチル化プロファイルは、表15−18からなる群から選択された、少なくとも10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む、請求項28−31のいずれか1つに記載のコンピューターにより実施される方法。
  33. メチル化プロファイルは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される少なくとも10、20、30、40、50、100、または200以上のバイオマーカーを含む、請求項28−32のいずれか1つに記載のコンピューターにより実施される方法。
  34. メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む、請求項28−33のいずれか1つに記載のコンピューターにより実施される方法。
  35. 癌種は固形癌タイプまたは血液系悪性癌種である、請求項28−34のいずれか1つに記載のコンピューターにより実施される方法。
  36. 癌種は再発性または難治性の癌種である、請求項28−35のいずれか1つに記載のコンピューターにより実施される方法。
  37. 癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍 びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む、請求項28−36のいずれか1つに記載のコンピューターにより実施される方法。
  38. 生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む、請求項28−37のいずれか1つに記載のコンピューターにより実施される方法。
  39. 複数のプローブを含むプローブパネルであって、各プローブは式Iのプローブであり、
    式中、
    Aは第1の標的結合領域であり、
    Bは第2の標的結合領域であり、および、
    Lはリンカー領域であり、
    Aは、SEQ ID NOs:1−1775から選択された配列の5’末端から位置1で始まる少なくとも30の連続的なヌクレオチドに対して少なくとも70%、80%、90%、95%、または99%の配列同一性を有し、
    Bは、SEQ ID NOs:1−1775から選択された同じ配列の3’末端から位置1’で始まる少なくとも12の連続的なヌクレオチドに対して少なくとも70%、80%、90%、95%、または99%の配列同一性を有し、
    LはAに結合し、および、
    BはAまたはLのいずれかに結合する、プローブパネル。
  40. LはAに結合し、BはLに結合する、請求項39に記載のプローブパネル。
  41. 複数のプローブは少なくとも10、20、30、50、または100以上のプローブを含む、請求項39または40に記載のプローブパネル。
  42. 複数のプローブは、CpGメチル化データを生成するために溶液ベースの次世代の配列決定反応に使用される、請求項39−41のいずれか1つに記載のプローブパネル。
  43. 溶液ベースの次世代の配列決定反応は、小滴デジタルPCR配列決定方法である、請求項42に記載のプローブパネル。
  44. Lは10−60、15−55、20−50、25−45、ならびに30−40のヌクレオチド長さである、請求項39−43のいずれか1つに記載のプローブパネル。
  45. Lはさらに各プローブを識別するためのアダプター領域を含む、請求項39−44のいずれか1つに記載のプローブパネル。
  46. 命令が保存される非一時的なコンピューター可読媒体であって、
    前記非一時的なコンピューター可読媒体は、プロセッサによって実行されるとき:
    a.配列決定方法によって生体サンプルのセットからCpGメチル化データを生成する工程であって、セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
    b.第1のプロセッサを用いて、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットを取得する工程であって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、工程と、
    c.第1のコンピューティングデバイスを用いて、第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットを取得する工程であって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
    d.第1のコンピューティングデバイスを用いて、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットを取得する工程であって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、工程と、
    e.第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットから、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成する工程と、
    f.癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する工程であって、
    (1)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、および、
    (2)癌CpGメチル化プロファイルデータベースは、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す、工程、
    含む工程を行う、非一時的なコンピューター可読媒体。
  47. 工程e)はさらに、
    a.第1のペアのデータセット内の第1のデータセットと第2のデータセットとの間の差を算出すること、
    b.第2のペアのデータセット内の第3のデータセットと第4のデータセットとの間の差を算出すること、および
    c.第3のペアのデータセット内の第5のデータセットと第6のデータセットとの間の差を算出すること、を含む、請求項46に記載の非一時的なコンピューター可読媒体。
  48. 工程e)は、第1のペアのデータセットの算出された差から、第2のペアのデータセットの算出された差から、および第3のペアのデータセットの算出された差から、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成することをさらに含む、請求項46または47に記載の非一時的なコンピューター可読媒体。
  49. CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される、請求項46−48のいずれか1つに記載の非一時的なコンピューター可読媒体。
  50. メチル化プロファイルは、表15−18からなる群から選択された、少なくとも10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む、請求項46−49のいずれか1つに記載の非一時的なコンピューター可読媒体。
  51. メチル化プロファイルは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される少なくとも10、20、30、40、50、100、または200以上のバイオマーカーを含む、請求項46−50のいずれか1つに記載の非一時的なコンピューター可読媒体。
  52. メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む、請求項46−51のいずれか1つに記載の非一時的なコンピューター可読媒体。
  53. 癌種は固形癌タイプまたは血液系悪性癌種である、請求項46−52のいずれか1つに記載の非一時的なコンピューター可読媒体。
  54. 癌種は再発性または難治性の癌種である、請求項46−53のいずれか1つに記載の非一時的なコンピューター可読媒体。
  55. 癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍 びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む、請求項46−54のいずれか1つに記載の非一時的なコンピューター可読媒体。
  56. 生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む、請求項46−55のいずれか1つに記載の非一時的なコンピューター可読媒体。
JP2020128392A 2015-01-18 2020-07-29 癌の状態を判定する方法とシステム Pending JP2021003108A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022024038A JP2022078120A (ja) 2015-01-18 2022-02-18 癌の状態を判定する方法とシステム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562104785P 2015-01-18 2015-01-18
US62/104,785 2015-01-18
US14/986,520 2015-12-31
US14/986,520 US9984201B2 (en) 2015-01-18 2015-12-31 Method and system for determining cancer status

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017556781A Division JP2018508228A (ja) 2015-01-18 2016-01-15 癌の状態を判定する方法とシステム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022024038A Division JP2022078120A (ja) 2015-01-18 2022-02-18 癌の状態を判定する方法とシステム

Publications (1)

Publication Number Publication Date
JP2021003108A true JP2021003108A (ja) 2021-01-14

Family

ID=56406499

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2017556781A Pending JP2018508228A (ja) 2015-01-18 2016-01-15 癌の状態を判定する方法とシステム
JP2020128392A Pending JP2021003108A (ja) 2015-01-18 2020-07-29 癌の状態を判定する方法とシステム
JP2022024038A Pending JP2022078120A (ja) 2015-01-18 2022-02-18 癌の状態を判定する方法とシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017556781A Pending JP2018508228A (ja) 2015-01-18 2016-01-15 癌の状態を判定する方法とシステム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022024038A Pending JP2022078120A (ja) 2015-01-18 2022-02-18 癌の状態を判定する方法とシステム

Country Status (15)

Country Link
US (2) US9984201B2 (ja)
EP (1) EP3245604B1 (ja)
JP (3) JP2018508228A (ja)
KR (1) KR20170120595A (ja)
CN (2) CN108064314B (ja)
AU (1) AU2016206505B2 (ja)
BR (1) BR112017015413A2 (ja)
CA (1) CA2974097A1 (ja)
EA (1) EA036566B1 (ja)
HK (1) HK1248285A1 (ja)
IL (1) IL253546A0 (ja)
MX (1) MX2017009351A (ja)
SG (2) SG11201705878VA (ja)
TW (2) TW202011416A (ja)
WO (1) WO2016115530A1 (ja)

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3825411A1 (en) 2014-06-18 2021-05-26 Clear Gene, Inc. Methods, compositions, and devices for rapid analysis of biological markers
TWI813141B (zh) 2014-07-18 2023-08-21 香港中文大學 Dna混合物中之組織甲基化模式分析
US9984201B2 (en) * 2015-01-18 2018-05-29 Youhealth Biotech, Limited Method and system for determining cancer status
WO2017106790A1 (en) 2015-12-18 2017-06-22 Clear Gene, Inc. Methods, compositions, kits and devices for rapid analysis of biological markers
WO2017212428A1 (en) * 2016-06-07 2017-12-14 The Regents Of The University Of California Cell-free dna methylation patterns for disease and condition analysis
WO2017214397A1 (en) 2016-06-08 2017-12-14 University Of Iowa Research Foundation Compositions and methods for detecting predisposition to cardiovascular disease
US10093986B2 (en) 2016-07-06 2018-10-09 Youhealth Biotech, Limited Leukemia methylation markers and uses thereof
WO2018009707A1 (en) * 2016-07-06 2018-01-11 Youhealth Biotech, Limited Solid tumor methylation markers and uses thereof
EP3535422A2 (en) * 2016-11-07 2019-09-11 Grail, Inc. Methods of identifying somatic mutational signatures for early cancer detection
CA3039685A1 (en) 2016-11-30 2018-06-07 The Chinese University Of Hong Kong Analysis of cell-free dna in urine and other samples
WO2018119452A2 (en) 2016-12-22 2018-06-28 Guardant Health, Inc. Methods and systems for analyzing nucleic acid molecules
CN106544341A (zh) * 2017-01-17 2017-03-29 上海亿康医学检验所有限公司 高效检测样本中的ctDNA的方法
EP3589371A4 (en) * 2017-03-02 2020-11-25 Youhealth Oncotech, Limited METHYLATION MARKERS FOR THE DIAGNOSIS OF HEPER CELL CARCINOMA AND LUNG CANCER
JP7220200B2 (ja) 2017-04-19 2023-02-09 シングレラ ジェノミクス, インコーポレイテッド ライブラリー構築および配列解析のための組成物および方法
EP3612627A4 (en) * 2017-04-19 2020-12-30 Singlera Genomics, Inc. COMPOSITIONS AND METHODS FOR DETECTION OF GENOMIC VARIANCE AND OF DNA METHYLATION STATUS
EP3622091A4 (en) * 2017-05-12 2021-02-17 President and Fellows of Harvard College UNIVERSAL EARLY CANCER DIAGNOSIS
EP3635138B1 (en) * 2017-05-15 2024-07-03 Katholieke Universiteit Leuven Method for analysing cell-free nucleic acids
CN111094590A (zh) * 2017-07-12 2020-05-01 大学健康网络 使用甲基化组分析进行癌症检测和分类
WO2019055829A1 (en) 2017-09-15 2019-03-21 Nazarian Javad METHODS OF DETECTION OF CANCER BIOMARKERS
US11851711B2 (en) * 2017-09-29 2023-12-26 Arizona Board Of Regents On Behalf Of The University Of Arizona DNA methylation biomarkers for cancer diagnosing
US20200277677A1 (en) * 2017-10-06 2020-09-03 Youhealth Oncotech, Limited Methylation markers for diagnosing cancer
US10748040B2 (en) * 2017-11-20 2020-08-18 Kavya Venkata Kota Sai KOPPARAPU System and method for automatic assessment of cancer
WO2019108555A1 (en) 2017-11-28 2019-06-06 Crail, Inc. Models for targeted sequencing
WO2019157214A2 (en) * 2018-02-07 2019-08-15 Ai Technologies Inc. Deep learning-based diagnosis and referral of diseases and disorders
CA3092998A1 (en) * 2018-03-13 2019-09-19 Grail, Inc. Anomalous fragment detection and classification
DE202019005627U1 (de) 2018-04-02 2021-05-31 Grail, Inc. Methylierungsmarker und gezielte Methylierungssondenpanels
WO2019200404A2 (en) * 2018-04-13 2019-10-17 Grail, Inc. Multi-assay prediction model for cancer detection
EP3802830A4 (en) * 2018-05-31 2022-03-09 The Regents of the University of California, A California Corporation DNA METHYLATION-BASED BIOMARKERS OF IRRITABLE BOWEL SYNDROME AND IRRITABLE BOWEL DISEASE
TWI822789B (zh) * 2018-06-01 2023-11-21 美商格瑞爾有限責任公司 用於資料分類之卷積神經網路系統及方法
CN108866192B (zh) * 2018-07-26 2021-06-22 上海奕谱生物科技有限公司 基于甲基化修饰的肿瘤标记物stamp-ep1
CN110791563B (zh) * 2018-08-01 2024-02-09 立森印迹诊断技术(无锡)有限公司 一种用于检测甲状腺肿瘤良恶性程度的分级模型及其应用
CN109022556A (zh) * 2018-08-29 2018-12-18 天津智鱼生物科技有限公司 一种dna甲基化程度的定量方法及应用
EP3847612A4 (en) * 2018-09-04 2022-06-01 3M Innovative Properties Company VISUALIZATION OF SOCIAL HEALTH DETERMINANTS
CN113286881A (zh) 2018-09-27 2021-08-20 格里尔公司 甲基化标记和标靶甲基化探针板
CN110265087A (zh) * 2018-10-05 2019-09-20 中国医药大学附设医院 染色体异常检测模型、其检测系统及染色体异常检测方法
CN109182526A (zh) * 2018-10-10 2019-01-11 杭州翱锐生物科技有限公司 用于早期肝癌辅助诊断的试剂盒及其检测方法
AU2019380342A1 (en) * 2018-11-15 2021-07-01 Ampel Biosolutions, Llc Machine learning disease prediction and treatment prioritization
GB201819452D0 (en) * 2018-11-29 2019-01-16 Ucl Business Plc Differential methylation
AU2019403273A1 (en) * 2018-12-19 2021-08-05 Grail, Llc Cancer tissue source of origin prediction with multi-tier analysis of small variants in cell-free dna samples
CN113424263A (zh) * 2018-12-21 2021-09-21 格里尔公司 异常片段检测与分类
KR102211240B1 (ko) * 2018-12-28 2021-02-01 아주대학교산학협력단 허혈성 심장질환에 대한 보조 의사 시스템에 의해 수행되는 허혈성 심장질환 진단 방법
KR102068310B1 (ko) * 2019-02-28 2020-01-20 주식회사 레피다인 간암 재발 예측용 dna 메틸화 마커 및 이의 용도
WO2020179646A1 (ja) * 2019-03-01 2020-09-10 国立大学法人佐賀大学 成人t細胞白血病/リンパ腫の検出方法
US20220180964A1 (en) * 2019-03-28 2022-06-09 Phase Genomics, Inc. Systems and methods for karyotyping by sequencing
US11773450B2 (en) 2019-04-03 2023-10-03 Grail, Llc Methylation-based false positive duplicate marking reduction
CN110157804A (zh) * 2019-04-04 2019-08-23 广州优泽生物技术有限公司 用于肺癌诊断、疗效预测或预后的甲基化位点、检测引物及试剂盒
US12009061B2 (en) 2019-04-10 2024-06-11 University of Pittsburgh—of the Commonwealth System of Higher Education Computational filtering of methylated sequence data for predictive modeling
CN110163102A (zh) * 2019-04-18 2019-08-23 麦克奥迪(厦门)医疗诊断系统有限公司 一种基于卷积神经网络的宫颈细胞图像分类识别方法
US20220220551A1 (en) * 2019-04-22 2022-07-14 Behavioral Diagnostics, Llc Compositions and methods for correcting for cellular admixture in epigenetic analyses
WO2020219721A1 (en) * 2019-04-23 2020-10-29 The Broad Institute, Inc. Compositions and methods characterizing metastasis
CN113826167A (zh) * 2019-05-13 2021-12-21 格瑞尔公司 基于模型的特征化和分类
SG11202101998UA (en) * 2019-05-31 2021-03-30 Freenome Holdings Inc Methods and systems for high-depth sequencing of methylated nucleic acid
CN111204867B (zh) * 2019-06-24 2021-12-10 北京工业大学 膜生物反应器-mbr膜污染智能决策方法
TWI765262B (zh) * 2019-06-26 2022-05-21 長佳智能股份有限公司 根據仿真分離重疊染色體之分離模型的訓練方法及利用該分離模型分離重疊染色體的方法及系統
WO2021050962A1 (en) * 2019-09-11 2021-03-18 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Cancer detection and classification
CN114616343A (zh) 2019-09-30 2022-06-10 夸登特健康公司 用于在甲基化分区测定中分析无细胞dna的组合物和方法
US11795495B1 (en) * 2019-10-02 2023-10-24 FOXO Labs Inc. Machine learned epigenetic status estimator
BR112022009237A2 (pt) * 2019-11-13 2022-08-02 Memorial Sloan Kettering Cancer Center Modelos de classificador para predizer tecido de origem a partir de sequenciamento de dna de tumor de direcionamento
CN110867254A (zh) * 2019-11-18 2020-03-06 北京市商汤科技开发有限公司 预测方法及装置、电子设备和存储介质
US20230049979A1 (en) * 2020-02-06 2023-02-16 OncoHost Ltd. Machine learning prediction of therapy response
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
CN112662765A (zh) * 2020-03-17 2021-04-16 博尔诚(北京)科技有限公司 一种检测6种中国高发癌症的探针组合物
KR20230017169A (ko) * 2020-03-31 2023-02-03 프리놈 홀딩스, 인크. 핵산 메틸화 분석을 통한 결장직장암 검출을 위한 방법 및 시스템
CN111334572B (zh) * 2020-04-26 2020-10-27 江苏大学附属医院 Ctsz基因甲基化的新用途
WO2021226110A1 (en) * 2020-05-05 2021-11-11 The Board Of Trustees Of The Leland Stanford Junior University Cell-free dna biomarkers and their use in diagnosis, monitoring response to therapy, and selection of therapy for prostate cancer
WO2021227950A1 (zh) * 2020-05-09 2021-11-18 广州燃石医学检验所有限公司 癌症预后方法
CN112391466A (zh) * 2020-05-19 2021-02-23 广州市基准医疗有限责任公司 用于检测乳腺癌的甲基化生物标记物或其组合和应用
CN111863138A (zh) * 2020-05-26 2020-10-30 浙江大学 人子宫组织细胞组成分析模型及其建立方法和应用
KR102461582B1 (ko) * 2020-08-11 2022-10-31 한림대학교 산학협력단 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램
US11255762B1 (en) * 2020-08-11 2022-02-22 Specialty Diagnostic (SDI) Laboratories, Inc. Method and system for classifying sample data for robotically extracted samples
US20230357852A1 (en) * 2020-08-19 2023-11-09 Mayo Foundation For Medical Education And Research Detecting non-hodgkin lymphoma
EP4208570A1 (en) * 2020-09-04 2023-07-12 Cardio Diagnostics, Inc. Methods and compositions for predicting and/or monitoring cardiovascular disease and treatments therefor
WO2022061080A1 (en) * 2020-09-17 2022-03-24 The Regents Of The University Of Colorado, A Body Corporate Signatures in cell-free dna to detect disease, track treatment response, and inform treatment decisions
CN116917474A (zh) * 2020-11-13 2023-10-20 特里普巴尔生物公司 多参数发现和优化平台
KR102507489B1 (ko) * 2020-12-24 2023-03-08 가톨릭대학교 산학협력단 진단 분류 장치 및 방법
CN113095376A (zh) * 2021-03-24 2021-07-09 四川大学 一种基于深度学习的口腔上皮异常增生判别与分级设备及系统
CN117858954A (zh) * 2021-04-21 2024-04-09 赫利奥健康公司 细胞异质性调整的克隆甲基化(chalm):甲基化定量方法
CN113376199A (zh) * 2021-05-12 2021-09-10 兰立生物科技(苏州)有限公司 一种用于癌症检测的生化分析检测系统
EP4341441A1 (en) 2021-05-21 2024-03-27 Ophiomics - Investigação e Desenvolvimento em Biotecnologia Dna methylation biomarkers for hepatocellular carcinoma
WO2023287953A1 (en) * 2021-07-14 2023-01-19 The Regents Of The University Of California Mycobiome in cancer
EP4376022A1 (en) * 2021-07-23 2024-05-29 Kaohsiung Medical University Clinical therapeutic drug prediction and recommendation system and method for evaluating efficacy of second-generation hormone drug in treatment of prostate cancer
WO2023017525A1 (en) 2021-08-11 2023-02-16 OncoHost Ltd. Predicting patient response
AU2022339065A1 (en) 2021-09-06 2024-03-14 Christian-Albrechts-Universität Zu Kiel Method for the diagnosis and/or classification of a disease in a subject
US12007397B2 (en) 2021-09-13 2024-06-11 PrognomIQ, Inc. Enhanced detection and quantitation of biomolecules
WO2023063049A1 (ja) * 2021-10-15 2023-04-20 富士フイルム株式会社 がん検出のためのバイオマーカーセットの作製方法
CN114003752B (zh) * 2021-11-24 2022-11-15 重庆邮电大学 基于粒球人脸聚类图像质量评估的数据库精简方法及系统
KR20230085834A (ko) 2021-12-07 2023-06-14 한양대학교 에리카산학협력단 필터와 다중 진입점 구조를 이용한 캐싱 방법 및 장치
CN114657247B (zh) * 2022-02-28 2022-12-02 北京莱盟君泰国际医疗技术开发有限公司 用于早期肝癌检测的dna甲基化生物标记物或组合及其应用
US20240021267A1 (en) * 2022-07-18 2024-01-18 Grail, Llc Dynamically selecting sequencing subregions for cancer classification
US20240055073A1 (en) * 2022-07-25 2024-02-15 Grail, Llc Sample contamination detection of contaminated fragments with cpg-snp contamination markers
CN115627541B (zh) * 2022-12-01 2023-03-28 中国医学科学院肿瘤医院 从微量DNA建立cfDNA库的方法、系统和应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018508228A (ja) * 2015-01-18 2018-03-29 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 癌の状態を判定する方法とシステム

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5525462A (en) 1991-05-02 1996-06-11 Toyo Boseki Kabushiki Kaisha Nucleic acid sequence amplification method, detection method, and reagent kit therefor
US6033854A (en) 1991-12-16 2000-03-07 Biotronics Corporation Quantitative PCR using blocking oligonucleotides
WO1995006137A1 (en) 1993-08-27 1995-03-02 Australian Red Cross Society Detection of genes
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9517955D0 (en) 1995-07-25 1995-11-08 Univ Strathclyde Nucleotide sequence detection and analysis
US5985557A (en) 1996-01-24 1999-11-16 Third Wave Technologies, Inc. Invasive cleavage of nucleic acids
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
EP1736554B1 (en) 1996-05-29 2013-10-09 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US5858665A (en) 1996-07-25 1999-01-12 Navix, Inc. Homogeneous diagnostic assay method utilizing simultaneous target and signal amplification
EP0960210A4 (en) 1996-10-04 2004-06-09 Chronix Biomedical DIAGNOSTIC NUCLEIC ACID DETECTION
JPH10253632A (ja) 1997-03-10 1998-09-25 Nissui Pharm Co Ltd 分析方法、キット及び装置
US6558901B1 (en) 1997-05-02 2003-05-06 Biomerieux Vitek Nucleic acid assays
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
CA2330673C (en) 1998-05-01 2009-05-26 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and dna molecules
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US7700324B1 (en) 1998-11-03 2010-04-20 The Johns Hopkins University School Of Medicine Methylated CpG island amplification (MCA)
US6331393B1 (en) 1999-05-14 2001-12-18 University Of Southern California Process for high-throughput DNA methylation analysis
US6180349B1 (en) 1999-05-18 2001-01-30 The Regents Of The University Of California Quantitative PCR method to enumerate DNA copy number
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
DE10130800B4 (de) 2001-06-22 2005-06-23 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierung mit hoher Sensitivität
US20030215842A1 (en) 2002-01-30 2003-11-20 Epigenomics Ag Method for the analysis of cytosine methylation patterns
EP2339025B1 (en) 2002-06-26 2013-10-09 Cold Spring Harbor Laboratory Methods for determining the methylation profiles
EP1660680B1 (en) 2003-07-31 2009-03-11 Sequenom, Inc. Methods for high level multiplexed polymerase chain reactions and homogeneous mass extension reactions for genotyping of polymorphisms
US20060183128A1 (en) 2003-08-12 2006-08-17 Epigenomics Ag Methods and compositions for differentiating tissues for cell types using epigenetic markers
ATE553218T1 (de) 2003-10-21 2012-04-15 Orion Genomics Llc Differentielle enzymatische fragmetierung
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
CA2548528A1 (en) * 2003-12-01 2005-06-16 Epigenomics Ag Methods and nucleic acids for the analysis of gene expression associated with the development of prostate cell proliferative disorders
US7459274B2 (en) 2004-03-02 2008-12-02 Orion Genomics Llc Differential enzymatic fragmentation by whole genome amplification
JP2005328709A (ja) 2004-05-18 2005-12-02 Toyobo Co Ltd 高速dnaポリメラーゼを用いた高速pcr
EP1812589A2 (en) * 2004-09-30 2007-08-01 Epigenomics AG Epigenetic methods and nucleic acids for the detection of lung cell proliferative disorders
US7643818B2 (en) 2004-11-22 2010-01-05 Seven Networks, Inc. E-mail messaging to/from a mobile terminal
US9074013B2 (en) 2004-11-29 2015-07-07 Sequenom, Inc. Means and methods for detecting methylated DNA
US20080261217A1 (en) * 2006-10-17 2008-10-23 Melnikov Anatoliy A Methylation Profile of Cancer
GB0700374D0 (en) 2007-01-09 2007-02-14 Oncomethylome Sciences S A NDRG family methylation markers
US20090075264A1 (en) * 2007-02-02 2009-03-19 Orion Genomics Llc Gene methylation in liver cancer diagnosis
US8911937B2 (en) 2007-07-19 2014-12-16 Brainreader Aps Method for detecting methylation status by using methylation-independent primers
WO2009021141A1 (en) 2007-08-07 2009-02-12 The Johns Hopkins University Comprehensive high throughput arrays for relative methylation
EP2053131A1 (en) 2007-10-19 2009-04-29 Ludwig-Maximilians-Universität München Method for determining methylation at deoxycytosine residues
CN101970692B (zh) * 2008-03-14 2017-02-01 基因特力株式会社 使用肺癌特异性甲基化标记基因检测肺癌的方法
WO2012031329A1 (en) 2010-09-10 2012-03-15 Murdoch Childrens Research Institute Assay for detection and monitoring of cancer
US20130296328A1 (en) * 2011-01-20 2013-11-07 Université Libre de Bruxelles Epigenetic portraits of human breast cancers
GB201102014D0 (en) 2011-02-04 2011-03-23 Ucl Business Plc Method for predicting risk of developing cancer
US20140094380A1 (en) 2011-04-04 2014-04-03 The Board Of Trustees Of The Leland Stanford Junior University Methylation Biomarkers for Diagnosis of Prostate Cancer
WO2012149171A1 (en) 2011-04-27 2012-11-01 The Regents Of The University Of California Designing padlock probes for targeted genomic sequencing
CN104024432B (zh) * 2011-08-31 2017-02-22 基因泰克公司 诊断性标志物
US8846316B2 (en) 2012-04-30 2014-09-30 Industrial Technology Research Institute Biomarker for human liver cancer
US10233503B2 (en) * 2012-05-24 2019-03-19 Fundació Institut D'investigació Biomèdica De Bellvitge (Idibell) Method for the identification of the origin of a cancer of unknown primary origin by methylation analysis
JP6269493B2 (ja) * 2012-09-19 2018-01-31 シスメックス株式会社 脳腫瘍に関する情報の取得方法、ならびに脳腫瘍に関する情報を取得するためのマーカーおよびキット
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
US20140271455A1 (en) * 2013-03-14 2014-09-18 City Of Hope Dna methylation biomarkers for small cell lung cancer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018508228A (ja) * 2015-01-18 2018-03-29 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 癌の状態を判定する方法とシステム

Also Published As

Publication number Publication date
CA2974097A1 (en) 2016-07-21
TW202011416A (zh) 2020-03-16
EP3245604B1 (en) 2022-03-02
AU2016206505B2 (en) 2022-03-10
MX2017009351A (es) 2017-10-24
US9984201B2 (en) 2018-05-29
SG10202010694PA (en) 2020-12-30
HK1248285A1 (zh) 2018-10-12
IL253546A0 (en) 2017-09-28
CN108064314B (zh) 2021-03-09
BR112017015413A2 (pt) 2018-08-07
CN113724786A (zh) 2021-11-30
EP3245604A1 (en) 2017-11-22
US20180341745A1 (en) 2018-11-29
TW201638815A (zh) 2016-11-01
WO2016115530A1 (en) 2016-07-21
JP2018508228A (ja) 2018-03-29
SG11201705878VA (en) 2017-08-30
EA201791569A1 (ru) 2018-01-31
KR20170120595A (ko) 2017-10-31
EA036566B1 (ru) 2020-11-24
US20160210403A1 (en) 2016-07-21
EP3245604A4 (en) 2018-06-20
CN108064314A (zh) 2018-05-22
JP2022078120A (ja) 2022-05-24
AU2016206505A1 (en) 2017-08-31

Similar Documents

Publication Publication Date Title
JP2021003108A (ja) 癌の状態を判定する方法とシステム
US20230348992A1 (en) Methylation markers for diagnosing hepatocellular carcinoma and lung cancer
CN111742062B (zh) 用于诊断癌症的甲基化标志物
US20200299776A1 (en) Solid tumor methylation markers and uses thereof
US11396678B2 (en) Breast and ovarian cancer methylation markers and uses thereof
US20190300964A1 (en) Colon cancer methylation markers and uses thereof
US10829821B2 (en) Leukemia methylation markers and uses thereof
US20190300965A1 (en) Liver cancer methylation markers and uses thereof
US20240209453A1 (en) Liver cancer methylation and protein markers and their uses

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200828

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210819

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211119

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220413