JP2020537487A - メチローム解析を用いる癌の検出及び分類 - Google Patents

メチローム解析を用いる癌の検出及び分類 Download PDF

Info

Publication number
JP2020537487A
JP2020537487A JP2020501564A JP2020501564A JP2020537487A JP 2020537487 A JP2020537487 A JP 2020537487A JP 2020501564 A JP2020501564 A JP 2020501564A JP 2020501564 A JP2020501564 A JP 2020501564A JP 2020537487 A JP2020537487 A JP 2020537487A
Authority
JP
Japan
Prior art keywords
dna
cell
cancer
free
derived
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020501564A
Other languages
English (en)
Other versions
JP2020537487A5 (ja
Inventor
デ カルヴァルホ ダニエル ディニズ
デ カルヴァルホ ダニエル ディニズ
スコット ビクター ブラットマン
スコット ビクター ブラットマン
ラジャット シンガニア
ラジャット シンガニア
チャクラヴァルシー アンクール ラヴィナラヤナ
チャクラヴァルシー アンクール ラヴィナラヤナ
シュー イー シェン
シュー イー シェン
Original Assignee
ユニバーシティー ヘルス ネットワーク
ユニバーシティー ヘルス ネットワーク
シナイ ヘルス システム
シナイ ヘルス システム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニバーシティー ヘルス ネットワーク, ユニバーシティー ヘルス ネットワーク, シナイ ヘルス システム, シナイ ヘルス システム filed Critical ユニバーシティー ヘルス ネットワーク
Publication of JP2020537487A publication Critical patent/JP2020537487A/ja
Publication of JP2020537487A5 publication Critical patent/JP2020537487A5/ja
Priority to JP2023119203A priority Critical patent/JP2023139162A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/164Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)

Abstract

対象における癌細胞由来のDNAの存在を検出する方法であって、対象由来のセルフリーDNAの試料を準備する工程と、上記試料をライブラリ調製に供して、引き続く上記セルフリーのメチル化DNAの配列決定を可能にする工程と、第1量のフィラーDNAを上記試料に加え、次いで任意選択的に上記試料を変性する工程であって、上記フィラーDNAの少なくとも一部分がメチル化されている工程と、メチル化ポリヌクレオチドに選択的な結合剤を使用して、セルフリーのメチル化DNAを捕捉する工程と、捕捉された上記セルフリーのメチル化DNAを配列決定する工程と、上記捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来並びに別個の癌種及び亜型を有する個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程とを備える方法が本願明細書に記載される。【選択図】図1(1)

Description

関連出願
本願は、2017年7月12日出願の米国仮特許出願第62/531527号に基づく優先権を主張する。この米国仮特許出願は、参照により本願明細書に援用される。
技術分野
本発明は、癌の検出及び分類、より具体的には癌の検出及び分類のためのメチローム解析の使用に関する。
バイオマーカーのソースとしての循環セルフリーDNA(cfDNA)の使用は、腫瘍学において急速に勢いを持ってきている[1]。バイオマーカーとしてのcfDNAのDNAメチル化マッピングの使用は、液体細胞診の分野で大きなインパクトを有することができよう。というのも、cfDNAのDNAメチル化マッピングの使用により、低侵襲的に、原発組織の特定を可能にし[2]、癌の型及び亜型の分類を可能にし、そして癌患者を階層化することができると思われるからである[3]。さらには、cfDNAの全ゲノムDNAメチル化マッピングを使用することで、疾患の証拠となるX線像がないステージI〜IIIの癌を有する患者において循環腫瘍DNA(ctDNA)を検出する際の重大な感度の問題を克服することができよう。既存のctDNA検出方法は、変異を配列決定することに基づいており、腫瘍と健常な循環cfDNAとの間を見分けるために利用可能な反復突然変異の数が限られていることに一部は起因して、感度に限界がある[4、5]。他方、全ゲノムDNAメチル化マッピングは、循環腫瘍DNA(ctDNA)を健常な循環セルフリーDNA(cfDNA)から見分けるために使用されてもよい多くのエピジェネティックな変異を活用する。例えば、上衣腫等のいくつかの腫瘍型は、何ら顕著な再発性体細胞変異もなく広範なDNAメチル化異常を有することができる[6]。
セルフリーのメチル化DNAを捕捉する特定の方法が国際公開第2017/190215号パンフレットに記載されており、この特許文献は、参照により援用される。
国際公開第2017/190215号パンフレット
一態様では、対象における癌細胞由来のDNAの存在を検出する方法であって、対象由来のセルフリーDNAの試料を準備する工程と、上記試料をライブラリ調製に供して、引き続く上記セルフリーのメチル化DNAの配列決定を可能にする工程と、第1量のフィラーDNAを上記試料に加え、次いで任意選択的に上記試料を変性する工程であって、上記フィラーDNAの少なくとも一部分がメチル化されている工程と、メチル化ポリヌクレオチドに選択的な結合剤を使用して、セルフリーのメチル化DNAを捕捉する工程と、捕捉された上記セルフリーのメチル化DNAを配列決定する工程と、上記捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程とを備える方法が提供される。
一態様では、癌細胞由来のDNAの存在を検出し、癌亜型を特定する方法であって、対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程と、癌細胞由来のDNAが特定される場合に、上記比較に基づいて原発癌細胞組織及び癌亜型をさらに特定する工程とを備える方法が提供される。
一態様では、癌細胞由来のDNAの存在を検出し、癌亜型を特定するコンピュータ実装方法であって、少なくとも1つのプロセッサで、対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、上記少なくとも1つのプロセッサで、捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、上記少なくとも1つのプロセッサで、癌細胞由来のDNAの存在を特定し、癌細胞由来のDNAが特定される場合に、上記比較に基づいて原発癌細胞組織及び癌亜型をさらに特定する工程とを備える方法が提供される。
一態様では、プロセッサ及びこのプロセッサに接続されたメモリを有する汎用性コンピュータと組み合わせて使用するためのコンピュータプログラム製品であって、コンピュータメカニズムがエンコードされたコンピュータ可読記憶媒体を含み、上記コンピュータプログラムメカニズムが上記コンピュータの上記メモリにローディングされ、上記コンピュータに本願明細書に記載される方法を実行させてもよいコンピュータプログラム製品が提供される。
一態様では、本願明細書に記載されるコンピュータプログラム製品を保存するためのデータ構造が保存されたコンピュータ可読媒体が提供される。
一態様では、癌細胞由来のDNAの存在を検出して癌亜型を特定するためのデバイスであって、少なくとも1つのプロセッサと、上記少なくとも1つのプロセッサと通信している電子メモリとを備え、上記電子メモリは、上記少なくとも1つのプロセッサで実行される場合に、上記少なくとも1つのプロセッサに、対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取ることと、捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較することと、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定し、癌細胞由来のDNAが特定される場合、上記比較に基づいて、原発癌細胞組織及び癌亜型をさらに特定することとを実行させるプロセッサ実行可能なコードを保存するデバイスが提供される。
一態様では、癌細胞由来のDNAの存在を検出して、2以上の可能性のある器官から上記癌細胞が発生した上記癌の場所を決定する方法であって、対象由来のセルフリーDNAの試料を準備する工程と、メチル化ポリヌクレオチドに選択的な結合剤を使用して、上記試料由来のセルフリーのメチル化DNAを捕捉する工程と、捕捉された上記セルフリーのメチル化DNAを配列決定する工程と、上記捕捉されたセルフリーのメチル化DNAの配列パターンを対照個体の2以上の母集団のDNA配列パターンと比較する工程であって、上記2以上の母集団の各々は、異なる器官に限局性癌を有する工程と、上記セルフリーDNAのメチル化のパターンと上記2以上の母集団のうちの1つのメチル化のパターンとの間の統計的に有意な類似性に基づいて、どの器官で上記癌細胞が発生したかを決定する工程とを備える方法が提供される。
本発明の好ましい実施形態のこれらの特徴及び他の特徴は、添付の図面が参照される以下の詳細な説明においてより明らかとなるであろう。
図1は、cfDNAのメチローム解析が少ない量のインプットDNAの中のctDNAを濃縮し検出するための高感度の手法であることを示す。A)ctDNAの濃度(列)、調べられたDMR数(行)、及びシークエンシング深度(x軸)の関数としての少なくとも1つのエピ変異を検出する確率のコンピュータシミュレーション。B)血漿cfDNAを模倣するように断片化されたHCT116細胞系由来の1〜100ngのインプットDNAに対するDNAメチル化シグナル間の全ゲノムピアソン(Pearson)相関。各濃度は、2つの生物的複製物を有する。 図1は、cfDNAのメチローム解析が少ない量のインプットDNAの中のctDNAを濃縮し検出するための高感度の手法であることを示す。C)HCT116由来の異なる濃度のインプットDNAからのcfMeDIP−seqから得られるDNAメチル化プロファイル(緑色のトラック)、並びにENCODE(ENCSR000DFS)から得られるRRBS(Reduced Representation Bisulfite Sequencing)HCT116データ及びGEO(GSM1465024)から得られるWGBS(Whole−Genome Bisulfite Sequencing)HCT116データ。ヒートマップ(RRBSトラック)について、黄色はメチル化を意味し、青色は非メチル化を意味し、灰色はカバレッジなしを意味する。 図1は、cfDNAのメチローム解析が少ない量のインプットDNAの中のctDNAを濃縮し検出するための高感度の手法であることを示す。D〜E)多発性骨髄腫(MM)細胞系MM1.S中へのCRC細胞系HCT116の段階希釈。cfMeDIP−seqが純粋HCT116 DNA(100%CRC)、純粋MM1.S DNA(100%MM)並びにMM DNA中に希釈された10%、1%、0.1%、0.01%、及び0.001%CRC DNAにおいて実施された。すべてのDNAが血漿cfDNAを模倣するように断片化された。本発明者らは、実測と予測の(D)DMR数及び(E)これらのDMR内のDNAメチル化シグナル(RPKM単位)にほぼ完全な線形相関(r=0.99、p<0.0001)を認めた。 図1は、cfDNAのメチローム解析が少ない量のインプットDNAの中のctDNAを濃縮し検出するための高感度の手法であることを示す。F)同じ希釈系列において、既知の体細胞変異は、バックグラウンドシークエンサー及びポリメラーゼエラー率を超える超深度(>10,000×)標的配列決定によって1/100対立遺伝子割合においてのみ検出可能である。CRC細胞系における各変異の部位に各塩基又は挿入/欠失を含むリードの割合が示されている。G)2人の結直腸癌患者からの患者由来の異種移植片(PDX)を有するマウスの血漿中の総cfDNA(ヒト+マウス)に対する百分率としてのctDNA(ヒト)の頻度。 図2は、血漿cfDNAのメチローム解析が腫瘍の分類を可能にすることを示す。A)癌の分類のための機械学習分類器構築の手法を示す概略図。 図2は、血漿cfDNAのメチローム解析が腫瘍の分類を可能にすることを示す。B)多クラスエラスティックネット機械学習分類器内に含まれるDMRのヒートマップ。これらの分類器は、健康な提供者由来の血漿DNA試料(n=24)、肺癌(n=25)、乳癌(n=25)、結直腸癌(n=23)、急性骨髄性白血病(AML)(n=28)、及び多形神経膠芽腫(GBM)(n=71)由来の血漿DNA試料で訓練された。階層的クラスタ分析方法:Ward。 図2は、血漿cfDNAのメチローム解析が腫瘍の分類を可能にすることを示す。C)モデルの10%又は25%において特定された癌種関連DMRのtSNE(t−Distributed Stochastic Neighbor Embedding:t分布型確率的近傍埋め込み)による2D視覚化。 図2は、血漿cfDNAのメチローム解析が腫瘍の分類を可能にすることを示す。D)血漿cfDNAメチル化ベースの多癌分類器についての性能測定基準。受信者オペレータ曲線下部面積(area under the receiver operator curve:auROC)が、エラスティックネット機械学習分類器の50分割生成の後の各癌種及び健康な提供者についてy軸に示されている。 図3は、独立のコホートにおける多癌分類器の検証を示す。A)肺癌(LUC)(n=55LUC対n=97その他)、AML(n=35AML対n=117その他)、及び健康な提供者(n=62健康な提供者対n=90その他)のコホートでの多癌分類器の独立の検証についてROC曲線が示されている。 図3は、独立のコホートにおける多癌分類器の検証を示す。B)早期LUC(n=32ステージI〜IIのLUC対n=97その他)及び末期LUC(n=23ステージIII〜IV LUC対n=97その他)での多癌分類器の独立の検証についてのROC曲線が示されている。 図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。A)癌亜型関連DMRのtSNE(t分布型確率的近傍埋め込み)による2D視覚化。乳癌亜型は、別個の遺伝子発現パターン及び転写因子活性(ER状態)並びに別個の腫瘍コピー数異常(HER2状態)を有する腫瘍を有する患者を見分ける能力を示す。AML亜型は、別個の再構成(FLT3状態)を有する腫瘍を有する患者を見分ける能力を示す。多形神経膠芽腫(GBM)亜型は、別個の点変異(IDH遺伝子変異状態)を有する腫瘍を有する患者を見分ける能力を示す。肺癌亜型は、予後的及び治療上の影響を有する別個の組織学(腺癌対扁平上皮癌対小細胞癌)を有する腫瘍を有する患者を見分ける能力を示す。 図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。B)乳癌血漿試料において3つの乳癌亜型の正確な区別を可能にする上位DMRを示すヒートマップ。 図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。C)AML患者血漿試料においてFLT3−ITD状態の正確な区別を可能にする上位DMRを示すヒートマップ。 図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。D)多形神経膠芽腫(GBM)患者血漿試料においてIDH遺伝子変異状態の正確な区別を可能にする上位DMRを示すヒートマップ。 図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。E)肺癌血漿試料において3つの肺癌組織学の正確な区別を可能にする上位DMRを示すヒートマップ。 図5は、本願明細書に記載される1以上の実施形態を実行するためのプラットフォームを提供するように好適に構成されたコンピュータデバイス、並びに関連する通信ネットワーク、デバイス、ソフトウェア及びファームウェアを示す。 図6は、配列決定飽和分析(sequencing saturation analysis)及び品質管理を示す。A)この図は、血漿cfDNAを模倣するように断片化されたHCT116 DNAからの各インプット濃度に対する各複製物からのcfMeDIP−seqデータを分析するBioconductorパッケージMEDIPSの飽和分析の結果を示す。 図6(1)の続きである。 図6(2)の続きである。 図6(3)の続きである。 図6(4)の続きである。 図6は、配列決定飽和分析及び品質管理を示す。B)HCT116細胞系の4つの開始DNA濃度(100ng、10ng、5ng、及び1ng)の2つの複製物においてプロトコルが試験された。反応特異度は、メチル化及び非メチル化添加シロイヌナズナDNAを使用して計算された。濃縮倍率比は、断片化HCT116 DNAのゲノム領域(メチル化精巣特異的H2B、TSH2B0及び非メチル化ヒトDNA領域(GAPDHプロモーター)のプライマー)を用いて計算された。水平の点線は25の濃縮倍率比閾値を示す。エラーバーは、±1s.e.mを表す。C)配列決定試料のCpG濃縮スコアは、インプット対照と比べて免疫沈降試料からのゲノム領域内のCpGの堅牢な濃縮を示す。CpG濃縮スコアは、上記領域のCpGの相対頻度をヒトゲノムのCpGの相対頻度で除算することにより得られた。エラーバーは、±1s.e.mを表す。
以下の説明では、本発明の十分な理解を提供するために、多くの特定の細部が提示される。しかしながら、本発明はこれらの特定の細部なしで実施されてもよいということは理解される。
DNAメチル化プロファイルは、細胞型特異的であり、癌では乱れている。最少量の循環セルフリーDNA(cfDNA)のメチローム解析のために設計された堅牢で高感度の方法を使用して、本発明者らは、複数の腫瘍型を互いから、及び健康な個体から見分ける数千の可変メチル化領域(Differentially Methylated Regions:DMR)を特定した。cfDNAのメチローム解析は、高感度であり、早期患者において循環腫瘍DNA(ctDNA)を検出することに好適である。cfDNAメチロームを使用する機械学習由来の分類器は、交差検証に基づいて、5つの癌種を有する患者及び健康な提供者由来の196個の血漿試料を正しく分類することができた。独立の検証では、血漿cfDNA中で特定された同じDMRを使用して、上記分類器は、AML、肺癌、及び健康な提供者、並びに早期及び末期の肺癌の両方を正しく分類することができた。それゆえ、cfDNAのメチローム解析は、ctDNAの非侵襲性の早期検出のために使用することができ、癌種を堅牢に分類することができる。
一態様では、対象における癌細胞由来のDNAの存在を検出する方法であって、対象由来のセルフリーDNAの試料を準備する工程と、上記試料をライブラリ調製に供して、引き続く上記セルフリーのメチル化DNAの配列決定を可能にする工程と、第1量のフィラーDNAを上記試料に加え、次いで任意選択的に上記試料を変性する工程であって、上記フィラーDNAの少なくとも一部分がメチル化されている工程と、メチル化ポリヌクレオチドに選択的な結合剤を使用して、セルフリーのメチル化DNAを捕捉する工程と、捕捉された上記セルフリーのメチル化DNAを配列決定する工程と、上記捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程とを備える方法が提供される。
出願人の共有に係る出願である、2016年5月3日出願の米国仮特許出願第62/331,070号及び2017年5月3日出願の国際特許、出願第PCT/CA2017/000108号は、セルフリーのメチル化DNAを捕捉するための方法を記載しており、これらは、参照により本願明細書に援用したものとする。
癌は、慣例で起源組織によって、例えば、結直腸癌、乳癌、肺癌等と分類されてきた。臨床腫瘍学の現在の実務では、癌の亜型を種々の分子的、発生的及び機能的基礎によって見分けることができることが、ますます重要になってきている。治療上の決定は正確な癌の亜型に依ることが多く、臨床医が、治療の開始に先立って亜型を特定することが必要である場合がある。治療上の決定に影響を及ぼしうる癌の細分類の例としては、ステージ(例えば、外科手術で処置される早期肺癌対化学療法で処置される末期肺癌)、組織学(組織像)(例えば、肺癌における小細胞癌対腺癌対扁平上皮癌)、遺伝子発現パターン又は転写因子活性(例えば、乳癌におけるER状態)、コピー数異常(例えば、乳癌におけるHER2状態)、特異的再構成(例えば、AMLにおけるFLT3)、特異的遺伝子点変異状態(例えば、IDH遺伝子点変異)、及びDNAメチル化パターン(例えば、脳癌におけるMGMT遺伝子プロモーターのメチル化)が挙げられる(しかしこれらに限定されない)。
本願明細書に記載される方法は、実に様々な癌に適用可能であり、それら癌としては、副腎癌、肛門癌、胆管癌、膀胱癌、骨癌、脳/cns腫瘍、乳癌、キャッスルマン病、子宮頸癌、結腸/直腸癌、子宮内膜癌、食道癌、ユーイング腫瘍、眼癌、胆嚢癌、消化管カルチノイド、消化管間質腫瘍(gist)、妊娠性絨毛性疾患、ホジキン病、カポジ肉腫、腎癌、咽頭癌及び下咽頭癌、白血病(急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄単球性白血病)、肝癌、肺癌(非小細胞、小細胞、肺カルチノイド)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔癌及び副鼻腔癌、上咽頭(鼻咽頭)癌、神経芽細胞腫、非ホジキンリンパ腫、口腔癌及び中咽頭癌、骨肉腫、卵巣癌、陰茎癌、下垂体部腫瘍、前立腺癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、成人軟部組織癌(成人軟部肉腫)、皮膚癌(基底細胞癌及び扁平上皮癌、黒色腫、メルケル細胞癌)、小腸癌、胃癌、精巣癌、胸腺癌、甲状腺癌、子宮肉腫、膣内癌、外陰癌、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍が挙げられるが、これらに限定されない。
ポリメラーゼ連鎖反応(PCR)及びそれに続くSanger(サンガー)シークエンシング等、種々の配列決定技法が当業者に知られている。高スループット配列決定としても知られる次世代シークエンシング(NGS)技法も利用可能であり、次世代シークエンシング(NGS)技法としては、Illumina(Solexa)シークエンシング、Roche 454シークエンシング、Ion torrent:Proton/PGMシークエンシング、SOLiDシークエンシング等、種々の配列決定技術が挙げられる。NGSは、従来使用されているSangerシークエンシングよりもはるかに速くて安価に、DNA及びRNAの配列決定を可能にする。いくつかの実施形態では、上記配列決定は、ショートリード配列決定のために最適化されている。
用語「対象」は、本願明細書で使用する場合、動物界の任意のメンバー、好ましくはヒト、最も好ましくは前立腺癌を有しているか、前立腺癌を有していたか、又は前立腺癌を有していると疑われるヒトを指す。
セルフリーのメチル化DNAは、血流の中を自由に循環しているDNAであって、DNAの種々の既知の領域でメチル化されているDNAである。セルフリーのメチル化DNAを分析するために、試料、例えば、血漿試料が採取されてもよい。従って、いくつかの実施形態では、上記試料は、対象の血液又は血漿である。
本願明細書で使用する場合、「ライブラリ調製」は、リスト末端修復(list end−repair)、Aテーリング、アダプターライゲーション、又は後続のDNA配列決定を可能にするためにセルフリーDNA上で行われる任意の他の調製を含む。
本願明細書で使用する場合、「フィラーDNA」は非コードDNAとすることができ、又はフィラーDNAは増幅産物(アプリコン)からなることができる。
DNA試料は、例えば、十分な熱を使用して変性されていてもよい。
いくつかの実施形態では、上記比較工程は、統計的分類器を使用するフィットに基づく。DNAメチル化データを使用する統計的分類器が、試料を癌種又は亜型等の特定の病状に振り分けるために使用されてもよい。癌種又は亜型の分類の目的では、分類器は、統計モデル内で1以上のDNAメチル化変数(すなわち、特徴量)からなるであろうし、統計モデルの出力は、別個の病状を見分けるための1以上の閾値を有することになろう。統計的分類器で使用される特定の特徴量(1若しくは複数)及び閾値(1若しくは複数)は、癌種若しくは亜型の先行知識に、最も情報が豊富であると思われる特徴量の先行知識に、機械学習に、又はこれらの手法のうちの2以上のものの組み合わせに由来することができる。
いくつかの実施形態では、上記分類器は機械学習由来である。好ましくは、上記分類器は、エラスティックネット(elastic net)分類器、lasso、サポートベクターマシン、ランダムフォレスト、又はニューラルネットワークである。
分析されるゲノム空間は、全ゲノムであってもよく、又は好ましくは調節領域(すなわち、FANTOM5エンハンサー(FANTOM5 enhancer)、CpGアイランド(CpG Island)、CpGショア(CpG shore)及びCpGシェルフ(CpG Shelf))に限定されてもよい。
好ましくは、回収された添加メチル化DNAの百分率は、プルダウン効率変数を制御するための共変量として含まれる。
複数の癌種(又は亜型)を互いから見分けることができる分類器のために、分類器は、好ましくは、注目する各種(又は亜型)の一対比較からの可変メチル化領域からなるであろう。
いくつかの実施形態では、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列は、健康な個体と癌性個体との間の可変メチル化領域(DMR)のデータベースに含まれる。
いくつかの実施形態では、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列は、血清、脳脊髄液、尿糞便、痰、胸水、腹水、涙、汗、パップスメア液、内視鏡検査ブラッシング液等の体液から、好ましくは血漿からのセルフリーDNA由来のDNAにおいて健康な個体と癌性個体との間で差次的にメチル化されている対照のセルフリーのメチル化DNA配列に限定される。
いくつかの実施形態では、上記試料は、100ng未満、75ng未満、又は50ng未満のセルフリーDNAを有する。
いくつかの実施形態では、上記第1量のフィラーDNAは、約5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、又は100%のメチル化フィラーDNAを含み、残部は非メチル化フィラーDNAであり、好ましくは5%〜50%、10%〜40%、又は15%〜30%がメチル化フィラーDNAである。
いくつかの実施形態では、上記第1量のフィラーDNAは、20ng〜100ng、好ましくは30ng〜100ng、より好ましくは50ng〜100ngである。
いくつかの実施形態では、上記試料由来のセルフリーDNA及び上記第1量のフィラーDNAは、合わせて少なくとも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む。
いくつかの実施形態では、上記フィラーDNAは、50bp〜800bp長、好ましくは100bp〜600bp長、及びより好ましくは200bp〜600bp長である。
いくつかの実施形態では、上記フィラーDNAは二本鎖である。上記フィラーDNAは二本鎖である。例えば、フィラーDNAは、ジャンクDNAであってもよい。また、フィラーDNAは、内在DNAでも外来DNAでもよい。例えば、フィラーDNAは非ヒトDNAであり、好ましい実施形態では、λDNAである。本願明細書で使用する場合、「λDNA」は腸内細菌ファージλDNAを指す。いくつかの実施形態では、フィラーDNAは、ヒトDNAに対するアラインメントを有しない。
いくつかの実施形態では、上記結合剤は、メチルCpG結合ドメインを含むタンパク質である。1つのこのような例示的タンパク質はMBD2タンパク質である。本願明細書で使用する場合、「メチルCpG結合ドメイン(MBD)」は、およそ70残基長でありかつ1以上の対称的メチル化CpGを含むDNAに結合するタンパク質及び酵素の特定のドメインを指す。MeCP2、MBD1、MBD2、MBD4及びBAZ2のMBDは、DNAへの結合を媒介し、MeCP2、MBD1及びMBD2の場合には、メチル化CpGへの結合を優先的に媒介する。ヒトタンパク質MECP2、MBD1、MBD2、MBD3及びMBD4は、メチルCpG結合ドメイン(MBD)の各々における存在によって関連づけられる核タンパク質のファミリーを含む。これらのタンパク質の各々は、MBD3を除いて、メチル化DNAに特異的に結合することができる。
他の実施形態では、上記結合剤は抗体であり、セルフリーのメチル化DNAを捕捉することは、その抗体を使用してセルフリーのメチル化DNAを免疫沈降させることを含む。本願明細書で使用する場合、「免疫沈降」は、特定の抗原(ポリペプチド及びヌクレオチド等)に特異的に結合する抗体を使用してその抗原を溶液から沈降させる技法を指す。このプロセスは、特定のタンパク質又はDNAを試料から単離及び濃縮するために使用することができ、そして抗体がその手順のある時点で固体基質に結合されることを必要とする。固体基質としては、例えばビーズ、例えば磁気ビーズが挙げられる。他の種類のビーズ及び固体基質は当該技術分野で公知である。
1つの例示的抗体は5−MeC抗体である。免疫沈降手順については、いくつかの実施形態では、少なくとも0.05μgのこの抗体が試料に加えられ、より好ましい実施形態では、少なくとも0.16μgのこの抗体が試料に加えられる。免疫沈降反応を確認するために、いくつかの実施形態では、本願明細書に記載される方法は、第2量の対照DNAを上記試料に加える工程をさらに備える。
いくつかの実施形態では、当該方法は、免疫沈降反応を確認するために、第2量の対照DNAを上記試料に加える工程をさらに備える。
本願明細書で使用する場合、「対照」は陽性対照及び陰性対照の両方、又は少なくとも陽性対照を含んでもよい。
いくつかの実施形態では、当該方法は、セルフリーのメチル化DNAの捕捉を確認するために、第2量の対照DNAを上記試料に加える工程をさらに備える。
いくつかの実施形態では、癌細胞由来のDNAの存在を特定することは、上記原発癌細胞組織を特定することをさらに備える。
いくつかの例では、腫瘍組織サンプリングは、困難である場合があり、又は重大なリスクを伴う場合があり、いずれの場合も、腫瘍組織サンプリングの必要なしに癌を診断及び/又は細分類することが所望される可能性がある。例えば、肺腫瘍組織サンプリングは、縦隔鏡検査、開胸術、又は経皮の針生検等の侵襲的手技を必要とする可能性があり、これらの手技・手順は、入院、胸腔チューブ、人工呼吸、抗生物質、又は他の医療行為の必要を生じる可能性がある。一部の個体は、併存疾患のため、又は好みによって腫瘍組織サンプリングのために必要な侵襲的手技を受けない可能性がある。いくつかの例では、腫瘍組織の調達のための現実の手順は、疑われる癌亜型に依存する可能性がある。他の例では、癌亜型は、同じ個体の中で経時的に発生する可能性があり、侵襲的腫瘍組織サンプリング手法を用いる連続的な評価は、実施不可能であることが多く、患者に十分に許容されるものではない。従って、血液検査による非侵襲的な癌の細分類は、臨床腫瘍学の実務において多くの有利な応用例を有することができよう。
従って、いくつかの実施形態では、上記原発癌細胞組織を特定することは、癌亜型を特定することをさらに備える。好ましくは、癌亜型は、ステージ(例えば、外科手術で処置される早期肺癌対化学療法で処置される末期肺癌)、組織学(例えば、肺癌における小細胞癌対腺癌対扁平上皮癌)、遺伝子発現パターン又は転写因子活性(例えば、乳癌におけるER状態)、コピー数異常(例えば、乳癌におけるHER2状態)、特異的再構成(例えば、AMLにおけるFLT3)、特異的遺伝子点変異状態(例えば、IDH遺伝子点変異)、及びDNAメチル化パターン(例えば、脳癌におけるMGMT遺伝子プロモーターのメチル化)に基づいて癌を識別する。
いくつかの実施形態では、工程(f)の比較は全ゲノムにわたって実施される。
他の実施形態では、工程(f)の比較は、全ゲノムから、特定の調節領域へ、例えば、限定されないが、FANTOM5エンハンサー、CpGアイランド、CpGショア、CpGシェルフ、又はこれらのいずれかの組み合わせに限定される。
いくつかの実施形態では、特定の工程は、コンピュータプロセッサにより実施される。
一態様では、癌細胞由来のDNAの存在を検出し、癌亜型を特定する方法であって、対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程と、癌細胞由来のDNAが特定される場合に、上記比較工程に基づいて原発の上記癌細胞組織及び癌亜型をさらに特定する工程とを備える方法が提供される。
一態様では、癌細胞由来のDNAの存在を検出して、2以上の可能性のある器官から上記癌細胞が発生した上記癌の場所を決定する方法であって、対象由来のセルフリーDNAの試料を準備する工程と、メチル化ポリヌクレオチドに選択的な結合剤を使用して、上記試料由来のセルフリーのメチル化DNAを捕捉する工程と、捕捉された上記セルフリーのメチル化DNAを配列決定する工程と、上記捕捉されたセルフリーのメチル化DNAの配列パターンを対照個体の2以上の母集団のDNA配列パターンと比較する工程であって、上記2以上の母集団の各々は、異なる器官に限局性癌を有する工程と、上記セルフリーDNAのメチル化のパターンと上記2以上の母集団うちの1つのメチル化のパターンとの間の統計的に有意な類似性に基づいて、どの器官で上記癌細胞が発生したかを決定する工程とを備える方法が提供される。
本発明のシステム及び方法は種々の実施形態で実施されてよい。好適に構成されたコンピュータデバイス、及び関連する通信ネットワーク、デバイス、ソフトウェア及びファームウェアは、1以上の上記の実施形態を実行するためのプラットフォームを提供してもよい。例として、図5は、記憶装置104に、及びランダムアクセスメモリ106に接続された中央処理装置(「CPU」)102を備えてもよい一般的なコンピュータデバイス100を示す。CPU102は、オペレーティングシステム101、アプリケーション・プログラム103、及びデータ123を処理してもよい。オペレーティングシステム101、アプリケーション・プログラム103、及びデータ123は、記憶装置104に保存され、必要に応じてメモリ106にロードされてもよい。コンピュータデバイス100は、CPU102から集中的な画像処理計算の負荷を減らしてこれらの計算をCPU102と並行して実行するために、CPU102に、及びメモリ106に作動可能に接続されているグラフィック処理装置(GPU)122をさらに備えてもよい。操作者107は、ビデオインターフェース105によって接続されたビデオディスプレー108、並びにI/Oインターフェース109によって接続されたキーボード115、マウス112、及びディスクドライブ又は半導体ドライブ114等の種々の入/出力装置を使用して、コンピュータデバイス100と対話してもよい。公知のように、マウス112は、ビデオディスプレー108におけるカーソルの移動を制御し、ビデオディスプレー108に現れる種々のグラフィカルユーザーインターフェース(GUI)コントロールをマウスボタンで操作するように構成されていてもよい。ディスクドライブ又は半導体ドライブ114は、コンピュータ可読媒体116を受け入れるように構成されていてもよい。コンピュータデバイス100は、ネットワークインターフェース111を介してネットワークの一部を形成して、コンピュータデバイス100が他の好適に構成されたデータ処理システム(図示せず)と通信することを可能にしてもよい。種々のソースからの入力を受信するために、1以上の異なる種類のセンサ135が使用されてもよい。
本発明のシステム及び方法は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ又はワイヤレスの手持ち式のものを含めた事実上任意の態様のコンピュータデバイスで実施されてよい。本発明のシステム及び方法は、1以上のコンピュータデバイスに本発明に係る方法における種々の工程の各々を実行することを可能にするためのコンピュータプログラムコードを備えるコンピュータ可読/可用媒体として実行されてもよい。複数のコンピュータデバイスが全体のオペレーションを実施する場合には、このオペレーションの種々の工程を分散させるために、それらのコンピュータデバイスはネットワーク化される。コンピュータ可読媒体又はコンピュータ可用媒体という用語は、プログラムコードの物理的実施形態の任意のタイプの1以上を含むということは理解される。特に、このコンピュータ可読/可用媒体は、1以上の携帯用の記憶用製品(例えば光ディスク、磁気ディスク、テープ等)に、コンピュータ及び/又は記憶システムに付随したメモリ等の計算装置の1以上のデータ記憶部分に内蔵されたプログラムコードを含むことができる。
一態様では、癌細胞由来のDNAの存在を検出し、癌亜型を特定するコンピュータ実装方法であって、少なくとも1つのプロセッサで、対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、上記少なくとも1つのプロセッサで、捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、上記少なくとも1つのプロセッサで、癌細胞由来のDNAの存在を特定する工程と、癌細胞由来のDNAが特定される場合、上記比較工程に基づいて上記原発癌細胞組織及び癌亜型をさらに特定する工程とを備える方法が提供される。
一態様では、プロセッサ及びこのプロセッサに接続されたメモリを有する汎用性コンピュータと組み合わせて使用するためのコンピュータプログラム製品であって、コンピュータメカニズムがエンコードされたコンピュータ可読記憶媒体を含み、上記コンピュータプログラムメカニズムが上記コンピュータの上記メモリにローディングされ、上記コンピュータに、本願明細書に記載される方法を実行させてもよいコンピュータプログラム製品が提供される。
一態様では、本願明細書に記載されるコンピュータプログラム製品を保存するためのデータ構造が保存されたコンピュータ可読媒体が提供される。
一態様では、癌細胞由来のDNAの存在を検出して癌亜型を特定するためのデバイスであって、少なくとも1つのプロセッサと、上記少なくとも1つのプロセッサと通信している電子メモリとを備え、上記電子メモリは、上記少なくとも1つのプロセッサで実行される場合に、上記少なくとも1つのプロセッサに、対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取ること、捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較すること、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定すること、並びに癌細胞由来のDNAが特定される場合に、上記比較工程に基づいて、上記原発癌細胞組織及び癌亜型をさらに特定することを実行させるプロセッサ実行可能なコードを保存するデバイスが提供される。
本願明細書で使用する場合、「プロセッサ」は、いずれのタイプのプロセッサ、例えば、いずれのタイプの汎用性マイクロプロセッサ又はマイクロコントローラ(例えば、Intel(商標)x86、PowerPC(商標)、ARM(商標)プロセッサ等)、デジタル信号処理(DSP)プロセッサ、集積回路、フィールドプログラマブルゲートアレイ(FPGA)、又はこれらのいずれかの組み合わせであってもよい。
本願明細書で使用する場合、「メモリ」は、内部に又は外部に置かれるいずれのタイプのコンピュータメモリ、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、コンパクトディスク読み出し専用メモリ(CDROM)、電気光学メモリ、磁気光学メモリ、消去可能なプログラマブル読み出し専用メモリ(EPROM)、及び電気的消去可能プログラム可能読み出し専用メモリ(EEPROM)等のうちの好適な組み合わせを含んでもよい。メモリ102の一部分は、従来のファイルシステムを使用して組織化され、デバイスの動作全体を支配するオペレーティングシステムにより制御され管理されてもよい。
本願明細書で使用する場合、「コンピュータ可読記憶媒体」(コンピュータ可読プログラムコードが内蔵された機械可読媒体、プロセッサ可読媒体又はコンピュータ可用媒体とも呼ばれる)は、コンピュータ又は機械によって可読のフォーマットでデータを保存することができる媒体である。機械可読媒体は、磁気的、光学的又は電気的な記憶媒体を含めたいずれの好適な有形の、非一過性の媒体、例えばディスケット、コンパクトディスク読み出し専用メモリ(CD−ROM)、メモリ素子(揮発性又は不揮発性)、又は類似の保存メカニズムであってよい。このコンピュータ可読記憶媒体は、実行されるときに、プロセッサに本開示の一実施形態に係る方法における工程を実行させる種々のセットの命令、コード配列、構成情報、又は他のデータを内蔵することができる。当業者は、記載された実行形態を実行するために必要な他の命令及びオペレーション(操作)は、コンピュータ可読記憶媒体に保存されることも可能であるということはわかるであろう。コンピュータ可読記憶媒体に保存された命令は、プロセッサ又は他の好適な処理装置によって実施されてよく、記載されたタスクを実行するための電気回路と整合されることが可能である。
本願明細書で使用する場合、「データ構造」は、データが効率的に使用することができるように、コンピュータにおいてデータを組織化する特定の方法である。データ構造は、データ構造上で実行することができるオペレーション及びそれらのオペレーションの計算複雑性を特定する1以上の特定の抽象データ型(ADT)を実行することができる。比較で、データ構造は、ADTによって与えられる仕様の具体的な実行形態である。
本発明の利点は、以下の実施例によりさらに例証される。本明細書中に示される実施例及びそれらの特定の詳細は、例証のためにのみ提示されており、本発明の特許請求の範囲に対する限定と解釈されるべきではない。
方法及び材料
提供者募集及び試料入手
CRC、乳癌、及びGBMの試料をUniversity Health Network BioBankから得て、AML試料をUniversity Health Network Leukemia BioBankから得て、最後に、健康な対照をカナダ、トロントのMount Sinai Hospital(MSH;マウントサイナイ病院)のFamily Medicine Centreを通して募集した。すべての試料を患者の承諾を得て集め、Research Ethics Board(研究倫理委員会)から、University Health Network及びカナダ、トロントのMount Sinai Hospitalから、機関承認を得て入手した。
検査試料加工−cfDNA
EDTA及びACD血漿試料は、BioBanksから、及びカナダ、トロントのMount Sinai Hospital(MSH)のFamily Medicine Centreから得た。すべての試料を、使用まで−80℃で、又は気相液体窒素中で保存した。セルフリーDNAは、QIAamp Circulating Nucleic Acid Kit(Qiagen(キアゲン))を使用して0.5〜3.5mlの血漿から抽出した。抽出したDNAは、使用に先立ってQubitにより定量した。
検査試料加工−PDX cfDNA
University Health NetworkのResearch Ethics Boardにより承認されたとおり、患者の同意を得てUniversity Health Network Biobankから得たヒト結直腸腫瘍組織を、コラゲナーゼAを使用して単一細胞へと消化した。単一細胞を、4〜6週齢のNOD/SCID雄マウスに皮下注射した。心臓穿刺による採血の前にCO2吸入によりマウスを安楽死させ、採取した血液をEDTA採血管に保存した。採取した血液試料から血漿を単離し、−80Cで保存した。セルフリーDNAは、QIAamp Circulating Nucleic Acid Kit(Qiagen)を使用して0.3〜0.7mlの血漿から抽出した。すべての動物研究は、University Health NetworkのAnimal Care Committee(動物管理委員会)によって承認された倫理規制を遵守して実施した。
cfMeDIP−seq
cfMeDIP−seqプロトコルの概略図は、国際公開第2017/190215号パンフレットに記載されている。cfMeDIPに先立って、上記DNA試料をKapa Hyper Prep Kit(Kapa Biosystems)を使用するライブラリ調製に供した。製造業者のプロトコルにいくらか変更を加えてそのプロトコルに従った。手短に言えば、注目するDNAを0.2mLのPCRチューブに加え、末端修復(エンドリペア)及びA−テーリングに供した。その後に、NEBNextアダプター(Illuminaキット用NEBNext Multiplex Oligos、New England Biolabs、から)を0.181μMの最終濃度で使用してアダプターライゲーションを行い、20℃で20分間インキュベーションし、AMPure XPビーズで精製した。溶出したライブラリを、USER酵素(New England Biolabs Canada)を使用して消化し、その後、MeDIPに先立ってQiagen MinElute PCR Purification Kitを用いて精製した。
調製したライブラリを、100ngの最終DNA量に、プールしたメチル化/非メチル化λPCR産物と合わせ、Taiwoら、2012[7]からのプロトコルをいくらか変更を加えて使用してMeDIPに供した。手短に言えば、MeDIPのために、Diagenode MagMeDIPキット(カタログ番号C02010021)を、製造業者のプロトコルにいくらか変更を加えてそのプロトコルに従って使用した。0.3ngの対照メチル化シロイヌナズナDNA及び0.3ngの対照非メチル化シロイヌナズナDNA、フィラーDNA(DNAの全量[cfDNA+フィラー+対照]を100ngにするため)及び緩衝液を、アダプターライゲーションしたDNAが入っているPCRチューブに添加した後、この試料を95℃に10分間加熱し、直後に氷水浴の中へ10分間入れた。各試料を、2つの0.2mLのPCRチューブに小分けし、一方は、10%インプット対照のためのものであり、他方は、免疫沈降にかけることになる試料のためのものであった。MagMeDIPキットからの含まれた5−mCモノクローナル抗体33D3(カタログ番号C15200081)を、希釈した抗体混合物を生成する前に1:15に希釈し、上記試料に加えた。洗浄した磁気ビーズ(製造業者の使用説明書に従った)も加え、その後に4℃で17時間インキュベーションした。この試料を、Diagenode iPure Kitを使用して精製し、50μlのBuffer Cで溶出した。反応(QC1)の成功は、添加したシロイヌナズナDNAの存在を検出するためのqPCRにより検証し、非メチル化添加DNAの%回収<1%及び反応の%特異度>99%(1−[添加非メチル化対照DNAの回収/添加メチル化対照DNAの回収]として算出)を確認して、その後で次の工程に進んだ。各ライブラリを増幅するための最適サイクル数は、qPCRの使用により決定し、この後でKAPA HiFi Hotstart Mastermixを使用して試料を増幅し、0.3μMの最終濃度までNEBNext multiplex oligosを加えた。このライブラリを増幅するために使用したPCR設定は以下のとおりであった:95℃で3分間の活性化、次いで98℃で20秒間、65℃で15秒間及び72℃で30秒間及び72℃で1分間の最終伸長の所定のサイクル。増幅したライブラリは、MinElute PCR精製カラムを使用して精製し、次いで、ゲルサイズを3% Nusieve GTGアガロースゲルを用いて選択して、アダプター二量体があればそれを除去した。配列決定に供する前に、メチル化ヒトDNA領域(精巣特異的H2B、TSH2B)及び非メチル化ヒトDNA領域(GAPDHプロモーター)の濃縮倍率を、セルフリーDNA(ATCCから得られる細胞系、Mycoplasma(マイコプラズマ)フリー)を模倣するように剪断されたHCT116細胞系DNAから生成されるMeDIP−seq及びcfMeDIP−seqライブラリについて測定した。最終ライブラリをBioAnalyzer分析に供した後、UHN Princess Margaret Genomic CentreにおいてIllumina HiSeq 2000で配列決定した。
点変異検出のための超深度標的配列決定
本発明者らは、QIAgen Circulating Nucleic Acidキットを使用して、Princess Margaret Cancer Centreにおいて初期臨床試験での登録前に作成された対応腫瘍組織分子プロファイリングデータを有する患者由来の約20mLの血漿(4〜5×10mLのEDTA採血管)からセルフリーDNAを単離した。細胞系(CRC及びMM細胞系の希釈)からPureGene Gentraキットを使用してDNAを抽出し、Covaris超音波処理器を使用して約180bpに断片化し、より大きいサイズの断片をAmpureビーズを使用して排除して、セルフリーDNAの断片サイズを模倣した。DNA配列決定ライブラリを、NEXTflex−96 DNA Barcodeアダプター(Bio Scientific、オースチン(Austin)、テキサス州)アダプターを利用するKAPA Hyper Prep Kit(Kapa Biosystems、ウィルミントン(Wilmington)、マサチューセッツ州)を使用して83ngの断片化DNAから構築した。既知の変異を含むDNA断片を単離するために、本発明者らは、Illumina TruSeq Amplicon Cancer Panelを使用して臨床検査室によって試験された48の遺伝子から変異ホットスポットを標的にしたビオチン化DNA捕捉プローブ(xGen Lockdown Custom Probe Mini Pool、Integrated DNA Technologies、コーラルビル(Coralville)、アイオワ州)を設計した。バーコードライブラリをプールし、次いでカスタムハイブリッド捕捉ライブラリを製造業者の使用説明書(IDT xGEN Lockdownプロトコルバージョン2.1)に従って適用した。これらの断片を、Illumina HiSeq 2000機器を使用して>10,000×リードカバレッジまで配列決定した。得られたリードをbwa−memを使用して整列(配列比較)し、変異をsamtools及びmuTectバージョン1.1.4を使用して検出した。
腫瘍特異的特徴の数とシークエンシング深度による検出確率との間の関係のモデル化
本発明者らは、145,000個のシミュレートされたゲノムを作成した。癌特異的メチル化DMRの割合は、0.001%、0.01%、0.1%、1%及び10%に設定し、それぞれ1、10、100、1000及び10000個の独立したDMRからなった。本発明者らは、14,500個の二倍体ゲノム(100ngのDNAに相当する)をこれらの最初の混合物から採取し、10、100、1000及び10000リード/遺伝子座をさらに採取して、これらの深さにおける配列決定カバレッジを表した。このプロセスを、カバレッジ、存在量及び特徴数の各組み合わせで100回繰り返した。本発明者らは、パラメータの各組み合わせで少なくとも1つのDMRの検出成功頻度を推定し、確率曲線をプロットして(図1A)、シークエンシング深度を条件とする検出成功確率に対する特徴数の影響を視覚的に評価した。
組織特有の特徴の誘導、多組織分類器の開発及び450kデータでの検証
cfDNA MeDIPプロファイルを、MEDIPS Rパッケージ[8]を使用して定量し、RPKMに換算し、その後、log2カウントパーミリオン(counts−per−million)に変換した。その後、線形モデルを、FANTOM5エンハンサー、CpGアイランド、CpGショア及びCpGシェルフにマッピングした特徴のマトリクス上でlimma−trend[9]を使用してフィッティングした。回収した添加メチル化DNAの百分率は、プルダウン効率変動量を制御するための共変量として含めた。ペアワイズ対比を組織種の各対について評価し、上位150及び下位150のDMRをエラスティックネット分類器訓練及び癌種特異性の検証のために選択した。性能測定基準は、交差検証における最高κ値を有するモデル、Chakravarthyらにおいて以前に用いられたヒューリスティクス[10]から、out−of−fold(データ外のデータ)のコールについてのクラス多数決(majority class vote)によって導かれた。
分類精度の評価のための機械学習分析
モデル訓練及び発見コホート上での評価
高い計算コストをかけずに腫瘍分類におけるcfMeDIPデータの性能を評価するために、本発明者らは、可能性のある候補特徴量の初期セットを、CpGアイランド、ショア、シェルフ及びFANTOM5エンハンサー(本明細書中では「規制特徴量」とラベルする)を包含するウィンドウ(範囲)に限縮し、196個の試料及び505,027個の特徴量のマトリクスを得た。本発明者らは、次に、caret Rパッケージを使用して、発見コホートデータを80%−20%方式で50の独立の訓練セット及びテストセットに分割した(図2A)。この分割を行ったが、発見コホートにわたるクラス割合を維持した。次いで、本発明者らは、各クラス対他クラスについてlimma−trendを使用して、訓練データパーティションでの調整t統計量(150過剰メチル化、150低メチル化)により上位300のDMRを選択した。次に、Cohen(コーエン)のκ(カッパ)を性能測定基準として使用して、混合パラメータの値(α(アルファ)、値=0、0.2、0.5、0.8及び1)及びペナルティ(λ(ラムダ)、値=0.01の増分で0〜0.05)を最適化するために、これらのDMRを使用して(最大300DMR×7個の他クラス=2100特徴量)、10分割交差検証(CV)の3回の反復の使用により二項GLMnetを訓練した。各訓練セットについて、これは、一群の6つの1クラス対他クラスの二項分類器を与えた。
次に、本発明者らは、AUROC(受信者動作特性曲線下部面積)を使用して、ホールドアウトテストセットで分類性能を推定した。これらの推定値は、分類の不偏尺度を表す。というのも、このホールドアウトテストセット試料は、DMR事前選択にもGLMnetの訓練及びチューニングにも使用されなかったからである。上記50個の独立の訓練セット及びテストセットも、訓練セットバイアスに起因して楽観的推定の最小化を可能にした。
検証コホートでのモデル評価
各検証コホートcfMeDIP試料について、本発明者らは、上記発見コホート内の上記50個の異なる訓練セットで訓練したAML、LUC及び健常の一対他の二項分類器についてクラス確率を推定した。上記50個のモデルからの確率を平均して単一スコアを生成し、この単一スコアを次にAUROC推定のために使用した。本発明者らは、早期LUC試料(ステージI及びII)又は末期LUC試料(ステージIII及びIV)のいずれかが一対他分類器のために残されたときにAUROCを推定することにより、疾患のステージが性能に影響を及ぼすかも評価した。
結果と考察
本発明者らは、0.001%〜10%まで異なる割合のctDNAを有する混合物を生物情報学的にシミュレーションした(図1A、列の面)。本発明者らは、ctDNAが1、10、100、1000、又は10000のDMR(可変メチル化領域)を有する状況も健常のcfDNAと比べてシミュレーションした(図1A、行の面)。次いで、リードを様々なシークエンシング深度で各遺伝子座においてサンプリングした(10×、100×、1000×、及び10000×)(図1A、x軸)。本発明者らは、癌ctDNAの存在量が少なく、カバレッジが浅いときでも、DMR数が増加すると少なくとも1つの癌特異的イベントの検出確率が高くなることを見出した(図1A)。
さらに、The Cancer Genome Atlas(TCGA)からのpan−cancerデータは、事実上すべての腫瘍型にわたって腫瘍組織と健常組織との間に多くのDMRを示した[11]。それゆえ、これらの知見は、癌特異的DNAメチル化異常をctDNAから成功裏に回収するアッセイが、低配列決定関連コストで悪性疾患を検出、分類及び追跡するための非常に感度が高いツールとして役立つことができることを強調した。
しかしながら、血漿cfDNA中のDNAメチル化の全ゲノムマッピングは、循環中のDNAの非常に少ない量及び断片化に起因して困難である[12]。結果として、cfDNAのメチル化プロファイリングに向けたこれまで試みは、結直腸癌スクリーニングのためのFDA承認のSEPT9メチル化アッセイ[13]等、主に遺伝子座特異的なPCRベースのアッセイに限られてきた[2、3]。最近の試みは、断片化されたcfDNAのwhole−genome bisulfite−sequencingを実施するためになされているが[14〜16]、CpGの低い全ゲノム存在量は、配列決定から入手できる有用なメチル化関連情報の量を減らす可能性が高い。それゆえ、血漿DNAに対するWGBSに関する主な問題は、高コストであり、低効率であり、そして亜硫酸水素塩変換に伴うDNAの損失である。他方、メチル化しやすいCpGリッチな特徴を選択的に濃縮する方法は、リードあたりに利用可能な有用な情報の量を最大にし、コストを下げ、DNA損失を減らす可能性が高い。
cfDNAメチル化マッピングに好適な全ゲノム方法
本発明者らは、セルフリーDNAを使用して全ゲノムDNAメチル化マッピングを行うための、cfMeDIP−seq(セルフリーのメチル化DNA免疫沈降及び高スループット配列決定)と呼ぶ新しい方法を開発した。ここで記載するcfMeDIP−seq方法は、本発明者らの経験では100ngのインプットDNAまで非常に堅牢である既存の低インプットMeDIP−seqプロトコル[7]の改変によって開発された。しかしながら、血漿試料の大部分は、100ngよりはるかに少ないDNAを与える。この難題を克服するために、本発明者らは、開始DNAの量を100ngまで人為的に高めるために、外来λDNA(フィラーDNA)をアダプターライゲーションしたcfDNAライブラリに添加した。これは、抗体による非特異的結合の量を最少にし、プラスチック製品との結合のために失われるDNAの量も最少にする。フィラーDNAは、アダプターライゲーションしたcfDNAライブラリにサイズが類似した増幅産物からなり、異なるCpG密度の非メチル化DNA及びインビトロメチル化DNAで構成された。異なる患者は異なる量のcfDNAを与えることになるので、このフィラーDNAの添加は実用にも役立ち、インプットDNA量を100ngに規準化することが可能になる。これによって、利用可能なcfDNAの量にかかわらず、すべての試料について下流のプロトコルが全く同じのままであるということが確保される。
本発明者らは、まず、cfDNAで認められたものと類似の断片サイズに剪断されたヒト結直腸癌細胞系HCT116からのDNAを使用して、cfMeDIP−seqプロトコルを検証した。公的なDNAメチル化データが利用可能であるため、HCT116を選んだ。本発明者らは、100ngの剪断細胞系DNAを使用する至適基準(ゴールドスタンダード)MeDIP−seqプロトコル[7]と10ng、5ng及び1ngの同じ剪断細胞系DNAを使用するcfMeDIP−seqプロトコルを同時に実施した。これを2つの生物的複製物において実施した。すべての条件で、本発明者らは、99%超の反応特異度(1−[添加非メチル化対照DNAの回収/添加メチル化対照DNAの回収])、及び非メチル化領域(GAPDH)に対する既知のメチル化領域(TSH2B0)の非常に高い濃縮を得た(図6B)。
上記ライブラリを、約3000〜7000万リード/ライブラリ(補遺の表1)で飽和まで配列決定した(図6A)。生のリードをヒトゲノム及び上記λゲノムの両方と整列させ、λゲノムと事実上アラインメントがないことが判明した(補遺の表1)。それゆえ、フィラーDNAとしての外来λDNAの添加は、配列決定データの生成を妨げなかった。最後に、本発明者らは、免疫沈降工程の品質管理手段としてCpG濃縮スコアを計算する[8]。すべてのライブラリはCpGに対して類似の濃縮を示したが、インプット対照は、予想通り、濃縮を示さず(図6C)、極低インプット(1ng)でも本発明者らの免疫沈降の有効性を確認した。
異なるインプットDNAレベルを比較する全ゲノム相関推定によれば、MeDIP−seq(100ng)法とcfMeDIP−seq(10、5及び1ng)法の両方が極めて堅牢であり、ピアソン相関が任意の2つの生物的複製物間で少なくとも0.94であった(図1B)。この分析の更に示すところによれば、5ng及び10ngのインプットDNAにおけるcfMeDIP−seqは、従来のMeDIP−seqによって100ngで得られるメチル化プロファイルを堅牢に再現することができる(少なくとも0.9のペアワイズピアソン相関)(図1B)。1ngのインプットDNAにおけるcfMeDIP−seqの性能は、100ngにおけるMeDIP−seqと比べて低下するが、それでも>0.7の強いピアソン相関を示す(図1B)。本発明者らは、cfMeDIP−seqプロトコルが、至適基準であるReduced Representation Bisulfite Sequencing(RRBS)及びWhole−Genome Bisulfite Sequencing(WGBS)を用いたHCT116のDNAメチル化プロファイルを再現することも認めた(図1C)。要するに、本発明者らのデータが示唆するところによれば、cfMeDIP−seqは、循環cfDNA等の断片化された低インプットDNA材料の全ゲノムメチル化マッピングの堅牢なプロトコルである。
cfMeDIP−seqは、腫瘍由来のctDNAの検出で高感度を示す
cfMeDIP−seqプロトコルの感度を評価するために、本発明者らは、結直腸癌(CRC)HCT116細胞系DNAを多発性骨髄腫(MM)MM1.S細胞系DNAに段階希釈した。どちらもcfDNAサイズを模倣するように剪断した。本発明者らは、CRC DNAを100%、10%、1%、0.1%、0.01%、0.001%から0%に希釈し、これらの希釈物の各々についてcfMeDIP−seqを行った。本発明者らは、同じ試料における3点変異の検出のために超深度(10,000×中央値(メジアン)カバレッジ)標的配列決定も行った。5%偽陽性率(FDR:False Discovery rate)閾値を用いた、純粋MM DNAに対する各CRC希釈ポイントで特定されたDMRの観察数は、希釈倍率に基づくDMRの予想数と0.001%希釈までほぼ完全に線形(r=0.99、p<0.0001)であった(図1D)。さらに、これらのDMR内のDNAメチル化シグナルも、観察対予想シグナルでほぼ完全な線形性を示す(r=0.99、p<0.0001)(図1E;補遺の表2B)。それに対して、1%希釈を超えると、超深度標的配列決定は、PCR又は配列決定誤差のために、CRC特異的変異体と偽変異体を確実に見分けることができなかった(図1F;補遺の表2A)。従って、cfMeDIP−seqは、癌由来のDNAの検出感度に優れ、標準プロトコルを用いた超深度標的配列決定による変異体検出の性能を超える。
癌DNAは、CpGリッチ領域において頻繁に過剰メチル化される[17]。cfMeDIP−seqはメチル化CpGリッチ配列を特異的に標的にするので、本発明者らは、ctDNAが免疫沈降手順中に優先的に濃縮されると仮定した。これを試験するために、本発明者らは、2人の結直腸癌患者から患者由来の異種移植片(PDX)を生成し、マウス血漿を収集した。腫瘍由来のヒトcfDNAは、インプット試料中の総cfDNAプール内で1%未満の頻度で存在し、免疫沈降後2倍の存在量で存在した(図1G;補遺の表3)。これらの結果の示唆するところによれば、ctDNAの偏りのある配列決定によって、cfMeDIP手順は、ctDNA検出感度を更に増加させることができた。
循環血漿cfDNAメチル化プロファイルは複数の癌種と健康な提供者とを見分けることができる
DNAメチル化パターンは、組織特異的であり、多くの他の癌種の中でもとりわけ、神経膠芽腫[18]、上衣腫[6]、結直腸癌[19]、及び乳癌[20、21]において癌患者を臨床的に関連する疾患部分群へと階層化するために使用されてきた。本発明者らは、cfDNA関連プロファイルが複数の腫瘍型に対して原発組織を特定するために使用することができるのではないかと疑問を持った。この目的のために、本発明者らは、5つの異なる腫瘍型由来の196個の試料及び早期及び末期の腫瘍由来の健常対照の特性を明らかにした。本発明者らは、線形モデル化を使用して、各一対比較のために、CpGショア、シェルフ、アイランド及びFANTOM5エンハンサーへの上位300のDMRのマッピングを特定し、全体で2,100個のユニークなDMRを導いた(図2A)。これらの特徴量のメチル化状態に基づく上記196個の血漿試料のt分布型確率的近傍埋め込み(tSNE)[22]に基づく密度クラスタ分析により、原発組織及び腫瘍型に基づく試料の別個のクラスタリングが明らかになった(図2B、図2C)。これらの特徴量とのエラスティックネット多癌分類器フィット(図2A)を使用して、本発明者らは、異なる腫瘍型の間の非常に正確な区別を観察した(図2D)。
疾患亜型の区別
本発明者らは、cfDNA MeDIPプロファイルが、5つの別個のケース − 遺伝子発現パターン(乳癌におけるER状態)、コピー数異常(乳癌におけるHER2状態)、再構成(AMLにおけるFLT3 ITD状態)、点変異(GBMにおけるIDH変異)、及び最後に肺癌における組織学 − における疾患亜型を区別する能力を評価した。いずれの場合も、線形モデルを使用して、これまでに記載したように特徴を選択しランク付けした。いずれの場合も、階層的クラスタ分析を使用して、試料のグループ分けを評価した。選択した特徴量のメチル化状態に基づくt分布型確率的近傍埋め込み(tSNE)[22]に基づく密度クラスタ分析により、癌亜型分類のこれらの5つの別個の例の各々に基づく試料の別個のクラスタリングが明らかになった。
機械学習を用いる癌の検出及び癌種の分類
cfMeDIPプロファイルが癌を検出しさらに癌種を分類する能力を厳密に評価するために、本発明者らは、次に、本発明者らの発見コホートで一連の機械学習分析を行った。高速の計算解析を可能にするために、本発明者らは、最初に、本発明者らのcfMeDIP発見コホートをCpGアイランド、ショア、シェルフ及びFANTOM5エンハンサー(n=505,027ウィンドウ)への特徴量マッピングに限縮した。本発明者らは、次に、本発明者らの発見コホート試料で、訓練セットバイアスを考慮しつつ、性能の不偏推定量を誘導するための戦略を実行した。
本実施例では、本発明者らは、発見コホートをバランスよく訓練セット及びテストセットに分割した(80%訓練セット、20%テストセット)。上記訓練セットの試料のみを使用して、本発明者らは、limma−trend検定統計量に基づいて、各クラス(試料の種類)対他クラスに対して上位300のDMRを選択し、上記訓練セットのデータ上でこれらの特徴量を使用して一連の一対他クラスGLMnetを訓練した。訓練手順は、Cohenのκに対して最適化したα及びλの値のグリッドにわたる3ラウンドの10分割交差検証(CV)からなっていた。多ラウンドの10分割CVの使用は、より一般化可能なモデルチューニングのためにさらなるランダム化を活用したいという考えに動機づけられたものであった。
次に、(DMR選択工程及びその後のGLMnet訓練/チューニング工程のあいだホールドアウトした)テストセット試料に由来するAUROC(受信者動作特性曲線下部面積)を使用して性能を評価した。訓練セットバイアスの影響を緩和するために、このプロセスを、発見コホートの訓練セット及びテストセットへの50個の異なる分割を用いて繰り返した。これは、結果的に、各一対他クラス比較に対して50個のモデル(全部で480個のモデル)のコレクションを生じた。ここでは、本発明者らは、このモデルのコレクションをE50と称する。
その後、本発明者らは、追加の152の血漿試料:AML(n=35)、肺癌(n=55)及び健康な対照(n=62)の試料の検証コホート、を生成することによりバッチ間で性能を評価した。各クラスに対して、本発明者らは、E50において上記モデルにより出力されたクラス確率を平均し、1クラス対すべての他クラスに対するAUROCを推定した(図3A)。この分類器は、AML対その他(0.993)、LUC対その他(0.943)及び健常対その他(1.000)の分類に対して高いAUROC値を示した。このことは、機械学習手法と組み合わせたcfMeDIP−seqが腫瘍型を正確に検出し分類する能力をさらに裏付けた。最後に、本発明者らは、この分類器が早期試料(0.950)において末期試料(0.934)と同程度に正確であること(図3B)を観察し、このことは、この手法が癌の早期検出並びに早期及び末期の両方で癌の検出に応用可能であるということを示唆した。
cfMeDIP−seqを用いるcfDNAメチロームプロファイリングのさらなる利点
cfDNAメチル化パターンが原発組織を正確に表す能力は、変異ベースのアッセイの限界も克服し、原発組織に対する特異性は、異なる組織における癌にわたる多くの潜在的なドライバー変異の再発性に起因して低い可能性がある[23]。変異ベースのアッセイも、腫瘍のクローン構造により低感度になる可能性があり、サブクローナルドライバーはctDNA中の低存在量のために検出しにくい可能性がある[24]。変異ベースのctDNA手法は、良性組織におけるドライバー変異による潜在的な交絡に対しても脆弱であり、このことは観察されており[25]、正の選択の根拠を提示すると文献に記載されている[26]。
これらを合わせると、− これまでに誘導されたうちで癌cfDNAメチロームの最大のコレクションに基づく − 本発明者らの知見は、cfMeDIP−seqを、癌の管理及び早期検出に影響を及ぼす潜在能力を有する効率的で費用効率が高いツールとして確立する。cfMeDIP−seqの精度及び多用途性は、耐性がエピジェネティックな変異に相関する状況、例えば前立腺癌におけるアンドロゲン受容体阻害への感受性[27]等における治療上の決定を伝えるために有用でありうる。早期の診断及びスクリーニングに対する潜在的な機会は、肺癌において特に明らかである可能性がある。というのも、この肺癌は、スクリーニングがすでに臨床上の有用性を示している疾患であり、既存のスクリーニング試験(すなわち、低線量CTスキャン)が電離放射線曝露及び高偽陽性率等の重大な制限を有する疾患であるからである。
結論として、本発明者らの知見は、非侵襲性の、費用効率が高い、高感度の、非常に正確な早期の腫瘍検出、多癌分類、及び癌亜型分類のための基礎としてのcfDNAメチル化プロファイルの有用性を強調する。
本発明の好ましい実施形態が本願明細書に記載されたが、本発明の趣旨又は添付の特許請求の範囲から逸脱せずに上記の実施形態に変更がなされてもよいことは当業者に理解されよう。以下の参考文献リストにあるものを含め、本願明細書に開示されるすべての文献は、参照により援用される。
参考文献リスト
1. Diaz,L.A.,Jr.及びA.Bardelli, Liquid biopsies:genotyping circulating tumor DNA. J Clin Oncol,2014.32(6):579−86頁。
2. Lehmann−Werman,R.ら, Identification of tissue−specific cell death using methylation patterns of circulating DNA. Proc Natl Acad Sci USA,2016.113(13):E1826−34頁。
3. Visvanathan,K.ら, Monitoring of Serum DNA Methylation as an Early Independent Marker of Response and Survival in Metastatic Breast Cancer:TBCRC 005 Prospective Biomarker Study. J Clin Oncol,2016:JCO2015662080頁。
4. Newman,A.M.ら, An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage. Nat Med,2014.20(5):548−54頁。
5. Aravanis,A.M.,M.Lee,及びR.D.Klausner, Next−Generation Sequencing of Circulating Tumor DNA for Early Cancer Detection. Cell,2017.168(4):571−574頁。
6. Mack,S.C.ら, Epigenomic alterations define lethal CIMP−positive ependymomas of infancy. Nature,2014.506(7489):445−50頁。
7. Taiwo,O.ら, Methylome analysis using MeDIP−seq with low DNA concentrations. Nat Protoc,2012.7(4):617−36頁。
8. Lienhard,M.ら、MEDIPS:genome−wide differential coverage analysis of sequencing data derived from DNA enrichment experiments. Bioinformatics,2014.30(2):284−6頁。
9. Law,C.W.ら, voom:Precision weights unlock linear model analysis tools for RNA−seq read counts. Genome Biol,2014.15(2):R29頁。
10. Chakravarthy,A.ら, Human Papillomavirus Drives Tumor Development Throughout the Head and Neck:Improved Prognosis Is Associated With an Immune Response Largely Restricted to the Oropharynx. J Clin Oncol,2016.34(34):4132−4141頁。
11. Hoadley,K.A.ら, Multiplatform analysis of 12 cancer types reveals molecular classification within and across tissues of origin. Cell,2014.158(4):929−44頁。
12. Fleischhacker,M.及びB.Schmidt, Circulating nucleic acids (CNAs) and cancer−−a survey. Biochim Biophys Acta,2007.1775(1):181−232頁。
13. Potter,N.T.ら, Validation of a real−time PCR−based qualitative assay for the detection of methylated SEPT9 DNA in human plasma. Clin Chem,2014.60(9):1183−91頁。
14. Legendre,C.ら, Whole−genome bisulfite sequencing of cell−free DNA identifies signature associated with metastatic breast cancer. Clin Epigenetics,2015.7:100頁。
15. Sun,K.ら, Plasma DNA tissue mapping by genome−wide methylation sequencing for noninvasive prenatal, cancer, and transplantation assessments. Proc Natl Acad Sci USA,2015.112(40):E5503−12頁。
16. Chan,K.C.ら, Noninvasive detection of cancer−associated genome−wide hypomethylation and copy number aberrations by plasma DNA bisulfite sequencing. Proc Natl Acad Sci USA,2013.110(47):18761−8頁。
17. Sharma,S.,T.K.Kelly,及びP.A.Jones, Epigenetics in cancer. Carcinogenesis,2010. 31(1):27−36頁。
18. Sturm,D.ら, Hotspot mutations in H3F3A and IDH1 define distinct epigenetic and biological subgroups of glioblastoma. Cancer Cell,2012.22(4):425−37頁。
19. Hinoue,T.ら, Genome−scale analysis of aberrant DNA methylation in colorectal cancer. Genome Res,2012.22(2):271−82頁。
20. Stirzaker,C.ら, Methylome sequencing in triple−negative breast cancer reveals distinct methylation clusters with prognostic value. Nat Commun,2015.6:5899頁。
21. Fang,F.ら, Breast cancer methylomes establish an epigenomic foundation for metastasis. Sci Transl Med,2011.3(75):75ra25頁。
22. Laurens van der Maaten,G.H., Visualizing Data using t−SNE. Journal of Machine Learning Research,2008.9:2579−2605頁。
23. Kandoth,C.ら, Mutational landscape and significance across 12 major cancer types. Nature,2013.502(7471):333−9頁。
24. McGranahan,N.ら, Clonal status of actionable driver events and the timing of mutational processes in cancer evolution. Sci Transl Med,2015.7(283):283ra54頁。
25. Zauber,P.,S.Marotta,及びM.Sabbath−Solitare, KRAS gene mutations are more common in colorectal villous adenomas and in situ carcinomas than in carcinomas. Int J Mol Epidemiol Genet,2013.4(1):1−10頁。
26. Martincorena,I.ら, Tumor evolution. High burden and pervasive positive selection of somatic mutations in normal human skin. Science,2015.348(6237):880−6頁。
27. Beltran,H.ら, Divergent clonal evolution of castration−resistant neuroendocrine prostate cancer. 2016.22(3):298−305頁。

Claims (38)

  1. 対象における癌細胞由来のDNAの存在を検出する方法であって、
    (a)対象由来のセルフリーDNAの試料を準備する工程と、
    (b)前記試料をライブラリ調製に供して、引き続く前記セルフリーのメチル化DNAの配列決定を可能にする工程と、
    (c)第1量のフィラーDNAを前記試料に加え、次いで任意選択的に前記試料を変性する工程であって、前記フィラーDNAの少なくとも一部分がメチル化されている工程と、
    (d)メチル化ポリヌクレオチドに選択的な結合剤を使用して、セルフリーのメチル化DNAを捕捉する工程と、
    (e)捕捉された前記セルフリーのメチル化DNAを配列決定する工程と、
    (f)前記捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、
    (g)前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程と
    を備える方法。
  2. 前記試料が、前記対象の血液又は血漿に由来する請求項1に記載の方法。
  3. 比較工程(f)が、統計的分類器を使用するフィットに基づく請求項1又は請求項2に記載の方法。
  4. 前記分類器が機械学習由来である請求項3に記載の方法。
  5. 前記分類器が、エラスティックネット分類器、lasso、サポートベクターマシン、ランダムフォレスト、又はニューラルネットワークである請求項4に記載の方法。
  6. 健康な個体及び癌性個体由来の前記対照のセルフリーのメチル化DNA配列が、健康な個体と癌性個体との間の可変メチル化領域(DMR)のデータベースに含まれる請求項1から請求項5のいずれか一項に記載の方法。
  7. 健康な個体及び癌性個体由来の前記対照のセルフリーのメチル化DNA配列が、セルフリーDNA由来のDNAにおいて健康な個体と癌性個体との間で差次的にメチル化されている対照のセルフリーのメチル化DNA配列に限定される請求項1から請求項6のいずれか一項に記載の方法。
  8. 前記対照のセルフリーのメチル化DNA配列が、血漿由来のDNAにおいて健康な個体と癌性個体との間で差次的にメチル化されている請求項7に記載の方法。
  9. 前記試料が、100ng未満、75ng未満、又は50ng未満のセルフリーDNAを有する請求項1から請求項8のいずれか一項に記載の方法。
  10. 前記第1量のフィラーDNAが、約5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、又は100%のメチル化フィラーDNAを含み、残部が非メチル化フィラーDNAであり、好ましくは5%〜50%、10%〜40%、又は15%〜30%がメチル化フィラーDNAである請求項1から請求項9のいずれか一項に記載の方法。
  11. 前記第1量のフィラーDNAが20ng〜100ng、好ましくは30ng〜100ng、より好ましくは50ng〜100ngである請求項1から請求項9のいずれか一項に記載の方法。
  12. 前記試料由来のセルフリーDNA及び前記第1量のフィラーDNAが、合わせて少なくとも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む請求項1から請求項11のいずれか一項に記載の方法。
  13. 前記フィラーDNAが50bp〜800bp長、好ましくは100bp〜600bp長、より好ましくは200bp〜600bp長である請求項1から請求項12のいずれか一項に記載の方法。
  14. 前記フィラーDNAが二本鎖である請求項1から請求項13のいずれか一項に記載の方法。
  15. 前記フィラーDNAがジャンクDNAである請求項1又は請求項2に記載の方法。
  16. 前記フィラーDNAが内在DNA又は外来DNAである請求項1から請求項3のいずれか一項に記載の方法。
  17. 前記フィラーDNAが非ヒトDNA、好ましくはλDNAである請求項16に記載の方法。
  18. 前記フィラーDNAがヒトDNAに対するアラインメントを有しない請求項1から請求項17のいずれか一項に記載の方法。
  19. 前記結合剤が、メチルCpG結合ドメインを含むタンパク質である請求項1から請求項18のいずれか一項に記載の方法。
  20. 前記タンパク質がMBD2タンパク質である請求項1から請求項19のいずれか一項に記載の方法。
  21. 工程(d)が、抗体を使用して前記セルフリーのメチル化DNAを免疫沈降させることを含む請求項1から請求項20のいずれか一項に記載の方法。
  22. 免疫沈降のために少なくとも0.05μg、好ましくは少なくとも0.16μgの前記抗体を前記試料に加えることを含む請求項21に記載の方法。
  23. 前記抗体が5−MeC抗体である請求項21に記載の方法。
  24. 前記免疫沈降反応を確認するために、工程(c)後に第2量の対照DNAを前記試料に加える工程をさらに備える請求項21に記載の方法。
  25. セルフリーのメチル化DNAの捕捉を確認するために、工程(c)後に第2量の対照DNAを前記試料に加える工程をさらに備える請求項1から請求項23のいずれか一項に記載の方法。
  26. 癌細胞由来のDNAの存在を特定する工程が、原発癌細胞組織を特定することをさらに備える請求項1から請求項25のいずれか一項に記載の方法。
  27. 前記原発癌細胞組織を特定することが、癌亜型を特定することをさらに備える請求項26に記載の方法。
  28. 前記癌亜型が、ステージ、組織学、遺伝子発現パターン、コピー数異常、再構成、又は点変異状態に基づいて前記癌を識別する請求項27に記載の方法。
  29. 工程(f)の比較が全ゲノムにわたって実施される請求項1から請求項28のいずれか一項に記載の方法。
  30. 工程(f)の比較が全ゲノムから特定の調節領域に限定される請求項1から請求項28のいずれか一項に記載の方法。
  31. 前記調節領域が、FANTOM5エンハンサー、CpGアイランド、CpGショア、CpGシェルフ、又はこれらのいずれかの組み合わせである請求項30に記載の方法。
  32. 工程(f)及び工程(g)がコンピュータプロセッサにより実施される請求項1から請求項31のいずれか一項に記載の方法。
  33. 癌細胞由来のDNAの存在を検出し、癌亜型を特定する方法であって、
    a. 対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、
    b. 捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、
    c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程と、
    d. 工程c.からの癌細胞由来のDNAが特定される場合、工程bの比較に基づいて、原発癌細胞組織及び癌亜型をさらに特定する工程と
    を備える方法。
  34. 癌細胞由来のDNAの存在を検出し、癌亜型を特定するコンピュータ実装方法であって、
    a. 少なくとも1つのプロセッサで、対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、
    b. 前記少なくとも1つのプロセッサで、捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、
    c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、前記少なくとも1つのプロセッサで、癌細胞由来のDNAの存在を特定し、工程c.からの癌細胞由来のDNAが特定される場合、工程bの比較に基づいて、原発癌細胞組織及び癌亜型をさらに特定する工程と
    を備える方法。
  35. プロセッサ及び前記プロセッサに接続されたメモリを有する汎用性コンピュータと組み合わせて使用するためのコンピュータプログラム製品であって、コンピュータメカニズムがエンコードされたコンピュータ可読記憶媒体を含み、前記コンピュータプログラムメカニズムが前記コンピュータの前記メモリにローディングされ、前記コンピュータに請求項34に記載の方法を実行させてもよいコンピュータプログラム製品。
  36. 請求項35に記載のコンピュータプログラム製品を保存するためのデータ構造が保存されたコンピュータ可読媒体。
  37. 癌細胞由来のDNAの存在を検出して癌亜型を特定するためのデバイスであって、
    少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信している電子メモリと
    を備え
    前記電子メモリは、前記少なくとも1つのプロセッサで実行される場合に、前記少なくとも1つのプロセッサに、
    a. 対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取ることと、
    b. 捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較することと、
    c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定し、癌細胞由来のDNAが特定される場合に、工程bの比較に基づいて、原発癌細胞組織及び癌亜型をさらに特定することと
    を実行させるプロセッサ実行可能なコードを保存するデバイス。
  38. 癌細胞由来のDNAの存在を検出して、2以上の可能性のある器官から前記癌細胞が発生した前記癌の場所を決定する方法であって、
    (a)対象由来のセルフリーDNAの試料を準備する工程と、
    (b)メチル化ポリヌクレオチドに選択的な結合剤を使用して、前記試料由来のセルフリーのメチル化DNAを捕捉する工程と、
    (c)捕捉された前記セルフリーのメチル化DNAを配列決定する工程と、
    (d)前記捕捉されたセルフリーのメチル化DNAの配列パターンを対照個体の2以上の母集団のDNA配列パターンと比較する工程であって、前記2以上の母集団の各々は、異なる器官に限局性癌を有する工程と、
    (e)前記セルフリーDNAのメチル化のパターンと前記2以上の母集団のうちの1つのメチル化のパターンとの間の統計的に有意な類似性に基づいて、どの器官で前記癌細胞が発生したかを決定する工程と
    を備える方法。
JP2020501564A 2017-07-12 2018-07-11 メチローム解析を用いる癌の検出及び分類 Pending JP2020537487A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023119203A JP2023139162A (ja) 2017-07-12 2023-07-21 メチローム解析を用いる癌の検出及び分類

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762531527P 2017-07-12 2017-07-12
US62/531,527 2017-07-12
PCT/CA2018/000141 WO2019010564A1 (en) 2017-07-12 2018-07-11 DETECTION AND CLASSIFICATION OF CANCER USING METHYLOME ANALYSIS

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023119203A Division JP2023139162A (ja) 2017-07-12 2023-07-21 メチローム解析を用いる癌の検出及び分類

Publications (2)

Publication Number Publication Date
JP2020537487A true JP2020537487A (ja) 2020-12-24
JP2020537487A5 JP2020537487A5 (ja) 2021-08-19

Family

ID=65000926

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020501564A Pending JP2020537487A (ja) 2017-07-12 2018-07-11 メチローム解析を用いる癌の検出及び分類
JP2023119203A Pending JP2023139162A (ja) 2017-07-12 2023-07-21 メチローム解析を用いる癌の検出及び分類

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023119203A Pending JP2023139162A (ja) 2017-07-12 2023-07-21 メチローム解析を用いる癌の検出及び分類

Country Status (8)

Country Link
US (1) US20220251665A1 (ja)
EP (1) EP3652741A4 (ja)
JP (2) JP2020537487A (ja)
KR (2) KR102628878B1 (ja)
CN (1) CN111094590A (ja)
BR (1) BR112020000681A2 (ja)
CA (1) CA3069754A1 (ja)
WO (1) WO2019010564A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018119452A2 (en) 2016-12-22 2018-06-28 Guardant Health, Inc. Methods and systems for analyzing nucleic acid molecules
CN109097439A (zh) * 2018-09-04 2018-12-28 上海交通大学 一种检测少量样品全基因组dna甲基化的方法
CN114616343A (zh) 2019-09-30 2022-06-10 夸登特健康公司 用于在甲基化分区测定中分析无细胞dna的组合物和方法
AU2020361591A1 (en) * 2019-10-11 2022-05-19 Grail, Llc Cancer classification with tissue of origin thresholding
JP2023502018A (ja) * 2019-11-06 2023-01-20 ユニバーシティー ヘルス ネットワーク 無細胞medipシークエンシングのための合成スパイクイン対照及びその使用方法
CN111154846A (zh) * 2020-01-13 2020-05-15 四川大学华西医院 一种甲基化核酸的检测方法
WO2021227950A1 (zh) * 2020-05-09 2021-11-18 广州燃石医学检验所有限公司 癌症预后方法
IL299157A (en) * 2020-06-19 2023-02-01 Univ Health Network Multimodal analysis of circulating cancer nucleic acid molecules
CN112382342A (zh) * 2020-11-24 2021-02-19 山西三友和智慧信息技术股份有限公司 一种基于集成特征选择的癌症甲基化数据分类方法
CN114507737A (zh) * 2022-03-22 2022-05-17 杭州医学院 一种石棉相关疾病甲基化标记物的检测引物组合、试剂盒及扩增子测序文库的构建方法
KR102491322B1 (ko) * 2022-03-29 2023-01-27 주식회사 아이엠비디엑스 암 진단을 위한 다중 분석 예측 모델의 제조 방법
WO2023230289A1 (en) * 2022-05-25 2023-11-30 Adela, Inc. Methods and systems for cell-free nucleic acid processing
CN115274124B (zh) * 2022-07-22 2023-11-14 江苏先声医学诊断有限公司 一种基于数据驱动的肿瘤早筛靶向Panel和分类模型的动态优化方法
US20240055073A1 (en) * 2022-07-25 2024-02-15 Grail, Llc Sample contamination detection of contaminated fragments with cpg-snp contamination markers
CN115376616B (zh) * 2022-10-24 2023-04-28 臻和(北京)生物科技有限公司 一种基于cfDNA多组学的多分类方法及装置
WO2024091028A1 (ko) * 2022-10-28 2024-05-02 주식회사 클리노믹스 Cell-free dna를 이용한 건강 및 질병관리 시스템 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015536639A (ja) * 2012-09-20 2015-12-24 ザ チャイニーズ ユニバーシティ オブ ホンコン 血漿による胎児または腫瘍のメチロームの非侵襲的決定
WO2016115530A1 (en) * 2015-01-18 2016-07-21 The Regents Of The University Of California Method and system for determining cancer status

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010065940A1 (en) * 2008-12-04 2010-06-10 The Regents Of The University Of California Materials and methods for determining diagnosis and prognosis of prostate cancer
TWI813141B (zh) * 2014-07-18 2023-08-21 香港中文大學 Dna混合物中之組織甲基化模式分析
WO2016094330A2 (en) * 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
CN109415763A (zh) * 2016-05-03 2019-03-01 大学健康网络 捕获无细胞的甲基化dna的方法及其用途

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015536639A (ja) * 2012-09-20 2015-12-24 ザ チャイニーズ ユニバーシティ オブ ホンコン 血漿による胎児または腫瘍のメチロームの非侵襲的決定
WO2016115530A1 (en) * 2015-01-18 2016-07-21 The Regents Of The University Of California Method and system for determining cancer status

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NATURE PROTOCOLOLS, vol. 7, JPN7022001948, 2012, pages 617 - 636, ISSN: 0005142000 *

Also Published As

Publication number Publication date
EP3652741A4 (en) 2021-04-21
WO2019010564A1 (en) 2019-01-17
KR102628878B1 (ko) 2024-01-23
KR20200032127A (ko) 2020-03-25
CN111094590A (zh) 2020-05-01
EP3652741A1 (en) 2020-05-20
JP2023139162A (ja) 2023-10-03
KR20240018667A (ko) 2024-02-13
US20200308651A1 (en) 2020-10-01
US20220251665A1 (en) 2022-08-11
BR112020000681A2 (pt) 2020-07-14
CA3069754A1 (en) 2019-01-17

Similar Documents

Publication Publication Date Title
KR102628878B1 (ko) 메틸롬 분석을 이용한 암 검출 및 분류
US20210230684A1 (en) Methods and systems for high-depth sequencing of methylated nucleic acid
US11560558B2 (en) Methods of capturing cell-free methylated DNA and uses of same
US20230167507A1 (en) Cell-free dna methylation patterns for disease and condition analysis
US20210156863A1 (en) Cancer detection, classification, prognostication, therapy prediction and therapy monitoring using methylome analysis
JP2018512048A (ja) 癌スクリーニング及び胎児分析のための変異検出
JP2023524627A (ja) 核酸のメチル化分析による結腸直腸癌を検出するための方法およびシステム
CN111742059A (zh) 用于靶向测序的模型
KR20220032525A (ko) 잔류 질병을 검출하기 위한 방법 및 시스템
KR20230025895A (ko) 순환 종양 핵산 분자의 다중모드 분석
US20230203473A1 (en) Methods of capturing cell-free methylated dna and uses of same
US12031184B2 (en) Cancer detection and classification using methylome analysis
EP4234720A1 (en) Epigenetic biomarkers for the diagnosis of thyroid cancer
KR20240104202A (ko) 순환 종양 핵산 분자의 다중모드 분석
WO2023230289A1 (en) Methods and systems for cell-free nucleic acid processing
WO2023107709A1 (en) Methods and systems for generating sequencing libraries
KR20240046525A (ko) 세포-유리 dna에 대한 tet-보조 피리딘 보란 시퀀싱과 관련된 조성물 및 방법
EP4341441A1 (en) Dna methylation biomarkers for hepatocellular carcinoma

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200917

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20200917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20200917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210709

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210709

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20210929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20211006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220426

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220427

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230721

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230728

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20230908