JP2023145696A - 無細胞ウイルス核酸を用いる癌スクリーニングの強化 - Google Patents

無細胞ウイルス核酸を用いる癌スクリーニングの強化 Download PDF

Info

Publication number
JP2023145696A
JP2023145696A JP2023126899A JP2023126899A JP2023145696A JP 2023145696 A JP2023145696 A JP 2023145696A JP 2023126899 A JP2023126899 A JP 2023126899A JP 2023126899 A JP2023126899 A JP 2023126899A JP 2023145696 A JP2023145696 A JP 2023145696A
Authority
JP
Japan
Prior art keywords
methylation
dna
subjects
cell
sites
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023126899A
Other languages
English (en)
Inventor
ユク-ミン デニス ロー
Dennis Lo Yuk-Ming
ロッサ ワイ クン チウ
Kwun Rossa Chiu Wai
クワン チー チャン
Kwan Chee Chan
ペイヨン チアン
Peiyong Jiang
ワイ ケイ ラム
Wai Kei Lam
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Publication of JP2023145696A publication Critical patent/JP2023145696A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/705Specific hybridization probes for herpetoviridae, e.g. herpes simplex, varicella zoster
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/706Specific hybridization probes for hepatitis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/708Specific hybridization probes for papilloma
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Virology (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

【課題】初期ステージでの腫瘍を検出するための感度および/または特異度を有する方法を提供すること。【解決手段】生体試料の混合物中の無細胞DNA分子を分析して、ウイルスDNAを検出することができる。ウイルスゲノムの1つ以上の部位でのウイルスDNA分子のメチル化を決定することができる。混合物メチル化レベル(複数可)は、特定のウイルスゲノムの部位(複数可)のセットにおいてメチル化された複数の無細胞DNA分子のうちの1つ以上の量に基づいて測定することができる。混合物メチル化レベル(複数可)は、様々な方法で、例えば、ある部位で、または複数の部位もしくは領域にわたってメチル化される無細胞DNA分子の密度として決定されることができる。混合物メチル化レベル(複数可)は、例えば、他の対象の少なくとも2つのコホートから決定された参照メチル化レベル(複数可)と比較することができる。コホートは、特定のウイルスゲノムに関連した異なる分類(第1の病態を含む)を有することができる。対象が第1の病態を有するかどうかの第1の分類は、比較に基づいて決定することができる。【選択図】 なし

Description

関連出願の相互参照
本出願は、「Enhancement Of Cancer Screening Using Cell-Free Viral Nucleic Acids」と題された、2017年7月26日に出願された米国仮特許出願第62/537,328号の優先権を主張し、かつその非仮出願である。その全内容はすべての目的のために参照により本明細書に組み込まれる。
腫瘍細胞が腫瘍由来DNAを血流に放出するという発見は、無細胞試料(血漿など)を使用して対象における腫瘍の存在、位置、および/またはタイプを決定することができる非侵襲的方法の開発を巻き起こした。多くの腫瘍は、発生初期に発見されれば治療可能であり得る。しかし、現在の方法では、初期ステージでの腫瘍を検出するための感度および/または特異度が欠けている可能性があり、多数の偽陽性または偽陰性の結果を返し得る。例えば、特定のウイルスは癌に関連するが、癌ではない対象においてウイルスDNAを検出することができ、それによって偽陽性の結果が生じる。
検査の感度とは、ある病態に対して陽性の対象がその病態に対して陽性となる可能性を指し得る。検査の特異度とは、ある病態に対して陰性の対象がその病態に対して陰性となる可能性を指し得る。腫瘍の早期検出のためのアッセイでは、感度や特異度の問題が誇張される場合があり得る。例えば、そのような腫瘍検出方法が実行される試料は腫瘍由来を比較的少量しか含み得ず、初期ステージで検査された個体間では病態自体が比較的低い有病率となるためである。したがって、腫瘍の検出により高い感度および/または特異度を有する方法には臨床的必要性がある。
実施形態は、例えば、ヒトなどの動物界における対象の生体試料を分析するためのシステム、装置、および方法を提供する。生体試料の混合物中の無細胞DNA分子を分析して、例えば、特定のウイルスゲノムにおける位置を決定することにより、ウイルスDNAを検出することができる。ウイルスゲノムの1つ以上の部位におけるウイルスDNAのメチル化状態を決定することができる。混合物メチル化レベル(複数可)は、特定のウイルスゲノムの部位(複数可)のセットにおいてメチル化された複数の無細胞DNA分子のうちの1つ以上の量に基づいて測定することができる。混合物メチル化レベル(複数可)は、様々な方法で、例えば、特定の部位でまたは複数の部位にわたって、場合によっては複数の領域(各領域は1つ以上の部位を含む)にわたって、メチル化される無細胞DNA分子のパーセンテージ/密度として決定されることができる。
混合物メチル化レベル(複数可)は、例えば、他の対象の少なくとも2つのコホートから決定された参照メチル化レベル(複数可)と比較することができる。コホートは、特定のウイルスゲノムに関連した異なる分類(第1の病態を含む)を有することができる。他のコホート(複数可)は、他の病態(複数可)に対応することができる。この比較は、様々な方法で、例えば、N個のメチル化レベルの多次元ポイントを形成し、N個の参照メチル化レベルとの差を決定することによって、実行されることができる。対象が第1の病態を有するかどうかの第1の分類は、この比較に基づいて決定することができる。
本開示のこれらおよび他の実施形態を、以下で詳細に説明する。例えば、他の実施形態は、本明細書に記載の方法に関連付けられたシステム、デバイス、およびコンピューター可読媒体に関する。
本開示の実施形態の性質および利点のより良好な理解は、以下の詳細な説明および添付の図面を参照して得ることができる。
本開示の実施形態による標的化バイサルファイト配列決定のための捕捉プローブの設計を示す。 本開示の実施形態による、伝染性単核球症、鼻咽頭癌(NPC)、およびナチュラルキラー(NK)-T細胞リンパ腫の患者におけるエプスタイン・バーウイルス(EBV)ゲノム全体におけるCpG部位のメチル化密度を示す。 本開示の実施形態による、初期ステージNPC(ステージI)を有するスクリーニングコホートからの患者(AL038)における血漿EBV DNAのメチル化プロファイルを示す。 本開示の実施形態による、異なる病態を有する2人の患者間のEBVゲノム全体におけるCpG部位のメチル化密度の差を示す。 本開示の実施形態による、NPC(TBR1392およびTBR1416)を有する2人の患者間のEBVゲノム全体におけるCpG部位のメチル化密度の差を示す。 本開示の実施形態による、初期ステージNPCを有する患者(AO050)と血漿EBV DNAの偽陽性結果を有する対象(HB002)との間の血漿EBV DNAのメチル化パターンの差を示す。 本開示の実施形態による、ある患者のEBVゲノム全体におけるCpG部位のメチル化密度(x軸)と、他の患者の同じCpG部位の対応するメチル化密度(y軸)を示すドットプロットである。 本開示の実施形態による、伝染性単核球症(IM)(n=2)、EBV関連リンパ腫(n=3)、一時的陽性の血漿EBV DNA(n=3)、持続的陽性の血漿EBV DNA(n=3)、およびNPC(n=6)を有する対象におけるEBVゲノムのCpG部位に基づく血漿EBV DNAのメチル化割合を示す。 本開示の実施形態による、第1の選択基準を満たす特異的メチル化領域(DMR)のマイニングを示す。 図9に記載された基準を満たす特異的メチル化領域のゲノム座標をリストする表である。 本開示の実施形態による、伝染性単核球症(IM)(n=2)、EBV関連リンパ腫(n=3)、一時的陽性の血漿EBV DNA(n=3)、持続的陽性の血漿EBV DNA(n=3)、およびNPC(n=6)を有する対象における図10に記載の39個のDMR内の821個のCpG部位に基づく血漿EBV DNAのメチル化割合を示す。 本開示の実施形態による、第2の選択基準を満たす特異的メチル化領域(DMR)のマイニングを示す。 本開示の実施形態による、一時的陽性の血漿EBV DNAを有する非NPC対象、持続的陽性の血漿EBV DNAを有する非NPC対象、およびNPC患者における図12に明記の46個のDMRに基づく血漿EBV DNAのメチル化割合を示す。 本開示の実施形態による、第3の選択基準を満たす代表的なメチル化コンセンサス領域のマイニングを示す。 本開示の実施形態による、伝染性単核球症(IM)(n=2)、EBV関連リンパ腫(n=3)、一時的陽性の血漿EBV DNA(n=3)、持続的陽性の血漿EBV DNA(n=3)、およびNPC(n=6)を有する対象の同一群における図12に記載の「代表的な」CpG部位に基づく血漿EBV DNAのメチル化割合を示す。 本開示の実施形態による、持続的に陽性の血漿EBV DNAを有する3症例のプールされた配列決定データで80%超の部位、およびNPCを有する対象3人で20%未満の平均値の部位にわたるメチル化割合を有するCpG部位の例を示す。 本開示の実施形態による、持続的に陽性の血漿EBV DNAを有する3症例のプールされた配列決定データで20%未満の部位、およびNPCを有する対象3人で80%超の部位にわたるメチル化割合を有するCpG部位の例を示す。 本開示の実施形態による、NPC患者6人(本発明のスクリーニングコホートからの初期ステージ疾患の患者4人を含む)、節外性NK-T細胞リンパ腫患者2人、および伝染性単核球症患者2人についての血漿EBV DNAのメチル化パターン分析に基づく階層的クラスタリング分析を使用したクラスター樹状図を示す。 本開示の実施形態による、NPC患者6人(本発明のスクリーニングコホートからの初期ステージNPC患者4人を含む)、および持続的に陽性の血漿EBV DNAを有する非NPC対象3人についての血漿EBV DNAのメチル化パターン分析に基づく階層的クラスタリング分析を使用したクラスター樹状図を示す。 鼻咽頭癌、NK-T細胞リンパ腫、および感染性単核球症の患者の全EBVゲノムにおけるすべての非重複500bp領域のメチル化レベルを示すヒートマップ2000を示す。 本開示の実施形態による、NPC患者2人(TBR1392とTBR1416)および伝染性単核球症患者2人(TBR1610とTBR1661)、ならびに連続分析で持続的に陽性の血漿EBV DNAを有する非NPC対象3人(AF091、HB002、およびHF020)においてEBVゲノムおよびヒトゲノムにマッピングされた配列決定された血漿DNA断片のサイズ分布のサイズプロファイルを示す。 本開示の実施形態による、NPC患者6人および血漿EBV DNAに対して持続的に陽性である対象3人におけるサイズ比を示す。 本開示の実施形態による、一時的陽性の血漿EBV DNAを有する非NPC対象、持続的陽性の血漿EBV DNAを有する非NPC対象、およびNPC患者におけるEBV DNAサイズ比を示す。 本開示の実施形態による、一時的陽性の血漿EBV DNAを有する非NPC対象、持続的陽性の血漿EBV DNAを有する非NPC対象、およびNPC患者において配列決定されたすべての血漿DNAリードのうちの血漿EBV DNAリード(EBVゲノムにマッピングされた血漿DNAリード)の割合を示す。 本開示の実施形態による、NPC患者、一時的陽性、および持続的陽性の血漿EBV DNAを有する非NPC対象についての血漿EBV DNAリードの割合および対応するサイズ比値のプロットである。 本開示の実施形態による、NPC患者、一時的陽性、および持続的陽性の血漿EBV DNAを有する非NPC対象についての血漿EBV DNAリードの割合および対応するメチル化割合値のプロットである。 本開示の実施形態による、NPC患者、一時的陽性、および持続的陽性の血漿EBV DNAを有する非NPC対象についての血漿EBV DNAリードの割合および対応するサイズ比およびメチル化割合値の3次元プロットを示す。 本開示の実施形態による、数ベース、サイズベース、およびメチル化ベースの分析の様々な組み合わせの受信者動作特性曲線(ROC)曲線分析を示す。 HPV陽性の頭頸部扁平上皮癌(HPV+ve HNSCC)の5症例の臨床ステージを示す。 本開示の実施形態による、HPV陽性頭頸部扁平上皮癌(HPV+ve HNSCC)を有する個々の患者における血漿HPV DNAのメチル化プロファイルを示す。 本開示の実施形態による、HPV+ve HNSCCを有する患者2人におけるHPVゲノム全体におけるすべてのCpG部位のメチル化レベルを示す。 本開示の実施形態による、B型肝炎ウイルス(HBV)DNAリード(HBVゲノムにマッピングされた血漿DNAリード)の割合、ならびに慢性B型肝炎ウイルス感染(HBV)患者9人および肝細胞癌(HCC)患者10人についてのHBVゲノム全体におけるすべてのCpG部位のメチル化割合を示す。 本開示の実施形態による、第1の病態の分類を決定するための動物である対象の生体試料を分析する方法を示すフローチャートである。 本発明の一実施形態によるシステムを示す。 本発明の実施形態による、システムおよび方法とともに使用可能な、例示的なコンピューターシステムのブロック図を示す。
付録Aは、持続的陽性のEBV DNAを有する対象3人とNPC患者3人のプールされた配列データ間のこれらのCpG部位のメチル化割合の差が20%を超える場合に、特異的メチル化レベルを持つEBVゲノム全体における個々のCpG部位のリストを示す。*でマークされた部位は、40%超、**は60%超、***は80%超のメチル化割合の差である。
用語
「試料」、「生体試料」、または「患者試料」という用語は、生きている対象または死んだ対象に由来する任意の組織または物質を含むことを意味する。生体試料は、無細胞試料であり得、これは、対象からの核酸分子と、病原体、例えば場合によってはウイルスからの核酸分子との混合物を含み得る。生体試料は一般に、核酸(例えば、DNAまたはRNA)またはその断片を含む。「核酸」という用語は一般に、デオキシリボ核酸(DNA)、リボ核酸(RNA)、またはそれらの任意のハイブリッドまたは断片を指し得る。試料中の核酸は無細胞核酸であってもよい。試料は、液体試料または固体試料(例えば、細胞または組織試料)であり得る。生体試料は、血液、血漿、血清、尿、膣液、水腫(例えば精巣の)からの液、膣洗浄流体、胸水、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液、乳首からの排出液、体の異なる部分からの吸引液などの体液であり得る。便試料もまた、使用することができる。種々の実施形態では、無細胞DNAのために濃縮された生体試料(例えば、遠心分離プロトコルを介して得られた血漿試料)におけるDNAの大部分は、無細胞であり得る(例えば、DNAの50%、60%、70%、80%、90%、95%、または99%超は、無細胞であり得る)。遠心分離プロトコルは、例えば、3,000g×10分で流体部分を得ることと、残留細胞を除去するために30,000gでさらに10分間再遠心分離することと、を含み得る。
本明細書で使用される「断片」(例えば、DNA断片)という用語は、少なくとも3つの連続したヌクレオチドを含むポリヌクレオチドまたはポリペプチド配列の一部を指し得る。核酸断片は、親ポリペプチドの生物学的活性および/またはいくつかの特徴を保持することができる。核酸断片は、二本鎖または一本鎖、メチル化または非メチル化、インタクトまたはニック、他の高分子、例えば脂質粒子、タンパク質と複合または非複合であり得る。一例では、鼻咽頭癌細胞は、エプスタイン・バーウイルス(EBV)DNA断片を対象、例えば患者、の血流に放出することができる。これらの断片は、血漿中の腫瘍由来DNAのレベルを検出するために使用することができる、1つ以上のBamHI-W配列断片を含むことができる。BamHI-W配列断片は、Bam-HI制限酵素を使用して認識および/または消化することができる配列に対応する。BamHI-W配列は、配列5´-GGATCC-3´を指し得る。
腫瘍由来の核酸は、腫瘍細胞内の病原体からの病原体核酸を含む、腫瘍細胞から放出された任意の核酸を指し得る。例えば、エプスタイン・バーウイルス(EBV)DNAは、鼻咽頭癌(NPC)の対象の癌細胞から放出され得る。
「アッセイ」という用語は一般に、核酸の特性を決定するための技術を指す。アッセイ(例えば第1のアッセイまたは第2のアッセイ)は一般に、試料中の核酸の量、試料中の核酸のゲノム同一性、試料中の核酸のコピー数変動、試料中の核酸のメチル化状態、試料中の核酸の断片サイズ分布、試料中の核酸の変異状態、または試料中の核酸の断片化パターンを決定する技術を指す。当業者に既知の任意のアッセイを使用して、本明細書で言及される核酸の特性のいずれかを検出することができる。核酸の特性には、配列、量、ゲノム同一性、コピー数、1つ以上のヌクレオチド位置でのメチル化状態、核酸のサイズ、1つ以上のヌクレオチド位置での核酸の突然変異、および核酸の断片化のパターン(例えば、核酸が断片化するヌクレオチド位置(複数可))が含まれる。用語「アッセイ」は、用語「方法」と交換可能に使用されてもよい。アッセイまたは方法は特定の感度および/または特異度を有し、その診断ツールとしての相対的な有用性はROC-AUC統計を使用して測定することができる。
本明細書で使用される「ランダム配列決定」という用語は一般に、配列決定される核酸断片が、配列決定手順の前に、具体的に特定または既定されていない配列決定を指す。特定の遺伝子座位を標的とするための配列特異的プライマーは、必要とされない。いくつかの実施形態において、断片の端部にアダプターを付加し、配列決定のためのプライマーをアダプターに結合させる。したがって、いかなる断片も、同じ普遍的なアダプターに結合する同じプライマーで配列決定することができ、よって、配列決定はランダムであり得る。ランダム配列決定を使用して、超並列配列決定(massively parallel sequencing)を実施してもよい。
「配列リード」は一般に、核酸分子の任意の部分または全部から配列決定されたヌクレオチドの鎖を指す。例えば、配列リードは、核酸断片から配列決定されたヌクレオチドの短鎖(例えば、約20~150個の塩基)、核酸断片の片端もしくは両端のヌクレオチドの短鎖、または生体試料に存在する核酸断片全体の配列決定であり得る。配列リードは、例えば、配列決定技術を使用するもしくはプローブを使用する様々な方法で、例えば、ハイブリダイゼーションアレイもしくは捕捉プローブで、または単一プライマーもしくは等温増幅を使用してポリメラーゼ連鎖反応(PCR)もしくは線形増幅などの増幅技術で、あるいは質量分析などの生物物理学的測定に基づいて、得られ得る。
「メチローム」は、ゲノム(例えば、ヒトもしくは他の動物ゲノム、またはウイルスゲノム)における複数の部位または遺伝子座におけるDNAメチル化の量の尺度を提供する。メチロームは、ゲノムの全部、ゲノムの実質的な部分、またはゲノムの比較的わずかな部分(複数可)に対応し得る。関心対象のメチロームの例は、腫瘍細胞(例えば、鼻咽頭癌、肝細胞癌、子宮頸癌)のメチローム、ウイルスメチローム(例えば、対象の健常もしくは腫瘍細胞内に存在するEBVの);細菌メチローム、ならびに臓器(例えば、脳細胞、骨、肺、心臓、筋肉、および腎臓などのメチローム)であり、それは、DNAを体液(例えば、血漿、血清、汗、唾液、尿、生殖分泌物、精液、便液、下痢液、脳脊髄液、消化管分泌物、腹水、胸水、眼内液、水腫(例えば、精巣の)からの液、嚢胞液、膵臓分泌物、腸分泌物、痰、涙、乳房および甲状腺からの吸引液など)に寄与することができる。臓器は、移植臓器であってもよい。胎児のメチロームは別の例である。
「血漿メチローム」は、動物(例えば、ヒト)の血漿または血清から決定されたメチロームである。血漿メチロームは、血漿および血清が無細胞DNAを含むので、無細胞メチロームの例である。血漿メチロームはまた、胎児/母体メチロームの、腫瘍/患者メチロームの、異なる組織もしくは臓器に由来するDNAの、臓器移植状況下でのドナー/レシピエントメチロームの混合物、および/または異なるゲノム(例えば、動物ゲノムおよび細菌/ウイルスゲノム)由来のDNAの混合物であるので、混合メチロームの例でもある。
「部位」(「ゲノム部位」とも呼ばれる)は、単一の塩基位置、または相関する塩基位置の群、例えば、CpG部位、または相関する塩基位置のより大きい群であり得る、単一の部位に対応する。「遺伝子座」は、複数の部位を含む領域に対応し得る。遺伝子座は、遺伝子座をその脈絡における部位と等価にするであろうただ1つの部位を含むことができる。
各ゲノム部位(例えば、CpG部位)に対する「メチル化指数」は、その部位におけるメチル化を、その部位をカバーするリード数の合計にわたって示す、(例えば、配列リードまたはプローブから決定されるような)DNA断片の割合を指し得る。「リード」は、DNA断片から得られた情報(例えば、部位のメチル化状態)に対応することができる。読み取りは、特定のメチル化状態のDNA断片と優先的にハイブリダイズする試薬(例えば、プライマーまたはプローブ)を使用して、得ることができる。典型的には、このような試薬は、DNA分子のメチル化状態、例えば、バイサルファイト変換、またはメチル化感受性制限酵素、またはメチル化結合タンパク質、または抗メチルシトシン抗体に応じて、DNA分子を特異的に修飾するか、または特異的に認識するプロセスによる処理後に適用される。別の実施形態において、メチルシトシンおよびヒドロキシメチルシトシンを認識する単一分子配列決定技術を使用して、メチル化状態を解明し、メチル化指数を決定することができる。
領域の「メチル化密度」は、この領域における部位をカバーするリード数の合計で割ったメチル化を示す、領域内の部位におけるリード数を指し得る。この部位は、具体的な特徴を有し得、例えば、CpG部位であり得る。したがって、領域の「CpGメチル化密度」は、この領域におけるCpG部位(例えば、特定のCpG部位、CpGアイランド内またはそれより大きな領域のCpG部位)をカバーするリード数の合計で割ったCpGメチル化を示すリード数を指す。例えば、ヒトゲノム中の各100kbビンのメチル化密度は、100kb領域へマッピングされた配列読み取りによって覆われたすべてのCpG部位の割合として、CpG部位の(メチル化されたシトシンに対応する)バイサルファイト処理後に変換されていないシトシンの総数から判定することができる。この分析はまた、500bp、5kb、10kb、50kb、もしくは1Mbなどの他のビンサイズに対して実施することができる。領域は、全ゲノム、または染色体、または染色体の一部(例えば、染色体腕)であり得る。CpG部位のメチル化指数は、領域がそのCpG部位のみを含む場合、その領域のメチル化密度と同じである。「メチル化シトシンの割合」は、この領域における解析されたシトシン残基の総数、すなわち、CpGの脈絡外のシトシンを含む、メチル化されている(例えば、バイサルファイト変換後に未変換)ことが示されているシトシン部位「C」の数を指し得る。メチル化指数、メチル化密度、およびメチル化シトシンの割合は、「メチル化レベル」の例であり、これは、部位におけるメチル化読み取りの数を含む、他の比を含み得る。バイサルファイト変換とは別に、当業者に既知の他のプロセスを使用して、DNA分子のメチル化状態を調べることができ、このプロセスは、メチル化状態に敏感な酵素(例えば、メチル化感受性制限酵素)、メチル化結合タンパク質、メチル化状態に感受性のあるプラットフォームを用いる単一分子配列決定(例えば、ナノポア配列決定(Schreiber et al.Proc Natl Acad Sci 2013;110:18910-18915)、およびPacific Biosciences単一分子リアルタイム分析(Flusberg et al.Nat Methods 2010;7:461-465))によるものを含むが、これらに限定されない。
「メチル化プロファイル」(メチル化状態とも呼ばれる)は、領域に対するDNAメチル化に関連した情報を含む。DNAメチル化に関連する情報は、CpG部位のメチル化指数、領域中のCpG部位のメチル化密度、連続した領域にわたるCpG部位の分布、2つ以上のCpG部位を含有する領域内の各個々のCpG部位のメチル化のパターンまたはレベル、および非CpGメチル化を含むことができるが、これらに限定されない。ゲノムの実質的な部分(例えば、10%、20%、30%、40%、50%、60%、70%、80%、または90%超をカバーする)のメチル化プロファイルは、メチロームと同等であると見なすことができる。哺乳類ゲノムにおける「DNAメチル化」は、典型的には、CpGジヌクレオチドにおけるシトシン残基の5´炭素へのメチル基の付加(すなわち、5-メチルシトシン)を指す。DNAメチル化は、他の文脈、例えば、CHGおよびCHHにおいてはシトシンにおいて生じ得、ここで、Hは、アデニン、シトシン、またはチミンである。シトシンのメチル化は、5-ヒドロキシメチルシトシンの形態でもあり得る。N-メチルアデニンなどの非シトシンメチル化もまた、報告されている。
「メチル化認識配列」とは、配列決定プロセス中にDNA分子のメチル化状態を確認することができる配列決定方法を指し、これにはバイサルファイト配列決定、またはメチル化感受性制限酵素消化、抗メチルシトシン抗体もしくはメチル化結合タンパク質を使用する免疫沈降、またはメチル化状態の解明を可能にする単一分子配列決定が含まれるが、これらに限定されない。「メチル化認識アッセイ」または「メチル化感受性アッセイ」には、MSP、プローブに基づく調査、ハイブリダイゼーション、制限酵素消化とそれに続く密度測定、抗メチルシトシン免疫アッセイ、メチル化シトシンまたはヒドロキシメチルシトシンの割合の質量分析調査、配列決定を伴わない免疫沈降などの配列決定および非配列決定に基づく方法の両方が含まれ得る。
「組織」は、機能単位としてともに群化する細胞の群に対応する。2つ以上のタイプの細胞が、単一の組織内に見出され得る。異なるタイプの組織は、異なるタイプの細胞(例えば、肝細胞、肺胞細胞、または血球細胞)からなり得るが、異なる生物(宿主対ウイルス)由来の組織または健常細胞対腫瘍細胞にも対応し得る。「組織」という用語は一般に、ヒト体内に見られる任意の細胞群(例えば、心臓組織、肺組織、腎臓組織、鼻咽頭組織、口腔咽頭組織)を指し得る。いくつかの態様では、「組織」または「組織型」という用語は、無細胞核酸が由来する組織を指すために使用され得る。一例では、ウイルス核酸断片は、例えば、エプスタイン・バーウイルス(EBV)の血液組織に由来し得る。別の例では、ウイルス核酸断片は、腫瘍組織、例えば、EBVまたはヒトパピローマウイルス感染(HPV)に由来し得る。
「分離値」(または相対存在量)は、2つのDNA分子量、2つの寄与率、または2つのメチル化レベル(試料(混合物)メチル化レベルおよび参照メチル化レベルなど)などの2つの値を含む差または比に対応する。分離値は、単純な差または比であり得る。例として、x/yの直接比はx/(x+y)と同様に分離値である。分離値は、他の因子、例えば、倍数因子を含むことができる。他の例として、値の関数の差または比、例えば、2つの値の自然対数(ln)の差または比を使用することができる。分離値は、差および/または比を含むことができる。メチル化レベルは、相対存在量の例であり、例えば、メチル化DNA分子(例えば、特定の部位)と他のDNA分子(例えば、特定の部位にある他のすべてのDNA分子または非メチル化DNA分子)との相対存在量である。他のDNA分子量は、正規化因子として機能することができる。別の例として、すべてまたは非メチル化DNA分子の強度に対するメチル化DNA分子の強度(例えば、蛍光または電界強度)を決定することができる。相対存在量は、体積あたりの強度も含むことができる。
本明細書で使用される「分類」という用語は、試料の特定の特性と関係した任意の数(複数可)または他の特徴(複数可)を指す。例えば、「+」記号(または「陽性」という語)は、試料が、特定のレベルの病態(例えば、癌)を有するとして分類されることを示し得る。分類は、二項(例えば、陽性または陰性)であってもよく、またはより多くのレベルの分類(例えば、1~10もしくは0~1のスケール)を有してもよい。
「カットオフ」、「閾値」、または参照レベルという用語は、操作で使用される所定の数を指し得る。閾値または参照値は、特定の分類が適用される値より上または下の値、例えば、対象が病態を有するかどうか、または病態の重症度などの病態の分類であってもよい。カットオフは、試料または対象の特徴を参照して、または参照せずに、予め決定されてもよい。例えば、カットオフは、検査される対象の年齢または性別に基づいて選択され得る。カットオフは、検査データの出力後に、かつそれに基づいて選択され得る。例えば、試料の配列決定が特定の深度に達するときに、特定のカットオフが使用され得る。別の例として、1つ以上の病態の既知の分類および測定された特性値(例えば、メチル化レベル)を有する参照対象を使用して、異なる病態および/または病態の分類(例えば、対象が病態を有するかどうか)を区別する参照レベルを決定することができる。これらの用語のうちのいずれも、これらの文脈のうちのいずれにおいても使用することができる。
「対照」、「対照試料」、「参照」、「参照試料」、「正常」、および「正常試料」という用語は、特定の病態を持たない試料、またはそうでなければ健康な試料を一般的に説明するために交換可能に使用され得る。一例では、本明細書に開示される方法は、腫瘍を有する対象に対して実施することができ、参照試料は、対象の健康な組織から採取された試料である。別の例では、参照試料は、疾患、例えば、癌または癌の特定ステージを有する対象から採取した試料である。参照試料は、対象またはデータベースから取得され得る。参照は一般に、対象からの試料を配列決定することから得られた配列リードをマッピングするために使用される参照ゲノムを指す。参照ゲノムは一般に、生体試料および生得的試料からの配列リードが整列および比較され得る、1倍体または2倍体ゲノムを指す。1倍体ゲノムについては、各遺伝子座において1つのヌクレオチドのみが存在する。2倍体ゲノムについては、ヘテロ接合遺伝子座を特定することができ、このような遺伝子座は2つの対立遺伝子を有し、いずれかのアレルが、遺伝子座への整列のマッチングを可能にし得る。参照ゲノムは、例えば、1つ以上のウイルスゲノムを含めることにより、ウイルスに対応し得る。
本明細書で使用される「健康である」という語句は一般に、良好な健康状態を有する対象を指す。このような対象は、悪性疾患または非悪性疾患が存在しないことを示す。「健常者」は、通常「健康である」とは見なされない、アッセイされる病態とは無関係の他の疾患または病態を有し得る。
「癌」または「腫瘍」という用語は交換可能に使用され、一般に、組織の異常な塊を指し、その塊の増殖は正常組織の増殖を上回り、協調されない。癌または腫瘍は、以下の特性に応じて「良性」または「悪性」と定義され得る。形態および機能性を含む細胞分化の程度、増殖速度、局所浸潤、および転移。「良性」腫瘍は一般に十分に分化しており、悪性腫瘍よりも特徴的に増殖が遅く、発生部位に局在したままである。さらに、良性腫瘍には、遠隔部位に浸潤、侵襲、または転移する能力を有さない。「悪性」腫瘍は一般に低分化(退形成)であり、周囲組織の進行性浸潤、侵襲、および破壊を伴う特徴的な急速な増殖を示す。さらに、悪性腫瘍には遠隔部位に転移する能力を有する。「ステージ」は、悪性腫瘍の進行状況を説明するために使用されることができる。初期ステージの癌または悪性腫瘍は、後期ステージの悪性腫瘍よりも体内の腫瘍量が少なく、一般的に症状が少なく、予後が良好で、治療成績が良好であることに関連している。後期または進行ステージの癌または悪性腫瘍は、多くの場合、遠隔転移および/またはリンパ拡散に関連している。
「癌のレベル」(またはより一般的には「疾患のレベル」もしくは「病態のレベル」)という用語は、癌が存在するか(すなわち、存在または不在)、癌のステージ、腫瘍のサイズ、転移があるかどうか、身体の総腫瘍量、治療に対する癌の反応、および/または癌の重症度の他の尺度(癌の再発など)を指し得る。癌のレベルは、記号、アルファベット文字、および色などの数または他のしるしであり得る。レベルは、ゼロであり得る。癌のレベルには、前悪性病態または前癌性病態(状態)も含まれ得る。癌のレベルは、様々な方法で使用することができる。例えば、スクリーニングにより、癌を有することを今まで知らなかった人物において癌が存在するかどうかをチェックすることができる。評価は、癌と診断されている人物を調べて、癌の進行を経時的に監視し、療法の有効性を研究し、または予後を決定することができる。一実施形態において、予後は、患者が癌で死亡する可能性、または特定の持続時間または特定の時間の後に癌が進行する可能性、または癌が転移する可能性として表すことができる。検出は、「スクリーニング」を意味することができ、または癌の示唆的な特徴(例えば、症状または他の陽性検査)を有する人物が癌を有するかどうかをチェックすることを意味し得る。「病理学のレベル」とは、病原体に関連する病理学のレベルを指すことができ、そのレベルは癌について上で説明したとおりであり得る。疾患/病態のレベルはまた、癌について上で説明したとおりであり得る。癌が病原体に関連している場合、癌のレベルは病理学のレベルの一種になり得る。
「サイズプロファイル」および「サイズ分布」という用語は一般に、生体試料中のDNA断片のサイズに関する。サイズプロファイルは、様々なサイズのある量のDNA断片の分布を提供するヒストグラムであり得る。様々な統計パラメーター(サイズパラメーターまたは単にパラメーターとも呼ばれる)は、あるサイズプロファイルを別のものと区別することができる。1つのパラメーターは、すべてのDNA断片に対する、または他のサイズもしくは範囲のDNA断片に対する、特定のサイズもしくはサイズ範囲のDNA断片の割合である。
「偽陽性」(FP)という用語は、病態を有さない対象を指し得る。偽陽性とは一般に、腫瘍、癌、前癌性病態(例えば、前癌性病変)、限局性癌または転移性癌、非悪性疾患を有さない、またはそうでなければ健康である対象を指す。偽陽性という用語は一般に、病態を有さないが、本開示のアッセイまたは方法によって病態を有すると特定される対象を指す。
「感度」または「真陽性率」(TPR)という用語は、真陽性の数を真陽性と偽陰性の数の合計で割ったものを指し得る。感度は、真に病態を有する集団の割合を正確に特定するアッセイまたは方法の能力を特徴付けることができる。例えば、感度は、癌を有する集団内の対象の数を正しく特定する方法の能力を特徴付けることができる。別の例では、感度は、癌を示す1つ以上のマーカーを正確に特定する方法の能力を特徴付けることができる。
「特異度」または「真陰性率」(TNR)という用語は、真陰性の数を真陰性と偽陽性の数の合計で割ったものを指し得る。特異度は、真に病態を有さない集団の割合を正確に特定するアッセイまたは方法の能力を特徴付けることができる。例えば、特異度は、癌を有さない集団内の対象の数を正しく特定する方法の能力を特徴付けることができる。別の例では、特異度は、癌を示す1つ以上のマーカーを正しく特定する方法の能力を特徴付けることができる。
「ROC」または「ROC曲線」という用語は、受信者動作特性曲線を指し得る。ROC曲線は、二項分類システムの性能をグラフィカルに表現されることができる。任意の所与の方法について、様々な閾値設定で感度を特異度に対してプロットすることにより、ROC曲線を生成することができる。対象における腫瘍の存在を検出する方法の感度および特異度は、対象の血漿試料中の腫瘍由来核酸の様々な濃度で決定され得る。さらに、得られた3つのパラメーター(感度、特異度、閾値設定など)のうちの少なくとも1つ、およびROC曲線によって、任意の不明なパラメーターの値または期待値を決定し得る。不明なパラメーターは、ROC曲線に適合した曲線を使用して決定され得る。「AUC」または「ROC-AUC」という用語は一般に、受信者動作特性曲線下の領域を指す。このメトリックは、方法の感度と特異度の両方を考慮して、方法の診断的有用性の尺度を提供し得る。一般的に、ROC-AUCの範囲は0.5~1.0であり、0.5に近い値は方法の診断的有用性が限られていること(例えば、低感度および/または低特異度)を示し、1.0に近い値は方法の診断的有用性が高いこと(例えば、高感度および/または高特異度)を示す。例えば、参照により本明細書に組み込まれる、Pepe et al,“Limitations of the Odds Ratio in Gauging the Performance of a Diagnostic,Prognostic,or Screening Marker,”Am.J.Epidemiol 2004,159(9):882-890を参照されたい。尤度関数、オッズ比、情報理論、予測値、キャリブレーション(適合度を含む)、および再分類測定を使用して診断的有用性を特徴付ける追加のアプローチは、参照によりその全体が本明細書に組み込まれる、Cook,“Use and Misuse of the Receiver Operating Characteristic Curve in Risk Prediction,”Circulation 2007,115:928-935に要約されている。
「約」または「およそ」という用語は、当業者によって決定される特定の値の許容誤差範囲内を意味し得、これは値の測定または決定方法、すなわち測定システムの制限について部分的に依存する。例えば、「約」は、当技術分野の慣例により、1以内または1を超える標準偏差を意味し得る。あるいは、「約」は、所与の値の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。あるいは、特に生物学的システムまたはプロセスに関して、「約」または「およそ」という用語は、値の1桁以内、5倍以内、より好ましくは2倍以内を意味し得る。本出願および特許請求の範囲に特定の値が記載されている場合、特に明記しない限り、特定の値の許容誤差範囲内の「約」という用語を想定すべきである。「約」という用語は、当業者によって一般に理解されている意味を有し得る。「約」という用語は±10%を指し得る。「約」という用語は、±5%を指し得る。
本明細書で使用される用語は、特定のケースのみを説明する目的のものであり、限定することを意図したものではない。本明細書で使用される場合、単数形「a」、「an」、および「the」は、文脈上明らかに別途指示されない限り、複数形も含むことを意図している。「または」の使用は、それとは反対に具体的に示されない限り、「排他的なまたは」ではなく「包含的なまたは」を意味することが意図される。「~に基づいて」という用語は、「~に少なくとも部分的に基づいて」を意味することを意図している。さらに、「~を含む(including)」、「~を含む(includes)」、「~を有する(having)」、「~を有する(has)」、「~とともに(with)」という用語、またはその変形は、詳細な説明および/または特許請求の範囲のいずれかで使用される限りでは、そのような用語は、「~を含む(comprising)」という用語と同様の様態で包括的であることを意図している。
本開示では、血液中の循環EBV DNA断片のメチル化パターンの分析に基づいて、異なるEBV関連疾患、悪性腫瘍、状態または完全に健康な個人を区別するアプローチを説明する。無細胞EBV DNA分子のメチル化パターンの分析には、いくつかの用途または実用性がある。非侵襲的方法での無細胞ウイルス分子のメチル化分析の実現可能性は、スクリーニング、予測医学、リスク層別化、監視、および予後診断との関連で臨床応用を強化するであろう。
実施形態は、例えば単一の採血からの単一時点分析においてさえ、異なるウイルス関連病態の対象(例えば、NPC患者)と検出可能な血漿EBV DNAの明らかに健常な対象とを区別することができる。実施形態は、対象が疾患または癌を有するかどうかのスクリーニングまたは検出のために、癌患者の疾患モニタリングのために、予後診断のために、および疾患または癌のリスク予測のために(すなわち、対象が疾患または癌を将来発症するかどうかを予測するために)も使用されることができる。このアプローチは、EBV以外のウイルスにも一般化されることができる。したがって、このアプローチは、ウイルスDNAベースのバイオマーカーを特定するための一般的なアプローチである。
I.癌およびウイルス
DNAウイルスとRNAウイルスの両方が、ヒトに癌を引き起こす可能性があることが示されている。いくつかの実施形態では、対象は、ウイルス(例えば、オンコウイルス)に起因する癌を有し得る。いくつかの実施形態では、対象は癌を有していてもよく、癌はウイルスDNAを使用して検出可能であってもよい。RNAの分析では、核酸は相補的DNA(cDNA)として存在し、これはRNAからコピーされ、宿主細胞での複製の培地であり得る。これらのcDNAはメチル化を有し、実施形態で使用され得る。
様々なウイルス感染は、様々な癌またはその他の病態に関連する。例えば、EBV感染は、NPCおよびナチュラルキラー(NK)T細胞リンパ腫、ホジキンリンパ腫、胃癌、および伝染性単核球症と密接に関連している。B型肝炎ウイルス(HBV)感染およびC型肝炎ウイルス(HCV)感染は、肝細胞癌(HCC)の発症リスクの増加と関連している。ヒトパピローマウイルス感染(HPV)は、子宮頸癌(CC)および頭頸部扁平上皮癌(HNSCC)の発症リスクの増加と関連している。例ではEBVに重点を置いているが、技術はHPV、HBV、および他のウイルス、特に癌に関連するウイルスに関する癌および他の病態に等しく適用することができる。
A.EBV
世界の人口の95%が生涯にわたる無症候性のエプスタイン・バーウイルス(EBV)感染症と推定されており、それによりウイルスは健康な個体のメモリB細胞に潜伏し、体内で持続する(Young et al.Nat Rev Cancer 2016 16(12):789-802)。少数の対象が症候性感染症を発症し、ウイルス感染による伝染性単核球症として現れる。EBVは、鼻咽頭癌(NPC)、胃癌、バーキットリンパ腫、ホジキンリンパ腫、ナチュラルキラーT細胞(NK-T細胞)リンパ腫、および移植後リンパ増殖性障害(PTLD)を含む、いくつかの悪性腫瘍または上皮および血液起源の癌様症候群との関連で発癌性ウイルスとも見なされる。
循環EBV DNAは、EBV関連悪性腫瘍の患者においてその診断および予後の役割が探究されている。この点で、血漿EBV DNAは、NPCのバイオマーカーとして確立されている(Lo et al.Cancer Res 1999;59:1188-91)。血漿EBV DNAを用いた定期的な調査は、NPCの診断が確認される患者の残存疾患および再発検出に対して推奨される(Lo et al.Cancer Res 1999;59:5452-5,Chan et al.J Natl Cancer Inst 2002;94:1614-9,Leung et al.Cancer 2003,98(2),288-91およびLeung et al.Ann Oncol 2014;25(6):1204-8)。血漿EBV DNAはまた、ホジキンリンパ腫(Kanakry et al.Blood 2013;121(18):3547-3553)、節外性NK-T細胞リンパ腫(Wang et al.Oncotarget 2015;6(30):30317-26,Kwong et al.Leukemia 2014;28(4):865-870)、およびPTLD(Gulley and Tang.Clin Microbiol Rev 2010;23(2):350-66)を含む他のEBV関連悪性腫瘍の予後に関して重要性を有することを示している。
しかし、このような感染症にかかっているすべての対象が関連癌になるわけではない。血漿EBV DNAの供給源は、NPCを有さない人において異なっていなければならない。NPC細胞から循環へのEBV DNAの持続的な放出とは異なり、EBV DNAの供給は、NPCを有さない人では一時的にそのようなDNAを提供するだけである。
B.偽陽性
癌スクリーニングとの関係において、本発明者らは、最近、定量的PCR(qPCR)による血漿EBV DNA分析を使用するNPCスクリーニングに関する大規模な予測研究を実施した(Chan et al.N Engl J Med 2017;377:513-522)。本発明者らは、登録時にNPCに対して無症候性であったすべての募集対象(スクリーニングコホート)の血漿EBV DNAレベルを分析した。検出可能な量の血漿EBV DNAを有する対象は、初期検査の4週間後にEBV DNAについて再検査された。募集された20,174人の対象のうち、1,112人が最初の検査で検出可能な血漿EBV DNAを有していた。血漿EBV DNAの量の測定に基づいた追跡検査で持続的陽性であった対象は309人であった。その後、血漿EBV DNAの結果が持続的陽性である対象34人が、内視鏡検査および磁気共鳴画像法(MRI)によりNPCを有することが確認された。前述のように、血漿EBV DNAは、NPCまたはその他のEBV関連悪性腫瘍を有さない明らかな健常者で検出することができた。
NPCスクリーニングを受けた対象20,174人では、単一時点分析に基づく血漿EBV DNA偽陽性率は約5%であった((1112-34)/(20174-34)=5.3%)。2回の連続EBV DNA分析により、偽陽性率は1.5%に低下した。しかしながら、血漿EBV DNAの連続検査では、最初の陽性結果が得られた対象から追加の血液試料を採取する必要があり、これはロジスティックな課題を提起し得る。また、陽性の血漿EBV DNA結果を有する対象のかなりの割合はNPCを有さない(単一時点分析で陽性の結果を示している対象の96%は、(1112-34)/1112として決定され、NPCを有さない)。偽陽性結果の対象には、一連の評価、および確定診断のために内視鏡検査やMRIなどの不必要な調査が必要であろう。これらはすべて、患者の不安および高いフォローアップコストにつながり得る。したがって、NPC患者と偽陽性の血漿EBV DNA結果の対象とを単一時点の血液分析で区別することを目指す。この例では、偽血漿EBV DNA陽性率は非NPC陽性率と見なされるか、または1回限りの陽性率とも呼ばれる。
C.メチル化の使用
これまでの研究では、異なるタイプのウイルス潜伏型(0、I、II、およびIII型)が報告されており、これらは異なるEBV関連悪性腫瘍で見られる潜伏型関連ウイルス遺伝子転写パターンによって定義されている(Young et al.Nat Rev Cancer 2016;16(12):789-802)。ウイルス潜伏型は、潜伏型関連遺伝子転写パターンによって定義される。したがって、異なるタイプのウイルス潜伏型のウイルスは、異なるウイルス遺伝子転写のパターンを有する。同じタイプのウイルス潜伏型を持つ異なるEBV関連疾患または病態は、類似のウイルス遺伝子転写パターンを有することができる。
異なる潜伏型の中には、複製起点、Cプロモーター、Wプロモーター、Qプロモーター、およびLMP1/2プロモーターを含む異なるウイルス遺伝子プロモーターの、異なるウイルス遺伝子発現プロファイルおよび異なるメチル化状態がある(Woeller et al.Curr Opin Virol 2013;3(3):260-5)。DNAメチル化は遺伝子発現の調節に寄与し、潜伏型特異的なメチル化パターンがあることが示唆されている(Lieberman.Nat Rev Microbiol 2013;11(12):863-75)。一例では、これまでの研究により、Cプロモーターのメチル化状態が発見されており、これは、メチル化特異的PCRを使用するNPC患者の鼻咽頭ブラシ細胞診試料由来のEBV DNAにおける潜伏型II型特異的なメチル化パターンに適合性がある(Ramayanti et al.Int J Cancer 140,149-162)。しかし、異なるEBV関連疾患または病態は、同じタイプのウイルス潜伏型を有することができ、したがって、類似のウイルス遺伝子転写パターンを有する(例を次の段落で説明)。ゆえに、ウイルス潜伏型は、疾患または癌のステージと相関がない。
同じタイプのウイルス潜伏型を持つ異なるEBV関連疾患は、類似のメチル化パターンを有することが予想される(Tempera et al.Semin Cancer Biol 2014;26:22-9,Fejer et al.J Gen Virol 2008;89:1364-70)。一例では、これまでの研究により、メチル化特異的PCRを使用して、健康なEBV血清陽性個体由来のB細胞およびEBV陽性リンパ腫由来の腫瘍組織の両方で、EBVのウイルスプロモーター領域全体における類似のメチル化パターン(潜伏型I型を呈する)が示された(Paulson et al.J Virol 1999;73:9959-68)。
これまでの研究では、異なるEBV関連疾患の細胞株および組織試料のバイサルファイト変換DNAのアンプリコン配列決定により、EBVのメチル化プロファイルを研究することを試みた(Fernandex et al.Genome Res 2009;19(3):438-51)。設計された77個のアンプリコンは、94個の異なるEBV潜伏型遺伝子および溶解遺伝子の転写開始部位、ならびに2つの構造RNA(EBER1およびEBER2)をカバーした。EBVゲノム全体における転写開始部位のメチル化状態(メチル化または非メチル化のいずれか)を評価した。これらの結果は、定量化とは対照的に、遊離ウイルスDNAはDNAメチル化を欠き、EBV関連悪性腫瘍の細胞株または組織試料由来のウイルスDNAには多数のメチル化EBV転写開始部位があったことのみを示した。重要なことに、異なる悪性病態(すなわち、NPCおよび異なるリンパ腫)の試料は、転写開始部位のメチル化パターンに基づいたクラスタリング分析と一緒にクラスター化され、一時的陽性または持続的陽性の対象は特定されなかった。そのメチル化パターンに基づいて、異なる悪性病態を区別することができなかった。
これまでの研究のほとんどは、腫瘍および細胞株の試料におけるウイルスのメチル化プロファイルの分析に重点を置いてきた。これらの腫瘍試料は、外科的生検などの侵襲的手技を通じて取得される必要がある。これは、スクリーニングや連続モニタリングなどの診断用途を制限し得る。また、これまでの研究は、定量的な結果ではなく、質的な側面に重点を置いてきた。
上記の報告データにもかかわらず、本発明者らは、同じタイプのウイルス潜伏型を示す異なるEBV関連疾患を区別する実現可能性を調査する。上記の報告データとは対照的に、本発明者らは、異なるEBV関連疾患または疾患ステージを区別することができる血漿EBV DNA配列のメチル化プロファイルの分析に基づいた方法について説明する。例えば、ウイルス遺伝子プロモーターのメチル化状態(メチル化または非メチル化)のみを分析する代わりに、無細胞EBV DNA分子の各CpG部位のメチル化レベルをゲノム全体様態で高解像度で調べた。驚くことに、本発明者らのデータは、無細胞EBV DNA分子のメチル化分析に基づいて、同じ潜伏型で異なるEBV関連病態と悪性腫瘍とを区別することができることを明らかにする。このように、本発明者らのデータは、潜伏型特有の変動性を超える無細胞EBV DNAメチル化パターンに関する新しい情報を提供する。
実施形態は、血中(例えば、血漿または血清)の無細EBV DNA分子のメチル化パターンを分析することができる。本開示の実施形態はまた、無細胞EBV DNA分子を含む他の体液、例えば、尿(Chan et al.Clin Cancer Res 2008;14(15):4809-13)、血清、膣液、子宮または膣洗浄液、胸水、腹水、脳脊髄液、唾液、汗、涙、痰、気管支肺胞洗浄液などにも使用することができる。糞便試料も使用することができる。技術的課題は、組織試料中の腫瘍DNAの分析と比較した場合、ウイルス分子の存在量が少なく断片化されているという性質である。本開示は、非侵襲的方法での無細胞ウイルス分子のメチル化分析の実現可能性を実証する。
II.無細胞EBV DNA分子のメチル化の測定
メチル化レベル(複数可)は、例えば、動物(ヒトなど)、ウイルス、または他のゲノムの様々な部位で測定されることができる。メチル化レベルは、1つ以上の部位、例えばCpG部位のメチル化情報を使用して決定されることができる。メチル化情報には、特定の部位でメチル化されたDNA分子の数、またはメチル化/非メチル化DNA分子の量に対応する強度シグナルを含むことができる。メチル化レベルは、メチル化DNA分子と非メチル化DNA分子との間の相対存在量を提供でき、例えば、部位でのすべてのDNA分子量または非メチル化DNA分子量は正規化係数として機能することができる。
ウイルスゲノムの場合、血漿中のウイルスゲノム全体における特定の遺伝子座の平均メチル化CpG密度(メチル化密度、MDとも呼ばれる)は、次の方程式を使用して計算されることができる。
式中、Mはメチル化ウイルスリードの数、Uはウイルスゲノム全体における遺伝子座位内のCpG部位での非メチル化ウイルスリードの数である。遺伝子座位内に2つ以上のCpG部位がある場合、MおよびUはそれぞれ部位全体のメチル化および非メチル化リードの数に対応する。例として、このようなメチル化または非メチル化されている個々のDNA断片の数は、配列決定またはデジタルPCRを使用して決定されることができる。別の例として、特定のリード数をカウントするのとは対照的に、メチル化密度は、リアルタイムPCRを使用して決定して、シグナル強度の比(例えば、メチル化強度と非メチル化強度の比)を得ることができる。したがって、強度シグナルが複数の核酸に対応する場合、核酸の分析をまとめて実行することができる。メチル化レベルの特定の形式は、例えば、上記の割合またはMとUの割合など、様々であり得る。
A.メチル化レベルを評価するための様々な技術
メチル化レベルを決定するために、例えば、ゲノム(例えば、ヒトゲノムまたはウイルスゲノム)のすべてまたは実質的な部分にわたるメチル化プロファイルを決定するために、異なるアプローチを使用することができる。メチル化プロファイルを包括的に調査するために、実施形態例は、バイサルファイト変換DNAの超並列配列決定(MPS)を使用して、ゲノム全体の情報とヌクレオチドごとおよび対立遺伝子ごとのメチル化レベルの定量的評価を提供することができる。任意のメチル化感受性アッセイを使用して、選択したCpG部位のメチル化レベルを決定することができる。他の技術の例としては、単一分子配列決定(例えば、ナノポア配列決定(Simpson et al.Nat Methods 2017;14(4):407-410))、メチル化特異的PCR(Herman et al.Proc Natl Acad Sci USA 1996;93(18):9821-9826)、メチル化状態に基づいてDNA分子を特異的に修飾する酵素(メチル化感受性制限酵素など)、メチル化結合タンパク質(抗体など)による処理、または質量分析法に基づく方法(例えば、Lin et al.Anal Chem 2016;88(2):1083-7)が挙げられる。
様々なタイプのメチル化を分析することができる。いくつかの実施形態では、例としてシトシン残基の5-メチル化を使用した。他のタイプのDNAメチル化の変化、例えば、ヒドロキシメチル化またはアデニンのメチル化も使用することができる。したがって、ヒドロキシメチル化を検出するための技術もまた使用することができ、例えば、酸化バイサルファイト配列決定(Booth et al.Science 2012;336(6083):934-7)とテトアシストバイサルファイト配列決定(NAT Protoc 2012;7(12):2159-70)などである。メチル化プロファイルの決定および使用に関するさらなる詳細は、米国特許公開第2015/0011403号および同第2016/0017419号、ならびに同第2017/0029900号に見出すことができ、それらはそれらの全体が参照により組み込まれる。
バイサルファイト修飾の間に、非メチル化シトシンはウラシルに続いてチミンに変換されるが、PCR増幅後、メチル化シトシンはそのまま残る(Frommer M,et al.Proc Natl Acad Sci USA 1992;89:1827-31)。配列決定とアラインメントの後、個々のCpG部位のメチル化は、CpG部位のシトシン残基でのメチル化配列リード数「M」(メチル化)と非メチル化配列リード数「U」(非メチル化)から推測されることができる。バイサルファイト配列決定を使用して、異なるウイルス関連病態の対象の血漿からウイルスメチロームを構築することができる。
上述のように、メチル化プロファイリングは、バイサルファイト変換DNAの超並列配列決定(MPS)を使用して実行されることができる。バイサルファイトに変換されたDNAのMPSは、ランダムもしくはショットガン方式、またはターゲット方式で実行されることができる。例えば、バイサルファイト変換したDNAの目的の領域(複数可)は、液相または固相ハイブリダイゼーションベースのプロセスを使用して捕捉した後、MPSを行うことができる。
MPSは、合成プラットフォームごとの配列決定(例えば、Illumina HiSeq、NextSeq、NovaSeqプラットフォーム)、ライゲーションプラットフォームごとの配列決定(例えば、Life TechnologiesのSOLiDプラットフォーム)、半導体ベースの配列決定システム(例えば、Life TechnologiesのIon TorrentまたはIon Protonプラットフォーム)、GenapSys Gene Electronic Nano-Integrated Ultra-Sensitive(GENIUS)テクノロジー、単一分子配列決定(例えば、HelicosシステムまたはPacific Biosciencesシステム)、またはナノポアベースの配列決定システム(例えば、Oxford Nanopore TechnologiesまたはRocheのGeniaプラットフォーム(sequencing.roche.com/research---development/nanopore-sequencing.html))を使用して実行することができる。脂質二重膜とタンパク質ナノポアを使用して構築されたナノポア、および固体状態のナノポア(グラフェンベースのものなど)を含むナノポアベースの配列決定。選択された単一分子配列決定プラットフォームにより、DNA分子(N6-メチルアデニン、5-メチルシトシン、および5-ヒドロキシメチルシトシンを含む)のメチル化状態をバイサルファイト変換なしで直接解明することができるので(B.A.Flusberg et al.2010 Nat Methods;7:461-465;J.Shim et al.2013 Sci Rep:3:1389.doi:10.1038/srep01389)、このようなプラットフォームを使用すると、非バイサルファイト変換試料DNA(例えば、血漿または血清DNA)のメチル化状態を分析することができる。配列は、ペアエンド配列決定を含むか、DNA分子全体の単一配列リードを提供し得る。
配列決定に加えて、例えば、上記のような他の技術を使用することができる。一実施形態では、メチル化プロファイリングは、メチル化特異的PCR、またはメチル化感受性制限酵素消化とそれに続くPCR、またはリガーゼ連鎖反応とそれに続くPCRにより行うことができる。さらに他の実施形態では、PCRは、単一分子またはデジタルPCRの形態である(B.Vogelstein et al.1999 Proc Natl Acad Sci USA;96:9236-9241)。さらなる実施形態では、PCRはリアルタイムPCRであり得る(Lo et al.Cancer Res 1999;59(16):3899-903 and Eads et al.Nucleic Acids Res 2000;28(8):E32)。他の実施形態では、PCRは多重PCRであり得る。一実施形態では、マイクロアレイベースの技術を使用することにより、メチル化プロファイリングを行うことができる。
配列決定後、配列リードは、メチル化データ解析パイプラインであるMethyl-Pipe(Jiang et al.PLoS One 2014;9:e100360)で処理して、ヒトゲノム全体(hg19)、EBVゲノム全体(AJ507799.2)、HBVゲノム全体、およびHPVゲノム全体からなる人工的に組み合わせた参照配列にマッピングさせることができる。異なる参照配列を使用することができ、1つの参照配列に結合するのではなく、ゲノムの各々に対してマッピングを実行することができる。組み合わせたゲノム配列内の一意の位置にマッピングさせる配列決定されたリードを下流解析に使用することができる。
B.捕捉プローブを使用する標的化バイサルファイト配列決定
特定の実施形態は、血漿EBV DNA分子のメチル化パターンについて特定の領域を調べることができる。一実施形態において、捕捉強化した標的化バイサルファイト配列決定を使用して、異なるEBV関連疾患または病態を有する対象の循環中の無細胞ウイルスDNA分子を分析することができる。例えば、捕捉プローブは、EBVゲノムのCpG部位のすべてまたは一部をカバーするように設計されることができる。このアプローチは、他のウイルスにも使用されることができる。したがって、捕捉プローブは、B型肝炎ウイルス(HBV)ゲノム、ヒトパピローマウイルス(HPV)ゲノム、およびその他のウイルス/細菌ゲノムのCpG部位のすべてまたは一部をカバーするように設計されることもできる。同じ分析で、ヒトゲノムのゲノム領域をターゲットにするために、捕捉プローブを含めることもできる。
いくつかの実施形態では、ウイルスゲノムとヒトゲノムとの間のサイズの差を考慮するために、目的のヒトゲノム領域を使用するよりも多くのプローブを設計して、ウイルスゲノム配列にハイブリダイズすることができる。別の実施形態では、例えば、約200bpのサイズの各ウイルスゲノム領域をカバーする平均約200μMのハイブリダイジングプローブ(例えば、200倍のタイリング捕捉プローブ)を設計することにより、ウイルスゲノム全体を標的とすることができる。一実施形態および一例として、ヒトのゲノムにおける目的の領域の場合、約200bpサイズの各領域をカバーする(例えば、5倍のタイリング捕捉プローブ)、平均5つのハイブリダイジングプローブを設計する。例解として、捕獲プローブは図1に従って設計され得る。
図1は、本開示の実施形態による標的化バイサルファイト配列決定のための捕捉プローブの設計を示す。図1は、捕捉プローブに関する情報、例えば、捕捉領域のサイズ、およびプローブでカバーされたタイリング量を示す。捕捉プローブは様々な長さで、互いにオーバーラップすることができる。このような捕捉プローブは、SeqCap-Epiシステム(Nimblegen)を使用することができる。他の実施形態は、そのような捕捉プローブを使用しなくてもよい。
列101は、配列のタイプ、すなわち、ヒトまたはウイルス標的の常染色体を特定する。列102は、特定の配列(例えば、染色体または特定のウイルスゲノムの配列)を特定する。列103は、捕捉プローブがカバーする塩基対(bp)の全長を示す。捕獲プローブは、配列全体をカバーしていなくてもよい(例えば、常染色体に示すように)が、例えば、ウイルスゲノムの場合、配列全体をカバーしていてもよい。列104は、捕捉プローブの深度を示し、プローブファイリングフォールドとも呼ばれる。これらの数字は、任意の所与の位置をカバーするプローブの数を伝える。常染色体の場合、捕獲プローブは平均で5倍のタイリングを提供する。ウイルス標的の場合、捕捉プローブは、平均で200倍のタイリングを提供する。したがって、ウイルスに対するプローブの数は、常染色体よりも単位長あたりのパーセンテージ/割合が高くなる。このような高レベルのウイルス標的の捕捉プローブ濃度は、ウイルスDNAを捕捉する可能性を最大化するのに役立つことができる。
III.様々な病態での血漿EBV DNAのメチル化レベル
例えば、NPC、伝染性単核球症、ホジキンリンパ腫、NK-T細胞リンパ腫など様々なEBV関連疾患/病態を有する患者、および検出可能な血漿EBV DNAを有する明らかに健康な個体において、血漿EBV DNA分子のメチル化パターンを分析した。検出可能な血漿EBV DNAを有する明らかに健康なこれらの対象は、NPCのスクリーニングのために動員された対象コホートから回収され、2群に分類された。第1の群には、初期検査では血漿EBV DNAレベルが検出可能であったが、追跡検査では検出不可能なレベルであり、「一時的陽性」と示された対象が含まれていた。第2の群には、初期検査と追跡検査の両方で検出可能な血漿EBV DNAレベルを有し、「持続的陽性」と示された対象が含まれていた。
特別に設計された捕獲プローブにより捕獲強化した標的化バイサルファイト配列決定を使用した。分析した各血漿試料について、QIAamp DSP DNA血液ミニキットを使用して、4mL血漿からDNAを抽出した。いずれの場合も、抽出されたすべてのDNAは、KAPAライブラリー調製キット(Roche)またはTruSeq DNA PCRフリーライブラリー調製キット(Illumina)を使用する配列決定ライブラリーの調製に使用された。アダプターに連結されたDNA産物は、EpiTect Bisulfite Kit(Qiagen)を使用して2回バイサルファイト処理にかけた。KAPA HiFi HotStart Uracil+ReadyMix PCRキット(Roche)を使用して、バイサルファイトに変換した試料に対して12~15サイクルのPCR増幅を実施した。第1のPCR増幅により、標的を捕捉するDNAの量を増やすことができる。標的の捕獲反応のために、DNAの投入量を提案することができる。血漿由来の入力DNA量(増幅なし)は、標的の捕捉に十分でない可能性がある。
次に、上記のウイルスおよびヒトゲノム領域をカバーするカスタム設計のプローブを使用して、増幅産物をSeqCap-Epiシステム(Nimblegen)で捕捉した(図1)。実質的な「DNAの喪失」が捕捉ステップで生じ得る。標的捕捉反応後のDNA量は、配列決定に必要な量より少なくてもよい。したがって、第2の増幅段階(例えば、PCRを使用)は、後続の配列決定ステップのためにDNA量を増幅することができる。したがって、いくつかの実施形態において、標的捕捉後、捕捉生成物を14サイクルのPCRにより濃縮し、DNAライブラリーを生成した。DNAライブラリーは、NextSeqプラットフォーム(Illumina)で配列決定された。配列決定の実行ごとに、ペアエンドモードを使用して、一意の試料バーコードを持つ4~6個の試料を配列決定した。各DNA断片から、2つの末端の各々から75ヌクレオチドを配列決定したが、他のヌクレオチド数も配列決定することができる。
A.異なるEBV関連病態における血漿EBV DNAのメチル化プロファイル
図2は、本開示の実施形態による、伝染性単核球症、NPC、およびNK-T細胞リンパ腫の患者のEBVゲノム全体におけるCpG部位のメチル化密度を示す。EBV DNAのメチル化プロファイルは、血漿EBV DNA断片の標的化キャプチャーバイサルファイト配列決定により生成された。横軸は、EBV参照ゲノムのゲノム座標を示す。縦軸は、単一のCpG部位の解像度でのメチル化密度を示す。
EBVゲノム全体におけるCpG部位のメチル化密度は、上述の式で導き出された。
異なる対象間で血漿EBV DNAのメチル化密度の異なるパターンを観察することができた。DNAメチル化のプロファイルのこれらの差は、全体的なレベルまたは遺伝子座特異的レベルで分析され得た。例えば、全体的なレベルでは、NPC患者2人(TBR1392とTBR1416)(メチル化密度83.8%と81.3%)よりも伝染性単核球症患者(TBR1610)(メチル化密度57.3%)で低メチル化レベルが観察された。全体的メチル化レベルは、ゲノム全体における部位のメチル化測定を使用して、単一の値を決定する。
また、比較的巨視的なレベルで、NK-T細胞リンパ腫(TBR1629)の患者は、NPC患者の2人(TBR1392およびTBR1416)よりも、EBVゲノム全体におけるメチル化レベルにおいて、高い多様性(例えば、ゲノム座標50000~100000)を示した。不均一性は、メチル化密度プロットにおいてくぼみとして現れる。NPC患者は比較的均一な密度を有するが、リンパ腫患者は密度が著しく低下する多くの小さな谷を示し、それによって櫛のような構造になる。
DNAメチル化のパターンは、遺伝子座特異的または領域特異的レベルで分析することもできる。これらの遺伝子座は、任意のサイズのもの、および少なくとも1つのCpG部位のものであり得る。これらの遺伝子座は、注釈付きのウイルス遺伝子と関連する場合としない場合がある。このような領域特異的メチル化レベルは、同一病態の異なる対象に同様の値を有し得るが、異なる病態の他の対象とは異なる値を有する。
図2では、本発明者らは、4つのゲノム領域、すなわち領域201(7,000~13,000)、領域202(138,000~139,000)、領域203(143,000~145,000)、および領域204(169,000~170,000)を定義する。領域201および204における領域特異的なメチル化密度は、伝染性単核球症(TBR1610)の症例よりもNPC(TBR1392およびTBR1416)の2つの症例で高かった。逆に、領域203において領域に特異的なメチル化密度は、伝染性単核球症の症例よりもNPCの2つの症例で低かった。領域203で領域特異的DNAメチル化密度は、NPCおよび伝染性単核球症の他の症例よりもNK-T細胞リンパ腫(TBR1629)の症例で最も高かった。このような結果は、異なるEBV関連病態の患者において、全体的レベルおよび遺伝子座特異的レベルに対する血漿EBV DNA断片のメチル化プロファイルに異なるパターンが存在することを示す。
したがって、領域201における低メチル化レベルは、対象が伝染性単核球症を有することを示すことができる。領域204の高メチル化レベルは、対象がNPCであることを示し得る。また、領域203のメチル化レベルが高いことは、対象がNK-T細胞リンパ腫を有することを示す。高または低(または中間範囲)を定義する閾値の特定の値は、図2に示すタイプの測定値に基づいて各領域に対して決定されることができる。このような領域は、異なる病態を有する対象のメチル化プロファイルを分析し、異なる病態に対して異なるメチル化密度を持つ領域を選択することにより選択されることができる。さらに、複数の領域からの測定値を、例えば、クラスタリング技術または決定木を介して組み合わせることができる。
B.初期ステージNPC
図3は、初期ステージNPC(ステージI)を有する本発明のスクリーニングコホートからの患者(AL038)の血漿EBV DNAのメチル化プロファイル、および低濃度の血漿EBV DNA(定量的PCRで測定した血漿1mLあたり8コピー)を示す。血漿DNAは初期の血液試料から抽出された。初期(ベースライン)検査が陽性の対象は、4週間後に再検査され、それを追跡検査と見なした。この患者は採血時にNPCの症状がなく、癌は2段階分析による血漿EBV DNAのリアルタイムPCR分析を使用するスクリーニングにより検出された。リアルタイムPCRによって持続的陽性の血漿EBV DNAを有する対象を、経鼻内視鏡検査およびMRIを使用してさらに確認した。
図3は、シグナルにはノイズが多いことを示し、例えば、いくつかの部位は100%のメチル化密度を有し、いくつかの部位はゼロなどの非常に低いメチル化密度を有する。そのようなノイズの多い挙動を除去するために、実施形態は、ウィンドウ内の部位でのすべての配列リードの組み合わせたメチル化密度を使用して測定される領域メチル化レベルを使用することができる。例えば、200bpのウィンドウを使用することができ、これによりノイズを減らし、よりスムーズなデータを提供することができる。したがって、試料内のEBV DNA配列の濃度が低くても、メチル化レベルを測定することができ、かつ異なる病態を区別するために使用することができる。病態を区別するこのような能力を示すさらなるデータを以下に示す。
この患者では、捕捉された血漿EBV DNA断片の量は、進行ステージNPCおよび高濃度の血漿EBV DNAを有する他の患者2人(TBR1392およびTBR1416)よりも比較的少なかった。前述のように、これは、たとえEPV濃度が低い症例でも、メチル化レベル(複数可)をなおも使用して特定の病態(この場合はNPC)を特定し得ることを示す。さらに、血漿EBVの量は、疾患のレベル(例えば、癌のレベル)を決定する一部として使用されることができる。
C.患者間のメチル化プロファイルの差分値
メチル化プロファイルの差は、NPCおよび伝染性単核球症の患者の比較を提供し得る。図2で前述したように、異なるEBV関連病態の患者間で血漿EBV DNAの異なるメチル化パターンが存在する。本発明者らは、これらの異なる患者間でのEBVゲノム全体におけるCpG部位のメチル化密度を比較することにより、メチル化パターンの差を分析する。
1.異なる病態
図4は、本開示の実施形態による、異なる病態を有する2人の患者の間のEBVゲノム全体におけるCpG部位のメチル化密度の差を示す。横軸は、EBVゲノムのゲノム座標である。縦軸は、2人の患者間のメチル化の部位ごとの差を示す。NPC(TBR1392)と伝染性単核球症(TBR1610)とのメチル化の差の中央値は、23.9%(IQR(四分位範囲):14.8~39.3%)であり、EBVゲノムのCpG部位全体におけるNPCメチル化レベルは、伝染性単核球症よりもNPCで系統的に高いことを示している。NPC(TBR1416)と伝染性単核球症(TBR1610)の別の比較でも、メチル化の差の類似パターン(中央値:22.9%、IQR:13.3~37.8%)が観察された。
上の図は、NPC患者(TBR1392)と伝染性単核球症患者(TBR1610)のメチル化密度の差を示す。1つのCpG部位での陽性値は、その特定の部位において症例TBR1610よりも症例TBR1392の方がメチル化密度が高いことを示す。陰性値は、そのCpG部位において症例TBR1610よりも症例TBR1392の方がメチル化密度が低いことを示す。
下の図は、別のNPC患者(TBR1416)と同じ伝染性単核球症患者(TBR1610)の間のメチル化密度の差を示す。このグラフィック表示は、異なるEBV関連病態における血漿EBV DNAのメチル化パターンの分析および比較の一例を示す。
一般に、NPC患者はより高いメチル化を有し、メチル化の差は有意な値を有する。このような差分値は、様々な方法で、例えば、合計して全体的な差分値を取得するなど、定量化することができる。この全体的な差分値は、クラスタリングで使用される2人の対象間の距離として機能することができ、各メチル化値(例えば、部位ごとのインデックスまたは領域ごとのレベル)は、多次元データポイント中の1つのデータポイントである。
2.同一病態
図5は、本開示の実施形態による、NPC(TBR1392およびTBR1416)の同じ診断を有する2人の患者間のEBVゲノム全体におけるCpG部位のメチル化密度の差を示す。一般に、2つの異なる疾患を有する患者のこれまでの分析と比較して、EBVゲノム全体におけるメチル化密度の差はより小さい(図4)。2人のNPC対象(TBR1392対TBR1416)間のメチル化差の中央値は、0.3%(IQR:-1.2~2.5%)であった。これは、EBV関連疾患と同じ診断を受けた患者が、類似の血漿EBV DNAのメチル化パターンを有し得ることを示す。メチル化密度の差は、特定の症例に特有のいくつかの疾患特性に影響を与え、追加の診断または予後情報を提供し得る。
3.NPCおよび偽陽性
図6は、本開示の実施形態による、初期ステージNPCを有する患者(AO050)と血漿EBV DNAの偽陽性結果を有する対象(HB002)との間の血漿EBV DNAのメチル化パターンの差を示す。この比較は、初期ステージNPC患者と、NPCを有さないが連続検査で血漿EBV DNAが持続的陽性であった対象との血漿EBV DNAのメチル化パターンを示す。どちらも本発明のスクリーニングコホートからのものであった。血漿DNAを動員時に最初の血液試料から抽出した。
図6に示すように、初期ステージNPC患者(AO050)と血漿EBV DNAの偽陽性結果(HB002)を有する対象との間には、血漿EBV DNAのメチル化パターンに差がある。しかし、NPC対象とIM対象との差の数とサイズは、図4のプロットよりも小さい。したがって、NPC対象と偽陽性対象との間に差があるという事実は、癌スクリーニングの精度を高める能力を示す。また、差がIM対象とは異なるスケールのものであるという事実は、3つの病態のいずれかを有する対象を区別するあらゆる能力を示す。この観察に基づいて、血漿EBV DNAメチル化パターンを使用して、2つの群(初期ステージNPCを有する対象および偽陽性の結果を有する対象)を区別する診断的有用性を調査し、そのデータを後のセクションで提供する。
D.同様の患者と異なる患者のメチル化密度間の相関
異なる部位でのメチル化密度の差分値を分析することに加えて、メチル化密度を一緒にプロットして、相関関係またはその欠如を特定し得る。例えば、2次元プロットの各データポイントには、同じ部位の2人の対象からの2つのメチル化密度を含めることができる。メチル化密度が相関している場合(例えば、対象2人が同一病態を有する場合)、プロットは線形の挙動を示す。メチル化密度が相関していない場合(例えば、対象2人が同一病態を有する場合)、プロットは線形の挙動を示さない。
図7A~7Cは、2つの臨床症例間の血漿EBV DNAのメチル化プロファイルの差を示す。図7A~7Cでは、3つのグラフの各データポイントは、1人の患者のEBVゲノム全体におけるCpG部位のメチル化密度(x軸上)および対応する他の患者の同じCpG部位のメチル化密度(y軸上)を表す。
図7Aおよび7Bは、異なる疾患(1人のNPCと1人の伝染性単核球症)を有する2人の患者間のメチル化密度を示す。図に示すように、メチル化密度は相関していない。NPC対象は、IM対象と一致しない高いメチル化密度(例えば、80%以上)を一貫して有するため、上部に水平バンドが生じる。このような挙動は、2つの対象が異なること、例えば、異なる病態を示す。異なる病態には、疾患のあるものと疾患のないものが含まれ得る。
図7Cは、NPCを有する2人の異なる患者間のメチル化密度を示す。図7Cでは、斜めの傾向線(勾配はほぼ1に等しい)を観察することができ、これは各CpG部位のメチル化密度が、NPCを有する2人の異なる患者間で類似していることを示唆している。このグラフィカルパターンは、図7Aおよび7Bでは観察されない。これらの結果は、異なるEBV関連疾患の患者が、血漿EBV DNA断片の異なるメチル化プロファイルのパターンを有することを再び示唆する。実施形態は、部位(または部位の領域)のそのような異なるメチル化特性を使用して、異なる病態間で異なるメチル化密度を有する部位/領域を特定し、それらの部位/領域を使用して病態を区別するためのメチル化レベル(複数可)を決定することができる。
IV.血漿EBV DNAのメチル化パターンを使用するEBV関連病態の識別
異なるEBV関連病態における血漿EBV DNAのメチル化プロファイルの体系的な比較のために、各症例について「メチル化割合」(一種の「メチル化密度」の一例)を使用した。血漿EBV DNA断片のメチル化割合は、次の方程式を使用して導き出すことができる。
式中、M´はメチル化されたリード数、U´は1つ以上のCpG部位での非メチル化リード数であり、予め選択することができる。メチル化割合は、本発明の捕捉プローブでカバーされるEBVゲノム内のすべてのCpG部位または一部のCpG部位に基づいて計算されることができる。メチル化レベルの他の例も使用されることができる。
A.ゲノム全体のメチル化レベルの集約
EBVゲノム全体における単一メチル化レベルの一例として決定されることができる。特定のCpG部位のセットでメチル化されたEBV DNA分子の集合数を使用して、体積の尺度などの他のDNA分子を含む測定量による正規化、他のDNA分子に対応する強度、または他のDNA分子の数とともに、ゲノム全体のメチル化レベルとしてメチル化割合を決定することができる。一実施形態では、本発明者らは、本発明の捕捉プローブによってカバーされるEBVゲノム内のCpG部位に基づいて、血漿EBV DNA分子のメチル化割合を計算した。
図8は、本開示の実施形態による、伝染性単核球症(IM)(患者数n=2)、EBV関連リンパ腫(n=3)、一時的陽性の血漿EBV DNA(n=3)、持続的陽性の血漿EBV DNA(n=3)、およびNPC(n=6)を有する対象においてカバーされる全CpG部位に基づく血漿EBV DNAのメチル化割合を示す。図8は、5つの異なる病態の箱ひげ図を示す。図に示すように、中央値は異なる病態を区別するために十分に分離されている。例えば、約79%の参照レベルは、EBVが持続的に陽性である患者とNPCを有する患者とを区別することができる。
全体として、血漿EBV DNAのゲノム全体の集合したメチル化割合を分析することで、異なるEBV関連疾患/病態を区別することができた(p値=8.52e-05、一元分散分析検定)。NPC患者6人のうちの4人は、スクリーニングコホートからの患者で、初期ステージNPC(ステージIまたはII)であった。したがって、初期ステージの病態でさえ、その病態(例えば、持続的陽性の対象)を有さない対象と区別することができる。異なる参照レベルを使用して異なる病態を区別することができ、例えば、約57%未満を使用してIMを特定し、57%~63%を使用して一時的陽性の対象を特定することができる。いくつかの実施形態では、所与のメチル化レベルについて、より幅広い病態セットからの2つ以上の病態を特定することができる(例えば、リンパ腫および一時的陽性は57%~63%の範囲で特定されることができる)。そのような状況では、確率を各病態に割り当てることができる。例えば、検査対象のメチル化は、2群の参照対象、すなわち、病態A(例:リンパ腫)に罹患している1群と、病態B(例:伝染性単核球症)に罹患しているもう1群と比較することができる。参照対象の2群の平均からの標準偏差の数を決定することができる。標準偏差の数に基づいて、2つの病態に罹患している確率を計算することができる。これらの確率を使用して、これら2つの病態に罹患している相対的な可能性を判断することができる。
選択される特定の参照値(複数可)は、メチル化レベルが決定される特定の様態に依存し得る。例えば、メチル化割合は、メチル化DNA分子の数M(例えば、リード数または強度を使用して決定される)を非メチル化DNA分子の数U(例えば、リード数または強度を使用して決定される)で割った、例えば、M/Uである。他のスケーリング係数または加算係数は、特定の参照値を変更し得る。本試料のメチル化レベルが参照試料のメチル化レベルと同じ様態で決定される限り、選択された参照レベルが適用される。参照レベルは、後の結果に示すように、メチル化レベルを測定するために選択した部位にも依存し得る。
メチル化レベルを使用して異なる病態を区別する能力は、部位で検出されたDNA分子の数に依存し得るが、本明細書に示された結果は、EBV DNA分子の数が比較的少なくなり得ることを示す。例えば、図8では、異なる対象における血漿EBV DNA分子の5%値は44であり、最小は26である。種々の実施形態では、無細胞ウイルスDNA分子の数は、少なくとも10個の無細胞DNA分子、例えば、20、30、40、50、100、または500個の無細胞DNA分子を含むことができる。他の実施形態では、無細胞DNA分子の総数を対象について分析し、特定のウイルスゲノムは少なくとも1,000個の無細胞DNA分子またはそれ以上(例えば、少なくとも10,000個、少なくとも100,000個、または少なくとも1,000,000個)であり得る。
B.特異的メチル化領域(DMR)
捕捉プローブでカバーされるすべての部位を使用する代わりに、特定の部位のみを使用することができる。これらの部位は、すべての部位を分析して、特定の特性、例えば、特定の病態間で異なるメチル化レベルを有する部位を選択することにより決定されることができる。部位は、領域ごとに個別にまたは集合的に分析されることができ、例えば、1つの領域に2つ以上の部位を割り当て、その領域に対してメチル化レベルを決定することができる。部位および領域は、ウイルスゲノムにわたり得ることにより、例えば、1つの部位/領域に限定されずに、ゲノム全体であり得る。例えば、1kb、2kb、5kb、または10kbごとに少なくとも1つの部位/領域を使用することができる。
したがって、いくつかの実施形態は、特異的メチル化領域(DMR)内のCpG部位に基づいてメチル化割合を計算することができる。血漿EBV DNAのメチル化パターンが異なるEBV関連疾患で異なることを先に示した。したがって、DMRが存在するべきであり、DMR内ではメチル化レベルは異なる疾患/病態間で異なる。個々の部位を使用することに加えて、異なるサイズの非重複ウィンドウを使用することができる。例えば、非重複領域のサイズは、50bp、100bp、200bp、300bp、400bp、500bp、600bp、800bp、および1000bpに設定することができるが、これらに限定されない。別の例では、各CpG部位は、例えば、結合部位領域を使用せずに、個別に分析されることができる。
DMRは、異なる病態の対象の特定のメチル化レベルを有するように選択されることができる。例えば、領域内のCpG部位のメチル化割合が、疾患/病態の1つ以上の症例において10%、20%、30%、40%、50%、60%、70%、80%、または90%未満、かつ別の疾患/病態の1つの症例において10%、20%、30%、40%、50%、60%、70%、80%または90%超である場合、DMRを定義することができる。さらに別の実施形態では、疾患ごとに2つ以上の症例を使用してDMRを定義することができる。また、2つを超える疾患/病態のカットオフ基準、例えば、各病態で異なる範囲のメチル化レベルなどを使用することができる。
1.IM<50%およびNPC>80%を使用するDMR
このようなDMRのマイニングを示すために、伝染性単核球症患者1人(TBR1610)とNPC患者1人(TBR1392)を無作為に選択した。ここでは、まず、EBVゲノム全体におけるサイズが500塩基対(bp)の非重複ウィンドウ(位置1~500、501~1000などのビン)を設定した。500bpの領域内で、IM(TBR1610)およびNPC(TBR1392)を有する患者における領域内のすべてのCpG部位の平均メチル化割合を計算した。この例では、領域内のすべてのCpG部位の平均メチル化割合が、伝染性単核球症(TBR1610)の症例では50%未満であり、NPC(TBR1392)の症例では80%超である場合に、500-bp領域はDMRの第1の選択基準を満たし得る。
図9は、本開示の実施形態による、第1の選択基準を満たす特異的メチル化領域(DMR)のマイニングを示す。図9は、図7Aに示す2つの症例に対応する。図9の各データポイントは、IM対象(x軸)のEBVゲノム全体の500-bp領域のメチル化割合と、NPC対象(y軸)の対応する同じ500-bp領域のメチル化割合を表す。上で定義されたこの第1の選択基準を使用して、本発明者らは、821個のCpG部位(本発明のプローブで捕捉されるEBVゲノム内の全CpG部位の約10%)からなる合計39個のDMRを特定した。これらの39個のDMRは、図9の左上隅にある。
図9では、NPC対象のメチル化割合を縦軸上に示し、IM対象のメチル化割合を横軸上に示す。垂直線901IM症例のメチル化割合の50%のカットオフを示す。水平線902は、NPC症例の80%のカットオフを示す。したがって、左上のセクション(一般に910としてマーク)の領域は、この例のDMRに対応する。
図10は、図9に記載された基準を満たす39個の特異的メチル化領域のゲノム座標をリストする表である。列1001は、この例ではEBVであるウイルスゲノムをリストする。列1002は、参照EBVゲノムの開始ゲノム座標を示す。列1003は、参照EBVゲノムの終了ゲノム座標を示す。メチル化密度列1004IM対象およびNPC対象におけるメチル化密度。
これらのDMRは、他の対象のメチル化レベル(複数可)を決定するために使用することができる。一実施形態では、このDMRセットのうちの1つの部位をカバーする各配列リードのメチル化状態を使用して、DMRセットに対応する割合を決定する。このメチル化割合は、図8と同様の様態で決定されることができるが、配列リードのサブセット、すなわちDMRのセット内の部位に対応するものが使用される。他の実施形態では、DMRの各々について個々のメチル化レベルを決定することができる。対象のメチル化レベルは、多次元データポイントを形成することができ、例えば、クラスタリング技術または参照平面(多次元空間の超平面)は、異なる病態を有する対象または異なる分類/病態のレベルを分離することができる。これらの病態を区別するために他の分析方法、例えば、ナイーブベイズ、ランダムフォレスト、決定木、サポートベクターマシン、k最近傍、K平均クラスタリング、ガウス混合モデル(GMM)、密度ベースの空間クラスタリング、階層的クラスタリング、ロジスティック回帰分類、およびその他の教師ありおよび教師なし分類または回帰方法を使用することができるがこれらに限定されない。
図11は、本開示の実施形態による、伝染性単核球症(IM)(n=2)、EBV関連リンパ腫(n=3)、一時的陽性の血漿EBV DNA(n=3)、持続的陽性の血漿EBV DNA(n=3)、およびNPC(n=6)を有する対象の同一群における上述(図8)の39個のDMR内の821個のCpG部位に基づく血漿EBV DNAのメチル化割合を示す。これらは、図8で使用されたものと同じ対象である。メチル化割合は、39個のDMRのセット内の821部位に対応する(例えば、整列させる)配列リードを使用して、単一の値として決定される。
図11は、5つの異なる病態の箱ひげ図を示す。図に示すように、中央値は異なる病態を区別することができる。例えば、約75%の参照レベルは、EBVが持続的に陽性である患者とNPCを有する患者とを区別することができる。異なる群間でメチル化割合の統計的に有意な差を観察することができ(p値=1.83e-05、一元分散分析検定)、これは図8よりも優れている。
図11には、図8といくつかの差がある。例えば、DMRがこれらの対象の特定の範囲にあるように特異的に選択されているので、IMとNPCの値の広がりは小さい。このような結果は、異なる病態を示すメチル化レベルの異なる範囲基準が、対象の異なる分類を識別するより選択的な技術を提供することができることを示す。さらに、NPC対象と持続的に陽性の対象との差は、図8よりも大きい。
2.IM<80%およびNPC>90%を使用するDMR
前のセクションと同様に、初期NPC患者と、検出可能な血漿EBV DNAを有する非NPC患者とを区別するために、分化メチル化領域に基づいて使用メチル化割合の分析を行った。分析されたすべてのNPC患者および非NPC対象は、見込みスクリーニングコホートを通じて特定された(Chan et al.N Engl J Med 2017;377:513-522)。DMRをマイニングするために、NPC患者2人(TBR1416およびFD089)および伝染性単核球症の患者1人(TBR1748)を無作為に選択した。さらに別の実施形態では、検出可能な血漿EBV DNAを有する非EBV対象を含む他のEBV関連疾患または病態をDMRのマイニングに使用し得る。EBVゲノム全体でサイズが500塩基対(bp)の非重複ウィンドウを設定する。
図12は、本開示の実施形態による、第2の選択基準を満たす特異的メチル化領域(DMR)のマイニングを示す。前のセクションとは対照的に、DMRのマイニングには、疾患ごとに2つ以上の症例(この分析ではNPC)を含めた。第2の選択基準は、(1)サイズが500bpの非重複、連続ウィンドウ、および(2)選択された伝染性単核球症の症例(TBR1748)で80%未満、鼻咽頭癌の両症例(TBR1416およびFD089)で90%超の領域内のCpG部位のメチル化割合に対応する。図12の各データポイントは、IM対象(x軸)のEBVゲノム全体の500-bp領域内のすべてのCpG部位の平均メチル化割合と、NPC対象2人(y軸上)の同じ領域の対応する平均メチル化割合を表す。
図12では、NPC対象のメチル化割合を縦軸上に示し、IM対象のメチル化割合を横軸上に示す。垂直線1201は、IM症例のメチル化割合の80%のカットオフを示す。水平線902は、NPC症例の90%のカットオフを示す。上で定義されたこの第2の選択基準を使用して、1,520CpG部位(本発明のプローブで捕捉されたEBVゲノム内の全CpG部位の約20%)からなる合計46個のDMRを特定した。46個のDMRは左上のセクションに示される(一般的に領域1210としてマークされる)。
図13は、本開示の実施形態による、一時的陽性の血漿EBV DNAを有する非NPC対象、持続的陽性の血漿EBV DNAを有する非NPC対象、およびNPC患者における図12に明記の46個のDMRに基づく血漿EBV DNAのメチル化割合を示す。各データポイントは異なる対象に対応する。一時的陽性および持続性陽性の分類は、前述のとおり、すなわち、試料から2回採取されたEBV DNAリードの数に基づいて決定される。
標的化バイサルファイト配列決定により、一時的陽性の血漿EBV DNAを有する非NPC対象117人、持続的陽性の血漿EBV DNAを有する非NPC対象39人、NPC患者30人を分析した。非NPC対象およびNPC患者はすべて、見込みスクリーニングコホートから動員された。上で定義したDMR(図12)に基づいて、3群間で血漿EBV DNAのメチル化割合を比較した。メチル化割合は、46個のDMRのセット内の1,520部位に対応する(例えば、整列させる)配列リードを使用して、単一の値として決定される。
一実施形態では、メチル化割合の集計の計算のために、様々なDMRに異なる重みを割り当てることができる。このような重み付けは、様々な方法、例えば、部位での各メチル化配列リードのスケーリング係数(例えば、領域により高い重みを付ける場合は1を超える係数を掛ける)で実装することができるか、またはスケーリング係数を領域のメチル化割合に適用し得、これにより、領域のメチル化割合の加重平均値を提供する。この例では、定義されたすべてのDMRに等しく重みを適用した。
NPC群の46個のDMRに基づく血漿EBV DNAの平均メチル化割合(平均=88.3%)は、一時的陽性(平均=65.3%)および持続的陽性(平均=71.1%)の血漿EBV DNAを有する他の2つの非NPC群の平均メチル化割合よりも有意に高かった(p<0.0001、クラスカル・ワリス検定)。したがって、NPC患者は、血漿EBV DNAのメチル化プロファイルの差(例えば、DMRに基づく血漿EBV DNAのメチル化割合で表される)に基づいて、検出可能な血漿EBV DNA(一時的陽性または持続的陽性)を有する非NPC対象と区別することができる。
この例および本明細書に記載の他の実施形態において、分類を区別するための参照レベルは様々な方法で決定することができる。一実施形態では、NPC対象とNPCではない対象とを区別するために使用されるカットオフ値(参照レベル)は、分析中のNPC患者(トレーニングセット)間のEBV DNAメチル化割合の最低値であり得る。他の実施形態では、カットオフ値は、例えば、NPC患者の平均EBV DNAメチル化割合マイナス1標準偏差(SD)、平均マイナス2SD、平均マイナス3SDとして決定することができる。さらに他の実施形態では、カットオフは、例えば、分析中のNPC患者の100%、95%、90%、85%、80%を含むがこれらに限定されないノンパラメトリック法により、受信者動作特性(ROC)曲線を使用して決定され得る。
本例では、メチル化割合の80%のカットオフ値を設定して、NPC検出で95%を超える感度を実現することができる。この80%のカットオフ値を使用すると、NPC患者30人中29人、一時的陽性の血漿EBV DNAを有する非NPC対象119人中16人、および持続的陽性の血漿EBV DNAを有する非NPC対象39人中6人が、標的化バイサルファイト配列決定により定義された46個のDMR内に決定された血漿EBV DNAのメチル化割合を有し、カットオフ値(80%)より高かった。計算された感度、特異度、および陽性予測値は、それぞれ96.7%、85.9%、および58.5%であった。
C.同一病態の代表的なメチル化コンセンサス領域
以下の例では、同一病態の対象間でメチル化密度が似ている領域を特定することを目的とした。このような領域を、病態の代表的なメチル化コンセンサス領域と定義する。いくつかの実施形態では、そのような基準はまた、病態間の特異的メチル化の基準と組み合わせることができる。
「代表的な」メチル化コンセンサス領域の特定を実証するために、NPC患者2人(TBR1392およびTBR1416)を無作為に選択した。ここでは、EBVゲノムを500bpの非重複領域に分割した。他の実施形態では、異なるサイズの重複領域が設定され得る。例えば、重複領域のサイズは、50bp、100bp、200bp、300bp、400bp、600bp、800bp、および1000bpに設定することができる。500bpの領域内で、NPC(TBR1392およびTBR1416)を有する患者2人における領域内のすべてのCpG部位の平均メチル化割合を計算した。
図14は、本開示の実施形態による、第3の選択基準を満たす代表的なメチル化コンセンサス領域のマイニングを示す。第3の選択基準は、(1)サイズが500bpの非重複、連続ウィンドウ、(2)2つのNPC症例間の1%未満の領域の全体的なメチル化密度の差、および(3)両症例で80%超の領域の全体的なメチル化密度に対応する。
他の実施形態では、2人のNPC患者間のメチル化割合の差が、2つのNPC症例間で2%、3%、4%、5%、6%、7%、8%、9%、または10%未満、かつメチル化割合が、10%、20%、30%、40%、50%、60%、70%、または90%を超える場合、「代表的な」メチル化コンセンサス領域を定義し得る。疾患ごとに2人を超える対象を使用して、「代表的な」メチル化コンセンサス領域を定義することができ、例えば、各対象のメチル化割合は特定の類似カットオフ(例えば、1%)内で、メチル化割合の特定の範囲内(例えば、80%超)にある。
図14の各データポイントは、NPC対象(x軸上)のEBVゲノム全体の500bp領域のメチル化割合と、他のNPC対象(y軸上)の同じ領域のメチル化割合を表す。上で定義した選択基準を使用して、本発明者らは79の領域を特定した。これらの79個のDMRは、図14の領域1410に見出され得る。
図14では、第1のNPC対象のメチル化割合を縦軸上に示し、第2のNPC対象のメチル化割合を横軸上に示す。垂直線1401は、IM症例のメチル化割合の80%のカットオフを示す。水平線1402は、NPC症例の80%のカットオフを示す。したがって、右上のセクションの領域(一般に領域1410としてマークされている)は、この例のDMRに対応する。
図15は、本開示の実施形態による、伝染性単核球症(IM)(n=2)、EBV関連リンパ腫(n=3)、一時的陽性の血漿EBV DNA(n=3)、持続的陽性の血漿EBV DNA(n=3)、およびNPC(n=6)を有する対象の同一群における上述(図12)の「代表的な」メチル化コンセンサス領域に基づく血漿EBV DNAのメチル化密度を示す。群間のメチル化割合に統計的に有意な差を観察できた(p値=0.00371、一元分散分析検定)。これらのデータに基づいて、代表的なメチル化コンセンサス領域の血漿DNAのメチル化密度を分析することにより、検査試料の状態を決定することができる。例えば、90%のメチル化密度は、試料がNPC患者から採取されることを示し、80%のメチル化密度は、試料がEBV陽性リンパ腫の患者からのものであることを示す。
D.単一CpG部位分析
部位のセットに基づいて集計メチル化レベルを計算することに加えて(例えば、上のセクションで説明したように)、実施形態は、EBVゲノム内の個々のCpG部位に基づいてメチル化割合を計算することができる。異なるEBV関連疾患に特異的なメチル化レベルを有する個々のCpG部位を特定するために、持続的陽性のEBV DNAを有するがNPCを有さない対象3人の血漿DNAリードの配列データをプールし、配列深度を7倍にした。次に、持続的陽性のEBV DNAを有する対象3人およびNPC患者3人(AO050、TBR1392、およびTBR1416)のプールされた配列データ間で、すべてのCpG部位のメチル化割合を比較した。配列データをプールすることは、すべての配列リードが同一対象からのものであるようにメチル化割合が決定されたことを意味する。
種々の実施形態では、CpG部位のメチル化割合が、疾患の一症例(対象)において10%、20%、30%、40%、50%、60%、70%、80%または90%未満、かつ別の疾患の一症例において10%、20%、30%、40%、50%、60%、70%、80%または90%超である場合、特異的メチル化レベルを有するこれらの個々のCpG部位を定義し得る。基準は、疾患ごとに2つ以上の症例に適用して、例えば、領域を使用する例について上で説明したように、異なる病態の異なる範囲で、ならびに異なる(より大きい)病態または同一病態(閾値内)を有する対象間の特定の分離で行い得るようにDMRを定義することができる。
付録Aは、持続的陽性のEBV DNAを有する対象3人とNPC患者3人のプールされた配列データ間のこれらのCpG部位のメチル化割合の差が20%を超える場合に、特異的メチル化レベルを持つEBVゲノム全体における個々のCpG部位のリストを示す。*でマークされた部位は、40%超、**は60%超、***は80%超の差を有する。他の実施形態では、特異的メチル化レベルを有するCpG部位は、20%、30%、50%、70%、または90%超のメチル化割合の差で定義され得る。ここで、60%を超える差があるいくつかの例示的な部位が分析される。
図16は、本開示の実施形態による、持続的陽性の血漿EBV DNAを有する3症例のプールされた配列決定データで80%超の部位、およびNPCを有する3対象で20%未満の平均値の部位にわたるメチル化割合を有するCpG部位の例を示す。伝染性単核球症の患者2人のこれらの部位にわたるメチル化割合も含まれていた。メチル化割合を縦軸上に示し、横軸は基準を満たす8個の個別の部位を列挙する。部位には連番が付されている。
図に示すように、すべての部位で、非NPC対象者(持続的陽性およびIMを含む)とNPC対象のうちの2人(TBR1416およびTBR1392)は良好に分離される。NPC対象AO050について、部位1~4、7、および8は良好な分離を提供するが、部位5および6は提供しない。したがって、2つの病態を区別するために決定された個々の特異的にメチル化された部位(例えば、単なる領域としてではない)は、1つの病態(NPC)と2つ以上の病態を区別するためにも使用されることができる。
図17は、本開示の実施形態による、持続的に陽性の血漿EBV DNAを有する3症例のプールされた配列決定データで20%未満の部位、およびNPCを有する3対象で80%超の部位にわたるメチル化割合を有するCpG部位の例を示す。伝染性単核球症の患者2人のこれらの部位にわたるメチル化割合も示す。この基準は、図16で使用した基準の反対である。メチル化割合を縦軸上に示し、横軸は基準を満たす22個の個別の部位を列挙する。部位には連番が付されている。
図に示すように、すべての部位で、非NPC対象者(持続的陽性およびIMを含む)とNPC対象は良好に分離される。これは、個々の部位を使用して分類を区別することができることを示す。また、特定の長さの同じ連続領域内にあるのとは対照的に、ウイルスゲノム全体から部位を選択することができる。例えば、より多くのEBV DNA断片を検出することができるように、より多くの部位を選択して統計的精度をより高めることができる。
一実施形態では、特異的メチル化レベルを有する複数のCpG部位(例えば、付録Aならびに図16および17で明記されるもの)は、互いに指定された距離内にあるように選択される。このようにして、個々のウイルスDNA断片が複数の部位を各々カバーし得る。例えば、特定の距離は150bpになり得、これは血漿DNA分子のおよそ代表的なサイズであるためである。そのような状況では、PCR増幅による複数の特異的にメチル化されたCpG部位を有する特定の領域の標的化した増幅が可能であろう。このターゲット分析は、ゲノム全体の分析アプローチを使用するよりも低コストであろう。
したがって、様々な実施形態では、メチル化パターンの分析は、ウイルスゲノム全体のゲノム領域または個々のCpG部位に基づくことができる。そのような領域分析では、ウイルスゲノムはゲノム座標に基づいて異なる領域に分割することができ、各領域はそのような領域内のすべてのCpG部位を含む。あるいは、特異的にメチル化されたCpG部位を最初に選択して、領域内でマージしてDMRを形成することもできる。別の例では、すべてのCpG部位を、有益な部位を事前に選択することなく、領域のメチル化密度の計算に含めることができる。
E.階層的クラスタリング分析
いくつかの実施形態は、メチル化レベル超を使用して分類を区別し得る。一例では、クラスタリング技術が使用され得る。このようなクラスタリング技術では、各対象について複数のメチル化レベル、例えば、異なる領域(各々が1つ以上の部位を含む)のメチル化レベル、個々の部位のメチル化レベル、またはそれらの組み合わせを決定することができる。いくつかの実施形態では、クラスタリングは階層的であり得る。
メチル化レベルのセットは、メチル化レベルの数に等しい長さを有する多次元データポイントを表すベクトルを形成することができる。本明細書で説明するように、領域(ビン)は様々なサイズのものであり得る。また、クラスタリング分析は、異なるサイズの非重複連続ビンに基づくことができる。例えば、ビンのサイズは、50bp、100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、または1000bpで定義することができる。したがって、クラスタリング分析は、異なる部位/ビンのメチル化レベルと、異なる対象間の対応するメチル化レベルとの比較に基づいて行うことができる。
図18は、本開示の実施形態による、NPC患者6人(本発明のスクリーニングコホートからの初期ステージ疾患の患者4人を含む)、節外性NK-T細胞リンパ腫患者2人、および伝染性単核球症患者2人についての血漿EBV DNAのメチル化パターン分析に基づく階層的クラスタリング分析を使用したクラスター樹状図を示す。この例では、階層的クラスタリング分析は、サイズが500bpの非重複連続領域内のCpG部位のメチル化割合の比較に基づいていた。クラスタリングは、異なる領域のメチル化割合の差に基づいて異なる対象をグループ化し、差を組み合わせて距離を提供することができる。
図18では、距離は上部水平軸に沿って示される。距離は、例えば、異なる遺伝子座のメチル化密度が多次元ポイント(距離が2つの多次元ポイントの間である)を表すベクトルに対応する場合、各メチル化密度(パーセンテージ)の差の合計として決定されることができる。2人の対象は、それらの間の距離に等しいポイントで組み合わせることができる。新しい患者を検査する場合、メチル化割合の新しい多次元ポイント(または他のレベル)を使用して、ノード(例えば、ノード1801または1802)に示すように、参照対象(例えば、図18に示すもの)のうちの最も近い1つまたは最も近いサブグループを決定する。最も近い参照対象または参照ノードの特定によって、分類を提供することができる。
クラスター樹状図1800は、NPC対象が増加的に一緒にクラスター化され(NPC対象はすべて、ノード1803でサブグループにクラスター化されている)、他の病態を有する対象を含まないことを示す。これは、IM対象およびリンパ腫対象からNPC対象を区別する能力を示す。同様に、IM対象を一緒にグループ化する。注目すべきことに、NK-T細胞リンパ腫の患者2人は一緒にクラスター化されなかった。患者1629はステージIVの疾患であり、患者1713はステージIの疾患であった。これは、メチル化パターンが同じ疾患の異なるステージにわたって進行し得ることを示すことができる。このうちの1つの潜在的な用途は、患者の病期分類と予後診断にメチル化プロファイルを使用することであろう。
血漿EBV DNAのメチル化パターンを介したクラスタリング分析に基づいて、異なるEBV関連疾患を区別することの実現可能性を実施した。例えば、特定のパターンが特定された後、実施形態は疾患を含むまたは除外することができる。主成分分析、線形判別分析、ロジスティック回帰、機械学習モデル、k平均クラスタリング、k最近傍、およびランダム決定フォレストを含むがこれらに限定されない他の分類アルゴリズムも使用することができる。
図19は、本開示の実施形態による、NPC患者6人(本発明のスクリーニングコホートからの初期ステージNPC患者4人を含む)、および持続的に陽性の血漿EBV DNAを有する非NPC対象3人についての血漿EBV DNAのメチル化パターン分析に基づく階層的クラスタリング分析を使用したクラスター樹状図を示す。血漿DNAを動員時に最初の血液試料から抽出した。この例では、階層的クラスタリング分析は、サイズが500bpの非重複連続ビン内のCpG部位のメチル化割合の比較に基づいていた。
図19では、距離も上部水平軸に沿って示される。距離は前述のとおり決定することができる。図18と同様に、2人の対象は、それらの間の距離に等しいポイントで組み合わせることができる。示されるように、NPC対象は、例えば、ノード1901および1902で、他のNPC対象とともにクラスター化される。クラスター樹状図1900は、NPC対象が増加的に一緒にクラスター化され(NPC対象はすべて、ノード1903でサブグループにクラスター化されている)、他の病態(すなわち、この例では持続的陽性)を有する対象を含まないことを示す。同様に、持続的陽性の対象が最初にグループ化される。これは、NPC対象を持続的陽性の対象と区別する能力を示す。
したがって、本発明者らは、連続分析の必要性のない、最初の血液試料由来の血漿EBV DNAのメチル化パターン分析に基づいて、偽陽性の血漿EBV DNAを有する非NPC対象から初期ステージNPC患者を区別する実現可能性を実証した。つまり、異なる時間に複数の測定を必要とするのではなく、単一の測定で正確な分類を行うことができる。これにより、連続血液検査および確認目的のさらなる調査のためのロジスティック配置で医療費を節約することができる可能性がある。
図20は、鼻咽頭癌、NK-T細胞リンパ腫、および伝染性単核球症の患者の全EBVゲノムにおけるすべての非重複500bp領域のメチル化レベルを示すヒートマップ2000を示す。各ウィンドウのメチル化レベルは、ウィンドウ内のすべてのCpG部位(選択なし)のメチル化密度の平均値として計算された。NPC患者5人、NK-T細胞リンパ腫患者3人、伝染性単核球症3人の血漿EBV DNAのメチル化パターンを分析した。本例では、メチル化パターンは、500-bpのすべての非重複ウィンドウのメチル化割合によって分析される。カラーキー/ヒストグラム2050は、異なるメチル化割合を異なる色で示し、白はゼロに近く、黄色(ライトグレー)は低い(例:約20%)、オレンジ(ミディアムグレー)は中程度(例:約50%)、および赤色(ダークグレー)は高い(例:約80%以上)を示す。カラーキー/ヒストグラム2050は、特定のメチル化レベルを持つ領域の数のヒストグラムも示す。
ヒートマップ2000は、全症例のEBVゲノム上のすべての非重複500bpウィンドウ全体におけるメチル化レベルを示す。各行は1つの500bp領域を表し、色はそのメチル化レベルを表す。各列は1つの症例を表す。クラスター樹状図2010は、異なる症例のクラスタリングを示す。同じ診断の異なる症例が一緒にクラスター化された。例えば、NPC症例はすべて右側上でクラスター化されており、暗赤色(ダークグレー)で明示されるように、高いメチル化レベルを示す。リンパ腫の対象は中央でクラスター化され、黄色(ライトグレー)(低メチル化レベル)および赤色(ダークグレー)(高メチル化レベル)が混在している。伝染性単核球症試料のクラスターが左側上に示され、明るい黄色(ライトグレー)により明示されるように、比較的低いメチル化レベルを示す。
図20は、血漿EBV DNAのメチル化パターンの分析を通してEBV関連疾患を予測する実現可能性を示す。さらに、EBVゲノムにわたるすべての領域とは対照的に、DMRを使用するとより高い精度が見られる。
他の実施形態では、メチル化パターンは、例えば、部位ごとに、(ゲノムワイド分析として)EBVゲノム全体におけるすべてのCpG部位にわたるメチル化割合を通じて導き出すことができる。別の実施形態では、EBV関連疾患または病態の予測のために、個々のCpG部位(複数可)および/またはDMR(複数可)に異なる重み付けを割り当てることができる。このような重み付けは、上記のように様々な方法で実装することができ、例えば、スケーリング係数(重み)を中間のメチル化レベルに適用して、領域またはゲノム全体の加重平均値を得ることができる。ここでは、分析中のすべてのCpG部位に等しく重みを割り当てた。
V.数およびサイズの使用
無細胞試料中の無細胞ウイルスDNA断片のメチル化レベルを使用して、異なる病態および/または病態レベルを有する対象を区別することに加えて、いくつかの実施形態は、無細胞試料中の無細胞ウイルスDNA断片のサイズを使用することができる。いくつかの実施形態はまた、無細胞試料中の無細胞ウイルスDNA断片の数(例えば、割合)を使用することができる。様々な実施形態は、例えば、各技術を使用して対象に同じ分類を必要とすることにより、異なる技術の組み合わせを使用することができる。例えば、a)EBVに整列させる血漿DNA断片の割合、b)血漿EBV DNA断片のサイズプロファイル、およびc)血漿EBV DNAのメチル化プロファイルの任意の組み合わせを分類に使用することができる。目的の診断感度と特異度を達成するために異なる技術を組み合わせる場合、異なる閾値を分類に採用することができる。
A.血漿EBV DNA断片のサイズプロファイル分析
血漿EBV DNA断片のメチル化分析の実行可能性に加えて、各血漿EBV DNA断片のサイズは、EBVゲノムの両端の最も外側のヌクレオチドの座標に基づいて推定された。無細胞EBV DNA断片のサイズ分布は、異なる病態(つまり、異なるパターン)で変わるため、それにより、異なる病態、すなわち病態レベルを有する対象を区別することが可能になる。これらの異なるサイズパターンは、様々なサイズメトリック、例えば、あるサイズ(例えば、第1のサイズ範囲)のウイルスDNA量と別のサイズ(例えば、第2のサイズ範囲)のウイルスDNAのサイズ比で定量化することができる。例えば、サイズ比を使用して、異なる病態の対象間で同一サイズ範囲内の常染色体DNA断片の量に正規化された特定のサイズ範囲(例えば、80~110塩基対)内の血漿EBV DNAリードの割合を比較することができる。
図21は、本開示の実施形態による、NPC患者2人(TBR1392とTBR1416)および伝染性単核球症患者2人(TBR1610とTBR1661)、ならびに連続分析で持続的に陽性の血漿EBV DNAを有する非NPC対象3人(AF091、HB002、およびHF020)においてEBVゲノムおよびヒトゲノムにマッピングされた配列決定された血漿DNA断片のサイズ分布のサイズプロファイルを示す。プロットは、水平軸に沿ってサイズ(bp)、および垂直軸に指定のサイズでDNAの頻度(割合)を示す。ヒトゲノムDNAのサイズ分布を、例えば、サイズ分布2104などの青色(灰色)で示す。EBVサイズ分布は、例えば、サイズ分布2103などの赤色(黒)で示す。
EBVゲノムに整列させた血漿EBV DNA断片と常染色体ゲノムに整列させた血漿EBV DNA断片のサイズプロファイルパターンの差を観察した。例えば、NPC対象は、約160bpのピークでより小さな無細胞EBV DNA断片にシフトし、下端でヒトDNAと同量の断片を有するが、IM対象は、100bp未満でヒトDNAよりも大量のEBV DNAを有する。持続的陽性の対象は、サイズが大きくなるにつれて上下に顕著な変動があるだけでなく、NPC対象に比べてピークがより顕著にシフトする。これらの差は、異なる病態の対象を区別するために使用することができ、例えば、NPCを有する対象と偽陽性の血漿EBV DNA結果を有する対象と区別することができる。
特定のサイズ範囲(例えば、80~110bp)内の血漿EBV DNAリードの割合を個体間で比較することは、血漿EBV DNA断片の量を同じサイズ範囲内の常染色体DNA断片の量に正規化することができる。このメトリックは、サイズ比の例である。サイズ比は、特定のサイズ範囲内の血漿EBV DNAの割合を、対応するサイズ範囲内の配列の参照セット(例えば、ヒト常染色体由来のDNA断片)の割合で割った値で定義することができる。様々なサイズ比を使用してもよい。例えば、80~110塩基対間の断片のサイズ比は次のようになる。
図22は、本開示の実施形態による、NPC患者6人および血漿EBV DNAに対して持続的に陽性である対象3人におけるサイズ比を示す。対象の2群のサイズ比間で統計的に有意な差を観察することができた(p値=0.02、マンホイットニー検定)。NPC対象と持続的陽性の対象とを区別するための参照サイズ値の例は、この特定のサイズ比で2~4(例えば、3)であり得る。
図23は、本開示の実施形態による、一時的陽性の血漿EBV DNAを有する非NPC対象、持続的陽性の血漿EBV DNAを有する非NPC対象、およびNPC患者におけるEBV DNAサイズ比を示す。NPC群(平均=1.9)の平均EBV DNAサイズ比(80~110bp)は、一時的陽性(平均=4.3)および持続的陽性(平均=4.8)の血漿EBVDNAである他の2つの非NPC群のサイズ比の中央値よりも有意に低かった(p<0.0001、クラスカル・ワリス検定)。
したがって、NPC患者は、例えば、EBV DNAサイズ比で表される血漿EBV DNAのサイズプロファイルの差に基づいて、検出可能な血漿EBV DNA(一時的陽性または持続的陽性)を有する非NPC対象と区別することができた。本例では、90%の検出感度を達成するために3のカットオフ値を使用した。3つのカットオフ値を使用すると、NPC患者30人中27人、一時的陽性の血漿EBV DNAを有する非NPC対象117人中23人、および持続的陽性の血漿EBV DNAを有する非NPC対象39人中7人が、カットオフを通過し、それらの血漿EBV DNAサイズ比はカットオフ値よりも低かった。計算された感度、特異度、および陽性予測値は、それぞれ90%、80.8%、および49.2%であった。
カットオフ(参照)値の選択は、様々な方法で決定することができる。一実施形態では、EBV DNAサイズ比のカットオフ値は、分析中のNPC患者(例えば、トレーニングセット内)のEBV DNAサイズ比の最高値を超える任意の値として選択することができる。他の実施形態では、カットオフ値は、例えば、NPC患者の平均EBV DNAサイズ比プラス1標準偏差(SD)、平均プラス2SD、平均プラス3SDとして決定することができる。さらに他の実施形態では、カットオフは、例えば、分析中のNPC患者の100%、95%、90%、85%、80%を含むノンパラメトリック法により、受信者動作特性(ROC)曲線を使用して決定され得る。
サイズ比の他の定義またはサイズ分布の他の統計値は、対象ごとに異なる値をもたらすため、対象を区別するための異なる参照値を有する。例えば、異なるサイズの範囲を使用するか、常染色体DNA断片に染色体のサブセットを使用するか、常染色体DNAをまったく使用しないことができる。核酸断片のサイズ分布の様々な統計値を決定することができる。例えば、サイズ分布の平均値、最頻値、中央値、または平均値を使用することができる。他の統計値、例えば、所与のサイズの累積頻度、または異なるサイズの核酸断片の量の様々な比率を使用することができる。累積頻度は、所与のサイズ以下、または所与のサイズより大きいDNA断片の割合(例えば、パーセンテージ)に対応し得る。したがって、分母の任意の正規化係数(使用する場合)は、異なるサイズ範囲のEBV DNA量に対するものであり得る。統計値は、健康な対照対象または他の病態の1つ以上のサイズ閾値と比較するために、DNA断片のサイズの分布に関する情報を提供する。当業者は、本開示に基づいてそのような閾値を決定する方法を知るであろう。サイズ比の他の例は、米国特許公開第2011/0276277号、同第2013/0237431号、および同第2016/0217251号に見出すことができる。
B.数
血漿EBV DNAのメチル化割合の分析に加えて、標的化バイサルファイト配列決定からの血漿EBV DNAリードの割合を分析した。無細胞EBV DMAリードの割合は、様々な方法、例えば、ヒトゲノムおよびいくつかのウイルスゲノム、または分析中のヒトゲノムおよびウイルスゲノムのみのすべてのDNAリードの割合として決定されることができる。前者の例では、組み合わせた参照配列は、ヒトゲノム全体(hg19)、EBVゲノム全体(AJ507799.2)、HBVゲノム全体、およびHPVゲノム全体を含むことができる。種々の例では、割合は、他のすべてのDNAリードまたは整列可能なもののみと比較して、分析中のウイルスゲノムに整列させるリード数に基づいて決定されることができる。(例えば、一意に、または特定のミスマッチ数とともに)ヒトゲノムといくつかのウイルスゲノムの参照ゲノムを使用して、NPC患者の3群間で血漿EBV DNAリードの割合を一時的陽性および持続的陽性の血漿EBV DNAを有する非NPC対象と比較した。
図24は、本開示の実施形態による、一時的陽性の血漿EBV DNAを有する非NPC対象、持続的陽性の血漿EBV DNAを有する非NPC対象、およびNPC患者において配列決定されたすべての血漿DNAリードのうちの血漿EBV DNAリード(EBVゲノムにマッピングされた血漿DNAリード)の割合を示す。NPC群の血漿EBV DNAリードの平均割合(平均=0.075%)は、一時的陽性(平均=0.003%)および持続的陽性(平均=0.052%)の血漿EBV DNAである他の2つの非NPC群の平均割合よりも有意に高かった(p<0.0001、クラスカル・ワリス検定)。したがって、NPC患者は、血漿EBV DNAの量(すなわち、血漿EBV DNAの割合)の差に基づいて、検出可能な血漿EBV DNA(一時的陽性または持続的陽性)を有する非NPC対象と区別することができる。
カットオフ値4.5x10-6を使用する本例では、NPC患者30人、一時的陽性の血漿EBV DNAを有する非NPC対象119人のうち79人、および持続的陽性の血漿EBV DNAを有する非NPC対象39人のうち34人の全員において、標的化バイサルファイト配列決定による血漿EBV DNA割合がこのカットオフ値よりも高くなった。計算された感度、特異度、および陽性予測値は、それぞれ100%、27.6%、および22.1%であった。
カットオフ(参照)値の選択は、様々な方法で決定することができる。一実施形態では、血漿EBV DNAの割合のカットオフ値は、分析中のNPC患者の割合の最低値未満の任意の値として選択することができる。すべてのNPC患者を捕捉し、最大感度を達成するようにカットオフを設定することができる。他の実施形態では、カットオフ値は、例えば、NPC患者の平均血漿EBV DNAリード割合マイナス1標準偏差(SD)、平均マイナス2SD、平均マイナス3SDとして決定されることができる。本例では、カットオフ値は、すべてのNPC患者の血漿EBV DNAリードの割合の平均から3SDを引いたものに設定された。さらに他の実施形態では、カットオフは、EBVゲノムにマッピングされた血漿DNA断片の割合の対数変換後に決定され、次いで同様の様態(例えば、平均などを使用して)で選択され得る。さらに他の実施形態では、カットオフは、例えば、分析中のNPC患者の100%、95%、90%、85%、80%を含むノンパラメトリック法により、受信者動作特性(ROC)曲線を使用して決定され得る。
C.複合分析
これらの3つの技術を組み合わせて、精度を高めることができる。例えば、複数のメトリック、例えば、複数のメチル化レベルを含む可能性のある各技術の各メトリクスは、対象を分類する(例えば、決定木でなされ得る)、あるいはトレーニング値のプロットの特定のセクション(象限)に対応する対象を特定する、参照値のそれぞれと比較し得る。例えば上述のように、クラスタリング技術を使用することもできる。
NPC特定のための血漿EBV DNA割合(定量化)とサイズ比の分析を組み合わせた値を評価した。また、血漿EBV DNA割合(定量化)の分析とNPC特定のメチル化割合、次いで3つすべてを一緒に組み合わせた値も評価した。
図25は、本開示の実施形態による、NPC患者、一時的陽性、および持続的陽性の血漿EBV DNAを有する非NPC対象についての血漿EBV DNAリードの割合および対応するサイズ比値のプロットである。図23および24で明記されたEBV DNAサイズ比と血漿EBV DNAリードの割合における同じカットオフ値を、灰色の点線で示す。楕円形は、複合分析に合格した象限2510を強調する。
この複合分析では、血漿EBV DNAの割合とサイズ比の両方の分析で、その配列データが同時にカットオフを通過した場合、血漿試料は陽性と見なされた。上で定義したカットオフを使用すると、NPC検出の感度、特異度、および陽性予測値は、それぞれ90%、88.5%、および61.7%であった。
図26は、本開示の実施形態による、NPC患者、一時的陽性、および持続的陽性の血漿EBV DNAを有する非NPC対象についての血漿EBV DNAリードの割合および対応するメチル化割合値のプロットである。図13および24にそれぞれ明記したとおり、46個のDMR内のEBV DNAメチル化割合および血漿EBV DNAリードの割合における同じカットオフ値を、灰色の点線で示す。楕円形は、複合分析に合格した象限2610を強調する。
この複合分析では、血漿EBV DNAの割合とメチル化割合の両方の分析において、その配列決定データが同時にカットオフを通過した場合、血漿試料は陽性であると見なされた(図で明記されたDMRに基づく)。上で定義したカットオフを使用すると、NPC検出の感度、特異度、および陽性予測値は、それぞれ96.7%、89.1%、および64.6%であった。
図27Aおよび27Bは、本開示の実施形態による、NPC患者、一時的陽性、および持続的陽性の血漿EBV DNAを有する非NPC対象についての血漿EBV DNAリードの割合および対応するサイズ比およびメチル化割合値の3次元プロットを示す。NPC特定のための血漿EBV DNA割合(定量化)、サイズ比、およびメチル化割合の3つすべてのパラメーターを組み合わせた値を評価した。割合は、図24と同じ様態で決定された。サイズ比は、図23と同じ様態で決定された。そして、メチル化レベルは、図13に使用される46個のDMRを使用して決定される。
図27Aでは、紫色の表面2710は、3次元空間において一時的および持続的に陽性の血漿EBV DNAを有する非NPC対象をNPC患者と区別する適合3D表面を示す。フィット面の使用は、対象を区別するための参照値が定数値よりも複雑になり得ることを示す。例えば、図26では、メチル化割合のカットオフは、配列リードの割合によって異なる可能性がある。分類の決定におけるこのような柔軟性は、より高い精度を提供することができる。フィッティングは、最適化された様々な精度メトリック、例えば、特異度、感度、または両方の平均値に合わせて選択することができる。このようなフィッティングは、サポートベクターマシンを使用して実行されることができる。図27Bは、図27Aと同じデータを示すが、表面2710がなく、軸がデータの周りのボックスにラベル付けされている。
図28Aおよび28Bは、本開示の実施形態による、数ベース、サイズベース、およびメチル化ベースの分析の様々な組み合わせの受信者動作特性曲線(ROC)曲線分析を示す。精度は、NPC対象と非NPC対象を正しく分類するためのものである。パラメーター(すなわち、割合、サイズ比、およびメチル化レベル)は、図27Aおよび27Bの場合と同じ様態で決定された。カットオフ値が変化したため、感度と特異度に変化が生じた。図27Aは、個々に使用される3つの技術の比較を示す。曲線下面積(AUC)の値が表示される。AUC値は、カウントのみ、サイズのみ、メチル化のみでそれぞれ0.905、0.942、0.979であった。メチル化は最良の結果をもたらす。図28Bは、3つの複合技術の比較を示す。数およびサイズのAUC値は0.97である。数およびメチル化のAUC値は0.985である。3つの技術すべてを使用すると、0.989で最良の精度が得られる。
VI.他のウイルスの例
他のウイルスも癌に関連している。例えば、血漿ヒトパピローマウイルス(HPV)は頭頸部扁平上皮癌(HNSCC)に関連する。また、B型肝炎ウイルス(HBV)は肝細胞癌(HCC)と関連している。以下の結果は、実施形態が他の無細胞ウイルスDNAのメチル化レベル(複数可)を使用して、無細胞EBV DNAにメチル化レベル(複数可)が使用されたのと同様の様態で病態レベルを分類することができることを示す。
A.HPV
図29は、HPV陽性の頭頸部扁平上皮癌(HPV+ve HNSCC)の5症例の臨床ステージを示す。症例は、AJCC Cancer Staging Manual第8版に従ってステージ化された。血漿DNAの標的化バイサルファイト配列により、HPV陽性頭頸部扁平上皮癌(HPV+ve HNSCC)の患者5人の血漿ヒトパピローマウイルス(HPV)DNAリードのメチル化プロファイルを分析した。5人の患者全員が初期ステージ(ステージIまたはII)の疾患を有していた。患者の全員が、その血漿DNA試料中に検出可能なHPV DNA断片を有していた。
各臨床症例について、QIAamp DSP DNA血液ミニキットを使用して、血漿4mLから血漿DNAを抽出した。いずれの場合も、抽出されたすべてのDNAは、TruSeq DNA PCRフリーライブラリー調製キット(Illumina)を使用する配列決定ライブラリーの調製に使用された。アダプターに連結されたDNA産物は、EpiTect Bisulfite Kit(Qiagen)を使用して2回バイサルファイト処理にかけた。KAPA HiFi HotStart Uracil+ReadyMix PCRキット(Roche)を使用して、バイサルファイトに変換した試料に対して12~15サイクルのPCR増幅を実施した。次に、上記のウイルスおよびヒトゲノム領域をカバーするカスタム設計のプローブを使用して、増幅産物をSeqCap-Epiシステム(Nimblegen)で捕捉した(図1)。
ターゲットの捕捉後、捕捉された生成物は、DNAライブラリーを生成するために14サイクルのPCRで濃縮された。DNAライブラリーは、NextSeqプラットフォーム(Illumina)で配列決定された。配列決定の実行ごとに、ペアエンドモードを使用して、一意の試料バーコードを持つ4~6個の試料を配列決定した。各DNA断片について、2つの末端の各々から75ヌクレオチドを配列決定した。配列決定後、配列リードは、メチル化データ解析パイプラインであるMethyl-Pipe(Jiang et al.PLoS One 2014;9:e100360)で処理され、ヒトゲノム全体(hg19)、EBVゲノム全体(AJ507799.2)、HBVゲノム全体、およびHPVゲノム全体を含む人工的に組み合わせた参照配列にマッピングさせることができる。組み合わせたゲノム配列内の一意の位置(他の実施形態においてミスマッチが許容される場合があるが)にマッピングさせる配列決定されたリードを下流解析に使用した。
図30は、本開示の実施形態による、HPV陽性頭頸部扁平上皮癌(HPV+ve HNSCC)を有する個々の患者における血漿HPV DNAのメチル化プロファイルを示す。HPV DNAのメチル化プロファイルは、これらの患者の血漿DNAの標的化キャプチャーバイサルファイト配列決定により生成された。図30は、HNSCC患者の血漿HPV16 DNA分子においてHPV16(HPV血清型16)メチル化を検出することができることを示す。HPVゲノム全体におけるすべてのCpG部位のメチル化密度を決定した。
血漿中のウイルスゲノム全体における固有の遺伝子座のメチル化密度MDは、方程式:MD=M/(M+U)を用いて計算することができ、式中、Mはメチル化ウイルスリードの数、Uはウイルスゲノム全体における遺伝子座位内のCpG部位での非メチル化ウイルスリードの数である。遺伝子座特異的レベルでは、これらの遺伝子座は、任意のサイズのもの、および少なくとも1つのCpG部位(1bp)のものであり得る。遺伝子座位内に2つ以上のCpG部位がある場合、MおよびUは部位全体の数に対応する。これらの遺伝子座は、注釈付きのウイルス遺伝子と関連付けられ得、かつ関連付けられ得ない。
異なる患者間で血漿HPV DNAのメチル化プロファイルの類似のパターンを観察することができた。通常、非癌対象にはHPVはない。2つのゲノム領域、すなわち領域3001および領域3002を定義した。領域3001における領域特異的なメチル化密度は、HPV+ve HNSCCの5症例すべての領域3002におけるものよりも一貫して高かった。同一病態の対象間のパターンにおけるこれらの類似性およびメチル化プロファイルの異なる病態の対象間のパターンの差は、全体的または遺伝子座特異的レベルで分析することができる。そのような予め定義された領域のメチル化密度は、例えば、癌のステージ、治療に対する反応、および再発リスクなどの臨床症状を予測することができる。
図31は、本開示の実施形態による、HPV+ve HNSCCを有する患者2人におけるHPVゲノム全体におけるすべてのCpG部位のメチル化レベルを示す。3101に示すように、第1の患者を黒で示し、底部上にある。第2の患者は灰色で、3102のように大きく見える場合がある。図に示すように、2人の患者は類似の遺伝子座位で明らかなメチル化レベルを有し、多くの遺伝子座はメチル化レベルの類似した値を有する。症例間の全体的レベルまたは遺伝子座特異的レベルについてメチル化レベルを比較することにより、実施形態は、HNSCCを有する対象を特定することができる。
B.HBV
血漿DNAの標的化バイサルファイト配列決定は、慢性B型肝炎ウイルス感染患者9人とHCC患者10人に対して実施された。また、慢性B型肝炎ウイルス感染およびHCCのこれらの患者からの血漿HBVリードのメチル化プロファイルも分析した。
図32Aおよび32Bは、本開示の実施形態による、B型肝炎ウイルス(HBV)DNAリード(HBVゲノムにマッピングされた血漿DNAリード)の割合、ならびに慢性B型肝炎ウイルス感染(HBV)患者9人および肝細胞癌(HCC)患者10人についてのHBVゲノム全体におけるすべてのCpG部位のメチル化割合を示す。
図32Aでは、ヒトゲノムに対してHBVゲノムに整列させたDNA断片の割合が決定された。この特定の例では、HBVゲノムに一意に整列する無細胞DNA断片の数を、図1に列挙した、ヒト、HBV、HPV、およびEBVのゲノムを含む組み合わせた参照ゲノムに一意に整列する無細胞DNA断片の数で割った。慢性HBV感染症患者(平均=0.03%)よりもHCC患者(平均=0.006%)では、HBV DNAリードの高い平均割合が観察されたが、統計的有意性は達成されなかった(p=0.07、スチューデントt検定)。視覚的にわかるように、HCC対象とHBV対象の平均は同程度である。したがって、数に基づく技術は、比較的低い予測能力を有する。
図32Bでは、HBVメチル化割合は、HBVゲノムのすべてのCpG部位全体における全体的メチル化レベルとして決定された。HCC患者の血漿HBV DNAのメチル化割合は、慢性B型肝炎ウイルス感染患者(平均=23%)よりもHCC患者(平均=1.7%)で有意に高いことが観察された(p=0.03、スチューデントt検定)。このような分離は、HBVを有するがHCCを有さない対象と、HCCを有する対象とを区別する能力の向上を示す。したがって、実施形態は、HCC病態のレベルを分類することができる(例えば、HCCまたは非HCC)。したがって、実施形態は、試料中の血漿HBV DNAのゲノム全体のメチル化レベルに基づいてHCCのリスクを予測することができた。
他の実施形態は、例えば、本明細書に記載されるように、他のタイプのメチル化レベルを実施することができる。例えば、分類は、予め定義された基準を持つ差別化されたメチル化領域内のメチル化レベルに基づくことができる。
VII.無細胞ウイルスDNAのメチル化を使用する方法
上述のように、実施形態は、無細胞ウイルスDNAおよび無細胞ゲノムヒトDNAを含む無細胞DNAの試料中の1つ以上のメチル化レベルを測定することができる。メチル化レベルは、病態に関連する特定のウイルス由来のDNAのメチル化レベル(複数可)を分析することにより、病態のレベルを分類することができる。数ベースおよびサイズベースの技術を使用して、メチル化技術を補完することもできる。
例として、病態のレベルは、病態が存在するかどうか、病態の重症度、病態のステージ、病態の見通し、治療に対する病態の反応、または病態の重症度もしくは進行の別の尺度であり得る。癌の例として、癌のレベルとは、癌が存在するかどうか、癌のステージ(例えば、初期および後期)、腫瘍のサイズ、治療に対する癌の反応、または癌の重症度もしくは進行の別の尺度であり得る。
EBVの場合、病態の例には、伝染性単核球症(IM)、鼻咽頭癌(NPC)、ナチュラルキラー(NK)-T細胞リンパ腫、およびこれらの病態を有さないが試料中にかなりの数の無細胞EBV DNA断片を示し得る対象を含むことができる。HPVの場合、病態の例には、頭頸部扁平上皮癌(HNSCC)と、かなりの量の無細胞HPV DNA断片を有するが、HNSCCを有さない対象を含むことができる。HBVの場合、病態の例には、肝細胞癌(HCC)と、かなりの量の無細胞HBV DNA断片を有するが、HCCを有さない対象を含むことができる。
A.病態を分類するためのメチル化レベルの使用
図33は、本開示の実施形態による、第1の病態の分類を決定するための動物である対象の生体試料を分析する方法3300を示すフローチャートである。試料には、対象のDNA分子、場合によってはウイルスのDNA分子の混合物を含めることができる。方法3300には、臨床、実験室、およびインシリコ(コンピューター)ステップを含めることができる。方法3300は、対象のスクリーニングの一部として、例えば、癌をスクリーニングするために実行することができる。したがって、対象は病態について無症状であり得る。
ブロック3310で、生体試料が対象から取得される。例として、生体試料は、血液、血漿、血清、尿、唾液、汗、涙、および痰、ならびに本明細書で提供される他の例であり得る。生体試料は、対象のゲノムおよび1つ以上の他のゲノムからの無細胞DNA分子の混合物を含むことができる。例えば、1つ以上の他のゲノムは、EBV、HPV、および/またはHBVゲノムなどのウイルスゲノムを含むことができる。いくつかの実施形態(例えば、血液用)では、無細胞DNA分子の混合物、例えば、血漿を得るための血液の遠心分離のために、生体試料を精製することができる。
ブロック3320で、複数の複数の無細胞DNA分子が、生体試料から分析される。無細胞DNA分子の分析には、特定のウイルスゲノム内の無細胞DNA分子の位置を特定し、特定のウイルスゲノムの1つ以上の部位で無細胞DNA分子がメチル化されているかどうかを決定することが含まれ得る。様々な数の無細胞DNA分子(ヒトおよびウイルス)は、特定のウイルスゲノムからとして特定されている様々な数(例えば、10、20、30、50、100、200、500、または1,000以上)例えば、少なくとも1,000で分析することができる。
配列読み取りの部位のメチル化状態は、本明細書に記載されるように得ることができる。例えば、DNA分子は、DNA分子の配列リードを使用して分析することができ、この場合、配列決定はメチル化認識である。他のメチル化認識アッセイも使用することができる。配列リードはそれぞれ、生体試料の無細胞DNA分子のメチル化状態を含むことができる。メチル化状態は、特定のシトシン残基が、5-メチルシトシンまたは5-ヒドロキシメチルシトシンであるかどうかを含み得る。配列リードは、様々な方法、様々な配列決定技術、PCR技術(例えば、リアルタイムまたはデジタル)、アレイ、および断片の配列を特定するためのその他の好適な技術で得ることができる。リアルタイムPCRは、例えば、部位でメチル化されたDNAの数に比例する強度シグナルとして、DNA群を集合的に分析する例である。配列リードは、2つの部位の相互の近接度と配列リードの長さに応じて、2つ以上の部位をカバーすることができる。
分析は、メチル化認識配列決定から配列読み取り値を受信することによって行うことができ、したがって、分析は、DNAから以前に得られたデータにのみ分析を行うことができる。他の実施形態では、分析は、実際の配列決定、またはDNA分子の特性の測定を実行する他の能動的ステップを含み得る。配列決定は、例えば、超並列配列決定または次世代配列決定を使用して、単一分子配列決定を使用して、および/または二本鎖もしくは一本鎖DNA配列決定ライブラリー調製プロトコル、ならびに本明細書に記載の他の技術を使用して、様々な方法で実行することができる。配列決定の一部として、配列リードの一部が細胞核酸に対応し得ることが可能である。
配列決定は、例えば本明細書に記載されるような標的化配列決定であり得る。例えば、ウイルスからの核酸分子に対して生体試料を濃縮することができる。ウイルス由来の核酸分子の生体試料の濃縮には、ウイルスの一部またはウイルスのゲノム全体に結合する捕捉プローブの使用を含むことができる。他の実施形態は、ウイルスの特定の遺伝子座に特異的なプライマーを使用することができる。生体試料は、ヒトゲノムの一部、例えば常染色体の領域由来の核酸分子について濃縮され得る。図1は、そのような捕獲プローブの例を示す。他の実施形態では、配列決定はランダム配列決定を含むことができる。
配列決定装置による配列決定後、配列リードは、例えば、有線または無線通信または取り外し可能な記憶装置を介して配列決定を実行する配列決定装置に通信可能に結合され得るコンピューターシステムによって受信され得る。いくつかの実施形態では、核酸断片の両端を含む1つ以上の配列リードが受信され得る。DNA分子の位置は、DNA分子の1つ以上の配列リードをヒトゲノムのそれぞれの部分、例えば、特異的メチル化領域(DMR)などの特定の領域にマッピング(整列)することにより決定することができる。一実施態様では、リードが目的の領域にマップされない場合、リードを無視することができる。他の実施形態では、特定のプローブ(例えば、PCRまたは他の増幅後)は、特定の蛍光色などを介して位置を示すことができる。特定は、無細胞DNA分子が1つ以上の部位のセットのうちの1つに対応するものであり得、すなわち、1つ以上の部位でメチル化されたDNAの量が必要とされるすべてであるため、特定の部位が不明となり得る。
ブロック3330で、1つ以上の混合物メチル化レベルが、特定のウイルスゲノムの1つ以上の部位のセットでメチル化された複数の無細胞DNA分子のうちの1つ以上の量に基づいて測定される。混合物メチル化レベルは、部位(複数可)のセットまたは部位(複数可)のサブセットの無細胞DNA分子のメチル化密度または割合(例えば、本明細書に記載される)であってもよい。例えば、メチル化レベルは、部位のセットに対応するDNA分子の数およびメチル化された数に基づいて決定されるメチル化密度に対応し得る。数は、1つ以上の部位での所定の配列リードのメチル化状態と組み合わせて、ウイルスゲノムへの配列リードのアライメントに基づいて決定され得る。
部位でメチル化されるDNA分子の各々の数は、部位のセットごとに決定されることができる。一実施形態では、部位はCpG部位であり、本明細書で言及される1つ以上の基準を使用して選択される特定のCpG部位のみであり得る。メチル化されたDNA分子の数は、特定の部位で分析されたDNA分子の総数、例えば、配列リードの総数を使用して正規化が実行されると、メチル化されない数を決定することと同等である。例えば、ある領域のCpGメチル化密度の増加は、同じ領域の非メチル化CpGの密度の減少と同等である。
1つ以上の部位のセットに少なくとも2つの部位が含まれる場合、少なくとも2つ部位で1つの混合物メチル化レベルを決定することができる。例えば、メチル化レベルは、第1のセットのすべての無細胞DNA分子の合計メチル化密度として計算することができる。別の例では、各部位または1つ以上の部位の領域(複数可)について個別のメチル化密度を計算することができ、それにより、例えば、セクションIV.B~IV.Eで説明したように、N個(例えば、2以上の整数)の混合物メチル化レベルを多次元ポイントとして提供することができる。個別のメチル化密度を組み合わせて、混合物メチル化レベル、例えば、個別のメチル化密度の平均値を取得することができる。
他の実施形態では、例えば、本明細書に記載のクラスタリングおよび他の技術を使用して、後の分析のために別個のメチル化レベルを保持することができる。例えば、多次元ポイント(N個の混合物メチル化レベル)をN参照メチル化レベルと比較してN差を得ることができ、これを使用して、対象が少なくとも2つのコホートのうちの1つに属するかどうかを判断することができる。図18~20は、このような階層的クラスタリング分析のための例を示す。領域は、例えば、50塩基~1,000塩基のサイズを有する所定の領域について上で説明したように、事前に決定されてもよく、サイズは領域間で同じかまたは異なる。
2つ以上の混合メチル化レベルが決定される場合、異なるレベルが部位のセットの異なるサブセットに対応し得る。例えば、メチル化レベルは、各々が1つ以上の部位を含み得る、異なる領域に対して決定することができる。領域は、例えば特定の領域が選択されるときに行われ得るように、ウイルスゲノム全体に広がるか、部分のみに対応することができる。このような領域は、例えば本明細書に記載されているように、1つ以上の基準に従って特異的にメチル化されるように選択することができる。このような基準は、特定の範囲内にある同一病態を有し、他の対象のコホートの閾値内の差を潜在的に有する対象のコホートメにおけるチル化レベルに対応することができる。したがって、領域または各部位の基準には、(1)同じコホートの複数の対象間のメチル化レベルの差、および/または(2)あるコホートの対象と別のコホートの対象との間のメチル化レベルの差を含んでもよい。
ブロック3340で、1つ以上の混合物メチル化レベルは、少なくとも2つのコホートの他の対象から決定される1つ以上の参照メチル化レベルと比較される。少なくとも2つのコホートは、特定のウイルスゲノムに関連した異なる分類を有することができ、異なる分類には第1の病態が含まれる。そのような病態の例、例えば、NPC、IM、リンパ腫、およびEBV DNA分子の数に対して一時的陽性または持続的陽性に関連する非NPC状態を、上に示す。コホートおよび参照メチル化レベルの例は、図8、11、13、15、および18~20に示す。
比較には様々な形式があり得る。例えば、混合物メチル化レベルと参照メチル化レベルとの比率や差など、分離値を決定することができる。様々な分離値を定義することができ、比率と差、および両方の関数を含む定義を含めることができる。比較は、分離値とカットオフ値の比較をさらに含み、統計学的有意差を決定することができる。例えば、参照メチル化レベルはコホートの平均値であり、試料の混合物メチル化レベルとコホートの平均値との差はカットオフ値と比較することができ、カットオフ値は、コホートで使用された参照試料について測定されたメチル化レベルの標準偏差に基づいて決定し得る。
複数のメチル化レベルおよび複数の参照レベルを含むいくつかの実施形態では、複数のメチル化レベルは、試料の多次元ポイント(例えば、ベクトルを形成するN個のレベル)に対応すると同時に、複数の参照レベルはN-1次元の表面(例えば、超平面)に対応することができ、表面は、閉じた表面、例えば、データポイントが同一病態に対応している球のような表面であり得る。別の例として、複数のメチル化レベルと参照レベルとの比較は、試料の多次元ポイントから参照対象の代表的な(参照)多次元ポイントまでの距離を決定することにより実装することができる。参照多次元ポイントは、単一の参照対象、たとえば患者AL038に対応し得る。別の例として、代表的な(参照)多次元ポイントは、同一病態の対象からの参照多次元ポイントのクラスターの重心であり得る。
別の例として、混合メチル化レベル(複数可)と参照メチル化レベル(複数可)の比較には、1つ以上の混合物メチル化レベルを、他の対象の少なくとも2つのコホートから決定された1つ以上の参照メチル化レベルを使用してトレーニングした機械学習モデルに入力することを含み得る。例えば、参照レベルは他の対象に対して測定されたメチル化レベルであり、クラスタリングモデルはその参照レベルを使用してトレーニングすることができる。例えば、特定のコホートに対応する対象のクラスターに対して重心を選択することができる。
ブロック3350で、対象が第1の病態を有するかどうかの第1の分類が、この比較に基づいて決定される。第1の分類は、様々な形式、たとえば二項結果または確率値をとることができる。いくつかの実施形態では、第1の分類は、第1の病態のレベル、例えば、腫瘍の大きさ、重症度、または癌のステージを提供することができる。
少なくとも2つのコホートの異なる分類には、1つ以上の参照レベルとの比較により、対象が第2の病態を有するかどうかの第2の分類を決定することができる、第2の病態も含まれ得る。例えば、単一の参照レベルは、IMとリンパ腫、またはNPCと持続的陽性の対象を区別することができる。
1つ以上の混合物メチル化レベルは、複数の参照メチル化レベルと比較することができる。1つのメチル化レベルだが複数の参照メチル化レベルを使用する例として、異なる参照レベルは異なる病態を区別することができる。例えば、第1の参照メチル化レベルは、対象が第1の病態を有するかどうかの第1の分類を決定することができ(例えば、IMありとIMなしの区別)、第2の参照メチル化レベルは、対象が第2の病態を有するかどうかの第2の分類を決定することができる(例えば、図8、図11、および図15に示すように、NPCありとNPCなしの区別)。したがって、実施形態は、異なる参照レベルを使用して、この比較に基づいて対象が第2の病態を有するかどうかの第2の分類を決定することができる。
この方法はさらに、対象が病態を有するという分類に応じて、病態について対象を治療することを含み、それにより病態を改善する(例えば、病態を除去するか、重症度を低減する)。病態が癌の場合、治療には、手術、放射線療法、化学療法、免疫療法、標的療法、ホルモン療法、幹細胞移植、または精密医療が含まれ得る。決定された病態のレベルに基づいて、対象への危害リスクを減らすための治療計画を立てることができる。方法は、治療計画に従って対象を治療することをさらに含み得る。
様々な時点で生体試料を取得し、それらの時点で独立して、または他の時点での測定および分類と合わせて分析することができる。そのような時点の例には、癌の治療の前後(標的療法、免疫療法、化学療法、手術など)、癌の診断後の異なる時点、癌の進行の前後、転移の発生の前後、疾患の重症度の増加の前後、または合併症の発症前後が挙げられる。
B.サイズ/数と組み合わせてのメチル化レベルの使用
セクションVで説明したように、数ベースおよび/またはサイズベースの技術は、メチル化技術と組み合わせて使用することができる。そのような技術は、例えば、それぞれが別々の分類を提供するなど、独立して実装することができる。このような独立した分類の各々は、その結果の最終的な分類を提供するために同じ結果を提供することを要求され得る。他の実施形態では、異なる技術の参照値は、別の技術からのメトリックに依存し得る。例えば、サイズ参照値は、図27について上で説明したように、所与の試料について測定されたメチル化レベルに依存し得る。いくつかの実施形態では、各メトリック(例えば、メチル化レベル)は、ベクトル内の異なる要素になり得、それにより、所与の試料のメトリックから多次元データポイントを作成する。メトリックの各々は、例えば、ほぼ同時に対象から取得し得る、同じ試料または別々の試料から決定することができる。
いくつかの実施形態では、サイズベースの技術は、対象の生体試料を分析するために以下のように実装され得る。試料は、メチル化分析に使用したものと同じ試料でも異なる試料でもよい。生体試料は、対象のゲノムおよび1つ以上の他のゲノム(例えば、ウイルスゲノム)からの無細胞DNA分子の混合物を含むことができる。生体試料中の複数の無細胞DNA分子の各々について、例えば本明細書に記載のように、サイズおよび位置を決定することができる。例えば、DNA分子の両端を配列決定して(例えば、DNA分子全体の1つの配列リードまたは両端の配列リードペアを提供するために)、配列リード(複数可)を参照ゲノムに整列させてサイズを決定することができる。したがって、実施形態は、DNA分子のサイズを測定し、特定のウイルスゲノム内のDNA分子の位置を特定することができる。これらの無細胞DNA分子は、例えば、メチル化認識配列決定が使用される、メチル化分析に使用されたものと同じであり得る。複数のDNA分子のサイズは、サイズ分布を形成することができる。
サイズ分布の統計値(サイズ比など)を決定することができる。統計値は、少なくとも2つのコホートの他の対象から決定された参照サイズ値と比較でき、これは、メチル化分析に使用された同じ2つのコホートであり得る。少なくとも2つのコホートは、特定のウイルスゲノムに関連した異なる分類(第1の病態を含む)を持つことができる。対象が第1の病態を有するかどうかのサイズベースの分類は、この比較に基づいて決定することができる。サイズベースの分類およびメチル化ベースの分類を一緒に使用して、最終的な分類を提供することができる。参照サイズ値の例を図22、23、25、および27に示す。
いくつかの実施形態では、数ベースの技術は、対象の生体試料を分析するために以下のように実装され得る。試料は、メチル化分析に使用した試料と同じでも異なっていてもよい。生体試料は、対象のゲノムおよび1つ以上の他のゲノム(例えば、ウイルスゲノム)からの無細胞DNA分子の混合物を含むことができる。
試料中の特定のウイルスゲノムに由来する無細胞DNA分子の量を決定することができる。いくつかの実施形態では、生体試料中の複数の無細胞DNA分子の各々について、分子が特定のウイルスゲノムに由来するかどうかを、例えば、場合によってはPCRなどの増幅とともに、配列決定またはプローブを使用して決定する。例えば、位置は、例えば、ヒトゲノムからか、または特定のウイルスゲノムからかを決定することができる。その位置は、無細胞DNAの混合物の配列決定から得た複数の配列リードを使用して決定することができる。特定のウイルスゲノムに整列させる複数の配列リードの量を決定することができる。例えば、配列リードの総数に対するウイルスゲノムに整列させた配列リードの割合を決定することができる。配列リードの総数は、ウイルスに対応する参照ゲノムに整列させた配列リードと、ヒトゲノムに整列させた配列リードの合計であり得る。本明細書に記載される他の比率、例えば、特定のウイルスゲノムからのリード量をヒトのリード量で割ったものも使用することができる。
参照ゲノムに整列させる配列リードの量は、メチル化および/またはサイズ分析に使用される同じ2つのコホートであり得る、少なくとも2つのコホートの他の対象から決定された参照値と比較することができる。少なくとも2つのコホートは、特定のウイルスゲノムに関連した異なる分類(第1の病態を含む)を有することができる。対象が第1の病態を有するかどうかの数ベースの分類は、この比較に基づいて決定されることができる。数ベースの分類およびメチル化ベースの分類を一緒に使用して、最終的な分類を提供することができる。参照カウント値の例は、図24~27および32Aに示す。
VIII.例示的なシステム
図34は、本発明の一実施形態によるシステム3400を示す。示されたシステムは、試料ホルダー3410内の無細胞DNA分子などの試料3405を含み、試料3405は、アッセイ3408と接触して、物理的特徴3415の信号を提供することができる。試料ホルダーの例は、アッセイのプローブおよび/もしくはプライマー、または液滴が(アッセイを含む液滴とともに)移動するチューブを含む、フローセルであり得る。試料からの蛍光強度値などの物理的特徴3415は、検出器3420によって検出される。検出器3420は、データ信号を構成するデータポイントを得るために、間隔(例えば、周期的な間隔)を空けて測定を行うことができる。一実施形態において、アナログデジタル変換器は、検出器からのアナログ信号をデジタル形態へと複数回変換する。試料ホルダー3410および検出器3420は、アッセイデバイス、例えば、本明細書に記載の実施形態に従って配列決定を実施する配列決定装置を形成することができる。データ信号3425は、検出器3420から論理システム3430へ送信される。データ信号3425は、ローカルメモリ3435、外部メモリ3440、または記憶デバイス3445に保存され得る。
論理システム3430は、コンピューターシステム、ASIC、マイクロプロセッサなどであってもよいか、またはそれらを含んでもよい。それはまた、ディスプレイ(例えば、モニタ、LEDディスプレイなど)、およびユーザ入力デバイス(例えば、マウス、キーボード、ボタンなど)を含み得るか、またはこれらに連結され得る。論理システム3430および他の構成要素は、スタンドアロンもしくはネットワーク接続されたコンピューターシステムの一部であってもよく、またはサーマルサイクラデバイスに直接取り付けられてもよいか、もしくは組み込まれてもよい。論理システム3430はまた、プロセッサ3450において実行する最適化ソフトウェアを含み得る。論理システム3430は、本明細書に説明される方法のうちのいずれかを実行するようにシステム3400を制御するための命令を記憶する、コンピューター可読媒体を含み得る。
本明細書で言及されるコンピューターシステムのうちのいずれも、任意の好適な数のサブシステムを利用してもよい。このようなサブシステムの例をコンピューターシステム10の図35に示す。いくつかの実施形態において、コンピューターシステムは、単一のコンピューター装置を含み、サブシステムは、コンピューター装置の構成要素であり得る。他の実施形態において、コンピューターシステムは、各々がサブシステムであり、内部構成要素を備える、複数のコンピューター装置を含むことができる。コンピューターシステムは、デスクトップコンピューターおよびラップトップコンピューター、タブレット、携帯電話、ならびに他の携帯デバイスを含み得る。
図35に示されるサブシステムは、システムバス75を介して相互接続される。プリンタ74、キーボード78、記憶デバイス(複数可)79、ディスプレイアダプタ82へ連結されているモニタ76、および他のものなどの追加のサブシステムが示されている。I/Oコントローラ71に結合する周辺機器および入力/出力(I/O)デバイスは、入力/出力(I/O)ポート77(例えば、USB、FireWire(登録商標))等の当技術分野において既知である任意の数の手段によって、コンピューターシステムに接続され得る。例えば、I/Oポート77または外部インターフェース81(例えば、Ethernet、Wi-Fiなど)を使用して、Internetなどの広域ネットワーク、マウス入力デバイス、またはスキャナに、コンピューターシステム10を接続することができる。システムバス75を介した相互接続は、中央プロセッサ73が、各サブシステムと通信し、システムメモリ72または記憶デバイス(複数可)79(例えば、ハードドライブまたは光ディスクなどの固定ディスク)からの複数の命令の実行、およびサブシステム間の情報交換を制御することを可能にする。システムメモリ72および/または記憶デバイス(複数可)79は、コンピューター可読媒体を具体化してもよい。別のサブシステムは、カメラ、マイクロホン、および加速度計等のデータ収集デバイス85である。本明細書に言及されるデータのうちのいずれも、1つの構成要素から別の構成要素に出力されてもよく、ユーザに対して出力されてもよい。
コンピューターシステムは、例えば、外部インターフェース81によって、内部インターフェースによって、または1つの構成要素から別の構成要素に接続され得る、もしくは取り外され得る記憶装置を介して、ともに接続された、複数の同じ構成要素またはサブシステムを含むことができる。いくつかの実施形態において、コンピューターシステム、サブシステム、またはデバイスは、ネットワーク上で通信することができる。かかる例において、1つのコンピューターをクライアント、別のコンピューターをサーバと見なすことができ、各々が、同じコンピューターシステムの一部であり得る。クライアントおよびサーバは各々、複数のシステム、サブシステム、または構成要素を含み得る。
実施形態の態様は、制御ロジックの形態で、ハードウェア回路(例えば、特定用途向け集積回路もしくはフィールドプログラマブルゲートアレイ)を使用して、および/またはモジュール式もしくは集積様態で汎用プログラマブルプロセッサを有するコンピューターソフトウェアを使用して、実装することができる。本明細書で使用される場合、プロセッサは、シングルコアプロセッサ、同じ集積チップ上のマルチコアプロセッサ、または単一の回路基板もしくはネットワーク化された上の複数の処理ユニット、ならびに専用のハードウェアを含むことができる。本開示および本明細書に提供される教示に基づいて、当業者は、ハードウェア、およびハードウェアとソフトウェアとの組み合わせを使用して、本発明の実施形態を実装するための他の方法および/または方法を認識および理解するであろう。
本出願で説明されるソフトウェア構成要素または関数のうちのいずれも、例えば、Java、C、C++、C#、Objective-C、Swiftなどの任意の好適なコンピューター言語、または、例えば、従来の技術もしくはオブジェクト指向の技術を使用するPerlもしくはPythonなどのスクリプト言語を使用する、処理デバイスによって実行されるソフトウェアコードとして実装されてもよい。ソフトウェアコードは、保存および/または伝送のためのコンピューター可読媒体上に一連の命令またはコマンドとして記憶され得る。好適な非一過性コンピューター可読媒体は、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、磁気媒体(ハードドライブもしくはフロッピーディスクなど)、または光学媒体(コンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)など)、およびフラッシュメモリなどを含むことができる。コンピューター可読媒体は、かかる記憶または送信デバイスの任意の組み合わせであってもよい。
かかるプログラムはまた、コード化され、インターネットを含む様々なプロトコルに従う有線ネットワーク、光ネットワーク、および/または無線ネットワークを介した送信に適合した搬送波信号を使用して送信されてもよい。したがって、コンピューター可読媒体は、かかるプログラムでコード化されたデータ信号を使用して作成されてもよい。プログラムコードでコード化されたコンピューター可読媒体は、互換性のあるデバイスでパッケージ化されていてもよく、または(例えば、インターネットダウンロードを介して)他のデバイスとは別個に提供されてもよい。任意のかかるコンピューター可読媒体は、単一のコンピューター製品(例えば、ハードドライブ、CD、もしくはコンピューターシステム全体)上もしくはその内部に存在してもよく、システムまたはネットワーク内の異なるコンピューター製品上もしくはその内部に存在してもよい。コンピューターシステムは、モニタ、プリンタ、または本明細書に記載の結果のうちのいずれかをユーザへ提供するための他の好適なディスプレイを含み得る。
本明細書記載の方法のうちのいずれも、ステップを実行するように構成することができる1つ以上のプロセッサを含むコンピューターシステムを用いて全体的または部分的に実施することができる。したがって、実施形態は、本明細書に説明される方法のうちのいずれかのステップを実行するように構成されたコンピューターシステムを対象とし得、潜在的には異なる構成要素がそれぞれのステップまたはそれぞれのステップのグループを実行する。番号付けされたステップとして提示されるが、本明細書の方法のステップは、同時にもしくは異なる時間に、または異なる順序で実行することができる。加えて、これらのステップの部分は、他の方法からの他のステップの部分と併用することができる。また、あるステップのすべてまたは部分は、任意選択的であってもよい。加えて、本方法のうちのいずれかのステップのうちのいずれかを、これらのステップを実行するためのシステムのモジュール、ユニット、回路、または他の手段を用いて実行することができる。
特定の実施形態の具体的な詳細は、本発明の実施形態の趣旨および範囲から逸脱することなく、任意の好適な様態で組み合わせることができる。しかしながら、本発明の他の実施形態は、各個々の態様、またはこれらの個々の態様の具体的な組み合わせに関する具体的な実施形態を対象とし得る。
本発明の例示的実施形態の上の説明は、例解および説明目的で提示されている。包括的であること、または本発明を説明された正確な形態に限定することは意図されず、多くの修正および変更が、先の教示に鑑みて可能である。
本明細書において言及されるすべての特許、特許出願、刊行物、および明細書は、すべての目的に対して参照によりそれらの全体が組み込まれる。いかなるものも、先行技術であるとは認められていない。
付録A

Claims (31)

  1. 動物である対象の生体試料を分析する方法であって、前記生体試料が、前記対象のゲノムおよび1つ以上の他のゲノムからの無細胞DNA分子の混合物を含み、前記方法は、
    前記生体試料からの複数の無細胞DNA分子を分析することであって、前記複数の無細胞DNA分子のうちの1つを分析することが、
    特定のウイルスゲノムにおける前記無細胞DNA分子の位置を特定することと、
    前記無細胞DNA分子が、前記特定のウイルスゲノムの1つ以上の部位においてメチル化されているかどうかを決定することと、を含む、分析することと、
    前記特定のウイルスゲノムの1つ以上の部位のセットにおいてメチル化された前記複数の無細胞DNA分子のうちの1つ以上の量に基づいて1つ以上の混合物メチル化レベルを測定することと、
    前記1つ以上の混合物メチル化レベルを、他の対象の少なくとも2つのコホートから決定された1つ以上の参照メチル化レベルと比較することであって、前記少なくとも2つのコホートが、前記特定のウイルスゲノムに関連した異なる分類を有し、前記異なる分類が第1の病態を含む、比較することと、
    前記比較に基づいて、前記対象が前記第1の病態を有するかどうかの第1の分類を決定することと、を含む、方法。
  2. 前記少なくとも2つのコホートの前記異なる分類が第2の病態をさらに含み、前記方法が、
    前記比較に基づいて、前記対象が前記第2の病態を有するかどうかの第2の分類を決定することをさらに含む、請求項1に記載の方法。
  3. 前記1つ以上の混合物メチル化レベルが、第1の参照メチル化レベルおよび第2の参照メチル化レベルを含む複数の参照メチル化レベルと比較され、前記第1の参照メチル化レベルは、前記対象が前記第1の病態を有するかどうかの前記第1の分類を決定するために使用され、前記第2の参照メチル化レベルは、前記対象が前記第2の病態を有するかどうかの前記第2の分類を決定するために使用される、請求項2に記載の方法。
  4. 前記特定のウイルスゲノムがエプスタイン・バーウイルスのものであり、前記対象がヒトであり、前記第1の病態が鼻咽頭癌であり、前記第2の病態が伝染性単核球症である、請求項3に記載の方法。
  5. 前記第1の分類は、前記対象が前記第1の病態を有していないことである、請求項1に記載の方法。
  6. 前記第1の分類を決定することは、前記第1の病態のレベルを決定することを含む、請求項1に記載の方法。
  7. 前記特定のウイルスゲノムが、エプスタイン・バーウイルスのものであり、前記対象がヒトであり、前記第1の病態が鼻咽頭癌である、請求項1に記載の方法。
  8. 前記1つ以上の部位のセットが、少なくとも2つの部位を含み、前記1つ以上の混合物メチル化レベルが、前記少なくとも2つの部位にわたって決定される1つの混合物メチル化レベルである、請求項1に記載の方法。
  9. 前記1つ以上の混合物メチル化レベルが、N個の混合物メチル化レベルを含み、Nは1より大きい整数であり、前記1つ以上の部位のセットが、少なくとも2つの部位を含み、前記比較が、
    前記N個の混合物メチル化レベルとN個の参照メチル化レベルとの差を測定することと、
    前記差を使用して、前記対象が、前記少なくとも2つのコホートのうちの1つに属するかどうかを決定することと、を含む、請求項1に記載の方法。
  10. 前記差を使用して、前記対象が、前記少なくとも2つのコホートのうちの1つに属するかどうかを決定することが、階層的クラスタリング分析を実行することを含む、請求項9に記載の方法。
  11. 前記N個の混合物メチル化レベルの各々が、複数の所定の領域のうちの1つについて測定される、請求項9に記載の方法。
  12. 前記複数の所定の領域が同じサイズのものであり、前記特定のウイルスゲノムにまたがり、前記同じサイズが50塩基~1,000塩基である、請求項11に記載の方法。
  13. 前記複数の所定の領域の各々が、(1)同じコホートの複数の対象間のメチル化レベルの差、および/または(2)あるコホートの対象と別のコホートの対象との間のメチル化レベルの差を含む1つ以上の基準を満たす、請求項11に記載の方法。
  14. 前記1つ以上の部位のセットが、(1)同じコホートの複数の対象間のメチル化レベルの差、および/または(2)あるコホートの対象と別のコホートの対象との間のメチル化レベルの差を含む1つ以上の基準をそれぞれ満たす複数の領域に存在する、請求項1に記載の方法。
  15. 前記1つ以上の部位のセットが、(1)同じコホートの複数の対象間のメチル化レベルの差、および/または(2)あるコホートの対象と別のコホートの対象との間のメチル化レベルの差を含む1つ以上の基準を満たす、請求項1に記載の方法。
  16. 前記1つ以上の混合物メチル化レベルを、他の対象の少なくとも2つのコホートから決定された前記1つ以上の参照メチル化レベルと比較することが、
    他の対象の前記少なくとも2つのコホートから決定された前記1つ以上の参照メチル化レベルを使用してトレーニングされた機械学習モデルに、前記1つ以上の混合物メチル化レベルを入力することを含む、請求項1に記載の方法。
  17. 前記1つ以上の部位のセットの各部位について、
    前記部位においてメチル化されるそれぞれのDNA分子の数を決定し、それにより前記特定のウイルスゲノムの前記1つ以上の部位のセットにおいてメチル化された前記複数の無細胞DNA分子のうちの前記1つ以上の量を決定することをさらに含む、請求項1に記載の方法。
  18. 前記複数の無細胞DNA分子のメチル化認識配列決定を実行して、配列リードを取得することと、
    前記配列リードを前記特定のウイルスゲノムに整列させ、前記1つ以上の部位のセットの各部位においてメチル化される前記それぞれのDNA分子の数を決定することと、をさらに含む、請求項17に記載の方法。
  19. 前記複数の無細胞DNA分子の位置、および前記複数の無細胞DNA分子が前記1つ以上の部位のセットにおいてメチル化されているかどうかを決定する一環として、前記複数の無細胞DNA分子のメチル化認識アッセイを実行することをさらに含む、請求項1に記載の方法。
  20. 前記無細胞DNA分子の前記位置を特定することが、前記位置が前記1つ以上の部位のセットのうちの1つに対応することを決定することを含む、請求項1に記載の方法。
  21. 前記複数の無細胞DNA分子のグループを集合的に分析して、前記特定のウイルスゲノムの前記1つ以上の部位のセットにおいてメチル化された前記複数の無細胞DNA分子のうちの前記1つ以上の量を決定する、請求項1に記載の方法。
  22. 前記複数の無細胞DNA分子が、前記特定のウイルスゲノムに位置する少なくとも10個の無細胞DNA分子を含む、請求項1に記載の方法。
  23. 前記特定のウイルスゲノムが、エプスタイン・バーウイルス、ヒトパピローマウイルス、またはB型肝炎ウイルスに対応する、請求項1に記載の方法。
  24. 試料中の無細胞DNA分子のセットの各々について、
    前記無細胞DNA分子のサイズを測定して、
    前記特定のウイルスゲノムにおける前記無細胞DNA分子の位置を特定することであって、前記無細胞DNA分子のセットの前記サイズがサイズ分布を形成し、前記試料が前記生体試料であるか、または前記対象のゲノムおよび前記1つ以上の他のゲノムから無細胞DNA分子の混合物を含む異なる試料である、特定することと、
    前記サイズ分布の統計値を決定することと、
    前記統計値を、他の対象の前記少なくとも2つのコホートから決定された参照サイズ値と比較することと、
    前記統計値と前記参照サイズ値との前記比較に基づいて、前記対象が前記第1の病態を有するかどうかの第2の分類を決定することと、
    前記第1の分類および前記第2の分類を使用して最終分類を決定することと、をさらに含む、請求項1に記載の方法。
  25. 試料中の前記特定のウイルスゲノムに由来する無細胞DNA分子の量を決定することであって、前記試料が前記生体試料であるか、または前記対象の前記ゲノムおよび前記1つ以上の他のゲノムからの無細胞DNA分子の混合物を含む異なる試料である、決定することと、
    前記量を、他の対象の前記少なくとも2つのコホートから決定された参照値と比較することと、
    前記量と前記参照値との前記比較に基づいて、前記対象が前記第1の病態を有するかどうかの第2の分類を決定することと、
    前記第1の分類および前記第2の分類を使用して最終分類を決定することと、をさらに含む、請求項1に記載の方法。
  26. 前記対象が前記第1の病態を有する前記第1の分類に応じて、前記対象が前記第1の病態を改善する治療を提供することをさらに含む、請求項1に記載の方法。
  27. 上述の方法のうちのいずれかの動作を実行するようにコンピューターシステムを制御するための複数の命令を記憶するコンピューター可読媒体を備える、コンピューター製品。
  28. システムであって、
    請求項27に記載のコンピューター製品と、
    前記コンピューター可読媒体上に記憶された命令を実行するための1つ以上のプロセッサと、を備える、システム。
  29. 前記上述の方法のうちのいずれかを実行するための手段を備えるシステム。
  30. 前記上述の方法のうちのいずれかを実行するように構成されたシステム。
  31. 前記上述の方法のうちのいずれかのステップをそれぞれ実行するモジュールを備えるシステム。
JP2023126899A 2017-07-26 2023-08-03 無細胞ウイルス核酸を用いる癌スクリーニングの強化 Pending JP2023145696A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762537328P 2017-07-26 2017-07-26
US62/537,328 2017-07-26
JP2020503956A JP2020527958A (ja) 2017-07-26 2018-07-25 無細胞ウイルス核酸を用いる癌スクリーニングの強化
PCT/CN2018/097072 WO2019020057A1 (en) 2017-07-26 2018-07-25 ENHANCING CANCER SCREENING WITH ACELLULAR VIRAL NUCLEIC ACIDS

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020503956A Division JP2020527958A (ja) 2017-07-26 2018-07-25 無細胞ウイルス核酸を用いる癌スクリーニングの強化

Publications (1)

Publication Number Publication Date
JP2023145696A true JP2023145696A (ja) 2023-10-11

Family

ID=65039389

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020503956A Pending JP2020527958A (ja) 2017-07-26 2018-07-25 無細胞ウイルス核酸を用いる癌スクリーニングの強化
JP2023126899A Pending JP2023145696A (ja) 2017-07-26 2023-08-03 無細胞ウイルス核酸を用いる癌スクリーニングの強化

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020503956A Pending JP2020527958A (ja) 2017-07-26 2018-07-25 無細胞ウイルス核酸を用いる癌スクリーニングの強化

Country Status (14)

Country Link
US (2) US10731224B2 (ja)
EP (2) EP4234723A3 (ja)
JP (2) JP2020527958A (ja)
KR (1) KR20200035427A (ja)
CN (1) CN111051536A (ja)
AU (2) AU2018305609B2 (ja)
CA (1) CA3070898A1 (ja)
DK (1) DK3658684T3 (ja)
ES (1) ES2959360T3 (ja)
IL (1) IL272030A (ja)
PH (1) PH12020500156A1 (ja)
SG (1) SG11202000609SA (ja)
TW (1) TW201920683A (ja)
WO (1) WO2019020057A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY195527A (en) 2016-10-24 2023-01-30 Grail Inc Methods And Systems For Tumor Detection
EP3574108A4 (en) 2017-01-25 2020-12-23 The Chinese University Of Hong Kong DIAGNOSTIC APPLICATIONS WITH THE USE OF NUCLEIC ACID FRAGMENTS
KR20200035427A (ko) * 2017-07-26 2020-04-03 더 차이니즈 유니버시티 오브 홍콩 세포-무함유 바이러스 핵산을 사용하는 암 스크리닝의 증강
WO2020206041A1 (en) * 2019-04-02 2020-10-08 Grail, Inc. Stratification of risk of virus associated cancers
WO2021257854A1 (en) * 2020-06-20 2021-12-23 Grail, Inc. Detection and classification of human papillomavirus associated cancers
WO2022109574A1 (en) * 2020-11-18 2022-05-27 Ultima Genomics, Inc. Methods and systems for detecting residual disease
CN114457192B (zh) * 2021-07-07 2023-02-07 中山大学 对唾液中EB病毒CpG位点进行甲基化分型的试剂在制备鼻咽癌诊断试剂盒中的应用

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835110B2 (en) 2008-11-04 2014-09-16 The Johns Hopkins University DNA integrity assay (DIA) for cancer diagnostics, using confocal fluorescence spectroscopy
JP5770737B2 (ja) 2009-11-06 2015-08-26 ザ チャイニーズ ユニバーシティ オブ ホンコン サイズに基づくゲノム分析
EP2426217A1 (en) * 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
CA2817370C (en) 2010-11-30 2022-02-01 The Chinese University Of Hong Kong Detection of genetic or molecular aberrations associated with cancer
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
EP4036247B1 (en) * 2012-09-04 2024-04-10 Guardant Health, Inc. Methods to detect rare mutations and copy number variation
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
NZ717423A (en) * 2012-09-20 2017-08-25 Univ Hong Kong Chinese Non-invasive determination of methylome of fetus or tumor from plasma
US9840742B2 (en) * 2014-06-16 2017-12-12 JBS Science Inc. Detection of hepatitis B virus (HBV) DNA and methylated HBV DNA in urine of patients with HBV-associated hepatocellular carcinoma
TWI758011B (zh) * 2014-07-18 2022-03-11 香港中文大學 Dna混合物中之組織甲基化模式分析
EP3567120B1 (en) 2014-12-12 2020-08-19 Verinata Health, Inc. Using cell-free dna fragment size to determine copy number variations
US10319463B2 (en) 2015-01-23 2019-06-11 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations
WO2016127944A1 (en) 2015-02-10 2016-08-18 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
TWI732771B (zh) 2015-07-20 2021-07-11 香港中文大學 Dna混合物中組織之單倍型甲基化模式分析
WO2017012592A1 (en) * 2015-07-23 2017-01-26 The Chinese University Of Hong Kong Analysis of fragmentation patterns of cell-free dna
US10428391B2 (en) * 2015-07-27 2019-10-01 The Johns Hopkins University Method to use viral and host methylation markers for cervical cancer screening and triage in liquid prep, serum/plasma, and urine: PCR and sequencing based process methods
CA3168463A1 (en) * 2015-12-17 2017-06-22 Illumina, Inc. Distinguishing methylation levels in complex biological samples
SG11201805115PA (en) * 2015-12-18 2018-07-30 Lucence Diagnostics Pte Ltd Detection and quantification of target nucleic acid sequence of a microorganism
CN109196120B (zh) 2016-05-30 2022-08-02 香港中文大学 使用血液中的无细胞dna检测血液病症
MY195527A (en) * 2016-10-24 2023-01-30 Grail Inc Methods And Systems For Tumor Detection
EP3574108A4 (en) 2017-01-25 2020-12-23 The Chinese University Of Hong Kong DIAGNOSTIC APPLICATIONS WITH THE USE OF NUCLEIC ACID FRAGMENTS
KR20200035427A (ko) * 2017-07-26 2020-04-03 더 차이니즈 유니버시티 오브 홍콩 세포-무함유 바이러스 핵산을 사용하는 암 스크리닝의 증강

Also Published As

Publication number Publication date
IL272030A (en) 2020-03-31
EP4234723A3 (en) 2023-09-20
PH12020500156A1 (en) 2020-09-14
ES2959360T3 (es) 2024-02-23
AU2018305609B2 (en) 2023-01-19
CN111051536A (zh) 2020-04-21
EP3658684B1 (en) 2023-08-30
SG11202000609SA (en) 2020-02-27
US20190032145A1 (en) 2019-01-31
EP3658684A1 (en) 2020-06-03
TW201920683A (zh) 2019-06-01
EP4234723A2 (en) 2023-08-30
US10731224B2 (en) 2020-08-04
AU2018305609A1 (en) 2020-02-06
CA3070898A1 (en) 2019-01-31
EP3658684A4 (en) 2021-04-14
US20200325546A1 (en) 2020-10-15
JP2020527958A (ja) 2020-09-17
KR20200035427A (ko) 2020-04-03
AU2023202318A1 (en) 2023-05-11
DK3658684T3 (da) 2023-10-09
WO2019020057A1 (en) 2019-01-31

Similar Documents

Publication Publication Date Title
TWI797095B (zh) 腫瘤檢測之方法及系統
AU2018305609B2 (en) Enhancement of cancer screening using cell-free viral nucleic acids
JP6829211B2 (ja) 癌スクリーニング及び胎児分析のための変異検出
AU2018212272B2 (en) Diagnostic applications using nucleic acid fragments
TWI828637B (zh) 利用核酸長度範圍於非侵入性產前檢測及癌症偵測
TW202102688A (zh) 與病毒相關的癌症的風險分級
WO2023056884A1 (en) Sequencing of viral dna for predicting disease relapse

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230808

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230808