TW202012639A - 使用病原體核酸負荷確定個體是否患有癌症病況的系統及方法 - Google Patents

使用病原體核酸負荷確定個體是否患有癌症病況的系統及方法 Download PDF

Info

Publication number
TW202012639A
TW202012639A TW108114393A TW108114393A TW202012639A TW 202012639 A TW202012639 A TW 202012639A TW 108114393 A TW108114393 A TW 108114393A TW 108114393 A TW108114393 A TW 108114393A TW 202012639 A TW202012639 A TW 202012639A
Authority
TW
Taiwan
Prior art keywords
individual
pathogen
cancer
virus
sequence reads
Prior art date
Application number
TW108114393A
Other languages
English (en)
Inventor
M 西拉斯 馬厄
安童 伐洛夫
西野梅地 薛賈伊
奧立維 克勞蒂 維恩
Original Assignee
美商格瑞爾公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商格瑞爾公司 filed Critical 美商格瑞爾公司
Publication of TW202012639A publication Critical patent/TW202012639A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/706Specific hybridization probes for hepatitis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/708Specific hybridization probes for papilloma
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Virology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

提供用於在一個體中篩查一癌症病況之方法。自所述個體獲得一生物樣品。所述樣品包括來自所述個體之無細胞核酸以及來自一組病原體中之一種病原體的潛在地無細胞核酸。對所述生物樣品中之所述無細胞核酸進行測序以產生來自所述個體之多個序列讀段。對於該組病原體中之每一各別病原體,測定映射至所述各別病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應量,由此獲得一組序列讀段量,所述組序列讀段量中之每一各別序列讀段量對應於所述組病原體中一相應病原體。使用所述組序列讀段量確定所述個體是否患有所述癌症病況。

Description

使用病原體核酸負荷確定個體是否患有癌症病況的系統及方 法
相關申請案的交叉引用
本申請案係關於2018年4月24日提交的題為「使用病原體核酸負荷確定個體是否患有癌症病況的系統及方法(Systems and Methods for Using Pathogen Nucleic Acid Load to Determine Whether a Subject Has a Cancer Condition)」的美國臨時專利申請案第62/662,198號,該案以引用的方式併入本文中。
本說明書描述使用自個體獲得的無細胞核酸對個體之疾病狀態或病況進行分類。
據估計,全世界有約五分之一的癌症與感染物有關。參見de Flora,2011,《癌發生(Carcinogenesis)》32:787-795。致癌病毒包括B型及C型肝炎病毒(HBV及HCV)、人乳頭狀瘤病毒(HPV)、埃-巴二氏病毒(Epstein-Barr virus,EBV)、人T細胞淋巴瘤病毒1(HTLV-1)、梅克爾細胞多瘤病毒(Merkel cell polyomavirus,MCPyV),及卡波西氏肉瘤病毒(Kaposi's sarcoma virus), 又稱為人疱疹病毒8(KSVH或HHV8)]。致癌細菌包含幽門螺旋桿菌(Helicobacter pylori)。致癌寄生蟲包含埃及血吸蟲(Schistosoma haematobium)、泰國肝吸蟲(Opithorchis viverrini)及華支睾吸蟲(Clonorchis sinensis)。參見Vandeven,2014年,《癌症免疫學研究(Cancer Immunol.Res.)》2(1):9-14,以及自Vandeven轉載的圖3A及3B。
病毒可藉由表現病毒致癌基因、藉由基因組整合以改變細胞原癌基因或腫瘤抑制因子的活性以及藉由誘導促進腫瘤形成之炎症來引起細胞轉型。參見Tang,"等人,2013,《自然-通信(Nature Communications)》4:2513。舉例而言,如轉載自Tang之圖4中所示,Tang揭示在來自19種癌症類型之178個病毒陽性腫瘤(水平軸)中,在至少一個腫瘤中以42p.p.m.總文庫讀段偵測的28種病毒之RNA-seq源性表現水準(豎軸)。在Tang中,如轉載自Tang的圖9中所概述,將非人類讀段與含3,590個RefSeq病毒基因組之資料庫相匹配,所述資料庫補充有藉由從頭組裝病毒讀段偵測的12個額外已知基因組及2個部分新穎基因組。Tang鑑別出178個FVR(病毒表現)為42p.p.m.之腫瘤,但發現大部分陽性病例具有明顯更高的水準(平均168且最高854p.p.m.)。
病毒負荷在幾乎完全由高風險人乳突狀瘤病毒(HPV)引起的子宮頸癌(CESC)中以及肝細胞癌(LIHC)中尤為明顯,對於肝細胞癌,B型肝炎病毒(HBV)或C型肝炎病毒(HCV)感染在一些國家中係主要致病原因。參見Williams,2006,《肝病學(Hepatology)》44,521-526。另外,具有強病毒組分的癌症包含在大部分伯基特氏淋巴瘤(Burkitt's lymphomas)中的埃-巴二氏病毒(EBV)/人疱疹病毒(HHV)4。經由針對HPV及HBV之疫苗接種方案已在預防病毒相關癌症方面取得進展,僅次於戒菸每年在全世界預防癌症病例的數量。參見Strong等人,2008,《歐洲癌症預防雜誌(Eur.J.Cancer Prev.)》17,153-161。
感染病毒之細胞典型地以先天性免疫反應響應,所述免疫反應通常包含釋放與氧化應力有關的細胞介素,及刺激促生長轉導因子。已知細胞介素可觸發AID/APOBEC表現。眾所周知,由此得到的AID/APOBEC蛋白質可在感染之細胞內引起超突變。因此,AID/APOBEC表現用作病毒感染與惡性轉化之間的潛在關聯。參見Siriwardena等人,2016,《化學綜述(Chem Rev)》,116(20):12688-12710。有若干報導將APOBEC蛋白質與病毒驅動之腫瘤發展相關聯,特別是HPV及HBV:APOBEC之表現及突變標誌(mutational signature)在HPV陽性子宮頸癌及頭頸癌(參見Alexandrov等人,2013,《自然》,500(7463),415-421)及HBV驅動之肝細胞癌(參見Deng等人,2014,《癌症快報(Cancer Lett.)》343(2):161-71)中以較高頻率發生。
迄今為止,已藉由前基因組時代之低通量方法測定病毒-腫瘤關聯。然而,大規模平行測序,包含下一代測序現在腫瘤組織中病毒之高效無偏偵測中顯示出前景。此類測序工作發現了引起大多數梅克爾細胞癌瘤的一種新型多瘤病毒。參見Feng等人,2008,《科學(Science)》319,1096-1100。作為另一個實例,Isakov等人,2011,《生物信息學(Bioinformatics)》27,2027-2030及Kostic等人,2012,《基因組研究(Genome Res.)》22,292-298)中揭示使用高通量RNA或DNA測序來偵測病毒的技術。作為另一實例,已使用大規模平行測序調查肝細胞癌中HBV基因組整合之位點。參見Sung等人,2012,《自然-遺傳學(Nat.Genet.)》44,765-769,及Jiang等人,2012,《基因組研究》,22,593-601。類似地,已藉由偵測宿主-病毒融合物,在來自癌症基因組圖譜(The Cancer Genome Atlas,TCGA)之轉錄組測序(RNA-seq)資料中定位多種子宮頸癌及頭頸癌中的病毒整合位點。參見Chen等人,2013,《生物信息學(Bioinformatics)》29,266-267。此等研究提供重要見解且清楚地展示使用大規模平行測序偵測病毒與癌症病況之間之關聯的可能性。然而,該等工作才剛剛開始,且需要更好的分 析及診斷演算法以更好地利用有關病毒及其與癌症之關聯的潛在豐富資訊。
鑒於以上背景,本領域中需要使用關於個體體內病毒負荷之資訊鑑別個體之癌症病況的穩健技術。
本揭示案藉由提供本領域中需要的使用關於個體體內病毒負荷之資訊鑑別個體之癌症病況的穩健技術,解決了背景中所鑑別的缺點。
I.單獨病原體負荷之偵測(例如使用靶向小組測序、全基因組測序或全基因組亞硫酸氫鹽測序)。 本揭示案之一個態樣提供一種基於源自一種或多種病原體之遺傳物質,在測試個體中篩查癌症病況的方法。如本文所揭示,病原體可為病毒、細菌、寄生蟲或在測試個體生物體外部之任何生物體。如本文所揭示,通常使用病毒或病毒負荷來說明各概念。然而,此類說明不應以任何方式限制範圍。所述方法包括自所述測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。在所述方法中,對所述第一生物樣品中之無細胞核酸進行測序(例如藉由全基因組測序、甲基化或非甲基化相關靶向小組測序、或全基因組亞硫酸氫鹽測序等)以產生來自所述測試個體之多個序列讀段。另外,在所述方法中,對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之病原體目標參考中一序列的所述多個序列讀段之相應量,由此獲得一組序列讀段量。所述組序列讀段量中之每一各別序列讀段量係對應於所述組病原體中之相應病原體。在所述方法中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括評價所述多個序列讀段以 獲得關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示。在此類實施例中,使用所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括經由k聚體分析評價所述多個序列讀段以獲得關於APOBEC誘導之突變標誌存在抑或不存在的指示。在此類實施例中,使用所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括分析來自所述測試個體之第一或第二生物樣品中與所述組病原體中之第一病原體有關之APOBEC蛋白質之表現。在此類實施例中,使用所述APOBEC蛋白質之表現及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法依賴於靶向基因小組,其包含對應於來自各種病原體之目標序列的遺傳標記物。舉例而言,在一些此類實施例中,所述各別病原體之病原體目標參考由來自所述各別病原體之參考基因組的靶向小組序列組成且對於各別病原體,所述測定步驟限制所述多個序列讀段中之每一序列讀段於來自所述各別病原體之參考基因組的相應靶向小組序列中的映射。
在一個態樣中,將反映病毒負荷之量與參考/截止值相比較。舉例而言,計算訓練集中每一個體之值以構造標準特異性及靈敏度曲線(例如其中x軸表示病毒負荷值)。所述參考/截止值係基於所希望的目標特異性選擇。或者,可以將總體病毒負荷或基於病原體之各個病毒負荷直接用作分類器(例如基於 邏輯斯蒂回歸(logistic regression)之分類器)的輸入。在一些實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括測定與第一分佈之預定百分位數有關的所述組病原體中之第一病原體之序列讀段的參考量。在此類實施例中,第一組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈。所述第一組個體的第一部分中的每一個體皆患有所述癌症病況且所述第一組個體的第二部分中的每一個體皆未患所述癌症病況。接著,將(i)第一量與(ii)第二量相比較,所述第一量係來自所述測試個體的映射至第一病原體之病原體目標參考中一序列的所述多個序列讀段之量,所述第二量係與第一分佈之預定百分位數有關的所述組病原體中第一病原體之序列讀段的參考量。當所述第一量超過所述第二量(參考/截止值係基於所希望的目標特異性選擇)臨限量時,說明所述測試個體有患所述癌症病況的可能性或確定所述測試個體患有所述癌症病況。
如本文所揭示,量(例如所述第一或第二量)可以為反映所述無細胞核酸樣品中源自病原體之核酸片段的豐度水準。舉例而言,此處的量可以為濃度、病毒源性序列讀段相對於源自測試個體(例如人類)之序列讀段的比率,或上下文內評價病毒源性序列讀段的任何適合量度。
在一個態樣中,將正規化病原體負荷與參考/截止值相比較。舉例而言,使用訓練集及對照健康集。所述訓練集同時包含健康個體及患病個體。在一些實施例中,所述對照健康集可以為所述訓練集之子集。在一些實施例中,藉由健康集中某一百分位數的健康樣品之病原體負荷將病原體負荷正規化以呈現每一病原體類型之正規化病毒負荷。在一些實施例中,接著對所述正規化負荷求和以提供總體病原體負荷。使用所述訓練集構造特異性及靈敏度曲線(例如其中x軸表示總體病原體負荷值或給定病原體之正規化負荷值)。參考/截止值係基於 所希望的目標特異性選擇。或者,可以將總體病毒負荷或基於病原體之各個病毒負荷直接用作分類器(例如基於邏輯斯蒂回歸之分類器)之輸入。在一些此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括測定與第一分佈之預定百分位數(例如90%、95%、98%或另一適合百分比)有關的所述組病原體中之第一病原體之序列讀段的參考量。在一些此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括測定與第一分佈之預定百分位數有關的所述組病原體中之第一病原體之序列讀段的參考量。未患所述癌症病況的第一組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈。
在一個態樣中,使用由訓練集中每一個體得到的比率或來自訓練集中每一個體之正規化病原體負荷值替代使用截止值作為二項或多項分類演算法之輸入。在一些此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括將所述組序列讀段量施加至分類器,由此確定(i)測試個體是否患有所述癌症病況或(ii)測試個體患所述癌症病況的可能性。
在一些實施例中,所述測定步驟包括基於與各別分佈之預定百分位數有關的序列讀段之量對映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量定限。未患所述癌症病況的各別組個體中之每一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻所述各別分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之各別量。在此類實施例中,當至少輸入來自所述測試個體之多個序列讀段的每一按比例調整之各別量的分類器指示所述測試個體患有所述癌 症病況時,確定所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性。在一些此類實施例中,所述分類器係基於邏輯斯蒂回歸演算法,其基於在訓練組個體中所觀察到的映射至相應病原體之病原體目標參考中一序列的序列讀段之相應量,單獨地對多個序列讀段的每一按比例調整之各別量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。在一些此類實施例中,所述組病原體包括在2種與100種之間的病原體。
II.病原體負荷結合另一類型分析(例如藉由全基因組測序進行之複本數變異分析或藉由全基因組亞硫酸氫鹽測序進行之甲基化分析)進行之偵測。 本揭示案之另一態樣提供一種在測試個體中篩查癌症病況的方法。所述方法包括自所述測試個體獲得第一生物樣品,所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。所述方法進一步包括執行第一分析,所述第一分析包括量測所述第一生物樣品中之無細胞核酸的第一特徵之量。所述方法進一步包括執行第二分析,所述第二分析包括i)對第二生物樣品中之無細胞核酸進行測序以產生來自所述測試個體的多個序列讀段,其中所述第二生物樣品係來自所述測試個體,且其中所述第二生物樣品包括來自所述測試個體之無細胞核酸及來自所述組病原體中之至少一種病原體的潛在地無細胞核酸;及ii)對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之病原體目標參考中一序列的所述多個序列讀段之相應量,由此獲得一組序列讀段量,所述組序列讀段量中之每一各別序列讀段量對應於所述組病原體中之相應病原體。所述方法進一步包括基於所述第一及第二分析篩查所述癌症病況,其中當所述第一分析或所述第二分析,或所述第一分析及所述第二分析指示所述測試個體患有或未患所述癌症病況或提供所述測試個體患或未患所述癌症病況的可能性時,認為所述測試個體有患所述癌症病況的可能性或患有所述癌症病況。
在一些實施例中,所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示。在此類實施例中,所述篩查使用(i)所述關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)第一特徵之量及(iii)所述關於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述篩查使用(i)所述關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)第一特徵之量及(iii)所述關於與第一病原體有關的APOBEC誘導之突變標誌在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,關於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的量測值。在此類實施例中,所述篩查使用(i)所述關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)第一特徵之量及(iii)所述APOBEC誘導之突變標誌之富集量的量測值確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一個態樣中,所述第二分析包括藉由將反映病毒負荷之量與參考/截止值相比較來測定所述量。舉例而言,計算訓練集中每一個體之值以構造標準特異性及靈敏度曲線(例如其中x軸表示病毒負荷值)。所述參考/截止值係基於所希望的目標特異性選擇。或者,可以將總體病毒負荷或基於病原體之各個病毒負荷直接用作分類器(例如基於邏輯斯蒂回歸之分類器)之輸入。在一些實施例中,所述第二分析還包括測定與第一分佈之預定百分位數有關的所述組病原體中之第一病原體之序列讀段的參考量。第一組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考中一序列的來自所述各別個體之序列 讀段的量貢獻第一分佈。所述第一組個體之第一部分中的每一個體皆患有所述癌症病況且所述第一組個體之第二部分中的每一個體皆未患所述癌症病況。將第一量與第二量相比較,所述第一量係來自所述測試個體的映射至第一病原體之病原體目標參考中一序列的多個序列讀段之量,所述第二量係與所述第一分佈之預定百分位數有關的所述組病原體中之第一病原體之序列讀段的參考量。當所述第一量超過所述第二量臨限量時,所述第二分析指示所述測試個體有患所述癌症病況的可能性或確定所述測試個體患有所述癌症病況。
在一個態樣中,所述第二分析包括測定正規化病原體負荷,接著將其與參考/截止值相比較。舉例而言,使用訓練集及對照健康集。所述訓練集同時包含健康個體及患病個體。在一些實施例中,所述對照健康集可以為所述訓練集之子集。在一些實施例中,藉由健康集中某一百分位數的健康樣品之病原體負荷將病原體負荷正規化以呈現每一病原體類型之正規化病原體負荷。在一些實施例中,接著對所述正規化負荷求和以提供總體病原體負荷。使用所述訓練集構造特異性及靈敏度曲線(例如其中x軸表示總體病原體負荷值或給定病原體之正規化負荷值)。參考/截止值係基於所希望的目標特異性選擇。或者,將總體病毒負荷或基於病原體於各個病毒負荷直接用作分類器(例如基於邏輯斯蒂回歸之分類器)之輸入。在一些實施例中,測定與第一分佈之預定百分位數(例如90%、95%、98%或另一適合百分比)有關的所述組病原體中之第一病原體之序列讀段的參考量。未患所述癌症病況的第一組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈。藉由與所述第一分佈之預定百分位數有關的所述組病原體中之第一病原體之序列讀段的參考量對映射至來自所述測試個體之第一病原體之病原體目標參考中一序列的多個序列讀段之量定限,由此形成所述多個序列讀段的按比例調整之量。將所述多個序列讀段的按比例調整之量同與第二分佈 之預定百分位數有關的多個序列讀段之按比例調整之量相比較。第二組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的按比例調整之量貢獻第二分佈。第二組中之第一部分個體中的每一個體皆患有所述癌症病況且第二組中之第二部分個體中的每一個體皆未患所述癌症病況。
在一個態樣中,在所述第二分析中,可以使用由訓練集中每一個體得到的比率或來自訓練集中每一個體之正規化病原體負荷值替代使用截止值作為二項或多項分類演算法之輸入。在一些實施例中,所述執行所述第二分析進一步包括用映射至所述各別病原體之病原體目標參考中一序列的序列讀段之相應量施加至分類器,由此所述第二分析判定(i)測試個體是否患有所述癌症病況或(ii)測試個體患所述癌症病況的可能性。
在一個態樣中,所述第二分析包括結合用於癌症偵測之測試個體源性標誌(例如用於複本數變異分析之標誌、用於體細胞突變分析之標誌或用於甲基化分析之標誌)之存在執行的病原體負荷分析。在一個態樣中,病原體負荷分析係結合病原體特異性標誌之存在,且進一步結合用於癌症偵測之測試個體源性標誌(例如用於複本數變異分析之標誌、用於體細胞突變分析之標誌或用於甲基化分析之標誌)之存在執行。在一些實施例中,所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關之序列片段標誌存在抑或不存在的指示。所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關之甲基化標誌存在抑或不存在的指示。在此類實施例中,篩查所述癌症病況使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與第一病原體有關之甲基化標誌存在抑或不存在的指示、(iii)第一特徵之量及(iv)所述組序列讀段量確定測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,所述執行所述第二分析進一步包括對於所述組病原體中之每一各別病原體,基於與各別分佈之預定百分位數有關的序列讀段之量對映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量定限。在此類實施例中,未患所述癌症病況的各別組個體中之每一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻所述各別分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之各別量。在此類實施例中,當至少輸入來自所述測試個體之多個序列讀段的每一按比例調整之各別量的分類器指示所述測試個體患有所述癌症病況時,所述第二分析認為所述測試個體有患所述癌症病況的可能性或患有所述癌症病況。
在一些實施例中,所述分類器係邏輯斯蒂回歸,其基於在訓練組個體中所觀察到的映射至所述各別病原體之病原體目標參考中一序列的序列讀段之相應量,單獨地對多個序列讀段的每一按比例調整之各別量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。
在一些實施例中,所述執行所述第二分析進一步包括對於所述組病原體中之每一各別病原體,基於與各別分佈之預定百分位數有關的序列讀段之量對映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量定限,其中未患所述癌症病況的各別組個體中之每一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻所述各別分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之各別量,在此類實施例中,對來自所述測試個體之多個序列讀段的每一按比例調整之各別量求和以測定總體腫瘤病原體負荷。當所述總體腫瘤病原體負荷滿足臨限截止值條件時,所述第二分析指示所述測試個體患有所述癌症病況。
在一些實施例中,所述臨限截止值條件係關於未患所述癌症病況 之一組個體所測定的所述組病原體之總體腫瘤病原體負荷的預定特異性。在一些實施例中,所述預定特異性係第95百分位數。
在一些實施例中,所述第一分析對提示所述癌症病況之第一組標記物具有一定靈敏度,且所述第一特徵係在第一組標記物內的第一生物樣品中無細胞核酸之複本數、片段大小分佈、斷裂模式、甲基化狀態或突變狀態之一。
在一些實施例中,所述第一特徵之量係基於與第二分佈之預定百分位數有關的第一特徵之量定限,由此形成所述第一特徵之按比例調整之量。未患所述癌症病況的第二組個體中之每一各別個體用由所述各別個體所量測的第一特徵之值貢獻第二分佈。當第一特徵的按比例調整之量超過與第二分佈之預定百分位數有關的第一特徵之量第二預定截止值時,第一分析認為測試個體患有癌症病況。
在一些實施例中,所述方法進一步包括基於以上揭示之第一分析及第二分析之組合篩查所述癌症病況的結果,對測試個體提供治療性干預或成像。
III.病毒特異性標誌之存在用於偵測癌症病況。 本揭示案之另一態樣提供一種在測試個體中篩查癌症病況的方法。自所述測試個體獲得第一生物樣品,其包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。對所述無細胞核酸進行測序以產生多個序列讀段。評價所述序列讀段以獲得關於與所述組病原體中之各別病原體有關的序列片段標誌存在抑或不存在的指示。使用所述關於與所述各別病原體有關之標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。在一些實施例中,所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示。在此類實施例中,使用關於與所述第一病 原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及關於與所述各別病原體有關之標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,使用關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及關於與所述各別病原體有關之標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,使用所述APOBEC誘導之突變標誌之富集量的量測值以及所述關於與所述各別病原體有關之標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,使用所述APOBEC蛋白質之表現以及所述關於與所述各別病原體有關之標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括執行分析,所述分析包括量測第一生物樣品中之無細胞核酸的APOBEC誘導之突變標誌的量。在此類實施例中,使用所述APOBEC誘導之突變標誌的量及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
IV.甲基化標誌之存在用於偵測癌症病況。 本揭示案之另一態樣提供一種在測試個體中篩查癌症病況的方法,其中自所述測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。對所述無細胞核酸進行測序以產生多個序列讀段,評價所述多個序列讀段以獲得關於與所述組病原體中之各別病原體有關之甲基化標誌存在抑或不存在的指示。使用所述關於與所述各 別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
V.病原體特異性標誌及甲基化標誌之存在用於偵測癌症病況。 本揭示案之另一態樣提供一種在測試個體中篩查癌症病況的方法,其中自所述測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。對所述無細胞核酸進行測序以產生多個序列讀段,評價所述多個序列讀段以獲得關於與所述組病原體中之各別病原體有關之序列片段標誌存在抑或不存在的指示。進一步評價所述多個序列讀段以獲得關於與所述組病原體中之各別病原體有關之甲基化標誌存在抑或不存在的指示。使用所述關於與各別病原體有關之標誌片段標誌存在抑或不存在的指示及所述關於與各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,使用所述關於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,使用所述關於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,使用所述APOBEC誘導之突變標誌之富集量的量測值以及所述關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的 可能性。
在一些實施例中,使用所述APOBEC蛋白質之表現以及所述關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,使用所述關於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法藉由執行分析繼續,所述分析包括量測第二生物樣品中之無細胞核酸的APOBEC誘導之突變標誌的量。在此類實施例中,使用所述關於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。在一些此類實施例中,測序係藉由全基因組測序、靶向小組測序(甲基化或非甲基化相關)或全基因組亞硫酸氫鹽測序執行。
VI.病原體源性小組用於癌症篩查。 本揭示案之另一態樣提供用於篩查測試個體以確定所述個體患癌症病況之可能性或指示所述個體患有癌症病況的病原體小組,所述病毒小組包括第一及第二序列片段。在一些實施例中,所述第一序列片段編碼相應寄生蟲之基因組的至少100個鹼基。在一些實施例中,所述病原體小組包含所述組寄生蟲中至少4種、至少5種、至少8種或至少50種不同寄生蟲的序列片段。在一些實施例中,所述第一序列片段編碼由相應寄生蟲之基因組所編碼之蛋白質的一部分。在一些實施例中,所述第一序列片段編碼相應寄生蟲之一部分基因組的甲基化模式。
VII.基於來自一種或多種病原體之無細胞核酸的存在篩查癌症病 況的方法。 本揭示案之另一態樣提供一種在測試個體中篩查癌症病況的方法。所述方法包括自所述測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之第一病原體的潛在地無細胞核酸。所述方法進一步包括執行分析,在該分析中,對所述第一生物樣品中之無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段。所述分析進一步包括測定與所述第一病原體之參考基因組比對的所述多個序列讀段之量。所述分析還包括基於與第一分佈之預定百分位數有關的序列讀段之量對所述量定限。未患所述癌症病況的一組個體中之每一各別個體將與所述第一病原體之參考基因組比對的來自所述各別個體之序列讀段的量貢獻第一分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之第一量。當至少部分地基於所述多個序列讀段的按比例調整之第一量的度量滿足與所述癌症病況有關之臨限值時,認為所述測試個體患有所述癌症病況。
在一些實施例中,當基於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在及所述多個序列讀段的按比例調整之第一量的度量滿足與所述癌症病況有關之臨限值時,認為所述測試個體患有所述癌症病況。
在一些實施例中,當基於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在及所述多個序列讀段的按比例調整之第一量的度量滿足與所述癌症病況有關之臨限值時,認為所述測試個體患有所述癌症病況。在一些實施例中,當基於與所述APOBEC誘導之突變標誌之富集量的量測值及所述多個序列讀段的按比例調整之第一量的度量滿足與所述癌症病況有關之臨限值時,認為所述測試個體患有所述癌症病況。在一些實施例中,當基於與所述組病原體中之第一病原體有關之APOBEC蛋白質之表現及所述多個序列讀段的按比例調整之第一量的度量滿足與所述癌症病況有關之臨限值時,認為所述測試個體患有所述癌症病況。在一些實施例中,當基於APOBEC誘導之突變標誌的量 及所述多個序列讀段的按比例調整之第一量的度量滿足與所述癌症病況有關之臨限值時,認為所述測試個體患有所述癌症病況。在一些實施例中,當基於APOBEC誘導之突變標誌的量及所述多個序列讀段的按比例調整之第一量的度量滿足與所述癌症病況有關之臨限值時,認為所述測試個體患有所述癌症病況。
在一些實施例中,當來自所述測試個體之所述多個序列讀段的按比例調整之第一量超過與所述分佈之預定百分位數有關的序列讀段之量預定截止值時,所述分析認為所述測試個體患有所述癌症病況。在一些實施例中,第一預定截止值比所述分佈之集中趨勢的量測值高單一標準差。在一些實施例中,第一預定截止值比所述分佈之集中趨勢的量測值高三個標準差。
VIII.基於來自一種或多種病原體方無細胞核酸的存在篩查多種癌症病況的方法。 本揭示案之另一態樣提供一種針對多種癌症病況中之每一癌症病況篩查測試個體的方法,其中自所述測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之任何病原體的潛在地無細胞核酸。對所述第一生物樣品中之無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段。所述方法進一步包括對所述組病原體中之每一各別病原體執行程序。所述程序包括測定與所述各別病原體之參考基因組比對的所述多個序列讀段之各別量,並基於與各別分佈之預定百分位數有關的序列讀段之量對所述各別量定限。未患癌症病況的各別組個體中之每一各別個體將與所述各別病原體之參考基因組比對的來自所述各別個體之序列讀段的量貢獻所述各別分佈,由此測定來自所述各別個體之所述多個序列讀段的按比例調整之各別量。所述方法進一步包括至少將所述多個序列讀段的每一按比例調整之各別量輸入分類器中,由此獲得分類器結果,所述分類器結果指示所述測試是否患有所述多種癌症病況中之一種癌症病況。
在一些實施例中,將所述關於與所述第一病原體有關的APOBEC 誘導之突變標誌存在抑或不存在的指示以及所述多個序列讀段的每一按比例調整之各別量輸入所述分類器中,由此獲得分類器結果,所述分類器結果指示所述測試是否患有所述多種癌症病況中之一種癌症病況。在一些實施例中,將所述關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及所述多個序列讀段的每一按比例調整之各別量輸入所述分類器中,由此獲得分類器結果,所述分類器結果指示所述測試是否患有所述多種癌症病況中之一種癌症病況。在一些實施例中,將所述APOBEC誘導之突變標誌之富集量的量測值以及所述多個序列讀段的每一按比例調整之各別量輸入所述分類器中,由此獲得分類器結果,所述分類器結果指示所述測試是否患有所述多種癌症病況中之一種癌症病況。在一些實施例中,所述方法進一步包括分析來自所述測試個體之第一生物樣品或第二生物樣品中與所述組病原體中之第一病原體有關的APOBEC蛋白質之表現。在此類實施例中,將所述APOBEC蛋白質之表現以及所述多個序列讀段的每一按比例調整之各別量輸入所述分類器中,由此獲得分類器結果,所述分類器結果指示所述測試是否患有所述多種癌症病況中之一種癌症病況。在一些實施例中,將APOBEC誘導之突變標誌之量以及所述多個序列讀段的每一按比例調整之各別量輸入所述分類器中,由此獲得分類器結果,所述分類器結果指示所述測試是否患有所述多種癌症病況中之一種癌症病況。
在一些實施例中,所述方法進一步包括自所述測試個體獲得第二生物樣品,其中所述第二生物樣品包括來自所述測試個體之無細胞核酸及來自所述組病原體中之第一病原體的潛在地無細胞核酸。在此類實施例中,將APOBEC誘導之突變標誌之量以及所述多個序列讀段的每一按比例調整之各別量輸入所述分類器中,由此獲得分類器結果,所述分類器結果指示所述測試是否患有所述多種癌症病況中之一種癌症病況。
在一些實施例中,所述組病原體包括至少兩種病原體。在一些實 施例中,所述組病原體包括至少二十種病原體。
IX.使用多個二項分類器基於來自一種或多種病原體之無細胞核酸的存在篩查多種癌症病況的方法。 本揭示案之另一態樣提供一種針對多種癌症病況中之每一癌症病況篩查測試個體的方法。所述方法包括自所述測試個體獲得第一生物樣品,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之任何病原體的潛在地無細胞核酸。所述方法進一步包括對所述第一生物樣品中之無細胞核酸進行測序,以產生來自所述測試個體之多個序列讀段。所述方法進一步包括對所述組病原體中之每一各別病原體執行程序。所述程序包括測定與所述各別病原體之參考基因組比對的所述多個序列讀段之各別量,並基於與各別分佈之預定百分位數有關的序列讀段之量對所述各別量定限。未患癌症病況的各別組個體中之每一各別個體將與所述各別病原體之參考基因組比對的來自所述各別個體之序列讀段的量貢獻所述各別分佈,由此測定來自所述各別個體之所述多個序列讀段的按比例調整之各別量。所述方法進一步包括至少將所述多個序列讀段的每一按比例調整之各別量輸入多個分類器中之每一分類器中,其中所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
在一些實施例中,所述輸入步驟將所述關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中。所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
在一些實施例中,所述輸入步驟將所述關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中。所述多個分 類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
在一些實施例中,將所述APOBEC誘導之突變標誌之富集量的量測值以及所述多個序列讀段的每一按比例調整之各別量輸入多個分類器中之每一分類器中。所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
在一些實施例中,所述輸入步驟將所述APOBEC蛋白質之表現以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中。所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
在一些實施例中,所述輸入步驟將APOBEC誘導之突變標誌的量以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中。所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
在一些實施例中,所述輸入步驟將APOBEC誘導之突變標誌的量以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中。所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
其他實施例係關於與本文所述方法有關之系統、攜帶型消費者裝置及電腦可讀媒體。如本文所揭示,本文所揭示之任何實施例在適當時可適用於任何態樣。根據以下詳細描述,本領域中熟習此項技術者將對本揭示案之其他態樣及優勢變得顯而易見,其中僅顯示及描述本揭示案之例示性實施例。應認識到,本揭示案能夠具有其他及不同實施例,且其若干細節能夠在各種顯而易見的方面進行修改,該等修改皆不背離本揭示案。因此,附圖及說明在本質上應視為 說明性的而非限制性的。
以引用的方式併入
本文中之所有出版物、專利及專利申請案均以全文引用的方式併入。若本文中之術語與併入之參考文獻中之術語之間有衝突,則本文中之術語為準。
100‧‧‧系統
102‧‧‧處理核心
104‧‧‧網路介面
106‧‧‧使用者介面
108‧‧‧顯示器
110‧‧‧輸入
111‧‧‧非持續記憶體
112‧‧‧持續記憶體
114‧‧‧通信匯流排
116‧‧‧可選操作系統
118‧‧‧可選網路通信模組
120‧‧‧病況評價模組
122‧‧‧關於來自測試個體之生物樣品1的資料構造
124‧‧‧第一特徵量測
126‧‧‧關於來自測試個體之生物樣品2的資料構造
128-1‧‧‧序列讀段1
128-1-1‧‧‧序列讀段1-1
128-1-2‧‧‧序列讀段1-2
128-1-M‧‧‧序列讀段1-M
128-2‧‧‧序列讀段2
128-M‧‧‧序列讀段M
130-1‧‧‧病原體目標參考1
130-2‧‧‧病原體目標參考2
130-Q‧‧‧病原體目標參考Q
132-1‧‧‧第1組資料集
132-2‧‧‧第2組
132-K‧‧‧第K組
134-1-1‧‧‧第1組個體1
134-1-2‧‧‧第1組個體2
134-1-Q‧‧‧第1組個體Q
202‧‧‧區塊
204‧‧‧區塊
206‧‧‧區塊
208‧‧‧區塊
210‧‧‧區塊
212‧‧‧區塊
213‧‧‧區塊
214‧‧‧區塊
215‧‧‧區塊
216‧‧‧區塊
217‧‧‧區塊
218‧‧‧區塊
220‧‧‧區塊
223‧‧‧區塊
224‧‧‧區塊
226‧‧‧區塊
228‧‧‧區塊
230‧‧‧區塊
232‧‧‧區塊
234‧‧‧區塊
236‧‧‧區塊
237‧‧‧區塊
238‧‧‧區塊
239‧‧‧區塊
240‧‧‧區塊
242‧‧‧區塊
244‧‧‧區塊
246‧‧‧區塊
248‧‧‧區塊
250‧‧‧區塊
252‧‧‧區塊
254‧‧‧區塊
256‧‧‧區塊
258‧‧‧區塊
260‧‧‧區塊
262‧‧‧區塊
264‧‧‧區塊
265‧‧‧區塊
266‧‧‧區塊
267‧‧‧區塊
268‧‧‧區塊
270‧‧‧區塊
272‧‧‧區塊
274‧‧‧區塊
276‧‧‧區塊
278‧‧‧區塊
280‧‧‧區塊
282‧‧‧區塊
284‧‧‧區塊
286‧‧‧區塊
288‧‧‧區塊
290‧‧‧區塊
292‧‧‧區塊
294‧‧‧區塊
296‧‧‧區塊
298‧‧‧區塊
302‧‧‧區塊
304‧‧‧區塊
306‧‧‧區塊
308‧‧‧區塊
310‧‧‧區塊
312‧‧‧區塊
314‧‧‧區塊
316‧‧‧區塊
318‧‧‧區塊
320‧‧‧區塊
322‧‧‧區塊
324‧‧‧區塊
326‧‧‧區塊
328‧‧‧區塊
330‧‧‧區塊
1300‧‧‧曲線圖
1302‧‧‧第一分佈
1304‧‧‧預定百分位數/直線
1306-1‧‧‧個體
1306-2‧‧‧個體
1308‧‧‧直線
1400‧‧‧曲線圖
1402‧‧‧分佈
1404‧‧‧直線
1406-1‧‧‧個體
1406-2‧‧‧個體
1500‧‧‧曲線圖
1502‧‧‧第二分佈
1504‧‧‧直線
1506-1‧‧‧個體
1506-2‧‧‧個體
1600‧‧‧曲線圖
1602‧‧‧第一分佈
1604‧‧‧直線
1700‧‧‧曲線圖
1702‧‧‧第二分佈
1704‧‧‧直線
1800‧‧‧方法
1802‧‧‧步驟
1820‧‧‧步驟
1830‧‧‧步驟
1835‧‧‧步驟
1840‧‧‧步驟
1850‧‧‧步驟
1860‧‧‧步驟
1900‧‧‧方法
1902‧‧‧區塊
1904‧‧‧區塊
1906‧‧‧區塊
1908‧‧‧區塊
2000‧‧‧核酸區段
2002‧‧‧胞嘧啶核苷酸鹼基
2005A‧‧‧區域
2005B‧‧‧區域
2005C‧‧‧區域
2070‧‧‧目標序列
2070A‧‧‧目標序列
2070B‧‧‧目標序列
2070C‧‧‧目標序列
2080‧‧‧富集之序列
2080A‧‧‧富集之序列/序列讀段
2080B‧‧‧富集之序列
2080C‧‧‧富集之序列/序列讀段
在附圖之諸圖中藉由實例且並非藉由限制來說明本文所揭示之實施方案。在圖式中之若干視圖中,類似元件符號係指對應部件。
圖1示出示例性方塊圖,示出根據本揭示案之一些實施例的計算裝置。
圖2A、2B、2C、2D、2E、2F、2G、2H、2I、2J、2K、2L及2M一起示出根據本揭示案之一些實施例,在測試個體中篩查癌症病況之方法的示例性流程圖。
圖3A及3B示出各種癌症與病原體之關聯,所述病原體為諸如病毒(例如B型及C型肝炎病毒(HBV及HCV)、人乳頭狀瘤病毒(HPV)、埃-巴二氏病毒(EBV)、人T細胞淋巴瘤病毒1(HTLV-1)、梅克爾細胞多瘤病毒(MCPyV)及卡波西氏肉瘤病毒);致癌細菌,包含幽門螺旋桿菌;及致癌寄生蟲,包含埃及血吸蟲、泰國肝吸蟲及華支睾吸蟲,如Vandeven,2014,《癌症免疫學研究》Res.2(1):9-14中所揭示。
圖4示出在178種腫瘤中偵測之28種病毒的RNA-seq源性表現水準,其中在來自19種癌症類型之178種病毒陽性腫瘤(水平軸)中,(豎軸)在至少一個腫瘤中之42p p.m總文庫讀段下偵測,如Tang,2013,《自然-通訊》 4:2513中所揭示。
圖5示出根據本揭示案之一個實施例,具有來自病毒之可偵測序列讀段的癌症個體之比例隨癌症類型之變化,以及具有來自病毒之可偵測序列讀段的非癌症個體之比例。
圖6示出根據本揭示案之一個實施例,藉由病毒物種且再藉由癌症類型確定的具有可偵測之序列讀段的癌症個體之比例。
圖7示出根據本揭示案之一個實施例,使用病毒負荷分析及SCNA Z分數分析偵測之頭頸癌病例的數目。
圖8示出根據本揭示案之一個實施例,藉由在95%特異性下針對一組定限,使用病毒負荷分析及SCNA Z分數分析(靈敏度)偵測的各種早期及晚期癌症之癌症病例的數目。
圖9示出顯示具有較強病毒表現(文庫中之410p.p.m.病毒讀段)以及較弱偵測(2-10p.p.m.)之腫瘤之百分數的條形圖,以及顯示針對主要病毒類別呈陽性之腫瘤之相對數量的餅圖,其中較強及較弱偵測分別如Tang,2013,《自然-通信》4:2513中所揭示來顯示。
圖10示出在藉由病毒負荷獨特地鑑別的早期乳癌中,使用所揭示之技術得到的讀段計數剛好低於先前技術研究之偵測臨限值。
圖11示出根據本揭示案之一個實施例,藉由在95%特異性下針對一組定限,使用病毒負荷分析及SCNA Z分數分析(靈敏度)偵測的各種早期及晚期癌症之癌症病例的數目。
圖12示出根據本揭示案之一個實施例,以比例計之病毒序列表示,其中病毒係基於其在最佳癌症預測模型中之存在進行選擇。
圖13示出根據本揭示案之一個實施例的分佈,其中第一組個體中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自各別 個體之序列讀段的量貢獻第一分佈。
圖14示出根據本揭示案之一個實施例的分佈,其中一組個體中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自各別個體之序列讀段的量貢獻該分佈。
圖15示出根據本揭示案之一個實施例的第二分佈,其中第二組個體中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自各別個體之序列讀段的量貢獻第二分佈。
圖16示出根據本揭示案之一個實施例的第一分佈,其中第二組個體中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自各別個體之序列讀段的量貢獻第一分佈。
圖17示出根據本揭示案之一個實施例的第一分佈,其中第二組個體中之每一各別個體用映射至第二病原體之病原體目標參考中一序列的來自各別個體之序列讀段的量貢獻第二分佈。
圖18係根據本揭示案之一些實施例,用於獲得甲基化資訊以達成在測試個體中篩查癌症病況之目的之方法的流程圖。
圖19示出根據本揭示案之一些實施例,用於製備測序用核酸樣品之方法的流程圖。
圖20係根據本揭示案之一些實施例,用於獲得序列讀段之製程的圖形表示。
現將詳細參考實施例,其實例將於附圖中示出。在以下詳細描述中,闡述眾多特定細節以便提供對本揭示案之透徹理解。然而,本領域中一般熟 習此項技術者將顯而易見,本揭示案可以在無此等特定細節情況下實踐。在其他情況下,並未詳細地描述熟知方法、程序、組分、電路及網路,以免不必要地混淆實施例之態樣。
本文所描述的實施方案提供用於篩查病況之各種技術解決方案。第一分析定量測試個體之第一生物樣品中無細胞核酸之特徵的量。第二分析產生來自測試個體之第二生物樣品中之無細胞核酸的序列讀段。藉由與分佈之預定百分位數有關的序列讀段之量對與病原體參考基因組比對的這些序列讀段之量定限。未患所述病況的一組個體中之每一各別個體將與病原體參考基因組比對之序列讀段的量貢獻該分佈。由此得到來自測試個體之序列讀段的按比例調整之量。病況篩查係基於所述第一及第二分析,利用所述測試個體序列讀段的按比例調整之量執行,其中當所述第一或第二分析指示所述個體患有所述病況時,認為所述測試個體患有所述病況。
定義
如本文所使用,術語「約」或「近似地」可意謂在如由本領域中一般熟習此項技術者所測定之特定值的可接受之誤差範圍內,此可部分取決於量測或測定該值之方法,例如量測系統之限制。舉例而言,根據本領域中之實踐,「約」可意謂在一個或大於一個標準差之範圍內。「約」可意謂既定值之±20%、±10%、±5%或±1%之範圍。術語「約」或「近似地」可意謂在一個值之一個數量級範圍內,在該值之5倍範圍內或在2倍範圍內。若在本申請案及申請專利範圍中描述特定值,除非另外規定,否則應假設術語「約」意謂在特定值的可接受之誤差範圍內。術語「約」可具有如本領域中一般熟習此項技術者通常所理解之含義。術語「約」可指±10%。術語「約」可指±5%。
如本文所使用,術語「分析」係指用於測定一種物質,例如核酸、蛋白質、細胞、組織或器官之特性的一種技術。分析(例如第一或第二分析)可 包括用於測定樣品中核酸之複本數變化、樣品中核酸之甲基化狀態、樣品中核酸之片段大小分佈、樣品中核酸之突變狀態或樣品中核酸之斷裂模式的一種技術。本領域中一般熟習此項技術者已知的任何分析均可用於偵測本文所提及之核酸的任何特性。核酸之特性可以包含序列、基因組屬性、複本數、在一個或多個核苷酸位置處之甲基化狀態、核酸之大小、核酸中在一個或多個核苷酸位置處突變之存在或不存在以及核酸之斷裂模式(例如發生核酸斷裂之核苷酸位置)。分析或方法可具有特定的靈敏度及/或特異性,且其作為診斷工具之相對有用性可使用ROC-AUC統計學來量測。
如本文所使用,術語「生物樣品」、「患者樣品」或「樣品」係指自個體獲取之任何樣品,該樣品可以反映與個體有關之生物狀態,且包含無細胞DNA。生物樣品之實例包含但不限於個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。生物樣品可以包含源自存活或死亡個體之任何組織或材料。生物樣品可以為無細胞樣品。生物樣品可包括核酸(例如DNA或RNA)或其片段。術語「核酸」可指脫氧核糖核酸(DNA)、核糖核酸(RNA)或其任何雜交體或片段。樣品中之核酸可為無細胞核酸。樣品可為液體樣品或固體樣品(例如細胞或組織樣品)。生物樣品可為體液,諸如血液、血漿、血清、尿液、陰道液、來自水囊腫(例如睪丸水腫)之流體、陰道沖洗液、胸膜液、腹水、腦脊髓液、唾液、汗液、淚液、痰液、支氣管肺泡灌洗液、乳頭溢液、來自身體不同部分(例如甲狀腺、乳房)之抽吸液等。生物樣品可以為糞便樣品。在各種實施例中,已富集無細胞DNA之生物樣品(例如經由離心方案獲得的血漿樣品)中之大部分DNA可以為無細胞的(例如大於50%、60%、70%、80%、90%、95%或99%的DNA可以為無細胞的)。可以對生物樣品進行處理,以物理方式破壞組織或細胞結構(例如離心及/或細胞溶解),由此將細胞內組分釋放至溶液中,該溶液可以另外含有酶、緩衝液、鹽、清潔劑及 類似物,其可以用於製備分析用樣品。
如本文所使用,術語「癌症」或「腫瘤」係指異常的組織塊,其中該組織塊之生長超過正常組織之生長且與正常組織之生長不協調。癌症或腫瘤可取決於以下特徵而定義為「良性」或「惡性」:細胞分化程度,包含形態及功能;生長速率;局部侵襲;及轉移。「良性」腫瘤可為良好分化的,生長典型地比惡性腫瘤慢,且保持侷限於原發部位。此外,在一些情況下,良性腫瘤不能浸潤、侵襲或轉移至遠端部位。「惡性」腫瘤可以為分化不良(退行發育)的,典型地快速生長,伴隨周圍組織之進行性浸潤、侵襲及破壞。此外,惡性腫瘤可具有轉移至遠端部位之能力。
術語「分類」可以指與樣品之特定特性有關的任何數字或其他性質。舉例而言,「+」符號(或「陽性」一詞)可表示樣品係分類為具有缺失或擴增。在另一個實例中,術語「分類」可指個體及/或樣品中腫瘤組織之量、個體及/或樣品中腫瘤之大小、個體中腫瘤之分期、個體及/或樣品中之腫瘤負荷及個體中腫瘤轉移之存在。分類可以為二項的(例如陽性或陰性)或具有更高層級之分類(例如自1至10或0至1之等級)。術語「截止值」及「臨限值」可以指操作中使用之預定數字。舉例而言,截止大小可指這樣一種大小,大於此大小則排除片段。臨限值可為這樣一種值,高於或低於該值,適用特定分類。此等術語中之任一個可用於此等情形中之任一種中。
如本文所使用,術語「無細胞核酸」、「無細胞DNA」及「cfDNA」可互換地指在個體之體液(例如血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、汗液、淚液、胸膜液、心包液或腹膜液)中循環且源自一個或多個健康細胞及/或一個或多個癌細胞之核酸片段。無細胞核酸與循環核酸可互換地使用。無細胞核酸之實例包含但不限於RNA、粒線體DNA或基因組DNA。
如本文所使用,術語「對照」、「對照樣品」、「參考」、「參 考樣品」、「正常」及「正常樣品」描述來自未患特定病況或在其他方面健康之個體的樣品。在一個實例中,本文所揭示之方法可對具有腫瘤之個體執行,其中參考樣品係自個體之健康組織獲取的樣品。參考樣品可自個體或資料庫獲得。參考可以為例如參考基因組,其係用於映射由對來自個體之樣品測序獲得的序列讀段。參考基因組可以指單倍體或二倍體基因組,其可用於與來自生物樣品及組成樣品之序列讀段比對及比較。組成樣品之實例可以為自個體獲得之白血球的DNA。對於單倍體基因組,在每一基因座處只能存在一個核苷酸。對於二倍體基因組,可鑑別出異型接合基因座;每一異型接合基因座可以具有兩個對偶基因,其中任一對偶基因可允許匹配以與基因座比對。
如本文所使用,術語「終止位置」或「終點位置」(或僅「終點」)可以指無細胞DNA分子,例如血漿DNA分子之最外部鹼基,例如在末端處之基因組座標或基因組屬性或核苷酸屬性。終點位置可對應於DNA分子之任一端。以此方式,若其係指DNA分子之起點與終點,則兩者均對應於終止位置。在一些情況下,一個終點位置係在無細胞DNA分子一個末端之最外部鹼基的基因組座標或核苷酸屬性,其係藉由分析方法,例如大規模並行測序或下一代測序、單分子測序、雙股或單股DNA測序文庫製備方案、聚合酶鏈反應(PCR)或微陣列偵測或確定。在一些情況下,此類活體外技術可以改變無細胞DNA分子之真正活體內物理終點。因此,每個可偵測終點可表示生物學上真正的終點,或所述終點係自分子之原始終點向內的一個或多個核苷酸或自分子之原始終點延伸之一個或多個核苷酸,例如非鈍端雙股DNA分子之突出端藉由克列諾片段(Klenow fragment)進行之5'鈍化及3'補平。在終點位置處之基因組屬性或基因組座標可由序列讀段與人類參考基因組,例如hg19比對之結果得到。其可由表示人類基因組原始座標之索引或代碼目錄得到。其可指無細胞DNA分子上之位置或核苷酸屬性,其係藉由但不限於目標特異性探針、小型測序、DNA擴增讀 取。術語「基因組位置」可以指聚核苷酸(例如基因、質體、核酸片段、病毒DNA片段)中之核苷酸位置。術語「基因組位置」不限於基因組(例如配子或微生物中、或多細胞生物體之每個細胞中之染色體的單倍體組)內的核苷酸位置。
如本文所使用,術語「假陽性」(FP)係指未患病況之個體。假陽性可以指個體未患腫瘤、癌症、癌變前病況(例如癌變前病變)、局部或轉移性癌症、非惡性疾病或在其他方面健康。術語假陽性可以指個體未患病況,但藉由本揭示案之分析法或方法鑑別為患有所述病況。
如本文所使用,術語「片段」(例如DNA片段)係指包括至少三個連續核苷酸的聚核苷酸或多肽序列之一部分。核酸片段可保持親本聚核苷酸之生物活性及/或一些特徵。在一個實例中,鼻咽癌細胞可將埃-巴二氏病毒(EBV)DNA之片段沈積至個體,例如患者之血流中。此等片段可包括一個或多個BamHI-W序列片段,其可用於偵測血漿中腫瘤源性DNA之水準。BamHI-W序列片段對應於可使用Bam-HI限制酶識別及/或消化之序列。BamHI-W序列可指序列5'-GGATCC-3'。
如本文所使用,術語「假陰性」(FN)係指個體患有病況。假陰性可以指個體患有腫瘤、癌症、癌變前病況(例如癌變前病變)、局部或轉移性癌症、或非惡性疾病。術語假陰性可以指個體患有病況,但藉由本揭示案之分析法或方法鑑別為未患所述病況。
如本文所使用,片語「健康」係指個體具有良好的健康狀況。健康個體可以展示沒有任何惡性或非惡性疾病。「健康個體」可患有與所分析之病況無關的其他疾病或病況,其在正常情況下可能不被視為「健康的」。
如本文所使用,術語「資訊性癌症DNA片段」或「資訊性DNA片段」可以對應於帶有或攜帶任一個或多個癌症相關或癌症特異性變化或突變之DNA片段,或特定終止基元(例如在DNA片段兩端處具有特定序列之多個 核苷酸)。
如本文所使用,術語「癌症水準」係指癌症是否存在(例如存在抑或不存在)、癌症分期、腫瘤大小、轉移之存在或不存在、身體之總腫瘤負荷及/或癌症嚴重程度之其他量度(例如癌症復發)。癌症水準可為數字或其他標誌,諸如符號、字母表字母及顏色。所述水準可以為零。癌症水準亦可包含與突變或突變數量有關的惡變前或癌變前病況(狀態)。癌症水準可以各種方式使用。舉例而言,篩查可檢查先前未知患癌之某人是否存在癌症。評估可調查已診斷患有癌症之某人以隨時間監測癌症之進展,研究療法之有效性或確定預後。在一個實施例中,預後可用個體死於癌症之機率、或在特定期限或時間之後癌症進展之機率、或癌症轉移之機率表示。偵測可包括『篩查』或可包括檢查具有提示癌症之特徵(例如症狀或其他陽性測試)之某人是否患有癌症。「病理水準」可指與病原體有關之病理水準,其中所述水準可如上文關於癌症所描述。當癌症與病原體有關時,癌症水準可為一種類型之病理水準。
如本文所使用,「甲基化組」可以為在基因組中多個位點或基因座處DNA甲基化之量的量度。甲基化組可對應於基因組之全部、基因組之大部分或基因組之相對較小的部分。「腫瘤甲基化組」可以為個體(例如人類)之腫瘤的甲基化組。腫瘤甲基化組可以使用腫瘤組織或血漿中之無細胞腫瘤DNA測定。腫瘤甲基化組可以為所關注甲基化組的一個實例。所關注甲基化組可以為能將核酸,例如DNA提供至體液中之器官的甲基化組(例如腦細胞、骨、肺、心臟、肌肉、腎等之甲基化組)。所述器官可以為移植之器官。
如本文所使用,對於每一基因組位點(例如CpG位點),術語「甲基化指數」可以指在所述位點處顯示甲基化之序列讀段相對於覆蓋該位點之總讀段數的比例。一個區域之「甲基化密度」可以為在一個區域內顯示甲基化之位點處之讀段數目除以覆蓋該區域中這些位點之讀段總數。所述位點可以具有特 定特徵(例如所述位點可以為CpG位點)一個區域之「CpG甲基化密度」可以為顯示CpG甲基化之讀段數目除以覆蓋該區域中之CpG位點(例如特定CpG位點、CpG島或較大區域內之CpG位點)之讀段總數。舉例而言,人類基因組中每100kb分組之甲基化密度可以由CpG位點處未轉化胞嘧啶(其可以對應於甲基化胞嘧啶)之總數佔映射至該100kb區域之序列讀段所覆蓋之所有CpG位點的比例測定。亦可對其他分組規模,例如50kb或1Mb等執行此分析。一個區域可為整個基因組或一個染色體或一個染色體之一部分(例如染色體臂)。當一個區域僅包含CpG位點時,該CpG位點之甲基化指數可與該區域之甲基化密度相同。「甲基化胞嘧啶之比例」可指所述區域中顯示甲基化之胞嘧啶位點「C」(例如在亞硫酸氫鹽轉化之後未經轉化)的數目比所分析之胞嘧啶殘基總數,例如包含在CpG環境外的胞嘧啶。甲基化指數、甲基化密度及甲基化胞嘧啶之比例係「甲基化水準」之實例。
如本文所使用,術語「甲基化譜」(又稱為甲基化狀態)可以包含與一個區域內之DNA甲基化有關之資訊。與DNA甲基化有關之資訊可以包含CpG位點之甲基化指數、一個區域中CpG位點之甲基化密度、相鄰區域內CpG位點之分佈、含有超過一個CpG位點之區域內每一個別CpG位點之甲基化模式或水準、以及非CpG甲基化。基因組之相當大一部分之甲基化譜可視為等效於甲基化組。哺乳動物基因組中之「DNA甲基化」可以指將甲基添加至CpG二核苷酸中胞嘧啶雜環之5位(例如以產生5-甲基胞嘧啶)。胞嘧啶甲基化可以在其他序列環境中之胞嘧啶中進行,例如5'-CHG-3'及5'-CHH-3',其中H係腺嘌呤、胞嘧啶或胸腺嘧啶。胞嘧啶甲基化亦可呈5-羥甲基胞嘧啶形式。DNA甲基化可以包含非胞嘧啶核苷酸之甲基化,諸如N6-甲基腺嘌呤。
如本文所使用,術語「突變」係指一個或多個細胞之遺傳物質中的可偵測變化。在一個具體實例中,一個或多個突變可見於癌細胞中且可以鑑別 (例如驅動突變及過客突變)。突變可以自表觀細胞傳遞給子細胞。本領域中之技術人員應瞭解,母細胞中之基因突變(例如驅動突變)可以在子細胞中誘導額外的不同突變(例如過客突變)。突變一般在核酸中發生。在一個具體實例中,突變可以為一個或多個脫氧核糖核酸或其片段中之可偵測變化。突變一般係指核酸中之核苷酸添加、缺失、取代、倒置或轉置至新位置。突變可以為自發突變或以實驗方式誘導之突變。特定組織之序列中的突變係「組織特異性對偶基因」的一個實例。舉例而言,腫瘤可以具有在基因座處產生不出現在正常細胞中之對偶基因的突變。「組織特異性對偶基因」之另一實例係出現在胎兒組織中但不存在於母體組織中的胎兒特異性對偶基因。
如本文所使用,術語「核酸」與「核酸分子」可互換使用。這些術語係指任何組成形式之核酸,諸如脫氧核糖核酸(DNA,例如互補DNA(cDNA)、基因組DNA(gDNA)及類似物)及/或DNA類似物(例如含有鹼基類似物、糖類似物及/或非天然主鏈及類似物),其皆可以呈單股或雙股形式。除非另外限制,否則核酸可包括已知之天然核苷酸類似物,其中有一些可以按與天然存在之核苷酸類似之方式起作用。核酸可以呈可用於進行本文中之製程的任何形式(例如線性、圓形、超螺旋、單股、雙股及類似形式)。在一些實施例中,核酸可以來自單一染色體或其片段(例如核酸樣品可以來自由二倍體生物體獲得的樣品之一條染色體)。在某些實施例中,核酸包括核小體、片段或核小體之部分或核小體樣結構。核酸有時包括蛋白質(例如組蛋白、DNA結合蛋白及類似物)。藉由本文所描述之方法分析的核酸有時係大體上分離的且大體上與蛋白質或其他分子不締合。核酸還包含自單股(「有義」或「反義」、「正」股或「負」股、「正向」閱讀框架或「反向」閱讀框架)及雙股聚核苷酸合成、複製或擴增之DNA的衍生物、變異體及類似物。脫氧核糖核苷酸包含脫氧腺苷、脫氧胞苷、脫氧鳥苷及脫氧胸苷。核酸可以使用自個體獲得的核酸作為模板製備。
如本文所使用,「病原體」可為病毒、細菌、寄生蟲或在測試個體生物體外部的任何生物體。如本文所揭示,通常使用病毒或病毒負荷來說明各概念。然而,此類說明不應以任何方式限制範圍。
如本文所使用,術語「參考基因組」係指可用於參考自個體鑑別之序列的任何生物體或病毒之任何特定的已知、經測序或表徵之基因組,無論係部分抑或完整的。用於人類個體以及許多其他生物體的示例性參考基因組提供於由國家生物技術資訊中心(National Center for Biotechnology Information,「NCBI」)或聖塔克魯斯之加利福尼亞大學(University of California,Santa Cruz;UCSC)代管之在線基因組瀏覽器中。「基因組」係指以核酸序列表示的生物體或病毒之完整遺傳資訊。如本文所使用,參考序列或參考基因組通常係來自一位個體或多位個體的組裝或部分組裝之基因組序列。在一些實施例中,參考基因組係來自一位或多位人類個體的組裝或部分組裝之基因組序列。參考基因組可以視為一個物種之基因組的代表性實例。在一些實施例中,參考基因組包括分配給染色體之序列。示例性人類參考基因組包含但不限於NCBI構建34(UCSC等效物:hg16)、NCBI構建35(UCSC等效物:hg17)、NCBI構建36.1(UCSC等效物:hg18)、GRCh37(UCSC等效物:hg19)及GRCh38(UCSC等效物:hg38)。
如本文所使用,術語「序列讀段」或「讀段」係指藉由本文所描述或本領域中已知之任何測序方法得到的核苷酸序列。讀段可以自核酸片段之一端產生(「單端讀段」),且有時係自核酸之兩端產生(例如配對端讀段、雙端讀段)。序列讀段之長度通常與具體測序技術有關。舉例而言,高通量方法提供大小在數十至數百鹼基對(bp)間變化的序列讀段。在一些實施例中,序列讀段之均值、中值或平均長度為約15bp至900bp長(例如約20bp、約25bp、約30bp、約35bp、約40bp、約45bp、約50bp、約55bp、約60bp、約65bp、 約70bp、約75bp、約80bp、約85bp、約90bp、約95bp、約100bp、約110bp、約120bp、約130、約140bp、約150bp、約200bp、約250bp、約300bp、約350bp、約400bp、約450bp或約500bp。在一些實施例中,序列讀段之均值、中值或平均長度為約1000bp、2000bp、5000bp、10,000bp或50,000bp或更長。舉例而言,奈米孔測序可以提供大小在數十至數百乃至數千鹼基對間變化的序列讀段。Illumina平行測序可以提供變化不大之序列讀段,例如大部分序列讀段可以小於200bp。序列讀段(或測序讀段)可以指對應於核酸分子(例如一串核苷酸)之序列資訊。舉例而言,序列讀段可以對應於來自部分核酸片段之一串核苷酸(例如約20至約150個),可以對應於在核酸片段之一端或兩端處之一串核苷酸,或可以對應於完整核酸片段之核苷酸。序列讀段可以多種方式,例如使用測序技術或使用探針,例如在雜交陣列中或捕捉探針,或擴增技術,諸如聚合酶鏈反應(PCR)或使用單一引子進行之線性擴增或等溫擴增獲得。
如本文所使用,術語「測序」、「序列測定」及如本文所使用之類似表述一般係指可用於測定諸如核酸或蛋白質之類生物大分子之次序的任何及所有生物化學方法。舉例而言,測序資料可以包含核酸分子諸如DNA片段中之核苷酸鹼基的全部或一部分。
如本文所使用,術語「測序深度」係指基因座由與該基因座比對之序列讀段覆蓋的次數。基因座可小至一個核苷酸、大至一個染色體臂,或大至整個基因組。測序深度可表示為「Yx」,例如50x、100x等,其中「Y」係指基因座經序列讀段覆蓋之次數。測序深度亦可應用於多個基因座或全基因組,在此情況下,Y可指基因座或單倍體基因組或全基因組分別測序的平均次數。當引述平均深度時,資料集中所包含之不同基因座的實際深度可跨越一定值範圍。超深度測序可指在基因座處測序深度為至少100x。
如本文所使用,術語「靈敏度」或「真陽性率」(TPR)係指真 陽性之數目除以真陽性及假陰性之數目的總和。靈敏度可表徵一種分析或方法正確鑑別群體中真正患有病況之部分的能力。舉例而言,靈敏度可表徵一種方法正確鑑別群體內患有癌症之個體之數目的能力。在另一個實例中,靈敏度可表徵一種方法正確鑑別提示癌症之一個或多個標記物的能力。
如本文所使用,術語「單核苷酸變異體」或「SNV」係指在核苷酸序列,例如來自個體之序列讀段之一個位置(例如位點)處,一個核苷酸取代為不同核苷酸。第一個核鹼基X取代成第二個核鹼基Y可表示為「X>Y」。舉例而言,胞嘧啶取代成胸腺嘧啶SNV可表示為「C>T」。
如本文所使用,術語「大小譜」及「大小分佈」可以涉及生物樣品中DNA片段之大小。大小譜可以為直方圖,其提供各種大小之DNA片段之量的分佈。各種統計參數(又稱為大小參數或僅稱為參數)可區分一個大小譜與另一個大小譜。一個參數可以為特定大小或大小範圍之DNA片段相對於所有DNA片段或相對於另一大小或範圍之DNA片段的百分比。
如本文所使用,術語「靈敏度」或「真陰性率」(TNR)係指真陽性之數目除以真陰性及假陽性之數目的總和。特異性可表徵一種分析或方法正確鑑別群體中真正未患病況之部分的能力。舉例而言,特異性可表徵一種方法正確鑑別群體內未患癌症之個體之數目的能力。在另一個實例中,特異性可表徵一種方法正確鑑別提示癌症之一個或多個標記物的能力。
如本文所使用,術語「個體」係指任何存活或無生命生物體,包含但不限於人(例如男性、女性、胎兒、孕婦、兒童或類似人群)、非人類動物、植物、細菌、真菌或原生生物。任何人或非人類動物均可充當個體,包含但不限於哺乳動物、爬行動物、禽類、兩棲動物、魚類、有蹄類動物、反芻動物、牛科動物(例如牛)、馬科動物(例如馬)、山羊科動物及綿羊科動物(例如綿羊、山羊)、豬類(例如豬)、駱駝類(例如駱駝、大羊駝、羊駝)、猴、猿(例如 大猩猩、黑猩猩)、熊科動物(例如熊)、家禽、犬、貓、小鼠、大鼠、魚類、海豚、鯨及鯊魚。在一些實施例中,個體係任何階段之雄性或雌性(例如男性、女性或兒童)。
如本文所使用,術語「組織」可以對應於一組細胞,這些細胞組合在一起成為功能單元。在單一組織中可發現超過一種類型之細胞。不同類型之組織可由不同類型之細胞(例如肝細胞、肺泡細胞或血細胞)組成,而且亦可對應於來自不同生物體(母親相對於胎兒)的組織或對應於健康細胞相對於腫瘤細胞。術語「組織」一般可指人體中發現的任何細胞群(例如心臟組織、肺組織、腎組織、鼻咽組織、口咽組織)。在一些態樣中,術語「組織」或「組織類型」可用於指作為無細胞核酸之來源的組織。在一個實例中,病毒核酸片段可以源自血液組織。在另一個實例中,病毒核酸片段可以源自腫瘤組織。
如本文所使用,術語「真陰性」(TN)係指個體未患病況或未患可偵測病況。真陰性可以指個體未患疾病或可偵測之疾病,諸如腫瘤、癌症、癌變前病況(例如癌變前病變)、局部或轉移性癌症、非惡性疾病,或個體在其他方面健康。真陰性可以指個體未患病況或未患可偵測之病況,或藉由本揭示案之分析或方法鑑別為未患該病況。
如本文所使用,術語「APOBEC」係指胞苷脫胺酶家族中之酶。參見Smith等人,2012,《細胞與發育生物學研討會(Semin Cell Dev Biol)》23(3):258-268。胞苷脫胺酶負責DNA之多個維持過程,且由與炎症反應有關之細胞介素誘導。參見Siriwardena等人,2016,《化學綜述》,116(20):12688-12710。APOBEC酶在炎症反應期間之基因調控中起到重要作用,且參與對各種病原體之反應。APOBEC活性亦可引起體細胞超突變,在一些情況下,所述體細胞超突變有益於提供由細胞產生之抗體的可變性。然而,在一些情況下,APOBEC相關突變(在本文中稱為APOBEC誘導之突變標誌)已與癌症之存在相關聯。參 見Seplyarskiy等人,2016,《基因組研究》26(2):174-182。確切地說,第2型及第13型突變標誌與不同癌症高度相關。參見Alexandrov等人,2013,《自然》,500(7463),415-421。另外,APOBEC蛋白質家族某些成員之表現水準亦與癌症相關。參見Wang等人,2018,《癌基因(Oncogene)》37:3924-3936。
以下參照示例應用進行說明來描述數個態樣。應理解,闡述許多具體詳情、關係及方法以提供對本文所述之特徵的充分理解。然而,相關領域中之熟習此項技術者將易於認識到,可在無一個或多個特定細節的情況下或藉由其他方法來實踐本文所描述之特徵。本文所述之特徵不受所示動作或事件之次序限制,因為一些動作可以按不同次序發生及/或與其他動作或事件同時發生。此外,實施根據本文所描述之特徵的方法不需要所有所示動作或事件。
示例性系統實施例. 現結合圖1描述示例性系統之詳情。圖1係繪示根據一些實施方案之系統100的方塊圖。在一些實施方案中,裝置100包含一個或多個處理單元CPU 102(又稱處理器)、一個或多個網路介面104、使用者介面106、非持續記憶體111、持續記憶體112及用於互連這些組件之一個或多個通信匯流排114。所述一個或多個通信匯流排114視情況包含系統組件之間互連且控制系統組件之間之通信的電路(有時稱為晶片組)。非持續記憶體111典型地包含高速隨機存取記憶體,諸如DRAM、SRAM、DDR RAM、ROM、EEPROM、快閃記憶體,而持續記憶體112典型地包含CD-ROM、數位多功能光碟(DVD)或其他光學儲存器、匣式磁帶、磁帶、磁碟儲存器或其他磁性儲存裝置、磁碟儲存裝置、光盤儲存裝置、快閃記憶體裝置或其他非揮發性固態儲存裝置。持續記憶體112視情況包含位於CPU 102遠端之一個或多個儲存裝置。持續記憶體112及在非持續記憶體112內之非揮發性記憶體裝置包括非暫時性電腦可讀儲存媒體。在一些實施方案中,非持續記憶體111或可替代地非暫時性電腦可讀儲存媒體有時結合持續記憶體112儲存以下程式、模組及資料結構或 其子集:●可選操作系統116,其包含用於處理各種基礎系統服務及用於執行硬體相關任務之程序;●可選網路通信模組(或指令)118,用於將系統100與其他裝置或通信網路連接;●病況評價模組120,用於在測試個體中篩查癌症病況;●關於來自測試個體之第一生物樣品的資料構造122,所述資料構造122包括第一特徵量測124;●關於來自測試個體之第二生物樣品的資料構造126,所述資料構造126包括關於由獲自第二生物樣品之無細胞核酸量測的多個序列讀段128之資訊;●用於多種病原體中之每一病原體(例如病毒物種)的病原體目標參考130;以及●一組或多組資料集132,每一各別組資料集132包括有關各別組資料集之多位個體134的資訊,包含序列讀段128資料。
在各種實施方案中,一個或多個以上標識之元件係儲存於一個或多個先前提及之記憶體裝置中,且對應於用於執行以上描述之功能的一組指令。以上標識之模組、資料或程式(例如多組指令)不必作為獨立軟體程式、程序、資料集或模組實施,且因此這些模組及資料之各種子集可以組合或以其他方式再佈置於各種實施方案中。在一些實施方案中,非持續記憶體111視情況儲存一小組以上所標識之模組及資料結構。此外,在一些實施例中,記憶體亦儲存上文未描述之額外模組及資料結構。在一些實施例中,一個或多個以上標識之元件係儲存於除可視化系統100外之電腦系統中,其可由可視化系統100定址,使得在需要時可視化系統100可以擷取此類資料之全部或一部分。
儘管圖1描繪「系統100」,但該圖更多地旨在作為對可能存在 於電腦系統中之各種特徵之功能說明,而非作為本文所描述之實施方案的結構示意圖。實際上,且本領域中一般熟習此項技術者應認識到,單獨示出之物件可以組合且一些物件可以隔開。另外,儘管圖1描繪非持續記憶體111中之某些資料及模組,但該等資料及模組中之一些或全部可以存在於持續記憶體112中。
已參照圖1揭示根據本揭示案之系統,現將詳細說明根據本揭示案之方法。應瞭解,所揭示方法中之任一種可以利用以下中所揭示之分析或演算法中的任一種以便確定測試個體之癌症病況或所述個體患所述癌症病況之可能性:2017年10月25日提交的美國專利申請案第15/793,830號及/或國際申請日為2017年10月24日之國際專利公開案第PCT/US17/58099號,其各自以引用的方式併入本文中。舉例而言,所揭示方法中之任一種可以結合以下所揭示之方法或所揭示之演算法中的任一種起作用:2017年10月25日提交之美國專利申請案第15/793,830號,及/或國際申請日為2017年10月24日之國際專利公開案第PCT/US17/58099號。
I.單獨病原體負荷之偵測(例如使用靶向小組測序、全基因組測序或全基因組亞硫酸氫鹽測序)。 本揭示案之一個態樣提供一種基於源自一種或多種病原體之遺傳物質,在測試個體中篩查癌症病況的方法。所述方法包括自所述測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。在所述方法中,對所述第一生物樣品中之無細胞核酸進行測序(例如藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序等)以產生來自測試個體之多個序列讀段128。另外,在所述方法中,對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之病原體目標參考130中一序列的所述多個序列讀段之相應量,由此獲得一組序列讀段量。所述組序列讀段量中之每一各別序列讀段量係對應於所述組病原體中之相應病原體。在所述方法中,使用所述組序列讀段 量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。應瞭解,病原體目標參考130可以具有若干不同序列。在典型實施例中,來自所述測試個體之序列讀段只需映射至該等序列之一上,以便計數為映射至所述病原體目標參考中之序列上。因此,映射至所述病原體目標參考之序列1的來自測試個體之序列讀段1將貢獻映射至所述病原體目標參考之一序列上的序列讀段之量,映射至所述病原體目標參考之序列2的來自測試個體之序列讀段2亦然,而未映射至所述病原體目標參考之任何序列上的來自測試個體之序列讀段3將不會貢獻映射至所述病原體目標參考中一序列上的序列讀段之量。
在一些實施例中,所述方法包含關於測試個體中APOBEC誘導之突變標誌之存在的資訊。
在一些實施例中,所述方法依賴於靶向病毒小組。亦即,在此類實施例中,特定病原體之病原體目標參考130侷限於來自所述各別病原體之基因組的一組序列。在一些實施例中,特定病原體之病原體目標參考130侷限於來自所述各別病原體之基因組的100個或更少序列、50個或更少序列、或25個或更少序列。因此,在一些此類實施例中,所述各別病原體之病原體目標參考130由來自所述各別病原體之參考基因組的靶向小組序列組成且對於各別病原體,所述測定步驟限制所述多個序列讀段(來自目標個體)中每一序列讀段於來自所述各別病原體之參考基因組的相應靶向小組序列中的映射。
在一些實施例中,將所述組病原體各自之病原體目標參考130一起彙集至單一池中且在整個病原體組內同時執行映射至所述各別病原體之病原體目標參考130中一序列的步驟。在一些此類實施例中,使用獨立計數器追蹤來自目標個體之序列讀段與所述單一池病原體序列中之序列之間的匹配。
在一些實施例中,來自測試個體之序列讀段映射至各別病原體之病原體目標參考130中一序列包括(i)所述多個序列讀段(來自測試個體)之一個 或多個序列讀段與(ii)所述各別病原體之病原體目標參考130中一序列之間的序列比對。
在一些實施例中,來自測試個體之序列讀段映射至各別病原體之病原體目標參考130中一序列包括(i)所述多個序列讀段中之一個或多個中的序列讀段與(ii)所述各別病原體之病原體目標參考中一序列之間甲基化模式的比較。
在一些實施例中,所述方法依賴於全基因組測序。在一些此類實施例中,所述各別病原體之病原體目標參考包括各別病原體之參考基因組且對於所述組病原體中之每一各別病原體,測定映射至病原體目標參考之一序列的多個序列讀段之相應量對於所述各別病原體,使用所述各別病原體之完整參考基因組比對所述多個序列讀段中之每一序列讀段。
在一些實施例中,所述各別病原體之病原體目標參考130包括所述各別病原體之參考基因組的至少一部分(例如不到所述參考基因組之10%、不到所述參考基因組之25%、不到所述參考基因組之50%、不到所述參考基因組之90%、或在所述參考基因組之10%與90%之間等)。在此類實施例中,對於所述組病原體中之每一各別病原體,所述測定步驟使用所述各別病原體之完整參考基因組用映射至所述各別病原體之病原體目標參考130中一序列的多個序列讀段之相應量與所述多個序列讀段中之每一序列讀段比對。
在一些實施例中,所述方法依賴於全基因組亞硫酸氫鹽測序。在此類實施例中,對於所述組病原體中之每一各別病原體,測定步驟比較映射至所述各別病原體之病原體目標參考130中一序列的所述多個序列讀段之相應量,對於所述各別病原體,將所述多個序列讀段中一個或多個序列讀段之甲基化模式與所述各別病原體之參考基因組之全部或一部分的甲基化模式相比較。
在一些實施例中,所述組病原體係單一病原體。在替代性實施例 中,所述組病原體係多種病原體,且對於所述組病原體中之每一各別病原體,測定映射至病原體目標參考130中一序列的多個序列讀段之相應量係針對多種病原體中之每一各別病原體執行。在一些實施例中,所述組病原體包括在200種與500種之間之病原體、在2種與50種之間之病原體或在2種與30種之間之病原體。
在一些實施例中,所述組病原體包括圖12中所繪示之所有病原體或由其組成。在一些實施例中,所述組病原體包括圖12中所列病原體中之2種或更多種、3種或更多種、4種或更多種、5種或更多種、或6種或更多種,或由其組成。
A.將反映病原體負荷之量與參考/截止值相比較,其中使用訓練集構造特異性及靈敏度曲線。已揭示本揭示案之方法的概述,現將描述所述方法之具體實施例。因此,在一些實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括測定與第一分佈之預定百分位數有關的所述組病原體中之第一病原體的序列讀段之參考量。
在此類實施例中,參看圖13,第一組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈1302。在一些此類實施例中,此係基於映射至所述第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量,藉由將所述組個體中之每一各別個體映射至曲線圖1300之X軸上來進行。藉由將所有個體以此方式映射至X軸上,形成分佈1302,其中Y軸表示個體之數量且X軸表示映射至所述第一病原體之病原體目標參考130中一序列的來自每一各別個體之序列讀段的量。因此,在圖13中,每個框1306表示所述組個體中之各別個體。每一各別個體藉由將映射至所述第一病原體之病原體目標參考130中 一序列的來自所述各別個體之序列讀段的量放在曲線圖1300之X軸上表示映射至所述第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量之位置處貢獻第一分佈1302。由此,如圖13中所示,具有最少量的映射至所述第一病原體之病原體目標參考130中一序列的第一組中之序列讀段的個體1306-1位於分佈1302之一端處(在X軸之第一端)且具有最大量的映射至所述第一病原體之病原體目標參考130中一序列的所述組中之序列讀段的個體1306-2位於分佈1302之另一端(在X軸之第二端)。
在一些實施例中,所述第一組個體之第一部分中的每一個體皆患有所述癌症病況且所述第一組個體之第二部分中的每一個體皆未患所述癌症病況。在典型實施例中,生物樣品係自所述第一組個體中之每一各別個體獲得,且序列讀段係以與自測試個體獲得序列讀段相同的方式,自所述各別個體之第一生物樣品獲得。
在此類實施例中,將(i)第一量與(ii)第二量相比較,所述第一量係來自所述測試個體的映射至第一病原體之病原體目標參考130中一序列的多個序列讀段之量,所述第二量係與第一分佈之預定百分位數1304有關的所述組病原體中第一病原體之序列讀段的參考量。亦即,所述第二量被視為在分佈1302中直線1304之位置處的序列讀段之量。舉例而言,若序列讀段之量係沿圖13中X軸,以映射至病原體目標參考130之序列讀段相對於給定組個體中經測序之序列讀段之總數的百分比表示,則在X軸上直線1304處此百分比之值用作此第二量(與第一分佈之預定百分位數有關的所述組病原體中第一病原體之序列讀段的參考量)。
舉例而言,考慮序列讀段之量係以映射至病原體目標參考130之序列讀段相對於給定個體中經測序之序列讀段之總數的百分比表示的情形。亦即,圖13中之X軸表示序列讀段之百分比。又另外,來自目標個體之多個序列 讀段中有3%映射至特定病原體目標參考130上。又另外,第一組個體中之每一各別個體以上述方式,用映射至所述第一病原體之病原體目標參考130中一序列的來自各別個體之序列讀段的量(此處為百分比)貢獻第一分佈1302,由此產生圖13中所示的分佈1302。將與第一分佈之預定百分位數1304有關的量彙集,且在此實例中係百分之二。因此,第一量(來自目標個體的映射至病原體目標參考130之序列讀段的百分比)超過第二量(與分佈1302之預定百分位數有關的序列讀段之參考百分比)且認為所述測試個體患有癌症或所述測試個體有患癌症之可能性。
在一些實施例中,所述第一分佈之預定百分位數係基於所希望的目標特異性選擇。舉例而言,在一些實施例中,所述第一分佈之預定百分位數(例如分佈1302中直線1304之位置)係分佈1302之第80百分位數或更大、第85百分位數或更大、第90百分位數或更大、第95百分位數或更大、或第98百分位數或更大。以此方式,若來自所述測試個體的映射至病原體目標參考130之序列讀段的量超過此數目,則可知所述測試個體具有的映射至病原體目標參考130之序列讀段的量大於所述第一組個體中個體之預定百分位數。在一些實施例中,所述第一組個體中之所有個體皆患有所研究之癌症病況。
在一些實施例中,為了判定測試個體有患所述癌症病況之可能性或確定測試個體患有所述癌症病況,來自測試個體的映射至病原體目標參考130之序列讀段的量必須超過與所述第一分佈之預定百分位數有關的序列讀段之量臨限量,而非只需要來自測試個體的映射至病原體目標參考130之序列讀段的量超過與所述第一分佈之預定百分位數有關的序列讀段之參考量。舉例而言,在一些實施例中,除鑑別與所述第一分佈之預定百分位數有關的第一病原體之序列讀段的參考量外,亦測定偏離所述分佈中此參考量一定距離(例如在直線1308處)之序列讀段的量且來自測試個體的映射至病原體目標參考130之序列讀段 的量必須超過與分佈1302中此位置(例如在直線1308處)有關的序列讀段之量。在一些實施例中,此距離偏離在所述分佈中直線1304處序列讀段之參考量一個標準差、兩個標準差或三個標準差。
因此,在此類實施例中,除測定與第一分佈1302在直線1304處之預定百分位數有關的所述第一病原體之序列讀段的參考量外,亦取得與偏離序列讀段之此參考量1個標準差、2個標準差或3個標準差有關的第一病原體之序列讀段的量且來自測試個體的映射至病原體目標參考130之序列讀段的量必須超過與分佈1302中偏離序列讀段之此參考量一個標準差、兩個標準差或三個標準差之點有關的序列讀段之量。
擴展至多種病原體.在一些實施例中,所述方法擴展至多種病原體。在此類實施例中,參看圖13,第一組個體中之每一各別個體用映射至多種病原體中任何病原體之任何病原體目標參考130中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈1302。在此類實施例中,來自各別個體之序列讀段只需要映射至病原體目標參考之一的一個序列上,以便計數為映射至所述多種病原體中任何病原體之病原體目標參考中一序列上。因此,映射至病原體目標參考130-1之序列1的來自個體之序列讀段1將貢獻映射至任何病原體之病原體目標參考中一序列上的序列讀段之量,映射至病原體目標參考130-2之序列1上的來自測試個體之序列讀段2亦然,而未映射至多種病原體之任何病原體目標參考之任何序列上的來自所述個體之序列讀段3將不貢獻映射至任何病原體目標參考中之序列上的序列讀段之量。
在一些此類實施例中,此係基於映射至多種病原體中任何病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量,藉由將所述組個體中之每一各別個體映射至曲線圖1300之X軸上進行。藉由將所有個體以此方式映射至X軸上,形成分佈1302,其中Y軸表示個體之數量且X軸表 示映射至多種病原體之任何病原體目標參考130中一序列的來自每一各別個體之序列讀段的量。因此,使用圖13作為參考,在此類實施例中,每個框1306表示所述組個體中之各別個體。每一各別個體藉由將映射至多種病原體中任何病原體之病原體目標參考130中一序列的來自各別個體之序列讀段的量放在曲線圖1300之X軸上表示映射至多種病原體中任何病原體之病原體目標參考130中一序列的來自各別個體之序列讀段的量的位置處貢獻第一分佈1302。由此,如圖13中所示,具有最少量的映射至多種病原體中任何病原體之病原體目標參考130中一序列的第一組中之序列讀段的個體1306-1係位於分佈1302之一端處(在X軸之第一端)且具有最大量的映射至多種病原體中任何病原體之病原體目標參考130中一序列的所述組中之序列讀段的個體1306-2位於分佈1302之另一端處(在X軸之第二端)。
在此類實施例中,將(i)第一量與(ii)第二量相比較,所述第一量係來自所述測試個體的映射至多種病原體中任何病原體之病原體目標參考130中一序列的多個序列讀段之量,所述第二量係與第一分佈之預定百分位數1304有關的所述多種病原體中任何病原體之序列讀段的參考量。亦即,所述第二量被視為在分佈1302中直線1304之位置處的序列讀段之量。舉例而言,若序列讀段之量係沿圖13中之X軸,以映射至多種病原體中任何病原體之任何病原體目標參考130的序列讀段相對於給定組個體中經測序之序列讀段之總數的百分比表示,則在x軸上直線1304處此百分比之值用作此第二量(與第一分佈之預定百分位數有關的映射至多種病原體中任何病原體之病原體目標參考130之一序列的序列讀段之參考量)。
舉例而言,考慮序列讀段之量以映射至多種病原體中任何病原體之病原體目標參考130的序列讀段相對於給定個體中經測序之序列讀段之總數的百分比表示的情形。亦即,圖13中之X軸表示映射至多種病原體中之任一個 之序列的序列讀段之百分比。又另外,來自目標個體之多個序列讀段中有百分之三映射至多種病原體之病原體目標參考130中的序列。又另外,第一組個體中之每一各別個體以上述方式用映射至多種病原體中任一個之病原體目標參考130中一序列的來自各別個體之序列讀段的量(此處為百分比)貢獻第一分佈1302,由此產生圖13中所示之分佈1302。將與第一分佈之預定百分位數1304有關的量彙集,且在此實例中係百分之二。因此,第一量(來自目標個體的映射至病原體目標參考130之序列讀段的百分比)超過第二量(與分佈1302之預定百分位數有關的序列讀段之參考百分比)且認為所述測試個體患有癌症或所述測試個體有患癌症之可能性。
B.將正規化病原體負荷與參考/截止值相比較,其中使用訓練集及對照健康集。在一些實施例中,藉由健康集中健康樣品中之某一百分位數將病原體負荷正規化以呈現每一病原體類型之正規化病毒負荷。圖8及11示出使用病毒負荷、如本文所描述之臨限值確定癌症類型及分期。在一些實施例中,接著對所述正規化負荷求和以提供總體病原體負荷。使用所述訓練集構造特異性及靈敏度曲線(例如其中x軸表示總體病原體負荷值或給定病原體之正規化負荷值)。參考/截止值係基於所希望的目標特異性選擇。
在一些此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括測定與分佈之預定百分位數(例如90%、95%、98%或另一適合百分比)有關的所述組病原體中第一病原體之序列讀段的參考量。未患所述癌症病況的一組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量貢獻所述分佈。
在此類實施例中,參看圖14,未患所述癌症病況的所述組個體中之每一各別個體用映射至第一病原體之病原體目標參考130中一序列的來自所 述各別個體之序列讀段的量貢獻分佈1402。在一些此類實施例中,此係基於映射至所述第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量,藉由將所述組個體中之每一各別個體映射至曲線圖1400之X軸上來進行。藉由將所有個體以此方式映射至X軸上,形成分佈1402,其中Y軸表示個體之數量且X軸表示映射至所述第一病原體之病原體目標參考130中一序列的來自每一各別個體之序列讀段的量。因此,在圖14中,每個框1406表示第一組個體中之各別個體。每一各別個體藉由將映射至所述第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量放在曲線圖1400之X軸上表示映射至所述第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量之位置處貢獻第一分佈1402。由此,如圖14中所示,具有最少量的映射至所述第一病原體之病原體目標參考130中一序列的第一組中之序列讀段的個體1406-1位於分佈1402之一端處(在X軸之第一端)且具有最大量的映射至所述第一病原體之病原體目標參考130中一序列的所述組中之序列讀段的個體1406-2位於分佈1402之另一端(在X軸之第二端)。
藉由與分佈1402之預定百分位數1404有關的所述組病原體中第一病原體之序列讀段的參考量對來自所述測試個體的映射至所述第一病原體之病原體目標參考中一序列的多個序列讀段之量定限,由此形成所述多個序列讀段的按比例調整之量。
舉例而言,所述參考量被視為在分佈1402中直線1404之位置處的序列讀段之量。舉例而言,若序列讀段之量係沿圖14中之X軸,以映射病原體目標參考130之序列讀段相對於給定組個體中經測序之序列讀段之總數的百分比表示,則在X軸上直線1404處之此百分比的值用作此參考量。舉例而言,考慮序列讀段之量係以映射至病原體目標參考130之序列讀段相對於給定個體中經測序之序列讀段之總數的百分比表示的情形。亦即,圖14中之X軸表示序 列讀段之百分比。又另外,來自目標個體之多個序列讀段中有百分之三映射至特定病原體目標參考130上。又另外,所述組個體中之每一各別個體以上述方式,用映射至所述第一病原體之病原體目標參考130中一序列的來自各別個體之序列讀段的量(此處為百分比)貢獻第一分佈1402,由此產生圖14中所示的分佈1402。將與分佈1402之預定百分位數1404有關的量彙集,且在此實例中係百分之二。因此,在本實例中,來自測試個體的映射至第一病原體之病原體目標參考中一序列的多個序列讀段之量(百分之三)係藉由與第一分佈之預定百分位數(百分之二)有關的所述組病原體中之第一病原體的序列讀段之參考量定限(例如正規化),由此形成所述多個序列讀段的按比例調整之量(百分之三/百分之二,或1.5%)。
在典型實施例中,生物樣品係自所述第一組個體中之每一各別個體獲得,且序列讀段係以與自測試個體獲得序列讀段相同的方式,自所述各別個體之第一生物樣品獲得。將(i)所述多個序列讀段的按比例調整之量與(ii)與第二分佈之預定百分位數有關的所述多個序列讀段之按比例調整之量相比較。
此第二分佈之實例繪示於圖15中。第二組個體中之每一各別個體1506用映射至所述第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的按比例調整之量貢獻第二分佈1502。所述第二組中之第一部分個體中的每一個體皆患有所述癌症病況且所述第二組中之第二部分個體中的每一個體皆未患所述癌症病況。
在此類實施例中,參看圖15,第二組個體中之每一各別個體用映射至第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量貢獻分佈1502。在一些此類實施例中,此係基於映射至第一病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量,藉由將第二組個體中之每一各別個體映射至曲線圖1500之X軸上進行。
在替代性實施例中,在藉由與分佈1402之預定百分位數1404有關的第一病原體之序列讀段的參考量按比例調整映射至第一病原體之病原體目標參考130中一序列的來自各別個體之序列讀段的量後,基於此量,藉由將第二組個體中之每一各別個體映射至曲線圖1500之X軸上來進行此操作。
藉由將所有個體以此方式映射至X軸上,形成分佈1502,其中Y軸表示個體之數量且X軸表示映射至第一病原體之病原體目標參考130中一序列的來自第二組中每一各別個體之序列讀段的量(或序列讀段之按比例調整之量)。因此,在圖15中,每個框1506表示第二組個體中之各別個體。每一各別個體藉由將映射至第一病原體之病原體目標參考130中一序列的來自各別個體之序列讀段的量(或按比例調整之量)放在曲線圖1500之X軸上表示映射至所述第一病原體之病原體目標參考130中一序列的來自各別個體之序列讀段的量(或按比例調整之量)的位置處,貢獻第二分佈1502。由此,如圖15中所示,具有最少量的映射至所述第一病原體之病原體目標參考130中一序列的第二組中之序列讀段的個體1506-1位於分佈1502之一端處(在X軸之第一端)且具有最大量的映射至所述第一病原體之病原體目標參考130中一序列的第二組中之序列讀段的個體1506-2位於分佈1502之另一端(在X軸之第二端)。
在一些此類實施例中,當來自測試個體之多個序列讀段的按比例調整之量超過與第二分佈之預定百分位數有關的多個序列讀段之按比例調整之量第一預定截止值時,認為所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性。舉例而言,若所述預定百分位數與直線1504相關,則將對應於直線1504的序列讀段之量用作與第二分佈之預定百分位數有關的多個序列讀段之按比例調整之量。
擴展至多種病原體.在一些實施例中,所述方法擴展至多種病原體。在一些實施例中,實現此目的之一種方式係測定與相應分佈之預定百分位數 有關的多種病原體中每一各別病原體之序列讀段的參考量。如以上參照圖14所論述,未患所述癌症病況的一組個體中之每一各別個體用映射至第一病原體之病原體目標參考130中一序列的來自各別個體之序列讀段的量貢獻分佈。亦對第二病原體執行此程序。舉例而言,未患所述癌症病況的所述組個體中之每一各別個體用映射至第二病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量貢獻與圖14之分佈1402類似的分佈。在一些此類實施例中,此係基於映射至第二病原體之病原體目標參考130中一序列的來自所述各別個體之序列讀段的量,藉由將所述組個體中之每一各別個體映射至曲線圖,如曲線圖1400之X軸上進行。藉由將所有個體以此方式映射至X軸上,形成分佈,其中一個軸表示個體之數量且另一個軸表示映射至第二病原體之病原體目標參考130中一序列的來自每一各別個體之序列讀段的量。藉由與所述分佈之預定百分位數有關的第二病原體之序列讀段的參考量對來自所述測試個體的映射至第二病原體之病原體目標參考中一序列的多個序列讀段之量定限,由此形成所述第二病原體之多個序列讀段的按比例調整之量。
在此類實施例中,將(i)來自測試個體的多種病原體中每一病原體之多個序列讀段的按比例調整之量的總和與(ii)與第二分佈之預定的有關的按比例調整之量相比較。對於此第二分佈,第二組個體中之每一各別個體用以與針對測試個體所進行相同之方式計算的按比例調整之量的總和貢獻第二分佈1502。亦即,藉由來自各別病原體之第一分佈的參考量對映射至各別病原體之病原體目標參考之序列讀段的來自第二組中每一各別個體之序列讀段的量進行正規化,且各別個體之各別按比例調整之量的總和貢獻第二分佈。當來自測試個體的多種病原體中每一病原體之多個序列讀段的按比例調整之量的總和超過與第二分佈之預定百分位數有關的多個序列讀段之按比例調整之量時,認為測試個體患有所述癌症病況或有患所述癌症病況的可能性。
C.使用來自訓練集中每一個體之量或來自訓練集中每一個體的正規化之病原體負荷值作為二項或多項分類演算法中之輸入。在一些此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括將所述組序列讀段量施加至分類器,由此確定(i)測試個體是否患有癌症病況或(ii)測試個體患所述癌症病況的可能性。
在一些此類實施例中,藉由對於第一組個體中之每一各別個體,將映射至所述組病原體中各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量輸入所述分類器中,預先訓練所述分類器。在一些此類實施例中,藉由對於第一組個體中之每一各別個體,將映射至多種病原體中每一各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段(例如存在於所述多種病原體中每一各別病原體中之序列)的量輸入分類器中,預先訓練分類器。第一組中之第一部分個體中的每一個體皆患有所述癌症病況且所述第一組中之第二部分個體中的每一個體皆未患所述癌症病況。
在替代性實施例中,藉由對於第一組個體中每一各別個體,將映射至所述組病原體中各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的正規化量輸入所述分類器中,預先訓練所述分類器。在此類實施例中,所述第一組中之第一部分個體中的每一個體皆患有所述癌症病況。所述第一組中之第二部分個體中的每一個體皆未患所述癌症病況。
藉由根據與相應分佈之預定百分位數有關的各別病原體之序列讀段的參考量使映射至各別病原體之病原體目標參考中一序列的來自第一組各別個體之序列讀段之量正規化,獲得映射至所述各別病原體之病原體目標參考中一序列的來自第一組各別個體之序列讀段的正規化量。未患所述癌症病況的第二組個體中之每一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段之量貢獻相應分佈。
舉例而言,考慮所述組病原體包括兩種病原體之情形。藉由根據與圖16之第一分佈1602之預定百分位數有關的第一病原體之序列讀段的參考量使映射至第一病原體之病原體目標參考中一序列的來自第一組各別個體之序列讀段之量正規化,獲得映射至所述第一病原體之病原體目標參考中一序列的來自第一組各別個體之序列讀段的正規化量。未患所述癌症病況的第二組個體中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段之量貢獻第一分佈。與圖16中第一分佈1602之預定百分位數有關的第一病原體之序列讀段的參考量係在該分佈之直線1604處的第一病原體之序列讀段的量。
藉由根據與圖17中第二分佈1702之預定百分位數有關的第二病原體之序列讀段的參考量使映射至第二病原體之病原體目標參考中一序列的來自第一組各別個體之序列讀段之量正規化,獲得映射至所述第二病原體之病原體目標參考中一序列的來自第一組各別個體之序列讀段的正規化量。未患所述癌症病況的第二組個體中之每一各別個體用映射至第二病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第二分佈。與圖17中第二分佈1702之預定百分位數有關的第二病原體之序列讀段的參考量係在該分佈之直線1704處的第二病原體之序列讀段的量。
此類方法可以擴展至所述組病原體中之多種病原體。
在一些實施例中,分類器係二項分類器。在一些實施例中,分類器係基於邏輯斯蒂回歸演算法。在一些此類實施例中,邏輯斯蒂回歸演算法提供所述測試個體患或未患所述癌症病況的可能性。在一些實施例中,所述邏輯斯蒂回歸演算法提供有關所述測試個體患有抑或未患所述癌症病況的二項評估。
在一些實施例中,分類器係提供多種可能性之邏輯斯蒂回歸演算法。所述多種可能性中之每一各別可能性係所述測試個體患多種癌症病況中之 相應癌症病況的可能性。另外,所述多種癌症病況包含所述癌症病況。
在一些實施例中,分類器係多項分類器。在一些此類實施例中,所述分類器係基於邏輯斯蒂回歸演算法、神經網路演算法、支援向量機(SVM)演算法或決策樹演算法。
邏輯斯蒂回歸演算法揭示於Agresti,《分類資料分析引論(An Introduction to Categorical Data Analysis)》,1996,第5章,第103-144頁,John Wiley & Son,New York中,其以引用的方式併入本文中。
所揭示之神經網路演算法,包含迴旋神經網路演算法,參見Vincent等人,2010,《機器學習研究雜誌(J Mach Learn Res)》11,第3371-3408頁;Larochelle等人,2009,《機器學習研究雜誌》10,第1-40頁;以及Hassoun,1995,《人工神經網路原理(Fundamentals of Artificial Neural Networks)》,麻省理工學院(Massachusetts Institute of Technology),其各自以引用的方式併入本文中。
SVM描述於以下中:Cristianini及Shawe-Taylor,2000,「支援向量機引論(An Introduction to Support Vector Machines)」,Cambridge University Press,劍橋(Cambridge);Boser等人,1992,「用於最優間隔分類器之訓練演算法(A training algorithm for optimal margin classifiers)」,《第5屆ACM計算學習理論研討會會議記錄(Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory)》,ACM Press,賓夕法尼亞州匹茲堡(Pittsburgh,Pa.),第142-152頁;Vapnik,1998,《統計學習理論(Statistical Learning Theory)》,紐約懷利(Wiley,New York);Mount,2001,《生物信息學:序列及基因組分析(Bioinformatics:sequence and genome analysis)》,Cold Spring Harbor Laboratory Press,紐約冷泉港(Cold Spring Harbor,N.Y.);Duda,《模式分類(Pattern Classification)》,第二版,2001,John Wiley&Sons,Inc.,第259、262-265頁;以及 Hastie,2001,《統計學習精要(The Elements of Statistical Learning)》,Springer,紐約;以及Furey等人,2000,《生物信息學(Bioinformatics)》16,906-914,其各自以全文引用的方式併入本文中。當用於分類時,SVM利用距經標記資料最遠之超平面將一組給定的二元標記之資料訓練集分開。對於可能不存在線性分離之情形,SVM可以與『內核函數(kernels)』技術組合起作用,該技術自動地實現特徵空間之非線性映射。SVM在特徵空間中發現之超平面對應於輸入空間中之非線性決策邊界。
決策樹大體上描述於Duda,2001,《模式分類》,John Wiley&Sons,Inc.,紐約,第395-396頁,其以引用的方式併入本文中。基於樹之方法將特徵空間分割成一組矩形,且接著在每一矩形中擬合模型(如常量)。在一些實施例中,決策樹係隨機森林回歸。可以使用的一種特定演算法係分類與回歸樹(classification and regression tree,CART)。其他特定的決策樹演算法包含但不限於ID3、C4.5、MART及隨機森林。CART、ID3及C4.5描述於Duda,2001,《模式分類》,John Wiley&Sons,Inc.,紐約,第396-408頁及第411-412頁中,其以引用的方式併入本文中。CART、MART及C4.5描述於Hastie等人,2001,《統計學習精要》,Springer-Verlag,紐約,第9章中,其以全文引用的方式併入本文中。隨機森林描述於Breiman,1999,《技術報告(Technical Report)567》,Statistics Department,U.C.Berkeley,1999年9月中,其以全文引用的方式併入本文中。
D.病原體負荷分析結合病原體特異性標誌之存在用於偵測測試個體之癌症病況。在一些實施例中,所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之各別病原體有關之序列片段標誌存在抑或不存在的指示。在此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性使用關於與所述各別病原體有關之標誌片段標誌存在抑或不存在之指示以及所述組序列讀段量確定所 述測試個體是否患有所述癌症病況或測試個體患所述癌症病況之可能性。
病原體負荷分析結合甲基化標誌之存在用於偵測癌症病況。如本文所揭示,甲基化標誌可以在病原體源性片段或測試個體源性片段內。在一些此類實施例中,所述方法包括評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關之甲基化標誌存在抑或不存在的指示。在一些此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性使用關於與第一病原體有關之甲基化標誌存在抑或不存在之指示以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況之可能性。
在一個態樣中,病原體負荷分析係結合病原體特異性標誌之存在且進一步結合用於癌症偵測之甲基化標誌(例如用於複本數變異分析之標誌、用於體細胞突變分析之標誌或用於甲基化分析之標誌)的存在執行。在一些實施例中,所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關之序列片段標誌存在抑或不存在的指示。另外,評價所述多個序列讀段以獲得關於與第一病原體有關之甲基化標誌存在抑或不存在的指示。另外,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性使用(i)關於與第一病原體有關之序列片段標誌存在抑或不存在的指示、(ii)關於與第一病原體有關之甲基化標誌存在抑或不存在的指示及(iii)所述組序列讀段量以確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括執行分析,所述分析包括量測第一生物樣品中之無細胞核酸之第一特徵的量。在此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括使用第一特徵之量及所述組序列讀段量確定所述測試個 體是否患有癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,執行分析,所述分析包括量測第二生物樣品中之無細胞核酸之第一特徵的量。在此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性包括使用第一特徵之量及所述組序列讀段量確定所述測試個體是否患有癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,所述癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。在一些此類實施例中,所述癌症病況係早期癌症。
在一些實施例中,所述癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。在一些此類實施例中,所述癌症病況係晚期癌症。
在一些實施例中,所述癌症病況係液體癌症、肝癌或肺癌。
在一些實施例中,第一生物樣品係血漿。在一些實施例中,第一生物樣品包括測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。在一些實施例中,第一生物樣品由測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液組成。
在一些實施例中,所述組病原體中之各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
在一些實施例中,所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。在一些實施例中,所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
在一些實施例中,第一組包括20或100位個體。在一些實施例中,第一組包括20或100位個體,且第一組中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自各別個體之序列讀段的百分比貢獻第一分佈。
在一些實施例中,映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段之量係由所述各別個體量測的與所述各別病原體之病原體目標參考中一序列比對的多個序列讀段之百分比。
在一些實施例中,映射至各別病原體之病原體目標參考中一序列的多個序列讀段之量係來自測試個體之多個序列讀段的百分比。
在一些實施例中,來自所述各別個體之序列讀段的量係由所述各別個體量測的映射至第一病原體之病原體目標參考中一序列的序列讀段之百分比。在一些實施例中,第一分佈之預定百分位數係第95或第98百分位數。在一些實施例中,第一預定截止值係零。在一些實施例中,第一預定截止值係與第二分佈之集中趨勢的量測值相差一個、兩個或三個標準差。
在一些實施例中,所述組病原體包括第一病原體及第二病原體,且所述測定包括i)測定映射至第一病原體之第一病原體目標參考中一序列的多 個序列讀段之第一量,及ii)測定映射至第二病原體之第二病原體目標參考中一序列的多個序列讀段之第二量。在此類實施例中,所述方法進一步包括藉由與第一分佈之第一預定百分位數有關的第一病原體之序列讀段的第一參考量對映射至第一病原體目標參考中一序列的來自所述測試個體之多個序列讀段的第一量定限,由此形成來自所述測試個體之多個序列讀段的按比例調整之第一量,其中未患所述癌症病況的第一組個體中之每一各別個體用映射至第一病原體之第一病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈。所述方法進一步包括藉由與第二分佈之第二預定百分位數有關的第二病原體之序列讀段的第二參考量對映射至第二病原體目標參考中一序列的來自所述測試個體之多個序列讀段的第二量定限,由此確定來自所述測試個體之多個序列讀段的按比例調整之第二量,其中未患所述癌症病況的第二組個體中之每一各別個體用映射至所述第二病原體之第二病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第二分佈。在此類實施例中,當至少輸入按比例調整之第一量及按比例調整之第二量的分類器指示測試個體患有所述癌症病況時,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性認為所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性。在一些此類實施例中,所述分類器係基於邏輯斯蒂回歸演算法,其中所述邏輯斯蒂回歸基於在包含患有所述癌症病況之個體及未患所述癌症病況之個體的訓練組個體中所觀察到的映射至第一病原體目標參考中一序列之序列讀段的量單獨地對按比例調整之第一量進行加權,且所述邏輯斯蒂回歸基於在所述訓練組中所觀察到的映射至第二病原體目標參考中一序列之序列讀段的量單獨地對按比例調整之第二量進行加權。
在一些實施例中,所述測定步驟包括基於與各別分佈之預定百分位數有關的序列讀段之量對映射至所述各別病原體之病原體目標參考中一序列 的多個序列讀段之相應量定限。未患所述癌症病況的各別組個體中之每一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻所述各別分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之各別量。在此類實施例中,當至少輸入來自測試個體之多個序列讀段的每一按比例調整之各別量的分類器指示所述測試個體患有所述癌症病況時,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性認為所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況之可能性。在一些此類實施例中,所述分類器係基於邏輯斯蒂回歸演算法,其基於在訓練組個體中所觀察到的映射至相應病原體之病原體目標參考中一序列的序列讀段之相應量,單獨地對多個序列讀段的每一按比例調整之各別量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。在一些此類實施例中,所述組病原體包括在2種與100種之間的病原體。
在一些實施例中,所述分類器係基於邏輯斯蒂回歸演算法、神經網路演算法、支援向量機演算法或決策樹演算法,所述演算法已針對訓練組個體進行訓練,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。
在一些實施例中,所述測定步驟包括基於與各別分佈之預定百分位數有關的序列讀段之量對映射至所述各別病原體之病原體目標參考中一序列的來自所述測試個體之多個序列讀段之相應量定限,其中未患所述癌症病況的各別組個體中之每一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻所述各別分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之各別量。在此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述 癌症病況的可能性對來自測試個體之多個序列讀段的每一按比例調整之各別量求和以確定總體腫瘤病原體負荷且當所述總體腫瘤病原體負荷滿足臨限截止值條件時,指示所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性。
在一些實施例中,當所述組序列讀段量超過臨限截止值條件時,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性判定所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性,所述臨限截止值條件係關於一組未患所述癌症病況之個體測定的所述組病原體之總體腫瘤病原體的預定特異性(例如第95百分位數)。
在一些實施例中,測定映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量包括在閱讀框架中轉譯來自所述測試個體之多個序列讀段以形成多個轉譯之序列讀段並將所述多個轉譯之序列讀段與所述病原體目標參考中每一序列之轉譯相比較。
在一些實施例中,測定映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量包括在核酸、核糖核酸或蛋白質空間中對來自所述測試個體之多個序列讀段與所述病原體目標參考進行k聚體匹配。示例k聚體分析揭示於Sievers等人,2017,《基因(Genes)》8,122中。
在一些實施例中,所述測試個體係人。在一些實施例中,所述方法進一步包括對人類基因組內多個序列讀段之相應量執行終點分析。在此類實施例中,使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性進一步使用所述終點分析確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所揭示之方法中的任一種進一步包括基於確定 所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性對測試個體提供治療性干預或成像。
II.結合另一類型分析偵測病毒負荷。 以上第I節中已揭示在測試個體中篩查癌症病況之方法。本節提供在測試個體中篩查癌症病況之其他方法。在本節中,將第I節中所描述之分析或方法中的任一種與量測測試個體中之第一特徵的另一分析組合以便在測試個體中篩查所述癌症病況。另外,本節提供有關癌症病況之類型、序列讀段之類型的更多細節及可用於以上第I節之方法中的其他實驗細節。
參看圖2A之區塊202-213,在一些實施例中,在測試個體中篩查癌症病況之方法係在電腦系統,諸如圖1之系統100中執行,該系統具有一個或多個處理器102及儲存由該一個或多個處理器執行之一個或多個程式,諸如病況評價模組120之記憶體111/112。
參看區塊204,在一些實施例中,測試個體係人。在一些實施例中,測試個體係哺乳動物。在一些實施例中,測試個體係任何存活或無生命生物體,包含但不限於人(例如男性、女性、胎兒、孕婦、兒童或類似人群)、非人類動物、植物、細菌、真菌或原生生物。在一些實施例中,測試個體係哺乳動物、爬行動物、禽類、兩棲動物、魚類(例如斑馬魚)、有蹄類動物、反芻動物、牛科動物(例如牛)、馬科動物(例如馬)、山羊科動物及綿羊科動物(例如綿羊、山羊)、豬類(例如豬)、駱駝類(例如駱駝、大羊駝、羊駝)、非人類靈長類動物(例如大猩猩、黑猩猩、紅毛猩猩、狐猴、狒狒、等)、熊科動物(例如熊)、家禽、犬、貓、小鼠、豚鼠、倉鼠、大鼠、海豚、鯨及鯊魚。在一些實施例中,所述個體係實驗室或農場動物,或來源於本文所揭示之生物體的細胞樣品。在一些實施例中,測試個體係任何階段之雄性或雌性(例如男性、女性或兒童)。
獲取樣品或藉由本文所描述之方法或組合物中之任一種治療的 測試個體可具有任何年齡且可以為成人、嬰兒或兒童。在一些情況下,所述個體,例如患者係0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99歲,或在其中之範圍內(例如在約2歲與約20歲之間、在約20歲與約40歲之間或在約40歲與約90歲之間)。特定種類之個體,例如可以得益於本揭示案之方法的患者係超過40歲的個體,例如患者。
另一特定種類之個體,例如可以得益於本揭示案之方法的患者係可能有較高慢性心臟症狀風險之兒科患者。另外,個體,例如獲取樣品或藉由本文所描述之方法或組合物中之任一種治療的患者可以為雄性或雌性。
參看區塊206,在一些實施例中,所述癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。參看區塊208以及圖11,在一些此類實施例中,所述癌症病況係早期癌症。圖11揭示使用本揭示案之方法鑑別該等病況,所述方法係結合圖2揭示及描述。
參看區塊210,在一些實施例中,所述癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。參看區塊212以及圖11,在一些此類實施例中,所述癌症病況係晚期癌症。圖11揭示使用本揭示案之方法鑑別該等病況,所述方法係結合圖2揭示及描述。
參看圖2A之區塊213,在一些實施例中,所述癌症病況係液體癌症、肝癌或肺癌。
參看圖2A之區塊214,在本揭示案中,自測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。
在一些實施例中,第一生物樣品包括個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。在此類實施例中,第一生物樣品可以包含個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液以及個體之其他組分(例如實體組織等)。生物樣品可以侵入性(例如手術手段)或非侵入性(例如抽取血液、拭子或收集排出之樣品)方式自測試個體獲得。
在一些實施例中,生物樣品由個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液組成。在此類實施例中,生物樣品限於個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液且不含有個體之其他組分(例如實體組織等)。
在一些實施例中,以2019年4月16日提交的題為「用於測定腫瘤中無細胞核酸百分數的系統及方法(Systems and Methods for Determining Tumor Fraction in Cell-Free Nucleic Acid)」之國際專利申請案第PCT/US2019/027756號中所揭示之方式中的任一種,對生物樣品進行加工以提取無細胞核酸以製備用於測序分析,該案以引用的方式併入本文中。
在一些實施例中,自第一生物樣品獲得的無細胞核酸係呈本揭示案中所定義之核酸的任何形式,或其組合。舉例而言,在一些實施例中,自生物樣品獲得的無細胞核酸係RNA及DNA之混合物。
區塊215-223.參看區塊215,執行第一分析,所述第一分析包括量測第一生物樣品中之無細胞核酸之第一特徵的量。參看區塊216,在一些此類 實施例中,測試個體係人且第一特徵係人類基因組中之靶向小組基因中的體細胞複本數變化計數。有關測定體細胞複本數變化計數之揭示內容,參見例如2013年3月13日提交的美國專利申請案第13/801,748號,其以引用的方式併入本文中。在一些實施例中,參看區塊217,靶向小組基因由20個基因至600個基因組成。
在一些實施例中,藉由第一分析量測之第一特徵係與預定基因組位置有關之單核苷酸變異體、與預定基因組位置有關之插入突變、與預定基因組位置有關之缺失突變、體細胞複本數變化、與預定基因組基因座有關之核酸重排或與預定基因組位置有關之異常甲基化模式。在一些此類實施例中,此第一特徵係使用2018年4月16日提交的題為「使用無細胞核酸中變異體之頻率對個體分類之系統及方法(Systems and Methods for Classifying Subjects Using Frequencies of Variants In Cell-Free Nucleic Acid)」之美國專利申請案第62/658,479號中所揭示之方法中的任一種鑑別,該案以引用的方式併入本文中。
在一些實施例中,第一特徵與由A分數分類器所進行之判定相關,本文描述基於非同義突變之靶向測序分析的腫瘤突變負荷之分類器。舉例而言,分類分數(例如「A分數」)可以使用對腫瘤突變負荷資料進行邏輯斯蒂回歸來計算,其中每一個體之腫瘤突變負荷的估計值係自靶向cfDNA分析獲得。在一些實施例中,腫瘤突變負荷可以每一個體之變異體總數估計,該等變異體係:判定為cfDNA中之候選變異體,通過雜訊建模及聯合判定及/或發現在重疊所述變異體之任何基因註釋中為非同義。訓練集之腫瘤突變負荷數量可以饋送至懲罰邏輯斯蒂回歸分類器中以確定使用交叉驗證實現95%特異性時之截止值。交叉驗證操作之實例示於圖6中。有關A分數之其他細節可見於例如Chaudhary等人,2017,《臨床腫瘤學雜誌(Journal of Clinical Oncology)》,35(5),增刊e14529,其以全文引用的方式併入本文中。
在一些實施例中,第一特徵與由2018年3月13日提交的題為「用於選擇、處理及分析高維度資料之方法及系統(Method and System for Selecting,Managing,and Analyzing Data of High Dimensionality)」之美國專利申請案第62/642,461號中所述之B分數分類器所進行之判定有關,該案以引用的方式併入本文中。根據B分數方法,分析在低變化區域中來自參考組健康個體中之健康個體的核酸樣品之第一組序列讀段。因此,將來自每一健康個體之核酸樣品的第一組序列讀段中之每一序列讀段與參考基因組中之區域比對。由此,選擇由來自訓練組中個體之核酸樣品的序列讀段構成的序列讀段訓練集。將訓練集中之每一序列讀段與自參考集鑑別的參考基因組中之低變化區域中的區域比對。訓練集包含來自健康個體之核酸樣品的序列讀段以及來自已知患有癌症之患病個體之核酸樣品的序列讀段。來自訓練組之核酸樣品屬於與來自參考組健康個體之核酸樣品相同或類似之類型。由此,使用由訓練集之序列讀段得到的量,即反映訓練組內來自健康個體之核酸樣品的序列讀段與來自患病個體之核酸樣品的序列讀段之間之差異的一個或多個參數確定其類型。接著,接收與包括來自癌症狀態未知之測試個體之cfDNA片段的核酸樣品有關的序列讀段測試集,並基於所述一個或多個參數確定所述測試個體患所述癌症之可能性。
在一些實施例中,第一特徵與由2018年3月13日提交的題為「甲基化片段異常偵測(Methylation Fragment Anomaly Detection)」之美國專利申請案第62/642,480號中所述之M分數分類器所進行之判定有關,該案以引用的方式併入本文中。
在一些實施例中,第一特徵係由2017年10月25日提交之美國專利申請案第15/793,830號,及/或國際申請日為2017年10月24日之國際專利公開案第PCT/US17/58099號中所揭示之方法或演算法中的任一種獲得,各案以引用的方式併入本文中。在一些實施例中,靶向小組基因由介於2個與30個之 間之基因、5個與50個之間之基因、10個與100個之間之基因、30個與500個之間之基因或50個與1000個之間之基因組成。
參看圖2B之區塊218,在一些實施例中,測試個體係人且第一特徵係人類基因組中之體細胞複本數變化計數。參看圖2B之區塊220,在一些實施例中,測試個體係人且第一特徵係人類基因組中之靶向小組基因的單核苷酸變異體計數、插入突變計數、缺失突變計數或核酸重排計數。
在一些此類實施例中,所述個體係人且多個序列讀段係自第一生物樣品獲取,作為靶向血漿分析之一部分。亦即,第一生物樣品係來自測試個體之血漿並將所述序列讀段與靶向血漿分析之靶向小組基因相比較以便鑑別變異體。在一些此類實施例中,靶向小組基因係在450個與500個基因之間。在一些實施例中,靶向小組基因係在500±5個基因之範圍內、在500±10個基因之範圍內或在500±25個基因之範圍內。在一些實施例中,自第一生物樣品獲取的序列讀段對於此靶向小組基因具有至少50,000x覆蓋率,對於此靶向小組基因具有至少55,000x覆蓋率,對於此靶向小組基因具有至少60,000x覆蓋率或對於此靶向小組基因具有至少70,000x覆蓋率。在一些此類實施例中,靶向血漿分析尋找靶向小組基因中之單核苷酸變異體、靶向小組基因中之插入、靶向小組基因中之缺失、靶向小組基因中之體細胞複本數變化(SCNA)或影響靶向小組基因之重排。因此,在一些實施例中,參看圖2B之區塊223,測試個體係人且第一特徵係人類基因組中之單核苷酸變異體計數、插入突變計數、缺失突變計數或核酸重排計數。
在一些實施例中,採取步驟以確保每一序列讀段表示生物樣品中之無細胞核酸中的特有核酸片段。取決於所用測序方法,每一此類特有核酸片段可由所得初始序列讀段中之多個序列讀段(例如PCR複製產物)表示。在典型實例中,使用多路複用測序技術,諸如條形碼解析無細胞核酸中之特有核酸片段 的所述序列讀段冗餘以獲得本揭示案之方法中所使用的最終多個序列讀段,以使得最終多個序列中之每一序列讀段獨特地表示生物樣品中之無細胞核酸中的相應特有核酸片段。參見Kircher等人,2012,《核酸研究(Nucleic Acids Research)》40,第1 e3號,其以引用的方式併入本文中,例如有關條形碼之揭示內容。在一些實施例中,此類映射僅允許完美匹配。在一些實施例中,此類映射允許一定錯配。在一些實施例中,使用程式諸如Bowtie 2執行此類映射。例如,有關此類映射之揭示內容,參見例如Langmead及Salzberg,2012,《自然-方法(Nat Methods)》9,第357-359頁。在一些實施例中,使用De Bruijn組譯程式進行此類映射。在一些靶向測序實施例中,使用如2018年11月27日提交的題為「用於靶向測序之模型(Models for Targeted Sequencing)」之美國專利申請案第16/201,912號中所揭示之雜訊建模、利用白血球(WBC)之聯合建模及/或邊緣變異體假影建模(edge variant artifact modelling)獲得多個序列讀段,該案以引用的方式併入本文中。在全基因組測序情況下,在本揭示案之一些實施例中,使用2019年3月13日提交的題為「鑑別複本數變異(Identifying Copy Number Aberrations)」之美國專利申請案第16/352,214號中所揭示之雜訊模型及啟發式演算法獲得所述多個序列讀段。
區塊224至238.在所揭示之方法中,自測試個體獲得第二生物樣品。在一些實施例中,僅自測試個體獲得單一生物樣品。亦即,第一生物樣品及第二生物樣品係相同的(例如參看區塊232)。在一些實施例中,第一生物樣品與第二生物樣品不同。第二生物樣品包括來自所述測試個體之無細胞核酸以及來自所述組病原體中之第一病原體的潛在地無細胞核酸。在一些實施例中,參看圖2B之區塊226,第一生物樣品及第二生物樣品係來自測試個體之血漿。參看圖2B之區塊228,在一些實施例中,第一生物樣品及第二生物樣品係來自測試個體之同一生物樣品的不同等分試樣。
參看圖2B之區塊230,在一些實施例中,本揭示案之方法篩查第一病原體,所述第一病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。在一些實施例中,本揭示案之方法篩查多種病原體,其中所述多種病原體包括由以下組成之病原體組中之至少兩種、至少三種、至少四種、至少五種或至少六種病原體:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)
在一些實施例中,參看圖2B之區塊234,所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。參看區塊236,在一些實施例中,所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。在一些實施例中,所述組病原體係多種病原體,其包括由以下組成之群組中的至少兩種、至少三種、至少四種、至少五種或至少六種病原體:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B 型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
參看圖2C之區塊237且如上文所論述,在一些實施例中,第一或第二生物樣品由以下組成或包括以下:測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。參看圖2C之區塊238,在一些實施例中,所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。在一些實施例中,所述組病原體包括以下的任何組合:人疱疹病毒5CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒及B型肝炎病毒18(HPV18)病毒。圖12示出根據本揭示案形成之模型如何成為用於鑑別患有癌症病況之個體中之此類癌症病況的最佳模型。
區塊239.參看圖2C之區塊239,執行第二分析,所述第二分析包括對第二生物樣品中之無細胞核酸進行測序以產生來自測試個體之多個序列讀段。
第二分析可在第一分析之後數小時、數天或數週執行。在一個實 施例中,第二分析係在第一分析之後立即執行。在其他實施例中,第二分析係在第一分析之後1、2、3、4、5或6天內、1、2、3、4、5、6、7或8週內、3、4、5、6或12個月內,或在第一分析之後超過1年執行。在一個具體實例中,第二分析係在第一樣品之2週內執行。一般而言,第二分析係用於改善可以在個體中偵測到腫瘤或癌症類型之特異性。執行第一分析與第二分析之間的時間可以實驗方式確定。在一些實施例中,所述方法可包括兩種或兩種以上分析,且兩種分析使用相同的樣品(例如在執行第一分析之前自個體,例如患者獲得單一樣品,並保存一段時間,直至執行第二分析)。舉例而言,可以同時自個體獲得兩管血液。第一管用於第一分析。第二管僅在自個體之第一分析得到的結果呈陽性時使用。所述樣品係使用具有本領域中技能者已知之任何方法保存(例如低溫保存)。此保存在某些情況中可為有益的,例如,其中個體可以接收陽性測試結果(例如第一分析提示癌症),且患者實際上可以不必等到執行第二分析,而是選擇尋求第二意見。
獲得生物樣品與執行分析之間的時間可以經優化以改善所述分析或方法之靈敏度及/或特異性。在一些實施例中,生物樣品可以在即將執行分析之前獲得(例如第一樣品係在執行第一分析之前獲得,且第二樣品係在執行第一分析之後但在執行第二分析之前獲得)。在一些實施例中,獲得生物樣品並在執行分析之前儲存一段時間(例如數小時、數天或數週)。在一些實施例中,在自個體獲得樣品之後1、2、3、4、5或6天內、1、2、3、4、5、6、7或8週內、3、4、5、6或12個月內,或在自個體獲得樣品之後超過1年,對樣品執行分析。
第二生物樣品係來自測試個體。第二生物樣品包括來自所述測試個體之無細胞核酸以及來自所述組病原體中之至少一種病原體的潛在地無細胞核酸。對於所述組病原體中之每一各別病原體,測定映射至病原體目標參考中一序列的多個序列讀段之相應量,由此獲得一組序列讀段量,所述組序列讀段量中 之每一各別序列讀段量對應於所述組病原體中之相應病原體。以上第I節中所揭示之方法中的任一種均可以用於此第二分析,並因此,有關用於對此類分析評分之適合第二分析及方法的揭示內容,以引用之方式併入第II節中,所述分析係關於所述測試個體患所述癌症病況或患有所述癌症病況之可能性。提供關於此第二分析之其他詳情以補充第I節之揭示內容。同樣,本節中所提供之其他詳情意圖補充以上第I節關於實驗詳情之揭示內容。
在一些實施例中,自第二生物樣品獲取超過1000個或5000個序列讀段。在一些實施例中,自第二生物樣品獲取的序列讀段提供對至少2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、98%或至少99%之測試個體基因組1×或更大、2×或更大、5×或更大、10×或更大、或50×或更大的覆蓋率。在一些實施例中,自第二生物樣品獲取的序列讀段提供對測試個體之基因組中至少3個基因、至少5個基因、至少10個基因、至少20個基因、至少30個基因、至少40個基因、至少50個基因、至少60個基因、至少70個基因、至少80個基因、至少90個基因、至少200個基因、至少300個基因、至少400個基因、至少500個基因或至少1000個基因的1×或更大、2×或更大、5×或更大、10×或更大或50×或更大的覆蓋率。
參看圖2C之區塊240,在一些實施例中,藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行測序。
在一些實施例中,藉由全基因組測序執行測序且自第二生物樣品獲取之多個序列讀段的平均覆蓋率係測試個體之整個基因組的至少1×、2×、3×、4×、5×、6×、7×、8×、9×、10×、至少20×、至少30×或至少40×。
在一些實施例中,藉由靶向小組測序執行測序,其中其中自第二生物樣品獲取的序列讀段對此靶向小組基因具有至少50,000×覆蓋率、至少55,000×覆蓋率、至少60,000×覆蓋率或至少70,000×覆蓋率。在一些此類實施例 中,靶向小組基因係在450個與500個基因之間。在一些實施例中,靶向小組基因係在500±5個基因之範圍內、在500±10個基因之範圍內或在500±25個基因之範圍內。
在一些此類實施例中,全基因組亞硫酸氫鹽測序根據以下實例1且如2018年3月13日提交的題為「甲基化片段異常偵測」之美國專利申請案第62/642,480號中另外揭示來鑑別一種或多種甲基化狀態向量,該案以引用的方式併入本文中。
在一些實施例中,使用一種或多種方法諸如正規化、GC偏差校正及/或因PCR過度擴增引起之偏差的校正對序列讀段進行預處理以校正偏差或錯誤。
可以使用任何測序形式自獲自生物樣品之無細胞核酸獲得序列讀段,包含但不限於高通量測序系統諸如Roche 454平台、Applied Biosystems SOLID平台、Helicos真正單分子DNA測序技術(True Single Molecule DNA sequencing technology)、來自Affymetrix Inc.之雜交測序平台、Pacific Biosciences之單分子即時(SMRT)技術、來自454 Life Sciences、Illumina/Solexa及Helicos Biosciences之合成測序平台,以及來自Applied Biosystems之連接法測序平台。亦可使用Life technologies之ION TORRENT技術及奈米孔測序自獲自生物樣品之無細胞核酸獲得序列讀段140。
在一些實施例中,使用合成測序及基於可逆終止子之測序(例如Illumina之基因組分析儀;基因組分析儀II;HISEQ 2000;HISEQ 2500(加利福尼亞州聖地亞哥(San Diego Calif.)之Illumina))自獲自生物樣品之無細胞核酸獲得序列讀段。在一些此類實施例中,對數百萬個無細胞核酸(例如DNA)片段進行平行測序。在此類測序技術之一個實例中,使用含有光學透明載片之流槽,所述光學透明載片在結合寡核苷酸錨(例如接頭引子)之表面上具有八個獨 立泳道。流槽通常係一種固體載體,其經組態以保持及/或允許試劑溶液依序越過經結合分析物。在一些情況下,流槽係呈平面形狀,光學透明,大體上呈毫米或亞毫米級,且通常具有發生分析物/試劑相互作用之通道或泳道。在一些實施例中,無細胞核酸樣品可以包含有助於偵測之信號或標籤。在一些此類實施例中,自獲自生物樣品之無細胞核酸獲取序列讀段包含經由多種技術獲得所述信號或標籤之定量資訊,所述技術為諸如流動式細胞測量術、定量聚合酶鏈反應(qPCR)、凝膠電泳、基因晶片分析、微陣列、質譜法、細胞螢光分析、螢光顯微法、共聚焦雷射掃描顯微鏡檢查、雷射掃描細胞測量術、親和層析法、手動分批模式分離、電場懸浮、測序及其組合。
在一些實施例中,序列讀段係按以下實例2中所揭示之示例分析方案中所描述的方式獲得。
在一些實施例中,在區塊239中自生物樣品之無細胞核酸獲得的序列讀段包括所述無細胞核酸之超過十個序列讀段、所述無細胞核酸之超過一百個序列讀段、所述無細胞核酸之超過五百個序列讀段、所述無細胞核酸之超過一千個序列讀段、所述無細胞核酸之超過兩千個序列讀段、所述無細胞核酸之之超過二千五百個序列讀段與五千個序列讀段之間、或所述無細胞核酸之超過五千個序列讀段。在一些實施例中,這些序列讀段各自屬於所述無細胞核酸之不同部分。在一些實施例中,第一多個序列讀段中的一個序列讀段與另一序列讀段屬於所述無細胞核酸之全部或相同部分。
A.利用靶向病原體小組.
區塊244-246.參看圖2D之區塊242,在一些實施例中,各別病原體之病原體目標參考由來自各別病原體之參考基因組的相應靶向小組序列組成,且對於所述各別病原體,測定映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量對於所述各別病原體將限制所述多個序列讀段之 每一序列讀段於來自所述各別病原體之參考基因組的相應靶向小組序列中之映射。
參看區塊244,在一些實施例中,映射包括(i)所述多個序列讀段中之一個或多個序列讀段與(ii)來自所述各別病原體之參考基因組的相應靶向小組序列中之序列之間的序列比對。在一些實施例中,當所述一個或多個序列讀段含有相應靶向小組序列中之序列的全部或一部分時,認為所述多個序列讀段中之各別序列讀段映射至相應靶向小組序列中之序列。
在一些實施例中,藉由將所述多個序列讀段中之每一序列讀段與所述相應靶向小組中每一序列中之區域比對,將所述多個序列讀段與所述相應靶向小組序列中之每一序列比對,以便確定所述序列讀段是否含有相應靶向小組中之序列的全部或一部分。序列讀段140與相應靶向小組中之序列中的區域比對涉及基於序列之間之完全或部分一致性,將來自所述多個序列讀段中之一個或多個序列讀段的序列與相應靶向小組序列中之序列的區域相匹配。比對可以手動地或藉由電腦演算法進行,實例包含作為Illumina基因組學分析(Illumina Genomics Analysis)流程之一部分發佈的核苷酸資料之高效局部比對(Efficient Local Alignment of Nucleotide Data,ELAND)電腦程式。序列讀段與相應靶向小組序列中之序列的比對可以為100%序列匹配。在一些實施例中,比對係小於100%序列匹配(例如不完美匹配、部分匹配或部分比對)。在一些實施例中,比對包括錯配。在一些實施例中,比對包括1、2、3、4或5個錯配。兩個或兩個以上序列可以使用任一股進行比對。在一些實施例中,核酸序列與另一核酸序列之反向補體比對。
B.利用全基因組測序.在一些實施例中,所述病原體目標參考包括各別病原體之參考基因組或其一部分,且對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之 相應量對於所述各別病原體,將使用所述各別病原體之完整參考基因組比對所述多個序列讀段中之一個或多個序列讀段。
在一些實施例中,所述測定包括,對於所述組病原體中之每一各別病原體,映射至所述各別病原體之病原體目標參考中一序列的所述多個序列讀段之相應量測定映射至第一病原體之病原體目標參考中一序列的多個序列讀段之相應第一量。在一些實施例中,對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量測定映射至第二病原體之病原體目標參考中一序列的多個序列讀段之相應第二量。
另外,第一量係基於與第一分佈之預定百分位數有關的序列讀段之量定限,其中未患所述癌症病況的第一組個體中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之第一量。第二量係基於與第二分佈之預定百分位數有關的序列讀段之量定限,其中未患所述癌症病況的第二組個體中之每一各別個體用映射至第二病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第二分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之第二量。在此類實施例中,第二分析至少部分地基於所述按比例調整之第一量及所述按比例調整之第二量指示所述測試個體患有或未患所述癌症病況,或提供所述測試個體患或未患所述癌症病況的可能性。
C.利用全基因組亞硫酸氫鹽測序.在一些實施例中,所述病原體目標參考係所述各別病原體之參考基因組或其一部分,且所述測定包括對於所述組病原體之每一各別病原體,測定映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量對於所述各別病原體,將所述多個序列讀段中 之一個或多個序列讀段的甲基化模式與所述各別病原體之完整參考基因組的甲基化模式相比較。
參看區塊246,在一些實施例中,映射包括(i)所述多個序列讀段中之一個或多個序列讀段與(ii)來自所述各別病原體之參考基因組的相應靶向小組序列中之序列之間甲基化模式的比較。有關此類甲基化模式之更多揭示內容見於以下實例1中。亦參見歐洲專利申請案第17202149.5號,其以引用的方式併入本文中。
區塊248.參看圖2D之區塊248,在一些實施例中,所述病原體目標參考130包括各別病原體之參考基因組,且對於所述各別病原體,測定映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量對於所述各別病原體,將使用所述各別病原體之完整參考基因組比對所述多個序列讀段中之一個或多個序列讀段。
在一些實施例中,藉由將所述多個序列讀段中之每一序列讀段與病原體目標參考基因組中之區域比對,將所述多個序列讀段與所述各別病原體之參考基因組比對,以便確定所述序列讀段是否含有病原體目標參考基因組中所述區域之全部或一部分。序列讀段與病原體目標參考基因組序列中之區域的比對涉及基於序列之間之完全或部分一致性,將來自多個序列讀段中之一個或多個序列讀段的序列與病原體目標參考基因組中所述區域之序列相匹配。比對可以手動地或藉由電腦演算法進行,實例包含作為Illumina基因組學分析流程之一部分發佈的核苷酸資料之高效局部比對(ELAND)電腦程式。序列讀段與病原體目標參考基因組中之區域的比對可以為100%序列匹配。在一些實施例中,比對係小於100%序列匹配(例如不完美匹配、部分匹配或部分比對)。在一些實施例中,比對包括錯配。在一些實施例中,比對包括1、2、3、4或5個錯配。兩個或兩個以上序列可以使用任一股進行比對。在一些實施例中,核酸序列與另 一核酸序列之反向補體比對。
區塊250.參看區塊250,在一些實施例中,所述病原體目標參考包括各別病原體之參考基因組,且對於所述各別病原體,測定映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量對於所述各別病原體,將所述多個序列讀段中一個或多個序列讀段之甲基化模式與所述各別病原體之完整參考基因組的甲基化模式相比較。有關此類甲基化模式之更多揭示內容見於以下實例1中。
區塊252-254.參看圖2E之區塊252,在一些實施例中,所述組病原體係單一病原體。參看區塊254,在一些實施例中,所述組病原體包括多種病原體,且對於所述組病原體中之每一各別病原體,測定映射至病原體目標參考中一序列的多個序列讀段之相應量係針對多種病原體中之每一各別病原體執行。
區塊256.參看圖2E之256,在一些實施例中,第二分析進一步包括測定與第一分佈之預定百分位數有關的所述組病原體中之第一病原體之序列讀段的參考量。第一組個體中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈,其中所述第一組個體之第一部分中的每一個體皆患有所述癌症病況且所述第一組個體之第二部分中的每一個體皆未患所述癌症病況。在此類實施例中,將第一量與第二量相比較,所述第一量係來自所述測試個體的映射至第一病原體之病原體目標參考中一序列的所述多個序列讀段之量,所述第二量係與所述第一分佈之預定百分位數有關的所述組病原體中之第一病原體之序列讀段的參考量。當所述第一量超過所述第二量臨限量時,所述第二分析指示所述測試個體有患所述癌症病況的可能性或確定所述測試個體患有所述癌症病況。
區塊258.參看圖2E之區塊258,在一些實施例中,第二分析進一步包括測定與第一分佈之預定百分位數有關的所述組病原體中之第一病原體之 序列讀段的參考量。未患所述癌症病況的第一組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈。藉由與所述第一分佈之預定百分位數有關的所述組病原體中之第一病原體之序列讀段的參考量對來自所述測試個體的映射至所述第一病原體之病原體目標參考中一序列的多個序列讀段之量定限,由此形成所述多個序列讀段的按比例調整之量。將所述多個序列讀段的按比例調整之量同與第二分佈之預定百分位數有關的所述多個序列讀段之按比例調整之量相比較。第二組個體中之每一各別個體用映射至所述第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的按比例調整之量貢獻第二分佈。第二組中之第一部分個體中的每一個體皆患有所述癌症病況且第二組中之第二部分個體中的每一個體皆未患所述癌症病況。
區塊260-264.參看圖F之區塊260及262,在一些實施例中,第一組包括20或100位個體,其各自用映射至第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈。參看圖2F之區塊265,在一些實施例中,第一分佈之預定百分位數係第95百分位數或第98百分位數。
區塊265-267.參看圖2F之區塊265,在一些實施例中,所述測定步驟測定映射至第一病原體之病原體目標參考中一序列的多個序列讀段之相應第一量。所述測定步驟測定映射至第二病原體之病原體目標參考中一序列的所述多個序列讀段之相應第二量。所述第一量係基於與第一分佈之預定百分位數有關的序列讀段之量定限,其中未患所述癌症病況的第一組個體中之每一各別個體用映射至第一病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第一分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之第一量。第二量係基於與第二分佈之預定百分位數有關的序列讀段之量定限,其中未患所述癌症病況的第二組個體中之每一各別個體用映射至第二 病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第二分佈,由此測定來自所述測試個體之多個序列讀段的按比例調整之第二量。第二分析至少部分地基於所述按比例調整之第一量及所述按比例調整之第二量指示測試個體患有或未患所述癌症病況或提供測試個體患有或未患所述癌症病況的可能性。
參看區塊266,在一些實施例中,藉由至少將多個序列讀段的按比例調整之第一量及多個序列讀段的按比例調整之第二量輸入分類器中,第二分析認為測試個體患有或未患所述癌症病況或第二分析提供測試個體患有或未患所述癌症的可能性。舉例而言,參看圖2G之區塊267,在一些實施例中,所述分類器係邏輯斯蒂回歸。所述邏輯斯蒂回歸基於在訓練組個體中所觀察到的映射至第一病原體之病原體目標參考中一序列的序列讀段之量,單獨地對多個序列讀段的按比例調整之第一量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。所述邏輯斯蒂回歸基於在所述訓練組中所觀察到的映射至第二病原體之病原體目標參考中一序列的序列讀段之量,單獨地對多個序列讀段的按比例調整之第二量進行加權。
區塊268-272.參看區塊268,在一些實施例中,將映射至各別病原體之病原體目標參考中一序列的序列讀段之相應量施加至分類器,由此第二分析判定(i)測試個體是否患有所述癌症病況或(ii)測試個體患所述癌症病況的可能性。參看圖2G之區塊270,在一些實施例中,施加步驟亦將第一特徵之量施加至分類器。參看圖2G之區塊272,在一些實施例中,在執行步驟239之前,藉由對於第一組個體中之每一各別個體,將映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量輸入第一分類器中,對所述分類器進行訓練。第一組中之第一部分個體中的每一個體皆患有所述癌症病況且第一組中之第二部分個體中的每一個體皆未患所述癌症病況。
區塊274.參看區塊274,在一些實施例中,在執行步驟239之前,藉由對於第一組個體中之每一各別個體,將映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的正規化量輸入分類器中,對所述分類器進行訓練。第一組中之第一部分個體中的每一個體皆患有所述癌症病況。第一組中之第二部分個體中的每一個體皆未患所述癌症病況。藉由根據與第二分佈之預定百分位數有關的所述各別病原體之序列讀段的參考量使映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量正規化,獲得映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的正規化量。未患所述癌症病況的第二組個體中之每一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻第二分佈。
區塊276.參看圖2H之區塊276,在一些實施例中,分類器係二項分類器(例如邏輯斯蒂回歸,例如提供測試個體患或未患所述癌症病況之可能性或提供對測試個體患有抑或未患所述癌症病況之二元評估的邏輯斯蒂回歸)。
區塊278.參看圖2H之區塊278,在一些實施例中,分類器係提供多種可能性之邏輯斯蒂回歸。所述多種可能性中之每一各別可能性係所述測試個體患多種癌症病況中之相應癌症病況的可能性。所述多種癌症病況包含所述癌症病況。
區塊280.參看圖2H之區塊280,在一些實施例中,分類器係多項分類器(例如神經網路演算法、支援向量機演算法或決策樹演算法等)。
區塊282-288.參看圖2I之區塊282,在一些實施例中,第二分析進一步包括對於所述組病原體中之每一各別病原體,基於與各別分佈之預定百分位數有關的序列讀段之量對映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量定限,其中未患所述癌症病況的各別組個體中之每 一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻各別分佈,由此測定來自測試個體之多個序列讀段的按比例調整之各別量。當至少輸入來自測試個體之多個序列讀段的每一按比例調整之各別量的分類器指示測試個體患有所述癌症病況時,第二分析認為測試個體有患所述癌症病況的可能性或患有所述癌症病況。
參看圖2I之區塊284,在一些實施例中,分類器係邏輯斯蒂回歸,其基於在訓練組個體中所觀察到的與相應病原體之參考基因組比對的序列讀段之相應量對多個序列讀段的每一按比例調整之各別量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。
參看圖2I之區塊286,在實施例中,所述組病原體包括在兩種與一百種之間之病原體。
參看圖2I之區塊288,在一些實施例中,分類器係針對訓練組個體進行訓練的神經網路演算法、支援向量機演算法或決策樹演算法,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。
區塊290.參看圖2I之區塊290,在一些實施例中,第二分析包括對於所述組中之每一各別病原體,基於與各別分佈之預定百分位數有關的序列讀段之量對映射至所述各別病原體之病原體目標參考中一序列的多個序列讀段之相應量定限。未患癌症病況的各別組個體中之每一各別個體用映射至所述各別病原體之病原體目標參考中一序列的來自所述各別個體之序列讀段的量貢獻各別分佈,由此測定來自測試個體之多個序列讀段的按比例調整之各別量。對多個序列讀段的每一按比例調整之各別量求和以確定總體腫瘤病原體負荷。當總體腫瘤病原體負荷滿足臨限截止值條件(例如關於一組未患所述癌症病況之個體所測定的所述組病原體之總體腫瘤病原體負荷的預定特異性,例如第90百分位數、第95百分位數、第98百分位數、第99百分位數或某一其他適合的百分 位數)時,第二分析指示測試個體患有所述癌症病況。
區塊292-296.參看圖2J之區塊292,篩查所述癌症病況係基於第一分析及第二分析進行。在此類實施例中,當第一分析或第二分析,或第一及第二分析兩者指示測試個體患有或未患所述癌症病況或提供測試個體患或未患所述癌症病況之可能性時,認為測試個體有患所述癌症病況的可能性或患有所述癌症病況。在一些此類實施例中,基於篩查結果提供對測試個體之治療性干預或成像。參看圖2J之區塊296,在一些實施例中,第一分析對於提示所述癌症病況之第一組標記物具有一定靈敏度。第一特徵係在第一組標記物內的第一生物樣品中之無細胞核酸之複本數、片段大小分佈、斷裂模式、甲基化狀態或突變狀態之一。
區塊298-304.參看圖2J之區塊298,在一些實施例中,基於與第二分佈之預定百分位數有關的第一特徵之量對第一特徵之量定限,由此形成第一特徵之按比例調整之量。未患所述癌症病況的第二組個體中之每一各別個體用由所述各別個體所量測的第一特徵之值貢獻第二分佈。當第一特徵的按比例調整之量超過與第二分佈之預定百分位數有關的第一特徵之量第二預定截止值時,第一分析認為測試個體患有癌症病況。參看區塊302,在一些實施例中,第二預定截止值係零。參看區塊304,在一些實施例中,第二預定截止值比第二分佈之集中趨勢的量測值高或低一個、兩個或三個標準差。
參看圖2J之區塊306,在一些實施例中,評價多個序列讀段以獲得關於與所述組病原體中之第一病原體有關之序列片段標誌存在抑或不存在的指示。所述篩查使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)第一特徵之量及(iii)所述組序列讀段量以確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。
參看圖2K之區塊308,在一些實施例中,評價多個序列讀段以獲 得關於與所述組病原體中之第一病原體有關之甲基化標誌存在抑或不存在的指示。所述篩查使用(i)關於與第一病原體有關之甲基化標誌存在抑或不存在的指示、(ii)第一特徵之量及(iii)所述組序列讀段量以確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。
參看圖2K之區塊310,在一些實施例中,評價多個序列讀段以獲得關於與所述組病原體中之第一病原體有關之序列片段標誌存在抑或不存在的指示。亦評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關的甲基化標誌存在抑或不存在的指示。在此類實施例中,所述篩查使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與第一病原體有關之甲基化標誌存在抑或不存在的指示、(iii)第一特徵之量及(iv)所述組序列讀段量確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。
參看圖2K之區塊312,在一些實施例中,映射至各別病原體之病原體目標參考中一序列的多個序列讀段之相應量係在第二生物樣品中量測的映射至各別病原體之病原體目標參考中一序列的來自測試個體之多個序列讀段的百分比。
參看圖2K之區塊314,在一些實施例中,測定映射至相應病原體之病原體目標參考中一序列的多個序列讀段之相應量包括在閱讀框架中轉譯所述多個序列讀段以形成多個轉譯之序列讀段並將所述多個轉譯之序列讀段與所述病原體目標參考之轉譯相比較。
參看圖2K之區塊316,在一些實施例中,測定映射至相應病原體之病原體目標參考中一序列的多個序列讀段之相應量包括在核酸、核糖核酸或蛋白質空間中對所述多個序列讀段與所述病原體目標參考進行k聚體匹配。
參看圖2K之區塊318,在一些實施例中,測試個體係人,且第二分析進一步包括對人類基因組內多個序列讀段之每一各別量執行終點分析。
參看圖2L之區塊320,在一些實施例中,評價多個序列讀段以獲得關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌(例如APOBEC誘導之突變標誌與宿主病毒免疫反應有關)存在抑或不存在的指示。在此類實施例中,所述篩查使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與第一病原體有關之甲基化標誌存在抑或不存在的指示及(iii)關於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。若存在,APOBEC誘導之突變標誌將包括宿主基因組中APOBEC/AID誘導之突變(參見例如Wallace等人,2018,PLoS Pathog 14(1)pp.e1006717,其以引用的方式併入本文中)。
參看圖2L之區塊322,在一些實施例中,經由k聚體分析評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示。在此類實施例中,所述篩查使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與第一病原體有關之甲基化標誌存在抑或不存在的指示及(iii)關於與第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。
參看圖2L之區塊324,在一些實施例中,關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含APOBEC誘導之突變標誌之富集量的量測值。在此類實施例中,所述篩查使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與第一病原體有關之甲基化標誌存在抑或不存在的指示且(iii)進一步包含APOBEC誘導之突變標誌之富集量的量測值以確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。
參看圖2L之區塊326,在一些實施例中,分析來自所述測試個體之第一生物樣品或第二生物樣品中與所述組病原體中第一病原體有關之APOBEC蛋白質之表現。在此類實施例中,所述篩查使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)第一特徵之量及(iii)與第一病原體有關之APOBEC蛋白質之表現確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。
參看圖2M之區塊328,在一些實施例中,執行第三分析,其包括量測第一生物樣品中之無細胞核酸之APOBEC誘導之突變標誌的量。所述篩查使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)第一特徵之量及(iii)APOBEC誘導之突變標誌的量確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。
參看圖2M之區塊330,在一些實施例中,執行第二分析進一步包括量測第二生物樣品中之無細胞核酸之APOBEC誘導之突變標誌的量。所述篩查使用(i)關於與第一病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)第一特徵之量及(iii)APOBEC誘導之突變標誌的量確定測試個體是否患有癌症病況或測試個體患癌症病況的可能性。
參看區塊320-330,在一些實施例中,APOBEC誘導之突變標誌係選自如以引用的方式併入本文中的Alexandrov等人,2013,《自然》500(7463),第415-421頁及Tate等人,2019,《核酸研究(Nuc.Acids Res.)》47(D1),第D941-D947頁中所定義之第2型突變標誌或第13型突變標誌。當在自個體獲得的多個序列讀段中觀察到第2型或第13型標誌時,確定在個體體內存在APOBEC突變過程。
III.病毒特異性標誌之存在用於癌症偵測. 以上第I節及/或第II節中已揭示在測試個體中篩查癌症病況之方法。本節提供在測試個體中篩查癌症 病況之其他方法。在本節中,將第I節及/或第II節中所描述之分析或方法與量測測試個體中第一特徵之另一分析組合以便在測試個體中篩查癌症病況。另外,本節提供有關癌症病況之類型、序列讀段之類型之更多細節及可以用於以上第I節及/或第II節之方法中的其他實驗細節。
本揭示案之另一態樣提供一種在測試個體中篩查癌症病況的方法。所述方法包括自所述測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。所述方法進一步包括對所述第一生物樣品中之無細胞核酸進行測序,以產生來自所述測試個體之多個序列讀段。所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之各別病原體有關的序列片段標誌存在抑或不存在的指示。如圖5中所示,可偵測相當大百分比的患有已知癌症病況之個體中的病毒片段(例如,確切地說,可以偵測頭頸癌或子宮頸癌患者之病毒標誌)。圖7進一步示出病毒負荷可以與疾病分期相關(例如隨著疾病分期增加,病毒負荷增加)。圖7中所示之資料係自頭頸癌患者獲得。圖10進一步示出,對於患乳癌之個體,本文所描述之方法能夠偵測低於先前研究中可偵測之水準的病毒負荷(例如參見Tang等人,2013,《自然-通信》4:2513)。所述方法進一步包括使用關於與所述各別病原體有關之片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,評價所述多個序列讀段亦獲得關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示。在此類實施例中,所述方法進一步包括使用關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及關於與所述各別病原體有關之標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的量測值。在此類實施例中,所述方法進一步包括使用APOBEC蛋白質之表現以及關於與所述各別病原體有關之標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,分析來自所述測試個體之第一生物樣品或第二生物樣品中與所述組病原體中之第一病原體有關之APOBEC蛋白質之表現。在此類實施例中,所述方法進一步包括使用APOBEC蛋白質之表現以及關於與所述各別病原體有關之標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括使用所述APOBEC誘導之突變標誌的量以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,自所述測試個體獲得第二生物樣品。第二生物樣品包括來自所述測試個體之無細胞核酸以及來自所述組病原體中之第一病原體的潛在地無細胞核酸。執行分析,所述分析包括量測所述第二生物樣品中之無細胞核酸的APOBEC誘導之突變標誌的量。在此類實施例中,所述方法進一步包括使用所述APOBEC誘導之突變標誌的量以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
IV.甲基化標誌之存在偵測癌症病況。 本揭示案之另一態樣提供一種在測試個體中篩查癌症病況的方法,其中自所述測試個體獲得生物樣品。所述生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。所述方法進一步包括對所述生物樣品中之無 細胞核酸進行測序,以產生來自所述測試個體之多個序列讀段。所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之各別病原體有關的甲基化標誌存在抑或不存在的指示。所述方法進一步包括使用關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,評價所述多個序列讀段亦獲得關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示。在此類實施例中,所述方法進一步包括使用關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的量測值。在此類實施例中,所述方法進一步包括使用所述APOBEC誘導之突變標誌之富集量的量測值以及關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,分析來自所述測試個體之第一生物樣品或第二生物樣品中與所述組病原體中之第一病原體有關的APOBEC蛋白質之表現。在此類實施例中,所述方法進一步包括使用所述APOBEC蛋白質之表現以及關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,執行分析,所述分析包括量測第一生物樣品中之無細胞核酸的APOBEC誘導之突變標誌的量。在此類實施例中,所述方法進 一步包括使用關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,自所述測試個體獲得第二生物樣品。第二生物樣品包括來自所述測試個體之無細胞核酸以及來自所述組病原體中之第一病原體的潛在地無細胞核酸。執行分析,所述分析包括量測所述第二生物樣品中之無細胞核酸的APOBEC誘導之突變標誌的量。在此類實施例中,所述方法進一步包括使用關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示以及關於與所述各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。在一些實施例中,所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
V.病原體特異性標誌及甲基化標誌之存在用於偵測癌症病況。 本揭示案之另一態樣提供一種在測試個體中篩查癌症病況的方法,其中自所述測試個體獲得第一生物樣品。所述第一生物樣品包括來自所述測試個體之無細胞核酸以及來自一組病原體中之至少一種病原體的潛在地無細胞核酸。所述方法進一步包括對所述第一生物樣品中之無細胞核酸進行測序,以產生來自所述測試個體之多個序列讀段。所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之各別病原體有關的序列片段標誌存在抑或不存在的指示。所述方法進一步包括評價所述多個序列讀段以獲得關於與所述組病原體中之各別病原體有關的甲基化標誌存在抑或不存在的指示。所述方法進一步包括使用所述關於與各別病原體有關之標誌片段標誌存在抑或不存在的指示以及所 述關於與各別病原體有關之甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
在一些實施例中,評價所述多個序列讀段以獲得關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示。在一些實施例中,所述方法進一步包括使用(i)與各別病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與各別病原體有關之甲基化標誌存在抑或不存在的指示及(iii)關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括使用(i)與各別病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與各別病原體有關之甲基化標誌存在抑或不存在的指示及(iii)關於與所述組病原體中之第一病原體有關的APOBEC誘導之突變標誌的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,關於與所述第一病原體有關的APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的量測值。在一些實施例中,所述方法進一步包括使用(i)關於與各別病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與各別病原體有關之甲基化標誌存在抑或不存在的指示及(iii)APOBEC誘導之突變標誌之富集量的量測值確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括分析來自所述測試個體之第一生物樣品或第二生物樣品中與所述組病原體中之第一病原體有關的APOBEC蛋白質之表現。在一些實施例中,所述方法進一步包括使用(i)與各別 病原體有關之標誌片段標誌存在抑或不存在的指示、(i)關於與各別病原體有關之甲基化標誌存在抑或不存在的指示及(iii)與所述組病原體中之第一病原體有關之APOBEC蛋白質之表現確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法進一步包括執行分析,所述分析包括量測第一生物樣品中之無細胞核酸的APOBEC誘導之突變標誌的量。在一些實施例中,所述方法進一步包括使用(i)關於與各別病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與各別病原體有關之甲基化標誌存在抑或不存在的指示以及(iii)APOBEC誘導之突變標誌之量及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
在一些實施例中,所述方法藉由執行分析繼續,所述分析包括量測第二生物樣品中之無細胞核酸之APOBEC誘導之突變標誌的量。在此類實施例中,所述方法進一步包括使用(i)關於與各別病原體有關之標誌片段標誌存在抑或不存在的指示、(ii)關於與各別病原體有關之甲基化標誌存在抑或不存在的指示以及(iii)APOBEC誘導之突變標誌之量及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
VI.病原體小組用於癌症篩查. 本揭示案之另一態樣提供一種用於篩查測試個體以確定所述個體患癌症病況之可能性或指示所述個體患有癌症病況的病原體小組,所述病毒小組包括第一序列片段及第二序列片段。第一序列片段及第二序列片段各自獨立地為由以下組成的一組寄生蟲中之相應寄生蟲的基因組之片段:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病 毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。第一序列片段係除具有第一序列片段之寄生蟲外的寄生蟲之片段。
在一些實施例中,所述第一序列片段編碼相應寄生蟲之基因組的至少一百個鹼基。在一些實施例中,病毒小組包含所述組寄生蟲中至少四種不同寄生蟲之序列片段。在一些實施例中,病毒小組包含所述組寄生蟲中至少五種不同寄生蟲之序列片段。
在一些實施例中,病原體小組包含所述組寄生蟲中至少八種不同寄生蟲之序列片段。在一些實施例中,病原體小組包含來自所述組寄生蟲中寄生蟲的至少五十個序列片段。
在一些實施例中,所述第一序列片段編碼由相應寄生蟲之基因組所編碼之蛋白質的一部分。在一些實施例中,所述第一序列片段編碼相應寄生蟲之一部分基因組的甲基化模式。
VII.病原體特異性標誌及APOBEC誘導之突變標誌之存在用於偵測癌症病況。 本揭示案之另一態樣使用APOBEC誘導之突變標誌之富集量的量測值作為篩查癌症之基礎。在此類實施例中,在一種物種之測試個體中篩查癌症病況或患第一病況之可能性包括自所述測試個體獲得第一生物樣品。第一生物樣品包括來自所述測試個體之無細胞核酸。在所述方法中,對第一生物樣品中之無細胞核酸進行測序(例如藉由全基因組測序、甲基化或非甲基化相關靶向小組測序、或全基因組亞硫酸氫鹽測序)以產生來自所述測試個體之多個序列讀段。接著,分析所述多個序列讀段中第一APOBEC誘導之突變標誌之富集量的量測值。接著,使用第一APOBEC誘導之突變標誌之富集量的量測值確定所述測試個體是否患有所述癌症病況或患所述癌症病況之可能性。
在一些實施例中,所述分析包括對所述多個序列讀段進行k聚體 分析以測定第一APOBEC誘導之突變標誌之富集量的量測值。在一些實施例中,所述分析包括(i)所述多個序列讀段中之一個或多個序列讀段與(ii)第一APOBEC誘導之突變標誌之間的序列比對,由此獲得第一APOBEC誘導之突變標誌之富集量的量測值。
在一些實施例中,第一APOBEC誘導之突變標誌之富集量的量測值係呈針對未患癌症之一組物種中第一APOBEC誘導之突變標誌之量的p值形式,當所述p值係在臨限值範圍內時,認為所述測試個體患有所述癌症病況或有患所述癌症病況的可能性,且當所述p值不在臨限值範圍內時,認為所述測試個體未患所述癌症病況或無患所述癌症病況的可能性。在一些此類實施例中,臨限值範圍係小於或等於0.00001、小於或等於0.0001、小於或等於0.001、小於或等於0.002、小於或等於0.003、小於或等於0.004、小於或等於0.005、小於或等於0.01、小於或等於0.02、小於或等於0.03、小於或等於0.04、或小於或等於0.05。
在一些實施例中,第一APOBEC誘導之突變標誌與病原體相關。亦即,個體之序列讀段中APOBEC誘導之突變標誌的存在或APOBEC誘導之突變標誌的量測值指示在所述個體中存在特定病原體。
在一些實施例中,上文所描述之分析進一步包括對所述多個序列讀段使用k聚體分析以測定映射至病原體之參考基因組的多個序列讀段之量且所述使用亦使用映射至病原體之參考基因組的多個序列讀段之量以確定所述測試個體是否患有所述癌症病況或患癌症病況之可能性。在一些實施例中,k聚體分析進一步包括將所述多個序列讀段中之每一序列讀段分割成預定大小之多個子鏈段,由此獲得所述測試個體之多個序列讀段中每一各別序列讀段的一組子鏈段,且所述分析比較所述病原體之參考基因組之全部或一部分的每一子鏈段。在一些此類實施例中,所述預定大小係選自1-10個、5-10個、10-80個、20-35個或20-25個核酸之組。
在一些實施例中,所述病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
在一些實施例中,所述方法進一步包括分析來自測試個體之第一生物樣品或另一生物樣品中與癌症病況有關之APOBEC蛋白質的表現,且使用第一APOBEC誘導之突變標誌之富集量的量測值進一步包括使用APOBEC蛋白質之表現確定所述測試個體是否患有所述癌症病況或患所述癌症病況之可能性。在一些實施例中,所述物種係人類。
在一些實施例中,所述癌症病況係乳癌、肺癌、前列腺癌、結腸直腸癌、腎癌、子宮癌、胰臟癌、食道癌、淋巴瘤、頭/頸癌、卵巢癌、肝膽癌、黑素瘤、子宮頸癌、多發性骨髓瘤、白血病、甲狀腺癌、膀胱癌、胃癌或其組合。在一些實施例中,所述癌症病況係其預定分期(例如第I期、第II期、第III期或第IV期)。在一些實施例中,第一生物樣品包括血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液,或其任何組合。
在一些實施例中,所述方法進一步包括基於確定所述測試個體患有所述癌症病況或有患所述癌症病況之可能性,對所述測試個體提供治療性干預或成像。
在一些實施例中,所述分析進一步包括分析第二APOBEC誘導之突變標誌之富集量的量測值且使用進一步包括使用所述第二APOBEC誘導之突變標誌之富集量的量測值確定所述測試個體是否患有所述癌症病況或患所述癌 症病況之可能性。
在一些實施例中,第一APOBEC誘導之突變標誌之富集量的量測值滿足預定富集量臨限值,認為所述測試個體患有所述癌症病況或有患所述癌症病況之可能性,且當第一APOBEC誘導之突變標誌之富集量的量測值未能滿足所述預定富集量臨限值時,認為所述測試個體未患所述癌症病況或無患所述癌症病況之可能性。
在一些實施例中,第一APOBEC誘導之突變標誌之富集量的量測值係藉由將序列讀段中第一APOBEC誘導之突變標誌的預期量與第一APOBEC誘導之突變標誌之富集量相比較來測定。在一些此類實施例中,序列讀段中第一APOBEC標誌之預期量係序列讀段中有約5、7、10、12或20個第一APOBEC標誌。
本揭示案之另一態樣提供一種用於在一種物種之測試個體中篩查癌症病況或患第一病況之可能性的電腦系統。所述電腦系統包括一個或多個處理器、一記憶體及一個或多個程式。所述一個或多個程式係儲存於所述記憶體中且經組態以由所述一個或多個處理器執行。所述一個或多個程式包含用於分析多個序列讀段中第一APOBEC誘導之突變標誌之富集量之量測值的指令。所述多個序列讀段係自來自測試個體之第一生物樣品獲得。第一生物樣品包括來自所述測試個體之無細胞核酸。所述一個或多個程式進一步包含用於對第一生物樣品中之無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段的指令。所述一個或多個程式進一步包含使用第一APOBEC誘導之突變標誌之富集量的量測值確定所述測試個體是否患有所述癌症病況或患所述癌症病況之可能性的指令。
本揭示案之又另一態樣提供非暫時性電腦可讀儲存媒體及嵌入其中之一個或多個電腦程式,其用於在一種物種之測試個體中篩查癌症病況或 患第一病況之可能性。所述一個或多個電腦程式包括當由電腦系統執行時使該電腦系統執行方法的指令,所述方法包括分析多個序列讀段中第一APOBEC誘導之突變標誌之富集量的量測值。所述多個序列讀段係自測試個體之第一生物樣品獲得,其中所述第一生物樣品包括來自測試個體之無細胞核酸。所述一個或多個電腦程式進一步包括用於對第一生物樣品中之無細胞核酸進行測序以產生來自測試個體之多個序列讀段的指令。所述一個或多個程式包括使用第一APOBEC誘導之突變標誌之富集量的量測值確定所述測試個體是否患有所述癌症病況或患所述癌症病況之可能性的指令。
本揭示案之另一態樣提供一種用於在一種物種之測試個體中篩查癌症病況或患第一病況之可能性的方法。所述方法包括自測試個體獲得第一生物樣品,其中所述第一生物樣品包括來自測試個體之無細胞核酸。接著,對所述第一生物樣品中之無細胞核酸進行測序(例如藉由全基因組測序、甲基化或非甲基化相關靶向小組測序、或全基因組亞硫酸氫鹽測序等)以產生來自所述測試個體的多個序列讀段。接著,使用k聚體分析來測定映射至病原體目標參考之多個序列讀段的量。使用序列讀段之量確定所述測試個體是否患有所述癌症病況或患所述癌症病況之可能性。在一些實施例中,所述病原體目標參考與第一病原體相關。在一些實施例中,此第一病原體與第一種病毒感染類型相關。在一些實施例中,所述測試個體患有第一種病毒感染類型。
在一些實施例中,所述病原體目標參考由一組目標序列組成,所述目標序列一起表示第一病原體之一小組病原體參考基因組,且對於所述病原體,所述使用限制所述多個序列讀段中之每一序列讀段於來自病原體參考基因組之相應靶向小組序列中之映射。
在一些實施例中,第一病原體之病原體目標參考係第一病原體之參考基因組或其一部分,且對於所述第一病原體,所述使用將所述多個序列讀段 中之一個或多個序列讀段的甲基化模式與所述第一病原體之參考基因組之全部或一部分中的甲基化模式相比較。
在一些實施例中,k聚體分析進一步包括將所述多個序列讀段中之每一序列讀段分割成預定大小之多個子鏈段,由此獲得所述測試個體之一組子鏈段,且所述使用比較所述第一病原體之參考基因組之全部或一部分中的多個子鏈段中之每一子鏈段。在一些實施例中,所述預定大小係選自1-10個、5-10個、10-80個、20-35個或20-25個核酸之組。
在一些實施例中,所述癌症病況係乳癌、肺癌、前列腺癌、結腸直腸癌、腎癌、子宮癌、胰臟癌、食道癌、淋巴瘤、頭/頸癌、卵巢癌、肝膽癌、黑素瘤、子宮頸癌、多發性骨髓瘤、白血病、甲狀腺癌、膀胱癌、胃癌或其組合,或其預定分期(例如第I期、第II期、第III期或第IV期)。
在一些實施例中,k聚體分析包括在閱讀框架中轉譯來自所述測試個體之多個序列讀段以形成多個轉譯之序列讀段並將所述多個轉譯之序列讀段與病原體目標參考中之每一序列的轉譯相比較。在一些實施例中,k聚體分析在核酸、核糖核酸或蛋白質空間中將來自所述測試個體之多個序列讀段與病原體參考基因組相比較。
在一些實施例中,所述方法進一步包括分析來自測試個體之第一生物樣品或另一生物樣品中與癌症病況有關之APOBEC蛋白質的表現,且使用序列讀段之量進一步包括使用APOBEC蛋白質之表現以及序列讀段之量確定所述測試個體是否患有所述癌症病況或患所述癌症病況之可能性。
在一些實施例中,所述多個序列讀段中之序列讀段的量係呈針對未患所述癌症之一組物種中映射至病原體目標參考之序列讀段之量的p值形式,當所述p值係在臨限值範圍內時,認為所述測試個體患有所述癌症病況或有患所述癌症病況之可能性,且當所述p值不在臨限值範圍內時,認為所述測試個體 未患所述癌症病況或無患所述癌症病況之可能性。
在一些實施例中,臨限值範圍係小於或等於0.00001、小於或等於0.0001、小於或等於0.001、小於或等於0.002、小於或等於0.003、小於或等於0.004、小於或等於0.005、小於或等於0.01、小於或等於0.02、小於或等於0.03、小於或等於0.04、或小於或等於0.05。
在一些實施例中,所述方法進一步包括基於確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性對測試個體提供治療性干預或成像。
本揭示案之另一態樣提供一種用於在一種物種之測試個體中篩查癌症病況或患第一病況之可能性的電腦系統。所述電腦系統包括一個或多個處理器、一記憶體及一個或多個程式。所述一個或多個程式係儲存於所述記憶體中且經組態以由所述一個或多個處理器執行。所述一個或多個程式包含使用k聚體分析測定映射至病原體目標參考之多個序列讀段之量及使用序列讀段之量確定所述測試個體是否患有所述癌症病況或患所述癌症病況之可能性的指令,其中所述多個序列讀段係自來自測試個體之第一生物樣品獲得,且其中所述第一生物樣品包括來自測試個體之無細胞核酸。
本揭示案之又另一態樣提供非暫時性電腦可讀儲存媒體及嵌入其中之一個或多個電腦程式,其用於在一種物種之測試個體中篩查癌症病況或患第一病況之可能性。所述一個或多個電腦程式包括當由電腦系統執行時使該電腦系統執行方法之指令,所述方法包括使用k聚體分析測定映射至病原體目標參考之多個序列讀段的量,其中所述多個序列讀段係自來自所述測試個體之第一生物樣品獲得,且其中所述第一生物樣品包括來自所述測試個體之無細胞核酸。所述一個或多個電腦程式進一步包括使用序列讀段之量確定所述測試個體是否患有所述癌症病況或患所述癌症病況之可能性的指令。
基於縱向研究提供分類方法.本揭示案之另一態樣係針對使用參考個體之縱向研究開發分類器。根據本揭示案之此態樣,提供一種分類方法,其包括對於一種物種之一組個體中的每一各別參考個體,在電腦系統中執行第一程序,所述電腦系統具有一個或多個處理器及儲存一個或多個程式以藉由所述一個或多個處理器執行之記憶體,其中所述組個體之第一部分患有癌症病況且所述組個體之第二部分未患所述癌症病況。第一程序包括自代表性各別參考癌症個體獲得相應第一生物樣品,其中所述相應第一生物包括無細胞核酸,並對所述相應第一生物樣品中之無細胞核酸進行測序以產生相應第一多個序列讀段。所述一個或多個程式進一步包括分析所述組中每一各別參考癌症個體之相應第一多個序列讀段中APOBEC誘導之突變標誌之富集量之量測值的指令。
在預定時間段內之一個或多個時間點重複以上操作,由此獲得所述組中每一各別參考個體的APOBEC標誌富集量之量測值的相應縱向集合。將所述組中每一各別個體的APOBEC標誌富集量之量測值的相應縱向集合以及APOBEC標誌富集量之量測值的相應縱向集合係來自患有所述癌症病況抑或未患所述癌症病況之一組個體的第一標記施加至未經訓練之分類器,由此獲得經訓練之分類器,該分類器經組態以基於所述物種之測試個體之APOBEC標誌富集量的量測值確定所述測試個體是否患有所述癌症病況。
在一些此類實施例中,所述組個體之第三部分患有第一病毒病況且所述組個體之第四部分未患所述病毒病況,且所述施加進一步施加APOBEC標誌富集量之量測值的相應縱向集合係來自患有所述第一病毒病況抑或未患所述第一病毒病況之一組個體的第二標記,且經組態以確定所述物種之測試個體是否患有所述癌症病況的經訓練之分類器基於所述測試個體之APOBEC標誌富集量之量測值及關於所述測試個體是否患有所述病毒病況之指示作出確定。在一些實施例中,所述組個體之第三部分包含第一部分個體或第二部分個體中之 個體,且所述組個體之第四部分包含第一部分個體或第二部分個體中之個體。
在一些實施例中,所述組個體之第五部分具有與所述癌症病況有關之APOBEC蛋白質的過度表現且所述組個體之第六部分不具有與所述癌症病況有關之APOBEC蛋白質的過度表現,且所述施加進一步施加來自每一各別組個體之每一生物樣品中APOBEC蛋白質之表現量,且經組態以確定所述測試個體是否患有所述癌症病況的經訓練之分類器基於所述測試個體之APOBEC標誌富集量之量測值、關於所述測試個體是否患有所述病毒病況之指示及來自測試個體之生物樣品中APOBEC蛋白質之表現量作出確定。在一些實施例中,所述組個體之第五部分包含第一或第二部分個體中之個體,且所述組個體之第六部分包含第一或第二部分個體中之個體。在一些此類實施例中,所述組個體之第五部分包含第一或第二部分個體中之個體,且所述組個體之第六部分包含所述或第二第一部分個體中之個體。
在一些實施例中,所述分類方法進一步包括自測試個體獲得測試生物樣品,其中所述測試生物樣品包括無細胞核酸;對所述測試生物樣品中之無細胞核酸進行測序以產生多個測試序列讀段;及分析所述多個測試序列讀段中APOBEC誘導之突變標誌之富集量的測試量測值,並將APOBEC標誌富集量之測試量測值施加至經訓練之分類器,由此獲得指示所述測試個體是否患有所述癌症病況之分類器結果。
在一些此類實施例中,測序係藉由全基因組測序、甲基化或非甲基化相關靶向小組測序或全基因組亞硫酸氫鹽測序執行。在一些實施例中,分析第一多個序列讀段中APOBEC誘導之突變標誌之富集量包括將所述多個序列讀段中之每一序列讀段與APOBEC誘導之突變標誌的查找表比對以便確定所述序列讀段是否含有APOBEC誘導之突變標誌之全部或一部分。
在一些實施例中,分析第一多個序列讀段中APOBEC誘導之突變 標誌之富集量包括對所述多個序列讀段中之每一各別序列讀段執行k聚體分析以確定所述各別序列讀段是否含有APOBEC誘導之突變標誌之全部或一部分。
在一些實施例中,第一APOBEC誘導之突變標誌之富集量係藉由將序列讀段中APOBEC誘導之突變標誌之預期量與第一APOBEC誘導之突變標誌之富集量的量測值相比較來測定。
在一些實施例中,APOBEC誘導之突變標誌係第2型APOBEC標誌或第13型APOBEC標誌。在一些實施例中,經訓練之分類器係二項分類器。在一些實施例中,經訓練之分類器係邏輯斯蒂回歸、神經網路、支援向量機或決策樹演算法。在一些實施例中,所述分類器係多項分類器,其確定所述個體患有第一抑或第二癌症病況。
在一些實施例中,經訓練之分類器係邏輯斯蒂回歸演算法,所述邏輯斯蒂回歸演算法提供所述測試個體患抑或未患所述癌症病況的可能性。在一些實施例中,所述邏輯斯蒂回歸提供有關所述測試個體患有抑或未患所述癌症病況的二項評估。在一些實施例中,所述預定時間段包括至少1、2、3、4、5、6或12個月且所述一個或多個時間點包括分佈於整個預定時間段內之至少2、4、6、8或10個時間點。
在一些實施例中,所述第一病毒病況係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
在一些實施例中,所述物種之所述組個體包括至少20位、50位、100位、200位或500位個體。在一些實施例中,所述方法進一步包括基於確定 所述測試個體是否患有所述癌症病況,對所述測試個體提供治療性干預或成像。
本揭示案之另一態樣提供一種用於分類之電腦系統。所述電腦系統包括一個或多個處理器、一記憶體及一個或多個程式。所述一個或多個程式係儲存於所述記憶體中且經組態以由所述一個或多個處理器執行。所述一個或多個程式包含執行以上所描述之實施例及方法中之任一種及全部的指令。本揭示案之另一態樣提供非暫時性電腦可讀儲存媒體及嵌入其中的用於分類之一個或多個電腦程式。所述一個或多個電腦程式包括當由電腦系統執行時使該電腦系統執行以上所描述之實施例及方法中之任一種及全部的指令。
實例1-產生甲基化狀態向量. 圖18係一流程圖,其描述根據本揭示案之一個實施例,對cfDNA片段測序以獲得甲基化狀態向量的製程1800。參看步驟1802,自生物樣品獲得cfDNA片段(例如,如上文結合圖2所論述)。參看步驟1820,處理cfDNA片段以將未甲基化之胞嘧啶轉化成尿嘧啶。在一個實施例中,對所述DNA進行亞硫酸氫鹽處理,將cfDNA片段之未甲基化胞嘧啶轉化成尿嘧啶,但不轉化甲基化胞嘧啶。舉例而言,在一些實施例中,使用商業套組,諸如EZ DNA MethylationTM-Gold、EZ DNA MethylationTM-Direct或EZ DNA MethylationTM-Lightning套組(購自Zymo Research Corp(加利福尼亞州爾灣市(Irvine,CA)))進行亞硫酸氫鹽轉化。在其他實施例中,未甲基化胞嘧啶轉化成尿嘧啶係使用酶反應實現。舉例而言,該轉化可以使用將未甲基化胞嘧啶轉化成尿嘧啶之市售套組,諸如APOBEC-Seq(馬薩諸塞州伊普斯維奇(Ipswich,MA)之NEBiolabs)。
由經轉化之cfDNA片段製備測序文庫(步驟1830)。視情況,使用多個雜交探針,在測序文庫中富集1835提供癌症狀態資訊的cfDNA片段或基因組區域。所述雜交探針係能夠與特別指定之cfDNA片段或靶向區域雜交並富集該等片段或區域用於後續測序及分析的短寡核苷酸。研究人員可使用雜交 探針執行一組指定所關注CpG位點之靶向、高深度分析。測序文庫或其一部分一經製備,即可經測序以獲得多個序列讀段(1840)。序列讀段可呈電腦可讀的數位形式以供電腦軟體處理及解譯。
基於所述序列讀段與參考基因組之比對測定所述序列讀段中各CpG位點之位置及甲基化狀態(1850)。每一片段之甲基化狀態向量指定參考基因組中所述片段之位置(例如,如由每一片段中第一CpG位點之位置或另一類似度量指定)、所述片段中CpG位點之數量及所述片段中每一CpG位點之甲基化狀態(1860)。
實例2-獲得多個序列讀段. 圖19係根據一個實施例的用於製備測序用核酸樣品之方法1900的流程圖。方法1900包含但不限於以下步驟。舉例而言,方法1900之任何步驟均可包括本領域中熟習此項技術者已知用於品質控制或其他實驗室分析程序的定量子步驟。
在區塊1902中,自個體提取核酸樣品(DNA或RNA)。所述樣品可以為人類基因組之任何子集,包含整個基因組。樣品可以自已知患有或疑似患有癌症之個體提取。樣品可以包含血液、血漿、血清、尿液、糞便、唾液、其他類型體液或其任何組合。在一些實施例中,抽取血液樣品之方法(例如注射器或刺破手指)的創傷性可低於可能需要手術的用於獲得組織生物檢體之程序。所提取之樣品可以包括cfDNA及/或ctDNA。對於健康個體,人體能夠天然地清除cfDNA及其他細胞碎片。若個體患有癌症或疾病,則所提取樣品中之ctDNA可以可偵測水準存在以便診斷。
在區塊1904中,製備測序文庫。在文庫製備期間,經由接頭連接將獨特分子標識符(unique molecular identifier,UMI)添加至核酸分子(例如DNA分子)。UMI係在接頭連接期間添加至DNA片段兩端之短核酸序列(例如4-10個鹼基對)。在一些實施例中,UMI係簡併鹼基對,其充當獨特標籤,可用於標 識源自特定DNA片段之序列讀段。在接頭連接後進行PCR擴增期間,UMI與附接之DNA片段一起複製。由此提供一種在下游分析中標識來自同一原始片段之序列讀段的方式。
在區塊1906,自所述文庫中富集靶向DNA序列。在富集期間,使用雜交探針(在本文中又稱為「探針」)靶向並下拉提供癌症(或疾病)存在或不存在、癌症狀態或癌症分類(例如癌症類型或起源組織)之資訊的核酸片段。對於給定工作流程,探針可設計成與DNA之目標(互補)股黏接(或雜交)。目標股可為「正」股(例如轉錄成mRNA且隨後轉譯成蛋白質之股)或互補「負」股。探針長度可在10、100或1000個鹼基對之範圍內。在一個實施例中,探針係基於一組基因設計以分析(例如人類或另一生物體之)基因組中疑似對應於某些癌症或其他類型疾病之特定突變或目標區域。此外,探針可以覆蓋目標區域之重疊部分。
圖20係根據一個實施例的用於獲得序列讀段之製程的圖形表示。圖20描繪來自樣品之核酸區段2000的一個實例。此處,核酸區段2000可以為單股核酸區段,諸如單股的。在一些實施例中,核酸區段2000係雙股cfDNA區段。所示實例描繪核酸區段中可作為不同探針之目標的三個區域2005A、2005B及2005C。具體而言,三個區域2005A、2005B及2005C各自包含在核酸區段2000上之重疊位置。示例重疊位置在圖20中被描繪為胞嘧啶(「C」)核苷酸鹼基2002。胞嘧啶核苷酸鹼基2002係位於區域2005A之第一邊緣附近、在區域2005B之中心且在區域2005C之第二邊緣附近。
在一些實施例中,一個或多個(或所有)探針係基於一組基因設計以分析(例如人類或另一生物體之)基因組中疑似對應於某些癌症或其他類型疾病之特定突變或目標區域。藉由使用一組標靶基因而非對基因組之所有表現基因測序,又稱為「全外顯子組測序」,方法2000可用於增加目標區域之測序 深度,其中深度係指樣品內之給定目標序列經測序之次數的計數。增加測序深度使得所需的核酸樣品輸入量減少。
使用一個或多個探針雜交核酸樣品2000有助於瞭解目標序列2070。如圖20中所示,目標序列2070係區域2005中作為雜交探針之目標的核苷酸鹼基序列。目標序列2070亦可稱為雜交之核酸片段。舉例而言,目標序列2070A對應於作為第一雜交探針之目標的區域2005A,目標序列2070B對應於作為第二雜交探針之目標的區域2005B,且目標序列2070C對應於作為第三雜交探針之目標的區域2005C。鑒於胞嘧啶核苷酸鹼基2002位於作為雜交探針之目標的每一區域2005A-C內之不同位置處,每一目標序列2070包含對應於目標序列2070上特定位置處之胞嘧啶核苷酸鹼基2002的核苷酸鹼基。
在雜交步驟之後,捕捉雜交之核酸片段且可使用PCR進行擴增。舉例而言,可以富集目標序列2070以獲得富集之序列2080,隨後可以對其進行測序。在一些實施例中,每一富集之序列2080係由目標序列2070複製得到。分別由目標序列2070A及2070C擴增的富集之序列2080A及2080C亦包含位於每一序列讀段2080A或2080C之邊緣附近的胸腺嘧啶核苷酸鹼基。如下文所使用,富集之序列2080中相對於參考對偶基因(例如胞嘧啶核苷酸鹼基2002)突變的突變核苷酸鹼基(例如胸腺嘧啶核苷酸鹼基)被視為替代性對偶基因。另外,由目標序列2070B擴增的每一富集之序列2080B包含位於每一富集之序列2080B之附近或中心處的胞嘧啶核苷酸鹼基。
在區塊1908中,由富集之DNA序列,例如圖20中所示的富集之序列2080產生序列讀段。測序資料可以藉由本領域中已知之手段,自富集之DNA序列獲取。舉例而言,方法1900可以包含下一代測序(NGS)技術,包含合成技術(Illumina)、焦磷酸測序(454 Life Sciences)、離子半導體技術(Ion Torrent測序)、單分子即時測序(Pacific Biosciences)、連接測序(SOLiD測序)、奈 米孔測序(Oxford Nanopore Technologies)或配對端測序(paired-end sequencing)。在一些實施例中,使用合成測序,利用可逆染料終止子執行大規模平行測序。
在一些實施例中,可使用本領域中已知之方法使序列讀段與參考基因組比對以確定比對位置資訊。比對位置資訊可以指示參考基因組中對應於給定序列讀段之起始核苷酸鹼基及終止核苷酸鹼基的區域之起始位置及終止位置。比對位置資訊亦可包含序列讀段長度,其可以由所述起始位置及終止位置確定。參考基因組中之區域可能與基因或基因區段有關。
在各種實施例中,序列讀段包含表示為R 1R 2之讀段對。舉例而言,第一讀段R 1可以自核酸片段之第一端開始測序,而第二讀段R 2可以自所述核酸片段的第二端開始測序。因此,將第一讀段R 1與第二讀段R 2之核苷酸鹼基對可以始終與參考基因組之核苷酸鹼基比對(例如呈相對取向)。由讀段對R 1R 2得到的比對位置資訊可以包含參考基因組中對應於第一讀段(例如R 1)之一端的起始位置,及參考基因組中對應於第二讀段(例如R 2)之一端的終止位置。換言之,參考基因組中之起始位置及終止位置表示所述核酸片段所對應的參考基因組內之可能位置。可生成並輸出具有序列比對圖譜(sequence alignment map,SAM)格式或二進制(binary,BAM)格式之輸出檔案以進行進一步分析,諸如上文結合圖2所描述之變異體識別。
結論
對於本文中作為單一實例描述之組件、操作或結構可提供多個實例。最後,各種組件、操作與資料儲存之間的邊界在某種程度上係任意的,且在特定說明性組態之上下文中說明特定操作。設想其他功能分配且可在當前所描述之實施方案的範圍內。一般而言,在示例組態中作為獨立組件呈現之結構及功能性可作為組合結構或組件實施。類似地,作為單一組件呈現之結構及功能性可作為獨立組件實施。此等及其他變化、修改、添加及改進處於所述實施方案之範 圍內。
亦應理解,儘管術語第一、第二等可在本文中用於描述各種元件,但此等元件不應受此等術語限制。此等術語僅用於將一個元件與另一元件相區分。舉例而言,第一個體可稱為第二個體,且類似地,第二個體可稱為第一個體,而不會背離本揭示案之範圍。第一個體與第二個體皆為個體,但其並非同一個體。
本揭示案中所使用之術語僅意圖描述特定實施例且並不打算限制本發明。除非上下文中另外楚指示,否則如本發明之描述及所附申請專利範圍中所使用,單數形式「一個(種)」及「所述」亦意圖包含複數形式。亦應理解,如本文所使用,術語「及/或」係指且涵蓋相關所列項目中一項或多項之任何及所有可能組合。亦應理解,術語「包括(comprises/comprising)」、「包含(including/includes)」、「具有(having/has)」、「含(with)」或其變化形式當用於本說明書或申請專利範圍中時,指明所述特徵、整數、步驟、操作、成分及/或組件之存在,但不排除一種或多種其他特徵、整數、步驟、操作、成分、組件及/或其群組之存在或添加。
如本文所使用,術語「若」可視取決於上下文而解釋為意謂「當......時」或「在......後」或「響應於測定」或「響應於偵測到」。類似地,片語「若測定」或「若偵測到[所陳述情形或事件]」可取決於上下文而解釋為意謂「在測定後」或「響應於測定」或「在偵測到[所陳述情形或事件]後」或「響應於偵測到[所陳述情形或事件]」。
前述描述包含體現例示性實施方案之示例系統、方法、技術、指令序列及計算機程式產品。出於說明之目的,陳述多種具體詳情以便提供對本發明主題各種實施方案之理解。然而,本領域中熟習此項技術者將顯而易見,可在無此等特定細節之情況下實踐本發明主題之實施方案。一般而言,熟知之指令實 例、方案、結構及技術並未詳細顯示。
出於說明之目的,已參照特定實施方案描述前述描述。然而,以上之說明性論述並不意欲為詳盡的或將所述實施方案侷限於所揭示之精確形式。鑒於以上教示,許多修改及變化係可能的。選擇並描述該等實施方案以便最佳地闡明原理及其實際應用,藉此使本領域中熟習此項技術者能夠最佳利用實施方案以及具有適合所涵蓋之特定用途之各種修改的各種實施方案。
100‧‧‧系統
102‧‧‧處理核心
104‧‧‧網路介面
106‧‧‧使用者介面
108‧‧‧顯示器
110‧‧‧輸入
111‧‧‧非持續記憶體
112‧‧‧持續記憶體
114‧‧‧通信匯流排
116‧‧‧可選操作系統
118‧‧‧可選網路通信模組
120‧‧‧病況評價模組
122‧‧‧關於來自測試個體之生物樣品1的資料構造
124‧‧‧第一特徵量測
126‧‧‧關於來自測試個體之生物樣品2的資料構造
128-1‧‧‧序列讀段1
128-1-1‧‧‧序列讀段1-1
128-1-2‧‧‧序列讀段1-2
128-1-M‧‧‧序列讀段1-M
128-2‧‧‧序列讀段2
128-M‧‧‧序列讀段M
130-1‧‧‧病原體目標參考1
130-2‧‧‧病原體目標參考2
130-Q‧‧‧病原體目標參考Q
132-1‧‧‧第1組資料集
132-2‧‧‧第2組
132-K‧‧‧第K組
134-1-1‧‧‧第1組個體1
134-1-2‧‧‧第1組個體2
134-1-Q‧‧‧第1組個體Q

Claims (304)

  1. 一種在一測試個體中篩查一癌症病況之方法,所述方法包括:(a)自所述測試個體獲得一第一生物樣品,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸;(b)對所述第一生物樣品中之所述無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段;(c)對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應量,由此獲得一組序列讀段量,所述組序列讀段量中之每一各別序列讀段量對應於所述組病原體中一相應病原體;以及(d)使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  2. 如申請專利範圍第1項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述使用(d)使用所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  3. 如申請專利範圍第1項所述的方法,其中所述方法進一步包括:經由k聚體分析評價所述多個序列讀段以獲得一關於一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述使用(d)使用所述關於與所述第一病原體有關的所述APOBEC誘導之 突變標誌存在抑或不存在的指示以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  4. 如申請專利範圍第2項至第3項中任一項所述的方法,其中所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的一量測值;且所述使用(d)使用所述APOBEC誘導之突變標誌之富集量的量測值以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  5. 如申請專利範圍第2項至第3項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  6. 如申請專利範圍第1項至第5項中任一項所述的方法,其中所述方法進一步包括:分析來自所述測試個體之所述第一生物樣品或一第二生物樣品中與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現,且其中所述使用(d)使用所述APOBEC蛋白質之表現及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  7. 如申請專利範圍第6項所述的方法,其中所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
  8. 如申請專利範圍第1項至第7項中任一項所述的方法,其中所述測序(b)係藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行。
  9. 如申請專利範圍第1項至第8項中任一項所述的方法,其中所述各別病原體之所述病原體目標參考由來自所述各別病原體之參考基因組的一 靶向小組序列組成且所述測定(c)對於所述各別病原體,限制所述多個序列讀段中每一序列讀段於來自所述各別病原體之參考基因組之相應靶向小組序列中的映射。
  10. 如申請專利範圍第9項所述的方法,其中所述映射包括(i)所述多個序列讀段中之一個或多個序列讀段與(ii)所述各別病原體之所述病原體目標參考中一序列之間的序列比對。
  11. 如申請專利範圍第1項至第8項中任一項所述的方法,其中所述各別病原體之所述病原體目標參考包括所述各別病原體之一參考基因組且對於所述各別病原體,所述測定(c)使用所述各別病原體之整個參考基因組比對所述多個序列讀段中之每一序列讀段。
  12. 如申請專利範圍第1項至第11項中任一項所述的方法,其中所述組病原體係單一病原體。
  13. 如申請專利範圍第1項至第11項中任一項所述的方法,其中:所述組病原體係多種病原體,且所述測定(c)係對所述多種病原體中之每一各別病原體執行。
  14. 如申請專利範圍第1項至第13項中任一項所述的方法,其中所述使用(d)包括:測定與一第一分佈之一預定百分位數有關的所述組病原體中之一第一病原體之序列讀段的一參考量,其中一第一組個體中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量貢獻所述第一分佈,且所述第一組個體之一第一部分中的每一個體皆患有所述癌症病況,且所述第一組個體之一第二部分中的每一個體皆未患所述癌症病況,且將(i)一第一量與(ii)一第二量相比較,所述第一量係來自所述測試個體的映 射至所述第一病原體之所述病原體目標參考中一序列的所述多個序列讀段之量,所述第二量係與所述第一分佈之預定百分位數有關的所述組病原體中之所述第一病原體之序列讀段的參考量,其中當所述第一量超過所述第二量一臨限量時,調整所述測試個體患所述癌症病況的可能性或確定所述測試個體患有所述癌症病況。
  15. 如申請專利範圍第1項至第13項中任一項所述的方法,其中所述使用(d)包括:測定與一第一分佈之一預定百分位數有關的所述組病原體中之一第一病原體之序列讀段的一參考量,其中未患所述癌症病況的一第一組個體中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量貢獻所述第一分佈,藉由與所述第一分佈之預定百分位數有關的所述組病原體中所述第一病原體之序列讀段之參考量對來自所述測試個體的映射至所述第一病原體之所述病原體目標參考中一序列的所述多個序列讀段之量定限,由此形成所述多個序列讀段的一按比例調整之量,及將(i)所述多個序列讀段的所述按比例調整之量與(ii)與一第二分佈之一預定百分位數有關的所述多個序列讀段的一按比例調整之量相比較,其中一第二組個體中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一按比例調整之量貢獻所述第二分佈,所述第二組中之一第一部分個體中的每一個體皆患有所述癌症病況,且所述第二組中之一第二部分個體中的每一個體皆未患所述癌症病況。
  16. 如申請專利範圍第15項所述的方法,其中當來自所述測試個 體之所述多個序列讀段的所述按比例調整之量超過與所述第二分佈之預定百分位數有關的多個序列讀段的所述按比例調整之量一第一預定截止值時,認為所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性。
  17. 如申請專利範圍第1項至第13項中任一項所述的方法,其中所述使用(d)包括:將所述組序列讀段量施加至一分類器,由此確定(i)所述測試個體是否患有所述癌症病況或(ii)所述測試個體患所述癌症病況的可能性。
  18. 如申請專利範圍第17項所述的方法,所述方法進一步包括:在所述使用(d)之前,藉由對於一第一組個體中之每一各別個體,將映射至所述組病原體中一各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量輸入所述分類器中,訓練所述分類器,其中所述第一組中所述個體之一第一部分中的每一個體皆患有所述癌症病況且所述第一組中所述個體之一第二部分中的每一個體皆未患所述癌症病況。
  19. 如申請專利範圍第17項所述的方法,所述方法進一步包括:在所述使用(d)之前,藉由對於一第一組個體中之每一各別個體,將映射至所述組病原體中一各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一正規化量輸入所述分類器中,訓練所述分類器,其中所述第一組中所述個體之一第一部分中的每一個體皆患有所述癌症病況,所述第一組中所述個體之一第二部分中的每一個體皆未患所述癌症病況,藉由根據與一第二分佈之一預定百分位數有關的所述各別病原體之序列讀段之一參考量使映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之量正規化,獲得映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的正規化量,未患所述癌症病況的一第二組個體中之每一各別個體用映射至所述各別病 原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量貢獻所述第二分佈。
  20. 如申請專利範圍第18項或第19項所述的方法,其中所述分類器係一二項分類器。
  21. 如申請專利範圍第20項所述的方法,其中所述分類器係基於一邏輯斯蒂回歸演算法。
  22. 如申請專利範圍第21項所述的方法,其中所述邏輯斯蒂回歸演算法提供所述測試個體患或未患所述癌症病況的可能性。
  23. 如申請專利範圍第21項所述的方法,其中所述邏輯斯蒂回歸演算法提供有關所述測試個體患有抑或未患所述癌症病況的二項評估。
  24. 如申請專利範圍第21項所述的方法,其中所述邏輯斯蒂回歸演算法提供多種可能性,所述多種可能性中之每一各別可能性係所述測試個體患多種癌症病況中之一相應癌症病況的可能性,且所述多種癌症病況包含所述癌症病況。
  25. 如申請專利範圍第18項或第19項所述的方法,其中所述分類器係一多項分類器。
  26. 如申請專利範圍第25項所述的方法,其中所述分類器係基於一邏輯斯蒂回歸演算法、一神經網路演算法、一支援向量機演算法或一決策樹演算法。
  27. 如申請專利範圍第1項所述的方法,所述方法進一步包括:執行一分析,所述分析包括量測所述第一生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述使用(d)包括使用所述APOBEC誘導之突變標誌的量以及所述組序列 讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  28. 如申請專利範圍第1項所述的方法,所述方法進一步包括:自所述測試個體獲得一第二生物樣品,其中所述第二生物樣品包括來自所述測試個體之無細胞核酸及來自所述組病原體中之一第一病原體的潛在地無細胞核酸;以及執行一分析,所述分析包括量測所述第二生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述使用(d)包括使用所述APOBEC誘導之突變標誌的量以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  29. 如申請專利範圍第27項至第28項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  30. 如申請專利範圍第1項至第29項中任一項所述的方法,其中所述測試個體係人。
  31. 如申請專利範圍第1項至第30項中任一項所述的方法,其中所述癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。
  32. 如申請專利範圍第31項所述的方法,其中所述癌症病況係早期癌症。
  33. 如申請專利範圍第1項至第32項中任一項所述的方法,其中所述癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。
  34. 如申請專利範圍第33項所述的方法,其中所述癌症病況係晚 期癌症。
  35. 如申請專利範圍第1項至第32項中任一項所述的方法,其中所述癌症病況係液體癌症、肝癌或肺癌。
  36. 如申請專利範圍第1項至第35項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係血漿。
  37. 如申請專利範圍第1項至第35項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係來自所述測試個體之同一生物樣品的不同等分試樣。
  38. 如申請專利範圍第1項至第35項中任一項所述的方法,其中所述第一生物樣品與所述第二生物樣品係相同生物樣品。
  39. 如申請專利範圍第1項至第38項中任一項所述的方法,其中所述第一生物樣品包括所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。
  40. 如申請專利範圍第1項至第38項中任一項所述的方法,其中所述第一生物樣品由所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液組成。
  41. 如申請專利範圍第1項至第40項中任一項所述的方法,其中所述組病原體中之一各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
  42. 如申請專利範圍第1項至第40項中任一項所述的方法,其中 所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。
  43. 如申請專利範圍第1項至第40項中任一項所述的方法,其中所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
  44. 如申請專利範圍第1項至第40項中任一項所述的方法,其中所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。
  45. 如申請專利範圍第14項至第16項或第18項至第26項中任一項所述的方法,其中所述第一組包括二十位個體。
  46. 如申請專利範圍第14項至第16項或第18項至第26項中任一項所述的方法,其中所述第一組包括一百位個體。
  47. 如申請專利範圍第14項至第16項中任一項所述的方法,其中所述第一組包括二十位個體,且所述第一組中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的百分比貢獻所述第一分佈。
  48. 如申請專利範圍第14項至第16項中任一項所述的方法,其中 所述第一組包括一百位個體,且所述第一組中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的百分比貢獻所述第一分佈。
  49. 如申請專利範圍第18項所述的方法,其中映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的量係與所述各別病原體之所述病原體目標參考中一序列比對的自所述各別個體量測的所述多個序列讀段之百分比。
  50. 如申請專利範圍第1項至第49項中任一項所述的方法,其中映射至所述各別病原體之所述病原體目標參考中一序列的所述多個序列讀段之相應量係來自所述測試個體之所述多個序列讀段的百分比。
  51. 如申請專利範圍第14項所述的方法,其中來自所述各別個體之序列讀段的量係映射至所述第一病原體之所述病原體目標參考中一序列的自所述各別個體量測之序列讀段的百分比。
  52. 如申請專利範圍第14項至第16項中任一項所述的方法,其中所述第一分佈之預定百分位數係第95百分位數。
  53. 如申請專利範圍第14項至第16項中任一項所述的方法,其中所述第一分佈之預定百分位數係第98百分位數。
  54. 如申請專利範圍第16項所述的方法,其中所述第一預定截止值係零。
  55. 如申請專利範圍第16項所述的方法,其中所述第一預定截止值係與所述第二分佈之集中趨勢的量測值相差單一標準差。
  56. 如申請專利範圍第16項所述的方法,其中所述第一預定截止值係與所述第二分佈之集中趨勢的量測值相差三個標準差。
  57. 如申請專利範圍第1項所述的方法,其中 所述組病原體包括一第一病原體及一第二病原體,所述測定(c)包括:i)測定映射至所述第一病原體之一第一病原體目標參考中一序列的所述多個序列讀段之一第一量,ii)測定映射至所述第二病原體之一第二病原體目標參考中一序列的所述多個序列讀段之一第二量,iii)藉由與一第一分佈之一第一預定百分位數有關的所述第一病原體之序列讀段之一第一參考量對映射至所述第一病原體目標參考中一序列的來自所述測試個體之所述多個序列讀段的所述第一量定限,由此形成來自所述測試個體之所述多個序列讀段的一按比例調整之第一量,其中未患所述癌症病況之一第一組個體中之每一各別個體用映射至所述第一病原體之所述第一病原體目標參考中一序列的來自所述各別個體之序列讀段的一量貢獻所述第一分佈,及iv)藉由與一第二分佈之一第二預定百分位數有關的所述第二病原體之序列讀段之一第二參考量對映射至所述第二病原體目標參考中一序列的來自所述測試個體之所述多個序列讀段的所述第二量定限,由此確定來自所述測試個體之所述多個序列讀段的一按比例調整之第二量,其中未患所述癌症病況之一第二組個體中之每一各別個體用映射至所述第二病原體之所述第二病原體目標參考中一序列的來自所述各別個體之序列讀段的一量貢獻所述第二分佈,且其中當至少輸入所述按比例調整之第一量及所述按比例調整之第二量的一分類器指示所述測試個體患有所述癌症病況時,所述使用(d)認為所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性。
  58. 如申請專利範圍第57項所述的方法,其中所述分類器係基於一邏輯斯蒂回歸演算法,所述邏輯斯蒂回歸基於在一訓練組個體中所觀察到的映射至所述第一病原 體目標參考中一序列的序列讀段之一量,單獨地對所述按比例調整之第一量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體,且所述邏輯斯蒂回歸基於在所述訓練組中所觀察到的映射至所述第二病原體目標參考中一序列的序列讀段之一量,單獨地對所述按比例調整之第二量進行加權。
  59. 如申請專利範圍第1項所述的方法,其中:所述測定(c)包括基於與一各別分佈之一預定百分位數有關的序列讀段之一量對映射至所述各別病原體之病原體目標參考中一序列的所述多個序列讀段之相應量定限,其中未患所述癌症病況的一各別組個體中之每一各別個體用映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量貢獻所述各別分佈,由此測定來自所述測試個體之所述多個序列讀段的一按比例調整之各別量,且其中當輸入來自所述測試個體之所述多個序列讀段的至少每一按比例調整之各別量的一分類器指示所述測試個體患有所述癌症病況時,所述使用(c)認為所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性。
  60. 如申請專利範圍第59項所述的方法,其中:所述分類器係基於一邏輯斯蒂回歸演算法,其基於在一訓練組個體中所觀察到的映射至所述相應病原體之所述病原體目標參考中一序列的序列讀段之一相應量,單獨地對所述多個序列讀段的每一按比例調整之各別量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。
  61. 如申請專利範圍第59項所述的方法,其中所述組病原體包括在兩種與一百種之間之病原體。
  62. 如申請專利範圍第57項或第59項所述的方法,其中所述分類 器係基於一邏輯斯蒂回歸演算法、一神經網路演算法、一支援向量機演算法或一決策樹演算法,所述演算法已針對一訓練組個體進行訓練,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。
  63. 如申請專利範圍第1項所述的方法,其中所述測定(c)包括基於與一各別分佈之一預定百分位數有關的序列讀段之一量對映射至所述各別病原體之所述病原體目標參考中一序列的來自所述測試個體之所述多個序列讀段之相應量定限,其中未患所述癌症病況的一各別組個體中之每一各別個體用映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一量貢獻所述各別分佈,由此測定來自所述測試個體之所述多個序列讀段的一按比例調整之各別量,且所述使用(d)對來自所述測試個體之所述多個序列讀段的每一按比例調整之各別量求和以確定總體腫瘤病原體負荷,其中當所述總體腫瘤病原體負荷滿足一臨限截止值條件時,所述使用(d)指示所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性。
  64. 如申請專利範圍第1項所述的方法,其中當所述組序列讀段量超過一臨限截止值條件時,所述使用(d)判定所述測試個體患有所述癌症病況或所述測試個體有患所述癌症病況的可能性,所述截止值條件係針對未患所述癌症病況之一組個體所測定的所述組病原體之總體腫瘤病原體負荷的預定特異性。
  65. 如申請專利範圍第64項所述的方法,其中所述預定特異性係第95百分位數。
  66. 如申請專利範圍第1項至第65項中任一項所述的方法,其中所述測定映射至所述各別病原體之所述病原體目標參考中一序列的所述多個序列讀段之一相應量包括在一閱讀框架中轉譯來自所述測試個體之所述多個 序列讀段以形成多個轉譯之序列讀段並將所述多個轉譯之序列讀段與所述病原體目標參考中每一序列之轉譯相比較。
  67. 如申請專利範圍第1項至第66項中任一項所述的方法,其中所述測定映射至所述各別病原體之所述病原體目標參考中一序列的所述多個序列讀段之一相應量包括在核酸、核糖核酸或蛋白質空間中對來自所述測試個體之所述多個序列讀段與所述病原體目標參考進行k聚體匹配。
  68. 如申請專利範圍第1項至第67項中任一項所述的方法,其中所述測試個體係人,且所述方法進一步包括在所述人類基因組內對所述多個序列讀段之相應量執行一終點分析,且所述使用(d)進一步使用所述終點分析確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  69. 如申請專利範圍第1項至第68項中任一項之方法,其進一步包括:(e)基於步驟(d)中所述測定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性,對所述測試個體提供一治療性干預或成像。
  70. 一種在一測試個體中篩查一癌症病況的方法,所述方法包括:(a)自所述測試個體獲得一第一生物樣品,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸;(b)執行一第一分析,所述分析包括量測所述第一生物樣品中所述無細胞核酸之一第一特徵之量;(c)執行一第二分析,其包括:i.對一第二生物樣品中的所述無細胞核酸進行測序以產生來自所述測試個 體之多個序列讀段,其中所述第二生物樣品係來自所述測試個體,且其中所述第二生物樣品包括來自所述測試個體之無細胞核酸及來自所述組病原體中之至少一種病原體的潛在地無細胞核酸,及ii.對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應量,由此獲得一組序列讀段量,所述組序列讀段量中之每一各別序列讀段量對應於所述組病原體中之一相應病原體;以及(d)基於步驟(b)及步驟(c)篩查所述癌症病況,其中當所述第一分析或所述第二分析,或所述第一分析及所述第二分析兩者指示所述測試個體患有或未患所述癌症病況或提供所述測試個體患或未患所述癌症病況的可能性時,認為所述測試個體有患所述癌症病況的可能性或患有所述癌症病況。
  71. 如申請專利範圍第70項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述篩查(d)使用(i)所述關於與一第一病原體有關的所述特徵片段特徵存在抑或不存在的指示、(ii)所述第一特徵之量及(iii)所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  72. 如申請專利範圍第70項所述的方法,其中所述方法進一步包括:經由k聚體分析評價所述多個序列讀段以獲得一關於一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述篩查(d)使用(i)所述關於與一第一病原體有關的所述特徵片段特徵存在 抑或不存在的指示、(ii)所述第一特徵之量及(iii)所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  73. 如申請專利範圍第71項至第73項中任一項所述的方法,其中所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的一量測值;且所述篩查(d)使用(i)所述關於與一第一病原體有關的所述特徵片段特徵存在抑或不存在的指示、(ii)所述第一特徵之量及(iii)所述APOBEC誘導之突變標誌之富集量的所述量測值確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  74. 如申請專利範圍第70項至第73項中任一項所述的方法,其中所述方法進一步包括:分析來自所述測試個體之所述第一生物樣品或一第二生物樣品中與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現,且其中所述篩查(d)使用(i)所述關於與一第一病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述第一特徵之量及(iii)與所述第一病原體有關的所述APOBEC蛋白質之表現確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  75. 如申請專利範圍第74項所述的方法,其中所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
  76. 如申請專利範圍第70項至第75項中任一項所述的方法,所述方法進一步包括: 執行一第三分析,所述分析包括量測所述第一生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述篩查(d)使用(i)所述關於與一第一病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述第一特徵之量及(iii)所述APOBEC誘導之突變標誌的量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  77. 如申請專利範圍第70項至第75項中任一項所述的方法,其中執行所述第二分析進一步包括:量測所述第二生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述篩查(d)使用(i)所述關於與一第一病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述第一特徵之量及(iii)所述APOBEC誘導之突變標誌的量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  78. 如申請專利範圍第71項至第77項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  79. 如申請專利範圍第70項所述的方法,其中所述測序(c)(i)係藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行。
  80. 如申請專利範圍第70項所述的方法,其中所述測試個體係人。
  81. 如申請專利範圍第70項至第80項中任一項所述的方法,其中所述癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。
  82. 如申請專利範圍第81項所述的方法,其中所述癌症病況係早期癌症。
  83. 如申請專利範圍第70項或第80項所述的方法,其中所述癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。
  84. 如申請專利範圍第83項所述的方法,其中所述癌症病況係晚期癌症。
  85. 如申請專利範圍第70項所述的方法,其中所述癌症病況係液體癌症、肝癌或肺癌。
  86. 如申請專利範圍第70項至第85項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係血漿。
  87. 如申請專利範圍第70項至第85項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係來自所述測試個體之同一生物樣品的不同等分試樣。
  88. 如申請專利範圍第70項至第85項中任一項所述的方法,其中所述第一生物樣品與所述第二生物樣品係相同生物樣品。
  89. 如申請專利範圍第70項至第88項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品包括所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。
  90. 如申請專利範圍第70項至第88項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品由所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、淚液、胸膜液、心包液或腹膜液組成。
  91. 如申請專利範圍第70項至第90項中任一項所述的方法,其中所述各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人 乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
  92. 如申請專利範圍第70項至第90項中任一項所述的方法,其中所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。
  93. 如申請專利範圍第70項至第90項中任一項所述的方法,其中所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
  94. 如申請專利範圍第70項至第93項中任一項所述的方法,其中所述測試個體係人,且所述第一特徵係所述人類基因組中一靶向小組基因的體細胞複本數變化計數。
  95. 如申請專利範圍第94項所述的方法,其中所述靶向小組基因由二十個與六百個之間的基因組成。
  96. 如申請專利範圍第70項至第93項中任一項所述的方法,其中所述測試個體係人,且所述第一特徵係所述人類基因組中的體細胞複本數變化計數。
  97. 如申請專利範圍第70項至第93項中任一項所述的方法,其中所述測試個體係人,且所述第一特徵係所述人類基因組中之一靶向小組基因中的一單核苷酸變異 體計數、一插入突變計數、一缺失突變計數或一核酸重排計數。
  98. 如申請專利範圍第70項至第90項中任一項所述的方法,其中所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。
  99. 如申請專利範圍第70項所述的方法,其中所述各別病原體之所述病原體目標參考由來自所述各別病原體之參考基因組的一相應靶向小組序列組成且所述執行(c)(ii)對於所述各別病原體,限制所述多個序列讀段中之每一序列讀段於來自所述各別病原體之所述參考基因組的所述相應靶向小組序列中的映射。
  100. 如申請專利範圍第99項所述的方法,其中所述映射包括(i)所述多個序列讀段中之一個或多個序列讀段與(ii)來自所述各別病原體之所述參考基因組的所述相應靶向小組序列中一序列之間的序列比對。
  101. 如申請專利範圍第99項所述的方法,其中所述映射包括(i)所述多個序列讀段中之一個或多個序列讀段與(ii)來自所述各別病原體之所述參考基因組的所述相應靶向小組序列中一序列之間甲基化模式的比較。
  102. 如申請專利範圍第70項所述的方法,其中所述病原體目標參考包括所述各別病原體之一參考基因組或其一部分,且所述執行(c)(ii)對於所述各別病原體,使用所述各別病原體之完整參考基因組比對所述多個序列讀段中之一個或多個序列讀段。
  103. 如申請專利範圍第70項所述的方法,其中所述病原體目標參 考係所述各別病原體之一參考基因組或其一部分,且所述執行(c)(ii)對於所述各別病原體,將所述多個序列讀段中之一個或多個序列讀段的甲基化模式與所述各別病原體之所述完整參考基因組的甲基化模式相比較。
  104. 如申請專利範圍第70項至第103項中任一項所述的方法,其中所述組病原體係單一病原體。
  105. 如申請專利範圍第70項至第103項中任一項所述的方法,其中所述組病原體包括多種病原體,且所述執行(c)(ii)係對所述多種病原體中之每一各別病原體執行。
  106. 如申請專利範圍第70項至第105項中任一項所述的方法,其中所述第二分析進一步包括:測定與一第一分佈之一預定百分位數有關的所述組病原體中之一第一病原體之序列讀段的一參考量,其中一第一組個體中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一量貢獻所述第一分佈,其中所述第一組個體之一第一部分中的每一個體皆患有所述癌症病況且所述第一組個體之一第二部分中的每一個體皆未患所述癌症病況,且將(i)一第一量與(ii)一第二量相比較,所述第一量係來自所述測試個體的映射至所述第一病原體之一病原體目標參考中一序列的所述多個序列讀段之量,所述第二量係與所述第一分佈之所述預定百分位數有關的所述組病原體中之所述第一病原體之序列讀段的參考量,其中當所述第一量超過所述第二量一臨限量時,所述第二分析指示所述測試個體有患所述癌症病況的可能性或確定所述測試個體患有所述癌症病況。
  107. 如申請專利範圍第70項至第105項中任一項所述的方法,其 中所述第二分析進一步包括:測定與一第一分佈之一預定百分位數有關的所述組病原體中之一第一病原體之序列讀段的一參考量,其中未患所述癌症病況的一第一組個體中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量貢獻所述第一分佈,藉由與所述第一分佈之所述預定百分位數有關的所述組病原體中之所述第一病原體之序列讀段的所述參考量對來自所述測試個體的映射至所述第一病原體之一病原體目標參考中一序列的所述多個序列讀段之量定限,由此形成所述多個序列讀段的一按比例調整之量,及將(i)所述多個序列讀段的所述按比例調整之量與(ii)與一第二分佈之一預定百分位數有關的所述多個序列讀段的一按比例調整之量相比較,其中一第二組個體中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一按比例調整之量貢獻所述第二分佈,其中所述第二組中所述個體之一第一部分中的每一個體皆患有所述癌症病況且所述第二組中所述個體之一第二部分中的每一個體均未患所述癌症病況。
  108. 如申請專利範圍第107項所述的方法,其中所述第一組包括二十位個體,其各自用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一量貢獻所述第一分佈。
  109. 如申請專利範圍第107項所述的方法,其中所述第一組包括一百位個體,其各自用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一量貢獻所述第一分佈。
  110. 如申請專利範圍第107項所述的方法,其中所述第一分佈之所述預定百分位數係第95百分位數。
  111. 如申請專利範圍第107項所述的方法,其中所述第一分佈之所述預定百分位數係第98百分位數。
  112. 如申請專利範圍第70項所述的方法,其中所述測定(c)(ii)測定映射至一第一病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應第一量,所述測定(c)(ii)測定映射至一第二病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應第二量,所述第一量係基於與一第一分佈之一預定百分位數有關的序列讀段之一量定限,其中未患所述癌症病況的一第一組個體中之每一各別個體用映射至所述第一病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量貢獻所述第一分佈,由此測定來自所述測試個體之所述多個序列讀段的一按比例調整之第一量,所述第二量係基於與一第二分佈之一預定百分位數有關的序列讀段之一量定限,其中未患所述癌症病況的一第二組個體中之每一各別個體用映射至所述第二病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量貢獻所述第二分佈,由此測定來自所述測試個體之所述多個序列讀段的一按比例調整之第二量,且所述第二分析至少部分地基於所述按比例調整之第一量及所述按比例調整之第二量指示所述測試個體患有或未患所述癌症病況或提供所述測試個體患或未患所述癌症病況的可能性。
  113. 如申請專利範圍第112項所述的方法,其中藉由至少將所述多個序列讀段的所述按比例調整之第一量及所述多個序列讀段的所述按比例調整之第二量輸入一分類器中,所述第二分析認為所述測試個體患有或未患所述癌症病況或所述第二分析提供所述測試個體患或未患所述癌症的可能性。
  114. 如申請專利範圍第113項所述的方法,其中所述分類器係一邏輯斯蒂回歸,所述邏輯斯蒂回歸基於在一訓練組個體中所觀察到的映射至所述第一病原體之所述病原體目標參考中一序列的序列讀段之一量,單獨地對所述多個序列讀段的所述按比例調整之第一量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體,且所述邏輯斯蒂回歸基於在所述訓練組中所觀察到的映射至所述第二病原體之所述病原體目標參考中一序列的序列讀段之一量,單獨地對所述多個序列讀段的所述按比例調整之第二量進行加權。
  115. 如申請專利範圍第70項至第105項中任一項所述的方法,其中所述執行(c)進一步包括:將映射至所述各別病原體之所述病原體目標參考中一序列的序列讀段之相應量施加至一分類器,由此所述第二分析判定(i)所述測試個體是否患有所述癌症病況或(ii)測試個體患所述癌症病況的可能性。
  116. 如申請專利範圍第115項所述的方法,其中所述施加亦將所述第一特徵之量施加至所述分類器。
  117. 如申請專利範圍第115項所述的方法,所述方法進一步包括:在所述執行(c)之前,對於一第一組個體中之每一各別個體,藉由將映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一量輸入所述分類器中,訓練所述分類器,其中所述第一組中所述個體之一第一部分中的每一個體皆患有所述癌症病況且所述第一組中所述個體之一第二部分中的每一個體皆未患所述癌症病況。
  118. 如申請專利範圍第115項所述的方法,所述方法進一步包括:在所述執行(c)之前,對於一第一組個體中每一各別個體,藉由將映射至所 述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的正規化量輸入所述分類器中,訓練所述分類器,其中所述第一組中所述個體之一第一部分中的每一個體皆患有所述癌症病況,所述第一組中所述個體之一第二部分中的每一個體皆未患所述癌症病況,藉由根據與一第二分佈之一預定百分位數有關的所述各別病原體之序列讀段之一參考量使映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之量正規化,獲得映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的正規化量,未患所述癌症病況的一第二組個體中之每一各別個體用映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段之一量貢獻所述第二分佈。
  119. 如申請專利範圍第117項或第118項所述的方法,其中所述分類器係一二項分類器。
  120. 如申請專利範圍第119項所述的方法,其中所述分類器係一邏輯斯蒂回歸。
  121. 如申請專利範圍第120項所述的方法,其中所述邏輯斯蒂回歸演算法提供所述測試個體患或未患所述癌症病況的可能性。
  122. 如申請專利範圍第120項所述的方法,其中所述邏輯斯蒂回歸演算法提供一有關所述測試個體患有抑或未患所述癌症病況的二項評估。
  123. 如申請專利範圍第120項之方法,其中所述邏輯斯蒂回歸演算法提供多種可能性,所述多種可能性中之每一各別可能性係所述測試個體患多種癌症病況中之一相應癌症病況的可能性,且所述多種癌症病況包含所述癌症病況。
  124. 如申請專利範圍第117項或第118項所述的方法,其中所述分類器係一多項分類器。
  125. 如申請專利範圍第124項所述的方法,其中所述分類器係基於一邏輯斯蒂回歸演算法、一神經網路演算法、一支援向量機演算法或一決策樹演算法。
  126. 如申請專利範圍第70項至第125項中任一項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一序列片段標誌存在抑或不存在的指示;且其中所述篩查(d)使用(i)所述關於與一第一病原體有關之所述標誌片段標誌存在抑或不存在的指示、(ii)所述第一特徵之量及(iii)所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  127. 如申請專利範圍第70項至第125項中任一項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一甲基化標誌存在抑或不存在的指示;且其中所述篩查(d)使用(i)所述關於與一第一病原體有關之所述甲基化標誌存在抑或不存在的指示、(ii)所述第一特徵之量及(iii)所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  128. 如申請專利範圍第70項至第125項中任一項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一序列片段標誌存在抑或不存在的指示;以及評價所述多個序列讀段以獲得一關於與所述組病原體中之所述第一病原體 有關的一甲基化標誌存在抑或不存在的指示;且其中所述篩查(d)使用(i)所述關於與所述第一病原體有關之所述標誌片段標誌存在抑或不存在的指示、(ii)一關於與所述第一病原體有關之一甲基化標誌存在抑或不存在的指示、(iii)所述第一特徵之量及(iv)所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  129. 如申請專利範圍第70項所述的方法,其中所述執行(c)進一步包括對於所述組病原體中之每一各別病原體,基於與一各別分佈之一預定百分位數有關的序列讀段之一量對映射至所述各別病原體之所述病原體目標參考中一序列的所述多個序列讀段之相應量定限,其中未患所述癌症病況的一各別組個體中之每一各別個體用映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一量貢獻所述各別分佈,由此測定來自所述測試個體之所述多個序列讀段的一按比例調整之各別量,且當至少輸入來自所述測試個體之所述多個序列讀段的每一按比例調整之各別量的一分類器指示所述測試個體患有所述癌症病況時,所述第二分析認為所述測試個體有患所述癌症病況的可能性或患有所述癌症病況。
  130. 如申請專利範圍第129項所述的方法,其中所述分類器係一邏輯斯蒂回歸,其基於在一訓練組個體中所觀察到的映射至所述各別病原體之所述病原體目標目標參考中一序列的序列讀段之一相應量,單獨地對所述多個序列讀段的每一按比例調整之各別量進行加權,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。
  131. 如申請專利範圍第129項所述的方法,其中所述組病原體包括在兩種與一百種之間之病原體。
  132. 如申請專利範圍第129項所述的方法,其中所述分類器係基 於一邏輯斯蒂回歸演算法、一神經網路演算法、一支援向量機演算法或一決策樹演算法,所述演算法已針對一訓練組個體進行訓練,所述訓練組個體包含患有所述癌症病況之個體及未患所述癌症病況之個體。
  133. 如申請專利範圍第70項所述的方法,其中所述執行(c)進一步包括對於所述組病原體中之每一各別病原體,基於與一各別分佈之一預定百分位數有關的序列讀段之一量對映射至所述各別病原體之所述病原體目標參考中一序列的所述多個序列讀段之相應量定限,其中未患所述癌症病況的一各別組個體中之每一各別個體用映射至所述各別病原體之所述病原體目標參考中一序列的來自所述各別個體之序列讀段的一量貢獻所述各別分佈,由此測定來自所述測試個體之所述多個序列讀段的一按比例調整之各別量,對來自所述測試個體之所述多個序列讀段的每一按比例調整之各別量求和以測定一總體腫瘤病原體負荷,且其中當所述總體腫瘤病原體負荷滿足一臨限截止值條件時,所述第二分析指示所述測試個體患有所述癌症病況。
  134. 如申請專利範圍第133項所述的方法,其中所述臨限截止值條件係關於未患所述癌症病況之一組個體所測定的所述組病原體之總體腫瘤病原體負荷的預定特異性。
  135. 如申請專利範圍第134項所述的方法,其中所述預定特異性係第95百分位數。
  136. 如申請專利範圍第70項所述的方法,其中所述第一分析對提示所述癌症病況之一第一組標記物具有一定靈敏度,且所述第一特徵係在所述第一組標記物內的所述第一生物樣品中所述無細胞核酸之一複本數、一片段大小分佈、一斷裂模式、一甲基化狀態或一突變狀態之一。
  137. 如申請專利範圍第136項之方法,其中所述第一特徵之量係基於與一第二分佈之一預定百分位數有關的所述第一特徵之一量定限,由此形成所述第一特徵的一按比例調整之量,其中未患所述癌症病況的一第二組個體中之每一各別個體將由所述各別個體所量測的所述第一特徵之一值貢獻所述第二分佈,且當所述第一特徵的所述按比例調整之量超過與所述第二分佈之所述預定百分位數有關的所述第一特徵之量一第二預定截止值時,所述第一分析認為所述測試個體患有癌症病況。
  138. 如申請專利範圍第137項所述的方法,其中所述第二預定截止值係零。
  139. 如申請專利範圍第137項所述的方法,其中所述第二預定截止值比所述第二分佈之集中趨勢的一量測值高單一標準差。
  140. 如申請專利範圍第137項所述的方法,其中所述第二預定截止值比所述第二分佈之集中趨勢的一量測值高三個標準差。
  141. 如申請專利範圍第70項所述的方法,其中映射至所述各別病原體之一病原體目標參考中一序列的所述多個序列讀段之相應量係在所述第二生物樣品中所量測的映射至所述各別病原體之一病原體目標參考中一序列的來自所述測試個體之所述多個序列讀段的百分比。
  142. 如申請專利範圍第70項至第141項中任一項所述的方法,其中所述測定映射至所述相應病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應量包括在一閱讀框架中轉譯所述多個序列讀段以形成多個轉譯之序列讀段並將所述多個轉譯之序列讀段與所述病原體目標參考之一轉譯相比較。
  143. 如申請專利範圍第70項至第141項中任一項所述的方法,其 中所述測定映射至所述相應病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應量包括在核酸、核糖核酸或蛋白質空間中對所述多個序列讀段與所述病原體目標參考進行k聚體匹配。
  144. 如申請專利範圍第70項至第143項中任一項所述的方法,其中所述測試個體係人,且所述第二分析進一步包括在所述人類基因組內對所述多個序列讀段之每一各別量執行一終點分析。
  145. 如申請專利範圍第70項至第144項中任一項所述的方法,其進一步包括基於所述篩查步驟(d)之一結果,對所述測試個體提供一治療性干預或成像。
  146. 一種在一測試個體中篩查一癌症病況的方法,所述方法包括:(a)自所述測試個體獲得一第一生物樣品,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸;(b)對所述生物樣品中之所述無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段;(c)評價所述多個序列讀段以獲得一關於與所述組病原體中之一各別病原體有關的一序列片段標誌存在抑或不存在的指示;以及(d)使用所述關於與所述各別病原體有關的所述標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
  147. 如申請專利範圍第146項所述的方法,其中所述方法進一步包括: 評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述使用(d)使用所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關的所述標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  148. 如申請專利範圍第146項所述的方法,其中所述方法進一步包括:經由k聚體分析評價所述多個序列讀段以獲得一關於一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述使用(d)使用所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關的所述標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  149. 如申請專利範圍第147項至第148項中任一項所述的方法,其中所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的一量測值;且所述使用(d)使用所述APOBEC誘導之突變標誌之富集量的所述量測值以及所述關於與所述各別病原體有關的所述標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  150. 如申請專利範圍第146項至第149項中任一項所述的方法, 其中所述方法進一步包括:分析來自所述測試個體之所述第一生物樣品或一第二生物樣品中與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現,且其中所述使用(d)使用所述APOBEC蛋白質之表現以及所述關於與所述各別病原體有關的所述標誌片段標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  151. 如申請專利範圍第150項所述的方法,其中所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
  152. 如申請專利範圍第146項至第151項中任一項所述的方法,所述方法進一步包括:執行一分析,所述分析包括量測所述第一生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述使用(d)包括使用所述APOBEC誘導之突變標誌的量以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  153. 如申請專利範圍第146項所述的方法,所述方法進一步包括:自所述測試個體獲得一第二生物樣品,其中所述第二生物樣品包括來自所述測試個體之無細胞核酸及來自所述組病原體中之一第一病原體的潛在地無細胞核酸;以及執行一分析,所述分析包括量測所述第二生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述使用(d)包括使用所述APOBEC誘導之突變標誌的量以及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病 況的可能性。
  154. 如申請專利範圍第147項至第153項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  155. 如申請專利範圍第146項所述的方法,其中所述測序(b)係藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行。
  156. 如申請專利範圍第146項所述的方法,其中所述測試個體係人。
  157. 如申請專利範圍第156項所述的方法,其中所述癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。
  158. 如申請專利範圍第157項所述的方法,其中所述癌症病況係早期癌症。
  159. 如申請專利範圍第156項所述的方法,其中所述癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。
  160. 如申請專利範圍第159項所述的方法,其中所述癌症病況係晚期癌症。
  161. 如申請專利範圍第146項所述的方法,其中所述癌症病況係液體癌症、肝癌或肺癌。
  162. 如申請專利範圍第146項至第161項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係血漿。
  163. 如申請專利範圍第146項至第161項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係來自所述測試個體之同一生物樣品的不同等分試樣。
  164. 如申請專利範圍第146項至第161項中任一項所述的方法,其中所述第一生物樣品與所述第二生物樣品係相同生物樣品。
  165. 如申請專利範圍第146項至第161項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品包括所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。
  166. 如申請專利範圍第146項至第161項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品由所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、淚液、胸膜液、心包液或腹膜液組成。
  167. 如申請專利範圍第146項至第166項中任一項所述的方法,其中所述組病原體中之一各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
  168. 如申請專利範圍第146項至第166項中任一項所述的方法,其中所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。
  169. 如申請專利範圍第146項至第166項中任一項所述的方法,其中所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒 (JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)
  170. 如申請專利範圍第146項至第166項中任一項所述的方法,其中所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。
  171. 一種在一測試個體中篩查一癌症病況的方法,所述方法包括:(a)自所述測試個體獲得一第一生物樣品,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸;(b)對所述第一生物樣品中之所述無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段;(c)評價所述多個序列讀段以獲得一關於與所述組病原體中之一各別病原體有關的一甲基化標誌存在抑或不存在的指示;以及(d)使用所述關於與所述各別病原體有關的所述甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
  172. 如申請專利範圍第171項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述使用(d)使用所述關於與所述第一病原體有關的所述APOBEC誘導之 突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關的所述甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  173. 如申請專利範圍第171項所述的方法,其中所述方法進一步包括:經由k聚體分析評價所述多個序列讀段以獲得一關於一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述使用(d)使用所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關的所述甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
  174. 如申請專利範圍第172項至第173項中任一項所述的方法,其中所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的一量測值;且所述使用(d)使用所述APOBEC誘導之突變標誌之富集量的所述量測值以及所述關於與所述各別病原體有關的所述甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  175. 如申請專利範圍第171項至第174項中任一項所述的方法,其中所述方法進一步包括:分析來自所述測試個體之所述第一生物樣品或一第二生物樣品中與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現,且其中 所述使用(d)使用所述APOBEC蛋白質之表現以及所述關於與所述各別病原體有關的所述甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  176. 如申請專利範圍第175項所述的方法,其中所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
  177. 如申請專利範圍第171項至第176項中任一項所述的方法,所述方法進一步包括:執行一分析,所述分析包括量測所述第一生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述使用(d)使用所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關的所述甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  178. 如申請專利範圍第171項所述的方法,所述方法進一步包括:自所述測試個體獲得一第二生物樣品,其中所述第二生物樣品包括來自所述測試個體之無細胞核酸及來自所述組病原體中之一第一病原體的潛在地無細胞核酸;以及執行一分析,所述分析包括量測所述第二生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述使用(d)使用所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述關於與所述各別病原體有關的所述甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  179. 如申請專利範圍第172項至第178項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  180. 如申請專利範圍第171項所述的方法,其中所述測序(b)係藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行。
  181. 如申請專利範圍第171項所述的方法,其中所述測試個體係人。
  182. 如申請專利範圍第181項所述的方法,其中所述癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。
  183. 如申請專利範圍第182項所述的方法,其中所述癌症病況係早期癌症。
  184. 如申請專利範圍第181項所述的方法,其中所述癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。
  185. 如申請專利範圍第184項所述的方法,其中所述癌症病況係晚期癌症。
  186. 如申請專利範圍第171項所述的方法,其中所述癌症病況係液體癌症、肝癌或肺癌。
  187. 如申請專利範圍第171項至第186項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係血漿。
  188. 如申請專利範圍第171項至第186項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係來自所述測試個體之同一生物樣品的不同等分試樣。
  189. 如申請專利範圍第171項至第186項中任一項所述的方法, 其中所述第一生物樣品與所述第二生物樣品係相同生物樣品。
  190. 如申請專利範圍第171項至第186項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品包括所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。
  191. 如申請專利範圍第171項至第186項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品由所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、淚液、胸膜液、心包液或腹膜液組成。
  192. 如申請專利範圍第171項至第190項中任一項所述的方法,其中所述組病原體中之一各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
  193. 如申請專利範圍第171項至第190項中任一項所述的方法,其中所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。
  194. 如申請專利範圍第171項至第190項中任一項所述的方法,其中所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
  195. 如申請專利範圍第171項至第190項中任一項所述的方法,其中所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。
  196. 一種在一測試個體中篩查一癌症病況的方法,所述方法包括:(a)自所述測試個體獲得一第一生物樣品,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸;(b)對所述第一生物樣品中之所述無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段;(c)評價所述多個序列讀段以獲得一關於與所述組病原體中之一各別病原體有關的一序列片段標誌存在抑或不存在的指示;(d)評價所述多個序列讀段以獲得一關於與所述組病原體中之一各別病原體有關的一甲基化標誌存在抑或不存在的指示;以及(e)使用所述關於與一各別病原體有關的所述標誌片段標誌存在抑或不存在的指示及所述關於與一各別病原體有關的所述甲基化標誌存在抑或不存在的指示確定所述測試個體是否患有所述癌症病況或測試個體患所述癌症病況的可能性。
  197. 如申請專利範圍第196項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有 關的一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述使用(e)包括使用(i)所述關於與一各別病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述關於與一各別病原體有關的所述甲基化標誌存在抑或不存在的指示及(iii)所述關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  198. 如申請專利範圍第196項所述的方法,其中所述方法進一步包括:經由k聚體分析評價所述多個序列讀段以獲得一關於一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述使用(e)包括使用(i)所述關於與一各別病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述關於與一各別病原體有關的所述甲基化標誌存在抑或不存在的指示及(iii)所述關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌的指示確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  199. 如申請專利範圍第197項至第198項中任一項所述的方法,其中所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的一量測值;且所述使用(e)包括使用(i)所述關於與一各別病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述關於與一各別病原體有關的所述甲基化標誌存在抑或不存在的指示及(iii)所述APOBEC誘導之突變標誌之富集量的所述量測值確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的 可能性。
  200. 如申請專利範圍第196項至第199項中任一項所述的方法,其中所述方法進一步包括:分析來自所述測試個體之所述第一生物樣品或一第二生物樣品中與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現,且其中所述使用(e)包括使用(i)所述與一各別病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述關於與一各別病原體有關的所述甲基化標誌存在抑或不存在的指示及(iii)與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  201. 如申請專利範圍第200項所述的方法,其中所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
  202. 如申請專利範圍第196項至第201項中任一項所述的方法,所述方法進一步包括:執行一分析,所述分析包括量測所述第一生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述使用(e)包括使用(i)所述關於與一各別病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述關於與一各別病原體有關的所述甲基化標誌存在抑或不存在的指示及(iii)所述APOBEC誘導之突變標誌的量及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  203. 如申請專利範圍第196項所述的方法,所述方法進一步包括:自所述測試個體獲得一第二生物樣品,其中所述第二生物樣品包括來自所 述測試個體之無細胞核酸及來自所述組病原體中之一第一病原體的潛在地無細胞核酸;以及執行一分析,所述分析包括量測所述第二生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述使用(e)包括使用(i)所述關於與一各別病原體有關的所述標誌片段標誌存在抑或不存在的指示、(ii)所述關於與一各別病原體有關的所述甲基化標誌存在抑或不存在的指示及(iii)所述APOBEC誘導之突變標誌的量及所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  204. 如申請專利範圍第197項至第203項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  205. 如申請專利範圍第196項所述的方法,其中所述測序(b)係藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行。
  206. 如申請專利範圍第196項所述的方法,其中所述測試個體係人。
  207. 如申請專利範圍第206項所述的方法,其中所述癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。
  208. 如申請專利範圍第196項所述的方法,其中所述癌症病況係早期癌症。
  209. 如申請專利範圍第206項所述的方法,其中所述癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。
  210. 如申請專利範圍第209項所述的方法,其中所述癌症病況係 晚期癌症。
  211. 如申請專利範圍第196項所述的方法,其中所述癌症病況係液體癌症、肝癌或肺癌。
  212. 如申請專利範圍第196項至第211項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係血漿。
  213. 如申請專利範圍第196項至第211項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係來自所述測試個體之同一生物樣品的不同等分試樣。
  214. 如申請專利範圍第196項至第211項中任一項所述的方法,其中所述第一生物樣品與所述第二生物樣品係相同生物樣品。
  215. 如申請專利範圍第196項至第211項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品包括所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。
  216. 如申請專利範圍第196項至第211項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品由所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、淚液、胸膜液、心包液或腹膜液組成。
  217. 如申請專利範圍第196項至第216項中任一項所述的方法,其中所述組病原體中之一各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
  218. 如申請專利範圍第196項至第216項中任一項所述的方法,其中所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。
  219. 如申請專利範圍第196項至第216項中任一項所述的方法,其中所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
  220. 如申請專利範圍第196項至第216項中任一項所述的方法,其中所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。
  221. 一種在一測試個體中篩查一癌症病況的方法,所述方法包括:(a)自所述測試個體獲得一第一生物樣品,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之一第一病原體的潛在地無細胞核酸;以及(b)執行一分析,其包括:i.對所述生物樣品中之所述無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段;ii.測定與所述第一病原體之一參考基因組比對的所述多個序列讀段之一 量,及iii.基於與一第一分佈之一預定百分位數有關的序列讀段之一量對所述量定限,其中未患所述癌症病況的一組個體中之每一各別個體將與所述第一病原體之所述參考基因組比對的來自所述各別個體之序列讀段的量一貢獻所述第一分佈,由此測定來自所述測試個體之所述多個序列讀段的一按比例調整之第一量;且其中當至少部分地基於所述多個序列讀段的所述按比例調整之第一量的一度量滿足與所述癌症病況有關之一臨限值時,認為所述測試個體患有所述癌症病況。
  222. 如申請專利範圍第221項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中當基於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在及所述多個序列讀段的所述按比例調整之第一量的一度量滿足與所述癌症病況有關的一臨限值時,認為所述測試個體患有所述癌症病況。
  223. 如申請專利範圍第221項所述的方法,其中所述方法進一步包括:經由k聚體分析評價所述多個序列讀段以獲得一關於一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中當基於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在及所述多個序列讀段的所述按比例調整之第一量的一度量滿足與所述癌症病況有關的一臨限值時,認為所述測試個體患有所述癌症病況。
  224. 如申請專利範圍第222項至第223項中任一項所述的方法, 其中所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的一量測值;且其中當基於所述APOBEC誘導之突變標誌之富集量的所述量測值及所述多個序列讀段的所述按比例調整之第一量的一度量滿足與所述癌症病況有關的一臨限值時,認為所述測試個體患有所述癌症病況。
  225. 如申請專利範圍第221項至第224項中任一項所述的方法,其中所述方法進一步包括:分析來自所述測試個體之所述第一生物樣品或一第二生物樣品中與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現,且其中當基於與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現及所述多個序列讀段的所述按比例調整之第一量的一度量滿足與所述癌症病況有關的一臨限值時,認為所述測試個體患有所述癌症病況。
  226. 如申請專利範圍第225項所述的方法,其中所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
  227. 如申請專利範圍第221項至第226項中任一項所述的方法,所述方法進一步包括:執行一分析,所述分析包括量測所述第一生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中當基於一APOBEC誘導之突變標誌的量及所述多個序列讀段的所述按比例調整之第一量的一度量滿足與所述癌症病況有關的一臨限值時,認為所述測試個體患有所述癌症病況。
  228. 如申請專利範圍第221項所述的方法,所述方法進一步包括:自所述測試個體獲得一第二生物樣品,其中所述第二生物樣品包括來自所述測試個體之無細胞核酸及來自所述組病原體中之一第一病原體的潛在地無細胞核酸;以及執行一分析,所述分析包括量測所述第二生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中當基於一APOBEC誘導之突變標誌的量及所述多個序列讀段的所述按比例調整之第一量的一度量滿足與所述癌症病況有關的一臨限值時,認為所述測試個體患有所述癌症病況。
  229. 如申請專利範圍第222項至第228項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  230. 如申請專利範圍第221項所述的方法,其中所述測序(b)(i)係藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行。
  231. 如申請專利範圍第221項所述的方法,其中當來自所述測試個體之所述多個序列讀段的所述按比例調整之第一量超過與所述分佈之所述預定百分位數有關的序列讀段的量一預定截止值時,所述分析認為所述測試個體患有所述癌症病況。
  232. 如申請專利範圍第231項所述的方法,其中所述第一預定截止值比所述分佈之集中趨勢的一量測值高單一標準差。
  233. 如申請專利範圍第231項所述的方法,其中所述第一預定截止值比所述分佈之集中趨勢的一量測值高三個標準差。
  234. 如申請專利範圍第221項所述的方法,其中所述測試個體係人。
  235. 如申請專利範圍第234項所述的方法,其中所述癌症病況係 子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。
  236. 如申請專利範圍第235項所述的方法,其中所述癌症病況係早期癌症。
  237. 如申請專利範圍第221項所述的方法,其中所述癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。
  238. 如申請專利範圍第237項所述的方法,其中所述癌症病況係晚期癌症。
  239. 如申請專利範圍第221項所述的方法,其中所述癌症病況係液體癌症、肝癌或肺癌。
  240. 如申請專利範圍第221項至第239項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係血漿。
  241. 如申請專利範圍第221項至第239項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係來自所述測試個體之同一生物樣品的不同等分試樣。
  242. 如申請專利範圍第221項至第239項中任一項所述的方法,其中所述第一生物樣品與所述第二生物樣品係相同生物樣品。
  243. 如申請專利範圍第221項至第239項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品包括所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。
  244. 如申請專利範圍第221項至第239項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品由所述測試個體之血液、全血、血 漿、血清、尿液、腦脊髓液、糞便、唾液、淚液、胸膜液、心包液或腹膜液組成。
  245. 如申請專利範圍第221項至第242項中任一項所述的方法,其中所述組病原體中之一各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
  246. 如申請專利範圍第221項至第242項中任一項所述的方法,其中所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。
  247. 如申請專利範圍第221項至第242項中任一項所述的方法,其中所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
  248. 如申請專利範圍第221項至第242項中任一項所述的方法,其中所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。
  249. 一種針對多種癌症病況之每一癌症病況篩查一測試個體的方法,所述方法包括:(a)自所述測試個體獲得一第一生物樣品,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之任何病原體的潛在地無細胞核酸;(b)對所述生物樣品中之所述無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段;(c)對所述組病原體中之每一各別病原體執行一程序,所述程序包括:i.測定與所述各別病原體之一參考基因組比對的所述多個序列讀段之一各別量,及ii.基於與一各別分佈之一預定百分位數有關的序列讀段之一量對所述各別量定限,其中未患所述多種癌症病況中之一癌症病況的一各別組個體中之每一各別個體將與所述各別病原體之所述參考基因組比對的來自所述各別個體之序列讀段的一量貢獻所述各別分佈,由此測定來自所述各別個體之所述多個序列讀段的一按比例調整之各別量;以及(d)至少將所述多個序列讀段的每一按比例調整之各別量輸入一第一分類器中,由此獲得一分類器結果,所述結果指示所述測試是否患有所述多種癌症病況中之一癌症病況。
  250. 如申請專利範圍第249項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述輸入(d)將所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述多個序列讀段的每一按比例調整之各別 量輸入所述第一分類器中,由此獲得一分類器結果,所述結果指示所述測試是否患有所述多種癌症病況中之一癌症病況。
  251. 如申請專利範圍第249項所述的方法,其中所述方法進一步包括:經由k聚體分析評價所述多個序列讀段以獲得一關於一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述輸入(d)將所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述多個序列讀段的每一按比例調整之各別量輸入所述第一分類器中,由此獲得一分類器結果,所述結果指示所述測試是否患有所述多種癌症病況中之一癌症病況。
  252. 如申請專利範圍第250項至第251項中任一項所述的方法,其中所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的一量測值;且所述輸入(d)將所述APOBEC誘導之突變標誌之富集量的所述量測值以及所述多個序列讀段的每一按比例調整之各別量輸入所述第一分類器中,由此獲得一分類器結果,所述結果指示所述測試是否患有所述多種癌症病況中之一癌症病況。
  253. 如申請專利範圍第249項至第252項中任一項所述的方法,其中所述方法進一步包括:分析來自所述測試個體之所述第一生物樣品或一第二生物樣品中與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現,且其中所述輸入(d)將所述APOBEC蛋白質之表現以及所述多個序列讀段的每一 按比例調整之各別量輸入所述第一分類器中,由此獲得一分類器結果,所述結果指示所述測試是否患有所述多種癌症病況中之一癌症病況。
  254. 如申請專利範圍第253項所述的方法,其中所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
  255. 如申請專利範圍第249項至第254項中任一項所述的方法,所述方法進一步包括:執行一分析,所述分析包括量測所述第一生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述輸入(d)將一APOBEC誘導之突變標誌的量以及所述多個序列讀段的每一按比例調整之各別量輸入所述第一分類器中,由此獲得一分類器結果,所述結果指示所述測試是否患有所述多種癌症病況中之一癌症病況。
  256. 如申請專利範圍第249項所述的方法,所述方法進一步包括:自所述測試個體獲得一第二生物樣品,其中所述第二生物樣品包括來自所述測試個體之無細胞核酸及來自所述組病原體中之一第一病原體的潛在地無細胞核酸;以及執行一分析,所述分析包括量測所述第二生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述輸入(d)將一APOBEC誘導之突變標誌的量以及所述多個序列讀段的每一按比例調整之各別量輸入所述第一分類器中,由此獲得一分類器結果,所述結果指示所述測試是否患有所述多種癌症病況中之一癌症病況。
  257. 如申請專利範圍第250項至第256項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  258. 如申請專利範圍第249項所述的方法,其中所述測序(b)係藉 由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行。
  259. 如申請專利範圍第249項所述的方法,其中所述測試個體係人。
  260. 如申請專利範圍第258項所述的方法,其中所述多種癌症病況中之一癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。
  261. 如申請專利範圍第260項所述的方法,其中所述癌症病況係早期癌症。
  262. 如申請專利範圍第258項所述的方法,其中所述多種癌症病況中之一癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。
  263. 如申請專利範圍第262項所述的方法,其中所述癌症病況係晚期癌症。
  264. 如申請專利範圍第260項所述的方法,其中所述多種癌症病況中之一癌症病況係液體癌症、肝癌或肺癌。
  265. 如申請專利範圍第249項至第264項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係血漿。
  266. 如申請專利範圍第249項至第264項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係來自所述測試個體之同一生物樣品的不同等分試樣。
  267. 如申請專利範圍第249項至第264項中任一項所述的方法,其中所述第一生物樣品與所述第二生物樣品係相同生物樣品。
  268. 如申請專利範圍第249項至第264項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品包括所述測試個體之血液、全血、血 漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。
  269. 如申請專利範圍第249項至第264項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品由所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、淚液、胸膜液、心包液或腹膜液組成。
  270. 如申請專利範圍第249項至第269項中任一項所述的方法,其中所述組病原體中之一各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
  271. 如申請專利範圍第249項至第269項中任一項所述的方法,其中所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。
  272. 如申請專利範圍第249項至第269項中任一項所述的方法,其中所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
  273. 如申請專利範圍第249項至第269項中任一項所述的方法,其中所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒 R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。
  274. 如申請專利範圍第249項至第269項中任一項所述的方法,其中所述組病原體包括至少兩種病原體。
  275. 如申請專利範圍第249項至第269項中任一項所述的方法,其中所述組病原體包括至少二十種病原體。
  276. 一種針對多種癌症病況之每一癌症病況篩查一測試個體的方法,所述方法包括:(a)自所述測試個體獲得一第一生物樣品,其中所述生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之任何病原體的潛在地無細胞核酸;(b)對所述生物樣品中之所述無細胞核酸進行測序以產生來自所述測試個體之多個序列讀段;(c)對所述組病原體中之每一各別病原體執行一程序,所述程序包括:i.測定與所述各別病原體之一參考基因組比對的所述多個序列讀段之一各別量,及ii.基於與一各別分佈之一預定百分位數有關的序列讀段之一量對所述各別量定限,其中未患所述多種癌症病況中之一癌症病況的一各別組個體中之每一各別個體將與所述各別病原體之所述參考基因組比對的來自所述各別個體之序列讀段的一量貢獻所述各別分佈,由此測定來自所述各別個體之所述多個序列讀段的一按比例調整之各別量;以及(d)至少將所述多個序列讀段的每一按比例調整之各別量輸入多個分類器中 之每一分類器中,其中所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
  277. 如申請專利範圍第276項所述的方法,其中所述方法進一步包括:評價所述多個序列讀段以獲得一關於與所述組病原體中之一第一病原體有關的一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述輸入(d)將所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中,其中所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
  278. 如申請專利範圍第276項所述的方法,其中所述方法進一步包括:經由k聚體分析評價所述多個序列讀段以獲得一關於一APOBEC誘導之突變標誌存在抑或不存在的指示;且其中所述輸入(d)將所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中,其中所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
  279. 如申請專利範圍第277項至第278項中任一項所述的方法,其中所述關於與所述第一病原體有關的所述APOBEC誘導之突變標誌存在抑或不存在的指示進一步包含所述APOBEC誘導之突變標誌之富集量的一量測值;且所述輸入(d)將所述APOBEC誘導之突變標誌之富集量的所述量測值以及 所述多個序列讀段的每一按比例調整之各別量輸入多個分類器中之每一分類器中,其中所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
  280. 如申請專利範圍第276項至第279項中任一項所述的方法,其中所述方法進一步包括:分析來自所述測試個體之所述第一生物樣品或一第二生物樣品中與所述組病原體中之一第一病原體有關的一APOBEC蛋白質之表現,且其中所述輸入(d)將所述APOBEC蛋白質之表現以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中,其中所述多個分類器中之每一分類器指示所述各別個體患有或未患所述多種癌症病況中之相應單一癌症病況。
  281. 如申請專利範圍第280項所述的方法,其中所述APOBEC蛋白質係APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H或APOBEC4。
  282. 如申請專利範圍第276項至第281項中任一項所述的方法,所述方法進一步包括:執行一分析,所述分析包括量測所述第一生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述輸入(d)將一APOBEC誘導之突變標誌的量以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中,其中所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
  283. 如申請專利範圍第276項所述的方法,所述方法進一步包括:自所述測試個體獲得一第二生物樣品,其中所述第二生物樣品包括來自所 述測試個體之無細胞核酸及來自所述組病原體中之一第一病原體的潛在地無細胞核酸;以及執行一分析,所述分析包括量測所述第二生物樣品中之所述無細胞核酸的一APOBEC誘導之突變標誌的一量;且其中所述輸入(d)將一APOBEC誘導之突變標誌的量以及所述多個序列讀段的每一按比例調整之各別量輸入所述多個分類器中之每一分類器中,其中所述多個分類器中之每一分類器指示所述各別個體患有抑或未患所述多種癌症病況中之相應單一癌症病況。
  284. 如申請專利範圍第277項至第283項中任一項所述的方法,其中所述APOBEC誘導之突變標誌選自第2型突變標誌或第13型突變標誌。
  285. 如申請專利範圍第276項所述的方法,其中所述測序(b)係藉由全基因組測序、靶向小組測序或全基因組亞硫酸氫鹽測序執行。
  286. 如申請專利範圍第276項所述的方法,其中所述測試個體係人。
  287. 如申請專利範圍第285項所述的方法,其中所述多種癌症病況中的一癌症病況係子宮頸癌、肝細胞癌、膀胱癌、乳癌、食道癌、前列腺癌、鼻咽癌、肺癌、淋巴瘤或白血病。
  288. 如申請專利範圍第287項所述的方法,其中所述癌症病況係早期癌症。
  289. 如申請專利範圍第285項所述的方法,其中所述多種癌症病況中之一癌症病況係腎癌、肝細胞癌、結腸直腸癌、食道癌、乳癌、肺癌、鼻咽癌、甲狀腺癌、淋巴瘤、卵巢癌或子宮頸癌。
  290. 如申請專利範圍第289項所述的方法,其中所述癌症病況係晚期癌症。
  291. 如申請專利範圍第285項所述的方法,其中所述多種癌症病況中之一癌症病況係液體癌症、肝癌或肺癌。
  292. 如申請專利範圍第276項至第291項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係血漿。
  293. 如申請專利範圍第276項至第291項中任一項所述的方法,其中所述第一生物樣品及所述第二生物樣品係來自所述測試個體之同一生物樣品的不同等分試樣。
  294. 如申請專利範圍第276項至第291項中任一項所述的方法,其中所述第一生物樣品與所述第二生物樣品係相同生物樣品。
  295. 如申請專利範圍第276項至第291項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品包括所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、汗液、淚液、胸膜液、心包液或腹膜液。
  296. 如申請專利範圍第276項至第291項中任一項所述的方法,其中所述第一生物樣品或所述第二生物樣品由所述測試個體之血液、全血、血漿、血清、尿液、腦脊髓液、糞便、唾液、淚液、胸膜液、心包液或腹膜液組成。
  297. 如申請專利範圍第276項至第296項中任一項所述的方法,其中所述組病原體中之一各別病原體係埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)或猿猴空泡病毒40(SV40)。
  298. 如申請專利範圍第276項至第296項中任一項所述的方法, 其中所述組病原體係RefSeq病毒基因組資料庫之全部或一小組。
  299. 如申請專利範圍第276項至第296項中任一項所述的方法,其中所述組病原體包括以下的任何組合:埃-巴二氏病毒(EBV)、人巨細胞病毒(HCMV)、B型肝炎病毒(HBV)、C型肝炎病毒(HCV)、人疱疹病毒(HHV)、人乳房腫瘤病毒(HMTV)、人乳頭狀瘤病毒16(HPV16)、人乳頭狀瘤病毒18(HPV18)、人乳頭狀瘤病毒60(HPV-60)、人乳頭狀瘤病毒ZM130(HPV8-ZM130)、人T細胞白血病病毒第1型(HTLV-1)、約翰坎甯安病毒(JCV)、傳染性軟疣病毒(MCV)及猿猴空泡病毒40(SV40)。
  300. 如申請專利範圍第276項至第296項中任一項所述的方法,其中所述組病原體包括以下的任何組合:人疱疹病毒5 CINCY-TOWNE(HHV5-CINCY-TOWNE)病毒、埃-巴二氏B95-8(EBV-B95-8病毒)、傳染性軟疣病毒R17b(MCV-R17b)病毒、人乳頭狀瘤病毒16(HPV16)病毒、人巨細胞病毒AD169(HCMV-AD169)病毒、B型肝炎病毒(HBV)病毒、B型肝炎病毒18(HPV18)病毒、C型肝炎病毒(HCV)病毒、人乳頭狀瘤病毒8-ZM130(HPV8-ZM130)病毒及約翰坎甯安病毒PLYCG(JCV-PLYCG)病毒。
  301. 如申請專利範圍第276項至第296項中任一項所述的方法,其中所述組病原體包括至少兩種病原體。
  302. 如申請專利範圍第276項至第296項中任一項所述的方法,其中所述組病原體包括至少二十種病原體。
  303. 一種用於在一測試個體中篩查一癌症病況的電腦系統,所述電腦系統包括:一個或多個處理器;一記憶體;以及一個或多個程式,其中所述一個或多個程式係儲存於所述記憶體中且經組 態以由所述一個或多個處理器執行,所述一個或多個程式包含用於以下之指令:(a)自來自所述測試個體之一第一生物樣品以電子形式獲得多個序列讀段,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸;(b)對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應量,由此獲得一組序列讀段量,所述組序列讀段量中之每一各別序列讀段量對應於所述組病原體中之一相應病原體;以及(c)使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
  304. 一種非暫時性電腦可讀儲存媒體及嵌入其中的用於分類之一個或多個電腦程式,所述一個或多個電腦程式包括在由一電腦系統執行時使所述電腦系統執行一用於在一測試個體中篩查一癌症病況之方法的指令,所述方法包括:(a)自來自所述測試個體之一第一生物樣品以電子形式獲得多個序列讀段,其中所述第一生物樣品包括來自所述測試個體之無細胞核酸及來自一組病原體中之至少一種病原體的潛在地無細胞核酸;(b)對於所述組病原體中之每一各別病原體,測定映射至所述各別病原體之一病原體目標參考中一序列的所述多個序列讀段之一相應量,由此獲得一組序列讀段量,所述組序列讀段量中之每一各別序列讀段量對應於所述組病原體中之一相應病原體;以及(c)使用所述組序列讀段量確定所述測試個體是否患有所述癌症病況或所述測試個體患所述癌症病況的可能性。
TW108114393A 2018-04-24 2019-04-24 使用病原體核酸負荷確定個體是否患有癌症病況的系統及方法 TW202012639A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862662198P 2018-04-24 2018-04-24
US62/662,198 2018-04-24

Publications (1)

Publication Number Publication Date
TW202012639A true TW202012639A (zh) 2020-04-01

Family

ID=68294277

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108114393A TW202012639A (zh) 2018-04-24 2019-04-24 使用病原體核酸負荷確定個體是否患有癌症病況的系統及方法

Country Status (6)

Country Link
US (1) US20210115520A1 (zh)
EP (1) EP3784806A4 (zh)
AU (1) AU2019261597A1 (zh)
CA (1) CA3097992A1 (zh)
TW (1) TW202012639A (zh)
WO (1) WO2019209954A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11610648B2 (en) * 2019-04-18 2023-03-21 Life Technologies Corporation Methods for context based compression of genomic data for immuno-oncology biomarkers
WO2021110987A1 (en) * 2019-12-06 2021-06-10 Life & Soft Methods and apparatuses for diagnosing cancer from cell-free nucleic acids
US20210292845A1 (en) * 2020-02-28 2021-09-23 Grail, Inc. Identifying methylation patterns that discriminate or indicate a cancer condition
JP2023520889A (ja) * 2020-03-31 2023-05-22 グレイル エルエルシー ゲノム領域モデリングによるがん分類
IL311481A (en) * 2021-10-04 2024-05-01 Univ Hong Kong Chinese Viral DNA sequencing to predict disease recurrence

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2569626B1 (en) * 2010-05-11 2019-11-27 Veracyte, Inc. Methods and compositions for diagnosing conditions
EP2426217A1 (en) * 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
KR102393608B1 (ko) * 2012-09-04 2022-05-03 가던트 헬쓰, 인크. 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
US10767229B2 (en) * 2012-11-05 2020-09-08 Gmdx Co Pty Ltd Methods for determining the cause of somatic mutagenesis
US10364467B2 (en) * 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
ES2908347T3 (es) * 2015-02-10 2022-04-28 Univ Hong Kong Chinese Detección de mutaciones para cribado de cáncer y análisis fetal
CA2993362A1 (en) * 2015-07-23 2017-01-26 The Chinese University Of Hong Kong Analysis of fragmentation patterns of cell-free dna
WO2017019751A1 (en) * 2015-07-27 2017-02-02 The Johns Hopkins University Method to use viral and host methylation markers for cervical cancer screening and triage in liquid prep, serum/plasma, and urine: pcr and sequencing based process methods
WO2017212428A1 (en) * 2016-06-07 2017-12-14 The Regents Of The University Of California Cell-free dna methylation patterns for disease and condition analysis
CN110100013A (zh) * 2016-10-24 2019-08-06 香港中文大学 用于肿瘤检测的方法和系统

Also Published As

Publication number Publication date
WO2019209954A1 (en) 2019-10-31
EP3784806A4 (en) 2022-01-19
AU2019261597A1 (en) 2020-11-19
EP3784806A1 (en) 2021-03-03
CA3097992A1 (en) 2019-10-31
US20210115520A1 (en) 2021-04-22

Similar Documents

Publication Publication Date Title
TWI822789B (zh) 用於資料分類之卷積神經網路系統及方法
JP7385686B2 (ja) 無細胞核酸の多重解像度分析のための方法
JP6829211B2 (ja) 癌スクリーニング及び胎児分析のための変異検出
CN110100013A (zh) 用于肿瘤检测的方法和系统
TW202012639A (zh) 使用病原體核酸負荷確定個體是否患有癌症病況的系統及方法
US11581062B2 (en) Systems and methods for classifying patients with respect to multiple cancer classes
ES2959360T3 (es) Mejora del cribado del cáncer mediante ácidos nucleicos víricos acelulares
TW202039860A (zh) 游離dna末端特徵
WO2021139716A1 (en) Biterminal dna fragment types in cell-free samples and uses thereof
JP2023516633A (ja) メチル化シークエンシングデータを使用したバリアントをコールするためのシステムおよび方法
JP2023540257A (ja) がんを分類するためのサンプルの検証
JP7514224B2 (ja) マイクロサテライト不安定性を評価するための方法およびシステム
TW202102688A (zh) 與病毒相關的癌症的風險分級