TW202348802A - 使用核酸片段之診斷應用 - Google Patents

使用核酸片段之診斷應用 Download PDF

Info

Publication number
TW202348802A
TW202348802A TW112116081A TW112116081A TW202348802A TW 202348802 A TW202348802 A TW 202348802A TW 112116081 A TW112116081 A TW 112116081A TW 112116081 A TW112116081 A TW 112116081A TW 202348802 A TW202348802 A TW 202348802A
Authority
TW
Taiwan
Prior art keywords
dna
individuals
plasma
cancer
npc
Prior art date
Application number
TW112116081A
Other languages
English (en)
Inventor
煜明 盧
慧君 趙
君賜 陳
江培勇
偉棋 林
Original Assignee
香港中文大學
美商格瑞爾有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US2017/058099 external-priority patent/WO2018081130A1/en
Application filed by 香港中文大學, 美商格瑞爾有限責任公司 filed Critical 香港中文大學
Publication of TW202348802A publication Critical patent/TW202348802A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/708Specific hybridization probes for papilloma
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6879Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medical Informatics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本發明各種實施例係關於無細胞核酸(例如血漿DNA及血清DNA)之計數分析、片段化模式及尺寸的應用(例如生物樣品之分類),該等無細胞核酸包括病原體(諸如病毒)的核酸。本發明一種應用之實施例可判定個體是否處於特定狀況。舉例而言,本發明之方法可判定個體是否患有癌症或腫瘤或其他病理。另一種應用之實施例可用於評定病況之階段或隨時間推移之病況進展。舉例而言,本發明之方法可用於判定個體之癌症階段或個體隨時間推移之癌症進展(例如,利用在不同時間獲自個體之樣品)。

Description

使用核酸片段之診斷應用
腫瘤細胞將腫瘤來源之DNA釋放至血液的發現已引發非侵入性方法的開發,該等方法能夠利用無細胞樣品(例如血漿)來確定個體中腫瘤的存在、位置及/或類型。許多腫瘤若在出現早期偵測到,則可進行治療。然而,當前方法可能缺乏早期偵測腫瘤的靈敏度及/或特異性,且可能反而導致大量假陽性或假陰性結果。測試之靈敏度係指病況呈陽性之個體針對該病況測試呈陽性的可能性。測試之特異性係指病況呈陰性之個體針對該病況測試呈陰性的可能性。靈敏度及特異性問題可能在用於腫瘤早期偵測之分析法中被特顯,例如因為進行此類腫瘤偵測方法之樣品具有相對較少量的腫瘤來源的DNA,且因為病況本身在早期測試之個體當中具有相對較低的流行率。因此,對腫瘤偵測具有較高靈敏度及/或特異性的方法存在臨床上的需求。
本發明各種實施例係關於無細胞核酸(例如血漿DNA及血清DNA)之計數分析、片段化模式及尺寸的應用(例如生物樣品之分類),該等無細胞核酸包括諸如病毒之病原體的核酸。本發明一種應用之實施例可判定個體是否處於特定狀況。舉例而言,本發明之方法可判定個體是否患有癌症或腫瘤或其他病理。另一種應用之實施例可用於評定病況之階段或隨時間推移病況之進展。舉例而言,本發明之方法可用於判定個體之癌症階段或個體隨時間推移之癌症進展(例如,利用在不同時間獲自個體之樣品)。 根據一個實施例,可使用獲自無細胞核酸分子混合物之定序的序列讀段來確定與對應於病毒之參考基因組比對的序列讀段的量,與參考基因組比對之序列讀段的量可與截止值相比以篩查病理。 根據另一個實施例,可使用病毒核酸分子(例如與對應於病毒之參考基因組比對的彼等核酸分子)的尺寸。確定來自病毒之核酸分子尺寸分佈的統計值。個體之病理等級可藉由以截止值為背景處理統計值資料來確定。 根據另一個實施例,確定無細胞核酸分子之第一量,該無細胞核酸分子係終止於對應於病毒之參考基因組之一或多個第一窗口內。各第一窗口包含基因組位置之第一集合中之至少一者,在該等基因組位置處無細胞核酸分子之末端以高於第一臨限值之比率存在於患有與病毒相關之癌症(或其他病理)之個體中。藉由使用無細胞核酸分子的第二量使第一量正規化來計算出相對豐度,該第二量的無細胞核酸分子包括終止於包括基因組位置之第一集合之一或多個第一窗口以外的基因組位置之第二集合的無細胞核酸分子。個體之癌症等級可藉由以截止值為背景處理相對豐度資料來確定。 實施例可組合各種技術。舉例而言,第一分析法可基於計數、基於尺寸或基於片段化的。第二分析法可為其他技術中之一者。作為實例,可使用多數同意規則,或可確定兩種技術之截止值,藉此從兩種技術對應特定病理等級確定一組資料點。 其他實施例係關於與本文所述方法相關之系統、攜帶型消費者裝置及電腦可讀取媒體。 根據以下詳細描述,本發明之其他態樣及優點對於熟習此項技術者是顯而易見的,其中僅展示及描述本發明之說明性實施例。應認識到,本發明能夠具有其他及不同實施例,且其若干細節能夠在各種明顯的方面進行修飾,全部不背離本發明。因此,圖式及描述應在本質上視為說明性的而非限制性的。
相關申請案之交叉引用 本申請案主張2017年1月25日申請之名稱為「使用核酸片段之診斷應用(Diagnostic Applications Using Nucleic Acid Fragments)」的美國臨時申請案第62/450,541號及2017年5月16日申請之名稱為「使用核酸片段之診斷應用」的美國臨時申請案第62/507,154號的優先權;且為2017年10月24日申請之名稱為「用於腫瘤偵測之方法及系統(Methods And Systems For Tumor Detection)」的PCT申請案第PCT/US2017/058099號的部分接續申請案,該等申請案之全部內容以引用的方式併入本文中用於所有目的。 術語 「組織」對應於一群作為功能單元組合在一起的細胞。在單一組織中可發現多於一種類型之細胞。不同類型的組織可由不同類型的細胞(例如肝細胞、肺泡細胞或血細胞)組成,但亦可對應於來自不同生物體(宿主與病毒)之組織或對應於健康細胞與腫瘤細胞。術語「組織」一般係指人體中發現的任何細胞群(例如心臟組織、肺組織、腎組織、鼻咽組織、口咽組織)。在一些態樣中,術語「組織」或「組織類型」可用於指起源於無細胞核酸之組織。在一個實例中,病毒核酸片段可來源於血液組織,例如對於埃-巴二氏病毒(Epstein-Barr Virus,EBV)。在另一個實例中,病毒核酸片段可來源於腫瘤組織,例如EBV或人類乳頭狀瘤病毒感染(HPV)。 術語「樣品」、「生物樣品」或「患者樣品」意欲包括來源於活個體或死個體之任何組織或材料。生物樣品可為無細胞樣品,其可包括來自個體之核酸分子與可能來自病原體(例如病毒)之核酸分子的混合物。生物樣品一般包含核酸(例如DNA或RNA)或其片段。術語「核酸」一般係指去氧核糖核酸(DNA)、核糖核酸(RNA)或其任何雜交體或片段。樣品中之核酸可為無細胞核酸。樣品可為液體樣品或固體樣品(例如細胞或組織樣品)。生物樣品可為體液,諸如血液、血漿、血清、尿液、陰道液、來自(例如睪丸)水囊腫之液體、陰道沖洗液、胸膜液、腹水、腦脊髓液、唾液、汗液、淚液、痰液、支氣管肺泡灌洗液、乳頭排出液、來自身體不同部位(例如甲狀腺、乳房)之抽吸液等。亦可使用糞便樣品。在各種實施例中,無細胞DNA已富集之生物樣品(例如經由離心步驟獲得之血漿樣品)中之大部分DNA可為無細胞的(例如大於50%、60%、70%、80%、90%、95%或99%之DNA可為無細胞的)。生物樣品可經處理以物理破壞組織或細胞結構(例如離心及/或細胞裂解),由此將細胞內組分釋放至溶液中,該溶液可進一步含有用於製備樣品進行分析之酶、緩衝液、鹽、清潔劑及其類似物。 術語「對照物」、「對照樣品」、「參考物」、「參考樣品」、「正常物」及「正常樣品」可互換使用,以大體上描述不具有特定病況或在其他方面健康的樣品。在一實例中,可對患有腫瘤之個體進行如本文所揭示之方法,其中參考樣品為取自於個體之健康組織的樣品。在另一實例中,參考樣品為取自於患有疾病(例如癌症或癌症之特定階段)之個體的樣品。參考樣品可獲自個體或資料庫。參考物一般係指用於定位對來自個體之樣品進行定序所獲得之序列讀段的參考基因組。參考基因組一般係指可比對及比較來自生物樣品及組成樣品之序列讀段的單倍體或二倍體基因組。對於單倍體基因組,各基因座僅存在一個核苷酸。對於二倍體基因組,可鑑別出異型接合基因座,此類基因座具有兩個對偶基因,其中任一對偶基因可允許匹配以與基因座比對。參考基因組可對應於病毒,例如藉由包括一或多個病毒基因組。 如本文所用,片語「健康」一般係指個體具有良好的健康狀況。此類個體證實沒有任何惡性或非惡性疾病。「健康個體」可能患有與所分析之病況無關的其他疾病或病況,通常可能不視為「健康的」。 術語「癌症」或「腫瘤」可互換使用,且一般係指組織之異常腫塊,其中腫塊生長超越正常組織生長且與正常組織生長不協調。癌症或腫瘤可定義為「良性」或「惡性」,其視以下特徵而定:細胞分化程度(包括形態及功能)、生長速率、局部侵襲及轉移。「良性」腫瘤一般分化良好,生長典型地比惡性腫瘤更慢,且保持侷限於原發部位。另外,良性腫瘤不具有浸潤、侵襲或轉移至遠端部位之能力。「惡性」腫瘤一般分化不良(退行發育),典型地快速生長伴隨著漸進性浸潤、侵襲及破壞周圍組織。此外,惡性腫瘤具有轉移至遠端部位之能力。「階段」可用於描述惡性腫瘤如何發展的。與晚期惡性病相比,早期癌症或惡性病與體內腫瘤負荷較少相關聯,一般症狀較輕,預後較佳且治療結果較佳。晚期癌症或惡性病通常與遠端轉移及/或淋巴擴散相關。 術語「癌症等級」一般係指癌症是否存在(亦即存在或不存在)、癌症階段、腫瘤尺寸、是否存在轉移、身體之總腫瘤負荷及/或癌症嚴重程度之其他量度(例如癌症復發)。癌症等級可為數字或其他標誌,諸如符號、字母及顏色。等級可為零。癌症等級亦包括與突變或多種突變相關之惡化前或癌前期病況(狀態)。癌症等級可以多種方式使用。舉例而言,篩查可檢查先前未知患癌之某人是否存在癌症。評定可調查已經診斷患有癌症之某人以隨時間推移監測癌症之進展,研究療法有效性或確定預後。在一個實施例中,預後可表示為患者死於癌症之機率或在特定持續時間或時間之後癌症進展之機率或癌症轉移之機率。偵測可意謂『篩查』或可意謂檢查具有癌症之暗示特徵(例如症狀或其他陽性測試)之某人是否患有癌症。「病理等級」係指與病原體相關之病理等級,其中等級可如上文針對癌症所述。當癌症與病原體相關時,癌症等級可為一種類型的病理等級。 如本文所用,術語「片段」(例如DNA片段)係指包含至少3個連續核苷酸之聚核苷酸或多肽序列的一部分。核酸片段可保留親本多肽之生物活性及/或一些特徵。核酸片段可為雙股或單股的、甲基化或未甲基化的、完整或帶切口的、與其他大分子(例如脂質粒子、蛋白質)複合或未複合的。在一實例中,鼻咽癌細胞可將埃-巴二氏病毒(EBV) DNA之片段釋放至個體(例如患者)之血流中。此等片段可包含一或多個BamHI-W序列片段,其可用於偵測血漿中腫瘤來源之DNA的含量。BamHI-W序列片段對應於可使用Bam-HI限制酶識別及/或消化之序列。BamHI-W序列係指序列5'-GGATCC-3'。 腫瘤來源的核酸係指自腫瘤細胞釋放之任何核酸,包括來自腫瘤細胞中之病原體的病原體核酸。舉例而言,埃-巴二氏病毒(EBV) DNA可釋放自患有鼻咽癌(NPC)之個體的癌細胞。 術語「分析法」一般係指用於確定核酸特性之技術。分析法(例如第一分析法或第二分析法)一般係指用於確定樣品中核酸之量、樣品中核酸之基因組一致性、樣品中核酸之複本數變異、樣品中核酸之甲基化狀態、樣品中核酸之片段尺寸分佈、樣品中核酸之突變狀態或樣品中核酸之片段化模式的技術。一般熟習此項技術者已知的任何分析法均可用於偵測本文提及之核酸的任何特性。核酸之特性包括序列、數量、基因組一致性、複本數、在一或多個核苷酸位置處之甲基化狀態、核酸之尺寸、在一或多個核苷酸位置處之核酸中之突變及核酸之片段化模式(例如核酸片段化之核苷酸位置)。術語「分析法」可與術語「方法」互換使用。分析法或方法可具有特定的靈敏度及/或特異性,且其作為診斷工具之相對有用性可使用ROC-AUC統計學來量測。 如本文所用,術語「隨機定序」一般係指在定序程序之前尚未具體鑑別或預先確定所定序之核酸片段的定序。不需要靶向特異性基因座之序列特異性引子。在一些實施例中,將銜接子添加至片段之末端中,且將用於定序之引子附接至銜接子。因此,任何片段均可使用附接至相同通用銜接子之相同引子定序,且因此定序可為隨機的。可使用隨機定序進行大規模平行定序。 如本文所用,「序列讀段」(或定序讀段)一般係指自核酸分子之任何部分或全部定序之一串核苷酸。舉例而言,序列讀段可為自核酸片段定序之短核苷酸串(例如20-150)、在核酸片段之一端或兩端之短核苷酸串或存在於生物樣品中之整個核酸片段的定序。序列讀段可以多種方式獲得,例如使用定序技術或例如在雜交陣列中使用探針或捕捉探針,或擴增技術,諸如聚合酶鏈式反應(PCR)或使用單一引子之線性擴增或等溫擴增。 如本文所用,術語「定序深度」一般係指基因座由與基因座對齊之序列讀段覆蓋的次數。基因座可與核苷酸一樣小,或與染色體臂一樣大,或與整個基因組一樣大。定序深度可表示為50x、100x等,其中「x」係指基因座經序列讀段覆蓋之次數。定序深度亦可應用於多個基因座或全基因組,在此情況下,x係指基因座或單倍體基因組或全基因組分別定序之平均次數。當引述平均深度時,資料集中所包括之不同基因座的實際深度跨越一定範圍之值。超深度定序係指定序深度為至少100x。 術語「尺寸概況」及「尺寸分佈」一般係關於生物樣品中DNA片段之尺寸。尺寸概況可為提供各種尺寸之DNA片段之量分佈的直方圖。各種統計參數(亦稱為尺寸參數或僅參數)可將一個尺寸概況與另一個尺寸概況區分開。一個參數為特定尺寸或尺寸範圍之DNA片段相對於所有DNA片段或相對於另一尺寸或範圍之DNA片段的百分比。 「終止位置」或「末端位置」(或僅「末端」)係指無細胞DNA分子(例如血漿DNA分子)之最外部鹼基(亦即在末端處)之基因組座標或基因組標識或核苷酸標識。末端位置可對應於DNA分子之任一末端。以此方式,若吾人提及DNA分子之起點及末端,則兩者均可對應於終止位置。實務上,一個末端位置為在無細胞DNA分子之一個末端之最外部鹼基的基因組座標或核苷酸標識,其係藉由分析方法偵測或確定,諸如(但不限於)大規模平行定序或下一代定序、單分子定序、雙股或單股DNA定序文庫製備方案、聚合酶鏈式反應(PCR)或微陣列。此類活體外技術可改變無細胞DNA分子之真實活體內實體末端。因此,每個可偵測末端可代表生物學上真實的末端,或末端為向內的一或多個核苷酸或自分子之原始末端延伸之一或多個核苷酸,例如非鈍端雙股DNA分子之突出端藉由克列諾片段(Klenow fragment)的5'鈍化及3'填充。末端位置之基因組標識或基因組座標可由序列讀段於人類參考基因組(例如hg19)之比對結果推導出。其可由代表人類基因組原始座標之索引或代碼目錄推導出。其係指無細胞DNA分子上之位置或核苷酸標識,其藉由(但不限於)靶特異性探針、小型定序、DNA擴增來讀取。術語「基因組位置」係指聚核苷酸(例如基因、質體、核酸片段、病毒DNA片段)中之核苷酸位置。術語「基因組位置」不限於基因組(例如配子或微生物中或多細胞生物體之每個細胞中之染色體的單倍體組)內的核苷酸位置。 「偏好末端」(或「複現終止位置」)係指在具有生理或病理(疾病)狀態(例如癌症)之生物樣品中比不具有此類狀態或在相同病理或生理狀態之不同時間點或階段(例如在治療之前或之後)之生物樣品中更高度呈現或普遍(例如藉由比率所量測)的末端。因此,相對於其他狀態,偏好末端在相關生理或病理狀態下偵測到的可能性或機率增加。可例如在患有癌症及未患癌症之患者中比較病理狀態與非病理狀態之間增加的機率,且將其量化為似然比或相對機率。似然比可基於在測試樣品中偵測到至少臨限數目個偏好末端之機率或基於與無此類病況之患者相比在患有此類病況之患者中偵測到偏好末端之機率來確定。似然比臨限值之實例包括(但不限於) 1.1、1.2、1.3、1.4、1.5、1.6、1.8、2.0、2.5、3.0、3.5、4.0、4.5、5、6、8、10、20、40、60、80及100。此類似然比可藉由對具有與不具有相關狀態之樣品的相對豐度值進行比較來量測。由於在相關生理或疾病狀態中偵測到偏好末端之機率較高,故可在具有相同生理或疾病狀態之不止一個個體中發現此類偏好終止位置。隨著機率的增加,即使當所分析之無細胞DNA分子的數目遠小於基因組之尺寸時,仍可偵測到多於一個無細胞DNA分子終止於相同的偏好終止位置。因此,偏好或複現終止位置亦稱為「頻繁終止位置」。定量臨限值一般要求將在相同樣品或相同樣品等分試樣內至少多次(例如3、4、5、6、7、8、9、10、15、20或50)偵測到的末端視為偏好末端。相關生理狀態可包括當個人健康、無疾病或無所關注之疾病時的狀態。類似地,「偏好終止窗口」對應於一組連續的偏好終止位置。 「相對豐度」一般係指具有特定特徵(例如規定長度、終止於一或多個規定座標/終止位置或與基因組之特定區對齊)之第一量的核酸片段與具有特定特徵(例如規定長度、終止於一或多個規定座標/終止位置或與基因組之特定區對齊)之第二量核酸片段的比率。在一個實例中,相對豐度係指終止於基因組位置之第一集合之DNA片段之數目與終止於基因組位置之第二集合之DNA片段之數目的比率。在一些態樣中,「相對豐度」可對應於將終止於一個基因組位置窗口內之無細胞DNA分子之量(一個值)與終止於另一個基因組位置窗口內之無細胞DNA分子之量(另一個值)相關聯的一種類型的分離值。兩個窗口可重疊,但可具有不同的尺寸。在其他實施方案中,兩個窗口可不重疊。另外,窗口可具有一個核苷酸之寬度,且因此相當於一個基因組位置。 終止於一個位置之核酸分子(例如DNA或RNA)的「比率」涉及核酸分子終止於該位置之頻率。舉例而言,比率可基於相對於所分析之核酸分子的數目正規化的終止於該位置之核酸分子的數目。作為另一個實例,比率可基於相對於終止於不同位置之核酸分子的數目正規化的終止於該位置之核酸分子的數目。作為另一個實例,比率可基於相對於來自第二樣品(例如參考樣品)之終止於該位置之核酸分子的數目正規化的來自第一樣品之終止於該位置之核酸分子的數目。作為另一個實例,比率可基於相對於來自第二樣品(例如參考樣品)之終止於位置之第二集合之核酸分子的數目正規化的來自第一樣品之終止於位置之第一集合(例如一或多個第一窗口內之基因組位置)之核酸分子的數目。 術語「分類」係指與樣品之特定特性相關聯之任何數字或其他字符。舉例而言,「+」符號(或詞語「陽性」)可表示樣品分類為具有缺失或擴增。在另一個實例中,術語「分類」係指個體及/或樣品中腫瘤組織之量、個體及/或樣品中腫瘤之尺寸、個體中腫瘤之階段、個體及/或樣品中之腫瘤負荷及個體中存在腫瘤轉移。分類可為二元的(例如陽性或陰性)或具有更多等級的分類(例如1至10或0至1之級別)。術語「截止值」及「臨限值」係指操作中所用之預定數字。舉例而言,截止尺寸係指一種尺寸,大於此尺寸則排除片段。臨限值可為一種值,高於或低於此值,則特定分類適用。此等術語中之任一者可用於此等情形中之任一者。 術語「真陽性」(TP)係指個體患有病況。真陽性一般係指個體患有腫瘤、癌症、癌前期病況(例如癌前期病變)、局部或轉移癌症或非惡性疾病。真陽性一般係指個體患有病況,且可藉由本發明之分析法或方法鑑別為患有病況。 術語「真陰性」(TN)係指個體沒有病況或沒有可偵測之病況。真陰性一般係指個體沒有疾病或可偵測之疾病,諸如腫瘤、癌症、癌前期病況(例如癌前期病變)、局部或轉移癌症、非惡性疾病,或個體在其他方面健康。真陰性一般係指個體沒有病況或沒有可偵測之病況,或藉由本發明之分析法或方法鑑別為沒有病況。 術語「假陽性」(FP)係指個體沒有病況。假陽性一般係指個體沒有腫瘤、癌症、癌前期病況(例如癌前期病變)、局部或轉移癌症、非惡性疾病,或在其他方面健康。術語假陽性一般係指個體沒有病況,但藉由本發明之分析法或方法鑑別為患有病況。 術語「假陰性」(FN)係指個體患有病況。假陰性一般係指個體患有腫瘤、癌症、癌前期病況(例如癌前期病變)、局部或轉移癌症或非惡性疾病。術語假陰性一般係指個體患有病況,但藉由本發明之分析法或方法鑑別為沒有病況。 術語「靈敏度」或「真陽性率」(TPR)係指真陽性之數目除以真陽性及假陰性之數目的總和。靈敏度可表徵分析法或方法正確鑑別真正患有病況之群體之比例的能力。舉例而言,靈敏度可表徵方法正確鑑別患有癌症之群體內之個體數目的能力。在另一個實例中,靈敏度可表徵方法正確鑑別指示癌症之一或多個標記的能力。 術語「特異性」或「真陰性率」(TNR)係指真陰性之數目除以真陰性及假陽性之數目的總和。特異性可表徵分析法或方法正確鑑別真正沒有病況之群體之比例的能力。舉例而言,特異性可表徵方法正確鑑別沒有癌症之群體內之個體數目的能力。在另一個實例中,特異性可表徵方法正確鑑別指示癌症之一或多個標記的能力。 術語「ROC」或「ROC曲線」係指接受者操作特徵曲線。ROC曲線可為二元分類器系統效能之圖形表示。對於任何給定方法,ROC曲線可藉由在各種臨限值設定下將靈敏度對特異性繪圖來生成。用於偵測個體存在腫瘤之方法的靈敏度及特異性可在個體之血漿樣品中腫瘤來源的核酸的各種濃度下來確定。此外,提供三個參數(例如靈敏度、特異性及臨限值設定)中之至少一者,ROC曲線可確定任何未知參數之值或期望值。未知參數可使用擬合成ROC曲線之曲線來確定。術語「AUC」或「ROC-AUC」一般係指接受者操作特徵曲線下的面積。此度量可提供方法之診斷效用的量度,同時考慮方法之靈敏度及特異性。一般而言,ROC-AUC範圍介於0.5至1.0,其中更接近0.5之值表明該方法具有有限的診斷效用(例如較低靈敏度及/或特異性)且更接近1.0之值表明該方法具有較大的診斷效用(例如較高靈敏度及/或特異性)。參見例如Pepe等人, 「Limitations of the Odds Ratio in Gauging the Performance of a Diagnostic, Prognostic, or Screening Marker,」 Am. J. Epidemiol 2004, 159 (9): 882-890,其以全文引用的方式併入本文中。使用似然函數、優勢比、資訊理論、預測值、校準(包括擬合優度)及重新分類量測以表徵診斷效用之額外方法根據Cook, 「Use and Misuse of the Receiver Operating Characteristic Curve in Risk Prediction,」 Circulation 2007, 115: 928-935加以彙總,其以全文引用的方式併入本文中。 「陰性預測值」或「NPV」可藉由TN/(TN+FN)或所有陰性測試結果之真陰性分數來計算。陰性預測值本質上受群體中病況之流行率及欲檢驗群體之驗前機率的影響。「陽性預測值」或「PPV」可藉由TP/(TP+FP)或所有陽性測試結果之真陽性分數來計算。其本質上受疾病之流行率及欲檢驗群體之驗前機率的影響。參見例如O'Marcaigh A S, Jacobson R M, 「Estimating The Predictive Value Of A Diagnostic Test, How To Prevent Misleading Or Confusing Results,」 Clin. Ped. 1993, 32(8): 485-491,其以全文引用的方式併入本文中。 術語「約」或「大致」可意謂在由一般熟習此項技術者所確定之特定值的可接受誤差範圍內,其將部分取決於如何量測或測定該值,亦即量測系統之侷限性。舉例而言,根據此項技術中之實踐,「約」可意謂在1或大於1個標準差內。或者,「約」可意謂既定值之至多20%、至多10%、至多5%或至多1%之範圍。或者,特別是關於生物系統或方法,術語「約」或「大致」可意謂在數值之一定數量級內、在5倍內且更佳在2倍內。若特定值描述於本申請案及申請專利範圍中,除非另有說明,否則應假定術語「約」意謂在特定值之可接受誤差範圍內。術語「約」可具有如一般熟習此項技術者通常所理解之含義。術語「約」可指±10%。術語「約」可指±5%。 本文中所用之術語僅用於描述特定情況之目的且並不意欲為限制性的。如本文所用,除非上下文另外明確指出,否則單數形式「一(a)」、「一(an)」及「該」意欲亦包括複數形式。此外,就實施方式及/或申請專利範圍中使用術語「包括(including)」、「包括(includes)」、「具有(having)」、「具有(has)」、「具有(with)」或其變化形式之程度而言,此類術語意欲以類似於術語「包含」之方式為包括性的。 已顯示循環無細胞DNA分析在非侵入性監測癌症治療反應 (1-3)及偵測癌症復發 (4-6)方面具有價值。為了將循環無細胞DNA之應用擴展至癌症篩查,研究人員必須面對開發對於在癌症早期偵測預期低濃度的循環腫瘤DNA足夠靈敏之分析法的挑戰。 延伸至對人源血漿DNA分子之研究之外,本發明提出患有或未患癌症之人員的血漿中所存在之病毒DNA分子之間(例如埃-巴二氏病毒(EBV)與鼻咽癌(NPC)之間)的分子特徵可能存在差異。血漿病毒DNA分子當中的差異(若存在)將允許吾人更好地區分NPC患者,由此降低假陽性率且增強基於血漿EBV DNA之篩查測試的陽性預測值(PPV)。 循環無細胞EBV DNA為EBV相關惡性病之基於血液的生物標記 (8-10)。對於NPC之晚期病例,已使用即時PCR驗證其在NPC復發之預測及監測中的臨床效用 (11, 12)。然而,雖然此類技術已鑑別出NPC之晚期病例,但當前技術對於NPC之早期病例的篩查的PPV較低。早期癌症之準確篩查為治療提供最大益處,且因此希望提高此類早期篩查之準確性。 在本發明中,吾等基於對樣品(例如無細胞樣品,諸如血漿或血清)中之EBV DNA之特性的分析,描述用可偵測之EBV DNA區分NPC個體與非NPC個體。此類特性可包括與參考NPC基因組比對之來自樣品之核酸序列讀段的比例;來自參考NPC基因組之核酸的尺寸分佈(例如低於尺寸臨限值之核酸片段的比例);及核酸片段之片段化模式(例如相對於終止於其他位置之NPC片段之量的終止於某些位置之核酸片段之量)。實施例亦可應用於分析與病毒感染相關之其他類型的癌症。 為了證明血漿EBV DNA用於NPC篩查之用途,吾等進行一項大規模前瞻性篩查研究,其涉及20,174名自社區鑑別之無症狀參與者。在篩查群組中經鑑別之早期NPC病例(I期或II期)的比例顯著高於歷史未篩查的群組。藉由篩查鑑別之NPC病例具有較長的無進展存活期。此等有前景的結果連同基於血液之測試的非侵入性將可能有助於血漿EBV DNA作為NPC篩查工具之廣泛使用。 I. 無細胞樣品中之病毒 DNA病原體可侵入細胞。舉例而言,諸如EBV之病毒可存在於細胞內。此等病原體可釋放其核酸(例如DNA或RNA)。核酸通常自病原體已造成一些病理(例如癌症)之細胞釋放。 圖1展示包括EBV之NPC細胞。NPC細胞可包括許多病毒複本,例如50個。圖1展示EBV基因組之核酸片段110被釋放(例如當細胞死亡時)至血流中。雖然將核酸片段110描繪為環形(例如因為EBV基因組為環形的),但該等片段將僅為EBV基因組之一部分。因此,NPC細胞可將EBV DNA之片段沈積至個體之血流中。此腫瘤標記可用於NPC之監測(Lo等人 Cancer Res 1999; 59: 5452-5455)及預測(Lo等人 Cancer Res 2000; 60: 6878-6881)。 A. 某些病毒於各種癌症之關係病毒感染牽涉許多病理狀況。舉例而言,EBV感染與NPC及自然殺手(NK) T細胞淋巴瘤、霍奇金淋巴瘤(Hodgkin lymphoma)、胃癌及感染性單核白血球增多症密切相關。B型肝炎病毒(HBV)感染及C型肝炎病毒(HCV)感染與罹患肝細胞癌(HCC)之風險增加相關。人類乳頭狀瘤病毒感染(HPV)與罹患子宮頸癌(CC)及頭頸部鱗狀細胞癌(HNSCC)之風險增加相關。 然而,並非所有具有此類感染之個體均會患上相關癌症。無NPC人員之血漿EBV DNA的來源必須不同。與EBV DNA自NPC細胞持續釋放至循環中不同,無NPC人員之EBV DNA的來源僅短暫促成此類DNA。 B. 偵測無細胞樣品中之病毒 DNA實施例可提供藉由分析循環病毒DNA之含量及分子特徵來偵測及區分與病毒感染相關之不同病況的方法。此可有利地提供使用來自個體之無細胞樣品偵測或篩查各種病理狀況,在一些情況下,甚至在個體未顯示給定的病理狀況時。此亦可使得能夠監測給定病理狀況隨時間、在一些情況下在治療期間或之後的進展或消退。作為實例,樣品(例如血漿或血清)中發現之病原體的核酸可:(1)自腫瘤組織釋放;(2)自非癌細胞(例如攜帶EBV之休息B細胞)釋放及(3)包含在病毒粒子中。 NPC之發病機制與EBV感染密切相關。在NPC之地方性流行區域,例如華南,幾乎所有NPC腫瘤組織均具有EBV基因組。就此而言,血漿EBV DNA已被確立為NPC之生物標記(Lo等人 Cancer Res 1999; 59:1188-91)。已顯示,血漿EBV DNA可用於在治癒性意圖治療後偵測NPC個體之殘留疾病(Lo等人 Cancer Res 1999; 59:5452-5及Chan等人 J Natl Cancer Inst 2002;94:1614-9)。已顯示,NPC個體之血漿EBV DNA為小於200 bp之短DNA片段,因此不太可能來源於完整的病毒粒子(Chan等人 Cancer Res 2003, 63:2028-32)。 1. 用於晚期之 qPCR 分析法即時定量PCR分析法可使用EBV基因組之特定區域,特別是EBV基因組之兩個區域BamHI-W及EBNA-1區來偵測晚期NPC。在每個EBV基因組中可存在約六至十二個BamHI-W片段之重複序列,且在每個NPC腫瘤細胞中可存在大致50個EBV基因組(Longnecker等人 Fields Virology, 第5版, 第61章 「Epstein-Barr virus」;Tierney等人 J Virol. 2011; 85: 12362-12375)。換言之,在每個NPC腫瘤細胞中可存在約300-600個(例如約500個) PCR靶標複本。 圖2展示NPC及對照個體中血漿無細胞EBV DNA的比較。類別(NPC及對照個體)繪製在X軸上。Y軸表示藉由BamHI-W區PCR系統所偵測之無細胞EBV DNA的濃度(EBV DNA複本數/毫升血漿)。使用顯示與BamHI-W區PCR資料之強相關性(斯皮爾曼等級相關性(Spearman rank order correlation),相關係數5 0.918;P,0.0005)的EBNA-1 PCR獲得類似結果。 如圖2所示,在96% (55/57)之鼻咽癌(NPC)患者(中位數濃度,21058個複本/毫升)及7% (3/43)之對照(中位數濃度,0個複本/毫升)的血漿中可偵測到無細胞EBV DNA。 在另一個分析中,表1顯示所分析之不同類型的樣品的數目。在初始分析(群組1)中,自耳鼻喉(ENT)診所招募六名呈現與NPC相容之症狀(包括頸部腫塊、聽覺喪失及流鼻血)的個體。與未呈現症狀之其他群組中所檢查的個體相比,群組1中之NPC個體患有晚期疾病(晚期)。香港癌症登記處之歷史資料顯示,80%呈現症狀且後來確診患有NPC之個體在顯示醫療照護時已患有晚期NPC。吾等確定藉由即時PCR及大規模平行定序測定之血漿EBV DNA的濃度是否將可用於區分NPC個體與具有假陽性血漿EBV DNA而無癌症之個體。
樣品類型 樣品數目
在研究登記時具有可偵測之血漿EBV DNA但大致四週後無可偵測之血漿EBV DNA的非NPC個體。對於此等個體,分析在登記時收集之樣品。此等個體標示為「瞬時陽性」。 5
在登記時及大致四週後具有持續可偵測之血漿EBV DNA的非NPC個體。對於此等個體,分析在登記時收集之樣品。此等個體標示為「持續陽性」。 9
NPC個體 6
EBV陽性淋巴瘤個體(兩名患有NK T細胞淋巴瘤且一名患有霍奇金淋巴瘤) 3
患有感染性單核白血球增多症之個體 1
1圖3A及3B展示對不同組個體藉由即時PCR量測之血漿EBV DNA濃度。如圖3A所示,與具有可偵測之血漿EBV DNA但無任何可觀察的病理的彼等個體相比,患有NPC、淋巴瘤及感染性單核白血球增多症之個體的血漿EBV DNA濃度較高。如圖3B所示,對於在登記時具有可偵測之血漿EBV DNA但無任何可觀察的病理的彼等個體,具有持續陽性結果之個體在登記時所量測之血漿EBV DNA濃度與在後續測試中變成陰性(亦即具有瞬時可偵測之血漿EBV DNA)之彼等個體相比較高(p=0.002,曼-惠特尼檢驗(Mann-Whitney test))。 2. 早期 qPCR 結果圖4描繪患有早期NPC及晚期NPC之個體的血漿EBV DNA濃度(複本數/毫升血漿)。如圖4所示,晚期NPC病例中之此測試血漿無細胞EBV DNA含量(中位數,47,047個複本/毫升;四分位數範圍,17,314-133,766個複本/毫升)顯著高於早期NPC病例(中位數,5,918個複本/毫升;四分位數範圍,279-20,452個複本/毫升;曼-惠特尼秩和檢驗,P < 0.001)。 如本文中所提及,晚期NPC之偵測不如早期偵測有用。研究使用即時PCR對BamHI-W片段進行血漿EBV DNA分析以偵測無症狀個體之早期NPC的效用。(Chan等人 Cancer 2013;119:1838-1844)。在一項具有1,318名參與者之群體研究中,量測血漿EBV DNA含量以調查EBV DNA複本數是否可用於NPC監測。69名參與者(5.2%)具有可偵測之血漿EBV DNA含量,其中3名參與者最終使用鼻內鏡及磁共振成像臨床上診斷為患有NPC。因此,此研究中之單一血漿EBV DNA測試的陽性預測值(PPV)為約4%,由真正患有NPC之患者之數目(n=3)除以真正患有NPC之患者之數目與錯誤鑑別為患有NPC之患者之數目(n=66)的總和計算得出。 對20,174名年齡介於40至62歲之間的無症狀中國男性進行一項更大規模的研究。在招募的20,174名個體中,有1,112名個體(5.5%)可自基線PCR測試偵測到血漿EBV DNA。其中,34名個體後來確診患有NPC。對於其餘1,078名非癌症個體,803名個體具有『瞬時陽性』血漿EBV DNA結果(亦即基線陽性但後續陰性)且275名具有『持續陽性』血漿EBV DNA結果(亦即基線及後續均為陽性)。首先用資料子集進行驗證分析。 圖5展示血漿EBV DNA呈持續陽性但無可觀察的病理的(左)個體及藉由篩查鑑別的(右)早期NPC患者藉由即時PCR量測之血漿EBV DNA濃度,作為驗證分析之一部分。經由篩查20,174名無症狀個體鑑別之34名NPC個體中之五名包括於此驗證分析中。此5名個體在參加研究時無症狀。群組2中此5名個體的血漿樣品對EBV DNA呈持續陽性,且隨後藉由內視鏡檢及MRI確診為NPC。與群組1中向ENT診所呈現症狀且診斷為患有晚期NPC之6名NPC個體不同,此5名無症狀NPC病例屬於早期。 圖6展示對血漿EBV DNA呈瞬時陽性(n=803)或持續陽性(n=275)(分別為左或中)但無可觀察的病理之個體及經鑑別為患有NPC之個體(n=34)之血漿EBV DNA片段濃度(複本數/毫升)的盒鬚圖。圖6展示來自基線PCR測試之1,112名具有可偵測之血漿EBV DNA之個體中所有個體的結果。EBV DNA片段之濃度(複本數/毫升)係藉由即時PCR分析來量測。 血漿EBV DNA結果表示為『陽性』或『陰性』。此處吾等回顧如藉由即時PCR所量測之組間血漿EBV DNA濃度的定量水準(圖6)。NPC組之平均血漿EBV DNA濃度(942個複本/毫升;四分位數範圍(IQR),18至68個複本/毫升)顯著高於『瞬時陽性』組(16個複本/毫升;IQR,7至18個複本/毫升)及『持續陽性』組(30個複本/毫升;IQR,9至26個複本/毫升) ( P< 0.0001,克拉斯卡-瓦立斯檢驗(Kruskal-Wallis test))。然而,三組當中之血漿EBV DNA濃度存在大量重疊(圖6)。 圖7展示對血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體及經鑑別為患有NPC之個體藉由即時PCR量測之血漿EBV DNA濃度(複本數/毫升)。在具有72名個體之此群組中,不同組個體當中藉由即時PCR量測之血漿EBV DNA濃度不存在統計學上顯著之差異( p值= 0.19;克拉斯卡-瓦立斯檢驗)。 3. 用於早期之兩次分析法分析前瞻性篩查研究中所用之即時聚合酶鏈式反應(PCR)分析法經顯示,對於偵測甚至來自小腫瘤之血漿EBV DNA高度靈敏。然而,在測試特異性方面存在改進空間。NPC在香港之峰值年齡別發病率為40/100,000人 (13),但大致5%之健康群體的血漿中具有可偵測之EBV DNA含量 (8, 14)。當藉由即時PCR分析法對每一參與者進行一次血漿EBV DNA評定時,篩查研究得到3.1%之陽性預測值(PPV) (7)。 鑒於即時PCR分析法之低PPV,因而研究於兩次不同時間用兩次分析法之效用。舉例而言,上述先前的研究顯示,EBV DNA傾向於在NPC個體之血漿中為可持續偵測的,但在非癌症個體之血漿中短暫出現。 為了研究血漿EBV DNA是否可用於篩查無症狀個體之早期NPC,吾等已使用血漿EBV DNA分析篩查20,174名無NPC症狀之個體。具有可偵測之血漿EBV DNA的個體在大致4週後用後續血漿EBV DNA分析再測試。用鼻咽之鼻內視鏡檢及磁共振成像(MRI)進一步研究在兩次連續分析具有持續陽性結果之個體。在招募的20,174名個體中,1,112名在登記時血漿EBV DNA呈陽性。其中,309名在後續測試中呈持續陽性。在血漿EBV DNA呈持續陽性之個體的群組內,34名隨後在用鼻內視鏡檢及MRI研究後確診為患有NPC。 兩個時間點測試方法確實將假陽性率自5.4%降低至1.4%,所得PPV為11.0%。此等結果顯示,具有初始陽性血漿EBV DNA結果之個體的再測試可將NPC個體與具有瞬時陽性結果之彼等個體區分開,且大幅降低需要更具侵入性及昂貴研究(亦即內視鏡檢及MRI)之個體的比例。然而,血漿EBV DNA之連續測試需要自具有初始陽性結果之個體收集額外血液樣品,其可能帶來後勤挑戰。 雖然兩次測試之PPV與其他癌症之群體篩查模態相比表現良好 (16),但在此研究中,吾等詢問是否可能有策略進一步增強藉由血漿EBV DNA分析之NPC篩查的PPV,例如藉由開發可用作獨立測試之新分析法。此等改良可允許吾等用基於單一時間點測試之方案取代兩個時間點測試方案。 C. 使用病毒 DNA 對早期及晚期癌症之初始定序分析在一些情況下,在初始分析法(例如qPCR分析法)後或代替qPCR篩查病況(例如腫瘤,例如NPC)之分析法可包含使用大規模平行定序來評定來自定位至EBV參考基因組之樣品之序列讀段的比例。 為了分析血漿中之無細胞病毒DNA,使用以專門設計的捕捉探針捕捉富集的靶向定序。此等捕捉探針覆蓋全EBV基因組、全HBV基因組、全HPV基因組及人類基因組中之多個基因組區域(包括chr1、chr2、chr3、chr5、chr8、chr15及chr22上之區域)。對於所分析之每個血漿樣品,使用QIAamp DSP DNA血液微型套組自4 mL血漿提取DNA。對於每種情況,使用KAPA文庫製備套組將所有提取的DNA用於製備定序文庫。使用KAPA PCR擴增套組對定序文庫進行十二個循環的PCR擴增。使用覆蓋上述病毒及人類基因組區域之定製設計的探針,使用SEQCAP-EZ套組(Nimblegen)捕捉擴增產物。在靶向捕捉後,進行14個循環之PCR擴增且使用Illumina NextSeq平台對產物進行定序。對於每一定序運行,使用雙端模式對具有獨特樣品條形碼之四至六個樣品進行定序。每個DNA片段將自兩個末端中之每一者定序75個核苷酸。在定序後,經定序之讀段將定位至人工組合之參考序列,其由全人類基因組(hg19)、全EBV基因組、全HBV基因組及全HPV基因組組成。定位至組合基因組序列中之獨特性地位置的經定序之讀段將用於下游分析。經獨特性地定位之讀段的中位數為5.3千萬(範圍:1.5~14.1千萬)。 1. 晚期圖8A及8B展示不同組個體之血漿中定位至EBV基因組的經定序之血漿DNA片段的比例。與圖3A及3B相同,個體對應於群組1。 如圖8A所示,在目標捕捉後使用大規模平行定序,與在登記時具有可偵測之血漿EBV DNA但無任何可觀察的病理之彼等個體相比,在患有NPC、淋巴瘤及感染性單核白血球增多症之個體中獨特性地定位至EBV基因組之讀段的比例較高。如圖B所示,對於在登記時具有可偵測之血漿EBV DNA但無任何可觀察的病理之彼等個體,具有持續陽性結果之個體在登記時所量測之定位至EBV基因組之讀段的比例與在後續測試中變成陰性(亦即具有瞬時可偵測之血漿EBV DNA)之彼等個體相比較高(p = 0.002,曼-惠特尼檢驗)。與使用即時PCR量測之血漿EBV DNA的濃度相比,使用獨特性地定位至EBV基因組之讀段比例的量測結果使得具有瞬時及持續陽性結果之個體之間的差異更大(19.3倍對1.7倍)。 血漿EBV DNA升高與NPC相關。先前的研究將NPC病例與血漿EBV DNA主要呈陰性的健康對照相比較。圖3A、3B、8A及8B提供NPC病例與血漿EBV DNA呈假陽性之非NPC病例之間的定量比較。下文所述之技術允許提高區分具有病理之個體與不具有病理之個體的準確性,由此減少假陽性。在EBV DNA之情況下,術語「假陽性」可意謂個體具有可偵測之血漿EBV DNA,但個體未患NPC (與病原體相關之病理實例)。血漿EBV DNA之存在為真實的,但相關病理(例如NPC)經鑑別可能為錯誤的。 2. 早期圖9展示(左)對血漿EBV DNA呈持續陽性但無可觀察的病理之個體及(右)早期NPC個體之血漿中定位至EBV基因組之讀段的比例。與圖5相同,個體對應於群組2。 如上所述,在靶富集後對血漿樣品進行定序。對於群組2中之五名NPC個體,雖然其血漿樣品對EBV DNA呈持續陽性,但與基於即時PCR分析之具有假陽性血漿EBV DNA結果的9名個體相比,EBV DNA濃度未顯示出顯著差異(P=0.7,曼惠特尼檢驗)。已知血漿EBV DNA濃度與NPC之階段相關。因此,早期NPC個體之血漿EBV DNA含量較低並不令人意外。 定位至EBV基因組之經定序之血漿DNA讀段的比例在假陽性病例與群組2 NPC病例之間無顯著差異。此等初始資料表明,圖5及9中所示之方法可能無法很好地區分假陽性與早期NPC。但是,此係針對小樣本數目。其他定序結果論述於下一部分。 D. 早期診斷之益處圖10分別描繪NPC患者在癌症各階段之總存活率及香港NPC之階段分佈。在一些實施例中,本發明之方法可用於減少達到癌症較高階段之患者的數目,由此增加其總存活機率。 II. 基於計數之病毒 DNA 分析如吾等對20,174名無症狀個體之前瞻性大規模篩查研究所示,若測試僅進行一次,則藉由即時PCR所測定之可偵測之血漿EBV DNA序列的存在或不存在可偵測到97.1%之無症狀NPC病例,假陽性率為5.4%。71%之無症狀NPC病例藉由鼻內視鏡檢及/或磁共振成像確診為早期(I期及II期)。為了進一步改良偵測早期NPC之PPV或降低假陽性率,吾等研究藉由即時PCR進行血漿EBV DNA定量是否具有價值。用於NPC早期偵測之血漿EBV DNA定量的即時PCR分析(圖5-7)顯示,即時PCR區分經篩查無症狀且呈NPC真陽性之個體與假陽性個體的能力有限。用於靶向定序之小樣本數目群組 (圖9)亦表明,血漿中定位至EBV基因組之序列讀段的比例將可能無法提供作為獨立測試之足夠區分。然而,吾等現已驗證定序定量之PPV、靈敏度及特異性值,且顯示其即使就其自身而言仍為有效的。對於僅基於計數之分析,靈敏度為97.1%,特異性為97.4%且PPV為6.1% (表4)。 使用上述經鑑別之20,174名個體的樣品,吾等使用靶向定序來捕捉及量測患有及未患NPC之個體的血漿EBV DNA之豐度。目的為鑑別血漿EBV DNA分子特徵,在區分患有NPC之人員與未患NPC但具有陽性血漿EBV DNA之~5%的群體方面,其將理想地維持靈敏度,但提供增強的特異性 (8, 14)A. 序列讀段之比例 - 探索及驗證使用來自20,174名個體之篩查研究的此大樣品集來確定來自樣品之序列讀段的比例是否可提供準確結果。將初始樣品集用於探索模式以確定用於最初鑑別個體是否患有癌症的模型(例如截止值)。將第二樣品集用於驗證模式以確定由發現模式確定之模型(例如截止值)之結果的準確性。雖然此部分關注EBV及其與NPC之關聯,但論述適用於病毒與癌症之間的其他關聯。 圖11展示用於探索及驗證使用與EBV基因組比對之序列讀段的比例篩查NPC的群組。在篩查研究中,招募20,174名個體且全部接受藉由即時PCR對血漿EBV DNA之基線測試。在基線時,1,112名個體具有可偵測之血漿EBV DNA。其中,34名個體確診患有NPC。對於其餘1,078名非癌症個體,803名個體具有『瞬時陽性』血漿EBV DNA結果(亦即基線陽性但後續陰性)且275名具有『持續陽性』血漿EBV DNA結果(亦即基線及後續均為陽性)。 吾等隨機選擇癌症及非癌症個體之血漿樣品,且將其分配至當前研究之探索及驗證樣品集中。兩個集合中之樣品不重疊。篩查研究中之所有34個NPC病例均已作為探索或驗證樣品集之一部分加以分析。驗證樣品集中包括來自獨立群組之額外31名NPC患者。 具體而言,吾等自篩查研究中隨機選擇10名NPC患者及40名非癌症個體(20名具有瞬時陽性EBV DNA結果且20名具有持續陽性EBV DNA結果)以包括於探索樣品集中。在10名隨機選擇之NPC個體當中,5名患有I期疾病,2名患有II期疾病,2名患有III期疾病且1名患有IV期疾病。 在驗證樣品集中,吾等包括其餘的24名患有NPC之患者及隨機選擇的232名非癌症個體。此232名非癌症個體包括159名具有瞬時陽性血漿EBV DNA結果之個體及73名具有持續陽性血漿EBV DNA結果之個體。『瞬時陽性』組與『持續陽性』組之比率類似於需要兩次分析法之篩查研究中所觀察到的實際比率。驗證組中之個體與探索組中之個體不重疊。 在驗證樣品集中,吾等亦包括來自外部未篩查群體之其他31名NPC患者。在篩查群組之24名NPC患者當中,11名患有I期疾病,6名患有II期疾病,6名患有III期疾病且1名患有IV期疾病。來自篩查群組之患有早期(I期及II期)及晚期(III期及IV期)疾病之NPC患者的分佈在探索及驗證樣品集之間無統計學上顯著之差異( P=1.0, 費雪精確檢驗(Fisher's exact test))。在來自外部群組之31名NPC患者當中,有3名I期疾病患者、2名II期疾病患者、20名III期疾病患者及6名IV期疾病患者。 圖12為展示探索及驗證樣品集中之個體特徵的表格。在篩查群組中,探索集中經選擇之NPC患者及驗證集中經選擇之NPC患者藉由即時PCR量測之血漿EBV DNA濃度無統計學上顯著之差異( P=0.2, t檢驗)。在篩查群組中,此等經選擇之232名非癌症個體與所有非癌症個體之間藉由即時PCR量測之血漿EBV DNA濃度無統計學上顯著之差異( P=0.07, t檢驗)。 對在登記進入前瞻性篩查研究時收集之基線(第一時間點)樣品進行定序分析。對於探索及驗證樣品集中之所有樣品,每一樣品經定位之讀段的中位數為7千萬(四分位數範圍(IQR),6.1千萬至8.5千萬)。 藉由覆蓋整個EBV基因組及人類染色體1、2、3、5、8、15及22之部分的探針捕捉血漿DNA分子且隨後定序。血漿EBV DNA讀段係指經定序且定位至EBV基因組之血漿DNA片段。吾等量測在移除PCR複製物之後EBV DNA讀段在比對的DNA讀段的總數中的比例(例如,如藉由相同起始及終止座標所確定)。此類技術可稱為基於計數之分析。 圖13A展示探索資料集中之NPC患者及具有瞬時陽性及持續陽性結果之非癌症個體之經定序之血漿DNA讀段的總數當中血漿EBV DNA讀段之比例。使用自探索樣品集獲得之資料,定義基於計數及基於尺寸之分析中的截止值以獲得捕捉所有NPC病例之100%靈敏度。在基於計數之分析中,將截止值定義為低於探索資料集中此10名NPC患者之EBV DNA讀段部分之對數值的平均值3個標準差。紅色點線1310表示4.5 × 10 -6之截止值。 使用此截止值,20名具有瞬時陽性EBV DNA結果之個體中之13名及20名具有持續陽性EBV DNA結果之個體中之15名在基於計數之分析中通過截止值。NPC患者(中位數,7.6 × 10 -5;IQR,6.2 × 10 -5至1.1 × 10 -4)之EBV DNA讀段的比例統計學上顯著高於具有瞬時陽性(中位數,6.9 × 10 -6;IQR,1.1 × 10 -6至1.9 × 10 -5P=0.0005,克拉斯卡-瓦立斯檢驗)及持續陽性結果(中位數,3.0 × 10 -5;IQR,4.5 × 10 -6至5.8 × 10 -5P=0.04,克拉斯卡-瓦立斯檢驗)之非癌症個體。 圖13B展示驗證樣品集中之NPC患者及具有瞬時陽性及持續陽性結果之非癌症個體之血漿EBV DNA讀段的比例。紅色點線1320表示探索資料集中所定義之相同截止值4.5 × 10 -6。 吾等分析驗證樣品集之所有樣品中EBV DNA讀段的比例。來自篩查群組(中位數,2.2 × 10 -4;IQR,8.9 × 10 -5至1.5 × 10 -3)及外部群組(中位數,1.7 × 10 -3;IQR,2.5 × 10 -4至5.4 × 10 -3)之NPC患者樣品之EBV DNA讀段的比例顯著高於具有瞬時陽性結果(中位數,2.1 × 10 -6;IQR,6.5 × 10 -7至8.0 × 10 -6P<0.0001)及持續陽性結果(中位數,2.4 × 10 -5;IQR,1.1 × 10 -5至5.0 × 10 -5P=0.0044)之非癌症個體的樣品。在探索資料集中所定義之截止值為4.5 × 10 -6之情況下,可捕捉來自兩個群組之NPC患者的所有樣品且EBV DNA讀段之比例高於定義的截止值。在基於計數之分析中,有56名(159名中)具有瞬時陽性結果之個體及64名(73名中)具有持續陽性結果之個體通過截止值。 B. 其他結果上述分析說明,與EBV基因組比對之無細胞樣品中序列讀段的比例可提供有用的獨立測試以篩查早期NPC。提供關於EBV、HBV及HPV之其他結果。 1.   EBV圖14展示對血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體及經鑑別為患有NPC之個體之定位至EBV基因組之血漿DNA片段的比例(%)。用於圖14之群組為用於圖7之相同群組。對於圖14中之定序結果,NPC與持續陽性個體之間的分離度相較於圖7中之即時PCR定量結果明顯較佳。 在對DNA片段進行靶向捕捉及定序後使用大規模平行定序,由所有經定序之讀段當中獨特性地定位至EBV基因組之讀段的比例所推導的EBV數量存在統計學上顯著之差異( p值= 0.01;克拉斯卡-瓦立斯檢驗)。藉由對所有經定序之讀段當中血漿EBV DNA片段之比例應用0.0009% (圖13A之單位為9 × 10 -6)的截止值,能夠區分患有NPC且具有持續陽性血漿EBV DNA之個體與大部分具有瞬時陽性血漿EBV DNA結果之個體。在患有NPC之個體組中,血漿中EBV讀段之比例最高。與在後續測試中將變成陰性(亦即具有瞬時可偵測之血漿EBV DNA)之彼等個體相比,具有持續陽性結果之個體在登記時所量測之血漿EBV DNA片段的比例較高。 圖15A展示15個瞬時陽性樣品、20個持續陽性樣品及10個來自確診NPC個體之樣品之訓練集的血漿中定位至EBV基因組之讀段的比例(%)。由所有經定序之讀段當中獨特性地定位至EBV基因組之讀段的比例所推導的EBV數量存在統計學上顯著之差異( p值< 0.0001;克拉斯卡-瓦立斯檢驗)。 在圖15A所示之實例中,截止值設定為0.0009%以捕捉所有NPC患者。藉由對所有經定序之讀段當中血漿EBV DNA片段之比例應用0.0009%之截止值,區分患有NPC且具有持續陽性血漿EBV DNA之個體與大部分具有瞬時陽性血漿EBV DNA結果之個體。在患有NPC之個體組中,血漿中EBV讀段之比例最高。與具有瞬時可偵測之血漿EBV DNA之彼等個體相比,具有持續陽性結果之個體之血漿EBV DNA片段的比例較高。在一些實施例中,可使用尺寸分析評估值高於0.0009%截止值之彼等樣品(5個瞬時陽性樣品;13個持續陽性樣品及10個NPC樣品),如V.A部分中所述。 圖15B展示56個瞬時陽性樣品、44個持續陽性樣品及29個來自確診NPC個體之樣品之驗證集的血漿中定位至EBV基因組之讀段的比例(%)。由所有經定序之讀段當中獨特性地定位至EBV基因組之讀段的比例所推導的EBV數量存在統計學上顯著之差異( p值< 0.0001;克拉斯卡-瓦立斯檢驗)。藉由對所有經定序之讀段當中血漿EBV DNA片段之比例應用0.0009%之截止值,能夠區分患有NPC且具有持續陽性血漿EBV DNA之個體與大部分具有瞬時陽性血漿EBV DNA結果之個體。在患有NPC之個體組中,血漿中EBV讀段之比例最高。與具有瞬時可偵測之血漿EBV DNA之彼等個體相比,具有持續陽性結果之個體之血漿EBV DNA片段的比例較高。高於截止值之樣品為:18個瞬時陽性樣品;35個持續陽性樣品及29個NPC樣品。 2.   HBV圖16展示HCC組之血漿中B型肝炎病毒(HBV) DNA片段之豐度(平均值:0.00047%)顯著高於包括健康對照個體、HBV攜帶者、肝硬化個體之非HCC組(平均值:0.021%)。HCC中HBV DNA片段之百分比為非HCC個體之45倍。此等資料顯示,血漿HBV DNA分子之定量評定將為HCC之偵測提供高靈敏度及特異性。 3.   HPV定序分析法可以類似於本文針對EBV所述之方式用以量測樣品中腫瘤相關之HPV DNA的量。此類分析可對篩查子宮頸癌(CC)及頭頸部鱗狀細胞癌(HNSCC)特別有用。在一個實例中,靶向定序分析法靶向HPV基因組多形性L1區內之區域(例如200個核苷酸)。更特定言之,可使用捕捉探針,其選擇性地與編碼L1區中之一或多個高變表面環的序列雜交。 下表2說明血漿中之HPV DNA可藉由定序偵測。
樣品ID 定位至HPV基因組之片段 定位至HPV基因組之片段的百分比(%)
健康對照 EN086 0 0
GC038 0 0
ER022 0 0
BP0656 0 0
FF159 0 0
鼻咽癌(NPC)患者 TBR1358 0 0
TBR1390 0 0
TBR1379 0 0
TBR1378 0 0
慢性B型肝炎病毒(HBV)攜帶者 GM2192F 0 0
GM2910F 0 0
GM6421F 0 0
肝細胞癌(HCC)患者 TBR_1330 0 0
TBR_1336 0 0
TBR_1423 0 0
子宮頸癌(CC)患者 C-819 1489 0.00731
C-822 1720 0.0132
C-877 6773 0.03177
C-788 7992 0.06083
C-801 2127 0.04563
C-803 1316 0.01504
頭頸部鱗狀細胞癌(HNSCC)患者 TBR_1067 53 0.00009
TBR_1019 3287 0.00642
2如下面提供的表5所示,使用捕捉探針設計藉由靶向定序分析來自23名無癌症(健康對照或慢性HBV攜帶者)或患有各種癌症(NPC、HCC、CC、HNSCC)之個體的血漿樣品。將序列讀段與HPV基因組進行比對且計數。資料顯示,來源於HPV之血漿DNA片段在患有HPV相關CC或HNSCC之患者的血漿中可偵測到,但在其他患者組中之任一者中均未偵測到。血漿HPV DNA片段之量可依據自進行定序之量偵測到的每一體積的絕對數來表示,或表示為與其他非HPV源性序列讀段之量的比例。 如表2所示,存在高於由健康個體或無HPV相關癌症之個體確立之臨限值之量的血漿HPV DNA序列可提供存在HPV相關癌症之證據。在此分析中,CC及HNSCC為HPV相關癌症,而NPC及HCC為非HPV相關癌症。在此分析中,使用定位至HPV之片段>0或定位至HPV之讀段>0%的截止值。舉例而言,可使用其他方法來基於無HPV相關癌症之個體的資料(包括ROC分析、>第90百分位、>第99百分位、高於平均值>2個標準差或>3個標準差)來確立參考值或截止值。 樣品中血漿HPV DNA序列之豐度範圍的差異可反映HPV相關癌症之階段。另外,血漿HPV DNA序列之數量級差異可反映不同組織來源之癌症。舉例而言,表2展示CC患者樣品中血漿HPV DNA序列之量一般高於HNSCC患者之樣品。 血漿HPV DNA序列當中之序列變體可允許吾人確定HPV之血清型或基因型,且進一步提供癌症診斷之高可能性的證據。舉例而言,CC通常與HPV 16型及HPV 18型相關。 在另一個分析中,表3展示所分析之患有不同類型HPV相關惡性病之患者的數目。
健康或疾病狀況 樣本數
患有子宮頸癌之患者 11
患有HPV陽性頭頸部鱗狀細胞癌之患者 7
患有子宮頸上皮內瘤形成之患者 16
3圖17展示各子宮頸癌臨床病例中獨特性地定位至不同HPV血清型之HPV基因組之讀段的數目及比例。對於每個臨床病例,自1 mL血漿提取血漿DNA。在靶向捕捉後使用大規模平行定序,得到每個病例之獨特性地定位至HPV基因組之讀段的數目。計算在移除重複讀段後所有經定位之讀段(亦即定位至人類及HPV基因組)當中血漿HPV讀段(獨特性地定位至HPV基因組之讀段)的比例。全部11名患有子宮頸癌患者的血漿DNA樣品中具有至少一個HPV DNA片段。HPV 16及18為兩種HPV血清型,血清型不同之處在於基因序列。血清型16及18為最常見的與子宮頸癌相關之血清型。 圖18展示各子宮頸上皮內瘤形成(intraepithelial neoplasia;CIN)臨床病例中獨特性地定位至不同HPV血清型之HPV基因組之讀段的數目及比例。對於每個臨床病例,自1 mL血漿提取血漿DNA。在靶向捕捉後使用大規模平行定序,得到每個病例之獨特性地定位至HPV基因組之讀段的數目。計算在移除重複讀段後所有經定位之讀段(亦即定位至人類及HPV基因組)當中血漿HPV讀段(獨特性地定位至HPV基因組之讀段)的比例。16名CIN患者中有3名在其血漿DNA樣品中具有至少一個HPV DNA片段。 圖19展示各HPV陽性頭頸部鱗狀細胞癌(HPV+ve HNSCC)臨床病例中獨特性地定位至不同HPV血清型之HPV基因組之讀段的數目及比例。根據AJCC癌症分期手冊第8版進行病例分期。對於每個臨床病例,自1 mL血漿提取血漿DNA。全部7名HPV +ve HNSCC患者在其血漿DNA樣品中具有至少一個HPV DNA片段。與CIN患者相比,較高比例之HPV+ve HNSCC患者在其血漿DNA樣品中具有HPV DNA片段。其可能歸因於HPV+ve HNSCC病例輸入血漿量較高。 利用相同捕捉探針組以靶向定序法分析270名健康個體。其中9名(3.3%)在其血漿中具有至少一個HPV DNA片段。圖20展示具有至少一個血漿HPV DNA之9名健康個體之血漿樣品中血漿HPV片段的數目及相應的HPV血清型。 藉由將定義『可偵測之血漿HPV DNA』之HPV讀段數目的截止值設定為1,5名健康個體(1.9%)及2名CIN患者(12.5%)在其血漿中具有可偵測(大於1)之HPV DNA。全部11名子宮頸癌患者及7名HPV+ve HNSCC患者仍具有可偵測之血漿HPV DNA。若將定義『可偵測之血漿HPV DNA』之HPV讀段數目的截止值設定為5,則僅1名健康個體(0.3%)在其血漿中具有可偵測之HPV DNA。2名CIN患者具有可偵測之血漿HPV DNA。全部11名子宮頸癌患者及7名HPV+ve HNSCC患者仍具有可偵測之血漿HPV DNA。HPV讀段數目之截止值的實例包括(但不限於) 1、2、3、4、5、10、15及20。 圖21展示患有子宮頸癌、子宮頸上皮內瘤形成(CIN)、HPV陽性頭頸部鱗狀細胞癌(HPV+ve HNSCC)之患者及健康對照之血漿DNA樣品中HPV讀段(包括所有血清型)的中位數比例。子宮頸癌患者之HPV讀段的中位數比例(0.0048%)顯著高於CIN患者(0%)及健康對照(0%) (p<0.0001,克拉斯卡-瓦立斯檢驗)。HPV+ve HNSCC患者之HPV讀段的中位數比例(0.003%)亦顯著高於健康對照(p<0.0001,曼-惠特尼檢驗) C. 方法圖22為說明根據本發明之實施例使用個體之無細胞混合物中病毒核酸片段之序列讀段篩查癌症之基於計數之方法2200的流程圖。方法2200之態樣可由電腦系統執行,例如本文所述。 方法2200可用於篩查生物樣品之病理,其中生物樣品包括無細胞核酸分子之混合物。可對病理(例如一種類型之癌症、CIN或單核白血球增多症)無症狀之個體進行篩查,且因此在病理早期鑑別出個體。混合物可包括來自個體之核酸分子及可能來自病毒(例如EBV、HBV或HPV)之核酸分子。 在區塊2210處,自個體獲得生物樣品。作為實例,生物樣品可為血液、血漿、血清、尿液、唾液、汗液、淚液及痰液,以及本文所提供之其他實例。在一些實施例中(例如對於血液),可純化生物樣品以獲得無細胞核酸分子之混合物,例如將血液離心以獲得血漿。 在區塊2220處,對無細胞核酸分子之混合物進行定序以獲得複數個序列讀段。定序可以各種方式進行,例如使用大規模平行定序或下一代定序、使用單分子定序及/或使用雙股或單股DNA定序文庫製備方案。技術人員應瞭解,可使用多種定序技術。作為定序之一部分,有可能一些序列讀段可對應於細胞核酸。 定序可為如本文所述之靶向定序。舉例而言,生物樣品可富集來自病毒之核酸分子。富集生物樣品之來自病毒之核酸分子可包括使用結合病毒之一部分或整個基因組的捕捉探針。生物樣品可富集來自人類基因組之一部分的核酸分子,例如常染色體區。表5提供此類捕捉探針之實例。在其他實施例中,定序可包括隨機定序。 在區塊2230處,接收自無細胞核酸分子之混合物定序獲得的複數個序列讀段。序列讀段可由電腦系統接收,該電腦系統可例如經由有線或無線通信或經由可拆卸之記憶體裝置可通信地耦合至進行定序的定序裝置。 在區塊2240處,確定與對應於病毒之參考基因組比對的複數個序列讀段的量。本文提供將序列讀段與病毒基因組比對之實例。該量可基於與參考基因組比對之序列讀段之數目以各種方式確定。舉例而言,可將與參考基因組比對之序列讀段之數目正規化。在各種實施例中,正規化可相對於生物樣品(或經純化之混合物)的體積或相對於與人類參考基因組比對之序列讀段的數目。 在一些實施例中,與參考基因組比對之序列讀段之量包括與參考基因組比對之序列讀段相對於序列讀段總數的比例。序列讀段之總數可為與對應於病毒之參考基因組比對的序列讀段及與人類基因組比對之序列讀段的總和。在各種實施方案中,可使用病毒核酸相對於人類DNA之相對量(豐度)的任何函數或導數,其中相對量之實例包括病毒核酸與人類DNA之量之間的比(例如比例)或差。 在區塊2250處,將與參考基因組比對之序列讀段的量與截止值相比,由此篩查病理。篩查可包括確定個體之病理等級,例如個體確實具有或不具有病理或具有某些等級之病理。 截止值可自具有病理學已知分類之訓練樣品集確定,例如本文所述。作為實例,可使用以下選擇截止值:(1)低於分類為具有病理之訓練樣品之與參考基因組比對之序列讀段的最低量的值;(2)分類為具有病理之訓練樣品之與參考基因組比對之序列讀段的平均量的規定數目的標準差;或(3)用於確定訓練樣品之正確分類的特異性及靈敏度。 在一些實施例中,病理等級為癌症等級。在另一個實施例中,病理等級為感染性單核白血球增多症。作為實例,癌症可選自由鼻咽癌、頭頸部鱗狀細胞癌、子宮頸癌及肝細胞癌組成之群。 在進行定序之前,可使用第一分析法確定是否偵測到足夠量的病毒,且因此保證定序執行。在一些實施方案中,即時聚合酶鏈式反應(PCR)可使用生物樣品或與生物樣品同時(例如相同臨床訪視)自個體獲得之不同生物樣品來進行。即時PCR可使用本文所述或熟習此項技術者已知的技術,例如使用Ct值提供來自病毒之核酸分子的數量。該數量可與數量臨限值相比。當該數量高於數量臨限值時,可進行定序,從而不浪費資源對不具有足夠數量病毒核酸之樣品進行定序,以保證更準確的技術。在一些實施例中,可使用數位PCR代替定序。捕捉探針可與相應引子一起用於進行序列讀段之計數。 D. 關於確定截止值之其他細節用於區分樣品分類(例如個體是否患有與病毒相關之特定癌症)之截止值可以各種方式確定。在一個實施例中,定位至病毒基因組之血漿DNA片段之比例的截止值可確定為低於所分析之癌症患者之最低資料點的任何值。在其他實施例中,截止值可由癌症患者之平均比例減去一個標準差(SD)、平均值減去2 SD及平均值減去3 SD來確定。在其他實施例中,截止值可在定位至病毒基因組之血漿DNA片段之比例的對數變換後來確定,例如(但不限於)在癌症患者之值的對數變換後的平均值減去SD、平均值減去2 SD、平均值減去3 SD。在其他實施例中,截止值可使用接受者操作特徵(ROC)曲線或藉由非參數方法來確定,例如(但不限於)包括約100%、約95%、約90%、約85%或約80%之所分析之癌症患者。在另一個實施例中,為了使測試特異性達到最大,可將截止值確定為高於非癌症個體當中定位至病毒基因組之DNA片段之最高比例的任何值,或在對數變換存在或不存在下之平均值加上SD、平均值加上2 SD、平均值加上3 SD。 在圖14中,藉由對所有經定序之讀段當中血漿EBV DNA片段之比例應用0.0009%之截止值,能夠區分患有NPC且具有持續陽性血漿EBV DNA之個體與大部分具有瞬時陽性血漿EBV DNA結果之個體。在其他實施例中(例如對於其他病毒/癌症組合),所有經定序之讀段當中血漿EBV DNA讀段之比例的截止值可大於0.00001%、大於0.00005%、大於0.0001%、大於0.0002%、大於0.0003%、大於0.0004%、大於0.0005%、大於0.0006%、大於0.0007%、大於0.0008%、大於0.0009%、大於0.001%、大於0.002%、大於0.003%、大於0.004%、大於0.005%、大於0.01%、大於0.1%或大於1%。 III. 基於尺寸之病原體 DNA 分析吾等研究且分析來自癌症患者及非癌症個體之血漿病毒DNA讀段(例如EBV、HBV及HPV)之尺寸分佈的差異。癌症個體之血漿病毒片段的尺寸分佈在統計學上比非癌症個體之病毒片段的尺寸分佈更長。同時,癌症個體之血漿病毒片段的尺寸分佈在統計學上顯著短於同一個體之血漿人類DNA片段。 在一些實施例中,使用定序來評定樣品中無細胞病毒核酸之尺寸。舉例而言,每個經定序之血漿DNA分子之尺寸可由序列之起始及終止座標推導出,其中座標可藉由將序列讀段定位(比對)至病毒基因組來確定。在各種實施例中,DNA分子之起始及終止座標可由兩個雙端讀段或覆蓋兩個末端之單個讀段來確定,如在單分子定序中可達成。 A. 尺寸分佈之差異尺寸分佈可以直方圖形式呈現,其中核酸片段之尺寸在橫軸上。可確定每個尺寸(例如在1 bp解析度內)之核酸片段的數目且將其繪製在縱軸上,例如作為原始數目或頻率百分比。尺寸之解析度可大於1 bp (例如2、3、4或5 bp解析度)。以下對尺寸分佈(亦稱為尺寸概況)之分析顯示,來自NPC個體之無細胞混合物中的病毒DNA片段在統計學上比無可觀察的病理之個體中更長。 圖23顯示正常個體及6名患有NPC之個體(TBR1344、TBR1358、TBR1360、TBR1378、TBR1379及TBR1390)之EBV DNA片段的尺寸分佈。使用雙端定序,基於經定序之EBV DNA片段之兩個末端中之每一者的最外部核苷酸的座標推導每個血漿EBV DNA片段之尺寸。展示NPC個體及無可觀察的病理之個體的血漿EBV DNA片段的尺寸概況。將來自此組無可觀察的病理之個體之所有病例的經定序之EBV DNA片段彙集在一起以繪製此等個體之聚集尺寸概況。 無任何可觀察的病理之個體的血漿EBV DNA尺寸分佈在NPC個體之尺寸分佈圖的左側,表明與NPC個體相比,無任何可觀察的病理之個體之經定序之血漿EBV DNA片段的尺寸分佈較短。此等結果表明,如藉由定序分析(例如大規模平行定序)所量測之血漿EBV DNA片段的尺寸概況可用於區分患有NPC之個體與具有假陽性血漿EBV DNA結果之個體。在先前的研究中,已顯示NPC個體之血漿EBV DNA為短片段(Chan等人 Cancer Res. 2003;63:2028-32)。然而,在先前的研究中,未提供關於患有NPC之個體與具有假陽性血漿EBV DNA結果之個體之間血漿EBV DNA片段之尺寸分佈差異的資訊。 圖24展示6名患有NPC之個體(TBR1344、TBR1358、TBR1360、TBR1378、TBR1379及TBR1390)中定位至EBV基因組及人類基因組之經定序之血漿DNA片段的尺寸分佈。對於每一個體,血漿EBV DNA片段之尺寸分佈短於定位至人類基因組之片段。此觀察結果與先前報導之研究結果一致,即來源於腫瘤細胞之血漿DNA的尺寸分佈比來源於非腫瘤細胞之DNA片段更短(Jiang等人 Proc Natl Acad Sci U S A. 2015; 112:E1317-25),因為NPC個體中之血漿EBV DNA片段來源於腫瘤細胞(Chan等人 Clin Chem. 2005; 51:2192-5)且定位至人類基因組之血漿DNA片段來源於腫瘤及非腫瘤細胞。 圖25展示3名患有淋巴瘤之個體(TBR1332、TBR1333及TBR1551)中定位至EBV基因組及人類基因組之經定序之血漿DNA片段的尺寸分佈。對於三名淋巴瘤個體中之每一者,血漿EBV DNA片段之尺寸分佈短於定位至人類基因組之片段。 圖26展示6名對照個體(AP080、BP065、EN086、BH035、FF159及GC038)中定位至EBV基因組及人類基因組之經定序之血漿DNA片段的尺寸分佈。對於具有假陽性血漿EBV DNA但無可觀察的病理之14名個體中之每一者,經定序之血漿EBV DNA的尺寸分佈短於定位至人類基因組之片段。此觀察結果出人意料,因為一般咸信非癌症個體中之EBV DNA片段與病毒粒子相關且預期高分子量片段存在於血漿中。在此組個體中發現短EBV DNA片段之存在為出人意料的。 圖27A及27B展示患有NPC之個體(26A)及對定位至EBV基因組及人類基因組之血漿EBV DNA呈持續陽性之個體(26B)中經定序之血漿DNA片段的尺寸概況。觀察到與EBV基因組比對之血漿EBV DNA片段及與常染色體基因組(例如參考物)比對之彼等片段的尺寸概況樣式的差異;彼等差異用於區分患有NPC之個體與具有假陽性血漿EBV DNA結果之個體。 圖28A展示患有NPC之患者的血漿中EBV DNA (紅色曲線)及常染色體DNA (黑色曲線)的尺寸分佈。圖28B展示具有持續陽性血漿EBV DNA結果之非癌症個體中EBV DNA (紅色曲線)及人類常染色體DNA (黑色曲線)的尺寸分佈。吾等觀察到來自NPC患者之EBV DNA的尺寸概況展現166 bp峰的降低,但當與人類常染色體DNA之尺寸概況相比時,在約150 bp處具有更明顯的峰(圖28A)。來自非癌症個體之EBV DNA的尺寸概況顯示峰分佈於較短片段尺寸上(圖28B)。因此,當與非癌症個體相比時,NPC患者之短於110 bp之EBV DNA分子的比例較低。 NPC患者之血漿EBV DNA尺寸概況中存在特徵性166 bp峰表明循環EBV DNA為核小體結合的。EBV DNA (作為循環腫瘤DNA)在約150 bp處的相對突出性與吾等先前的研究結果一致,即腫瘤來源的DNA一般短於非腫瘤來源的DNA (20)。 與癌症患者相反,來自非癌症個體之血漿EBV DNA確實未展現典型的核小體模式(圖28B)。缺乏核小體保護 (29)可能致使彼等病毒序列更易受DNA降解影響,從而導致非癌症個體之血漿EBV DNA的尺寸分佈較短。因此,在非NPC個體中觀察到比在NPC中相對較高比例的短EBV DNA片段。已報導病毒粒子相關EBV DNA不含核小體 (30)。吾等懷疑非NPC個體血漿中之EBV DNA片段可能代表降解的病毒產物或不完整的病毒複製產物。實際上,非癌症個體之EBV DNA尺寸概況(圖28B)展示一系列分隔10 bp之峰。 在淋巴瘤患者之血漿EBV DNA序列中亦觀察到特徵性166 bp峰(圖25)。此等資料表明,EBV陽性淋巴瘤及可能的其他EBV相關惡性病可與對血漿EBV DNA呈陽性之非癌症個體區分開。預期與非癌症個體相比,EBV相關惡性病及淋巴瘤患者具有較高比例之長血漿EBV DNA分子或較低比例之短血漿EBV DNA分子。 B. 尺寸比 - 探索及驗證上述尺寸分佈之變化導致經定序之血漿DNA之尺寸概況圖案的個體間變化。為了比較個體間特定尺寸範圍內(例如在80與110個鹼基對之間)之血漿病毒DNA讀段(例如EBV讀段)的比例,可將血漿病毒DNA片段之量相對於相同尺寸範圍內之常染色體DNA片段之量正規化。此度量表示為尺寸比。尺寸比可由特定尺寸範圍內之血漿病毒DNA片段之比例除以相應尺寸範圍內之常染色體(例如常染色體DNA片段)之比例來定義。舉例而言,在80與110個鹼基對之間的EBV DNA片段之尺寸比將為: 尺寸比係指示每個樣品中短DNA片段之相對比例。EBV DNA尺寸比愈低,尺寸在80與110 bp之間之EBV DNA分子的比例愈低。 圖29A展示亦用於圖13A之探索樣品集中癌症及非癌症病例的EBV尺寸比。將截止值定義為高於探索資料集中所有10名癌症患者之EBV尺寸比平均值3個標準差。由紅色點線表示截止值9.1。 使用此截止值,20名具有瞬時陽性EBV DNA結果之個體中之8名及20名具有持續陽性EBV DNA結果之個體中之6名通過基於尺寸之分析中的截止值。NPC患者樣品之中位數尺寸比(中位數,4.5;IQR,3.5至4.6)顯著低於具有瞬時(平均值,11.8;IQR,8.6至13.8, P=0.001,克拉斯卡-瓦立斯檢驗)或持續陽性血漿EBV DNA(平均值,12.7;IQR,8.0至16.5, P=0.0005,克拉斯卡-瓦立斯檢驗)之非癌症個體樣品的平均比率。 圖29B展示亦用於圖13B之驗證樣品集中之NPC患者及具有瞬時陽性及持續陽性結果之非癌症個體的EBV DNA尺寸比。探索資料集中所定義之相同截止值9.1由紅色點線表示。 在圖29B中,來自篩查(中位數,3.2;IQR,2.4至4.2)及外部群組(中位數,3.0;IQR,2.4至4.3)之NPC患者樣品中觀察到的EBV DNA尺寸比低於具有瞬時陽性(中位數,11.3;IQR,7.6至15.1; P<0.0001)及持續陽性結果(中位數,12.7;IQR,9.0至16.5; P<0.0001)之非癌症個體的樣品。此等結果表明,在外部群組中亦觀察到來自探索資料集之NPC患者中短EBV DNA片段比例較低的發現。在探索資料集中所定義之截止值為9.1時,來自兩個群組之NPC患者的所有樣品的EBV DNA尺寸比均小於截止值。在基於尺寸之分析中,有55名(159名中)具有瞬時陽性結果之個體及19名(73名中)具有持續陽性結果之個體通過截止值。 實際上,若吾等將此基於尺寸比之方法的此等效能特徵應用於20,174名無症狀個體之前瞻性篩查研究的樣品群組,則測試將顯示97.1%靈敏度、98.3%特異性及8.9%之PPV (表4)。換言之,確定血漿EBV DNA尺寸比作為區分患有及未患NPC但具有可偵測之血漿EBV DNA之個體的獨立測試將表現良好。當系統或算法確定樣品中發現之任何EBV DNA分子的尺寸概況時,血漿EBV DNA尺寸概況評定測試將能夠同時鑑別EBV DNA序列之存在或不存在。 C. 其他結果上述分析說明,與EBV基因組比對之無細胞樣品中序列讀段之尺寸分佈的統計值可提供有用的獨立測試以篩查早期NPC。提供關於EBV、HBV及HPV之其他結果。 1.   EBV圖30展示低於150 bp之經定序之血漿EBV DNA片段的百分比。當與具有瞬時陽性或持續可偵測之血漿EBV DNA但無可觀察的病理之個體相比時,患有NPC、淋巴瘤及感染性單核白血球增多症之個體中低於150 bp之EBV DNA片段的比例較低。此等結果表明,對經定序之血漿EBV DNA片段尺寸之分析可用於區分患有癌症之個體與無任何可觀察的病理之個體。 圖31展示(左)對血漿EBV DNA呈持續陽性但無可觀察的病理之個體及(右) NPC個體之血漿中低於150個鹼基對(bp)之EBV DNA片段的百分比。儘管定位至EBV基因組之經定序之血漿DNA讀段的比例在假陽性病例與群組2 NPC病例之間無顯著不同,但群組2 NPC個體顯示短血漿EBV DNA片段之比例顯著低於具有假陽性結果之個體(P = 0.02,曼-惠特尼檢驗)。此等結果支持即使當兩組血漿EBV DNA之濃度相似時,對可定序血漿EBV DNA尺寸之分析仍可用於區分NPC個體與具有假陽性血漿EBV DNA結果之個體。 圖32展示血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體及經鑑別為患有NPC之個體的長度在80與110個鹼基對之間的血漿EBV DNA片段與長度在80與110個鹼基對之間的常染色體DNA片段的尺寸比。藉由確定在80與110個鹼基對之間之片段的尺寸比(例如在特定尺寸範圍內之血漿EBV DNA片段的比例除以在相應尺寸範圍內之常染色體DNA片段的比例),吾等可觀察到患有NPC之個體與具有假陽性血漿EBV DNA結果之個體之間的統計學上顯著之差異( p0.0001;曼-惠特尼U檢驗)。與具有假陽性血漿EBV DNA結果之個體相比,患有NPC之個體在80至110 bp之尺寸範圍內的尺寸比較低。因此,與具有瞬時陽性或持續陽性血漿EBV結果之個體相比,NPC患者之在80-110 bp尺寸範圍內之血漿EBV讀段在所有經定序之EBV讀段當中的比例較低。 圖33展示血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體及經鑑別為患有NPC之個體的尺寸指數(例如尺寸比之倒數)。尺寸指數可定義為尺寸比之倒數,且尺寸比定義為在特定尺寸範圍內之血漿EBV DNA片段的比例除以在相應尺寸範圍內之常染色體DNA片段的比例。基於血漿EBV DNA讀段之尺寸概況的差異,將患有NPC之個體與具有持續陽性血漿EBV DNA之個體區分開。使用尺寸比7(例如尺寸指數大於0.14)的截止值,將患有NPC之個體與大部分具有持續陽性血漿EBV DNA之個體區分開。灰點表示所有經定序之讀段當中血漿EBV DNA讀段的比例大於0.0009%的情況(參見例如圖14)。具有瞬時陽性血漿EBV DNA之八名個體中之三名的尺寸指數大於0.14。具有持續陽性血漿EBV DNA之十三名個體中之兩名的尺寸指數大於0.14。所有NPC患者之尺寸指數均大於0.14。在一些實施例中,尺寸指數之截止值可用於確定個體是否患有病況(例如NPC)、對於病況呈假陽性或未患病況。 圖34A展示用於訓練集之血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體及經鑑別為患有NPC之個體(右)的尺寸指數(例如尺寸比之倒數)。基於血漿EBV DNA讀段之尺寸指數的差異,將患有NPC之個體與具有持續陽性血漿EBV DNA之個體區分開。 在一個實施例中,尺寸指數之截止值可確定為低於所分析之NPC患者之最低比例的任何值。在當前實例中,可設定大於0.143%之截止值(亦即尺寸比小於7)以捕捉所有NPC患者。使用尺寸指數大於0.143之截止值,將患有NPC之個體與大部分具有持續陽性血漿EBV DNA之個體區分開。所有NPC患者之尺寸指數均大於0.143。 圖34B展示用於驗證集之血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體及經鑑別為患有NPC之個體(右)的尺寸指數(例如尺寸比之倒數)。使用尺寸指數大於0.143之截止值,將患有NPC之個體與大部分具有持續陽性血漿EBV DNA之個體區分開。所有NPC患者之尺寸指數均大於0.143。 2.   HBV圖35A展示HCC個體中定位至HBV基因組及人類基因組之經定序之血漿DNA片段的尺寸分佈。與NPC個體之樣式類似,與HBV基因組比對之血漿DNA片段的尺寸分佈短於與人類基因組比對之片段。 圖35B展示(左)患有慢性B型肝炎之個體及(右) HCC個體之血漿中低於150 bp之HBV DNA片段百分比的條形圖。與HCC個體相比,慢性HBV攜帶者中<150 bp之經定序之血漿HBV DNA的平均百分比較高。此觀察結果與NPC個體及具有假陽性血漿EBV DNA結果之個體之間的尺寸差異一致。 3.   HPV血漿HPV DNA序列之尺寸概況可允許吾人區分患有HPV相關癌症之個體與無癌症但由於其他良性病況而具有可偵測之血漿HPV DNA的個體。血漿HPV DNA序列之尺寸概況可進一步允許吾人區分不同組織來源之HPV相關癌症,例如CC及HNSCC。 圖36及37展示患有子宮頸癌之8名個體(C-788、C-801、C-803、C-819、C-822、C-877、3485、3276)中經定序之血漿HPV DNA片段及定位至人類基因組之DNA片段(常染色體DNA片段)的尺寸分佈。使用雙端定序,基於經定序之HPV DNA片段之兩個末端中之每一者的最外部核苷酸的座標推導每個血漿HPV DNA片段之尺寸。對於每個子宮頸癌患者,血漿HPV片段之尺寸分佈短於常染色體DNA片段。即使對於具有低含量HPV DNA (少於100個HPV DNA讀段)之患者,仍獲得在約150 bp處達到峰值之類似的累積頻率差(ΔS)曲線。此表明血漿HPV DNA之尺寸概況在子宮頸癌患者當中為類似的,且可用於基於尺寸之HPV相關疾病的診斷。 圖38及39展示患有HPV陽性頭頸部鱗狀細胞癌瘤(HPV+ve HNSCC)之6名個體(TBR1019、TBR1245、TBR1988、TBR1989、TBR2002及TBR2175)中經定序之血漿HPV DNA片段及定位至人類基因組之DNA片段(常染色體DNA片段)的尺寸分佈。對於每個HPV+ve HNSCC患者,吾等可觀察到類似的血漿HPV片段尺寸分佈曲線。血漿HPV片段之尺寸分佈短於常染色體DNA片段。此表明血漿HPV DNA之尺寸概況在HPV+ve HNSCC患者當中為類似的,且可用於基於尺寸之HPV相關疾病的診斷。 D. 各種統計值應理解,尺寸臨限值(例如圖31中之150 bp)可為任何值。尺寸臨限值可為至少約10 bp、20 bp、25 bp、30 bp、35 bp、40 bp、45 bp、50 bp、55 bp、60 bp、65 bp、70 bp、75 bp、80 bp、85 bp、90 bp、95 bp、100 bp、105 bp、110 bp、115 bp、120 bp、125 bp、130 bp、135 bp、140 bp、145 bp、150 bp、155 bp、160 bp、165 bp、170 bp、175 bp、180 bp、185 bp、190 bp、195 bp、200 bp、210 bp、220 bp、230 bp、240 bp、250 bp或大於250 bp。舉例而言,尺寸臨限值可為150 bp。在另一個實例中,尺寸臨限值可為180 bp。在一些實施例中,可使用上限及下限尺寸臨限值(例如值的範圍)。在一些實施例中,可使用上限及下限尺寸臨限值來選擇長度在上限及下限截止值之間的核酸片段。在一些實施例中,可使用上限及下限截止值來選擇長度大於上限截止值及小於下限尺寸臨限值的核酸片段。 可確定核酸片段尺寸分佈之各種統計值。舉例而言,可使用尺寸分佈之總體均值(average)、眾數、中位數或平均值(mean)。可使用其他統計值,例如給定尺寸之累積頻率或不同尺寸之核酸片段之量的各種比率。累積頻率可對應於具有給定尺寸或小於或大於給定尺寸之DNA片段的比例(例如百分比)。統計值提供關於核酸片段尺寸分佈之資訊,用於與一或多個截止值比較以確定由病原體引起之病理等級。可使用健康個體、已知具有一或多種病理之個體、對與病原體相關之病理呈假陽性的個體及本文中提及之其他個體的群組來確定截止值。熟習此項技術者將知曉如何基於本文描述來確定此類截止值,例如參照圖31中所描繪之資料。 為了執行基於尺寸之分析,實施例可計算位於病原體之參考基因組中之核酸分子之尺寸的第一統計值(例如藉由將序列讀段與參考基因組進行比對或使用探針)。在一個實施例中,第一統計值可由位於一或多個特定區域(例如與偏好終止位置相關之區域)之核酸分子或僅整個參考基因組來確定。第一統計值可與截止值相比以確定病理等級。 在一些實施例中,病原體片段尺寸之第一統計值可與來自人類基因組之尺寸的參考統計值相比。舉例而言,可確定第一統計值與參考統計值之間的分離值(例如差值或比率),參考統計值例如自病原體參考基因組中之其他區域確定或自人類核酸確定。亦可由其他值確定分離值。舉例而言,可自多個區域之統計值確定參考值。分離值可與尺寸臨限值相比以獲得尺寸分類(例如DNA片段是否較短、較長或與正常區域相同)。 一些實施例可使用以下公式計算參數(分離值),其可定義為參考病原體基因組與參考人類基因組之間短DNA片段比例之差: 其中 P(≤150 bp) 測試 表示源自尺寸≤150 bp之測試區域之經定序之片段的比例,且 P(≤150 bp) 參考 表示源自尺寸≤150 bp之參考區域之經定序之片段的比例。在其他實施例中,可使用其他尺寸臨限值,例如(但不限於) 100 bp、110 bp、120 bp、130 bp、140 bp、160 bp及166 bp。在其他實施例中,尺寸臨限值可以鹼基、或核苷酸、或其他單位表示。 可使用對照個體之Δ F之平均值及SD值計算基於尺寸之z分數。 在一些實施例中,基於尺寸之z分數> 3表明病原體之短片段的比例增加,而基於尺寸之z評分< -3表明病原體之短片段的比例降低。可使用其他尺寸臨限值。基於尺寸之方法的其他細節可見於美國專利第8,620,593號及第8,741,811號及美國專利公開案2013/0237431,其均以全文引用的方式併入本文中。 為了確定核酸片段之尺寸,至少一些實施例可與其中可分析染色體來源及分子長度之任何單分子分析平台一起作用,例如電泳、光學方法(例如光學定位及其變體,en.wikipedia.org/wiki/Optical_mapping #cite_note-Nanocoding-3及Jo等人 Proc Natl Acad Sci USA 2007; 104: 2673-2678)、基於螢光之方法、基於探針之方法、數位PCR (基於微流體或基於乳液,例如BEAMing (Dressman等人 Proc Natl Acad Sci USA 2003; 100: 8817-8822)、RainDance (www.raindancetech.com/technology/pcr- genomics-research.asp))、滾環擴增、質譜法、熔融分析(或熔融曲線分析)、分子篩分等。作為質譜法之實例,較長分子將具有較大質量(尺寸值之實例)。 在一個實例中,核酸分子可使用雙端定序方案隨機定序。兩端之兩個讀段可定位(比對)至參考基因組,其可經重複序列掩蔽(例如當與人類基因組比對時)。DNA分子之尺寸可由兩個讀段定位至的基因組位置之間的距離來確定。 可使用任何核酸片段尺寸或尺寸範圍來確定尺寸比。在一個實例中,尺寸比可為尺寸在50-75個鹼基對長度內之病毒DNA片段的比例與尺寸在50-75個鹼基對長度內之常染色體DNA片段的比例之比。在另一個實例中,尺寸比可為尺寸在60-90個鹼基對長度內之病毒DNA片段的比例與尺寸在60-90個鹼基對長度內之常染色體DNA片段的比例之比。在另一個實例中,尺寸比可為尺寸在70-100個鹼基對長度內之病毒DNA片段的比例與尺寸在70-100個鹼基對長度內之常染色體DNA片段的比例之比。在另一個實例中,尺寸比可為尺寸在90-120個鹼基對長度內之病毒DNA片段的比例與尺寸在90-120個鹼基對長度內之常染色體DNA片段的比例之比。在另一個實例中,尺寸比可為尺寸在120-150個鹼基對長度內之病毒DNA片段的比例與尺寸在120-150個鹼基對長度內之常染色體DNA片段的比例之比。在另一個實例中,尺寸比可為尺寸在150-180個鹼基對長度內之病毒DNA片段的比例與尺寸在150-180個鹼基對長度內之常染色體DNA片段的比例之比。在另一個實例中,尺寸比可為尺寸在180-210個鹼基對長度內之病毒DNA片段的比例與尺寸在180-210個鹼基對長度內之常染色體DNA片段的比例之比。在另一個實例中,尺寸比可為約95個鹼基對長度尺寸之病毒DNA片段的比例與約95個鹼基對長度尺寸之常染色體DNA片段的比例之比。在一些實施例中,用於確定尺寸比之病毒DNA片段的尺寸範圍及常染色體DNA片段的尺寸範圍可不同。舉例而言,尺寸比可為約80-110個鹼基對長度尺寸之病毒DNA片段的比例與約120-150個鹼基對長度尺寸之常染色體DNA片段的比例之比。在另一個實例中,尺寸比可為尺寸在80-110個鹼基對長度內之病毒DNA片段的比例與約105個鹼基對長度尺寸之常染色體DNA片段的比例之比。 E. 方法圖40為說明根據本發明之實施例之使用病毒DNA片段之尺寸分佈來確定癌症等級之方法4000的流程圖。方法4000之態樣可以與方法2200類似之方式執行。該方法之至少一部分可由電腦系統執行。 方法4000可分析生物樣品以確定獲得生物樣品之個體的病理等級,其中生物樣品包括無細胞核酸分子之混合物。該混合物可包括來自個體之核酸分子及可能來自病毒之核酸分子。可對病理(例如一種類型之癌症、CIN或單核白血球增多症)無症狀之個體進行分析,且因此在病理早期鑑別出個體。 在區塊4010處,量測生物樣品中複數個核酸分子的尺寸。尺寸可經由任何適合之方法(例如上述方法)來量測。作為實例,所量測之尺寸可為長度、分子量或與長度成比例的量測參數。 在一些實施例中,可對核酸分子之兩個末端進行定序且與基因組比對以確定核酸分子之起始及終止座標,從而獲得鹼基長度,其為尺寸之一個實例。此類定序可為靶向定序,例如涉及如本文所述之捕捉探針。其他用於確定尺寸之實例技術包括電泳、光學方法、基於螢光之方法、基於探針之方法、數位PCR、滾環擴增、質譜法、熔融分析(或熔融曲線分析)、分子篩分等。作為質譜法之實例,較長分子將具有較大質量(尺寸值之實例)。 在區塊4020處,確定核酸分子是否來自對應於病原體之參考基因組。作為實例,核酸分子在參考基因組中之位置可藉由定序及比對或使用與參考基因組對應之探針來確定。 在一些實施例中,可接收包括核酸片段之兩個末端的一或多個序列讀段。因此,可自無細胞核酸分子之混合物的定序獲得複數個序列讀段。一或多個序列讀段可與參考基因組比對以獲得一或多個比對位置。一或多個比對位置可用於確定核酸片段之尺寸。 在區塊4030處,確定來自參考基因組之複數個核酸分子之尺寸分佈的統計值。小於尺寸臨限值之片段的累積頻率為統計值之一個實例。統計值可提供總尺寸分佈之量度,例如相對於大片段量的小片段量。在另一個實施例中,統計值可包括以下之比:(1)生物樣品中來自參考基因組之在第一尺寸範圍內之複數個核酸分子的第一量;及(2)生物樣品中來自參考基因組之在與第一尺寸範圍不同之第二尺寸範圍內之複數個核酸分子的第二量。舉例而言,第一範圍可為低於第一尺寸臨限值之片段,且第二尺寸範圍可為高於第二尺寸臨限值之片段。例如當第二尺寸範圍為全部尺寸時,兩個範圍可重疊,例如圖30所示。 在各種實施例中,統計值可為尺寸分佈之總體均值、眾數、中位數或平均值。在其他實施例中,統計值可為生物樣品中來自參考基因組之低於尺寸臨限值(例如150 bp)之複數個核酸分子的百分比。對於此類統計值,當統計值低於截止值時,可確定個體對於病理呈陽性。 在一些實施例中,統計值可包括以下之尺寸比:(1)與病毒之參考基因組比對之尺寸在給定範圍內之核酸分子序列讀段的第一比例;及(2)與人類參考基因組比對之尺寸在給定範圍內之核酸分子序列讀段的第二比例。此類實例提供於圖32中。在各種實施例中,給定範圍可為約80至約110個鹼基對、約50至約75個鹼基對、約60至約90個鹼基對、約90至約120個鹼基對、約120至約150個鹼基對、或約150至約180個鹼基對。在其他實施例中,統計值可為尺寸比之倒數,由此使用尺寸指數,例如圖33所示。 在區塊4040處,個體之病理等級係藉由針對一或多個截止值處理統計值來確定。舉例而言,可將低於尺寸臨限值(例如150)之片段的百分比與截止值相比,以確定該比率是否低於截止值。在圖30中,截止值可為約45以區分對EBV呈持續陽性但無病理(或甚至瞬時陽性)之個體與患有NPC、淋巴瘤或感染性單核白血球增多症之個體。 在使用尺寸比之一個實施例中(例如圖32中),實例截止值包括約7、約8、約9或約10。在另一個實施例中,例如當使用尺寸指數時,實例截止值可為約0.11、0.12、0.13或0.14。 在各種實施例中,在區分集合中之樣品所獲得的準確性可包括:確定病理等級之陽性預測值(PPV)為至少6%、7%或8%,其中確定病理等級之靈敏度為至少95%、96%或97%,及/或其中確定病理等級之特異性為至少95%、96%、97%或98%。 F. 確定截止值在一些實施例中,尺寸比之截止值可用於確定個體是否患有病況(例如NPC)、對於病況呈假陽性或未患病況。舉例而言,與具有假陽性血漿EBV DNA結果之個體相比,患有NPC之個體在80至110 bp之尺寸範圍內的尺寸比較低。在一些實施例中,尺寸比之截止值可為約0.1、約0.5、約1、約2、約3、約4、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約25、約50、約100或大於約100。在一些實施例中,處於及/或低於截止值之尺寸比係指示患有病況(例如NPC)。在一些實施例中,處於及/或高於截止值之尺寸比係指示患有病況(例如NPC)。 在一些實施例中,尺寸指數之截止值可為約或最少10、約或最少2、約或最少1、約或最少0.5、約或最少0.333、約或最少0.25、約或最少0.2、約或最少0.167、約或最少0.143、約或最少0.125、約或最少0.111、約或最少0.1、約或最少0.091、約或最少0.083、約或最少0.077、約或最少0.071、約或最少0.067、約或最少0.063、約或最少0.059、約或最少0.056、約或最少0.053、約或最少0.05、約或最少0.04、約或最少0.02、約或最少0.001或小於約0.001。在一些實施例中,處於及/或低於截止值之尺寸指數係指示患有病況(例如NPC)。在一些實施例中,處於及/或高於截止值之尺寸指數係指示患有病況(例如NPC)。 在一個實施例中,尺寸比或尺寸指數之截止值可確定為低於所分析之癌症患者之最低比例的任何值。在其他實施例中,可確定截止值,例如(但不限於)癌症患者之平均尺寸指數減去一個標準差(SD)、平均值減去兩個SD及平均值減去三個SD。在其他實施例中,截止值可在定位至病毒基因組之血漿DNA片段之比例的對數變換後來確定,例如(但不限於)在癌症患者之值的對數變換後的平均值減去一個SD、平均值減去兩個SD、平均值減去三個SD。在其他實施例中,截止值可使用接受者操作特徵(ROC)曲線或藉由非參數方法來確定,例如(但不限於)包括100%、95%、90%、85%、80%之所分析之NPC患者。 IV. 病原體 DNA 之片段化在本發明中,吾等表明存在病毒無細胞DNA之非隨機片段化過程。非隨機片段化過程可在一定程度上在各種類型之含有無細胞核酸的生物樣品中發生,例如血漿、血清、尿液、唾液、腦脊髓液、胸膜液、羊膜液、腹膜液及腹水。無細胞核酸以短片段形式天然存在。無細胞核酸片段化係指當無細胞核酸分子產生或釋放時,高分子量核酸(諸如細胞核或病毒中之DNA)裂解、斷裂或消化成短片段的過程。無細胞DNA之論述可同樣適用於其他無細胞核酸。 並非所有無細胞DNA分子具有相同的長度。一些分子比其他分子短。已顯示人類之無細胞DNA (諸如血漿DNA)一般比細胞DNA短且較不完整。類似地,當疾病過程(例如癌症)改變細胞基因組之基因表現圖譜及功能時,來源於具有疾病之細胞的無細胞DNA完整機率概況將反映彼等細胞。因此,無細胞DNA圖譜將提供疾病存在之證據或為疾病存在之標誌。另外,癌細胞中之病毒核酸受影響,使得片段化改變。 一些實施例進一步增強研究無細胞DNA片段化概況之解析度。吾等研究個別無細胞DNA分子(尤其血漿病毒核酸分子)之實際終止位置或末端,而非僅對核苷酸區段上的讀段求和以鑑別具有較高或較低完整機率或完整性的區域。值得注意的是,吾等資料顯示切割無細胞病毒核酸片段之特定位置為非隨機的。病毒核酸片段存在某些終止位置,其在樣品(諸如血漿)內高度呈現。此類終止位置之出現或呈現次數在統計學上顯著高於單獨預期的機率。吾等將無細胞DNA終止位置之此等非隨機位置稱為偏好終止位置或偏好末端。亦可存在非偏好區域,例如低含量病毒片段終止於彼等位置。 與特定生理狀態或病理狀態有關之偏好末端目錄可藉由比較具有不同生理或病理狀態之個體間(例如癌症與非癌症樣品相比)的偏好末端的無細胞DNA圖譜來鑑別。另一種方法為在生理(例如妊娠)或病理(例如癌症)過程之不同時間比較偏好末端之病毒核酸圖譜。此類時間點之實例包括癌症治療(例如靶向療法、免疫療法、化學療法、手術)前後、癌症診斷後的不同時間點、癌症進展前後、轉移出現前後、疾病嚴重程度增加前後或併發症出現前後。 當偏好末端在生理或病理狀態下被偵測到的可能性或機率較高時,可考慮偏好末端與生理或疾病狀態相關。在其他實施例中,與其他狀態相比,偏好末端具有一定的機率更可能在相關生理或病理狀態下偵測到。由於在相關生理或疾病狀態下偵測到偏好末端的機率較高,因此將在超過一個具有相同生理或疾病狀態的個體中發現此類偏好或複現末端(或終止位置)。高機率亦會致使此類偏好或複現末端可在相同樣品或同一個體之等分試樣中多次偵測到。在一些實施例中,可設置定量臨限值以限制末端之納入,該等末端在相同樣品或相同樣品等分試樣內被偵測到至少規定次數(例如5、10、15、20等)以視為偏好末端。 在針對任何生理或病理狀態建立無細胞DNA偏好末端目錄之後,可使用靶向或非靶向方法偵測其在無細胞DNA樣品(例如血漿)或其他個體中之存在,以確定具有類似健康、生理或疾病狀態之其他測試個體的分類。病毒偏好末端可藉由隨機非靶向定序來偵測。需要考慮定序深度,以便可達成鑑別相關偏好末端之全部或一部分的合理機率。 或者,可遵循(但不限於)定序偵測、微陣列或PCR,對無細胞DNA樣品中之偏好末端密度較高的基因座進行雜交捕捉,以富集樣品中的具有此類偏好末端之無細胞DNA分子。然而,或者,可使用基於擴增之方法(例如逆向PCR、滾環擴增)特異性擴增及富集具有偏好末端之病毒核酸片段。擴增產物可藉由熟習此項技術者已知之定序、微陣列、螢光探針、凝膠電泳及其他標準方法來鑑別。材料及方法部分提供關於靶向定序之其他細節。 實務上,一個末端位置為在無細胞DNA分子之一個末端之最外部鹼基的基因組座標或核苷酸標識,其係藉由分析方法偵測或確定,諸如(但不限於)大規模平行定序或下一代定序、單分子定序、雙股或單股DNA定序文庫製備方案、PCR、用於DNA擴增之其他酶促方法(例如等溫擴增)或微陣列。此類活體外技術可改變無細胞DNA分子之真實活體內實體末端。因此,每個可偵測末端可代表生物學上真實的末端,或末端為向內的一或多個核苷酸或自分子之原始末端延伸之一或多個核苷酸。舉例而言,在藉由5'突出端鈍化及3'突出端填充進行的DNA定序文庫建構期間,使用克列諾片段產生鈍端雙股DNA分子。儘管此類程序可揭露與生物學末端不一致的無細胞DNA末端位置,但仍可確立臨床相關性。此原因在於,與特定生理或病理狀態相關或有關之偏好的鑑別可基於相同的實驗室方案或方法原理,其導致校準樣品與測試樣品中之無細胞DNA末端發生一致且可再現的改變。許多DNA定序方案使用單股DNA文庫(Snyder等人 Cell 2016, 164: 57-68)。單股文庫之序列讀段的末端比雙股DNA文庫的末端可更向內或延伸更遠。 末端位置之基因組標識或基因組座標可由序列讀段與參考基因組(例如人類之hg19及病毒片段之病毒參考基因組)之比對結果推導出。其可由代表人類基因組原始座標之索引或代碼目錄推導出。雖然末端為無細胞DNA分子之一個或兩個末端的核苷酸,但可經由識別血漿DNA分子上之其他核苷酸或其他核苷酸片段來偵測末端。舉例而言,具有偏好末端之血漿DNA分子的陽性擴增係經由結合至擴增子之中間鹼基的螢光探針偵測。舉例而言,可藉由結合至血漿DNA分子之中段上之一些鹼基的螢光探針之陽性雜交來鑑別末端,其中片段尺寸已知。以此方式,吾人可藉由算出多少個鹼基在具有已知序列及基因組標識的螢光探針外部來確定末端的基因組標識或基因組座標。換言之,可經由偵測相同血漿DNA分子上的其他鹼基來鑑別或偵測末端。末端可為無細胞DNA分子上之位置或核苷酸標識,其係藉由(但不限於)靶特異性探針、小型定序及DNA擴增來讀取。 A. 定量片段化之實例宿主及先前侵入細胞之病毒的無細胞核酸可使用Illumina Genome Analyzer平台進行大規模平行定序。可使用其他大規模平行或單分子定序儀。在一些實施例中,可進行血漿DNA分子之雙端定序。舉例而言,每個分子可在每個末端定序50 bp,因此每個分子總計100 bp。可使用SOAP2程式將每個序列之兩個末端與參考人類基因組比對(Li R等人 Bioinformatics 2009, 25:1966-7)。可使用類似程序將病毒片段定位至參考病毒基因組。 為了反映片段化模式,可基於定序結果確定基因組之每個核苷酸的完整機率(P I)。 其中N z為覆蓋靶核苷酸兩側(5'及3')上至少z個核苷酸(nt)之全長定序讀段的數目;且N T為覆蓋靶核苷酸之定序讀段的總數。 P I值可反映具有以特定位置為中心之完整DNA分子的機率,其長度為兩倍的z值加1 (2z+1)。完整機率(P I)之值愈高,血漿DNA在特定核苷酸位置處片段化之可能性愈小。為了對此作進一步說明,在圖41中說明完整機率之定義。 圖41展示完整機率(P I)之定義的說明性實例。T為計算P I之靶核苷酸的位置。A及B分別為T上游(5') z個核苷酸(nt)及下游(3') z nt的兩個位置。自a至j標記之黑線表示來自母體血漿之經定序之血漿DNA片段。片段a至d覆蓋所有三個位置A、B及T。因此,在靶核苷酸兩側(5'及3')覆蓋至少z nt之片段的數目(N z)為4。另外,片段e、f及g亦覆蓋位置T,但其不覆蓋位置A及B。因此,總共有7個片段覆蓋位置T (N T=7)。片段h及j覆蓋A或B,但不覆蓋T。此等片段並不計數在N z或N T中。因此,此特定實例中之P I為4/7 (57%)。 在一個實施例中,P I可使用25作為z值來計算。因此,完整的血漿DNA片段將定義為覆蓋至少靶位置上游25 nt至靶位置下游25 nt的片段。在其他實施例中,可使用其他z值,例如(但不限於) 10、15、20、30、35、40、45、50、55、60、65、70、75及80。 P I為終止於基因組位置窗口內之核酸片段之相對豐度的實例。可使用其他度量標準,例如P I的倒數,其與具有完整DNA分子之機率具有相反的關係。P I的倒數值愈高將指示作為終止位置或終止窗口的機率愈高。其他實例為末端DNA片段之量測數目相對於末端DNA片段之預期數目的p值、所有比對的DNA片段中終止的DNA片段的比例或偏好末端終止比(PETR)的比例,其可以如下方式定義。 相對豐度之所有此類度量標準可量測終止於例如寬度為2z+1之窗口內之無細胞DNA片段的比率,其中z可為零,由此使窗口等效於基因組位置。關於片段化及相關度量標準之其他細節可見於PCT公開案WO 2017/012592中,其以全文引用的方式併入本文中。 B. 病原體 DNA 片段之終止位置的頻率圖42展示具有持續假陽性血漿EBV DNA且無可觀察的病理之4名個體及6名NPC個體之EBV基因組中終止於各核苷酸之血漿EBV DNA片段的頻率。由於具有瞬時可偵測之血漿EBV DNA之個體的血漿EBV DNA片段的數目極小,故其在此處並不作為實例顯示。y軸為終止於特定核苷酸之血漿EBV DNA片段的數目,且x軸為EBV基因組中之基因組座標。 吾等觀察到終止位置之分佈在具有假陽性結果但無可觀察的病理之個體與NPC個體之間為不同的。舉例而言,在無任何病理之個體中,更多的血漿EBV DNA片段終止於位於區域A內之位置,而在NPC個體中,更多的血漿EBV DNA片段終止於位於區域B內之位置。在EBV基因組中具有重複元件之區域中,經定序之血漿EBV DNA片段無法定位至EBV基因組中之獨特位置。因此,在EBV基因組中無可獨特性地比對定序之讀段終止於具有重複序列之區域內。 此等結果表明,對EBV基因組上血漿EBV DNA片段之終止位置的分析可用於區分具有假陽性結果但無病理之個體與NPC個體。對終止位置之分析可藉由(但不限於)非靶向大規模平行定序或單分子定序、在靶富集後之大規模平行定序或單分子定序、擴增子定序、即時PCR、數位PCR、逆向PCR及錨定PCR進行。對於擴增子定序、即時PCR及數位PCR,一個實施例為具有覆蓋特異性終止位置之引子或探針。 分析可在擴增或不擴增之情況下進行。對於基於擴增之方法,可使用與特異性終止位置互補之寡核苷酸來富集資訊末端(例如具有特定終止基元之核酸片段)。陽性擴增可解釋為指示存在此類資訊末端。或者,擴增產物可隨後進行額外步驟以鑑別或確認資訊末端的存在。用於偵測或確認資訊末端存在之方法可包括(但不限於)以下中之任一者:雜交方法,諸如寡核苷酸探針、抗體探針、小型定序、直接定序、大規模平行定序、單分子定序、質譜法、基於連接之分析法。此類偵測或確認方法可應用於基於非擴增之方法。基於擴增及非擴增之偵測資訊末端之方法可在基於雜交之方法之前或之後富集具有病毒DNA序列之樣品。可使用基於擴增之方法富集具有病毒DNA序列之樣品。 為了證明終止位置與疾病病況之關聯,吾等隨機挑選一名具有持續可偵測血漿EBV DNA但無病理之個體及一名NPC個體用於挖掘頻繁終止位置。吾等以兩種情況中終止於其之血漿EBV DNA片段之數目遞減排列EBV基因組之座標。對於此類分析,終止於其之片段數目最多的EBV基因組座標將排列第1。 出於說明目的,選擇兩種情況中之每一者中排名前400的座標。在其他實施例中,可選擇不同數目之排名靠前的座標進行分析。作為實例,可選擇排名前100、前200、前300、前500、前600、前800及前1000的座標。在另一個實施例中,可選擇由具有相同疾病狀態之個體(例如患有NPC之個體)共享的排名靠前的座標。在另一個實施例中,可使用在某些疾病狀態中作為血漿EBV DNA之終止位置具有顯著較高機率的座標機率。p值之臨限值的實例包括(但不限於)0.1、0.05、0.01、0.005、0.001及0.0001。在一個實施例中,可使用由具有相同疾病狀態之顯著比例的個體共享的排名靠前的位置。在另一個實施例中,可將具有相同疾病狀態之不同個體的排名靠前的位置放在一起。在另一個實施例中,由較大比例之個體共享的排名靠前的位置可賦予較大權重,且由較小比例之個體共享的排名靠前的位置可賦予較小權重,從而可計算加權分數。 圖43展示描繪(A)特定於無可觀察的病理之個體的偏好終止位置的數目(例如383),(B)特定於患有NPC之個體的偏好終止位置的數目(例如383)及(C)兩組個體共享之偏好終止位置(例如17)的文氏圖。在具有假陽性EBV DNA之個體中排名前500但在NPC個體中未排名靠前之座標表示為集合A位置。在NPC個體中排名前500但在具有假陽性血漿EBV DNA結果之個體中未排名靠前之座標表示為集合B位置。在兩種情況下均排列前400之座標表示為集合C位置。兩種情況僅共享4.25%之共同終止位置。 為了證明具有相同疾病狀態(例如患有NPC)之個體是否將共享EBV基因組中相同的偏好終止位置,吾等計算八名具有持續可偵測之血漿EBV DNA但無病理之個體及五名NPC個體之終止於集合A及集合B座標之片段的百分比。確定此等座標之兩名個體不包括於此分析中。 圖44展示熱圖,其描繪無可觀察的病理之個體及NPC個體之終止於集合A位置或集合B位置之片段的百分比。描繪8名無可觀察的病理之個體(左8行;C1-C8)及5名NPC個體(右5行;NPC1-NPC5)的熱圖。終止於集合A終止位置之NPC個體的核酸片段與終止於集合B終止位置之NPC個體的核酸片段相比相對較不豐富。每一列表示特定位置且每一列表示一名個體。較深顏色(藍色)表明終止於特定位置之EBV DNA片段的百分比較高。與無病理之個體相比,五名NPC個體之終止於集合B位置(來自另一名NPC個體之頻繁終止位置)之血漿EBV DNA片段的百分比較高。相比之下,與NPC個體相比,無病理之個體終止於集合A位置(來自另一名具有可偵測之血漿EBV DNA但無可觀察的病理之個體的頻繁終止位置)之血漿EBV DNA片段的百分比較高。此等結果表明具有相同疾病狀態之個體共享排名靠前之終止位置。 由於具有相同疾病狀態之個體共享排名靠前的終止位置,故吾等研究具有可偵測之血漿EBV DNA之個體中血漿EBV DNA的終止位置可用於指示疾病狀態,例如區分NPC個體與無可觀察的病理之個體。 為了證明此方法之可行性,吾等首先確定終止於集合A及集合B位置之經定序之血漿EBV DNA片段的數目。隨後吾等計算B/A比為: 對於五名具有瞬時陽性血漿EBV DNA但無可觀察的病理之個體,獨特性地與EBV基因組比對之可定位血漿DNA片段的數目極小。此等樣品可與自NPC個體、淋巴瘤個體及患有感染性單核白血球增多症之個體收集的樣品完全區分。對於所有五名個體,經定序之血漿EBV DNA片段未終止於任何集合A及集合B位置。 C. 片段化以確定病理等級在NPC個體中,末端核苷酸恰好終止於一或多個NPC特異性終止位置之血漿EBV DNA片段將更可能來源於腫瘤。基於此假設,終止於NPC特異性終止位置之經定序之血漿EBV DNA片段的數目可用於指示存在或不存在NPC或具有類似血漿DNA片段化模式之其他癌症。在另一個實施例中,此參數亦可用於反映癌症等級,例如(但不限於)腫瘤尺寸、癌症階段、腫瘤負荷及轉移之存在。令人關注的是,在對照個體中,EBV DNA片段之末端核苷酸終止於對照個體特有不同於NPC特異性終止位置的終止位置(例如對照特異性終止位置)集合。由於健康個體不具有腫瘤,故血漿EBV DNA片段並非來源於腫瘤。預期對照個體及NPC個體中EBV DNA之片段化模式的差異與DNA片段化之具體機制有關。預期NPC特異性片段化模式可為腫瘤細胞凋亡誘導之DNA片段化的結果。另外,預期對照特異性片段化模式可為EBV DNA複製誘導之DNA片段化的結果。 NPC個體及參考個體(例如健康個體或對諸如腫瘤之疾病呈假陽性的個體)均可在其血液中具有EBV DNA。然而,每個群體可具有獨特的EBV DNA片段化模式。藉由將核酸之第一量(例如可對應於來自個體之生物樣品之終止於NPC特異性偏好終止位置之EBV DNA片段的數目)用第二量(例如可對應於來自健康個體之參考樣品之終止於健康或假陽性特異性偏好終止位置之EBV DNA片段的數目)正規化,本發明之方法可更好地區分對病況呈真陽性之個體及假陽性或在其他方面健康之個體。 對照個體(例如無可觀察的病理之個體)及腫瘤個體之獨特DNA片段化模式的鑑別及應用可具有極大的實用價值。舉例而言,終止於腫瘤特異性終止位置之核酸片段的豐度在對照個體及腫瘤個體中可能不會顯著不同。在另一個實例中,與EBV DNA豐度可能較高且更容易偵測之對照個體相比,在具有低腫瘤負荷之腫瘤個體中,EBV DNA豐度可能較低且更難以偵測。在一些實施例中,給定個體(例如健康個體或腫瘤個體)之偏好終止位置可具高度特異性(例如對照個體之偏好終止位置極少亦為腫瘤個體之偏好終止位置)。 在一些實施例中,末端比(例如終止於基因組位置之第一集合之核酸分子的第一量與終止於基因組位置之第二集合之核酸分子的第二量之比)可用於確定組織類型之比例份額的分類。在一個實例中,終止於NPC特異性終止位置之EBV DNA片段的數目可使用終止於對照特異性終止位置之EBV DNA片段的數目正規化。在一些實施例中,度量標準(例如末端比、複本數及核酸片段尺寸中之至少兩者)之組合可用於偵測個體之病況(例如腫瘤)。舉例而言,如上文所論述,與對照個體相比,NPC個體可展現較高數目之EBV DNA片段、較高B/A比及較低比例之長度小於150個鹼基對的讀段。 D. 結果以下資料展示,可使用終止於位置之第一集合之病毒片段與終止於位置之第二集合之病毒片段之間的相對豐度區分展現病毒負荷但一些患有癌症且一些未患癌症之個體。 1.   EBV圖45展示不同組個體之終止於集合B位置之片段的數目除以終止於集合A位置之片段的數目之比(例如B/A比)。對於具有持續可偵測之血漿EBV DNA之個體,無病理之個體的B/A比顯著低於NPC個體(P < 0.001,曼-惠特尼檢驗)及淋巴瘤個體(P < 0.01,曼-惠特尼檢驗)。患有感染性單核白血球增多症之個體的B/A比高於所有具有持續可偵測之血漿EBV DNA但無病理的個體。此等結果表明終止於優先針對不同疾病之位置的血漿EBV DNA片段的比例可用於鑑別所測試之個體的疾病狀態。 在一些實施例中,集合(例如集合A或集合B)之終止位置可在其具有高於隨機片段化所預期之機率時經鑑別。在其他實施例中,真病理患者(例如NPC)中病原體基因組(例如EBV DNA)中最常見的終止位置可鑑別為集合B,且假陽性患者(或其他無病理個體)之最常見的終止位置可鑑別為集合A。可使用各個組之不重疊集合。在一組終止位置處之片段的量可在存在或不存在正規化之情況下以各種方式定量。 圖46展示(左)對血漿EBV DNA呈持續陽性但無可觀察的病理之個體及(右) NPC個體的B/A比。兩組之B/A比亦顯著不同(P = 0.001,曼-惠特尼檢驗)。由於集合B中之偏好終止位置係使用一組獨立的NPC個體確定的,故此等結果表明偏好終止位置在不同NPC個體之間為共享的,與血漿EBV DNA濃度無關。 圖47展示對血漿EBV DNA呈持續陽性(左)但無可觀察的病理之個體及經鑑別為患有NPC之個體的末端比(例如終止於集合B位置之經定序之血漿EBV DNA片段的數目與終止於集合A位置之經定序之血漿EBV DNA片段的數目之比)。對於具有持續可偵測之血漿EBV DNA的個體,無病理之個體的末端比顯著低於患有NPC之個體的末端比(p = 0.001;曼-惠特尼檢驗)。預期末端比可充當區分患有NPC之個體與具有持續陽性血漿EBV DNA但無可觀察的病理之個體的參數。 在其他實施例中,對終止位置之分析可藉由終止於特定病況之偏好位置之片段的數目來確定。舉例而言,可使用終止於集合B位置之片段的數目來確定測試個體患有NPC之可能性。在另一個實施例中,終止於此類位置之片段的數目可基於經定序之片段的總數或定位至EBV基因組之經定序之片段的數目或定位至EBV基因組之一或多個區域之經定序之片段的數目進行正規化。當使用血漿EBV DNA分析篩查NPC個體時,顯示陽性結果。基於吾等已進行之研究中所用的安排,吾等將在大約四週內收集另一種血液樣品且確定血漿EBV DNA是否持續陽性。基於所顯示的結果,一種替代性安排為使用B/A比分析終止於NPC偏好終止位置之血漿EBV DNA片段的尺寸及百分比。對於<150 bp之片段的百分比高且B/A比低的彼等情況,其可視為NPC低風險,而<150 bp之片段的百分比低且B/A比高的彼等情況可建議做進一步研究。此安排可改良測試之後勤且免除要求個體回來進一步採血的需要。 除NPC以外,對血漿中之病毒DNA片段尺寸及其終止位置之分析亦可用於偵測與病毒感染相關之其他癌症。在此方面,吾等分析三名HCC個體及三名具有慢性B型肝炎感染但無HCC之個體。在中國及東南亞,大部分HCC與HBV感染相關。這些個體之血漿DNA樣品在使用上述方案將靶富集後進行定序。 2. HBV隨機選擇一名HCC個體來分析偏好終止位置。HBV基因組之座標按此特定HCC個體中終止於此等位置之血漿DNA片段的數目降序排列。出於說明目的,鑑別前800個位置。此等位置表示為HCC偏好位置。在其他實施例中,可使用其他位置數目,例如(但不限於) 100、200、400、600、1000或1500。出於說明目的,隨機選擇另外2000個位置用於將與HBV基因組比對之血漿DNA片段的數目正規化。其他數目可用於此正規化過程,例如(但不限於) 200、400、600、800、1000、1500及2500。在其他實施例中,可使用血漿樣品中之總DNA或經定序之讀段的總數或與HBV基因組比對之讀段的總數進行正規化。 圖48展示(左)患有慢性B型肝炎之個體及(右) HCC個體之血漿HBV DNA片段的數目之盒鬚圖,該片段終止於HCC偏好終止位置係經與終止於其他位置之片段正規化。與具有慢性HBV感染但無HCC之個體相比,HCC個體中終止於HCC偏好位置之血漿HBV DNA片段的數目較高。此等結果表明,終止於HCC偏好位置之片段的數目可用於區分HCC個體與無HCC之慢性HBV攜帶者。 應理解,當將終止於偏好終止位置之血漿DNA片段的數目與終止於『其他位置』之片段進行正規化時,『其他位置』可為基因或基因組之任何其他位置中之一或多者。儘管『其他位置』可對應於偏好終止位置(例如與參考基因組比對之核酸片段的偏好終止位置),但『其他位置』未必為偏好終止位置。在一個實施例中,『其他位置』可對應於複數個核酸之最不偏好的終止位置。在另一個實施例中,『其他位置』可對應於位置之隨機集合。 對於HBV及HPV (下文)研究,一些實施例分別鑑別出HCC或子宮頸癌病例中最常見的(例如前1,000個)末端,且鑑別出相同病例中最不常見的末端(例如後1,000個),其中後者用於正規化。圖49中所示之資料顯示,最常見的HCC末端之定量表示為其他末端(例如最不常見或任何隨機末端)之比率。 3.   HPV對血漿中病毒DNA之片段化模式的分析可推廣至其他與病毒感染相關之癌症。作為說明性實例,吾等分析患有頭頸部鱗狀細胞癌之個體的血漿。這種癌症與HPV感染密切相關。如上所述,在靶富集後對血漿DNA進行定序。分析與HPV獨特性地比對之血漿DNA片段。 圖49A及49B展示終止於HPV基因組之不同位置的血漿HPV DNA片段的數目。與在NPC個體及HCC個體中觀察到的模式類似,HPV基因組中存在更可能為頭頸部鱗狀細胞癌個體之血漿DNA的終止位置的位置(圖49A)。此等位置可用於偵測此類型之癌症。吾等資料亦表明,類似方法可用於偵測與HPV感染相關之子宮頸癌。圖49B所示之六個子宮頸癌病例與圖17所示之第一尺寸病例相同。在一個實施例中,可確定子宮頸癌之偏好終止位置。隨後,可測試任何具有陽性血漿HPV DNA結果之個體彼等血漿HPV DNA是否將終止於子宮頸癌偏好終止位置。彼等血漿HPV DNA終止於此類位置之個體更可能患有子宮頸癌,而彼等血漿HPV DNA終止於其他位置之個體更可能具有假陽性結果。 如圖49B所示,血漿HPV DNA序列之片段化模式可允許吾人區分彼等患有HPV相關癌症之個體與無癌症但由於其他良性病況具有可偵測之血漿HPV DNA的個體。血漿HPV DNA序列之尺寸概況及片段化模式可進一步允許吾人區分不同組織來源之HPV相關癌症,例如CC (圖49B)及HNSCC (圖49A)。 圖50顯示在全HPV基因組中,血漿中HPV DNA分子之覆蓋率為不均勻的,表明HPV基因組中之片段化模式應為不同的。根據HPV基因組中定位之基因組座標,在移除PCR複製前後之資料中可看出不均勻性。此類覆蓋不均勻性可能與GC含量相關。 圖51展示可藉由比較患有子宮頸癌之個體與患有頭頸部鱗狀細胞癌(HNSCC)之個體之間的HPV片段覆蓋率來確定差異性片段化模式。X軸為子宮頸癌與HNSCC個體中HPV片段覆蓋率之比。Y軸為子宮頸癌個體中HPV片段之覆蓋率。紅色區域指示子宮頸癌個體中存在片段更豐富之不同片段化模式,且同時子宮頸癌個體中之片段比HNSCC多1.5×倍。此等資料表明病毒DNA片段化模式可用於告知不同類型的癌症。 圖52展示藉由定序分析血漿HPV DNA讀段之偏好終止位置的文氏圖。吾等研究血漿HPV DNA片段是否在HPV基因組具有偏好終止位置。吾等假設患有不同HPV相關惡性病之個體之間血漿HPV DNA片段的偏好位置將不同。為了證明終止位置與疾病病況之關聯,吾等隨機挑選一名子宮頸癌患者(CaCx3485)及一名HPV陽性頭頸部鱗狀細胞癌(HPV+ve HNSCC)患者(TBR1989)用於挖掘頻繁終止位置。吾等以兩種情況中終止於其之血漿HPV DNA片段之數目遞減排列HPV基因組之座標。在此類安排中,終止於其之片段數目最大的HPV基因組座標將排名第1。 出於說明目的,針對兩種情況中之每一者選擇排名前100、前500及前1000的座標。在其他實施例中,可選擇不同數目之排名靠前的座標進行分析。 圖52展示子宮頸癌患者及HPV+ve HNSCC患者中EBV基因組之100、500及1000個最常見的終止位置。對於100個最常見的終止位置,兩個病例共享26個(26%)共同終止位置。對於500個最常見的終止位置,兩個病例共享234個(46.8%)共同終止位置。對於1000個最常見的終止位置,兩個病例共享543個(54.3%)共同終止位置。 E. 方法圖53為說明根據本發明之實施例之基於病毒核酸分子之片段化模式來確定個體之癌症等級的方法5300的流程圖。方法4000之態樣可以與方法2200類似之方式執行。該方法之至少一部分可由電腦系統執行。 在區塊5310處,分析來自個體之生物樣品的第一複數個無細胞核酸分子。無細胞核酸之分析包含確定參考基因組中對應於無細胞核酸分子之至少一個末端的基因組位置,其中參考基因組對應於病毒。可確定對應於無細胞核酸分子之兩個末端的兩個基因組位置。 在區塊5320處,確定終止於第一窗口中之一者內之第一複數個無細胞核酸分子的第一量。每個第一窗口包含基因組位置之第一集合中之至少一者,在該等基因組位置處無細胞核酸分子之末端以高於第一臨限值的比率存在於患有與病毒相關之癌症的個體中。 基因組位置之第二集合可藉由分析來自未患癌症之參考個體(例如健康個體)之參考樣品的無細胞核酸分子來鑑別。在一個實施例中,基因組位置之第二集合包含對應於第一複數個無細胞核酸分子中之至少一者之末端的所有基因組位置。 基因組位置之第一集合可藉由分析來自至少一個第一附加樣品之第二複數個無細胞核酸分子來鑑別,以鑑別第二複數個無細胞核酸分子之終止位置。可已知至少一個第一附加樣品具有與病毒相關之癌症且屬於與生物樣品相同的樣品類型。對於複數個基因組窗口中之每個基因組窗口,可計算終止於基因組窗口之第二複數個無細胞核酸分子的相應數目,且比較參考值以確定終止於基因組窗口內之一或多個基因組位置之無細胞核酸分子的比率是否高於第一臨限值。至少一個第一附加樣品可來自個體且在與生物樣品不同的時間獲得。基因組位置之第一集合中之每一者可具有終止於基因組位置之第二複數個無細胞核酸分子中之至少規定數目的無細胞核酸分子。 在區塊5330處,終止於第一窗口中之一者內之第一複數個無細胞核酸分子的相對豐度係藉由使用來自生物樣品之第一複數個無細胞核酸分子的第二量使第一量正規化來計算。第二量之無細胞核酸分子可包括終止於包括基因組位置之第一集合之第一窗口之外的基因組位置之第二集合的無細胞核酸分子。第一及第二集合可能重疊或可能不重疊。使第一量正規化包括使用第一量及第二量計算相對豐度。 相對豐度可包含第一量與第二量之比率。作為實例,相對豐度可為B/A比。 在區塊5340處,個體之病理等級係藉由針對一或多個截止值處理相對豐度來確定。舉例而言,可確定相對豐度是否大於截止值。舉例而言,B/A比可與截止值相比以確定該比是否高於截止值。在圖45中,截止值可為約1.7以區分對EBV呈持續陽性但無病理之個體與患有NPC、淋巴瘤或感染性單核白血球增多症之個體。 F. 確定終止位置當對核酸(例如DNA或RNA)進行定序時,存在片段終止模式之各種可能性。舉例而言,血漿DNA之末端一般存在四種組態:(A)具有兩個齊平末端之雙股DNA分子;(B)具有一個齊平末端及一個非齊平末端之雙股DNA分子(顯示兩種情形中之每一者,因為兩股中之任一者可突出);(C)具有兩個非齊平末端之雙股DNA分子,其具有突出末端之不同組合;及(D)單股DNA分子。 在具有非齊平末端的組態中,存在不同模式,此視DNA分子的5'或3'端是否突出而定。對於(B),雙股DNA分子具有一個齊平末端及一個非齊平末端。在實例B1中,5'端突出且在實例B2中,3'端突出。對於(C),當兩個末端均不齊平時,存在三種可能模式。在(C1)中,兩側的5'端突出。在(C2)中,兩側的3'端突出。在(C3)中,一側的5'端突出且另一側的3'端突出。 對於定序,雙端定序方案通常對每一股之一個末端進行定序。因此其視為雙股DNA定序方案。當兩個末端不齊平時,方案可切下末端中的核苷酸或添加核苷酸至末端以使其齊平。克列諾片段為可執行此類操作的酶。本領域中之其他方案使用單股DNA定序方案。 不論所用特定技術(包括使用探針),只要終止位置可重複且顯示相關性(如本文中所示),在定序中是否獲得DNA片段之真實末端不影響結果,因為任何偏移為可重複的且因此抵消。另外,可使用某些技術鑑別終止位置,如術語部分中所述。 G. 鑑別偏好終止位置上述多個實施例鑑別出病毒片段之偏好終止位置,其中一些偏好終止位置可為連續的,由此形成偏好終止窗口。可使用不同度量標準來鑑別無細胞病毒片段在基因組窗口(例如最小窗口之基因組位置)的出現率。 在其他實例中,有病況及無病況(例如癌症,可能為特定類型)之樣品之高比率終止位置(例如比率高於臨限值)集合中的差異可用於鑑別與病況相關之特定組織類型的偏好終止部位,例如使用文氏圖所述。作為其他實例,有病況之一個樣品中的比率顯著高於無病況之另一個樣品可提供特定病毒之偏好終止位點。在各種實施例中,此類實例技術中的一些或全部可一起使用。比率可藉由相對豐度之任何度量標準量測。 在上述方法之一些實施例中,以高於臨限值之比率出現無細胞病毒核酸分子之末端的基因組位置之第一集合可以如下方式鑑別。校準樣品可以與測試樣品類似之方式分析,其中兩種樣品屬於相同類型(例如血漿、血清、尿液等)且已知校準樣品包括第一組織類型(例如HCC患者之肝臟腫瘤組織)。終止於基因組窗口(例如寬度為一或多個)中之病毒片段的數目可與參考值相比,以確定終止位置之比率是否高於該位置之臨限值。在一些實施例中,若比率超過參考值,則當相應數目超過參考值時,第一基因組窗口內之每個基因組位置可鑑別為具有高於臨限值之比率。此方法可鑑別包括偏好終止位置的偏好終止窗口。 參考值可使得僅前N個基因組窗口具有高於臨限值的比率。舉例而言,基因組位置之第一集合可具有關於相應數目之最高N值。作為實例,N可為至少10、至少100、至少1,000、至少2,500、至少5,000、至少10,000、至少50,000、至少100,000、至少500,000、至少1,000,000或至少5,000,000。 作為另一個實例,參考值可為根據樣品中無細胞DNA分子之機率分佈及平均長度終止於基因組窗口內之病毒片段的預期數目。p值可使用相應數目及預期數目來確定,其中臨限值對應於截止p值(例如0.01)。p值小於截止p值表示比率高於臨限值。 作為另一個實例,參考值可包括來自鑑別為無癌症之樣品之終止於基因組窗口內之無細胞DNA分子的量測數目。為了與參考值進行比較,可獲取終止於一個位置之相應數目與覆蓋基因組窗口之第三複數個無細胞核酸分子之第三數目的第一比率。對於此比較,參考值可包括終止於基因組窗口內之讀段的量測數目與覆蓋基因組窗口且未終止於基因組窗口內之第三複數個無細胞核酸分子之第四數目的參考比率。在一個實施方案中,第三數目個無細胞核酸分子未終止於基因組窗口內。可確定第一比率是否大於乘法因子乘以參考比率。 在一些實施例中,虛無假設為所有片段將隨機片段化,使得每個基因組位置將具有成為片段末端之相等機率。可假定片段平均為規定尺寸(例如166 bp)。p值如下計算: p值 = 泊松(N 實際, N 預測) 其中泊松()為泊松機率函數;N 實際為終止於特定核苷酸之讀段的實際數目;且 。可使用本傑明(Benjamini)及霍赫貝格(Hochberg)校正(Bejamini等人. Journal of the Royal Statistical Society, 1995;57:289-300)調整p值,以達成預期的錯誤發現率(FDR),例如<1%。因此,確定比率是否高於第一臨限值可包含使用相應數目及預期數目確定相應p值,其中第一臨限值對應於截止p值。相應p值小於截止p值表明終止於基因組窗口內之無細胞核酸分子的比率高於第一臨限值。 在一些實施例中,終止於基因組位置之第二複數個無細胞核酸分子之比率高於第一臨限值的基因組位置構成第一超集。鑑別基因組位置之第一集合可進一步包含分析來自鑑別為無癌症之至少一個第二附加樣品的第三複數個無細胞核酸分子,以鑑別終止於基因組位置之高於第一臨限值之第三複數個無細胞核酸分子的第二超集。基因組位置之第一集合可包含屬於第一超集且不屬於第二超集的基因組位置。 H. 相對豐度本文提供相對豐度值之各種實例,例如完整機率(P I)、先前部分中所述之p值,及使用基因組窗口或當窗口寬度為一時之基因組位置所確定的PETR值。對於基因組位置(寬度為一之窗口)之PETR,可針對基因組位置之第一集合中的每個基因組位置計算終止於該基因組位置之病毒核酸片段的相應數目。此可作為確定終止於基因組位置之第一集合中之任一者的第一複數個病毒片段的第一數目(例如分子)之一部分來進行。覆蓋基因組位置且未終止於基因組位置之無細胞DNA分子的第三數目(例如分母)可作為確定病毒分子之第二數目之一部分來計算。可確定相應數目與第三數目之第一比率,且可使用第一比率之平均值作為相對豐度。 在一些實施例中,可確定終止於窗口A內之片段之數目與終止於窗口B內之片段之數目之間的基於窗口之PETR (w-PETR)比率。對於w-PETR,可針對基因組位置之第一集合的每個基因組位置計算終止於包括基因組位置之第一窗口內之無細胞DNA分子的相應數目。可計算終止於包括基因組位置之第二窗口內之無細胞DNA分子的第三數目。第二窗口可大於第一窗口。在一些情況下,相應數目與第三數目之第一比率可用作相對豐度,或第一比率之平均值用作相對豐度。 相對豐度值之另一個實例為終止於基因組窗口之病毒片段的比例,例如作為終止於偏好終止位置之經定序之DNA片段的比例來量測。因此,基因組位置之第二集合可包括對應於第一複數個病毒片段中之至少一者之末端的所有基因組位置。 V. 組合技術以上論述集中於每個測試作為獨立技術。在各種實施例中,可組合不同的技術。下文提供組合之若干實例連同一些結果。技術之組合可同時進行,例如使用樣品之相同部分或不同部分或使用在同一臨床訪視期間獲取的不同樣品。 A. 組合計數及尺寸基於計數之分析及基於尺寸之分析可組合,以提高區分有病理之個體與無病理之個體的準確性。 1.   EBV圖54展示患有鼻咽癌之患者及非癌症個體之血漿EBV DNA的定量及尺寸概況分析。吾等對血漿EBV DNA進行靶向捕捉定序,且鑑別NPC及非NPC個體血漿內EBV DNA分子之豐度及尺寸概況的差異,如獨立技術部分中所述。 使用經組合之基於計數及尺寸之血漿EBV DNA分析,可藉由單一時間點測試以增強的陽性預測值進行鼻咽癌之篩查。NPC患者之具有較長片段長度之血漿EBV DNA的量顯著較高。由探索資料集確立截止值且在驗證樣品集中檢驗。 圖55展示一個驗證集之分析概述。分析開始於包括56個瞬時陽性樣品;44個持續陽性樣品及29個確診NPC樣品之驗證集。將個體中定位至EBV基因組之血漿DNA片段比例的截止值設定為0.0009%,瞬時陽性樣品中之18個高於臨限值;持續陽性樣品中之35個高於臨限值;且NPC樣品中之29個高於臨限值。使用大於0.143之尺寸指數截止值,瞬時陽性樣品中之4個高於截止值,持續陽性樣品中之4個高於截止值,且NPC樣品中之29個高於截止值。 以超過20,000名個體之群組起始,1,112名個體對血漿EBV DNA呈陽性。彼等個體中之34名患有NPC;1,078名為假陽性。使用基於下一代定序之分析法進行EBV數量及尺寸概況分析,假陽性之數目據估計減少至82個(803個瞬時陽性樣品×(4/56) + 275個持續陽性×(4/44)給出82個假陽性之估計值)。初始分析法之假陽性率為5.4% (1078/(20174-34-1)*100%)。使用下一代定序分析法進行EBV數量及尺寸概況分析可將假陽性率降低至0.4% (82個假陽性/(20,174-34-1)總數*100%)。初始分析法之陽性預測值為3.1% (34/1112*100%)。使用下一代定序分析法進行EBV數量及尺寸概況分析可將陽性預測值提高至29.3%。(34個真陽性/(34個真陽性 +82個假陽性)*100% = 29.3%)。提供改良的假陽性及陽性預測值,不包含靈敏度,全部基於初始血液樣品。圖54說明對血漿EBV DNA呈陽性之初始樣品進行下一代定序分析法可降低假陽性率且提高陽性預測值。 在另一個實施例中,在使用定位至EBV基因組之經定序之血漿DNA片段的比例(例如大於或等於0.0009%)之第一分析及隨後使用尺寸比(例如小於或等於7%)之第二分析後,個體經鑑別為患有NPC。使用血漿EBV數量分析(例如所有經定序之讀段當中EBV DNA讀段的比例)及尺寸比之組合,計算72名個體之群組中之NPC偵測率、假陽性率及陽性預測值。NPC偵測率為100%。假陽性率為13.5%且陽性預測值為86.5%。相比之下,僅使用即時PCR分析篩查患有NPC之個體,假陽性率為30.4%且陽性預測值為69.6%。因此,吾等可使用EBV DNA數量及靶向捕捉定序之尺寸分析的組合分析以及0.0009%及7%之上述截止值觀察到假陽性率幾乎降低三倍。 採用需要樣品同時通過EBV DNA計數及尺寸量測之截止值的模型,偵測到NPC之陽性預測值(PPV)為19.6%。因此,若血漿樣品之定序資料同時通過基於計數及尺寸之分析的截止值,則血漿樣品視為陽性的且經鑑別為NPC。當與前瞻性篩查研究中PPV為11.0%相比時,此代表優異的表現,前瞻性篩查研究要求具有最初可偵測之血漿EBV DNA結果的參與者在4週內再測試。 吾等對驗證樣品集中之所有樣品進行經組合之基於計數及尺寸之分析。藉由應用探索資料集中所定義之相同截止值,可捕捉來自篩查及外部群組之NPC患者的所有樣品。 圖56A展示驗證樣品集中所有病例之血漿EBV讀段的比例與相應的尺寸比值之間的關係圖。探索樣品集中所定義之基於計數及尺寸之分析的相同截止值由灰色點線表示。紅色橢圓形突出顯示具有通過經組合之基於計數及尺寸之分析中之截止值的病例的象限。有15名(159名中)具有瞬時陽性結果之個體及17名(73名中)具有持續陽性結果之個體在基於計數及尺寸之分析中均通過截止值。 吾等使用接受者操作特徵(ROC)曲線分析比較基於計數、基於尺寸及經組合之基於計數及尺寸之分析以及即時PCR在區分驗證樣品集中之NPC患者與非癌症個體時的診斷效能。 圖56B展示基於計數之分析、基於尺寸之分析、組合定序分析及即時PCR定量分析之接受者操作特徵(ROC)曲線。即時PCR效能係基於藉由即時PCR分析法測定的定量血漿EBV DNA值而在NPC及非NPC病例之間作出判斷。顯示曲線下面積(AUC)值。基於計數、基於尺寸及組合分析之曲線下面積值分別為0.93、0.92及0.97,且顯著高於基於PCR之分析(0.75) (分別為 P=0.0071, P=0.0143, P=0.0008,靴帶檢驗(Bootstrap test))。此等資料顯示,單獨的基於計數之分析、單獨的基於尺寸之分析或經組合之基於計數及尺寸之分析均比使用即時PCR進行血漿EBV DNA定量表現得更好。 由於經組合之基於計數及尺寸之分析達成最佳診斷效能,故吾等提出新的NPC篩查方案,在基於即時PCR之基線分析之後併入對血漿EBV DNA之組合分析。將對具有藉由即時PCR可偵測之EBV DNA的基線血漿樣品進行靶向捕捉定序。在此新方案中,若個體之血漿樣品在基於計數及基於尺寸之分析中均通過截止值,則將個體定義為『篩查陽性』。若血漿樣品未通過基於計數或基於尺寸之分析的截止值,則將個體定義為『篩查陰性』。 圖57展示使用來自圖56A之截止值將整個20,174名個體篩查群組之血漿EBV DNA之基於計數之分析及基於尺寸之分析的效能模型化。陳述據估計之靈敏度、特異性、陽性預測值及假陽性率。CI表示95%信賴區間。 基於驗證樣品集中組合分析之效能,假設採用新的篩查方案,吾等已估計前瞻性篩查試驗之整個20,174名個體群組的靈敏度、特異性、陽性預測值及假陽性率。在驗證群組中,159名具有瞬時陽性EBV DNA結果之個體中之15名(9.4%)、73名具有持續陽性結果之個體中之17名(23.3%)及全部24名NPC患者(100%)通過基於計數及尺寸之分析中的截止值。根據新方案,其全部視為『篩查陽性』。在篩查研究中,藉由即時PCR分析具有不可偵測之血漿EBV DNA的一名個體在一年內罹患NPC (7)。由於可捕捉在篩查研究中測試呈陽性之所有癌症病例,故此新方案之預計靈敏度將為97.1% (95%置信區間(CI),95.5至98.7%),其將與先前的兩個時間點篩查方案相同。具有假『篩查陽性』結果之個體的估計數目為140名(篩查群組中『瞬時陽性』組的9.4%及『持續組』的23.3%)。據估計之特異性將為99.3% (95% CI,99.2%至99.4%)。PPV及假陽性率經估計分別為19.6% (95% CI,13.7%至25.5%)及0.70% (95% CI,0.58%至0.8%)。20,174名個體群組中基於計數及基於尺寸之分析的預計效能顯示於表4中。
   20,174名個體群組
靈敏度(%) 特異性(%) PPV (%)
基於計數之分析 97.1 97.4 6.1
基於尺寸之分析 97.1 98.3 8.9
組合分析 97.1 99.3 19.6
4. 20,174名個體群組中基於計數、基於尺寸及組合分析之預計診斷效能。 藉由揭示患有或未患NPC之個體當中血漿EBV DNA之豐度及尺寸概況的差異,可達成更具體的NPC鑑別。針對定序分析確定之截止值係基於維持在前瞻性篩查研究中藉由即時PCR測試所達到之靈敏度的目標 (7)。因此,基於定序之測試之效能的關鍵區別在於其提供改良的特異性。來自前瞻性篩查研究之資料顯示,當對單個基線血液樣品進行測試時,即時PCR之假陽性率為5.4%。此與3.1%之PPV相關。在此研究中,對基線血液樣品進行定序分析。使用基於計數之定序方法,假陽性率為2.6%且PPV為6.0% (表4)。當獨立使用基於尺寸之方法時,假陽性率為1.7%且PPV為8.9%。為了進一步提高測試效能,吾等提出一種方法,要求樣品同時通過基於計數及尺寸之截止值,以便視為測試呈陽性。使用此類組合方法,吾等實現僅0.7%之假陽性率及19.6%之PPV。即使當考慮PPV為11.0%之兩個時間點方案時,此等資料仍相比即時PCR顯著改良。 基於定序之分析允許在定量(基於計數之分析)或量測DNA尺寸概況(基於尺寸之分析)的同時鑑別血漿EBV DNA之存在,且因此可用作獨立於藉由其他測試預先篩查的測試。另一方面,表4中所示之預計效能亦表明,基於定序之測試可用作藉由即時PCR測試後的第二級測試。即時PCR用於確定個體中存在或不存在血漿EBV DNA。若即時PCR測試呈陽性,則吾人可隨後進行僅基於計數之定序分析、僅基於尺寸之定序分析或經組合之基於計數及尺寸之定序分析以區分癌症真陽性與假陽性病例(EBV DNA呈陽性但無NPC)。此類安排將使NPC篩查計劃最具成本效益,因為每個篩查個體係藉由即時PCR測試來測試,該測試之成本低於定序。僅彼等藉由即時PCR測試之血漿EBV DNA陽性(約5%之群體)將繼續進行至定序測試。定序測試可對與即時PCR測試相同的血漿DNA提取物、來自相同的血液抽取物但不同的等分試樣的樣品或不同血液抽取物來進行。然而,若定序成本下降或視為足夠經濟,則所有第一線篩查可基於定序(僅基於計數、僅基於尺寸或經組合之基於計數及尺寸)。其可向實驗室提供維持一個測試而非一個程式兩個平台(亦即即時PCR及定序)之實際優勢。 2. 確定截止值吾等已採用建模方法開發使用EBV DNA計數及尺寸比分析區分NPC患者與具有瞬時及持續陽性血漿EBV DNA之非NPC個體的算法。在一個實施例中,吾等使用分類及回歸樹(CART)分析。CART分析之一個目標為實現不同組間的最大分離(或每組之最高偵測率)。此係藉由開發用於EBV DNA計數及尺寸分析之算法且在兩個參數(EBV DNA計數及尺寸比)中找到最佳截止值來達成。使用CART分析,吾等已開發如下算法:首先分析EBV DNA尺寸比,隨後分析EBV DNA計數。每個集合中之三個數字分別代表具有瞬時陽性血漿EBV DNA之非NPC個體、具有持續陽性血漿EBV DNA之非NPC個體及NPC患者的數目。 圖58及59展示分類及回歸樹(CART)分析之結果以確定各種參數之最佳截止值,從而用於區分對血漿EBV DNA呈瞬時陽性或持續陽性但無可觀察的病理之個體或經鑑別為患有NPC之個體。一般熟習此項技術者應瞭解,可使用多種方法確定用於區分群組或群體內之不同組的截止值。此類方法之非限制性實例為CART分析。在CART分析中,目標為在參數中找到最佳截止值,以實現不同組間的最大分離(或每組之最高偵測率)。 此CART分析得出尺寸比截止值= 4.837,且log (EBV計數)截止值= -2.655。使用此等截止值,NPC偵測率為90.6%且陽性預測值為90.6%。在EBV DNA尺寸比分析及截止值設定為4.837之情況下,將24名具有瞬時陽性血漿EBV DNA之非NPC個體、13名具有持續陽性血漿EBV DNA之非NPC個體及3名NPC患者分為一組(EBV DNA尺寸比大於或等於4.837),且將2名具有瞬時陽性血漿EBV DNA之非NPC個體、1名具有持續陽性血漿EBV DNA之非NPC個體及29名NPC患者分為另一組(EBV DNA尺寸比小於4.837)。 將EBV DNA尺寸比大於或等於4.837之組用EBV DNA計數分析進一步分類。在EBV計數分析及log (EBV計數)之截止值設定為-2.655之情況下,將21名具有瞬時陽性血漿EBV DNA之非NPC個體、1名具有持續陽性血漿EBV DNA之非NPC個體及0名NPC患者分為一組(log (EBV計數)小於-2.655),且將3名具有瞬時陽性血漿EBV DNA之非NPC個體、12名具有持續陽性血漿EBV DNA之非NPC個體及3名NPC患者分為另一組(log (EBV計數)大於或等於-2.655)。使用此等截止值,NPC偵測率為90.6%且陽性預測值為90.6%。亦可使用其他決策樹類型,包括(但不限於)提昇樹及自舉聚合決策樹。 3. 方法圖60為根據本發明之實施例之組合病毒核酸片段之基於計數及基於尺寸之分析以確定病理等級之方法的流程圖。方法6000之態樣可以與方法2200及4000類似之方式執行。該方法之至少一部分可由電腦系統執行。 方法6000可分析生物樣品以確定獲得生物樣品之個體的病理等級,其中生物樣品包括無細胞核酸分子之混合物。該混合物可包括來自個體之核酸分子及可能來自病毒之核酸分子。可對病理(例如一種類型之癌症、CIN或單核白血球增多症)無症狀之個體進行分析,且因此在病理早期鑑別出個體。 在區塊6010處,執行第一分析法。第一分析法可分析來自個體之第一生物樣品的複數個無細胞核酸分子,以確定與對應於病毒之參考基因組比對之複數個無細胞核酸分子的第一量。作為實例,第一分析法可包括即時聚合酶鏈式反應(PCR)或定序,例如在方法2200中所執行。 在區塊6020處,使用基於尺寸之分析執行第二分析法。區塊6022及6024可作為執行第二分析法之一部分來執行。第二分析法可對第二生物樣品執行,該第二生物樣品可與第一生物樣品相同或不同。第一生物樣品及第二生物樣品可來自相同血液樣品(例如不同血漿/血清部分)。在一些實施例中,僅當第一量高於第一截止值時才執行第二分析法。可以與針對方法4000所述類似之方式執行第二分析法,例如經由電泳或對核酸片段之兩個末端進行定序及比對。此類定序可為靶向定序,例如涉及如本文所述之捕捉探針。 在區塊6022處,量測第二生物樣品中複數個核酸分子中之每一者的尺寸。區塊6022可以與圖40之區塊4010類似之方式執行。 在區塊6024處,確定來自參考基因組之複數個核酸分子之尺寸分佈的第二量。區塊6024可以與圖40之區塊4030類似之方式執行。在一些實施例中,第二量屬於具有給定範圍內之尺寸且與參考基因組比對的核酸分子。此類第二量可使用具有不同範圍內之尺寸且與參考基因組比對之無細胞核酸分子的第三量正規化(例如圖31中所示)。作為另一個實例,第二量可使用具有給定範圍內之尺寸且與常染色體基因組比對之無細胞核酸分子的第三量正規化。(例如圖32中所示)。 在區塊6030處,將第一量與第一截止值相比。可確定第一量是否超過第一截止值(例如高於)。可確定第一量超過第一截止值之程度,例如以告知最終確定的病理等級。 在區塊6040處,將第二量與第二截止值相比。可確定第一量是否超過第一截止值(例如高於或低於,視第二量如何定義而定)。可確定第二量超過第二截止值之程度,例如以告知最終確定的病理等級。 在區塊6050處,個體之病理等級係基於第一量與第一截止值之比較及第二量與第二截止值之比較來確定。在一些實施例中,僅當第一量超過第一截止值且第二量超過第二截止值時才確定個體具有病理。 在各種實施例中,確定癌症等級之陽性預測值可為至少15%、至少17%或至少19%,確定癌症等級之靈敏度為至少95%、至少96%或至少97%,及/或確定癌症等級之特異性為至少95%、至少96%、至少97%、至少98%或至少99%。 B. 經組合之片段及尺寸作為另一個實例,可組合片段化及尺寸分析。 圖61展示(實心圓)對血漿EBV DNA呈持續陽性但無可觀察的病理之個體及(空心圓) NPC個體之血漿中B/A比對比低於150 bp之EBV DNA片段百分比的散佈圖。基於經定序之<150 bp之血漿EBV DNA片段的百分比及B/A比,NPC個體可與彼等具有假陽性血漿EBV DNA結果之個體區分開。使用此兩種參數,僅一名具有假陽性結果之個體與NPC個體聚集。 VI. 改良之益處自公共衛生觀點來看,PPV之任何改良均將具有實質性影響。廣東為中國NPC發病率最高的省份之一 (33)。根據2016年中國統計年鑒,廣東省約有2千萬年齡在40至65歲之間的男性。若對此年齡範圍內之年齡別發病率最高的所有男性採用通用NPC篩查計劃,則新方案將使得假陽性數目減少50%,亦即140,000名個體。如此大的數目意味著最初耗費在後續測試及包括內視鏡檢及磁共振成像(MRI)之確認研究上的醫療支出大幅減少。 一些實施例之益處在於可自僅單一時間點之血液採樣實現高PPV。藉由克服兩個時間點之測試需求,吾等之新方案具有優於先前需要兩個時間點測試之方案的顯著優勢。先前對其他癌症篩查計劃之研究已顯示,相當大一部分篩查測試結果異常之參與者報告焦慮及窘迫 (34)。因此,對於兩個時間點測試,在基線具有可偵測之EBV DNA的個體僅可在後續測試後獲得其最終篩查狀態。此等個體在等待後續測試時可能會感到焦慮。另外,測試兩個時間點之要求存在許多後勤挑戰。存在與召回最初測試呈陽性之個體進行第二測試相關的直接成本。當在臨床情形下採用方案時,順應性可能成為問題。順應性降低將導致NPC篩查計劃之靈敏度降低。相比之下,新的基於定序之方案避免需要第二血液樣品來定義已呈『篩查陽性』的個人。因此,此新方案更具臨床及邏輯實用性,且可更容易被公眾所接受。 吾等當前研究之資料顯示,血漿EBV DNA之靶向定序分析可實現NPC篩查之高PPV。在此研究中,定序測試之效能係相對於前瞻性篩查研究中藉由即時PCR評定之病例而經模型化。因此,效能資料代表組合使用即時PCR及血漿EBV DNA之定序分析的兩階段測試。舉例而言,血漿EBV DNA之即時PCR評定作為第一線測試來進行。5.5%之測試個體(包含真NPC及假陽性)將具有可偵測之血漿EBV DNA含量。此等樣品將隨後藉由定序測試另外分析。此將代表更具成本效益之方法,因為~95%之群體可藉由即時PCR測試篩查呈陰性。 吾等研究已突出顯示研究人類血漿中病毒核酸之片段化模式的價值。目前尚不清楚無NPC之個體的血漿存在EBV DNA的臨床意義。藉由展示此等分子與NPC患者血漿中發現之分子的分子性質差異,提供一定程度的再次保證,其不大可能代表NPC傾向性。儘管如此,吾等目前正每年跟蹤此等個體以評定其未來的臨床結果。另一方面,探究不同EBV相關疾病或癌症(例如感染性單核白血球增多症、霍奇金淋巴瘤、伯基特氏淋巴瘤及移植後淋巴增生病症)中血漿EBV DNA之片段化模式為值得的。此類研究對於建立血漿EBV DNA之疾病特異性分子標籤及理解不同疾病中EBV之病理生理學將為有用的。在未來的研究中,亦可分析與癌症相關之其他病毒物種之循環DNA分子的片段化模式 (35)。舉例而言,可研究肝細胞癌患者之循環B型肝炎病毒DNA及子宮頸癌患者之循環人類乳頭狀瘤病毒DNA。 總而言之,吾等已開發第二代NPC篩查方法。此方法係基於NPC患者與非癌症個體之間血漿EBV DNA的差異性定量及基於尺寸之特徵。此類方法不僅在減少假陽性方面表現出更優越的效能,且亦允許進行單個時間點測試而無需後續血液樣品。吾等相信此更具臨床實用性之方案將極大地簡化測試且有助於在群體規模上實施。據設想,由於在地方性流行區域進行大規模篩查,故NPC之死亡率可能會降低。此研究亦揭示基於血漿DNA篩查其他癌症類型之未來發展途徑。 一些實施例可包含基於分類提供治療性干預或基於分類對個體進行成像。 VII. 材料及方法下文描述各種實例技術,其可在各種實施例中實現。 關於血液樣品收集及血漿DNA提取,可將外周血樣品收集至含有EDTA之管中且立即儲存在4℃下。可將血液樣品離心以分離血漿與其餘血液組分(例如紅血球、白血球及血小板)。舉例而言,血液樣品可首先在4℃下以1,600 g離心10分鐘,且血漿部分在4℃下以16,000 g再離心10分鐘以移除殘餘血細胞。在2,000×g下離心15分鐘消耗血漿樣品中之血小板。血漿樣品可儲存在2-8℃下直至進一步分析。自4 mL血漿提取血漿DNA。使用QIAamp DSP DNA血液微型套組(Qiagen)自血漿提取DNA。 關於DNA文庫構築,可使用KAPA文庫製備套組(Kapa Biosystems)根據製造商方案構築索引血漿DNA文庫。使用KAPA HiFi HotStart ReadyMix PCR套組(KAPA Biosystems),用13個循環的PCR擴增接附子接合的DNA。 關於DNA文庫之定序,可使用NextSeq 500或HiSeq 2500定序平台(Illumina)對多重DNA文庫進行定序。使用雙端定序方案,自每個末端定序75個核苷酸。 關於定序資料之比對,可藉助於SOAP2 (36)以雙端模式分析雙端定序資料。將雙端讀段與包括參考人類基因組(hg19)及EBV基因組(AJ507799.2)之組合參考基因組進行比對。每個末端之比對允許至多兩個核苷酸錯配。僅兩個末端與相同染色體以正確取向獨特性地比對之雙端讀段跨越600 bp內之插入物尺寸,用於下游分析。 在一些實施例中,定序資料分析係藉由以Perl及R語言編寫之生物信息學程式來進行。在整個篩查群組中以及在探索及驗證資料集中,使用克拉斯卡-瓦立斯檢驗比較NPC患者、具有瞬時陽性EBV DNA之非癌症個體及具有持續陽性EBV DNA之非癌症個體當中的血漿EBV DNA濃度。克拉斯卡-瓦立斯檢驗亦用於比較探索及驗證資料集中三組EBV DNA讀段的比例。 P值<0.05視為統計學上顯著的。 A. 靶向富集 偵測腫瘤來源的核酸的特異性可與樣品中腫瘤來源的核酸的濃度成比例。因此,靶特異性富集可用於增加樣品中腫瘤來源的核酸的濃度。舉例而言,具有與EBV DNA中之BamHI序列(5'-GGATCC-3')互補且能夠結合之序列的DNA探針可用於進行樣品中EBV DNA片段之靶向富集。DNA探針亦用高親和力標籤(例如生物素)標記,其允許回收結合靶之探針。在回收結合靶之探針後,將EBV DNA解離且與探針分離。隨後,可根據本文所述之方法分析富集的樣品。 為了自血漿DNA樣品富集病毒DNA分子用於隨後的定序分析,用EBV捕捉探針進行靶富集。覆蓋整個EBV基因組之EBV捕捉探針係自Roche NimbleGen (SeqCap EZ Developer, Roche NimbleGen Inc)訂購的。將來自5個樣品之DNA文庫在一個捕捉反應中多路複用。使用等量的每個樣品的DNA文庫。吾等亦包括探針以覆蓋人類常染色體區以供參考。由於EBV DNA為血漿DNA池中之少數,故在每個捕捉反應中使用相對於常染色體DNA探針過量~100倍的EBV探針。在捕捉反應後,經捕捉之DNA文庫用14個循環的PCR再擴增。 在一些實施例中,可使用經設計以與EBV基因組之任何部分結合的捕捉探針進行靶向捕捉。在一些實施例中,捕捉探針可經生物素化,且在文庫製備之後使用磁性珠粒(例如經抗生蛋白鏈菌素塗佈之珠粒)拉下或富集與核酸靶(例如EBV基因組片段)雜交的捕捉探針。在一些實施例中,所用捕捉探針組亦可靶向人類基因組之一部分。舉例而言,捕捉探針可經設計以與一或多個染色體(例如染色體1、8及/或13之任一複本)之至少一部分雜交。在一些實施例中,使用該組中之捕捉探針靶向至少約1 mb、至少5 mb、至少10 mb、至少20 mb、至少30 mb、至少40 mb、至少50 mb、至少60 mb、至少70 mb、至少80 mb、至少90 mb或至少100 mb之人類基因組。在一些實施例中,捕捉探針組可拉下對應於EBV之約285個序列讀段。在一些實施例中,捕捉探針組可拉下對應於人類基因組之約4千萬個序列讀段。 為了分析血漿中之無細胞人類乳頭狀瘤病毒(HPV) DNA,可使用藉由專門設計之捕捉探針捕捉富集的靶向定序。此等捕捉探針可覆蓋全HPV基因組、全B型肝炎病毒(HBV)基因組、全EBV基因組及人類基因組中之多個基因組區域(包括chr1、chr2、chr3、chr5、chr8、chr15、chr22上之區域)。對於所分析之每個血漿樣品,使用QIAamp循環核酸套組自1-4 mL血漿提取DNA。對於每種情況,使用TruSeq Nano文庫製備套組將所有提取的DNA用於製備定序文庫。使用Illumina TruSeq Nano PCR擴增套組對定序文庫進行十二個循環的PCR擴增。使用覆蓋上述病毒及人類基因組區域之定製設計的探針,使用SEQCAP-EZ套組(Nimblegen)捕捉擴增產物。在靶向捕捉後,進行14個循環之PCR擴增且使用Illumina NextSeq平台對產物進行定序。對於每一定序運行,使用雙端模式對具有獨特樣品條形碼之四至五個樣品進行定序。每個DNA片段將自兩個末端中之每一者定序75個核苷酸。在定序後,經定序之讀段將定位至人工組合之參考序列,其由全人類基因組(hg19)、全HPV基因組、全HBV基因組及全EBV基因組組成。定位至組合基因組序列中之獨特性地位置的經定序之讀段將用於下游分析。 舉例而言,捕捉探針可經設計以覆蓋全EBV基因組、全B型肝炎病毒(HBV)基因組、全人類乳頭狀瘤病毒(HPV)基因組及/或人類基因組中之多個基因組區(包括chr1、chr2、chr3、chr5、chr8、chr15及chr22上之區域)。為了有效地自血漿捕捉病毒DNA片段,可使用比所關注之人類常染色體區更多的與病毒基因組雜交的探針。在一個實施例中,對於全病毒基因組,平均100個雜交探針覆蓋每個尺寸~200 bp之區域(例如100X平鋪捕捉探針)。對於人類基因組之所關注區域,吾等設計平均2個雜交探針覆蓋每個尺寸~200 bp之區域(例如2X平鋪捕捉探針)。可根據表5設計捕捉探針。 5 :用於靶向定序之捕捉探針之設計
      長度 (bp) 靶向捕捉設計
常染色體 chr1 29,382,851 2x平鋪捕捉探針
chr2 819,161
chr3 25,981,149
chr5 2,339,138
chr8 21,438,698
chr15 767,847
chr22 327,728
病毒靶 EBV 170,771 100x平鋪捕捉探針
HBV 3,216
HPV16 7,855
HPV18 7,789
HPV31 7,791
HPV33 7,744
HPV35 7,813
HPV39 7,734
HPV45 7,784
HPV51 7,674
HPV52 7,820
HPV56 7,814
HPV58 7,705
HPV66 7,806
HPV68 7,751
HPV70 7,884
總共有2.1M用於人類DNA、EBV HPV及HBV之探針。188,342個探針用於EBV DNA捕捉。待捕捉之EBV序列與待捕捉之人類DNA序列之比率為0.0021。 B. 無擴增分析對無細胞DNA分子之分析可無擴增。當使用PCR時,定序深度(亦即覆蓋特定核苷酸或終止於參考基因組中之特定核苷酸之序列讀段的數目)不直接反映分析多少個覆蓋特定核苷酸之血漿DNA分子。此係因為一個血漿DNA分子可在PCR過程中產生多個複製物,且多個序列讀段可來源於單個血漿DNA分子。此複製問題在以下情況下變得更重要:i)用於擴增定序文庫之PCR循環次數較高;ii)定序深度增加,及iii)原始血漿樣品中DNA分子之數目較少(例如血漿體積較小)。 因此,一些實施例可包括自待分析之生物樣品獲得模板DNA分子;使用模板DNA分子製備可分析DNA分子之定序文庫,可分析DNA分子之定序文庫的製備不包括模板DNA分子之DNA擴增操作;對可分析DNA分子之定序文庫進行定序以獲得對應於第一複數個無細胞DNA分子的複數個序列讀段。分析第一複數個無細胞DNA分子可包括在電腦系統接收複數個序列讀段且藉由電腦系統將複數個序列讀段與參考基因組進行比對以確定複數個序列讀段的基因組位置。 VIII. 個體在與本文描述相關之情況下,個體可患有任何類型之癌症或腫瘤。在一個實例中,個體可能患有鼻咽癌或鼻腔癌。在另一個實例中,個體可能患有口咽癌或口腔癌。癌症之非限制性實例可包括(但不限於)腎上腺癌、肛門癌、基底細胞癌、膽管癌、膀胱癌、血癌、骨癌、腦腫瘤、乳癌、支氣管癌、心血管系統癌、子宮頸癌、結腸癌、結腸直腸癌、消化系統癌、內分泌系統癌、子宮內膜癌、食道癌、眼癌、膽囊癌、胃腸腫瘤、肝細胞癌、腎癌、造血惡性腫瘤、喉癌、白血病、肝癌、肺癌、淋巴瘤、黑素瘤、間皮瘤、肌肉系統癌、骨髓發育不良症候群(MDS)、骨髓瘤、鼻腔癌、鼻咽癌、神經系統癌、淋巴系統癌、口腔癌、口咽癌、骨肉瘤、卵巢癌、胰臟癌、陰莖癌、垂體瘤、前列腺癌、直腸癌、腎盂癌、生殖系統癌、呼吸系統癌、肉瘤、唾液腺癌、骨骼系統癌、皮膚癌、小腸癌、胃癌、睪丸癌、咽喉癌、胸腺癌、甲狀腺癌、腫瘤、泌尿系統癌、子宮癌、陰道癌或外陰癌。術語『淋巴瘤』一般係指任何類型之淋巴瘤,包括B細胞淋巴瘤(例如彌漫性大B細胞淋巴瘤、濾泡性淋巴瘤、小淋巴球性淋巴瘤、套細胞淋巴瘤、邊緣區B細胞淋巴瘤、伯基特淋巴瘤、淋巴漿細胞性淋巴瘤、毛細胞白血病或原發性中樞神經系統淋巴瘤)或T細胞淋巴瘤(例如前體T-淋巴母細胞性淋巴瘤或外周T細胞淋巴瘤)。術語『白血病』一般係指任何類型之白血病,包括急性白血病或慢性白血病。白血病之類型包括急性骨髓性白血病、慢性骨髓性白血病、急性淋巴球性白血病、急性未分化白血病或慢性淋巴球性白血病。在一些情況下,癌症患者未患特定類型之癌症。舉例而言,在一些情況下,患者可能患有不是乳癌的癌症。 癌症之實例包括導致實體腫瘤之癌症以及不導致實體腫瘤之癌症。此外,本文提及之任何癌症可為原發癌(例如以其首先開始生長之身體部分命名的癌症)或繼發癌或轉移癌(例如起源於身體之另一部分的癌症)。 處於癌症風險下之個體可能由於特定病況(諸如癌前病況)而處於風險下。癌前病況包括(但不限於)光化性角化症、巴雷斯特氏食道症(Barrett's esophagus)、萎縮性胃炎、原位導管癌、先天性角化不良、缺鐵性吞咽困難、扁平苔癬、口腔黏膜下纖維化、日光性彈力組織變性、子宮頸發育不良、黏膜白斑病及紅斑)。在一些情況下,患者可能由於細胞或組織發育異常(例如細胞數目之異常變化、細胞形狀之異常變化、細胞尺寸之異常變化或細胞色素沉著之異常變化)而處於癌症風險下。處於癌症風險下之個體可為暴露於致癌劑下之患者。此類患者可包括暴露於已知或可能致癌物(例如乙醛、石棉或菸草產品)之患者或暴露於電離輻射(例如γ輻射、β輻射、X輻射或紫外輻射)之患者。在一些情況下,處於癌症風險下之患者係由於癌症家族史而處於風險下。 在一些實施例中,本發明之方法可偵測個體之腫瘤或癌症,其中該腫瘤或癌症具有疾病之地理模式。在一個實例中,個體可能患有在華南(例如香港特區)盛行之EBV相關癌症(例如鼻咽癌)。在另一個實例中,個體可能患有在美國及西歐盛行之HPV相關癌症(例如口咽癌)。在另一個實例中,個體可能患有在日本南部、加勒比海、中非、南美洲部分地區及美國東南部一些移民團體中盛行之人類T淋巴病毒-1 (HTLV-1)相關癌症(例如成人T細胞白血病/淋巴瘤)。 已顯示DNA及RNA病毒能夠引起人類癌症。在一些實施例中,個體可能患有由病毒(例如腫瘤病毒)引起之癌症。在一些實施例中,個體可能患有癌症,且該癌症可使用病毒DNA偵測。舉例而言,與患有癌症或腫瘤之個體相比,病毒DNA在健康個體中可能具有獨特的片段化模式。在一些態樣中,特定病毒DNA片段化模式(例如對照個體或腫瘤個體中之病毒DNA片段化模式)可使用病毒DNA片段之一或多個特定核苷酸、所得片段化病毒DNA之尺寸(例如長度或質量)、病毒DNA片段之複本數或病毒DNA片段之任何其他特徵(例如甲基化標籤、序列、GC含量或結合親和力)偵測。在一些實施例中,個體可能患有癌症,且該癌症可使用腫瘤來源的病毒DNA偵測。在一些實施例中,個體可能患有癌症,且該癌症可使用腫瘤來源的病毒DNA或其片段在自個體獲得之無細胞樣品(例如血液樣品、血漿樣品或血清樣品)中偵測到。熟習此項技術者應瞭解,病毒可能具有多種病毒株(例如可能在基因組成上不同的相關病毒),其包括於本申請案之實施例的範疇內。舉例而言,個體可能患有由HPV感染引起(或與之相關)的口腔癌、口咽癌、子宮頸癌、陰莖癌、肛門癌、陰道癌或外陰癌,HPV可包括超過150種相關病毒。EBV感染亦可增加個體罹患鼻癌、鼻咽癌、淋巴瘤(例如伯基特淋巴瘤或霍奇金淋巴瘤)或胃癌之風險。在另一個實例中,B型肝炎病毒(HBV)或C型肝炎病毒感染可引起慢性感染,其可能增加個體罹患肝癌之可能性。可引起個體之癌症或與個體之癌症相關之病毒的非限制性實例包括HPV、EBV、HBV、C型肝炎病毒(HCV)、人類免疫缺陷病毒(例如與卡波西肉瘤(Kaposi sarcoma)、子宮頸癌、非霍奇金淋巴瘤、肛門癌、霍奇金病、肺癌、口腔癌、口咽癌、皮膚癌及肝癌相關)、人類疱疹病毒8 (例如與卡波西肉瘤、血癌、原發性滲出性淋巴瘤及卡斯特萊曼病(Castleman disease)相關)、人類T淋巴病毒-1 (例如與淋巴球性白血病、非霍奇金淋巴瘤及成人T細胞白血病/淋巴瘤相關)及梅克爾細胞(Merkel cell)多瘤病毒(例如與諸如梅克爾細胞癌之皮膚癌相關)。在一些實施例中,非人類個體(例如靈長類)可能患有癌症,且該癌症可使用腫瘤來源的病毒DNA偵測到。舉例而言,猿猴病毒40 (SV40)感染可增加個體罹患間皮瘤、腦腫瘤、骨癌及淋巴瘤之風險。 如本文所述之個體可為任何年齡且可為成人、嬰兒或兒童。在一些情況下,患者為0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99歲,或在其範圍內(例如2至20歲、20至40歲或40至90歲)。可能受益之特定類別的患者為40歲以上之患者。可能受益之另一特定類別患者為兒童患者,其可能具有慢性心臟症狀之風險較高。此外,藉由本文所述之任何方法或組合物治療的患者可為男性或女性。 亦可對非人類個體(諸如實驗室或農場動物)或來源於本文所揭示之生物體的細胞樣品進行本文所揭示之任何方法。非人類個體之非限制性實例包括犬、山羊、天竺鼠、倉鼠、小鼠、豬、非人類靈長類(例如大猩猩、猿、猩猩、狐猴或狒狒)、大鼠、綿羊、牛或斑馬魚。 IX. 實例系統圖62展示根據本發明之一實施例的系統6200。所示之系統包括樣品6205,諸如樣品架6210內之無細胞DNA分子,其中樣品6205可與分析法6208接觸以提供物理特徵6215之信號。樣品架之實例可為包括分析法之探針及/或引子的流槽或液滴藉以移動之管(在包括微滴之分析的情況下)。樣品之物理特徵6215 (諸如螢光強度值)係藉由偵測器6220偵測。偵測器可以間隔(例如週期性間隔)進行量測以獲得構成資料信號之資料點。在一個實施例中,類比至數位轉換器複數次將來自偵測器之類比信號轉換成數位形式。資料信號6225係自偵測器6220發送至邏輯系統6230。資料信號6225可存儲於本地記憶體6235、外部記憶體6240或存儲裝置6245中。 邏輯系統6230可為或可包括電腦系統、ASIC、微處理器等。其亦可包括顯示器(例如監視器、LED顯示器等)及使用者輸入裝置(例如鼠標、鍵盤、按鈕等)或與之耦合。邏輯系統6230及其他組件可為獨立或網路連接電腦系統之一部分,或其可直接附接至或併入於熱循環裝置中。邏輯系統6230亦可包括在處理器6250中執行之最佳化軟體。 本文中提及之任何電腦系統可利用任何適合數目個子系統。此類子系統之實例展示於圖63之電腦設備10中。在一些實施例中,電腦系統包括單個電腦設備,其中子系統可為電腦設備之組件。在其他實施例中,電腦系統可包括具有內部組件之多個電腦設備,其各自為子系統。電腦系統可包括桌上型及膝上型電腦、平板電腦、移動電話及其他移動裝置。 圖63中所示之子系統經由系統匯流排75互連。展示額外子系統,諸如印刷機74、鍵盤78、存儲裝置79、耦合至顯示配接器82之監視器76及其他。耦合到I/O控制器71之周邊裝置及輸入/輸出(I/O)裝置可藉由此項技術中已知的任何數目的連接件,諸如輸入/輸出(I/O)端口77 (例如USB、FireWire®)連接至電腦系統。舉例而言,I/O端口77或外部接口81 (例如乙太網、Wi-Fi等)可用於將電腦系統10連接至諸如網際網路之廣域網、鼠標輸入裝置或掃描儀。經由系統匯流排75之互連允許中央處理器73與每個子系統通信且控制來自系統記憶體72或存儲裝置79 (例如固定盤,諸如硬盤驅動器,或光碟)之複數個指令的執行以及子系統之間的資訊交換。系統記憶體72及/或存儲裝置79可體現為電腦可讀取媒體。另一個子系統為資料收集裝置85,諸如照相機、麥克風、加速計及其類似物。本文所提及之任何資料可自一個組件輸出至另一個組件且可輸出給使用者。 電腦系統可包括例如藉由外部接口81或藉由內部接口連接在一起的複數個相同組件或子系統。在一些實施例中,電腦系統、子系統或設備可經網路通信。在此等情況下,可將一台電腦視為用戶端且另一台電腦視為伺服器,其中每一者可為同一電腦系統之一部分。用戶端及伺服器各自可包括多個系統、子系統或組件。 實施例之態樣可使用硬體電路(例如特殊應用積體電路或場可程式化閘陣列)以控制邏輯形式及/或使用具有大體上可程式化處理器的電腦軟體以模組化或一體化方式來實施。如本文所用,處理器包括單核處理器、位於同一積體晶片上之多核處理器,或位於單一電路板上或網路化之多個處理單元。基於本發明及本文所提供之教示,一般熟習此項技術者將知道及瞭解使用硬體及硬體與軟體之組合來實施本發明之實施例的其他方式及/或方法。 本申請案中描述之任何軟體組件或功能可實施為待由使用任何適合之電腦語言(諸如Java、C、C++、C#、Objective-C、Swift)或腳本語言(諸如Perl或Python)的處理器使用例如習知或面向對象技術來執行的軟體程式碼。軟體程式碼可以一系列指令或命令形式存儲於電腦可讀取媒體上以用於存儲及/或傳輸。適合的非暫時性電腦可讀取媒體可包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、磁性媒體(諸如硬碟機或軟碟機)或光學媒體,諸如光盤(CD)或DVD (數位化通用光碟)、快閃記憶體及其類似物。電腦可讀取媒體可為此類存儲或傳輸裝置之任何組合。 此類程式亦可使用適合於經由有線、光學及/或符合各種協定之無線網路(包括網際網路)傳輸之載波信號來編碼及傳輸。因此,電腦可讀取媒體可使用以此類程式編碼的資料信號建立。以程式碼編碼之電腦可讀取媒體可與相容裝置一起封裝或與其他裝置分開提供(例如藉助於網際網路下載)。任何此類電腦可讀取媒體可駐存於單個電腦產品(例如硬碟機、CD或整個電腦系統)上或其內部,且可存在於系統或網路內之不同電腦產品上或其內部。電腦系統可包括用於向使用者提供本文所提及之任何結果的監視器、印刷機或其他適合之顯示器。 本文所述之任何方法可完全或部分地使用電腦系統來進行,該電腦系統包括一或多個可經組態以執行操作的處理器。因此,實施例可涉及經組態以執行本文所述之任何方法之操作的電腦系統,可能利用不同組件執行相應操作或相應操作組。儘管以經編號之操作呈現,但本文方法之操作可以同時或以不同順序執行。另外,此等操作之部分可與來自其他方法之其他操作之部分一起使用。另外,操作之全部或部分可為視情況選用的。另外,任何方法之任何操作可使用模組、單元、電路或用於執行此等操作之其他方法來執行。 本文中所用之各部分標題僅出於組織目的而不應理解為限制所描述之主題。 應理解,本文所述之方法不限於本文所述之特定方法、協定、主題及定序技術且因此可變化。亦應理解,本文中所用之術語僅出於描述特定實施例之目的而並不意欲限制本文中所描述之方法及組合物之範疇,該範疇將僅由隨附申請專利範圍限制。雖然本文已顯示及描述本發明之一些實施例,但對於熟習此項技術者應顯而易見的是,此類實施例僅藉助於實例提供。熟習此項技術者現將在不背離本發明之情況下想到許多變化、改變及取代。應理解,本文所述之本發明實施例的各種替代方案可用於實踐本發明。預期以下申請專利範圍界定本發明之範疇,且因此涵蓋此等申請專利範圍及其等效物之範疇內的方法及結構。 參考用於說明之實例應用來描述數個態樣。除非另外指示,否則任何實施例可與任何其他實施例組合。應理解,闡述許多具體詳情、關係及方法以提供對本文所述之特徵的充分理解。然而,熟習此項技術者應容易認識到,可在沒有一或多個具體詳情之情況下或使用其他方法來實踐本文所述之特徵。本文所述之特徵不受所示行為或事件之順序限制,因為一些行為可以不同的順序發生及/或與其他行為或事件同時發生。此外,並非所有所示行為或事件均需要根據本文所述之特徵來實現方法。 雖然本文已顯示及描述本發明之一些實施例,但對於熟習此項技術者應顯而易見的是,此類實施例僅藉助於實例提供。不希望本發明受本說明書中所提供之具體實例的限制。雖然已參考前述說明書描述本發明,但本文實施例之描述及說明並不意欲以限制性意義來解釋。熟習此項技術者現將在不背離本發明之情況下想到許多變化、改變及取代。 此外,應理解,本發明之所有態樣不限於本文所闡述之具體描繪、組態或相對比例,其視各種條件及變數而定。應理解,本文所述之本發明之實施例的各種替代方案均可用於實踐本發明。因此,涵蓋本發明亦應涵蓋任何此類替代、修改、變化或等效物。預期以下申請專利範圍界定本發明之範疇,且因此涵蓋此等申請專利範圍及其等效物之範疇內的方法及結構。 本文所提及之所有專利、專利申請案、公開案及描述均以全文引用之方式併入用於所有目的。不承認任一者為先前技術。 X. 參考文獻1. S.-J. Dawson, D. W. Y. Tsui, M. Murtaza, H. Biggs, O. M. Rueda, S.-F. Chin, M. J. Dunning, D. Gale, T. Forshew, B. Mahler-Araujo, S. Rajan, S. Humphray, J. Becq, D. Halsall, M. Wallis, D. Bentley, C. Caldas, N. Rosenfeld, Analysis of circulating tumor DNA to monitor metastatic breast cancer. N. Engl. J. Med. 368, 1199-1209 (2013). 2. A. R. Thierry, F. Mouliere, S. El Messaoudi, C. Mollevi, E. Lopez-Crapez, F. Rolet, B. Gillet, C. Gongora, P. Dechelotte, B. Robert, M. Del Rio, P.-J. Lamy, F. Bibeau, M. Nouaille, V. Loriot, A.-S. Jarrousse, F. Molina, M. Mathonnet, D. Pezet, M. Ychou, Clinical validation of the detection of KRAS and BRAF mutations from circulating tumor DNA. Nat. Med. 20, 430-435 (2014). 3. T. Forshew, M. Murtaza, C. Parkinson, D. Gale, D. W. Y. Tsui, F. Kaper, S.-J. Dawson, A. M. Piskorz, M. Jimenez-Linan, D. Bentley, J. Hadfield, A. P. May, C. Caldas, J. D. Brenton, N. Rosenfeld, Noninvasive identification and monitoring of cancer mutations by targeted deep sequencing of plasma DNA. Sci. Transl. Med. 4, 136ra68-136ra68 (2012). 4. J. Tie, Y. Wang, C. Tomasetti, L. Li, S. Springer, I. Kinde, N. Silliman, M. Tacey, H. L. Wong, M. Christie, S. Kosmider, I. Skinner, R. Wong, M. Steel, B. Tran, J. Desai, I. Jones, A. Haydon, T. Hayes, T. J. Price, R. L. Strausberg, L. A. Diaz, N. Papadopoulos, K. W. Kinzler, B. Vogelstein, P. Gibbs, Circulating tumor DNA analysis detects minimal residual disease and predicts recurrence in patients with stage II colon cancer. Sci. Transl. Med. 8, 346ra92-346ra92 (2016). 5. T. Reinert, L. V Schøler, R. Thomsen, H. Tobiasen, S. Vang, I. Nordentoft, P. Lamy, A. S. Kannerup, F. V Mortensen, K. Stribolt, S. Hamilton-Dutoit, H. J. Nielsen, S. Laurberg, N. Pallisgaard, J. S. Pedersen, T. F. Ørntoft, C. L. Andersen, Analysis of circulating tumour DNA to monitor disease burden following colorectal cancer surgery. Gut 65, 625-634 (2016). 6. L. A. Diaz Jr, R. T. Williams, J. Wu, I. Kinde, J. R. Hecht, J. Berlin, B. Allen, I. Bozic, J. G. Reiter, M. A. Nowak, K. W. Kinzler, K. S. Oliner, B. Vogelstein, The molecular evolution of acquired resistance to targeted EGFR blockade in colorectal cancers. Nature 486, 537-540 (2012). 7. K. C. A. Chan, J. K. S. Woo, A. King, B. C. Y. Zee, W. K. J. Lam, S. L. Chan, S. W. I. Chu, C. Mak, I. O. L. Tse, S. Y. M. Leung, G. Chan, E. P. Hui, B. B. Y. Ma, R. W. K. Chiu, S. F. Leung, A. C. van Hasselt, A. T. C. Chan, Y. M. D. Lo, Analysis of plasma Epstein-Barr virus DNA to screen for nasopharyngeal cancer. N. Engl. J. Med. 377, 513-522 (2017). 8. Y. M. D. Lo, L. Y. Chan, K. W. Lo, S. F. Leung, J. Zhang, A. T. Chan, J. C. Lee, N. M. Hjelm, P. J. Johnson, D. P. Huang, Quantitative analysis of cell-free Epstein-Barr virus DNA in plasma of patients with nasopharyngeal carcinoma. Cancer Res 59, 1188-1191 (1999). 9. J. A. Kanakry, H. Li, L. L. Gellert, M. V. Lemas, W. S. Hsieh, F. Hong, K. L. Tan, R. D. Gascoyne, L. I. Gordon, R. I. Fisher, N. L. Bartlett, P. Stiff, B. D. Cheson, R. Advani, T. P. Miller, B. S. Kahl, S. J. Horning, R. F. Ambinder, Plasma Epstein-Barr virus DNA predicts outcome in advanced Hodgkin lymphoma: Correlative analysis from a large North American cooperative group trial. Blood 121, 3547-3553 (2013). 10. J. A. Kanakry, A. M. Hegde, C. M. Durand, A. B. Massie, A. E. Greer, R. F. Ambinder, A. Valsamakis, The clinical significance of EBV DNA in the plasma and peripheral blood mononuclear cells of patients with or without EBV diseases. Blood 127, 2007-2017 (2016). 11. Y. M. D. Lo, L. Y. Chan, A. T. Chan, S. F. Leung, K. W. Lo, J. Zhang, J. C. Lee, N. M. Hjelm, P. J. Johnson, D. P. Huang, Quantitative and temporal correlation between circulating cell-free Epstein-Barr virus DNA and tumor recurrence in nasopharyngeal carcinoma. Cancer Res 59, 5452-5455 (1999). 12. S. F. Leung, K. C. A. Chan, B. B. Ma, E. P. Hui, F. Mo, K. C. K. Chow, L. Leung, K. W. Chu, B. Zee, Y. M. D. Lo, A. T. C. Chan, Plasma Epstein-Barr viral DNA load at midpoint of radiotherapy course predicts outcome in advanced-stage nasopharyngeal carcinoma. Ann. Oncol. 25, 1204-1208 (2014). 13. Hong Kong Cancer Registry, Nasopharyngeal Cancer in 2015, (2015) (available at http://www3.ha.org.hk/cancereg/statistics.html). 14. J. Kanakry, R. Ambinder, The biology and clinical utility of EBV monitoring in blood. Curr Top Microbiol Immunol 391, 475-499 (2015). 15. K. C. A. Chan, E. C. W. Hung, J. K. S. Woo, P. K. S. Chan, S. F. Leung, F. P. T. Lai, A. S. M. Cheng, S. W. Yeung, Y. W. Chan, T. K. C. Tsui, J. S. S. Kwok, A. D. King, A. T. C. Chan, A. C. Van Hasselt, Y. M. D. Lo, Early detection of nasopharyngeal carcinoma by plasma Epstein-Barr virus DNA analysis in a surveillance program. Cancer 119, 1838-1844 (2013). 16. H. Y. Wang, C. H. Hsieh, C. N. Wen, Y. H. Wen, C. H. Chen, J. J. Lu, Cancers screening in an asymptomatic population by using multiple tumour markers. PLoS One 11, e0158285 (2016). 17. K. C. A. Chan, J. Zhang, A. T. C. Chan, K. I. K. Lei, S. F. Leung, L. Y. S. Chan, K. C. K. Chow, Y. M. D. Lo, Molecular characterization of circulating EBV DNA in the plasma of nasopharyngeal carcinoma and lymphoma patients. Cancer Res. 63, 2028-2032 (2003). 18. K. C. A. Chan, A. T. C. Chan, S. F. Leung, J. C. S. Pang, A. Y. M. Wang, J. H. M. Tong, K. F. To, L. Y. S. Chan, L. L. S. Tam, N. Y. F. Chung, J. Zhang, K. W. Lo, D. P. Huang, Y. M. D. Lo, Investigation into the origin and tumoral mass correlation of plasma Epstein-Barr virus DNA in nasopharyngeal carcinoma. Clin. Chem. 51, 2192-2195 (2005). 19. Y. M. D. Lo, K. C. A. Chan, H. Sun, E. Z. Chen, P. Jiang, F. M. F. Lun, Y. W. Zheng, T. Y. Leung, T. K. Lau, C. R. Cantor, R. W. K. Chiu, Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus. Sci. Transl. Med. 2, 61ra91-61ra91 (2010). 20. P. Jiang, C. W. M. Chan, K. C. A. Chan, S. H. Cheng, J. Wong, V. W.-S. Wong, G. L. H. Wong, S. L. Chan, T. S. K. Mok, H. L. Y. Chan, P. B. S. Lai, R. W. K. Chiu, Y. M. D. Lo, Lengthening and shortening of plasma DNA in hepatocellular carcinoma patients. Proc. Natl. Acad. Sci. U.S.A. 112, E1317-E1325 (2015). 21. M. W. Snyder, M. Kircher, A. J. Hill, R. M. Daza, J. Shendure, Cell-free DNA comprises an in vivo nucleosome footprint that informs its tissues-of-origin. Cell 164, 57-68 (2016). 22. K. Sun, P. Jiang, K. C. A. Chan, J. Wong, Y. K. Y. Cheng, R. H. S. Liang, W. Chan, E. S. K. Ma, S. L. Chan, S. H. Cheng, R. W. Y. Chan, Y. K. Tong, S. S. M. Ng, R. S. M. Wong, D. S. C. Hui, T. N. Leung, T. Y. Leung, P. B. S. Lai, R. W. K. Chiu, Y. M. D. Lo, Plasma DNA tissue mapping by genome-wide methylation sequencing for noninvasive prenatal, cancer, and transplantation assessments, Proc. Natl. Acad. Sci. U.S.A. 112, E5503-E5512 (2015). 23. F. Mouliere, N. Rosenfeld, Circulating tumor-derived DNA is shorter than somatic DNA in plasma. Proc. Natl. Acad. Sci. U.S.A. 112, 3178-3179 (2015). 24. F. Mouliere, B. Robert, E. Peyrotte, M. Del Rio, M. Ychou, F. Molina, C. Gongora, A. R. Thierry, High fragmentation characterizes tumour-derived circulating DNA. PLoS One 6(2011), doi:10.1371/journal.pone.0023418. 25. H. R. Underhill, J. O. Kitzman, S. Hellwig, N. C. Welker, R. Daza, D. N. Baker, K. M. Gligorich, R. C. Rostomily, M. P. Bronner, J. Shendure, Fragment length of circulating tumor DNA. PLoS Genet. 12, 1-24 (2016). 26. D. Chandrananda, N. P. Thorne, M. Bahlo, High-resolution characterization of sequence signatures due to non-random cleavage of cell-free DNA. BMC Med. Genomics 8, 29 (2015). 27. S. C. Y. Yu, K. C. A. Chan, Y. W. L. Zheng, P. Jiang, G. J. W. Liao, H. Sun, R. Akolekar, T. Y. Leung, A. T. J. I. Go, J. M. G. van Vugt, R. Minekawa, C. B. M. Oudejans, K. H. Nicolaides, R. W. K. Chiu, Y. M. D. Lo, Size-based molecular diagnostics using plasma DNA for noninvasive prenatal testing. Proc. Natl. Acad. Sci. U.S.A. 111, 8583-8588 (2014). 28. K. C. A. Chan, J. Zhang, A. B. Y. Hui, N. Wong, T. K. Lau, T. N. Leung, K. W. Lo, D. W. S. Huang, Y. M. D. Lo, Size distributions of maternal and fetal DNA in maternal plasma. Clin. Chem. 50, 88-92 (2004). 29. J. E. Shaw, L. F. Levinger, C. W. Carter, Nucleosomal structure of Epstein-Barr virus DNA in transformed cell lines. J. Virol. 29, 657-665 (1979). 30. R. F. Ambinder, Plasma Epstein-Barr virus DNA for screening. N. Engl. J. Med. 377, 584-585 (2017). 31. D. J. Gaffney, G. McVicker, A. A. Pai, Y. N. Fondufe-Mittendorf, N. Lewellen, K. Michelini, J. Widom, Y. Gilad, J. K. Pritchard, Controls of nucleosome positioning in the human genome. PLoS Genet. 8, 1-13 (2012). 32. J. Zhong, K. Luo, P. S. Winter, G. E. Crawford, E. S. Iversen, A. J. Hartemink, Mapping nucleosome positions using DNase-seq, Genome Res. 26, 351-364 (2016). 33. S. M. Cao, M. J. Simons, C. N. Qian, The prevalence and prevention of nasopharyngeal carcinoma in China. Chin. J. Cancer 30, 114-119 (2011). 34. L. Sharp, L. Tilson, S. Whyte, A. O. Ceilleachair, C. Walsh, C. Usher, P. Tappenden, J. Chilcott, A. Staines, M. Barry, H. Comber, Using resource modelling to inform decision making and service planning: the case of colorectal cancer screening in Ireland. BMC Health Serv. Res. 13, 105 (2013). 35. E. A. Mesri, M. A. Feitelson, K. Munger, Human viral oncogenesis: A cancer hallmarks analysis. Cell Host Microbe 15, 266-282 (2014). 36. R. Li, C. Yu, Y. Li, T. W. Lam, S. M. Yiu, K. Kristiansen, J. Wang, SOAP2: An improved ultrafast tool for short read alignment, Bioinformatics 25, 1966-1967 (2009).
10:電腦設備 71:I/O控制器 72:系統記憶體 73:中央處理器 74:印刷機 75:系統匯流排 76:監視器 77:I/O端口 78:鍵盤 79:存儲裝置 81:外部接口 82:顯示配接器 85:資料收集裝置 2200:方法 2210:區塊 2220:區塊 2230:區塊 2240:區塊 2250:區塊 4000:方法 4010:區塊 4020:區塊 4030:區塊 4040:區塊 5300:方法 5310:區塊 5320:區塊 5330:區塊 5340:區塊 6000:方法 6200:系統 6205:樣品 6208:分析法 6210:樣品架 6215:物理特徵 6220:偵測器 6225:資料信號 6230:邏輯系統 6240:外部記憶體 6245:存儲裝置 6250:處理器
本發明之新穎特徵在隨附申請專利範圍中詳細闡述。將參照以下闡述利用本發明原理之說明性實施例的詳細描述及隨附圖式(在本文中亦為「圖」)來獲得對本發明之特徵及優點的較佳理解,其中: 圖1描繪展示來自鼻咽癌(nasopharyngeal cancer;NPC)細胞之埃-巴二氏病毒(Epstein-Barr virus;EBV) DNA片段沈積至個體血流中的示意圖。 圖2描繪患有NPC個體及對照個體之血漿EBV DNA濃度(複本數/毫升血漿)。 圖3A及3B展示藉由即時PCR量測不同組個體之血漿EBV DNA濃度。 圖4描繪患有早期NPC及晚期NPC個體的血漿EBV DNA濃度(複本數/毫升血漿)。 圖5展示藉由即時PCR量測下列個體血漿EBV DNA濃度,作為驗證分析之一部分,(左)血漿EBV DNA呈持續陽性但無可觀察的病理之個體,(右)藉由篩查鑑別為早期NPC患者。 圖6展示藉由即時PCR量測下列個體血漿EBV DNA濃度(複本數/毫升):血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體,及經鑑別患有NPC之個體。 圖7展示藉由即時PCR量測下列個體血漿EBV DNA濃度(複本數/毫升):血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體,及經鑑別患有NPC之個體。 圖8A及8B展示不同組個體中定位至EBV基因組的經定序之血漿DNA片段的比例。 圖9展示下列個體血漿中定位至EBV基因組之讀段的比例:(左)血漿EBV DNA呈持續陽性但無可觀察的病理之個體,及(右)藉由篩查鑑別為早期NPC患者。 圖10描繪隨時間推移NPC不同期數之個體的總存活率。 圖11展示用於探索及驗證使用與EBV基因組比對之序列讀段的比例篩查NPC的群組。 圖12為展示探索及驗證樣品集中之個體特徵的表格。 圖13A展示探索資料集中之NPC患者及具有瞬時陽性及持續陽性結果之非癌症個體中經定序之血漿DNA讀段的總數當中血漿EBV DNA讀段之比例。圖13B展示驗證樣品集中NPC患者及具有瞬時陽性及持續陽性結果之非癌症個體中血漿EBV DNA讀段的比例。 圖14展示下列個體中定位至EBV基因組之血漿DNA片段的比例(%):血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體,及鑑別為患有NPC之個體。 圖15A展示15個瞬時陽性樣品、20個持續陽性樣品及10個來自確診NPC個體之樣品之訓練集的血漿中定位至EBV基因組之讀段的比例(%)。圖15B展示56個瞬時陽性樣品、44個持續陽性樣品及29個來自確診NPC個體之樣品之驗證集的血漿中定位至EBV基因組之讀段的比例(%)。 圖16展示HCC組之血漿中B型肝炎病毒(HBV) DNA片段之豐度(平均值:0.00047%)顯著高於包括健康對照個體、HBV帶菌者、肝硬化個體之非HCC組(平均值:0.021%)。 圖17展示各子宮頸癌臨床病例之獨特性地定位至不同HPV血清型之HPV基因組之讀段的數目及比例。 圖18展示各子宮頸上皮內瘤形成(CIN)臨床病例之獨特性地定位至不同HPV血清型之HPV基因組之讀段的數目及比例。 圖19展示各HPV陽性頭頸部鱗狀細胞癌(HPV+ve HNSCC)臨床病例之獨特性地定位至不同HPV血清型之HPV基因組之讀段的數目及比例。 圖20展示具有至少一個血漿HPV DNA之9名健康個體之血漿樣品中血漿HPV片段的數目及相應的HPV血清型。 圖21展示患有子宮頸癌、子宮頸上皮內瘤形成(CIN)、HPV陽性頭頸部鱗狀細胞癌(HPV+ve HNSCC)之患者及健康對照之血漿DNA樣品中HPV讀段(包括所有血清型)的中位數比例。 圖22為說明根據本發明之實施例使用個體之無細胞混合物中病毒核酸片段之序列讀段篩查癌症之基於計數之方法2200的流程圖。 圖23展示來自正常個體之合併樣品及6名患有鼻咽癌之個體(例如TBR1344、TBR1358、TBR1360、TBR1378、TBR1379及TBR1390)之樣品中EBV DNA片段的尺寸分佈。 圖24展示6名患有鼻咽癌(NPC)之個體(例如TBR1344、TBR1358、TBR1360、TBR1378、TBR1379及TBR1390)中定位至EBV基因組及人類基因組之經定序之血漿DNA片段的尺寸分佈。 圖25展示3名患有淋巴瘤之個體(TBR1332、TBR1333及TBR1551)中定位至EBV基因組及人類基因組之經定序之血漿DNA片段的尺寸分佈。 圖26展示6名對照個體(AP080、BP065、EN086、BH035、FF159及GC038)中定位至EBV基因組及人類基因組之經定序之血漿DNA片段的尺寸分佈。 圖27A及27B展示患有NPC之個體(圖27A)及血漿EBV DNA呈持續陽性之個體(圖27B)中定位至EBV基因組及人類基因組的經定序之血漿DNA片段的尺寸概況。 圖28A展示患有NPC之患者的血漿中EBV DNA (紅色曲線)及常染色體DNA (黑色曲線)的尺寸分佈。圖28B展示具有持續陽性血漿EBV DNA結果之非癌症個體中EBV DNA (紅色曲線)及人類常染色體DNA (黑色曲線)的尺寸分佈。 圖29A展示亦用於圖13A之探索樣品集中癌症及非癌症病例的EBV尺寸比。圖29B展示亦用於圖13B之驗證樣品集中之NPC患者及具有瞬時陽性及持續陽性結果之非癌症個體的EBV DNA尺寸比。 圖30展示低於150 bp之經定序之血漿EBV DNA片段的百分比。 圖31展示下列個體血漿中低於150個鹼基對(bp)之EBV DNA片段的百分比:(左)血漿EBV DNA呈持續陽性但無可觀察的病理之個體,及(右)藉由篩查鑑別為早期NPC患者。 圖32展示下列個體血漿EBV DNA片段長度介於80及110個鹼基對之間與常染色體DNA片段長度介於80及110個鹼基對之間的尺寸比:血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體,及鑑別為患有NPC之個體。 圖33展示下列個體之尺寸指數(例如尺寸比之倒數):血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體,及經鑑別為患有NPC之個體 。 圖34A展示下列個體之尺寸指數(例如尺寸比之倒數)以用於訓練集:血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體,及經鑑別為患有NPC之個體(右)。圖34B展示下列個體之尺寸指數(例如尺寸比之倒數)以用於驗證集:血漿EBV DNA呈瞬時陽性或持續陽性(分別為左或中)但無可觀察的病理之個體,及經鑑別為患有NPC之個體(右)。 圖35A展示HCC個體中定位至HBV基因組及人類基因組之經定序之血漿DNA片段的尺寸分佈。圖35B展示(左)患有慢性B型肝炎之個體及(右) HCC個體之血漿中低於150 bp之HBV DNA片段百分比的條形圖。 圖36及37展示患有子宮頸癌之8名個體(C-788、C-801、C-803、C-819、C-822、C-877、3485、3276)中經定序之血漿HPV DNA片段及定位至人類基因組之DNA片段(常染色體DNA片段)的尺寸分佈。 圖38及39展示患有HPV陽性頭頸部鱗狀細胞癌瘤(HPV+ve HNSCC)之3名個體中經定序之血漿HPV DNA片段及定位至人類基因組之DNA片段(常染色體DNA片段)的尺寸分佈。 圖40為說明根據本發明之實施例之使用病毒DNA片段之尺寸分佈來確定癌症等級之方法的流程圖。 圖41展示根據本發明之實施例之完整機率(P I)之定義的說明性實例。 圖42展示具有持續假陽性血漿EBV DNA且無可觀察的病理之4名個體及6名NPC患者之EBV基因組中終止於各核苷酸之血漿EBV DNA片段的頻率。 圖43展示描繪(A)特定於無可觀察的病理之個體的偏好終止位置的數目(383),(B)特定於患有NPC之個體的偏好終止位置的數目(383)及(C)兩組個體共享之偏好終止位置(17)的文氏圖。 圖44展示熱圖,其描繪無可觀察的病理之個體及NPC個體之終止於集合A位置或集合B位置之片段的百分比。描繪8名無可觀察的病理之個體(左8行;C1-C8)及5名NPC個體(右5行;NPC1-NPC5)的熱圖。終止於集合A終止位置之NPC個體的核酸片段與終止於集合B終止位置之NPC個體的核酸片段相比相對較不豐富。 圖45展示不同組個體之終止於集合B位置之片段的數目除以終止於集合A位置之片段的數目之比(例如B/A比)。 圖46展示下列個體之B/A比:(左)血漿EBV DNA呈持續陽性但無可觀察的病理之個體,及(右)藉由篩查鑑別之早期NPC患者。 圖47展示下列個體中之末端比(例如終止於集合B位置之經定序之血漿EBV DNA片段的數目與終止於集合A位置之經定序之血漿EBV DNA片段的數目之比):血漿EBV DNA呈持續陽性(左)但無可觀察的病理之個體,及經鑑別為患有NPC之個體 。 圖48展示(左)患有慢性B型肝炎之個體及(右) HCC個體之終止於HCC偏好終止位置之血漿HBV DNA片段的數目相對於終止於其他位置之片段正規化的盒鬚圖。 圖49A及49B展示終止於HPV基因組之不同位置的血漿HPV DNA片段的數目。 圖50展示在全HPV基因組中,血漿中HPV DNA分子之覆蓋率為不均勻的。 圖51展示差異性片段化模式,其係藉由比較患有子宮頸癌(CC)之個體與患有頭頸部鱗狀細胞癌(HNSCC)之個體之間的HPV片段覆蓋率來確定。 圖52展示藉由定序分析血漿HPV DNA讀段之偏好終止位置的文氏圖。 圖53為說明根據本發明之實施例之基於病毒核酸分子之片段化模式來確定個體之癌症等級的方法的流程圖。 圖54展示患有鼻咽癌之患者及非癌症個體之血漿EBV DNA的定量及尺寸概況分析。 圖55展示使用定位至EBV基因組之經定序之血漿DNA片段的比例進行第一分析及隨後使用尺寸比進行第二分析後,經鑑別為血漿EBV DNA呈瞬時陽性或持續陽性但無可觀察的病理之個體及經鑑別為患有NPC之個體的數目。 圖56A展示驗證樣品集中所有病例之血漿EBV讀段的比例與相應的尺寸比值之間的關係圖。圖56B展示基於計數之分析、基於尺寸之分析、組合定序分析及即時PCR分析之接受者操作特徵(ROC)曲線。 圖57展示使用來自圖56A之截止值模擬基於計數之分析及基於尺寸之分析用於整個20,174名個體篩查群組之血漿EBV DNA之效能。 圖58及59展示分類及回歸樹(CART)分析之結果以確定各種參數之最佳截止值,從而用於區分血漿EBV DNA呈瞬時陽性或持續陽性但無可觀察的病理之個體或經鑑別為患有NPC之個體。 圖60為根據本發明之實施例之組合病毒核酸片段之基於計數及基於尺寸之分析以確定病理等級之方法的流程圖。 圖61展示下列個體血漿中B/A比相對低於150 bp之EBV DNA片段百分比的散佈圖:(實心圓)血漿EBV DNA呈持續陽性但無可觀察的病理之個體,及(空心圓)藉由篩查鑑別之早期NPC患者。 圖62展示根據本發明之一實施例的系統5900。 圖63展示可與根據本發明之實施例的系統及方法一起使用的實例電腦系統10的框圖。

Claims (19)

  1. 一種確定個體之病理等級的方法,該方法包含: 執行第一分析法,其中該第一分析法包含分析來自該個體之第一生物樣品的第一複數個無細胞核酸分子及確定該個體對該病理為陽性;及 執行第二分析法,其中該第二分析法包含 量測第二生物樣品中第二複數個無細胞核酸分子中之每一者的尺寸;及 確定來自病毒之參考基因組之該第二複數個無細胞核酸分子之規定尺寸的量; 將該量與第二截止值進行比較;及 基於該第一分析法為陽性及該量與該第二截止值之比較來確定該個體之病理等級。
  2. 如請求項1之方法,其中該第一分析法包括即時聚合酶鏈式反應(PCR)。
  3. 如請求項1之方法,其中該病理等級為癌症等級。
  4. 如請求項3之方法,其中該癌症係選自由以下各者組成之群:鼻咽癌、頭頸部鱗狀細胞癌、子宮頸癌及肝細胞癌。
  5. 如請求項1之方法,其中該第一生物樣品及該第二生物樣品來自相同的血液樣品。
  6. 如請求項1之方法,其中該第一生物樣品及該第二生物樣品為該相同樣品,且其中該第二複數個無細胞核酸分子為該第一複數個無細胞核酸分子。
  7. 如請求項1之方法,其中當該第一分析法為陽性時,執行該第二分析法。
  8. 如請求項1之方法,其中僅當該第一分析法為陽性且該量超過該第二截止值時才確定該個體具有該病理。
  9. 如請求項8之方法,其中該量藉由低於該第二截止值而超過該第二截止值。
  10. 如請求項1之方法,其中該量屬於具有給定範圍內之尺寸且與該參考基因組比對的核酸分子。
  11. 如請求項10之方法,其進一步包含使用具有不同範圍內之尺寸且與該參考基因組比對之無細胞核酸分子的另一量將該量正規化。
  12. 如請求項10之方法,其進一步包含使用具有該給定範圍內之尺寸且與常染色體基因組比對之無細胞核酸分子的另一量將該量正規化。
  13. 如請求項1之方法,其中確定該病理等級之陽性預測值為至少15%、至少17%或至少19%,其中確定該病理等級之靈敏度為至少95%、至少96%或至少97%,及/或其中確定該病理等級之特異性為至少95%、至少96%、至少97%、至少98%或至少99%。
  14. 如請求項1之方法,其進一步包含富集該第二生物樣品中來自該病毒之核酸分子。
  15. 如請求項14之方法,其中該富集該第二生物樣品中來自該病毒之核酸分子包括使用結合該病毒之一部分或全部基因組的捕捉探針。
  16. 如請求項14之方法,其進一步包含: 富集該第二生物樣品中來自人類基因組之一部分的核酸分子。
  17. 一種用於分析生物樣品之電腦產品,其包含存儲複數個指令之電腦可讀取媒體,該等指令用於控制電腦系統執行如請求項1至16中任一項之方法。
  18. 一種系統,其包含: 如請求項17之電腦產品;及 一或多個處理器,用於執行存儲於該電腦可讀取媒體上之指令。
  19. 一種用於分析生物樣品之系統,其包含用於執行如請求項1至16中任一項之方法的構件。
TW112116081A 2017-01-25 2018-01-25 使用核酸片段之診斷應用 TW202348802A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201762450541P 2017-01-25 2017-01-25
US62/450,541 2017-01-25
US201762507154P 2017-05-16 2017-05-16
US62/507,154 2017-05-16
PCT/US2017/058099 WO2018081130A1 (en) 2016-10-24 2017-10-24 Methods and systems for tumor detection
WOPCT/US17/58099 2017-10-24

Publications (1)

Publication Number Publication Date
TW202348802A true TW202348802A (zh) 2023-12-16

Family

ID=62905753

Family Applications (2)

Application Number Title Priority Date Filing Date
TW107102794A TWI803477B (zh) 2017-01-25 2018-01-25 使用核酸片段之診斷應用
TW112116081A TW202348802A (zh) 2017-01-25 2018-01-25 使用核酸片段之診斷應用

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW107102794A TWI803477B (zh) 2017-01-25 2018-01-25 使用核酸片段之診斷應用

Country Status (9)

Country Link
US (3) US10633713B2 (zh)
EP (1) EP3574108A4 (zh)
CN (1) CN110291212A (zh)
AU (2) AU2018212272B2 (zh)
CA (1) CA3051509A1 (zh)
MY (1) MY197535A (zh)
SG (1) SG11201906397UA (zh)
TW (2) TWI803477B (zh)
WO (1) WO2018137685A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012142213A2 (en) 2011-04-15 2012-10-18 The Johns Hopkins University Safe sequencing system
EP3447495B2 (en) 2012-10-29 2024-03-13 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
TWI797095B (zh) 2016-10-24 2023-04-01 美商格瑞爾有限責任公司 腫瘤檢測之方法及系統
AU2018212272B2 (en) 2017-01-25 2022-04-28 Grail, Inc. Diagnostic applications using nucleic acid fragments
EP3658684B1 (en) 2017-07-26 2023-08-30 The Chinese University Of Hong Kong Enhancement of cancer screening using cell-free viral nucleic acids
MX2020001575A (es) 2017-08-07 2020-11-18 Univ Johns Hopkins Materiales y métodos para evaluar y tratar el cáncer.
GB201819134D0 (en) * 2018-11-23 2019-01-09 Cancer Research Tech Ltd Improvements in variant detection
WO2020060994A1 (en) 2018-09-17 2020-03-26 The University Of North Carolina At Chapel Hill Method for quantifying dna fragments in a sample by size
WO2020186024A1 (en) * 2019-03-13 2020-09-17 Grail, Inc. Systems and methods for enriching for cancer-derived fragments using fragment size
EP3947742A4 (en) * 2019-04-02 2022-12-28 Grail, LLC RISK STRATIFICATION TO VIRUS-ASSOCIATED CANCER
WO2021046655A1 (en) * 2019-09-13 2021-03-18 University Health Network Detection of circulating tumor dna using double stranded hybrid capture
WO2021113287A1 (en) * 2019-12-04 2021-06-10 Illumina, Inc. Preparation of dna sequencing libraries for detection of dna pathogens in plasma
WO2021168143A1 (en) * 2020-02-18 2021-08-26 Tempus Labs, Inc. Systems and methods for detecting viral dna from sequencing
AU2021292311A1 (en) * 2020-06-20 2023-02-16 Grail, Llc Detection and classification of human papillomavirus associated cancers
WO2022040163A1 (en) * 2020-08-18 2022-02-24 Delfi Diagnostics, Inc. Methods and systems for cell-free dna fragment size densities to assess cancer
AU2022359420A1 (en) * 2021-10-04 2024-05-02 Grail, Llc Sequencing of viral dna for predicting disease relapse
US20240011105A1 (en) * 2022-07-08 2024-01-11 The Chinese University Of Hong Kong Analysis of microbial fragments in plasma

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE399793T1 (de) 1999-04-02 2008-07-15 Corixa Corp Verbindungen und verfahren für therapie und diagnose von lungenkrebs
US20030219765A1 (en) 2000-03-23 2003-11-27 Jose Costa Methods for evaluating cancer risk
US20030211522A1 (en) 2002-01-18 2003-11-13 Landes Gregory M. Methods for fetal DNA detection and allele quantitation
ATE312946T1 (de) 2002-03-05 2005-12-15 Epigenomics Ag Verfahren und vorrichtung zur bestimmung der gewebespezifität von freier dna in körperflüssigkeiten
US7704687B2 (en) 2002-11-15 2010-04-27 The Johns Hopkins University Digital karyotyping
WO2004078999A1 (en) 2003-03-05 2004-09-16 Genetic Technologies Limited Identification of fetal dna and fetal cell markers in maternal plasma or serum
PL201608B1 (pl) 2003-06-13 2009-04-30 Cezary Cybulski Sposób i zestaw do wykrywania wysokiej genetycznie uwarunkowanej predyspozycji do raka prostaty oraz zastosowanie zmiany germinalnej w obrębie genu NBS1
ATE435301T1 (de) 2003-10-16 2009-07-15 Sequenom Inc Nicht invasiver nachweis fötaler genetischer merkmale
US20050282196A1 (en) 2004-04-30 2005-12-22 Jose Costa Methods and compositions for cancer diagnosis
CN1790021A (zh) * 2004-12-15 2006-06-21 杨华显 利用循环伊波病毒dna对前癌、原位癌和癌病灶的筛查
US20070122823A1 (en) 2005-09-01 2007-05-31 Bianchi Diana W Amniotic fluid cell-free fetal DNA fragment size pattern for prenatal diagnosis
EP2423334A3 (en) 2006-02-02 2012-04-18 The Board of Trustees of The Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
SI2351858T1 (sl) 2006-02-28 2015-06-30 University Of Louisville Research Foundation Med Center Three, Zaznavanje fetalnih kromosomskih nenormalnosti z uporabo tandema polimorfizmov posameznih nukleotidov
WO2008024009A1 (fr) 2006-08-15 2008-02-28 Institut Molekulyarnoi Genetiki Rossiiskoi Akademii Nauk (Img Ran) Niveau de transcription du gène timp3 utilisé en tant que marqueur servant à diagnostiquer le cancer du poumon non à petites cellules
US7842482B2 (en) * 2007-02-26 2010-11-30 The Chinese University Of Hong Kong Methods and kits for diagnosis, prognosis or monitoring of Epstein-Barr virus (EBV)-associated cancer
CA2688312A1 (en) 2007-05-25 2008-12-04 Decode Genetics Ehf. Genetic variants on chr 5p12 and 10q26 as markers for use in breast cancer risk assessment, diagnosis, prognosis and treatment
PT2183693E (pt) 2007-07-23 2014-01-14 Univ Hong Kong Chinese Diagnóstico de aneuploidia cromossómica fetal utilizando sequenciação genómica
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
US20090053719A1 (en) 2007-08-03 2009-02-26 The Chinese University Of Hong Kong Analysis of nucleic acids by digital pcr
US20100041048A1 (en) 2008-07-31 2010-02-18 The Johns Hopkins University Circulating Mutant DNA to Assess Tumor Dynamics
US8835110B2 (en) * 2008-11-04 2014-09-16 The Johns Hopkins University DNA integrity assay (DIA) for cancer diagnostics, using confocal fluorescence spectroscopy
US20100136560A1 (en) 2008-12-02 2010-06-03 The Johns Hopkins University Integrated Analyses of Breast and Colorectal Cancers
RU2011143425A (ru) 2009-03-31 2013-05-10 Оридис Биомаркерс Гмбх Способ диагностики рака и мониторинга лечения рака
US20120208711A1 (en) 2009-10-02 2012-08-16 Centre For Addiction And Mental Health Method for Analysis of DNA Methylation Profiles of Cell-Free Circulating DNA in Bodily Fluids
EP2494065B1 (en) 2009-10-26 2015-12-23 Lifecodexx AG Means and methods for non-invasive diagnosis of chromosomal aneuploidy
WO2011053790A2 (en) 2009-10-30 2011-05-05 Fluidigm Corporation Assay of closely linked targets in fetal diagnosis and coincidence detection assay for genetic analysis
PT3241914T (pt) 2009-11-05 2019-04-30 Sequenom Inc Análise genómica fetal a partir de uma amostra biológica materna
EP2496713B1 (en) 2009-11-06 2018-07-18 The Chinese University of Hong Kong Size-based genomic analysis
GB0922006D0 (en) 2009-12-17 2010-02-03 Genome Res Ltd Diagnostic
US10662474B2 (en) 2010-01-19 2020-05-26 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
DK3382037T3 (da) 2010-01-19 2021-05-25 Verinata Health Inc Fremgangsmåder til bestemmelse af fraktionen af føtale nukleinsyrer i maternelle prøver
EP2536854B1 (en) 2010-02-18 2017-07-19 The Johns Hopkins University Personalized tumor biomarkers
US10047397B2 (en) 2010-04-16 2018-08-14 Chronix Biomedical Breast cancer associated circulating nucleic acid biomarkers
EP2426217A1 (en) * 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
KR102185244B1 (ko) 2010-11-30 2020-12-02 더 차이니즈 유니버시티 오브 홍콩 암과 연관된 유전적 또는 분자적 이상들의 검출
WO2012103031A2 (en) 2011-01-25 2012-08-02 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US20140178348A1 (en) 2011-05-25 2014-06-26 The Regents Of The University Of California Methods using DNA methylation for identifying a cell or a mixture of cells for prognosis and diagnosis of diseases, and for cell remediation therapies
JP6161607B2 (ja) 2011-07-26 2017-07-12 ベリナタ ヘルス インコーポレイテッド サンプルにおける異なる異数性の有無を決定する方法
ES2937410T3 (es) 2011-09-26 2023-03-28 Qiagen Gmbh Método rápido para aislar ácidos nucleicos extracelulares
JP6073902B2 (ja) 2011-10-06 2017-02-01 セクエノム, インコーポレイテッド 遺伝的変異の非侵襲的評価のための方法およびプロセス
EP2768985B1 (en) 2011-10-21 2019-03-20 Chronix Biomedical Colorectal cancer associated circulating nucleic acid biomarkers
WO2013060762A1 (en) 2011-10-25 2013-05-02 Roche Diagnostics Gmbh Method for diagnosing a disease based on plasma-dna distribution
WO2013086352A1 (en) 2011-12-07 2013-06-13 Chronix Biomedical Prostate cancer associated circulating nucleic acid biomarkers
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
EP2825675B1 (en) 2012-03-13 2017-12-27 Patel, Abhijit Ajit Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
US20150105267A1 (en) 2012-05-24 2015-04-16 University Of Washington Through Its Center For Commercialization Whole genome sequencing of a human fetus
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
WO2014004726A1 (en) * 2012-06-26 2014-01-03 Caifu Chen Methods, compositions and kits for the diagnosis, prognosis and monitoring of cancer
ES2906714T3 (es) 2012-09-04 2022-04-20 Guardant Health Inc Métodos para detectar mutaciones raras y variación en el número de copias
SG10201705198UA (en) 2012-09-20 2017-07-28 Univ Hong Kong Chinese Non-invasive determination of methylome of fetus or tumor from plasma
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
GB2526736A (en) 2013-02-21 2015-12-02 Toma Biosciences Inc Methods, compositions, and kits for nucleic acid analysis
EP2971097B1 (en) 2013-03-15 2018-08-01 Verinata Health, Inc Generating cell-free dna libraries directly from blood
CN103215350B (zh) 2013-03-26 2016-11-02 苏州贝康医疗器械有限公司 一种基于单核苷酸多态性位点的孕妇血浆中胎儿dna含量的测定方法
US10174375B2 (en) 2013-09-20 2019-01-08 The Chinese University Of Hong Kong Sequencing analysis of circulating DNA to detect and monitor autoimmune diseases
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
WO2015054080A1 (en) 2013-10-07 2015-04-16 Sequenom, Inc. Methods and processes for non-invasive assessment of chromosome alterations
US20150119260A1 (en) * 2013-10-18 2015-04-30 National Taiwan University Circulating cancer biomarker and its use
EP4306659A3 (en) 2014-04-14 2024-03-27 Yissum Research and Development Company of the Hebrew University of Jerusalem Ltd. A method and kit for determining the tissue or cell origin of dna
SG11201608993RA (en) 2014-05-09 2016-11-29 Lifecodexx Ag Detection of dna that originates from a specific cell-type and related methods
US9840742B2 (en) 2014-06-16 2017-12-12 JBS Science Inc. Detection of hepatitis B virus (HBV) DNA and methylated HBV DNA in urine of patients with HBV-associated hepatocellular carcinoma
US20160002717A1 (en) 2014-07-02 2016-01-07 Boreal Genomics, Inc. Determining mutation burden in circulating cell-free nucleic acid and associated risk of disease
EP3169813B1 (en) 2014-07-18 2019-06-12 The Chinese University Of Hong Kong Methylation pattern analysis of tissues in dna mixture
DK3178941T3 (da) * 2014-07-25 2022-01-17 Bgi Genomics Co Ltd Fremgangsmåde til bestemmelse af fraktionen af cellefrie føtale nukleinsyrer i en prøve af perifert blod fra en gravid kvinde og anvendelse deraf
WO2016015058A2 (en) 2014-07-25 2016-01-28 University Of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
DK3201361T3 (da) 2014-10-01 2020-05-18 Chronix Biomedical Fremgangsmåder til kvantificering af cellefrit DNA
US10683552B2 (en) 2014-11-25 2020-06-16 Presidents And Fellows Of Harvard College Clonal haematopoiesis
CA2967447A1 (en) 2014-12-05 2016-06-09 Foundation Medicine, Inc. Multigene analysis of tumor samples
AU2015360298B2 (en) * 2014-12-12 2018-06-07 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
WO2016109604A2 (en) 2014-12-29 2016-07-07 InnoGenomics Technologies, LLC Multiplexed assay for quantitating and assessing integrity of cell-free dna in biological fluids for cancer diagnosis, prognosis, and surveillance
CN113930507A (zh) 2014-12-31 2022-01-14 夸登特健康公司 疾病的检测和治疗以及用于传送测试结果的系统和方法
US10364467B2 (en) * 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US11242559B2 (en) 2015-01-13 2022-02-08 The Chinese University Of Hong Kong Method of nuclear DNA and mitochondrial DNA analysis
US10319463B2 (en) * 2015-01-23 2019-06-11 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations
WO2016127944A1 (en) 2015-02-10 2016-08-18 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
CN107750279A (zh) 2015-03-16 2018-03-02 个人基因组诊断公司 核酸分析系统和方法
AU2016295712B2 (en) 2015-07-20 2022-06-02 The Chinese University Of Hong Kong Methylation pattern analysis of haplotypes in tissues in DNA mixture
JP6931236B2 (ja) * 2015-07-23 2021-09-01 ザ チャイニーズ ユニバーシティ オブ ホンコン 無細胞dnaの断片化パターンの分析
US10428391B2 (en) 2015-07-27 2019-10-01 The Johns Hopkins University Method to use viral and host methylation markers for cervical cancer screening and triage in liquid prep, serum/plasma, and urine: PCR and sequencing based process methods
EP3365441A1 (en) 2015-10-22 2018-08-29 The Broad Institute Inc. Type vi-b crispr enzymes and systems
AU2016370835B2 (en) 2015-12-17 2020-02-13 Illumina, Inc. Distinguishing methylation levels in complex biological samples
CN108603236A (zh) 2015-12-18 2018-09-28 路胜基因(新加坡)私人有限公司 检测和定量微生物的靶核酸序列
US10095831B2 (en) * 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
CN115161390A (zh) 2016-05-30 2022-10-11 香港中文大学 使用血液中的无细胞dna检测血液病症
EP3481966B1 (en) 2016-07-06 2023-11-08 Guardant Health, Inc. Methods for fragmentome profiling of cell-free nucleic acids
TWI797095B (zh) * 2016-10-24 2023-04-01 美商格瑞爾有限責任公司 腫瘤檢測之方法及系統
WO2018112100A2 (en) 2016-12-13 2018-06-21 Bellwether Bio, Inc. Determining a physiological condition in an individual by analyzing cell-free dna fragment endpoints in a biological sample
AU2018212272B2 (en) 2017-01-25 2022-04-28 Grail, Inc. Diagnostic applications using nucleic acid fragments
EP3658684B1 (en) 2017-07-26 2023-08-30 The Chinese University Of Hong Kong Enhancement of cancer screening using cell-free viral nucleic acids
CA3123474A1 (en) * 2018-12-19 2020-06-25 The Chinese University Of Hong Kong Cell-free dna end characteristics
US20220259647A1 (en) 2019-07-09 2022-08-18 The Translational Genomics Research Institute METHODS OF DETECTING DISEASE AND TREATMENT RESPONSE IN cfDNA

Also Published As

Publication number Publication date
EP3574108A1 (en) 2019-12-04
AU2018212272B2 (en) 2022-04-28
US20230151436A1 (en) 2023-05-18
AU2018212272A1 (en) 2019-07-18
TW201840853A (zh) 2018-11-16
CA3051509A1 (en) 2018-08-02
TWI803477B (zh) 2023-06-01
SG11201906397UA (en) 2019-08-27
US11479825B2 (en) 2022-10-25
EP3574108A4 (en) 2020-12-23
US20180208999A1 (en) 2018-07-26
WO2018137685A1 (en) 2018-08-02
US20200318204A1 (en) 2020-10-08
CN110291212A (zh) 2019-09-27
AU2022205234A1 (en) 2022-08-04
US10633713B2 (en) 2020-04-28
MY197535A (en) 2023-06-21

Similar Documents

Publication Publication Date Title
TWI803477B (zh) 使用核酸片段之診斷應用
US20230132951A1 (en) Methods and systems for tumor detection
US10731224B2 (en) Enhancement of cancer screening using cell-free viral nucleic acids
Frimer et al. HPV16 CpG methyl-haplotypes are associated with cervix precancer and cancer in the Guanacaste natural history study
TW202102688A (zh) 與病毒相關的癌症的風險分級
WO2023056884A1 (en) Sequencing of viral dna for predicting disease relapse
AU2017347790B2 (en) Methods and systems for tumor detection
KR20240070647A (ko) 질환 재발을 예측하기 위한 바이러스 dna의 시퀀싱