TW201639968A

TW201639968A - 血漿粒線體ｄｎａ分析之應用

Info

Publication number: TW201639968A
Application number: TW105101035A
Authority: TW
Inventors: 煜明盧; 慧君趙; 君賜陳; 江培勇
Original assignee: 香港中文大學
Priority date: 2015-01-13
Filing date: 2016-01-13
Publication date: 2016-11-16
Also published as: TWI807306B; WO2016112851A1; TW202144583A; US20160203260A1; CN107208153A; EP3245300A4; US20220112554A1; TW202336235A; TWI727938B; US11242559B2; EP3245300A1

Abstract

本發明係關於確定生物樣品中相對於核DNA分子之量之粒線體DNA分子之量，且該相對量用於多種目的，例如篩選、偵測、預測或監測多種生理及病理狀況。作為實例，可使用粒線體DNA之量來估計組織類型之DNA濃度，例如胎兒DNA濃度、腫瘤DNA濃度，或源自非造血組織來源之生物樣品中之DNA濃度。可使用測序技術確定樣品中之粒線體DNA濃度以正確偵測癌症等級。亦使用粒線體DNA分子與核DNA分子比較之相對量來確定自體免疫疾病之等級。

Description

血漿粒線體DNA分析之應用

相關申請案之交叉參考

本申請案主張對Lo等人(代理人案號80015-015800US)於2015年1月13日申請之標題為「Using Size And Number Aberrations In Plasma DNA For Detecting Cancer」美國臨時專利申請案第62/102,867號；及Lo等人(代理人案號80015-016000US)於2015年2月3日申請之標題為「Applications Of Plasma Mitochondrial DNA Analysis」之美國臨時專利申請案第62/111,524號之優先權，出於所有目的其揭示內容係全文以引用方式併入。

最近業內非常關注血漿及血清中之無細胞DNA用於分子診斷之用途。舉例而言，已在血漿中偵測到粒線體DNA(Chiu等人Clin Chem 2003；49：719-726及Lo等人Sci Transl Med 2010；2：61-ra91)。已量測癌症患者血漿中之粒線體DNA，但該等量測不一致(Yu M等人Mitochondrial DNA 2012；23：329-32；Zachariah RR等人Obstet Gynecol 2008；112：843-50；Mehra N等人Clin Cancer Res 2007；23：421-6；Kohler等人Mol Cancer 2009；8：105；及Choudhuri等人Mol Cell Biochem 2014；386：259-269)。此外，粒線體DNA之量化的使用已受到限制。

各個實施例可確定生物樣品中相對於核DNA分子之量的粒線體DNA分子之量，及該相對量用於各種目的之用途，例如篩選、偵測、預測或監測各種生理及病理狀況。舉例而言，實施例顯示，可使用粒線體DNA之量來估計某組織類型之DNA之濃度。

根據一個實施例，胎兒DNA分數可藉由確定粒線體DNA之量然後將該量定位至胎兒DNA分數來量測。因此，可使用粒線體DNA之量來估計來自懷孕女性之樣品中之胎兒DNA濃度，其可相對於其他技術降低該等量測之成本。亦可使用粒線體DNA之量來估計樣品中之腫瘤DNA濃度。且可確定來自非造血組織來源之DNA之百分比。

根據另一實施例，可使用生物樣品中粒線體DNA分子與核DNA分子之量相比之相對量精確地確定生物體之癌症等級。DNA分子之隨機測序可產生定位(mapped)至參照核基因體及參照粒線體二者之序列讀段(reads)，以確定DNA分子係核DNA或粒線體DNA。在一些實施方案中，僅使用獨特地定位(mapping)(比對)至粒線體基因體之序列讀段來確定相對量。此外，可使用粒線體DNA分子之相對量來確定腫瘤大小。

根據另一實施例，可使用生物樣品中粒線體DNA分子與核DNA分子之量相比之相對量精確地確定生物體之自體免疫疾病之等級。此外，可使用粒線體DNA分子之大小分佈之統計值來確定生物體之自體免疫疾病之等級，例如全身性紅斑狼瘡之等級。

其他實施例係關於與本文所述方法相關之系統及電腦可讀媒體。

可參照以下詳細說明及附圖來獲得對本發明之實施例之性質及優點之更佳理解。

術語

如本文所用術語「生物樣品」係指任何取自個體(例如，人類，例如懷孕女性)且含有一或多種所關注核酸分子之樣品。實例包括血漿、唾液、胸水、汗液、腹水、膽汁、尿液、血清、胰液、糞便、宮頸灌洗液及宮頸塗抹樣品。

術語「核酸」或「多核苷酸」係指去氧核糖核酸(DNA)或其呈單鏈或雙鏈形式之聚合物。除非明確限制，否則該術語涵蓋含有天然核苷酸之已知類似物之核酸，其具有與參照核酸類似之結合性質且係以與天然核苷酸類似之方式來代謝。除非另外指示，否則特定核酸序列亦隱含地涵蓋其保守修飾變體(例如，簡並密碼子取代)、等位基因、直向同源物、單核苷酸多型性(SNP)及互補序列以及明確指示之序列。具體而言，簡併密碼子取代可藉由生成序列來達成，其中一或多個所選(或全部)密碼子之第三個位置經混合鹼基及/或去氧肌苷殘基取代(Batzer MA等人，Nucleic Res 1991；19：5081；Ohtsuka E等人，J Biol Chem 1985；260：2605-2608；及Rossolini GM等人，Mol Cell Probes 1994；8：91-98)。

術語「基因」意指參與產生多肽鏈之DNA區段。其可包括在編碼區之前及之後之區域(前導序列及尾曳序列)以及個別編碼區段(外顯子)之間之間插序列(內含子)。

如本文所用術語「基因座(locus)」或其複數形式「基因座(loci)」係具有橫跨基因體之變異之任何長度之核苷酸(或鹼基對)之位置或地址。

術語「測序標籤」(亦稱為序列讀段)係指自核酸分子之全部或一部分(例如DNA片段)獲得之序列。在一個實施例中，僅對片段之一個末端進行測序，例如約30個鹼基。然後可將測序標籤與參照基因體比對。或者，可對片段之兩個末端進行測序以生成兩個測序標籤，其可在比對中提供更高準確度且亦提供片段長度。在另一實施例中，線性DNA片段可藉由例如連接來成環，且可對跨越連接位點之部分進行測序。

術語胎兒DNA分數濃度可與術語胎兒DNA比例及胎兒DNA分數互換使用，且係指存於源自胎兒及/或胎盤之母體血漿或血清樣品中之DNA分子之比例(Lo YMD等人Am J Hum Genet 1998；62：768-775；Lun FMF等人Clin Chem 2008；54：1664-1672)。

術語「大小曲線」大體上係指生物樣品中DNA片段之大小。大小曲線可為直方圖，其提供各種大小之DNA片段之量的分佈。可使用各個統計學參數(亦稱為大小參數或合理參數)來區分一種大小曲線與另一種大小曲線。一個參數係特定大小或大小範圍之DNA片段相對於所有DNA片段或相對於DNA片段另一大小或範圍之百分比。

如本文所用術語「參數」意指描述定量資料集之數值及/或定量資料集之間之數值關係。舉例而言，第一核酸序列之第一量與第二核酸序列之第二量之間之比率(或比率函數)係參數。

如本文所用術語「分類」係指與樣品之特定性質相關之任何數量或其他特徵(包括詞語)。舉例而言，「+」符號可表示，樣品分類為具有缺失或擴增(例如，加倍)。術語「截止值」及「臨限值」係指用於操作中之預定數量。舉例而言，截止大小可係指排除高於其之片段之大小。臨限值可為高於或低於其適用特定分類之值。該等術語中之任一者可用於該等情況中之任一者中。

「非造血組織來源」係指除血液系統以外之任何器官。實例包括肝、肺、心臟、腦、非造血癌症、胎盤等。

術語「核DNA」係指源自細胞核之DNA。「核基因體」對應於源自細胞核之核DNA。「粒線體基因體」對應於源自細胞粒線體之DNA。

術語「癌症等級」可係指是否存在癌症、癌症階段、腫瘤大小、涉及多少染色體區域之缺失或擴增(例如加倍或三倍)及/或癌症嚴重度之其他量度。癌症等級可為數量或其他特徵。該等級可為零。癌症等級亦包括與缺失或擴增相關之惡變前或癌前狀況。

術語「SLE等級」可係指患者(或生物體)是否患有SLE、患者所呈現之症狀程度或患者特定器官或全身之SLE進展。SLE等級可為定量(即，由數量表示或落到數值尺度上)或定性。SLE等級可與疾病之已確立度量相關或由其表示，例如全身性紅斑狼瘡疾病活動指數(SLEDAI)或特定組織中之抗DNA抗體效價。SLEDAI係分數之實例。SLE等級亦可對應於患者經分選或篩分至其中之組，如下文所論述(即，靜止、輕度活動及中度/高度活動)。

10‧‧‧電腦系統

71‧‧‧輸入/輸出控制器

72‧‧‧系統記憶體

73‧‧‧中央處理器

74‧‧‧印表機

75‧‧‧系統匯流排

76‧‧‧監測器

77‧‧‧輸入/輸出埠

78‧‧‧鍵盤

79‧‧‧儲存器件

81‧‧‧外部介面

82‧‧‧顯示器轉接器

85‧‧‧資料收集器件

圖1係顯示組織類型及每個細胞中之相應粒線體數量之表100。

圖2顯示根據本發明實施例胎盤及血球之與粒線體基因體比對之DNA片段之分數(MtDNA%)之圖200。

圖3顯示根據本發明實施例未懷孕及懷孕樣品(第一個三個月及第三個三個月)之血漿MtDNA%之圖300。

圖4顯示根據本發明實施例第一個三個月與第三個三個月懷孕之間之血漿MtDNA%差異之圖400。

圖5顯示根據本發明實施例血沉棕黃層(BC)、絨毛膜絨毛取樣(CVS)及胎盤(第三個三個月)中之粒線體DNA百分比(MtDNA%)之圖500。

圖6係顯示根據本發明實施例血漿樣品中粒線體DNA分數與胎兒DNA分數之間之正相關之圖600。

圖7係顯示根據本發明實施例第一個三個月懷孕之胎兒DNA分數與血漿粒線體DNA百分比之間之相關性之圖700。

圖8顯示根據本發明實施例用於確定血漿中粒線體DNA分數與胎兒DNA分數之間之函數關係之訓練資料之圖800。

圖9顯示根據本發明實施例針對基於與Y染色體比對之血漿DNA片段分數量測之胎兒DNA分數繪製之自粒線體DNA分數推論之胎兒DNA分數之圖900。

圖10係顯示根據本發明實施例第一個三個月樣品中血漿DNA大小比率與血漿MtDNA%之間之相關性之圖1000。

圖11係圖解說明根據本發明實施例分析懷有胎兒之女性個體之生物樣品以估計生物樣品中之胎兒DNA濃度之方法1100之流程圖。

圖12顯示HCC腫瘤組織、腫瘤周圍非惡性肝組織及血球樣品之平均粒線體DNA百分比(MtDNA%)之圖式1200。

圖13顯示根據本發明實施例健康個體、B型肝炎病毒(HBV)個體、硬化症患者及HCC患者之血漿MtDNA%之圖1300。

圖14係顯示根據本發明實施例用於區別HCC患者與健康對照之血漿粒線體DNA分數之診斷準確度之接受者操作特徵(ROC)曲線之圖1400。

圖15顯示根據本發明實施例健康個體及NPC(鼻咽癌)患者之血漿MtDNA%之圖1500。

圖16顯示根據本發明實施例針對腫瘤組織中粒線體DNA之分數濃度與腫瘤大小之乘積繪製之血漿中之粒線體DNA分數之圖1600。

圖17顯示根據本發明實施例結腸直腸癌患者及患有肝轉移之結腸直腸癌患者之血漿MtDNA%之圖1700。

圖18顯示健康個體(黑色)、HBV攜帶者(黃色)、硬化症患者(藍色)及HCC患者(紅色)中之循環粒線體DNA之大小曲線。顯示1名健康對照個體之循環核DNA之大小曲線以供比較(虛線)。

圖19係圖解說明根據本發明實施例分析生物體之生物樣品以使用生物樣品中粒線體DNA之量確定生物體之癌症等級之分類之方法1900之流程圖。

圖20係顯示根據本發明實施例不同組之間血漿樣品中屬粒線體DNA(MtDNA)之序列讀段百分比之圖式2000。

圖21係顯示根據本發明實施例血漿樣品中MtDNA之序列讀段百分比對SLEDAI之圖2100。

圖22係顯示根據本發明實施例血漿樣品中MtDNA之序列讀段百分比對抗ds DNA抗體含量之圖2200。

圖23係顯示根據本發明實施例各個組之血漿樣品中MtDNA之序列讀段百分比之圖式2300。

圖24係圖解說明根據本發明實施例分析生物體之生物樣品以使用MtDNA之量確定生物體中自體免疫疾病等級之分類之方法2400之流程圖。

圖25係顯示根據本發明實施例各個組之粒線體DNA(MtDNA)之大小分佈之圖2500。

圖26係圖解說明根據本發明實施例分析生物體之生物樣品以使用MtDNA大小確定生物體中自體免疫疾病等級之分類之方法2600之流程圖。

圖27係圖解說明根據本發明實施例分析懷有胎兒之女性個體之生物樣品以估計源自非造血組織來源之生物樣品中之DNA濃度之方法2700之流程圖。

圖28顯示可用於根據本發明實施例之系統及方法之實例電腦系統10之方塊圖。

實施例已鑑別血漿DNA之關鍵來源為造血來源。因此，可將血漿DNA視為懷孕女性血漿中造血DNA加其他來源之臨床相關DNA(例如胎兒(胎盤)DNA)與癌症患者血漿中之腫瘤DNA之組合。下文結果顯示，可使用與核DNA分子之量相比之生物樣品中粒線體DNA分子之量來估計樣品中之胎兒DNA分數。此外，可確定來自非造血組織來源之DNA百分比。

在一些實施例中，DNA分子之隨機測序可提供用於針對參照核基因體及參照粒線體基因體二者之定位程序中之序列讀段。DNA分子係粒線體DNA或核DNA可基於序列讀段定位之位置來確定。樣品中粒線體DNA之相對量可自定位序列讀段來確定。實施例可使用相對量精確地確定癌症等級，如下文所示。此外，可使用粒線體DNA之相對量來確定腫瘤大小與每一腫瘤細胞內之粒線體DNA之量的乘積。

此外，根據下文結果，亦可使用生物樣品中粒線體DNA分子與核DNA分子之量相比之相對量精確地確定生物體之自體免疫疾病等級。此外，可使用粒線體DNA分子之大小分佈之統計值來確定生物體之自體免疫疾病等級，例如全身性紅斑狼瘡等級。

I.細胞中之粒線體

每一細胞中粒線體之數量在不同組織之間可顯著變化，此乃因不同細胞類型可具有不同粒線體數量。粒線體產生能量且不同細胞所需能量之量不同。粒線體基因體為16kb。

因此，細胞中粒線體DNA及核DNA之相對豐度在不同組織中有所不同。血漿及血清包括源自體內各個組織之細胞之無細胞粒線體DNA及核DNA。可存在改變源自某些細胞之無細胞DNA之量之狀況。舉例而言，懷孕導致無細胞胎盤(胎兒)DNA存在於血漿或血清中。作為另一實例，腫瘤可導致更多來自受影響組織之DNA存在於樣品中。

來自特定組織之其他無細胞DNA(或在胎盤情形中之新DNA)可由於每一細胞中粒線體之數量之差異而引起樣品中粒線體DNA(MtDNA)之量之變化。因此，對血漿(或血清)中粒線體DNA之絕對及分數濃度之定量分析可用於反映因不同生理或病理狀況所致增加或減少之組織器官之DNA貢獻。

圖1係顯示組織類型及每個細胞中之相應粒線體數量之表100。欄110列示各種組織。欄120列示每個細胞之粒線體數量及偏差。如可見，粒線體之數量顯著改變。大多數組織類型之粒線體多於血球，但胃組織之粒線體少於血球。

可使用對血漿中粒線體DNA分數之定量分析來偵測其他癌症類型，前提係癌症組織中粒線體DNA及核DNA之相對豐度不同於(高於或低於)血球。對於其中粒線體DNA低於血球之組織，可觀察到血漿中之較低粒線體分數。假定每一含有核DNA之約一個集合，則粒線體DNA及核DNA之相對豐度主要由細胞中之粒線體數量支配。

II.對懷孕女性血漿中胎兒DNA之分數濃度之分析

胎兒源DNA存於懷孕女性之無細胞血漿中(Lo等人Lancet 1997；350：485-7)。母體血漿樣品中胎兒DNA之分數濃度(亦稱為胎兒DNA分數(F%))係支配各種基於母體血漿DNA之分析之非侵入式出生前測試之準確度之重要參數，例如在染色體非整倍體之非侵入式出生前測試中(Chiu等人BMJ 2011；342：c7401)。一些實施例提供經由對母體樣品中粒線體DNA之定量分析確定母體血漿樣品中胎兒DNA之分數濃度之方法。儘管提供血漿之實例性結果，但實施例可使用包括粒線體DNA片段之其他樣品(例如，血清或尿液)。

A.不同組織之血漿MtDNA%

在健康個體中，造血系統中之細胞係血漿中循環無細胞DNA之主要來源(Lui等人，Clin Chem 2002；48：421-427)。在懷孕女性中，胎盤將DNA釋放至母體循環中。胎盤源DNA攜帶胎兒之遺傳資訊且在非侵入式出生前測試領域中一般稱為「胎兒DNA」。因此，胎兒DNA涵蓋胎盤源DNA及源自胎兒之任何其他DNA。對胎盤及血球中之粒線體及核DNA實施分析作為量測技術及與表100中資料之一致性之檢查。

為確定胎盤及血球中粒線體及核DNA之相對豐度，使用Illumina HiSeq系列測序儀對4名懷孕女性之胎盤組織及相應血球樣品進行測序。根據QIAamp DSP DNA血液微型套組之血液及體液方案自血沉棕黃層樣品提取基因體DNA。用QIAamp DNA微型套組(Qiagen)自胎盤組織提取DNA。用Covaris S220集中式超音波發生器將5微克基因體DNA剪切至約200bp。然後用末端配對樣品製備套組(Illumina)構築DNA樣品之測序庫。使用Illumina HiSeq系列測序儀對每一樣品之測序庫進行測序。對來自DNA片段之兩個末端中之每一者之75個核苷酸進行測序。藉助短寡核苷酸比對程式2(SOAP2)(Li等人，Bioinformatics 2009；25：1966-7)以末端配對模式分析末端配對測序資料。對於每一末端配對讀段，將來自每一末端之75bp與包含非重複遮蔽(non-repeat-masked)之參照人類核基因體(hg19)及人類粒線體基因體二者之參照序列進行比對。對於每一末端之比對容許至多2個核苷酸失配。使用定位至組合之人類核及粒線體基因體之獨特位置之讀段進行下游分析。確定每一樣品之與粒線體基因體比對之DNA片段之分數(比例)(表示為MtDNA%)。

圖2顯示根據本發明實施例胎盤及血球之與粒線體基因體比對之DNA片段之分數(MtDNA%)之圖200。每一資料點對應於胎盤或紅血球之特定組織樣品中為粒線體DNA之DNA之百分比(MtDNA%)。如自表100所預期，胎盤組織樣品通常具有較高MtDNA%。

由於胎盤中之較高粒線體DNA分數，胎盤源胎兒DNA之分數濃度將影響懷孕女性血漿中粒線體DNA之濃度(絕對或分數)。預期較高胎兒DNA分數與母體血漿中粒線體DNA之較高濃度相關。粒線體DNA之絕對濃度仍依賴於樣品中DNA之已知濃度，且因此仍具有分數/百分比態樣。舉例而言，已知血漿樣品中DNA之量具有特異性 DNA濃度。因此，假定新樣品具有已知濃度，則可使用粒線體DNA之絕對濃度。

圖3顯示根據本發明實施例未懷孕及懷孕樣品(第一個三個月及第三個三個月)之血漿MtDNA%之圖300。對來自4個未懷孕女性血漿樣品、59個第一個三個月懷孕血漿樣品及10個第三個三個月懷孕血漿樣品之DNA片段進行測序。未懷孕女性之平均血漿MtDNA%為0.0009%；第一個三個月為0.0017%；且第三個三個月為0.0012%。第一個三個月樣品顯著高於未懷孕女性樣品(曼-懷特尼測試(Mann Whitney test)，p值=0.017)及第三個三個月樣品(曼-懷特尼測試，p值=0.054)。因此，可見到，懷孕病例中血漿樣品中MtDNA之比例高於未懷孕女性個體。

圖4顯示根據本發明實施例第一個三個月與第三個三個月懷孕之間之血漿MtDNA%差異之圖400。第一個三個月懷孕之血漿粒線體DNA%高於未懷孕(見圖3)及第三個三個月懷孕樣品。第一個三個月胎盤細胞中之粒線體DNA含量通常高於第三個三個月胎盤細胞(見圖5)，由此產生第一個三個月樣品之較高量測值。

圖5顯示根據本發明實施例血沉棕黃層(BC)、絨毛膜絨毛取樣(CVS)及胎盤(第三個三個月)中之粒線體DNA百分比(MtDNA%)之圖500。CVS係在第一個三個月中獲取。量測並比較血沉棕黃層、CVS及胎盤中之MtDNA%。血沉棕黃層、CVS及胎盤之平均MtDNA%分別係：0.073%、0.189%及0.07%。CVS之MtDNA%顯著高於血沉棕黃層(曼-懷特尼測試，p值=0.001)及胎盤(T-測試，p值=0.008)二者，而胎盤與血沉棕黃層無顯著差異。量測第三個三個月之胎盤。因此，血漿MtDNA%之差異可藉由組織MtDNA%來解釋。

上文資料指示，尤其在第三個三個月之前，樣品中MtDNA之量與胎兒DNA濃度有關，此乃因已知具有較高胎兒DNA濃度之樣品之 MtDNA較高。以下部分提供更具體資料，其顯示，MtDNA%與胎兒DNA濃度成比例。

B.與F%成比例之MtDNA%

由於胎盤細胞之每個細胞中具有更多粒線體且胎盤係母體血漿中胎兒DNA之主要貢獻者，故在血漿樣品中存在胎兒DNA時對血漿樣品之貢獻較高。此外，在胎兒DNA濃度較高時，將存在較高比例之MtDNA。下文證實此關係係真實的。

圖6係顯示根據本發明實施例血漿樣品中粒線體DNA分數與胎兒DNA分數之間之正相關之圖600。每一資料點對應於不同血漿樣品。垂直軸顯示血漿樣品中之MtDNA%。水平軸顯示胎兒DNA分數(濃度)。對於此資料，使用來自男性胎兒之染色體Y來確定胎兒DNA分數。正相關係R=0.51(Pearson相關性)且信賴度為P<0.001。因此可見，可使用MtDNA%來估計胎兒DNA分數。可使用其他技術來確定胎兒DNA分數。另一實例係使用父系遺傳之遺傳標記，例如單核苷酸多型性或簡單串聯重複多型性或插入-缺失多型性。另一實例係使用後生標記，例如在胎兒與母體DNA之間經不同甲基化之區域(Poon等人，Clin Chem 2002；48：35-41；Chiu等人，Am J Pathol 2007；170：941-950；Chan等人，Clin Chem 2006：52：2211-2218；美國專利6,927,028)。可使用熟習此項技術者已知之方法分析上文標記，包括聚合酶鏈式反應(PCR)、數位PCR、測序、大量平行測序及靶向式大量平行測序。

為獲得圖6之資料，使用Illumina HiSeq 2500系統對182名各懷男性胎兒之懷孕女性之血漿樣品進行測序。對於每一懷孕女性，使用自2.5mL至4mL血漿提取之DNA用於使用TruSeq DNA樣品製備套組(Illumina,Inc)建構測序庫。測序係以12-叢(plex)格式實施。換言之，將12個樣品之條碼測序庫加載至測序用Illumina流動槽之一個泳道中。在測序後，藉由樣品特異性條碼來鑑別每一樣品之測序讀段。使用單末端方案進行測序。對於每一測序DNA片段，對36個核苷酸進行測序。使用SOAP2程式將測序資料與包含非重複遮蔽之參照人類核基因體(hg19)及人類粒線體基因體二者之參照序列進行比對。使用定位至人類核或粒線體基因體之獨特位置之讀段進行下游分析。計算每一樣品中與粒線體基因體比對之DNA片段之分數(表示為MtDNA%)。如先前所述，基於與Y染色體比對之DNA片段之分數來確定胎兒DNA分數(Chiu等人，BMJ 2011；342：c7401)。由於在粒線體基因體與核基因體之間有相當同源性，故使用更嚴格之定位準確度要求將最初定位至粒線體基因體之所有測序讀段與組合之核及粒線體基因體進一步再比對。

來自圖3之資料亦顯示血漿MtDNA%與胎兒DNA濃度F%之間之相關性。在一些實施例中，自染色體Y序列之比例計算胎兒DNA分數(F%)可如下實施。對於懷有男性胎兒之案例，胎兒DNA分數(F%)可自與染色體Y比對之讀段之比例(ChrY%)來推論。極小比例之來自懷女性胎兒之懷孕女性之測序讀段錯誤比對於染色體Y上(Chiu等人，2008)。因此，來自男性胎兒懷孕血漿之ChrY%係由錯誤比對(misaligned)讀段及源自男性胎兒之真讀段組成。為推論F%，可使用以下方程式：ChrY%=[ChrY%_男性×F%]-[ChrY%_女性×(1-F%)]

ChrY%_男性係在含有100%男性DNA之血漿樣品中在染色體Y上比對之讀段之比例，而ChrY%_女性係在含有100%女性DNA之血漿中在染色體Y上比對之讀段(錯誤比對讀段)之比例。可自對照樣品確定ChrY%_男性及ChrY%_女性。

圖7係顯示根據本發明實施例第一個三個月懷孕之胎兒DNA分數與血漿粒線體DNA百分比之間之相關性之圖700。自來自圖3之59個第一個三個月血漿樣品量測F%及血漿MtDNA%。在樣品之血漿MtDNA%與F%之間存在正相關(p值=0.0006；R²=0.189)。因此，已顯示，MtDNA%始終與胎兒分數濃度F%相關。

C.使用MtDNA%量化F%

由於血漿中胎兒DNA分數與粒線體DNA分數之間之相關性，可使用血漿粒線體DNA分數之量化來量測母體血漿樣品中之胎兒DNA分數。因此，可使用MtDNA%來確定胎兒DNA分數。益處在於，無需區別胎兒DNA與母體DNA即可計算MtDNA%。且可使用單末端測序，與末端配對測序相反，其將在使用DNA片段之大小來確定胎兒DNA濃度時使用。因此，測序成本可藉由使用單末端測序而降低。

為測試預測胎兒DNA濃度之能力，將圖6中所用之所有182個血漿樣品隨機分為兩個集合，即訓練集合及驗證集合。使用訓練集合來確定血漿粒線體DNA分數與胎兒DNA分數之關係。然後，在驗證集合中，基於自訓練集合確定之公式使用粒線體DNA分數來推論胎兒DNA分數。

圖8顯示根據本發明實施例用於確定血漿中粒線體DNA分數與胎兒DNA分數之間之函數關係之訓練資料之圖800。對於訓練集合，如下確定粒線體DNA分數與胎兒DNA分數之間之關係(校正函數)

MtDNA%=F%×0.0001226335+0.001141848%

其中MtDNA係血漿樣品中之粒線體DNA分數(%)；且F係樣品中之胎兒DNA分數(%)。對於驗證集合，根據公式使用每一樣品之粒線體DNA分數來推論樣品中之胎兒DNA分數。

圖9顯示根據本發明實施例針對基於與Y染色體比對之血漿DNA片段分數量測之胎兒DNA分數繪製之自粒線體DNA分數推論之胎兒DNA分數之圖900。所推論及所量測之胎兒DNA分數顯示良好相關性(R=0.61,P<0.001,Pearson相關性)。自所量測值推論之值之中值偏差為5.1%(四分位距：2.6%至8.2%)。

因此，可確定校正函數，其提供樣品中MtDNA濃度與胎兒DNA濃度之間之關係。在自新個體獲得新樣品時，可量測MtDNA濃度，且可使用校正函數將MtDNA濃度轉化為胎兒DNA濃度。MtDNA濃度可為分數濃度或相對濃度，但絕對濃度仍將基於典型DNA濃度假定某一分數表示。作為實例，絕對濃度可表示為每體積之量(例如，假定總DNA/mL之特定濃度)或每ng DNA之量，該二者皆涉及核DNA之某一量度。

在各個實施例中，血漿中粒線體DNA之濃度可藉由例如但不限於以下方法來量測：即時PCR(Chiu等人，Clin Chem 2003；49：719-726)、數位PCR(Lo等人，Proc Natl Acad Sci USA 2007；104：13116-13121)及質譜(Ding等人，Proc Natl Acad Sci USA 2004；101：10762-10767)。舉例而言，可使用用於MtDNA及核(nDNA)二者之引子及探針來量測各別量，且可取比率。作為另一實例，引子可靶向核及粒線體基因體中之同源區域，且可使用探針或質譜來區分二者，以獲得各別量。作為另一實例，可使用僅量測粒線體DNA之引子及探針來確定MtDNA之量，其中該量可相對於添加至反應之總DNA之量(大部分係核DNA)(例如，藉由分光光度法量測)或添加至反應之樣品體積來表示。每毫升母體血漿內所含之總DNA(大部分係核DNA)通常存在多個範圍。因此，可使用DNA總量(例如，每體積或每質量)來獲得MtDNA濃度。在其他實施例中，粒線體DNA及核DNA之絕對濃度之量測可分開實施然後合併以獲得MtDNA對核DNA之相對量。然後可基於該兩個濃度(例如但不限於該兩個值之比率或差異)推論胎兒DNA濃度。

MtDNA%與胎兒DNA分數相關之其他證據可藉由MtDNA%與核DNA片段大小相關之相關性來見到。核DNA片段大小與胎兒DNA分數之間之相關性先前已顯示於美國專利公開案2013/023743中，其係全文以引用方式併入。

圖10係顯示根據本發明實施例第一個三個月樣品中血漿DNA大小比率與血漿MtDNA%之間之相關性之圖1000。使用來自圖3之59個第一個三個月血漿樣品。發現血漿MtDNA%與大小比率顯著相關(p值<0.0001,R²=0.35)。在此實例中，如下確定血漿DNA大小曲線：

P(100-150)係母體及胎兒之長度介於100bp與150bp之間之核DNA片段之比例。P(163-169)係長度介於163bp與169bp之間之DNA片段之比例。

使用此一大小比例來確定胎兒DNA濃度之缺點在於，不得不實施末端配對測序。另一方面，甚至可在無對兩個末端進行測序之額外測序成本之情況下用單末端測序獲得MtDNA%。

D.方法

如上文所述，實施例可確定生物樣品中為粒線體DNA之複數個DNA分子之量並基於所確定量估計樣品中之胎兒DNA濃度。該量可為生物樣品中為粒線體DNA之複數個DNA分子之比例。在其他實施例中，該量可為MtDNA濃度，例如每單位體積，例如mL之濃度。在一個實施例中，可使用即時PCR來確定MtDNA之絕對濃度並使用如針對MtDNA百分比所顯示之類似函數逼近來確定胎兒DNA濃度。

圖11係圖解說明根據本發明實施例分析懷有胎兒之女性個體之生物樣品以估計生物樣品中之胎兒DNA濃度之方法1100之流程圖。在一些實施例中，生物樣品可為血漿或血清。生物樣品包括來自女性個體及胎兒之無細胞DNA。生物樣品之無細胞DNA包括粒線體DNA及核DNA。

在一個實施方案中，可在機器(例如測序機)處接收生物樣品，該機器輸出可用於確定DNA片段係核DNA或粒線體DNA之量測資料(例如，序列讀段)。方法1100可完全或部分用電腦系統來實施，如同本文所述之其他方法一般。

在方塊1110，在電腦系統接收生物樣品中複數個DNA分子之序列資訊。作為實例，針對其獲得序列資訊之DNA分子之數量可為至少500,000。可分析此DNA分子數量用於本文所述之其他方法。

序列資訊可以多種方式來獲得。舉例而言，可作為對應於特測序列之探針之特定顏色之單一量測來接收DNA分子之序列。在其他實施例中，可自每一鹼基之測序量測(例如每一鹼基之強度信號)確定DNA分子之序列。在一個實施方案中，使用轉接蛋白對DNA分子進行隨機測序。

在方塊1120，對於生物樣品中複數個DNA分子中之每一者，確定DNA分子係核DNA分子或粒線體DNA分子。可使用DNA分子之序列資訊在參照核基因體或參照粒線體基因體中確定DNA分子之位置。若確定DNA分子定位於參照核基因體中，則將DNA分子鑑別為核DNA。若確定DNA分子定位於參照粒線體基因體中，則將DNA分子鑑別為粒線體DNA。若以足夠準確度確定DNA分子並非僅定位於參照核基因體或參照粒線體基因體中，則可丟棄DNA分子，且其將因此不包括於所分析之複數個DNA分子中。

作為確定DNA片段(分子)之位置之一部分，可對DNA片段進行測序以獲得序列讀段，且可將序列讀段定位(比對)至參照核基因體或參照粒線體基因體。若生物體係人類，則參照基因體將係潛在地來自特定亞群體之參照人類基因體。作為另一實例，可用不同探針分析無細胞DNA片段(例如，在PCR或其他擴增後)，其中每一探針對應於不同位置。在一些實施例中，對無細胞DNA片段之分析可藉由接收對應於該等無細胞DNA片段之序列讀段或其他實驗資料然後使用電腦系統分析實驗資料來實施。

在方塊1130，量測經鑑別為粒線體DNA之複數個DNA分子之正規化量。粒線體DNA之量可以多種方式來確定。舉例而言，可計數粒線體DNA片段之數量。作為另一實例，可計數粒線體DNA片段中之鹼基數量。

該量可以多種方式正規化。舉例而言，可使用總可用DNA分子(即，已針對其實施鑑別之分子)藉由除粒線體DNA分子之量來正規化。在始終使用相同數量之可用DNA分子時出現相同結果。另一實例係粒線體DNA分子之量與核DNA分子之量之比率。因此，正規化量可係相對於包括鑑別為核DNA分子之DNA分子之複數個DNA分子之第二量。作為實例，第二量可屬核及粒線體DNA分子或僅屬核DNA分子。可計算第一量與第二量之比率以獲得正規化量。

在一個實施例中，正規化量係血漿粒線體DNA百分比。可如下實施血漿粒線體DNA百分比(血漿MtDNA%)計算。血漿粒線體DNA百分比(血漿MtDNA%)可對應於獨特地定位於粒線體DNA基因體上之讀段之比例。其反映血漿中之粒線體DNA貢獻，且可如下來計算：

因此，在一個實施例中，複數個DNA分子之正規化量對應於生物樣品中粒線體DNA之比例。可確定為粒線體DNA之複數個DNA分子之第一量，且可確定經鑑別為核DNA之DNA分子之第二量。可作為確定正規化量之一部分來計算第一量與第二量之比率(例如，上文所示百分比)，例如，可應用乘性因子，例如100%縮放。

在其他實施例中，正規化量可為MtDNA之濃度，例如每單位體積、例如mL或每質量/重量之DNA之濃度。在僅針對參照粒線體基因體(例如，使用MtDNA特異性探針)確定複數個DNA分子之位置之實施例中，所有其位置經確定之複數個DNA分子將係粒線體DNA。在該等實施例中，例如使用探針量測經鑑別為粒線體DNA之複數個DNA分子之第一量。且可例如如上所述量測生物樣品中之DNA總量(包括核DNA之DNA總量)。正規化量將使用第一量與總量之比率以獲得MtDNA對包括經鑑別為核DNA分子之DNA分子之複數個DNA分子之第二量(例如，總量)之相對量。

在方塊1140，獲得校正函數，其指定粒線體DNA濃度與胎兒DNA濃度之間之關係。校正函數之實例係上文中之函數：MtDNA%=F%×0.0001226335+0.001141848%。此函數提供每一F%值之MtDNA%值。重排此函數提供每一MtDNA%值之F%值：

此一校正函數可藉由自記憶體讀取0.0001226335及0.001141848(係數之實例)來獲得。

校正函數係以多種方式來定義，例如定義為指定函數(例如線性或非線性函數)之複數個係數。其他實施例可儲存複數個校正資料點(例如，校正函數之資料點)以使得可生成校正函數。此外，可在該等校正資料點之間實施內插以獲得校正函數。不管如何定義校正函數，可自記憶體檢索該等值。

可自校正樣品確定校正資料點且因此確定校正函數，如上所述。該等校正樣品之實例包括用於圖6及圖7之資料。在該等樣品中，已知胎兒DNA分數，且因此可將該等樣品視為校正樣品。可量測其胎兒DNA分數為已知之該等樣品中每一者之正規化量。然後可藉由例如實施最小平方線性擬合或使用另一度量之線性擬合來確定校正函數。可使用任何適宜迴歸分析。

因此，校正函數可使用來自其他懷孕女性之複數個其他樣品中之每一者之值來獲得。可在其他樣品中量測胎兒DNA濃度之第一值，其中胎兒DNA濃度之量測將不使用粒線體DNA之鑑別。該等技術之實例提供於上文中。可使用自其他樣品獲得之其他序列資訊量測為粒線體DNA之複數個DNA分子之正規化量之第二值。可確定每一樣品之來自第一值及第二值之二維資料點，例如如圖6及7中。可實施二維資料點之迴歸分析以獲得校正函數。

在方塊1150，基於所量測量使用校正函數來估計生物樣品中之胎兒DNA濃度。舉例而言，使用上文實例性校正函數，正規化量可為至校正函數之輸入變量，該校正函數輸出胎兒DNA分數。在其他實施例中(例如，其中將校正函數定義為資料點之集合)，可在正規化量毗鄰所測試之正規化量之兩個校正資料點之間使用內插。內插函數可提供胎兒DNA分數。

III.癌症偵測

亦可使用粒線體DNA之量測來偵測並監測癌症。一些實施例可實施樣品中無細胞DNA片段之大量平行測序以獲得序列讀段，可將該等序列讀段定位至參照核基因體及參照粒線體基因體。可使用所定位讀段來量測樣品中為粒線體DNA之DNA片段之比例/百分比(正規化量之實例)。如下文所示，在以此方式確定正規化量時，下文結果顯示，正規化量在確定癌症等級中提供高準確度。此外，該等結果與腫瘤存在於其中之組織中之粒線體DNA含量一致。

大量平行測序可提供以下優點：(1)可訊問多個部分或接近整個粒線體基因體；(2)可使用生物資訊學方式排除與核基因體序列同源之粒線體基因體區域；(3)可分析短於彼等通常使用基於PCR之分析所偵測序列之序列；及(4)可使用相同分析量測核及粒線體序列之相對量。

A.腫瘤及血液組織之MtDNA%

分析可在血液樣品中發現之某些組織(包括造血(血液)細胞)之粒線體DNA含量。如上文針對母體樣品所論述，血漿樣品(或具有無細胞DNA之其他混合物)中深層組織之粒線體DNA含量影響樣品中之總體粒線體DNA含量。

為分析粒線體DNA含量，使用肝細胞癌HCC。對12名患有HCC之患者之所切除腫瘤組織及腫瘤周圍非惡性組織進行測序。測序係如上所述使用Illumina HiSeq系列測序儀來實施。對於每一欲測序DNA片段之兩個末端中之每一者，對75個核苷酸進行測序。使用SOAP2程式實施與包括參照人類核及粒線體基因體之參照序列(hg19)之末端配對比對。

圖12顯示HCC腫瘤組織、腫瘤周圍非惡性肝組織及血球樣品之平均粒線體DNA百分比(MtDNA%)之圖式1200。鬚狀物表示量測之標準偏差。與血球相比較，HCC腫瘤組織及腫瘤周圍非惡性肝組織具有顯著較高之粒線體DNA分數(對於兩個組，P<0.001，Student t-測試)。

圖式1200顯示，腫瘤肝組織及非惡性肝組織具有相當之MtDNA%。由於肝向血漿中貢獻粒線體DNA(MtDNA)，相對於無腫瘤存在時，額外腫瘤組織將向血漿中添加更多DNA。由於HCC腫瘤組織中之粒線體DNA分數值高於血球中，腫瘤源DNA在HCC患者血漿中之存在將導致血漿中之粒線體DNA濃度相對於核DNA而增加。

B.血漿中之MtDNA%

分析具有不同肝病況之不同個體之血漿以闡釋實施例使用粒線體DNA含量區別癌症與其他肝病況之能力。具體而言，使用大量平行測序分析90名HCC患者之血漿。分析來自67名患有慢性HBV感染之個體、36名患有HBV相關硬化之個體及32名健康個體之血漿樣品作為對照。

圖13顯示根據本發明實施例健康個體、HBV個體、硬化症患者及HCC患者之血漿MtDNA%之圖1300。觀察到在HCC患者中血漿粒線體DNA分數與所有三組對照相比有所升高(P<0.001,Student t-測試)。HCC患者及健康個體之血漿中粒線體DNA之中值分數濃度分別為0.0014%及0.00045%(P值<0.0001,曼-懷特尼測試)。粗線顯示中值。盒之上邊界及下邊界顯示四分位距(即，介於25%與75%之間)。鬚狀物顯示第10及第90百分位數。其他圖使用類似符號。

圖1300顯示，可精確地區別患有HCC之個體與健康個體及患有其他肝病況之個體。因此，藉由大量平行測序對血漿粒線體DNA之定量分析可用作HCC之標記。如上文所論述，可以多種方式量測相對於核DNA較高之MtDNA含量以提供用於區別癌症患者之正規化量。使用ROC曲線分析進一步闡釋用於區別HCC患者與健康對照之血漿粒線體DNA分數之診斷準確度。

圖14係顯示根據本發明實施例用於區別HCC患者與健康對照之血漿粒線體DNA分數之診斷準確度之接受者操作特徵(ROC)曲線之圖1400。曲線下面積為0.93。此指示，血漿中之粒線體DNA分數可用於偵測HCC。

在0.00084%之截止值下，如藉由ROC曲線之頂部左手側點所確定，達成80%之敏感性及94%之特異性用於區別HCC患者與健康個體。在與健康個體相比時，在HBV攜帶者(P值=0.32,曼-懷特尼測試)或肝硬化患者(P值=0.49,曼-懷特尼測試)之間未觀察到粒線體DNA之分數濃度之顯著差異。

圖15顯示根據本發明實施例健康個體及NPC(鼻咽癌)患者之血漿MtDNA%之圖1500。NPC(鼻咽癌)患者血漿中粒線體DNA之分數濃度係健康個體之兩倍高。此NPC資料進一步顯示，可使用MtDNA%來區別患有癌症之個體與未患癌症之個體。可基於圖(如圖1500)選擇適宜臨限值用於此一區別。舉例而言，0.003之臨限值可提供高特異性及相對較少之偽陽性。此一臨限值係基於參照樣品(在此案例中係健康個體)之參照值之實例。

現在論述使用與參照值相比之MtDNA之正規化量之其他實例。該比較可確定該量是否在統計學上不同於(例如，高於或低於)參照值。在參照值對應於來自參照樣品之值時，可使用差異之臨限值(例如對應於差異之標準偏差為3)，如在群體中所見之值的分佈中所見。

MtDNA之正規化量可藉由用與MtDNA基因體比對之序列讀段數量除以可與任一基因體比對之序列讀段之總數量來計算。此正規化量使得可將一個樣品之結果與另一樣品之結果相比較。舉例而言，正規化量可為序列讀段之比例(例如，百分比或分數)，其中對於健康個體或患有癌症之個體，參照值係預期來自MtDNA基因體之值。但多種其他正規化係可能的，如熟習此項技術者可瞭解。舉例而言，可藉由用MtDNA序列讀段之數量除以核序列讀段之數量或藉由始終使用相同數量之序列讀段來正規化。然後可將此正規化量與臨限值相比較，該臨限值可自一或多個未展現癌症之參照樣品確定。

在一些實施例中，臨限值可為參照值。在其他實施例中，該比較可包括參照值及臨限值。舉例而言，該比較可包括正規化量與參照值之間之分離值(例如，比率或差異)，且可將該分離值與臨限值相比較以觀察是否存在統計上顯著之差異。

在一個實施例中，該比較係藉由使用以下方程式計算z-分數來實施：z-分數=(病例之正規化量-平均值)/S.D.，其中「平均值」係參照樣品之平均正規化量；且S.D.係參照樣品之正規化量之標準偏差。因此，z-分數可對應於所測試病例之正規化量遠離一或多個參照個體之平均正規化量之標準偏差數量。可將此z-分數與臨限值相比較。

C.腫瘤大小

正規化量之量值可藉由若干個因素來確定。一個因素係腫瘤組織之MtDNA含量及生物樣品(例如血漿)中腫瘤源DNA之分數濃度。腫瘤組織之較高MtDNA含量增加腫瘤釋放之無細胞MtDNA之量。若腫瘤組織之MtDNA含量高於血球，則MtDNA對核DNA之相對量將增加。且在腫瘤組織之MtDNA含量高於血球時，樣品(例如血漿)中腫瘤源DNA之分數濃度愈高，所測試病例之正規化量愈大。

為分析正規化量之變化，量測具有腫瘤之患者之血漿MtDNA%，該腫瘤之大小及組織類型已經由例如手術來確定。亦量測該組織類型之腫瘤中之MtDNA濃度。

圖16顯示根據本發明實施例針對腫瘤組織中粒線體DNA之分數濃度與腫瘤大小之乘積繪製之血漿中之粒線體DNA分數之圖1600。觀察到正相關性(R=0.55,Pearson相關性)。因此，給定腫瘤組織之MtDNA%之增加對應於腫瘤大小之增加。

此關係可用於尤其在治療後監測疾病進展。對於特定患者，腫瘤組織中之粒線體DNA分數將相同。因此，血漿中粒線體DNA分數之連續變化將可用於反映腫瘤大小。因此，實施例可基於粒線體DNA之血漿分數濃度隨時間追蹤腫瘤大小。

圖1600中之函數係校正函數之另一實例。在此實例中，在已知來源組織中之MtDNA含量時校正函數可提供腫瘤大小。腫瘤大小係癌症等級之分類之實例。上文針對校正函數之論述亦適用於此實例及本文所述之其他迴歸分析。

另外，由於腫瘤大小與腫瘤DNA分數成比例，故可基於給定腫瘤之粒線體DNA分數確定腫瘤DNA分數。舉例而言，可量測具有不同腫瘤大小之患者之參照樣品之腫瘤DNA分數。然後，一旦得知腫瘤之組織類型並藉由例如成像方法(如CT掃描)估計腫瘤大小，可立即使用血漿中之MtDNA%確定腫瘤DNA分數。

除了偵測及監測原發性癌症外，亦可應用對血漿中粒線體DNA之分析以偵測轉移癌症。轉移癌症可在轉移器官中引起顯著組織破壞。舉例而言，轉移至肝之結腸直腸癌可引起肝組織之顯著破壞。由於肝組織之粒線體DNA分數高於血球及結腸直腸組織二者，故血漿中粒線體DNA之升高可用於指示肝中轉移疾病之存在。

圖17顯示根據本發明實施例結腸直腸癌患者及患有肝轉移之結腸直腸癌患者之血漿MtDNA%之圖1700。結腸直腸癌伴肝轉移個體之血漿中之粒線體DNA分數濃度係無轉移結腸直腸癌之2.2倍大。因此，可使用約0.0025之臨限值來區別患有結腸直腸癌之患者與患有結腸直腸癌伴肝轉移之患者。基於本揭示內容，熟習此項技術者將能確定用於區別其他癌症與轉移之其他臨限值。

因此，在一些實施例中，若患者患有一種類型之癌症，且然後正規化量急劇顯著增加，則可鑑別該癌症已轉移至每個細胞具有較高粒線體之組織。舉例而言，在結腸組織中僅存在約150個MtDNA拷貝。因此，在無肝轉移之情況下，MtDNA之增加不會過大。然而，由於肝中顯著較高之MtDNA含量，肝之參與將可能導致顯著較高之血漿MtDNA含量。

D.癌症粒線體DNA之大小曲線

懷疑粒線體DNA由於其亦未在組織蛋白周圍纏繞而較短。因此，MtDNA將經受較大降解及酶裂解壓力，且因此較短。由於任一個別個體之所測序粒線體DNA片段之數量相對較小，彙集來自同一組中之所有個體之所測序粒線體DNA片段已獲得經彙集大小曲線。

循環核DNA顯示在166bp處具有主峰之特徵性大小模式。此模式可能係由於結合至核DNA之組織蛋白防止酶降解之結果。在循環粒線體DNA之大小分佈中未觀察到此模式。亦觀察到粒線體DNA之大小分佈短於血漿中之核DNA。

可基於細胞中粒線體之平均數量以及一個粒線體中粒線體DNA之已知長度(即，16kb)確定樣品中粒線體DNA之預期量。對於健康個體，血漿中粒線體DNA之所量測量低於預期量(即，基於多個粒線體中粒線體DNA之長度)。對於癌症患者，所量測量較預期量高一個數量級。

在健康個體中，血漿粒線體DNA之中值分數濃度為僅0.00045%。慮及粒線體基因體之大小係核基因體大小之0.00053%且每個細胞有50至4,000個粒線體，此分數濃度相對較低(Kelly RD等人，Mito-chondrial DNA copy number is regulated in a tissue specific manner by DNA methylation of the nuclear-encoded DNA polymerase gamma A.Nucleic Acids Res 2012；40(20)：10124-10138；及Mengel-From J等人，Mitochondrial DNA copy number in peripheral blood cells declines with age and is associated with general health among elderly.Hum Genet 2014；133(9)：1149-1159)。

循環粒線體DNA之較小大小分佈及相對較低豐度可能係由於粒線體DNA因缺乏組織蛋白保護而對降解有較高敏感性所致。如上所述，與健康個體相比，在HCC患者血漿中粒線體DNA之濃度較高。此可能係由於HCC細胞或肝細胞與造血細胞相比通常粒線體數量較高所致，在健康個體中造血細胞係循環DNA之主要來源(Kelly RD等人，(2012)；Mengel-From J等人(2014)；及Lui YYN等人，Predominant hematopoietic origin of cell-free DNA in plasma and serum after sex- mismatched bone marrow transplantation.Clin Chem 2002；48(3)：421-427)。

此外，對於癌細胞，有更多粒線體DNA。若癌症患者中有較高比例之粒線體DNA，則DNA(核及粒線體)之總體大小將較小。因此，癌症患者之較高比例之粒線體DNA將影響總體大小曲線。但由於MtDNA在血漿中之穩定性遠低於核DNA，故來自MtDNA之序列讀段之實際量極低。由於腫瘤DNA之縮短程度更深且腫瘤DNA分數高於MtDNA分數，故腫瘤DNA分數對總體大小曲線具有更大影響。

循環粒線體DNA分子之大小分佈可影響使用某些技術偵測MtDNA之準確度。如圖18中所示，循環粒線體DNA分子片段化至低於150bp。PCR之靈敏度取決於靶片段之大小。模板DNA愈短，則固定之PCR引子可跨越整個DNA分子並偵測其之機率愈低。與之相比，在大量平行測序中，通常將測序引子添加至靶分子之末端。因此，所測序分子之機率較少受到DNA分子之較短大小曲線之不良影響，由此提供一致且正確之結果。

E.方法

圖19係圖解說明根據本發明實施例分析生物體之生物樣品以使用生物樣品中粒線體DNA之量確定生物體之癌症等級之分類之方法1900之流程圖。生物樣品包括源自正常細胞及潛在地源自癌症相關細胞之無細胞DNA分子。生物樣品之無細胞DNA包括粒線體DNA及核DNA。作為實例，生物樣品可為血漿或血清。

在方塊1910，在電腦系統處接收來自生物樣品中複數個DNA分子之測序之序列讀段。測序可為DNA分子之隨機測序，例如測序可使用轉接蛋白來實施。其他實施例可使用引子之隨機集合(例如完備集合)以使得所有序列皆具有匹配引子。可使用隨機六聚體之完整集合。

在方塊1920，對於生物樣品中複數個DNA分子中之每一者，確定DNA分子係核DNA或粒線體DNA。可使用DNA分子之序列讀段在參照核基因體或參照粒線體基因體中確定DNA分子之位置。在一個實施方案中，可嘗試將相應序列讀段定位至參照核基因體及參照粒線體基因體。在一個實例中，僅使用獨特地定位之讀段。

在將DNA分子定位至參照核基因體及參照粒線體基因體之嘗試中，實施例可使用一或多個第一準則實施第一定位程序用於確定與參照粒線體基因體之第一比對。一或多個第一準則可指定容許失配之數量、容許匹配之位置之數量及是否所有參照基因體皆用於定位。在一個實施例中，定位DNA分子使用參照核基因體及參照粒線體基因體之至少大部分。

對於基於第一定位程序確定與參照粒線體基因體比對之每一序列讀段，可使用較一或多個第一準則更嚴格之一或多個第二準則實施定位至參照核基因體及參照粒線體基因體之第二定位程序。在一個實施方案中，僅在對於第一及第二定位程序序列讀段定位至粒線體基因體時，該序列讀段貢獻至正規化量。舉例而言，一或多個第二準則可包括，序列讀段定位至參照粒線體基因體上之獨特位置及/或失配少於第一定位程序中所容許。而第一定位程序可容許更多失配及/或更多匹配位置。一或多個第二準則亦可包括，序列讀段與參照粒線體基因體比對且失配少於與參照核基因體之第二比對。定位時之初次通過可較快以鑑別用於MtDNA之潛在序列讀段，然後在序列讀段潛在地與MtDNA比對後僅花費更多計算時間。

在一些實施例中，在第一定位程序未鑑別與參照粒線體基因體之潛在比對時，將序列讀段計為對應於核DNA。以此方式，僅MtDNA必須明確定位至參照核基因體與參照粒線體基因體二者。因此，由於在粒線體基因體與核基因體之間有相當同源性，所有初始定位至粒線體基因體之經測序讀段可使用定位準確度之更嚴格要求與組合之核及粒線體基因體再比對。可實施此一技術用於本文所述之任一方法。

在方塊1930，量測經鑑別為粒線體DNA之複數個DNA分子之正規化量。方塊1930可以類似於方法1100之方塊1130之方式來實施。因此，正規化量可係相對於包括經鑑別為核DNA分子之DNA分子之複數個DNA分子之第二量。作為實例，第二量可屬核及粒線體DNA分子或僅屬核DNA分子。

對於大量平行測序，可自相同數量之粒線體基因體生成顯著更多之靶。對於PCR，僅偵測粒線體基因體上之單一靶或少數靶。假定粒線體基因體片段化為150bp之片段，則一個粒線體基因體將片段化為106個片段。此較高靶分子數量將轉換成量化之較佳靈敏度及精密度。

在方塊1940，將正規化量與參照值相比較。作為實例，參照值可為針對正常樣品確定之臨限值。如上文所提及，該比較可包括基於正規化量及參照值確定z-分數(或其他差異或比率，或其函數)及將結果與臨限值相比較。在其他實施例中，例如若z-分數中之其他值向方程式之另一側移動，則參照值可包括臨限值。

在方塊1950，基於該比較確定生物體中癌症等級之分類。作為實例，分類可包括癌症呈陽性、癌症呈陰性或不確定。可使用一個以上參照值來確定何種分類適用。舉例而言，參照值可存在用於區別兩個分類中之任一者。

分類之其他實例可包括腫瘤大小(圖16)或癌症階段，例如癌症是否已轉移(圖17)。因此，可自校正函數(例如，校正資料點)確定參照值以確定大小分類。在一個實例中，與所量測正規化量最接近之校正值可為參照值。在腫瘤位於MtDNA含量少於血球之組織中時，可在正規化量小於臨限值時偵測癌症。以此一方式，可基於正規化量高於或低於臨限值排除不同組織作為腫瘤來源。

根據上文說明，可使用MtDNA豐度之臨限值來區分HCC患者與正常個體。臨限值可自健康正常個體之組建立。在一個實例中，使用16名健康正常個體基於平均值及標準偏差(SD)來確定正常參照範圍。認為高於健康對照平均值之兩個SD指示血漿中粒線體DNA之顯著過表現。為使彼等因同源區域而可定位至人類核及粒線體基因體二者之不明確讀段之影響降至最低，將粒線體及人類基因體編譯在一起以形成單一資料庫。僅使用獨特地與粒線體基因體比對之讀段進行下游分析。藉由使粒線體及人類基因體可同時用於比對，源自同源區域之DNA片段將可與組合基因體之一個以上區域比對。在僅選擇獨特地與組合基因體中之僅一個位置比對之DNA片段或序列讀段時，丟棄彼等源自同源區域之DNA分子。使用此方法，在特異性為93%時達成80%之敏感性。另一方面，在序列資料唯一地與包括同源區域之粒線體基因體比對時，在特異性為93%時敏感性僅為51%。

IV.使用粒線體DNA之自體免疫偵測

粒線體DNA(MtDNA)亦可用於偵測自體免疫疾病，例如全身性紅斑狼瘡(SLE)。鑒於經攻擊細胞通常將具有高於血球之MtDNA濃度，對於自體免疫疾病亦見到血漿中之升高MtDNA含量。

A.SLE

全身性紅斑狼瘡(SLE)係自體免疫疾病因免疫系統對機體之「自體攻擊」而引起且導致發炎及組織損傷。與其他自體免疫疾病(例如多發性硬化及1型糖尿病)不同，SLE被視為原型性全身性自體免疫疾病。其具有影響包括皮膚、肌肉、骨骼、肺、腎、心血管及中樞神經系統在內之多個器官系統之潛力。

SLE之特徵在於免疫自身耐受性之損失及自體抗體之產生。使用 SLE患者之血清抗雙鏈(ds)DNA抗體效價作為評價疾病活動之血清學方式。然而，約30% SLE患者即使在活動階段期間對此測試亦呈陰性。

與SLE相關之細胞死亡之加速及死細胞副產物清除率之降低可生成細胞外DNA並改變SLE患者循環中DNA之特徵。另外，SLE之發病機制中所涉及之其他機制(例如DNA酶活性之缺乏及針對DNA之自體抗體之過量產生)亦可改變循環DNA之完整性。如下文所示，SLE之免疫失調可改變SLE患者樣品(例如，血漿)中之MtDNA%。

B.使用MtDNA%確定等級

圖20係顯示根據本發明實施例不同組之間血漿樣品中屬粒線體DNA(MtDNA)之序列讀段百分比之圖式2000。不同患者組包括對照患者、非活動性SLE患者及活動性SLE患者。存在11名對照患者、15名非活動性SLE患者及9名活動性SLE患者。非活動性LSE患者之全身性紅斑狼瘡疾病活動指數(SLEDAI)為0-6(Bombardier等人，Derivation of the SLEDAI.A disease activity index for lupus patients.The Committee on Prognosis Studies in SLE.Arthritis Rheum 1992,35：630-640)。活動性LSE患者之SLEDAI大於6。

活動性SLE組之平均MtDNA百分比分別為對照(P=0.0057)及非活動性SLE(P=0.0148)之4.2倍高及3倍高。因此，可例如使用0.04之臨限值或藉由接受者操作特徵曲線分析或其他適宜技術鑑別之其他截止值區別活動性SLE患者與對照及非活動性患者，如熟習此項技術者將得知。亦針對SLEDAI及抗ds DNA抗體含量分析相同資料。

圖21係顯示根據本發明實施例血漿樣品中MtDNA之序列讀段百分比對SLEDAI之圖2100。有11個對照樣品顯示為SLEDAI為零。圖2100顯示血漿中粒線體DNA之序列讀段百分比與SLEDAI之間之相關性，且Spearman’s R=0.56且P=0.0048。在確定相關性值中僅使用 SLE病例。

可基於MtDNA%使用線性擬合(或其他校正函數)來確定SLEDAI值。可儲存校正函數並以與本文所述之其他校正函數類似之方式來確定。以此方式，可使用MtDNA%來估計SLE之嚴重度等級。較高MtDNA%將指示較高SLE嚴重度等級。

圖21亦顯示，可使用0.02之臨限值來區別健康患者與SLE患者。在一些實施例中，可使用SLEDAI及MtDNA%，其中可經由不涉及MtDNA%之無關過程確定SLEDAI。舉例而言，為增強特異性，可將MtDNA%及SLEDAI與各別臨限值相比較以確定是否二者皆升高。可使用二者皆升高之準則來確定自體免疫疾病是否存在或確定嚴重度。因此，在一些實施方案中，在任一者升高時可鑑別自體免疫疾病之存在，但除非二者皆升高，否則不鑑別為嚴重。可使用MtDNA%來鑑別自體免疫疾病之存在，且使用SLEDAI來確定嚴重度。為增強敏感性，實施例可在任一者升高之情況下鑑別自體免疫疾病之存在。滿足此準則(即任一者升高)之臨限值可高於二者皆需升高之情況。對於MtDNA%及SLEDAI二者可使用不同臨限值以確定不同嚴重度等級。

圖22係顯示根據本發明實施例血漿樣品中MtDNA之序列讀段百分比對抗ds DNA抗體含量之圖2200。已顯示抗ds DNA抗體含量與SLE相關(Isenberg等人，Detection of cross-reactive anti-DNA antibody idiotypes in the serum of systemic lupus erythematosus patients and of their relatives.Arthritis Rheum 1985；28：999-1007)。圖2200顯示血漿中粒線體DNA之序列讀段百分比與抗ds DNA抗體含量之間之相關性，且Spearman’s R=0.71且P<0.0001。在確定相關性值中使用所有SLE病例。如可見，在活動性與非活動性SLE之間，抗體含量並非始終有區別。使用抗體含量與MtDNA%之組合可幫助區別，例如具有1000抗體含量之活動性SLE病例具有較高MtDNA%。舉例而言，可使用約0.055之臨限值。因此，對於不同抗體含量(或含量範圍)，可選擇並使用不同MtDNA%臨限值以提高準確度。

圖23係顯示根據本發明實施例各個組之血漿樣品中MtDNA之序列讀段百分比之圖式2300。在圖式2300中，AB對應於抗ds DNA抗體含量。各個組係對照組(無SLE)、AB500之組及AB>500之組。如可見，AB>500之樣品之平均MtDNA%高於對照及AB500之組。因此，MtDNA%可以與抗體含量類似之方式有區別，亦如圖22中所示。且可使用兩種標記之組合。

C.方法

圖24係圖解說明根據本發明實施例分析生物體之生物樣品以使用MtDNA之量確定生物體中自體免疫疾病等級之分類之方法2400之流程圖。生物樣品包括無細胞DNA。生物樣品之無細胞DNA包括粒線體DNA及核DNA。作為實例，生物樣品可為血漿或血清。

在方塊2410，在電腦系統處接收生物樣品中複數個DNA分子之序列資訊。方塊2410可以與方法1100之方塊1110類似之方式來實施。

在方塊2420，對於生物樣品中複數個DNA分子中之每一者，確定DNA分子係核DNA或粒線體DNA。可使用DNA分子之序列資訊藉由例如實施將序列讀段定位至參照核基因體及參照粒線體基因體之定位程序在參照核基因體或參照粒線體基因體中確定DNA分子之位置。方塊2420可以與方法1100之方塊1120類似之方式來實施。

在方塊2430，量測經鑑別為粒線體DNA之複數個DNA分子之正規化量。方塊2430可以與方法1100之方塊1130類似之方式來實施。因此，正規化量可係相對於包括經鑑別為核DNA分子之DNA分子之複數個DNA分子之第二量。作為實例，該第二量可屬核及粒線體DNA分子或僅屬核DNA分子。

在方塊2440，將正規化量與參照值相比較。作為實例，參照值可為針對正常樣品確定之臨限值。方塊2440可以與方法1900之方塊1940類似之方式來實施。舉例而言，可自圖20-23中所示類型之資料確定參照值。

在方塊2450，生物體中自體免疫疾病等級之分類係基於該比較來確定。測試可係針對具體自體免疫疾病，例如SLE。作為實例，分類可包括自體免疫疾病呈陽性、自體免疫疾病呈陰性或不確定。其他實例可包括自體免疫疾病活動或不活動，如圖20及22。

D.大小

圖25係顯示根據本發明實施例各個組之粒線體DNA(MtDNA)之大小分佈之圖2500。各個組係對照組、非活動性SLE及活動性SLE。

如可見，大小分佈自對照至非活動性SLE變小，且對於活動性SLE甚至更小。可使用此關係基於大小分佈來鑑別患者未患SLE或患有非活動性SLE或活動性SLE。舉例而言，非活動性SLE患者之大小分佈之平均值、中值或模式(峰位置)之統計值相對於健康患者變小，且對於活動性SLE患者甚至更小。可使用多種統計值，例如低於具體大小(例如，70bp)之序列讀段之比例、兩個大小之序列讀段數量之比率(例如，60bp之數量除以90bp之數量)或另外兩種統計值之比率。所有該等統計值皆將顯示至更小大小之位移。適宜統計大小之其他實例可參見美國專利第8,620,593號及美國專利公開案2013/0237431號，二者皆係以引用方式併入。

圖26係圖解說明根據本發明實施例分析生物體之生物樣品以使用MtDNA大小確定生物體中自體免疫疾病等級之分類之方法2600之流程圖。生物樣品包括無細胞DNA。

在方塊2610，在電腦系統處接收生物樣品中複數個DNA分子之序列資訊。方塊2610可以與方法1100之方塊1110類似之方式來實施。

在方塊2620，對於生物樣品中複數個DNA分子中之每一者，使用DNA分子之序列資訊來確定DNA分子在參照粒線體基因體中之位置。由於位置可提供DNA分子係核DNA或粒線體DNA，可僅包括粒線體DNA作為複數個DNA分子之一部分。可使用DNA分子之序列資訊藉由例如實施將序列讀段定位至參照核基因體及參照粒線體基因體之定位程序在參照核基因體或參照粒線體基因體中確定DNA分子之位置。方塊2620可以與本文所述其他定位技術類似之方式來實施。

在方塊2630，使用DNA分子之確定之位置量測DNA分子之大小。獲得DNA分子之大小闡述於Lo等人之標題為「Size-Based Analysis of Fetal DNA Fraction in Maternal Plasma」之美國專利公開案第2013/0237431號中，其內容係出於所有目的以引用方式併入本文中。

在方塊2640，基於確定之位置將DNA分子組鑑別為係粒線體DNA。一旦已鑑別MtDNA分子組，可立即分析該組之大小分佈。該組可包含位置已確定之複數個DNA分子之全部或僅一部分。

在方塊2650，計算粒線體DNA分子組之大小分佈之第一統計值。如上文所提及，可使用多種統計值。在實施例中，第一統計值可藉由在指定大小下計算第一曲線下面積來確定。第一曲線可為MtDNA分子之累積頻率在大小範圍中之曲線。在一個實施例中，第一統計值可為MtDNA片段之平均值(average)、平均值(mean)或中值大小。在另一實施例中，第一統計值可包括低於第一大小之片段長度之和，其可為一類截止值。舉例而言，可將每一小於70bp之片段之長度加和。可將該和除以另一數量，例如所有MtDNA片段之長度之和或大於第二大小截止值(其可與第一大小相同)之片段之長度之和。舉例而言，第一統計值可為低於第一大小截止值之片段總長度相對於片段總長度之比率，或小片段之總長度相對於大片段總長度之比率。

在方塊2660，將第一統計值與參照值相比較。在實施例中，參照值可對應於來自一或多個參照樣品(例如健康對照或非活動性SLE患者)之大小分佈之參照統計值。第一參照值可藉由在指定大小下計算參照曲線下面積來確定。參照曲線可為一或多個參照樣品之MtDNA分子之累積頻率在大小範圍中之曲線。在各個實施例中，可使用來自多個參照樣品之總大小分佈，或可組合來自不同大小分佈之單獨值以提供單一參照值。

在方塊2670，生物體中自體免疫疾病等級之分類係基於該比較來確定。分類之實例包括無自體免疫疾病、非活動性自體免疫疾病及活動性自體免疫疾病。可比較第一統計值與參照值以獲得分離值，可將該分離值與臨限值(截止值)相比較以確定分類。在一個實施例中，分離值可為第一統計值與參照值之間之差異。在另一實施例中，分離值可為第一統計值對參照值之比率。

分離值可為使用以下方程式計算之測試樣品與一或多個參照樣品之間之短MtDNA片段之比例之差異：

其中表示來自測試樣品之大小150bp之經測序 MtDNA片段之比例，且表示來自一或多個參照樣品之大小 150bp之經測序MtDNA片段之比例。在其他實施例中，可使用其他大小臨限值，例如但不限於100bp、110bp、120bp、130bp、140bp、160bp及166bp。在其他實施例中，大小臨限值可以鹼基、或核苷酸、或其他單位來表現。

可將分離值與一或多個截止值相比較。可將分離值與兩個截止值相比較以確定該分離值是否在特定範圍內。該範圍可包括一個截止值以確定是否存在非正常資料點(例如存在自體免疫疾病)，且可使用第二截止值來確定該資料點是否係針對自體免疫疾病之活動性或非活動性狀態。

在一些實施例中，可將第一統計值與複數個參照值相比較以確定自體免疫疾病等級之分類。舉例而言，在第一統計值大於第一參照值(例如0.055，如針對圖22所提及)時，可將自體免疫疾病確定為活動性。在第一統計值小於第一參照值且大於第二參照值(例如，0.18，參照圖20及22)時，可將自體免疫疾病確定為非活動性。在第一統計值小於第二參照值時，可將自體免疫疾病確定為不存在。

V.非造血組織

不同細胞類型含有不同數量之粒線體DNA。若有組織中每個細胞含有之粒線體DNA之量高於造血細胞之平均值，則在該血漿樣品含有自該另一組織釋放之DNA時見到血漿粒線體DNA%之上升。舉例而言，圖5顯示，絨毛膜絨毛細胞(第一三個月胎盤組織)之粒線體DNA含量高於血沉棕黃層，此解釋圖3中第一三個月樣品中之較高血漿MtDNA%。此外，在癌症患者中見到較高MtDNA%。因此，可使用樣品中MtDNA之正規化量來估計源自非造血組織來源之生物樣品中之DNA濃度。且在偵測到升高MtDNA%時，可鑑別一些非造血組織中之細胞死亡(例如，表示某一病理)。

圖27係圖解說明根據本發明實施例分析懷有胎兒之女性個體之生物樣品以估計源自非造血組織來源之生物樣品中之DNA濃度之方法2700之流程圖。生物樣品包括無細胞DNA。生物樣品之無細胞DNA包括粒線體DNA及核DNA。作為實例，生物樣品可為血漿或血清。

在方塊2710，在電腦系統處接收生物樣品中複數個DNA分子之序列資訊。方塊2710可以與方法1100之方塊1110類似之方式來實施。

在方塊2720，對於生物樣品中複數個DNA分子中之每一者，確定DNA分子係核DNA或粒線體DNA。可使用DNA分子之序列資訊藉由例如實施將序列讀段定位至參照核基因體及參照粒線體基因體之定位程序在參照核基因體或參照粒線體基因體中確定DNA分子之位置。方塊2720可以與方法1100之方塊1120類似之方式來實施。

在方塊2730，量測經鑑別為粒線體DNA之複數個DNA分子之正規化量。方塊2730可以與方法1100之方塊1130類似之方式來實施。因此，正規化量可係相對於包括經鑑別為核DNA分子之DNA分子之複數個DNA分子之第二量。作為實例，該第二量可屬核及粒線體DNA分子或僅屬核DNA分子。

在方塊2740，獲得指定源自非造血組織來源之生物樣品中粒線體DNA濃度與DNA之第二濃度之間之關係之校正函數。方塊2740可以與方法1100之方塊1140類似之方式來實施。

在方塊2750，基於正規化量使用校正函數來估計生物樣品中之第二濃度。方塊2750可以與方法1100之方塊1150類似之方式來實施。

在各個實施例中，非造血組織來源可包括肝、肺、心臟、腦、非造血癌症或胎盤。舉例而言，可隨時間監測DNA之第二濃度以追蹤腫瘤大小，例如如針對圖16所論述。因此，可藉由確定腫瘤細胞中粒線體DNA之分數濃度及基於腫瘤細胞中粒線體DNA之分數濃度確定腫瘤大小來追蹤腫瘤大小。

VI.胎兒分析之材料及方法

下文係用於胎兒分析之一些實例性技術。其他實施例可使用不同技術。

對於血漿及血沉棕黃層樣品之製備，將末梢血樣品在4℃下以1,600g離心10min(離心機5810 R,Eppendorf)。在此第一輪離心後，透明上層係血漿部分，將其轉移至2mL離心管中並在4℃下以16,000g再離心10min(離心機5417 R,Eppendorf)(Chiu等人2001)。血沉棕黃層係中間層且將其轉移至1.5mL離心管中，在室溫下以2,500g再離心5min(微量離心機Z 233 M-2,Hermle)以移除任何殘留血漿。將無細胞血漿及血沉棕黃層二者皆在-80℃下儲存於微量離心管中。

對於血漿DNA提取，遵循具有一些修改之製造商之真空方案用QIAamp DSP DNA血液微型套組(Qiagen)提取血漿DNA。將每一400μL血漿與40μL蛋白酶及400μL緩衝液AL混合。將混合物在56℃下培育20min。將400μL冰冷無水乙醇與溶解物充分混合。使溶解物流經QIAamp Mini旋轉管柱。每一管柱與不超過2mL所施加血漿一起使用。在經由管柱抽出溶解物後，藉由600μL緩衝液AW1洗滌其，之後藉由緩衝液AW2洗滌。在洗滌步驟後將管柱以16,000g旋轉3min以移除所有殘留洗滌緩衝液。將70μL去離子水添加至每一管柱並在室溫下培育5min。然後將管柱以16,000g離心1min以溶析DNA。將所提取DNA儲存於-30℃下用於後續實驗。

對於自血沉棕黃層提取基因體DNA，基因體DNA係遵循血液或體液旋轉方案使用QIAamp DNA血液微型套組(Qiagen)自血沉棕黃層提取。對於每一樣品，將400μL血沉棕黃層與40μL蛋白酶及400μL緩衝液AL混合。將混合物在56℃下培育20min。在培育後，將400μL冰冷無水乙醇與溶解物充分混合。然後將600μL溶解物施加至QIAamp Mini旋轉管柱並在室溫下以6,000g離心1min。重複此程序直至所有溶解物流經管柱。然後藉由600μL緩衝液AW1及AW2洗滌管柱。在洗滌後，將管柱以16,000g離心3min以移除所有殘留洗滌緩衝液。最後，將80μL去離子水添加至管柱並在室溫下培育5min。藉由將管柱以16,000g離心1min來溶析基因體DNA。

對於自絨毛膜絨毛取樣(CVS)及胎盤組織提取基因體DNA，使用QIAamp DNA微型套組(Qiagen)自CVS及胎盤組織提取基因體DNA。使用具有少量修改之自組織旋轉純化DNA之方案。將胎盤及CVS組織用磷酸鹽緩衝鹽水(PBS)洗滌兩次並切成小片。將每一樣品與360μL緩衝液ATL及40μL蛋白酶K在56℃及溫和振盪下混合5小時培育直至整個組織被消化。添加400μL緩衝液AL並在70℃下培育15min。之後添加400μL冷無水乙醇用於DNA沈澱。然後使反應混合物流經QIAamp Mini旋轉管柱。相應地添加600μL洗滌緩衝液AW1及AW2。在洗滌步驟後將管柱以16,000g離心3min以移除所有殘留洗滌緩衝液。在洗滌步驟後將管柱以16,000g離心3min以移除所有殘留洗滌緩衝液。最後，分別在100μL及30μL去離子水中溶析來自胎盤及CVS之DNA。

對於基因體DNA量化，使用NanoDrop 2000分光光度計(Thermo Scientific)藉由量測在260nm及280nm下吸光度之比率(260/280)對所提取基因體DNA進行量化。

對於基因體DNA超音波處理，將5μg基因體DNA稀釋至130μL超純水中並遵循製造商說明書藉由S220集中式超音波發生器(Covaris)超音波處理至大小範圍為100-300bp，之後繼續進行庫製備。

對於血漿DNA庫製備，血漿DNA庫係藉由使用用於末端配對方案之KAPA庫製備套組(Kapa Biosystems)來製備。末端修復反應係用85μL血漿DNA、10μL 10×末端修復緩衝液、5μL末端修復酶混合物實施之第一步驟。最終反應混合物體積為100μL。在20℃下培育30min後，遵循製造商說明書藉由使用MinElute反應清理套組(Qiagen)純化反應混合物並溶析於31μL EB緩衝液中。溶析產物為30μL末端修復之DNA，將其與5μL 10×A-曳尾緩衝液、3μL A-曳尾酶及12μL超純水混合以產生總計50μL反應混合物。將混合物在30℃下培育30min且之後使用MinElute反應清理套組(Qiagen)純化。用31μL緩衝液EB溶析A-曳尾DNA並繼續進行轉接蛋白連接。將30μL A-曳尾DNA與10μL 5×連接緩衝液、5μL DNA連接酶、1μL DNA轉接蛋白(PE multiplex,15μM)及4μL超純水混合用於50μL反應。將反應物在20℃下培育15min且之後使用MinElute反應清理套組(Qiagen)純化。將 DNA溶析於23μL EB緩衝液中以供隨後之PCR擴增。PCR富集反應混合物包括22μL轉接蛋白連接之DNA、25μL 2×KAPA HiFi HotStart ReadyMix、500nM PE PCR Primer InPE 1.0,10nM PE PCR Primer InPE 2.0及500nM PCR Primer Index。PCR譜圖法如下：在98℃下DNA變性45sec，14個98℃下15sec、65℃下30sec及72℃下30sec之循環，最後在72℃下延長1min。將PCR產物保持在4℃下直至藉由MinElute PCR純化套組(Qiagen)遵循製造商說明書繼續進行PCR純化為止。最終庫經25μL緩衝液EB溶析且備妥用於DNA庫驗證。

對於基因體DNA庫製備，基因體DNA庫係藉由使用用於末端配對方案之KAPA庫製備套組(Kapa Biosystems)來製備。將1μg超音波處理之基因體DNA稀釋至85μL超純水中。在末端修復反應中，將85μL超音波處理之DNA、10μL 10×末端修復緩衝液、5μL末端修復酶混合物一起添加。最終反應混合物體積為100μL。在20℃下培育30min後，遵循製造商說明書藉由使用MinElute反應清理套組(Qiagen)純化反應混合物並溶析於31μL EB緩衝液中。溶析產物為30μL末端修復之DNA，將其與5μL 10×A-曳尾緩衝液、3μL A-曳尾酶及12μL超純水混合以產生總計50μL反應混合物。將混合物在30℃下培育30min且之後使用MinElute反應清理套組(Qiagen)純化。用31μL緩衝液EB溶析A-曳尾DNA並繼續進行轉接蛋白連接。將30μL A-曳尾DNA與10μL 5×連接緩衝液、5μL DNA連接酶、1μL DNA轉接蛋白(PE multiplex,15μM)及4μL超純水混合用於50μL反應。將反應物在20℃下培育15min且之後使用MinElute反應清理套組(Qiagen)純化。將DNA溶析於23μL EB緩衝液中以供隨後之PCR擴增。PCR富集反應混合物包括22μL轉接蛋白連接之DNA、25μL 2×KAPA HiFi HotStart ReadyMix、500nM PE PCR Primer InPE 1.0、10nM PE PCR Primer InPE 2.0及500nM PCR Primer Index。PCR譜圖法如下：在98℃下DNA 變性45sec，12個98℃下15sec、65℃下30sec及72℃下30sec之循環，最終在72℃下延長1min。將PCR產物保持在4℃下直至藉由MinElute PCR純化套組(Qiagen)遵循製造商說明書繼續進行PCR純化為止。最終庫經25μL緩衝液EB溶析且備妥用於DNA庫驗證。

遵循製造商方案使用具有2100生物分析儀(Agilent)之DNA 1000套組分析庫大小分佈。對於血漿DNA庫，典型大小為290bp。

藉由SYBR Green即時qPCR分析使用KAPA庫量化套組-Illumina/ABI Prism SYBR Green(Kapa Biosystems)在7300即時PCR系統(Applied Biosystems)上對DNA庫進行定量。該套組含有可藉由側接Illumina轉接蛋白序列來擴增DNA庫片段之引子。套組之標準曲線係由介於20pM至0.0002pM範圍內之10倍稀釋液中之6個標準品製得。反應體積為20μL，由4μL標準品或100,000倍稀釋之DNA庫、12μL含有引子預混合物之KAPA SYBR FAST qPCR母液混合物及4μL PCR級水組成。每一樣品係一式兩份實施且包括6個NTC用於污染偵測。PCR譜圖法係95℃下10min；35個95℃下30s及60℃下45s之循環。藉由慮及DNA標準品(452bp)與DNA庫平均大小之間之大小差異，根據此公式計算庫濃度：

對於DNA測序及比對，使用標準末端配對(76bp×2個循環)方案對DNA庫進行測序。在HiSeq 2500或HiSeq 2000測序儀(Illumina)上在多重測序中使用另外7個測序循環解碼每一DNA分子之指標序列。使用短寡核苷酸比對程式2(SOAP2)(soap.genomics.org.cn)應用非重複遮蔽之hg19參照人類基因體(genome.ucsc.edu)用於序列讀段比對。僅使用兩個末端以正確取向與同一染色體比對且跨越=<600bp之插入體大小之末端配對讀段。對於末端配對讀段之每一成員容許具有不超過2個核苷酸失配之讀段。僅使用定位至獨特基因體位置之讀段進行下游分析。

VII.電腦系統

本文所提及之任一電腦系統可利用任何適宜數量之子系統。該等子系統之實例顯示於圖28之電腦系統10中。在一些實施例中，電腦系統包括單一電腦裝置，其中子系統可為電腦裝置之組件。在其他實施例中，電腦系統可包括多個電腦裝置，其各自為子系統，具有內部組件。電腦系統可包括桌上型及膝上型電腦、平板電腦、行動電話及其他移動器件。

將圖28中顯示之子系統經由系統匯流排75互連。顯示其他子系統(例如印表機74、鍵盤78、儲存器件79、耦聯至顯示器轉接器82之監測器76及其他)。可將耦聯至I/O控制器71之外周及輸入/輸出(I/O)器件藉由任一數量之業內已知構件(例如輸入/輸出(I/O)埠77(例如，USB、FireWire^®))連接至電腦系統。舉例而言，可使用I/O埠77或外部介面81(例如乙太網路(Ethernet)、Wi-Fi等)將電腦裝置10連接至廣域網路(例如網際網路)、滑鼠輸入器件或掃描儀。經由系統匯流排75互連容許中央處理器73與每一子系統通訊並控制來自系統記憶體72或儲存器件79(例如，固定磁碟，例如硬驅動器或光碟)之複數個指令的執行以及子系統之間資訊之交換。系統記憶體72及/或儲存器件79可體現電腦可讀媒體。另一子系統係資料收集器件85，例如照相機、麥克風、加速計及諸如此類。本文所提及之任何資料可自一個組件輸出至另一組件且可輸出至使用者。

電腦系統可包括複數個例如藉由外部介面81或藉由內部介面連接在一起之相同組件或子系統。在一些實施例中，電腦系統、子系統或裝置可在網路中通訊。在該等情形中，可將一台電腦視為用戶端並將另一台電腦視為伺服器，其中每一者可係同一電腦系統中之一部分。用戶端及伺服器可各自包括多個系統、子系統或組件。

應理解，本發明之任何實施例可使用硬體(例如應用特異性積體電路或場效可程式閘陣列)及/或以模組或積體方式使用電腦軟體及一般可程式處理器以控制邏輯形式來實施。如本文所用處理器包括同一積體晶片上之單核心處理器、多核心處理器，或單一電路板上之或網路化之多個處理單元。基於本文所提供之揭示內容及教示，熟習此項技術者將得知並瞭解使用硬體及硬體與軟體之組合來實施本發明實施例之其他方式及/或方法。

本申請案中所述之軟體組件或功能中之任一者皆可作為欲使用任一適合電腦語言(例如Java、C、C++、C#、Objective-C、Swift或腳本語言(例如Perl或Python))使用例如習用或物件導向技術藉由處理器執行之軟體代碼來實施。軟體代碼可在用於儲存及/或傳輸之電腦可讀媒體上儲存為一系列指令或命令，適宜媒體包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、磁媒體(例如硬驅動器或軟碟)或光學媒體(例如光碟(CD)或DVD(數位通用磁碟)、快閃記憶體及諸如此類)。電腦可讀媒體可為該等儲存或傳輸器件之任何組合。

該等程式亦可使用適於經由符合多種協定之有線、光學及/或無線網路(包括網際網路)傳輸之載波信號編碼並傳輸。因此，根據本發明實施例之電腦可讀媒體可使用以該等程式編碼之資料信號來產生。以該程式代碼編碼之電腦可讀媒體可用相容器件包裝或與其他器件分開提供(例如，經由網際網路下載)。任何該電腦可讀媒體可駐存於單一電腦產品(例如硬驅動器、CD或整個電腦系統)上或其內，且可存於系統或網路之不同電腦產品上或其內。電腦系統可包括監測器、印表機或用於將本文所提及之任何結果提供給使用者之其他適宜顯示器。

本文所述之任何方法可完全或部分用包括一或多個處理器之電腦系統來實施，該電腦系統可經組態以實施步驟。因此，實施例可係關於電腦系統，其經組態以實施本文所述之任何方法之步驟，潛在地具有實施各別步驟或各別步驟組之不同組件。儘管呈現為經編號步驟，但本文方法之步驟可同時或以不同順序來實施。另外，該等步驟之部分可與其他方法之其他步驟之部分一起使用。同樣，步驟之全部或部分可為可選的。另外，任何方法之任何步驟可用模組、電路或用於實施該等步驟之其他構件來實施。

在不背離本發明實施例之精神及範疇之情況下，特定實施例之具體細節可以任何適宜方式組合。然而，本發明之其他實施例可係關於涉及每一個別態樣或該等個別態樣之具體組合之具體實施例。

出於闡釋及說明之目的，上文已呈現本發明實例性實施例之說明。其並不意欲係窮盡性或將本發明限制於所述之確切形式，且根據上文教示內容可能進行諸多修改及改變。

除非明確指示相反含義，否則列舉「一(a)」、「一(an)」或「該」欲意指「一或多個」。除非明確指示相反含義，否則使用「或」欲意指「包括性或」而非「排除性或」。

本文所提及之所有專利、專利申請案、公開案及說明皆出於所有目的全文以引用方式併入。其皆未被承認為先前技術。

Claims

一種分析懷有胎兒之女性個體之生物樣品以估計該生物樣品中之胎兒DNA濃度之方法，該生物樣品包括來自該女性個體及該胎兒之無細胞(cell-free)DNA，該無細胞DNA包括粒線體DNA及核DNA，該方法包含藉由電腦系統實施：接收該生物樣品中複數個DNA分子之序列資訊；對於該複數個DNA分子中之每一DNA分子：使用該DNA分子之序列資訊確定該DNA分子在參照核基因體或參照粒線體基因體中之位置；基於該位置鑑別該DNA分子係核DNA分子或粒線體DNA分子；量測經鑑別為粒線體DNA分子之該複數個DNA分子之正規化量，該正規化量係相對於包括經鑑別為核DNA分子之DNA分子之該複數個DNA分子之第二量；獲得指定粒線體DNA濃度與胎兒DNA濃度之間之關係之校正函數；及基於該正規化量使用該校正函數估計該生物樣品中之該胎兒DNA濃度。
如請求項1之方法，其中該複數個DNA分子之位置僅針對該參照粒線體基因體確定，因此位置經確定之所有該複數個DNA分子皆係粒線體DNA分子，該方法進一步包含：量測經鑑別為粒線體DNA分子之該複數個DNA分子之第一量；及量測該生物樣品中之DNA總量，該DNA總量係核DNA分子及粒線體DNA分子之總量，該總量對應於該第二量，其中量測該正規化量使用該第一量與該總量之比率。
如請求項1之方法，其中經鑑別為粒線體DNA分子之該複數個DNA分子之正規化量對應於該生物樣品中粒線體DNA之濃度。
如請求項1之方法，其進一步包含藉由該電腦系統實施：確定為粒線體DNA分子之該複數個DNA分子之第一量；藉由計數該等核DNA分子來確定該複數個DNA分子之第二量；及計算該第一量與該第二量之比率，其中使用該比率來確定經鑑別為粒線體DNA分子之該複數個DNA分子之正規化量。
如請求項1之方法，其中該序列資訊包括來自該生物樣品之該複數個DNA分子之測序之序列讀段(sequence reads)，且其中確定該等DNA分子之位置包括：實施將該等序列讀段定位(mapping)至該參照核基因體及該參照粒線體基因體以確定哪些序列讀段位於該參照核基因體上及哪些序列讀段位於該參照粒線體基因體上。
如請求項5之方法，其進一步包含：實施該生物樣品之該複數個DNA分子之測序以獲得該等序列讀段。
如請求項1之方法，其中獲得該校正函數包括自該電腦系統之記憶體檢索該校正函數。
如請求項7之方法，其中該校正函數係作為複數個校正資料點儲存。
如請求項7之方法，其中該校正函數係作為指定函數之複數個係數儲存。
如請求項1之方法，其中獲得該校正函數包括：對於來自其他懷孕女性之複數個其他樣品中之每一者：量測另一樣品中胎兒DNA濃度之第一值，該胎兒DNA濃度之量測不使用粒線體DNA鑑別；使用自該另一樣品獲得之另一序列資訊量測為粒線體DNA分子之該複數個DNA分子之正規化量之第二值；及自該第一值及該第二值確定二維資料點；及對該等二維資料點實施迴歸分析以獲得校正函數。
如請求項1之方法，其中該生物樣品係血漿或血清。
一種分析生物體之生物樣品之方法，該生物樣品包括源自正常細胞及潛在地源自癌症相關細胞之DNA分子，該生物樣品包括無細胞DNA，該無細胞DNA包括粒線體DNA及核DNA，該方法包含：在電腦系統接收來自該生物體之生物樣品中複數個DNA分子之測序之序列讀段；對於該生物樣品中該複數個DNA分子之一部分中之每一者：藉由該電腦系統嘗試將相應序列讀段定位至參照核基因體及參照粒線體基因體來確定該DNA分子在該參照核基因體或該參照粒線體基因體中之位置；藉由該電腦系統基於該位置鑑別該DNA分子係核DNA分子或粒線體DNA分子；藉由該電腦系統量測經鑑別為粒線體DNA分子之該複數個DNA分子之正規化量，該正規化量係相對於包括經鑑別為核DNA分子之DNA分子之該複數個DNA分子之第二量；將該正規化量與參照值比較；及基於該比較確定該生物體中癌症等級之分類。
如請求項12之方法，其中該癌症等級之分類包括是否已發生轉移。
如請求項12之方法，其中將該正規化量與複數個參照值比較以確定該癌症等級之分類。
如請求項14之方法，其中該複數個參照值係提供腫瘤大小作為分類之校正函數之一部分。
如請求項12之方法，其進一步包含藉由該電腦系統實施：確定為粒線體DNA分子之該複數個DNA分子之第一量；藉由計數該等核DNA分子來確定該複數個DNA分子之第二量；及計算該第一量與該第二量之比率，其中使用該比率來確定經鑑別為粒線體DNA分子之該複數個DNA分子之正規化量。
如請求項12之方法，其中嘗試將該等DNA分子定位至該參照核基因體及該參照粒線體基因體包括：使用一或多個第一準則實施第一定位程序用於確定與該參照粒線體基因體之第一比對(alignment)；對於基於該第一定位程序確定與該參照粒線體基因體比對之每一序列讀段：使用較該一或多個第一準則更嚴格之一或多個第二準則實施對該參照核基因體及該參照粒線體基因體之第二定位程序，其中僅在序列讀段於該第一定位程序及該第二定位程序定位至該粒線體基因體時，該序列讀段貢獻(contributes)至該正規化量。
如請求項17之方法，其中該一或多個第二準則包括該序列讀段定位至該參照粒線體基因體上之獨特位置。
如請求項17之方法，其中該一或多個第二準則包括該序列讀段與該參照粒線體基因體比對失配少於與該參照核基因體之第二比對。
如請求項12之方法，其中定位該等DNA分子使用至少大部分之該參照核基因體及該參照粒線體基因體。
如請求項12之方法，其中該癌症係肝細胞癌或鼻咽癌。
如請求項12之方法，其中經鑑別為粒線體DNA分子之該複數個DNA分子之正規化量對應於該生物樣品中粒線體DNA之濃度。
如請求項12之方法，其中該測序係該生物體之生物樣品中該複數個DNA分子之隨機測序。
一種分析生物體之生物樣品之方法，該生物樣品包括無細胞DNA，該無細胞DNA包括粒線體DNA及核DNA，該方法包含：在電腦系統接收該生物樣品中複數個DNA分子之序列資訊；對於該複數個DNA分子中之每一DNA分子：藉由該電腦系統使用該DNA分子之序列資訊確定該DNA分子在參照核基因體或參照粒線體基因體中之位置；藉由該電腦系統基於該位置鑑別該DNA分子係核DNA分子或粒線體DNA分子；藉由該電腦系統量測為粒線體DNA分子之該複數個DNA分子之正規化量，該正規化量係相對於包括經鑑別為核DNA分子之DNA分子之該複數個DNA分子之第二量；將該正規化量與參照值比較；及基於該比較確定該生物體自體免疫疾病等級之分類。
如請求項24之方法，其中確定該分類包括確定該自體免疫疾病係活動性或非活動性。
如請求項24之方法，其中將該正規化量與複數個參照值比較以確定該自體免疫疾病等級之分類。
如請求項26之方法，其中該複數個參照值係提供該自體免疫疾病嚴重度之校正函數之一部分。
如請求項27之方法，其中該自體免疫疾病係全身性紅斑狼瘡(SLE)，且其中該嚴重度係藉由全身性紅斑狼瘡疾病活動指數(SLEDAI)量測。
如請求項27之方法，其中該自體免疫疾病係全身性紅斑狼瘡(SLE)，該方法進一步包含：量測該生物樣品中之抗ds DNA抗體含量，其中該生物體中該自體免疫疾病等級之分類進一步基於該抗ds DNA抗體含量。
如請求項29之方法，其進一步包含：基於該抗ds DNA抗體含量選擇該參照值。
如請求項24之方法，其進一步包含藉由該電腦系統實施：確定為粒線體DNA分子之該複數個DNA分子之第一量；藉由計數該等核DNA分子來確定該複數個DNA分子之第二量；及計算該第一量與該第二量之比率，其中使用該比率來確定經鑑別為粒線體DNA分子之該複數個DNA分子之正規化量。
一種分析生物體之生物樣品之方法，該生物樣品包括無細胞DNA，該無細胞DNA包括粒線體DNA及核DNA，該方法包含：在電腦系統接收該生物樣品中複數個DNA分子之序列資訊；對於該複數個DNA分子中之每一DNA分子：藉由該電腦系統使用該DNA分子之序列資訊確定該DNA分子在參照粒線體基因體中之位置；及藉由該電腦系統使用該DNA分子之確定位置量測該DNA分子之大小；藉由該電腦系統基於該確定位置將一組DNA分子鑑別為粒線體DNA分子；藉由該電腦系統計算該組粒線體DNA分子之大小分佈之第一統計值；將該第一統計值與參照值比較；及基於該比較確定該生物體中自體免疫疾病等級之分類。
如請求項32之方法，其中確定該分類包括基於該比較確定該自體免疫疾病係活動性或非活動性。
如請求項32之方法，其中將該第一統計值與複數個參照值比較以確定該自體免疫疾病等級之分類。
如請求項34之方法，其中在該第一統計值大於第一參照值時將該自體免疫疾病確定為活動性，且其中在該第一統計值小於該第一參照值且大於第二參照值時將該自體免疫疾病確定為非活動性。
如請求項35之方法，其中在該第一統計值小於該第二參照值時確定該自體免疫疾病不存在。
如請求項33之方法，其中該第一統計值包括以下中之至少一者：該組粒線體DNA分子之大小分佈之平均值、中值或模式。
如請求項32之方法，其中該自體免疫疾病係全身性紅斑狼瘡(SLE)。
一種分析生物體之生物樣品之方法，該生物樣品包括無細胞DNA，該無細胞DNA包括粒線體DNA及核DNA，該方法包含藉由電腦系統實施：接收該生物樣品中複數個DNA分子之序列資訊；對於該複數個DNA分子中之每一DNA分子：使用該DNA分子之序列資訊確定該DNA分子在參照核基因體或參照粒線體基因體中之位置；基於該位置鑑別該DNA分子係核DNA分子或粒線體DNA分子；量測經鑑別為粒線體DNA分子之該複數個DNA分子之正規化量；獲得指定該源自非造血組織來源之生物樣品中粒線體DNA濃度與DNA之第二濃度間之關係之校正函數；及使用該校正函數基於該正規化量來估計該生物樣品中該DNA之第二濃度。
如請求項39之方法，其進一步包含藉由該電腦系統實施：隨時間追蹤該DNA之第二濃度以追蹤腫瘤大小。
如請求項40之方法，其進一步包含：確定該腫瘤細胞中粒線體DNA之分數濃度；及基於該腫瘤細胞中粒線體DNA之分數濃度確定該腫瘤大小。
如請求項39之方法，其中該非造血組織來源包括肝、肺、心臟、腦、非造血癌或胎盤。
一種電腦產品，其包含電腦可讀媒體，該電腦可讀媒體儲存複數個指令用於控制電腦系統實施上述方法中任一者之操作。
一種系統，其包含：如請求項43之電腦產品；及一或多個用於執行儲存於該電腦可讀媒體上之指令之處理器。
一種系統，其包含用於實施上述方法中任一者之構件(means)。
一種系統，其經組態以實施上述方法中之任一者。
一種系統，其包含分別實施上述方法中任一者之步驟之模組。