TWI703216B

TWI703216B - Ｄｎａ混合物中之組織甲基化模式分析

Info

Publication number: TWI703216B
Application number: TW104123505A
Authority: TW
Inventors: 慧君趙; 君賜陳; 煜明盧; 江培勇; 孫坤
Original assignee: 香港中文大學
Priority date: 2014-07-18
Filing date: 2015-07-20
Publication date: 2020-09-01
Also published as: ES2890136T3; US20190050528A1; US20240304279A1; TW201617455A; EP3169813A1; WO2016008451A1; HUE056267T2; TW201903158A; TWI813141B; TWI727156B; HK1232256A1; CN106795562A; EP3543356A1; TW202219277A; TW202136521A; TWI758011B; ES2741400T3; DK3543356T3; CN106795562B; US20160017419A1

Abstract

本發明關於使用特定基因組位點之甲基化程度判定不同組織對DNA混合物之貢獻(contributions)。可使用M個組織類型之組織特異性甲基化程度將該DNA混合物中測得之混合物甲基化程度解卷積(deconvolve)以判定該等M個組織類型之各分率貢獻。可選擇各種類型基因組位點以具有跨組織類型及跨個體之特定性質，以在判定各種組織類型之貢獻中提供增高準確度。可使用該等分率貢獻以偵測特定組織之異常貢獻，指示該組織之疾病狀態。亦可使用不同尺寸DNA片段之分率貢獻之差別來識別特定組織之疾病狀態。可偵測特定組織中特定染色體區域之序列失衡，例如識別腫瘤之位置。

Description

DNA混合物中之組織甲基化模式分析

[相關申請案之交叉參考]

本申請案主張以下申請案之優先權且係其非臨時性的：由Chiu等人於2014年7月18日所申請之標題為「Determining the Compositions of a DNA Mixture by Tissue-Specific Methylation Pattern Analysis」之美國臨時申請案第62/026,330號；由Chiu等人於2015年5月7日所申請之標題為「Determining the Compositions of a DNA Mixture by Tissue-Specific Methylation Pattern Analysis」之美國臨時申請案第62/158,466號；及由Chiu等人於2014年6月23日所申請之標題為「Determining the Compositions of a DNA Mixture by Tissue-Specific Methylation Pattern Analysis」之美國臨時申請案第62/183,669號，為了所有目的而將其等全部內容以引用之方式併入本文中。本申請案亦係關於共同擁有之標題為「Non-Invasive Determination Of Methylome Of Fetus Or Tumor From Plasma」之PCT公開案WO2014/043763，為了所有目的而將其等全部內容以引用之方式併入本文中。

已顯示血漿中的無細胞DNA之分析可用於不同診斷目的，包含非侵入性產前測試及癌症偵測。咸信無細胞DNA在血漿中之存在係由於DNA自凋亡細胞釋放(Jahr等人，Cancer Res 2001；61：1659-1665及 Lo等人，Sci Transl Med.2010；2：61ra91.)。在先前研究中，已顯示在健康個體及器官移植受體中造血細胞係血漿DNA之主要來源(Lui YY等人，Clin Chem 2002；48：421-7及Zheng YW等人，Clin Chem 2012；58：549-58)。在此等先前研究中，器官移植模型係用以判定不同器官對血漿DNA之貢獻。在彼等情況下，器官供體與移植受體間之基因差異係用以計算經移植之器官對移植受體之血漿DNA的貢獻。然而，在該模型中，僅可判定經移植之器官之貢獻及不可同時判定該受體之其他器官之貢獻。

此外，甚至對可使用甲基化模式判定其他組織之貢獻之技術，此類技術之準確度未經綜合性檢測，及因此未充分識別準確度之缺陷。而且，已限制判定其他組織之貢獻的應用。

描述實施例以判定不同組織對包含各種組織類型之無細胞DNA分子之混合物之生物樣本的貢獻，例如，如發生於血漿及其他體液中。實施例可分析該DNA混合物之甲基化模式(例如，特定基因組位點之甲基化程度)及判定各種組織類型對該DNA混合物之分率貢獻。可選擇各種類型基因組位點以具有跨組織類型及跨個體之特定性質，以在判定該等各種組織類型之貢獻中提供增高準確度。例如，相對於僅使用對一種組織類型特異之基因組位點，可使用具有至少臨限值量之變異性之基因組位點。

在一些實施例中，可判定可能貢獻於DNA混合物之組織類型(候選組織)之甲基化模式。然後，判定受關注DNA混合物之甲基化模式。例如，可計算各種位點之甲基化程度。由於DNA混合物包括候選組織之DNA，因此可藉由比較該DNA混合物與候選組織類型之甲基化模式判定該DNA混合物之組成。例如，可使用N個基因組位點之甲基化程度以計算M個組織之貢獻，其中M小於或等於N。可計算每個組織之每個位點之甲基化程度。可解方程式Ax=b之線性系統，其中b係N個位點測得之甲基化密度之向量，x係M個組織之貢獻之向量，及A係M行及N列之矩陣，每一行提供該行特定位點之M個組織的甲基化密度。若M小於N，則可進行最小平方最優化。

在各種實施例中，DNA混合物中特定組織類型之貢獻百分率相對於參考值的顯著分離值(即，相減之差或比率)可指示疾病狀態。該參考值可對應於健康個體中判定之貢獻百分率，及分離值大於臨限值可判定疾病狀態，因為病變組織比健康組織釋放更多無細胞DNA分子。

在其他實施例中，可使用兩組無細胞DNA分子(每組係不同之尺寸範圍)之甲基化程度判定組織類型之兩個分率貢獻以識別該組織類型是否病變之類別。兩個分率貢獻間之分離值可與臨限值比較，及可基於該比較判定第一組織類型是否具有疾病狀態之類別。例如，此種技術可藉由測量較短無細胞DNA分子比較長無細胞DNA分子更高的分率貢獻識別釋放較短無細胞DNA分子之病變組織。

在又其他實施例中，可使用兩組無細胞DNA分子(每組係不同染色體區域)之甲基化程度判定組織類型之兩個分率貢獻以識別第一染色體區域是否具有序列失衡之類別。兩個分率貢獻間之分離值可與臨限值比較，及可基於該比較判定第一染色體區域是否具有序列失衡之類別。例如，不同拷貝數之區域將對應於拷貝數畸變之起源之組織類型之不同貢獻百分率，當該組織類型具有畸變腫瘤時可出現。

其他實施例係關於與本文描述之方法相關的系統及電腦可讀媒體。

可參照下文實施方式及隨附圖式更好瞭解本發明之實施例之性質及優勢。

附錄A顯示I型及II型標誌之表S1。

術語

「甲基化組」提供在基因組中之複數個位點或基因座處之DNA甲基化量的量度。該甲基化組可對應於該基因組之所有、該基因組之大部分或該基因組之相對小部分。「胎兒甲基化組」對應於孕婦之胎兒之甲基化組。可使用各種胎兒組織或胎兒DNA來源(包含胎盤組織及母體血漿中之無細胞胎兒DNA)判定胎兒甲基化組。「腫瘤甲基化組」對應於生物(例如，人類)之腫瘤之甲基化組。可使用腫瘤組織或母體血漿中之無細胞腫瘤DNA判定腫瘤甲基化組。胎兒甲基化組及腫瘤甲基化組係受關注之甲基化組的實例。受關注之甲基化組之其他實例係器官之甲基化組(例如，腦細胞、骨、肺、心臟、肌肉及腎臟等之甲基化組)，該等器官可有助於DNA進入體液(例如，血漿、血清、汗液、唾液、尿、生殖器分泌物、精液、糞便液、腹瀉液、腦脊髓液、胃腸道分泌物、腹水、胸腔積液、眼內液、陰囊積水液(例如，睪丸)、囊腫液、胰分泌物、腸分泌物、痰、眼淚、來自乳腺及甲狀腺之抽吸液體等)中。該等器官可係經移植之器官。

「血漿甲基化組」係判定自動物(例如，人類)之血漿或血清之甲基化組。由於血漿及血清包含無細胞DNA，因此血漿甲基化組係無細胞甲基化組之實例。由於血漿甲基化組係胎兒/母體甲基化組或腫瘤/病患甲基化組或衍生自不同組織或器官之DNA之混合物，因此血漿甲基化組亦係混合之甲基化組之實例。「胎盤甲基化組」可判定自絨毛膜絨毛樣本(CVS)或胎盤組織樣本(例如，分娩後獲得)。「細胞甲基化組」對應於判定自病患之細胞(例如，血液細胞)之甲基化組。血液細胞之甲基化組稱為血液細胞甲基化組(或血液甲基化組)。

「位點」對應於單一位點，其可係單一基礎位置或相關性基礎位置之群，例如，CpG位點。「基因座」可對應於包含多個位點之區域。基因座可包含僅一個位點，此使得該基因座相當於該情境中之一位點。

每個基因組位點(例如，CpG位點)之「甲基化指數」係指在該位點顯示甲基化之序列讀段佔涵蓋該位點之讀段總數的比例。區域之「甲基化密度」係於該區域內之顯示甲基化之位點之讀段數量除以該區域內之涵蓋該等位點之讀段總數。該等位點可具有特異性特徵，例如，為CpG位點。因此，區域之「CpG甲基化密度」係顯示CpG甲基化之讀段數量除以該區域中之涵蓋CpG位點(例如，特定CpG位點、CpG島內之CpG位點，或更大區域)之讀段總數。例如，人類基因組中每100-kb小區段(bin)之甲基化密度可測定為於CpG位點之於亞硫酸氫鹽處理後未轉化之胞嘧啶(其對應於甲基化胞嘧啶)總數佔對照至100-kb區域之序列讀段涵蓋之所有CpG位點之比例。亦可對其他小區段尺寸(例如，50-kb或1-Mb等)進行該分析。區域可係整個基因組或染色體或染色體之部分(例如，染色體臂)。當該區域僅包含CpG位點時，該CpG位點之甲基化指數等同於區域之甲基化密度。「甲基化胞嘧啶之比例」係指在該區域中之經分析之胞嘧啶殘基之總數(即，包含在CpG情境外之胞嘧啶)中，顯示為甲基化(例如，亞硫酸氫鹽轉化後未經轉化)之胞嘧啶位點數(「C’s」)之數量。甲基化指數、甲基化密度及甲基化胞嘧啶比例係「甲基化程度」之實例。

「甲基化圖譜」(亦稱為甲基化狀態)包含關於區域之DNA甲基化之資訊。關於DNA甲基化之資訊可包含(但不限於)CpG位點之甲基化指數、區域內之CpG位點之甲基化密度、相鄰區域上之CpG位點之分佈、含有多於一個CpG位點之區域內之每一個別CpG位點之甲基化模式或程度，及非CpG甲基化。可認為大部分基因組之甲基化圖譜相當於甲基化組。哺乳動物基因組中之「DNA甲基化」通常係指在CpG二核苷酸間，甲基加成至胞嘧啶殘基之5’碳上(即，5-甲基胞嘧啶)。在其他情境中，DNA甲基化可發生於胞嘧啶中，例如，CHG及CHH，其中H係腺嘌呤、胞嘧啶或胸腺嘧啶。胞嘧啶甲基化亦可呈5-羥甲基胞嘧啶之形式。亦報告非胞嘧啶甲基化(諸如N⁶-甲基腺嘌呤)。

「組織」對應於相同類型細胞之群。不同類型組織可由不同類型細胞(例如，肝細胞、肺泡細胞或血液細胞)組成，但亦可對應於不同生物之組織(母親對胎兒)或健康細胞對腫瘤細胞。「參考組織」對應於用以判定組織特異性甲基化程度之組織。可使用不同個體之相同組織類型之多個樣本以判定該組織類型之組織特異性甲基化程度。

「生物樣本」係指任何取自個體(例如，人類，諸如孕婦、癌症患者或懷疑患有癌症之人、器官移植受體或懷疑器官患有疾病過程(例如，心臟心肌梗塞或腦中風)之個體)並含有一或多個受關注之核酸分子的樣本。該生物樣本可係體液，諸如血液、血漿、血清、尿、陰道分泌物、陰囊積水液(例如，睪丸)或陰道沖洗液、胸腔積液、腹水、腦脊髓液、唾液、汗液、眼淚、痰、支氣管肺泡灌洗液等。亦可使用糞便樣本。

術語「癌症程度」可係指癌症是否存在；癌症階段；腫瘤尺寸；是否轉移；身體之總腫瘤負擔及/或癌症嚴重性之其他量度。癌症程度可係數字或其他標記，諸如符號、字母及顏色。該程度可係零。該癌症程度亦包含與突變或突變數相關之癌前性(premalignant)或癌前期(precancerous)病症(狀態)。可以各種方式使用該癌症程度。例如，篩選可檢查預先未知患有癌症之某人是否存在癌症。評定可研究已診斷患有癌症之某人以監測癌症隨時間之發展；研究療法之有效性或判定預後。在一個實施例中，該預後可表示為病患死於癌症之機率，或癌症於特定期間或時間後發展之機率，或癌症轉移之機率。偵測可意謂「篩選」或可意謂檢查具有癌症之暗示特徵(例如，症狀或其他陽性測試)之某人是否患有癌症。

術語染色體區域之「序列失衡」意謂染色體區域之無細胞DNA分子之量相對於期望值(若生物係健康的)之任何顯著偏差。例如，一染色體區域在某一組織中可顯示擴增或缺失，從而導致含有與其他組織之DNA混合之該組織之DNA之DNA混合物中該染色體區域的序列失衡。例如，可自假定為正常的另一樣本或另一染色體區域獲得期望值(例如，代表二倍體生物之兩個複本之量)。染色體區域可包括多個不連貫之子區域。

基因組基因座(標誌)之「類型」對應於跨組織類型之基因座之特定屬性。本說明主要係指I型基因座及II型基因座，其等性質詳細提供於下文中。給定類型之基因座可具有跨組織類型之甲基化程度之特定統計變異。基因組基因座(標誌)之「類別」對應於跨不同個體之相同組織類型之基因座之甲基化程度之特定變異。一組基因組基因座(標誌)可包括任何數量之各種類型及/或類別之基因座。因此，一組基因座對應於經選擇以供特定測量之基因座及不意謂該組基因座之任何特定性質。

「分離值」對應於涉及兩個值(例如，兩個分率貢獻或兩個甲基化程度)之差值或比率。該分離值可係簡單差值或比率。該分離值可包含其他因數，例如，乘性因數。作為其他實例，可使用該等值之函數之差值或比率，例如，該等兩個值之自然對數(ln)之差值。

如本文使用之術語「類別」係指任何與樣本之特定性質相關之數量或其他特徵。例如，「+」符號(或詞「正」)可表示樣本類別為具有缺失或擴增。該類別可係二進制(例如，正或負)或具有更多類別程度(例如，自1至10或0至1之標度)。術語「截止」及「臨限值」係指操作中使用之預定數。例如，截止尺寸可係指一種尺寸，超過該尺寸之片段被排除。臨限值可係一種值，超過或低於該值即適用特定類別。該等術語中之任何一者可用於此等內文之任何一者中。

10‧‧‧電腦設備

75‧‧‧系統匯流排

100‧‧‧根據本發明之實施例之分析無細胞DNA分子之DNA混合物以自甲基化程度判定各種組織類型之分率貢獻之方法

205‧‧‧生物樣本

210‧‧‧全基因組亞硫酸氫鹽定序

220‧‧‧組織特異性甲基化圖譜

230‧‧‧血漿DNA組織圖譜分析使用組織特異性甲基化圖譜220以判定組織貢獻百分率

241‧‧‧產前測試

242‧‧‧癌症偵測及監測

243‧‧‧器官移植監測

243‧‧‧器官損害評估，例如創傷、自身免疫性疾病、心肌梗塞、中風、感染...

300‧‧‧根據本發明之實施例之15名孕婦之不同器官對血漿DNA之百分率貢獻的圖

350‧‧‧根據本發明之實施例之自血漿DNA甲基化解卷積推算之由胎盤所貢獻之血漿DNA分率與使用胎兒特異性SNP對偶基因推算之胎兒DNA分率間之相關性的圖

400‧‧‧根據本發明之實施例判定自孕婦之血漿DNA組織圖譜分析之百分率貢獻的表

600‧‧‧根據本發明之實施例之非孕健康對照個體間之血漿DNA組織圖譜分析之百分率貢獻的表

700‧‧‧根據本發明之實施例之使用第一組標誌(具有高器官特異性)評估的11名孕婦及4名非孕健康個體之不同器官對血漿DNA之貢獻的表

800‧‧‧根據本發明之實施例之使用第二組標誌(具有低器官特異性)評估的11名孕婦及4名非孕健康個體之不同器官對血漿DNA之貢獻的表

900‧‧‧在經評估之胎兒DNA分率(胎盤之貢獻)與藉由計數母體血漿樣本中之胎兒特異性對偶基因判定之胎兒DNA分率間之相關性的圖

950‧‧‧甲基化標誌之評估值與藉由胎兒特異性對偶基因計數判定之胎兒DNA分率間之絕對差值的圖

1000‧‧‧根據本發明之實施例之基於器官特異性甲基化模式分析之癌症及健康病患之不同組織對血漿DNA之貢獻的表

1100‧‧‧根據本發明之實施例之藉由器官特異性甲基化模式分析判定之及藉由全基因組甲基化程度判定之顯示腫瘤DNA分率值的圖

1150‧‧‧基於血漿DNA組織圖譜分析之由肝臟貢獻之血漿DNA分率與藉由GAAL分析判定之腫瘤衍生之血漿DNA分率間之相關性的圖

1200‧‧‧在各種時間下之病患HCC 10之血漿中之經評估之腫瘤衍生之DNA的圖

1250‧‧‧病患HCC 9之血漿中之經評估之腫瘤衍生之DNA的圖

1300‧‧‧根據本發明之實施例之器官移植病患間之血漿DNA組織圖譜分析的表

1400‧‧‧藉由血漿DNA組織圖譜分析推算之經移植之移植物貢獻之血漿DNA分率與使用供體特異性SNP對偶基因判定之供體DNA分率間之相關性的圖

1500‧‧‧比較使用用於甲基化解卷積之503個I型、503個II型及兩種類型(各503個)標誌之準確度之分析的圖

1550‧‧‧比較使用用於甲基化解卷積之251個I型、251個II型及兩種類型(各251個)標誌之準確度之分析的圖

1600‧‧‧比較使用用於甲基化解卷積之123個I型、123個II型及兩種類型(各123個)標誌之準確度之分析的圖

1650‧‧‧比較使用用於甲基化解卷積之52個I型、52個II型及兩種類型(各52個)標誌之準確度之分析的圖

1700‧‧‧比較使用用於甲基化解卷積之26個I型、26個II型及兩種類型(各26個)標誌之準確度之分析的圖

1750‧‧‧比較使用用於甲基化解卷積之13個I型、13個II型及兩種類型(各13個)標誌之準確度之分析的圖

1800‧‧‧根據本發明之實施例之使用具有不同選擇標準之標誌推算之血漿DNA之胎盤貢獻的圖

1850‧‧‧使用在相同類型組織中使用具有低變異性(i類)及高變異性(ii類)之標誌之血漿DNA解卷積之準確度的圖

1900‧‧‧根據本發明之實施例之基於器官特異性甲基化模式分析之患有各種癌症之病患及健康個體之不同組織對血漿DNA之貢獻的表

2000‧‧‧根據本發明之實施例之與四名對照個體之平均值相比之每名癌症病患之不同器官之貢獻的表

2100‧‧‧根據本發明之實施例之HCC及健康對照個體之自甲基化標誌評估之肝臟對血漿DNA之貢獻根據的圖

2150‧‧‧健康對照個體與HCC病患間之如本發明之實施例推算由肝臟貢獻之血漿DNA之百分率的圖

2200‧‧‧相較於對照個體，肺癌病患中由肺貢獻之血漿DNA之百分率明顯較高(P=0.002，Mann-Whitney秩和檢定)的圖

2250‧‧‧相較於所有對照個體，由肺癌病患之結腸貢獻之血漿DNA之百分率更高的圖

2300‧‧‧根據本發明之實施例之癌症病患間之血漿DNA組織圖譜分析之表

2400‧‧‧根據本發明之實施例之分析無細胞DNA分子之DNA混合物以基於組織對該DNA混合物之高分率貢獻識別疾病狀態之方法

2500‧‧‧根據本發明之實施例之九名SLE病患之藉由甲甲基化解卷積所得之不同器官對血漿DNA之百分率貢獻的表

2600‧‧‧根據本發明之實施例判定自三名孕婦(M6941p、M7171p及M396p)之不同長度之無細胞DNA分子之胎盤貢獻的圖

2650‧‧‧根據本發明之實施例判定自移植病患之不同長度之無細胞DNA分子之非造血組織之貢獻的表

2700‧‧‧根據本發明之實施例判定自移植病患之不同長度之無細胞DNA分子之肝臟之貢獻的圖

2750‧‧‧根據本發明之實施例判定自HCC病患之不同長度之無細胞DNA分子之肝臟之貢獻的圖

2900‧‧‧根據本發明之實施例之用於判定拷貝數畸變之起源組織之方法

3050‧‧‧根據本發明之實施例之跨各者懷有三染色體21(T21)之胎兒之孕婦之不同組織之染色體21之分離值△M的圖

3250‧‧‧根據本發明之實施例之跨癌症病患之不同組織之顯示拷貝數增加及拷貝數損失之區域間之分離值△M的圖

3300‧‧‧根據本發明之實施例之跨癌症病患之不同組織之經隨機選擇之基因組區域間之分離值△M的圖

3450‧‧‧收集自在懷孕早期診斷為患有復發性濾泡性淋巴瘤之孕婦之樣本間之用於拷貝數畸變偵測之全基因組DNA序列分析的圖

3500‧‧‧判定自對患有復發性濾泡性淋巴瘤之孕婦之預處理血漿樣本進行之血漿DNA組織圖譜分析之分率貢獻的表

3550‧‧‧患有並行濾泡性淋巴瘤之孕婦之不同組織之分離值△M的圖

3600‧‧‧根據本發明之實施例之對直腸癌轉移至肝臟之病患之血漿DNA之拷貝數畸變分析的圖

3700‧‧‧總結所有樣本之基本序列參數(包含定序深度)之表

3900‧‧‧根據本發明之實施例之使用甲基化解卷積分析生物之生物樣本以判定染色體區域是否顯示序列失衡之方法

圖1係繪示根據本發明之實施例之分析無細胞DNA分子之DNA混合物以判定各種組織類型之甲基化程度之分率貢獻之方法的流程圖。

圖2顯示顯示根據本發明之實施例之DNA甲基化解卷積(例如，使用血漿)及其應用之若干可能應用之示意性圖。

圖3A顯示根據本發明之實施例之15名孕婦之不同器官對血漿DNA之百分率貢獻的圖。圖3B顯示根據本發明之實施例之自血漿DNA甲基化解卷積推算之由胎盤所貢獻之血漿DNA分率與使用胎兒特異性SNP對偶基因推算之胎兒DNA分率間之相關性的圖350。

圖4顯示根據本發明之實施例之判定自孕婦之血漿DNA組織圖譜分析(mapping)分析之百分率貢獻的表。

圖5顯示根據本發明之實施例之藉由血漿DNA組織圖譜分析判定之除胎盤外之器官之百分率貢獻及基於胎兒特異性SNP對偶基因之胎兒DNA分率的圖。

圖6顯示根據本發明之實施例之非孕健康對照個體間之血漿DNA組織圖譜分析之百分率貢獻的表。

圖7顯示根據本發明之實施例之使用第一組標誌(具有高器官特異性)評估的11名孕婦及4名非孕健康個體之不同器官對血漿DNA之貢獻的表。

圖8顯示根據本發明之實施例之使用第二組標誌(具有低器官特異性)評估的11名孕婦及4名非孕健康個體之不同器官對血漿DNA之貢獻的表。

圖9A係顯示在經評估之胎兒DNA分率(胎盤之貢獻)與藉由計數母體血漿樣本中之胎兒特異性對偶基因判定之胎兒DNA分率間之相關性的圖。

圖9B係顯示在甲基化標誌之評估值與藉由胎兒特異性對偶基因計數判定之胎兒DNA分率間之絕對差值的圖。

圖10顯示根據本發明之實施例之基於器官特異性甲基化模式分析之癌症及健康病患之不同組織對血漿DNA之貢獻的表1000。

圖11A係顯示根據本發明之實施例之藉由器官特異性甲基化模式分析判定之及藉由全基因組甲基化程度判定之腫瘤DNA分率值的圖1100。圖11B係顯示在基於血漿DNA組織圖譜分析之由肝臟貢獻之血漿DNA分率與藉由GAAL分析判定之腫瘤衍生之血漿DNA分率間之相關性的圖。

圖12A係顯示在各種時間下之病患HCC 10之血漿中之經評估之腫瘤衍生之DNA的圖。圖12B係顯示病患HCC 9之血漿中之經評估之腫瘤衍生之DNA的圖。

圖13係顯示根據本發明之實施例之器官移植病患間之血漿DNA組織圖譜分析的表。

圖14係顯示在藉由血漿DNA組織圖譜分析推算之由經移植之移植物貢獻之血漿DNA分率與使用供體特異性SNP對偶基因判定之供體DNA分率間之相關性的圖。

圖15A係顯示比較使用用於甲基化解卷積之503個I型、503個II型及兩種類型(各503個)之標誌之準確度之分析的圖。圖15B係顯示比較使用用於甲基化解卷積之251個I型、251個II型及兩種類型(各251個)之標誌之準確度之分析的圖。

圖16A係顯示比較使用用於甲基化解卷積之52個I型、52個II型及兩種類型(各52個)標誌之準確度之分析的圖。圖16B係顯示比較使用用於甲基化解卷積之123個I型、123個II型及兩種類型(各123個)之標誌之準確度之分析的圖。

圖17A係顯示比較使用用於甲基化解卷積之26個I型、26個II型及兩種類型(各26個)標誌之準確度之分析的圖。圖17B係顯示比較使用用於甲基化解卷積之13個I型、13個II型及兩種類型(各13個)標誌之準確度之分析的圖。

圖18A係顯示根據本發明之實施例之使用不同選擇標準之標誌推算之胎盤對血漿DNA之貢獻的圖。圖18B係顯示使用在相同類型組織中具有低變異性(i類)及高變異性(ii類)之標誌之血漿DNA解卷積之準確度的圖。

圖19係顯示根據本發明之實施例之基於器官特異性甲基化模式分析之患有各種癌症之病患及健康個體之不同組織對血漿DNA之貢獻的表。

圖20顯示根據本發明之實施例之相較於四個對照個體之平均值，每個癌症病患之不同器官之貢獻的表。

圖21A係顯示根據本發明之實施例之評估自HCC及健康對照個體之甲基化標誌之肝臟對血漿DNA之貢獻的圖。圖21B係顯示根據本發明之實施例推算之健康對照與HCC病患間之由肝臟貢獻之血漿DNA之百分率的圖。

圖22A及22B顯示自本發明之實施例推算之(A)肺及(B)結腸之百分率貢獻及未孕健康對照與肺癌或直腸癌病患間之比較。

圖23係顯示根據本發明之實施例之癌症病患間之血漿DNA組織圖譜分析之表。

圖24係繪示根據本發明之實施例之分析無細胞DNA分子之DNA混合物以基於組織對該DNA混合物之高分率貢獻識別疾病狀態之方法的流程圖。

圖25係顯示根據本發明之實施例之九個SLE病患中藉由甲基化解卷積判定之不同器官對血漿DNA之百分率貢獻的表。

圖26A係顯示根據本發明之實施例判定自三名孕婦(M6941p、M7171p及M396p)之不同長度之無細胞DNA分子之胎盤貢獻的圖。圖26B係顯示根據本發明之實施例判定自移植病患之不同長度之無細胞 DNA分子之非造血組織之貢獻的圖。

圖27A係顯示根據本發明之實施例判定自移植病患之不同長度之無細胞DNA分子之肝臟之貢獻的圖。圖27B係顯示根據本發明之實施例判定自HCC病患之不同長度之無細胞DNA分子之肝臟之貢獻的圖。

圖28係繪示根據本發明之實施例之分析無細胞DNA分子之DNA混合物以基於組織對不同尺寸無細胞DNA分子之該DNA混合物之差別分率貢獻識別該組織中之疾病狀態之方法的流程圖。

圖29係繪示根據本發明之實施例之用於判定拷貝數畸變之起源組織之方法2900的流程圖。

圖30A顯示根據本發明之實施例之攜載三染色體21之孕婦中之染色體特異性血漿DNA甲基化解卷積之分析的繪示。圖30B係顯示根據本發明之實施例之跨各者懷有三染色體21(T21)之胎兒之孕婦之不同組織之染色體21之分離值△M的圖3050。

圖31係顯示根據本發明之實施例之跨各者懷有三染色體21(T21)之胎兒之孕婦之不同組織之其他染色體之分離值△M的圖。

圖32A係根據本發明之實施例之癌症病患之血漿DNA中之CNA區域之分析的繪示。圖32B係顯示根據本發明之實施例之跨癌症病患之不同組織之顯示拷貝數增加及拷貝數損失之區域間之分離值△M的圖。

圖33係顯示根據本發明之實施例之跨癌症病患之不同組織之經隨機選擇之基因組區域間之分離值△M的圖。

圖34A顯示根據本發明之實施例之患有並行淋巴瘤(concurrent lymphoma)之孕婦之甲基化解卷積分析的繪示。圖34B係顯示收集自在懷孕早期診斷為患有復發性濾泡性淋巴瘤之孕婦之樣本間之用於拷貝數畸變偵測之全基因組DNA定序分析的圖。

圖35A係顯示判定自對患有復發性濾泡性淋巴瘤之孕婦之預處理血漿樣本進行之血漿DNA組織圖譜分析之分率貢獻的表3500。圖35B係顯示患有並行濾泡性淋巴瘤之孕婦之不同組織之分離值△M的圖。

圖36A係顯示對直腸癌轉移至肝臟之病患之血漿DNA進行之拷貝數畸變分析的圖。圖36B係顯示根據本發明之實施例之患有直腸癌及肝臟轉移之病患之血漿DNA之拷貝數畸變之甲基化解卷積分析的圖。

圖37及38顯示用於識別起源組織中之各種樣本之基本定序參數(包含定序深度)的表。

圖39係繪示根據本發明之實施例之使用甲基化解卷積分析生物之生物樣本以判定染色體區域是否顯示序列失衡之方法的流程圖。

圖40A係顯示根據本發明之實施例之兩名孕婦之尿DNA之尺寸分佈的圖。圖40B顯示根據本發明之實施例之尿DNA中之不同染色體之基因組代表(GR)的圖。

圖41顯示可與本發明之實施例之系統及方法一起使用之示例性電腦系統10的方塊圖。

本發明之實施例可使用特定組織類型之某些基因組位點之已知甲基化程度判定血漿(或其他DNA混合物)中各種組織類型之無細胞DNA的百分率。例如，可測量肝臟樣本之基因組位點之甲基化程度，及可使用此等組織特異性甲基化程度以判定該混合物中多少無細胞DNA係來自肝臟。亦可測量為DNA混合物提供大量貢獻之組織類型之甲基化程度，使得無細胞DNA混合物可佔主導(例如，多於90%、95%或99%)。此類其他樣本可包含(但不限於)以下各物中之一些或所有：肺、結腸、小腸、胰臟、腎上腺、食道、脂肪組織、心臟及腦。

可使用解卷積方法以判定已知組織特異性甲基化程度之組織類型之各分率貢獻(例如，百分率)。在一些實施例中，可自特定基因組位點之已知組織特異性甲基化程度及混合物甲基化程度建立線性方程式系統，及可判定(例如，使用最小平方)最近似於經測量之混合物甲基化程度之分率貢獻。

可選擇特定基因組位點以提供所需準確度程度。例如，相對於僅使用對一種組織類型特異之基因組位點，可使用具有至少臨限值量之變異性之基因組位點。可選擇第一組(例如，10個)基因組位點使得各者具有跨組織類型之至少0.15之甲基化程度變異係數且使得各者在一或多個其他樣本之M個組織類型之最大與最小甲基化程度間具有超過0.1的差值。該第一組基因組位點可能不具有特定組織類型之特定甲基化標籤，例如，僅或主要在特定組織類型中甲基化。此類第一組稱為II型位點。此等基因組位點可與確實具有特定標籤之基因組位點(其等稱為I型位點)組合使用。

使用II型位點可確保基因組位點跨越跨該等組織類型之甲基化程度之全部空間，從而在I型位點上提供增高準確度。僅使用更多I型位點為甲基化空間提供冗餘基礎向量(即，更多具有與其他位點相同之模式的基因組位點)，同時添加其他甲基化程度跨不同組織具有各種值之基因組位點經由線性方程式系統添加新基礎向量以識別分率貢獻。

分率貢獻一經判定(不管所選位點之類型)，可出於各種目的使用該等分率貢獻。可判定特定組之彼等組織類型者健康之人(例如，所有組織類型健康之個體或某些組織類型健康之個體)之各種組織類型之參考分率貢獻。當組織類型(例如，肝臟)患病時，則該組織將釋放更多無細胞DNA分子，可隨細胞凋亡而發生。例如，肝臟之分率貢獻之大量增加(即，臨限值大於參考值)指示該肝臟患病。

特定組織類型之分率貢獻之此類增加可經進一步分析，例如，無細胞DNA之尺寸分析。該尺寸分析亦可自動進行。亦可判定不同尺寸範圍(例如，短及長)之兩個分率貢獻，及該等兩個分率貢獻間之分離值(即，差值或比率)可指示特定組織類型之短無細胞DNA分子多於長無細胞DNA分子。由於病變組織具有較短之無細胞DNA分子，因此特定組織類型中較短無細胞DNA分子相對於較長無細胞DNA分子之更高分率貢獻指示該特定組織類型患病。

可使用使用不同染色體區域之組織類型之分率貢獻間的分離值以判定該組織類型是否具有序列失衡。以其中該組織類型係胎兒組織之孕婦為例，若染色體21具有三個複本，則使用染色體21之無細胞DNA測量之胎兒組織之百分率將高於測量自另一具有兩個複本之染色體的胎兒組織百分率。胎兒組織之分率貢獻之顯著分離值(例如，大於臨限值)指示該染色體21具有序列失衡。

如另一用於偵測序列失衡之實例，特定染色體區域可因具有拷貝數畸變而加以識別，但可能無法知曉畸變之起源。區域亦可具有畸變之嫌。可使用經識別之區域之無細胞DNA判定組織類型之第一分率貢獻，及可使用另一區域之無細胞DNA判定該組織類型之第二分率貢獻。該等分率貢獻間之顯著分離值指示該組織類型係顯示序列失衡(例如，經由拷貝數畸變識別之序列失衡或簡單地為針對經識別之區域測試之序列失衡)之組織類型。

I 藉由甲基化解卷積判定DNA混合物之組成

不同組織類型可具有基因組位點之不同甲基化程度。可使用此等差異以判定各種組織類型之DNA在混合物中的分率貢獻。因此，可藉由組織特異性甲基化模式分析判定DNA混合物之組成。以下實例討論甲基化密度，但可使用其他甲基化程度。

A 單一基因組位點

可使用單一甲基化基因組位點(甲基化標誌)說明甲基化解卷積之原理以判定生物之DNA混合物之組成。假定組織A之基因組位點經完全甲基化，即100%之甲基化密度(MD)及組織B係完全未甲基化，即 0%之MD。在此實例中，於在受關注之區域中甲基化CpG二核苷酸之情境中，甲基化密度係指胞嘧啶殘基之百分率。

若該DNA混合物C包括組織A及組織B及該DNA混合物C之整體甲基化密度係60%，則吾人可根據下式推算組織A及B對該DNA混合物C之比例貢獻： MD _C =MD _A ×a+MD _B ×b， 其中MD_A、MD_B、MD_C分別表示組織A、組織B及DNA混合物C之MD；及a與b係組織A及B對DNA混合物C之比例貢獻。在該特定實例中，假定組織A及B係DNA混合物中僅有之兩種成分。因此，a+b=100%。因此，分別計算組織A及B對DNA混合物之貢獻係60%及40%。

組織A及組織B中之甲基化密度可獲得自生物之樣本及獲得自相同類型之其他生物(例如，可能係相同亞族群之其他人類)之樣本。若使用其他生物之樣本，則可使用組織A樣本之甲基化密度之統計分析(例如，平均值、中值、幾何平均值)以獲得甲基化密度MD_A並以類似方法獲得MD_B。

可選擇基因組位點以具有最低個體間變異，例如，小於變異之特定絕對量或在經測試之基因組位點之最低部分內。例如，對最低部分，實施例可選擇在經測試之基因組位點之群間僅具有最低10%之變異之基因組位點。其他生物可取自健康之人及彼等具有特定生理者(例如，孕婦或不同年齡之人或特定性別之人)，其等可對應於包含正經測試之當前生物之特定亞族群。

亞族群之其他生物亦可具有其他病理性病症(例如，患有肝炎或糖尿病之病患等)。此類亞族群可具有對於各種組織而言之經改變之組織特異性甲基化模式。除使用正常組織之甲基化模式外，此類疾病病症下之組織之甲基化模式可用於解卷積分析中。當測試患有彼等病症者之此類亞族群之生物時，該解卷積分析可更準確。例如，硬變肝臟或纖維變性腎臟分別相較於正常肝臟及正常腎臟可具有不同甲基化模式。因此，若篩選患有肝臟硬變之病患之其他疾病，則可更準確地包含硬變肝臟作為連同其他組織類型之健康組織向血漿DNA貢獻DNA之候選者中之一者。

B 多個基因組位點

當有更多可能之候選組織時，可使用更多基因組位點(例如，10個或更多個)以判定DNA混合物之組成。DNA混合物之比例組成之評估的準確度取決於大量因數，包含基因組位點數、該等基因組位點(亦稱為「位點」)對特定組織之特異性及用以判定參考組織特異性程度之跨不同候選組織及跨不同個體之位點之變異性。位點對組織之特異性係指該等基因組位點在特定組織與其他組織類型間之甲基化密度之差異。

其等甲基化密度間之差異越大，則位點對特定組織將更具特異性。例如，若位點在肝臟中經完全甲基化(甲基化密度=100%)及在所有其他組織中完全未甲基化(甲基化密度=0%)，則該位點將對該肝臟具有高度特異性。然而，可藉由(例如但不限於)位點在不同類型組織中之甲基化密度的範圍或標準偏差來反映該位點跨不同組織之變異性。較大範圍或較高標準偏差將容許數學上更精確及更准確地判定不同器官對DNA混合物的相對貢獻。在本申請案之後續部分中說明此等因數對評估候選組織對DNA混合物之比例貢獻之準確度的影響。

此處，吾人使用數學方程式以說明不同器官對DNA混合物之比例貢獻之推算。DNA混合物中不同位點之甲基化密度與不同組織中之對應位點之甲基化密度間之數學關係可表示為：

其中

表示DNA混合物中位點i之甲基化密度；p _k表示組織k對DNA混合物之比例貢獻；MD _ik表示組織k中之位點i之甲基化密度。當位點數與器官數相同或大於器官數時，可判定個體p _k之值。如上所述，組織特異性甲基化密度可獲得自其他個體，並可選擇位點以具有最低個體間之變異。

額外標準可納入該演算法中以改善準確度。例如，所有組織之合計貢獻可約束為100%，即Σ _k p _k =100%。

此外，可要求所有器官之貢獻係非負數：

由於生物變異，觀察之整體甲基化模式可不完全相同於推算自組織之甲基化之甲基化模式。在此種情況下，將需要數學分析以判定個別組織之最可能之比例貢獻。因此，藉由W表示在DNA中觀察之甲基化模式與推算自組織之甲基化模式間之差值。

其中O係DNA混合物之觀察之甲基化模式及M_k係個別組織k之甲基化模式。p_k係組織k對DNA混合物之比例貢獻。可藉由最小化W判定每個p_k之最可能值，W係觀察之甲基化模式與推算之甲基化模式間之差值。可使用數學演算法解該方程式，例如藉由使用二次規劃、線性/非線性回歸、期望-最大(EM)演算法、最大似然演算法、最大後驗評估及最小平方法。

C 甲基化解卷積法

如上所述，可分析包含生物之無細胞DNA分子之混合物之生物樣本以判定該混合物之組成，特別係不同組織類型之貢獻。例如，可判定肝臟之無細胞DNA分子之百分率貢獻。可使用該生物樣本中之百分率貢獻之此等測量值以獲得該生物樣本之其他測量值，例如，如描述於後續部分中，識別腫瘤所處位置。

圖1係繪示根據本發明之實施例之分析無細胞DNA分子之DNA混合物以自甲基化程度判定各種組織類型之分率貢獻之方法100的流程圖。生物樣本包含M個組織類型之無細胞DNA分子之混合物。該生物樣本可係各種實例中之任何一者，例如，如本文所述。組織類型數M係大於二。在各種實施例中，M可係3、7、10、20或更大，或該等值間之任何數。可使用電腦系統進行方法100。

在區塊110中，識別N個基因組位點以供分析。該等N個基因組位點可具有各種屬性，例如，如更詳細地描述於描述I型及II型基因組位點之部分II中。例如，該等N個基因組位點可僅包含I型或II型位點，或兩者之組合。可基於一或多個其他樣本之分析而識別該等基因組位點，例如，基於獲得自關於測量於各種個體中之甲基化程度之資料庫的資料。

在一些實施例中，該等N個基因組位點中之至少10個係II型且各者具有跨M個組織類型之至少0.15之甲基化程度變異係數。該變異係數可使用更嚴格之臨限值，例如，0.25。該等至少10個基因組位點亦可各者具有M個組織類型之最大與最小甲基化程度間之超過0.1之差值。該變異係數可使用更嚴格之臨限值，例如，0.2。該等N個基因組位點亦可包含I型位點(例如，至少10個)。

可測量一個樣本或一組樣本之基因組基因座之此等甲基化性質。該組樣本可係生物之亞族群，其包含測試中之即時生物，例如，具有與即時生物共用之特定性狀之亞族群。此等其他樣本可稱為參考組織，及可使用不同樣本之不同參考組織。

在區塊120中，對於M個組織類型之各者，在N個基因組位點獲得N個組織特異性甲基化程度。N係大於或等於M，使得該等組織特異性甲基化程度可用於解卷積中以判定分率百分率。該等組織特異性甲基化程度可形成維數N乘M之矩陣A。該矩陣A之每列可對應於特定組織類型之甲基化模式，其中該模式係N個基因組位點之甲基化程度。

在各種實施例中，該等組織特異性甲基化模式可檢索自公共資料庫或先前研究。在本文之實例中，嗜中性細胞及B細胞之甲基化資料係下載自基因表現公共資料庫(Gene Expression Omnibus)(Hodges等人，Mol Cell 2011；44：17-28)。其他組織(海馬迴、肝臟、肺、胰臟、心房、結腸(包含其各種部分，例如，乙狀結腸、橫結腸、升結腸、降結腸)、腎上腺、食道、小腸及CD4 T細胞)之甲基化模式係下載自RoadMap Epigenomics project中(Ziller等人，Nature 2013；500：477-81)。膚色血球層、胎盤、腫瘤及血漿資料之甲基化模式係來自公開報告(Lun等人，Clin Chem.2013；59：1583-94；Chan等人，Proc Natl Acad Sci U S A.2013；110：18761-8)。可使用此等組織特異性甲基化模式以識別待用於解卷積分析中之N個基因組位點。

在區塊130中，接收包含M個組織類型之無細胞DNA分子之混合物之生物樣本。該生物樣本可以各種方式獲得自病患生物。獲得此類樣本之方式可係非侵入性或侵入性的。非侵入性獲得之樣本之實例包含某些類型之流體(例如，血漿或血清或尿)或糞便液。例如，血漿包含許多器官組織之無細胞DNA分子，及因此可經由一個樣本用於分析許多器官。

在區塊140中，分析該生物樣本之無細胞DNA分子以識別其等於對應於該生物之參考基因組中之位置。例如，可定序該等無細胞DNA 分子以獲得序列讀段，及該等序列讀段可對照(比對)於參考基因組。若該生物係人類，則該參考基因組將係可能特定亞族群之參考人類基因組。如另一實例，可以不同探針(例如，在PCR或其他擴增後)分析無細胞DNA分子，其中每個探針對應於不同基因組位點。在一些實施例中，可藉由接收序列讀段或對應於無細胞DNA分子之其他實驗資料，及然後分析該實驗資料進行無細胞DNA分子之分析。

可分析無細胞DNA分子之統計顯著數以提供準確之解卷積以判定M個組織類型之分率貢獻。在一些實施例中，分析至少1,000個無細胞DNA分子。在其他實施例中，可分析至少10,000或50,000或100,000或500,000或1,000,000或5,000,000個無細胞DNA分子或更多。欲分析之分子總數可取決於M及N，及所需之精確度(準確度)。

在區塊150中，使用第一組各者位於參考基因組之N個基因組位點之任一者之無細胞DNA分子測量N個基因組位點之N個混合物甲基化程度。該等N個混合物甲基化程度係指生物樣本之混合物中之甲基化程度。例如，若該混合物之無細胞DNA分子係位於N個基因組位點中之一者處，則該分子於該位點之甲基化指數可計入該位點之整體甲基化密度中。該等N個混合物甲基化程度可形成長度N之甲基化向量b，其中b對應於觀察值，可自該觀察值判定該等組織類型之分率貢獻。

在一實施例中，可使用全基因組亞硫酸氫鹽定序判定DNA混合物中基因組位點之甲基化程度。在其他實施例中，可使用以下方法判定基因組位點之甲基化程度：可使用甲基化微陣列分析(諸如Illumina HumanMethylation450系統)；或藉由使用甲基化免疫沉澱法(例如，使用抗甲基胞嘧啶抗體)或以甲基化結合蛋白質處理且接著藉由微陣列分析或DNA定序；或藉由使用甲基化敏感限制酶處理後且接著藉由微陣列或DNA定序；或藉由使用甲基化感測定序，例如，使用單一分子定序方法(例如，藉由奈米孔洞定序(Schreiber等人，Proc Natl Acad Sci 2013；110：18910-18915)或藉由Pacific Biosciences單一分子即時分析(Flusberg等人，Nat Methods 2010；7：461-465))。可以相同方式測量組織特異性甲基化程度。如其他實例，靶向亞硫酸氫鹽定序、甲基化特異性PCR、基於非亞硫酸氫鹽之甲基化感測定序(例如，藉由單一分子定序平臺(Powers等人，Efficient and accurate whole genome assembly and methylome profiling of E.coli.BMC Genomics.2013；14：675))可用於分析血漿DNA甲基化程度以供血漿DNA甲基化解卷積分析。因此，可以各種方式獲得甲基化感測定序結果。

在區塊160中，判定合成向量之M值。每個M值對應於M個組織類型之特定組織類型對DNA混合物之分率貢獻。可在給定NxM個組織特異性甲基化程度下解該合成向量之M值以提供N個混合物甲基化程度(例如，甲基化向量b)。M分率貢獻可對應於藉由解Ax=b判定之向量x。當N大於M時，該解可涉及誤差之最小化，例如，使用最小平方。

在區塊170中，使用該合成向量判定混合物中M個組織類型之各量。該合成向量之M值可直接作為M個組織類型之分率貢獻。在一些實施方案中，可將該等M值轉化為百分率。可使用誤差項以將M值移位至較高或較低值。合成向量之每個值可視為一分量，及第一分量可對應於第一組織類型。

D 應用

如上所述，該等分率貢獻可用於生物樣本之其他測量及其他判定中，例如，特定染色體區域是否具有序列失衡或特定組織類型是否患病。

圖2顯示顯示根據本發明之實施例之DNA甲基化解卷積(例如，使用血漿)之若干可能應用之示意性圖。在圖2中，在210，對生物樣本205進行全基因組亞硫酸氫鹽定序。在230，血漿DNA組織圖譜分析使用組織特異性甲基化圖譜220以判定組織貢獻百分率。實例組織特異性甲基化圖譜顯示為肝臟、血液細胞、脂肪組織、肺、小腸及結腸。可如上文或別處所述判定該等貢獻百分率，例如，解Ax=b。應用之實例包括產前測試241、癌前偵測及監測242、器官移植監測及器官損害評估244。

可藉由比較不同組織(包含肝臟、肺、食道、心臟、胰臟、乙狀結腸、小腸、脂肪組織、腎上腺、結腸、T細胞、B細胞、嗜中性細胞、腦及胎盤)之甲基化圖譜(圖2)識別可用於判定不同器官對血漿DNA之貢獻之甲基化標誌(基因組位點)之列表。在各種實例中，肝臟、肺、食道、心臟、胰臟、結腸、小腸、脂肪組織、腎上腺、腦及T細胞之全基因組亞硫酸氫鹽定序資料係檢索自Baylor College of Medicine之Human Epigenome Atlas(www.genboree.org/epigenomeatlas/index.rhtml)。B細胞及嗜中性細胞之亞硫酸氫鹽定序資料係Hodges等人之公開案(Hodges等人；Directional DNA methylation changes and complex intermediate states accompany lineage specificity in the adult hematopoietic compartment.Mol Cell 2011；44：17-28)。胎盤之亞硫酸氫鹽定序資料係Lun等人(Lun等人，Clin Chem 2013；59：1583-94)。在其他實施例中，可自使用微陣列分析(例如，使用Illumina Infinium HumanMethylation450 BeadChip Array)生成之資料集中識別標誌。

II 甲基化標誌之選擇

上文中，吾人已描述使用甲基化分析以判定DNA混合物之組成的原理。特定言之，使用甲基化分析可判定不同器官(或組織)對血漿DNA之百分率貢獻。在本部分中，吾人進一步描述選擇甲基化標誌之方法及該技術之臨床應用。

藉由甲基化分析判定DNA混合物之組成之結果受用於DNA混合物之組成之解卷積中之甲基化標誌的影響。因此，選擇合適之基因組甲基化標誌對準確判定DNA混合物之組成可係重要的。

A 用於解卷積之甲基化標誌之標準

對標誌選擇，可考慮下列三個屬性。(i)希望甲基化標誌具有跨不同個體之在相同組織類型中測得之低甲基化程度變異性。由於DNA混合物之組成之判定係取決於組織特異性甲基化模式之識別，因此跨不同個體之在相同組織類型中之低甲基化程度變異性將可用於準確識別DNA混合物中之組織特異性模式。在組織特異性甲基化程度獲得自其他生物(例如，來自資料庫)之樣本之實施例中，低變異性意謂其他樣本之甲基化程度類似於測試中之當前生物之組織特異性甲基化程度。

(ii)希望甲基化標誌具有跨不同組織之高甲基化程度變異性。對特定標誌，跨不同組織之較高甲基化程度差值可提供不同組織對DNA混合物之貢獻之更精確判定。特定言之，可藉由使用一組具有屬性(ii)之標誌及另一組具有屬性(iii)之標誌獲得精確度之改善。

(iii)希望甲基化標誌在特定組織中相較於彼等其他組織中之大部分或所有者時具有特別不同的甲基化程度。與上述之第(ii)點相反，標誌在大部分組織之甲基化程度中可具有低變異性但其於特定組織中之甲基化程度不同於大部分其他組織。該標誌將對判定具有不同於其他組織之甲基化程度之組織之貢獻特別有用。

B 實例

標誌選擇之原理繪示於表1之下列假設實例中。

在該假設實例中，當相較於標誌1時，標誌2在三個個體之肝臟之甲基化密度中具有較低可變異性。因此，作為用於判定DNA混合物中肝臟之貢獻之標籤，標誌2優於標誌1。

相較於標誌4，標誌3具有跨不同組織類型之更高甲基化密度變異性。根據上文討論之數學關係，標誌3相較於標誌4，在評估自不同組織之貢獻之變化的相同程度將在DNA混合物之推算甲基化密度中提供更大變化。因此，以標誌3評估每個組織的貢獻將更精確。

標誌5具有跨肝臟、心臟及肺之低甲基化密度變異性。其等甲基化密度自10%至14%而變化。然而，結腸之甲基化密度係80%。該標誌將對判定DNA混合物中結腸之貢獻特別有用。同樣，對於標誌6，相較於其他組織，心臟係低甲基化。因此，可藉由標誌6準確判定心臟之貢獻。因此，組合標誌5及6將可準確判定結腸及心臟之貢獻。標誌2及3之添加則將足以推算四個器官(包含肝臟、心臟、肺及結腸)之各貢獻。

C 標誌之不同類型

甲基化標誌可不一定需要具有上述所有三個屬性。I型甲基化標誌將通常具有上述屬性(iii)。許多此類標誌亦可具有屬性(i)。另一方面，II型甲基化標誌將通常具有上述屬性(ii)。許多此類標誌亦可具有屬性(i)。特定標誌可具有所有三個屬性亦係可能的。

在一些實施例中，將標誌廣義地分為兩種類型(I型及II型)。I型標誌具有組織特異性。一或多種組織之特定群之此等標誌之甲基化程度係不同於大部分其他組織。例如，相較於所有其他組織之甲基化程度，特定組織可具有顯著甲基化程度。在另一實例中，兩種組織(例如，組織A及組織B)具有類似甲基化程度，但組織A及B之甲基化程度明顯不同於剩餘組織之甲基化程度。

II型標誌具有高組織間甲基化變異性。此等標誌之甲基化程度具有跨不同組織之高度可變異。該類別中之單一標誌可不足以判定特定組織對DNA混合物之貢獻。然而，II型標誌之組合，或與一或多個I型標誌之組合可共同用以推算個別組織之貢獻。在上文之定義下，特定標誌可係僅I型標誌、僅II型標誌、或同時係I型及II型標誌兩者。

1. I型標誌

在一個實施例中，I型標誌可藉由比較該標誌之甲基化密度與所有候選組織之該特定標誌之甲基化密度的平均值及標準偏差(SD)來識別。在一個實施方案中，若一個組織中之標誌之甲基化密度與所有組織之平均值相差3倍標準偏差(SD)，則識別該標誌。

研究獲得自上文提及之來源之14個組織的甲基化圖譜以選擇標誌。在一個分析中，使用上述標準識別全部1,013個I型標誌(附錄A之表S1中經標誌標記之I型)。在其他實施例中，可使用在特定組織與平均甲基化密度間之其他截止，例如，1.5 SD、2 SD、2.5 SD、3.5 SD及4 SD。在又另一實施例中，可通過比較特定組織之甲基化密度與所有組織之中值甲基化密度識別I型標誌。

在其他實施例中，當多於一個組織(例如，兩個、三個、四個或五個組織)相較於所有候選組織之平均甲基化密度顯示顯著不同甲基化密度時可獲得該等I型標誌。在一個實施方案中，截止甲基化密度可計算自所有候選組織之甲基化密度的平均值及SD。出於說明之目的，該截止(臨限值)可定義為3倍SD高於或低於平均甲基化密度。因此，當指定數量之組織之甲基化密度比該等組織之平均甲基化密度高3倍SD以上或比該等組織之平均甲基化密度低3倍SD以上時，可選擇標誌。

2. II型標誌

為識別II型標誌，計算跨所有14個候選組織之甲基化密度之平均值及SD且SD對平均值之比率表示為變異係數(CV)。在該說明性實例中，吾人使用>0.25之截止CV，及在該群組織之最大與最小甲基化密度間之超過0.2之差值以識別合格之II型標誌。使用此等標準，識別5820個II型標誌(附錄A之表S1中經標誌標記之II型)。CV截止之其他實例包含0.15、0.2、0.3及0.4。用於最大與最小甲基化密度間之差值之截止的其他實例包含0.1、0.15、0.25、0.3、0.35、0.4、0.45及0.5。

在其他實施例中，可使用跨相同組織類型之多個樣本的平均值以測量甲基化程度跨不同組織之變異。例如，可平均化10個樣本之相同基因組位點之10個甲基化程度以獲得該基因組位點之單一甲基化程度。可進行類似方法以判定其他組織類型之該基因組位點的平均甲基化程度。然後跨組織類型之平均值可用於判定該基因組位點是否具有跨組織類型之顯著變異。除平均值外亦可使用其他統計值，例如，中值或幾何平均值。可使用此類統計值以識別I型及/或II型標誌。

可使用相同組織類型之不同樣本(例如，來自不同個體)以判定甲基化程度跨不同樣本之變異。因此，若存在相同組織類型之多個樣本，則實施例可進一步測量特定標誌在相同組織類型之此類樣本間的變異。跨樣本具有低變異之標誌相較於具有高變異之標誌將係更可靠的標誌。

實施例亦係關於表S1中之標誌及該等標誌之任何組合之用途，例如，使用表S1中任何10個或更多個I型或II型標誌，及使用各表之10個或更多個標誌的任何組合。例如，實施例係關於使用表S1之50(或100、250、500或1,000)個I型標誌及50(或100、250、500、1,000、2,000或5,000)個II型標誌。

D 標誌之不同類別

基因組基因座(甲基化標誌)之「類別」對應於基因座跨不同個體之相同組織類型之甲基化程度之特定變異。不同類別可在跨個體之特定組織類型間具有不同變異範圍。甲基化標誌之第一類別在經測試之個體間可具有10%之甲基化程度差值或更低。甲基化標誌之第二類別在經測試之個體間可具有多於10%之甲基化程度差值。使用具有低個體間變異之甲基化標誌(第一類別標誌)將可能改善判定DNA混合物中特定器官之貢獻的準確度。

E 可能之甲基化標誌之識別

在一些實施例中，以下列方式識別可能之甲基化標誌。此類可能之甲基化標誌可隨後接受上文之標準以識別I型及II型標誌。在其他實施例中，無需I型或II型之識別。而且，其他實施例可使用其他技術以識別可能之甲基化標誌。

在一些實施例中，考慮體染色體上之所有CpG島(CGIs)及CpG濱(shores)可能之甲基化標誌。不使用性染色體上之CGIs及CpG濱以最小化原始資料中關於性相關染色體劑量差異之甲基化程度的變異。CGIs係下載自加州大學(University of California)，Santa Cruz(UCSC)資料庫(genome.ucsc.edu/,27,048 CpG islands for the human genome)(Kent等人，The human genome browser at UCSC.Genome Res.2002；12(6)：996-1006)，及CpG濱定義為CpG島之2kb毗鄰窗(flanking windows)(Irizarry等人，The human colon cancer methylome shows similar hypo-and hypermethylation at conserved tissue-specific CpG island shores.Nat Genet 2009；41(2)：178-186)。然後，將CpG島及濱細分為非重疊之500bp單元，並將每個單元視為可能之甲基化標誌。

在14個組織類型間比較所有可能之基因座之甲基化密度(即，在 500bp單元內經甲基化之CpGs之百分率)。如先前報告(Lun等人，Clin Chem.2013；59：1583-94)，當與剩餘組織比較時，發現胎盤係總體低甲基化。因此，在標誌識別階段不包含胎盤之甲基化圖譜(profile)。使用剩餘13個組織類型之甲基化圖譜，識別甲基化標誌的兩種類型。例如，I型標誌可指具有一個組織中之甲基化密度相較於13個組織類型之平均值低於或高於3 SD的任何基因組位點。當(A)大部分高甲基化組織之甲基化密度比大部分低甲基化組織之甲基化密度高至少20%時；及(B)跨13個組織類型之甲基化密度之SD除以該群之平均甲基化密度(即變異係數)係至少0.25時，可認為II型標誌可高度變異。最後，為減少可能冗餘標誌之數，可在兩個CpG濱側接一個CpG島之一個相鄰區塊中僅選擇一個標誌。

F 基於應用之選擇

可取決於所需應用之參數而改變經選擇以供特定應用之甲基化標誌組。例如，為判定基因組畸變(例如，拷貝數畸變(CNA))之起源，大量標誌遍佈基因組將係有利的。如另一實例，對自特定組織釋放進入血漿之DNA係特別重要的應用，技術人員可選擇優先較大數量之相較於該標誌組中之其他甲基化標誌於該組織類型中經區別性甲基化的甲基化標誌(例如，I型標誌)。

可根據預期用途改變解卷積分析中之甲基化標誌的數量及選擇。若肝臟之分率貢獻特別受關注，例如，在已接受肝臟移植之病患中，則可在解卷積分析中使用更多I型肝臟特異性標誌以增加經移植之肝臟對血漿DNA之貢獻之定量的精確度。

III 組成準確度

如上所述，實施例可識別血漿DNA之組織貢獻者。在各種實例中，進行血漿DNA之全基因組亞硫酸氫鹽定序並參照不同組織之甲基化圖譜分析。以使用二次規劃為實例，將血漿DNA定序資料解卷積為不同組織之比例貢獻。測試孕婦、患有肝細胞癌、肺癌及結腸直腸癌之病患及經骨髓及肝臟移植後之個體的實施例。

在大部分個體中，白血液細胞係循環DNA池之主要貢獻者。孕婦中之胎盤貢獻係與藉由胎兒特異性基因標誌顯示之比例貢獻相關。移植受體中之血漿之移植物衍生之貢獻與彼等使用供體特異性基因標誌判定者相關。患有肝細胞癌、肺癌或直腸癌之病患顯示具有腫瘤之器官之高血漿DNA貢獻。肝細胞癌病患中之肝臟貢獻亦與使用腫瘤相關拷貝數畸變作出之測量值相關。

在血漿中顯示拷貝數畸變之癌症病患及孕婦中，甲基化解卷積精確定位負責畸變之組織類型。在於孕期診斷為患有濾泡性淋巴瘤之孕婦中，甲基化解卷積指示自B細胞進入血漿DNA池之極高貢獻並定位B細胞(而非胎盤)為血漿中觀察之拷貝數畸變的起源。因此，實施例可用作基於不同組織進入血漿之擾動比例貢獻之識別評定廣泛生理及病理病症的有力工具。

A 不同類型之血液細胞之貢獻

如甲基化解卷積之實例，吾人判定不同組織及細胞類型對循環DNA之貢獻。自患有全身性紅斑狼瘡(SLE)之兩名病患收集兩個血液樣本。收集後，將該等靜脈血液樣本於1,500g下離心分離10分鐘。離心分離後，分離血液細胞及血漿。然後自血液細胞中提取DNA。該DNA經亞硫酸氫鹽轉化並於HiSeq2000定序儀中使用一道流動細胞定序。使用細胞類型特異性甲基化模式分析來分析兩個血液細胞樣本。包含嗜中性細胞、淋巴細胞、食道、結腸、胰臟、肝臟、肺、心臟、腎上腺及海馬迴之甲基化模式作為血液細胞DNA之可能之候選者。選擇609個甲基化標誌以供分析。兩個個體之全血液樣本亦送至細胞計數以判定血液細胞之嗜中性細胞及淋巴細胞的分率組成。

對甲基化模式分析，將嗜中性細胞及淋巴細胞判定為組成血液細胞DNA之主要成分。嗜中性細胞及淋巴細胞之貢獻之相對比例與根據細胞計數分析之其等於血液樣本中的相對豐度類似。

B 孕婦

使用孕婦之血漿DNA之甲基化分析來分析不同組織(包含肝臟、肺、胰臟、結腸、海馬迴、小腸、血液細胞、心臟、腎上腺、食道及胎盤)的貢獻。由於胎盤基因型通常與胎兒之基因型相同但不同於孕婦之基因型，因此可藉由計數樣本中之胎兒特異性對偶基因之數量準確判定胎盤對母體血漿之精確貢獻。

1. 組成及與胎兒DNA百分率之相關性

對15名孕婦(第一、第二及第三孕期各五名)進行血漿DNA之全基因組亞硫酸氫鹽定序。進行甲基化解卷積並推算不同組織之百分率貢獻。基於表S1中之所有I型及II型標誌之甲基化程度(諸如甲基化密度)使用二次規劃分析判定不同器官之貢獻。

圖3A顯示根據本發明之實施例之15名孕婦之不同器官對血漿DNA之百分率貢獻的圖300。每個長條對應於一個樣本之結果。不同顏色表示不同器官在血漿中之貢獻。此等結果顯示白血液細胞(即，嗜中性細胞及淋巴細胞)係血漿DNA池之最重要貢獻者。此觀察結果係與骨髓移植後預先獲得之彼等觀察結果者一致(Lui YY等人，Clin Chem 2002；48：421-7)。

圖4顯示根據本發明之實施例判定自孕婦之血漿DNA組織圖譜分析之百分率貢獻的表400。此等結果亦顯示胎盤係孕婦中之血漿DNA之另一主要貢獻者，及分率濃度自9.9%至38.4%。

吾人亦使用非孕婦具有之父性遺傳之胎兒單核苷酸多型性(SNP)對偶基因測量胎盤貢獻。為分析胎兒特異性SNP對偶基因，藉由分析絨毛膜絨毛樣本或胎盤判定胎兒之基因型。藉由分析血液細胞判定孕婦之基因型。基於SNP之結果顯示甲基化解卷積結果之獨立驗證。

圖3B顯示根據本發明之實施例之自血漿DNA甲基化解卷積推算之由胎盤貢獻之血漿DNA分率與使用胎兒特異性SNP對偶基因推算之胎兒DNA分率間之相關性的圖350。圖350顯示藉由甲基化解卷積判定之胎盤貢獻與使用SNPs測得之胎兒DNA分率強相關(r=0.99，p<0.001，皮爾遜相關(Pearson correlation))。因此，兩個參數值間觀察到良好正相關，此指示血漿DNA甲基化解卷積準確判定胎盤對母體血漿樣本之貢獻。

圖5顯示根據本發明之實施例之藉由血漿DNA組織圖譜分析推算之除胎盤外之器官之百分率貢獻及基於胎兒特異性SNP對偶基因之胎兒DNA分率的圖。X軸表示藉由基於SNP之分析評估之胎兒DNA分率及Y軸表示藉由血漿組織DNA圖譜分析推算之百分率貢獻。嗜中性細胞之血漿DNA貢獻顯示反相關。此可能係由於嗜中性細胞係血漿DNA池之主要貢獻者之事實，及因此當胎盤貢獻增加，嗜中性細胞之相對貢獻將必然減小。剩餘組織之甲基化解卷積結果顯示與胎兒DNA分率無關。

圖6顯示根據本發明之實施例之非孕健康對照個體間之血漿DNA組織圖譜分析之百分率貢獻的表600。當將該方法應用於非孕健康對照個體之血漿時，大部分樣本中缺少胎盤貢獻(中值：0%；四分位數範圍：0%至0.3%)。

2. 所選標誌相對隨機標誌之比較

以所選標誌相對隨機標誌測試百分率貢獻之準確度。對不同組之標誌進行不同組成計算。基於上述標準選擇一組，及另一組係隨機組。結果顯示為獲得準確結果，依法選擇甲基化標誌(基因組基因座)係重要的。

招募十一名孕婦及四名健康非孕個體以供此分析。其等血漿DNA係經亞硫酸氫鹽轉化並使用Illumina HiSeq2000定序儀定序。以一道定序流動細胞定序每個血漿樣本。然後使用生物資訊學程式(Methy-Pipe(Jiang P.PLoS One 2014；9：e100360))分析序列讀段。該程式可比對經亞硫酸氫鹽轉化之序列讀段與參考基因組並判定每個經定序之片段上之每個CpG位點之甲基化狀態。因此，可使用各對齊參考基因組之基因組位點中之至少一者之序列讀段測量混合物甲基化程度。

第一組標誌具有用於識別血漿DNA中之不同組織之高特異性。對每個組織類型，選擇相較於其他組織具有最大甲基化密度差值的標誌。該等標誌係判定自含有至少一個CpG二核苷酸之基因組區域。在此實例中，CpG島(CGIs)用作可能之標誌，其等於DNA之特定拉伸中具有高頻率CpG位點。該特定實例中之CGIs係下載自加州大學，Santa Cruz(UCSC)資料庫：(genome.ucsc.edu)。總而言之，吾人自人類基因組獲得27,048個CpG島。CpG島之中值尺寸係565bp(範圍：200bp至45kb)。該島之90%係小於1.5kb。

對每個甲基化標誌，判定在受關注之組織與其他組織間之甲基化密度之差值。然後將該差值表示為跨其他組織之標準偏差(SDs)之數量。對受關注之組織，根據甲基化密度之該差值排列所有標誌。選擇20個具有超過(10個標誌)及低於(10個標誌)其他組織之平均甲基化密度之最大差值的標誌。標誌數量之其他實例包含5、15、20、30、40、50、100及200。

此外，亦選擇具有跨所有不同組織之高變異性的標誌。在此實例中，選擇在最高與最低甲基化密度之組織間具有>50%之差值的標誌。該差值之其他實例包含20%、30%、40%、60%、70%及80%。此外，亦基於平均值及SD計算甲基化密度跨不同組織之變異性。在此實例中，若SD值多於兩倍平均值，則亦選擇標誌。截止值之其他實例可包含1、1.5、2.5及3之標準偏差。基於此等選擇標準，為第一組選擇344個甲基化標誌。

對第二組，自上文討論之27,048個CGIs中隨機選擇341個標誌。首先自1至27,048編號所有CGIs。然後，藉由用於標誌選擇之電腦產生隨機數(1至27,048間)。然後重複該步驟直至選擇總計341個標誌。若已使用產生之隨機數，則將產生另一隨機數。預期該組標誌在識別組織特異性甲基化模式中具有低得多的特異性。因此，預期判定血漿DNA之組成之準確度降低。

圖7顯示根據本發明之實施例之使用第一組標誌(具有高器官特異性)評估的11名孕婦及4名非孕健康個體之不同器官對血漿DNA之貢獻的表700。胎兒DNA分率係藉由計數胎兒特異性對偶基因判定並顯示於底行中。在四名非孕對照個體之各者中，判定胎盤對血漿之貢獻接近於0%。此指示該方法之特異性。

圖8顯示根據本發明之實施例之使用第二組標誌(具有低器官特異性)評估的11名孕婦及4名非孕健康個體之不同器官對血漿DNA之貢獻的表800。藉由計數胎兒特異性對偶基因判定之胎兒DNA分率顯示於底行中。使用此等較低特異性標誌，觀察到胎盤之貢獻之相對非一致百分率，及4名非孕對照個體中觀察到胎盤之相當大貢獻。此指示該等標誌之組織特異性在該方法中係重要的。

圖9A係顯示在經評估之胎兒DNA分率(胎盤之貢獻)與藉由計數母體血漿樣本中之胎兒特異性對偶基因判定之胎兒DNA分率間之相關性的圖900。使用第一組甲基化標誌之該等兩種技術之結果具有良好相關性。然而，使用第二組甲基化標誌，藉由使用甲基化分析之評估顯示與使用胎兒特異性對偶基因計數判定之真實值的顯著偏差。

圖9B係顯示甲基化標誌之評估值與藉由胎兒特異性對偶基因計數判定之胎兒DNA分率間之絕對差值的圖950。使用第一組標誌及第二組標誌之使用甲基化分析之評估的中值誤差分別係4%及8%。

C 癌症病患

實施例亦可用於判定癌症病患之血漿中癌症衍生之DNA之數量。在此實例中，自10名患有肝細胞癌(HCC)之病患收集靜脈血液樣本。使用如上所述之組織特異性甲基化模式分析判定不同器官(包含肝臟、肺、結腸、小腸、胰臟、食道、腎上腺、心臟、腦及血液細胞)之百分率貢獻。此外，亦使用亞硫酸氫鹽定序分析腫瘤組織以識別腫瘤特異性甲基化模式。平均化所有不同組織之結果以判定代表性腫瘤組織模式。使用此等腫瘤特異性甲基化標誌，亦判定腫瘤對血漿DNA之貢獻。

使用總計828個器官特異性標誌以供該分析。作為對照，四名未患癌症之健康對照個體亦包含於該分析中。在每種情況下，藉由血漿之總甲基化程度判定癌症病患中之腫瘤組織對血漿DNA之實際貢獻。已顯示腫瘤組織相較於非腫瘤組織係通常低甲基化(Feinberg等人，Nature.1983；301：89-92及Chan等人，Proc Natl Acad Sci U S A.2013；110：18761-8)。非惡性組織之全基因組甲基化程度係約70%，而腫瘤組織之全基因組甲基化程度係約45%。因此，可使用下式評估對血漿DNA之腫瘤貢獻： f×45%+(1-f)×75%=MD _P

其中MD_P係血漿樣本之測得之全基因組甲基化程度及f係血漿中腫瘤衍生之DNA之分率濃度。已顯示評估腫瘤衍生之DNA分率之該方法與基於染色體畸變之偵測之方法良好相關(Chan等人，Proc Natl Acad Sci U S A.2013；110：18761-8)。

圖10顯示根據本發明之實施例之基於器官特異性甲基化模式分析之癌症病患及健康病患之不同組織對血漿DNA之貢獻的表1000。在四名未患癌症之健康對照個體之各者中，腫瘤組織之貢獻判定為0%。此指示該甲基化模式分析係特異性的。

圖11A係顯示根據本發明之實施例之藉由器官特異性甲基化模式分析判定之及藉由全基因組甲基化程度判定之腫瘤DNA分率值的圖1100。圖1100顯示在10名HCC病患中藉由器官特異性甲基化模式分析判定之腫瘤DNA分率與藉由全基因組甲基化程度分析判定之腫瘤DNA分率良好相關。

吾人亦藉由研究損失異質接合性之基因組區域測量血漿中HCC腫瘤DNA之分率濃度，此係一種吾人先前已命名為全基因組聚集對偶基因損失(GAAL)之技術(Chan KCA等人，(2013)Clin Chem 59(1)：211-224)。

圖11B係顯示基於血漿DNA組織圖譜分析之由肝臟貢獻之血漿DNA分率與藉由GAAL分析判定之腫瘤衍生之血漿DNA分率間之相關性的圖1150。圖1150顯示藉由甲基化解卷積推算之血漿中之肝臟衍生之DNA的貢獻與藉由GAAL測得之腫瘤DNA濃度間有良好相關性(r=0.63，p=0.015，皮爾遜相關)。

在另一實施例中，可以下列方式進行全基因組聚集對偶基因損失(GAAL)分析。可使用昂飛全基因組人類SNP矩陣6.0系統(Affymetrix Genome-Wide Human SNP Array 6.0 system)分析HCC情況之腫瘤樣本。可如先前描述識別顯示損失異質接合性(LOH)之區域(Chan等人，Clin Chem.2013；59：211-24)。可藉由使用下列方程式以全基因組方式分析法分析血漿定序資料中之顯示LOH之SNPs之對偶基因計數判定血漿中腫瘤衍生之DNA的分率濃度：

其中N_non-del表示腫瘤組織中攜載未刪除之對偶基因之序列讀段的數量，及N_del表示腫瘤組織中攜載經刪除之對偶基因之序列讀段的數量。

圖12A係顯示在各種時間下之病患HCC 10之血漿中之經評估之腫瘤衍生之DNA的圖1200。在手術前(Pre-Tx)及在病患之手術切除術後之3日及3個月時取得該等樣本。該病患係處於腫瘤切除術後2年之臨床緩解中。在腫瘤之手術切除術後之3日及3個月時，無法偵測於血漿中該腫瘤特異性甲基化模式。該發現係與手術後2年無任何可偵測之癌症之發現一致。

圖12B係顯示病患HCC 9之血漿中之經評估之腫瘤衍生之DNA的圖1250。在治療前(Pre-Tx)及在病患之手術切除術後之3日及2個月時取得該等樣本。該病患隨後在3個月時診斷為在剩餘未切除之肝臟中具有多處腫瘤沉積(手術時預先未知)及注意在該手術後之4個月時具有多個肺轉移。該病患在該手術後8個月時死於轉移性疾病。使用組織特異性甲基化模式分析，評估腫瘤組織在該手術後之3日及2個月時貢獻總血漿DNA中之8%及12%。

D 器官移植及解卷積

器官對血漿DNA之貢獻之定量可有效應用於監測接受器官移植之病患。已顯示由經移植之器官釋放之DNA水平在與經移植之器官之損害相關之情況下(例如，在組織排斥之情況下)將增加(De Vlaminck等人，Sci Transl Med.2014；6：241ra77)。然而，現存方法僅基於偵測供體與受體間不同之多型性標誌，例如，供體中存在但受體中缺乏之SNP對偶基因(De Vlaminck等人，Circulating cell-free DNA enables noninvasive diagnosis of heart transplant rejection.Sci Transl Med.2014；6：241ra77)或性誤配移植情況下之染色體Y序列(García Moreira等人，Cell-free DNA as a noninvasive acute rejection marker in renal transplantation.Clin Chem.2009；55：1958-66)。對多型性標誌之分析，基因分型需要器官供體及受體兩者之組織。供體及受體組織之基因分型將額外增加分析之成本及實務上可能無法獲得器官供體之組織。而且，染色體X及Y上之序列僅在供體及受體性別不同之情況下有用。因此，甲基化解卷積技術相較於一些先前技術可耗時更少及成本密集，及比其他先前技術更適用。

1. 分率之相關性

該部分顯示判定供體器官貢獻之血漿DNA之比例的準確度，判定方式為血漿DNA甲基化解卷積分析。在該方法中，無需供體及受體之組織之基因分型。

已接受移植之個體提供驗證血漿DNA組織圖譜分析方法之珍貴機會。藉由使用存在於器官供體中及移植受體中缺乏之SNP對偶基因，技術人員可如先前描述測量血漿中之移植器官之分率濃度(Zheng YW等人，2012)。然後可比較該結果與使用甲基化解卷積推算之結果。

圖13係顯示根據本發明之實施例之器官移植病患間之血漿DNA組織圖譜分析的表1300。吾人為4名肝臟移植受體及3名骨髓移植受體進行血漿DNA組織圖譜分析。在每種情況下，獲得供體及受體之組織並使用大規模平行定序進行基因分型。識別供體特異性SNP對偶基因並用於計算供體器官貢獻之血漿DNA之分率。在肝臟移植受體間比較使用供體特異性SNP對偶基因評估之供體DNA分率與肝臟貢獻，同時在骨髓移植受體間比較彼等者與白血液細胞貢獻(即，嗜中性細胞加淋巴細胞)。然後，進行血漿甲基化解卷積以分別判定在肝臟移植及骨髓移植之情況下之肝臟及血液細胞的貢獻。

圖14係顯示藉由血漿DNA組織圖譜分析推算之經移植之移植物貢獻之血漿DNA分率與使用供體特異性SNP對偶基因判定之供體DNA分率間之相關性的圖1400。三角形表示肝臟移植受體之結果及點表示骨髓移植受體之結果。圖1400顯示甲基化解卷積與基於SNP之結果間之強相關(r=0.99，p<0.001，皮爾遜相關)。

2. 不同標誌類型之比較

比較甲基化解卷積分析中之I型及II型標誌之相對貢獻。為公平比較其等貢獻，首先隨機選擇1013個II型標誌，使得用於後續分析之I型及II型標誌之數量相同。1013個I型標誌與1013個II型標誌形成池。

進行使用不同數量之隨機選擇之甲基化標誌的甲基化解卷積以判定經移植之器官(即，肝臟移植受體之肝臟及骨髓移植受體之血液細胞)之貢獻。已隨機選擇標誌後，進行基於實際定序資料之解卷積分析。在每個分析中，使用相同數量之I型及II型標誌。然而，標誌總數在不同組之解卷積分析中變化以判定標誌數量對甲基化解卷積分析之準確度之影響。對每個分析，標繪藉由甲基化解卷積分析之經移植之器官對血漿DNA之百分率貢獻與衍生自供體特異性SNP對偶基因之值間的差值。

圖15A係顯示比較使用用於甲基化解卷積之503個I型、503個II型及兩種類型(各503個)之標誌之準確度之分析的圖1500。顯示已接受肝臟移植之病患(LTP1至LTP5)及已接受骨髓移植之病患(BMT1至BMT3)之藉由甲基化解卷積分析之經移植之器官對血漿DNA之百分率貢獻與衍生自供體特異性SNP對偶基因之值間之差值。對每個病患，藉由左邊、中間及右邊之箱分別顯示僅使用I型標誌、僅使用II型標誌及使用兩種類型標誌之甲基化解卷積結果。單獨使用I型標誌之分析相較於僅使用II型標誌或兩種類型標誌具有更大偏差。另一方面，觀察到在僅使用II型標誌與使用兩種類型標誌之結果間無顯著差異。

圖15B係顯示比較使用用於甲基化解卷積之251個I型、251個II型及兩種類型(各251個)標誌之準確度之分析的圖1550。顯示已接受肝臟移植之病患(LTP1至LTP5)及彼等已接受骨髓移植者(BMT1至BMT3)之藉由甲基化解卷積分析之經移植之器官對血漿DNA之百分率貢獻與衍生自供體特異性SNP對偶基因之值間的差值。對每個病患，藉由左邊、中間及右邊之箱分別顯示僅使用I型標誌、僅使用II型標誌及使用兩種類型標誌之甲基化解卷積結果。單獨使用I型標誌之分析相較於僅使用II型標誌或兩種類型標誌之分析具有更大偏差。另一方面，觀察到在僅使用II型標誌與使用兩種類型標誌之結果間無顯著差異。

圖16A係顯示比較使用用於甲基化解卷積之52個I型、52個II型及兩種類型(各52個)標誌之準確度之分析的圖1600。顯示已接受肝臟移植之病患(LTP1至LTP5)及彼等已接受骨髓移植者(BMT1至BMT3)之藉由甲基化解卷積分析之經移植之器官對血漿DNA之百分率貢獻與衍生自供體特異性SNP對偶基因之值間的差值。對每個病患，藉由左邊、中間及右邊之箱分別顯示僅使用I型標誌、僅使用II型標誌及使用兩種類型標誌之甲基化解卷積結果。僅使用I型標誌之分析相較於僅使用II型標誌或兩種類型標誌之分析具有更大偏差。另一方面，觀察到在僅使用II型標誌與使用兩種類型標誌之結果間無顯著差異。

圖16B係顯示比較使用用於甲基化解卷積之52個I型、52個II型及兩種類型(各52個)標誌之準確度之分析的圖1650。顯示已接受肝臟移植之病患(LTP1至LTP5)及彼等已接受骨髓移植者(BMT1至BMT3)之藉由甲基化解卷積分析之經移植之器官對血漿DNA之百分率貢獻與衍生自供體特異性SNP對偶基因之值間的差值。對每個病患，藉由左邊、中間及右邊之箱分別顯示僅使用I型標誌、僅使用II型標誌及使用兩種類型標誌之甲基化解卷積結果。單獨使用I型標誌之分析相較於僅使用II型標誌或兩種類型標誌之分析具有更大偏差。另一方面，觀察到在僅使用II型標誌與使用兩種類型標誌之結果間無顯著差異。

圖17A係顯示比較使用用於甲基化解卷積之26個I型、26個II型及兩種類型(各26個)標誌之準確度之分析的圖1700。顯示已接受肝臟移植之病患(LTP1至LTP5)及彼等已接受骨髓移植者(BMT1至BMT3)之藉由甲基化解卷積分析之經移植之器官對血漿DNA之百分率貢獻與衍生自供體特異性SNP對偶基因之值間的差值。對每個病患，藉由左邊、中間及右邊之箱分別顯示僅使用I型標誌、僅使用II型標誌及使用兩種類型標誌之甲基化解卷積結果。僅使用I型標誌之分析相較於僅使用II型標誌或兩種類型標誌之分析具有更大偏差。另一方面，觀察到在僅使用II型標誌與使用兩種類型標誌之結果間無顯著差異。

圖17B係顯示比較使用用於甲基化解卷積之13個I型、13個II型及兩種類型(各13個)標誌之準確度之分析的圖1750。顯示已接受肝臟移植之病患(LTP1至LTP5)及彼等已接受骨髓移植者(BMT1至BMT3)之藉由甲基化解卷積分析之經移植之器官對血漿DNA之百分率貢獻與衍生自供體特異性SNP對偶基因之值間的差值。對每個病患，藉由左邊、中間及右邊之箱分別顯示僅使用I型標誌、僅使用II型標誌及使用兩種類型標誌之甲基化解卷積結果。僅使用I型標誌之分析相較於僅使用II型標誌或兩種類型標誌之分析具有明顯更大偏差。另一方面，觀察到在僅使用II型標誌與使用兩種類型之標誌之結果間無顯著差異。

整體而言，II型標誌比I型標誌提供更佳結果，此係令人驚訝的，尤其在給定專注於先前研究中之I型標誌下。吾人之結果亦顯示更多標誌提供較大準確度。

E 不同標準之影響

如上所述，可使用各種標準以識別不同類型之標誌。例如，可藉由特定組織中之甲基化程度不同於所有組織之平均甲基化程度來識別I型標誌，例如，至少相差特定臨限值(諸如3倍SD)。而且，對II型標誌，使用具有某一變異及最大差值之標準。下文部分顯示用於識別標誌之不同標準之準確度。

1. 以較不嚴格之標準識別之標誌的表現

吾人使用具有跨不同組織之不同變異性之標誌比較甲基化解卷積分析的表現。基於兩組具有不同選擇標準之標誌判定15名孕婦之血漿DNA的胎盤貢獻。兩組標誌包含如先前部分描述之所有I型標誌。然而，兩組標誌之II型標誌之選擇標準不同。

第I組標誌包含滿足具有>0.25之甲基化密度CV及組織群之最大與最小甲基化密度間之超過0.2之差值之標準的所有5820個II型標誌。對第II組標誌，該CV要求係>0.15及組織群之最大與最小甲基化密度間之差值超過0.1。該組標誌中有8,511個II型標誌。

圖18A係顯示根據本發明之實施例之使用具有不同選擇標準之標誌推算之血漿DNA之胎盤貢獻的圖1800。垂直軸對應於使用第II組標誌推算之胎盤貢獻。水平軸對應於使用第I組標誌推算之胎盤貢獻。基於具有不同選擇標準之兩組標誌，胎盤貢獻結果間具有良好相關性(r=0.99，皮爾遜相關)。因此，使用CV>0.15及組織群之最大與最小甲基化密度間之差值超過0.1之要求可獲得良好準確度。

2. 相同類型組織內之甲基化程度變異的影響

為研究相同類型組織(例如，來自不同個體)間之標誌之甲基化程度之變異是否將影響解卷積分析之表現，吾人分析兩個懷孕案例之胎盤組織。識別甲基化標誌之兩種類別。具體言之，該等兩種類別係基於其於兩個胎盤組織之甲基化程度中之相似性來識別。i類標誌具有10%或更低之甲基化密度。ii類標誌具有在兩個胎盤組織間之高變異性(甲基化密度中之差值超過10%)。

圖18B係顯示使用在相同類型組織中具有低變異性(i類)及高變異性(ii類)之標誌之血漿DNA解卷積之準確度的圖1850。進行血漿DNA解卷積以判定15名孕婦之血漿DNA之胎盤貢獻。對每個標誌，兩個胎盤組織之甲基化密度之平均值用以表示該分析中之胎盤的甲基化程度。對使用i類及ii類標誌之解卷積分析之各者，使用總計1024個標誌。

基於胎兒特異性SNP對偶基因之比例進一步判定血漿中之胎盤衍生之DNA之量。然後比較藉由基於i類及ii類標誌之甲基化解卷積分析推算之百分率貢獻與基於胎兒特異性SNP對偶基因之結果。使用i類及ii類標誌推算之胎盤貢獻離基於胎兒特異性對偶基因評估之值的中值偏差分別係2.7%及7.1%。因此，使用具有較低個體間組織甲基化程度變異之i類標誌在甲基化解卷積分析中給出更佳準確度。

當使用在相同類型組織內具有高變異性之標誌(ii類)時，觀察到甲基化解卷積與胎兒特異性對偶基因分析之結果之間具有明顯較高差值(P<0.0001，威爾卡森(Wilcoxon)符號秩檢定)。換言之，使用相同類型組織內具有低變異性之標誌將增加甲基化解卷積分析之準確度。因此，可基於相同類型組織內之變異性選擇標誌，例如(但不限於)，CV值及相同類型組織之最大與最小甲基化密度間之差值。

IV 自增加之貢獻識別組織中之疾病

在一個使用經判定之分率貢獻之應用中，實施例可自特定組織類型偵測相對於參考程度之異常分率貢獻。在一個實施例中，該等參考程度可對應於該組織類型健康之生物中已建立之值。在另一實施例中，該參考程度可對應於使用不同尺寸範圍之無細胞DNA分子判定之分率貢獻。

A 相對於健康百分率增加之百分率

實施例可偵測特定組織類型之經判定之分率貢獻高於對健康生物所預期之正常分率貢獻。組織患病將引起特定組織類型之分率貢獻增加，並因此釋放更多無細胞DNA分子。例如，患病器官由於細胞凋亡或其他細胞機制而將釋放更多無細胞DNA分子。

1. 判定未知原發癌症之組織起源

在先前研究中，已證明可偵測癌症病患之無細胞血漿中腫瘤相關DNA變化。例如，可偵測癌症病患之血漿DNA中癌症相關染色體拷貝數變化及癌症相關整體低甲基化。因此，血漿DNA之分析將可能對篩選表面健康個體中之癌症有用(Chan等人，Proc Natl Acad Sci U S A.2013；110：18761-8及Chan等人，Clin Chem.2013；59：211-24)。偵測血漿中之癌症相關特徵後，判定原發腫瘤之位置亦係重要的。

此處，吾人提出腫瘤細胞將顯示一些起源自原發組織之DNA甲基化特徵。吾人推論腫瘤衍生之DNA相較於其他組織將具有更類似於起源之起源組織之甲基化圖譜。因此，在血漿中之腫瘤衍生之DNA之存在下，腫瘤起源之組織對血漿DNA之貢獻將明顯增加。因此，分析癌症病患之血漿DNA中之組織特異性DNA甲基化模式將對指示原發腫瘤之位點有用。

在此實例中，吾人分析上文討論之10名HCC病患、兩名肺癌病患及一名直腸癌病患之血漿DNA。使用不同器官之甲基化模式進行分析。然而，腫瘤組織之甲基化模式非包含於該分析中，因為在癌症篩選方案中，該腫瘤組織通常不可用於甲基化分析。

圖19係顯示根據本發明之實施例之基於器官特異性甲基化模式分析之患有各種癌症之病患及健康個體之不同組織對血漿DNA之貢獻的表1900。相較於健康個體之平均值，10名HCC病患中之9名之血漿中之肝臟貢獻增加。肺癌及直腸癌病患中肺及結腸之貢獻分別增加。因此，病變組織確實對應於異常分率貢獻。

圖20顯示根據本發明之實施例之與四名對照個體之平均值相比之每名癌症病患之不同器官之貢獻的表2000。該等貢獻顯示為自四名對照個體之平均值之分率貢獻差值。

正值及負值分別指示特定器官之貢獻之增加及減小。在每名病患中，粗體數字表示相較於對照個體之最大增量。對10名HCC病患中之8名，肝臟之貢獻相較於四名對照個體具有最大增加。對兩名肺癌病患，肺之貢獻顯示最大增加。對直腸癌病患，該最大增加係結腸。此等結果顯示血漿中之組織特異性甲基化模式分析可對判定隱藏原發癌症之癌症起源有用。

圖21A係顯示根據本發明之實施例之HCC及健康對照個體之自甲基化標誌評估之肝臟對血漿DNA之貢獻的圖2100。相較於對照個體，HCC個體中之血漿之肝臟貢獻顯著提高。因此，分率貢獻可用作樣本之測量值，其中可比較該測量值與臨限值(例如，約8%)以識別疾病之高風險。與臨限值之比較可提供該組織類型是否病變之類別，其中該類別可係組織病變之可能性之不同程度。

提供使用應用於癌症偵測之甲基化解卷積分析血漿DNA之其他實例。為證明此現象，分析29名肝細胞癌(HCC)病患、四名肺癌病患及一名直腸癌病患之血漿DNA。招募三十二名健康個體作為對照，如顯示於圖6之表600中。其中，26名HCC病患、4名肺癌病患及32名對照之血漿DNA全基因組亞硫酸氫鹽定序結果已報告於先前研究中(Chan等人，Proc Natl Acad Sci U S A.2013；110：18761-8)。在此等實例中，使用亞硫酸氫鹽定序判定血漿DNA之甲基化圖譜。亦可使用其他甲基化偵測方法，例如(但不限於)彼等最後部分中提及者。

圖21B係顯示健康對照個體與HCC病患間之如本發明之實施例推算之由肝臟貢獻之血漿DNA之百分率的圖2150。相較於對照個體，HCC病患中由肝臟貢獻之血漿DNA之百分率明顯更高(P<0.001，Mann-Whitney秩和檢定)。圖2150提供比較組織之分率貢獻與參考值以識別組織之疾病狀態之能力之其他證據。

圖22A及22B顯示自本發明之實施例推算之(A)肺及(B)結腸之百分率貢獻及未孕健康對照個體與肺癌或直腸癌病患間之比較。圖22A係顯示相較於對照個體，肺癌病患中由肺貢獻之血漿DNA之百分率明顯更高(P=0.002，Mann-Whitney秩和檢定)的圖2200。圖22B係顯示相較於所有對照個體，由肺癌病患之結腸貢獻之血漿DNA之百分率更高的圖2250。此等資料顯示使用甲基化解卷積分析之血漿DNA分析對識別癌症之起源組織(例如，在已將病患識別為可能患有癌症後)有用及對篩選病患以首先識別組織之疾病狀態有用。

圖23係顯示根據本發明之實施例之癌症病患間之血漿DNA組織圖譜分析之表2300。該甲基化解卷積指示HCC及對照個體之肝臟對血漿貢獻之中值百分率分別係12.9%(四分位數範圍：8.7%-32.9%)及5.5%(四分位數範圍：4.6%-7.1%)。

2. 基於增加之貢獻偵測疾病狀態之方法

圖24係繪示根據本發明之實施例之分析無細胞DNA分子之DNA 混合物以基於組織對該DNA混合物之高分率貢獻識別疾病狀態之方法2400的流程圖。該生物樣本包含複數個組織類型(包含第一組織類型)之無細胞DNA分子之混合物。

在區塊2410中，識別N個基因組位點以供分析。該等N個基因組位點可具有各種屬性，例如，如上所述。例如，該等N個基因組位點可包含僅I型或II型位點或兩者之組合。可以類似圖1之區塊110之方式進行區塊2410。

在區塊2420中，接收包含M個組織類型之無細胞DNA分子之混合物的生物樣本。可以類似圖1之區塊130之方式進行區塊2420。

在區塊2430中，分析該生物樣本之無細胞DNA分子以識別其等在對應於該生物之參考基因組中之位置。可以類似圖1之區塊140之方式進行區塊2430。經分析之無細胞DNA分子可係短DNA片段，其等可以較小數量之DNA片段提供足夠之準確度，如闡述於下文之IV.B部分中。

在區塊2440中，使用分別位於參考基因組之N個基因組位點中任一者處之無細胞DNA分子測量N個基因組位點之N個混合物甲基化程度。可測量N個基因組位點之各者之一個混合物甲基化程度。可以類似圖1之方法100之區塊150之方式進行區塊2440。因此，可使用測量DNA分子之甲基化程度之任何技術。在一些實施例中，DNA分子之甲基化程度之測量可使用甲基化感測定序結果，亦可使用該等結果以判定該DNA分子之位置。

在區塊2450中，使用N個第一甲基化程度判定該混合物中第一組織類型之第一分率貢獻。在一些實施例中，可經由圖1之方法100之區塊160及170進行區塊2450。因此，可同時判定一組M個組織類型之分率貢獻。區塊2450可使用對M個組織類型之各者判定之N個基因組位點之N個組織特異性甲基化程度(例如，如在圖1之方法100之區塊120 中)。

在區塊2460中，計算在第一分率貢獻與參考分率貢獻間之分離值。例如，該分離值可包含第一分率貢獻及參考分率貢獻之差值或比率。該分離值可包含其他因數，及可使用分率貢獻之函數之差值。可使用對第一組織類型健康之生物之樣本判定參考分率貢獻。

在區塊2470中，可比較該分離值與臨限值以判定第一組織類型是否已具有疾病狀態之類別。如本文作為結果顯示，特定組織類型對該混合物之量的統計上顯著增加指示疾病狀態。若總貢獻限制為1(即，100%)，則特定組織類型之增加將伴隨該混合物中一或多個其他組織之對應減少。因此，可比較該混合物中第一組織類型之第一量(例如，分率貢獻)與臨限值量以判定該第一組織類型是否具有疾病狀態之類別。

在一個實施例中，基於第一組織類型健康之第一組生物之混合物中第一組織類型的量及第一組織類型患病之第二組生物之混合物中第一組織類型的量判定臨限值。該等患病生物可具有經測試之疾病(例如，癌症)。例如，該等第二組生物可在第一組織類型中具有癌症。如另一實例，該等第二組生物可具有已被排斥之第一組織類型之移植物。對移植器官，疾病狀態之識別可對應於該生物是否排斥該第一組織類型之類別，其中該排斥係疾病狀態。

3. 全身性紅斑狼瘡(SLE)

為進一步說明血漿DNA甲基化解卷積分析之可能效用，吾人分析九名SLE病患之血漿DNA。此等病患具有小於8之SLE疾病活動指數(SLEDAI)，此指示其等疾病係相對不活動的。對此等八名病患進行血漿DNA甲基化解卷積。

圖25係顯示根據本發明之實施例之九名SLE病患之藉由甲基化解卷積所得之不同器官對血漿DNA之百分率貢獻的表2500。相較於其他 SLE病患，病患8及9中之肝臟之貢獻增加。病患8具有藥物引起之肝炎及235U/L之高丙胺酸轉胺酶(ALT)活性。病患9具有涉及肝臟之瀰漫性結核病。此等結果表明血漿DNA甲基化解卷積分析可識別受影響器官之病理學。

4. 識別與經偵測之疾病相關之組織類型

當可見大增加百分率時，先前部分自動判定組織類型作為識別疾病之一部分。若藉由其他方式識別疾病，則特定組織類型之較小增加可容許識別組織類型，即使該增加不足以大至藉由其本身表示疾病狀態。例如，若上文識別癌症，則上文之分析可識別涉及之組織。V部分中提供識別經偵測之癌症之組織類型之實施例的另一描述。

B 尺寸選擇與甲基化解卷積

作為另一選擇或除識別相對於健康組織之值之高分率貢獻外，實施例亦可分析不同尺寸之無細胞DNA分子之分率貢獻。此外當進行時，可將某些組織類型識別為具有高分率貢獻，及尺寸分析可證實該組織類型是否患病。

關於無細胞DNA分子之尺寸，已證明胎兒衍生之DNA之尺寸分佈短於孕婦之血漿中母體衍生之DNA的尺寸分佈。此外，腫瘤衍生之DNA之尺寸分佈短於衍生自癌症病患中之非惡性組織之DNA的尺寸分佈(Jiang等人，Proc Natl Acad Sci U S A.2015；112：E1317-25)。因此，長及短DNA片段之選擇性分析將可識別特定組織之短無細胞DNA分子之富集。

因此，可藉由分析特定尺寸之DNA片段獲得增高準確度。例如，於患有肝癌之病患中將觀察肝臟對血漿DNA之增加之貢獻。已證明衍生自肝癌之血漿DNA分子短於衍生自非惡性組織之血漿DNA(Jiang等人，Proc Natl Acad Sci U S A.2015；112：E1317-25)。因此，相較於分析長DNA分子時，當分析短DNA分子時肝臟之貢獻更高之觀察將進一步支持肝臟貢獻之提高與病患中之肝癌之存在一致。

1. 結果

使用雙末端定序協定(paired-end sequencing protocol)定序三個母體血漿樣本及兩個癌症病患之血漿樣本，使得可判定每個血漿DNA分子之兩端上之最外核苷酸於參考人類基因組中的座標。然後可自兩端之核苷酸之該等座標推算每個血漿DNA分子之尺寸。

為說明當選擇性分析短或長DNA分子時血漿DNA之組成是否將不同，吾人已任意使用150bp之截止以界定長及短DNA分子。尺寸截止之其他實例包含70bp、75bp、80bp、90bp、100bp、110bp、120bp、130bp、140bp、160bp、170bp、180bp、190bp及200bp。除長度外，質量亦可用作尺寸之量度。作為質譜法之一實例，較長分子將具有較大質量(尺寸值之實例)。長度係尺寸之另一實例，例如，如以鹼基對測量。亦可使用物理方法進行尺寸選擇，諸如藉由凝膠電泳或藉由過濾或藉由尺寸選擇性沉澱或藉由雜交。

以下結果顯示尺寸分析可與經由甲基化解卷積分析血漿DNA之組織貢獻組合使用。在一些實施例中，血漿DNA之甲基化解卷積可關注血漿DNA之特定尺寸範圍。當非造血組織之DNA分子具有較短尺寸分佈時，短DNA片段之選擇性分析可對釋放自靶向器官之DNA進行更具成本效益之分析。例如，為判定是否對接受肝臟移植之病患中之經移植之肝臟造成顯著損害，可僅對短DNA片段進行甲基化解卷積。由於當選擇性分析短DNA片段時，非造血組織將對血漿DNA具有較高分率貢獻，因此可以分析較少無細胞DNA分子獲得與參考值之統計差值。例如，較高分率貢獻導致較少細胞游離無細胞DNA分子之分率貢獻之可偵測變化(即，超過臨限值之變化)，由於非造血組織之無細胞DNA分子之較高濃度所致。因此，方法2400中分析之無細胞DNA分子可低於尺寸截止，此可提供針對較少無細胞DNA分子之所需準確度。肝臟貢獻在此情況下之增加可指示經移植之肝臟中之增加之細胞凋亡。

圖26A係顯示根據本發明之實施例判定自三名孕婦(M6941p、M7171p及M396p)之不同長度之無細胞DNA分子之胎盤貢獻的圖2600。相較於涉及所有血漿DNA而無尺寸選擇之分析，當僅分析<150bp之短血漿DNA片段時，血漿DNA之胎盤貢獻係更高。相比之下，相較於涉及所有血漿DNA而無尺寸選擇之分析，當僅分析

150bp之長血漿DNA片段時，血漿DNA之胎盤貢獻係更低。

此等結果係與胎盤衍生之DNA(具有胎兒之相同基因型)的尺寸分佈短於母體衍生之DNA之尺寸分佈一致。可使用此類結果指示實施例以偵測特定組織類型中之病症。

圖26B係顯示根據本發明之實施例判定自移植病患之不同長度之無細胞DNA分子之非造血組織之貢獻的圖2650。合併五名已接受肝臟移植之病患(LT病患)之序列讀段以供分析。作為對照，合併四名健康對照個體之序列讀段以供該分析。吾人觀察到相較於涉及所有血漿DNA而無尺寸選擇之分析，當僅分析<150bp之短血漿DNA片段時，非造血組織之比例貢獻增加。相較於涉及所有血漿DNA而無尺寸選擇之分析，當僅分析

150bp之長血漿DNA片段時，該比例貢獻減小。

此類結果亦指示實施例可識別器官中之病症。儘管實施例通常將不用以識別經移植之器官，但實施例可監測不同尺寸之分率貢獻間之分離值(例如，差值或比率)。當分離值增加時，可識別經移植之器官的問題。

圖27A係顯示根據本發明之實施例判定自移植病患之不同長度之無細胞DNA分子之肝臟之貢獻的圖2700。亦分析健康對照個體及已接受肝臟移植之病患之肝臟之比例貢獻。相對於涉及所有血漿DNA而無尺寸選擇之分析，當分析短DNA片段時肝臟之比例貢獻增加，及當分析長DNA片段時，肝臟之比例貢獻減小。

相較於當分析長DNA片段時，當分析血漿中之短DNA片段時，肝臟之貢獻更高。此外，差值量大於除肝臟外亦包含其他組織之非造血組織。此類結果進一步說明精確定位具有與較短無細胞DNA分子之增加相關之病症之組織的能力。

圖27B係顯示根據本發明之實施例判定自HCC病患之不同長度之無細胞DNA分子之肝臟之貢獻的圖2750。分析兩名HCC病患之肝臟之比例貢獻。相對於涉及所有血漿DNA而無尺寸選擇之分析，當分析短DNA片段時肝臟之比例貢獻增加及當分析長DNA片段時肝臟之比例貢獻減小。

因此，實施例可分析長及短無細胞DNA分子之分率貢獻間之分離值以識別患病組織。可判定一組組織類型之各者之此類分離值。當特定組織類型之特定分離值係超過臨限值時，則可如對應於疾病狀態類別組織類型。如技術人員可見，正常生物之差別係僅數個百分點，其中HCC情況下之差別係接近8%或更大。

2. 方法

圖28係繪示根據本發明之實施例之分析無細胞DNA分子之DNA混合物以基於組織對不同尺寸之無細胞DNA分子之該DNA混合物之差別分率貢獻識別該組織中之疾病狀態之方法的流程圖。生物樣本包含複數個組織類型(包含第一組織類型)之無細胞DNA分子之混合物。

在區塊2810中，分析該生物樣本之複數個無細胞DNA分子。可以類似圖1之方法100之區塊140之方式進行區塊2810。例如，可分析至少1,000個無細胞DNA分子以判定該等無細胞DNA分子位於何處，及可如下文之描述測量甲基化程度。

此外，可測量該等複數個無細胞DNA分子之各尺寸。可以各種方式測量該等尺寸。例如，可定序(例如，使用甲基化感測定序)該等無細胞DNA分子以獲得序列讀段，及尺寸可對應於序列讀段之長度。可將該等序列讀段比對參考基因組以判定無細胞DNA分子位於何處。在一個實施方案中，該定序包含定序無細胞DNA分子之各兩端，及該比對包含比對該等兩端。可基於將兩端比對參考基因組判定該等複數個無細胞DNA分子之尺寸。

可以不同之程序進行位置及尺寸之判定，例如，可進行物理分離，及然後可判定(例如，使用定序或雜交探針)位置。該物理分離方法之實例包含凝膠電泳、過濾、尺寸選擇性沉澱或雜交。可在分析無細胞DNA分子前進行該物理分離方法以判定其等位置。在一個實施方案中，可使用雜交探針判定該等位置。在其他實施例(例如，定序)中，可判定該等複數個無細胞DNA分子之各尺寸。

在區塊2820中，識別分別位於對應於生物之參考基因組之N個基因組位點之任一者之複數個無細胞DNA分子。只要無細胞DNA分子包含該等N個基因組位點中之一者，則可將其包含於內。如本文描述，可以各種方式及使用各種標準識別N個基因組位點。可使用II部分中描述之技術。N係可大於或等於10之整數。

在區塊2830中，識別第一組具有在第一尺寸範圍內之尺寸之複數個無細胞DNA分子。該第一尺寸範圍可對應於任何尺寸範圍，例如，小於特定長度；大於特定長度；或在兩個尺寸之間。可藉由物理方法(例如，如本文描述之方法)或藉由已知每個DNA分子之尺寸並在電腦上識別其等而識別該第一組。

在區塊2840中，使用第一組複數個無細胞DNA分子測量N個基因組位點之N個第一混合物甲基化程度。可測量N個基因組位點之各者之一個第一混合物甲基化程度。可以類似圖1之方法100之區塊150之方式進行區塊2840。

在區塊2850中，使用該等N個第一甲基化程度判定混合物中第一組織類型之第一分率貢獻。在一些實施例中，可經由圖1之方法100之區塊160及170進行區塊2850。因此，可同時判定一組M組織類型之分率貢獻。

在區塊2860中，識別第二組具有在第二尺寸範圍內之尺寸之複數個無細胞DNA分子。該第二尺寸範圍係不同於該第一尺寸範圍。該第二尺寸範圍可對應於任何尺寸範圍，例如，小於特定長度；大於特定長度；或無尺寸選擇(即，所有尺寸)，只要其不同於該第一尺寸範圍即可。當該第二尺寸範圍無尺寸選擇時，該第一尺寸範圍將係該第二尺寸範圍之子集。

在一些實施例中，該等兩種尺寸範圍不重疊，而在其他實施例中可存在重疊。該等尺寸範圍不集中於相同尺寸，但偏移(offset)，可能不重疊。在一個實施例中，該第一尺寸範圍係小於150個鹼基及該第二尺寸範圍係150個鹼基及更高。

在區塊2870中，使用第二組複數個無細胞DNA分子測量N個基因組位點之N個第二混合物甲基化程度。可測量N個基因組位點之各者之一個第二混合物甲基化程度。可以類似區塊2840之方式進行區塊2870。

在區塊2880中，使用該等N個第二甲基化程度判定混合物中第一組織類型之第二分率貢獻。可以類似區塊2850之方式進行區塊2880。

在區塊2890中，計算第一分率貢獻與第二分率貢獻間之分離值。分離值之實例如本文描述，且包含差值或比率。若一種組織類型向該混合物貢獻相對多短DNA分子，則較短尺寸範圍之分率貢獻將較高。

在區塊2895中，比較該分離值與臨限值以判定第一組織類型是否具有疾病狀態之類別。一種類別可為當該分離值超過該臨限值時，該第一組織類型具有疾病狀態。該疾病狀態可識別因釋放不成比例數量之較短無細胞DNA分子而導致之組織問題(例如癌症)。該臨限值可定義為可判定之負數或絕對值。

在一些實施例中，該臨限值可基於對第一組織類型健康之第一組生物之混合物判定之分離值及第一組織類型患病之第二組生物之混合物判定之分離值來判定。各種類別可解釋分離值超過臨限值多少。因此，可如本文所述之任何方法使用多個臨限值。

V 識別對應於拷貝數畸變之組織

拷貝數畸變對應於染色體區域(例如，整個染色體或染色體之部分)中之擴增及缺失。拷貝數畸變(CNA)存在於許多腫瘤中並可因此指示癌症或其他疾病之存在。可於以引用之方式併入本文中之美國專利案第8,741,811號中發現藉由偵測顯示CNA之區域識別癌症之其他細節。但技術人員僅自CNA分析可能無法獲知腫瘤之起源。實施例可使用甲基化解卷積以識別對應於拷貝數畸變之無細胞DNA分子之起源。實施例亦可使用甲基化解卷積以測試特定之染色體區域。

例如，血漿由自體內多個組織釋放之DNA組成。使用血漿DNA之全基因組亞硫酸氫鹽定序，吾人已獲得此等組織對循環DNA池的貢獻。如本文描述，藉由自代表每個組織類型之DNA甲基化標籤獲得參考值之生物資訊學解卷積方法識別該等組織貢獻者及其等相對比例。吾人於孕婦、癌症病患及移植受體中驗證該方法。實施例容許技術人員識別血漿DNA中觀察到之基因組畸變之起源組織。此方法在產前測試、腫瘤學、移植監測及其他領域中具有許多研究及診斷應用。

A 拷貝數畸變(CNAs)之組織圖譜分析

已將血漿中之拷貝數畸變之偵測用於非侵入性產前測試(Chiu RWK等人，(2008)Proc Natl Acad Sci U S A 105：20458-20463；Chiu RWK等人，(2011)BMJ 342：c7401；Bayindir B等人，(2015)Eur J Hum Genet doi：10.1038/ejhg 2014.282；及Norton ME等人，(2015)N Engl J Med 372：1589-1597)及癌症偵測(Leary RJ等人，(2012)Sci Transl Med 4(162)：162ra154；Chan等人，Proc Natl Acad Sci U S A.2013；110：18761-8；Heitzer E等人，(2013)Int J Cancer 133(2)：346-356)之情境中。若技術人員可識別拷貝數畸變之起源組織，則其係高度有利的。

對亞染色體拷貝數畸變之非侵入性產前偵測(Yu SCY等人，(2013)PLoS One 8(4)：e60968)，其將可用於識別血漿畸變是否已單獨起源自(i)胎盤；單獨起源自(ii)母體或起源自(iii)胎盤及母體兩者。對癌症篩選，其將係臨床資訊充分以能夠為後續診斷或治療程序識別癌症之起源組織。

通常可於不同類型之癌症中觀察到拷貝數畸變。可偵測癌症病患之血漿中與癌症相關之拷貝數畸變(Chan等人，Clin Chem.2013；59：211-24)。在癌症篩選之情境中，CNA之起源組織可不明顯。因此，若可識別CNA之起源組織，則其係有用的。可使用血漿DNA甲基化解卷積以識別血漿CNA之起源組織。

圖29係繪示根據本發明之實施例之用於判定拷貝數畸變之起源組織之方法2900的流程圖。方法2900可使用病患之血漿進行及至少部分使用電腦系統進行。

在區塊2910中，進行血漿DNA分析以識別顯示拷貝數畸變之區域。該畸變可對應於表現過量或表現不足。在一些實施例中，可將基因組分為小區段(例如，1-Mb小區段)，及可判定特定小區段之無細胞DNA分子之量(例如，藉由將序列結果對照至參考基因組之該部分)。可標準化特定小區段之量(例如，相對於小區段之平均量)以可識別表現過度或表現不足。

除基於CNA分析識別區域外，可於各種實施例中簡單選擇區域以供測試。例如，可懷疑區域具有CNA，例如，如通常可在腫瘤中具有畸變之某些區域。或者，對胎兒應用(下文描述)，某些染色體區域通常可具有畸變。

在區塊2915中，識別不存在CNA區域。在一些實施例中，方法2900可於該點處停止。

在區塊2920中，可進行甲基化解卷積，例如，如描述於圖1中。可對每個CNA區域進行甲基化解卷積。因此，可進行染色體區域特異性血漿DNA甲基化解卷積。

在區塊2932中，由於甲基化解卷積，獲得拷貝數增加之區域之組織貢獻。在區塊2934，由於甲基化解卷積，獲得無CNA之區域之組織貢獻。在區塊2936，由於甲基化解卷積，獲得拷貝數減少之區域之組織貢獻。

在區塊2940中，可比較不同染色體區域之組織貢獻。例如，可判定此等各種組織貢獻之分離值。對任何兩個區域，可判定特定組織之分離值。該等分離值將在拷貝數增加之區域與無CNA之區域間；在拷貝數增加之區域與拷貝數減少之區域間及在無CNA之區域與拷貝數減少之區域間。

在區塊2950中，可基於組織之分離值大小識別起源組織的本體。具有大貢獻之組織將釋放具有經測試之畸變之無細胞DNA分子。

對此應用，具有跨基因組展開之甲基化標誌係有利的。因此，II型甲基化標誌由於與I型標誌相比之其相對較大數量而特別有用。對某些實施例，技術人員可進一步調節標誌之選擇標準以進一步增加技術人員可使用之標誌數。在又其他實施例中，技術人員可組合I型及II型標誌兩者以進一步增加技術人員可使用之標誌數。

B 識別畸變區域

可以各種方式進行CNA分析，例如，如描述於美國專利案第8,741,811號中之方式。例如，可將人類基因組(或其他類型生物之基因組)分成約3000個非重疊性1-Mb小區段。可判定對照至每個1-Mb小區段之讀段數量。校正GC偏差後(Chen EZ等人，(2011)PLoS One 6(7)：e21791)，可計算每個小區段之序列讀段密度。對每個小區段，可比較測試情況下之序列讀段密度與參考對照個體之值。可將拷貝數增加及減少分別定義為比對照之平均值高及低3倍標準偏差。因此，識別第一染色體區域為顯示拷貝數畸變可係基於位於該第一染色體區域中之無細胞DNA分子之第一量。

為判定血漿中之拷貝數畸變之組織起源，可使用位於血漿中顯示此類畸變之基因組區域內之甲基化標誌進行血漿DNA組織圖譜分析。在下列癌症病患之實例中，僅在畸變影響至少30Mb之相鄰染色體區域之情況下進行血漿DNA拷貝數畸變之對照，使得甲基化標誌之數量足可用於對照。

C 偵測CNA之起源之實例

甲基化解卷積以識別血漿拷貝數畸變起源之組織。例如，當相較於對無拷貝數畸變之基因組區域進行相同分析時，當在血漿中觀察到拷貝數增加時，位於受影響之基因組區域內之標誌的甲基化解卷積應揭示畸變起源組織的貢獻增加。相反，當在血漿中觀察到拷貝數減少時，位於受影響之基因組區域內之標誌的甲基化解卷積應揭示畸變起源組織的貢獻減小。在下列部分中，吾人於懷有患有三染色體21之胎兒之孕婦、HCC病患及患有淋巴瘤之孕婦中說明此概念之應用。在此等實例中，無需知曉經識別之區域具有CNA；及在該情況下，可使用該等技術以判定序列失衡是否確實存在於經測試之區域中。

1. 胎兒異常

圖30A顯示根據本發明之實施例之攜載三染色體21之孕婦中之染色體特異性血漿DNA甲基化解卷積之分析的繪示。具有三染色體21之胎兒將釋放增加量之攜載胎盤甲基化標籤之染色體21序列進入其懷孕母體之血漿中。因此，當技術人員使用存在於染色體21上之標誌對血漿亞硫酸氫鹽定序資料進行甲基化解卷積時，預期胎盤貢獻(表示為

)相較於使用存在於其他染色體上之標誌評估之胎盤貢獻(表示為

)將增加。

在該繪示中，假定母體血漿中之胎兒DNA分率係20%。由於該胎兒中之染色體21之額外拷貝，因此相較於使用一或多個參考染色體上之標誌，當基於染色體21上之標誌進行甲基化解卷積分析時胎盤衍生之DNA之貢獻將增加50%。

因此，實施例可在甲基化解卷積方法中使用染色體21之無細胞DNA分子判定分率貢獻，導致胎盤組織之30%的分率貢獻。亦使用一個或多個參考染色體之無細胞DNA分子進行甲基化解卷積，導致胎盤組織之20%的分率貢獻。然後可判定各種組織之分率貢獻之差值以偵測染色體21是否具有序列失衡(例如，該實例中之三染色體)。

此處，吾人表示△M為染色體21與一或多個染色體(表示為Ref Chr)間之不同器官對血漿DNA之貢獻的差值。

△M=M ^Chr21 -M ^{Ref Chr}

其中M^Chr21係基於染色體21上之標誌，組織對血漿DNA之貢獻及M^{Ref Chr}係基於參考染色體上之標誌，組織對血漿DNA之貢獻。因此，△M係貢獻差值之陣列，各對應於不同組織。因此，實施例可計算：

將以類似方式計算甲基化解卷積中涉及之其他組織類型之各者的其他△M值。若胎盤係母體血漿中之染色體21之拷貝數增加的起源，則將預期在相較於其他組織類型之△M值時，胎盤之△M值最高。

為進一步說明該技術，吾人分析5名各懷有三染色體21胎兒之孕婦之血漿。胎齡在13至14周間變動。於每種情況下之血漿DNA中觀察到染色體21之表現增強。吾人對定序資料進行甲基化解卷積並計算多個組織類型之△M值。

圖30B係顯示根據本發明之實施例之跨各懷有三染色體21(T21)之胎兒之孕婦之不同組織之染色體21之分離值△M的圖3050。在五種情況中之每種情況下，胎盤之△M值最高，此表明拷貝數畸變起源於胎盤。而且，即使先前未識別染色體21之CNA，但胎盤組織之高△M值指示在胎盤組織之染色體21中有畸變。

圖31係顯示根據本發明之實施例之各懷有三染色體21(T21)之胎兒之孕婦跨不同組織之其他染色體之分離值△M的圖3100。將除染色體21外之所有體染色體上之甲基化標誌隨機分成兩組(即，A組及B組)。使用藉由電腦產生之一系列隨機數(範圍自0至1)實施隨機化。將與小於0.5之隨機數相關之標誌分配至A組，否則將其分配至B組。在此分析中，A組包含起源於染色體1、2、4、5、6、8、12、14、15、17、22之標誌及B組包含起源於染色體3、7、9、10、11、13、16、18、19、20之標誌。使用每組標誌進行血漿DNA組織圖譜分析。顯示之△M值表示使用A及B組中之標誌之特定組織對血漿DNA之貢獻的差值。可見，無單一組織始終顯示升高之△M值。

血漿DNA甲基化解卷積分析亦可用於判定CNA是否已起源於母體或胎兒，例如，在使用母體血漿DNA分析之微缺失或微重複之非侵入性產前測試中。最近，已顯示可使用母體血漿DNA分析偵測胎兒之微缺失或微重複(Yu等人，PLoS One 2013；8：e60968)。然而，當於母體血漿DNA中偵測到微缺失或微重複時，畸變可起源於母體、胎兒或其等兩者中。可使用甲基化解卷積分析解決該問題。

考慮孕婦係正常及胎兒係攜載微重複之方案。若吾人對重複之區域及其他正常區域進行母體血漿DNA之染色體特異性甲基化解卷積，則胎盤之△M值最正，此指示在重複之區域下額外劑量之胎盤DNA釋放進入血漿中。另一方面，對母親係微重複之載體及胎兒係正常之方案，胎盤DNA對母體血漿之貢獻在重複之區域下將相對減小，因為母體組織相較於胎兒將在重複之區域下對血漿DNA貢獻更多。若母親與胎兒皆係微重複之載體，則母親與胎兒之比例貢獻在受影響及未受影響之染色體區域下將相同。反面情況將適用於涉及微缺失之方案。不同方案中之△M的預期變化顯示於下表中。

在某些實施例中，胎兒或母親或兩者可於不同區域攜載多於一個拷貝數畸變。例如，胎兒可於不同區域攜載微重複及微缺失兩者。

2. 肝細胞癌(HCC)

一些實施例亦可用以判定產生自腫瘤之CNA之起源。在腫瘤位點於呈現時不清晰之病患中，血漿DNA之CNAs之甲基化解卷積分析將可用於識別癌症之起源。

圖32A係根據本發明之實施例之癌症病患之血漿DNA中之CNA區域之分析的繪示。在癌症病患中，將預期拷貝數增加(即，擴增)之基因組區域富集釋放自各自癌症之起源組織之DNA。因此技術人員將觀察到血漿中癌症之起源組織之比例貢獻(表示為

)增加。相反，將預期拷貝數減少(即，缺失)之基因組區域消耗釋放自各自癌症之組織之DNA。則技術人員將觀察到血漿中之癌症之起源組織之比例貢獻(表示為

)減小。

類似上文三染色體21實例，技術人員可使用下列方程式定義△M值，其中，

對非癌症之起源組織，拷貝數畸變(即，擴增或缺失)對其等對血漿之比例貢獻將無任何系統性影響。因此，在此種分析中，當相較於其他組織類型之△M值時，癌症之起源組織之△M值將最高。

在其他實施例中，可藉由比較顯示擴增之基因組區域與顯示正常拷貝數之區域計算△M。在又其他實施例中，可藉由比較顯示缺失之基因組區域與顯示正常拷貝數之區域計算△M。

例如，分析七名HCC病患、一名肺癌病患及一名直腸癌病患之血漿DNA。所有此等九名病患之血漿中偵測到CNAs。為判定血漿中偵測到之此等CNAs之起源組織，對顯示拷貝數增加及拷貝數減少之染色體區域進行甲基化解卷積。在上文研究之HCC、肺癌及直腸癌樣本中，於7名HCC、1名肺癌及1名直腸癌病患之血漿中觀察到影響至少30Mb區域(即，人類基因組之~1%)之拷貝數畸變。

基於顯示擴增及缺失之基因組區域分別判定每個組織類型對血漿之比例貢獻。計算在兩組基因組區域間每個組織類型之貢獻之差值並表示為△M，其中△M係組織類型之差值陣列。因此，△M=M ^Amp -M ^Del

其中M^Amp係表示基於位於顯示拷貝數增加之基因組區域中之標誌之組織貢獻的陣列；及M^Del係表示基於位於顯示拷貝數減少之基因組區域中之標誌之組織貢獻的陣列。

圖32B係顯示根據本發明之實施例之跨癌症病患之不同組織之顯示拷貝數增加及拷貝數損失之區域間之分離值△M的圖3250。在此實例中，該等△M值跨癌症病患之不同組織。△M表示在顯示拷貝數增加及貝數減少之區域間特定組織對血漿DNA之貢獻的差值。

對每種情況，以黃色、藍色或綠色顯示最高△M。以灰色顯示其他△M值。將具有最高△M之組織視為拷貝數畸變之起源組織。在具有拷貝數增加與拷貝數減少之基因組區域間對血漿DNA之貢獻之差值(△M)分別於七名HCC病患、肺癌病患及直腸癌病患之肝臟、肺及結腸中係最高的。因此，甲基化解卷積分析正確指示血漿樣本中之CNAs之起源組織。

圖33係顯示根據本發明之實施例之跨癌症病患之不同組織之經隨機選擇之基因組區域間之分離值△M的圖3300。作為對照，吾人亦使用兩組隨機選擇之未於血漿中顯示拷貝數畸變之基因組區域進行相同分析。所示△M值表示在兩組隨機選擇之無血漿DNA拷貝數畸變之區域間特定組織對血漿DNA之貢獻之差值。如於圖33中可見，對該對照分析，在該等△M值與癌症之起源組織間無系統性關係。

3. 患有淋巴瘤之孕婦

除拷貝數畸變外，甲基化解卷積亦可應用於判定其他類型之基因組畸變(例如(但不限於)單核苷酸突變及易位)之起源組織。可判定接近於基因組畸變之區域之甲基化狀態並與未受影響區域之甲基化狀態比較。預期基因組畸變之起源組織於受影響區域下顯示對血漿DNA之較高貢獻。

圖34A顯示根據本發明之實施例之患有並行淋巴瘤之孕婦之甲基化解卷積分析的繪示。圖34A顯示具有拷貝數增加之區域及無拷貝數增加之區域。為證實於血漿中觀察到之拷貝數畸變之起源組織，可使用存在於在血漿中顯示擴增之基因組區域(表示為

)及顯示正常拷貝數之區域(表示為

)甲之標誌分別進行血漿中基化解卷積：

圖34A顯示B細胞、胎盤及其他組織之分率貢獻的圖表。由於CNAs之起源組織係濾泡性淋巴瘤，所以產生淋巴瘤之組織類型(B細胞)將給出最高△M值。

為進一步繪示實施例之效用，吾人分析在懷孕早期診斷為患有復發性濾泡性淋巴瘤之孕婦之血漿DNA。該婦女具有濾泡性淋巴瘤之歷史及接受治癒性化學療法。隨後該婦女在其淋巴瘤處於臨床緩解時懷孕。在懷孕第11週時，自該孕婦收集血液樣本以供胎兒染色體非整倍體性之非侵入性產前測試。母體血漿DNA定序結果揭示總數異常。藉由淋巴結之組織檢查及環鋸生檢證實濾泡性淋巴瘤之復發。

圖34B係顯示收集自在懷孕早期診斷為患有復發性濾泡性淋巴瘤之孕婦之樣本間之用於拷貝數畸變偵測之全基因組DNA序列分析的圖3450。圖3450顯示在膚色血球層、淋巴結生檢、預處理血漿及化學療法開始後10週收集之血漿樣本之全基因組拷貝數分析。自內之外：預處理血漿樣本之膚色血球層、淋巴結生檢、處理前收集之血漿樣本及處理後收集之血漿樣本。在最外環處以順時針方式顯示染色體表意文字。每個點表示1-Mb區域。綠色、紅色及灰色點分別表示具有拷貝數增加、拷貝數減少及無拷貝數畸變之區域。拷貝數自中心至外昇冪配置。相較於其他染色體區域越靠近中心的點指示拷貝數減少。相較於其他染色體區域越進一步背離中心的點指示拷貝數增加。

於淋巴結生檢及預處理血漿樣本中偵測到拷貝數畸變，但於處理後之血漿樣本及預處理血漿樣本之膚色血球層中未偵測到。在淋巴瘤之拷貝數畸變之圖譜與預處理血漿中之圖譜間具有高度相似性。拷貝數畸變於預處理血漿部分中之存在，但此類畸變於相同血液樣本之血液細胞部分中之缺乏指示血漿DNA異常係衍生自與淋巴瘤相關之無細胞DNA而非循環腫瘤細胞。

全基因組亞硫酸氫鹽定序後，對預處理血漿樣本進行甲基化解卷積。在此病患中，於血漿中顯示拷貝數減少之相連區域中無一區域之尺寸係30Mb或以上。因此，位於已缺失之區域內之甲基化標誌的數量不足以進行組織圖譜分析。因此，使用不顯示任何拷貝數畸變之區域作為參考。

圖35A係顯示判定自對經預處理之患有復發性濾泡性淋巴瘤之孕婦之血漿樣本進行之血漿DNA組織圖譜分析之分率貢獻的表3500。淋巴細胞之血漿DNA比例貢獻係70.2%。B淋巴細胞之血漿DNA貢獻係62.2%及T淋巴細胞貢獻8%。

圖35B係顯示患有並行濾泡性淋巴瘤之孕婦之不同組織之分離值△M的圖3550。針對此病患之預處理血漿樣本，顯示跨不同組織之△M值。B細胞顯示最高△M值，此表明拷貝數畸變係衍生自B細胞。濾泡性淋巴瘤細胞係衍生自B細胞。如圖可見，B淋巴細胞顯示最高△M值，因此證實其等係血漿中之貝數畸變之起源。

4. 癌症病患中之轉移性病變

此等基因組畸變之甲基化解卷積可特別用於其中不確定腫瘤是否係受影響器官之原發癌症或係另一器官之癌症之轉移性病變之臨床方案。如上文所述，涉及腫瘤之器官將導致受影響器官對血漿之貢獻改變。此外，藉由甲基化解卷積分析血漿DNA之CNAs可用於識別原發癌症之組織起源。組合此等兩種類型之分析可用於判定轉移性病變是否存在。

為說明此點，下文討論三個假設實例：i. HCC病患(原發肝癌)；ii. 具有原發直腸癌而無肝臟轉移之病患；及iii. 具有原發直腸癌及肝臟轉移之病患。

對HCC病患，肝臟中存在腫瘤將導致肝臟對血漿DNA之貢獻增加。此外，由於癌症係衍生自肝臟細胞，因此與癌症相關之CNAs之起源組織將係肝臟。對無肝臟轉移之直腸癌病患，由於不涉及肝臟，因此預期肝臟對血漿DNA之貢獻正常；及甲基化解卷積指示該腫瘤係衍生自結腸。對具有肝臟轉移之直腸癌病患，腫瘤細胞入侵肝臟將導致釋放入血漿中之肝臟DNA增加。由於癌症係衍生自結腸，因此CNA分析將指示畸變係起源自結腸。

例如，於超音波檢查術研究上呈現病患之肝臟質量。在後續臨床調查中，發現該病患具有轉移至肝臟之直腸癌。對血漿進行甲基化解卷積。表5顯示該病患顯示結腸對血漿DNA之貢獻增加。

圖36A係顯示根據本發明之實施例之對直腸癌轉移至肝臟之病患之血漿DNA之拷貝數畸變分析的圖3600。每個點表示1-Mb區域。該等結果表示為一組32名健康對照個體之血漿DNA之平均基因組代表的標準偏差數。位於兩條黑線間之灰色點指示健康個體之平均值之血漿DNA表現無偏差。位於在兩條黑線間之區域之內部及外部之黑色點指示彼等區域分別係病患之血漿DNA中之表現不足及表現過度。然後使用解卷積分析法分析血漿DNA中之具有表現過度及表現不足之區域以判定畸變起源之組織。

圖36B係顯示根據本發明之實施例之患有直腸癌及肝臟轉移之病患之血漿DNA之拷貝數畸變之甲基化解卷積分析的圖36B。該分析指示結腸之擴增與缺失之區域間之差值(△M)最大，此表明該等畸變最可能衍生自結腸。因此，實施例可識別在肝臟質量中引起之原發癌症。

5. 體細胞嵌合化

體細胞嵌合化描述在身體之某些組織中存在具有不同基因組組成之細胞。體細胞嵌合化源自在染色體分離或DNA複製期間發生之錯誤，導致各種基因組畸變，諸如染色體非整倍體性、拷貝數變異(CNVs)、基因組重排、單核苷酸變異或重複擴展及微衛星不穩定性(Lupski.Science 2013；341：358-9)。

血漿DNA甲基化解卷積之實施例可用於識別受體細胞嵌合化影響之組織。將首先分析血漿DNA以表徵基因組畸變(例如，CNA)。然後，可使用受影響區域及另一未受影響區域內之甲基化標誌進行甲基化解卷積。藉由比較此等兩組區域之血漿DNA之組成，可判定△M。然後可藉由具有顯著分離值(例如，△M值)之組織識別受體細胞嵌合化影響之組織。

6. 各種病理學病症之偵測及監測

血漿DNA甲基化解卷積可用於偵測及監測各種病理學病症，例如(但不限於)中風、心肌梗塞、自身免疫性疾病及感染。例如，病患承認喪失意識及懷疑中風之臨床診斷。腦貢獻升高可用於指示對腦存在顯著損害。可藉由比較該等病患之結果與健康對照個體之結果得出腦對血漿DNA之貢獻升高之結論。貢獻升高之程度亦可用於指示該病患之預後。

同樣，對因臨床症狀而懷疑患有心肌梗塞或其他心臟疾病之病患，心臟之貢獻可用於指示該診斷或用於預測該病患之預後。可使用健康對照個體組中之心臟對血漿DNA之貢獻值判定截止。

在一個實施例中，截止可係健康對照個體之腦貢獻之某一百分率，例如，第90、第95、第99百分位數。在另一實施例中，可將截止設置為超過對照個體之平均值之2倍SD、2.5倍SD、3倍SD或3.5倍SD。

亦可將血漿DNA甲基化解卷積應用於識別呈現未知起源之敗血症之病患的感染源。因細胞損害增加而預期經感染之組織釋放更多DNA進入血漿中。

7. 總結

如上文詳細描述，已在以下情況下驗證實施例：(i)使用孕婦偵測胎盤之血漿貢獻；(ii)使用HCC病患及肝臟移植後之個體偵測肝臟之血漿貢獻；(iii)使用骨髓移植受體及在孕期診斷之淋巴瘤案例偵測白血液細胞之血漿貢獻；(iv)自肺癌案例中偵測肺之血漿貢獻及(v)自直腸癌案例中偵測結腸之血漿貢獻。由於血漿DNA通常被視為細胞死亡之標誌，因此吾人之方法可用作評估不同組織類型中之細胞死亡現象之一般方法。因此，除產前測試、癌症偵測/監測及移植監測之應用外，實施例亦可在用於研究細胞死亡或各種身體組織之損害(例如，中風、心肌梗塞、創傷、自身免疫性疾病、感染性疾病等)之許多藥物分支中具有應用。

此外，資料顯示根據病患之生理狀態或潛在病理學將觀察到血漿DNA池之組織組成的特徵性擾動。識別可於血漿中觀察到之拷貝數畸變之起源組織的能力具有許多可能之臨床應用。例如，對用於篩選癌症之血漿DNA定序之應用，實施例可識別癌症之可能起源組織，以計劃進一步之診斷調查或治療程序。如另一實例，實施例將對非侵入性產前測試十分有用。使用三染色體21之偵測作為模式系統，吾人已證明技術人員可識別胎盤為母體血漿中之過量染色體21之起源組織。

癌症偵測及非侵入性產前測試之應用在患有濾泡性淋巴瘤之孕婦之情況下集中。吾人於該孕婦之血漿中觀察到拷貝數畸變(圖34A)。血漿甲基化解卷積揭示淋巴細胞對血漿之極高貢獻。B淋巴細胞係濾泡性淋巴瘤之病理學中涉及之細胞類型。因此，有趣的是，實施例識別B細胞(62.2%，圖35A)而非T細胞為該病患中之血漿DNA之主要貢獻者。

比較使用起源於顯示拷貝數畸變增加之基因組區域之甲基化標誌獲得之甲基化解卷積結果與顯示正常拷貝數之區域之甲基化標誌獲得之甲基化解卷積結果的△M分析進一步證實B細胞為拷貝數畸變之來源(圖35B)。此等結果因此與濾泡性淋巴瘤之診斷完全一致。隨著非侵入性產前測試之臨床效用之增加及母體年齡進一步年輕化之趨勢，可能在此類測試期間將偵測越來越多之惡性腫瘤的情況(Osborne CM等人，(2013)Prenat Diagn 33(6)：609-611；Vandenberghe P等人，(2015)Lancet Haematol 2：e55-e65)。因此本文描述之實施例在此類情況之進一步調查中將係非常有用的。

在一些實施例中，可進一步精化將用於解卷積方法之甲基化標誌之選擇。在一個變型中，可調節標誌組以更關注對血漿DNA池較不突出之貢獻者之組織類型。此可揭示技術人員可使用實施例監測之新穎病理生理學狀態。

除使用DNA甲基化標誌外，實施例亦可通過mRNA(Ng EKO等人，(2003)Proc Natl Acad Sci USA 100：4748-4753；Tsui NBY等人，(2014)Clin Chem 60(7)：954-962；Koh W等人，(2014)Proc Natl Acad Sci U S A 111(20)：7361-7366)及微RNA(Chim SSC等人，(2008)Clin Chem 54(3)：482-490；Wang K等人，(2009)Proc Natl Acad Sci U S A 106(11)：4402-4407)之研究調查循環核酸池之組織貢獻。DNA甲基化及轉綠方法可彼此相互協同作用及將給出不同類型之資訊。

在上文之實例中，遵照製造商之說明書(Illumina)製備DNA庫並於HiSeq或NextSeq系統(Illumina)上定序。對HiSeq，以TruSeq SBS Kit v3(Illumina)進行定序之76(單端模式)或76 x 2(雙端模式)週期。對NextSeq，使用NextSeq 500 High Ouput v2套組(Illumina)進行76 x 2雙端定序週期。鹼基判定(base calling)後，移除轉接序列(adapter sequence)及低品質鹼基(即，品質分數<5)。然後藉由甲基化資料分析管路甲基管處理呈FASTQ格式之經修剪之讀段。所有樣本之基本序列參數(包含定序深度)總結於圖37及38之表3700中。

D 判定序列失衡之方法

圖39係繪示根據本發明之實施例之使用甲基化解卷積分析生物之生物樣本以判定染色體區域是否顯示序列失衡之方法3900的流程圖。該生物樣本包含複數個組織類型(包含第一組織類型)之無細胞DNA分子之混合物。至少部分使用電腦系統進行方法3900。

在區塊3910中，分析該生物樣本之複數個無細胞DNA分子。可以類似圖1之方法100之區塊140之方式進行區塊3910。

例如，可分析至少1,000個無細胞DNA分子以判定無細胞DNA分子位於何處，並可如下文描述測量甲基化程度。

在區塊3920中，識別第一組複數個無細胞DNA分子。該第一組DNA分子之各者係位於對應於生物之參考基因組之第一染色體區域之N個基因組位點中之任一者。例如，一個DNA分子(例如，具有比對N個基因組位點之第一者處之序列讀段)可位於N個基因組位點之第一者處，及另一DNA分子可位於N個基因組位點之第二者處。DNA分子兩者將包含於第一組中。

可以各種方式及使用各種標準識別N個基因組位點。可使用II部分中描述之技術。該等N個基因組位點可滿足某一標準，諸如跨組織及跨個體之甲基化程度。可基於其他樣本之資料(例如，資料庫之甲基化分析)識別該等基因組位點。N係可大於或等於10之整數。

該等N個基因組位點將位於可相鄰或包括非相鄰子區域之第一染色體區域內。可基於CNA分析(例如，如上文描述)選擇第一染色體區域。例如，一區域可相對於其他區域定義為具有DNA分子之表現過度或表現不足，其中該分析可能可使用與用於甲基化分析相同的生物樣本。表現過度或表現不足指示拷貝數畸變，及下文之甲基化分析可判定哪一組織係CNA之起源組織。

在區塊3930中，使用第一組複數個無細胞DNA分子測量N個基因組位點之N個第一混合物甲基化程度。可測量N個基因組位點之各者之一個第一混合物甲基化程度。可以類似圖1之方法100之區塊150之方式進行區塊3930。因此，可使用測量DNA分子之甲基化程度之任何技術。在一些實施例中，DNA分子之甲基化程度之測量可使用甲基化感測定序結果，其亦可用以判定DNA分子之位置。

在區塊3940中，使用該等N個第一甲基化程度判定混合物中第一組織類型之第一分率貢獻。在一些實施例中，可經由圖1之方法100之區塊160及170進行區塊3940。因此，可同時判定一組M個組織類型之分率貢獻。

區塊3940可使用對M個組織類型之各者判定之N基因組位點之N個組織特異性甲基化程度(例如，如在圖1之方法100之區塊120中)。在一些實施例中，該等N個組織特異性甲基化程度可僅係第一組織類型之甲基化程度及所有其他組織類型之集體甲基化程度。因此，M可有效地僅係2。若第一組織類型係受關注之唯一組織類型，則此種概括不損失任何資訊。其他組織類型之集體值可產生自其他組織類型之各分離值。

在區塊3950中，識別第二組複數個無細胞DNA分子。第二組 DNA分子之各者位於對應於生物之參考基因組之第二染色體區域之K個基因組位點中之任一者。該第二染色體區域不同於第一染色體區域(例如，不同染色體)，及因此K個基因組位點不同於N個基因組位點。K係可大於或等於10之整數。K及N值亦可不同，及因此K可不等於N。可以類似區塊3920之方式進行區塊3950。

可將第二染色體區域識別為未顯示任何畸變之區域。該識別可基於生物之樣本之測量，例如，如以識別第一染色體區域之類似方式，但未顯示任何表現過度或表現不足。在其他實施例中，可將該第二染色體區域識別為具有與第一染色體區域相反之畸變，其中可假定該等畸變來自相同組織類型。

在又其他實施例中，可基於畸變之典型位置或其缺乏識別第二染色體區域。對胎兒之實例，染色體13、18及21相對更常發生非整倍體性，但其他染色體相對不常發生。因此，其他染色體中之一或多者可用作第二染色體區域。該第二染色體區域可相鄰或包括非相鄰之子區域。

在區塊3960中，使用第二組複數個無細胞DNA分子測量K個基因組位點之K個第二混合物甲基化程度。可測量K個基因組位點之各者之一個第二混合物甲基化程度。可以類似區塊3930之方式進行區塊3960。

在區塊3970中，使用該等K個第二甲基化程度判定混合物中第一組織類型之第二分率貢獻。可以類似區塊3940之方式進行區塊3970。

在區塊3980中，計算第一分率貢獻與第二分率貢獻間之第一分離值。例如，分離值可包含第一分率貢獻及第二分率貢獻之差值或比率。該分離值可包含其他因數(例如，乘性因數)。作為其他實例，可使用該等分率貢獻之函數差值，例如，分率貢獻之自然對數(ln)的差值。

在區塊3990中，比較第一分離值與臨限值以判定該第一組織類型是否具有第一染色體區域之序列失衡之類別。當該分離值超過該臨限值時，該類別可係第一組織類型具有第一染色體區域之序列失衡。如先前部分中所描述，大分離值指示第一組織類型存在序列失衡(例如，拷貝數畸變)。例如，若該第一分率貢獻比該第二分率貢獻大該臨限值，則可判定第一染色體區域在第一組織類型中顯示擴增。若該第一分率貢獻比該第二分率貢獻小該臨限值，則可判定第一染色體區域在第一組織類型中顯示缺失。

在一個實例中，如對V.C.1部分，該生物係懷有胎兒之孕婦，及該第一組織類型係胎盤組織。因此，該方法可偵測胎兒於第一染色體區域中是否具有非整倍體性。在另一實例中，即使當該生物懷孕時，該第一組織類型可非係胎盤組織。此種測試可判定其他組織是否具有序列失衡，例如，如在V.C.3部分中。

如上所述，可基於位於第一染色體區域中之無細胞DNA分子的數量將第一染色體區域識別為顯示拷貝數畸變。相對於其他區域表現過度或表現不足之量(例如，相差至少一個臨限值)可指示拷貝數畸變。例如，位於第一染色體區域中之無細胞DNA分子之數量可係無細胞DNA分子、無細胞DNA分子之積聚長度及密度之原始計數，可將其判定為該區域每單位長度之計數。

一旦經識別一區域以供測試，可判定M個組織類型之分離值。因此，對第一及第二染色體區域之各者，可判定M個組織類型之各者之M個分率貢獻。可比較每個分離值與臨限值以判定組織類型是否係起源。該分離值可指示多於一個組織類型顯示序列失衡，如在V.C.4中。在一個實施例中，可將最大分離值識別為原發癌症。

若該生物經識別為某組織(例如，非胎盤組織)中之第一染色體區域具有序列失衡，則可將該生物類別為該某組織具有某一癌症程度。可基於分離值之範圍判定癌症程度。可基於第一染色體區域之表現過度或表現不足之程度及顯示畸變之染色體區域之數量進一步判定該癌症程度。

在一些實施例中，可在第一組織類型中測試多個區域之序列失衡。若第一組織類型之許多區域(例如，多於一個截止值)顯示序列失衡，則識別第一組織類型為起源可具有較大之統計學準確度。而且，若測試許多區域，則可減少判定序列失衡之臨限值，使用若干具有序列失衡之區域之截止以改善特異性。因此，第一組織類型是否具有第一染色體區域之序列失衡之類別可基於具有超過臨限值之對應分離值的不同染色體區域數。以此種方式，可藉由識別具有小分離值之區域(該區域否則可能無法被偵測)提高靈敏度。該臨限值可取決於截止值，截止值越高則臨限值越低，及反之亦然。

一旦一生物經診斷具有一定程度之癌症，則可基於該診斷治療該生物。亦可為類別疾病狀態之其他方法進行治療。例如，治療可包含手術、放射性療法或化學療法。

VI 靶向分析

基於甲基化分析之組織貢獻之解卷積可涉及CpG位點之甲基化狀態的判定。除使用非靶向亞硫酸氫鹽定序以判定DNA混合物(例如，血漿DNA)之全基因組甲基化圖譜外，亦可使用靶向方法以研究受關注之CpG位點之甲基化狀態或甲基化密度，或其他甲基化程度。可進行受關注之CpG位點之靶向，例如(但不限於)DNA雜交、微陣列、PCR擴增及甲基化特異性PCR。亦可使用此等技術之組合。靶向方法可增加有關個體CpG位點之甲基化資訊而未大體上增加整體定序之量。當相較於一或多個其他組織時，該靶向方法亦可提高用於偵測自組織進入體液中之DNA貢獻，特別係自次要貢獻者組織進入體液中之DNA貢獻之靈敏度及/或特異性及/或精確度。

在一個實例中，可藉由雜交(例如，但不限於使用Nimblegen SeqCap系統或Agilent SureSelect Target Enrichment系統)富集受關注之區域。在另一實例中，雜交探針可經設計以捕獲經亞硫酸氫鹽特定轉化之DNA序列。然後可定序針對受關注之區域富集之定序庫。使用該策略，相較於非靶向定序方法，可以相同數目之定序自樣本之DNA分子顯著增加受關注之區域的定序深度。

如另一實例，可使用PCR擴增法靶向受關注之區域。PCR引子可經設計以擴增具有CpG位點之區域，該等CpG位點可提供甲基化解卷積分析資訊。可分析經擴增之區域之整體甲基化程度，例如(但不限於)使用包括單一分子定序(諸如奈米孔洞定序或Pacific Biosciences單一分子即時系統)之大規模平行定序、即時PCR、數位PCR或質譜法。

在一個實施方案中，該等PCR引子可經設計以靶向甲基化序列或未甲基化序列。在該實施方案中，可比較經甲基化及未經甲基化之DNA分子之量以判定提供資訊之CpG位點之甲基化程度(I型或II型甲基化標誌)。在另一實施方案中，該等PCR引子僅與無差別甲基化之區域(例如，無CpG位點之區域)雜交。在該情況下，可擴增甲基化序列及未甲基化序列兩者。然而，該經擴增之擴增物將含有CpG位點，然後可判定每個經擴增之分子之甲基化狀態，例如(但不限於)使用對甲基化序列或未甲基化序列具特異性之螢光探針。或者，可使用大規模平行定序或質譜法分析該等PCR產品。

各種實施例亦可應用於分析不同CpG位點之甲基化圖譜，使該分析之成本效益達最大化。

A 靶向I型及II型標誌兩者

靶向I型及II型標誌兩者可用於增加甲基化解卷積分析之整體成本效益，因為大量經分析之無細胞DNA分子將對應於所使用之基因組位點。換言之，為獲得用於甲基化解卷積分析之相同數量資訊性DNA 分子，相較於使用全基因組分析，使用靶向方法定序之量可大幅減少。

B 靶向I型標誌及II型標誌之全基因組

當需要更精確地判定特定類型組織之貢獻時，靶向I型標誌及II型標誌之全基因組分析係特別適用，且其他組織之貢獻係通常受關注。靶向I型及II型標誌兩者亦可達成該目的，但設計靶向兩種類型之標誌之試驗則需要大量努力。

在該情況下，可依靶向方式分析受關注組織中之差別甲基化之I型標誌，使得可更精確判定其等於DNA混合物(例如，血漿DNA及尿DNA)中之甲基化程度。在-一些實例中，藉由I型標誌靶向之組織係血漿DNA池之次要貢獻者。使用I型標誌靶向此類組織將提高技術人員可偵測及測量其等對血漿DNA池之貢獻之靈敏度。另一優點係技術人員可調整使此類測量值最優化之濃度範圍。

作為例子，若技術人員希望靶向通常貢獻極低程度之DNA於血漿中之組織A，則其可使用多個I型標誌以靶向組織A，例如，使用10或100個標誌。若對特定血漿樣本10或100個標誌之僅一部分將分別為正，則技術人員可進一步調整組織A對血漿之經測量之貢獻。當組織A對血漿之貢獻係非常低時，偵測對血漿中之組織A特異之標誌之可能性低及藉由一或多個統計學函數(例如，泊松(Poisson)分佈)調定偵測速率。在該情況下，可藉由可於血漿中偵測之I型標誌之百分率推算組織A對血漿DNA之相對貢獻。可使用II型標誌判定其他組織之貢獻。

C 靶向II型標誌及I型標誌之全基因組

可使用靶向II型標誌及I型標誌之全基因組分析以排除特定組織類型之貢獻。例如，預期胎盤之貢獻在分娩後下降至不可偵測程度。可使用II型標誌之靶向分析及對胎盤特異之I型標誌之全基因組分析以準確判定不同組織器官之貢獻及排除胎盤對血漿DNA之貢獻。此可用以排除先前孕婦中之妊娠產物的保留。

VII 不同無細胞流體之甲基化解卷積

A 尿DNA

亦可對尿DNA進行DNA甲基化解卷積。先前研究已證明可於健康個體及患有各種疾病之病患之尿中偵測無細胞DNA(Hung等人，Clin Chem.2009；55：715-22；Chan等人，Clin Cancer Res.2008；14：4809-13；García Moreira等人，Clin Biochem.2009；42：729-31；Hoque等人，J Natl Cancer Inst.2006；98：996-1004)。尿中之無細胞DNA可局部衍生自腎臟及泌尿系統中之細胞(Hoque等人，J Natl Cancer Inst.2006；98：996-1004)或經腎臟衍生自血漿(Hung等人，Clin Chem.2009；55：715-22；Chan等人，Clin Cancer Res.2008；14：4809-13)。甲基化解卷積分析可對局部及全身性疾病之識別有用。

在一個實施例中，尿DNA之甲基化解卷積可用於監測已接受腎臟移植之病患。先前顯示在移植排斥之存在下，增加之DNA將自經移植之腎臟釋放於腎臟移植受體之尿中(Zhong等人，Ann N Y Acad Sci.2001；945：250-7)。因此，可使用尿DNA中之腎臟之百分率貢獻之升高以指示腎臟排斥之存在。

在另一實施例中，可使用尿DNA解卷積偵測或監測尿路中之惡性腫瘤之存在。可以對尿DNA之貢獻增加指示癌症之起源組織。例如，將預期患有膀胱癌及前列腺癌之病患具有分別來自膀胱及前列腺之高貢獻。技術人員亦可結合基因組畸變(例如，拷貝數畸變及單核苷酸變異)進行甲基化解卷積以定位基因組畸變之起源組織。

亦可通過尿DNA之解卷積偵測其他臨床情形(諸如感染及創傷)。在感染之情況下，技術人員將看到甲基化解卷積後尿DNA之白血球全體濃度增加。

技術人員亦可應用尿DNA甲基化解卷積以偵測及監測腎臟疾病。例如，可應用該技術偵測及監測具有自身免疫性起源之腎臟疾病。在一個實施例中，技術人員將看到自經選擇之白血球全體(例如，來自淋巴細胞)進入尿DNA池中之畸變貢獻。自身免疫性相關腎臟疾病之實例包含因全身性紅斑狼瘡引起之IgA腎病及腎小球性腎炎。

如另一實例，可應用該技術以偵測及監測對腎小球過濾障壁造成損害之腎臟疾病。在此類情況下，技術人員將預期尿DNA之經腎臟組分增加。在又另一實施例中，技術人員可使用尿DNA甲基化解卷積以偵測腎臟之惡性腫瘤，例如，腎臟細胞癌症及腎盂之移形細胞腫瘤。在此情形下，技術人員亦可結合基因組畸變(例如，拷貝數畸變及單核苷酸變異)進行甲基化解卷積以定位基因組畸變之起源組織。

尿樣本係收集自兩名處於懷孕末三個月之孕婦。對每個尿樣本，使用如先前描述之Wizard Plus Minipreps DNA純化系統(Promega)自17mL尿中提取DNA(Tsui等人，PLoS One 2012；7：e48319)。以KAPA DNA庫製備套組(Kapa Biosystems)製備DNA定序庫。然後使用EpiTect亞硫酸氫鹽套組(Qiagen)使尿DNA定序庫經受2輪亞硫酸氫鹽改性。藉由10個PCR週期富集轉接拼接DNA分子。在HiSeq 2000儀器(Illumina)上以雙端格式定序75bp之經亞硫酸氫鹽處理之DNA庫。將定序結果與人類參考基因組(hg19)比對。進行基於1013個I型及5820個II型標誌之甲基化程度之解卷積分析以判定不同器官對尿DNA之貢獻。

表6顯示兩名孕婦之不同器官對尿之百分率貢獻。推算尿DNA之4.3%及5%係來自胎盤。該結果與胎兒DNA可經腎臟進入孕婦尿中之先前研究結果一致(Tsui等人，PLoS One 2012；7：e48319)。此外，膀胱亦貢獻兩個尿樣本中之總DNA的12.2%及8.1%。

每個尿DNA分子之尺寸可推算自最外核苷酸之基因組座標。

圖40A係顯示根據本發明之實施例之兩名孕婦之尿DNA之尺寸分佈之圖4000。作為對照，亦顯示五名孕婦之血漿DNA之尺寸分佈。尿DNA之尺寸分佈明顯短於血漿DNA之尺寸分佈。此等研究結果指示對短尿DNA之甲基化解卷積可行。

圖40B顯示根據本發明之實施例之尿DNA中之不同染色體之基因組代表(GR)之圖4050。作為對照，亦顯示兩名孕婦之血漿DNA樣本之染色體的基因組代表。不同染色體之比例表現在尿與血漿樣本間類似。將尿DNA序列之0.063%及0.059%比對染色體Y。此可與兩名孕婦皆懷有男性胎兒之事實一致。

B 腦脊髓液(CSF)

如另一實例，亦可對提取自CSF之DNA進行甲基化解卷積。增加之組織破壞可與不同之顱內病理學，例如，腦血管疾病、感染、癌症、自身免疫性疾病(例如，多發性硬變)及退行性疾病(例如，阿滋海默症、帕金森氏症等)相關。特定細胞類型對CSF之DNA之增加之貢獻將與該特定細胞類型之細胞更新增強相關並可用於各種疾病之偵測及監測(包含回應於治療)。

C 胸腔積液及腹水

在另一實例中，亦可對提取自胸腔積液之DNA進行甲基化解卷積。通常可於患有各種肺病理學之病患中觀察到胸腔滲出液。亦可於患有心臟衰竭、腎臟疾病之病患及患有肝臟疾病之病患中觀察到胸腔滲出液。在先前研究中，可使用顯示具有胸腔滲出液之病患之胸腔積液中之DNA濃度的測量以將胸腔滲出液類別為漏出性及滲出性(Chan等人，Clin Chem.2003；49：740-5)。該類別用以指示病患正經受之可能病理學。可使用胸腔積液DNA之解卷積以指示病理學之組織起源。例如，在患有惡性胸腔滲出液之病患中，胸腔積液之解卷積可指示該胸腔滲出液是否係由於原發肺癌或自另一器官至肺之轉移性癌症所致。此外，可於顯示各種類型之基因畸變(包含拷貝數畸變及點突變)之區域上進行甲基化解卷積使得可判定畸變之組織起源。

在又另一實例中，可對提取自腹水之DNA進行甲基化解卷積。可於各種病理學(例如，肝臟硬變、感染及惡性腫瘤)中觀察到腹水。亦可於患有心臟衰竭及腎臟疾病之個體中觀察到腹水。可使用腹水DNA之解卷積以指示病理學之組織起源。特定言之，識別導致腹水之惡性腫瘤之起源。類似胸腔積液之分析，可對顯示各種類型之基因畸變(包含拷貝數畸變及點突變)之區域進行甲基化解卷積，使得可判定該等畸變之組織起源。

VIII 電腦系統

本文提及之任何電腦系統可利用任何合適數量之亞系統。此類亞系統之實例顯示於圖1之電腦設備10中。在一些實施例中，電腦系統包含單一電腦設備，其中該等亞系統可係該電腦設備之組件。在其他實施例中，電腦系統可包含多個具有內部組件之電腦設備(每個係亞系統)。

經由系統匯流排75互連顯示於圖41中之亞系統。顯示額外亞系統諸如印表機74、鍵盤78、儲存裝置79、耦合至顯示器配接器82之監測器76及其他。可藉由任何數量之此項技術中已知的之構件諸如輸入/輸出(I/O)埠77(例如，USB、FireWire^®)將周邊設備及耦合至I/O控制器71之輸入/輸出(I/O)裝置連接至該電腦系統。例如，可使用I/O埠77或外介面81(例如，乙太網路(Ethernet)、Wi-Fi等)以將電腦系統10連接至諸如網際網路、滑鼠輸入裝置或掃描器的廣域網路。經由系統匯流排75之互連容許中央處理器73與每個亞系統相通信並控制來自系統記憶體72或儲存裝置79(例如，固定磁碟，諸如硬碟或光碟)之指令之執行及亞系統間之資訊之交換。系統記憶體72及/或儲存裝置79可體現電腦可讀媒體。本文提及之任何資料可自一個組件輸出至另一組件及可輸出至使用者。

電腦系統可包含複數個相同組件或亞系統，例如，藉由外介面81或藉由內介面連接在一起。在一些實施例中，電腦系統、亞系統或設備可於網路上通信。在此類實例中，一臺電腦可視為客戶端及另一臺電腦可視為伺服器，其中各者可係相同電腦系統之一部分。客戶端及伺服器可各包含多個系統、亞系統或組件。

應瞭解可使用硬體(例如，特定應用積體電路或現場可程式閘陣列)以控制邏輯之形式及/或使用具有通常可編程之處理器之電腦軟體以模組化或積體化之方式實施本發明之任何實施例。如本文使用，處理器包含單核處理器、多核處理器級相同積體晶片，或多個處理單元級單電路板或網路。基於本文提供之揭示內容及教義，一般技術者將知曉並明瞭使用硬體及硬體與軟體之組合實施本發明之實施例之其他方式及/或方法。

本申請案中描述之任何軟體組件或函數可以欲由使用任何合適之電腦語言諸如(例如，Java、C、C++、C#、Objective-C、Swift)或劇本式語言諸如使用(例如)習知或面向對象技術之Perl或Python之處理器執行的軟體代碼形式實施。軟體代碼可以一系列指令或命令之形式儲存於用於儲存及/或傳輸之電腦可讀媒體上，合適之媒體包含隨機存取記憶體(RAM)、唯讀記憶體(ROM)、諸如硬驅或軟碟之磁性媒體或諸如光碟(CD)或DVD(數位多功能光碟)之光學媒體、快閃記憶體及類似物。電腦可讀媒體可係此類儲存或傳輸裝置之任何組合。

此類程式亦可經編碼及使用適於經由遵守各種協議(包含網際網路)之有線、光纖及/或無線網路傳輸之載波信號傳輸。因此，可使用以此類程式編碼之資料信號建立本發明之實施例之電腦可讀媒體。經程式代碼編碼之電腦可讀媒體可與相容裝置一起封裝或獨立於其他裝置提供(例如，經由網際網絡下載)。任何此種電腦可讀媒體可存在於單一電腦產品(例如，硬碟、CD或整體電腦系統)之上或之內，及可存在於系統或網路內之不同電腦產品之上或之內。電腦系統可包含監測器、印表機或其他合適之用以向使用者提供任何本文提及之結果的顯示器。

可以包含一或多個處理器之電腦系統完全或部分地進行本文描述之任何方法，該電腦系統可經構形以進行步驟。因此，實施例可關於經構形以進行本文描述之任何方法之步驟之電腦系統，該電腦系統可能具有進行各自步驟或步驟之各自組之不同組件。儘管呈現為經編號之步驟，但本文之方法之步驟可同時或以不同順序進行。此外，此等步驟之部分可與其他方法之其他步驟之部分一起使用。而且，步驟之所有或部分係可選。此外，任何該等方法之任何步驟可以模組、電路或其他進行此等步驟之構件進行。

以任何合適之方式組合特定實施例之特定細節而不背離本發明之實施例之精神及範圍。然而，本發明之其他實施例可關於涉及每一個別態樣或此等個別態樣之特定組合的特定實施例。

已出於說明及描述之目的呈現本發明之例示性實施例之上文描述。非旨在窮舉或將本發明限制於所述精確形式，及根據上文之教義可能存在許多修改及變更。該等實施例係經選擇及描述以最好地解釋本發明之原理及其實務應用，藉此使得熟習此項技術者最好地利用本發明之實施例以及適於所預期之特定用途之各種改良。

除非明確指出相反情況，否則「一」、「一個」或該」之例舉意指「一或多個」。除非明確指出相反情況，否則「或」之使用意指「包容性或」及非「排他性或」。

出於所有目的將所有本文提及之專利、專利申請案、公開案及說明以全文引用的方式併入本文中。未承認係先前技術。

附錄A