TW202033767A

TW202033767A - 改善游離dna品質

Info

Publication number: TW202033767A
Application number: TW108138130A
Authority: TW
Inventors: 煜明盧; 卓豪曾; 江培勇; 思朗王; 慧君趙
Original assignee: 香港中文大學
Priority date: 2018-10-22
Filing date: 2019-10-22
Publication date: 2020-09-16
Also published as: SG11202102994RA; EP3870705A4; EP3870705A1; CN112888783A; US11926821B2; US20200123532A1; TWI809213B; WO2020083267A1

Abstract

本發明之實施例提供用於分析之游離DNA之品質的改善。游離DNA可包含具有缺陷之DNA，該等缺陷使得不能用諸如定序及目標捕獲富集之技術分析彼等DNA。此等缺陷可為在該等DNA股內且不存在於該DNA之末端處的缺陷。本發明之實施例修復游離DNA中的此等股內缺陷。隨後，修復游離DNA中之該等缺陷可允許此等經修復游離DNA藉由包含定序及目標捕獲富集之技術來分析。

Description

改善游離DNA品質

相關申請案之交叉引用

本申請案主張2018年10月22日申請之題為「改善游離DNA品質」的美國臨時申請案第62/748,767號之優先權，出於所有目的其揭示內容以全文引用之方式併入本文中。

偵測母體血漿中循環游離胎兒DNA（cfDNA）自1997發現其以來已愈來愈被非侵入性產前測試（NIPT）採納。¹ 不同來源之cfDNA分子具有特徵性尺寸分佈，其中母體cfDNA分子具有最充足166-bp峰而胎兒cfDNA分子具有相對突出的143-bp峰。² 胎兒與母體cfDNA之間的尺寸差異已用於基於尺寸之NIPT的研發。^2-4 胎兒DNA分數為成功NIPT之主要貢獻因素。已展示即使定序較淺，亦可估算胎兒DNA分數。⁵ 儘管國際上採用NIPT，多個問題仍需要進一步優化，包含假陰性及未調用結果。⁶ 為了這些目的，已探索多種途徑以自母體血漿富集胎兒DNA。^3,7,8 然而，所有此等方法均具有其缺點。

DNA損傷，例如（單股切口）存在及分佈於整個cfDNA分子中。^9,10 細胞凋亡，咸信其為cfDNA產生之主要機制之一，涉及核破裂期間的DNA斷裂，接著形成且產生凋亡體。^11-13 通常使用之定序文庫製備方法採用僅修復DNA末端，從而導致諸如具有單股切口的受損cfDNA片段之缺失。^10,14,15 因此，藉由現行成對末端大規模平行定序（MPS）平台偵測此等受損cfDNA分子具有挑戰性。

下文所述之系統及方法解決DNA損傷及其他DNA問題。根據該等系統及方法可改善用於定序文庫製備及/或其他分析之游離DNA之品質。

本發明之實施例提供用於分析之游離DNA之品質的改善。游離DNA可包含具有缺陷之DNA，該等缺陷使得不能用諸如定序及目標捕獲富集之技術分析彼等DNA。此等缺陷可為在DNA股內且不存在於DNA之末端處的缺陷。本發明之實施例修復游離DNA中的此等股內缺陷。隨後，修復游離DNA中之缺陷可允許此等經修復游離DNA藉由包含定序及目標捕獲富集之技術來分析。

修復游離DNA可提高可用於分析之DNA之量及/或可允許分析更長的DNA片段。因為在修復之後將可獲得更多無缺陷DNA，在一些情形下，當無缺陷DNA之量不足以進行分析或不足以得出分析之統計顯著結論時，則可能進行DNA分析。另外，更長DNA片段可能更傾向於由本文所述之技術可修復之缺陷。隨後修復缺陷可允許分析更多更長的DNA片段。長DNA片段允許分析病症及病狀，並在最小數目之基因座上重複序列樣式。

游離DNA中缺陷之樣或嚴重程度可為病症或病況之指示。舉例而言，某種病症之游離DNA中的缺陷可能比來自未患病症之個體的游離DNA中之缺陷多。隨後缺陷之數目或樣式可用於提供個體是否患有病症之分類。

可參考以下實施方式及隨附圖式來獲得對本發明實施例之性質及優勢的較佳理解。

術語

如本文所用，術語「基因座（ locus ）」或其複數形式「基因座（ loci ）」為具有跨基因組之變化的任何長度之核苷酸（或鹼基對）的位置或位址。「序列讀段」係指自核酸分子之任何部分或全部定序之一串核苷酸。舉例而言，序列讀段可為自核酸片段定序之短核苷酸串（例如約20至150）、位於核酸片段之一或兩個末端的短核苷酸串或存在於生物樣品中之整個核酸片段之定序。序列讀段可以多種方式獲得，例如使用定序技術或使用探針，例如雜交陣列或捕獲探針；或擴增技術，諸如聚合酶鏈反應（PCR）或使用單一引子的線性擴增或等溫擴增。

「組織」對應於一組細胞，其歸併為一個功能單元。可在單一組織中找到超過一種類型之細胞。不同類型之組織可由不同類型的細胞（例如肝細胞、肺泡細胞或血細胞）組成，但亦可對應於來自不同生物體（母體與胎兒）的組織或對應於健康細胞與展示病症之細胞。

「生物樣品」 係指自個體（例如人類，諸如孕婦、患有病症者或疑似患有病症者、器官移植接受者或疑似具有涉及器官（例如心肌梗塞中之心臟或中風中之大腦或貧血中之造血系統）之疾病過程的個體）取得，且含有一或多種相關核酸分子的任何樣品。生物樣品可為體液，諸如血液、血漿、血清、尿液、陰道液、來自陰囊水腫（例如睪丸）之液體、陰道沖洗液、胸膜液、腹水、腦脊髓液、唾液、汗液、淚液、痰、支氣管肺泡灌洗液、乳頭排出液、來自身體不同部分（例如甲狀腺、乳房）之抽吸液等。亦可使用糞便樣品。在各種實施例中，游離DNA已富集之生物樣品（例如經由離心方案獲得之血漿樣品）中之大部分DNA可為游離的，例如大於50%、60%、70%、80%、90%、95%或99%之DNA可為游離的。離心方案可包含例如3,000 g×10分鐘獲得液體部分，及在例如30,000 g下再離心另外10分鐘以移除殘餘細胞。樣品中之游離DNA可來源於各種組織之細胞，且因此樣品可包含游離DNA之混合物。

「核酸」 可指去氧核糖核苷酸或核糖核苷酸及其呈單股或雙股形式之聚合物。術語可涵蓋含有合成的、天然存在的及非天然存在的已知核苷酸類似物或經修飾主鏈殘基或鍵之核酸，其具有與參考核酸相似之結合特性，且其以與參考核苷酸相似之方式代謝。此等類似物之實例可包含（但不限於）硫代磷酸酯、胺基磷酸酯、膦酸甲酯、對掌性膦酸甲酯、2-O-甲基核糖核苷酸及肽核酸（PNA）。

除非另有指示，否則特定核酸序列亦隱含地涵蓋其經保守性修飾之變異體（例如簡併密碼子取代）及互補序列，以及明確指示之序列。具體而言，簡併密碼子取代可藉由產生其中一或多個所選（或所有）密碼子之第三位置經混合鹼基及/或去氧肌苷殘基取代之序列來達成（Batzer等人,《核酸研究（ Nucleic Acid Res. ）》 19:5081 (1991)；Ohtsuka等人,《生物化學雜誌（ J. Biol. Chem. ）》 260:2605-2608 (1985)；Rossolini等人,《分子細胞探針（ Mol. Cell. Probes ）》 8:91-98 (1994)）。術語核酸可與基因、cDNA、mRNA、寡核苷酸及多核苷酸互換使用。

除非上下文另外清楚地指示，否則術語「核苷酸」除指代天然存在之核糖核苷酸或去氧核糖核苷酸單體之外，可理解為係指其相關結構變異體，包括衍生物及類似物，該等結構變異體相對於核苷酸正使用之特定情況（例如與互補鹼基雜交）在功能上等效。

「序列讀段」係指自核酸分子之任何部分或全部定序之一串核苷酸。舉例而言，序列讀段可為存在於生物樣品中之整個核酸片段。序列讀段可自單分子定序獲得。「單分子定序」 係指對單模板DNA分子進行定序以獲得序列讀段，而不需要解譯來自模板DNA分子之純系複本之鹼基序列資訊。單分子定序可對整個分子或DNA分子之僅一部分進行定序。DNA分子之大部分可經定序，例如大於50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%。

「分類」 係指與樣品之特定特性相關的任何數字或其他字元。舉例而言，「+」符號（或詞語「陽性」）可表示樣品歸類為具有缺失或擴增。分類可以為二元的（例如陽性或陰性）或具有更多層級之分類（例如自1至10或0至1之等級）。術語「截斷」 及「臨限」 係指操作中使用之預定數字。舉例而言，截斷尺寸可指一種尺寸，大於此尺寸則排除片段。臨限值可為一種值，高於或低於此值，則特定分類適用。此等術語中之任一者可用於此等情形中之任一者。

術語「尺寸型態」 大體上係關於生物樣品中之DNA片段的尺寸。尺寸型態可為提供各種尺寸之DNA片段之量分佈的直方圖。各種統計參數（亦稱為尺寸參數或僅參數）可用於區分一個尺寸型態與另一尺寸型態。一個參數為特定尺寸或尺寸範圍之DNA片段相對於所有DNA片段或相對於另一尺寸或範圍之DNA片段的百分比。

如本揭示案所用之術語「截斷值」 或量意謂用於在生物樣品之兩種或更多種分類狀態之間判斷——例如是否存在與特定表型病況或疾病或對表型病況或疾病之易感性相關或關聯的基因序列的數值或量。舉例而言，若參數大於截斷值，則進行定量資料之第一分類，或若參數小於截斷值，則進行定量資料之不同分類。

母體血漿中及其他生物樣品中之游離DNA可用於診斷性及其他目的。然而，游離DNA分子可能在雙股核酸分子之股內受損。損傷可由生物樣品之原因（例如熱、攪動、紫外光）或生物樣品之內部原因（例如複製錯誤）產生。習知檢定，包含定序及使用目標探針，可能無法自此等具有股內缺陷之雙股核酸分子確定讀段。因此，受損游離DNA可能不提供可用於分析之任何資訊。本發明之實施例可允許自生物樣品中之游離DNA產生更多資訊及更精確資訊。

圖 1A 展示完好雙股DNA及股內缺陷。完好dsDNA展示在糖磷酸酯主鏈或鹼基對中不存在缺陷。帶切口DNA展示缺少兩個相鄰核苷酸之間的主鏈。具體而言，相鄰核苷酸之間不存在磷酸二酯鍵。有間隙DNA為股中缺少一或多個核苷酸的情況。無鹼基DNA為缺少一或多個鹼基而主鏈不受影響的情況

圖 1B 展示可能影響DNA內之鹼基的其他缺陷。當相鄰胸腺嘧啶鹼基經由碳-碳雙鍵彼此結合（通常在紫外線輻射存在下）時可形成胸苷二聚體。因此，與腺嘌呤結合之胸腺嘧啶鹼基對斷裂。氧化嘧啶包含鳥嘌呤被氧化以形成8-側氧基鳥嘌呤時。脫胺胞嘧啶包含胞嘧啶損失胺基且形式尿嘧啶時。

圖 1C 展示DNA-蛋白交聯缺陷。雙股DNA與蛋白交聯。DNA-蛋白交聯缺陷可經由反向交聯解決，該反向交聯可藉由添加高濃度之氯化鈉達成。

為補救受損DNA分子，吾人假設使用Taq DNA聚合酶、Bst DNA聚合酶、Taq DNA接合酶、核酸內切酶VIII、核酸內切酶IV、T4核酸內切酶V（PDG）、8-側氧基鳥嘌呤醣苷酶（FPG）或尿嘧啶-DNA醣苷酶（UDG）之修復混合物可用於修復母體血漿中之cfDNA。修復混合物之實例為PreCR修復混合物。經修復具有較高DNA完整性之母體血漿DNA可增加下游分析之成功率。由於胎兒源性cfDNA分子比母體源性cfDNA分子更短且更片段化，^2,16 吾人提議胎兒cfDNA分子擁有更多DNA損傷。藉由修復此等受損胎兒cfDNA分子，可富集胎兒DNA分數。

在此研究中，吾人對來自早期及晚期妊娠孕婦之母體血漿的cfDNA應用修復處理。吾人研究並比較經修復cfDNA樣品及其假處理對照的尺寸型態及胎兒DNA分數。吾人亦將論述修復處理對NIPT之效能及對評估個體是否患有病症的效能之潛在影響。I ． 母體血漿之 DNA 修復研究

處理來自母體血漿之DNA片段以修復諸如圖1A中之彼等缺陷的股內缺陷。分析經修復DNA片段對短及長片段以及胎兒及母體DNA之作用。 A 材料及方法1. 個體、樣品收集及 DNA 提取

此研究經機構研究倫理委員會批准。在獲得知情同意書之情況下，自香港威爾士親王醫院婦產科（Department of Obstetrics and Gynaecology, Prince of Wales Hospital, Hong Kong）招募懷有單胎男胎之孕婦。如先前所述自20 mL之EDTA抗凝母體外周血液分離血漿。² 對於晚期妊娠情形，在自距臍帶附著2 cm深5 cm遠之區遞送之後新剝離1 cm³ 之胎盤組織。對於早期妊娠情形，獲得絨毛膜絨毛樣品（CVS）。分別使用QIAamp DSP DNA血液迷你套組（Qiagen）及QIAamp DNA血液迷你套組（Qiagen）提取血漿及白血球層基因組DNA，且藉由Qubit 3.0（Invitrogen）定量。使用QIAamp DNA迷你套組（Qiagen）根據製造商之方案提取胎盤DNA及絨毛膜絨毛DNA。2. 血漿 cfDNA 修復及定序 文庫製備

使用PreCR修復混合物（新英格蘭生物實驗室（New England Biolabs））對10 ng提取血漿DNA進行DNA修復。用相同量之DNA輸入同時進行假處理對照。假處理對照包含反應緩衝劑但不含活性酶。在此情形下，假處理對照並不包含PreCR修復混合物之活性酶。藉由消除由反應緩衝劑導致的潛在偏差，假處理對照比普通對照（亦即無反應緩衝劑）更佳。簡言之，將10 ng提取DNA在49 　l反應物中與1X ThermoPol緩衝劑、100 　M dNTPs、1X NAD⁺ 及H₂ O混合，接著添加1 　l H₂ O（假處理）或PreCR修復混合物（修復）。假處理或經修復處理血漿DNA藉由MinElute反應物清除套組（Qiagen）純化以移除剩餘酶及試劑，接著進行成對末端定序文庫製備。雙股DNA（dsDNA）文庫如先前所述產生。¹⁷ 接附子接合單股DNA（LIG-ssDNA）文庫藉由Accel-NGS 1S Plus DNA文庫套組（SWIFT Biosciences）產生。文庫藉由Qubit dsDNA HS檢定套組（Thermo Fisher Scientific）及LightCycler 96系統（Roche）上之即時定量PCR（KAPA文庫定量套組）定量。藉由Agilent 4200 TapeStation系統用高靈敏度D1000 ScreenTape（Agilent）檢查定序文庫之尺寸型態以確認在定序之前成功製備文庫。3. 目標捕獲富集及大規模平行定序

如所述執行定序文庫之目標捕獲。¹⁸ 捕獲探針（Roche Nimblegen）主要目標Chr6及ChrY上之序列。獲得之平均定序深度為每鹼基152X（在82X至210X範圍內）。藉由定量即時PCR驗證目標捕獲富集效率。所有文庫均用NextSeq 500系統（Illumina）上之75 bp x 2的成對末端（PE）型式定序。移除接附子序列及低品質鹼基（亦即品質評分＜5）且使用短寡核苷酸比對程式2（SOAP2）將定序讀段與非重複遮蔽人類參考基因組（hg19）比對。¹⁹ 至多兩個核苷酸錯配但不插入缺失，允許用於成對末端讀段之各成員。4. 單分子即時（ SMRT ）定序

將具有Illumina型式接附子之目標捕獲前定序文庫彙集且使用SMRTbell模板製備套組1.0-SPv3（Pacific Biosciences）進行SMRT定序模板構建。將目標捕獲後Illumina定序文庫以相似方式彙集且進一步進行SMRT定序文庫構建。使用擴增子模板製備及定序方案，並作少量修改：用1.8x AMPure PB珠粒純化DNA，且使用TapeStation儀器（Agilent）估計文庫尺寸。用SMRT Link v5.1.0軟體（Pacific Biosciences）計算定序引子退火及聚合酶結合條件。簡言之使定序引子v3退火至定序模板，隨後使用Sequel Binding and Internal Control套組2.1（Pacific Biosciences）使聚合酶與模板結合。在Sequel SMRT Cell 1M v2上進行定序。用Sequel定序套組2.1（Pacific Biosciences）在Sequel系統上收集定序影片10小時。5. 微陣列基因分型及單核苷酸多態性（ SNP ）鑑別

用Infinium Omni2.5-8 V1.3套組及iScan系統（Illumina）對胎兒及母體基因組DNA樣品進行基因分型。SNP由Birdseed v2算法調用。²⁰ 將CVS及胎盤之基因型與母親之基因型進行比較以鑑別胎兒特異性及母體特異性SNP等位基因。若SNP在母親中為同型接合而在胎兒中為異型接合則將其視為胎兒特異性，而反之則為母體特異性SNP。如所述推導胎兒DNA分數。² 在尺寸分級胎兒分數分析中，如先前所述將胎兒DNA片段劃分成10-bp區間，¹⁷ 其具有分析之經修改尺寸範圍。錯誤率由以下方程式推導：

對於小鼠血漿cfDNA修復，在10至12週齡經由心臟穿刺獲得來自兩隻野生型（WT）C57BL/6小鼠之全血樣品。如先前所述將血液收集至含EDTA之收集管中並分離血漿。²¹ 在dsDNA定序文庫製備之前對10 ng cfDNA輸入進行假處理或修復處理。 B. 結果

來自母體血漿之cfDNA的修復處理之結果展示修復處理可恢復胎兒及母體來源之長（＞250 bp）cfDNA分子之子組。修復處理使胎兒分數少量但持續提高。分析經修復DNA之結果展示在修復之後與其母體對應物比較時胎兒長cfDNA分子（＞250 bp）之富集相對較高。對於分子診斷之下游檢定未發現修復處理改變DNA保真度。發現雙股DNA之缺陷之修復比單股DNA中缺陷之修復更有效。1. 來自早期及晚期妊娠母體血漿樣品之假處理或經修復 cfDNA 之尺寸型態特徵

吾人最先研究在假處理或PreCR DNA修復處理之後是否存在母體血漿中的cfDNA之任何尺寸型態變化。粗略地，假處理與修復組之間的尺寸型態並未展示在距定序0至250 bp範圍內之主要差異。兩組之主峰大小均在大約166 bp處且一系列峰在70至150 bp具有10 bp週期性。然而，吾人觀測到在修復處理之後與其假處理對應物進行比較短（0至250 bp）cfDNA片段平均降低2.4%（96.64%至94.33%）而長（251至600 bp）cfDNA片段平均提高68.8%（3.36%至5.67%）。統計分析展示兩種變化均顯著（均p＜0.01 ；Student's成對t 測試）。使用IBM SPSS Statistics（IBM）進行Student's成對t 測試及Wilcoxon符號秩測試。p值小於0.05視為統計學上顯著的。

圖 2A 展示來自代表性晚期妊娠母體血漿（M12778）之假處理及經修復cfDNA之尺寸型態比較。下圖代表長cfDNA分子之放大尺寸型態（黑色框）。該圖展示251至600 bp之片段的百分比分數之提高。

此趨勢在所有個體測試（包含來自早期及晚期妊娠之所有母體血漿）中均一致（圖 2B ）。圖 2B 展示在假處理或修復處理之後妊娠早期及妊娠晚期母體血漿中具有不同尺寸的cfDNA分子之定量。在修復之後短（0至250 bp）cfDNA分子之分數不斷降低而長（251至600 bp）cfDNA分子之分數不斷提高。Student's成對t 測試，p＜0.01。觀測到短分子之百分比分數之降低為修復之後長分子數目提高之結果。

圖 3A 、圖 3B 、圖 3C 及圖 3D 以對數尺度呈現來自圖 2A 及圖 2B 中之樣品的資料，以更好地說明更長片段之頻率增加。圖 3A 展示以對數尺度表示的來自代表性晚期妊娠母體血漿（M12778）之假處理及經修復cfDNA之尺寸型態比較。圖 3B 至圖 3D 展示假處理及經修復cfDNA之平均尺寸型態比較。圖 3B 展示來自所有情形之結果。圖 3C 僅展示早期妊娠。圖 3D 僅展示晚期妊娠。在此等圖中經修復定序文庫中長（＞250 bp）cfDNA分子之富集突出。

接著吾人詢問在修復處理之後的此等尺寸變化是否展示與cfDNA分子之胎兒或母體來源之任何關係。使用基於SNP之基因型，吾人將所有個體之cfDNA片段分離成其相應母體及胎兒來源。將攜帶胎兒或母體特異性SNP等位基因之cfDNA片段分離且分別視為胎兒或母體特異性cfDNA分子。¹⁷ 吾人自胎兒及母體來源之經修復cfDNA分子中觀測到相似趨勢（圖 4A ）。圖 4A 展示來自左側之胎兒來源及右側之母體來源的假處理及經修復cfDNA之平均尺寸型態比較。下圖代表長cfDNA分子之放大尺寸型態（黑色框）。

在修復處理之後長胎兒及母體cfDNA分子分別平均提高82.7%（2.26%至4.13%）及66.7%（3.42%至5.7%）（圖 4B ）。圖 4B 展示左側胎兒cfDNA及右側母體cfDNA分子中短（0至250 bp）及長（251至600 bp）cfDNA分子之定量。所展示之資料來自假處理或修復處理後之妊娠早期及妊娠晚期母體血漿。統計分析展示兩個增量均顯著（均p＜0.01；Student's成對t 測試）。此等結果表明在修復之後與其母體對應物比較胎兒長cfDNA分子之富集相對較高。2. 來自早期及晚期妊娠母體血漿樣品之假處理或經修復 cfDNA 文庫之胎兒 DNA 分數特徵

因為胎兒DNA分數為成功NIPT之重要參數，此度量之提高可有益於NIPT之靈敏度，尤其在胎兒比重不足之情形下。⁶ 因此，吾人表徵並比較來自假處理及修復處理之後的妊娠早期及妊娠晚期樣品之母體血漿的總胎兒DNA分數。當來來自所有8個樣品在資料彙集在一起時，吾人觀測到在修復處理之後與其假處理對照比較胎兒DNA分數持續提高4.31%（21.85%至22.79%）（圖 5 ）。修復處理使胎兒分數少量但持續提高。統計分析展示此等增量為顯著的（p = 0.012；Wilcoxon符號秩測試）。此等溫和胎兒DNA分數增量之來源可能來自新修復胎兒長cfDNA分子。為證明此，吾人對假處理及經修復個體均應用尺寸分級胎兒分數分析。將胎兒DNA片段劃分成10-bp區間，範圍為0 bp至600 bp。隨後分別推導各區間內之胎兒DNA分數。¹⁷ 吾人觀測到此等胎兒DNA分數增量主要由尺寸為大約300 bp之胎兒cfDNA分子的增加貢獻（圖 6A 及圖 6B ）。圖4A展示早期妊娠母體血漿。圖6B展示晚期妊娠母體血漿。在經修復組中長（大致300 bp）cfDNA分子中之胎兒DNA分數具有輕度提高。綜合而言，此等結果表明在母體血漿中長胎兒cfDNA分子之富集高於其母體對應物。

DNA損傷可為定序誤差之普遍原因。²² 新型誤差可經由cfDNA修復方案之多個步驟，諸如股置換及氧化核苷酸之校正引入cfDNA中。因此，吾人接著檢驗經修復文庫中誤差率是否存在顯著變化。在早期及晚期妊娠情形下均未觀測到誤差率之顯著變化（圖 7 ）。此表明對於分子診斷之下游檢定修復處理並不改變DNA保真度。

因為胎兒cfDNA分子為母體血漿中之少數物種，大多數自總母體血漿cfDNA定序獲得之資料由母本源性cfDNA分子主導。具體而言，為獲得增加的胎兒cfDNA分子之定序深度，吾人使用目標捕獲方法使用與Chr6及ChrY上之序列雜交的探針。¹⁸ 對於所有假處理及經修復樣品吾人實現每鹼基152X之平均定序深度。目標定序結果之觀測結果與非目標捕獲資料一致，其中在修復處理之後尺寸在250 bp與600 bp之間的長cfDNA分子富集13.6%（10.53%至11.96%）（圖 8 ）。目標捕獲探針在Chr6及ChrY之序列上雜交。來自彙集之妊娠早期及妊娠晚期母體血漿之假處理及經修復cfDNA之平均尺寸型態比較。下圖為長cfDNA分子之放大尺寸型態（黑色框）。

當僅計算所捕獲之胎兒cfDNA分子時，吾人觀測到在修復處理之後長染色體Y cfDNA分子相對於其假處理對應物平均富集14.8%（6.36%至7.3%）（圖 9A ）。頂部圖式展示來自早期妊娠（左側）及晚期妊娠（右側）母體血漿中之Y染色體的假處理及經修復cfDNA分子之平均尺寸型態比較。下圖代表長cfDNA分子之放大尺寸型態（黑色框）。圖9B展示在假處理或修復處理之後來自妊娠早期及妊娠晚期母體血漿之短（0至250 bp）及長（251至600 bp）cfDNA Y染色體cfDNA分子之定量。統計分析展示此等增量為顯著的（p＜0.01；Student's成對t 測試）。因此，吾人已證實修復處理可恢復母體血漿中胎兒及母體來源之長（＞250 bp）cfDNA分子子組。在修復之後總胎兒DNA分數之少量但持續之提高由長胎兒cfDNA分子相對於其母體對應物更高之富集。3. 修復處理後來自母體血漿之長於 250 bp 的 cfDNA 分子之富集

因為假處理及修復cfDNA之間的主要尺寸差異駐留在長於250 bp之cfDNA分子上，藉由習知NGS平台（諸如Illumina平台）偵測此等分子可能並非較佳的，因為其讀取長度更短。採用SMRT技術之來自Pacific Biosciences的第三代定序平台可實現超過20 kb之定序讀取長度。²³ 吾人假設使用此類技術，吾人可提高吾人觀測母體血漿中長於250 bp之cfDNA分子的能力。由於最小cfDNA輸入之限制，吾人彙集所有Illumina格式化之目標捕獲前及之目標捕獲後文庫且在SMRT定序平台上對其再定序而非直接定序DNA模板。吾人預期在修復處理之後長cfDNA分子之富集。與吾人之來自Illumina平台之定序資料一致，吾人觀測到在修復處理之後在具有或不具有目標捕獲之彙集文庫中長於250 bp的cfDNA分子分別富集31.3%及28.9%（圖 10 ）。目標捕獲前（左側）及目標捕獲後（右側）文庫之彙集樣品展示在修復之後長於250 bp之cfDNA分子之富集，而分子長於400 bp之富集更突出。對於長於600 bp之cfDNA分子而言此等富集甚至更顯著（在目標捕獲前及目標捕獲後文庫中分別為52%及50.4%）。此等資料不僅進一步確認吾人先前在修復處理之後在成對末端、短讀段定序平台中對長cfDNA分子富集之觀測結果，且亦闡明在先前研究中尚未藉由大規模平行定序分析之長cfDNA分子之群體。4. cfDNA 修復在不同文庫製備方案中之效能

因為吾人先前已展示超短片段係藉由單股DNA（ssDNA）定序文庫製備方法富集，¹⁷ 相較於習知雙股DNA（dsDNA）方法評估此等方案中之cfDNA修復效能為值得的。吾人假設由接附子接合ssDNA（LIG-ssDNA）方案所獲得的超短cfDNA片段之一些分數實際上釋放自受損DNA結構，其中切口及/或間隙存在於雙股DNA結構之單股中。吾人推測cfDNA修復可藉由LIG-ssDNA方案經由填充DNA股上之間隙及切口來減少此等超短cfDNA片段（＜100 bp）富集。為驗證此等假設，吾人在假處理或PreCR處理之後同時進行dsDNA及LIG-ssDNA文庫製備方法。吾人觀測到與其假處理對應體比較經修復LIG-ssDNA文庫中超短cfDNA片段（＜100 bp）減少。對於長於250 bp之cfDNA片段，cfDNA片段之增量極有限（圖 11 ）。吾人推斷儘管修復之後超短cfDNA片段之一些部分減少，但無證據表明此等部分有助於更長cfDNA片段之增加。因此，LIG-ssDNA文庫中長cfDNA片段恢復之能力比dsDNA文庫差。用PreCR修復缺陷對單股DNA文庫製備方案不如對雙股DNA文庫製備方案有效。5. 來自小鼠血漿之 cfDNA 中的 cfDNA 修復效能

為驗證cfDNA損傷之修復是否亦存在於非人類哺乳動物中，吾人評估cfDNA修復在來自小鼠之cfDNA中之效能。自兩隻C57BL/6野生型（WT）小鼠分離血漿，自血漿提取DNA，接著進行假處理或修復處理。在嚴格人類情境中製備定序dsDNA文庫。吾人觀測到在修復處理之後長（200-1000 bp）cfDNA片段之70%提高（圖 12 ）。經修復之長（＞200 bp）cfDNA片段之富集為未經修復處理之對應體之1.41倍。cfDNA片段頻率以對數尺度呈現。此結果與人類群組一致，表明高級生物體（諸如哺乳動物）共有相似cfDNA損傷模式。II 胎兒三染色體症及 SLE 患者之 DNA 修復研究

處理來自另外的個體之DNA片段以修復股內缺陷。修復來自各自懷有單胎第21對染色體三體症胎兒之孕婦之母體血漿的DNA片段。另外，修復來自患有活性或無活性全身性紅斑性狼瘡症（SLE）之患者的DNA片段。分析經修復DNA片段對短及長片段之作用以及其對偵測樣品之病況的影響。章節‎0中之參考文獻與其他章節中之參考文獻相隔單獨編號，且參考文獻提供於章節末端之清單中。 A. 材料及方法

此研究經機構倫理委員會批准。招募十名早期妊娠及十名晚期妊娠孕婦，該等婦女懷有單胎男胎。亦招募五名懷有單胎第21對染色體三體症胎兒之孕婦。招募四名患有全身性紅斑性狼瘡症（SLE）之患者。所有SLE患者符合美國風濕病學會（American College of Rheumatology）診斷性準則且其狼瘡疾病活動藉由SLE疾病活動指數（SLEDAI）評估，SLE疾病活動指數為疾病活動之臨床量測。¹ 兩名患者具有無活性SLE（SLEDAI中值：1；範圍0至2）而其他兩名具有活性SLE（SLEDAI均等於8）。亦藉由血液取樣之時間量測所有患者之抗dsDNA抗體水平。所有妊娠樣品均自香港威爾士親王醫院婦產科招募。SLE樣品自香港威爾士親王醫院醫學及治療科風濕病門診招募。所有個體均已知情同意。1. 文庫製備

如先前所述自20 mL之EDTA抗凝母體外周血液分離血漿。² 對於晚期妊娠情形，在自距臍帶2 cm深5 cm遠之區遞送之後新剝離1 cm³ 之胎盤組織。對於早期妊娠情形，獲得絨毛膜絨毛樣品（CVS）。分別使用QIAamp DSP DNA血液迷你套組（Qiagen）及QIAamp DNA血液迷你套組（Qiagen）提取血漿及白血球層基因組DNA，且藉由Qubit 3.0（Invitrogen）定量。使用QIAamp DNA迷你套組（Qiagen）根據製造商之方案提取胎盤DNA及絨毛膜絨毛DNA。對於游離DNA（cfDNA）修復，藉由使用PreCR修復混合物（新英格蘭生物實驗室）針對每個個體修復10 ng提取血漿DNA輸入。

對假處理對照用相同量之DNA輸入及僅反應緩衝劑同時進行。所有DNA修復或假處理處理均根據製造商之說明進行。假處理或經修復處理血漿DNA藉由MinElute反應物清除套組（Qiagen）純化以移除剩餘酶及試劑，接著進行定序文庫製備。雙股DNA（dsDNA）文庫由Illumina之KAPA HTP文庫製備套組（KAPA Biosystems）根據製造商之說明產生。接附子接合單股DNA（LIG-ssDNA）文庫由Accel-NGS 1S Plus DNA文庫套組（SWIFT Biosciences）產生。文庫藉由Qubit及LightCycler 96系統（Roche）上之即時定量PCR定量。藉由Agilent高靈敏度D1000 ScreenTape系統（Agilent）檢查定序文庫之尺寸型態。所有文庫均用NextSeq 500系統（Illumina）上之75 bp x 2的成對末端（PE）型式定序。移除接附子序列及低品質鹼基（亦即品質評分＜5）且使用短寡核苷酸比對程式2（SOAP2）將文庫與非重複遮蔽人類參考基因組（hg19）比對。³ 至多兩個核苷酸錯配但不插入缺失，允許用於成對末端讀段之各成員。

對於小鼠血漿cfDNA修復，在10至12週齡經由心臟穿刺獲得來自兩隻野生型（WT）C57BL/6小鼠之全血樣品。如先前所述將血液收集至含EDTA之收集管中並分離血漿。⁴ 在dsDNA定序文庫製備之前對10 ng cfDNA輸入進行假處理或修復處理。對於SLE血漿樣品，每個樣品之所有提取cfDNA均在dsDNA定序文庫製備之前均勻分成假處理或修復處理。2. 微陣列基因分型及單核苷酸多態性（ SNP ）鑑別

用Infinium Omni2.5-8 V1.3套組及iScan系統（Illumina）對胎兒及母體基因組DNA樣品進行基因分型。SNP由Birdseed v2算法調用，置信度截斷分值為0.15。⁵ 將CVS及胎盤之基因型與母親之基因型進行比較以鑑別胎兒特異性及母體特異性SNP等位基因。若SNP在母親中為同型接合而在胎兒中為異型接合則將其視為胎兒特異性，而反之則為母體特異性SNP。如所述推導胎兒DNA分數。² 簡言之，胎兒DNA分數（F）係藉由胎兒特異性SNP等位基因（p）與母親及胎兒共有之共同SNP等位基因（q）之間的等位基因比率使用下式推導：⁶

在尺寸分級胎兒分數分析中，如先前所述將胎兒DNA片段劃分成10-bp區間，⁷ 具有經修改的分析尺寸範圍。為了偵測第21對染色體三體症，每個樣品之Chr21之過表現藉由Z分值使用下式來定量：

其中GRchr21係第21號染色體之基因組表現（GR）。 B. 結果

發現修復DNA片段在來自懷有單胎三染色體症胎兒之孕婦的生物樣品中及來自活性及無活性SLE患者之生物樣品中均富集更長片段。發現修復來自母體血漿之DNA片段提高確定胎兒之三染色體症的靈敏度及特異性。PreCR修復處理富集更長（＞250 bp）cfDNA分子而不顯著損失更短（＜166 bp）cfDNA分子。與未經修復之生物樣品比修復DNA片段使得更多來自生物樣品之DNA片段用於分析三染色體症或SLE或其他病狀。修復DNA片段得到更大的無活性與活性SLE樣品之間的絕對分離差值。對於潛在分子診斷開發而言此轉換成相對提高33.7%。 1.來自第 21 對染色體三體症母體血漿樣品之假處理或經 PreCR 修復 cfDNA 之尺寸型態特徵。

圖13展示來自懷有患第21對染色體三體症之胎兒的孕婦之母體血漿的短（0至250 bp）及長（＞250 bp）cfDNA片段之尺寸分佈表。與妊娠早期及妊娠晚期母體血漿樣品之結果相似，吾人觀測到在PreCR修復處理之後所有第21對染色體三體症樣品中短（0至250 bp）cfDNA片段平均絕對減少3.3%（95.5%至92.2%）而長（＞250 bp）cfDNA片段平均絕對增加3.7%（4.1%至7.8%）。

圖 14A 及圖 14B 展示在修復之前及之後第21對染色體三體症樣品中DNA片段之尺寸型態。圖 14A 及圖 14B 為總頻率之百分比分數對比DNA片段尺寸之圖式。圖14A展示對數尺度之百分比分數，而圖14B展示相同資料的線性尺度之百分比分數。在每個圖式上繪製假處理及經PreCR修復處理片段。經PreCR修復片段展示比假處理片段更大之更長片段之分數。

圖 15 展示在經假修復處理或經PreCR處理修復之後來自五名各自懷有第21對染色體三體症胎兒之女性的短（0至250 bp）及長（251至600 bp）cfDNA分子之定量。圖15中之圖式展示假處理及修復處理片段之總頻率之百分比分數。短片段展示百分比分數之下降。長片段展示百分比分數之提高。統計分析展示兩個變化均顯著（均p＜0.01 ；Student成對t 測試）。2. PreCR 修復處理之後第 21 對染色體三體症之改善的 NIPT 效能

因為經修復cfDNA樣品具有更多來自胎兒之可分析的完好長cfDNA分子，吾人旨在證實其用於產前診斷之潛在應用。吾人招募五名懷有第21對染色體三體症胎兒之孕婦且將Chr21之染色體表現與10個早期妊娠整倍體病例（其將為NIPT之臨床上最相關樣品）比較。吾人觀測到在PreCR修復處理之後，第21對染色體三體症病例之Chr21 z分值展示平均提高17.3%（範圍為14.4%至19.8%）且顯現與整倍體樣品之z分值更好的分離度（圖 16 ）。

在圖 16 中，五個第21對染色體三體症樣品之第21號染色體z分值展示於左側上，而10個整倍體樣品之第21號染色體z分值展示於右側上。經修復第21對染色體三體症樣品展示提高的z分值且與整倍體樣品之分離度更高。此等結果表明PreCR修復處理可改善第21對染色體三體症孕婦之NIPT效能。修復處理可允許更低的胎兒分數用於非整倍體分析。修復亦可允許在用於非整倍體之未經修復DNA尚未展示足夠高的z分值以分類為非整倍體之情形中非整倍體之分類。修復處理可產生具有與無修復處理之方法比提高的靈敏度、特異性及/或準確度之方法。a) 模擬細節

為了定量地證實血漿DNA修復作用，吾人進行模擬分析，接著進行接收者操作特徵（ROC）分析使用映射至懷有第21對染色體三體症胎兒之孕婦中的chr21之DNA讀段以確定使用經修復之血漿DNA讀段是否提供優於未經修復的血漿DNA讀段之優勢。在模擬中，假設胎兒分數為1%且假設總定序讀段為300萬。在PreCR修復之後胎兒分數之相對提高設定為4.8%。

在電腦模擬中，假設來源於特定染色體之血漿DNA之定序讀段之數目遵循二項分佈。對於懷有整倍體胎兒之孕婦，源自第21號染色體（chr21）之血漿DNA之定序讀段比例表示為GR21。在總定序讀段中，來源於chr21之讀段之數目（E）將遵循以下分佈：

，（1）其中「Binom」表示二項分佈。

對於懷有三染色體症胎兒之孕婦，源自chr21之血漿DNA之定序讀段的比例表示為GR'₂₁ ：

，（2）其中f為孕婦之母體血漿DNA中胎兒DNA分數。在總定序讀段中，來源於chr21之讀段之數目（T）將遵循以下分佈：

，（3）其可重寫為：

，（4）

在修復血漿DNA之後在定序之前，f將提高至f'，其藉由下式調節：

，（5）其中α是血漿DNA修復後胎兒DNA分數的相對增加。在此情境下，對於懷有三染色體症胎兒之孕婦，在總定序讀段（n）中，來源於chr21之讀段之數目（G）將遵循以下分佈：

，（6）

根據（1）、（4）及（6），吾人針對100個分別來自懷有整倍體胎兒之孕婦及懷有第21對染色體三體症胎兒之孕婦的血漿DNA樣品模擬源自chr21之定序讀段。吾人亦模擬100個來自懷有第21對染色體三體症胎兒之孕婦之血漿DNA，隨後進行DNA修復。對於各樣品，假設胎兒分數為1%且假設總定序讀段（n）為300萬。與懷有整倍體胎兒之孕婦比較，將接收者操作特徵（ROC）分析用於確定映射至懷有第21對染色體三體症胎兒之孕婦中的chr21之經修復與未經修復之血漿DNA讀段之百分比之間的診斷性差異。

用R函數rbinom 產生二項分佈。用R套裝程式pROC（1.15.3版）繪製經DNA修復及未經DNA修復之群組的ROC曲線。採用DeLong's測試來比較ROC曲線以確定與無DNA修復之方法比較使用具有DNA修復方案之方法對第21對染色體三體症偵測之改善是否統計學上顯著。b) 模擬結果

圖 17 展示模擬結果之ROC曲線，其比較偵測經DNA修復與未經DNA修復之第21對染色體三體症。結果展示在修復之後曲線下面積（AUC）自0.729增加至0.822。使用DeLong's測試之統計分析展示改善為顯著的（假處理相對於修復，DeLong's測試：p = 0.006013）。因此，修復DNA可改善使用來自母體血漿的DNA片段確定胎兒之三染色體症的靈敏度及特異性。3. PreCR 修復處理之後來自 SLE 患者之血漿中更長 cfDNA 分子增加

與正常個體比較來自SLE患者之cfDNA分子的cfDNA尺寸型態不同。⁸ 先前已報導短於115 bp之cfDNA片段之富集突出。⁸ 此外，疾病之嚴重程度對應於此等超短cfDNA片段之量，亦即活性SLE患者在其血漿中具有更多超短片段。基於此，吾人旨在探索PreCR修復處理對來自SLE患者之cfDNA分子的尺寸型態之影響。吾人招募2名無活性（SLEDAI = 0至2）及2名活性（SLEDAI = 8）SLE患者，自其血漿提取cfDNA，並進行假處理或修復處理。

圖 18 包含樣本編號，SLE疾病活動指數（SLEDAI）水平、SLE患者之抗ds DNA抗體水平及來自血漿之總DNA量。SLEDAI及抗ds DNA抗體水平為疾病活動之臨床量測。較高SLEDAI及較高抗ds DNA抗體水平對應於更具活性之SLE狀態。

吾人觀測到在修復之後更長cfDNA片段增加，與來自母體血漿樣品之結果相似。

圖 19 及圖 20 展示來自SLE患者中之每一者的經修復及未經修復cfDNA之尺寸型態。圖19展示分數之對數對比DNA片段之尺寸。圖19以線性尺度展示相同資料。分析來自四個患者之樣品（S113、S117、S312、S494），其中每個患者具有假處理及修復樣品。假處理資料用虛線展示，而經修復資料用實線展示。兩名患者具有無活性SLE，且兩名患者具有活性SLE。圖式展示在修復情況下更長DNA片段（＞250 bp）增加。在修復情況下更短DNA片段（＜200 bp）展示輕微減少。

圖 21A 及圖 21B 展示圖 19 及圖 20 中所顯示的來自無活性及活性SLE患者之平均結果。圖21A展示對數分數對比DNA片段尺寸。圖21B以線性尺度展示相同資料。圖式展示在修復情況下更長DNA片段（＞250 bp）增加。在修復情況下更短DNA片段（＜200 bp）展示輕微減少。

圖 22 展示在cfDNA修復之後活性及無活性SLE患者中不同尺寸範圍之DNA片段的百分比變化及百分比表。圖22涉及圖19及圖20中顯示之相同資料。表具有四個不同尺寸範圍：短（0至250 bp）、長（＞250 bp）、0至115 bp及＞200 bp。0至115 bp及＞200 bp之尺寸範圍為Chan等人, 《美國國家科學院院刊（PNAS）》 (2014)中所用之範圍。⁸ 針對無活性SLE患者及活性SLE患者報導每個尺寸範圍之百分比。表中每個單元中的前兩個百分比為修復之前及修復之後的尺寸範圍之百分比。括弧中之百分比指示修復之後增加或減少之相對百分比。

圖 23 展示在修復之後無活性SLE及活性SLE患者之平均百分比變化。圖23展示將來自患者之資料平均之後的百分比變化，與圖21A及圖21B中繪製之資料相似。對於無活性SLE患者，在PreCR修復處理之後短（0至250 bp）cfDNA片段平均減少2.3%（97.4%至95.2%）而長（251至600）cfDNA片段平均增加88.0%（2.6%至4.8%）。對於活性SLE患者，在PreCR修復處理之後短cfDNA片段平均減少1.4%（97.2%至95.8%）而長cfDNA片段平均提高49.3%（2.8%至4.2%）。然而，吾人並未觀測到尺寸短於或等於166 bp之cfDNA分子之量的任何顯著變化。

當分別將短及長DNA片段之尺寸範圍修改成0至115 bP及＞200 bp時，變化與0至250 bp及＞250 bp變化相似。對於無活性SLE樣品，在PreCR修復處理之後短（0至115 bp）及長（＞250 bp）cfDNA片段分別平均相對減少14.5%（4.3%至3.7%）及平均相對增加46.8%（5.4%至7.6%）。對於活性SLE患者在PreCR修復處理之後短（0至115 bp）及長（＞250 bp）cfDNA片段分別平均相對減少4.3%（11.8%至11.3%）及平均相對增加21.7%（7.8%至9.4%）。PreCR修復處理增加可用於SLE之診斷的DNA片段之數目。為了評估使用PreCR修復對SLE患者進行診斷之可能性，吾人進行尺寸分組（限於120至130 bp）且在假處理或PreCR修復處理之後分別繪製無活性及活性SLE樣品之絕對百分比。

圖 24A 及圖 24B 繪製使用假處理及修復DNA片段對SLE患者進行分子診斷之可能性。圖24A為圖22中之120至130 bp之資料的圖形表示。圖24A繪製在假處理或PreCR修復處理之後無活性及活性SLE樣品之絕對百分比。將尺寸分組設定為120至130 bp。D₁ 及D₂ 分別代表在假處理或PreCR修復處理之後無活性與活性SLE樣品之間的絕對分離差值。圖24B繪製條形圖，其展示經修復SLE樣品中絕對分離差值相對提高33.7%。與未經修復DNA片段比較在PreCR修復之後無活性與活性SLE樣品之間的此更好分離為確定患者之SLE等級中的優勢。測試多個尺寸範圍，其中120至130 bp尺寸範圍展示在修復處理之後無活性與活性SLE樣品之間的最佳分離。然而，亦可使用其他尺寸範圍，包含100至110 bp、110至120 bp、130至140 bp或140至150 bp。4. 章節 II 、 III. ‎ B 及 III. ‎ C 之參考文獻 1. Bombardier C, Gladman DD, Urowitz MB, Caron D, Chang CH.Derivation of the SLEDAI.A disease activity index for lupus patients.The Committee on Prognosis Studies in SLE.《類風濕性關節炎（ Arthritis Rheum ）》 . 1992;35(6):630-640. 2. Lo YM, Chan KC, Sun H等人. Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus.《科學轉化醫學（ Sci Transl Med ）》 . 2010;2(61):61ra91. 3. Li R, Yu C, Li Y等人. SOAP2: an improved ultrafast tool for short read alignment.《生物資訊（ Bioinformatics ）》 . 2009;25(15):1966-1967. 4. Cheng THT, Lui KO, Peng XL等人. DNase1 Does Not Appear to Play a Major Role in the Fragmentation of Plasma DNA in a Knockout Mouse Model.《臨床化學（ Clin Chem ）》 . 2018;64(2):406-408. 5. Hong H, Xu L, Tong W. Assessing consistency between versions of genotype-calling algorithm Birdseed for the Genome-Wide Human SNP Array 6.0 using HapMap samples.《實驗醫學與生物學進展（ Adv Exp Med Biol ）》 . 2010;680:355-360. 6. Jiang P, Peng X, Su X等人. FetalQuant.《 NPJ 基因組醫學（ NPJ Genom Med ）》 . 2016;1:16013. 7. Vong JSL, Tsang JCH, Jiang P等人. Single-Stranded DNA Library Preparation Preferentially Enriches Short Maternal DNA in Maternal Plasma.《臨床化學》 . 2017;63(5):1031-1037. 8. Chan RW, Jiang P, Peng X等人. Plasma DNA aberrations in systemic lupus erythematosus revealed by genomic and methylomic sequencing.《美國科學學院學報（ Proc Natl Acad Sci U S A ）》 . 2014;111(49):E5302-5311. 9. Chen EZ, Chiu RW, Sun H等人. Noninvasive prenatal diagnosis of fetal trisomy 18 and trisomy 13 by maternal plasma DNA sequencing.《美國科學公共圖書館（ PLoS One ）》 . 2011;6(7):e21791. 10. Chiu RW, Akolekar R, Zheng YW等人. Non-invasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study.《英國醫學雜誌（ BMJ ）》 . 2011;342:c7401. 11. Palomaki GE, Deciu C, Kloza EM等人. DNA sequencing of maternal plasma reliably identifies trisomy 18 and trisomy 13 as well as Down syndrome: an international collaborative study.《遺傳醫學（ Genet Med ）》 . 2012;14(3):296-305. 12. Nicolaides KH, Syngelaki A, Ashoor G, Birdir C, Touzet G. Noninvasive prenatal testing for fetal trisomies in a routinely screened first-trimester population.《美國婦產科學雜誌（ Am J Obstet Gynecol ）》 . 2012;207(5):374.e371-376. 13. Pergament E, Cuckle H, Zimmermann B等人. Single-nucleotide polymorphism-based noninvasive prenatal screening in a high-risk and low-risk cohort.《產科學與婦科學（ Obstet Gynecol ）》 . 2014;124(2 Pt 1):210-218. 14. Cervera R, Khamashta MA, Font J等人. Morbidity and mortality in systemic lupus erythematosus during a 10-year period: a comparison of early and late manifestations in a cohort of 1,000 patients.《醫學（巴爾的摩）（ Medicine (Baltimore) ）》 . 2003;82(5):299-308. 15. Raptis L, Menard HA.Quantitation and characterization of plasma DNA in normals and patients with systemic lupus erythematosus.《臨床研究（ J Clin Invest ）》 . 1980;66(6):1391-1399. 16. Chen JA, Meister S, Urbonaviciute V等人. Sensitive detection of plasma/serum DNA in patients with systemic lupus erythematosus.《自體免疫（ Autoimmunity ）》 . 2007;40(4):307-310.III 論述

吾人之研究結果證實使用修復混合物（例如PreCR修復混合物）之cfDNA修復可恢復母體血漿中及來自SLE患者之血漿的長cfDNA分子之子組。在修復之後長cfDNA分子比短cfDNA分子相對富集表明長cfDNA分子含有比其短對應物更多的可修復DNA損傷。鑒於長cfDNA分子(例如＞250 bp）在母體循環中以痕量存在，因修復產生之任何富集可產生相對而言顯著的增量。實際上，吾人之來自Illumina及Pacific Biosciences SMRT定序平台之資料分別說明長於250 bp之cfDNA分子富集68.8%及31.3%。當關注甚至更長cfDNA分子時富集變得甚至更顯著。舉例而言，對於尺寸在450 bp與600 bp之間的cfDNA分子，如使用Illumina及Pacific Biosciences SMRT平台所量測富集量分別為109.4%及44.3%。對於長於600 bp之cfDNA分子如藉由Pacific Biosciences SMRT平台所量測，DNA修復後之富集為50.4%。簡而言之，修復處理可成功地恢復來自母體血漿之長cfDNA分子。似乎cfDNA分子愈長，富集度愈高。

出於若干原因先前未進行修復游離DNA中之股內缺陷。生物樣品中游離DNA之濃度相對較低，且具有缺陷之游離DNA之濃度將甚至更低。因此認為修復股內缺陷幾乎對分析無益處。另外，在修復之後臨床相關DNA之分數可能未顯著提高。舉例而言，圖5展示自假處理及修復樣品量測之胎兒DNA分數通常不變。因此，修復游離DNA中之缺陷可能不會相比於非臨床相關DNA增強臨床相關DNA之信號。然而，發現修復游離DNA對短及長游離DNA具有不同作用。

不同機制可參與血漿中短及長cfDNA分子之產生。舉例而言，短於200 bp之cfDNA分子可能係由細胞凋亡期間之酶促分解產生。另一方面，長（＞250 bp）cfDNA分子可能係由其他細胞死亡機制（諸如壞死）產生。^11,24-27 如先前所論述，因修復產生之cfDNA分子之富集在250 bp與600 bp之間更突出。後一長度使人聯想到二核小體及三核小體模式（分別為大約330 bp及500 bp）。

圖25展示正常細胞中之DNA封裝流程。將DNA圍繞核小體包裹，該核小體由4個核心組蛋白之八聚體（形成「核小體核心」，由147 bp之DNA以約10 bp螺旋狀重複包裹）、連接子組蛋白及連接子DNA（平均尺寸大約20 bp）組成。已證實，血漿DNA並不隨機片段化。高解析度血漿DNA尺寸型態分析顯示166 bp處之主峰及低於150 bp之10 bp週期性。² 已提出此尺寸型態與核小體結構密切相關。166 bp處之峰對應於圍繞一個核小體核心包裹之DNA的長度。250與450 bp之間的峰（例如圖8）可對應於圍繞兩個核小體核心包裹之DNA之長度。450 bp與600 bp之間的峰可對應於圍繞三個核小體核心包裹之DNA之長度。修復游離DNA可允許分析更多二核小體及三核小體DNA長度。

根據吾人之資料，在修復之後長而非短cfDNA分子之富集表明大部分DNA損傷可能來源於細胞死亡機制而非細胞凋亡（例如壞死）。相比之下，在修復處理之後不存在短cfDNA分子富集表明此等短cfDNA分子可能不含有可修復DNA損傷。

將總cfDNA分解成胎兒及母體分數，吾人之資料表明DNA損傷並不隨機分佈於不同來源之cfDNA分子中。儘管吾人之資料顯示在胎兒及母體cfDNA分子中均出現長cfDNA富集，但長胎兒cfDNA分子之富集量級（82.3%）高於母體來源之cfDNA分子（66.7%）（圖2）。與此一致，在修復之後的少量但持續總胎兒分數增量表明胎兒cfDNA分子可帶有更多DNA損傷（圖5）。此觀測結果之可能原因可為由於藉由DNA切割酶對胎兒cfDNA分子之可行性更高。²⁸ DNA修復之後相較於非捕獲富集（82.3%）目標捕獲文庫中長胎兒cfDNA分子之相對更低富集（14.7%）可能係由於在目標探針雜交期間具有不同長度的DNA模板之間的競爭作用。

修復處理恢復受損DNA之能力開拓許多潛在的應用。在產前診斷中，cfDNA之修復可提高NIPT的成功率。特定言之，由胎兒DNA分數不足^29-33 或較差cfDNA品質引起之不可報導NIPT結果之情境可由DNA修復改善。此等情境之實例可包含極早期孕婦之NIPT、自具有高身體品質指數之孕婦獲得的樣品等。^34-37 此外，cfDNA修復顯示血漿中更多長可分析cfDNA分子之能力可開拓使用NIPT用於長基因組目標之可能性，該等長基因組目標為例如涉及三聯體重複病症（諸如X染色體脆裂症（FXS））之序列。在FXS中，具有完全突變的FMR1等位基因之患者中的CGG串聯重複之長度可長於600 bp。^38,39 修復游離DNA用於確定FXS在下文描述。

cfDNA修復之應用亦可延伸至基於連鎖之NIPT用於單基因性疾病之開發。隨著可分析cfDNA長度之增加，對於所選基因組區，可在母體血漿中偵測來自藉由多態性標記物側接之親本載體的單一基因之突變等位基因。此方法對於以串聯方式出現之具有高濃度SNP簇的基因組區，諸如人類白細胞抗原（HLA）區可為可行的，下文描述使用經修復游離DNA分析HLA區。

總之，此研究已顯示在修復處理之後在母體血漿中及來自SLE患者之血漿中長cfDNA分子之較佳恢復。總胎兒DNA分數之少量但持續增量由較高胎兒源性cfDNA分子富集提供。吾人希望本文所呈現之資料可促進進一步研究以將此等觀測結果轉換成NIPT之臨床增強。 A. 游離DNA修復在分子診斷中之優勢

DNA損傷係在多個細胞過程期間引入細胞，諸如細胞增殖期間的代謝活動及DNA複製。在大多數情況下，細胞能夠鑑別DNA損傷之類型，並藉由不同類型之DNA損傷修復過程來解決其。對於不可修復的DNA損傷，細胞註定會經受細胞凋亡，以防止致癌突變的積累。咸信細胞凋亡及壞死為存在於循環中之游離DNA（cfDNA）兩個主要來源。^10,27,40 與基因組DNA相似，若cfDNA損傷則存在多個類型，亦即DNA物理斷裂，諸如DNA切口、間隙及雙股斷裂形成；DNA分子之修飾，諸如氧化、水解（諸如去胺基作用）、DNA鹼基之缺失及嘧啶-二聚體形成。此等DNA損傷可降低cfDNA完整性且可造成對分子診斷之下游分析的次最佳作用，諸如下一代定序（NGS）、定量PCR（qPCR）、尺寸型態表徵等。

大部分cfDNA片段具有大小為166 bp之峰，類似於146 bp單核小體結構加20 bp連接子區。除此等主要cfDNA物種之外，存在少量具有更長長度的cfDNA物種，範圍為166 bp至超過600 bp。此等罕見cfDNA物種可攜帶與更短cfDNA物種一樣重要的有價值資訊。然而，由於現行下一代定序（NGS）平台之尺寸範圍偵測之限制，此等長cfDNA物種之偵測需要超高通量以達成合理的定序覆蓋率，其不切實際且成本無效。儘管存在技術障礙，但最近的第三代單分子即時（SMRT）定序已在某種程度上部分削弱讀取長度限制，其中超高讀取長度（＞20kb）可自單一循環cfDNA分子產生。但是，在循環中探索超長cfDNA物種仍為一項艱巨任務。

相比之下，cfDNA修復為一個相對低本高效、快速且用戶友好的方法來達成長cfDNA富集不改變定序通量及定序文庫結構。目前，一種DNA修復套組為新英格蘭生物實驗室之PreCR修復混合物。PreCR修復混合物能夠修復各種天然發生的DNA損傷，諸如無鹼基水解、切口、鹼性氧化及胸苷二聚。⁴¹ 然而，其不能修復DNA斷裂及DNA蛋白交聯。 B. 用於偵測胎兒三染色體症之游離DNA修復

PreCR修復混合物恢復受損DNA之能力開拓許多潛在的應用。在產前診斷中，吾人之資料（例如圖16）證實PreCR修復處理可有助於改善用於第21對染色體三體症篩查的NIPT效能。經修復第21對染色體三體症樣品之z分值與經修復整倍體樣品之z分值更好地分離。此對於Chr21 z分值為邊界且接近整倍體-非整倍體截斷且未經修復處理之情形尤其重要。組合模擬及ROC分析進一步確認此等NIPT改善可顯著提高測試之靈敏度以及特異性。除增強鑑別整倍體及非整倍體之統計置信度以外，修復cfDNA亦可改善NIPT之判讀率。特定言之，由胎兒DNA分數不足^9-13 或較差cfDNA品質引起之不可報導NIPT結果之情境可由DNA修復改善。 C. 游離DNA修復以評估SLE

SLE為系統自體免疫疾病，其會導致多個部位處之慢性發炎，產生組織損傷及器官衰竭。此等之實例為腎併發症、感染及心肌梗塞。¹⁴ SLE亦已報導為與血漿中cfDNA之升高有關。^15,16 亦已報導SLE患者具有較高的尺寸短於115 bp之cfDNA之比例。⁸ 此等cfDNA分子在活性SLE患者之血漿中之量高於健康個體之三倍。⁸ 此等更短（＜115 bp）cfDNA分子之升高在活性SLE患者中比在無活性SLE患者中更明顯。⁸ 因此，藉由PreCR修復混合物改善cfDNA品質之能力可對SLE患者中此等cfDNA分子之尺寸型態產生影響。PreCR修復處理富集更長（＞250 bp）cfDNA分子而不顯著損失更短（＜166 bp）cfDNA分子之觀測結果表明大部分可修復cfDNA分子長於250 bp。富集的超短cfDNA（＜115 bp）（其為嚴重SLE患者之特徵）⁸ 一般不能藉由PreCR修復混合物恢復。PreCR處理修復DNA片段，從而允許分析更多片段用於SLE或其他病狀。需要進一步研究來揭示此等cfDNA分子攜帶的DNA損傷之性質。出於診斷目的，在PreCR修復處理後更好地分離非活動和活動SLE樣品可改善SLE評估。 D. cfDNA修復之潛在應用

DNA修復可在大範圍DNA檢定及分子測試之前應用，諸如取證中之DNA指紋識別、DNA考古樣品檢索用於分類及物種分類、自舊歸檔FFPE樣品恢復DNA等。在cfDNA領域中，經修復預處理之cfDNA可提高NIPT準確度及靈敏度。特定言之，由低cfDNA輸入較差cfDNA品質所致之非資訊性NIPT測試結果的情形可藉由增加母體血漿中完好、可檢定胎兒DNA來改善。此等情況之實例將為早期妊娠孕婦及肥胖孕婦之NIPT，其中胎兒cfDNA稀少且難以檢定。此外，藉由將cfDNA修復應用於現今基於單倍型之NIPT方案中使用單核苷酸多態性（SNP），^18,42,43 特定妊娠病狀諸如單基因性疾病、^消失雙胞胎及^三倍體妊娠之偵測及鑑別將更高效及準確。 E. cfDNA修復之延伸應用超出了現今偵測極限

cfDNA修復在循環中顯現長cfDNA片段之能力開拓分子診斷在各種疾病上之潛在延伸應用。在一個實例中，疑似患有三聯體重複病症之患者之循環中長串聯重複及重複的小隨體物種之偵測困難且繁瑣，因為彼等物種極稀少且嚴重受損。此使得藉由NIPT對此等疾病進行分子診斷困難。然而，利用cfDNA修復之優勢，此等長串聯重複及小隨體物種之偵測可變得合理。

圖 26 展示患有X染色體脆裂症（FXS）之患者中CGG三聯體重複cfDNA片段之存在，其中完全突變FMR1等位基因之長度可多達600 bp或更多（Garber, Kathryn B., Jeannie Visootsak及Stephen Warren T., 「X染色體脆裂症（Fragile X Syndrome）」Nature.com, Nature Publishing Group, 2008年4月9日.網路. 2016年9月9日）。在完全突變（病原性）FMR1等位基因中CGG重複數目可超過200。傳統上，FXS之產前診斷仍為侵入性的；FMR1之擴增CGG串聯重複藉由與由南方墨點雜交確認耦接之三聯體重複Primed-PCR（TP-PCR）偵測。^44,45

使用NIPT診斷FXS受限於cfDNA長度檢測極限。實際上，FXS之NIPT診斷需要相當大的待定序之擴增FMR1等位基因之完整性，來自完全突變FMR1等位基因的CGG串聯重複愈長，其受損程度重。集中於FMR1啟動子區之相對甲基化狀態之篩選方法⁴⁶ 允許FXS之NIPT。此工作之研究者在FMR1 上游基因座發現獨特的DNA甲基化邊界，其防止DNA甲基化自上游末端向FMR1 之基因啟動子及基因體的擴散。其亦發現此邊界受破壞且甲基化滲透至FMR1 啟動子中，導致FMR1 靜默。利用cfDNA修復，自高甲基化或低甲基化FMR1 啟動子及其近端上游末端富集的cfDNA片段將準確偵測DNA甲基化邊界並提高FXS之NIPT成功率。

在另一實例中，cfDNA修復亦可應用於其中足夠量之具有相當大長度之cfDNA片段為必需的檢定中。一個實例將為HLA 及HBB 基因之等位基因單倍型分析，其均為串聯SNP簇之濃度高度多態。HLA 及HBB 基因座中之相對短SNP內距離允許潛在的單倍型分析可能性，使用cfDNA及存在於循環中之連鎖及近端串聯SNP。HLA 分型為臍帶血及骨髓移植中將供體與接受者匹配之前的關鍵步驟。錯配的HLA配對可導致移植後併發症，稱為移植物抗宿主（GVHD）疾病。重要地，目標基因基因座內之串聯SNP的成功偵測取決於完好、可檢定的cfDNA片段之存在。

圖 27 展示HLA基因之等位基因單倍型分析。HLA區覆蓋第6染色體短臂之HLA區。對HLA 基因進行單倍型分析使用長DNA，以鑑別特定HLA 基因組序列。⁴⁷ 更長DNA片段覆蓋多個HLA 基因有助於具有正確連鎖之準確單倍型分析。

此等單倍型分析方法之可行性亦可進一步應用與對其他單基因性疾病之單倍型分析，諸如先天性腎上腺增生（CAH）。圖 28 展示CAH之連鎖分析。CAH為由CYP21A2基因之突變引起的常染色體隱性遺傳病。連鎖分析可藉由定位並連接2個側接突變位點之近端SNP達成。¹⁸ 此連鎖分析藉由使用更長長度之DNA促進。突變位點與附近SNP之間的距離會變化，視突變之基因組區之特定SNP密度而定。突變位點與附近SNP之間的距離愈近可能將產生愈好的結果，因為cfDNA在母體循環中高度碎裂。在連鎖分析之情形下，覆蓋突變位點與兩側SNP之長cfDNA提供連鎖單倍型信息。

在另一實例中，cfDNA修復可有助於在處理過程中即時監測各種疾病病狀。重要的是，藉由差異cfDNA甲基化標誌量測進行之組織測繪提供了偵測cfDNA來源的強大工具。^48,49 在妊娠相關病狀（諸如子癇前症及滋養細胞發育不良）中，母體血漿中的胎盤源性cfDNA之即時偵測成為強大的監測工具。任何疾病或病症之復發都可立即偵測並用最佳治療解決。對於移植後之接受者，可將相似即時組織測繪應用於更有效監測可能的器官排斥反應。然而，在定序文庫之DNA亞硫酸氫鹽修飾過程中，亞硫酸氫鹽定序方案之關鍵步驟在定序文庫上產生外部DNA損傷。此等損傷可藉由將可定序片段轉化成非資訊性物種來降低組織測繪之靈敏度。在亞硫酸氫鹽處理後可能的額外修復處理設法將彼等受損的經亞硫酸氫鹽轉化之片段碎片挽救成完好、可定序之物種。

在另一實例中，cfDNA之可修復性之偵測可有助於偵測、評估及監測與cfDNA損傷相關的病狀之疾病進展，例如自體免疫病症及發炎性病狀。特定言之，cfDNA損傷之量可由經修復樣品與其非修復對照之間的差值推導；亦即較高的假處理-修復差值可反映較高的cfDNA損傷含量。在自體免疫及發炎性病狀（諸如全身性紅斑性狼瘡症（SLE））中，超短cfDNA分子（≤115 bp）之比例比健康個體之比例高得多。疾病之進展（由無活性至活性形式）與此等超短cfDNA分子之增加相關。⁵⁰ 吾人懷疑此等疾病中（尤其在嚴重或活性形式中）DNA損傷之程度及性質亦將不同。

cfDNA損傷之程度，或相反地可修復性之程度之偵測將允許偵測及評估此等疾病。DNA損傷之程度愈高或可修復性之程度愈高，將反映此等疾病之存在或疾病之高活性或更高嚴重程度。可修復性程度之量測可基於比較在經DNA修復或未經DNA修復下各種尺寸的DNA分子之量。此外，DNA損傷程度之評估可基於比較測試樣品與收集自未患疾病或患輕度形式之疾病者之對照樣品之間的DNA修復程度（添加與省略修復步驟之間的差值）可將此等參數一般化以用於cfDNA損傷之表徵。相似地，在任何下游分析或檢定之前，任何cfDNA/gDNA/ctDNA樣品之品質亦可藉由量測DNA可修復性來評估。舉例而言，具有高DNA可修復性之樣品指示較差DNA品質，建議在下游方案（諸如定序文庫製備）之前可進行另外的修復處理步驟。

DNA損傷亦可以時間依賴性方式獲得及積累。DNA片段釋放且在循環中保持之時間愈長，其獲取並積累DNA損傷之機會愈多。因此，即時監測DNA損傷之程度可為治療效率之潛在方法。 F. cfDNA修復作為分子診斷之有價值工具

因為在某一組織之微環境中不同細胞類型具有不同代謝周轉率，不同組織可具有其獨特「損傷標誌」。不同cfDNA可自不同受損組織釋放。藉由組織測繪（Sun等人, 《美國國家科學院院刊》 2015），可跟蹤及鑑別cfDNA之來源。組織測繪可與循環中cfDNA損傷之定量同時進行（例如使用經標記之dNTP）。因此，隨後可推導及偵測一段時間中來自某一器官之動態「損傷標誌」。

未來cfDNA修復發展之另一主要問題將為可修復DNA之種類。當前，存在許多無法逆轉之DNA損傷，亦即DNA碎裂及DNA-蛋白交聯。此係因為DNA碎裂之修復為雙股斷裂（DSB）之一種類型，需要一系列修復複合蛋白在生物學條件下進行非同源末端連接（NHEJ）。碎裂因此，修復DNA片段化仍為當前的挑戰。為解決此，可能需要摻入DSB修復所需之NHEJ蛋白，例如Mre11-Rad50-Nbs1（MRN）複合物及Ku-DNA-PKcs複合物。DSB修復後之DNA定相問題可藉由生物資訊學裝置經由在習知DNA修復與DSB修復步驟之間設計的分子條形碼系統來解決。

與DNA碎裂相反，DNA交聯（諸如股內交聯及DNA-蛋白交聯）難以修復得多。DNA股與蛋白之間的共價鍵之強黏附力使得其極難以斷裂。由於在循環附近存在DNA結合蛋白之大量相異性之性質，部分蛋白有可能極容易形成DNA-蛋白交聯。若主要血漿蛋白質（諸如人類血清白蛋白（HSA））發生此情況，則將產生大量與HSA交聯之cfDNA，其在無反向交聯程序之情況下幾乎不可獲得。因此，迫切需要打斷cfDNA-蛋白交聯並釋放彼等cfDNA分子以供下游檢定。遇到此情況，應設計反向交聯步驟並將其包含於DNA修復程序中。

除DNA損傷類型特徵，在cfDNA分子上之損壞位置亦可為未來分子診斷中有價值之資訊。DNA損傷模式為可追蹤的很重要；知道DNA損傷在cfDNA分子上之確切位置將有助於推斷此等損傷的來源。然而，在此等「基於修復之液體活檢」方法之開發中，存在許多挑戰需要克服。首先，在無已知的切口模式及多種核酸酶之切割突出端情況下，不可能藉由檢驗循環中存在之整個cfDNA損傷類型的集合來回顧性地推斷出損傷引發機制。例如，負責cfDNA碎裂之典型核酸酶（諸如DnaseI及類DNase1-3）不含有共同切割位點。此等酶傾向於以隨機方式切割DNA分子。相反，此等酶對DNA分子具有其獨特攻擊模式；DNase1傾向於攻擊及切割裸DNA分子，其中類DNase1-3傾向於生成多核小體模式。⁵¹

其次，所有含損傷之cfDNA片段之圖譜的積聚以及其準確損傷位置將為分子診斷發展所必需。利用cfDNA修復之優勢來恢復長cfDNA片段，有可能偵測到先前未發現之cfDNA物種，其中一股之中間有較大間隙，而另一股上之末端有超長突出端。同樣，只要損傷為可修復的，具有多種損傷類型組合之cfDNA分子也可系統地顯示。

第三，在出編號之完好cfDNA分子之霧狀物中追蹤經修復cfDNA分子可藉由摻入經標記且無毒的dNTP來解決。經標記之dNTP可用於修復缺陷。可藉由單一cfDNA分子中未標記及經標記dNTP之比率計算損傷程度。藉由量測修復動力學此在連續監測疾病進展及治療有效性中尤其適用。總之，幾乎可以肯定隨著DNA修復技術之改善，分子診斷中cfDNA之最終目標為「搜索」循環中未發現的、受損cfDNA分子之新類別將成為可能。IV. 實例方法 A. 改善游離核酸品質

圖 29 展示改善第一生物樣品之分析的方法2900。第一生物樣品可包含游離核酸分子。第一生物樣品可包含來自懷有胎兒之女性個體的母體血漿或來自患有病症或疑似患有病症之個體的血漿。血漿可自血液樣品中提取。第一生物樣品可為添加並非來源於個體或個體之胎兒的任何組分之前的樣品。

在方框2902處，可自游離核酸分子獲得雙股核酸分子以產生第二生物樣品。複數個雙股核酸分子中之一或多個雙股核酸分子各自具有一或多個缺陷。對於具有一或多個缺陷中之缺陷的一或多個雙股核酸分子中之每一者，該缺陷存在於各別雙股核酸分子中在距該各別雙股核酸分子之最近末端至少一個核苷酸之位置處。換言之，該缺陷可為股內缺陷且並非雙股核酸分子之任一股之任一末端處的缺陷。在一些實施例中，該缺陷可在距各別雙股核酸分子之最近末端2、3、4、5、10、15、20、25或30個或更多個核苷酸之位置處。

一或多個缺陷可包含選自由以下組成之群的缺陷：切口、間隙、無鹼基位點、胸苷二聚體、氧化嘧啶、脫胺胞嘧啶、封閉3'端缺陷或其組合。

一或多個雙股核酸分子之長度可在251至600 bp、251至450 bp或451 bp至600 bp範圍內。長度可能與二核小體或三核小體核酸分子相關。

在方框2904處，可將包含酶之混合物添加至第二生物樣品。該酶可包含聚合酶、接合酶、核酸內切酶或醣苷酶中之至少一者。混合物可包含Taq DNA聚合酶、Bst DNA聚合酶、Taq DNA接合酶、核酸內切酶VIII、核酸內切酶IV、T4核酸內切酶V（PDG）、8-側氧基鳥嘌呤醣苷酶（FPG）或尿嘧啶-DNA醣苷酶（UDG）中之至少一種酶。在一些實施例中，混合物可包含Taq DNA聚合酶、Bst DNA聚合酶、Taq DNA接合酶、核酸內切酶VIII、核酸內切酶IV、T4核酸內切酶V（PDG）、8-側氧基鳥嘌呤醣苷酶（FPG）及尿嘧啶-DNA醣苷酶（UDG）。混合物亦可包含NAD⁺ 、ThermoPol反應緩衝劑及去氧核苷三磷酸鹽（dNTP）之任何組合。

在方框2906處，一或多個雙股核酸分子中之每一者中的一或多個缺陷可使用酶來修復以產生經修復雙股核酸分子組。經修復雙股核酸分子組可不含一或多個缺陷，包含本文所述之任何缺陷。修復一或多個缺陷可包含與長度為0至250 bp的核酸分子相比修復更大數目之長度為251至600 bp之核酸分子。換言之，與來自單核小體核酸分子之缺陷相比更多來自二核小體及/或三核小體核酸分子在缺陷可經修復。

對於含有臨床相關DNA（諸如胎兒DNA）之生物樣品，修復一或多個雙股核酸分子中之缺陷可提高臨床相關DNA之分數以允許進一步分析。舉例而言，若第一生物樣品獲自懷有胎兒之女性個體，則一或多個具有缺陷之雙股核酸分子可包含複數個胎兒源性核酸分子。在修復一或多個缺陷之後，將第二生物樣品可由胎兒分數表徵，該胎兒分數根據由分析經修復雙股核酸分子組所獲得的讀段計算。胎兒分數可大於進一步分析之較佳或所需臨限分數。0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09或0.10。可根據讀段計算修復之後的胎兒分數以大於根據修復之前的讀段所計算之胎兒分數。然而，來自胎兒之DNA的實際分數可能不變。替代地，修復之後所計算之胎兒分數可能提高，因為可能僅在修復之後獲得胎兒源性DNA之讀段。

方法可包含進行複數個雙股核酸分子或經修復雙股核酸分子組之鈍端接合。鈍端接合並非方框2906中之一或多個缺陷的修復，因為鈍端接合處理在雙股核酸分子末端處的核苷酸而非股內缺陷。

在方框2908處，定序文庫可使用經修復雙股核酸分子組生成。對經修復雙股核酸分子組進行定序文庫製備程序，包含末端修復、A加尾、定序接附子接合及索引PCR擴增。

在方框2912處，可分析定序文庫以確定讀段組。在一些實施例中，分析至少1,000個游離DNA分子。在其他實施例中，可分析至少10,000或50,000或100,000或500,000或1,000,000或5,000,000個或更多個游離DNA分子。可藉由對定序文庫定序確定讀段組。定序技術可包含成對末端定序、大規模平行定序、單分子即時（SMRT）定序、PCR、反轉錄PCR（RT-PCR）、數位PCR或定序。在一些實施例中，讀段組可藉由進行目標捕獲富集確定。讀段組可不包含來自具有一或多個缺陷的雙股核酸分子之讀段。舉例而言，讀段組可不包含來自具有一或多個缺陷之雙股核酸分子的任一單股核酸分子之讀段。在一些實施例中，讀段組可來自雙股核酸分子之僅一股。在其他實施例中，讀段組可來自雙股核酸分子之兩股。

方法可包含使用定序文庫，該定序文庫使用經修復雙股核酸分子組來製備。方法可包含自母體血漿樣品偵測胎兒之非整倍體。在一些實施例中，方法可包含偵測序列不平衡。方法可包含偵測胎兒中之微擴增或微缺失。此外，方法可包含偵測本文所述之任何病症。

舉例而言，方法可包含確定第二生物樣品中是否存在序列不平衡。可自經修復雙股核酸分子組獲得複數個序列讀段。複數個序列讀段可藉由電腦系統分析。分析序列讀段可包含藉由比對序列讀段與參考基因組來鑑別序列讀段在參考基因組中之位置。可藉由電腦系統確定使用所鑑別位置的來自基因組區之序列讀段之量。可獲得來自基因組區之序列讀段之量的歸一化參數值。可將歸一化參數值與截斷值比較。可基於比較確定是否存在序列不平衡。基因組區可為染色體，且序列不平衡可為非整倍體。

經修復雙股核酸分子組可用於其中具有更長核酸分子為較佳之方法。舉例而言，經修復核酸分子組可用於使用來自懷有胎兒之女性個體的第一生物樣品來確定是否存在X染色體脆裂症（FXS）之分類。方法可包含自FMR1啟動子區及FMR1啟動子之近端上游末端富集經修復雙股核酸分子組以形成富集的雙股核酸分子組。可對富集的雙股核酸分子組進行甲基化感知檢定。在一些實施例中，甲基化感知檢定可包含亞硫酸氫鹽定序。可自富集的雙股核酸分子組獲得複數個序列讀段。可將複數個序列讀段與參考基因組比對。使用經比對序列讀段偵測在FMR1啟動子上游位置處是否存在指示FXS之DNA甲基化邊界。分類可為當不存在DNA甲基化邊界時存在FXS。

方法可包含對經修復雙股核酸分子組進行單倍型分析。HLA基因可為單倍型。可藉由自富集的雙股核酸分子組獲得複數個序列來對單基因性疾病進行單倍型分析。可將複數個序列讀段與參考基因組比對。使用所比對的複數個序列讀段鑑別兩個近端SNP之間的基因座處之突變。單基因性疾病可為先天性腎上腺增生。 B. 對病症進行分類

圖 30 展示確定個體是否患有病症之分類的方法3000。該病症可包含全身性紅斑性狼瘡症（SLE）、先天性腎上腺增生（CAH）、X染色體脆裂症、移植物抗宿主（GVHD）病、妊娠相關病症（例如子癇前症及滋養細胞發育不良）、非整倍體、序列不平衡或本文所述之任何病症。

在方框3002處，可接受第一樣品。第一樣品可包含來源於生物樣品中之游離核酸分子的第一組雙股核酸分子。生物樣品可為本文所述之任何生物樣品。第一組雙股核酸分子之一或多個雙股核酸分子可各自具有一或多個缺陷。一或多個缺陷可存在於各別雙股核酸分子中距該各別雙股核酸分子之最近末端至少一個核苷酸之位置處。一或多個缺陷可為本文所述之任何缺陷。

在方框3004處，可接受第二樣品。第二樣品可包含來源於生物樣品中之游離核酸分子的第二組雙股核酸分子。舉例而言，第一樣品及第二樣品可藉由將生物樣品分成兩個樣品來製備。在一些實施例中，第一樣品與第二樣品可能體積相等，其中相等可包含在實驗誤差內不同的體積。第一樣品之體積可為第二樣品之體積的5%、10%或15%內。

在方框3006處，可將包含酶之第一混合物添加至第一樣品。第一混合物及酶可為本文所述之任何混合物及酶。舉例而言，混合物可包含本文所述之複數種酶。

在方框3008處，第一組雙股核酸分子中之一或多個雙股核酸分子中之每一者的一或多個缺陷可使用酶來修復。可自修復產生經修復的第一組雙股核酸分子。

第二樣品可由包括第三組雙股核酸分子之第三樣品形成。可將第二混合物添加至第三樣品以產生第二組雙股核酸分子。第二混合物可不包含酶。舉例而言，第二混合物可為假混合物，其包含第一混合物的組分，除修復股內缺陷之酶以外。第二組雙股核酸分子可與第三組雙股核酸分子相同或不同。在其他實施例中，第二樣品未添加假混合物。

在方框3010處，可測定表徵經修復的第一組雙股核酸分子與第二組雙股核酸分子之間的缺陷差值之參數值。

可使用由經修復的第一組雙股核酸分子及第二組雙股核酸分子確定之讀段來確定參數值。舉例而言，方法可包含對經修復的第一組雙股核酸分子定序或進行目標捕獲富集以確定第一組讀段。方法亦可包含對第二組雙股核酸分子定序或進行目標捕獲富集以確定第二組讀段。第一組讀段及第二組讀段可不包含來自具有一或多個缺陷的雙股核酸分子之讀段。在末端修復過程中倖存的受損DNA片段受損DNA可導致簇形成失敗，引起PCR失敗或DNA聚合酶停滯。當核苷酸取代發生時亦可出現錯配，從而導致定序誤差。第一組讀段可具有第一讀段量。第二組讀取可具有第二讀段量。

使用第一讀段量及第二讀段量確定參數值。舉例而言，可使用第一讀段量與第二讀段量之間的差值確定參數值。在其他實施例中，可使用第一讀段量與第二讀段量之比率確定值。比率可使用第一量除以第二量、第二量除以第一量、第一量除以第一量與第二量之總和或第二量除以第一量與第二量之總和來計算。在一些實施例中，讀段量可受限於某一尺寸範圍或某一基因組位置之讀段。讀段量可為歸一化讀段量（例如百分比、分數或濃度）。

可根據描述讀段組之尺寸的統計值來確定值。方法可包含計算表徵第一組讀段之尺寸的第一統計值及計算表徵第二組讀段之尺寸的第二統計值。統計值可為描述讀段組之核酸分子之尺寸的中值、眾數、均值或百分位數。可使用第一統計值及第二統計值來確定值。舉例而言，值可為統計值之間的差值或統計值之比率。

參數可為多維的。參數之第一維度可以基於核酸分子之尺寸。第一維度可為尺寸範圍。在其他實施例中，第一維度可為核酸分子之尺寸與參考尺寸之比率範圍。參數之第二維度可包含核酸分子之量。舉例而言，參數可為某些尺寸之核酸分子的核酸分子之量的矩陣。作為另一實例，參數可為某些尺寸之核酸分子的核酸分子之量的圖表（例如直方圖）。

在一些實施例中，參數之第一維度可包含核酸分子之參考基因組中的位置。第二維度可包含核酸分子之量。隨後參數可描述在參考基因組中某些位置處的核酸分子之量。

參考值亦可為多維的。參考值可指定處於核酸分子之不同尺寸的核酸分子之量。參考值可為處於不同尺寸之臨限量或不同尺寸中的某一量之模式（例如量應以某一尺寸達到峰值）。在一些實施例中，參考值可指定在參考基因組中之某些位置處的核酸分子之量。此等基因組位置可對應於核小體之間的位置。參考值可使用一或多個經鑑別為患有或未患有病症之個體來確定。

在方框3012處，可將參數值與參考值比較。比較參數值可包含確定參數值是否超過參考值（例如參數值比參考值更陽性或更陰性）。參考值可為臨限值。

在方框3014處，個體是否患有病症之分類可基於參數值與參考值之比較而確定。可藉由比較確定病症之等級或嚴重程度。嚴重程度可取決於參數值與參考值之間的差值。差值愈大可意謂病症愈嚴重。當差值大於截斷值時病症可歸類為更嚴重。可使用若干截斷值，其中每個截斷值與不同嚴重程度相關。

在一些實施例中，方法可包含在將個體患有病症或個體患有病症之高似然性分類之後治療特定病症。實施例可包含在確定患者之疾病或病況的等級之後治療患者中之疾病或病況。治療可包含任何適合療法、藥物或手術，包含描述於本文中提及之參考文獻中的任何治療。參考文獻中關於治療之資訊以引用之方式併入本文中。V. 實例系統

圖31說明根據本發明之一實施例的系統3100。如所示之系統包含樣品3105，諸如樣品架3110中之游離DNA分子，其中樣品3105可與檢定3108接觸以提供物理特徵3115之信號。在一些實施例中，樣品3105可為具有核酸材料之單細胞。樣品架之實例可為流槽，其包含檢定之探針及/或引子或經由其移動液滴之管（其中液滴包含檢定）。樣品之物理特徵3115（諸如螢光強度值）係藉由偵測器3120偵測。偵測器可按時間間隔（例如週期性時間間隔）進行量測以獲得構成資料信號之資料點。在一個實施例中，類比至數位轉換器複數次將來自偵測器之類比信號轉換成數位形式。資料信號3125自偵測器3120傳送至邏輯系統3130。資料信號3125可儲存在局部記憶體3135、外部記憶體3140或儲存裝置3145中。

邏輯系統3130可為或可包含電腦系統、ASIC、微處理器等。其亦可包含顯示器（例如監視器、LED顯示器等）或與其耦接及用戶輸入裝置（例如滑鼠、鍵盤、按鈕等）。邏輯系統3130及其他組件可為獨立或網路連接電腦系統之一部分，或其可直接連接至或併入於熱循環裝置中。邏輯系統3130亦可包含在處理器3150中執行之最佳化軟體。

本文提及之任何電腦系統可利用任何適合數目之子系統。此等子系統之實例展示於圖 32中之電腦系統10中。在一些實施例中，電腦系統包含單一電腦設備，其中子系統可為電腦設備之組件。在其他實施例中，電腦系統可包含多個電腦設備，各電腦設備為具有內部組件之子系統。電腦系統可包含桌上型電腦及膝上型電腦、平板電腦、移動電話及其他行動裝置。

圖 32中示出之子系統經由系統匯流排75互連。展示其他子系統，諸如印表機74、鍵盤78、儲存裝置79、與顯示器配接器82耦接之監視器76，及其他。耦接至I/O控制器71之周邊裝置及輸入/輸出（I/O）裝置可藉由此項技術中已知的任何數目的連接件，諸如輸入/輸出（I/O）端口77（例如USB、FireWire®）連接至電腦系統。舉例而言，I/O埠77或外部接口81（例如，乙太網路、Wi-Fi等）可用於將電腦系統10連接至諸如因特網、滑鼠輸入裝置或掃描儀之廣域網路。經由系統匯流排75進行之互連允許中央處理器73與各子系統通信且控制來自系統記憶體72或存儲裝置79（例如固定磁碟，諸如硬碟機或光碟）之複數個指令的執行以及子系統之間的資訊交換。系統記憶體72及/或儲存裝置79可實施為電腦可讀取媒體。另一子系統為資料收集裝置85，諸如照相機、麥克風、加速計及其類似物。本文所提及之任何資料可自一個組件向另一個組件輸出且可向用戶輸出。

電腦系統可包含例如藉由外部介面81或藉由內部介面連接在一起的複數個相同組件或子系統。在一些實施例中，電腦系統、子系統或設備可經由網路通信。在此等情況下，可將一台電腦視為用戶端且另一台電腦視為伺服器，其中每一者可為同一電腦系統之一部分。用戶端及伺服器可各自包含多個系統、子系統或組件。

實施例之態樣可使用硬體（例如特殊應用積體電路或場可程式化閘陣列）以控制邏輯形式及/或使用具有大體上可程式化處理器的電腦軟體以模組化或積體方式來實施。如本文所用，處理器包含位於同一積體晶片上之單核心處理器、多核心處理器，或位於單一電路板上或網路化之多個處理單元。基於本文所提供揭示內容及教示，本領域中一般熟習此項技術者將知曉及瞭解使用硬體及硬體與軟體之組合來實施本發明之實施例的其他方式及/或方法。

本申請案中所述之任何軟體組件或功能可使用例如習知或面向對象技術，以軟體程式碼形式實施，軟體程式碼係由使用任何適合電腦語言（諸如（例如）Java、C、C++、C#、Objective-C、Swift）或腳本處理語言（諸如Perl或Python）的處理器執行。軟體程式碼可作為一系列指令或命令儲存在電腦可讀取媒體上以用於儲存及/或傳輸。適合的非暫時性電腦可讀取媒體可包含隨機存取記憶體（RAM）、唯讀記憶體（ROM）、磁性媒體（諸如硬碟機或軟碟機）或光學媒體，諸如光碟（CD）或DVD（數位化通用光碟）、快閃記憶體及其類似者。電腦可讀取媒體可為此等儲存或傳輸裝置之任何組合。

此等程式亦可使用適用於經由符合各種協定之有線、光學及/或無線網路（包含網際網路）傳輸的載波信號來編碼及傳輸。因此，可使用經此類程序編碼的資料信號來創建電腦可讀取媒體。用程式碼編碼的電腦可讀取媒體可與相容裝置一起封裝或與其他裝置分開提供（例如經由因特網下載）。任何此等電腦可讀取媒體可駐留在單一電腦產品（例如硬碟機、CD或整個電腦系統）上或其中，且可存在於系統或網路內的不同電腦產品之上或其中。電腦系統可包含監視器、印表機或其他適合顯示器，用於向用戶提供本文提及的結果中之任一者。

本文所述之任何方法可完全或部分地使用電腦系統來進行，該電腦系統包含一或多個可經組態以執行操作的處理器。因此，實施例可涉及經組態以執行本文所述之任何方法之操作的電腦系統，可能利用不同組件執行相應操作或相應操作組。儘管以經編號之操作呈現，但本文方法之操作可以同時或以不同順序執行。另外，此等操作之部分可與來自其他方法之其他操作之部分一起使用。而且，操作之全部或部分可為視情況選用的。另外，任何方法之任何操作可使用模組、單元、電路或用於執行此等操作之其他方法來執行。

本文所用之章節標題僅出於組織目的且不應被視為限制所描述之主題。

應理解，本文所述之方法不限於本文所述之特定方法、方案、主題及定序技術且因此可變化。亦應理解，本文所用之術語僅出於描述特定實施例之目的，而並不意欲限制本文所述之方法及組合物之範疇，該範疇將僅受隨附申請專利範圍限制。儘管本文已展示及描述本揭示案之一些實施例，但對於本領域中熟習此項技術者應顯而易見的是，此等實施例僅藉助於實例提供。本領域中熟習此項技術者現將在不背離本揭示案之情況下想到許多變化、改變及取代。應理解，本文所述之本揭示案之實施例的各種替代例可用於實踐本揭示案。預期以下申請專利範圍界定本揭示案之範疇，且因此涵蓋此等申請專利範圍及其等效者之範疇內的方法及結構。

參考用於說明之實例應用來描述若干態樣。除非另有指示，否則任何實施例可與任何其他實施例組合。應理解，闡述許多具體詳情、關係及方法以提供對本文所述特徵的充分理解。然而，熟習此項技術者應容易認識到，可在沒有一或多個具體詳情之情況下或使用其他方法來實踐本文所述之特徵。本文所述之特徵不受所示行為或事件之順序限制，因為一些行為可以不同的順序發生及/或與其他行為或事件同時發生。此外，實施根據本文所述之特徵的方法不需要所有所示動作或事件。

儘管本文已展示及描述本發明之一些實施例，但對於本領域中熟習此項技術者應顯而易見的是，此等實施例僅藉助於實例提供。並不預期本發明受本說明書中所提供之具體實例限制。儘管已參考前述說明書描述本發明，但本文實施例之描述及說明並不意欲以限制性意義來解釋。本領域中熟習此項技術者現將在不背離本發明之情況下想到許多變化、改變及取代。

此外，應理解，本發明之所有態樣不限於本文所闡述之具體描繪、組態或相對比例，其視各種條件及變數而定。應理解本文所述之本發明實施例之各種替代方案可用於實施本發明。因此，涵蓋本發明亦應涵蓋任何此類替代、修改、變化或等效物。預期以下申請專利範圍界定本發明之範疇，且因此涵蓋此等申請專利範圍及其等效者之範疇內的方法及結構。

在提供值之範圍下，應理解除非上下文另外明確規定，否則亦特別揭示在所述範圍上限與下限之間的各插入值，精確至下限單位之十分之一。涵蓋在所述範圍內任何陳述值或插入值之間的各更小範圍及所述範圍內之任何其他陳述或插入值。此等更小範圍之上限及下限可獨立地包含或排除在所述範圍內，且任一界限、無界限或兩個界限包含於更小範圍中之各範圍亦涵蓋於本發明內，經受所述範圍中任何特別排除之界限。在規定範圍包含界限中之一或兩者情況下，亦包含排除彼等所包含之界限之任一者或兩者的範圍。

除非上下文另外明確規定，否則如本文及隨附申請專利範圍中所用，單數形式「一（a/an）」及「該（the）」包括複數個提及物。因此，舉例而言，「方法」之提及包含複數個此等方法且「顆粒」之提及包含本領域中熟習此項技術者已知之一或多種粒子及其等效者之提及等等。現已出於清楚及理解之目的詳細地描述本發明。然而，應瞭解某些變化及修改可在隨附申請專利範圍之範疇內實踐。VI. 除章節 II 、 ‎B 及 ‎C 中之參考文獻外的參考文獻 1. Lo YM, Corbetta N, Chamberlain PF等人. Presence of fetal DNA in maternal plasma and serum.《柳葉刀（ Lancet ）》 . 1997;350(9076):485-487. 2. Lo YM, Chan KC, Sun H等人. Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus.《科學轉化醫學》 . 2010;2(61):61ra91. 3. Lun FM, Tsui NB, Chan KC等人. Noninvasive prenatal diagnosis of monogenic diseases by digital size selection and relative mutation dosage on DNA in maternal plasma.《美國科學學院學報》 . 2008;105(50):19920-19925. 4. Yu SC, Chan KC, Zheng YW等人. Size-based molecular diagnostics using plasma DNA for noninvasive prenatal testing.《美國科學學院學報》 . 2014;111(23):8583-8588. 5. Jiang P, Peng X, Su X等人. FetalQuant.《 NPJ 基因組醫學》 . 2016;1:16013. 6. Chan KC, Ding C, Gerovassili A等人. Hypermethylated RASSF1A in maternal plasma: A universal fetal DNA marker that improves the reliability of noninvasive prenatal diagnosis.《臨床化學》 . 2006;52(12):2211-2218. 7. Dhallan R, Au WC, Mattagajasingh S等人. Methods to increase the percentage of free fetal DNA recovered from the maternal circulation.《美國醫學會雜誌（ JAMA ）》 . 2004;291(9):1114-1119. 8. Li Y, Di Naro E, Vitucci A, Zimmermann B, Holzgreve W, Hahn S. Detection of paternally inherited fetal point mutations for beta-thalassemia using size-fractionated cell-free DNA in maternal plasma.《美國醫學會雜誌》 . 2005;293(7):843-849. 9. Burnham P, Kim MS, Agbor-Enoh S等人. Single-stranded DNA library preparation uncovers the origin and diversity of ultrashort cell-free DNA in plasma.《科學報導（ Sci Rep ）》 . 2016;6:27859. 10. Snyder MW, Kircher M, Hill AJ, Daza RM, Shendure J. Cell-free DNA Comprises an In Vivo Nucleosome Footprint that Informs Its Tissues-Of-Origin.《細胞（ Cell ）》 . 2016;164(1-2):57-68. 11. Nagata S. Apoptotic DNA fragmentation.《實驗細胞研究（ Exp Cell Res ）》 . 2000;256(1):12-18. 12. Stroun M, Lyautey J, Lederrey C, Olson-Sand A, Anker P. About the possible origin and mechanism of circulating DNA apoptosis and active DNA release.《臨床化學學報（ Clin Chim Acta ）》 . 2001;313(1-2):139-142. 13. van der Vaart M, Pretorius PJ.The origin of circulating free DNA.《臨床化學》 . 2007;53(12):2215. 14. Mouliere F, El Messaoudi S, Pang D, Dritschilo A, Thierry AR.Multi-marker analysis of circulating cell-free DNA toward personalized medicine for colorectal cancer.《分子腫瘤學（ Mol Oncol ）》 . 2014;8(5):927-941. 15. Chandrananda D, Thorne NP, Bahlo M. High-resolution characterization of sequence signatures due to non-random cleavage of cell-free DNA.《 BMC 醫學基因組學（ BMC Med Genomics ）》 . 2015;8:29. 16. Chan KC, Zhang J, Hui AB等人. Size distributions of maternal and fetal DNA in maternal plasma.《臨床化學》 . 2004;50(1):88-92. 17. Vong JSL, Tsang JCH, Jiang P等人. Single-Stranded DNA Library Preparation Preferentially Enriches Short Maternal DNA in Maternal Plasma.《臨床化學》 . 2017;63(5):1031-1037. 18. New MI, Tong YK, Yuen T等人. Noninvasive prenatal diagnosis of congenital adrenal hyperplasia using cell-free fetal DNA in maternal plasma.《臨床內分泌與代謝雜誌（ J Clin Endocrinol Metab ）》 . 2014;99(6):E1022-1030. 19. Li R, Yu C, Li Y等人. SOAP2: an improved ultrafast tool for short read alignment.《生物資訊》 . 2009;25(15):1966-1967. 20. Hong H, Xu L, Tong W. Assessing consistency between versions of genotype-calling algorithm Birdseed for the Genome-Wide Human SNP Array 6.0 using HapMap samples.《實驗醫學與生物學進展》 . 2010;680:355-360. 21. Cheng THT, Lui KO, Peng XL等人. DNase1 Does Not Appear to Play a Major Role in the Fragmentation of Plasma DNA in a Knockout Mouse Model.《臨床化學》 . 2018;64(2):406-408. 22. Chen L, Liu P, Evans TC, Ettwiller LM.DNA damage is a pervasive cause of sequencing errors, directly confounding variant identification.《科學（ Science ）》 . 2017;355(6326):752-756. 23. Ardui S, Ameur A, Vermeesch JR, Hestand MS.Single molecule real-time (SMRT) sequencing comes of age: applications and utilities for medical diagnostics.《核酸研究（ Nucleic Acids Res ）》 . 2018;46(5):2159-2168. 24. Giacona MB, Ruben GC, Iczkowski KA, Roos TB, Porter DM, Sorenson GD.Cell-free DNA in human blood plasma: length measurements in patients with pancreatic cancer and healthy controls.《胰腺（ Pancreas ）》 . 1998;17(1):89-97. 25. Holdenrieder S, Stieber P, Förg T等人. Apoptosis in serum of patients with solid tumours.《抗癌研究（ Anticancer Res ）》 . 1999;19(4A):2721-2724. 26. Jahr S, Hentze H, Englisch S等人. DNA fragments in the blood plasma of cancer patients: quantitations and evidence for their origin from apoptotic and necrotic cells.《癌症研究（ Cancer Res ）》 . 2001;61(4):1659-1665. 27. Thierry AR, El Messaoudi S, Gahan PB, Anker P, Stroun M. Origins, structures, and functions of circulating DNA in oncology.《癌症轉移綜述（ Cancer Metastasis Rev ）》 . 2016;35(3):347-376. 28. Sun K, Jiang P, Wong AIC等人. Size-tagged preferred ends in maternal plasma DNA shed light on the production mechanism and show utility in noninvasive prenatal testing.《美國科學學院學報》 . 2018;115(22):E5106-E5114. 29. Chen EZ, Chiu RW, Sun H等人. Noninvasive prenatal diagnosis of fetal trisomy 18 and trisomy 13 by maternal plasma DNA sequencing.《美國科學公共圖書館》 . 2011;6(7):e21791. 30. Chiu RW, Akolekar R, Zheng YW等人. Non-invasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study.《英國醫學雜誌》 2011;342:c7401. 31. Palomaki GE, Deciu C, Kloza EM等人. DNA sequencing of maternal plasma reliably identifies trisomy 18 and trisomy 13 as well as Down syndrome: an international collaborative study.《遺傳醫學》 . 2012;14(3):296-305. 32. Nicolaides KH, Syngelaki A, Ashoor G, Birdir C, Touzet G. Noninvasive prenatal testing for fetal trisomies in a routinely screened first-trimester population.《美國婦產科學雜誌》 2012;207(5):374.e371-376. 33. Pergament E, Cuckle H, Zimmermann B等人. Single-nucleotide polymorphism-based noninvasive prenatal screening in a high-risk and low-risk cohort.《產科學與婦科學》 . 2014;124(2 Pt 1):210-218. 34. Canick JA, Palomaki GE, Kloza EM, Lambert-Messerlian GM, Haddow JE.The impact of maternal plasma DNA fetal fraction on next generation sequencing tests for common fetal aneuploidies.《產前診斷（ Prenat Diagn ）》 . 2013;33(7):667-674. 35. Dar P, Curnow KJ, Gross SJ等人. Clinical experience and follow-up with large scale single-nucleotide polymorphism-based noninvasive prenatal aneuploidy testing.《美國婦產科學雜誌》 . 2014;211(5):527.e521-527.e517. 36. Norton ME, Wapner RJ.Cell-free DNA Analysis for Noninvasive Examination of Trisomy.《新英格蘭醫學雜誌（ N Engl J Med ）》 . 2015;373(26):2582. 37. Yared E, Dinsmoor MJ, Endres LK等人. Obesity increases the risk of failure of noninvasive prenatal screening regardless of gestational age.《美國婦產科學雜誌》 . 2016;215(3):370.e371-376. 38. Nolin SL, Brown WT, Glicksman A等人. Expansion of the fragile X CGG repeat in females with premutation or intermediate alleles.《美國人類遺傳學雜誌（ Am J Hum Genet ）》 . 2003;72(2):454-464. 39. McLennan Y, Polussa J, Tassone F, Hagerman R. Fragile x syndrome.《當代基因組學（ Curr Genomics ）》 . 2011;12(3):216-224. 40. Lui YY, Chik KW, Chiu RW, Ho CY, Lam CW, Lo YM.Predominant hematopoietic origin of cell-free DNA in plasma and serum after sex-mismatched bone marrow transplantation.《臨床化學》 . 2002;48(3):421-427. 41. Diegoli TM, Farr M, Cromartie C, Coble MD, Bille TW.An optimized protocol for forensic application of the PreCR™ Repair Mix to multiplex STR amplification of UV-damaged DNA.《國際法醫學遺傳學（ Forensic Sci Int Genet ）》 . 2012;6(4):498-503. 42. Ye J, Chen C, Yuan Y等人. Haplotype-based Noninvasive Prenatal Diagnosis of Hyperphenylalaninemia through Targeted Sequencing of Maternal Plasma.《科學報導》 . 2018;8(1):161. 43. Ma D, Yuan Y, Luo C等人. Noninvasive prenatal diagnosis of 21-Hydroxylase deficiency using target capture sequencing of maternal plasma DNA.《科學報導》 . 2017;7(1):7427. 44. Rajan-Babu IS, Lian M, Cheah FSH等人. FMR1 CGG repeat expansion mutation detection and linked haplotype analysis for reliable and accurate preimplantation genetic diagnosis of fragile X syndrome.《分子醫學專家綜述（ Expert Rev Mol Med ）》 . 2017;19:e10. 45. Tural S, Tekcan A, Kara N, Elbistan M, Güven D, Ali Tasdemir H. FMR1 gene mutation screening by TP-PCR in patients with premature ovarian failure and fragile-X.《婦科內分泌（ Gynecol Endocrinol ）》 . 2015;31(3):191-195. 46. Naumann A, Hochstein N, Weber S, Fanning E, Doerfler W. A distinct DNA-methylation boundary in the 5'- upstream sequence of the FMR1 promoter binds nuclear proteins and is lost in fragile X syndrome.《美國人類遺傳學雜誌》 . 2009;85(5):606-616. 47. Hosomichi K, Shiina T, Tajima A, Inoue I. The impact of next-generation sequencing technologies on HLA research.《美國人類遺傳學雜誌》 . 2015;60(11):665-673. 48. Sun K, Jiang P, Chan KC等人. Plasma DNA tissue mapping by genome-wide methylation sequencing for noninvasive prenatal, cancer, and transplantation assessments.《美國科學學院學報》 . 2015;112(40):E5503-5512. 49. Lehmann-Werman R, Neiman D, Zemmour H等人. Identification of tissue-specific cell death using methylation patterns of circulating DNA.《美國科學學院學報》 . 2016;113(13):E1826-1834. 50. Chan RW, Jiang P, Peng X等人. Plasma DNA aberrations in systemic lupus erythematosus revealed by genomic and methylomic sequencing.《美國科學學院學報》 . 2014;111(49):E5302-5311. 51. Napirei M, Ludwig S, Mezrhab J, Klöckl T, Mannherz HG.Murine serum nucleases--contrasting effects of plasmin and heparin on the activities of DNase1 and DNase1-like 3 (DNase1l3).FEBS J. 2009;276(4):1059-1073.

10:電腦系統 71:I/O控制器 72:系統記憶體 73:中央處理器 74:印表機 75:系統匯流排 76:監視器 77:輸入/輸出I/O埠 78:鍵盤 79:儲存裝置 81:外部接口 82:配接器 85:資料收集裝置 2900:方法 2902:方框 2904:方框 2906:方框 2908:方框 2912:方框 3000:方法 3002:方框 3004:方框 3006:方框 3008:方框 3010:方框 3012:方框 3014:方框 3100:系統 3105:樣品 3108:檢定 3110:樣品架 3115:物理特徵 3120:偵測器 3125:資料訊號 3130:邏輯系統 3135:局部記憶體 3140:外部記憶體 3145:儲存裝置 3150:處理器

圖 1A 、圖 1B 及圖 1C 展示根據本發明之實施例的影響DNA之不同缺陷模式。圖 2A 及圖 2B 展示根據本發明之實施例，母體血漿中cfDNA之尺寸型態之修復變化。圖 3A 至圖 3D 展示根據本發明之實施例，由於對數尺度之修復而產生的尺寸型態之變化。圖 4A 及圖 4B 展示根據本發明之實施例，處理修復胎兒及母體來源之cfDNA分子。圖 5 展示根據本發明之實施例經修復cfDNA之胎兒DNA分數特徵。來自早期及晚期妊娠母體血漿之假處理或經修復cfDNA之胎兒DNA分數圖 6A 及圖 6B 展示根據本發明之實施例，在假處理或修復處理之後早期及晚期妊娠母體血漿cfDNA的尺寸分級胎兒DNA分數。圖 7 展示根據本發明之實施例來自早期及晚期妊娠母體血漿之假處理及經修復cfDNA之間的誤差率比較。圖 8 展示根據本發明之實施例在目標捕獲文庫中之修復處理後長cfDNA分子之富集。圖 9A 展示根據本發明之實施例藉由染色體Y目標捕獲而增加之胎兒cfDNA分子之定序深度。圖 9B 展示根據本發明之實施例在假處理或修復處理之後來自早期及晚期妊娠母體血漿之短及長cfDNA染色體Y分子之定量。圖 10 展示根據本發明之實施例修復處理富集長於250 bp之cfDNA分子。圖 11 展示根據本發明之實施例，藉由不同方案由M12490晚期妊娠母本血漿DNA所製備的文庫之尺寸型態比較。圖 12 展示根據本發明之實施例來自經修復或未經修復之小鼠的cfDNA尺寸型態。圖 13 展示根據本發明之實施例，來自懷有患第21對染色體三體症之胎兒的孕婦之母體血漿之短（0至250 bp）及長（＞250 bp）cfDNA片段的尺寸分佈表。根據本發明之實施例圖 14A 及圖 14B 展示根據本發明之實施例，來自五個各自懷有第21對染色體三體症胎兒之女性的經修復或未經修復之平均尺寸型態。圖14A為具有對數尺度的圖表，而圖14B為具有線性尺度的圖表。圖 15展示根據本發明之實施例，在經假修復處理或經PreCR修復處理之後來自五個各自懷有第21對染色體三體症胎兒之女性的短（0至250 bp）及長（250至600 bp）cfDNA分子之定量。圖 16 展示根據本發明之實施例，在PreCR修復處理之後第21對染色體三體症之改善的非侵入性產前測試（NIPT）效能。圖 17 展示根據本發明之實施例在修復之後針對測定三染色體症中之提高的接收者操作特徵曲線。圖 18 展示根據本發明之實施例之自其提取cfDNA之SLE患者之表。圖 19 展示根據本發明之實施例來自四個SLE患者的經修復或未經修復DNA片段之對數尺度的尺寸型態。圖 20 展示根據本發明之實施例來自四個SLE患者的經修復或未經修復DNA片段之線性尺度的尺寸型態。圖 21A 及圖 21B 展示根據本發明之實施例來自4個SLE患者（2個無活性SLE；2個活性SLE）之經假修復及經PreCR修復之cfDNA的平均尺寸型態比較。圖21A 為具有對數尺度的圖表，而圖21B為具有線性尺度的圖表。圖 22 展示根據本發明之實施例在cfDNA修復之後活性及無活性SLE患者中DNA片段之不同尺寸範圍內的百分比變化及百分比之表。圖 23 展示根據本發明之實施例在cfDNA修復之後活性及無活性SLE患者中DNA片段之不同尺寸範圍內變化的表。圖 24A 及圖 24B 繪製根據本發明之實施例使用假處理及修復DNA片段之SLE患者的分子診斷可能性。圖 25 展示根據本發明之實施例正常細胞中之DNA封裝流程。圖 26 展示根據本發明之實施例患有X染色體脆裂症（FXS）之患者中CGG三聯體重複cfDNA片段之存在。圖 27 展示根據本發明之實施例的HLA基因之對偶基因單倍型分析。圖 28 展示根據本發明之實施例對於先天性腎上腺增生（CAH）之連鎖分析。圖 29 展示根據本發明之實施例的製備生物樣品之定序文庫之方法。圖 30 展示根據本發明之實施例的確定個體是否患有病症之分類的方法。圖 31 說明根據本發明之實施例的系統。圖 32 展示可與根據本發明之實施例之系統及方法一起使用的實例電腦系統之方框。

Claims

一種改善第一生物樣品之分析的方法，該第一生物樣品包含游離核酸分子，該方法包括：自該等游離核酸分子獲得複數個雙股核酸分子以產生第二生物樣品，其中：該複數個雙股核酸分子中之一或多個雙股核酸分子各自具有一或多個缺陷，及對於具有該一或多個缺陷中之缺陷的該一或多個雙股核酸分子中之每一者：該缺陷存在於各別雙股核酸分子中距該各別雙股核酸分子之最近末端至少一個核苷酸之位置處；向該第二生物樣品添加包括酶之混合物；及使用該酶修復該一或多個雙股核酸分子中之每一者中的該一或多個缺陷以產生經修復雙股核酸分子組。
如請求項1之方法，其進一步包括：使用該等經修復雙股核酸分子組產生定序文庫，及使用該定序文庫偵測非整倍體或序列不平衡。
如請求項2之方法，其進一步包括：藉由以下來確定該第二生物樣品中是否存在序列不平衡：自該等經修復雙股核酸分子組獲得複數個序列讀段，藉由電腦系統分析該複數個序列讀段，其中分析序列讀段包含：藉由比對序列讀段與參考基因組鑑別該序列讀段在該參考基因組中之位置，藉由電腦系統使用所鑑別之位置確定來自基因組區的序列讀段之量，獲得來自該基因組區之序列讀段之量的歸一化參數值，比較該歸一化參數值與截斷值，基於該比較確定是否存在該序列不平衡。
如請求項3之方法，其中該基因組區為染色體，且該序列不平衡為非整倍體。
如請求項2之方法，其進一步包括對該定序文庫定序或進行該定序文庫之目標捕獲富集以確定讀段組。
如請求項5之方法，其中該讀段組不包括來自具有一或多個缺陷的一或多個雙股核酸分子之任何股之讀段。
如請求項1之方法，其中該一或多個缺陷係選自由切口、間隙、無鹼基位點、胸苷二聚體、氧化嘧啶、脫胺胞嘧啶、封閉3'端缺陷或其組合組成之群。
如請求項1之方法，其中該經修復雙股核酸分子組不含切口、間隙、無鹼基位點、胸苷二聚體、氧化嘧啶、脫胺胞嘧啶、封閉3'端缺陷或其組合。
如請求項1之方法，其中該酶包括聚合酶、接合酶、核酸內切酶或醣苷酶中之至少一者。
如請求項1之方法，其中該混合物包括Taq DNA聚合酶、Bst DNA聚合酶、Taq DNA接合酶、核酸內切酶VIII、核酸內切酶IV、T4核酸內切酶V（PDG）、8-側氧基鳥嘌呤醣苷酶（FPG）或尿嘧啶-DNA醣苷酶（UDG）。
如請求項1之方法，其中該混合物包括Taq DNA聚合酶、Bst DNA聚合酶、Taq DNA接合酶、核酸內切酶VIII、核酸內切酶IV、T4核酸內切酶V（PDG）、8-側氧基鳥嘌呤醣苷酶（FPG）及尿嘧啶-DNA醣苷酶（UDG）。
如請求項1之方法，其中該第一生物樣品為來自懷有胎兒之女性個體的母體血漿。
如請求項1之方法，其中該一或多個雙股核酸分子之長度在251至600 bp、251至450 bp或451 bp至600 bp範圍內。
如請求項1之方法，其中該一或多個雙股核酸分子具有與二核小體核酸分子或三核小體核酸分子相關之長度。
如請求項1之方法，其中修復該一或多個雙股核酸分子中之每一者的該一或多個缺陷包括與長度為0至250 bp之核酸分子相比修復更大數目的長度為251至600 bp之核酸分子。
如請求項1之方法，其中：該第一生物樣品獲自懷有胎兒之女性個體，該一或多個雙股核酸分子包括複數個胎兒源性核酸分子，在修復該一或多個缺陷之後，將該第二生物樣品藉由胎兒分數表徵，該胎兒分數根據由分析該經修復雙股核酸分子組所獲得的讀段計算，及該胎兒分數大於0.05。
如請求項1之方法，其進一步包括：進行該複數個雙股核酸分子或該經修復雙股核酸分子組之鈍端接合。
如請求項1之方法，其進一步包括：使用該經修復雙股核酸分子組對HLA基因進行單倍型分析。
如請求項1之方法，其進一步包括：藉由以下對單基因性疾病進行單倍型分析：自富集之雙股核酸分子組獲得複數個序列讀段，比對該複數個序列讀段與參考基因組，及使用所比對的複數個序列讀段鑑別兩個近端SNP之間的基因座處之突變。
如請求項19之方法，其中該單基因性疾病為先天性腎上腺增生。
一種確定個體是否患有病症之分類的方法，該方法包括：接收第一樣品，該第一樣品包括來源於生物樣品中之游離核酸分子的第一組雙股核酸分子，其中：該第一組雙股核酸分子之一或多個雙股核酸分子各自具有一或多個缺陷，及該一或多個缺陷存在於各別雙股核酸分子中距該各別雙股核酸分子之最近末端至少一個核苷酸之位置處；接收第二樣品，該第二樣品包括來源於該生物樣品中該游離核酸分子之第二組雙股核酸分子；向該第一樣品添加包括酶之第一混合物；使用該酶修復該第一組雙股核酸分子之該一或多個雙股核酸分子中之每一者中的該一或多個缺陷以產生經修復第一組雙股核酸分子；確定表徵該經修復第一組雙股核酸分子與該第二組雙股核酸分子之間的缺陷差值之參數值；比較該參數值與參考值；及基於該參數值與該參考值之比較確定該個體是否患有該病症之該分類。
如請求項21之方法，其中：該第一混合物包括複數種酶。
如請求項21之方法，其中該第一樣品與該第二樣品之體積相等。
如請求項21之方法，其進一步包括：將第二混合物添加至第三樣品以產生包括該第二組雙股核酸分子之該第二樣品，該第三樣品包括來源於該生物樣品中之該游離核酸分子的第三組雙股核酸分子，該第二混合物不包含該酶。
如請求項24之方法，其中：該第一混合物包括複數種酶，及該第二混合物不包含該複數種酶。
如請求項21之方法，其進一步包括：對該經修復第一組雙股核酸分子定序或進行目標捕獲富集以確定第一組讀段，及對該第二組雙股核酸分子定序或進行目標捕獲富集以確定第二組讀段，其中：該第一組讀段不包括來自具有一或多個缺陷之雙股核酸分子之讀段，該第二組讀段不包括來自具有一或多個缺陷之雙股核酸分子之讀段，該第一組讀段具有第一讀段量，該第二組讀段具有第二讀段量，及使用該第一讀段量及該第二讀段量確定該參數值。
如請求項26之方法，其進一步包括：計算表徵該第一組讀段之尺寸的第一統計值，計算表徵該第二組讀段之尺寸的第二統計值，其中：該參數值係使用該第一統計值及該第二統計值確定。
如請求項26之方法，其中：使用該第一讀段量與該第二讀段量之間的差值確定該參數值，或使用該第一讀段量與該第二讀段量之比率確定該參數值。
如請求項26之方法，其中：該第一讀段量為歸一化讀段量，及該第二讀段量為歸一化讀段量。
如請求項21之方法，其中：該參數為多維的，該參數之第一維度係基於核酸分子之尺寸，及該參數之第二維度包括該核酸分子之量。
如請求項30之方法，其中該第一維度為尺寸之範圍或該核酸分子之尺寸與參考尺寸的比率之範圍。
如請求項30之方法，其中：該參考值為多維的，及該參考值指定該核酸分子中不同尺寸的核酸分子之量。
如請求項21之方法，其中：該參數為多維的，該參數之第一維度包括核酸分子在參考基因組中之位置，及該參數之第二維度包括該核酸分子之量。
如請求項21之方法，其中該參考值係使用鑑別為患有該病症之一或多個個體或由鑑別為未患有該病症之一或多個個體測定。
如請求項34之方法，其中比較該參數值與該參考值包括確定該參數值是否超過該參考值。
如請求項21之方法，其中該病症為全身性紅斑狼瘡、先天性腎上腺增生（CAH）、X染色體脆裂症、移植物抗宿主（GVHD）疾病、妊娠相關病症、非整倍體或序列不平衡。
如請求項35之方法，其中：確定該分類係基於該參數值與該參考值之間的差值，及該分類包括該病症之嚴重程度，當差值大於截斷值時該分類指示較嚴重病症。
一種電腦產品，其包括儲存複數個指令用於控制系統以進行如請求項21至37中任一項之電腦可讀取媒體。
一種系統，其包括：如請求項38之電腦產品；及一或多個處理器，其用於執行儲存於該電腦可讀取媒體上之指令。
一種系統，其包括用於進行如請求項1至37中任一項之方法的裝置。
一種系統，其包括一個或多個處理器，該處理器經組態以執行如請求項1至37中任一項之方法。
一種系統，其包括分別進行如請求項1至37中任一項之方法的步驟之模組。