TW202305142A - 游離dna甲基化及核酸酶介導之片段化 - Google Patents

游離dna甲基化及核酸酶介導之片段化 Download PDF

Info

Publication number
TW202305142A
TW202305142A TW111113507A TW111113507A TW202305142A TW 202305142 A TW202305142 A TW 202305142A TW 111113507 A TW111113507 A TW 111113507A TW 111113507 A TW111113507 A TW 111113507A TW 202305142 A TW202305142 A TW 202305142A
Authority
TW
Taiwan
Prior art keywords
size
methylation
eccdna
sequence reads
individual
Prior art date
Application number
TW111113507A
Other languages
English (en)
Inventor
煜明 盧
慧君 趙
君賜 陳
江培勇
穎欣 陳
倪夢
小澄 韓
子君 冼
Original Assignee
香港中文大學
美商格瑞爾有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港中文大學, 美商格瑞爾有限責任公司 filed Critical 香港中文大學
Publication of TW202305142A publication Critical patent/TW202305142A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

核酸酶活性可影響cfDNA之甲基化程度及片段化。某些核酸酶活性程度可與某些區域中甲基化之某些程度相關。可分析某些基因體區域中之甲基化程度以對核酸酶活性進行分類。相比於其他基因體區域之甲基化狀態,不同基因體區域之甲基化狀態可確定個體中之病況(例如,諸如癌症之疾病或病症)之等級。核酸酶活性可經由對不同位點之甲基化狀態之分析來監測。治療功效亦可使用某些基因體區域處之甲基化程度來確定。來自在參考基因體中低甲基化或高甲基化之基因體區域的片段數目可用於提供關於樣本本身之資訊(例如分率濃度)。亦可使用染色體外環狀DNA之尺寸分佈來分析生物樣本。亦描述系統。

Description

游離DNA甲基化及核酸酶介導之片段化
已開發出使用游離DNA(cfDNA)進行的許多令人興奮的診斷及預後應用用於非侵入性產前測試及癌症液體活檢體(Chiu等人, 《美國國家科學院院刊( Proc Ntl Acad Sci USA)》2008;105:20458-20463;Chan等人, 《新英格蘭醫學雜誌( N Engl J Med)》, 2017;377:513-522)。血漿cfDNA基本上為自體內不同組織釋放的具有166 bp之模態尺寸之短DNA分子之混合物,包括(但不限於)造血組織、腦、肝臟、肺、結腸、胰臟等(Sun等人,美國國家科學院院刊2015;112:E5503-12;Lehmann-Werman等人, 《美國國家科學院院刊》2016;113: E1826-34;Moss等人, 《自然通訊( Nat Commun)》2018;9:5068)。
利用多種細胞類型中獨特的甲基化模式,已在差異甲基化區域詢問cfDNA以確定cfDNA分子的組織來源,其中特定組織中cfDNA的增加可以定位病理部位(Sun等人, 《美國國家科學院院刊》2015;112:E5503-12;Guo等人, 《自然遺傳( Nat Genet.)》2017;49:635-642)。舉例而言,癌症與正常細胞之間的DNA甲基化差異之全基因體分析已用於癌症偵測(Chan等人, 《美國國家科學院院刊》2013;110:18761-18768;Kang等人, 《基因體生物學( Genome Bio.)》2017:18)。
雖然cfDNA甲基化為癌症及組織來源測試之有前景的標記,但該領域僅開始探究cfDNA片段化後的生物學。就此而言,已發現DNA片段化為cfDNA為非隨機的且反映核小體之基礎位置(Sun等人, 《基因體研究( Genome Res.)》2019;29:418-427;Snyder等人, 《細胞( Cell)》2016;164:57-68;Ivanov等人, 《BMC基因體學( BMC Genomics.)》2015;16:S1;Chandrananda等人, 《BMC醫藥基因體學( BMC Med Genomics.)》2015;8:29)。藉由研究cfDNA之片段組學,吾人先前已展示不同核酸酶缺陷影響cfDNA片段末端及大小剖析(Serpas等人, 《美國國家科學院院刊》2019;116:641-649;Han等人, 《美國人類遺傳學雜誌( Am J Hum Genet.)》2020;106:202-214;Chan等人, 《美國人類遺傳學雜誌》2020;1-13)。cfDNA之片段化剖析已揭示為癌症之新出現的生物標記(Jiang等人, 《癌症發現( Cancer Discov.)》2020;10:664-673)。
本發明之一些實施例描述用於確定核酸酶介導之cfDNA片段化的cfDNA甲基化量測之實務實施方案,其可以用於確定樣本中癌症之等級及cfDNA之分率濃度。某些核酸酶活性程度可與某些區域中甲基化之某些程度相關
作為實例,可分析某些基因體區域中之甲基化程度以對核酸酶活性進行分類。覆蓋低甲基化或高甲基化位點之片段的相對豐度可用於確定個體中之病狀(例如疾病或病症)的等級、核酸酶活性之分類或樣本中臨床相關DNA分子之分率濃度。基因是否呈現遺傳病症或治療功效之分類亦可使用某些位點處之甲基化程度測定。
患有病況之個體的DNA片段可具有較大的在某些區域(例如開放染色質區域)內之趨勢。相比於包括此等區域外部之彼等拷貝數畸變的拷貝數畸變,此等區域內之拷貝數畸變的數目可用於判定個體是否患有病況。
在其他實例中,生物樣本中cfDNA之甲基化亦可用於提供關於樣本本身之資訊。分析來自在參考基因體中低甲基化或高甲基化之位點的片段可用於估測生物樣本中臨床相關DNA分子之分率濃度。
除使用線性cfDNA之外,來自染色體外環狀DNA(eccDNA)之cfDNA可用於分析生物樣本。來自eccDNA之cfDNA片段的尺寸分佈可用於確定基因是否呈現遺傳病症、核酸酶活性之分類或治療功效之分類。基於樣本中eccDNA之量的參數值可用於確定基因是否呈現遺傳病症。本文所描述之實施例亦包括測定來自eccDNA之游離DNA片段之混合物中的數量的方法。
本發明之此等及其他實施例詳細描述於下文中。舉例而言,其他實施例係關於與本文所描述之方法相關之系統、裝置及電腦可讀媒體。
可參考以下詳細描述及隨附圖式來獲得對本發明實施例之性質及優勢的較佳理解。 術語
組織」對應於一組細胞,其共同歸類為一個功能單元。可在單一組織中找到超過一種類型之細胞。不同類型的組織可由不同類型的細胞(例如肝細胞、肺泡細胞或血細胞)組成,但亦可對應於來自不同生物體(母親與胎兒)之組織或對應於健康細胞與腫瘤細胞。「參考組織」可對應於用於測定組織特異性甲基化程度之組織。來自不同個人之相同組織類型之多個樣本可用於測定彼組織類型之組織特異性甲基化程度。
生物樣本」係指獲自個體(例如人類(或其他動物),諸如懷孕女性、患有癌症或其他病症之個人、或疑似患有癌症或其他病症之個人、器官移植接受者或疑似患有涉及器官(例如心肌梗塞中之心臟、或中風中之大腦、或貧血中之造血系統)之疾病過程之個體且含有一個或多個所關注之核酸分子的任何樣本。生物樣本可為體液,諸如血液、血漿、血清、尿液、陰道液、來自陰囊水腫(例如睪丸)之液體、陰道沖洗液、胸膜液、腹水、腦脊髓液、唾液、汗液、淚液、痰、支氣管肺泡灌洗液、乳頭排出液、來自身體不同部分(例如甲狀腺、乳房)之抽吸液、眼內液體(例如眼房液)等。亦可使用糞便樣本。在各種實施例中,已富集游離DNA之生物樣本(例如經由離心方案獲得之血漿樣本)中之大部分DNA可為游離的,例如多於50%、60%、70%、80%、90%、95%或99% DNA可為游離的。離心方案可包括例如3,000 g × 10分鐘獲得流體部分,及以例如30,000 g再離心10分鐘以移除殘餘細胞。作為生物樣本分析之一部分,可分析生物樣本之統計學上顯著數目個游離DNA分子(例如以提供準確量測結果)。在一些實施例中,分析至少1,000個游離DNA分子。在其他實施例中,可分析至少10,000或50,000或100,000或500,000或1,000,000或5,000,000個或更多個游離DNA分子。可分析至少相同數目個序列讀段。
序列讀段」係指自核酸分子之任何部分或全部測序之核苷酸串。舉例而言,序列讀段可為自核酸片段測序之短核苷酸串(例如20-150個核苷酸)、在核酸片段之一端或兩端之短核苷酸串或存在於生物樣本中之整個核酸片段的測序。序列讀段可以各種方式獲得,該等方式例如為使用測序技術或使用探針,例如在雜交陣列或如可用於微陣列中之捕獲探針中;或擴增技術,諸如聚合酶鏈反應(PCR)或使用單一引子進行的線性擴增或等溫擴增。作為生物樣本之分析的一部分,可分析至少1,000個序列讀段。作為其他實例,可分析至少10,000或50,000或100,000或500,000或1,000,000或5,000,000個或更多個序列讀段。可使用序列讀段的數量作為DNA片段之數目的代表。為了自序列讀段之量確定DNA片段之數目,可進行計算以考慮到雙邊測序及/或測序技術之偏差。
序列讀段可包括與片段之末端相關聯的「 末端序列」。末端序列可以對應於片段的最外層N個鹼基,例如,片段末端的1-30個鹼基。若序列讀段對應於整個片段,則序列讀段可包括兩個末端序列。當雙邊測序提供對應於片段末端之兩個序列讀段時,各序列讀段可包括一個末端序列。
終止位置( ending position)」或「 末端位置( end position)」(或僅「 末端」)可指游離DNA分子(例如血漿DNA分子)之最外部鹼基(亦即位於末端)的基因體座標或基因體身分或核苷酸身分。末端位置可對應於DNA分子的任一末端。以此方式,若其係指DNA分子的始端與末端,則兩者均對應於終止位置。實務上,一個末端位置為游離DNA分子之一個末端之最外面的鹼基的基因體座標或核苷酸身分,其係藉由分析方法偵測或確定,諸如(但不限於)大規模平行測序或下一代測序、單分子測序、雙股或單股DNA測序文庫製備方案、聚合酶鏈反應(PCR)或微陣列。此類活體外技術可改變游離DNA分子之真實活體內實體末端。因此,每個可偵測末端可代表生物學上的真實末端或末端為向內的一個或多個核苷酸或自分子之原始末端延伸的一個或多個核苷酸,例如藉由克列諾片段(Klenow fragment)對非鈍端雙股DNA分子之突出端進行的5'鈍化及3'填充。末端位置之基因體身分或基因體座標可利用序列讀段與人類參考基因體(例如hg19)之排比結果獲得。其可自表示人類基因體之原始座標的索引或代碼目錄獲得。其可指藉由(但不限於)目標特異性探針、小型測序、DNA擴增法讀取之游離DNA分子上的位置或核苷酸身分。
偏好末端」(或「 複現終止位置」)係指一種末端,其在具有生理學(例如懷孕)或病理學(疾病)狀態(例如癌症)之生物樣本中呈現或盛行(例如如藉由比率所量測)的程度高於不具有此類狀態的生物樣本或在不同時間點或階段(例如治療前或治療後)具有相同病理學或生理學狀態的生物樣本。因此,相對於其他狀態,偏好末端在相關生理學或病理學狀態下偵測到的可能性或機率增加。可例如在患有癌症及未患癌症之患者中比較病理狀態與非病理狀態之間增加的機率,且將其量化為似然比或相對機率。似然比可基於在測試樣本中偵測到至少臨限數目個偏好末端之機率或基於與無此類病況之患者相比在患有此類病況之患者中偵測到偏好末端之機率來確定。似然比臨限值之實例包括(但不限於) 1.1、1.2、1.3、1.4、1.5、1.6、1.8、2.0、2.5、3.0、3.5、4.0、4.5、5、6、8、10、20、40、60、80及100。此類似然比可藉由對具有與不具有相關狀態之樣本的相對豐度值進行比較來量測。由於偵測相關生理學或疾病狀態下出現偏好末端的機率較高,因此在超過一個具有該相同生理學或疾病狀態之個體中發現此類偏好末端位置。隨著機率的增加,即使當所分析之游離DNA分子的數目遠小於基因體之尺寸時,仍可偵測到多於一個游離DNA分子終止於相同的偏好終止位置。因此,偏好或複現終止位置亦稱為「頻繁終止位置」。在一些實施例中,定量臨限值可用於要求在相同樣本或相同樣本等分試樣內至少多次(例如3、4、5、6、7、8、9、10、15、20或50次)偵測到的末端視為偏好末端。相關生理狀態可包括當個人健康、無疾病或無所關注之疾病時的狀態。類似地,「 偏好末端窗」對應於一組鄰接的偏好終止位置。
終止於某一位置之DNA分子的「 比率」係指DNA分子終止於該位置的頻率。此速率可被稱作「 末端密度」。該比率可基於針對所分析之DNA分子之數目標準化之終止於該位置的DNA分子之數目。標準化亦可基於周圍區域中之末端的平均值、中值或總數目。用於標準化之周圍區域可包括(但不限於)位置上游及/或下游500、1000、3000、5000等bp。
術語「 對偶基因」係指在同一實體基因體基因座處之替代性DNA序列,其可或可不導致不同表現型性狀。在具有各染色體之兩個拷貝(除男性人類個體中之性別染色體之外)的任何特定二倍體生物體中,各基因之基因型包含在該基因座處存在之對偶基因對,其在同型接合子中相同而在異型接合子中不同。生物體之群體或物種在各個個體中在各基因座上通常包括多個對偶基因。其中在群體中發現超過一個對偶基因的基因體基因座稱為多形位點。基因座處之對偶基因變異可量測為群體中存在之對偶基因的數目(亦即,多形現象之程度)或異型接合子之比例(亦即,異型接合性比率)。如本文所用,術語「 多形現象」係指人類基因體中任何個體間變異,而不管其頻率如何。此類變異之實例包括(但不限於)單核苷酸多形性、簡單串聯重複多形性、插入-缺失多形性、突變(其可為致病的)及拷貝數目變異。如本文所用之術語「 單倍型」係指同一染色體或染色體區域上一起傳遞的多個基因座上之對偶基因的組合。單倍型可指少至一對基因座,或指染色體區域,或指整個染色體或染色體組。
相對頻率」(亦稱為僅「頻率」)可指比例(例如百分比、分率或濃度)。特定言之,特定末端模體(例如,CCGA或僅單一鹼基)之相對頻率可提供與末端模體CCGA(例如具有CCGA之終止序列)相關聯之樣本中的游離DNA片段比例。
總值」可指例如一組終止位置之相對頻率的集體特性。實例包括如可在聚類中實施之平均值、中值、相對頻率之總和、相對頻率之間的變化(例如,標準差(SD)、變化係數(CV)、四分位數範圍(IQR)或不同相對頻率之間的某個百分點截止值(例如第95個或第99個百分點)),或與相對頻率之參考模式的差(例如,距離)。
「校準樣本」可以對應於其中所期望量測值(例如核酸酶活性、遺傳病症之分類或其他所期望特性)已知或經由校準方法測定,例如使用其他量測技術,諸如用於有效劑量之凝固量測值或用於量測核酸酶數量之ELISA或量化核酸酶DNA消化速率、用於量測核酸酶活性的分析(實例方法可涉及在添加含有核酸酶的樣本之前及之後或實時地以螢光或分光光度法量測DNA數量;另一個實例係使用徑向酶擴散方法)。校準樣本可具有單獨量測值(例如,具有特定末端模體或具有特定尺寸之片段的量),可判定所期望量測值可與其相關。
校準 資料點」包括「 校準值」(例如具有特定末端模體或具有特定尺寸之片段的量)及其他測試樣本期望測定的量測值或已知值。校準值可根據自樣本之DNA分子量測之各種類型的資料(例如,具有末端模體或具有特定尺寸之片段的量)加以確定。校準值對應於與所期望特性(例如遺傳病症之分類、核酸酶活性或抗凝血劑劑量之功效)相關的參數。舉例而言,可自針對校準樣本判定之量測值判定校準值,針對該量測值已知所期望特性。校準資料點可以多種方式定義,例如作為離散點或作為校準函數(亦稱為校準曲線或校準表面)。校準函數可衍生自校準資料點之額外數學轉換。
「位點」(亦稱為「基因體位點」)對應於單一位點,其可為單一鹼基位置或一組相關鹼基位置,例如CpG位點、TSS位點、DNA酶超敏位點或相關鹼基位置之更大群。「基因座」可對應於包括多個位點之區域。基因座可僅包括一個位點,此將使得基因座在彼情形下等效於一個位點。
「分離值」對應於涉及兩個值,例如兩個分率貢獻或兩個甲基化程度之差值或比率。分離值可為簡單的差值或比率。作為實例,x/y以及x/(x+y)之正比為分離值。分離值可包括其他因子,例如乘法因子。關於其他實例,可使用該等值之函數的差值或比率,例如兩個值之自然對數(ln)的差值或比率。分離值可包括差值及比率。
分離值」及「 總值」(例如相對頻率之分離值及總值)為提供在不同分類(狀態)之間變化之樣本量度之參數(亦稱為度量)的兩個實例,且因此可用於確定不同分類。總值可為分離值,例如,當在樣本的一組相對頻率與相對頻率的參考集合之間獲得差值時,如可在聚類中所進行。
相對豐度」為一種分離值類型,其使終止於一個基因體位置窗內之游離DNA分子的量(一個值)與終止於另一個基因體位置窗內之游離DNA分子的量(另一個值)關聯。兩個窗可重疊,但具有不同尺寸。在其他實施方案中,兩個窗不重疊。另外,窗口可具有一個核苷酸之寬度,且因此相當於一個基因體位置。末端密度為一種類型的相對豐度。
如本文所使用之術語「 分類」係指與樣本之特定特性相關之任何一個或多個數字或一個或多個其他字元。舉例而言,符號「+」(或字語「正性」)可表示樣本歸類為具有缺失或擴增。分類可為二元(例如陽性或陰性)或具有更高分類水準(例如自1至10或0至1之標度)。
術語「 截止值」及「 臨限值」係指操作中所使用之預定數值。舉例而言,截止尺寸可指一種尺寸,高於該尺寸,則片段被排除。臨限值可為一種值,高於或低於該值,則特定分類適用。在此等情形中之任一者下均可使用此等術語中之任一者。截止值或臨限值可為表示特定分類或在兩個或兩個以上分類之間進行鑑別之「參考值」或衍生自該參考值。如技術人員應瞭解,此類參考值可以各種方式確定。例如,可以針對具有不同已知分類的兩個不同群組的個體確定度量,且可以選擇參考值來代表一個分類(例如,平均值)或度量的兩個集群之間的值(例如,經選擇以獲得所期望的靈敏度及特異性)。作為另一實例,參考值可基於樣本之統計模擬而判定。特定截止值、臨限值、參考值等可基於所期望準確度(例如,靈敏度及特異性)而判定。
病變等級」(或病症等級)可指與生物體相關之病變的量、程度或嚴重程度。實例為表現核酸酶之細胞病症。病變之另一實例為移植器官之排斥。其他實例病變可包括自身免疫攻擊(例如,損害腎臟的狼瘡性腎炎或多發性硬化)、發炎疾病(例如,肝炎)、纖維化過程(例如,肝硬化)、脂肪浸潤(例如,脂肪肝疾病)、變性過程(例如,阿爾茨海默氏病(Alzheimer's disease))及缺血性組織損傷(例如,心肌梗塞或中風)。個體之健康狀態可視為無病變之分類。病變可為癌症。
術語「 癌症等級」係指癌症是否存在(例如存在或不存在)、癌症分期、腫瘤尺寸、轉移之存在或不存在、身體之總腫瘤負荷、癌症對治療之反應及/或癌症嚴重程度之其他量度(例如癌症復發)。癌症等級可為數字或其他標誌,諸如符號、字母及顏色。等級可為零。癌症等級亦可包括惡化前或癌變前病況(狀態)。可以各種方式使用癌症等級。舉例而言,篩查可檢查先前未知患癌之某人是否存在癌症。評定可調查已經診斷患有癌症之某人以隨時間推移監測癌症之惡化,研究療法有效性或確定預後。在一個實施例中,預後可用患者死於癌症之機率或特定期限或時間之後癌症惡化之機率或癌症轉移之機率或程度表示。偵測可意謂『篩查』或可意謂檢查暗示有癌症特徵(例如症狀或其他陽性測試)的某人是否患有癌症。
各基因體位點(例如, CpG 位點)之「 甲基化指數」或「 甲基化狀態」可指在該位點處顯示甲基化之DNA片段(例如,如自序列讀段或探針測定)相比於覆蓋彼位點之讀段總數之比例。「讀段」可對應於獲自DNA片段之資訊(例如位點處之甲基化狀態)。讀段可使用優先雜交至特定甲基化狀態之DNA片段之試劑(例如引子或探針)獲得。通常,在根據DNA分子之甲基化狀態以不同方式修飾或以不同方式識別DNA分子之方法,例如亞硫酸氫鹽轉化,或甲基化敏感限制酶,或甲基化結合蛋白,或抗甲基胞嘧啶抗體,或識別甲基胞嘧啶及羥甲基胞嘧啶之單分子測序技術處理後施用此類試劑。
區域之「 甲基化密度」可指展示甲基化之區域內之位點處之讀段數目除以覆蓋區域中之位點之讀段總數。位點可具有特定特徵,例如為CpG位點。因此,區域之「CpG甲基化密度」可指展示CpG甲基化之讀段數目除以覆蓋該區域中之CpG位點(例如特定CpG位點、CpG島內之CpG位點或更大區域)之讀段總數。舉例而言,人類基因體中各100 kb基因區域之甲基化密度可由亞硫酸氫鹽處理之後在CpG位點處未轉化之胞嘧啶(其對應於甲基化胞嘧啶)總數測定為在100 kb區域定位之序列讀段所覆蓋之所有CpG位點的比例。此分析亦可對於其他基因區域尺寸進行,例如500 bp、5 kb、10 kb、50 kb或1 Mb等。區域可為整個基因體或染色體或染色體之一部分(例如染色體組)。當區域僅包括CpG位點時,該CpG位點之甲基化指數與區域之甲基化密度相同。「甲基化胞嘧啶之比例」可指展示為甲基化(例如在亞硫酸氫鹽轉化之後未經轉化)之胞嘧啶位點「C」之數目相比於分析之胞嘧啶殘基總數,即包括區域中除CpG背景之外的胞嘧啶。甲基化指數、甲基化密度及甲基化胞嘧啶之比例為「甲基化程度」之實例。除亞硫酸氫鹽轉化之外,本領域中熟習此項技術者已知之其他方法可用於查詢DNA分子之甲基化狀態,包括(但不限於)對甲基化狀態敏感之酶(例如,甲基化敏感限制酶)、甲基化結合蛋白、使用對甲基化狀態敏感之平台的單分子測序(例如,奈米孔測序(Schreiber等人, 《美國國家科學院院刊》2013;110: 18910-18915)且藉由太平洋生物科學公司單分子即時分析(the Pacific Biosciences single molecule real time analysis)(Tse等人, 《美國國家科學院院刊》2021;118: e2019768118)。
術語「 低甲基化」可指一個位點或一組位點(例如區域)的甲基化程度低於指定值,例如甲基化程度等於或低於80%、75%、70%、65%或60%。術語「 高甲基化」可指一個位點或一組位點(例如區域)的甲基化程度高於指定值,例如甲基化程度等於或高於80%、75%、70%、65%或60%。
基因之名稱通常以斜體書寫。人類基因通常亦以所有大寫字母書寫。小鼠基因在第一個字母之後可能未出現大寫字母。蛋白質習知地以所有大寫字母書寫且無斜體字。作為實例,小鼠可具有 Dnase1l3基因及DNASE1L3蛋白質,而人類可具有 DNASE1L3基因及DNASE1L3蛋白質。
術語「約(about/approximately)」可意謂在如藉由本領域中一般熟習此項技術者所測定之特定值之可接受誤差範圍內,其將部分地視該值如何經量測或測定,亦即量測系統之限制而定。舉例而言,根據本領域中之實踐,「約」可意謂在1或大於1個標準差內。或者,「約」可意謂既定值之至多20%、至多10%、至多5%或至多1%之範圍。可替代地,尤其關於生物系統或方法,術語「約」可意謂在值之一定數量級內、在5倍內且更佳在2倍內。若特定值描述於本申請案及申請專利範圍中,除非另有說明,否則應假定術語「約」意謂在特定值之可接受誤差範圍內。術語「約」可具有如一般熟習此項技術者通常所理解之含義。術語「約」可指±10%。術語「約」可指±5%。
相關申請案之交叉引用
本申請案主張2022年3月1日提交之名稱為「游離DNA甲基化及核酸酶介導之片段化」的美國臨時專利申請案第63/615,468號及2021年4月8日提交之名稱為「游離DNA甲基化及核酸酶介導之片段化」的美國臨時專利申請案第63/172,542號之益處,該等專利申請案以全文引用之方式併入本文中且出於所有目的。
游離DNA(cfDNA)為癌症及產前測試之強大非侵入性生物標記且在血漿(以及其他游離樣本)中作為短片段循環。游離DNA包括線性DNA及染色體外環DNA(eccDNA)。血漿中之eccDNA包括來自某些組織之粒線體基因體之亞類的DNA。然而,cfDNA尚未用於理解個人中之核酸酶活性。不同核酸酶活性可指示不同程度之疾病及不同組織類型。另外,核酸酶活性對DNA片段化及甲基化之影響先前未在分析cfDNA方面加以考慮。在本發明中,吾人應用核酸酶活性、cfDNA甲基化與分析生物樣本之大小剖析之間的關係。
不同核酸酶缺陷可在全基因體層面上影響血漿cfDNA之表觀甲基化程度。研究小鼠中之DNASE1L3及DNASE1作為核酸酶之實例。不同核酸酶活性影響某些基因體區域(例如轉錄起始位點(TSS)中片段之低甲基化/高甲基化程度。覆蓋低甲基化或高甲基化位點之片段的相對豐度可用於確定個體中之病狀(例如疾病或病症)的等級、核酸酶活性之分類或樣本中臨床相關DNA分子之分率濃度。相對豐度可基於某些位點處之片段數目相較於其他位點處之片段數目來測定。舉例而言,更多來自CpG位點之低甲基化片段可指示存在病況。
來自某些區域之更大數目個片段可指示病況之等級。來自患有病況之個體之樣本在某些區域中可具有更多片段或在某些區域中具有更高或更低甲基化。區域可包括開放染色質區域(OCR)、CpG島(CGI)或TSS附近。某些區域內之拷貝數畸變之數目可用於判定個體是否具有病況。
臨床上相關DNA之分率濃度可藉由分析來自低甲基化或高甲基化位點之片段來確定。舉例而言,胚胎DNA具有較少來自甲基化CpG位點或來自OCR及CGI之片段。 不同大小之cfDNA可以與不同甲基化程度相關,此視核酸酶活性而定。某些大小片段可相對高甲基化,而其他大小片段可相對低甲基化。因此,不同基因體區域在不同大小之具有不同核酸酶活性條件之cfDNA中無法均勻表示。
eccDNA可用於分析生物樣本。來自eccDNA之cfDNA片段的尺寸分佈可用於確定基因是否呈現遺傳病症、核酸酶活性之分類或治療功效之分類。某些核酸酶缺陷會導致更較長的cfDNA片段。基於樣本中eccDNA之量的參數值可用於確定基因是否呈現遺傳病症。本文所描述之實施例亦包括測定來自eccDNA之游離DNA片段之混合物中的數量的方法。 I.             核酸酶對游離DNA甲基化之作用
描述核酸酶對游離DNA甲基化之作用。分析來自具有核酸酶缺陷之生物體的游離DNA。觀測到包括在某些基因體位點或基因體區域處之甲基化及大小剖析之變化。研究來自小鼠及在某些核酸酶缺陷之人類的樣本。來自實例核酸酶之結果可基於其他核酸酶之裂解及其他特徵來應用於其他核酸酶。看到包括在某些基因體位點處或附近的大小剖析、甲基化量、標準化末端密度基於核酸酶缺陷而變化。 A.            實驗設計及結果
在實例分析中,吾等對來自DNASE1L3或DNASE1及其野生型對應物之小鼠的彙集血漿cfDNA及白血球層基因體DNA進行全基因體亞硫酸氫鹽測序以比較其cfDNA剖析(包括大小及甲基化剖析)。發現來自人類個體之樣本的類似結果。
在來自核酸酶缺陷之個體之cfDNA分析中,確定各樣本之總體CpG甲基化百分比。用於測定此分析中之CpG甲基化的方法為亞硫酸氫鹽測序。其他方法可涉及直接電化學偵測、單分子即時偵測、甲基化DNA免疫沈澱、微陣列分析、甲基化特異性PCR或基質輔助雷射解吸電離飛行時間質譜法。
在亞硫酸氫鹽測序中,亞硫酸氫鹽用於將胞嘧啶轉化成尿嘧啶,使甲基化胞嘧啶(Cs)完整。使用甲基化特異性及非特異性引子對經修飾DNA之後續PCR擴增用胸嘧啶(T)置換所有尿嘧啶核苷酸。此產生甲基化特異性單核苷酸改變,其可藉由測序及與參考序列之排比來加以鑑別。參考基因體中指定胞嘧啶之甲基化百分比係藉由彼指定胞嘧啶下之測序C/(C+T)數目計算。可使用所有片段之測序部分計算樣本之總體甲基化(亦即讀段1及讀段2)且測定各參考C處之Cs及Ts之計數。甲基化百分比可限於CpG二核苷酸中之Cs或可為C,繼之以任何其他核苷酸(CH,其中H可為腺苷、胸嘧啶或胞嘧啶)。
亞硫酸氫鹽測序可使各基因體位點之甲基化狀態恢復。甲基化狀態可用於測定區域之甲基化密度。可基於甲基化密度確定位點或區域為低甲基化或高甲基化的。甲基化分析可與片段大小分析一起使用以確定樣本或具有核酸酶缺陷之個體的特徵。 1.            核酸酶缺陷小鼠之血漿甲基化變化
對不同基因型的核酸酶缺陷及不同樣本類型研究CpG位點之總體甲基化百分比。另外,量測不同基因體區域之CpG甲基化百分比。
1展示自各樣本中全部讀段計算之總體CpG甲基化百分比。X軸展示小鼠之基因型(野生型[WT]、Dnase1l3 -/-、Dnase1 -/-)及樣本類型(血漿、白血球層)。Y軸展示甲基化CpG位點之百分比。在所有基因型中,血漿cfDNA之CpG甲基化百分比低於自白血球層提取之其相應基因體DNA之甲基化百分比(WT血漿中值百分比:71.3%相對於WT白血球層中值百分比:74.7%,威爾科克森符號秩檢驗,p=0.03; Dnase1l3缺陷血漿中值百分比:65.4%相對於 Dnase1l3缺陷白血球層中值百分比:74.8%,威爾科克森符號秩檢驗,p=0.03; Dnase1缺陷血漿中值百分比:73.8%相對於Dnase1缺陷白血球層中值百分比:76.7%)。
比較在核酸酶基因型之間,來自Dnase1l3缺陷小鼠之血漿cfDNA比來自WT小鼠之血漿cfDNA顯著更低低甲基化(威爾卡森秩和檢驗,p=0.002)。另一方面,來自 Dnase1缺陷小鼠之血漿cfDNA相對高甲基化。相比於血漿cfDNA之不同甲基化程度,WT、 Dnase1l3缺陷小鼠及 Dnase1缺陷小鼠之間的基因體DNA之CpG甲基化百分比彼此無明顯不同。總而言之,此等資料表明,雖然不同基因型之白血球層細胞內之DNA之甲基化程度很大程度上不受DNASE1L3或DNASE1缺陷影響,但血漿cfDNA之明顯甲基化由此等核酸酶中之任一者之缺失影響。
2A展示轉錄起始位點(TSS)中來自各基因型之cfDNA之中值CpG甲基化百分比。X軸展示鹼基對與轉錄起始位點(TSS)之相對距離。Y軸展示中值CpG甲基化百分比。不同顏色線展示不同基因型之結果。藍線202展示 Dnase1 -/- 基因型結果。綠線204展示野生型基因型結果。紅線206展示 Dnase1l3 -/- 基因型結果。藍線202通常高於綠線204,其通常高於紅線206。彩色線之次序與圖2A-2E之所有均相同。所有基因之TSS自UCSC下載。用標記置放於位置0處之TSS的核苷酸聚集TSS區域。所有基因型之CpG甲基化百分比在此等區域之中心為最低的。 Dnase1l3缺陷小鼠之cfDNA相比於在此等區域中所有相對距離處之野生型cfDNA低甲基化,而 Dnase1缺陷小鼠之cfDNA略微高甲基化。
2B展示來自RNA聚合酶II結合位點(Pol II)周圍之各基因型的cfDNA之中值CpG甲基化百分比。所有基因之Pol II結合位點自Mouse ENCODE項目下載。Pol II區域聚集,其中此等區域之中心置放於位置0處。所有基因型之CpG甲基化百分比在此等區域之中心為最低的。 Dnase1l3缺陷小鼠之cfDNA相比於在此等區域中所有相對距離處之野生型cfDNA低甲基化,而 Dnase1缺陷小鼠之cfDNA略微高甲基化。
2C-2D展示來自H3K4me3及H3K27ac區域周圍之各基因型的cfDNA之中值CpG甲基化百分比。H3K4me3及H3K27ac分別為活性強化子及活性啟動子之標記的修飾。H3K4me3及H3K27ac區域自Mouse ENCODE項目下載。H3K4me3及H3K27ac區域聚集,其中此等區域之中心置放於位置0處。所有基因型之CpG甲基化百分比在此等區域之中心為最低的。 Dnase1l3缺陷小鼠之cfDNA相比於在此等區域中所有相對距離處之野生型cfDNA低甲基化,而 Dnase1缺陷小鼠之cfDNA略微高甲基化。
2E展示基因體中隨機區域周圍的各基因型之cfDNA之中值CpG甲基化百分比。10,000 bp長度之10,000個隨機非重疊區域藉由BEDTool(v2.27.1)在全基因體中隨機選擇(Quinlan等人, 《生物信息學( Bioinformatic)》2010;26:841-842)。來自 Dnase1l3缺陷小鼠之血漿cfDNA之表觀低甲基化及來自 Dnase1缺陷小鼠之血漿cfDNA之表觀輕微高甲基化存在於隨機區域中。因為隨機區域將反映全基因體>97%的異染色質,所以來自 Dnase1l3缺陷小鼠之cfDNA的表觀低甲基化及來自 Dnase1缺陷小鼠之cfDNA的表觀高甲基化似乎與開放或封閉染色質狀態無關且影響全基因體。
2A-2E均展示 Dnase1l3缺陷小鼠與野生型相比在某些位點周圍係低甲基化,且Dnase1缺陷小鼠與野生型相比在某些位點周圍係高甲基化。此等圖展示不同核酸酶缺陷可產生不同甲基化程度。 2.            核酸酶缺陷及甲基化對cfDNA大小剖析之影響
先前已表徵此等不同核酸酶對血漿cfDNA大小剖析之作用,且各基因型之中值大小剖析展示於 3(Serpas等人, 2019;Cheng等人, 2018)。圖3展示X軸上之鹼基對的片段大小及Y軸上之片段大小的頻率。與模態大小為167 bp的WT小鼠(綠線304)的cfDNA相比,來自 Dnase1l3缺陷小鼠(紅線308)的cfDNA表現出短≤150 bp片段的增加,模態大小為164 bp,其中166 bp片段減少,且≥250 bp片段略有增加,這與我們之前的發現一致(Serpas等人,2019年)。另一方面,當比較來自Dnase1缺陷小鼠(藍線312)之cfDNA與來自WT小鼠(綠色)之cfDNA時,大小剖析存在細微差異。≤150 bp的短片段略有減少,166 bp片段的頻率增加,且模態大小為171 bp。先前,吾人已報導來自Dnase1缺陷小鼠之cfDNA的大小剖析顯然與來自WT小鼠之cfDNA的大小剖析不同(Cheng等人,2018)。雖然差異並不明顯,但回想起來,吾人在此處注意到的大小剖析之細微差異亦存在更多樣本之益處(Cheng等人,2018)。因此,與WT小鼠相比, Dnase1l3缺陷小鼠具有較短cfDNA大小剖析且 Dnase1缺陷小鼠具有稍微較長的cfDNA大小剖析。
此前,吾等組亦發現人類血漿中之低甲基化cfDNA比高甲基化cfDNA短(Lun等人,2013)。吾等檢查可見此關係在具有不同核酸酶基因型之小鼠的血漿中是否仍為真。吾人鑑別出具有至少三個CpG之cfDNA片段且將此等CpG中之零甲基化為0%甲基化片段的片段及將所有其CpG經甲基化為100%甲基化片段的片段進行分類。吾人比較此等0%甲基化片段及100%甲基化片段在三種基因型中之每一者中之中值大小剖析( 4A 4B4C)。在所有三種基因型中,0%甲基化片段(黃線404、408及412)具有比其100%甲基化對應物具有更短片段的大小剖析。因此,與吾等在人類血漿中之先前發現類似,與核酸酶相關之基因型無關,未甲基化片段比甲基化片段更可能短。
知曉未甲基化片段傾向於更短,且來自 Dnase1l3缺陷小鼠之cfDNA具有更多的短片段,這增加了來自 Dnase1l3缺陷小鼠之cfDNA僅僅因為短片段之增加而更加低甲基化的可能性。為了闡明此等相關因子之間的關係,吾等檢驗在0%及100%甲基化片段內之各基因型之中值cfDNA大小剖析以控制甲基化程度( 5A 5B)。在來自 Dnase1l3缺陷小鼠之cfDNA中,縮短吾等先前使用所有片段觀測到之大小剖析(圖3)在0%中亦顯而易見(紅線504,圖5A)及100%(紅線516,圖5B)甲基化片段(0%甲基化片段之模態大小:WT中之166 bp相對於 Dnase1l3缺陷小鼠中155 bp;100%甲基化片段之模態大小:WT中168 bp相對於 Dnase1l3缺陷小鼠中155 bp)。因為來自 Dnase1l3缺陷小鼠之0%及100%甲基化片段均相對短於來自WT小鼠之甲基化片段,所以DNASE1L3缺陷本身對大小剖析有影響。此外,來自Dnase1l3缺陷小鼠之cfDNA大小剖析的相對縮短在0%甲基化片段中甚至比在100%甲基化片段中更加誇張,尤其在≤80 bp片段中。在WT(綠線508及520)及 Dnase1l3缺陷小鼠(紅線504及516)中,此等超短≤ 80 bp片段在0%甲基化片段中之頻率高於100%甲基化片段中之頻率。因此,在WT及 Dnase1l3缺陷小鼠中,cfDNA片段大小縮短程度亦受片段之甲基化狀態影響。
吾等隨後探索來自Dnase1缺陷小鼠之0%及100%片段之中值cfDNA大小剖析變化(藍線512及524,圖5A、5B)。吾等先前看到的所有片段(圖3)稍長之大小剖析在0%(藍線512,圖5A)及100%(藍線524,圖5B)甲基化片段中顯而易見,其具有相似之延長程度( Dnase1缺陷小鼠中0%及100%甲基化片段之模態大小為169 bp)。此等結果表明, Dnase1缺陷小鼠之cfDNA之大小剖析變化相對獨立於甲基化狀態發生。此外,在來自WT及 Dnase1l3缺陷小鼠之cfDNA中看到的0%甲基化片段中短≤150 bp片段,尤其係超短≤ 80 bp片段的頻率增加在 Dnase1缺陷小鼠之cfDNA中不存在。因此,DNASE1似乎造成0%甲基化片段中此等短≤150 bp片段之頻率增加。
總之,雖然低甲基化cfDNA之大小剖析往往比高甲基化cfDNA短,但此等核酸酶之缺失亦對cfDNA大小剖析產生獨立影響。來自 Dnase1缺陷小鼠之cfDNA揭露0%甲基化片段中短≤ 150 bp片段之頻率增加,尤其係超短≤80 bp,與DNASE1活性有關。 3.            OCR及CGI片段在cfDNA甲基化中之作用
吾人接下來探索此等DNASE1活性相關之短未甲基化片段在Dnase1l3缺陷小鼠之cfDNA中的基因體來源。吾等假設其可能與OCR及CpG島(CGI)相關,此係因為相比於基因體整體,已知此等區域為低甲基化的。吾等將側接TSS及Pol II區域之中心的±500 bp區域及H3K27ac及/或H3K4me3之區域歸類為OCR且用CGI合併此等區域。
6A 6B 6C 6D 6E6F在X軸上展示到基因體位點之相對距離,在Y軸上展示為百分比之標準化末端密度。標準化末端密度係由片段末端計數除以±3000 bp區域中之中值末端計數來計算。各基因型之中值標準化末端密度展示在聚合TSS區域(圖6A)、RNA聚合酶II(Pol II)(圖6B)、H3K4me3(圖6C)及H3K27ac區域(圖6D)、CGI(圖6E)及隨機選擇的區域(圖6F)之±1000 bp窗口中。野生型小鼠之cfDNA呈綠色(例如,圖6A中之綠線604), Dnase1l3缺陷小鼠呈紅色(例如,紅線608),且 Dnase1缺陷小鼠呈藍色(例如,藍線612)。在圖6A-6E中,紅線最高,綠線次高,藍線最低。
吾等觀測到,與WT(例如,綠線604)相比,此等OCR及CGI區域在 Dnase1l3缺陷小鼠(例如,紅線608)之cfDNA中增加了末端密度,且在 Dnase1缺陷小鼠(例如,藍線612)之cfDNA中降低了末端密度。相比之下,基因體隨機區域中之標準化末端密度在WT、 Dnase1l3缺陷及 Dnase1缺陷小鼠之cfDNA中相似且重疊( 6F)。因此,此等OCR及CGI區域在不同基因型之cfDNA中與隨機基因體區域相比存在差異性片段化。在 Dnase1l3缺陷小鼠之cfDNA中,此等OCR及CGI區域之片段化增加與來自OCR及CGI的短(≤ 150 bp)片段的比例增加相關(圖7)。
7展示OCR及CGI中片段之大小剖析。鹼基對中之片段大小展示在X軸上。片段大小之頻率展示在Y軸上。展示OCR及CGI內片段之中值cfDNA大小剖析。野生型小鼠之cfDNA用綠線704顯示, Dnase1l3缺陷小鼠用紅線708展示, Dnase1缺陷小鼠用藍線712展示。所有野生型片段之cfDNA大小剖析展示為與灰線716的比較。 Dnase1缺陷小鼠之OCR及CGI中短(≤ 150 bp)cfDNA的比例顯著降低,其將此等低甲基化短片段與OCR及CGI之DNASE1片段化連接。
此等所選擇之OCR及CGI內之片段之百分比展示於 8中。基因型展示於X軸上。與CGI區域合併之TSS、PoI II、H3K4me3及H3K27ac區域中心周圍的區域±500 bp之片段百分比展示於Y軸中。與來自WT小鼠之cfDNA相比,來自 Dnase1l3缺陷小鼠之cfDNA在OCR及CGI中具有顯著更多的片段(WT中值百分比:3.66%相對於 Dnase1l3缺陷中值百分比:5.20%,威爾卡森秩和檢驗, p=0.002)。與WT小鼠之cfDNA( Dnase1缺陷中值百分比:3.17%)相比, Dnase1缺陷小鼠之cfDNA中此等片段似乎亦存在略微較低的百分比。各樣本之此等OCR及CGI片段百分比均大於小鼠基因體中之此等OCR及CGI之預期百分比,其為2.61%。因此,此等低甲基化OCR及CGI片段一般似乎在血漿cfDNA中稍微富集。
為了探究此等OCR及CGI片段對來自不同核酸酶基因型之小鼠的cfDNA之甲基化差異的貢獻,吾等在自OCR及CGI生物資訊掩蔽此等片段之後重新計算每一基因型中的cfDNA之總體甲基化程度( 9)。在圖9中,基因型展示於X軸上。Y軸展示在生物資訊排除掩蔽分析中之OCR及CGI片段之後的CpG甲基化百分比。引人注目地,Dnase1l3缺陷小鼠(圖1)之cfDNA中所見的較大低甲基化程度恢復至74.7%之中值CpG甲基化(圖9),其類似於其白血球層甲基化百分比。實際上,排除在此等OCR及CGI起源片段之後增加的所有基因型之總體甲基化程度(WT中值百分比:76.4%, Dnase1缺陷中值百分比:78.2%),基本上恢復至其成對白血球層之甲基化程度。
10A-10C為來自每個樣本之圈圖,其中各點表示每一鼠類體染色體之1 Mb基因區域中的CpG甲基化百分比,且若≥70%,則呈藍色,且若<70%,則呈紅色。外環係各1 Mb基因區域中包括所有片段之CpG甲基化百分比,且內環不包括OCR及CGI中之片段。掩蔽OCR及CGI中之片段以全基因體方式減少來自WT(圖10A)、 Dnase1缺陷(圖10B)及 Dnase1l3缺陷小鼠(圖10C)之cfDNA的相對低甲基化區域。來自 Dnase1l3缺陷小鼠之cfDNA中之大部分低甲基化區域在掩蔽此等OCR及CGI之後消失。此等結果表明其為此等OCR及CGI中之片段,其為來自 Dnase1l3缺陷小鼠之cfDNA之所觀測到的低甲基化之主要原因;此等OCR及CGI片段在與基因體DNA相比之cfDNA中所見之一般低甲基化中起一定作用。 4.            藉由片段大小之差示甲基化程度及OCR及CGI比例
吾等隨後利用片段大小分析cfDNA之甲基化程度。對於特定大小之所有片段,計算CpG甲基化百分比且在 11中標繪各基因型之中值。X軸展示片段大小。Y軸展示CpG甲基化百分比。野生型係以綠線1104展示。 Dnase1缺陷小鼠以藍線1108展示。 Dnase1l3缺陷小鼠以紅線1112展示。灰色虛線標記166 bp片段大小。在所有基因型中,CpG甲基化似乎遵循週期性模式,其中甲基化峰值在大約170 bp、360 bp及550 bp片段大小處。此等片段大小對應於與單、二及三核小體相關之大小,表明核小體相關之cfDNA片段更可能發生甲基化。
cfDNA甲基化百分比中之谷值係約片段大小270 bp及460 bp。cfDNA甲基化中之此等谷值對應於較高比例之所有基因型之OCR及CGI片段( 12)。圖12具有X軸上之片段大小。計算各片段大小內OCR及CGI片段之比例,且各基因型之中值展示於Y軸上。野生型係以綠線1204展示。 Dnase1缺陷小鼠以藍線1208展示。 Dnase1l3缺陷小鼠以紅線1212展示。所有片段大小、 Dnase1l3缺陷小鼠之cfDNA中OCR及CGI片段比例高於來自WT及 Dnase1缺陷小鼠之cfDNA中。在來自 Dnase1缺陷小鼠之cfDNA中,在超短片段≤80 bp中OCR及CGI片段比例相對降低,表明在此等片段大小下DNASE1增加cfDNA之OCR及CGI比例方面之作用較強。有趣的係,在與甲基化谷值相關之片段大小中,來自 Dnase1缺陷小鼠之cfDNA具有比來自WT小鼠之cfDNA稍微更高的OCR及CGI片段比例。此等片段大小中之稍微較高OCR及CGI比例可能與其他酶相關。因此,吾人已展示cfDNA之不同片段大小與不同甲基化程度及不同比例之OCR及CGI片段相關。
為了梳理出不同片段大小之間甲基化程度與OCR和CGI片段比例之間的關係,吾等對OCR和CGI片段進行生物資訊掩蔽,且重新繪製掩蔽後各片段大小之CpG甲基化程度( 13)。在圖13中,野生型以綠線1304展示; Dnase1缺陷小鼠以藍線1308展示; Dnase1l3缺陷小鼠以紅線1312展示。灰色虛線標記166 bp片段大小。
14A14B14C中,在掩蔽OCR及CGI片段之前及之後展示具有各片段大小之CpG甲基化百分比。之前的掩蔽百分比以灰線1404、1408及1412展示。
掩蔽後,雖然週期性模式持續存在,但峰谷差異減小並且所有基因型的所有片段大小的甲基化百分比增加( 13 14A14B)。對於所有基因型,在掩蔽此等OCR及CGI片段之後展現甲基化之最大增加的片段大小為彼等≤80 bp及約270 bp之第一谷值周圍的片段大小(圖14),其與OCR及CGI片段之比例較高的大小對應。在270 bp下,來自WT小鼠之cfDNA中甲基化百分比自55.4%上升至60.3%,來自 Dnase1缺陷小鼠之cfDNA中自50.9%至56.9%,且來自 Dnase1l3缺陷小鼠之cfDNA中自46.7%至55.0%。另一方面,可能單核小體相關片段之甲基化程度僅最低限度地增加;例如166 bp片段甲基化百分比自WT之74.3%增加至76.3%,DNASE1缺陷cfDNA中76.3至78.2%,且DNASE1L3缺陷cfDNA中71.1%至74.3%。此等結果再次說明OCR及CGI片段對cfDNA甲基化之影響對於某些cfDNA大小更明顯。
比較圖4A中之核酸酶基因型,與WT及 Dnase1缺陷小鼠相比,來自 Dnase1l3缺陷小鼠之cfDNA在大多數片段大小高達約500 bp的情況下經低甲基化,其中包含98-99%之測序cfDNA的總群體。在掩蔽之後,低甲基化程度在某些片段大小中比在其他片段大小中減少得更多(圖13)。有趣的係,在掩蔽OCR及CGI片段後,來自約80 bp至200 bp及250 bp至350 bp的片段大小在來自 Dnase1l3缺陷小鼠的cfDNA與來自WT及 Dnase1缺陷小鼠的cfDNA之間的甲基化百分比仍然存在顯著差異。此可歸因於未由吾等生物資訊掩蔽解釋之其他低甲基化片段的存在及/或此等區域中高甲基化片段之相對不存在。
相比之下,來自 Dnase1缺陷小鼠之cfDNA的相對高甲基化僅在特定大小範圍內出現,最明顯地在166 bp及360 bp甲基化峰值周圍(圖11)。此相對高甲基化在掩蔽OCR及CGI片段之後未明顯變化(圖13)。因此,來自 Dnase1缺陷小鼠之cfDNA中所見的相對高甲基化主要在單核小體及雙核小體大小之cfDNA中且不大可能與OCR及CGI片段相關。 5.            DNASE1L3切割甲基化CpG
儘管吾等已證明低甲基化OCR及CGI中之DNASE1活性係 Dnase1l3缺陷小鼠之cfDNA中之相對低甲基化的主要促成者,但DNASE1活性似乎僅為全圖之一部分。即使在掩蔽OCR及CGI片段之後,仍保持來自 Dnase1l3缺陷小鼠之cfDNA相比於來自WT小鼠之cfDNA的相對低甲基化(威爾卡森秩和檢驗, p=0.008)(圖9),尤其係在片段大小中80 bp至200 bp及250 bp至350 bp中(圖13)。因此,吾人亦繼續探究DNASE1L3之作用。吾等推論在 Dnase1l3缺陷小鼠之血漿中可見之相對低甲基化亦可由DNASE1L3對甲基化片段之貢獻降低而產生。
吾人設計一種查詢DNASE1L3是否可以切割甲基化CpG之方法。為此,吾人首先鑑別甲基化及未甲基化CpG。自包含八個不同小鼠組織(骨髓、胸腺、脾臟、腎臟、心臟、肝臟、大腸、小腸)之亞硫酸氫鹽測序之下載數據集分別具有兩個拷貝,吾等發掘於90%之所有組織中甲基化之CpG且拷貝讀段且將其鑑別為假定甲基化CpG(總計545,720個CpG)。類似地,吾等亦針對在數據集中在80%讀段中未甲基化之CpG且將其鑑別為假定未甲基化CpG(總計7,140個CpG)。使用90%讀段中未甲基化CpG用於後續分析更加困難,此係由於極低數目之CpG滿足此條件(總計11個CpG)。利用自此下載數據集鑑別之此等假定甲基化及未甲基化CpG,吾人證實吾等血漿數據集中之此等CpG之實際甲基化程度將與其預期甲基化程度類似。對於假定甲基化CpG,此等CpG在各樣本之血漿cfDNA中具有>90%甲基化程度,且對於假定未甲基化CpG,此等CpG在各樣本之吾人血漿cfDNA中具有<20%甲基化程度( 15A15B)。
在鑑別此等假定甲基化及未甲基化CpG下,吾人計算此等CpG及其周圍區域上方之標準化末端密度。當聚集在一起將假定甲基化C置放在位置0時,在周圍的±1000 bp上存在強烈週期性的末端密度模式,暗示CTCF區域周圍發現的核小體陣列( 16A)(Fu等人,2008;Kelly等人,2012)。此等結果表明,吾人鑑別之此等假定甲基化CpG可能來源於封裝染色質結構中之DNA,只有當周圍的核小體相位良好時,才會產生此類明顯的週期性。將吾等焦點縮小到僅假定甲基化C,吾人發現在來自WT及Dnase1缺陷小鼠之所有血漿樣本中在假定甲基化C下標準化末端密度增加( 16B)。因此,在DNASE1L3存在下,在WT及Dnase1缺陷小鼠之cfDNA中,在假定甲基化C處存在極特異性切割。相比之下,在Dnase1l3缺陷小鼠之血漿中,假定甲基化C與其周圍-6至+8 bp區域相比不再優先切割( 16C)。紅線1604展示Dnase1l3缺陷小鼠之標準化末端密度。因此,此證據表明,DNASE1L3負責裂解此等核小體陣列中之此等假定甲基化C,且在其不存在下的情況下,片段化模式不再具有特異性,屬於更寬-6至+8 bp區域,其可能為核小體之間的連接區域。有趣的係,在不存在DNASE1L3的情況下,該接頭區域中末端密度最高的位置,即新的較佳切割位點,正好相隔10 bp。此可解釋 Dnase1l3缺陷小鼠之cfDNA大小剖析中10 bp週期性之顯著增加。
另一方面,與假定甲基化CpG相比,假定未甲基化CpG似乎來源於極其不同的基因體區域。假定未甲基化CpG之周圍區域展現圍繞假定未甲基化CpG的在-400至+400 bp區域中標準化末端密度之一般化增加( 17A)。此等較大區域因此對於片段化更加可接近,此為將表明此等區域可能為OCR之特性。在來自WT及Dnase1缺陷小鼠之cfDNA中,不尤其較佳為假定未甲基化C與其周圍±1000 bp區域相比切割( 17B)。在 Dnase1l3缺陷小鼠之血漿中,假定未甲基化C亦並非優先切割,實際上,其側接鹼基相較於WT小鼠之cfDNA具有更高的末端密度( 17C)。紅線1704展示 Dnase1l3缺陷小鼠之標準化末端密度。 Dnase1l3缺陷小鼠之cfDNA中側接假定未甲基化C的區域中片段末端的此增加與OCR及CGI中之先前發現相呼應。類似地, Dnase1缺陷小鼠之cfDNA中側接假定未甲基化C之區域中末端密度降低(圖17B)再次暗示DNASE1在產生圍繞未甲基化區域之片段末端中起主要作用。因此,自此分析,吾等揭示使用核酸酶缺陷小鼠切割甲基化CpG及未甲基化CpG處之DNASE1L3的偏好。 6.            DNASE1L3缺陷之人類個體
為了將吾等發現外推給人類cfDNA,吾等執行來自三個DNASE1L3缺陷個體(H2、H4及V11)及一個異型接合親本(H1)之血漿樣本之亞硫酸氫鹽測序(Cha等人,2020)。與 Dnase1L3缺陷小鼠相似,與對照及異型接合相比, DNASE1L3缺陷個體之血漿cfDNA係低甲基化( DNASE1L3缺陷個體H2之CpG甲基化:69.66%、H4:70.1%及V11:69.32%相對於8個對照的中值:74.90%及H1:73.84%)( 18)。圖18展示來自X軸上具有不同基因型之人類個體的樣本。以橙色顯示之第一行(或僅具有對照及V11樣本之行)來自血漿。以紫色展示之第二行來自白血球層。Y軸展示CpG甲基化百分比。所有對照及個體之血漿cfDNA甲基化程度亦低於白血球層樣本之血漿cfDNA甲基化程度(圖18)。來自 DNASE1L3缺陷患者之血漿cfDNA之此低甲基化可見於TSS及隨機區域中且因此亦為全基因體現象( 19A 19B)。在圖19A中,對照樣本以綠線1904展示;異型接合 DNASE1L3親本以深綠線1908展示;且 DNASE1L3缺陷個體以紅線1912展示。在圖19B中,對照樣本以綠線1916展示; DNASE1L3缺陷個體以紅線1920展示。異型接合 DNASE1L3親本以在紅線1920與綠線1916之間有時可見且有時在綠線1916上方可見的暗綠線展示。
類似地, DNASE1L3缺陷患者之血漿cfDNA具有更短的大小剖析,其在0%甲基化片段中比在100%甲基化片段中更加誇張( 20A 20B)。在圖20A中,對照樣本以綠線2004展示;異型接合 DNASE1L3親本以深綠線2008展示;且 DNASE1L3缺陷個體以紅線2012展示。在圖20B中,對照樣本以綠線2016展示;異型接合 DNASE1L3親本以深綠線2020展示;且 DNASE1L3缺陷個體以紅線2024展示。
較短大小剖析對應於低甲基化開放染色質TSS區域( 21A)中標準化末端密度的增加,其與隨機區域( 21B)相反。在圖21A中,對照樣本以綠線2104展示;異型接合 DNASE1L3親本以深綠線2108展示;且 DNASE1L3缺陷個體以紅線2112展示。在圖21B中,不同樣本之不同線重疊。此表明在 DNASE1L3缺陷患者之cfDNA中,低甲基化區域處的DNA片段化增加。與對照相比, DNASE1L3缺陷患者血漿中OCR及CGI區域的片段顯著增加證實了這一點(對照中值百分比:5.71 %相對於 DNASE1L3缺陷中值百分比:7.34%,威爾卡森秩和檢驗, p=0.01)( 22)。當此等OCR及CGI片段經生物資訊掩蔽時,血漿CpG低甲基化恢復至對照物中所見之程度( 23A 23B23C)。圖23A展示正常個體之圈圖。圖23B及23C展示 DNASE1L3缺陷個體之圈圖。總體而言,OCR及CGI區域至短低甲基化片段中之切割增加亦佔DNASE1l3缺陷個體之cfDNA中所見之相對低甲基化。
亦在人類cfDNA中證實DNASE1L3之切割偏好。發現對照血漿cfDNA優先在假定甲基化CpG下結束( 24)。對照樣本以綠線2404展示;異型接合 DNASE1L3親本以深綠線2408展示;且 DNASE1L3缺陷個體以紅線2412展示。與小鼠cfDNA相比,人類cfDNA中對以假定甲基化CpG結束的片段的驚人偏好似乎更為明顯,其中人類之標準化末端密度約為2.4,而小鼠為1.5。此末端偏好不存在於DNASE1L3缺陷個體之cfDNA中,該等個體之所得末端密度剖析展示較寬-6至+8 bp區域中之峰(圖24)。因此,吾人發現 DNASE1L3缺陷患者之cfDNA很大程度上類似於 Dnase1l3缺陷小鼠,確定人類血漿中核酸酶活性與cfDNA甲基化之間的此聯繫。 B.            大小剖析及甲基化變化
在此工作中,吾等已發現,不同核酸酶缺陷極大地影響血漿cfDNA在全基因體程度上之表觀甲基化程度及大小剖析。吾人已發現 Dnase1l3缺陷小鼠及 DNASE1L3缺陷人類之血漿cfDNA比來自對照樣本之cfDNA低甲基化得多,且具有較短大小剖析,其中≤150 bp的短片段增加,166 bp片段減少。這與 Dnase1缺陷小鼠之cfDNA形成對比,後者的高甲基化程度略高於WT cfDNA,且具有稍長的大小剖析,≤150 bp的短片段減少,且166 bp片段增加。此係因為白血球層基因體DNA之甲基化程度在不同基因型之間類似,所以血漿cfDNA甲基化之差異可能與DNA片段化過程期間之核酸酶活性相關。
在我們分別探索 Dnase1l3缺陷及 Dnase1缺陷小鼠之血漿cfDNA中低甲基化及高甲基化的原因時,吾人發現來自 Dnase113缺陷小鼠之cfDNA具有更多的低甲基化片段,此等片段源自開放染色質區域及CpG島的片段化增加遍及全基因體。 Dnase1缺陷小鼠之cfDNA中此等片段之減少揭示罪魁禍首為DNASE1。 Dnase1缺陷小鼠中之DNASE1活性缺失允許吾等推斷DNASE1增加此等OCR及CGI之片段化,且導致此等區域中短片段的比例增加,尤其係超短片段。DNASE1活性之此理解與使用DNASE1至DNASE-seq中之探測DNase I超敏區域的整個領域及技術一致(Boyle等人,2008)。
25展示DNASE1及DNASE1L3的推斷活性。DNASE1(例如,以藍色展示之DNASE1 2504)偏好裂解未甲基化及開放染色質DNA。藉由片段化此等區域,DNASE1增加血漿中之此等OCR及CGI區域之表示,引起cfDNA之相對低甲基化。在不同cfDNA大小中,此等OCR及CGI區域不同等地表示。DNASE1L3(例如以紅色所示之DNASE1L3 2508)有效地切割甲基化片段且相比於DNASE1增加血漿cfDNA中甲基化片段之表示。DNASE1L3之切割偏好可能導致166 bp片段大小的突出。此等偏好之組合產生最終cfDNA大小剖析2512及針對各片段大小所觀測到的甲基化剖析2516。
生物資訊掩蔽此等OCR及CGI片段表明,此等區域係Dnase1l3缺陷小鼠之血漿cfDNA中相對低甲基化的主要貢獻者。此外,吾人發現此等OCR及CGI片段通常相對富集於血漿cfDNA中,且此富集說明血漿cfDNA與其基因體DNA相比之相對低甲基化(圖3)。似乎低甲基化OCR及CGI中之DNASE1活性增加其片段化且使此等低甲基化區域在血漿cfDNA中增濃。此亦解釋來自Dnase1缺陷小鼠之血漿cfDNA的相對高甲基化。相當值得注意的係,僅佔吾人樣本中之總測序cfDNA群體之3-6%的此等OCR及CGI片段可對血漿cfDNA之表觀甲基化程度具有此顯著影響。
cfDNA大小剖析實際上在無DNASE1L3存在下最顯著地變化。吾等針對假定甲基化及未甲基化CpG之分析揭示了原因。吾人證明,不存在DNASE1L3減少甲基化CpG處之切割。此由現有文獻支援,展示DNASE1L3可在無蛋白水解幫助之情況下以高效率將染色質裂解至幾乎不可偵測程度(Sisirak等人,2016年;Napirei等人,2009年)。
由於基因體係>97%的異染色質,其大部分CpG甲基化,因此大部分基因體對DNASE1L3活性敏感,但對DNASE1不太敏感。因此,並不出人意料的係,DNASE1L3之不存在將顯著影響cfDNA大小剖析。來自 Dnase1l3缺陷小鼠之cfDNA中cfDNA大小剖析之更明顯變化中之一者為166 bp峰之突出度降低。吾人假設166 bp片段大小可藉由染色質之連接區域中之DNASE1L3切割此等甲基化C之相對較強局部偏好產生。令人驚訝的係,在不存在DNASE1L3的情況下,兩個新的片段末端偏好似乎彼此相距恰好10 bp。此亦可解釋 Dnase1l3缺陷小鼠之cfDNA中10 bp週期性之突出度增加。
實際上,此用於產生166 bp片段之DNASE1L3偏好在來自Dnase1缺陷小鼠之cfDNA中顯而易見。在此類小鼠中,0%與100%甲基化cfDNA均片段化為極類似大小剖析,具有極急劇166 bp峰且展現未甲基化片段之顯著有限縮短。因此,在不存在DNASE1下,DNASE1L3似乎具有有限偏好將未甲基化片段切割成較小片段。實際上,在 Dnase1缺陷小鼠之cfDNA中,假定未甲基化CpG之末端密度降低。此等結果表明DNASE1L3在很大程度上與DNA甲基化狀態無關,這將增加血漿cfDNA之甲基化部分,因為基因體中甲基化CpG比未甲基化CpG更豐富(圖25)。
此項工作亦揭示不同大小之cfDNA與不同甲基化程度相關。廣泛認為cfDNA片段的大小與單核小體、雙核小體及三核小體相關(約170 bp、360 bp及550 bp)相對高甲基化,而中等大小的片段(約270 bp及460 bp)相對低甲基化。掩蔽OCR及CGI片段表明,低甲基化在片段<=80 bp及所有三種基因型之谷值周圍不均衡地影響。此等片段大小實際上具有較高比例之OCR及CGI片段,且可反映較多的DNASE1之活性。吾人由此表明不同基因體區域在不同大小之cfDNA中不均勻表示。
檢查基因型之間的各cfDNA大小之甲基化程度差異揭露DNASE1L3亦起作用。可以切割甲基化CpG之DNASE1L3似乎產生更多個166 bp片段,其在 Dnase1缺陷小鼠之cfDNA中係甲基化的。 Dnase1缺陷小鼠之cfDNA中之單核小體大小的片段似乎係甲基化程度最高的,甲基化程度隨著各額外的核小體而降低,這表明甲基化片段之DNASE1L3對單核小體的貢獻最高(圖11)。對此之一種解釋係,此係因為藉由DNASE1L3之切割偏好增加甲基化片段之貢獻,核小體相關片段大小似乎更加甲基化。此外,在掩蔽OCR及CGI片段之後,片段大小80至200 bp及250至350 bp之甲基化程度在 Dnase1l3缺陷小鼠之cfDNA與WT及 Dnase1缺陷小鼠之cfDNA之間的剩餘差異表明一部分此等片段大小可來源於DNASE1L3切割偏好。DNASE1L3可在此等特定片段大小中起作用之潛在原因為此等片段大小可來源於甲基化DNA之核小體內切割。可存在可起作用之其他核酸酶,且將來對雙基因敲除模型之研究將進一步優化分析。然而,吾等觀測結果證明特定cfDNA大小反映受甲基化影響之片段化過程。
在本文中,吾人能夠推斷DNASE1及DNASE1L3之作用及偏好。吾人不僅已展示核酸酶影響表觀cfDNA甲基化程度,且亦展示各核酸酶如何影響其。吾人亦證實cfDNA大小剖析(本質上為片段化過程之終產物)反映關於甲基化之此等差異核酸酶活性。因此,吾等已對cfDNA的此等基本特性有所瞭解。
此等發現已在具有DNASE1L3缺陷之人類cfDNA中複製。人類中之同型接合 DNASE1L3缺陷導致兒童全身性紅斑性狼瘡症(SLE)及血管炎之家族性常染色體隱性形式(Al-Mayouf等人,2011;Ozcakar等人,2013;Carbonella等人,2017)。 Dnase1l3缺失導致DNA自身耐受性之喪失大概與DNASE1L3破壞核小體清除有關(Sisirak等人,2016;Napirei等人,2000)。即使在不具有 Dnase1l3缺陷之SLE患者中,吾等先前已發現其具有與 Dnase1l3缺陷患者中所發現之剖析類似的短、低甲基化cfDNA比例增加(Chan等人,2014)。此可與核小體之核酸酶清除中之功能畸變有關;更多研究將有助於闡明核酸酶活性與SLE發病機制之間的關係。
此等觀測結果對cfDNA領域具有深遠影響。cfDNA之片段化過程引起cfDNA之表觀甲基化。個人中之核酸酶活性可影響總體cfDNA甲基化且導致假陽性測試。此係因為某些片段大小具有反映不同比例之不同基因體區域之不同甲基化程度,所以由於此潛在生物學而聚焦對某些片段大小的診斷測試可為有利的。由於cfDNA片段體學為新興的癌症生物標記,因此更深入地瞭解核酸酶對cfDNA片段化之影響係至關重要的。最終,基於大小之分析及基於核酸酶之分析的組合係用於研究cfDNA生物學之有效方法且可具有診斷應用。 C.           使用區域中之甲基化分析樣本
僅使用甲基化程度分析某些生物樣本可能很困難。舉例而言,患有不同病況之個體之樣本之間的甲基化程度差異可能沒有顯著差異。生物樣本中開放染色質區域(OCR)及圍繞某些CpG位點之片段的量可視個體之某些病況而變化。舉例而言,OCR及CpG位點周圍之片段之量可視樣本中之個體之癌症分類或樣本中之片段是否為母體或胎兒而不同。分析假定甲基化或假定未甲基化CpG位點可幫助分析生物樣本以區分不同病況或不同組織類型。 1.            癌症
量測OCR(TSS、H3K27ac及H3K4me3標記上游及下游500 bp)及CGI區域中片段之比例在比較癌症及非癌症方面引起統計顯著差異。在一個實施例中,對來自8名健康對照、17名感染慢性乙型肝炎病毒(HBV)之患者及34名HCC患者的血漿cfDNA進行亞硫酸氫鹽測序,其中位值為3800萬雙邊讀段(範圍,18-6500萬)。
26展示自各樣本之血漿cfDNA中所有測序片段所計算之總體CpG甲基化百分比。X軸展示不同cfDNA樣本之來源:對照個體(CTR)、慢性乙型肝炎(HBV)攜帶者及患有肝細胞癌(HCC)之個體。一些HCC樣本相比於對照為總體極低甲基化的;然而,作為一組,對照與HCC之間的總體CpG甲基化在統計學上不顯著。
另一方面,在 27A中,在健康對照及HCC患者之間比較OCR及CGI區域中片段之比例。來自HCC患者之cfDNA與對照相比,OCR及CGI片段之比例顯著降低( P值=0.009,威爾卡森秩和檢驗)。在 27B中,膀胱癌中亦發現此趨勢。X軸展示不同樣本之來源:對照個體(CTR)、患有低度非肌侵襲性膀胱癌(NMIBC_LG)、高度非肌侵襲性膀胱癌(NIMBC_HG)及高度肌肉侵襲性膀胱癌(MIBC_HG)之個體。屬於OCR及CGI區域之片段隨著膀胱癌之嚴重程度降低,自低度非肌侵襲性膀胱癌(NMIBC_LG)至高度非肌侵襲性膀胱癌(NIMBC_HG)及高度肌肉侵襲性膀胱癌(MIBC_HG)。作為一組,膀胱癌在OCR及CGI中具有明顯極少的片段( P值0.003,威爾卡森秩和檢驗)。 2.            胎兒對比母體特異性片段
28展示OCR及CGI區域中之胎兒特異性片段及母體特異性片段之比例亦顯著不同。X軸展示胎兒特異性片段及母體特異性片段。OCR定義為圍繞TSS、H3K4me3及H3K27ac區域之中心的±500 bp且與CGI區域合併。藉由基因分型鑑別來自懷孕女性之單一血漿樣本的胎兒特異性片段及母體特異性片段且定量此等區域中之片段之比例。在成對的威爾科克森符號秩檢驗中,胎兒特異性片段在OCR及CGI區域的片段比例顯著低於母體特異性片段( P值=9.2 E-06)。 3.            SLE
當身體之免疫系統失去自身耐受性且錯誤地攻擊身體自身之細胞或組織時,出現自體免疫疾病。詳言之,全身性紅斑性狼瘡症(SLE)之特徵在於針對雙股DNA(dsDNA)之自體抗體。抗DNA自體抗體之水準與疾病活性相關,且由DNA及抗DNA自體抗體形成之免疫複合體的沈積與狼瘡性腎炎之發展相關(Soni等人,《免疫學之當前觀點( Current Opinion in Immunology)》2018;55:31-37)。先前,吾等已觀測到SLE患者之血漿具有增加比例之短cfDNA,且已展示針對血漿DNA之基因體及表觀遺傳特徵之高解析度分析反映SLE患者之疾病活性(Chan等人,《 美國國家科學院院刊》111, E5302-E5311)。SLE患者之血漿cfDNA可展示可能模擬患有癌症患者之異常基因體表示(拷貝數變化)。在下文中,吾人展示具有異常基因體表示之例示性活動性SLE病例及使用OCR之分析如何可適用於區分此等異常基因體表示與癌症。
29為展示另一組開放染色質區域之表格,其包括轉錄起始位點(TSS)、CCCTC-結合因子(CTCF)位點、DNase1超敏位點(DNaseI)及H3K27ac、H3K4me3及H3K4me1組蛋白標記。人類基因體中各標記之數目係以其對應功能展示。允許此組OCR包含402,660,816 bp,其為基因體之13%。如圖29中所列出,OCR可擴展至TSS、CCCTC結合因子(CTCF)位點、DNase1超敏位點(DNaseI)及H3K27ac、H3K4me3及H3K4me1組蛋白標記。這此組OCR總共包含402,660,816 bp,其藉由包括各區域之側接3000 bp而為13%基因體。此側接區可改變為1000 bp或500 bp,或4000 bp,其中權衡靈敏度及特異性。
在SLE中,尤其活動性SLE,在cfDNA中可觀測到基因體中異常基因體表示( 30)。圖30為展示健康個體(內層)、非活動性SLE患者(中間層)及活動性SLE患者(外層)中之全基因體中1 Mb基因區域中之基因體表示的圈圖。各點表示1 Mb基因區域之基因體表示,且若-3個SD來自健康對照組中之平均基因體表示,則呈紅色,且若+3個SD來自健康對照組中之平均基因體表示,則呈綠色。活動性SLE患者患有具有廣泛發散基因體分佈之cfDNA。
量測基因體表示(MGR)展示於 31中。在各1 Mb基因區域中,計算健康組中片段計數之平均值及標準差。隨後樣本MGR藉由如下z評分計算來計算:自樣本之片段數目(N)除以標準差(SD)減去健康組之平均片段數目(M)。
32展示如何進行所選擇之OCR之生物資訊掩蔽。圖29中之OCR內的片段自健康平均值及SD計算及最終MGR計算排除。OCR以紅色顯示。
33為展示量測之基因體表示(MGR)將如何在生物資訊掩蔽指定的開放染色質區域後變化的圈圖。內環展示在OCR之生物資訊掩蔽之前的各基因區域之MGR,其中存在許多異常基因體表示。在生物學上資訊掩蔽此等OCR之後,異常及基因體表示減少。
此與 34形成對比,其為展示HCC患者之血漿cfDNA樣本中之MGR的圈圖。拷貝數變化亦通常在癌症及圖34中觀測到,吾人可見整個基因體中多個區域中之拷貝數增加(綠色)及損失(紅色)。內環為掩蔽OCR之前的MGR且外環為掩蔽OCR之後的MGR。值得注意地,在掩蔽OR之前或之後MGR及拷貝數畸變不存在明顯改變。
35為在生物資訊掩蔽OCR之前及之後,健康對照、SLE及HCC個體中具有異常MGR(超過+3SD或小於-3SD)之基因區域百分比的盒圖。X軸展示樣本(健康對照、SLE、HCC個體)之來源及樣本是否在OCR掩蔽之前或之後獲取。Y軸展示具有異常MGR之基因區域百分比。雖然在掩蔽健康對照及真陽性HCC情況中之OCR之前及之後不存在異常MGR之比例的顯著變化,但在掩蔽SLE中之此等區域之後異常MGR之比例降低。因此,掩蔽此等OCR及CGI區域可適用於在偵測癌症患者之血漿cfDNA中常常可見之拷貝數變化時減少假陽性。 4.            假定甲基化或未甲基化CpG之覆蓋
先前展示假定甲基化或未甲基化CpG處之末端密度以證明特異性核酸酶在假定甲基化或未甲基化CpG處之切割偏好。自經歷全基因體亞硫酸氫鹽測序之9種人類組織鑑別出假定甲基化或未甲基化CpG,作為路線圖表觀基因體學項目之一部分。在所有組織中≥90%之所有片段中甲基化之CpG位點認為係假定甲基化CpG,在所有組織中≤20%之所有片段中甲基化CpG認為係假定未甲基化CpG。與經鑑別CpG之C或G重疊的片段視為覆蓋CpG且包括於計算覆蓋度中。
36A36B展示覆蓋或8名健康對照(CTR)、17名感染慢性乙型肝炎病毒(HBV)之患者及34名肝細胞癌(HCC)患者之血漿cfDNA中之假定甲基化(圖36A)或未甲基化(圖36B)之片段之比例。Y軸展示覆蓋圖36A中之假定甲基化CpG位點及覆蓋圖36B中之假定未甲基化CpG位點之片段的比例。雖然推定甲基化CpG的覆蓋度沒有顯著差異(P值0.89,威爾卡森秩和檢驗),但與CTR相比,HCC患者血漿cfDNA中假定未甲基化CpG的覆蓋度顯著降低(P值8.4 E-05,威爾卡森秩和檢驗)。
37A37B為展示14名對照、14名非活動性SLE患者及20名活動性SLE患者之血漿cfDNA中覆蓋假定甲基化(圖37A)或未甲基化(圖37B)CpG之片段的比例的盒圖。雖然推定甲基化CpG的覆蓋度沒有顯著差異(P值0.57,威爾卡森秩和檢驗),但與健康對照相比,患有活動性SLE患者之血漿cfDNA中假定未甲基化CpG的覆蓋度顯著降低(P值0.04,威爾卡森秩和檢驗)。
38A38B為展示覆蓋孕婦血漿cfDNA中胎兒特異性與母體特異性片段中假定甲基化或未甲基化CpG之片段的比例的盒圖。假定甲基化CpG之覆蓋度在胎兒特異性片段中顯著低於在母體特異性片段中(P值3.2 E-06,威爾卡森符號秩檢驗)。假定未甲基化CpG之覆蓋度在胎兒特異性片段中與母體特異性片段相比不顯著較低(P值0.06,威爾卡森符號秩檢驗)。 D.           實例方法
方法可包括以不同方式使用甲基化狀態或程度來分析樣本。可僅自特定位點測定甲基化程度。舉例而言,位點可包括所有甲基化或未甲基化CpG位點且可包括或不包括某些區域。可使用全部低甲基化或全部高甲基化之來自某些位點之序列讀段的相對豐度分析樣本。樣本中序列讀段之相對豐度可用於診斷個體或測定樣本中臨床相關DNA之分率濃度。另外,不包括開放染色質區域之區域中確定的拷貝數畸變及使用其他區域確定的拷貝數畸變可用於確定個體是否患有病況。藉由任何方法偵測之病況可藉由本文所描述之任何治療(例如部分III)在個體中治療。 1.            分析生物樣本之甲基化程度
使用某些位點處之甲基化狀態確定之甲基化程度可用於確定生物樣本或獲得生物樣本之個體的各種特徵。所使用之某些位點可為所有甲基化或所有未甲基化之CpG位點。該等位點可包括或不包括OCR或CGI中之位點。甲基化程度可用於偵測與核酸酶有關之基因的遺傳病症,測定血液病症之治療功效,或監測核酸酶活性。偵測與核酸酶有關之基因的遺傳病症。
39展示說明根據本發明之實施例的用於使用個體之包括游離DNA之生物樣本偵測與核酸酶相關之基因的遺傳病症之方法3900的流程圖。方法3900及本文中之其他方法可完全或部分地使用電腦系統來進行。生物樣本可為任何游離DNA樣本,例如如本文所描述。
在框3902處,接收自對個體之第一生物樣本中之第一游離DNA片段進行測序而獲得的第一序列讀段。測序可以例如如本文所描述之各種方式進行。測序可為如本文所描述之靶向測序。舉例而言,生物樣本可富集來自特定區域之DNA片段。富集可包括使用結合至例如如藉由參考基因體所定義之一部分或全基因體的捕獲探針。
序列讀段可指示游離DNA片段位點處之甲基化狀態。舉例而言,如本文所描述,可使用亞硫酸氫鹽轉化來查詢cfDNA片段位點處之甲基化狀態。除亞硫酸氫鹽轉化之外,本領域中熟習此項技術者已知之其他方法亦可用於查詢DNA分子之甲基化狀態,包括(但不限於)對甲基化狀態敏感之酶(例如甲基化敏感限制酶)、甲基化結合蛋白、使用對甲基化狀態敏感之平台之單分子測序(例如奈米孔測序(Schreiber等人,《美國國家科學院院刊》2013;110: 18910-18915)且藉由太平洋生物科學公司單分子即時分析(Tse等人,《美國國家科學院院刊》2021;118: e2019768118)。
在框3904處,序列讀段之甲基化狀態用於確定游離DNA片段之甲基化程度。甲基化程度可使用所有序列讀段或僅滿足某些準則(例如位置或大小)之某些序列讀段確定。甲基化程度可使用複數個位點處之序列讀段確定。位點可具有特定特徵,例如為CpG位點。甲基化程度可自亞硫酸氫鹽處理之後未轉化之胞嘧啶(其對應於甲基化胞嘧啶)之總數確定。舉例而言,在CpG位點,甲基化位點可確定為定位至所關注區域(例如100-kb區域)之序列讀段所覆蓋之所有CpG位點的比例。亦可對具有其他基因區域大小(例如500 bp、5 kb、10 kb、50 kb或1 Mb等)之區域進行此分析。區域可為全基因體或染色體或染色體之一部分(例如染色體臂)。
在框3906處,將游離DNA片段之甲基化程度與參考值進行比較以確定基因在個體中是否展現出遺傳病症的分類。參考值可包含或用於確定截止或臨限值。截止值或臨限值可衍生自表示特定分類或在兩個或兩個以上分類之間進行鑑別之參考值。甲基化程度高於或低於截止值(臨限值)值之個體可歸類為攜帶遺傳病症。截止值可藉由相對於參考值之統計度量(例如,顯著性、P值、Z分數)來定義,例如,使得甲基化程度在統計學上係不同的。替代地,校準值可用作參考值。舉例而言,校準樣本中之cfDNA之甲基化程度(其分類已知)可用於基於游離DNA片段之甲基化程度確定基因在個體中是否展現出遺傳病症之分類。校準樣本可在某些位置、區域或全基因體處具有已知甲基化程度,以及具有已知分類。
如技術人員將瞭解,參考值可以各種方式確定。舉例而言,參考值可由野生型動物或健康人類個體確定。參考值可測定自相同個體獲得之組織特異性樣本或部分樣本(例如獲自血漿但在不同時間或掩蔽(例如OCR或CGI)或樣本之白血球層部分獲得之序列讀段),如例如圖1中所示。舉例而言,在基因體中主要甲基化或未甲基化之位置或區域中存在或程度之甲基化可自關於健康個體或健康個體群體之數據集提取且用作參考值。
參考值可包含複數個截止值或臨限值。甲基化程度可屬於兩個截止值或臨限值,表示遺傳病症之亞型或遺傳病症之進展程度。舉例而言,可確定具有不同已知分類之兩個或多於兩個不同個體群組之甲基化程度,且參考值可選擇為表示一個分類(例如中值)或兩個度量簇之間的值(例如選擇以獲得所期望靈敏度及特異性)。
基於游離DNA片段之甲基化程度與參考值之比較,可使用統計方法或機器學習方法,例如但不限於包括邏輯回歸、支援向量機(SVM)、決策樹、CART演算法(分類及回歸樹)、樸素貝葉斯分類、聚類演算法、主分量分析、單一值分解(SVD)、t-分佈式隨機鄰域嵌入(tSNE)、人工神經網路、構築分類器集合且接著藉由進行其預測之權重投票而對新數據點進行分類的集合方法等。
在一些實施方案中,在確定甲基化程度或分類之前過濾游離DNA片段。例如,僅來自某個區域(例如,轉錄起始位點、RNA聚合酶II位點、H3K4me3標記區域、H3K27ac標記區域或隨機區域)的片段可用於確定甲基化程度或因此對個體中之遺傳疾病進行分類。 a)            確定血液病症之治療功效
40展示說明根據本發明之實施例用於確定患有血液病症之個體之治療功效之方法4000的流程圖。血液病症可包括血栓栓塞事件之傾向性。方法4000之某些框可以類似於方法3900之框的方式執行。
在框4002處,接收自對個體之血液樣本中之游離DNA片段進行測序而獲得的序列讀段。血液樣本係在經投與第一劑量之抗凝血劑的個體之後獲得。抗凝血劑可為肝素。序列讀段可指示游離DNA片段位點處之甲基化狀態。在接收序列讀段之前,可自個體獲得血液樣本。因此,可對血液樣本中之游離DNA片段進行測序以獲得序列讀段。
在框4004處,序列讀段之甲基化狀態用於確定游離DNA片段之甲基化程度。甲基化程度可使用複數個位點處之序列讀段確定。可確定具有所有甲基化或未甲基化CpG位點之游離DNA片段之甲基化程度(例如如圖4中所示)。DNA片段可具有一個或多個CpG位點,且所有可經甲基化或未甲基化。
在框4006處,游離DNA片段之甲基化程度與參考值相比以確定治療功效之分類。第二劑量之抗凝血劑可基於該比較投與個體,該第二劑量大於該第一劑量。在其他實例中,第二劑量可小於第一劑量,例如在該量超過參考值之情況下。治療可包括血液透析、腎臟移植或本文所描述之任何治療。
在一些實施例中,在確定甲基化程度時排除位於開放染色質區域或CpG島中的基因體位點(例如,如圖10及13所示)。參考值可在包括開放染色質區域之位點或CpG島中使用甲基化狀態來確定(例如如圖10及23中所示)。所測定之甲基化程度可對應於甲基化密度低於指定百分比之多個區域。舉例而言,如圖15中所示,可僅在參考基因體中低甲基化之位點中確定甲基化程度。在其他實例中,可測定具有指定大小之游離DNA片段之甲基化程度(例如如圖11及13中所示)。
參考值可對應於先前在投與抗凝血劑之前在個體中進行的量測。來自先前量測之量的改變可指示抗凝血劑劑量之功效。在另一實施方案中,參考值可對應於健康個體中量測之量。有效劑量可為使得該量在健康個體之參考值臨限值內的治療。在又一實施方案中,參考值可對應於在患有血液病症之個體中量測之量(例如如可在投與抗凝血劑之前在個體中預先量測)。舉例而言,參考值可包含野生型動物或健康人類個體。參考值可包含組織特異性樣本或獲自同一個體之部分樣本(例如獲自樣本之血漿或白血球層部分之序列讀段),如例如圖1所示。 b)            監測核酸酶活性
41為說明根據本發明之實施例的用於使用個體之包括游離DNA之生物樣本監測核酸酶之活性之方法4100的流程圖。方法4000之某些框可以類似於方法3900及4000之框的方式執行。
在框4102處,接收個體之生物樣本中之游離DNA片段的序列讀段。序列讀段可指示游離DNA片段位點處之甲基化狀態。接收可類似於框3902或4002。 在框4104處,序列讀段之甲基化狀態用於確定游離DNA片段之甲基化程度。甲基化程度可使用複數個位點處之序列讀段確定。可確定具有所有甲基化或未甲基化CpG位點之游離DNA片段之甲基化程度(例如如圖4A-4C中所示)。
在框4106處,游離DNA片段之甲基化程度係與參考值比較以確定核酸酶活性之分類(例如,如圖1中所示)。一些實施例可用於監測核酸酶活性,例如DFFB、DNASE1及DNASE1L3。此類活性可來自內部核酸酶(亦即,作為身體之天然過程)及/或來自添加核酸酶,例如DNASE1之結果。此類監測可用於判定遺傳病症對於治療功效之變化。舉例而言,DNASE1可用於治療個體。如本文所描述,可藉由使用cfDNA片段分析一個位點或複數個位點處之甲基化程度來量測治療效果或核酸酶活性異常(例如,由於遺傳病症)。在一些實施例中,DNASE1(例如,外源添加的)可用於治療自體免疫病況,諸如SLE。視活性之測定而定,可改變核酸酶之治療劑量。異常核酸酶活性之確定(例如,高於或低於對應於正常/健康值之參考值)可指示單獨或與其他因素組合之病變程度。病變可為癌症。在一些實施例中,分類可為核酸酶活性之數值表示(例如核酸酶活性之量測值)。 2.            區域特異性序列讀段量化
來自某一組CpG位點之序列讀段的比例可用於分析生物樣本。某一組CpG位點可為在參考基因體中均為低甲基化或高甲基化之CpG位點。對於來自具有不同條件水平之個體的樣本及來自具有不同核酸酶活性之個體的樣本,覆蓋此等特定位點之序列讀段的相對豐度可能不同。 a)            分化基因型及表現型
42為說明根據本發明之實施例的用於使用個體之包括游離DNA之生物樣本監測核酸酶之活性之方法4200的流程圖。如本文所描述之生物樣本(例如全血、血漿等)可獲自個體且可執行血液樣本中之游離DNA片段之測序以獲得序列讀段。方法4200之某些框可以與其他方法之框類似之方式執行。
在框4202處,可以識別參考基因體中全部低甲基化或全部高甲基化之第一組CpG位點。參考基因體可獲自健康個體或健康個體群體。參考基因體可含有主要(或假定)未甲基化或主要甲基化之區域。參考基因體中之甲基化程度可與第一臨限值相比。低於第一臨限值之甲基化程度可指示低甲基化位點(例如圖15A,可將第一臨限值設定為低於野生型之中值甲基化程度)。在其他實施例中,參考基因體中之甲基化程度可與第二臨限值相比。高於第二臨限值之甲基化程度可指示高甲基化位點(例如圖15B,第二臨限值可設定為高於野生型之中值甲基化程度)。該臨限值可為本文中所描述之任何臨限值。未攜帶遺傳病症或所關注疾病之個體可視為健康個體。
在框4204處,接收自對個體之生物樣本中之游離DNA片段進行測序而獲得的序列讀段。框4204可與框3902中所描述類似之方式進行。
在框4206處,將序列讀段與參考基因體進行排比以確定參考基因體中對應於游離DNA片段之基因體位置。舉例而言,可使用各種排比工具,諸如BLAST、BOWTIE或SOAP中之任一者將全DNA片段之序列讀段(或來自末端之一對讀段,或僅來自一端之一個讀段)與參考基因體(例如,hg19或其他參考)進行排比。作為排比之一部分,可確定DNA片段之至少一個末端的座標。以此方式,可確定僅末端位置或由DNA片段覆蓋之任何位置的覆蓋度(讀段/片段之數目)。因此,參考基因體中之基因體位置可對應於一個或多個cfDNA片段之一端或對應於一個或多個cfDNA片段之其他部分。
在框4208處,藉由使用排比序列讀段確定覆蓋第一組CpG位點之游離DNA片段的相對豐度。可以各種方式測定相對豐度。例如,相對豐度可包含參考基因體中可能經cfDNA片段覆蓋之推定甲基化(或高甲基化)或未甲基化(或低甲基化)CpG位點之百分比(例如如圖8、圖27A、或圖27B中所示)。在另一實施例中,在涉及與核酸酶活性相關之遺傳病症的病況下,相對豐度可包含標準化末端密度,如本文所描述(例如如圖6A-6E中所示)。
在框4210處,隨後將相對豐度與參考值進行比較以確定個體之病況等級。參考值可包含使用來自健康個體之生物樣本之序列讀段確定的豐度水準。覆蓋定位至第一組CpG位點中之CpG位點之位置的cfDNA片段的相對豐度可與相對豐度之參考值不同(例如顯著較低或顯著較高)。所觀測到之差異可用於確定個體之病況的等級或分類。該病況可包含酶缺陷。該病況可包含癌症(例如如圖27A及27B及圖36A及36B中所示)。該病況可為自體免疫疾病。該病況可由遺傳病症引起。展現遺傳病症之基因可能與核酸酶相關(例如如圖6A-6E及8中所示)。該病況可包含自體免疫疾病(例如如圖37A及37B中所示)。 b)            監測核酸酶活性
43為說明根據本發明之實施例的用於使用個體之包括游離DNA之生物樣本監測核酸酶之活性之方法4300的流程圖。如本文所描述之生物樣本(例如全血、血漿等)可獲自個體且可執行樣本中之游離DNA片段之測序以獲得序列讀段。方法4300之某些框可以與其他方法之框類似之方式執行。
在框4302處,可以識別參考基因體中全部低甲基化或全部高甲基化之第一組CpG位點。參考基因體可獲自健康個體或健康個體群體。參考基因體可含有主要未甲基化或主要甲基化之CpG位點。未攜帶遺傳病症或所關注疾病之個體可視為健康個體。框4302可以與框4202類似之方式進行。
在框4304處,接收自對個體之生物樣本中之游離DNA片段進行測序而獲得的序列讀段。
在框4306處,將序列讀段與參考基因體進行排比以確定參考基因體中對應於游離DNA片段之基因體位置。框4306可以與框4206類似之方式進行。 在框4308處,覆蓋第一組CpG位點之游離DNA片段之相對豐度係藉由使用排比序列讀段確定,如框4208中所描述。相對豐度可為相對於所分析之DNA分子之數目標準化的覆蓋第一組CpG位點之DNA分子的數目。
在另一實例中,相對豐度可為覆蓋位點(例如OCR或CGI)之cfDNA片段的百分比,如例如圖22中所示。在另一實施例中,游離DNA片段之相對豐度可為第一組CpG位點處之游離DNA片段之大小分佈的統計值(例如如圖7中所示)。統計值可為覆蓋第一組CpG位點之游離DNA片段之第一量相對於覆蓋第一組CpG位點之游離DNA片段之第二量的大小比率,該第一組CpG位點具有第二大小。
相對豐度可為覆蓋第一組CpG位點之序列讀段的末端密度。獲自個體之生物樣本可含有更大或更少在CpG位點處酶裂解之cfDNA片段,該等cfDNA片段主要為高甲基化、低甲基化或未甲基化的。
可測定具有指定大小之游離DNA片段之游離DNA片段之相對豐度(例如如圖12中所示)。指定大小可包含5個鹼基對(bp)、10 bp、50 bp、100 bp、200 bp、500 bp、1000 bp或更多個bp或其間的其他大小。指定大小可為大小範圍。舉例而言,指定大小可包含約5-100 bp、70-150 bp、50-500 bp、5-50 bp、約100-500 bp、約100-1000 bp或其他範圍之範圍。
在框4310處,隨後將相對豐度與參考值進行比較以確定酶活性之第一分類。參考值可包含使用來自健康個體之生物樣本之序列讀段確定的豐度水準。酶(例如核酸酶,諸如DFFB、DNASE1或DNASE1L3)之活性可經分類且用於確定遺傳病症或用於如4104中所描述之遺傳病症之治療功效的變化。病況等級可至少部分地基於遺傳病症確定,其中基因與核酸酶相關(例如如圖6A-6E及8中所示)。異常酶活性(例如高於或低於對應於正常/健康值之參考值)之測定可指示單獨或與其他因素組合之病變等級。病變可為癌症。 3.            分率濃度
44為說明根據本發明之實施例用於估測個體之生物樣本中之臨床相關DNA分子之分率濃度的方法4400之流程圖。生物樣本可包括來自複數種組織類型之游離DNA分子之混合物。舉例而言,生物樣本可自包含母體cfDNA分子及胎兒cfDNA分子之孕婦獲得(例如如圖28及圖38A及38B中所示)。生物樣本可包含腫瘤特異性cfDNA分子以及其他組織特異性cfDNA分子。臨床相關DNA分子可包含胎兒DNA。在其他實施例中,臨床相關DNA可為腫瘤DNA或移植DNA。方法4400之某些框可以與其他方法之框類似之方式執行。
在框4402處,可以識別參考基因體中全部低甲基化或全部高甲基化之第一組CpG位點。參考基因體可獲自健康個體或健康個體群體及/或非懷孕個體。參考基因體可含有主要未甲基化或主要甲基化之位置或區域。未攜帶遺傳病症或所關注疾病之個體可視為健康個體。位點可如框4202所描述來鑑別。
在框4404處,接收自對個體之生物樣本中之游離DNA片段進行測序而獲得的序列讀段。
在框4406處,將序列讀段與參考基因體進行排比以確定參考基因體中對應於游離DNA片段之基因體位置。框4406可以與框4206類似之方式進行。
在框4408處,藉由使用排比序列讀段確定覆蓋第一組CpG位點之游離DNA片段的相對豐度。相對豐度可包含覆蓋假定甲基化或未甲基化位點(例如OCR或CpG(或CGI)位點)之片段的百分比(例如如圖28或圖38A及38B中所示)。
在框4410處,可藉由將相對豐度與由臨床相關DNA分子之分率濃度已知之一個或多個校準樣本確定之一個或多個校準值進行比較來估測生物樣本中臨床相關DNA分子之分率濃度。如圖28及圖38A及38B中所示,胎兒及母體DNA具有相對豐度之差異。具有兩者之混合物的樣本將具有取決於樣本中胎兒/母體DNA之比例的相對豐度。校準樣本之分率濃度可以其他方式測定,例如使用男性胎兒或胎兒特異性標記(例如,自父親遺傳之對偶基因或胎兒特異性表觀遺傳標記)在Y染色體上之基因座。
校準數據點可包括臨床相關DNA之相對豐度及量測/已知分數。該比較可涉及與校準曲線(由校準數據點構成)比較,且因此該比較可鑑別具有量測之測試樣本之相對豐度的曲線上之點。對應於所鑑別點之分率濃度可隨後用於估測分率濃度。舉例而言,相對豐度可提供為校準函數之輸入(例如線性或非線性擬合)以獲得分率濃度之輸出。 4.            確定條件
45為說明根據本發明之實施例的用於使用個體之包括游離DNA之生物樣本監測核酸酶之活性之方法4500的流程圖。方法4500之某些框可以與其他方法之框類似之方式執行。
在框4502處,接收自對個體之血液樣本中之游離DNA片段進行測序而獲得的序列讀段。如本文所描述之生物樣本(例如全血、血漿等)可獲自個體且可執行樣本中之游離DNA片段之測序以獲得序列讀段。
在框4504處,使用序列讀段確定參考基因體中對應於游離DNA片段之至少一個末端的基因體位置。
在框4506處,確定複數個區段中之每一區段中之序列讀段的第一量。舉例而言,參考基因體可劃分成具有特定大小之區段(或基因區域)。作為實例,區段或基因區域大小可為約10 kb、50 kb、100 kb、500 kb、1 Mb或更大。區段大小可在此處提及之任何兩個大小之間。可確定對應於區段之序列讀段的頻率或拷貝數。在其他實施例中,該量可為彼區段之DNA片段之大小分佈的統計值。亦可使用其他特性,例如區域之甲基化程度。
在框4508處,將第一量與第一參考值進行比較以確定片段是否存在拷貝數畸變。參考值可包含自健康個體獲得的與各區段相對應的序列讀段的量。在一片段中,獲自個體之樣本之序列讀段之量與參考值之間的差異可表示拷貝數畸變。舉例而言,可使用量測基因體表示(例如如圖31-圖35中所示)。
在框4510處,確定存在拷貝數畸變之第一區段數目。對於複數個區段,可重複框4506及4508中提及之過程以確定存在拷貝數畸變之第一區段數目。
在框4512處,經掩蔽以排除開放染色質區域之複數個區段之每一遮蔽區段中的第二量之序列讀段。掩蔽可包含電腦模擬掩蔽(例如使用生物資訊方法排除區段)。某些區域可經掩蔽,例如如圖29中所示。
在框4514處,將第二量與第二參考值進行比較以確定掩蔽區段是否存在拷貝數畸變。第二參考值可包含獲自健康個體之在掩蔽區段中之序列讀段的量。獲自個體之掩蔽區段之讀段量與參考值(對於相同區段)的差異可用於確定拷貝數畸變。
在框4516處,可針對一個或多個掩蔽區段重複框4510及4512中描述之步驟以確定具有拷貝數畸變的掩蔽片段之第二數目。因此,可使用本文所描述之在掩蔽之前及之後量測之基因體表示(例如如圖31-圖35中所示)。
在框4518處,至少基於第一數目及第二數目確定個體之病況。第一數目及第二數目可以多種方式使用。舉例而言,可執行兩個數目之間的差異及/或個別數目之分析。舉例而言,可進行以下初始分類:病況使用第一數目存在(例如自體免疫或癌症存在),例如使用幾個百分比之擴增之截止值(例如3或5%)。隨後,第二數目可用於確定特定病況類型,例如其是否為自體免疫或癌症,例如截止值約25%可區分SLE與癌症。因此,病況可為自體免疫疾病,例如SLE。舉例而言,在掩蔽之前(如框4504-4510處所描述)及在掩蔽之後(如框4512-4516處所描述)確定之具有異常MGR之基因區域之百分比可用於確定個體之病況(例如SLE或HCC)。 II.          核酸酶對染色體外環狀DNA之作用
游離DNA(cfDNA)分子以線性或環狀形式存在於血漿中(T. Paulsen、P. Kumar、M. M. Koseoglu、A. Dutta,《在正常及腫瘤細胞中發現DNA染色體外環(Discoveries of Extrachromosomal Circles of DNA in Normal and Tumor Cells)》。《趨勢基因( Trends Genet.)》。 34, 270-278 (2018), Y. M. D. Lo, D. S. C. Han, P. Jiang, R. W. K. Chiu,《液體活檢中游離DNA之表觀遺傳學、片段組學及拓樸結構(Epigenetics, fragmentomics, and topology of cell-free DNA in liquid biopsies)》。《科學》(80-。)。372, eaaw3616 (2021))。某些來源於組織之線粒體基因體子組在血漿中展現為環狀形式(M. -J.L. Ma等人,《對血漿粒線體DNA之拓樸分析揭露線性及環狀分子兩者之共存(Topologic Analysis of Plasma Mitochondrial DNA Reveals the Coexistence of Both Linear and Circular Molecules)》。《臨床化學(Clin. Chem.)》,《臨床化學》2019.308122 (2019))。另外,在懷孕女性、正常個體及患有癌症之患者之血漿中亦可偵測游離染色體外環狀DNA(eccDNA),儘管豐度低於其線性對應物(S. T. K. Sin等人,《母體血漿中染色體外環狀DNA之鑑別及表徵(Identification and characterization of extrachromosomal circular DNA in maternal plasma)》《美國科學院院刊》117, 1658-1665 (2020), J. Zhu等人,《人類血漿中之游離eccDNA之分子表徵(Molecular characterization of cell-free eccDNAs in human plasma)》。《科學代表(Sci. Rep.)》7, 10968 (2017), P. Kumar等人,《正常及癌性組織將染色體外環狀DNA(eccDNA)釋放至循環中(Normal and Cancerous Tissues Release Extrachromosomal Circular DNA (eccDNA) into the Circulation)》。《癌症分子研究(Mol. Cancer Res.)》15, 1197-1205 (2017))。
與在166-bp處存在一個主要峰的線性cfDNA相比,血漿中eccDNA之大小分佈展現兩個主要峰簇,頂點在202-及338-bp左右,且在兩個簇內具有急劇的10-bp週期性,反映了可能涉及核小體結構(Sin等人, PNAS(2020))。標準特異性eccDNA分子在孕婦之母體血漿中可偵測到,其相比母體血漿較短且較少甲基化(Sin等人, PNAS(2020)), S. T. K. Sin等人,《母體血漿中胎兒染色體外環狀DNA之特徵:甲基化狀態及清除率(Characteristics of Fetal Extrachromosomal Circular DNA in Maternal Plasma: Methylation Status and Clearance)》。《臨床化學》,67(2021))。因此,eccDNA分子之生物特性可能取決於其組織來源。
線性cfDNA之片段化為非隨機過程。多線證據表明,此類片段化模式可與各種核酸酶之活性有關(D. S. C. Han、Y. M. D. Lo,《cfDNA及核糖核酸酶生物學之連接(The Nexus of cfDNA and Nuclease Biology)》《趨勢基因》0(2021))。舉例而言,已報導去氧核糖核酸酶1樣3(DNASE1L3)有助於游離DNA片段化且優先產生在小鼠及人類(Serpas等人, PNAS(2019),R. W. Y. Chan等人,《與DNASE1L3基因突變相關之血漿DNA剖析:臨床觀測、核酸酶底物偏好及活體內校正之關係(Plasma DNA Profile Associated with DNASE1L3Gene Mutations : Clinical Observations , Relationships to Nuclease Substrate Preference , and In Vivo Correction)》《美國人類遺傳學雜誌(Am. J. Hum. Genet.)》1-13(2020))。Han等人系統研究去氧核糖核酸酶1(DNASE1)、DNASE1L3及DNA片段化因子亞基β(DFFB)對游離DNA片段化之作用,且發現此等酶在細胞凋亡中逐步作用於DNA降解(D. S. C. Han等人,DNASE1、DNASE1L3及DFFB之游離DNA片段化及作用的生物學(The Biology of Cell-free DNA Fragmentation and the Roles of DNASE1, DNASE1L3, and DFFB)》《美國人類遺傳學雜誌》106, 202-214(2020))。另外,在具有Dnase1l3及Dffb雙缺失之小鼠中偵測不到片段化cfDNA(T. Watanabe、S. Takada、R. Mizuta,《血液循環中之游離DNA由DNase1L3及凋亡蛋白酶活化之DNase(Cell-free DNA in blood circulation is generated by DNase1L3 and caspase-activated DNase)》《生化與生理研究通訊(Biochem. Biophys. Res. Commun.)》516, 790-795(2019))。因此重要的係發現某些核酸酶是否亦可在血漿中之eccDNA之產生及/或降解中起作用。
在本文中,基因敲除小鼠模型用於探索DNASE1L3及DNASE1等核酸酶是否會影響血漿eccDNA之生物學特性。藉由比較核酸酶缺陷之小鼠中血漿與組織eccDNA之間的eccDNA大小變化程度,分析此等核酸酶以細胞內或細胞外方式作用於eccDNA之能力。此外,藉由應用小鼠懷孕模型,檢驗細胞外DNASE1L3對游離eccDNA之作用。藉由比較DNASE1L3突變患者與健康對照之間的游離eccDNA剖析提供對人類中之eccDNA之核酸酶作用的其他證據。
總體而言,Dnase1l3缺失可延長血漿中之eccDNA。小鼠組織之EccDNA大小剖析似乎不受 Dnase1l3缺失影響,表明游離eccDNA由DNASE1L3之大小改變可與降解而非eccDNA之產生相關。藉由來自小鼠懷孕模型之數據進一步突出顯示此類機制洞察:由胎兒釋放之細胞外DNASE1L3可消化母體游離eccDNA。值得注意地,具有 DNASE1L3缺陷之人類個體展現的大小分佈比健康對照長,此與 Dnase1l3缺陷小鼠之作用一致。本文所提供之方法可以使用游離eccDNA作為針對 DNASE1L3缺陷相關疾病,諸如全身性紅斑狼瘡及某些類型之癌症之生物標記。實驗設計、材料及方法及結果更詳細地描述於本文中。 A.            實驗設計及結果
基因敲除小鼠模型用於研究去氧核糖核酸酶1(DNASE1)及去氧核糖核酸酶1樣3(DNASE1L3)對血漿染色體外環狀DNA(eccDNA)之特徵的影響。發現當與野生型小鼠相比時, Dnase1l3 −/− 小鼠中血漿eccDNA計數升高,在 Dnase1 −/− 小鼠中未觀測到顯著變化。 Dnase1l3 −/− 小鼠中游離eccDNA展現的大小分佈大於野生型小鼠的大小分佈。值得注意的係,此類大小改變未發現於 Dnase1 −/− Dnase1l3 −/− 小鼠之組織eccDNA中。此等數據表明DNASE1L3可細胞外消化游離eccDNA。細胞內eccDNA可以低於游離eccDNA之速率消化。此可部分歸因於細胞外eccDNA與細胞內eccDNA相比之可及性。小鼠懷孕模型中之剖析血漿eccDNA展示,在懷有 Dnase1l3 +/− 胎兒之 Dnase1l3 −/− 小鼠中,母體血漿中之eccDNA相比於懷有 Dnase1l3 −/− 胎兒之 Dnase1l3 −/− 小鼠而言縮短。因此,自 Dnase1l3 +/− 胎兒釋放至母體血液循環中之DNASE1L3可具有全身活性。此懷孕模型強調循環DNASE1L3可以細胞外部方式降解母體eccDNA分子。此外,具有 DNASE1L3功能損失型突變之人類個體中的血漿eccDNA亦展現與對照個體(例如健康個體)相比更長的大小分佈。 1.            研究設計
46說明此研究之概念設計之示意圖。研究核酸酶(例如DNASE1及DNASE1L3)是否會對關於量及大小分佈之eccDNA特徵具有任何作用。首先,在4601階段,鑑別來自野生型小鼠4603、 Dnase1 −/−小鼠4605及 Dnase1l3 −/−小鼠4607之血漿eccDNA分子。比較此等三組小鼠中之eccDNA之標準化計數及大小剖析。其次,在階段4610,為探究核酸酶是否作用於活細胞內部之eccDNA分子、來自兩個組織類型中之三組小鼠之細胞eccDNA:對肝臟及白血球層進行剖析。此類比較係在三組小鼠中之血漿及組織(肝臟及白血球層)eccDNA中進行,以闡明在細胞外或細胞內對eccDNA(若存在)之核酸酶作用。為進一步查詢核酸酶對eccDNA之細胞外作用,應用懷孕模型4620以檢驗異種接合( Dnase1l3+/−)胎兒所釋放之DNASE1L3是否對具有野生型胎兒4623之野生型小鼠、具有同型接合胎兒4625之 Dnase1l3 −/− 小鼠及具有異型接合胎兒4627之 Dnase1l3 −/− 小鼠之母體血漿中之游離eccDNA具有任何影響。最後,在階段4630,藉由比較健康對照4632與患有DNASE1L3功能損失型突變4635之個體之間的eccDNA特徵,進一步評估核酸酶對游離eccDNA之作用。 2.            小鼠血漿中eccDNA之量
eccDNA之頻率或量可指示基因是否展現遺傳病症。中值為17,463,304個雙邊讀段(範圍:11,845,852-27,836,098)之血漿eccDNA庫使用如先前所描述之基於標籤之eccDNA庫製備方案(4)進行測序,且鑑別中值為15,337個eccDNA基因座(範圍:3,309-94,248)。 47展示三組小鼠中鑑別之血漿eccDNA分子之量的圖。x軸上呈現之三組小鼠包括12隻野生型(WT)小鼠(最接近y軸線之圖左側的群組)、11隻 Dnase1 −/− 小鼠(中間群組)及11隻 Dnase1l3 −/− 小鼠(圖右側的群組)。y軸上所示之量藉由各樣本之可定位讀段之數目標準化,表示為百萬可定位讀段(EPM)值之eccDNA。Dnase1l3 −/−小鼠之EPM值顯著高於(中值:12,206;範圍:1,241-40,897)野生型小鼠之EPM值(中值:3,056;範圍:1,404-6,952)(P=0.04,克拉斯卡-瓦立斯檢驗(Kruskal-Wallis test))。在野生型與 Dnase1 −/− 小鼠之間未觀測到統計顯著差異。野生型及Dnase1 −/−小鼠之間缺乏統計顯著差異可為其他核酸酶在消化所存在DNA分子中具有與DNASE1類似的作用的結果。圖47展示eccDNA之頻率或量可以用於確定基因是否展現遺傳病症。 3.            小鼠血漿中之EccDNA大小分佈
eccDNA之大小分佈可以區分具有或不具有某些核酸酶缺陷之生物體。根據小鼠基因型將血漿eccDNA分子混合至三組中。其大小頻率(Y軸)繪製於 48A-48C中,其中eccDNA片段大小展示於X軸上。所有三組小鼠之血漿eccDNA展示雙峰大小分佈,其中頂點在約200 bp(第1峰簇)及350 bp(第2峰簇)。與野生型小鼠相比, Dnase1l3 −/− 小鼠展示第1峰簇減少(150-250 bp)及第2峰簇增強(300-450 bp)。然而,在 Dnase1 −/− 與野生型小鼠之間未觀測到此類差異。計算三個組小鼠之兩個峰簇之大小剖面曲線下面積(AUC)的值。
48D繪製三個組小鼠(X軸)之AUC比率(第2峰簇:第1峰簇)(Y軸)。圖48A-48D展示Dnase1l3 −/−小鼠的AUC比率顯著高於野生型及Dnase1 −/−小鼠。AUC比率以較佳展示eccDNA之整體大小分佈特徵之方式計算。AUC比率愈高,eccDNA之整體大小愈長。舉例而言, Dnase1l3 −/− 群組之AUC比率大於一,而野生型及 Dnase1 −/− 之AUC比率小於一。 Dnase1l3 −/− 群組的大小在統計上比其他兩個群組長。
48E說明確定第一峰簇4810及第二峰簇4820之AUC值的實例。圖48E展示X軸上鹼基對中eccDNA片段大小之大小。各片段大小之頻率展示於Y軸中。強調各峰值簇下之面積。曲線可經整合以確定各峰簇之曲線下面積。如圖48D中所示,可計算面積之比率。
48F展示三個組小鼠(野生型「WT」、 Dnase1 −/− Dnase1l3 −/− )之第1峰簇之AUC值(150-250 bp)及第2峰簇(300-450 bp)。X軸展示兩個峰簇。y軸展示AUC。在每一峰簇圖中,來自野生型組之數據展示於左側, Dnase1 −/− 小組展示於中間,且 Dnase1l3 −/− 小組展示於右側。圖48F展示Dnase1l3 −/−小鼠之第1峰簇減少及第2峰簇增強(AUC 1 峰簇:中值30.3%,範圍19.0-54.6%;AUC 2 峰簇:中值58.9%,範圍40.4-67.7%),其與野生型小鼠相比具有統計學意義(AUC 1 峰簇:中值77.9%,範圍62.7-88.1%;AUC 2 峰簇:中值12.8%,範圍8.9-28.5%)( P 1 峰簇< 0.0001, P 2 峰簇< 0.0001;克拉斯卡-瓦立斯檢驗)。
總之,此等數據指示 Dnase1l3 −/− 小鼠之血漿eccDNA分子比野生型及 Dnase1 −/− 小鼠之血漿eccDNA分子長。此等圖展示血漿eccDNA分子之大小分佈可用於區分具有某些核酸酶缺陷之小鼠與不具有核酸酶缺陷之小鼠。 4.            小鼠組織中之EccDNA大小分佈
為了探究血漿eccDNA在上述小鼠之不同基因型之間的大小差異是否發生在細胞內或細胞外,將自肝提取之eccDNA及自野生型、 Dnase1 −/− Dnase1l3 −/− 小鼠收集之白血球層剖析。並行應用組織eccDNA鑑別之兩種方法:基於標籤之方法及基於滾環擴增(RCA)之方法。收集組織eccDNA分子以根據小鼠基因型及組織類型進行大小剖析。在血漿中之不同基因型中但在組織中未觀測到EccDNA大小差異。
49A-49F展示來自標籤方法之大小剖析結果。X軸展示片段之大小。Y軸展示頻率。在5隻野生型小鼠(圖49A)、5隻 Dnase1 −/− 小鼠(圖49B)及5隻 Dnase1l3 −/− 小鼠(圖49C)中分析肝臟eccDNA。在6隻野生型小鼠(圖49D)、4隻 Dnase1 −/− 小鼠(圖49E)及5隻 Dnase1l3 −/− 小鼠(圖49F)中分析白血球層eccDNA。自肝臟及白血球層組織中分別鑑別出中值為3,051(範圍:1,633-29,176)及4,217(範圍:1,952-10,034)之eccDNA分子。
49G使用標籤化方法展示針對三組(野生型、 Dnase1 −/− Dnase1l3 −/− 小鼠)之肝臟eccDNA的AUC比率。X軸展示群組。Y軸展示AUC比率,其為第2峰簇(300-450 bp)面積除以第1峰簇(150-250 bp)面積。在三組小鼠中,在肝臟eccDNA中未偵測到AUC比率之統計顯著差異( P=0.45,克拉斯卡-瓦立斯檢驗)。
49H展示使用標籤化方法針對三組(野生型、 Dnase1 −/− Dnase1l3 −/− 小鼠)之白血球層eccDNA的AUC比率。X軸展示群組。Y軸展示AUC比率,其為第2峰簇(300-450 bp)面積除以第1峰簇(150-250 bp)面積。類似於肝臟樣本,白血球層樣本中未偵測到AUC比率之統計顯著差異( P=0.10,克拉斯卡-瓦立斯檢驗)。
50A-50F展示來自RCA方法之大小剖析結果。X軸展示片段之大小。Y軸展示頻率。在5隻野生型小鼠(圖50A)、5隻 Dnase1 −/− 小鼠(圖50B)及5隻 Dnase1l3 −/− 小鼠(圖50C)中分析肝eccDNA。在6隻野生型小鼠(圖50D)、4隻Dnase1 −/−小鼠(圖50E)及5隻Dnase1l3 −/−小鼠(圖50F)中分析白血球層eccDNA,其中分別自肝臟及白血球層組織鑑別eccDNA分子之中值為10,402(範圍:4,355-42,473)及12,490(範圍:6,260-43,288)。
50G展示針對RCA方法三組(野生型、 Dnase1 −/− Dnase1l3 −/− 小鼠)之肝eccDNA的AUC比率。X軸展示群組。Y軸展示AUC比率,其為第2峰簇(300-450 bp)面積除以第1峰簇(150-250 bp)面積。在三組小鼠中,在肝臟eccDNA中未偵測到AUC比率之統計顯著差異( P=0.93,克拉斯卡-瓦立斯檢驗)。
50H展示針對RCA方法三組(野生型、 Dnase1 −/− Dnase1l3 −/− 小鼠)之白血球層eccDNA的AUC比率。X軸展示群組。Y軸展示AUC比率,其為第2峰簇(300-450 bp)面積除以第1峰簇(150-250 bp)面積。宛如肝臟樣本,白血球層樣本中未偵測到AUC比率之統計顯著差異( P=0.93,克拉斯卡-瓦立斯檢驗)。
對於標籤化及RCA方法兩者,彙集各組織類型中鑑別之eccDNA用於小鼠之各基因型及剖析大小。來源於此等組織之eccDNA分子皆顯示雙峰大小分佈,其中兩個頂點在約200 bp及350 bp處。值得注意的係,肝臟eccDNA之兩個峰簇比白血球層eccDNA之彼等峰簇更陡。10-bp週期性振盪在肝臟eccDNA中亦顯而易見(使人聯想血漿eccDNA模式),但在白血球層eccDNA中相對模糊。此類變化可能暗示eccDNA之特徵可能取決於其來源組織。對於肝臟或白血球層,在野生型、 Dnase1 −/− Dnase1l3 −/− 小鼠中可觀測到eccDNA大小分佈無明顯差異。
結果表明,在血漿中觀測到基因型之間的eccDNA大小差異,但在組織中未觀測到,這表明DNASE1L3對細胞內eccDNA之影響可能不顯著。相比之下,此酶可能夠在此等分子釋放至血液循環中之後作用於eccDNA。 5.            Dnase1l3 −/−小鼠懷孕模型
為了驗證野生型及 Dnase1l3 −/− 小鼠之間在血漿中觀測到的eccDNA大小差異係由於細胞外DNASE1L3影響的假設,採用 Dnase1l3 −/− 小鼠懷孕模型。在此模型中,使具有或不具有Dnase1l3缺陷之C57BL/6(B6)品系之雌性小鼠與來自BALB/c基因體背景之野生型小鼠雜交。因此,產生三個交配組:(1)懷有野生型胎兒之野生型雌性;(2)懷有 Dnase1l3 −/− 胎兒之Dnase1l3 −/−雌性;(3)懷有 Dnase1l3 +/− (異型接合)胎兒之 Dnase1l3 −/− 雌性。B6與BALB/c品系之間的基因體差異亦可用於區分胎兒特異性分子與母親及胎兒共有之分子(亦即,共有分子)(參見材料及方法中之細節)。結果展示由胎兒釋放之DNASE1L3可在母體血漿中消化eccDNA。
51展示母體血漿中小鼠懷孕樣本及其各別eccDNA胎兒部分之資訊。圖中之小鼠懷孕樣本對於小鼠及胎兒具有不同 Dnase1l3基因型。針對eccDNA大小及不同基因型之量分析樣本。圖51之第一行係小鼠ID。第二至第五行包括配對對的資訊。第二行為雌性之 Dnase1l3基因型。第三行列出雌性之品系。第四行為雄性之 Dnase1l3基因型。第五行列出雄性之品系。第六行列出以週為單位之母體年齡。第七行係懷孕之天數。八至第十行提供胎兒之資訊。第八行係胎兒之數目。第九行係胎兒之 Dnase1l3基因型。第十行列出胎兒之品系。第十一行包括所偵測之總eccDNA片段。第十二及第十三行提供關於覆蓋資訊性SNP之eccDNA之資訊。第十四行列出覆蓋胎兒與母親之間共享之資訊性SNP之eccDNA的數目。第十五行列出覆蓋胎兒特異性SNP之eccDNA之數目。第十六行包括胎兒eccDNA部分。中值胎兒eccDNA分數為25.8%(範圍:16.5%-46.6%)。
52A-52C標繪三組懷孕小鼠中總血漿eccDNA之平均大小分佈。針對攜帶野生型胎兒之野生型雌性(圖52A)、攜帶 Dnase1l3 −/− 胎兒之 Dnase1l3 −/− 雌性(圖52B)及攜帶 Dnase1l3 +/− 胎兒之 Dnase1l3 −/− 雌性(圖52C)之母體血漿中eccDNA之平均大小分佈作圖。eccDNA片段大小展示於X軸上。頻率展示於Y軸上。針對各峰簇標記AUC值,且相應地計算AUC比率。針對攜帶野生型胎兒之野生型雌性(圖52A),血漿eccDNA展示高第1峰簇(AUC=67.8%)及相對較低第2峰簇(AUC=29.1%),其中AUC比率為0.43。另一方面,針對攜帶 Dnase1l3 −/− 胎兒之 Dnase1l3 −/− 雌性(圖52B),血漿eccDNA展示低第1峰簇(AUC=21.4%)及較高第2峰簇(AUC=68.3%),其中AUC比率為3.18。因此,與攜帶野生型胎兒之野生型小鼠相比,懷有 Dnase1l3 −/− 胎兒之 Dnase1l3 −/− 雌性具有較長血漿eccDNA。此符合非懷孕野生型與 Dnase1l3 −/− 小鼠之間所觀測到之eccDNA大小差異(圖48A與圖48C)。然而,針對攜帶 Dnase1l3 +/− (異型接合)胎兒之 Dnase1l3 −/− 雌性(圖52C),血漿eccDNA大小展示將 Dnase1l3 −/− 表現型部分逆轉至野生型表現型,其中兩個AUC值(AUC 1 峰簇=30.6%;AUC 2 峰簇=60.8%)及AUC比率(1.99)屬於前兩組懷孕小鼠之間。圖52A-52C表明胎兒釋放之DNASE1L3在母體循環中之eccDNA分子上存在全身作用,縮短其尺寸。
52D展示與胎兒eccDNA分開彙集之母體eccDNA的大小剖析。 52E展示與母體eccDNA分開彙集之胎兒eccDNA的大小剖析。eccDNA片段大小展示於X軸上,且頻率展示於Y軸上。在懷有 Dnase1l3 +/− 胎兒之 Dnase1l3 −/− 小鼠之血漿中未觀測到胎兒eccDNA比母體eccDNA(共有分子)短,這表明DNASE1L3對eccDNA消化的局部影響可能不如先前所報導的,其可能在線性cfDNA上(Serpas等人, PNAS(2019))。圖展示胎兒釋放之DNASE1L3可在母體血漿中消化eccDNA。 6.            患有缺陷DNASE1L3之人類個體
在患有DNASE1L3功能損失型突變(亦即, DNASE1L3 −/− )之患者中進一步研究 DNASE1L3缺陷對血漿eccDNA之影響。此等個體之詳細樣本資訊描述於材料及方法中。 53A53B分別對健康人類個體及DNASE1L3突變患者之血漿eccDNA的平均大小分佈作圖。eccDNA片段大小展示於X軸上,且頻率展示於Y軸上。自收集自4位健康人類個體之血漿樣本彙集之eccDNA之大小剖析(圖53A)。自3個具有 DNASE1L3之功能損失型突變之人類個體收集之4個血漿樣本彙集eccDNA之大小剖析(圖53B);在血液透析前與血液透析後時間點自同一個體收集此等樣本中之兩個。血液透析前獲取之樣本與血液透析後獲取之樣本之間未發現差異。當相比於健康對照時,DNASE1L3突變體展示較低的第1峰簇,反映此等患者中之小eccDNA之頻率降低。與小鼠中之結果類似,人類之結果表明人類中之 DNASE1L3缺陷會導致血漿中更長的eccDNA。
53C比較健康對照與 DNASE1L3突變之個體之間的AUC比率。個體組展示於X軸上。AUC比率展示於Y軸上。在圖53C中,圓點表示在單個時間點自各個體收集樣本;三角形8210及正方形8220分別表示在血液透析前及血液透析後時間點自同一患者收集之樣本。具有 DNASE1L3突變之個體展現比健康個體顯著更高的AUC比率( P=0.03,威爾卡森秩和檢驗)。
54A54H展示圖53A至53C中之此等個體的個別大小剖析。eccDNA片段大小展示於X軸上,且頻率展示於Y軸上。對於在兩個時間點供給血液樣本之患者,血液透析前時間點(圖54E)及血液透析後時間點(圖54F)之間的eccDNA大小分佈非常類似。有趣的係,在 DNASE1L3突變之個體(圖54E-54H)中也觀測到第3峰簇(500-650 bp)及第4峰簇(700-800 bp)之富集,反映了此等患者血漿中之長eccDNA分子的更高豐度。因此,人類個體中之 DNASE1L3缺陷將引起血漿中之eccDNA延長,此與Dnase1l3基因敲除小鼠中之吾等發現一致(圖48A-48D)。 B.            大小剖析變化
eccDNA之生物特性可能受核酸酶之活性影響。藉由利用 Dnase1Dnase1l3之基因敲除小鼠模型,本文中展示 Dnase1l3缺陷將顯著延長小鼠血漿eccDNA。然而,在 Dnase1缺陷小鼠中未觀測到此類作用。DNASE1L3可為影響游離eccDNA之大小特徵的主要促成因素中之一者。
有趣的係,野生型小鼠(圖48A)中之血漿eccDNA大小分佈與人類個體(圖53A)中之彼等不同,其中相比於野生型人類個體,野生型小鼠具有更增強的第1峰簇及更減少的第2峰簇。另一方面,Dnase1l3缺陷小鼠之血漿eccDNA大小剖析(圖48C)高度類似於人類中之彼等。此類觀測結果可能歸因於小鼠中存在之循環DNASE1L3之高得多的活性(M. Napirei、S. Ludwig、J. Mezrhab、T. Klöckl、H. G. Mannherz,《甲基血清核酸酶-纖維蛋白溶酶及肝素對DNase1及DNase1-樣3之活性的對比作用(DNase1l3)(Murine serum nucleases - contrasting effects of plasmin and heparin on the activities of DNase1 and DNase1-like 3 (DNase1l3))》。FEBS J.276, 1059-1073 (2009))。在吾等比較健康人類個體及 DNASE1L3突變患者之間的游離eccDNA的數據中,進一步強調DNASE1L3對eccDNA大小的縮短作用(圖53C)。此等證據一致地表明DNASE1L3之活性可有效地調節游離eccDNA之生物特徵。
值得注意的係,在細胞內層面下, Dnase1 −/− 小鼠及 Dnase1l3 −/− 小鼠均未展示出可觀測到的eccDNA大小分佈變化(圖50A-50H)。結果表明,細胞內eccDNA經DNASE1L3之訪問可能有限。相反,DNASE1L3可在其進入血液循環之後對eccDNA分子起作用。此假定可部分由以下關於活細胞之證據片段支持:(i)內質網中偵測到DNASE1L3,但不存在核(S. D、T. S,人類DNase I家族核酸內切酶之表徵及細胞凋亡期間之DNase γ活化。《生物化學(Biochemistry)》40, 143-152 (2001), M. Napirei、S. Wulf、D. Eulitz、H. G. Mannherz、T. Kloeckl,大鼠去氧核糖核酸酶1(Dnase1)及鼠類去氧核糖核酸酶1-樣3(Dnase1l3)之比較表徵。《生物化學雜誌(Biochem. J.)》389, 355-64(2005));(ii)細胞eccDNA位於細胞核(Y. Hotta, A. Bassel,《哺乳動物細胞及較高植物細胞中之Dna的分子大小及圓度(Molecular Size and Circularity of Dna in Cells of Mammals and Higher Plants.)》。《美國國家科學院院刊》53, 356-362 (1965), Y. Shibata等人,《正常組織中之染色體外微DNA及染色體微缺失(Extrachromosomal microDNAs and chromosomal microdeletions in normal tissues.)》。《科學》336, 82-6 (2012)),其將因此限制DNASE1L3對此等分子之訪問。然而,eccDNA分子釋放至循環中將促進其藉由DNASE1L3訪問,導致此等DNA分子降解。
吾等對Dnase1l3懷孕小鼠模型之發現進一步證明DNASE1L3對游離eccDNA之細胞外功能。先前已確定在懷有 Dnase1l3 +/− 胎兒之 Dnase1l3缺陷小鼠中,自胎兒釋放之DNASE1L3可以全身方式降解線性cfDNA分子(Serpas等人, PNAS(2019))。類似地,在此處觀測到在同一妊娠背景下,eccDNA大小剖析部分恢復到母體血漿中之野生型模式。此發現表明,胎兒產生之細胞外DNASE1L3可作用於母體血液循環中之eccDNA,調節母體游離eccDNA之降解。關於DNASE1L3(Serpas等人, PNAS(2019))之局部作用,未觀測到當相比於其 Dnase1l3 −/− 母親時衍生自 Dnase1l3 +/− 胎兒之eccDNA的縮短。吾人推測游離eccDNA之某些特徵可能仍有待揭示,諸如彼等eccDNA分子是否與細胞外囊泡或組蛋白相關。
使用具有缺陷 DNASE1L3之小鼠及人類模型建立核酸酶活性及游離eccDNA特性之間的生物學聯繫。由於 DNASE1L3之異常表現已在多種疾病中經報導,諸如全身性紅斑性狼瘡症(R. W. Y. Chan等人,《與 DNASE1L3基因突變相關之血漿DNA剖析:臨床觀測、核酸酶底物偏好與活體內校正之關係(Plasma DNA Profile Associated with DNASE1L3Gene Mutations : Clinical Observations , Relationships to Nuclease Substrate Preference , and In Vivo Correction)》。《美國人類遺傳學雜誌(Am. J. Hum. Genet.)》1-13 (2020),J. Hartl等人,《偶發性全身性紅斑性狼瘡症之DNASE1L3活性之自體抗體介導之損傷(Autoantibody-mediated impairment of DNASE1L3 activity in sporadic systemic lupus erythematosus)》《實驗醫學雜誌(J. Exp. Med.)》218(2021))及某些類型的癌症(S. D, T. S,《人類DNase I家族核酸內切酶之表徵及細胞凋亡過程中DNase γ之活化(Characterization of human DNase I family endonucleases and activation of DNase gamma during apoptosis)》。《生物化學(Biochemistry)》40, 143-152 (2001), M. Napirei、S. Wulf、D. Eulitz、H. G. Mannherz、T. Kloeckl,大鼠去氧核糖核酸酶1(Dnase1)及鼠類去氧核糖核酸酶1-樣3(Dnase1l3)之比較表徵。《生物化學雜誌》389, 355-64 (2005)),游離eccDNA之大小模式分析可用於此等疾病之生物標記發展。 C.           實例方法
eccDNA之大小剖析可用於確定生物樣本或獲得生物樣本之個體之各種特徵。eccDNA之某些大小之量可用於比較不同大小剖析。可使用某些大小之原始量或不同大小之比率。可偵測遺傳病症,包括與酶產生缺陷或過度相關之病症。可監測核酸酶之活性。可基於核酸酶活性確定個體之病況。eccDNA之量可用於確定遺傳病症。 1.            使用eccDNA大小分佈確定與核酸酶相關之遺傳病症
55為說明根據本發明之實施例使用個體之包括游離eccDNA之生物樣本偵測與核酸酶相關聯之基因之遺傳病症之方法5500的流程圖。方法5500及本文中之其他方法可完全或部分地使用電腦系統來進行。生物樣本可為任何游離DNA樣本,例如如本文所描述。該個體可能懷有胎兒。
在框5502處,接收自對個體之生物樣本中之eccDNA的游離DNA片段進行測序而獲得的序列讀段。測序可以例如如本文所描述之各種方式進行。測序可為如本文所描述之靶向測序。舉例而言,生物樣本可首先富集eccDNA及/或亦富集自eccDNA內之一個或多個特定區域的片段。組織eccDNA鑑別及富集之不同方法示於 56中且描述於本文中。富集可包括標籤化(圖56,步驟5620),滾環擴增(圖56,步驟5625)或酶處理(圖56,步驟5615)。酶處理可包括核酸外切酶V處理。酶處理可耗費至多5分鐘(min)、10 min、20 min、30 min、45 min、60 min、90 min、12小時(hr)、18 hr、24 hr或更長。在一些實施例中,酶處理耗時約30分鐘。
在框5504處,序列讀段用於確定游離DNA片段之大小分佈的大小值。大小值可表徵大小分佈。大小值可表徵一個或多個大小之游離DNA片段的量。在一些實施例中,大小分佈屬於游離eccDNA。
在一些實施例中,大小值係具有第一大小之游離DNA片段的第一量與具有第二大小之游離DNA片段的第二量的比率(例如,圖48E)。第一大小(例如,對應於圖48E,第一峰簇7310之大小),可為約150個鹼基對(bp)至約250 bp。第一大小可為約50 bp至約250 bp、約50 bp至約100 bp、約100 bp至約150 bp、約150 bp至約200 bp或約200 bp至約250 bp。第二大小(例如,對應於圖48E,第二峰簇7320之大小)可為約300 bp至約450 bp。第二大小可為約250 bp至約500 bp、250 bp至約300 bp、300 bp至約350 bp、約350 bp至約400 bp、約400 bp至約450 bp或約450 bp至約500 bp、約500 bp至約550 bp、550 bp至約600 bp、600 bp至約650 bp、500 bp至約650 bp、650 bp至約700 bp、700 bp至約750 bp、750 bp至約800 bp、700至800 bp或800至850 bp。第一大小及第二大小(例如第一或第二大小之中值或平均大小)可彼此隔開至少約10 bp、20 bp、30 bp、40 bp、50 bp、60 bp、70 bp、80 bp、90 bp、100 bp、150 bp或200 bp。在一些情況下,第一大小之上限可比第二大小之下限小至少約10 bp、20 bp、30 bp、40 bp、50 bp、60 bp、70 bp、80 bp、90 bp或100 bp。第一大小不同於第二大小。一個或多個大小可包括第一大小及第二大小。在一些實施例中,可使用超過一個大小值。舉例而言,每一大小值可為涉及不同第一大小及/或不同第二大小之不同比率。
在一些實施例中,該大小值係基於呈本文所描述之任何大小的游離DNA片段之量而非不同大小之量的比率。舉例而言,大小值可為大小為300 bp至400 bp之游離DNA片段的量。大小值可為DNA片段之頻率(例如百分比)或計數。頻率可為大小範圍之頻率的曲線下面積(AUC)。舉例而言,AUC可為圖48A-48C中兩個峰之一下的AUC。在一些實施例中,大小值可為AUC之比率。舉例而言,AUC比率可為一個峰下之AUC除以另一峰之AUC(例如圖48D中之AUC比率)。
在框5506處,隨後將來自樣本(例如來自人類個體或另一哺乳動物)之大小值與自一個或多個參考樣本獲得的參考大小值進行比較。樣本可獲自懷有胎兒之個體。
參考樣本可包含自懷有胎兒之個體獲得的樣本。參考樣本可包含自健康個體獲得之樣本,例如不具有缺陷核酸酶活性或用於與核酸酶相關聯之基因的任何遺傳病症的個體。健康個體可具有正常核酸酶活性。參考樣本可包含來自具有缺陷核酸酶活性之個體的樣本,或用於與核酸酶相關聯之基因的遺傳病症。參考樣本可獲自組織或血液(例如血漿或血清)或本文所描述之任何生物樣本。參考樣本可來自在相同或類似胎齡(例如,個體之1、2、3或4週內的相同三月期或胎齡)之個體。
參考值可以與大小值相同之方式確定。樣本大小值與參考樣本參考值之間的差值可用於對基因是否展現遺傳病症進行分類。參考值可為確定與參考樣本之統計顯著差異的截止值。舉例而言,參考值可為與具有或不具有遺傳病症之參考個體之平均值相距一個、兩個或三個標準差。在一些情況下,參考樣本係在治療之前或之後自個體獲得,其中治療影響核酸酶之活性。在一些實施例中,治療係血液透析。
在一些實施例中,與參考之比較可涉及例如使用監督學習訓練之機器學習模型。大小值(及潛在其它標準,例如拷貝數及甲基化程度)及獲得訓練樣本之訓練個體的已知條件可形成訓練數據集。機器學習模型之參數可基於訓練集進行最佳化,以在對病況等級進行分類時提供最佳化之準確性。實例機器學習模型包括神經網路、決策樹、叢聚法及支援向量機。比較可如圖39之框3906中所描述進行。
在框5506處,基於大小值之比較確定與核酸酶相關聯之基因是否展現遺傳疾病的分類。在一些實施例中,個體懷有胎兒。樣本可含有來自個體及胎兒之游離eccDNA。大小值比較隨後可用於確定胎兒是否具有核酸酶活性缺陷或與核酸酶相關聯之基因之遺傳病症的分類。在一些情況下,相同樣本可用於基於該比較確定懷孕個體是否具有核酸酶活性缺陷或針對與核酸酶相關聯之基因之遺傳病症的分類。遺傳病症可為 DNASE1L3基因之病症。遺傳疾病可包括以下一種或多種基因的疾病:DNASE1、DFFB、TREX1(三引物修復核酸外切酶1)、 AEN(細胞凋亡增強核酸酶)、 EXO1(核酸外切酶1)、 DNASE2(去氧核糖核酸酶2)、 ENDOG(核酸內切酶G)、 APEX1(類嘌呤核酸/無嘧啶內切去氧核糖核酸酶1)、 FEN1(瓣結構特異性核酸內切酶1)、 DNASE1L1(去氧核糖核酸酶1樣1)、 DNASE1L2(去氧核糖核酸酶1樣2)及 EXOG(外切/核酸內切酶G)。
在一些情況下,樣本可用於偵測與核酸酶相關聯之母本對偶基因、父本對偶基因(例如胎兒特異性對偶基因)或基因之兩種對偶基因是否展現遺傳病症(例如圖52A-52C)。舉例而言,可使用兩個參考值。第一參考值可自胎兒在一位置處對於第一對偶基因係同型接合之一個或多個第一參考個體確定。第二參考值可自胎兒在位置處對於第二對偶基因係同型接合之一個或多個第二參考個體確定。 2.            確定血液病症之治療功效
57展示說明根據本發明之實施例用於確定患有血液病症之個體之治療功效的方法5700之流程圖。方法5700之某些框可以與圖55之方法5500之框類似的方式執行。
在框5710處,接收自對個體之血液樣本中之游離DNA片段進行測序而獲得的序列讀段。個體之血液樣本可在個體已經歷治療(例如第一劑量之治療)之後獲得。治療可包括抗凝血劑、血液透析、腎臟移植或本文所描述之任何治療。序列讀段可與圖40之框4002所描述類似的方式或以本文所描述之任何方式獲得。
在框5720處,確定游離DNA片段之大小分佈之大小值。大小值表徵呈一個或多個大小之游離DNA片段的量。框5720可與框5504類似之方式進行。
在框5730處,使大小值與參考值進行比較以確定治療功效的分類。第二劑量之抗凝血劑可基於該比較投與個體,該第二劑量大於該第一劑量。在其他實例中,第二劑量可小於第一劑量,例如在該量超過參考值之情況下。基於比較,可繼續、增加或中斷治療。
參考值可對應於在投與治療之前在個體中先前執行之量測值。來自先前量測之量的改變可指示治療功效。在另一實施方案中,參考值可對應於健康個體中量測之量。有效治療可為使得該量在健康個體之參考值臨限值內的治療。在又一實施方案中,參考值可對應於在患有血液病症之個體中量測之量(例如如先前可在投與治療之前在個體中量測)。舉例而言,參考值可包含野生型動物或健康人類個體。參考值可包含組織特異性樣本或獲自同一個體之部分樣本(例如獲自樣本之血漿或白血球層部分之序列讀段),如例如圖1所示。 3.            使用eccDNA監測核酸酶活性
58為說明根據本發明之實施例,使用包括eccDNA之個體之生物樣本監測核酸酶活性的方法5800之流程圖。方法5800之某些框可以類似於方法5500之框的方式執行。 在框5802處,類似於框5502,接收自對個體之生物樣本中之eccDNA的游離DNA片段進行測序而獲得的序列讀段。
在框5804處,類似於框5504,序列讀段用於確定游離DNA片段之大小分佈的大小值。
在框5806處,類似於框5506,將來自樣本(例如人類個體或另一哺乳動物)之大小值與獲自一或多個參考樣本之參考大小值進行比較。隨後可基於該比較確定核酸酶活性之分類。核酸酶可為DNASE1L3、DNASE1、DFFB、TREX1(三引物修復核酸外切酶1)、AEN(細胞凋亡增強核酸酶)、EXO1(核酸外切酶1)、DNASE2(去氧核糖核酸酶2)、ENDOG(核酸內切酶G)、APEX1(類嘌呤核酸/無嘧啶內切去氧核糖核酸酶1)、FEN1(瓣結構特異性核酸內切酶1)、DNASE1L1(去氧核糖核酸酶1樣1)或DNASE1L2(去氧核糖核酸酶1樣2)。
在一些情況下,懷孕個體、胎兒或二者均具有核酸酶活性缺陷或與核酸酶相關聯之基因的遺傳病症。在一些其他情況下,懷孕個體或胎兒中僅一者具有缺陷核酸酶活性,或與核酸酶相關聯之基因的遺傳病症。該基因可為DNase I家族(例如人類)之任何成員。在一些實施例中,基因為 DNASE1DNASE1L3。基因之兩種對偶基因之缺失(亦即,空對偶基因之同型接合性)或兩種對偶基因中之一者(亦即,異型接合性)可與疾病相關。舉例而言,DNASE1L3中之空對偶基因之同型接合性可與諸如全身性紅斑性狼瘡症之病況相關。在另一實例中,DNASE1L3之異型接合性可與諸如類風濕性關節炎之病況相關。大小值比較可用於確定個體中之核酸酶活性缺陷(亦即,獲自個體之樣本)。
可在不對母親進行基因分型的情況下自比較大小值與參考值獲得胎兒之基因型資訊。然而,在一些實施例中,母親可經基因分型。母親可為同型接合的(例如,兩個對偶基因之損失或兩個對偶基因之野生型)或異型接合的。對於以下組,可獲得複數個參考值:(1)母親為同型接合的(野生型)且不具有基因缺陷且胎兒為野生型(例如圖52A);(2)母親針對基因缺陷係同型接合的且胎兒針對基因缺陷係同型接合的(圖52B);(3)母親針對基因缺陷係同型接合的且胎兒為異型接合的(圖52C);(4)母親為野生型且胎兒為異型接合的;(5)母親為異型接合的且胎兒為異型接合的;且(6)母親為異型接合的且胎兒為野生型。相比於當生物體為野生型時,在生物體針對缺陷係同型接合的情況下,可預期較長eccDNA片段,其中生物體針對缺陷係同型接合的。該等大小亦可受生物樣本中eccDNA之胎兒部分影響。參考個體可具有與個體相同或類似之胎齡。胎兒之基因型可藉由確定最接近大小值之參考值來確定。隨後可確定胎兒具有與參考值相同的基因型。隨後亦可根據參考值確定母體基因型。
分類可為核酸酶活性缺陷。大小值可指示比參考值更長的游離DNA片段。舉例而言,大小值可為較長大小與較短大小的簇之比率,且該比率可大於參考值。
在一些情況下,核酸酶活性缺陷為諸如癌症之病況的標誌。因此,在一些實施例中,本文所描述之大小值比較用於將個體(亦即獲自個體之樣本)分類為患有病況(例如癌症)之個體。分類可為個體患有以缺陷核酸酶活性為特徵之病況(例如癌症)。參考值可由一個或多個患有病況之參考個體或一個或多個未患病況之參考個體確定。 4.            使用eccDNA量確定遺傳病症
59為說明根據本發明之實施例的用於使用個體之包括游離DNA之生物樣本偵測與核酸酶相關聯之基因的遺傳病症之方法的流程圖。方法5900之某些框可以類似於方法5500或5800之框的方式執行。
在框5902處,類似於框5502或框5802,接收自對個體生物樣本中之eccDNA的游離DNA片段進行測序而獲得的序列讀段。
在框5904,序列讀段用於確定對應於生物樣本中eccDNA量的參數值。對應於生物樣本中eccDNA量的參數可為,例如,eccDNA之量與來自生物樣本之可定位序列讀段的總量之比率。例如,該參數可為圖47中描述之每百萬可定位讀段(EPM)的eccDNA。參數值可為例如樣本中eccDNA豐度之百分比。
在框5906,可將對應於樣本中eccDNA量的參數值與參考個體中eccDNA參數的參考值進行比較,以確定基因在個體中是否展現出遺傳疾病的分類。
參考個體可為本文所描述之參考個體中之任一者(例如具有與不展現遺傳病症之核酸酶相關聯之基因的個體,不具有核酸酶活性缺陷之個體)。生物樣本可經處理以自eccDNA富集游離DNA片段。處理可包括物理處理(例如過濾、離心等)、化學處理(例如酶消化)或其組合。在一些實施例中,樣本用核酸酶處理以移除線性DNA,隨後對eccDNA之游離DNA片段進行測序。遺傳病症可為本文所描述之任何病症,包括與 DNASE1L3相關之病症。樣本可藉由用核酸酶處理樣本,接著對游離DNA片段進行測序以產生序列讀段來進一步處理。在一些情況下,核酸酶為核酸外切酶V。 5.            定量樣本中之eccDNA
樣本中eccDNA之絕對量可藉由嵌入已知量之環狀DNA來確定。隨後可使用對應於已知量之嵌入參考分子分子的序列讀段之量來確定樣本中之eccDNA之量。與已知量之嵌入參考分子與序列讀段之量相關之校準曲線可用於確定eccDNA之量。
可提取游離DNA以形成生物樣本。提取可類似於圖56之步驟5601。生物樣本可分成若干相等等分試樣,或游離DNA可提取為相等體積之若干等分試樣。環狀DNA之不同已知量可添加至每一等分試樣中。舉例而言,可將各種不同量(例如,0.1 ng、1 ng、2 ng、5 ng、10 ng)之已知大小(例如,200 bp)之環狀DNA添加(嵌入)至相等等分試樣中。嵌入參考分子可為合成環狀DNA、質粒DNA或其他環狀形式的DNA分子。
來自生物樣本及嵌入環狀DNA之DNA混合物可隨後用核酸外切酶V處理以便進行線性DNA消化(例如圖56之步驟5615)。所得DNA隨後可經歷用於開放環狀DNA之標籤(例如圖56之步驟5620)。DNA可經歷PCR擴增。自測序結果鑑別之嵌入環狀DNA分子的量可與預定義特徵(例如序列讀段之量及藉由序列讀段確定之大小)相關以建立用於校準之標準曲線。隨後可使用校準曲線將eccDNA自血漿DNA之序列讀段的量轉化成絕對量(例如質量、濃度)。在一些實施例中,自血漿DNA鑑別之eccDNA之量可使用已知嵌入環狀DNA之序列讀段之量標準化,以獲得所關注的eccDNA實體之相對量。
可應用衍生自校準曲線之轉化配方以將各種尺寸之eccDNA之讀段計數轉化為絕對量。舉例而言,若1 ng嵌入環狀DNA(例如200 bp)產生10,000個讀段,則400 bp所關注的eccDNA之10,000個讀段將對應於樣本中2 ng此類分子。此類轉化式亦可考慮諸如(但不限於)所鑑別之eccDNA之大小、測序深度、測序長度、DNA可定位性及PCR重複率之因素。樣本中eccDNA之量可用於使用此參數區分健康對照與患者組,而不考慮批次間的差異。
60為與分析生物樣本以量化eccDNA的量相關聯之示例過程6000的流程圖。在一些實施方案中,圖60之一個或多個過程框可由裝置(例如,系統6500)執行。在一些實施中,圖60之一個或多個程序框可藉由另一裝置或與裝置分離或與包括裝置之裝置之群組執行。另外或替代地,圖60之一個或多個過程框可由系統6500之一個或多個組件,諸如分析裝置6510、偵測器6520、邏輯系統6530、本地記憶體6535、外部記憶體6540、儲存裝置6545、處理器6550及/或治療裝置6560執行。
在框6010處,接收自對由個體之生物樣本製備之混合物中染色體外環狀DNA(eccDNA)之游離DNA片段進行測序而獲得的第一組序列讀段。第一組序列讀段可藉由本文所描述之任何方法獲得,包括例如來自圖39之框3902。生物樣本可為本文所描述之任何生物樣本。除來自eccDNA之DNA片段以外,所製備之混合物可包括來自已知量之特定已知大小之環狀DNA的片段。
可將已知量之環狀DNA添加至生物樣本中以獲得且隨後如圖56所描述進行處理以獲得混合物。亦可製備一種或多種額外混合物。混合物及一種或多種額外混合物各可具有相同量的來自生物樣本之eccDNA。該過程可包括將生物樣本中之eccDNA分成混合物及一種或多種其他混合物。舉例而言,生物樣本可分成相等體積或質量之等分試樣。可將已知量之第二大小之環狀DNA添加至第一混合物中。可將額外已知量之環狀DNA添加至一種或多種額外混合物中。舉例而言,可將不同已知量添加至每一混合物。已知量可包括0 pg、1 pg、2 pg、3 pg、4 pg、5 pg、6 pg、7 pg、8 pg、9 pg、10 pg、50 pg、0.1 ng、0.2 ng、0.3 ng、0.4 ng、0.5 ng、0.6 ng、0.7 ng、0.8 ng、0.9 ng、1 ng、2 ng、3 ng、4 ng、5 ng、6 ng、7 ng、8 ng、9 ng、10 ng或在此等質量中之任兩者內指定範圍內的質量。
可將相同大小之環狀DNA添加至各混合物中。大小可為包括(但不限於)100 nt、200 nt、500 nt、1000 nt、2000 nt、3000 nt、4000 nt、5000 nt或在由此等大小中之任兩者內指定範圍內的大小的大小。
混合物及一種或多種額外混合物可如圖56所描述處理。混合物及一種或多種額外混合物可用酶處理以移除線性DNA。酶可為核酸酶(例如核酸外切酶V)。使混合物中之eccDNA及環狀DNA及一種或多種額外混合物線性化以形成線性化eccDNA及線性化環狀DNA,線性化可經由標籤化。線性化亦可為滾環擴增,隨後音波處理。線性化可包括額外擴增。對線性化eccDNA進行測序以獲得該一種或多種額外混合物中之每一者之第一組序列讀段及一個或多個第三組序列讀段。對線性化環狀DNA進行測序以獲得一種或多種額外混合物中之每一者之第二組序列讀段及一個或多個第四組序列讀段。
在框6020處,使用第一組序列讀段量測游離DNA片段之大小。此等片段包括來自eccDNA及來自嵌入環狀DNA之片段。游離DNA片段之大小可使用片段與參考基因體之排比來量測。可確定片段末端處之最外部核苷酸的基因體位置。片段大小可使用基因體位置之間的差異計算。在一些實施例中,片段可為序列,且大小可藉由計數片段中之核苷酸確定。
在框6030處,確定對應於第一大小之第一組序列讀段的第一量。第一大小可為eccDNA而非環狀DNA之片段。第一大小可為特定大小或大小範圍。例如,大小範圍可為自50 bp至約250 bp、約50 bp至約100 bp、約100 bp至約150 bp、約150 bp至約200 bp、或自約200 bp至約250 bp、約250 bp至約300 bp、300 bp至約350 bp、約350 bp至約400 bp、約400 bp至約450 bp、或約450 bp至約500 bp、約500 bp至約550 bp、550 bp至約600 bp、600 bp至約650 bp、500至約650 bp、650 bp至約700 bp、700 bp至約750 bp、750 bp至約800 bp、700至800 bp或800至850 bp。第一量可為片段之數目或片段之總長度。
在框6040處,確定對應於第二大小之第一組序列讀段的第二量。第二大小可為混合物中已知量之環狀DNA的特定大小。第二大小可為本文針對環狀DNA之大小描述的任何大小。第二大小可為不同於由eccDNA之片段產生之大小的大小。
在框6050處,將第一量與校準數據點進行比較。校準數據點可使用對應於第二大小之第二組序列讀段的第二量確定。校準數據點可包括作為序列讀段數目之量的座標及混合物或生物樣本中之量的另一座標。校準數據點可為校準曲線之點。校準曲線可使用對應於第二大小之一個或多個額外量之序列讀段確定。一種或多種額外量中之每一者可對應於一種或多種額外混合物中之一種或多種額外已知量之環狀DNA。該等額外已知量可不同於已知量。已知量及額外已知量可為本文所描述之任何量。
校準曲線可為由複數個校準數據點確定之曲線。複數個校準數據點可來自複數個量序列讀段及複數個已知量之環狀DNA。校準曲線可為使序列讀段之量與已知量相關的曲線。校準曲線可為針對複數個校準數據點之擬合或回歸。在一些實施例中,校準曲線可為序列讀段之量與混合物或生物樣本中環狀DNA之量相關的函數。
在框6060處,使用該比較確定來自eccDNA之對應於混合物中之第一大小的游離DNA片段之量。該量可為片段之質量、數目或片段之長度。確定量可包括獲取與校準數據點相關之已知量及藉由包括eccDNA大小、測序深度、測序長度、DNA可定位性及PCR重複率之因素調整已知量。舉例而言,與校準數據點相關之已知量可乘以所關注的eccDNA之大小相對於環狀DNA之大小的比率。
可確定除第一大小外之eccDNA之大小的量。校準數據點可為第一校準數據點。該量可為第一量。第一校準數據點之已知量可為第一已知量。確定對應於來自混合物中eccDNA之游離DNA片段之第三大小的序列讀段之第三量,第三大小可不同於第一大小及第二大小。可將第三量與第二校準數據點進行比較。第二校準數據點可使用對應於添加之環狀DNA之第二大小的第三組序列讀段之第四量確定。舉例而言,第二校準數據點可使第四量與第二大小之第二已知量相關。第二已知量及第三量可來自第二混合物。第三量相較於第二量可更接近於第四量,因此代替第一校準數據點或除了第一校準數據點以外,亦使用第二校準數據點。可使用該比較來確定來自eccDNA之對應於第三大小之游離DNA片段的第二量。在一些實施例中,第三大小之eccDNA可處於與第一大小之eccDNA不同的混合物中。
參數值可使用來自eccDNA之對應於混合物中第一大小之游離DNA片段的量來確定。參數可為量之標準化值。舉例而言,參數可為混合物或生物樣本之量除以體積或質量。參數可為濃度。在一些實施例中,參數可使用獲得生物樣本之個體之一種或多種物理特性確定。舉例而言,參數可使用個體之體重或身高。參數值可使用來自對應於第三大小之eccDNA的游離DNA片段之第二量來確定。大小範圍內之額外大小可用於參數,包括本文所描述之任何大小範圍。在一些實施例中,參數可為大小之量。
參數值可與參考值相比較以確定基因在個體中是否展現遺傳病症之分類。基因及遺傳病症可為本文所描述之任何基因及遺傳病症。參考值可由具有未展現與核酸酶相關聯之基因之遺傳病症之基因的個體或展現該基因次序之個體確定。參考值可為截止值或指示參考個體之參數的統計不同值之臨限值。遺傳病症之特徵可在於核酸酶缺陷。若參數值大於參考值或若參數值小於參考值,則分類可為基因展現基因次序。
實施例亦可包括治療遺傳病症。治療可包括本文所描述之任何治療。
過程6000可包括額外實施方案,諸如任何單一實施方案或下文描述及/或結合本文中在別處描述之一或多個其他程序之實施方案的任何組合。
儘管圖60展示過程6000之示例框,但在一些實施方案中,過程6000相比於圖90中所描繪之框可包括額外框、更少框、不同框或以不同方式配置之框。另外或替代地,可並行地執行過程6000之框中之兩者或兩者以上。 D.           材料與方法
使用小鼠模型及人類個體進行實驗,以研究與 DNASE1L3基因差異相關的差異。 1.            動物模型
Dnase1基因( Dnase1 −/− )缺失的小鼠獲自加州大學戴維斯分校的基因敲除小鼠項目庫;自傑克遜實驗室獲得 Dnase1l3基因( Dnase1l3 −/− )缺失的小鼠。小鼠在飼養香港中文大學(CUHK)實驗動物中心,其中所有實驗程序均經香港中文大學動物實驗倫理委員會批准,符合《實驗動物護理及使用指南》(2011年第8版)由美國國立衛生研究院建立。 2.            人類個體
在書面知情同意的情況下招募四名健康人類個體。自詹尼納加斯利尼公司(意大利)招募三名具有 DNASE1L3突變之人類個體。此等三個 DNASE1L3突變之個體之一在血液透析前及血液透析後時間點提供血液樣本。因此,自此患者群組獲得總計四個血液樣本。 3.            小鼠樣本收集及處理
藉由心臟穿刺自12隻野生型、11隻Dnase1 −/−及11隻Dnase1l3 −/−小鼠中採集血樣,且在4℃下以1,600×g離心10 min,隨後在4℃下以16,000×g藉由另一離心步驟離心血漿部分10 min以移除細胞碎片。在室溫下在5,000 × g下離心白血球層部分5分鐘以移除殘餘血漿。收集小鼠肝臟組織且立即儲存在-80℃下。使用QIAamp循環核酸套組(凱傑(Qiagen))提取血漿DNA。使用QIAamp DNA迷你套組(凱傑)提取白血球層(6隻野生型、4隻 Dnase1 -/-及5隻 Dnase1l3 -/-小鼠)及肝臟(5隻野生型、5隻 Dnase1 -/-及5隻 Dnase1l3 -/-小鼠)組織DNA。 4.            EccDNA庫製備及測序
使用先前詳述之基於標籤的方法自血漿樣本中構建EccDNA庫(Sin等人, PNAS(2020))。對於自肝臟及白血球層之組織DNA之eccDNA富集,吾人採用使用固相可逆固定化(SPRI)珠粒之雙重大小選擇方法(貝克曼庫爾特(Beckman Coulter))。
56說明此方法的工作流程。在步驟5601中,首先使用0.5×珠粒移除染色體DNA 5602(大尺寸分子);隨後使用1.8×珠粒收集小尺寸DNA(線性5603及環狀5606)。對於最佳選擇結果,對各樣本進行三次此方法(步驟5610)。將選定大小的組織DNA與核酸外切(新英格蘭生物實驗室(New England Biolabs))在50 µL反應系統中在37℃下培育30 min以移除線性DNA(步驟5615)。藉由管柱純化,使用MinElute反應清除套組(凱傑)收集剩餘DNA,接著標籤化(步驟5620)或滾環擴增(步驟5625)以用於eccDNA庫構建。關於標記(步驟5620),用Nextera XT DNA庫製備套組(伊路米那(Illumina))處理DNA樣本。對於滾環擴增(步驟5625),使用NxGen phi29 DNA聚合酶(Lucigen)在30℃下擴增DNA樣本12小時,繼之以音波處理至200 bp及測序銜接子連接。DNA庫在伊路米那NextSeq 500或NextSeq 2000平台上以2×75 bp或2×150 bp雙邊讀段進行測序。
以下提供有關獲得環狀DNA之更多信息。關於環狀DNA之額外資訊可見於2020年3月25日提交之美國專利公開案第2020/0407799 A1號中,其內容出於所有目的以引用之方式併入本文中。
在步驟5615中,工作流程首先藉由核酸外切酶消化(例如使用核酸外切酶V)降低(例如基本上消除)血漿DNA樣本中之線性DNA。其他技術亦可以用於減少線性DNA,例如氯化銫-溴化乙錠(CsCl-EB)密度梯度離心。
吾等隨後遵循用使環開放(例如eccDNA)以形成線性化DNA分子之方法。eccDNA之線性化可以各種方式進行。在一個實例中,吾人利用限制酶消化來在具有切割序列模體之特定切割位點打開環,該切割序列模體係一種類型之切割標籤。在另一實例中,吾等使用轉座酶(例如經由標籤[步驟5620])打開環,例如以插入與切割序列模體相同可識別的切割標籤用於限制酶消化。隨後可進行所得線性化DNA之庫製備及下一代測序。
在使用酶消化之各種實施例中,一個實施方案可使用限制酶MspI(CCGG序列之切割;甲基化不敏感)。在另一實施方案中,吾等使用限制酶HpaII(切割CCGG序列;甲基化敏感)。在又一實施方案中,吾人組合經由使用 MspI及 HpaII產生之資料以獲得eccDNA之新穎洞察。
可使用除 MspI及 HpaII外之限制酶。作為說明,亦可以使用均識別GATC序列之 DpnI及 DpnII。 DpnI僅在識別位點(A鹼基)經甲基化時切割。另一方面, DpnII對甲基化狀態不敏感。識別及切割之鹼基數目可以變化。舉例而言, MspI及 HpaII均係4鹼基切割子。可以使用除4鹼基切割子以外的限制酶,諸如6鹼基切割子。
在與滾環擴增eccDNA(Shibata等人. 《科學(Science)》. 2012;336:82-86)及剪切(例如利用霧化器)以形成線性化DNA相比時,使用切割標籤之方法(例如,限制酶或轉座酶方法)可以為eccDNA讀段之定義(鑑別)提供更嚴格的準則。舉例而言,可以使用另外兩個包含已知序列(切割標籤)之錨來準確鑑別eccDNA分子,在該已知序列中已進行切割(例如,CCGG片段末端)並且在序列讀段之兩個末端序列之間沒有間隙。此類特徵錨可以用於準確地鑑別eccDNA讀段且確定其在參考基因體中之位置。不存在間隙可以使用參考基因體經由排比程序確定,如下文更詳細描述。
來自切割標籤之此資訊(例如CCGG讀取端)不僅促進eccDNA之較準確鑑別,由自甲基化不敏感及甲基化敏感限制酶偵測之eccDNA之數目提供的補充資訊亦允許一者推斷eccDNA之甲基化程度。經由先前記錄之方法無法獲得此類資訊。此外,eccDNA片段中不存在的CCGG片段末端(或對其他類型的限制酶具有特異性之其他識別序列,亦即其他類型的切割標籤)可以提供對eccDNA損傷先前存在的見解,此係指在限制酶切割之前的eccDNA線性化。此類線性化可能係由於在DNA處理期間的機械剪切、血流中的核酸酶攻擊等引起的。儘管此類eccDNA分子經偵測具有接合位點,但通常在片段之一個或兩個末端缺少限制酶切割模體。此類情況可稱為「先前存在的eccDNA損傷」。先前記錄之方法亦無法獲得此類資訊。此類資訊可為eccDNA產生之生物機制及活體內處理提供有價值的知識。
使用限制酶消化已用於產生用於分子選殖之重組質體。然而,此種應用與本發明之間存在明顯的差異。首先,eccDNA分子係自生物體基因體中產生的,當相對於基因體進行定位時,其起點及終點位置清晰,而細菌質體中不存在此類概念。其次,用於eccDNA研究之限制酶方法可以提供宿主基因體序列之見解。但是對於細菌質體DNA,限制酶消化方法僅允許窺視質體DNA資訊,而不允許宿主基因體本身(Shintani等人. 《微生物學前沿(Front Microbiol)》. 2015;31;6:242)。
限制酶方法利用eccDNA上存在特定識別位點來對其進行消化及線性化。利用轉座酶隨機切割DNA之標籤片段化方法不需要特定的DNA序列。因此,標籤片段化方法可能會為文庫建構及測序提供更多數目之線性化eccDNA。在先前的報導中,描述了標籤片段化用於組織中之eccDNA分析的用途(Shoura等人. 《基因-基因體-遺傳學(G3)》(Bethesda). 2017;7(10):3295-3303)。Shoura等人使用氯化銫-溴化乙錠密度梯度離心法自組織基因體DNA中富集eccDNA。相反,不需要執行此類步驟。因此,本發明之標籤片段化方法可以更適合於血漿DNA及包括循環DNA之其他體液或糞便。 a)            eccDNA鑑別之原理及生物資訊學方法
61展示根據本發明之實施例用於eccDNA鑑別之實例技術。基因體6100中之「藍色」區域6102及「紅色」區域6106指示假設連接在一起以形成染色體外環狀DNA(eccDNA)的兩個區域。「青色」條指示限制酶識別位點6104,其充當切割標籤。舉例而言, MspI限制酶可識別及裂解CCGG位點。此類特異性切割將使原始環狀DNA分子線性化。所得線性化分子將帶有黏性末端(staggered end),可以經由末端修復步驟對該等黏性末端進行修復以形成鈍端分子。此類鈍DNA末端會帶有切割標籤(亦即5' CGG及3' CGG模體)。隨後,可以使用不同的測序技術對鈍端DNA進行測序,此等技術包括但不限於Illumina平台、Ion Torrent測序等。
展示eccDNA 6110具有包括來自基因體6100之兩個區域6102及6106之環狀接合基因座6112。區域6102及6106之末端包括在eccDNA 6110中緊鄰彼此之兩個分離的基因體位置處形成環狀接合基因座6112之核苷酸。在步驟6120,在位點6104處進行消化以產生線性化DNA分子6125。在步驟6130,例如如上所描述進行末端修復以產生末端修復DNA分子6135。在步驟6140,進行測序(例如,雙邊測序或單分子測序)以獲得序列6145,其包括環狀接合基因座6112。如所示,序列6145可包括讀段1及讀段2。
若吾等以足夠的讀取長度測序讀段1及讀段2,則在雙邊測序步驟中具有跨越環狀接合基因座6112之序列讀段(由嵌合箭頭指示)的可能性較高。讀段1自線性化DNA分子6125之左端延伸,其中讀段1在環狀接合基因座6112之左邊係藍色的且在環狀接合基因座6112之右邊係紅色的。讀段2自線性化DNA分子6125之右端延伸,其中讀段2在環狀接合基因座6112之右側係紅色的且在環狀接合基因座6112之左側係藍色的。
在步驟6150處,對參考基因體進行排比。當讀段1及/或讀段2覆蓋環狀接合基因座6112時,在排比結果中,吾人將觀測到以獨特定位方向定位至參考基因體之線性化分子之讀段1及讀段2序列(例如藉由 MspI切割)。出於說明目的,吾等在讀段1中定義未定位區段6152(在排比步驟之後紅色箭頭,「b→a」片段),其將對應於跨越接合點之序列,該接合點來源於其他基因體區域以形成環狀DNA。類似地,吾等在讀段2中定義未定位區段6154(在排比步驟之後的藍色箭頭,「e→f」區段),其將對應於跨越接合點之序列,該接合點來源於其他基因體區域以形成環狀DNA分子。
以下兩種情境覆蓋此類獨特定位方向,涉及讀段與參考基因體之間的反轉方向: a.    當區段「b→c」之讀段1最小定位座標(亦即b)等於或小於區段「d→e」之讀段2最小定位座標(亦即d)時,讀段1將以反轉股排比,而讀段2將以正向股排比。 b.    當讀段2最小定位座標等於或小於讀段1最小定位座標(圖61中未示出)時,讀段1將以正向股排比,而讀段2將以反轉股排比。
對於源自初始線性DNA之一對雙邊讀段,此類獨特定位方向不同於習知定位方向。因此,此類準則可用於鑑別環狀分子。舉例而言,當讀段1最小定位座標等於或小於讀段2最小定位座標時,讀段1以正向股完全排比,而讀段2以反轉股完全排比;或者,當讀段2最小定位座標等於或小於讀段1最小定位座標時,讀段1以反轉股完全排比,而讀段2以正向股完全排比。在生物資訊學上,搜尋讀段1及/或讀段2中存在的未定位區段之參考基因體中的定位位點將允許描述接合點。由來自片段的未定位區段推斷的接合位點之間的距離將指示環狀DNA之大小。舉例而言,區域6102與位點6104之間的距離提供環狀DNA之大小。
另一特徵係,若僅切割一次環狀DNA,則在經定位的讀段1與讀段2之間有兩個核苷酸重疊。讀段1與讀段2之間的此類兩個核苷酸重疊的序列利用 MspI或 HpaII或其他消化酶產生的交錯末端(亦即鋸齒狀末端)引入。 MspI或 HpaII將產生兩個交錯單股斷裂,且兩個斷裂之間的距離將為2 bp。此類5'突出的2-nt單股末端(彼此互補)將在末端修復步驟中經填充以形成鈍端。因此,所得的DNA序列將在讀段1及讀段2序列之末端之間帶有2 bp的重疊。換言之,在文庫製備步驟期間,將有「末端修復」步驟,該步驟藉由在每個末端添加兩個核苷酸,將鋸齒狀末端變成鈍端。因此,所得DNA序列將具有兩個鈍端而非兩個鋸齒狀末端。當兩個測序讀段與基因體進行排比時,在末端修復步驟期間添加的兩個核苷酸將顯示為兩個讀段之間重疊的兩個額外的鹼基對,此可用於另外或替代性地鑑別環狀NDA分子。
綜上,在示例eccDNA鑑別方法中,可存在四個「診斷特徵」,包括: a.    如上文(a)及(b)所提供,環狀DNA特定定位方向(方向性); b.    接合點識別(junction-aware)讀段(僅相對於參考基因體進行定位之末端序列的一部分); c.    限制酶切割標籤; d.    讀段1及讀段2序列之5'端中之兩個重疊鹼基。
此種診斷功能可以大大提高鑑別血漿DNA中全基因體eccDNA分子之特異性。在一些實施方案中,可以將滿足此等「診斷特徵」中之至少一者的測序讀段定義為候選環狀DNA。對於利用限制酶多次切割之環狀DNA,讀段1及讀段2不會在彼此之間帶有重複序列(重疊鹼基)。在其他實施方案中,來自一對之僅一個讀段可在接合位點上,而另一個不攜帶接合點。作為另一實例,來自一對的兩個讀段將不帶有接合點,但是展示出暗示環狀DNA之唯一定位方向。在又另一實例中,即使不能在測序讀段中直接觀測到完整的限制酶切割標籤,亦可以自參考基因體中檢索到一個環狀DNA之此等推斷的接合位點之間的參考序列。接著,可以進行生物資訊學研究,在此種檢索的參考序列中是否存在任何限制酶切割標籤(模體)。此種推斷的限制酶切割模體將增加對鑑別環狀DNA物種確實正確之信心。
因此,一種方法可以使用限制酶作為分析eccDNA之一部分。此種技術可以與本文所述之其他方法組合使用,例如,用於分析eccDNA以及mtDNA。下游分析可以包括利用偵測環狀DNA來量測樣本之性質。
在第一步驟中,可接收生物體之生物樣本。本文提供生物樣本之實例,諸如血漿及血清。該生物樣本包括複數個染色體外環狀DNA(eccDNA)分子。eccDNA可以來自許多染色體,包括體染色體及/或性染色體。每一該複數個eccDNA分子包括接合點,兩個分隔的基因體位置處之核苷酸在該接合點處彼此緊鄰。環狀接合基因座6112為此類與區域6102及6106之接合點之實例,包括此類兩個彼此緊鄰之分隔基因體位置。
在第二步驟(例如步驟6120)中,使用限制酶進行消化。在一些實施方案中,可使用超過一種類型之限制酶。消化複數個eccDNA分子可以形成一組線性化DNA分子,該組線性化DNA分子各自包括接合點。每種限制酶可以在不同的模體處切割,其中所得的線性化DNA片段具有不同的切割標籤。術語「線性化DNA片段」不同於「線性DNA片段」,「線性DNA片段」在任何消化之前就已經係線性的。
在第三步驟(例如步驟6140)中,對於各線性化DNA分子,可對線性化DNA分子之至少兩端進行測序以獲得一個或多個序列讀段。該一個或多個序列讀段可包括或可不包括接合點。若讀段不包括接合點,則eccDNA分子仍可使用定位之方向性鑑別。在某些實施例中,可以獲得兩個序列讀段(各末端一個)。在其他實施例中,整個線性化DNA分子之單個序列讀段可以包括兩個末端,如本文所描述。
在獲得序列讀段之後,可以將序列讀段定位(排比)至參考基因體,例如以查看其是否以反轉取向定位。若其確實以相反的取向定位(示例準則),則可以將相應的線性化DNA分子鑑別為最初係環狀的。因此,對於每一線性化DNA分子,可以自一個或多個序列讀段中選擇線性化DNA分子之一對末端序列。該對末端序列不包括接合點。此類末端序列之實例為圖61中之末端序列6146及末端序列6148。使每一對末端序列之方向反轉以獲得一對反轉末端序列。此類反轉末端序列之實例為反轉末端序列6156及反轉末端序列6158。接著可以將該對反轉末端序列相對於參考基因體進行定位。
可分析所定位之反轉末端序列以量測生物樣本之特性。本文提供此類量測之實例。此類分析可以使用所偵測eccDNA之集合值(例如,計數、尺寸或甲基化)。因此,該方法可進一步包括基於與參考基因體定位之反轉末端序列對鑑別源自eccDNA分子之線性化DNA分子,及確定鑑別之eccDNA分子之集體值,其中分析定位之反轉末端序列以量測生物樣本之特性使用集合值。 b)            鑑別技術
如上文所解釋,可使用各種標準鑑別環狀DNA分子。另外,各種程序可用於原始序列讀段之分析(例如來自圖61之讀段1及讀段2)以鑑別環狀DNA之特性中之一或多者。
原始序列讀段可經預處理。舉例而言,可以移除重複讀段、測序轉接子及測序讀段3'末端之低品質鹼基。此外,可以選擇雙邊讀段之指定數目的鹼基(或來自單分子讀段之末端)進行排比。 (1)         假定eccDNA鑑別
由在經預處理之雙邊讀段中前50 bp之讀段1及讀段2組成之生物資訊截斷之讀段1及讀段2可用於使用排比程序,例如Bowtie 2 (Langmead等人. 《自然方法(Nat Methods.)》, 2012;9:357-9)與雙邊模式中之人類參考基因體排比。亦可以使用其他排比技術。除了50 bp以外,亦可以使用每個讀段之其他長度,例如至少20、25、30、35、40或45 bp。排比時的第一遍可以嘗試標準取向,例如,讀段1與左側末端以比最後一個基於讀段之基因體位置低的基因體位置進行排比。對於通常排比(亦即,在正向方向上)的彼等配對末端讀段,將在第一遍中確定關於讀段1及讀段2之定位方向性。與習知適當地定位雙邊相比,若片段的讀段1及讀段2對應於環狀DNA,則正向定向將不提供對之適當排比,因此讀段具有環狀DNA特異性定位方向(圖61)。
若該對讀段不與正向定向排比,則可在第二遍排比中嘗試反轉定向。如圖61中所示,讀段1及讀段2係反轉的。若截短的讀段可以反轉定向進行排比,則截短前的相應讀段可以與參考基因體重新進行排比。可能需要非截斷的讀段,以便其覆蓋接合點。若讀段的確覆蓋接合點,則即使在反轉方向上,其亦不會完全與參考基因體完全排比,例如如圖61所示。具有至少一個無法在全長上與參考基因體進行排比之讀段的雙邊讀段可用於eccDNA之「診斷特徵」(例如上述4個)的下游詳細分析,因為不能以端對端模式與參考基因體進行排比的此類讀段提示接合點。此等雙邊讀段可以視為源自環狀DNA分子之假定讀段。 (2)         探測eccDNA分子之接合點
為了以單一鹼基解析度精確定位eccDNA之基因體位置,一些實施方案分別針對假定讀段微調再排比。以讀段1為例,將來自讀段1序列之前20 bp及後20 bp用作種子(分別為種子A及種子B),以確定可能帶有接合點之候選基因體區域。用於搜尋候選位置之縮短的讀段有助於最大程度地減少讀段含有接合點的可能性,此將影響排比精度及接合位點之精確確定。在此步驟中,可以允許多次命中(例如,每個種子不超過10次命中),以使偵測接合點的靈敏度最大化。若種子B序列未在同一方向上位於種子A定位位置之下游,則表明此類讀段1將帶有接合點。
接下來,吾人使用一種搜尋方法以單一鹼基解析度對鑑別為潛在攜帶接合點之讀段1進行接合點探測。
62A62B展示根據本發明之實施例用於接合點搜尋方法之示意性方法。在與參考基因體排比之後的讀段內進行搜索,例如如圖61中之步驟6150之後所示。攜帶接合點之讀段6207含有兩個相對定位方向之區段(紅色及藍色),例如如圖61中所示。
在圖62A及圖62B中所示,以「分裂及匹配」方式進行搜尋。吾人使用「分裂位點」6205(如黑色虛線所示)將原始讀段1序列分為兩部分,亦即A部分及B部分。吾人沿著除了種子區域6202及6204(例如,長度為20 bp)以外的整個序列迭代滑動「分裂位點」6205,以耗盡A部分及B部分之所有組合。「分裂位點」6205左側(但不包括種子區域6202)之序列係A部分。「分裂位點」6205右側(但不包括種子區域6204)之序列係B部分。可以限制A部分及B部分中之每一者的最小長度,例如不少於18 bp。
圖62A展示其中「分裂位點」6205不與實際接合點6212重疊之實例。如所示,在分裂讀段之後,可以重新排比種子區域6202及6204。接著,如所示,A部分及B部分可以分別接合。當「分裂位點」6205不與實際接合點6212重疊時,若吾人在將A部分及B部分分別黏接至種子A及種子B之後將A部分及B部分與參考基因體進行比較,則A部分及B部分將展示許多錯配。
圖62B展示當「分裂位點」確實與實際接合點6212完全重疊時之實例。若吾人在將A部分及B部分分別黏貼至種子A及種子B之後將A部分及B部分與參考基因體進行比較,則A部分及B部分在理論上將顯示零錯配。因此,將A部分及B部分之所有組合中給出錯配最小值的讀段1序列中之「分裂位點」6250鑑別為接合點。此類最小值可以滿足錯配條件。在其他實施方案中,可以擴張種子,直至指定數目(例如,兩個或更多個)的連續位置與參考錯配為止。
此種搜尋亦獨立地應用於讀段2序列。讀段2序列將用於進一步提高特異性。舉例而言,讀段2序列將有兩種情況:(1)讀段2序列帶有接合點作為讀段1。此類接合資訊應與自讀段1序列推斷的結果相容。(2)讀段2序列不帶有接合點。在此種情況下,讀段2序列應在由接合位點任一端的序列劃定的區域內完全排比,該接合位點係自讀段1序列(亦即A部分及B部分)推斷出來的。讀段1及讀段2之處理順序可以互換。在又另一實施例中,沿著帶有推斷的接合點的整個讀段的錯配總數必須不超過指定數目(例如2)。 5.            EccDNA鑑別及大小剖析
用於小鼠eccDNA鑑別及大小剖析之生物資訊原則的細節自先前研究(Sin等人, PNAS(2020))用少量調整修飾,包括小鼠基因體用作參考基因體之事實。對於小鼠妊娠模型,配對設置如下:C57BL/6基因體背景之雌性小鼠(野生型或Dnase1l3−/−)與來自BALB/c(野生型)或C57BL/6(Dnase1l3−/−)基因體背景之雄性小鼠雜交(圖51)。來自懷孕小鼠之eccDNA文庫的測序資料首先相對於C57BL/6參考基因體(NCBI構築38/UCSCmm10)進行定位以用於候選eccDNA鑑別。所得候選eccDNA讀段隨後相對於BALB/c基因體定位。僅選擇在C57BL/6及BALB/c基因體兩者下鑑別為eccDNA之候選讀段用於下游分析。含有在C57BL/6與BALB/c基因體之間不同的4,576,884個SNP之資料庫獲自小鼠基因體計劃(https://www.sanger.ac.uk/science/data/mouse-genomes-project)。因為所有雌性小鼠來自C57BL/6品系,所以任何含有BALB/c-特異性對偶基因之eccDNA將指定為胎兒特異性分子。覆蓋相同對偶基因與共用SNP之剩餘分子將分配為共用分子,其主要為母體來源。 6.            統計分析
應用克拉斯卡-瓦立斯檢驗(Kruskal-Wallis test)及鄧氏多重比較檢驗(Dunn's Multiple Comparison Test)來比較三組資料。應用威爾卡森秩和檢驗來比較兩組資料。此等統計檢驗使用GraphPad Prism 8.0(GraphPad軟體)進行。統計顯著性定義為P<0.05。 III.       治療
實施例可進一步包括在確定個體之分類之後治療患者之遺傳病症或低核酸酶活性(例如低於臨限值)。在治療之後個體之分類可涉及或可不涉及活體內或活體外添加抗凝血劑以增強cfDNA末端型態。此外,當當前劑量具有較低功效(例如,劑量增加或可使用不同的抗凝血劑)時,治療可判定為當前治療(例如,抗凝血劑)之替代物。治療可根據確定的病症程度、任何鑑別之突變及/或組織來源來提供。例如,所鑑別之突變(例如在多形性實施方案中)可使用特定藥物或化學療法靶向。起源組織可用於導引手術或任何其他治療形式。且病症等級可用於確定任何類型之治療多具侵襲性,其亦可基於病症等級確定。病症(例如,癌症)可藉由化學療法、藥物、膳食、療法及/或手術治療。在一些實施例中,參數(例如,量或大小)之值超出參考值愈多,則治療可愈具攻擊性。
治療可包括化學療法,其使用藥物來破壞癌細胞,通常保持癌細胞避免生長及分裂。藥物可涉及例如(但不限於)用於膀胱內化學療法之絲裂黴素-C(可用作一般藥物)、吉西他濱(gemcitabine)(Gemzar)及噻替派(thiotepa)(Tepadina)。全身性化學療法可涉及例如(但不限於)順鉑吉西他濱(cisplatin gemcitabine)、甲胺喋呤(Rheumatrex,Trexall)、長春鹼(Velban)、小紅莓(doxorubicin)及順鉑。
在一些實施例中,治療可包括免疫療法。免疫療法可包括阻斷稱作PD-1之蛋白質的免疫檢查點抑制劑。抑制劑可包括(但不限於)阿特珠單抗(atezolizumab)(Tecentriq)、納武單抗(nivolumab)(Opdivo)、阿維魯單抗(avelumab)(Bavencio)、德瓦魯單抗(durvalumab)(Imfinzi)及派立珠單抗(pembrolizumab)(Keytruda)。
治療實施例亦可包括靶向治療。靶向療法為靶向有助於癌症生長及存活之癌症之特異性基因及/或蛋白質的治療。例如,厄達替尼(erdafitinib)為經口給予之藥物,其經批准用於治療具有FGFR3或FGFR2基因突變之局部晚期或轉移性尿道上皮癌之人,該尿道上皮癌具有持續生長或擴散之癌細胞。
一些治療可包括放射療法。放射療法使用高能量x射線或其他粒子來破壞癌細胞。除每一個別治療之外,亦可使用本文中所描述之此等治療之組合。在一些實施例中,當參數之值超出自身超出參考值之臨限值時,可使用治療之組合。參考文獻中關於治療之資訊以引用之方式併入本文中。 IV.        實例實施細節
描述用於研究對線性cfDNA及eccDNA之核酸酶作用的實驗技術。此等技術可應用於本文所描述之任何方法。
在例示性鼠類模型中,由傑克遜實驗室產生具有C57BL/6NJ背景上之Dnase1l3(mm9 Chr14:8,809,531-8,810,216)中之外顯子5之CRISPR/Cas9靶向缺失的小鼠。在B6背景上攜帶 Dnase1[Dnase1tm1.1(KOMP)Vlcg]之靶向對偶基因之小鼠及B6背景上之WT對照小鼠係自加利福尼亞大學戴維斯分校(University of California at Davis)之基因敲除小鼠計劃庫獲得。所有實驗程序均經香港中文大學(The Chinese University of Hong Kong,CUHK)動物實驗倫理委員會批准,且按照《實驗動物護理及使用指南(Guide for the Care and Use of Laboratory Animals)》(第8版,2011年)由美國國立衛生研究院(National Institutes of Health)建立。將小鼠飼養在CUHK之實驗室動物中心。將14-20週齡的雄性及雌性小鼠用於實驗。由於其血液樣本經彙集在一起,因此未對性別(sex)及性別(gender)對結果的影響進行分析。
在示例鼠類樣本收集中,藉由心臟穿刺對小鼠實施安樂死及放血。將全血置放於含EDTA之試管(來自Sarstedt的1.3 mL K3E微管)且立即藉由雙離心方案分離(1,600× g在4℃下10分鐘,隨後在4℃下以16,000× g再離心血漿10分鐘)(Chiu等人,2001年)。將來自3-4隻小鼠的血漿收集到各池中,每個池產生1.1-1.9 mL血漿。總共,吾等自20隻WT小鼠的血漿中產生6個WT池,自20隻 Dnase1l3 −/− 小鼠的血漿中產生6個 Dnase1l3 −/− 池,以及自8隻 Dnase1 −/− 小鼠的血漿中產生2個 Dnase1 −/− 池。
在示例人類個體中,自詹尼納加斯利尼公司(stituto Giannina Gaslini)(意大利)及病童醫院(Hospital for Sick Children,SickKids)(加拿大)招募3名患有 DNASE1L3缺陷之個體(H2、H4及V11)及1名異型接合親體(H1),且具有書面知情同意。3名 DNASE1L3缺陷個體(H2、H4及V11)具有同型接合移碼c.290_291delCA(p.Thr97Ilefs*2)突變,且H1為H2及H4之異型接合親體。來自先前公開數據集之8名健康個體的血漿數據用作對照(Chan等人,2013年)。收集所有人類個體之血漿,但配對白血球層僅可用於H1、H2及H4。該研究經香港中文大學-醫院管理局新界東集群臨床研究倫理委員會(Joint Chinese University of Hong Kong-Hospital Authority New Territories East Cluster Clinical Research Ethics Committee)、詹尼納加斯利尼公司倫理委員會(批准BIOL 6/5/04)及SickKids研究倫理委員會批准。 A.            DNA提取及亞硫酸氫鹽DNA測序
在實例中,用QIAamp循環核酸套組(凱傑)提取血漿DNA,且使用QIAamp DNA血液迷你套組(凱傑)提取白血球層DNA,隨後音波處理至350 bp之中值大小(Covaris)。使用具有亞硫酸氫鹽修飾之TruSeq DNA奈米庫製備套組(伊路米那(Illumina))使用EpiTect亞硫酸氫鹽套組(凱傑)構建索引DNA庫。經亞硫酸氫鹽轉化之DNA庫經過12個循環的PCR富集,且在Agilent 4200 TapeStation(安捷倫科技(Agilent Technologies))上使用高靈敏度D1000 ScreenTape系統(安捷倫科技)進行分析,用於品質控制及基於凝膠之大小測定。測序之前藉由Qubit dsDNA高靈敏度分析套組(賽默飛世爾科技(Thermo Fisher Scientific))對庫進行量化。在HiSeq 4000平台(伊路米那)上針對血漿庫及在NextSeq 500平台(伊路米那)上針對白血球層庫進行2×75 bp雙邊測序。 B.            亞硫酸氫鹽測序數據之品質控制、修整及排比
在實例中,基於其六鹼基索引序列將序列分配給其相應的樣本。移除銜接子序列,且自雙邊亞硫酸氫鹽測序讀段中修整Phred評分低於20的低品質鹼基。清理後的讀段與參考基因體(小鼠:NCBI MGSCv37/UCSC mm9;人類:NCBI GRCh37/USCS hg19;非重複掩蔽)進行排版,最多有兩個錯配。共享相同起始及末端基因體座標之雙邊讀段數視為PCR重複,且從下游分析中丟棄。基因體中所有CpG位點之甲基化密度由Methy-Pipe電腦程式生成(Jiang等人,2010年)。
63概括各條件下獲得之獨特片段的數目。第一行列舉基因型。第二行列舉樣本類型。第三行為樣本鑑別。第四行為原始片段計數。第五行為預處理之後的片段計數。第六行為可定位片段之數目。第七行為定位速率(可定位片段除以預處理之後的片段計數)。第八行為非複製片段之數目。第九行為重複率。第10行為重複片段之數目。第11行為測序深度。
64展示小鼠數據中 Dnase1Dnase1l3基因的缺失在排比數據中得到證實。左圖展示 Dnase1l3基因區域。右圖展示 Dnase1基因區域。不同樣本列在不同列。各列中之有色條表示存在與該區域排比之片段。左圖展示來自 Dnase1l3 -/- 基因型之樣本具有缺失區域,不同於來自 Dnase1 -/- 及野生型基因型之樣本。右圖展示來自 Dnase1 -/- 基因型之樣本具有缺失區域,不同於來自 Dnase1l3 -/- 及野生型基因型之樣本。 C.           計算不同區域周圍之末端密度及甲基化程度
在實例中,RNA聚合酶II(Pol II)、H3K4me3、H3K27ac區域係自人類及小鼠編碼項目(Shen等人, 2012年;Dunham等人,2012年)下載。所有基因之轉錄起始位點(TSS)及CpG島(CGI)自UCSC下載。10,000 bp長度之10,000個隨機非重疊區域藉由BEDTool(v2.27.1)在全基因體中隨機選擇(Quinlan及Hall 2010)。使用觀測窗大小為±1000 bp,藉由±3000 bp區域中之中值末端計數標準化片段末端計數以獲得標準化末端密度。自相對應的區域中之CpG位點計算此等區域之甲基化程度。計算且繪製各別樣本中值。 D.           0%及100%甲基化片段之cfDNA大小
在實例中,排比末端之基因體座標用於推斷所測序cfDNA之全片段的大小。為鑑別0%及100%甲基化片段,使用具有三個或超過三個CpG位點之片段計算甲基化百分比。將至少三個甲基化CpG中為零的CpG標記為0%甲基化片段,且將具有所有至少三個甲基化CpG之CpG標記為100%甲基化片段。繪製此等片段類型中之各基因型之中值大小。 E.            OCR及CGI片段分析
在實例中,TSS、PoI II、H3K4me3及H3K27ac區域中心周圍±500 bp之區域與CGI區域合併。若至少一個鹼基與此等區域重疊,則片段考慮在此等區域內。計算此等區域內片段之片段百分比及尺寸大小,且在掩蔽此等區域之後重新計算甲基化程度及大小剖析。關於圈圖,將參考基因體分成1 Mb基因區域,且圈圖中之各點表示自1 Mb基因區域內之所有CpG位點推論的各基因區域之甲基化程度。 F.            假定甲基化及未甲基化CpG之分析
在示例鼠類模型中,使用以下標識符自編碼門戶(https://www.encodeproject.org/)獲得8隻具有2個生物學重複的小鼠組織的全基因體亞硫酸氫鹽測序(WGBS)數據:ENCFF874IPH、ENCFF249MKR、ENCFF916JME、ENCFF012ENO、ENCFF283GDL、ENCFF348XNA、ENCFF978EJO、ENCFF282MIR、ENCFF779LLA、ENCFF060ISR、ENCFF853NGK、ENCFF373MDU、ENCFF306KYH、ENCFF663AVX、ENCFF678IZX、ENCFF918TYN、ENCFF098RUM、ENCFF585VLM、ENCFF847MPY、ENCFF980YJZ、ENCFF073OSB、ENCFF804QBF、ENCFF192LZC、ENCFF442AJP、ENCFF541AEY、ENCFF753BBR、ENCFF798LHE、ENCFF082ZSO、ENCFF623FPU、ENCFF422TOH、ENCFF240XBY、ENCFF566GDN、ENCFF340YVI、ENCFF703DEV、ENCFF802SFU、ENCFF306ZPW。使用以下標識符自路線圖表觀基因工程項目獲得9個人體組織的WGBS數據:GSM1010983、GSM1010981、GSM983648、GSM983649、GSM1010984、GSM983650、GSM916049、GSM983647、GSM983651、GSM1010987、GSM983645、GSM983646、GSM983652、GSM1120324、GSM1010978、GSM1058027、GSM1059433、GSM1120321。此等數據集之排比及甲基化分析由俾斯麥(Bismark)用編碼WGBS單末端電腦程式進行(Krueger及Andrews 2011)。
自此等數據集中鑑別出假定未甲基化及甲基化CpG位點,甲基化程度截止值分別為≤20%及≥90%。自小鼠數據集,鑑別545,720個假定甲基化CpG及7,140個假定未甲基化CpG。自人類資料集,鑑別出439.114個假定甲基化CpG。
對於末端密度分析,聚集各別CpG位點且展示在±1000 bp及±20 bp窗內之標準化末端密度。標準化末端密度為末端計數除以±1000 bp區域之中值末端計數。具有其覆蓋所鑑別之CpG之C或G的鹼基中之任一者的片段用於計算此等假定未甲基化或甲基化CpG位點處之CpG甲基化。 G.           統計分析
分析由自產生物資訊程式進行,該等程式以Perl及R語言書寫。小於0.05之P值視為統計顯著的且所有概率係雙尾。 V.           實例系統
65示出根據本發明之實施例的量測系統6500。如所示之系統在分析裝置6510內包括諸如游離DNA分子之樣本6505,其中可在樣本6505上執行分析6508。舉例而言,樣本6505可與分析6508之試劑接觸以得到物理特徵6515之信號。分析裝置之實例可為包括分析之探針及/或引子或其中移動小滴之管(其中小滴包括分析)的流量槽。用偵測器6520偵測樣本之物理特性6515(例如,螢光強度、電壓或電流)。偵測器6520可按時間間隔(例如,週期性時間間隔)進行量測,獲得構成數據信號之數據點。在一個實施例中,類比至數位轉換器在複數個時間將來自偵測器之類比信號轉換成數位形式。分析裝置6510及偵測器6520可形成分析系統,例如根據本文所描述之實施例進行測序之測序系統。數據信號6525自偵測器6520發送至邏輯系統6530。作為一實例,數據信號6525可用於確定DNA分子之參考基因體中之序列及/或位置。數據信號6525可包括在同一時間作出之各種量測結果,例如用於樣本6505之不同分子之螢光染料的不同顏色或不同電信號,且因此數據信號6525可對應於多個信號。數據信號6525可儲存於本地記憶體6535、外部記憶體6540或儲存裝置6545中。
邏輯系統6530可為或可包括電腦系統、ASIC、微處理器、圖形處理單元(GPU)等。其亦可包括或耦接顯示器(例如監視器、LED顯示器等)及使用者輸入裝置(例如滑鼠、鍵盤、按鈕等)。邏輯系統6530及其他組件可為獨立的或網路連接之電腦系統的一部分,或其可直接連接至包括偵測器6520及/或分析裝置6510之裝置(例如測序裝置)或併入其中。邏輯系統6530亦可包括在處理器6550中執行之軟體。邏輯系統6530可包括電腦可讀取媒體,其儲存用於控制量測系統6500以執行本文所描述之任一方法的指令。舉例而言,邏輯系統6530可向包括分析裝置6510之系統提供命令,使得測序或其他物理操作得以執行。此類物理操作可以特定次序進行,例如在試劑以特定次序添加及移除之情況下。此類物理操作可由可用於獲得樣本且進行分析之例如包括機械臂之機器人系統執行。
系統6500亦可包括治療裝置6560,其可向個體提供治療。治療裝置6560可確定治療及/或用於進行治療。該治療之實例可包括手術、放射線療法、化學療法、免疫療法、靶向療法、激素療法及幹細胞移植體。邏輯系統6530可連接至治療裝置6560,例如以得到本文所描述之方法之結果。治療裝置可自諸如成像裝置及使用者輸入之其他裝置接收輸入(例如以控制治療,諸如對機器人系統進行控制)。
本文所提及之任一種電腦系統可利用任何適合數目個子系統。該等子系統之實例展示於 66中之電腦系統10中。在一些實施例中,電腦系統包括單一電腦設備,其中子系統可為電腦設備之組件。在其他實施例中,電腦系統可包括具有內部組件之多個電腦設備,其各自為子系統。電腦系統可包括桌上型及膝上型電腦、平板電腦、移動電話及其他移動裝置。
圖66中所示之子系統經由系統匯流排75互連。顯示額外子系統,諸如印表機74、鍵盤78、一個或多個儲存裝置79、與顯示配接器82耦接之監測器76(例如顯示屏幕,諸如LED)及其他裝置。耦接至I/O控制器71上之周邊裝置及輸入/輸出(I/O)器件可藉由此項技術中已知之多種手段(諸如輸入/輸出(I/O)埠77(例如,USB、FireWire ®))連接至電腦系統。例如,I/O埠77或外部介面81(例如乙太網路(Ethernet)、Wi-Fi等)可用於將電腦系統10連接至廣域網路(諸如網際網路)、滑鼠輸入裝置或掃描儀。經由系統匯流排75互連允許中央處理器73與各子系統通信且控制系統記憶體72或儲存裝置79(例如固接磁碟,諸如硬碟機,或光碟)執行複數個指令,以及子系統之間的資訊交換。系統記憶體72及/或一個或多個儲存裝置79可實施為電腦可讀媒體。另一子系統為資料收集裝置85,諸如照相機、麥克風、加速計及其類似物。本文中所提及之資料中之任一者可自一個組件輸出至另一組件且可輸出至使用者。
電腦系統可包括複數個相同組件或子系統,例如藉由外部介面81、藉由內部介面或經由可移式儲存裝置連接到一起,該等可移式儲存裝置可自一個組件連接至另一組件且移除。在一些實施例中,電腦系統、子系統或設備可經網路通信。在此等情況下,可將一台電腦視為用戶端且將另一台電腦視為伺服器,其中每一者可為同一電腦系統之部分。用戶端及伺服器各自可包括多個系統、子系統或組件。
實施例之態樣可使用硬體電路(例如,特殊應用積體電路或場可程式化閘陣列)及/或使用以模組化或整合式方式儲存於具有大體可程式化處理器之記憶體中的電腦軟體以邏輯控制形式實施,且因此處理器可包括儲存組態硬體電路之軟體指令的記憶體以及具有組態指令之FPGA或ASIC。如本文所用,處理器可包括單核處理器、同一個積體晶片上之多核處理器或單一電路板或網路硬體以及專用硬體上之多個處理單元。基於本揭示案及本文中所提供之教示內容,本領域中一般熟習此項技術者將瞭解使用硬體及/或硬體及軟體之組合實施本揭示案之實施例的其他方式及/或方法。
本申請案中所描述之任何軟體組件或功能可使用例如習知或面向對象技術,以軟體程式碼形式實施,軟體程式碼係由使用任何適合電腦語言(諸如Java、C、C++、C#、Objective-C、Swift)或腳本處理語言(諸如Perl或Python)的處理器執行。軟體程式碼可以一系列指令或命令形式儲存於電腦可讀取媒體上進行儲存及/或傳輸。適合之非暫時性電腦可讀媒體可包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、磁性媒體(諸如硬驅動機或軟碟機)或光學媒體(諸如密閉磁碟(CD)或數位光碟(DVD)或藍光光碟)、快閃記憶體及其類似者。電腦可讀取媒體可為此類裝置之任何組合。另外,可重新配置操作之次序。處理程序可在其操作完成時終止,但可具有不包括於圖式中之額外步驟。方法(process)可對應於方法(method)、函數、程序、次常式、次程式等。當方法對應於函數時,其終止可對應於函數返回至調用函數或主函數。
此類程式亦可使用適用於經由符合多種協定之有線、光學及/或無線網路(包括網際網路)傳輸的載波信號來編碼及傳輸。因此,電腦可讀取媒體可使用以此類程式編碼之數據信號建立。以程式碼編碼之電腦可讀取媒體可與相容裝置一起封裝或與其他裝置分開提供(例如經由網際網路下載)。任何此類電腦可讀媒體可存在於單一電腦產品(例如硬碟機、CD或整個電腦系統)上或其內部,且可存在於系統或網路內之不同電腦產品上或其內部。電腦系統可包括用於向使用者提供本文所提及之任何結果的監測器、印表機、或其他適合之顯示器。
本文所描述之方法中之任一種可完全或部分地用電腦系統來進行,該電腦系統包括可經組態以執行步驟之一個或多個處理器。因此,實施例可針對經組態以執行本文所描述之任何方法之步驟的電腦系統,潛在地使用不同組件進行各別步驟或各別步驟組。儘管以帶編號之步驟形式呈現,但本文中之方法之步驟可同時或在不同時間或以不同順序執行。另外,此等步驟之部分可與其他方法之其他步驟之部分一起使用。此外,步驟之全部或部分可為視情況選用的。此外,任何方法之任何步驟可使用用於進行此等步驟之系統的模組、單元、電路或其他構件來進行。
可在不脫離本發明之實施例的精神及範疇的情況下以任何適合方式組合特定實施例之特定細節。然而,本發明之其他實施例可關於與各個別態樣或此等個別態樣之特定組合相關的特定實施例。
已出於說明及描述之目的呈現本發明之實例實施例的上述描述。其並不意欲為詳盡的或將本揭示案限於所描述之精確形式,且鑒於以上教示,許多修改及變化為可能的。
除非有相反的特定說明,否則「一(a/an)」或「該(the)」之敍述欲意謂「一個或多個」。除非相反地特定指示,否則「或」之使用欲意謂「包括性的或」,而非「互斥性的或」。提及「第一」組件不一定需要提供第二組件。此外,除非明確陳述,否則提及「第一」或「第二」組件不會將所提及組件限制於特定位置。術語「基於」意指「至少部分地基於」。
出於所有目的,本文所提及之所有專利、專利申請案、公開案及描述均以全文引用之方式併入。不承認任一者為先前技術。當本申請案與本文所提供之參考文獻之間存在衝突時,應以本申請案為準。
3900:方法 3902:框 3904:框 3906:框 4000:方法 4002:框 4004:框 4006:框 4100:方法 4102:框 4104:框 4106:框 4200:方法 4202:框 4204:框 4206:框 4208:框 4210:框 4300:方法 4302:框 4304:框 4306:框 4308:框 4310:框 4400:方法 4402:框 4404:框 4406:框 4408:框 4410:框 4500:方法 4502:框 4504:框 4506:框 4508:框 4510:框 4512:框 4514:框 4516:框 4518:框 4601:階段 4603:野生型小鼠 4605:Dnase1 / 小鼠 4607:Dnase1l3 / 小鼠 4610:階段 4620:懷孕模型 4623:野生型胎兒 4625:同型接合胎兒 4627:異型接合胎兒 4630:階段 4632:健康對照 4635:DNASE1L3功能損失型突變 4810:第一峰簇 4820:第二峰簇 5500:方法 5502:框 5504:框 5506:框 5601:步驟 5603:線性 5606:環狀 5610:步驟 5615:步驟 5620:步驟 5625:步驟 5700:方法 5710:框 5720:框 5730:框 5800:方法 5802:框 5804:框 5806:框 5900:方法 5902:框 5904:框 5906:框 6000:過程 6010:框 6020:框 6030:框 6040:框 6050:框 6060:框 6100:基因體 6102:「藍色」區域 6104:限制酶識別位點 6106:「紅色」區域 6110:eccDNA 6112:環狀接合基因座 6120:步驟 6125:DNA分子 6135:DNA分子 6140:步驟 6145:序列 6146:序列 6148:序列 6150:步驟 6152:未定位區段 6154:未定位區段 6156:反轉末端序列 6158:反轉末端序列 6202:種子區域 6204:種子區域 6205:「分裂位點」 6207:讀段 6212:接合點 6250:「分裂位點」 6500:量測系統 6505:樣本 6508:分析 6510:分析裝置 6515:物理特徵 6520:偵測器 6525:數據信號 6530:邏輯系統 6535:本地記憶體 6540:外部記憶體 6545:儲存裝置 6550:處理器 6560:治療裝置 71:控制器 72:系統記憶體 73:中央處理器 74:列印機 75:系統匯流排 76:監測器 77:端口 78:鍵盤 79:儲存裝置 81:外部介面 82:顯示配接器 85:資料收集裝置
1展示根據本發明之實施例,在全基因體層面上來自 Dnase1l3缺陷小鼠之cfDNA係低甲基化的且來自 Dnase1缺陷小鼠之cfDNA係高甲基化的。自各樣本之血漿cfDNA及白血球層基因體DNA中所有經測序片段計算總體CpG甲基化百分比。對成對血漿及白血球層樣本進行威爾科克森符號秩檢驗(Wilcoxon signed-rank test)。對野生型及 Dnase1l3缺陷樣本進行威爾卡森秩和檢驗。
2A 2B 2C 2D2E展示根據本發明之實施例相對於某些位點之中位CpG甲基化百分比。展示轉錄起始位點中來自每一基因型之cfDNA之中值CpG甲基化百分比(圖2A)RNA聚合酶II位點(圖2B)、H3K4me3標記區域(圖2C)、H3K27ac標記區域(圖2D),及隨機區域(圖2E)。各樣本中之所有片段之CpG甲基化百分比係在每一此等聚集區域上計算且各基因型之中值以±3000 bp窗展示。WT小鼠之cfDNA係綠色, Dnase1l3缺陷小鼠係紅色,且 Dnase1缺陷小鼠係藍色。
3展示WT、 Dnase1l3缺陷小鼠及 Dnase1缺陷小鼠之cfDNA大小剖析。使用所有樣本片段對各基因型之中值cfDNA大小剖析作圖。來自WT小鼠之cfDNA係綠色, Dnase1l3缺陷小鼠係紅色,且 Dnase1缺陷小鼠係藍色。
4A 4B4C展示根據本發明之實施例之未甲基化及甲基化片段的大小剖析。在野生型cfDNA內比較0%甲基化片段(橙色)及100%甲基化片段(紫色)之大小剖析(圖4A),Dnase1l3缺陷(圖4B)及Dnase1缺陷小鼠(圖4C)。
5A5B展示根據本發明之實施例僅使用0%甲基化片段或僅100%甲基化片段(圖5B)之來自不同基因型之cfDNA的大小剖析(圖5A)。
6A 6B 6C 6D 6E6F展示根據本發明之實施例,不同基因型在距離各個位點之相對距離處的標準化末端密度。
7展示根據本發明之實施例之OCR及CpG島(CGI)中的片段之大小剖析。展示OCR及CGI內部之片段的中值cfDNA大小剖析。來自野生型小鼠之cfDNA係綠色, Dnase1l3缺陷小鼠係紅色,且 Dnase1缺陷小鼠係藍色。所有野生型片段之cfDNA大小剖析展示為灰色比較。
8展示根據本發明之實施例不同基因型之OCR及CGI區域中之片段的比例。來自Dnase1l3缺陷小鼠之cfDNA具有顯著增加之比例的OCR及CGI片段。在野生型及Dnase1l3缺陷小鼠樣本之間進行威爾卡森秩和檢驗。
9展示根據本發明之實施例在掩蔽分析中生物資訊排除OCR及CGI片段之後的CpG甲基化百分比。CpG甲基化百分比在此等片段經掩蔽之後增加。來自 Dnase1l3缺陷小鼠之cfDNA的相對低甲基化在掩蔽之後基本上減少,但仍顯著不同於野生型小鼠之cfDNA甲基化。在野生型及 Dnase1l3缺陷樣本之間進行威爾卡森秩和檢驗。
10A-10C為展示根據本發明之實施例,在掩蔽OCR及CGI片段之前(外環)及之後(內環)的全基因體CpG甲基化百分比的圓圖。各點表示小鼠體染色體之1 Mb基因區域中之CpG甲基化百分比且若≥70%,則為藍色,且若<70%,則為紅色。針對野生型之圓圖展示(圖10A) Dnase1l3缺陷(圖10B)及 Dnase1缺陷小鼠(圖10C)。
11為根據本發明之實施例不同基因型之特定大小之所有片段的中值CpG甲基化百分比的圖。
12為根據本發明之實施例不同基因型在各片段大小內之OCR及CGI片段之比例的圖。
13為根據本發明之實施例,在掩蔽OCR及CGI片段之後,各片段大小之CpG甲基化百分比的圖。
14A 14B14C展示根據本發明之實施例,其中在野生型(圖14A)、Dnase1l3缺陷(圖14B)及Dnase1缺陷小鼠(圖14C)中掩蔽OCR及CGI片段之前及之後各片段大小的CpG甲基化百分比。
15A15B展示根據本發明之實施例野生型、Dnase1l3缺陷及Dnase1缺陷小鼠中假定未甲基化CpG(圖15A)及假定甲基化CpG(圖15B)之血漿cfDNA甲基化百分比。
16A 16B16C展示標準化末端密度優於根據本發明之實施例的假定甲基化CpG。鑑別假定甲基化CpG,且藉由±1000 bp區域之中值末端計數標準化此等CpG之血漿cfDNA末端密度。±1000 bp窗(圖16A)及±20 bp窗(圖16B、圖16C)。所鑑別之C置放於位置0處。展示所有野生型樣本(綠色)及所有 Dnase1缺陷小鼠樣本(藍色)之標準化末端密度之間的比較(圖16B)。展示所有野生型樣本(綠色)及所有 Dnase1l3缺陷小鼠樣本(紅色)之標準化末端密度之間的比較(圖16C)。
17A 17B17C展示相對於根據本發明之實施例之假定未甲基化CpG的標準化末端密度。鑑別假定未甲基化CpG,且藉由±1000 bp區域之中值末端計數標準化此等CpG之血漿cfDNA末端密度。展示±1000 bp窗(圖17A)及±20 bp窗(圖17B、17C)。所鑑別之C置放於位置0處。展示所有野生型樣本(綠色)及所有 Dnase1缺陷小鼠樣本(藍色)之標準化末端密度之間的比較(圖17B)。展示所有野生型樣本(綠色)及所有 Dnase1l3缺陷小鼠樣本(紅色)之標準化末端密度之間的比較(圖17C)。
18展示根據本發明之實施例,展示人類血漿(橙色)及白血球層(紫色)樣本之CpG甲基化百分比。H2、H4及V11具有同型接合移碼c.290_291delCA(p.Thr97Ilefs*2)突變,且H1係H2及H4之異型接合親本。展示8個對照樣本之中值。
19A19B展示在聚集TSS區域上計算之各樣本之片段的CpG甲基化百分比(圖19A)及隨機區域(圖19B)。各樣本類型之中值展示在±3000 bp窗中。
20A20B展示根據本發明之實施例使用僅0%甲基化片段(圖20A)或僅100%甲基化片段(圖20B)繪製之各個體類型之中值cfDNA大小剖析。
21A21B展示相對於聚集TSS區域(圖21A)及隨機區域(圖21B)±1000 bp窗口中各樣本類型之中值標準化末端密度。
22展示根據本發明之實施例的OCR及CGI區域中之片段的比例。OCR定義為圍繞TSS、PoI II、H3K4me3及H3K27ac區域之中心的區域±500 bp。來自 DNASE1L3缺陷個體之cfDNA具有顯著增加比例之OCR及CGI片段。在對照與 DNASE1L3缺陷之個體之間進行威爾卡森秩和檢驗。
23A 23B23C展示根據本發明之實施例來自正常(圖23A)及DNASE1L3缺陷之患者(圖23B及23C)之圓圖展示在掩蔽OCR及CGI片段之前(外環)及之後(內環)的全基因體CpG甲基化百分比。各點表示小鼠體染色體之1 Mb基因區域中之CpG甲基化百分比且若≥70%,則為藍色,且若<70%,則為紅色。紅色點比藍色點更接近中心。
24展示根據本發明之實施例,±20 bp窗中相對於假定甲基化CpG之標準化末端密度。所鑑別之C位於位置0。來自對照樣本之cfDNA呈淺綠色,異型接合 DNASE1L3親本呈深綠色,且DNASE1L3缺陷個體呈紅色。
25說明根據本發明之實施例的DNASE1及DNASE1L3之推斷活性。
26展示根據本發明之實施例來自對照個體(CTR)、慢性乙型肝炎載體(HBV)及患有肝細胞癌(HCC)患者之cfDNA CpG甲基化。自各樣本之血漿cfDNA中之所有亞硫酸氫鹽測序片段計算總體CpG甲基化百分比。來自HCC患者之cfDNA在全基因體層面上相對低甲基化,但使用威爾卡森秩和檢驗差異在統計學上不顯著( P值=0.14)。
27A27B展示根據本發明之實施例的OCR及CGI區域中之片段的百分比。TSS、H3K4me3及H3K27ac區域中心周圍之區域±500 bp與CGI區域合併。圖27A展示來自對照個體(CTR)、慢性乙型肝炎載體(HBV)及患有肝細胞癌(HCC)之患者之此等OCR及CGI區域中之片段的比例。來自HCC患者之cfDNA具有顯著降低的來自對照( P值=0.009,威爾卡森秩和檢驗)之OCR及CGI片段的比例。圖27B展示來自對照個體(CTR)、患有低度非肌侵襲性膀胱癌(NMIBC_LG)、高度非肌侵襲性膀胱癌(NIMBC_HG)及高度肌肉侵襲性膀胱癌(MIBC_HG)之患者之此等OCR及CGI區域中之片段的比例。來自患有所有三種類型膀胱癌之患者的cfDNA與對照( P值=0.003,威爾卡森秩和檢驗)相比具有OCR及CGI片段之顯著降低之比例。
28展示根據本發明之實施例的OCR及CGI區域中之片段的百分比。TSS、H3K4me3及H3K27ac區域中心周圍之區域±500 bp與CGI區域合併。展示此等OR及CGI區域中之胎兒特異性片段及母體特異性片段的比例。此等OCR及CGI區域中之胎兒特異性片段顯著低於母體特異性片段( P值=9.2 E-06,威爾卡森秩和檢驗)。
29為展示另一組開放染色質區域之表格,其包括轉錄起始位點(TSS)、CCCTC-結合因子(CTCF)位點、DNase1超敏位點(DNaseI)及H3K27ac、H3K4me3及H3K4me1組蛋白標記。
30為展示根據本發明之實施例,健康個體(內環)、無活動性SLE患者(中間環)及活動性SLE患者(外環)中之全基因體中之1 Mb基因區域中之基因體表示的圈圖。各點表示1 Mb組之基因體表示,且若-3 SD來自健康對照組中之平均基因體表示,則呈紅色,且若+3 SD來自健康對照組中之平均基因體表示,則呈綠色。活動性SLE患者患有具有廣泛發散基因體分佈之cfDNA。
31為根據本發明之實施例之所量測基因體表示(MGR)計算之示意圖。
32為根據本發明之實施例在生物資訊移除開放染色質區域之後的基因體表示。開放染色質區域經電腦模擬移除且經量測基因體表示(MGR)如圖31中所說明計算。
33為根據本發明之實施例,在電腦模擬移除開放染色質區域(內環)之前及在電腦模擬移除開放染色質區域(外環)之後,具有活動性SLE之患者(S112)中MGR之圈圖。如所說明,拷貝數畸變歸因於開放染色質區域之電腦模擬移除而標準化。
34為根據本發明之實施例,在電腦模擬移除開放染色質區域(內環)之前及在電腦模擬移除開放染色質區域(外環)之後,HCC患者中MGR之圈圖。在實例HCC情況中,在掩蔽OCR區域之前及之後不存在實質性變化。
35為根據本發明之實施例,在電腦模擬移除開放染色質區域之前及之後來自SLE患者、HCC患者及健康個人之樣本中MGR之盒圖表示。具有異常MGR之組之百分比(超過+3 SD或小於-3 SD)在生物資訊掩蔽健康對照及HCC患者中之OCR之前及之後類似。另一方面,在掩蔽OCR之後,SLE患者顯著不同。使用威爾卡森秩和檢驗。此等結果指示,在MGR畸變分析中掩蔽開放染色質區域可用於減少假陽性結果。
36A36B展示根據本發明之實施例,與對照個人(CTR)、慢性乙型肝炎載體(HBV)及患有肝細胞癌(HCC)患者中假定甲基化CpG(圖36A)或假定未甲基化CpG(圖36B)之至少1個鹼基重疊的片段百分比。假定甲基化CpG之覆蓋在CTR相對於HCC方面並不顯著不同(P值0.89,威爾卡森秩和檢驗),而假定未甲基化CpG之覆蓋在HCC中相對於CTR顯著較低(P值8.4 E-05,威爾卡森秩和檢驗)。藉由分析組織樣本之下載資料集以鑑別一致甲基化或未甲基化之CpG位點,例如甲基化程度高於(高甲基化)或低於(低甲基化)指定值之CpG位點,來區別假定甲基化CpG位點(假定高甲基化或假定低甲基化CPG位點)。
37A37B展示根據本發明之實施例,與對照個人(對照)、患有無活動性SLE之患者及患有活動性SLE患者中假定甲基化CpG(圖37A)或假定未甲基化CpG(圖37B)之至少1個鹼基重疊的片段百分比。假定甲基化CpG之覆蓋在對照中相對於活動性SLE方面並無顯著差異( P值0.57,威爾卡森秩和檢驗),而假定未甲基化CpG之覆蓋在活動性SLE中相對於對照方面顯著較低( P值0.04,威爾卡森秩和檢驗)。
38A38B展示根據本發明之實施例,與胎兒特異性片段及母體特異性片段中假定甲基化CpG(圖38A)或假定未甲基化CpG(圖38B)之至少1個鹼基重疊的片段百分比。假定甲基化CpG之覆蓋在胎兒特異性片段中與母體特異性片段相比顯著較低( P值3.2 E-06,威爾卡森秩和檢驗)。假定未甲基化CpG之覆蓋在胎兒特異性片段中與母體特異性片段相比不顯著較低( P值0.06,威爾卡森秩和檢驗)。
39為說明根據本發明之實施例,使用包括游離DNA之個體之生物樣本偵測與核酸酶有關之基因之遺傳病症的方法之流程圖。
40為說明根據本發明之實施例,用於確定患有血液病症之個體之治療功效的方法之流程圖。
41為說明根據本發明之實施例,用於使用包括游離DNA之個體之生物樣本監測核酸酶之活性的方法之流程圖。
42為說明根據本發明之實施例,用於分析包括游離DNA之個體之生物樣本的方法之流程圖。
43為說明根據本發明之實施例,用於使用包括游離DNA之個體之生物樣本監測核酸酶之活性的方法之流程圖。
44為說明根據本發明之實施例,用於估測個體之生物樣本中之臨床相關DNA分子之分率濃度的方法之流程圖。
45為說明根據本發明之實施例,用於分析包括游離DNA之個體之生物樣本的方法之流程圖。
46說明根據本發明之實施例,研究核酸酶對血漿染色體外環狀DNA(eccDNA)之作用的實驗設計。
47展示根據本發明之實施例,野生型小鼠及缺乏DNASE1或DNASE1L3之小鼠中之eccDNA計數分佈。
48A-48C展示根據本發明之實施例,小鼠之三組中之eccDNA大小頻率。
48D展示根據本發明之實施例對應於三組小鼠中之eccDNA大小頻率的曲線下面積(AUC)比率。
48E說明在eccDNA大小頻率圖中測定第一峰簇及第二峰簇之AUC值的實例。
48F展示根據本發明之實施例對應於圖48A-48C中各組小鼠之第一峰簇及第二峰值簇的AUC值。
49A-49C展示根據本發明之實施例,使用標籤自三組小鼠中之肝獲得之eccDNA的大小分佈。
49D-49F展示根據本發明之實施例,使用標籤自三組小鼠中之白血球層獲得之eccDNA的大小分佈。
49G展示根據本發明之實施例對應於圖49A-49C之三組小鼠之eccDNA大小分佈中兩個峰之AUC比率。
49H展示根據本發明之實施例對應於圖49D-49F之三組小鼠之eccDNA大小分佈中兩個峰之AUC比率。
50A-50C展示根據本發明之實施例,使用滾環擴增(RCA)自三組小鼠中之肝獲得之eccDNA的大小分佈。
50D-50F展示根據本發明之實施例,使用RCA自三組小鼠中之白血球層獲得之eccDNA的大小分佈。
50G展示根據本發明之實施例對應於圖49A-49C之三組小鼠之eccDNA大小分佈中兩個峰之AUC比率。
50H展示根據本發明之實施例對應於圖49D-49F之三組小鼠之eccDNA大小分佈中兩個峰之AUC比率。
51展示根據本發明之實施例,母體血漿中小鼠懷孕樣本及其各別eccDNA胎兒部分之資訊。
52A-52C展示根據本發明之實施例,三組懷孕小鼠中總血漿eccDNA之平均大小分佈。
52D根據本發明之實施例展示母體eccDNA之平均大小分佈。
52E展示根據本發明之實施例,胎兒eccDNA之平均大小分佈。
53A展示根據本發明之實施例之自收集自4名健康人類個體之血漿樣本彙集的eccDNA之大小剖析。
53B展示根據本發明之實施例,自3名具有 DNASE1L3之功能損失型突變之人類個體收集之4個血漿樣本彙集之eccDNA的大小剖析。
53C展示根據本發明之實施例,健康對照與DNASE1L3突變個體之間的AUC比率之比較(圖53A及53B中所示)。
54A-54D展示根據本發明之實施例,分別自4名健康人類個體收集之eccDNA血漿樣本之大小剖析。
54E54F展示根據本發明之實施例,自第一人類個體收集之血漿樣本中之eccDNA與血液透析前及血液透析後之DNASE1L3之功能損失型突變的大小剖析。
54G54H展示根據本發明之實施例,自具有DNASE1L3之功能損失型突變之兩個不同人類個體收集之血漿樣本中eccDNA的大小剖析。
55為說明根據本發明之實施例使用eccDNA之大小以使用包括游離eccDNA之個體之生物樣本偵測與核酸酶相關之基因之遺傳病症的方法之流程圖。
56說明根據本發明之實施例,用於樣本製備及組織eccDNA鑑別之兩種不同方法。
57為說明根據本發明之實施例用於確定患有血液病症之個體之治療功效的方法之流程圖。
58為說明根據本發明之實施例,使用包括eccDNA之個體之生物樣本監測核酸酶活性的方法之流程圖。
59為說明根據本發明之實施例使用eccDNA之量以使用包括游離DNA之個體之生物樣本偵測與核酸酶相關之基因之遺傳病症的方法之流程圖。
60為說明根據本發明之實施例分析生物樣本以定量eccDNA之量的方法之流程圖。
61展示根據本發明之實施例用於eccDNA鑑別之實例技術。
62A62B展示根據本發明之實施例用於接合點搜尋方法之示意性方法。
63為展示自根據本發明之實施例測序獲得之片段計數的表格。
64為根據本發明之實施例,各樣本在缺失區域上血漿cfDNA覆蓋度之曲線圖。
65說明根據本發明之實施例之量測系統。
66展示可與根據本發明之實施例的系統及方法一起使用的實例電腦系統的方塊圖。

Claims (88)

  1. 一種使用個體之包括游離DNA的生物樣本來監測核酸酶之活性之方法,該方法包含: 接收對該個體之該生物樣本中之游離DNA片段進行測序而獲得的序列讀段,該等序列讀段指示該等游離DNA片段之位點處之甲基化狀態; 使用該等序列讀段之該等甲基化狀態確定該等游離DNA片段之甲基化程度,該甲基化程度使用複數個位點處之序列讀段確定;及 將該甲基化程度與參考值進行比較,以確定該核酸酶之活性的分類。
  2. 如請求項1之方法,其中該核酸酶之活性的該分類係該活性異常, 該方法進一步包含: 使用該核酸酶之活性的該分類確定癌症等級之分類。
  3. 如請求項1之方法,其中該甲基化程度係針對所有CpG位點經甲基化或未經甲基化之游離DNA片段。
  4. 如請求項1之方法,其中確定該甲基化程度不包括處於開放染色質區域或CpG島中之位點。
  5. 如請求項4之方法,其中該參考值係使用包括開放染色質區域或CpG島中之位點處的甲基化狀態確定的。
  6. 如請求項4之方法,其中該甲基化程度對應於甲基化密度低於指定百分比之多個區域。
  7. 如請求項1至6中任一項之方法,其中確定該甲基化程度僅包括在參考基因體中低甲基化之位點。
  8. 如請求項1至7中任一項之方法,其中該甲基化程度係針對具有指定尺寸之該等游離DNA片段確定的。
  9. 一種用於分析個體之包括游離DNA之生物樣本的方法,該方法包含: 鑑別在參考基因體中全部低甲基化或全部高甲基化的第一組CpG位點; 接收對該個體之該生物樣本中之游離DNA片段進行測序而獲得的序列讀段; 將該等序列讀段與該參考基因體進行排比以確定該參考基因體中對應於該等游離DNA片段的基因體位置; 使用經排比序列讀段確定覆蓋該第一組CpG位點之該等游離DNA片段的相對豐度;及 將該相對豐度與參考值進行比較,以確定該個體之病況之等級。
  10. 如請求項9之方法,其中該病況之該等級為基因在該個體中是否展現出遺傳病症,且其中該基因與核酸酶相關聯。
  11. 如請求項9之方法,其中該病況為癌症。
  12. 如請求項9之方法,其中該病況為自體免疫疾病。
  13. 一種使用個體之包括游離DNA的生物樣本來監測核酸酶之活性之方法,該方法包含: 鑑別在參考基因體中全部低甲基化或在該參考基因體中全部高甲基化的第一組CpG位點; 接收對該個體之該生物樣本中之游離DNA片段進行測序而獲得的序列讀段; 將該等序列讀段與該參考基因體進行排比以確定該參考基因體中對應於該等游離DNA片段的基因體位置; 使用經排比序列讀段確定覆蓋該第一組CpG位點之該等游離DNA片段的相對豐度;及 將該相對豐度與參考值進行比較,以確定該核酸酶之活性的第一分類。
  14. 如請求項13之方法,其中該核酸酶之活性的該第一分類係該活性異常, 該方法進一步包含: 使用該核酸酶之活性的該第一分類確定癌症等級之第二分類。
  15. 如請求項13之方法,其中該參考值係由對參考個體中之核酸酶活性之量測確定的。
  16. 如請求項15之方法,其中該第一分類為該核酸酶之活性的數值表示。
  17. 如請求項9及13中任一項之方法,其中該等游離DNA片段之該相對豐度係與第二組CpG位點有關。
  18. 如請求項17之方法,其中該等游離DNA片段之該相對豐度係針對具有指定尺寸之該等游離DNA片段確定的。
  19. 如請求項18之方法,其中該指定尺寸為尺寸範圍。
  20. 如請求項10或13之方法,其中: 該等游離DNA片段之該相對豐度係與第二組CpG位點有關,及 該相對豐度為覆蓋該第一組CpG位點之序列讀段的末端密度。
  21. 如請求項9及13中任一項之方法,其中該等游離DNA片段之該相對豐度為覆蓋該第一組CpG位點之該等游離DNA片段之尺寸分佈的統計值。
  22. 如請求項21之方法,其中該統計值為覆蓋該第一組CpG位點且具有第一尺寸的第一量之該等游離DNA片段相對於覆蓋該第一組CpG位點且具有第二尺寸的第二量之該等游離DNA片段的尺寸比。
  23. 一種評估個體之生物樣本中之臨床相關DNA分子之分率濃度的方法,該生物樣本包括來自複數種組織類型之游離DNA分子之混合物,該方法包含: 鑑別在參考基因體中全部低甲基化或在該參考基因體中全部高甲基化的第一組CpG位點; 接收對該個體之該生物樣本中之游離DNA片段進行測序而獲得的序列讀段; 將該等序列讀段與該參考基因體進行排比以確定該參考基因體中對應於該等游離DNA片段的基因體位置; 使用經排比序列讀段確定覆蓋該第一組CpG位點之該等游離DNA片段的相對豐度;及 藉由將該相對豐度與由一個或多個校準樣本所確定之一個或多個校準值進行比較,估測該生物樣本中之該等臨床相關DNA分子之分率濃度,該等一個或多個校準樣本中之該等臨床相關DNA分子之分率濃度已知。
  24. 如請求項23之方法,其中該等臨床相關DNA分子為腫瘤DNA分子。
  25. 如請求項23之方法,其中該等臨床相關DNA分子為胎兒DNA分子。
  26. 如請求項23之方法,其中該一個或多個校準值係藉由量測該一個或多個校準樣本中覆蓋該等CpG位點的游離DNA片段之相對豐度來確定的。
  27. 如請求項23之方法,其中將該相對豐度與該一個或多個校準值進行比較包含將該相對豐度輸入至校準函數中。
  28. 一種用於分析個體之包括游離DNA之生物樣本的方法,該方法包含: 接收對該個體之該生物樣本中之游離DNA片段進行測序而獲得的序列讀段; 使用該等序列讀段確定參考基因體中對應於該等游離DNA片段之至少一個末端的基因體位置; 針對複數個區段中的每一者: 確定該區段中之序列讀段之第一量;及 將該第一量與第一參考值進行比較,以確定該區段是否具有拷貝數畸變; 確定具有拷貝數畸變之區段的第一數目; 針對複數個經掩蔽區段中的每一者: 確定該經掩蔽區段中之序列讀段的第二量,其中該複數個經掩蔽區段經掩蔽以排除開放染色質區域;及 將該第二量與第二參考值進行比較,以確定該經掩蔽區段是否具有拷貝數畸變; 確定具有拷貝數畸變之經掩蔽區段的第二數目;及 基於該第一數目及該第二數目確定該個體是否具有病況。
  29. 如請求項28之方法,其中該病況為自體免疫疾病。
  30. 如請求項29之方法,其中該病況為SLE。
  31. 如請求項28之方法,其中該病況為癌症。
  32. 一種使用個體之包括游離DNA之生物樣本來偵測與核酸酶相關聯之基因的遺傳病症之方法,該方法包含: 接收對該個體之該生物樣本中之游離DNA片段進行測序而獲得的序列讀段,該等序列讀段指示該等游離DNA片段之位點處之甲基化狀態; 使用該等序列讀段之該等甲基化狀態確定該等游離DNA片段之甲基化程度,該甲基化程度使用複數個位點處之序列讀段確定;及 將該甲基化程度與參考值進行比較,以確定該基因在該個體中是否展現出該遺傳病症之分類。
  33. 一種用於確定患有血液病症之個體之治療功效的方法,該方法包含: 接收對該個體之血液樣本中之游離DNA片段進行測序而獲得的序列讀段,該血液樣本係在投與該個體第一劑量之抗凝血劑之後獲得的,其中該等序列讀段指示在該等游離DNA片段之位點處之甲基化狀態; 使用該等序列讀段之該等甲基化狀態確定該等游離DNA片段之甲基化程度,該甲基化程度使用複數個位點處之序列讀段確定;及 將該甲基化程度與參考值進行比較,以確定該治療之該功效的分類。
  34. 如請求項32或33之方法,其中該甲基化程度係針對所有CpG位點經甲基化或未經甲基化之游離DNA片段。
  35. 如請求項32或33之方法,其中確定該甲基化程度不包括處於開放染色質區域或CpG島中之位點。
  36. 如請求項35之方法,其中該參考值係使用包括開放染色質區域或CpG島中之位點處的甲基化狀態確定的。
  37. 如請求項35之方法,其中該甲基化程度對應於甲基化密度低於指定百分比之多個區域。
  38. 如請求項32至37中任一項之方法,其中確定該甲基化程度僅包括在參考基因體中低甲基化之位點。
  39. 如請求項7、9、13、23或38中任一項之方法,其中藉由以下方式確定該參考基因體中之位點係低甲基化的: 將該參考基因體中在該位點處之甲基化程度與臨限值進行比較,及 確定該參考基因體中之該甲基化程度低於該臨限值。
  40. 如請求項9、13或23中任一項之方法,其中藉由以下方式確定該參考基因體中之位點係高甲基化的: 將該參考基因體中在該位點處之甲基化程度與臨限值進行比較,及 確定該參考基因體中之該甲基化程度高於該臨限值。
  41. 如請求項32至38中任一項之方法,其中該甲基化程度係針對具有指定尺寸之該等游離DNA片段確定的。
  42. 如請求項9、13或23中任一項之方法,其中該相對豐度包含覆蓋該第一組CpG位點之片段百分比。
  43. 一種使用個體之包括游離DNA之生物樣本來偵測與核酸酶相關聯之基因的遺傳病症之方法,該方法包含: 接收對該個體之該生物樣本中之染色體外環狀DNA(eccDNA)之游離DNA片段進行測序而獲得的序列讀段; 使用該等序列讀段確定該等游離DNA片段之尺寸分佈的尺寸值,該尺寸值表徵一個或多個尺寸之該等游離DNA片段之量;及 將該尺寸值與參考值進行比較,以確定該基因在該個體中是否展現出該遺傳病症的分類。
  44. 如請求項43之方法,其中該個體懷有胎兒。
  45. 如請求項44之方法,其進一步包含將該尺寸值與該參考值進行比較,以確定該基因在該胎兒中是否展現出該遺傳病症的分類。
  46. 如請求項45之方法,其進一步包含使用該尺寸值與該參考值之該比較來確定該胎兒之基因型。
  47. 如請求項44之方法,其中該參考值係自一個或多個第一參考個體確定的第一參考值,該一個或多個第一參考個體懷有在一位置處對於第一對偶基因係同型接合之胎兒,該方法進一步包含: 將該尺寸值與自一個或多個第二參考個體確定之第二參考值進行比較,該一個或多個第二參考個體懷有在該位置處對於第二對偶基因係同型接合之胎兒,其中該第二對偶基因不同於該第一對偶基因,及 當該尺寸值介於該第一參考值與該第二參考值之間時,確定該胎兒在該位置處為異型接合的。
  48. 如請求項43之方法,其中該參考值係自該基因未展現出該遺傳病症的個體確定的。
  49. 如請求項43之方法,其中該參考值係自該基因展現出該遺傳病症的個體確定的。
  50. 如請求項43之方法,其中該基因為 DNASE1L3
  51. 一種使用個體之包括eccDNA的生物樣本來監測核酸酶之活性之方法,該方法包含: 接收對該個體之該生物樣本中之eccDNA的游離DNA片段進行測序而獲得的序列讀段; 使用該等序列讀段確定該等游離DNA片段之尺寸分佈的尺寸值,該尺寸值表徵一個或多個尺寸之游離DNA片段之量;及 將該尺寸值與參考值進行比較,以確定該核酸酶之活性的分類。
  52. 如請求項51之方法,其中該參考值係自健康個體確定的。
  53. 如請求項51之方法,其中該參考值係在改變該核酸酶之活性的治療之前自該個體確定的。
  54. 如請求項53之方法,其中該治療係血液透析。
  55. 如請求項51之方法,其中該核酸酶為DNASE1L3。
  56. 如請求項51之方法,其中該分類為該核酸酶之活性缺乏。
  57. 如請求項56之方法,其中該尺寸值指示游離DNA片段比該參考值更長。
  58. 如請求項51之方法,其中該分類為該個體患有特徵為核酸酶活性缺乏之病況。
  59. 如請求項58之方法,其中該參考值係自無該病況之個體確定的。
  60. 如請求項51之方法,其中該參考值係由對參考個體中之核酸酶活性之量測確定的。
  61. 如請求項60之方法,其中該分類為該核酸酶之活性的數值表示。
  62. 如請求項43或51之方法,其中該核酸酶為第一核酸酶,且在對eccDNA之游離DNA片段進行測序之前,用第二核酸酶處理該生物樣本以移除線性DNA。
  63. 如請求項62之方法,其進一步包含: 用該核酸酶處理該生物樣本,及 對該等游離DNA片段進行測序以產生該等序列讀段。
  64. 一種用於確定具有特徵為核酸酶活性缺乏之病況之個體的治療功效的方法,該方法包含: 接收對該個體之生物樣本中之eccDNA的游離DNA片段進行測序而獲得的序列讀段,該生物樣本係在投與該個體第一劑量之該治療之後獲得的; 使用該等序列讀段確定該等游離DNA片段之尺寸分佈的尺寸值,該尺寸值表徵一個或多個尺寸之游離DNA片段之量;及 將該尺寸值與參考值進行比較,以確定該治療功效的分類。
  65. 如請求項43、51或64中任一項之方法,其中該生物樣本係血漿。
  66. 如請求項43、51或64中任一項之方法,其中該尺寸值為具有第一尺寸之該等游離DNA片段之第一量與具有第二尺寸之該等游離DNA片段之第二量的比率,其中該第一尺寸與該第二尺寸不同。
  67. 如請求項66之方法,其中該第一尺寸為150至250 bp且該第二尺寸為300至450 bp。
  68. 如請求項66之方法,其中該第一尺寸與該第二尺寸相隔至少100個鹼基對。
  69. 如請求項43、51或64之方法,其中該尺寸值為該尺寸分佈之統計值。
  70. 如請求項43、51或64之方法,其中該尺寸值為具有一定尺寸的游離DNA片段之量。
  71. 一種使用個體之包括游離DNA之生物樣本來偵測與核酸酶相關聯之基因的遺傳病症之方法,該方法包含: 接收對該個體之該生物樣本中之染色體外環狀DNA(eccDNA)之游離DNA片段進行測序而獲得的序列讀段; 使用該等序列讀段確定對應於該生物樣本中之eccDNA之量的參數值; 將該參數值與參考值進行比較,以確定該基因在該個體中是否展現出該遺傳病症的分類。
  72. 如請求項71之方法,其中該參數為eccDNA之量與可定位讀段之量的比率。
  73. 一種分析包括游離DNA之個體之生物樣本的方法,該游離DNA之至少一部分為染色體外環狀(eccDNA),該方法包含: 接收對由該個體之該生物樣本製備之混合物中之染色體外環狀DNA(eccDNA)的游離DNA片段進行測序而獲得的第一組序列讀段,該混合物包括來自已知量之具有特定尺寸之環狀DNA的DNA片段; 使用該第一組序列讀段量測該等游離DNA片段之尺寸; 確定對應於第一尺寸之該第一組序列讀段之第一量; 確定對應於第二尺寸之該第一組序列讀段之第二量,該第二尺寸為該混合物中該已知量之環狀DNA的特定尺寸; 將該第一量與校準資料點進行比較,該校準資料點使用對應於該第二尺寸之第二組序列讀段之該第二量確定; 使用該比較確定該混合物中對應於該第一尺寸之來自eccDNA之游離DNA片段的量。
  74. 如請求項73之方法,其中: 該校準資料點為校準曲線之點, 該校準曲線使用對應於該第二尺寸之序列讀段之一個或多個額外量確定,該一個或多個額外量中之每一者對應於一種或多種額外混合物中之該環狀DNA之一個或多個額外已知量。
  75. 如請求項74之方法,其中該校準曲線係藉由使曲線擬合至表示該第一量及該已知量以及該一個或多個額外量及該一個或多個額外已知量之點來確定的。
  76. 如請求項74之方法,其中該混合物及該一種或多種額外混合物各具有相同量之來自該生物樣本之eccDNA。
  77. 如請求項76之方法,其進一步包含: 將該生物樣本中之該eccDNA分成該混合物及該一種或多種額外混合物, 將該第二尺寸之該已知量的環狀DNA添加至該混合物中, 將該額外已知量之該環狀DNA添加至該一種或多種額外混合物中。
  78. 如請求項73至77中任一項之方法,其中該校準資料點具有表示該第二組序列讀段之該第二量的第一座標及表示該已知量之第二座標。
  79. 如請求項77之方法,其進一步包含: 用酶處理該混合物及該一種或多種額外混合物以移除線性DNA, 使該混合物及該一種或多種額外混合物中之該eccDNA及該環狀DNA線性化,以形成線性化eccDNA及線性化環狀DNA, 對該線性化eccDNA進行測序,以獲得該一種或多種額外混合物中之每一者之該第一組序列讀段及一個或多個第三組序列讀段,及 對該線性化環狀DNA進行測序,以獲得該一種或多種額外混合物中之每一者之該第二組序列讀段及一個或多個第四組序列讀段。
  80. 如請求項73至79中任一項之方法,其進一步包含: 使用該混合物中對應於該第一尺寸之來自eccDNA的游離DNA片段的量來確定參數值,及 將該參數值與參考值進行比較,以確定基因在該個體中是否展現出遺傳病症的分類。
  81. 如請求項80之方法,其中: 該校準資料點為第一校準資料點,及 該量為第一量; 該方法進一步包含: 確定該混合物中對應於來自eccDNA之游離DNA片段之第三尺寸的序列讀段之第三量, 將該第三量與第二校準資料點進行比較,該第二校準資料點使用對應於該第二尺寸之第三組序列讀段的第四量確定,及 使用該比較確定對應於該第三尺寸之來自eccDNA之游離DNA片段的第二量; 其中確定該參數值包含使用該第二量。
  82. 如請求項80或81之方法,其中對於與核酸酶相關聯之基因而言,該參考值係自該基因不展現出遺傳病症之個體或自展現出該遺傳病症之個體確定的。
  83. 如請求項82之方法,其中該遺傳病症之特徵在於該核酸酶缺乏。
  84. 一種電腦產品,其包含儲存複數個指令之非暫時性電腦可讀媒體,該複數個指令在執行時使得電腦系統進行如前述請求項中任一項之方法。
  85. 一種系統,其包含: 如請求項84之電腦產品;及 一個或多個處理器,其用於執行儲存於該電腦可讀媒體上之指令。
  86. 一種系統,其包含用於進行上述方法中之任一者之構件。
  87. 一種系統,其包含經組態以進行上述方法中之任一者之一個或多個處理器。
  88. 一種系統,其包含分別進行上述方法中之任一者之步驟的模組。
TW111113507A 2021-04-08 2022-04-08 游離dna甲基化及核酸酶介導之片段化 TW202305142A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163172542P 2021-04-08 2021-04-08
US63/172,542 2021-04-08
US202263315468P 2022-03-01 2022-03-01
US63/315,468 2022-03-01

Publications (1)

Publication Number Publication Date
TW202305142A true TW202305142A (zh) 2023-02-01

Family

ID=83545099

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111113507A TW202305142A (zh) 2021-04-08 2022-04-08 游離dna甲基化及核酸酶介導之片段化

Country Status (4)

Country Link
US (1) US20220396838A1 (zh)
EP (1) EP4320269A1 (zh)
TW (1) TW202305142A (zh)
WO (1) WO2022214051A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115376616B (zh) * 2022-10-24 2023-04-28 臻和(北京)生物科技有限公司 一种基于cfDNA多组学的多分类方法及装置
WO2024114678A1 (en) * 2022-11-29 2024-06-06 Centre For Novostics Fragmentomics in urine and plasma
CN115910211B (zh) * 2022-12-15 2024-03-22 广州女娲生命科技有限公司 胚胎植入前dna分析检测方法及装置
CN116312794B (zh) * 2023-01-09 2023-11-14 哈尔滨医科大学 一种融合单细胞分析方法的甲基化样本聚类方法
CN116168761B (zh) * 2023-04-18 2023-06-30 珠海圣美生物诊断技术有限公司 核酸序列特征区域确定方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9732390B2 (en) * 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
US11168356B2 (en) * 2017-11-02 2021-11-09 The Chinese University Of Hong Kong Using nucleic acid size range for noninvasive cancer detection
US11581062B2 (en) * 2018-12-10 2023-02-14 Grail, Llc Systems and methods for classifying patients with respect to multiple cancer classes
EP3947717A4 (en) * 2019-03-25 2022-12-28 The Chinese University Of Hong Kong DETERMINATION OF LINEAR AND ROUND SHAPES OF CIRCULATION NUCLEIC ACIDS
CN115298324A (zh) * 2019-12-18 2022-11-04 香港中文大学 游离dna断裂和核酸酶

Also Published As

Publication number Publication date
WO2022214051A1 (en) 2022-10-13
EP4320269A1 (en) 2024-02-14
US20220396838A1 (en) 2022-12-15

Similar Documents

Publication Publication Date Title
TWI817187B (zh) 偵測突變以用於癌症篩選分析
TW202305142A (zh) 游離dna甲基化及核酸酶介導之片段化
TWI786428B (zh) 癌症檢測之血漿dna突變分析
Ku et al. A new paradigm emerges from the study of de novo mutations in the context of neurodevelopmental disease
TWI458976B (zh) 由母體之生物樣本分析胎兒之基因體
WO2020192680A1 (en) Determining linear and circular forms of circulating nucleic acids
WO2019210873A1 (en) Size-tagged preferred ends and orientation-aware analysis for measuring properties of cell-free mixtures
US20200199656A1 (en) Cell-free dna end characteristics
Devarajan et al. Targeted next generation sequencing of RB1 gene for the molecular diagnosis of Retinoblastoma
TWI727938B (zh) 血漿粒線體dna分析之應用
US20210238668A1 (en) Biterminal dna fragment types in cell-free samples and uses thereof
WO2022012504A1 (en) Nuclease-associated end signature analysis for cell-free nucleic acids
JP2016518811A (ja) 多胎妊娠における胎児ゲノムの決定
CN115298324A (zh) 游离dna断裂和核酸酶
CN117500938A (zh) 无细胞dna甲基化和核酸酶介导的片段化
WO2023217101A1 (en) Analysis of nucleic acids associated with extracellular vesicles
Sisoudiya et al. Identification of USP9X as a leukemia susceptibility gene
Sina Identification and interpretation of pathogenic variants following Next Generation Sequencing (NGS) analysis in human Mendelian disorders