TW202237856A - 使用尿液及其他dna特徵之方法 - Google Patents

使用尿液及其他dna特徵之方法 Download PDF

Info

Publication number
TW202237856A
TW202237856A TW110145886A TW110145886A TW202237856A TW 202237856 A TW202237856 A TW 202237856A TW 110145886 A TW110145886 A TW 110145886A TW 110145886 A TW110145886 A TW 110145886A TW 202237856 A TW202237856 A TW 202237856A
Authority
TW
Taiwan
Prior art keywords
nucleic acid
strand
acid molecules
jagged
condition
Prior art date
Application number
TW110145886A
Other languages
English (en)
Inventor
煜明 盧
君賜 陳
江培勇
淑恒 鄭
周澤
解婷婷
王廣亞
丁晨
Original Assignee
香港中文大學
美商格瑞爾有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港中文大學, 美商格瑞爾有限責任公司 filed Critical 香港中文大學
Publication of TW202237856A publication Critical patent/TW202237856A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

游離DNA片段之末端可用於分析生物樣品。在一些實施例中,可分析來自尿液樣品之DNA。游離DNA片段通常包括鋸齒狀末端,其中雙股DNA之一個股之一個末端延伸超過另一股之另一末端。此等鋸齒狀末端之長度及量可用於確定個體病況之水準。在某些區域中片段之末端的密度亦可用於對病況之水準進行分類。另外,DNA片段可顯示週期性模式,其中DNA片段之量對應於突出末端之長度。可分析週期性以確定生物樣品之特性。亦可用避免修剪雙股DNA之3'突出末端的技術來分析鋸齒狀末端。

Description

使用尿液及其他DNA特徵之方法
游離DNA已被證實特別適用於分子診斷及監測。基於游離之應用包括非侵入性產前檢測(Chiu RKW等人, 《美國國家科學院院刊(Proc Natl Acad Sci USA)》. 2008;105:20458-63)、癌症偵測及監測(Chan KCA等人, 《臨床化學(Clin Chem)》. 2013;59:211-24;Chan KCA等人, 《美國國家科學院院刊》.2013;110:1876-8;Jiang P等人, 《美國國家科學院院刊》.2015;112:E1317-25)、移植監測(Zheng YW等人, 《臨床化學》. 2012;58:549-58)及追蹤起源組織(Sun K等人, 《美國國家科學院院刊》.2015;112:E5503-12;Chan KCA;Snyder MW等人, Cell.2016;164:57-68)。迄今為止開發之游離核酸分析方法包括基於單核苷酸變異體(SNV)、拷貝數畸變(CNA)、人類基因體中游離DNA末端位置或甲基化標記物分析的彼等方法。識別用於偵測新特性新核酸分析方法且增加現有方法之精確性將為有益的。
雙股游離DNA片段通常可具有彼此不完全互補的兩股。一個股可延伸超出另一股,產生突出末端。此等突出末端通常經修復以在分析中形成鈍末端。然而,由此等突出末端產生之「鋸齒狀末端」可適用於分析生物樣品。本文描述可如何在分析中使用鋸齒狀末端以及如何量測鋸齒狀末端。例如,來自尿液樣品之游離DNA中之鋸齒狀末端可用於以非侵入性及精確方式診斷或偵測病況。
鋸齒狀末端之程度,其可為鋸齒狀末端之數量或長度,在樣品中可反映個體中之病況水準。例如,鋸齒狀末端之程度可能與疾病(例如癌症)、病症、妊娠相關之病況或移植病況有關。在一些實施例中,鋸齒狀末端之程度可確定移植物排斥的可能性。在一些實施例中,特定基因體位置處之鋸齒狀末端可適用於對病況水準進行分類。例如,距位點(例如,CTCF結合位點或DNASE1超敏位點[DHS])一定距離處之鋸齒狀末端可用於對病況水準進行分類。
在一些實施例中,片段末端的密度可用於對病況水準進行分類。基於基因體座標,片段可具有在上游的一末端及下游的另一末端。在某些基因體位置(例如,距特定位點的某一距離處),上游末端之數目及下游末端之數目可用於對病況水準進行分類。可使用上游末端與下游末端之量之間的差值。
在一些實施例中,鋸齒狀末端可以用改良技術進行分析。該技術避免修剪雙股DNA之3’突出末端。避免修剪3’突出末端意外地改進了對5’突出末端之分析,特別係短突出末端。使用更準確之短突出末端計數,鋸齒狀末端長度之分析將更加準確,且可以提供改進的生物樣品分析。
在一些實施例中,DNA片段顯示出週期性模式,其中DNA片段的量對應於突出末端的長度。可分析在不同鋸齒狀末端長度下的DNA量的週期性,以確定生物樣品之特性。例如,週期性可用於確定病況之水準。
可參考以下詳細描述及隨附圖式來獲得對本發明實施例之性質及優勢的較佳理解。
相關申請案之交叉參考 本申請案主張於2021年5月26日提交之題為「使用尿液及其他DNA特徵之方法(METHODS USING CHARACTERISTICS OF URINARY AND OTHER DNA)」的美國臨時申請案第63/193,508號及於2020年12月8日提交之題為「使用尿液及其他DNA特徵之方法(METHODS USING CHARACTERISTICS OF URINARY AND OTHER DNA)」的美國臨時申請案第63/122,669號的優先權且係其非臨時申請,其中之每一者出於所有目的以全文引用之方式併入本文中。 術語
組織」對應於一組細胞,其共同歸類為一個功能單元。可在單一組織中找到超過一種類型之細胞。不同類型的組織可由不同類型的細胞(例如肝細胞、肺泡細胞或血細胞)組成,但亦可對應於來自不同生物體(母親與胎兒)之組織或對應於健康細胞與腫瘤細胞。「參考組織」可對應於用於測定組織特異性甲基化水準之組織。來自不同個體之相同組織類型之多個樣品可用於測定該組織類型之組織特異性甲基化水準。
器官」對應一組功能相似的組織。一或多種類型之組織可見於單一器官中。器官可為不同器官系統之一部分,包括心血管系統、消化系統、內分泌系統、排泄系統、淋巴系統、表皮系統、肌肉系統、神經系統、生殖系統、呼吸系統及骨骼系統。
生物樣品」係指取自個體(例如人類,諸如孕婦、患有癌症之個人、或疑似患有癌症之個人、器官移植受體或疑似患有涉及器官(例如心肌梗塞中之心臟、或中風中之大腦、或貧血中之造血系統)之疾病過程之個體)且含有所關注之一或多種核酸分子之任何樣品。生物樣品可為體液,諸如血液、血漿、血清、尿液、陰道流體、來自水囊腫(例如睪丸)之流體、陰道沖洗液、胸膜液、腹水、腦脊髓液、唾液、汗液、淚液、痰、支氣管肺泡灌洗液、乳頭排放液、來自身體不同部分(例如甲狀腺、乳房)之抽吸流體等。亦可使用糞便樣品。在各種實施例中,已富集游離DNA之生物樣品(例如經由離心方案獲得之血漿樣品)中之大部分DNA可為游離的,例如大於50%、60%、70%、80%、90%、95%或99%之DNA可為游離的。離心方案可包括例如3,000 g × 10分鐘獲得流體部分,及以例如30,000 g再離心10分鐘以移除殘餘細胞。
一種「 序列讀數」係指自核酸分子之任何部分或全部定序的一串核苷酸。例如,序列讀數可為自核酸片段定序之短核苷酸串(例如20-150)、在核酸片段之一端或兩端之短核苷酸串或存在於生物樣品中之整個核酸片段的定序。序列讀數可以多種方式獲得,例如使用定序技術或使用探針,例如雜交陣列或捕獲探針;或擴增技術,諸如聚合酶鏈反應(PCR)或使用單一引子的線性擴增或等溫擴增。
位點」(亦稱作「基因體位點」)對應於單一位點,其可為單一鹼基位置或相關鹼基位置群,例如CpG位點或相關鹼基位置之較大群。「基因座」可以對應於包括多個位點之區域。基因座可僅包括一個位點,此將使得基因座在彼情形下等效於一個位點。
各基因體位點(例如,CpG位點)之「 甲基化指標」或「 甲基化狀態」可指在該位點處顯示甲基化之DNA片段(例如,如自序列讀數或探針測定)相比於覆蓋彼位點之讀數總數之比例。「讀數」可對應於獲自DNA片段之資訊(例如位點處之甲基化狀態)。可使用較佳地雜交至特定甲基化狀態之DNA片段之試劑(例如引子或探針)獲得讀數。通常,此類試劑在藉由取決於DNA分子之甲基化狀態不同地修飾或不同地識別DNA分子之方法,例如亞硫酸氫鹽轉化,或甲基化敏感限制酶,或甲基化結合蛋白,或抗甲基胞嘧啶抗體,或識別甲基胞嘧啶及羥甲基胞嘧啶之單分子定序技術處理後施用。
區域之「 甲基化密度」可指顯示甲基化之區域內之位點處之讀數數目除以覆蓋區域中之位點之讀數總數。位點可具有特定特性,例如為CpG位點。因此,區域之「CpG甲基化密度」可指顯示CpG甲基化之讀數數目除以覆蓋區域中之CpG位點(例如特定CpG位點、CpG島或較大區域內之CpG位點)之讀數總數。例如,人類基因體中各100 kb面元之甲基化密度可自亞硫酸氫鹽處理之後在CpG位點處未轉化之胞嘧啶(其對應於甲基化胞嘧啶)的總數測定為映射至100 kb區域之序列讀數所覆蓋之所有CpG位點的比例。此分析亦可對於其他面元大小,例如500 bp、5 kb、10 kb、50 kb或1 Mb等執行。區域可為整個基因體或染色體或染色體之一部分(例如染色體臂)。當區域僅包括CpG位點時,CpG位點之甲基化指標與區域之甲基化密度相同。「甲基化胞嘧啶之比例」可指相比於分析之胞嘧啶殘基之總數展示為甲基化(例如在亞硫酸氫鹽轉化之後未轉化)之胞嘧啶位點「C's」之數目,亦即包括區域中除CpG背景之外的胞嘧啶。甲基化指標、甲基化密度及甲基化胞嘧啶之比例為「甲基化水準」之實例。除亞硫酸氫鹽轉化之外,熟習此項技術者已知之其他方法可用於查詢DNA分子之甲基化狀態,包括(但不限於)對甲基化狀態敏感之酶(例如,甲基化敏感限制酶)、甲基化結合蛋白、使用對甲基化狀態敏感之平台的單分子定序(例如,奈米孔定序(Schreiber等人,《美國國家科學院院刊》2013;110: 18910-18915)且藉由太平洋生物科學單分子即時分析(the Pacific Biosciences single molecule real time analysis)(Flusberg等人,《自然方法(Nat Methods)》2010; 7: 461-465))。
術語「測序深度」係指基因座經與基因座比對之序列讀數覆蓋之次數。基因座可與核苷酸一樣小,或與染色體臂一樣大,或與整個基因體一樣大。測序深度可表示為50×、100×等,其中「×」係指基因座經序列讀數覆蓋之次數。測序深度亦可應用於多個基因座或全基因體,在此情況下,×可指基因座或單倍體基因體或全基因體分別定序之平均次數。超深度定序可指測序深度為至少100×。
分離值」對應於涉及兩個值,例如兩個分率貢獻或兩個甲基化水準之差值或比率。分離值可為簡單的差值或比率。作為實例,x/y以及x/(x+y)之正比為分離值。分離值可包括其他因子,例如乘法因子。關於其他實例,可使用該等值之函數的差值或比率,例如兩個值之自然對數(ln)的差值或比率。分離值可包括差值及比率。
如本文所用之術語「分類」係指與樣品之特定特性相關之任何數字或其他字符。例如,「+」符號(或詞語「陽性」)可表示將樣品分類為具有缺失或擴增。分類可為二元的(例如陽性或陰性)或具有更多分類水準(例如1至10或0至1之標度)。術語「 閾值」及「 臨限值」係指操作中所用之預定數字。例如,截止大小可指一種大小,大於此大小則排除片段。臨限值可為高於或低於特定分類適用之值。在此等情形中之任一者下均可使用此等術語中之任一者。
當描述DNA分子時,術語「 損傷」可指DNA鏈裂、存在於雙股DNA中之單股、雙股DNA之突出末端、藉由經氧化鳥嘌呤、無鹼基地點、胸苷二聚體、經氧化嘧啶、經阻斷3'末端或鋸齒狀末端之氧化DNA修飾。
術語「 鋸齒狀末端」可指DNA之黏性末端、DNA之突出末端或其中雙股DNA包括未與另一股DNA雜交的DNA股。「 鋸齒狀末端值」或「 鋸齒狀指標」係鋸齒狀末端程度的量度。鋸齒狀末端值可與懸垂在雙股DNA中之第二股的一個股的平均長度相關(例如,成比例)。複數個DNA分子之鋸齒狀末端值可包括考慮DNA分子中之鈍末端。
在一些情況下,鋸齒狀指標值可提供在複數個游離DNA分子中一個股懸垂另一股之集體量度。鋸齒狀之集體量度可基於複數個游離DNA分子之突出末端的估計長度判定,例如,游離DNA分子中之每一者的個別量測之平均值、中值或其他集體量度。在一些情況下,針對特定片段大小範圍(例如,130至160 bp、200至300 bp)測定鋸齒狀之集體量度。在一些情況下,可基於接近複數個游離DNA分子之末端的甲基化信號變化來確定鋸齒狀之集體量度。
術語「 比對」及相關術語可指將序列與參考序列匹配。參考序列可為參考基因體(例如,人類基因體)或特定分子的序列。此類參考序列可包含至少100 kb、1 Mb、10 Mb、50 Mb、100 Mb及更多。此等比對方法無法手動地執行且由專用電腦軟體執行。比對可涉及冗長且眾多的序列(例如至少1,000、10,000、100,000、1百萬、1千萬或1億個序列)。另外,比對可涉及序列自身內之可變性或序列讀數內之誤差。因此,與此類可變性或誤差之比對可能不需要與參考序列精確匹配。
術語「 實時」可指在某一時間限制內完成的計算操作或過程。時間限制可為1分鐘、1小時、1天或7天。 具體實施方式
據報導,游離DNA為非隨機片段化的(Lo等人, 《科學轉化醫學(Sci Transl Med)》. 2010;2:61ra91)。最近,發現雙股血漿游離DNA攜帶單股末端,稱為鋸齒狀末端。血漿DNA鋸齒狀末端之特徵可充當非侵入性產前檢測及癌症偵測之生物標記物。血漿DNA及尿液DNA之片段化模式不同。例如,尿液DNA分子短於血漿DNA分子(Tsui等人, 《公共科學圖書館·綜合(PLoS One)》.2012;7:e48319)。此外,用於額外研究之尿液DNA分子之態樣包括:(1)尿液DNA中鋸齒狀末端之程度;(2)使用尿液DNA鋸齒狀末端作為生物標記物(例如用於膀胱癌偵測);及(3)在額外臨床情形下實施尿液DNA鋸齒狀末端。不意欲受任何特定理論束縛,認為鋸齒狀末端可關於游離DNA如何經片段化。例如,DNA可以階段形式經片段化,且鋸齒狀末端的大小可反映片段化之階段。鋸齒狀末端之數目及/或鋸齒狀末端中突出末端之大小可用於分析具有游離DNA之生物樣品且提供關於樣品及/或獲得樣品之個體之資訊。
導致特定器官或組織中細胞死亡的不同致病原因可能會導致游離DNA分子中DNA損傷的相對表現發生改變。例如,雙股DNA之突出末端將與起源組織有關。因此,用於分析游離DNA損傷之本發明之實施例將為偵測或監測但不限於癌症偵測、器官損傷、免疫疾病及移植狀態以及進行非侵入性產前檢測提供新的可能性。
實施例包括使用鋸齒狀末端之程度、鋸齒狀末端之密度及/或鋸齒狀末端之週期性來分析生物樣品。鋸齒狀末端可以在某些位置進行分析,該等位置可能位於某一基因體位點或距某一基因體位點一定距離處。基因體位點可係與染色質中之蛋白質的修飾相關或與蛋白質相互作用相關的位點。此等對鋸齒狀末端的分析可以提高確定個體病況水準的準確性。
非習知技術可用於量測生物樣品分析中之鋸齒狀末端。在一些實施例中,吾等使用DNA末端修復在原始序列及鋸齒狀末端之間引入差異甲基化信號,視在DNA末端修復程序中是否使用未甲基化胞嘧啶或甲基化胞嘧啶,隨後進行亞硫酸氫鹽定序而定。
在一些實施例中,當分析5’突出末端時,3’突出末端可能不係鈍末端的。出乎意料地,避免3'末端的鈍末端會增加可用於分析的5’突出末端的量。因此,生物樣品之分析可得到改良。 I.     偵測鋸齒狀末端
可以若干種方式,包括間接及直接偵測尿液DNA之鋸齒狀末端。尿液DNA可能在核苷酸處有意甲基化或未甲基化。鋸齒狀末端可使用與無末端修復之DNA片段具有相反甲基化狀態的核苷酸修復。接著甲基化水準給出了尿液DNA片段之鋸齒狀末端程度的指示。可使用與片段中之某些長度的已知序列雜交的合成探針。另外,鋸齒狀長度可藉由以下直接確定:將接附子添加至雙股DNA之末端,對雙股DNA之單股進行定序,且接著將一個股之序列與另一股比對以確定突出末端。 A.                使用甲基化
1顯示了尿液DNA鋸齒狀末端分析之工作流程的示意圖。在一個實施例中,可基於在鋸齒狀末端之末端修復過程中併入的未甲基化胞嘧啶推斷尿液DNA之5'-突出鋸齒狀末端。在一些實施例中,3'末端可為突出之鋸齒狀末端。鋸齒狀末端亦可稱為突出末端或黏性末端。
在階段110,可自包括尿液樣品在內的生物樣品中提取具有鋸齒狀末端的DNA分子。尿液樣品可自個體中排出。經填充之棒棒糖狀代表甲基化之CpG位點。
在階段120,DNA分子可進行末端修復。鋸齒狀末端填充有核苷酸(即dNTP)。未經填充之棒棒糖狀代表未甲基化之CpG位點。虛線代表新填充之核苷酸。末端修復之DNA分子進一步經受亞硫酸氫鹽定序。新填充之核苷酸中未甲基化之C可能會轉化為尿嘧啶(U),其藉由PCR擴增為T,而滯留分子內之原始甲基化C保持未修飾。因此,原始DNA分子中之CpG胞嘧啶一般可經甲基化,而藉由末端修復過程併入至接近尿液DNA之3'末端(或在其他實施例中為5'末端)之新合成股中的CpG胞嘧啶可未經甲基化。因此,鋸齒狀末端之修復將降低接近3'末端(或其他實施例中為5'末端)區域中之甲基化水準。末端修復分子之亞硫酸氫鹽定序可提供兩末端甲基化水準的量度,以提供鋸齒狀末端長度的量度。
在一些實施例中,修復至少1,000個游離DNA分子。在其他實施例中,可修復至少10,000或50,000或100,000或500,000或1,000,000或5,000,000個或更多游離DNA分子。
在階段130,分析DNA之鋸齒狀。為了基於CpG甲基化信號量化鋸齒狀,吾等利用讀數1及讀數2之間CpG位點的未甲基化胞嘧啶的差異來反映鋸齒狀,稱為鋸齒狀指標未甲基化(JI-U)。讀數1對應於階段120中頂部股之藍色末端。讀數2對應於階段120中頂部股之虛線紅色末端。JI-U藉由下式計算:
Figure 02_image001
, 其中, M 1 表示來自接近5'尿液DNA末端之片段中之位置的30個鹼基所貢獻的甲基化密度,且 M 2 表示來自接近3'尿液DNA末端之片段中之位置的30個鹼基所貢獻的甲基化密度。在一些實施例中,吾人可使用但不限於接近3'尿液DNA末端之1個鹼基、2個鹼基、3個鹼基、4個鹼基、5個鹼基、10個鹼基、20個鹼基、40個鹼基、50個鹼基等來評估尿液鋸齒狀末端,以及其組合。甲基化密度 M 1 M 2 可為在不同DNA片段中之甲基化密度的統計值(例如,平均值、中值、眾數或百分位數)。較高的JI-U對應於讀數1及讀數2之間增加的甲基化差異。較高的JI-U可指示DNA片段之較多鋸齒狀末端。
在階段140,分析JI-U模式。例如,吾等研究膀胱癌患者(n=46)及非膀胱癌患者(對照組,n=39)之間尿液DNA的JI-U分佈及CTCF結合位點周圍的JI-U模式。發現JI-U會隨著與CTCF結合位點的距離而變化。JI-U與結合位點之間的關係稍後在本揭示案中論述。此外,觀測到JI-U視生物樣品之類型(例如,血漿與尿液)而定。對於具有移植組織之個體,JI-U基於移植組織之類型及排斥反應之可能性而異。
在一些實施例中,原始DNA片段之核苷酸(例如胞嘧啶)可為未甲基化的。鋸齒狀末端可填充有甲基化之核苷酸(例如胞嘧啶)。在此等條件下,可使用鋸齒狀指標甲基化(JI-M)。在階段130中,讀數1未甲基化,因此 M 1 為0或接近於0。讀數2為甲基化的且不為零或顯著高於0。因此,JI-M可接著等效於讀數2(或與其成比例)之甲基化水準。 B.                使用探針
在一些實施例中,可在不使用甲基化信號之情況下確定DNA的鋸齒狀。例如,可使用合成探針。合成探針可包括與片段中某一長度的已知序列雜交的部分。可使用具有不同長度的互補部分的複數個探針。探針可包括分子標籤,其識別互補部分之長度且因此識別與探針雜交之鋸齒狀末端的長度。可對分子標籤進行定序以確定鋸齒狀末端之大小。
作為一實例,已知鋸齒狀末端出現在Alu之24 bp共同序列中。不同長度探針可經設計以與共同序列之至少一部分互補。例如,一個探針可包括與共同序列之13個連續核苷酸互補的序列,且另一個探針可包括與共同序列之22個連續核苷酸互補的序列(其中22個連續核苷酸包括13個連續核苷酸)。可使用1至24個核苷酸之其他探針長度。此等互補序列可進一步與分子標籤連接。分子標籤可為一串許多核苷酸(例如6個),其允許吾人在具有13-nt鋸齒狀末端之合成DNA與具有22-nt鋸齒狀末端之合成DNA區分,類似於條碼。可對雜交DNA進行定序及比對。與各分子標記相關之讀數之數目可指示具有某一長度鋸齒狀末端之片段的數目。 C.                接附子之比對
在一些實施例中,鋸齒狀末端之長度可直接確定。直接確定鋸齒狀末端之長度可包括以下:將接附子添加至雙股DNA之末端,自雙股DNA形成單股DNA,對所得單股DNA進行定序,且接著將一個股之序列與另一股進行比對。接附子之比對可用於確定鋸齒狀末端的突出末端的量。
2顯示了經由血漿DNA之環化直接評估血漿DNA黏性末端/突出末端的實施例。血漿DNA經由單股DNA(ssDNA)接合酶與單股DNA接附子(黃色)接合。亞硫酸氫鹽處理使得Watson(頂部股)與Crick股(底部股)不再互補,因為幾乎所有來自兩個股中之非CpG位點之胞嘧啶轉化為尿嘧啶,形成環化單股DNA分子。可使用標記有3'定序接附子(例如Illumina P7,藍色)之隨機引子(例如5-聚體)擴增此類環化單股DNA,產生許多可包括單股DNA接附子(黃色)的線性DNA分子。側接最初接合之單股接附子之DNA序列將允許推斷鋸齒狀末端。為了使線性DNA分子能夠適合於定序,經由退火及基於PCR之延伸來併入5'定序接附子(紅色,例如Illumina P5,紅色)。接著,標記有P5及P7接附子之分子將擴增及定序。藉由研究如在示意圖中所示之「a」及「b」序列的相對位置,經由比對或自互補分析確定側接原始單股接附子(黃色)的序列(由紅色箭頭指示的「a」及「b」)。環化分子中之「c」及「d」序列可經由用於分析「a」及「b」序列類似的策略進行分析。使DNA環化及使用自互補分析的其他技術係可能的。
在不涉及量測甲基化水準之實施例中,鋸齒狀末端之長度可用於確定指標。可使用長度之統計值作為指標,包括平均值、中值、眾數或百分位數。 II.  血漿及尿液DNA之間鋸齒狀的差異
觀測到尿液DNA展現出與血漿DNA不同的鋸齒狀。尿液DNA通常比血漿DNA顯示出更高鋸齒狀。此外,與血漿DNA相比,尿液DNA在大多數大小的DNA片段中表現出更多鋸齒狀。亦觀測到尿液DNA顯示出不同大小之鋸齒狀週期性。 A.                鋸齒狀末端及甲基化水準比較
3A 3B顯示了血漿及尿液DNA之間鋸齒狀的比較。圖3A圖示了孕婦之血漿DNA與患有血尿之對照個體的尿液DNA之間的JI-U值。y軸係鋸齒狀指標未甲基化(JI-U)。x軸顯示血漿DNA(30名個體)及尿液DNA(39名個體)的結果。圖3A顯示患有血尿之對照個體的尿液DNA的JI-U值(中值:35.8;範圍:21.3-60.0)比孕婦之血漿DNA的JI-U值(中值:21.7;範圍:14.7-26.2)高1.6倍( P值<0.0001,曼-惠特尼 U檢驗(Mann-Whitney Utest))。
圖3B圖示了游離DNA片段之前30個核苷酸及後30個核苷酸處不同基因座的血漿(藍色三角形)及尿液(紅色圓形)DNA之間的甲基化水準。y軸顯示作為所有CpG位點之百分比的甲基化水準。x軸顯示片段之股的5'末端及3'末端兩者的核苷酸位置。「nt」代表核苷酸。在本申請案中,「nt」及核苷酸可與鹼基互換使用。對於「接近5'末端之30 nt」,較高的核苷酸數目比較低的核苷酸數目更遠離5'末端。對於「接近3'末端之30 nt」,較低的核苷酸數目比較高的核苷酸數目更遠離3'末端。在合併所有比對之成對末端讀數之後藉由分析讀數1及讀數2中在不同CpG位點之甲基化水準,吾等觀測到接近尿液DNA分子之3'末端的甲基化水準比血漿DNA分子的甲基化水準下降得更多。此等結果表明,當與血漿DNA相比,尿液DNA具有更多鋸齒狀末端。 B.                鋸齒狀末端之大小分析
4A 4B顯示血漿及尿液DNA之間的片段化模式。圖4A顯示了孕婦之血漿DNA(藍線404)及對照個體之尿液DNA(紅線408)的大小分佈。個體為圖3A及圖3B中分析之同一相同。x軸顯示鹼基對中之片段大小。除非上下文另外規定,否則片段之大小可基於末端修復之後分子的最外層核苷酸。y軸顯示特定大小片段之頻率。圖4A顯示尿液DNA及血漿DNA之間的大小分佈明顯不同。尿液DNA比血漿DNA更片段化。
圖4B顯示了不同片段大小之JI-U值。x軸顯示鹼基對中之片段大小。y軸顯示JI-U。在60至600 bp範圍內之各大小的尿液DNA(紅線412)的JI-U值幾乎都高於血漿DNA(藍線416)的JI-U值。有趣地,血漿DNA的JI-U曲線在約165 bp間隔(即大約一個核小體單位)內顯示出若干個強振盪主峰及在約10 bp週期內顯示出一系列小分子的弱振盪次峰,而尿液DNA顯示出弱振盪主峰,但存在強振盪次峰。此不同行為可能表明尿液DNA鋸齒狀末端及血漿DNA鋸齒狀末端可在臨床上以不同的方式實施。例如,在一些實施例中,某些大小範圍內之鋸齒狀末端的選擇性分析可增強基於尿液DNA鋸齒狀末端之測試的效能。 III.            癌症及非癌症之間的差異鋸齒狀
由於膀胱腫瘤DNA分子存在於患有膀胱癌之患者的尿液DNA中(Cheng等人, 《臨床化學》. 2019;65:927-936),吾等探究了使用尿液DNA之鋸齒狀來評估患有膀胱癌之患者的可行性。發現尿液DNA之鋸齒狀在不同水準的膀胱癌中有所不同,包括不同大小範圍之DNA片段。結果顯示,可以使用鋸齒狀之量度對不同水準的病症進行分類。另外,觀察片段之特定大小或片段之特定位置可提高確定病症水準的靈敏度及/或特異性。 A.                顯示指標值差異之結果
5A5B5C5D顯示患有膀胱癌之患者的尿液DNA中的JI-U值。圖5A顯示了患有血尿但無膀胱癌的對照個體、低級別非肌肉浸潤性膀胱癌(NMIBC LG)的個體、高級別非肌肉浸潤性膀胱癌(NMIBC HG)的個體及肌肉浸潤性膀胱癌(MIBC)的個體的JI-U盒狀圖。圖5A之x軸顯示對照個體及患有膀胱癌之個體。各組中個體之數目顯示於x軸標記中。JI-U顯示於y軸上。如圖5A所示,與無癌症但患有血尿之對照組(中值:33.9;範圍21.3-50.7)相比,經常出現血尿之膀胱癌患者的尿液DNA鋸齒狀末端指標(JI-U)顯著降低(中值:26.6;範圍:3.5-50.7)( P值<0.0001,曼-惠特尼 U檢驗)。患有MIBC之患者顯示最低中值JI-U值。
圖5B顯示了對於不同類型之樣品在不同大小之間變化的JI-U值。圖5B顯示y軸上之JI-U及x軸上之鹼基對中片段的大小。藍線504顯示患有血尿但無膀胱癌之對照個體。綠線508顯示低級別非肌肉浸潤性膀胱癌(NMIBC LG)。黃線512顯示高級別非肌肉浸潤性膀胱癌(NMIBC HG)。紅線516顯示肌肉浸潤性膀胱癌(MIBC)。患有膀胱癌之患者中尿液DNA之鋸齒狀減少在不同大小範圍內有規律地存在。
圖5C顯示了患有血尿但無膀胱癌的對照個體、低級別非肌肉浸潤性膀胱癌(NMIBC LG)的個體、高級別非肌肉浸潤性膀胱癌(NMIBC HG)的個體及肌肉浸潤性膀胱癌(MIBC)的個體的JI-U盒狀圖,類似於圖5A。然而,圖5C顯示了130至160 bp之片段且與DNASE1超敏位點(DHS)重迭的結果。圖5A之x軸顯示對照個體及患有膀胱癌之個體。各組中個體之數目顯示於x軸標記中。JI-U顯示於y軸上。與圖5A相比,圖5C顯示了對照個體及患有膀胱癌之個體的JI-U之間更大的分離。圖5C亦顯示,與圖5A中所示之結果相比,130至160 bp的JI-U顯示出不同膀胱癌等級之間的更多差異。
基於尿液中DNASE1活性遠高於血漿這一事實(Nadano等人, 《臨床化學》. 1993;39:448-52),在一個實施例中,可使用與DHS重迭之尿液DNA分子進行鋸齒狀末端分析。DHS定義為顯示DNASE I裂解位點過度表現的基因體區域。DHS係自ENCODE(DNA元件之百科全書)資料庫(encodeproject.org)下載的。與使用所有片段進行區分相比,使用與DHS重迭之130至160 bp片段區分癌症得到改善( P值:0.02,DeLong檢驗)。
圖5D顯示了使用JI-U確定膀胱癌的接收者操作特徵(ROC)曲線。y軸顯示靈敏度,且x軸顯示特異性。紅色曲線520用於在所有片段大小上使用JI-U。藍色曲線524用於使用片段大小在130至160 bp範圍內且與DNASE1超敏位點(DHS)重迭之JI-U。當使用所有片段時,ROC曲線下面積(AUC)為0.75。此等結果表明,尿液DNA之鋸齒狀末端可充當膀胱癌之生物標誌物。膀胱癌患者尿液DNA鋸齒狀的觀測結果與血漿DNA鋸齒狀末端的觀察結果相反。患有HCC之患者血漿中腫瘤DNA的鋸齒狀高於造血源DNA(Jiang等人, 《基因體研究(Genome Res)》. 2020;30:1144-1153),進一步表明血漿及尿液DNA分子之鋸齒狀末端的不同特性。
結果,吾等觀測到區分患有及未患有膀胱癌之患者的效能增強(AUC:0.83)(圖5D)。在一些實施例中,吾人可使用但不限於40至70 bp、70至100 bp、100至130 bp、130至160 bp、160至190 bp等之大小範圍及/或包括此等大小範圍之組合的大小範圍。 C.                實例方法
6顯示了使用鋸齒狀末端指標值來分析尿液樣品之方法600。
在方塊601處,可接收尿液樣品。尿液樣品可自個體獲得。尿液樣品可包括複數個游離核酸分子。複數個核酸分子中之各核酸分子可為具有第一部分之第一股及第二股的雙股。複數個核酸分子中之至少一些的第一股的第一部分可懸垂第二股,可不與第二股雜交。第一部分可在第一股之第一末端。第一末端可為3'末端或5'末端。
可分析統計學上顯著數目之游離核酸分子,以便準確確定來自第一組織類型之比例貢獻。在一些實施例中,分析至少1,000個游離核酸分子。在其他實施例中,可分析至少10,000或50,000或100,000或500,000或1,000,000或5,000,000個或更多的游離核酸分子。作為另一實例,可產生至少10,000或50,000或100,000或500,000或1,000,000或5,000,000個序列讀數。所分析之游離核酸分子之數目可適用於本文所描述之任何方法。
在方塊602處,方法600可包括量測複數個核酸分子中之各核酸分子的特徵。量測可包括量測第一股、第二股或第一股及第二股之特徵,該特徵與懸垂第二股或未與第二股雜交的第一股的長度相關(例如,成比例)。該特徵亦可與懸垂第二股之第一股的長度相關。可量測複數個核酸之各核酸的特徵。特徵可為複數個核酸分子中之每一者之第一及/或第二股之末端部分之一或多個位點處的甲基化狀態。可藉由所描述之任何技術來量測特徵。在一些實施例中,特徵可為懸垂第二股或未與第二股雜交之第一股的長度。長度可直接確定。
在一些實施例中,方法600可包括量測核酸分子的大小。複數個核酸分子可具有在規定範圍內之大小。指定範圍可為40至70 bp、70至100 bp、100至130 bp、130至160 bp、160至190 bp、190至250 bp、大於250 bp、小於生物樣品中存在之整個大小範圍的任何範圍、本文所描述之任何範圍或本文所描述之範圍之任何組合(包括不連續範圍)。指定範圍可基於顯示不同病況水準之間的統計顯著分離的先前資料。大小範圍可基於較短股或較長股的大小。大小範圍可基於末端修復之後的分子之最外層核苷酸。若5'末端突出,則將出現5'至3'聚合酶介導之伸長且大小可為較長股。若3'末端突出,則在不具有3'至5'合成功能之DNA聚合酶的情況下,可修剪3'突出的單個股,且大小可接著為較短股。
在實施例中,方法600可包括分析核酸分子以產生讀數。讀數可與參考基因體比對。複數個核酸分子可為相對於轉錄起始位點或結合位點(包括CTCF位點或DNASE1超敏位點(DHS))在某一距離範圍內之讀數。在本揭示案中其他地方進一步詳細討論與距某些位點的距離有關的方法。
在方塊604處,可確定使用複數個核酸分子之量測特徵的鋸齒狀指標值。鋸齒狀指標值可為鋸齒狀末端值,包括鋸齒狀指標未甲基化(JI-U)或鋸齒狀指標甲基化(JI-M),如稍後描述。鋸齒狀指標值可包括在第一及/或第二股之末端部分之一或多個位點處的複數個核酸分子之甲基化水準。在一些實施例中,鋸齒狀指標值可為複數個核酸分子之鋸齒狀末端長度的統計值(例如,平均值、中值、眾數、百分位數)。
若第一複數個核酸分子在指定大小範圍內,則方法可包括量測第二複數個核酸分子之各核酸分子的特徵。第二複數個核酸分子可具有第二指定大小範圍之大小。測定鋸齒狀指標值可包括使用第一複數個核酸分子之量測特性及第二複數個核酸分子之量測特性來計算比率。
鋸齒狀指標值可與參考值進行比較。參考值或比較可使用具有訓練資料集的機器學習來確定。
在方塊606處,可使用鋸齒狀指標值來確定個體病況之水準。在一些實施例中,可基於鋸齒狀指標值與參考值之比較來確定病況之水準。當鋸齒狀指標值超過參考值時,病況之水準可分類為存在、可能或嚴重。該病況可包括疾病、病症或妊娠。病況可為癌症、自體免疫性疾病、妊娠相關之病況或本文所描述之任何病況。作為實例,癌症可包括膀胱癌、肝細胞癌(HCC)、大腸直腸癌(CRC)、白血病、肺癌或咽喉癌。自體免疫性疾病可包括全身性紅斑狼瘡(SLE)。在一些實施例中,疾病可包括泌尿科問題、泌尿道感染、腎臟炎症或膀胱炎症(亦即,膀胱炎)。以下各種資料提供用於確定病況之水準的實例。
方法可進一步包括在確定患者之疾病或病況之水準之後對患者之疾病或病況進行治療。治療可根據所確定之癌症水準、所鑑別的突變及/或起源組織來提供。例如,所鑑別之突變(例如在多形性實施例中)可使用特定藥物或化學療法靶向。起源組織可用於導引手術或任何其他治療形式。且癌症水準可用於確定任何類型之治療多具侵襲性,其亦可基於癌症水準確定。癌症可藉由化學療法、藥物、膳食、療法及/或手術治療。在一些實施例中,參數之值超出參考值愈多,則治療可愈具侵襲性。
治療可包括經尿道膀胱腫瘤切除術(TURBT)。此程序用於診斷、分級及治療。在TURBT期間,外科醫生經由尿道將膀胱鏡插入至膀胱中。接著使用具有小導線環、雷射或高能電之工具移除腫瘤。對於NMIBC患者,TURBT可用於治療或消除癌症。另一治療可包括根治性膀胱切除術及淋巴結剝離。根治性膀胱切除術係移除整個膀胱及可能周圍組織及器官。治療亦可包括尿路分流術。尿路分流術係在移除膀胱作為治療之部分時,醫師創建用於尿液排出身體外之新路徑。
治療可包括化學療法,其使用藥物來破壞癌細胞,通常保持癌細胞避免生長及分裂。藥物可涉及例如(但不限於)用於膀胱內化學療法之絲裂黴素-C(可用作一般藥物)、吉西他濱(gemcitabine)(Gemzar)及噻替派(thiotepa)(Tepadina)。全身性化學療法可涉及例如(但不限於)順鉑吉西他濱(cisplatin gemcitabine)、甲胺喋呤(Rheumatrex,Trexall)、長春鹼(Velban)、小紅莓(doxorubicin)及順鉑。
在一些實施例中,治療可包括免疫療法。免疫療法可包括阻斷稱作PD-1之蛋白質的免疫檢查點抑制劑。抑制劑可包括(但不限於)阿特珠單抗(atezolizumab)(Tecentriq)、納武單抗(nivolumab)(Opdivo)、阿維魯單抗(avelumab)(Bavencio)、德瓦魯單抗(durvalumab)(Imfinzi)及派立珠單抗(pembrolizumab)(Keytruda)。
治療實施例亦可包括靶向治療。靶向療法為靶向有助於癌症生長及存活之癌症之特異性基因及/或蛋白質的治療。例如,厄達替尼(erdafitinib)為經口給予之藥物,其經批准用於治療具有FGFR3或FGFR2基因突變之局部晚期或轉移性尿道上皮癌之人,該尿道上皮癌具有持續生長或擴散之癌細胞。
一些治療可包括放射療法。放射療法使用高能量x射線或其他粒子來破壞癌細胞。除每一個別治療之外,亦可使用本文中所描述之此等治療之組合。在一些實施例中,當參數之值超出自身超出參考值之臨限值時,可使用治療之組合。參考文獻中關於治療之資訊以引用之方式併入本文中。
病況之分類亦可基於其他臨床因素。例如,由於遺傳因素或年齡,個人可被認為處於特定病況之風險下。在一些實例中,個體可呈現該病況之症狀。
當實施方塊606時,可使用具有該病況之個體的一或多個參考樣品來確定參考值。作為另一實例,使用不具有該病況之個體的一或多個參考樣品來測定參考值。可根據參考樣品確定多個參考值,潛在地藉由不同參考值區分病況之不同水準。參考值可為本文所描述之任何參考值。
在一些實施例中,與參考之比較可涉及例如使用監督學習訓練之機器學習模型。鋸齒狀指標值(及潛在其它標準,例如拷貝數、DNA片段之大小及甲基化水準)及獲得訓練樣品之訓練個體的已知條件可形成訓練資料集。機器學習模型之參數可基於訓練集進行最佳化,以在對病況水準進行分類時提供最佳化之準確性。實例機器學習模型包括神經網路、決策樹、叢聚法及支援向量機。 IV.            具有末端密度之核小體足跡
研究CTCF結合位點附近之末端密度。末端密度可在DNA片段之U-末端與D-末端之間偏移。吾等探究不同末端之密度之間的差異是否可用於確定病況的水準。使用尿液DNA之不同末端的密度差異來準確確定不同水準之膀胱癌。 A.                末端密度之差異
7A顯示血漿及尿液DNA分子的CTCF結合位點附近的U-末端及D-末端密度。y軸係血漿DNA末端密度。末端密度係末端出現的值,藉由跨越相對於CTCF結合位點的上游/下游1-kb基因座的彼等值的中值進行標準化。頂部圖顯示血漿DNA之末端密度。紫線704表示上游末端。藍線708表示下游末端。底部圖顯示尿液DNA之末端密度。紫線712表示上游末端。藍線716表示下游末端。x軸為與CTCF結合位點之鹼基對距離。正數位於CTCF結合位點之下游。負數位於CTCF結合位點之上游。頂部圖上方之草圖說明與血漿DNA及尿液DNA之末端密度的結果相關的可能核小體結構。圖7A之資料來自患有癌症之個體及未患癌症之個體。
如圖7A所示,對於源自Watson股(亦即,與參考基因體中所示股相同的股)之血漿DNA分子,CTCF結合位點附近之U-末端及D-末端密度均顯示出約180 bp間隔的週期性信號,類似於核小體陣列的組織良好的模式。末端密度之兩個連續峰之間的距離可有助於確定核小體足跡。末端密度之峰表明血漿DNA產生期間的首選切割。在CTCF結合位點附近(上游/下游300)亦觀測到U-末端及D-末端密度之取向模式,此與先前報導一致(Sun等人, 《基因體研究》. 2019;29:418-27)。在CTCF結合位點上游及下游300 bp範圍之外的U-末端及D-末端密度軌跡之間的小偏移(約20 bp)可係由於連接子DNA的部分降解。相比之下,對於尿液DNA分子,核小體陣列之模式變得較不明顯,而偏移變得更寬,此可能表明與血漿DNA生成相比,在尿液DNA片段生成期間存在進一步的DNA降解。
7B圖示了末端密度及JI-U值分佈在相對於核小體中心的基因座上。兩個圖的x軸為至核小體中心的距離。頂部圖顯示在y軸上之末端密度。頂部圖繪製了基於血漿DNA分子之U-末端(紫線720)及D-末端(藍線724)的末端密度。底部圖顯示了血漿DNA(藍線728)及尿液DNA(紅線732)的JI-U值。頂部圖上方之草圖示出核小體中心相對於x軸之位置。頂部圖顯示在接近連接子區域之區域中富含U-末端及D-末端密度,此與先前報導一致(Sun等人, 《美國國家科學院院刊》 U S A.2018;115:E5106-14)。底部圖顯示與其他位置相比,觀測到接近連接子區域之區域中JI-U值相對較高。與核小體核心區域相比,在連接子DNA區域中觀測到血漿DNA之平均JI-U升高22.4%。對於尿液DNA,連接子DNA區域中之平均JI-U增加13.1%。
8係相對於CTCF結合位點,尿液DNA之末端密度的圖示。y軸顯示尿液DNA末端之出現(亦即末端密度)。x軸顯示與CTCF結合位點之鹼基對距離。末端密度係末端出現的值,藉由跨越相對於CTCF結合位點的上游/下游1-kb基因座的彼等值的中值進行標準化。紫線804表示上游末端。藍線808表示下游末端。圖示中之垂直列突出顯示了-80±20 bp及+80±20 bp的距離範圍。尿液DNA之U-末端及D-末端密度顯示CTCF結合位點周圍的週期性信號。U-末端及D-末端之密度可用作生物標誌物,用於告知開放染色質區域內的病理生理狀態。圖8之資料係基於未患癌症之個體。
吾等使用距離範圍為-80 ± 20 bp內之D-末端與N-末端之間的末端密度的累積差異(∆C1)及距離範圍為+80 ± 20 bp內之N-末端與D-末端之間的累積差異(∆C2)作為量測值。在一個實施例中,∆C1及∆C2的總和(∆C)可用作評估患者是否可能患有癌症的分子指標。-80 ± 20 bp及+80 ± 20 bp之大小範圍顯示U-末端及D-末端密度之間的偏移。在其他實施例中,大小範圍可包括但不限於-40 ± 20 bp、-50 ± 20 bp、-60 ± 20 bp、-70 ± 20 bp、-100 ± 20 bp、+40 ± 20 bp、+50 ± 20 bp、+60 ± 20 bp、+70 ± 20 bp、+100 ± 20 bp或此等範圍之組合。
9顯示了患有血尿之對照個體以及患有低級別非肌肉浸潤性膀胱癌(NMIBC-LG)之患者、高級別非肌肉浸潤性膀胱癌(NMIBC-HG)之患者及肌肉浸潤性膀胱癌(MIBC)之患者中的末端密度的累積差異(∆C)的盒狀圖。y軸顯示末端密度的累積差異(∆C)。x軸顯示不同的個體組。與未患癌症之個體(中值:7.2;範圍:-4.9-22.77)相比,患有膀胱癌之患者中尿液DNA的∆C值顯著更高(中值:12.8;範圍:-36.1-25.9)( P值<0.0001,曼惠特尼 U檢測)。結果表明∆C可用於以非侵入性方式偵測癌症。 B.                分類準確率
10A 10B顯示了使用∆C度量區分患有及未患癌症之患者的ROC曲線。兩個圖在y軸上具有靈敏度且在x軸上具有特異性。圖10A係使用具有任何膀胱癌之水準的所有患者與對照個體的ROC曲線。AUC為0.75,用於將患有任何膀胱癌水準的個體與對照個體區分開來。圖10B係使用患有肌肉侵入性膀胱癌(MIBC)的患者與對照個體的ROC曲線。AUC為0.88,用於將患有MIBC的個體與對照個體區分開來。此等資料表明,用於癌症偵測之∆C度量的能力可能因癌症階段而異。癌症之晚期階段可能會產生更大的∆C度量及更高的AUC。資料亦表明,癌症之不同階段可基於∆C度量進行區分。 C.                實例方法
11顯示了分析自個體獲得之生物樣品的方法1100。生物樣品可為本文所描述之任何生物樣品。在一些實施例中,生物樣品可為尿液樣品。生物樣品可包括複數個核酸分子。複數個核酸分子為游離的。
在方塊1102處,可偵測複數個核酸分子中之一組核酸分子。一組核酸分子中之各核酸分子的特徵可在於至少一個末端在距預定類型的基因體位點指定距離處具有基因體位置。預定類型可與基因體位點處染色體中之蛋白質之修飾或基因體位點處之蛋白質相互作用相關。預定可意指位點類型係在定序及/或比對之前確定。基因體位點可為CTCF結合位點或DNASE1超敏位點(DHS)。在一些實施例中,基因體位點可為核小體中心、核小體邊緣或對應於核小體的區域。
識別一組核酸分子可包括對該核酸分子組中之各核酸分子進行定序以產生一或多個讀數。定序可以例如如本文所描述之各種方式進行。一或多個讀數可與參考基因體(例如,人類參考基因體)比對。核酸分子之基因體位置可由一或多個讀數確定。
在方塊1104處,一組核酸分子中之各核酸分子的一個末端可歸類為上游末端而另一端歸類為下游末端。分類可包括比對各核酸分子。比對可產生確定核酸分子末端處或末端附近的基因體座標。下游末端可基於針對基因體位置具有較高值(例如較高基因體座標)的末端來識別。在一些具體例中,可藉由在DNA聚合酶延伸方向上游(亦即5'→3' DNA合成)確定5'末端。在一些實施例中,5'及3'末端可藉由核苷酸之化學結構確定。例如,去氧核糖環之第五碳通常攜帶磷酸酯基(亦即,5'末端),而去氧核糖環之第三碳通常攜帶羥基(亦即,3'末端)。結果,可將兩個末端進行分類。
在方塊1106處,可確定在指定距離處具有上游末端之核酸分子的第一量。第一量可為核酸分子之數目、總長度或總質量。
在方塊1108處,可確定在指定距離處具有下游末端之核酸分子的第二量。第二量可為核酸分子之數目、總長度或總質量。
在方塊1110處,可確定使用第一量及第二量的分離值。分離值可為量的差異或比率。
分離值可與參考值進行比較。參考值可由來自不患有病況之個體之一或多個對照樣品或來自患有病況之個體之一或多個對照樣品確定。參考值可確定為本文所描述之任何參考值。
在方塊1112處,可使用分離值確定個體之病況水準。確定可基於將分離值與參考值進行比較。病況可為本文中所描述之任何病況。更嚴重水準之病況可與較大分離值相關聯。當分離值超過參考值時,個體可分類為患有病況或患有病況之高可能性。方法可包括用本文所描述之治療來治療病況。
在一些實施例中,可使用機器學習模型來執行分類,例如,如圖6之方塊606所描述。 V.  臨床上相關之DNA的富集
某些類型之組織或樣品可具有與其他組織或樣本不同的鋸齒狀特性。例如,胎兒DNA可能比母體DNA更具鋸齒狀。對於移植組織之受體,受體之DNA可能比供體之DNA更具有不同的鋸齒狀。因此,針對某一量或範圍的鋸齒狀富集或過濾(物理或電腦模擬)DNA可用於增強特定類型之組織的信號。富集之DNA可接著用於不同分析。 A.                孕婦之母體及胎兒尿液DNA分子之間的鋸齒狀末端
吾等亦研究孕婦之尿液DNA中母體來源及胎兒來源分子之間鋸齒狀的差異。吾等使用微陣列平台(Human Omni2.5,Illumina)對母體白血球層及胎盤組織進行基因分型。自5個孕婦收集排泄之尿液樣品。
存在191,143個資訊性單核苷酸多型性(SNP)基因座(範圍:311-207,363)之中值,其中母親為純合子的(亦即,AA)且胎兒為雜合子的(亦即,AB),從而允許定義胎兒特異性等位基因。吾等獲得191,655個資訊性SNP基因座(範圍:8,764-214,815)之中值,其中母親為雜合子的(亦即,AB)且胎兒為純合子的(亦即,AA),從而允許定義母體特異性等位基因。攜帶母體特異性及胎兒特異性等位基因的尿液DNA分子被視為母體來源及胎兒來源的尿液DNA分子。
自各懷孕血漿個體中獲得4500萬(範圍:2500-9300萬)映射的成對末端尿液DNA讀數的中值。彼等樣品中之中值胎兒DNA分數為0.5%(範圍:0.4%-0.9%)。根據本揭示案中之實施例,將所有母體特異性及胎兒特異性DNA分子分別合併且用於計算鋸齒狀末端指標(JI-U)。
12顯示了孕婦之母體來源及胎兒來源尿液DNA之間的JI-U值。y軸顯示JI-U。x軸顯示母體來源之DNA及胎兒來源之DNA。如圖12中所示,孕婦之尿液中胎兒尿液DNA的JI-U(JI-U:30.1)高於母體DNA的JI-U(JI-U:28.9)。換言之,與母體來源之尿液DNA相比,胎兒來源之尿液DNA的JI-U值增加了4.1%。此等結果表明尿液DNA之鋸齒狀末端可反映起源組織。尿液DNA之鋸齒狀可適用於非侵入性產前檢測。例如,鋸齒狀指標較高之DNA分子將富集胎兒DNA。此類基於尿液DNA鋸齒狀末端之選擇將有助於使用尿液DNA分子偵測胎兒病症,因為尿液DNA池中之胎兒DNA分數愈高,使用尿液DNA偵測胎兒病症將愈敏感。 B.                移植患者中之鋸齒狀末端
吾等分析12名移植患者之尿液DNA的JI-U,包括腎移植(n=10)、造血幹細胞移植(HSCT,n=1)及肝移植(n=1)。吾等使用大規模平行亞硫酸氫鹽定序獲得了5400萬成對末端讀數(範圍:2900萬至2.96億)之中值。存在201,499個供體特異性資訊性SNP基因座(範圍:14,091-328,861)之中值,其中受體為純合子的(亦即,AA)且供者為雜合子的(亦即,AB)或受體及供體都為純合子的但在不同基因型(亦即,AA與BB)中,從而允許定義供體特異性等位基因。存在195,475個受體特異性資訊性SNP基因座(範圍:2,913-334,122)之中值,其中受體為雜合子的(亦即,AB)且供體為純合子的(亦即,AA)或受體及供體都為純合子的但在不同基因型(亦即,AA與BB)中,從而允許定義受體特異性等位基因。攜帶受體特異性及供體特異性等位基因的尿液DNA分子被視為受體來源及供體來源的尿液DNA分子。彼等樣品中之中值供體DNA分數為32.9%(範圍:2.5%-94.0%)。根據本揭示案中之實施例,針對各樣品分別推導出尿液中受體來源DNA分子及供體來源DNA分子的JI-U模式。
13A13B13C顯示了不同移植患者中受體來源及供體來源DNA之間的JI-U值。圖13A顯示了腎移植患者。圖13B顯示了造血幹細胞移植(HSCT)患者。圖13C顯示了肝移植患者。三個圖中之每一者的y軸顯示JI-U。三個圖中之每一者的x軸顯示受體來源之DNA及供體來源之DNA。
圖13A顯示與腎移植患者之尿液中之受體DNA(中值:32.2)相比,供體DNA中之JI-U(中值:30.1)降低了6.5%。相比之下,圖13B與圖13C顯示供體DNA中之JI-U的增加。
圖13B顯示與HSCT中之受體DNA(JI-U:33.4)相比,供體DNA中之JI-U(JI-U:39.3)增加了17.6%。
圖13C顯示與肝移植患者之尿液中之受體DNA(38.7)相比,供體DNA中之JI-U(42.6)增加(升高:約10.0%)。
此等結果表明,與腎後DNA分子相比,跨腎DNA分子可能具有更大的鋸齒狀特徵。因此,在一個實施例中,可使用鋸齒狀標記物藉由選擇性地分析具有長鋸齒狀末端的尿液DNA分子來富集跨腎DNA分子,藉此提高使用尿液DNA來監測泌尿系統外器官(例如血細胞、肝臟、肺及結腸等)受損的效能。選擇性分析可涉及所需尿液DNA分子之電腦模擬及物理選擇。物理選擇可包括但不限於由DNA探針、凝膠電泳及微流體介導之基於磁珠的雜交分析。 C.                實例富集方法
14顯示了富集自個體獲得之生物樣品的臨床上相關之核酸分子的方法1400。生物樣品可包括複數個核酸分子。複數個核酸分子可為游離的。複數個核酸分子可包括臨床上相關之核酸分子及其他核酸分子。第一複數個核酸分子中之各核酸分子可為具有第一部分之第一股及第二股的雙股。複數個核酸分子中之至少一些的第一股的第一部分可不具有來自第二股之互補部分。第一部分可不與第二股雜交。第一部分可在第一股之第一末端。第一部分可懸垂第二股。臨床上相關之核酸分子可包括胎兒DNA、腫瘤來源之DNA、移植物DNA或與病症相關之DNA。
在方塊1402處,可選擇第一複數個核酸分子內之核酸分子的子組。對於核酸分子子組中之各核酸分子,懸垂第二股或未與第二股雜交之第一股的長度可大於臨限值。第一股之長度可懸垂第二股。核酸分子子組可包括比複數個核酸分子更少的核酸分子。
在一些實施例中,選擇核酸分子子組可包括量測第一股及/或第二股的特徵。對於複數個核酸分子中之各核酸分子,特徵可與懸垂第二股或未與第二股雜交之第一鏈的長度相關(例如,與其成比例)。該特徵亦可與懸垂第二股之第一股的長度成比例。該特性可為本文所描述之任何特徵,包括懸垂第二股或未與第二股雜交之第一股的長度。識別核酸分子子組可包括藉由電腦系統選擇具有大於閾值之特徵的核酸分子以獲得第二複數個核酸分子。閾值可為突出末端之最小長度。例如,最小長度可為1、2、3、4、5、6、7、8、9、10、10至15、15至20或大於20個核苷酸。
在一些實施例中,選擇核酸分子子組可包括對具有最小突出末端長度的分子的物理選擇。選擇核酸分子子組可包括將核酸分子子組與複數個核酸分子之其餘部分物理分離。例如,方法可包括對於第一複數個核酸分子中之各核酸分子,將寡核苷酸與第一股的長度雜交。可量測寡核苷酸之特徵。寡核苷酸之特徵可與懸垂第二股或不與第二股雜交之第一股的長度成比例。可選擇具有大於閾值的特徵的核酸分子以獲得第二複數個核酸分子。寡核苷酸可包括一或多個螢光標記物。特徵可為螢光。寡核苷酸可基於螢光進行分類。在一些實施例中,物理選擇可包括由DNA探針、凝膠電泳及微流體介導之基於磁珠的雜交分析。
與其他基於雜交之捕獲富集技術不同,雜交技術不涉及將雙股DNA變性以形成單股DNA以促進與寡核苷酸的雜交。雙股DNA分子之鋸齒狀末端已經為單股DNA,且使具有鋸齒狀末端之雙鏈DNA分子變性可使得確定鋸齒狀末端的長度變得更加困難。
在一些實施例中,寡核苷酸可連接至超過截止長度之寡核苷酸的標記物。該方法可包括捕獲具有標記物之核酸分子以獲得第二複數個核酸分子。標記物可包括生物素或具有可以選擇性捕獲之結構的其他分子。核酸分子可藉由結合標記物來捕獲。可以擴增捕獲之核酸分子以獲得經擴增之核酸分子子組。
經擴增之核酸分子子組可表示比其他區域具有更多鋸齒狀末端之基因體區域。例如,可識別在患有癌症(例如膀胱癌)之個體中產生比無癌症之個體更多的具有較長鋸齒狀末端的分子的基因體區域。可設計靶向長鋸齒狀末端(例如長於10 nt)之探針。探針可優先結合長鋸齒狀末端而非較短鋸齒狀末端。長於某一長度之探針難以與短於某一長度之鋸齒狀末端雜交。此外,即使探針能夠與較短長度雜交,探針與較短末端之間的親和力仍低於探針與較長長度之間的親和力。因此,雜交探針及較短鋸齒狀末端可能不穩定,且在某些溫度(諸如培育溫度)下,雜交可變性。
可使用各種雜交分析。雜交可在液體溶液中或在固體支撐物上實現。對於液體溶液,分析之後可進行分離步驟以分離雜合產物。分離步驟可涉及磁場中之磁性顆粒。塗佈有鏈黴抗生物素蛋白之磁珠可選擇性地收集目標長鋸齒狀末端。在一些實施例中,吸收層析、差異沈澱、電泳、親和層析或免疫沈澱可用於分離。對於固體支撐物,支撐物可包括聚合物珠粒、玻璃載玻片、含樹脂之管柱或膜。標記之長鋸齒狀末端可連接至支撐基底,且可洗掉非結合片段(例如使用流體學)。
在方塊1404處,可分析核酸分子子組以確定臨床上相關之核酸分子的特性。在一些實施例中,分析核酸分子子組可包括使用經擴增之核酸分子子組。
分析核酸分子子組可包括使用第二複數個核酸分子確定參數值。確定參數值可使用經擴增之核酸分子子組。參數可為大小分佈之統計量度,包括平均值、中值、模式、百分位數、最小值或最大值。在一些實施例中,參數之值可為核酸分子之量。在一些實施例中,參數之值可使用某些區域中核酸分子之量確定。例如,核酸分子之量可用於確定多個拷貝數畸變,包括缺失及擴增。
可使用參數值確定病況水準的分類。確定病況水準之分類可包括比較參數值與參考值。當參數值超過參考值時,病況之水準可分類為存在、可能或嚴重。參考值可為本文所描述之任何參考值。病況可包括疾病、病症、妊娠或移植狀態。病況可包括癌症、自體免疫性疾病、妊娠相關之病況或移植排斥反應。病況可包括本文所描述之任何病況。該方法可進一步包括在對病況存在或嚴重進行分類之後的治療。治療可包括本文所描述之任何治療。
病況之分類亦可基於其他臨床因素。例如,由於遺傳因素或年齡,個人可被認為處於特定病況之風險下。在一些實例中,個體可呈現該病況之症狀。
在一些實施例中,可使用機器學習模型來執行分類,例如,如圖6之方塊606所描述。 VI.            移植病況
吾等進一步分析了兩個腎移植樣品(RT01及RT02),分別具有7200及7900萬配對讀數。發現RT01及RT02之供體DNA分數分別為32.9%及53.2%。
15顯示具有及不具有急性排斥反應之腎移植患者之間的尿液DNA的JI-U值。y軸顯示JI-U值。x軸顯示不同樣品之類別:無排斥反應之樣品及兩個腎移植樣品(RT01及RT02)。
如圖15中所示,吾等觀測到與10名無排斥反應的腎移植患者(JI-U中值:30.9)相比,患有急性排斥反應的腎移植患者RT01中之JI-U(JI-U:24.7)降低了20.0%。吾等觀測到與10名無排斥反應的腎移植患者(JI-U中值:30.9)相比,患有急性排斥反應的腎移植患者RT01中之JI-U(JI-U:24.6)降低了20.4%。此等資料表明吾人可使用尿液DNA分子之JI-U來監測器官移植患者。
基於圖13B及圖13C顯示供體來源之DNA的JI-U值高於受體來源之DNA,吾等預計HSCT及肝移植排斥樣品比無排斥的樣品具有更高的JI-U值。
16顯示了分析自個體獲得之生物樣品的方法1600。個體可為第一組織之移植物之受體。移植之第一組織可來自腎臟、造血幹細胞或肝臟。在一些實施例中,移植之組織可來自器官,包括心臟、肺、胰臟或腸。移植之組織可與器官一起移植。在一些實施例中,移植物可包括角膜、皮膚、血液、骨胳或肢體。
生物樣品可包括血液、血漿、尿液或唾液,或可為本文所揭示之任何生物樣品。生物樣品可包括複數個核酸分子。複數個核酸分子可為游離的。複數個核酸分子中之各核酸分子可為具有第一部分之第一股及第二股的雙股。複數個核酸分子中之至少一些的第一股的第一部分可不具有來自第二股之互補部分。第一部分可懸垂第二股或不與第二股雜交。第一部分可在第一股之第一末端。
在方塊1602處,可量測複數個核酸分子中之各核酸分子的第一股及/或第二股的特徵。特徵可與懸垂第二股或不與第二股雜交之第一股的長度相關(例如,成比例)。該特性可為本文所描述之任何特性,包括鋸齒狀末端之長度。
在方塊1604處,可使用複數個核酸分子之量測特徵確定鋸齒狀指標值。鋸齒狀指標值可提供股之長度之集合量度,該股懸垂複數個核酸分子中之另一股或不與其雜交。鋸齒狀指標值可為鋸齒狀末端值(例如,鋸齒狀指標未甲基化[JI-U])。鋸齒狀指標值可為本文所描述之任何鋸齒狀指標值,包括複數個核酸分子之鋸齒狀末端之長度的統計值。
鋸齒狀指標值可與參考值進行比較。參考值可使用排斥移植物之個體的一或多個參考樣品確定。在一些實施例中,參考值可使用不排斥移植物之個體之一或多個參考樣品確定。在自個體獲得生物樣品之前,可使用自個體獲得之一或多個參考樣品來確定參考值。例如,參考值可由在個體接受移植之前獲得的一或多個參考樣品確定。作為另一實例,參考值可由獲自移植後但在當前生物樣品之前之個體的一或多個參考樣品確定。鋸齒狀指標值可隨時間推移在移植受體中監測,其中過去鋸齒狀指標值充當參考值。
在方塊1606處,可使用鋸齒狀指標值確定移植至個體中之第一組織的移植病況。確定可基於鋸齒狀指標值與參考值之比較。移植病況可包括排斥反應、移植物功能障礙或感染的可能性。在一些實施例中,當鋸齒狀指標值大於參考值時,移植病況可分類為排斥、可能被排斥、具有移植物功能障礙、可能具有移植物功能障礙、被感染或可能被感染。例如,第一組織可為一或多個造血幹細胞或來自肝臟。在其他實施例中,當鋸齒狀指標值小於參考值時,移植病況可被確定為被排斥、可能被排斥、具有移植物功能障礙、可能具有移植物功能障礙、被感染或可能被感染。例如,移植物可來自腎臟。
可在移植物被排斥或可能被排斥時確定移植病況。該方法可包括治療個體之移植物的急性排斥反應。例如,移植物可自個體移除。在一些實施例中,個體可投與免疫抑制劑藥物。在一些實施例中,個體可用抗體、血液轉移、骨髓移植或基因療法進行治療。
在一些實施例中,可使用機器學習模型來執行確定,例如,如圖6之方塊606中所描述。 VII.         基因體位點周圍之差異鋸齒狀
吾等進一步探究鋸齒狀末端是否與核小體結構有關。鋸齒狀末端之研究基於其相對於可能與基因體位點處之染色質中的蛋白質修飾或基因體位點處之蛋白質相互作用相關的位點的位置。吾等首先識別基因體區域,其中存在一系列有序的核小體,稱為核小體陣列。例如,在CTCF(由CTCF基因編碼之轉錄因子)結合位點附近的基因體區域中的核小體定位被認為係有序的(Snyder等人, 《細胞》.2016;164:57-68;Sun等人, 《基因體研究》. 2019;29:418-27)。吾等分析相對於CTCF結合位點的1-kb上游/下游之尿液及血漿DNA的鋸齒狀。吾等計算CTCF結合位點周圍血漿DNA末端的出現(亦即末端密度)。末端密度係末端出現之值,藉由跨越相對於CTCF結合位點的上游/下游1-kb基因座的彼等值的中值進行標準化。當吾人根據血漿DNA片段相對於參考基因體之上游及下游末端(亦即,U-末端及D-末端)的方向分別分析末端時,片段末端信號繞開放染色質區域有差異地定相(Sun等人, 《基因體研究》. 2019;29:418-27)。換言之,將定序片段與人類參考基因體比對後,片段之U-末端表示基因體座標中具有較小值的末端,而D-末端表示基因體座標中具有較大值的末端(Sun等人, 《基因體研究》. 2019;29:418-27)。
除相對於CTCF位點之位置之外,發現鋸齒狀相對於其他位點而不同,包括組蛋白修飾及DNASE1超敏位點(DHS)。相對於此等位點之某些位置處之DNA片段的鋸齒狀指標值可用於確定病況(諸如癌症)之水準。 A.                顯示特定位點之鋸齒狀差異的結果
17A17B顯示鋸齒狀末端及核小體軌跡之間的關係。
17A顯示了在非癌性個體中彙集的源自Watson股的血漿及尿液DNA分子的CTCF結合位點周圍的JI-U值。y軸係血漿DNA末端密度。x軸為與CTCF結合位點之鹼基對距離。紅線1704表示尿液DNA。藍線1708表示尿液DNA。有趣地,將具有對應於CTCF結合位點之尿液DNA之JI-U信號定相成自末端密度推導之核小體陣列的模式。JI-U信號之峰位置大致與連接子DNA區域比對,表明藉由DNA核酸酶切割之連接子DNA可能伴有鋸齒狀末端之產生。亦在源自Watson股之血漿DNA分子中觀測到JI-U信號之此類核小體模式。然而,CTCF(中值:35.4)附近之尿液DNA JI-U波的幅度高於對照樣品的血漿DNA(中值:20.2),而尿液及血漿DNA JI-U信號之間的週期性位置無明顯差異。
17B顯示了對照個體及患有不同階段膀胱癌之患者中源自Watson股的尿液DNA分子的CTCF結合位點周圍的JI-U值。y軸係血漿DNA末端密度。x軸為與CTCF結合位點之鹼基對距離。不同顏色的線顯示了患有血尿但無膀胱癌的對照個體(藍線1712)、低級別非肌肉浸潤性膀胱癌(NMIBC LG)的個體(綠線1716)、高級別非肌肉浸潤性膀胱癌(NMIBC HG)的個體(黃線1720)及肌肉浸潤性膀胱癌(MIBC)的個體(紅線1724)。如圖17B中所示,與無膀胱癌之患者相比,膀胱癌患者之尿液DNA中CTCF附近的JI-U值亦較低,通常在患有MIBC及高級別NMIBC之患者中最低。由源自Watson股之細胞DNA分子量測的JI-U值的模式可由來自Crick股的彼等值反映出來。此等結果表明,沿核小體結構之JI-U值可用於癌症偵測。
如上文所描述,圖7B顯示了血漿DNA及尿液DNA兩者相對於核小體中心之距離的JI-U值。在與核小體中心之距離相同的情況下,觀測到尿液DNA之JI-U值高於血漿DNA。
為進一步驗證鋸齒狀末端是否優先出現在核小體連接子DNA區域中,吾等使用相對於各核小體軌跡中心之片段計算JI-U值。核小體軌跡(1,037,961個區域)來自先前公開之研究(Gaffney等人, 《公共科學圖書館:遺傳學(PLoS Genet)》.2012;8:e1003036)。 B.                使用在CTCF位點處之鋸齒狀區分病況的準確性
18顯示了使用相對於CTCF位點範圍為0至500之位置的JI-U的累積JI-U值來區分患有MIBC之患者及未患有膀胱癌之患者的ROC圖。靈敏度顯示於y軸上。特異性顯示於x軸上。JI-U沿相對於圖17B中CTCF位點範圍為0至500之位置的累積JI-U值在區分MIBC患者及無膀胱癌患者方面實現0.85的AUC。此等結果展現,沿核小體結構之尿液DNA的JI-U值可用於癌症偵測。 C.                使用具有組蛋白修飾區域處之鋸齒狀區分病況的準確性
特定區域之鋸齒狀可用於癌症偵測。可使用特定組蛋白修飾,包括例如H3K4me1、H3K4me3、H3K36me3、H3K27me2、H3K9Ac、H3K27Ac、H4K16Ac、H3K27me3及H3K9me3。分析H3K4me1及H3K4me3。H3K4me1為對DNA包裝蛋白組蛋白H3起作用之表觀遺傳修飾,其涉及組蛋白H3蛋白之第四個離胺酸殘基處的單甲基化。據報導,H3K4me1與基因強化子相關。H3K4me3為對DNA包裝蛋白組蛋白H3起作用之表觀遺傳修飾,其涉及組蛋白H3蛋白之第四個離胺酸殘基處的三甲基化。據報導,H3K4me3與活化基因表現相關。
19A19B顯示了分析源自與此等組蛋白修飾相關之基因體區域的尿液DNA鋸齒狀末端的結果。圖19A及19B顯示了使用累積JI-U值區分患有MIBC之患者及無膀胱癌之患者的ROC圖。圖19A顯示了使用與H3K4me1組蛋白修飾相關之基因體區域的結果。圖19B顯示了使用與H3K4me3組蛋白修飾相關之基因體區域的結果。靈敏度顯示在兩個圖中之y軸上,特異性顯示在兩個圖中之x軸上。如自兩個圖看出,與H3K4me1相關之JI-U值(AUC:0.77)相比,自H3K4me3標記之基因體區域推導出的JI-U值在區分膀胱癌患者及無癌症患者(AUC:0.80)方面具有較好效能。此結果表明,對與特定表觀遺傳修飾相關之鋸齒狀末端的選擇性分析可增強診斷能力。 D.               實例方法
20顯示了分析自個體獲得之生物樣品的方法2000。生物樣品可為本文所描述之任何生物樣品。生物樣品可包括複數個核酸分子。複數個核酸分子可為游離的。複數個核酸分子中之各核酸分子可為具有在一個末端處的第一部分之第一股及第二股的雙股。複數個核酸分子中之至少一些的第一股的第一部分可不具有來自第二股之互補部分。第一部分可不與第二股雜交。第一部分亦可在第一股之第一末端。第一股之第一部分可懸垂第二股。
在方塊2002處,可對複數個核酸分子進行定序以產生序列讀數。定序可藉由本文中所揭示之任何技術進行。
在方塊2004處,可將序列讀數與參考基因體比對以確定複數個核酸分子的基因體位置。參考基因體可為人類參考基因體。
在方塊2006處,可識別複數個核酸分子中之一組核酸分子。核酸分子組中之各核酸分子可在距基因體位點指定距離處具有基因體位置。基因體位點可為預定類型之位點。基因體位點可與基因體位點處染色體中之蛋白質之修飾或基因體位點處之蛋白質相互作用相關。基因體位點可為CTCF結合位點或DNASE1超敏位點(DHS)。基因體位點可指基因體區域而非受限於單一基因體座標。此外,基因體位點可包括具有特定組蛋白修飾之區域,諸如H3K4me1、H3K4me3、H3K36me3、H3K27me2、H3K9Ac、H3K27Ac、H4K16Ac、H3K27me3及H3K9me3。在一些實施例中,基因體位點可為核小體中心、核小體邊緣或對應於核小體的區域。識別核酸分子組可包括對核酸分子組中之各核酸分子進行定序以產生一或多個讀數。定序可以例如如本文所描述之各種方式進行。實例技術可使用探針、合成定序、接合及奈米孔。一或多個讀數可與參考基因體(例如,人類參考基因體)比對。核酸分子之基因體位置可由一或多個讀數確定。
距基因體位點之指定距離可在一個範圍。例如,範圍可為0至40 nt、40至70 nt、70至100 nt、100至130 nt、130至160 nt、160至190 nt、190至200 nt、200至250 nt、250至300 nt、300至350 nt、350至400 nt、400至500 nt、500至750 nt、750至1,000 nt或大於1,000 nt。在一些實施例中,指定距離可為0 nt。
在方塊2008處,可量測核酸分子組中之各核酸分子的第一股及/或第二股的特徵。特徵可與懸垂第二股或不與第二股雜交之第一股的長度相關(例如,成比例)。該特性可為本文所描述之任何特性,包括直接確定之長度。
在方塊2010處,可使用核酸分子組之量測特徵確定鋸齒狀指標值。鋸齒狀指標值可提供股之長度之集合量度,該股不與核酸分子組中之另一股雜交。鋸齒狀指標值可為本文所描述之任何鋸齒狀指標值,包括核酸分子組之鋸齒狀末端之長度的統計值。
鋸齒狀指標值可與參考值進行比較。參考值可由來自患有病況或無病況之個體的參考樣品確定。參考值可以本文所描述之任何方式確定。
在方塊2012處,可使用鋸齒狀指標值來確定個體病況之水準。確定可基於鋸齒狀末端值與參考值之比較。病況可為本文中所描述之任何病況。若鋸齒狀指標值超過參考值,則可確定病況存在、可能或嚴重。方法可包括治療病況。治療可為本文所描述之任何治療。
在一些實施例中,可使用機器學習模型來執行確定,例如,如圖6之方塊606中所描述。 VIII.      不修剪3'末端之鋸齒狀末端分析技術
本文之揭示內容顯示,大量游離DNA(cfDNA)之單股突出末端不僅存在於血漿中,亦存在於尿液中。吾人之先前工作已證明,通過定序(Jag-seq)進行鋸齒狀末端分析可研究鋸齒狀末端之特徵,且吾等發現血漿DNA中之鋸齒狀末端可用作分子診斷中的生物標誌物的證據(Jiang等人, 2020)。然而,關於尿液cfDNA中之鋸齒狀末端的分子特徵的資訊極少。因此,吾等將Jag-seq(Jag-seq II)之經修改版本應用於尿液cfDNA中以更多地探究鋸齒狀末端的性質,尤其係尿液中鋸齒狀末端的長度及鋸齒狀末端分析在尿液DNA中的應用。新版本Jag-seq II出乎意料地允許更準確地確定鋸齒狀末端長度,且更準確地確定由鋸齒狀末端長度分析產生之病況水準。5’突出末端係在無處理之情況下進行分析以修剪3’突出末端。避免修剪3'末端會增加待分析之懸垂的5'末端之量,尤其係較短的5'末端突出末端。 A.   用於檢查cfDNA分子之突出末端的酶處理
21A顯示了用於確定鋸齒狀末端之長度的先前Jag-seq方法。Jag-seq方法主要用於確定5'突出末端及鈍末端(例如片段2304)。階段2110顯示具有5'突出末端之片段2104及具有3'突出末端之片段2108。片段中之胞嘧啶大部分未甲基化。
階段2120顯示了用核酸外切酶Exo T移除3'突出末端後的片段。片段2108變為片段2112。片段2104不受影響。
階段2130顯示了在用Klenow(exo-)填充5'突出末端之後片段2104的結果。藍色虛線(例如,線2116及2118)表示鈍末端片段之新填充的核苷酸。5'突出末端分子之3'末端由dATP(A)、dTTP(T)、dGTP(G)及mdCTP(mC)填充以形成鈍末端。新填充之核苷酸中之胞嘧啶甲基化,而原始片段之胞嘧啶未甲基化。新填充之核苷酸與原始片段之間的甲基化差異允許甲基化圖譜指示鋸齒狀末端之長度。片段2112仍可在樣品中,但因為片段不影響後面的鋸齒狀末端分析,所以不再顯示。
階段2140顯示了用PNK進行5'磷酸化後的鈍末端片段。階段2150顯示了與定序接附子(例如接附子2122及2124)接合後之鈍末端片段。
在階段2150之後,可對片段進行亞硫酸氫鹽處理。可如在圖1中之階段120所描述進行鋸齒狀末端分析。最初具有3'突出末端之片段(諸如片段2308)不會影響鋸齒狀末端分析,因為此等片段不接收新核苷酸以填充鋸齒狀末端。
21B顯示了一種改進方法,稱為Jag-seq II,用於鋸齒狀末端偵測以更好地瞭解cfDNA之片段化。吾人藉由忽略3'突出末端之修剪處理步驟來改進Jag-seq方法,此意謂3突出末端分子中之3'突出末端在末端修復程序期間未經拋光。
在階段2160,具有5'突出末端之片段(片段2104)及3'突出末端之片段(片段2108)均存在。階段2160可等效於階段2110。隨後用Hemo Klen Taq處理片段以填充5'突出末端,但不添加3'修剪處理。
階段2170顯示了在5'突出末端經填充以形成鈍末端片段之後的片段。片段2104變為片段2164。藍色虛線對應於鈍末端片段之新填充的核苷酸。新填充之核苷酸中之胞嘧啶甲基化,而原始片段之胞嘧啶未甲基化。在其他實施例中,新填充之核苷酸可為未甲基化的,而原始片段之核苷酸為甲基化的。片段2108保持不變。
階段2180顯示了用PNK進行5'磷酸化後的片段。片段2164經磷酸化變為片段2168。片段2108經磷酸化變為片段2172。
階段2190顯示了與定序接附子(例如接附子2182及2184)接合後之片段。將定序接附子添加至鈍末端片段中變為片段2176。片段2176接著可經歷亞硫酸氫鹽定序且分析鋸齒狀末端,如在圖1中階段120所描述。片段2172不為鈍末端的,且定序接附子不與片段連接。因此,片段2172不經歷亞硫酸氫鹽定序(由紅色X表示)。
此改進方法將保留突出之3'末端的組態,而無需經由酶修剪進行人工改動。與先前方法相比,此新穎方法在鋸齒狀末端長度推論上達成更精確的效能,尤其對於含有短5'突出末端或鈍末端的分子。以下更詳細地描述了使用短5'突出末端之改進,其中在分析突出末端時的少數核苷酸誤差會導致鋸齒狀末端長度具有更大的百分比差異。避免修剪3'突出末端不會人工增加亞硫酸氫鹽定序後確定的鈍末端之計數。
22A-22F示出了使用Jag-seq及Jag-seq II技術對具有5'突出鋸齒狀末端的摻入分子的影響。摻入DNA分子係已知序列的DNA分子。圖22A顯示了1 nt摻入鋸齒狀末端的序列結構。圖22B顯示了14 nt摻入鋸齒狀末端的序列結構。粗體及下劃線之鹼基表示5'突出末端。
兩個分子旨在研究含有較短鋸齒狀末端的分子是否會更嚴重地受到在Jag-seq中使用而非在Jag-seq II中使用的3'末端修剪步驟的影響。兩個分子均在與具有5'突出末端之股雜交的股的3'末端包括一或多個C核苷酸。圖22A顯示了在末端處的單個C核苷酸。
如圖22B中所示,吾等設計了帶有14 nt 5'突出末端之46 bp分子,其中在較短股的3'末端處具有四個連續的C。此外,較長股的第一個突出末端鹼基係G,其使得G的互補鹼基mC在末端修復步驟中作為第一個鹼基而被併入。因此,經由此特殊序列鹼基組合,吾等能夠偵測到文庫製備期間產生之任何人工鋸齒狀末端。吾人在文庫製備期間添加此分子作為內部對照,如圖22D中所示。此分子允許吾等確認新的定序方案在末端修復過程期間填充了鋸齒狀末端。
圖22C-22F顯示了具有已知鋸齒狀末端之摻入序列的C的轉化圖。添加以填充鋸齒狀末端的C經甲基化且不會轉化為T。作為原始分子一部分的C未經甲基化且轉化為T。具有1 nt及14 nt鋸齒狀末端之摻入序列的部分序列顯示在x軸上。以大寫字母表示之核苷酸指示序列呈雙股形式。小寫字母及下劃線之核苷酸指示在末端修復期間新填充之序列。垂直條之陰影部分表示T的頻率(經轉化之C)。垂直條之白色部分指示C的頻率(未經轉化之C)。圖22C及22D係使用Jag-seq II技術之結果。圖22E及22F係使用Jag-seq技術之結果。由於吾等在併入步驟中使用了甲基化之C,因此末端修復前原始片段對應的核苷酸應為經轉化之C(亦即T,以灰色表示),而末端修復核苷酸對應的核苷酸應為未經轉化之C(亦即C,以白色表示)。
如圖22D中所示,在亞硫酸氫鹽定序後使用Jag-seq II技術,吾等觀測到99.96%位於DNA分子原始雙股部分的C轉化為T,而98.32%新填充之C(甲基化)保留作為C,因為吾等在併入步驟中使用了甲基化之C。
相比之下,如圖22F中所示,短股中最後一個鹼基中15.85%的C在Jag-seq中為未經轉化之C(亦即,在亞硫酸氫鹽處理之前填充有mC),此可潛在地影響鋸齒狀末端長度推斷或隨後使用鋸齒狀末端長度進行分析的準確性。雙股上之3'較短末端處之不合需要mC填充係由Jag-seq中之3'末端修剪過程引起的,即使3'較短末端不為突出末端。與圖22F中使用Jag-seq時的短股中最後一個鹼基中15.85%的C為未經轉化之C相比,圖22D顯示使用Jag-seq II時未經轉化之C顯著減少,即短股中最後一個鹼基中僅約0.04%的C為未經轉化之C。
圖22C顯示,使用Jag-seq II技術,雙股之最後一個鹼基上僅0.19%的C未經轉化。相比之下,圖22E顯示使用Jag-seq技術,最後一個鹼基上98.23%的C未經轉化。換言之,99.81%之片段經確定與最初設計成經修改的Jag-seq II方案中的1-nt的鋸齒狀末端長度一致,而僅1.77%之片段經確定與先前Jag-seq方案中的1-nt的鋸齒狀末端長度一致。此等結果指示,經改良的方法不會影響分子末端之性質,且吾等因此成功地提高了精確鋸齒狀末端長度推斷之準確性,尤其係對於短5'鋸齒狀末端。此等提高之準確性結果出人意料,因為修剪3'懸垂末端之處理預計不會影響具有5’突出末端之片段的準確性。 B.                尿液cfDNA中鋸齒狀末端指標值及平均鋸齒狀末端長度
驗證了Jag-seq II在鋸齒狀末端分析中之使用。分析尿液樣品中之片段的鋸齒狀末端長度及甲基化水準,甲基化水準與鋸齒狀末端長度相關。
23顯示了使用Jag-seqII的尿液cfDNA中不同大小範圍內的讀數2(JI-M)中CH甲基化水準的分佈圖。此處,CH甲基化包括任何C之甲基化,其中H為A、C或T,但其中H不為G。讀數2對應於包括經添加之核苷酸以填充5'突出末端的讀數。在此圖中,讀數2包括末端75個核苷酸。JI-M為鋸齒狀指標甲基化,即讀數2中之CH甲基化水準。較高JI-M指示較多甲基化及較長鋸齒狀末端。不同的線表示來自不同健康個體之不同樣品。
吾等對健康尿液樣品進行了Jag-seq II,以查看尿液鋸齒狀末端的基本特徵。y軸以百分比形式顯示讀數2(JI-M)中之CH甲基化水準。x軸顯示片段大小(bp)。1U至5U之不同的線表示不同的健康個體。JI-M之值隨不同大小之分子而變化,顯示波浪狀模式。當片段大小為約130 bp時,JI-M迅速增加且達到約50%之次峰。JI-M在65%-80%處且在分子大小為240 bp附近連續增長至第一個主峰。隨後,在大約410 bp片段大小處出現第二個主峰。
吾等先前研究(Jiang等, 2020)已發現CC-標籤策略,其使用一個甲基化C緊鄰一個未甲基化C來推斷鋸齒狀末端之起點,提供一種推斷準確鋸齒狀末端長度的解決方案。例如,原始片段之3'末端之最末端的C可能經甲基化。另一股上具有5'突出末端的下一個核苷酸為G。因此,填充鋸齒狀末端之新添加的核苷酸將為未甲基化之C。隨後,緊鄰未甲基化之C的甲基化C的模式可確定鋸齒狀末端的確切起點。吾等檢測不同分子大小下之平均值及中值鋸齒狀末端長度,且觀測到具有與JI-M類似的波浪狀模式。
24A24B顯示了尿液cfDNA中不同片段大小之平均值及中值鋸齒狀末端長度。x軸顯示兩個圖中之片段大小(bp)。圖24A中之y軸顯示了平均(平均值)鋸齒狀末端長度。圖24B中之y軸顯示了中值鋸齒狀末端長度。1U至5U之不同的線表示不同的健康個體。兩個圖均顯示了鋸齒狀末端長度的波浪狀模式。兩個峰之間的距離約為170 bp,其對應於核小體足跡。此等圖顯示鋸齒狀末端型態可用於確定及監測核小體模式。 C.                癌症生物標記物
為進一步檢查尿液cfDNA之鋸齒狀末端的特徵是否可作為新的生物標記物,為癌症診斷提供一個額外領域,吾等將Jag-seq II應用於癌症患者之尿液cfDNA。
25A25B顯示了膀胱癌患者及對照個體的JI-M及平均鋸齒狀末端長度的盒鬚圖。平均鋸齒狀末端長度係自CC-標籤確定之所有鋸齒狀末端長度的平均值。圖中之x軸顯示對照個體及膀胱癌患者。圖25A中之y軸顯示JI-M值。圖25B中之y軸顯示平均鋸齒狀末端長度(nt)。顯然,膀胱癌患者之JI-M及平均鋸齒狀末端長度(JI-M:中值,40.69;範圍,34.11-44.25;平均鋸齒狀末端長度:中值,22.10;範圍,18.83-24.01)比健康對照之彼等JI-M及平均鋸齒狀末端長度(JI-M:中值,48.14;範圍,37.94-56.46;平均鋸齒狀末端長度:中值,25.16;範圍,20.30-26.63)在統計學上均有所下降。JI-M值或平均鋸齒狀末端長度經證明係膀胱癌之可能生物標記物。 D.               實例方法
26係與分析自個體獲得的生物樣品而不修剪樣品中片段之3'末端相關的實例過程2600的流程圖。在一些實施中,圖26之一或多個過程方塊可由系統(例如,圖34中之系統3400)執行。在一些實施中,圖26之一或多個過程方塊可由與系統分離或包括該系統之另一裝置或裝置群組執行。另外或替代地,圖26之一或多個過程方塊可由系統3400之一或多個組件執行,諸如處理器3450、記憶體3435、外部記憶體3440、儲存裝置3445、樣品架3410、偵測器3420及/或邏輯系統3430。
生物樣品包括第一複數個核酸分子,其中5'末端3’突出末端。例如,第一複數個核酸分子可包括圖21B中之片段2104。第一複數個核酸分子可為游離的。第一複數個核酸分子之各核酸分子為具有第一股及第二股的雙股。各第一股包括未與第二股雜交之第一部分。各第一部分在第一股之5'末端處。生物樣品可為本文所描述之任何生物樣品。
生物樣品可包括第二複數個核酸分子,其中3'末端懸垂5'末端。例如,第二複數個核酸分子可包括圖21B中之片段2108。第二複數個核酸分子可為游離的。第二複數個核酸分子之各核酸分子為具有第三股及第四股的雙股(對於不同於第一複數個核酸分子之第一股及第二股的術語而言)。各第三股包括未與第四股雜交之第一部分。各第一部分在第三股之3'末端處。生物樣品可不包括雙股核酸分子,其具有不與第二複數個核酸分子中之核酸分子以外的另一股雜交的一個股的3'末端。在一些實施例中,第二複數個核酸分子包括至少50%、60%、70%、80%、90%或95%之生物樣品中具有3’突出末端之所有核酸分子。在一些實施例中,第二複數個核酸分子之數目可為第一複數個核酸分子之數目的至少50%、60%、70%、80%、90%或95%。在一些實施例中,第一複數個核酸分子及/或第二複數個核酸分子可在某一大小範圍內,包括本文所描述之任何大小範圍。
第一複數個核酸分子之核酸分子中之第一類型之核苷酸可全部經甲基化或可全部未甲基化。第一類型核苷酸可為胞嘧啶或本文所描述之任何核苷酸。例如,在圖21B中,圖21B之片段2104中的所有胞嘧啶可經甲基化。在一些實施例中,核酸分子中之第一類型核苷酸可經甲基化或未甲基化超過某一百分比(例如,60%、70%、80%、90%或95%)。
在方塊2604處,包括一或多個核苷酸之第一化合物可與第一複數個核酸分子之核酸分子的第一股的第一部分雜交。第一化合物可填充5'末端突出末端且移除鋸齒狀末端以形成鈍末端。例如,第一化合物可為圖21B中片段2164中之藍色虛線。第一化合物連接至第二股之3'末端以形成延伸的核酸分子。經延伸之核酸分子具有延長的第二股,其具有包括第一化合物之3'末端。第一化合物具有3'末端,其不與第二股接觸。例如,在圖21B中之階段2170,片段2164之藍色虛線的3'末端不接觸其延長的原始股。第一化合物可包括甲基化不同於第二股的第一類型核苷酸。例如,若第二股中之第一類型核苷酸經甲基化,則第一化合物中之第一類型核苷酸未經甲基化。相反,若第二股中之第一類型核苷酸未經甲基化,則第一化合物中之第一類型核苷酸經甲基化。第一化合物中之各第一類型核苷酸可具有與第二股中之第一類型核苷酸中之每一者相反的甲基化狀態。可針對第一複數個核酸分子中之各核酸分子重複方塊2604。
在雜交期間生物樣品可包括第二複數個核酸分子。例如,經構形以移除第二複數個核酸分子之核酸分子的第一部分的酶不可添加至生物樣品中。例如,未將核酸外切酶添加至生物樣品中。生物樣品可不具有經修剪以形成鈍末端核酸分子之第二複數個核酸分子之3’突出末端。類似於圖21B中之片段2108,第二複數個核酸分子可保持3'突出末端而不修剪3'突出末端。
在一些實施例中,過程2600可包括磷酸化複數個延伸的核酸分子。過程2600亦可包括磷酸化第二複數個核酸分子。例如,如圖21B中之階段2180,5'末端可經磷酸化。接附子可添加至延伸之核酸分子。第二複數個核酸分子可不添加接附子。
在方塊2606處,第一化合物中之第一類型核苷酸或第二股中之第一類型核苷酸可轉化為第二類型核苷酸。第二類型核苷酸可不同於第一類型核苷酸。轉化可藉由亞硫酸氫鹽處理進行。例如,第二類型核苷酸可為尿嘧啶,而第一類型核苷酸為胞嘧啶。胞嘧啶,尤其係未甲基化胞嘧啶,可藉由亞硫酸氫鹽處理轉化為尿嘧啶。轉化可發生在生物樣品中,且在轉化期間生物樣品可包括第二複數個核酸分子。
在一些實施例中,第二股中之第一類型核苷酸可經轉化。該方法接著亦可包括轉化第二複數個核酸分子中之第一類型核苷酸。例如,第二複數個核苷酸可包括由轉化未甲基化胞嘧啶產生之尿嘧啶。
在方塊2608處,可確定對應於第一化合物中第一類型核苷酸之一或多個位點中之每一者的第一甲基化狀態。甲基化狀態可藉由確定第二類型核苷酸之核苷酸的標識來確定。例如,第一化合物中之第一類型核苷酸可轉化為第二類型核苷酸。第二類型核苷酸可不同於第一類型核苷酸。例如,可識別出第一化合物中之尿嘧啶,此意謂尿嘧啶在方塊2608中進行亞硫酸氫鹽處理之前為未甲基化胞嘧啶且第一甲基化狀態為未甲基化的。核苷酸之標識可藉由任何適合定序技術,包括本文所描述之彼等技術確定。
作為另一實例,若第二股中之第一類型核苷酸轉化為第二類型核苷酸,則第一化合物中之核苷酸可確定為胞嘧啶,此意謂第一化合物包括甲基化胞嘧啶。接著將第一甲基化狀態甲基化。可針對第一複數個核酸分子中之各核酸分子重複方塊2608。
在一些實施例中,可計算使用第一甲基化狀態的甲基化水準。甲基化水準可為第一複數個核酸分子中經甲基化(或未經甲基化)之位點的百分比、分數或數目。
在一些實施例中,可確定使用甲基化水準的鋸齒狀指標值。鋸齒狀指標值可提供股之長度之集合量度,該股不與第一複數個核酸分子中之另一股雜交。鋸齒狀指標值可包括JI-U、JI-M或本文所描述之任何指標值。鋸齒狀指標值可針對某一片段大小。
在一些實施例中,過程2600可包括使用複數個第一甲基化狀態確定第一複數個核酸分子之各第一化合物的長度。長度可基於甲基化之量確定。在一些實施例中,可基於顯示不同甲基化狀態之相同類型的連續位點(例如,使用CC核苷酸量測圖24A及24B中之長度)來確定確切長度。第一類型核苷酸將鄰接於第二類型核苷酸。
儘管圖26顯示過程2600之實例區塊,但在一些實施中,過程2600相比於圖26中所描繪之區塊可包括額外區塊、更少區塊、不同區塊或以不同方式配置之區塊。另外或替代地,可並行地執行過程2600之區塊中之兩者或更多者。 IX.            尿液cfDNA中鋸齒狀末端長度的週期性模式
尿液中之游離DNA顯示出鋸齒狀末端長度頻率的週期性行為。尿液中游離DNA片段的週期性可有助於對個體之病況水準進行分類。該病況可包括癌症,例如腎癌。
27顯示了在尿液中藉由使用於章節VIII.B中描述之CC-標籤技術推導出的鋸齒狀末端長度的分佈圖。x軸顯示核苷酸中之鋸齒狀末端長度。y軸顯示0至74 nt之鋸齒狀末端長度大小的頻率(%)。CC-標籤技術在上文結合圖24A及24B予以描述。
圖27顯示,一般來說,當鋸齒狀末端變得較長時,相對頻率緩慢降低。例如,相較於10 nt,具有40 nt之鋸齒狀末端的片段較少。除此逐漸降低之外,尿液cfDNA之鋸齒狀末端長度顯示出約10 nt的週期性模式,而血漿DNA中之鋸齒狀末端則未發現此類模式。通過更詳細地觀察週期性模式,鋸齒狀末端週期性之幅度引起吾人之注意,此係由於其在不同個體之間有所不同。為分析鋸齒狀末端週期性之幅度,吾人藉由以下等式中所示之數學方法計算波之強度(例如,總計七個峰值):
Figure 02_image003
其中 p係特定峰值之頻率,且 vl vr 係相對左(右)谷值之頻率。鋸齒狀末端長度週期性指標提供了峰值與谷值之間差異的量度。亦可使用定量峰值與谷值之間差異的其他指標。
較高鋸齒狀末端長度週期性指標表明鋸齒狀末端長度之分佈的10 nt週期性模式更強。吾等進一步分析以查看鋸齒狀末端長度週期性指標是否可能受片段長度的影響。
28顯示跨越不同片段大小之週期性指標的圖。x軸顯示鹼基對中片段大小。y軸顯示鋸齒狀末端長度週期性指標。如圖28中所示,當片段長度小於170 bp時,鋸齒狀末端長度之週期性指標顯露出在不同片段大小下的10-nt週期性模式。例如,吾等在90 bp、100 bp、111 bp、121 bp、132 bp及142 bp處觀測到多個鋸齒狀末端長度週期性指標的峰,及在85 bp、95 bp、106 bp、116 bp、127 bp、137 bp及148 bp處觀測到多個鋸齒狀末端長度週期性指標的波谷。 A.                用於確定腎細胞癌之鋸齒狀末端長度週期性指標
鋸齒狀末端長度週期性指標可用於區分患有腎細胞癌(RCC)之個體及健康對照個體。鋸齒狀末端長度週期性指標可為比使用鋸齒狀末端值更有效的生物標記物。
29A顯示對照個體及患有RCC之個體的鋸齒狀末端長度週期性指標的圖。x軸顯示對照個體及患有RCC(亦即腎癌)之個體。y軸顯示鋸齒狀末端長度週期性指標。如圖29A中所示,腎癌尿液樣品與較高鋸齒狀末端長度週期性指標值相關。發現RCC個體之鋸齒狀末端長度週期性指標值(中值,0.41;範圍,0.21-0.58)顯著高於健康對照個體(中值,0.25;範圍,0.12-0.42)。
29B顯示了對照個體及患有RCC之個體的平均鋸齒狀末端長度的圖。x軸顯示對照個體及患有RCC(亦即腎癌)之個體。y軸顯示平均鋸齒狀末端長度(nt)。該圖顯示對照個體與RCC個體之間的平均鋸齒狀末端長度在統計學上無顯著差異。對照個體及RCC個體的JI-M與在統計學上亦無顯著差異。
圖29C顯示了使用週期性指標及平均鋸齒狀末端長度來區分對照個體及患有RCC之個體的ROC曲線。使用週期性指標之曲線下面積(AUC)為0.857。相比之下,使用平均鋸齒狀末端長度之AUC為0.629,顯示平均鋸齒狀末端長度不能有效區分健康對照個體及患有RCC之彼等個體。出人意料地,鋸齒狀末端長度週期性指標係一種能夠區分尿液樣品中之腎癌患者及非癌症患者的特徵。 B.                肝素治療對尿液cfDNA鋸齒狀末端長度週期性之影響
尿液鋸齒狀末端長度中出現之特殊週期性模式促使吾等進一步研究鋸齒狀末端產生的潛在機制。
目前尚不清楚鋸齒狀長度分佈的10-bp週期性是否與核小體構形有關。據報導,DNA片段大小之10 nt週期性裂解模式可能係由DNA酶I消化引起的,該酶更偏好在雙股DNA上進行單一切割,同時,很大程度上依賴於組蛋白-DNA結合結構(Suck, 1994)。先前研究亦發現肝素可藉由鬆弛組蛋白結合來破壞染色質結構,且因此增加DNA可及性(Villeponteau, 1992)。因此,此改變之核小體構形顯示對主要核酸酶中之一者,即DNA酶I的消化的靈敏度較高(Brotherton等人, 1989)。基於此等研究,吾人隨後進行一組肝素處理實驗,其旨在理解核小體結構是否可能涉及產生泌尿cfDNA中鋸齒狀之末端長度的10 nt週期性模式。
30顯示了用肝素培育處理之尿液cfDNA的大小分佈。x軸顯示片段大小(bp)。y軸顯示頻率(%)。不同的線顯示不同的處理。具有紅色(線3002)、藍色(線3004)、綠色(線3006)及紫色(線3008)顏色的線分別表示用EDTA處理0小時、用肝素處理0小時、用肝素處理0.5小時及用肝素處理1小時。時間表示在室溫下活體外培育之持續時間。處理之後為Jag-seq II。預期用EDTA處理不改變鋸齒狀末端長度週期性,且充當與用肝素處理比較之對照。
與EDTA 0小時處理(線3002)相比,10 nt鋸齒狀末端長度週期性的幅度比用肝素處理0小時(線3004)時稍弱。有趣地,隨著肝素之培育時間增加,週期性開始逐漸消失。值得注意地,用肝素處理1小時(線3008)導致尿液cfDNA中大部分10 bp的鋸齒狀末端長度週期性模式丟失,此係由於染色質結構的破壞增加。
31顯示了用肝素培育處理之尿液cfDNA中的鋸齒狀末端長度分佈。x軸顯示鋸齒狀末端長度(nt)。y軸顯示頻率(%)。具有紅色(線3102)、藍色(線3104)、綠色(線3106)及紫色(線3108)顏色的線分別表示用EDTA處理0小時、用肝素處理0小時、用肝素處理0.5小時及用肝素處理1小時。圖31之基礎資料與圖30相同。
吾等經由改變染色質結構來探究肝素處理是否會影響尿液鋸齒狀末端之產生及分佈。如圖31中所示,當尿液樣品用肝素處理0小時時,10 nt鋸齒狀末端長度週期性模式顯著減弱。隨著肝素培育時間達到1小時,週期性模式幾乎消失。圖31顯示增加肝素處理時間似乎減少週期性。
32A 32B32C顯示了對EDTA及肝素處理之不同時段的JI-M、平均鋸齒狀末端長度及鋸齒狀末端長度週期性指標的分析。圖32A-32C之基礎資料與圖30及31相同。在圖32A-32C中,x軸顯示了不同處理(不同培育時間之EDTA或肝素)。
在圖32A中,y軸為JI-M指標。在圖32B中,y軸為平均鋸齒狀末端長度(nt)。在圖32A及32B中,吾等發現JI-M之值及平均鋸齒狀末端長度在EDTA 0小時及肝素0小時處理之間無顯著差異。然後,隨著肝素培育時間之延長(0.5小時或1小時),JI-M及平均鋸齒狀末端長度逐漸降低。
圖32C顯示了y軸上之鋸齒狀末端長度週期性指標。圖32C顯示與EDTA 0小時處理相比,肝素0小時處理之週期性指標大大減少。較長肝素處理時間導致鋸齒狀末端長度週期性指標的減少較小。
一同採取32A-32C,此等結果強烈表明鋸齒狀末端長度之10 nt週期性模式與組蛋白及尿液cfDNA結合結構密切相關,結合DNA酶I的活性水準。 C.                實例方法
33係與分析生物樣品以使用與游離DNA片段的鋸齒狀末端長度相關的週期性對病況的水準進行分類相關之實例過程3300的流程圖。在一些實施中,圖33之一或多個過程方塊可由系統(例如,圖34中之系統3400)執行。在一些實施中,圖33之一或多個過程方塊可由與系統分離或包括該系統之另一裝置或裝置群組執行。另外或替代地,圖33之一或多個過程方塊可由系統3400之一或多個組件執行,諸如處理器3450、記憶體3435、外部記憶體3440、儲存裝置3445、樣品架3410、偵測器3420及/或邏輯系統3430。
生物樣品可包括複數個核酸分子。在一些實施例中,生物樣品可為尿液、血清、唾液或本文所描述之除血漿之外的任何樣品。複數個核酸分子可為游離的。複數個核酸分子中之各核酸分子為具有第一部分之第一股及第二股的雙股。複數個核酸分子之至少一些的第一股的第一部分不具有來自第二股的互補部分,不與第二股雜交且可位於第一股之第一末端處。複數個核酸分子之大小在50至170 nt、50至100 nt、100至140 nt、140至170 nt、170至200 nt、200至240 nt或大於240 nt範圍內。複數個核酸分子可為用於分析之統計顯著數目,其可為本文中所描述之游離核酸分子之任何數目。
在方塊3302處,量測複數個核酸分子中之各核酸分子的特徵。特徵與懸垂第二股或不與第二股雜交之第一股的長度相關(例如,成比例)。特徵可為長度。在一些實施例中,特徵可為甲基化水準。可針對各核酸分子之第一股及/或第二股量測特徵。
在方塊3304處,可創建直方圖。可藉由量測具有量測特徵之複數個值中之每一者的核酸分子的量來創建直方圖。直方圖可針對不同的鋸齒狀末端長度繪製量(例如,頻率)。直方圖之實例包括圖27或圖31。直方圖可不呈現為圖。在一些實施例中,直方圖可呈表格形式。
在方塊3306處,可使用直方圖識別複數個峰值量及複數個局部最小量。峰值量可為局部最大量。峰值量及局部最小量可由直方圖以肉眼確定。在一些實施例中,峰值量及局部最小量可以數學方式確定。例如,可在直方圖之導數為零時確定峰值量或局部最小量。當二階導數為負時可能出現峰值量。當二階導數為正時可能出現最小量。
複數個峰值量可以量測特徵之週期性間隔出現。例如,峰值量可能出現在波浪狀模式之頂部。量測特徵之週期性間隔可對應於9至11 nt、5至9 nt、12至15 nt、15至20 nt、20至25 nt或以上之長度。局部最小量可以量測特徵之週期性間隔出現。例如,複數個局部最小量可能出現在波浪狀模式之底部。複數個峰值量可為2、3、4、5、6、7、8、9、10或更多個峰值。複數個局部最小量可為2、3、4、5、6、7、8、9、10或以上局部最小值之數目。在一些實施例中,複數個峰值量及複數個局部最小量可不包括直方圖中存在的所有峰值量及所有局部最小量。例如,可排除短(例如,小於5 nt)鋸齒狀末端長度或長鋸齒狀末端長度處的峰值量及局部最小量。
在方塊3308處,可確定鋸齒狀指標值。可使用複數個峰值量及複數個局部最小量確定鋸齒狀指標值。鋸齒狀指標值可提供峰值量相對於局部最小量的集體量度。在一些實施例中,鋸齒狀指標值可使用僅複數個峰值量或僅複數個局部最小量來確定。例如,可以使用複數個峰值量的頻率、週期或幅度來確定鋸齒狀指標值。在一些實例中,可使用複數個局部最小量的頻率、週期或幅度來確定鋸齒狀指標值。可使用平均或中值頻率、週期或振幅。
可使用複數個局部最小量的幅度來確定鋸齒狀指標值。可使用複數個峰值量中之各峰值量與至少一個相鄰局部最小量的比較來確定鋸齒狀指標值。該比較可包括差值、總和、比率或乘積。鋸齒狀指標值可為上述週期性指標。
鋸齒狀指標值可與參考值進行比較。參考值可使用患有病況之個體之一或多個參考樣品確定,或參考值可使用未患有病況之個體之一或多個參考樣品確定。參考值可為指示與患有病況之個體或未患病況之個體之預期值統計學上顯著差異的臨限值。例如,參考值可設定為與參考個體之平均鋸齒狀指標值相差1、2或3個標準差。在一些實施例中,參考值可為來自同一個體在較早時間(例如,在癌症治療之前或來自健康基線病況)的鋸齒狀指標值。
在方塊3310處,可使用鋸齒狀指標值來確定個體病況之水準。確定可基於將鋸齒狀指標值與參考值進行比較。病況可為癌症。例如,病況可為腎癌。當鋸齒狀指標值超過參考值時,分類可能係癌症存在。分類可為本文所描述之任何分類。分類可為癌症之嚴重性,其可包括癌症之階段。分類可能係癌症變得或多或少嚴重。
過程3300可進一步包括治療病況,其可為本文所描述之任何治療,包括使用方法600。
儘管圖33顯示過程3300之實例區塊,但在一些實施中,過程3300相比於圖33中所描繪之區塊可包括額外區塊、更少區塊、不同區塊或以不同方式配置之區塊。另外或替代地,可並行地執行過程3300之區塊中之兩者或更多者。 X.  實例系統
34示出根據本發明之實施例的量測系統3400。如所示,系統包括樣品3405,諸如樣品架3410內之游離DNA分子,其中樣品3405可與分析法3408接觸以提供物理特徵3415之信號。樣品架之一實例可為包括分析法之探針及/或引子的流槽或液滴藉以移動之管(在包括液滴之分析法的情況下)。用偵測器3420偵測樣品之物理特徵3415(例如,螢光強度、電壓或電流)。偵測器3420可按時間間隔(例如,週期性間隔)進行量測,以獲得構成資料信號之資料點。在一個實施例中,類比至數位轉換器在複數個時間將來自偵測器之類比信號轉換成數位形式。樣品架3410及偵測器3420可形成分析裝置,例如根據本文所描述之實施例進行定序之定序裝置。資料信號3425自偵測器3420發送至邏輯系統3430。資料信號3425可儲存於局部記憶體3435、外部記憶體3440或儲存裝置3445中。
邏輯系統3430可為或可包括電腦系統、ASIC、微處理器等。其亦可包括顯示器(例如監測器、LED顯示器等)及使用者輸入裝置(例如滑鼠、鍵盤、按鈕等)或與其耦合。邏輯系統3430及其他組件可為獨立的或網路連接之電腦系統的一部分,或其可直接連接至或併入包括偵測器3420及/或樣品架3410之裝置(例如定序裝置)中。邏輯系統3430亦可包括在處理器3450中執行之軟體。邏輯系統3430可包括電腦可讀媒體,其儲存用於控制系統3400進行本文所描述之方法中之任一者的指令。例如,邏輯系統3430可向包括樣品架3410之系統提供命令,使得執行定序或其他物理操作。此類物理操作可以特定次序進行,例如在試劑以特定次序添加及移除之情況下。此類物理操作可由可用於獲得樣品且進行分析之例如包括機械臂之機器人系統執行。
本文所提及之任一種電腦系統可利用任何適合數目個子系統。此類子系統之實例顯示於圖35中之電腦系統10中。在一些實施例中,電腦系統包括單一電腦設備,其中子系統可為電腦設備之組件。在其他實施例中,電腦系統可包括具有內部組件之多個電腦設備,其各自為子系統。電腦系統可包括桌上型及膝上型電腦、平板電腦、移動電話及其他移動裝置。
圖35中所示之子系統經由系統匯流排75互連。顯示額外子系統,諸如印表機74、鍵盤78、一或多個儲存裝置79、與顯示配接器82耦接之監測器76(例如顯示屏幕,諸如LED)及其他裝置。耦接至I/O控制器71上之周邊裝置及輸入/輸出(I/O)器件可藉由此項技術中已知之多種手段(諸如輸入/輸出(I/O)埠77(例如,USB、FireWire ®))連接至電腦系統。例如,I/O埠77或外部介面81(例如乙太網路(Ethernet)、Wi-Fi等)可用於將電腦系統10連接至廣域網路(諸如網際網路)、滑鼠輸入裝置或掃描儀。經由系統匯流排75互連允許中央處理器73與各子系統通信且控制系統記憶體72或儲存裝置79(例如固接磁碟,諸如硬碟機,或光碟)執行複數個指令,以及子系統之間的資訊交換。系統記憶體72及/或一或多個儲存裝置79可實施為電腦可讀媒體。另一子系統為資料收集裝置85,諸如照相機、麥克風、加速計及其類似物。本文中所提及之資料中之任一者可自一個組件輸出至另一組件且可輸出至使用者。
電腦系統可包括複數個相同組件或子系統,例如藉由外部介面81、藉由內部介面或經由可移式儲存裝置連接到一起,該等可移式儲存裝置可自一個組件連接至另一組件且移除。在一些實施例中,電腦系統、子系統或設備可經網路通信。在此等情況下,可將一台電腦視為用戶端且另一台電腦視為伺服器,其中每一者可為同一電腦系統之一部分。用戶端及伺服器各自可包括多個系統、子系統或組件。
實施例之態樣可以控制邏輯形式使用硬體電路(例如特殊應用積體電路或場可程式化閘陣列)及/或使用具有大體上可程式化處理器之電腦軟體以模組化或整合式方式來實施。如本文所用,處理器可包括單核處理器、同一個積體晶片上之多核處理器或單一電路板或網路硬體以及專用硬體上之多個處理單元。基於本文所提供之揭示內容及教示內容,一般熟習此項技術者將知道及瞭解使用硬體及硬體與軟體組合來實施本發明之實施例的其他方式及/或方法。
本申請案中所描述之任何軟體組件或功能可使用例如習知或面向對象技術,以軟體程式碼形式實施,軟體程式碼係由使用任何適合電腦語言(諸如Java、C、C++、C#、Objective-C、Swift)或腳本處理語言(諸如Perl或Python)的處理器執行。軟體程式碼可以一系列指令或命令形式儲存於電腦可讀取媒體上進行儲存及/或傳輸。適合之非暫時性電腦可讀媒體可包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、磁性媒體(諸如硬碟機或軟碟機)或光學媒體,諸如光碟(CD)或數位化通用光碟(DVD)或藍光碟、快閃記憶體及其類似者。電腦可讀媒體可為此類儲存或傳輸裝置之任何組合。
此類程式亦可使用適用於經由符合多種協定之有線、光學及/或無線網路(包括網際網路)傳輸的載波信號來編碼及傳輸。因此,電腦可讀取媒體可使用以此類程式編碼之資料信號建立。以程式碼編碼之電腦可讀取媒體可與相容裝置一起封裝或與其他裝置分開提供(例如經由網際網路下載)。任何此類電腦可讀媒體可存在於單一電腦產品(例如硬碟機、CD或整個電腦系統)上或其內部,且可存在於系統或網路內之不同電腦產品上或其內部。電腦系統可包括用於向使用者提供本文所提及之任何結果的監測器、印表機、或其他適合之顯示器。
本文中所描述之方法中之任一者可完全或部分地使用電腦系統來執行,電腦系統包括可經組態以執行步驟之一或多個處理器。可即時地執行藉由處理器執行之任何操作(例如,比對、確定、比較、運算、計算)。因此,實施例可針對經組態以執行本文所描述之任何方法之步驟的電腦系統,潛在地使用不同組件進行各別步驟或各別步驟組。儘管以帶編號之步驟形式呈現,但本文中之方法之步驟可同時或在不同時間或以不同順序執行。另外,此等步驟之一部分可與其他方法之其他步驟之一部分一起使用。此外,步驟之全部或部分可為視情況選用的。此外,任何方法之任何步驟可使用用於進行此等步驟之系統的模組、單元、電路或其他構件來進行。
可在不脫離本發明之實施例的精神及範疇的情況下以任何合適方式組合特定實施例之特定細節。然而,本發明之其他實施例可針對與各個別態樣或此等個別態樣之特定組合相關的特定實施例。
已出於說明及描述之目的呈現本揭示案之實例實施例的上述描述。其並不意欲為詳盡的或將本揭示案限於所描述之精確形式,且鑒於以上教示,許多修改及變化為可能的。
除非有相反的特定說明,否則「一(a/an)」或「該(the)」之敍述欲意謂「一或多個」。除非相反地特定指示,否則「或」之使用欲意謂「包括性的或」,而非「互斥性的或」。提及「第一」組件不一定需要提供第二組件。此外,除非明確陳述,否則提及「第一」或「第二」組件不會將所提及組件限制於特定位置。術語「基於」意指「至少部分地基於」。
出於所有目的,本文所提及之所有專利、專利申請案、公開案及描述均以全文引用之方式併入。不承認任一者為先前技術。 XI.            參考 Brotherton, T. W., Jagannadham, M. V., & Ginder, G. D.(1989).肝素與完整單核小體結合且誘導新的展開結構(Heparin Binds to Intact Mononucleosomes and Induces a Novel Unfolded Structure).《生物化學(Biochemistry)》. https://doi.org/10.1021/bi00434a055 Jiang, P., Xie, T., Ding, S. C., Zhou, Z., Cheng, S. H., Chan, R. W. Y., Lee, W. S., Peng, W., Wong, J., Wong, V. W. S., Chan, H. L. Y., Chan, S. L., Poon, L. C. Y., Leung, T. Y., Chan, K. C. A., Chiu, R. W. K., & Lo, Y. M. D.(2020).血漿中之雙股DNA之鋸齒狀末端的偵測及表徵(Detection and characterization of jagged ends of double-stranded DNA in plasma).《基因體研究》, 30(8). https://doi.org/10.1101/gr.261396.120 Suck, D.(1994).藉由DNA酶識別DNA(DNA recognition by DNase I). 於《分子識別雜誌( Journal of Molecular Recognition)》. https://doi.org/10.1002/jmr.300070203 Villeponteau, B.(1992).肝素藉由結合組蛋白中對胰蛋白酶敏感的鹼性殘基來增加染色質可及性(Heparin increases chromatin accessibility by binding the trypsin-sensitive basic residues in histones).《生物化學雜誌(Biochemical Journal)》. https://doi.org/10.1042/bj2880953
1顯示了根據本發明之實施例的尿液DNA鋸齒狀末端分析的工作流程之示意圖。
2顯示了根據本發明之實施例經由血漿DNA之環化對血漿DNA鋸齒狀末端的直接評估。
3A3B顯示了根據本發明之實施例的血漿及尿液DNA之間的鋸齒狀(jaggedness)的比較。
4A4B顯示了根據本發明之實施例的血漿及尿液DNA之間的片段化模式。
5A5B5C5D顯示了根據本發明之實施例的尿液DNA中鋸齒狀指標未甲基化(JI-U)值與膀胱癌的關係。
6顯示了根據本發明之實施例的使用鋸齒狀末端指標值來分析尿液樣品的方法。
7A7B顯示了根據本發明之實施例的末端密度與核小體軌跡之間的關係。
8係根據本發明之實施例的尿液DNA的末端密度相對於CTCF結合位點的圖。
9係根據本發明之實施例的在不同膀胱癌病況中末端密度的累積差異的盒狀圖。
10A10B顯示了根據本發明之實施例的使用末端密度度量來區分患有癌症及未患有癌症之患者的ROC曲線。
11顯示了根據本發明之實施例的分析自個體獲得的生物樣品以使用末端密度資訊對病況水準進行分類的方法。
12顯示了根據本發明之實施例的孕婦的母體來源及胎兒來源的尿液DNA之間的JI-U值。
13A13B13C顯示了根據本發明之實施例的腎移植、造血幹細胞移植(HSCT)及肝移植患者中受體來源及供體來源之DNA之間的JI-U值。
14顯示了根據本發明之實施例的藉由選擇具有某些鋸齒狀指標值的DNA來富集生物樣品的方法。
15顯示了根據本發明之實施例的具有及不具有急性排斥反應的腎移植患者之間的尿液DNA的JI-U值。
16顯示了根據本發明之實施例的分析來自個體的生物樣品以對移植病況進行分類的方法。
17A17B顯示了根據本發明之實施例的鋸齒狀末端與核小體軌跡之間的關係。
18顯示了根據本發明之實施例的用於區分患有MIBC的患者及未患有膀胱癌的患者的接收者操作特徵(ROC)圖。
19A19B顯示了根據本發明之實施例的分析源自與此等組蛋白修飾相關之基因體區域的尿液DNA鋸齒狀末端的結果。
20顯示了根據本發明之實施例的分析自個體獲得的生物樣品以使用某些基因體位置處的JI-U值對病況水準進行分類的方法。
21A21B示出了根據本發明之實施例的先前的Jag-seq方法及新的Jag-seq II方法。
22A-22F示出了根據本發明之實施例的使用Jag-seq及Jag-seq II技術對具有5'突出鋸齒狀末端的摻入(spike-in)分子的影響。
23顯示了根據本發明之實施例的在尿液cfDNA中不同大小範圍內的讀數2(JI-M)中CH甲基化水準的分佈圖。
24A24B顯示了根據本發明之實施例的在尿液cfDNA中不同大小範圍內的平均及中值鋸齒狀末端長度。
25A25B顯示了根據本發明之實施例的膀胱癌個體及對照個體的JI-M及平均鋸齒狀末端長度的盒鬚圖。
26係根據本發明之實施例的分析自個體獲得的生物樣品而不修剪樣品中片段之3'末端的方法。
27顯示了根據本發明之實施例的在尿液中藉由使用CC-標籤技術推導出的鋸齒狀末端長度的分佈圖。
28顯示了根據本發明之實施例的在不同片段大小的鋸齒狀末端長度的週期性指標的圖。
29A29B29C顯示了根據本發明之實施例的使用週期性指標及平均鋸齒狀末端長度來區分對照個體及患有腎細胞癌(RCC)之個體的結果。
30顯示了根據本發明之實施例的用肝素培育處理之尿液cfDNA的大小分佈。
31顯示了根據本發明之實施例的用肝素培育處理之尿液cfDNA中的鋸齒狀末端長度分佈。
32A32B32C顯示了根據本發明之實施例的對尿液中不同EDTA及肝素處理的JI-M、平均鋸齒狀末端長度及週期性指標的分析。
33係根據本發明之實施例的使用DNA片段中之鋸齒狀末端長度的週期性來分析生物樣品的方法。
34示出了根據本發明之實施例的量測系統。
35顯示了可與根據本發明之實施例的系統及方法一起使用的實例電腦系統的方塊圖。

Claims (94)

  1. 一種分析尿液樣品之方法,該方法包含: 量測來自個體之該尿液樣品之游離複數個核酸分子之各核酸分子的特徵,其中該游離複數個核酸分子之各核酸分子為具有第一部分之第一股及第二股的雙股,該游離複數個核酸分子中之至少一些之該第一股的該第一部分懸垂該第二股,且該特徵與懸垂該第二股之該第一股的長度相關; 使用該游離複數個核酸分子之該等量測特徵測定鋸齒狀指標值;及 使用該鋸齒狀指標值確定該個體病況之水準。
  2. 如請求項1之方法,其中該病況包含疾病、病症或妊娠。
  3. 如請求項2之方法,其中該病況係癌症、自體免疫性疾病或妊娠相關之病況。
  4. 如請求項1之方法,其中該量測包含量測各核酸分子之第一股、第二股或該第一股及該第二股之特徵。
  5. 如請求項1之方法,其中該第一部分在該第一股之第一末端,且該第一末端係5'末端。
  6. 如請求項1之方法,其進一步包含: 量測核酸分子之大小,其中該游離複數個核酸分子具有在規定範圍內之大小。
  7. 如請求項6之方法,其中該規定範圍為140至160 bp。
  8. 如請求項6之方法,其中: 該游離複數個核酸分子為第一複數個核酸分子,且 該規定範圍為第一規定範圍, 該方法進一步包含: 量測第二游離複數個核酸分子之各核酸分子之一股的該特徵,其中該第二游離複數個核酸分子具有第二規定範圍內之大小, 其中測定該鋸齒狀指標值包含使用該第一複數個核酸分子之該等量測特徵及該第二游離複數個核酸分子之該等量測特徵來計算比率。
  9. 如請求項1之方法,其中該特徵係在該游離複數個核酸分子中之每一者的該等第一股、該等第二股或該等第一股及該等第二股的末端部分處之一或多個位點處的甲基化狀態,且其中該鋸齒狀指標值包括在該等第一股、該等第二股或該等第一股及該等第二股的末端部分之一或多個位點處的該游離複數個核酸分子的甲基化水準。
  10. 如請求項1之方法,其中該特徵係長度。
  11. 如請求項9之方法,其中較高甲基化水準與懸垂該第二股之該第一股的較長長度相關。
  12. 如請求項1之方法,其進一步包含: 分析核酸分子以產生讀數, 將該等讀數與參考基因體進行比對, 其中: 該游離複數個核酸分子具有相對於轉錄起始位點之某一距離範圍內的讀數。
  13. 如請求項1之方法,其進一步包含: 分析核酸分子以產生讀數, 將該等讀數與參考基因體進行比對, 其中: 該游離複數個核酸分子具有相對於CTCF位點或DNASE1超敏位點之某一距離範圍內的讀數。
  14. 如請求項1之方法,其中確定該病況之該水準係基於將該鋸齒狀指標值與參考值進行比較。
  15. 如請求項14之方法,其中該參考值係使用患有該病況之個體的一或多個參考樣品測定。
  16. 如請求項14之方法,其中該參考值係使用並未患有該病況之個體的一或多個參考樣品測定。
  17. 如請求項14之方法,其中使用機器學習模型來執行對該鋸齒狀指標值與該參考值之該比較以及對該個體之該病況之該水準的確定。
  18. 一種確定移植病況之方法,該方法包含: 量測來自個體之生物樣品之游離複數個核酸分子之各核酸分子的特徵,其中個體係第一組織移植物之受體,該游離複數個核酸分子之各核酸分子為具有第一部分之第一股及第二股的雙股,該游離複數個核酸分子中之至少一些之該第一股的該第一部分懸垂該第二股,且該特徵與懸垂該第二股之該第一股的長度相關; 使用該游離複數個核酸分子之該等量測特徵測定鋸齒狀指標值;及 使用該鋸齒狀指標值確定移植至該個體中之該第一組織之該移植病況。
  19. 如請求項18之方法,其中該移植物係腎臟、一或多種造血幹細胞或肝臟。
  20. 如請求項18之方法,其中該移植病況包含排斥反應、移植物功能障礙、感染或其組合之可能性。
  21. 如請求項18之方法,其中確定移植至該個體中之該第一組織中之該移植病況包含將該鋸齒狀指標值與參考值進行比較。
  22. 如請求項21之方法,其中當該鋸齒狀指標值大於該參考值時,該移植病況分類為被排斥或可能被排斥。
  23. 如請求項22之方法,其中該第一組織係一或多種造血幹細胞或肝臟。
  24. 如請求項21之方法,其中當該鋸齒狀指標值小於該參考值時,該移植病況分類為被排斥或可能被排斥。
  25. 如請求項24之方法,其中該第一組織係來自腎臟。
  26. 如請求項21之方法,其中該參考值係使用排斥該第一組織移植物的個體的一或多個參考樣品或使用不排斥該第一組織移植物的個體的一或多個參考樣品來測定。
  27. 如請求項21之方法,其中該參考值係在自該個體獲得該生物樣品之前使用自該個體獲得的一或多個參考樣品測定。
  28. 如請求項18之方法,其中: 確定該移植病況包含確定該移植物正被排斥, 該方法進一步包含治療該個體之該移植物的急性排斥反應。
  29. 如請求項18至28中任一項之方法,其中該生物樣品包含血液、血漿、血清、尿液或唾液。
  30. 如請求項18至28中任一項之方法,其中該生物樣品包含尿液。
  31. 一種分析生物樣品之方法,該方法包含: 對來自個體之生物樣品的游離複數個核酸分子進行定序以產生序列讀數,其中該游離複數個核酸分子之各核酸分子為具有第一部分之第一股及第二股的雙股,且其中該游離複數個核酸分子中之至少一些之該第一股的該第一部分懸垂該第二股; 將該等序列讀數與參考基因體比對以確定該游離複數個核酸分子之基因體位置; 識別該游離複數個核酸分子之一組核酸分子,其中該核酸分子組之各核酸分子的基因體位置與預定類型之基因體位點相距指定距離; 量測該核酸分子組之各核酸分子之特徵,其中該特徵與懸垂該第二股之該第一股的長度相關; 使用該核酸分子組之該等量測特徵測定鋸齒狀指標值;及 使用該鋸齒狀指標值確定該個體病況之水準。
  32. 如請求項31之方法,其中該生物樣品包含血液、血漿、血清、尿液或唾液。
  33. 如請求項31至32中任一項之方法,其中該指定距離係一範圍。
  34. 如請求項31至32中任一項之方法,其中該指定距離為0 nt。
  35. 如請求項31至34中任一項之方法,其中該基因體位點為CTCF結合位點、DNASE1超敏位點(DHS)或具有組蛋白修飾之區域。
  36. 如請求項35之方法,其中該基因體位點為具有該組蛋白修飾之該區域。
  37. 如請求項36之方法,其中該組蛋白修飾包含H3K4me1、H3K4me3、H3K36me3、H3K27me2、H3K9Ac、H3K27Ac、H4K16Ac、H3K27me3或H3K9me3。
  38. 如請求項31之方法,其中確定該個體之該病況包含將該鋸齒狀指標值與參考值進行比較。
  39. 一種分析生物樣品之方法,該方法包含: 自該生物樣品選擇游離複數個核酸分子內之一核酸分子子組,其中: 該游離複數個核酸分子包括臨床上相關之核酸分子及其他核酸分子, 該游離複數個核酸分子之各核酸分子為具有第一部分之第一股及第二股的雙股, 該游離複數個核酸分子中之至少一些之該第一股的該第一部分懸垂該第二股,且 對於該核酸分子子組之各核酸分子: 懸垂該第二股之該第一股的長度大於臨限值;及 分析該核酸分子子組以確定該等臨床上相關之核酸分子之特性。
  40. 如請求項39之方法,其中選擇該核酸分子子組包含: 對於該游離複數個核酸分子之各核酸分子: 量測該第一股、該第二股或該第一股及該第二股之特徵,其中該特徵與懸垂該第二股之該第一股的長度相關,及 藉由電腦系統選擇該特徵大於閾值之核酸分子,以獲得該核酸分子子組。
  41. 如請求項39之方法,其中選擇該核酸分子子組包含: 將該核酸分子子組與該游離複數個核酸分子之其餘部分物理分離。
  42. 如請求項41之方法,其中物理分離該核酸分子子組包含將探針與該核酸分子子組的鋸齒狀末端進行雜交,其中該等探針經設計以與該等鋸齒狀末端雜交,其中懸垂該第二股之該第一股的長度大於該臨限值。
  43. 如請求項42之方法,其中該雜交係經由基於磁珠之雜交分析來實現。
  44. 如請求項42之方法,其進一步包含: 使用凝膠電泳或微流體技術分離與該等探針雜交之該等核酸分子。
  45. 如請求項41之方法,其進一步包含: 將寡核苷酸與該第一股的長度雜交。
  46. 如請求項45之方法,其進一步包含: 量測該寡核苷酸之特徵,其中該寡核苷酸之該特徵與懸垂該第二股之該第一股的長度相關,及 選擇該特徵大於閾值之核酸分子,以獲得該核酸分子子組。
  47. 如請求項45之方法,其中: 該寡核苷酸連接至超過截止長度之寡核苷酸的標記物,且 該方法進一步包含: 捕捉具有該標記物之核酸分子,以獲得該核酸分子子組。
  48. 如請求項47之方法,其進一步包含: 擴增該核酸分子子組,以獲得經擴增之核酸分子子組; 其中: 分析該核酸分子子組包含使用該經擴增之核酸分子子組。
  49. 如請求項39至48中任一項之方法,其中分析該核酸分子子組包含確定該核酸分子子組的參數值,及 確定病況之分類包含使用該參數值。
  50. 如請求項49之方法,其中確定該分類包含將該參數值與參考值進行比較。
  51. 如請求項49中任一項之方法,其中該參數值係核酸分子之量或大小分佈的統計量度。
  52. 如請求項51之方法,其中該病況包含疾病、病症、妊娠或移植狀態。
  53. 如請求項52之方法,其中該病況係癌症、自體免疫性疾病、妊娠相關之病況或移植排斥反應。
  54. 一種分析生物樣品之方法,該方法包含: 自個體之該生物樣品偵測游離複數個核酸分子之一組核酸分子,其中該核酸分子組之各核酸分子包含至少一個末端,該末端具有與預定類型之基因體位點相距指定距離的基因體位置; 對於該核酸分子組之各核酸分子的兩個末端: 將一個末端識別為上游末端且將另一末端識別為下游末端; 確定在該指定距離處具有上游末端之核酸分子的第一量; 確定在該指定距離處具有下游末端之核酸分子的第二量; 使用該第一量及該第二量確定分離值;及 使用該分離值確定該個體病況之水準。
  55. 如請求項54之方法,其中將一個末端分類為上游末端且將另一末端分類為下游末端包含將下游末端識別為具有比上游末端高的該基因體位置的值。
  56. 如請求項54之方法,其中該基因體位點為CTCF結合位點或DNASE1超敏位點(DHS)。
  57. 如請求項54之方法,其中確定該個體之該病況之該水準包含將該分離值與參考值進行比較。
  58. 如請求項57之方法,其中該參考值係自來自未患有該病況之個體的一或多個對照樣品或自來自患有該病況之個體的一或多個對照樣品確定。
  59. 如請求項54至58中任一項之方法,其中該病況包含疾病、病症、妊娠或移植病況。
  60. 如請求項59之方法,其中該病況係癌症、自體免疫性疾病、妊娠相關之病況或移植排斥反應。
  61. 如請求項54至58中任一項之方法,其中該病況係膀胱癌。
  62. 如請求項54至61中任一項之方法,其中該病況之較嚴重水準與較大分離值相關聯。
  63. 如請求項54至62中任一項之方法,其中該生物樣品包含血液、血漿、血清、尿液或唾液。
  64. 如請求項54至63中任一項之方法,其中識別該核酸分子組包含: 對於該核酸分子組之各核酸分子: 對該核酸分子進行定序以產生一或多個讀數,及 將該一或多個讀數與參考基因體比對以確定該核酸分子的該基因體位置。
  65. 一種分析生物樣品之方法,該方法包含: 對於該生物樣品中第一游離複數個核酸分子之各核酸分子,該第一游離複數個核酸分子之各核酸分子為具有第一股及第二股的雙股,各第一股包含懸垂該第二股之第一部分,且各第一部分位於該第一股之5'末端: 將包含一或多個核苷酸之第一化合物與該第一股之該第一部分雜交以形成延伸核酸分子,該第一化合物連接至該第二股之3'末端以形成具有包含該第一化合物之3'末端的延長第二股,該第一化合物具有不接觸該第二股之3'末端,其中該第一化合物中各第一類型核苷酸具有與該第二股中之該第一類型核苷酸中之每一者相反的甲基化狀態; 在該生物樣品中將該第一化合物中之該第一類型核苷酸或該第二股中之該第一類型核苷酸轉化為第二類型核苷酸,其中該生物樣品在轉化之後包含第二游離複數個核酸分子,該第二游離複數個核酸分子之各核酸分子為雙股且包含第三股及第四股,各第三股包含懸垂該第四股之第一部分,且各第一部分位於該第三股之3'末端;及 確定對應於該第一化合物中之該第一類型核苷酸之一或多個位點中之每一者的第一甲基化狀態。
  66. 如請求項65之方法,其中未向該生物樣品添加經組態為移除該第二游離複數個核酸分子之核酸分子的該第一部分的酶。
  67. 如請求項66之方法,其中未向該生物樣品中添加核酸外切酶。
  68. 如請求項65之方法,其中: 該生物樣品不包含雙股核酸分子,其具有一個股之3'末端,該一個股懸垂除該第二游離複數個核酸分子中之該等核酸分子以外之另一股,且 該第二游離複數個核酸分子之數目為該第一游離複數個核酸分子之數目的至少50%。
  69. 如請求項65之方法,其中該第一類型核苷酸係胞嘧啶。
  70. 如請求項65之方法,其進一步包含藉由識別與該第二類型核苷酸相鄰之該第一類型核苷酸來確定該第一游離複數個核酸分子之各第一化合物的長度。
  71. 如請求項65之方法,其進一步包含: 使用該等第一甲基化狀態計算甲基化水準,及 使用該甲基化水準確定鋸齒狀指標值。
  72. 如請求項65之方法,其中: 轉化該第一化合物中之該第一類型核苷酸或該第二股中之該第一類型核苷酸包含轉化該第一化合物中之該第一類型核苷酸, 確定該第一甲基化狀態包含確定該第二類型核苷酸之標識,及 該第一甲基化狀態經確定為未甲基化的。
  73. 如請求項65之方法,其進一步包含: 使該複數個延伸核酸分子磷酸化; 使該第二游離複數個核酸分子磷酸化;及 將接附子添加至該等延伸核酸分子中。
  74. 如請求項65之方法,其中轉化該第一化合物中之該第一類型核苷酸或該第二股中之該第一類型核苷酸包含對該第一化合物中之該第一類型核苷酸或該第二股中之該第一類型核苷酸進行亞硫酸氫鹽處理。
  75. 如請求項65之方法,其中: 轉化該第一化合物中之該第一類型核苷酸或該第二股中之該第一類型核苷酸包含轉化該第二股中之該第一類型核苷酸, 該方法進一步包含: 轉化該第二游離複數個核酸分子中之該第一類型核苷酸。
  76. 一種分析尿液樣品之方法,該方法包含: 量測來自個體之該尿液樣品之游離複數個核酸分子之各核酸分子的特徵,其中該游離複數個核酸分子之各核酸分子為具有第一部分之第一股及第二股的雙股,該游離複數個核酸分子中之至少一些之該第一股的該第一部分懸垂該第二股,且該特徵與懸垂該第二股之該第一股的長度相關; 藉由量測具有該量測特徵之複數個值中之每一者的核酸分子之量來產生直方圖; 使用該直方圖識別複數個峰值量及複數個局部最小量; 使用該複數個峰值量及該複數個局部最小量來確定鋸齒狀指標值;及 使用該鋸齒狀指標值確定該個體病況之水準。
  77. 如請求項76之方法,其中量測包含量測各核酸分子之該第一股、該第二股或該第一股及該第二股之特徵。
  78. 如請求項76之方法,其中該鋸齒狀指標值包含相對於該等局部最小量之該等峰值量的集體量度。
  79. 如請求項76之方法,其中該直方圖呈表格形式。
  80. 如請求項76之方法,其中該特徵係長度。
  81. 如請求項76之方法,其中該病況係癌症。
  82. 如請求項81之方法,其中該病況係腎癌。
  83. 如請求項76之方法,其中該鋸齒狀指標值係使用該複數個局部最小量確定,且該鋸齒狀指標值提供該複數個峰值量與該複數個局部最小量之間的差異的集體量度。
  84. 如請求項83之方法,其中該鋸齒狀指標值係使用該複數個峰值量中之各峰值量與至少一個相鄰局部最小量的比較來確定。
  85. 如請求項76之方法,其中: 該複數個峰值量以該量測特徵之週期性間隔出現,且 該複數個局部最小量以該量測特徵之週期性間隔出現。
  86. 如請求項85之方法,其中該量測特徵之該週期性間隔對應於9至11 nt的長度。
  87. 如請求項76之方法,其中該游離複數個核酸分子具有在50至170 nt範圍內之大小。
  88. 如請求項76之方法,其中對該病況之該水準進行分類包含將該鋸齒狀指標值與參考值進行比較。
  89. 如請求項88之方法,其中該參考值係使用患有該病況之個體的一或多個參考樣品測定,或該參考值係使用並未患有該病況之個體的一或多個參考樣品測定。
  90. 一種電腦產品,其包含儲存複數個指令之非暫時性電腦可讀媒體,該等指令在執行時控制電腦系統執行如前述請求項中任一項之方法。
  91. 一種系統,其包含: 如請求項90之電腦產品;及 一或多個處理器,其用於執行儲存於該電腦可讀媒體上之指令。
  92. 一種系統,其包含執行上述方法中之任一者的構件。
  93. 一種系統,其包含經組態以執行上述方法中之任一者的一或多個處理器。
  94. 一種系統,其包含分別執行上述方法中之任一者的步驟的模組。
TW110145886A 2020-12-08 2021-12-08 使用尿液及其他dna特徵之方法 TW202237856A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202063122669P 2020-12-08 2020-12-08
US63/122,669 2020-12-08
US202163193508P 2021-05-26 2021-05-26
US63/193,508 2021-05-26

Publications (1)

Publication Number Publication Date
TW202237856A true TW202237856A (zh) 2022-10-01

Family

ID=81848575

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110145886A TW202237856A (zh) 2020-12-08 2021-12-08 使用尿液及其他dna特徵之方法

Country Status (9)

Country Link
US (1) US20220177971A1 (zh)
EP (1) EP4259817A1 (zh)
JP (1) JP2023553113A (zh)
KR (1) KR20230125790A (zh)
AU (1) AU2021395060A1 (zh)
CA (1) CA3198004A1 (zh)
IL (1) IL302784A (zh)
TW (1) TW202237856A (zh)
WO (1) WO2022121894A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024137397A1 (en) * 2022-12-19 2024-06-27 Foundation Medicine, Inc. Methods and compositions for profiling the ends of a cell-free dna molecule

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUE058263T2 (hu) * 2015-02-10 2022-07-28 Univ Hong Kong Chinese Mutációk detektálása rákszûrési és magzatelemzési célból
EP3535415A4 (en) * 2016-10-24 2020-07-01 The Chinese University of Hong Kong TUMOR DETECTION METHODS AND SYSTEMS
IL315032A (en) * 2016-11-30 2024-10-01 The Chinese Univ Of Hong Kong Analysis of cell-free DNA in urine and other samples

Also Published As

Publication number Publication date
EP4259817A1 (en) 2023-10-18
KR20230125790A (ko) 2023-08-29
JP2023553113A (ja) 2023-12-20
US20220177971A1 (en) 2022-06-09
AU2021395060A1 (en) 2023-07-06
WO2022121894A1 (en) 2022-06-16
CA3198004A1 (en) 2022-06-16
IL302784A (en) 2023-07-01
AU2021395060A9 (en) 2024-06-20

Similar Documents

Publication Publication Date Title
EP3899018B1 (en) Cell-free dna end characteristics
CN114999567A (zh) 游离dna的片段化模式的分析
US20210238668A1 (en) Biterminal dna fragment types in cell-free samples and uses thereof
JP2024112999A (ja) 無細胞dna損傷分析およびその臨床応用
TW202102687A (zh) 確定循環核酸之線性及環狀形式
WO2023093782A1 (en) Molecular analyses using long cell-free dna molecules for disease classification
JP2023537215A (ja) 無細胞核酸についてのヌクレアーゼに関連する末端シグネチャ分析
WO2016160600A1 (en) Method of identifying risk for autism
US20220177971A1 (en) Methods using characteristics of urinary and other dna
TW202342765A (zh) 用於量測甲基化及疾病之片段化
CN116685690A (zh) 使用尿液和其他dna的特征的方法
US20240287593A1 (en) Single-molecule strand-specific end modalities
TW202424208A (zh) 無細胞dna的表觀遺傳學分析
CN118749032A (zh) 使用长游离dna分子进行疾病分类的分子分析