TW202012638A - 用於癌症及贅瘤之評估的組合物及方法 - Google Patents
用於癌症及贅瘤之評估的組合物及方法 Download PDFInfo
- Publication number
- TW202012638A TW202012638A TW108112820A TW108112820A TW202012638A TW 202012638 A TW202012638 A TW 202012638A TW 108112820 A TW108112820 A TW 108112820A TW 108112820 A TW108112820 A TW 108112820A TW 202012638 A TW202012638 A TW 202012638A
- Authority
- TW
- Taiwan
- Prior art keywords
- target
- methylation
- kit
- sequencing
- dna
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2531/00—Reactions of nucleic acids characterised by
- C12Q2531/10—Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
- C12Q2531/113—PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Hospice & Palliative Care (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Oncology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本發明係關於某些組合物、套組、裝置、系統及方法,例如用於評估個體之癌症或贅瘤之某些組合物、套組、裝置、系統及方法。在特定態樣中,本文提供基於評估來自個體之所選靶聚核苷酸序列,例如靶基因組DNA序列之甲基化狀態,用於評估該個體之癌症或贅瘤之組合物、套組、裝置、系統及方法。
Description
本發明係關於某些組合物、套組、裝置、系統及方法,例如用於評估個體之癌症或贅瘤之組合物、套組、裝置、系統及方法。在特定態樣中,本文提供基於評估來自個體之所選靶聚核苷酸序列,例如靶基因組DNA序列之甲基化狀態,用於評估該個體之癌症或贅瘤之組合物、套組、裝置、系統及方法。
已知用於評估個體之癌症或贅瘤之各種試劑、套組及方法。然而,需要用於評估個體之癌症或贅瘤之經改善的組合物、套組、裝置、系統及方法,例如具有較好敏感度、特異度及/或提供更多資訊之測試。本發明解決此需要及其他相關需要。
本發明內容並不意欲用於限制所主張之主題之範疇。所主張之主題之其他特點、細節、效用及優勢將自實施方式,包括附圖及隨附申請專利範圍中所揭示之彼等態樣而顯而易見。
在一個態樣中,本文提供一組經分離之聚核苷酸,其包含以下、由以下組成或基本上由以下組成:至少兩種經分離之聚核苷酸,該等經分離之聚核苷酸中之各者具有表1中所列之標靶1至標靶1849中之任一者之聚核苷酸序列或其互補序列。亦提供包含上組中之任一者之套組、裝置、系統或製品。
在另一態樣中,提供經組態以評估表1中所列之標靶1至標靶1849中之至少兩者之甲基化狀態的套組、裝置、系統或製品。在一些實施例中,本發明套組、裝置、系統或製品經組態以評估個體之癌症或贅瘤。
在再一態樣中,本文提供一種用於評估個體之癌症或贅瘤之方法,該方法包含:a)提供來自個體之樣品,其含有至少兩種該個體之靶聚核苷酸,該至少兩種靶聚核苷酸具有表1中所列之標靶1至標靶1849中之至少兩者之聚核苷酸序列或其互補序列;b)評估該至少兩種靶聚核苷酸之甲基化狀態;及c)基於該至少兩種靶聚核苷酸之甲基化狀態之評估,評估該個體之癌症或贅瘤。在一些實施例中,本發明方法用於個體之癌症或贅瘤之診斷、預後、分級、風險評估或治療監測。
相關申請
本申請案主張2018年4月12日申請之美國臨時專利申請案第62/656,820號之優先權,其揭示內容出於所有目的以全文引用之方式併入本文中。在一些態樣中,本發明係關於2017年4月19日申請之美國臨時申請案第62/487,422號及2017年4月19日申請之美國臨時申請案第62/487,423號,其內容出於所有目的以其全文引用之方式併入。
在以下描述中闡述眾多特定細節以便提供對本發明之透徹理解。出於實例之目的提供此等細節,且可根據申請專利範圍在不存在此等特定細節中之一些或全部的情況下實踐所主張之主題。應理解,在不脫離所主張之主題之範疇的情況下,可使用其他實施例,且可進行結構改變。應理解個別實施例中之一或多者中所描述之各種特點及功能在其適用性方面不限於描述其之具體實施例。其可替代地獨自或以某一組合應用於本發明之其他實施例中之一或多者,無論是否描述該等實施例,且無論該等特點是否呈現為所描述之實施例的一部分。出於清晰之目的,技術領域中已知關於所主張之主題之技術材料尚未詳細地描述,因此並非不必要地遮蔽所主張之主題。
本申請案中所提及之所有出版物(包括專利文件、科學論文及資料庫),出於所有目的均以全文引用之方式併入本文中,其引用之程度如同各個別出版物以引用之方式個別地併入一般。出版物或文獻之引用不意欲承認該出版物或文獻為相關先前技術,其亦絕不承認此等出版物或文件之內容或日期。
除非如此指定,否則所有標題係出於讀者便利性目的,且不應用於限制標題後跟隨之文本的意義。
除非另外指示,否則所提供實施例之實踐將採用此項技術中實踐之彼等之技能範圍內的有機化學、聚合物技術、分子生物學(包括重組技術)、微生物學、細胞生物學、生物化學及定序技術之習知技術及描述。該等習知技術包括多肽及蛋白質合成及修飾、聚核苷酸合成及修飾、聚合物陣列合成、聚核苷酸之雜交及接合、雜交之偵測及核苷酸定序。可參考本文中之實例來獲得適合技術之特定說明。然而,當然亦可使用其他等效習知程序。該等習知技術及描述可見於標準實驗室手冊,諸如Green,等人編,Genome Analysis : A Laboratory Manual Series
(第I-IV卷) (1999);Weiner, Gabriel, Stephens編,Genetic Variation : A Laboratory Manual
(2007);Dieffenbach, Dveksler編,PCR Primer : A Laboratory Manual
(2003);Bowtell及Sambrook,DNA Microarrays : A Molecular Cloning Manual
(2003);Mount,Bioinformatics : Sequence and Genome Analysis
(2004);Sambrook及Russell,Condensed Protocols from Molecular Cloning : A Laboratory Manual
(2006);及Sambrook及Russell,Molecular Cloning : A Laboratory Manual
(2002) (均來自Cold Spring Harbor Laboratory Press);Ausubel等人編,Current Protocols in Molecular Biology
(1987);T. Brown編,Essential Molecular Biology
(1991), IRL Press;Goeddel編,Gene Expression Technology
(1991), Academic Press;A. Bothwell等人編,Methods for Cloning and Analysis of Eukaryotic Genes
(1990), Bartlett Publ.;M. Kriegler,Gene Transfer and Expression
(1990), Stockton Press;R. Wu等人編,Recombinant DNA Methodology
(1989), Academic Press;M. McPherson等人,PCR : A Practical Approach
(1991), Oxford University Press之IRL Press;Stryer,Biochemistry
(第4版) (1995), W. H. Freeman, New York N.Y.;Gait,Oligonucleotide Synthesis : A Practical Approach
(2002), IRL Press, London;Nelson及Cox,Lehninger , Principles of Biochemistry
(2000)第3版, W. H. Freeman Pub., New York, N.Y.;Berg,等人,Biochemistry
(2002) 第5版, W. H. Freeman Pub., New York, N.Y.,其所有出於所有目的以其全文引用之方式併入本文中。
A. 定義
除非另外定義,否則本文所用之所有技術及科學術語均具有與一般熟習本發明所屬技術者通常所理解相同之含義。若此章節中所闡述之定義與以引用方式併入本文中之專利、申請案、公開申請案及其他公開案中所闡述之定義相反或者不一致,則以此章節中所闡述之定義,而非以引用方式併入本文中的定義為準。
如本文所用,「一個/種(a/an)」意謂「至少一個/種」或「一或多個/種」。除非上下文另外明確指示,否則如本文所用,單數形式「一個/種(a/an)」及「該」包括複數個參考物。
在本發明通篇,所主張之主題之各種態樣均以範圍型式呈現。應理解,範圍型式中之描述僅為了方便及簡潔起見且不應視為對所主張之主題之範疇的不可撓限制。因此,範圍之描述應視為已特定揭示所有可能之子範圍以及該範圍內之個別數值。舉例而言,在提供值範圍之情況下,應理解,該範圍之上限與下限之間的各中間值及該所陳述範圍內的任何其他所陳述值或中間值均涵蓋於所主張之主題內。此等較小範圍之上限及下限可獨立地包括於較小範圍內且亦涵蓋於所主張之主題內,在所陳述範圍內受到任何特定排他性限制。當所陳述之範圍包括限制中之一者或兩者時,排除彼等所包括之限制中之任一者或兩者之範圍亦包括於所主張之主題中。不管範圍之寬度如何,此均適用。
本文中對「約」一個值或參數之提及包括(及描述)針對該值或參數本身之變化。舉例而言,提及「約X」之描述包括「X」之描述。另外,在任何系列數量前使用「約」包括「約」該系列中之所敍述數量中之各者。舉例而言,提及「約X、Y或Z」之描述意欲描述「約X、約Y或約Z」。
除非上下文另外明確指示,否則如本文所用之術語「平均」係指平均值或中值或用於近似平均值或中值之任何值。
如本文所用之「個體」係指生物體或生物體之部分或組分,向該生物體或生物體之一部分或組分可投與或施用所提供組合物、方法、套組、裝置及系統。舉例而言,個體可為哺乳動物或哺乳動物之細胞、組織、器官或一部分。如本文所用,「哺乳動物」係指哺乳動物類別之物種中之任一者,較佳為人類(包括人類、人類個體或人類患者)。個體及哺乳動物包括但不限於農耕動物、運動型動物、寵物、靈長類動物、馬、狗、貓及嚙齒動物(諸如小鼠及大鼠)。
如本文所使用,術語「樣品」係指可含有分析所需之靶分子之任何東西,包括生物樣品。如本文所用,「生物樣品」可指自活的或病毒(或朊病毒)來源或大分子及生物分子之其他來源獲得之任何樣品,且包括可自其中獲得核酸、蛋白質及/或其他大分子之個體之任何細胞類型或組織。生物樣品可為直接獲自生物學來源的樣品或經處理之樣品。舉例而言,經擴增之分離核酸構成生物樣品。生物樣品包括但不限於體液,諸如血液、血漿、血清、腦脊髓液、滑液、尿液、汗液、精液、大便、痰、淚液、黏液、羊水或其類似物、積液、骨髓樣品、腹水、骨盆洗滌液、胸膜液、脊髓液、淋巴、眼液、鼻提取物、咽喉或生殖器拭子、來自消化組織之細胞懸浮液或糞便材料之提取物及來自人類、動物(例如非人類哺乳動物)及植物之組織及器官樣品及來源於其中之經處理樣品。
術語「聚核苷酸」、「寡核苷酸」、「核酸」及「核酸分子」在本文中可互換地使用以指任何長度之核苷酸之聚合形式,且包含核糖核苷酸、脫氧核糖核苷酸及其類似物或混合物。術語包括三股、雙股及單股脫氧核糖核酸(「DNA」)以及三股、雙股及單股核糖核酸(「RNA」)。其亦包括例如藉由烷基化及/或藉由封端經修飾及未經修飾之聚核苷酸形式。更特定言之,術語「聚核苷酸」、「寡核苷酸」、「核酸」及「核酸分子」包括聚脫氧核糖核苷酸(含有2-脫氧-D-核糖)、聚核糖核苷酸(含有D-核糖) (包括tRNA、rRNA、hRNA及mRNA)、剪接或未經剪接的任何其他類型之聚核苷酸(其為嘌呤或嘧啶鹼基之N-醣苷或C-醣苷)及含有非核苷酸主鏈之其他聚合物,例如聚醯胺(例如,肽核酸(peptide nucleic acid,「PNA」))及聚(N-嗎啉基) (可以Neugene購自Anti-Virals, Inc., Corvallis, OR)聚合物及其他合成序列特異性核酸聚合物,其前提條件為該等聚合物含有呈允許鹼基配對及鹼基堆疊(諸如發現於DNA及RNA中)之組態之核鹼基。因此,此等術語包括例如3'-脫氧-2',5'-DNA、寡脫氧核苷酸N3'至P5'胺基磷酸酯、經2'-O-烷基取代之RNA、DNA與RNA之間或PNA與DNA或RNA之間之雜交體,且亦包括已知類型之修飾,例如標記、烷基化作用、「封蓋」、用類似物取代核苷酸中之一或多者、核苷酸間修飾,諸如具有不帶電之鍵聯之彼等(例如,膦酸甲酯、磷酸三酯、胺基磷酸酯、胺基甲酸酯等)、具有帶負電之鍵聯之彼等(例如,硫代磷酸酯、二硫代磷酸酯等)及具有帶正電之鍵聯之彼等(例如,胺基烷基胺基磷酸酯、胺基烷基磷酸三酯)、含有側接部分之彼等(諸如蛋白質(包括酶(例如,核酸酶)、毒素、抗體、信號肽、聚-L-離胺酸等))、具有嵌入劑之彼等(例如,吖啶、補骨脂素等)、含有(例如金屬、放射性金屬、硼、氧化金屬等之)螯合物之彼等、含有烷基化劑之彼等、具有經修飾之鍵聯之彼等(例如,α變旋異構核酸等)以及未修飾形式之聚核苷酸或寡核苷酸。核酸一般會含有磷酸二酯鍵,但在一些情況下可包括具有替代主鏈之核酸類似物,該等主鏈諸如胺基磷酸酯、二硫代磷酸酯或胺基磷酸甲酯鍵聯;或肽核酸主鏈及鍵聯。其他類似物核酸包括具有雙環結構之彼等,該等雙環結構包括鎖核酸、正主鏈、非離子主鏈及非核糖主鏈。可進行核糖磷酸酯主鏈之修飾以提高分子之穩定性;舉例而言,PNA:DNA雜交體可在一些環境中呈現較高穩定性。術語「聚核苷酸」、「寡核苷酸」、「核酸」及「核酸分子」可包含任何適合長度諸如至少5、6、7、8、9、10、20、30、40、50、100、200、300、400、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000或更多個核苷酸。
應瞭解,如本文所用,術語「核苷」及「核苷酸」包括不僅含有已知嘌呤及嘧啶鹼基且亦含有已經修飾之其他雜環鹼基的彼等部分。該等修飾包括甲基化嘌呤或嘧啶、醯基化嘌呤或嘧啶或其他雜環。經修飾之核苷或核苷酸亦可包括糖部分上之修飾,例如其中羥基中之一或多者經鹵素、脂族基置換,或官能化為醚、胺或其類似物。術語「核苷酸單元」意欲涵蓋核苷及核苷酸。
術語「互補」及「實質上互補」包括在核苷酸或核酸之間、例如在兩股雙股DNA分子之間或寡核苷酸引子與單股核酸上之引子結合位點之間雜交或鹼基配對或形成雙螺旋體。互補核苷酸一般為A及T (或A及U)或C及G。當經最佳比對及比較且在適當核苷酸插入或刪除下之一個股之核苷酸與另一股之至少約80%、通常至少約90%至約95%且甚至約98%至約100%配對時,兩個單股RNA或DNA分子稱為實質上互補的。在一個態樣中,核苷酸之兩個互補序列能夠在相對核苷酸之間較佳在小於25%、更佳在小於15%、甚至更佳在小於5%、最佳在無錯配之情況下雜交。較佳地,兩個分子將在高嚴格度之條件下雜交。
如本文所用,對於參考序列,反向互補序列為呈反向順序之參考序列之互補序列。舉例而言,對於5'-ATCG-3',互補序列為3'-TAGC-5',且反向互補序列為5'-CGAT-3'。
如本文所用之「雜交」可指兩個單股聚核苷酸非共價地結合以形成穩定雙股聚核苷酸之過程。在一個態樣中,所得雙股聚核苷酸可為「雜交體」或「雙螺旋體」。「雜交條件」通常包括大約低於1 M、通常低於約500 mM且可低於約200 mM之鹽濃度。「雜交緩衝液」包括諸如5% SSPE之緩衝鹽溶液或其他此項技術中已知之該等緩衝液。雜交溫度可低至5℃,但通常高於22℃,且更通常高於約30℃,且通常超過37℃。雜交通常在嚴格條件,亦即序列將與其靶序列雜交但將不與其他非互補序列雜交之條件下進行。嚴格條件與序列相關,且隨情況不同而不同。舉例而言,較長片段可能需要比短片段更高的用於特異性雜交之雜交溫度。因為其他因素可影響包括鹼基組合物及互補股之長度、有機溶劑之存在及鹼基錯配程度之雜交嚴格度,所以參數之組合比任何一個參數單獨的絕對量測值更重要。一般而言,在所界定離子強度及pH下,將嚴格條件選擇為比特定序列之T m
低約5℃。熔融溫度T m
可為一群雙股核酸分子半解離為單股之溫度。用於計算核酸之T m
之幾個方程式為此項技術中所熟知。如由標準參考文獻指示,當核酸在1 M NaCl下呈水溶液時,T m
值之簡單估計值可由方程式T m
= 81.5 + 0.41 (% G + C)計算(參見例如Anderson
, M.L.M.及Young
, B.D.1985
,Quantitative filter hybridization . In : Nucleic acid hybridization
: a practical approach, 73-111. B. D. Hames及S. J. Higgins (編). IRL Press Limited, Oxford.)。其他參考文獻(例如,Allawi及SantaLucia, Jr.,Biochemistry
, 36:10581-94 (1997))包括替代的運算方法,其考慮結構及環境以及序列特徵來計算T m
。
一般而言,雜交體之穩定性係離子濃度及溫度之函數。通常,雜交反應在較低嚴格度條件下進行,隨後洗滌,但變成具有較高嚴格度。例示性嚴格條件包括在約7.0至約8.3之pH及至少25℃之溫度下至少0.01 M之鹽濃度至不超過1 M鈉離子濃度(或其他鹽)。舉例而言,5 × SSPE (在pH為7.4下750 mM NaCl,50 mM磷酸鈉,5 mM EDTA)之條件及大約30℃之溫度適用於對偶基因特異性雜交,但適合溫度視雜交區域之長度及/或GC含量而定。在一個態樣中,判定錯配百分比之「雜交嚴格度」可為如下:1)高嚴格度:0.1 × SSPE、0.1% SDS、65℃;2)中間嚴格度:0.2 × SSPE、0.1% SDS、50℃ (亦稱為中等嚴格度);及3)低嚴格度:1.0 × SSPE、0.1% SDS、50℃。應理解,相等嚴格度可使用替代緩衝液、鹽及溫度實現。舉例而言,中等嚴格雜交可指准許諸如探針之核酸分子結合互補核酸分子之條件。雜交核酸分子一般具有至少60%一致性,包括例如至少70%、75%、80%、85%、90%或95%一致性中之任一者。中等嚴格條件可為等效於在42℃下在50%甲醯胺、5 ×鄧哈特溶液(Denhardt's solution)、5 × SSPE、0.2% SDS中雜交,隨後在42℃下在0.2 × SSPE、0.2% SDS中洗滌之條件。可例如藉由在42℃下在50%甲醯胺、5 ×鄧哈特溶液、5 × SSPE、0.2% SDS中雜交,隨後在65℃下在0.1 × SSPE及0.1% SDS中洗滌來提供高嚴格度條件。低嚴格度雜交可指等效於在22℃下在10%甲醯胺、5 ×鄧哈特溶液、6 × SSPE、0.2% SDS中雜交,隨後在37℃下在1 × SSPE、0.2% SDS中洗滌之條件。鄧哈特溶液含有1%聚蔗糖(Ficoll)、1%聚乙烯吡咯啶酮及1%牛血清白蛋白(BSA)。20 × SSPE (氯化鈉、磷酸鈉、EDTA)含有3 M氯化鈉、0.2 M磷酸鈉及0.025 M EDTA。其他適合之中等嚴格度及高嚴格度雜交緩衝液及條件已為熟習此項技術者所熟知,且描述於例如Sambrook等人, Molecular Cloning: A Laboratory Manual,第2版, Cold Spring Harbor Press, Plainview, N.Y. (1989);及Ausubel等人, Short Protocols in Molecular Biology,第4版, John Wiley & Sons (1999)中。
或者,實質性互補在RNA或DNA股將在選擇性雜交條件下與其互補序列雜交時存在。通常,選擇性雜交將在至少14至25個核苷酸之一段上存在至少約65%互補、較佳至少約75%、更佳至少約90%互補時出現。參見M. Kanehisa,Nucleic Acids Res .
12:203 (1984)。
本文所用之「引子」可為天然或合成寡核苷酸,其在與聚核苷酸模板形成雙螺旋體時能夠充當核酸合成之起始點,且自其3'端沿模板延伸以形成經延伸之雙螺旋體。在延伸過程期間添加之核苷酸序列藉由模板聚核苷酸之序列確定。引子通常藉由聚合酶,例如DNA聚合酶延伸。
「接合」可指在模板驅動反應中在兩個或更多個核酸(例如寡核苷酸及/或聚核苷酸)之末端之間形成共價鍵或鍵聯。鍵或鍵聯之性質可廣泛地變化,且可以酶方式進行接合。如本文所用,接合通常以酶方式進行以在一個寡核苷酸之5'碳末端核苷酸與另一核苷酸之3'碳之間形成磷酸二酯鍵聯。
如本文所用之「擴增」一般係指產生所需序列之多個複本的方法。「多個複本」意謂至少2個複本。「複本」不一定意謂與模板序列互補或一致之完美序列。舉例而言,複本可包括核苷酸類似物,諸如脫氧肌苷、有意序列改變(諸如經由包含與模板可雜交但不互補之序列之引子引入的序列改變),及/或在擴增期間發生之序列誤差。
「序列確定」及其類似物包括確定與核酸之核苷酸鹼基序列相關之資訊。該資訊可包括鑑別或確定核酸之部分以及全部序列資訊。序列資訊可以不同程度之統計可靠度或可信度確定。在一個態樣中,術語包括確定核酸中之複數個連續核苷酸之一致性及排序。
術語「定序」、「高通量定序」或「下一代定序」包括使用以本質上平行方式確定許多(通常數千至數十億)之核酸序列之方法的序列確定,亦即其中製備用於並非一次一個地但以整體過程定序的DNA模板,且其中許多序列較佳平行地讀出,或可替代地使用自身可平行化的超高通量串行方法的序列確定。該等方法包括但不限於焦磷酸定序(例如,如由454 Life Sciences, Inc., Branford, CT商業化);藉由接合定序(例如,如在SOLiD™技術,Life Technologies, Inc., Carlsbad, CA中商業化);藉由使用經修飾之核苷酸合成定序(諸如在Illumina, Inc., San Diego, CA之TruSeq™及HiSeq™技術;Helicos Biosciences Corporation, Cambridge, MA之HeliScope™;及Pacific Biosciences of California, Inc., Menlo Park, CA之PacBio RS中商業化);藉由離子偵測技術定序(諸如Ion Torrent™技術,Life Technologies, Carlsbad, CA);DNA奈米球之定序(Complete Genomics, Inc., Mountain View, CA);基於奈米孔之定序技術(例如,如由Oxford Nanopore Technologies, LTD, Oxford, UK研發)及類似高度平行化之定序方法。
「SNP」或「單核苷酸多形現象」可包括個體之間之遺傳變異;例如可變的生物體之DNA中之單個含氮鹼基位置。在整個基因組中發現SNP;個體之間之許多遺傳變異係由於SNP基因座處之變異,且此遺傳變異通常導致個體之間之表現型變異。用於本發明之SNP及其相應對偶基因可來源於任何數目個來源,諸如公眾資料庫(U.C. Santa Cruz Human Genome Browser Gateway (genome.ucsc.edu/cgi-bin/hgGateway)或NCBI dbSNP網站(ncbi.nlm.nih gov/SNP/),或可如美國專利第6,969,589號;及標題為「Human Genomic Polymorphisms」之美國公開案第2006/0188875號中所述以實驗方式確定。儘管SNP之使用描述於本文中所呈現之一些實施例中,但應理解亦可使用其他雙對偶基因或多對偶基因遺傳標記物。雙對偶基因遺傳標記為具有兩種多形形式或對偶基因之遺傳標記物。如上文所提及,對於與特質相關之雙對偶基因遺傳標記物,與對照組相比病例組之遺傳組成更豐富的對偶基因稱為「相關對偶基因」,且另一對偶基因可稱為「不相關對偶基因」。因此,對於與給定特質(例如疾病或藥物反應)相關之各雙對偶基因多形現象,存在對應相關對偶基因。可與本文中所呈現之方法一起使用之其他雙對偶基因多形現象包括但不限於聚核苷酸變化、插入、刪除及易位。
應進一步理解,本文中對DNA之參考可包括基因組DNA、粒線體DNA、游離型DNA及/或DNA衍生物,諸如擴增子、RNA轉錄物、cDNA、DNA類似物等。在關聯研究中篩選之多形基因座可呈二倍體或單倍體狀態,且理想地,將來自整個基因組中之位點。定序技術可用於SNP定序,諸如可採用BeadArray平台 (GOLDENGATETM
檢定) (Illumina, Inc., San Diego, CA) (參見Fan,等人,Cold Spring Symp . Quant . Biol .
, 68:69-78 (2003))。
在一些實施例中,術語「甲基化狀態(methylation state/methylation status)」係指在DNA序列內之一個或複數個CpG二核苷酸處存在或不存在5-甲基胞嘧啶(「5-mC」或「5-mCyt」)。在DNA序列內之一或多個特定CpG甲基化位點(各自具有兩個CpG二核苷酸序列)處之甲基化狀態包括「未甲基化」、「完全甲基化」及「半甲基化」狀態。術語「半甲基化(hemi-methylation/hemimethylation)」係指其僅一股為甲基化的雙股DNA之甲基化狀態。術語「高甲基化」係指相對於正常對照DNA樣品內之對應CpG二核苷酸處所發現之5-mCyt的量,與測試DNA樣品之DNA序列內之一個或複數個CpG二核苷酸處之5-mCyt之存在增加對應的平均甲基化狀態。術語「低甲基化」係指相對於正常對照DNA樣品內之對應CpG二核苷酸處所發現之5-mCyt的量,與測試DNA樣品之DNA序列內之一個或複數個CpG二核苷酸處之5-mCyt之存在減少對應的平均甲基化狀態。
本文中之「多重測定(multiplexing)」或「多重檢定(multiplex assay)」可指一種檢定或其他分析方法,其中多個標靶(例如多個核酸序列)之存在、量及/或甲基化狀態(methylation state/methylation status)可藉由使用超過一種標記物進行同步檢定,該等標記中之各者具有至少一種不同偵測特徵,例如螢光特徵(例如,激發波長、發射波長、發射強度、半高全寬峰高度(full width at half maximum peak height,FWHM)或螢光壽命)或獨特核酸或蛋白質序列特徵。
如本文所用,「疾病或病症」係指由例如感染或遺傳缺陷產生且由可鑑別的症狀表徵之生物體之病理性病況。
B. 經分離之聚核苷酸及相關組合物之組
在一個態樣中,本文提供一種經分離之聚核苷酸之組,其包含至少兩個經分離之聚核苷酸、由至少兩個經分離之聚核苷酸組成或基本上由至少兩個經分離之聚核苷酸組成,該等經分離之聚核苷酸中之各者具有表1中所列之標靶1至標靶1849中之任一者之聚核苷酸序列(示於圖5中)或其互補或實質上互補序列。
本發明之組可包含以下、由以下組成或基本上由以下組成:任何適合數目的上述經分離之聚核苷酸。舉例而言,本發明之組可包含以下、由以下組成或基本上由以下組成:表1中所列之標靶1至標靶1849中之至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個經分離之聚核苷酸或與之全部,或其數值範圍或子範圍對應的經分離之聚核苷酸。
在一個實施例中,本發明之組可包含表1中所列之標靶1至標靶1849中之至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個經分離之聚核苷酸或與之全部,或其數值範圍或子範圍對應的經分離之聚核苷酸。在另一實施例中,本發明之組可由以下組成:表1中所列之標靶1至標靶1849中之至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個經分離之聚核苷酸或與之全部,或其數值範圍或子範圍對應的經分離之聚核苷酸。在再一實施例中,本發明之組可基本上由以下組成:表1中所列之標靶1至標靶1849中之至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個經分離之聚核苷酸或與之全部,或其數值範圍或子範圍對應的經分離之聚核苷酸。
本發明之組中之經分離之聚核苷酸可為任何適合類型之聚核苷酸。舉例而言,經分離之聚核苷酸可為DNA分子、RNA分子或其組合。在一些實施例中,DNA分子可為基因組DNA分子或其片段。
經分離之聚核苷酸可固定在基板上。經分離之聚核苷酸可固定在任何適合基板上。舉例而言,基板可包含固體表面、多孔表面或其組合。在一些實施例中,基板可為珠粒、管、微量滴定盤、膜、凝膠或玻璃載片之一部分。在其他實施例中,經分離之聚核苷酸分子可在空間上彼此分開地固定在基板上,以使得經分離之聚核苷酸分子中之各者可單獨地評估或分析。
亦提供包含以上組中之任一者之套組、裝置、系統或製品。
本發明套組、裝置、系統或製品可出於任何適合用途或目的經組態。舉例而言,本發明套組、裝置、系統或製品可經組態以評估表1中所列之標靶1至標靶1849中之至少兩者之甲基化狀態。在一些實施例中,本發明套組、裝置、系統或製品可經組態以評估至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個或數值範圍或其子範圍的經分離之聚核苷酸或與表1中所列之標靶1至標靶1849中之全部對應的經分離之聚核苷酸之甲基化狀態。在其他實施例中,本發明套組、裝置、系統或製品中之經分離之聚核苷酸可經組態為對照聚核苷酸。
本發明套組、裝置、系統或製品中之經分離之聚核苷酸可具有任何適合之濃度水準。舉例而言,經分離之聚核苷酸之濃度水準可為約1飛莫耳至約100毫莫耳,例如為約1飛莫耳(femtomolar,fM)、10 fM、100 fM、1皮莫耳(picomolar,pM)、10 pM、100 pM、1奈莫耳(nanomolar,nM)、10 nM、100 nM、1微莫耳(micromolar,μM)、10 μM、100 μM、1毫莫耳(millimolar,mM)、10 mM、100 mM或其子範圍。
本發明套組、裝置、系統或製品可出於任何適合用途或目的經組態。舉例而言,套組、裝置、系統或製品可經組態以評估個體之癌症或贅瘤,例如以評估個體之肺癌或結直腸癌或以用於個體之泛癌分析或剖析。
C. 用於評估甲基化之套組、系統及相關組合物
在另一態樣中,提供經組態以評估表1中所列之標靶1至標靶1849中之至少兩者之甲基化狀態的套組、裝置、系統或製品。
本發明套組、裝置、系統或製品可包含用於評估任何適合數目個表1中所列之標靶之甲基化狀態的試劑。舉例而言,本發明套組、裝置、系統或製品可包含用於評估至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個或數值範圍或其子範圍的經分離之聚核苷酸或與表1中所列之標靶1至標靶1849中之全部對應的經分離之聚核苷酸之甲基化狀態的試劑。
在一些實施例中,本發明套組、裝置、系統或製品可包含用於評估任何子組之表1中所列之標靶之甲基化狀態的試劑。舉例而言,本發明套組、裝置、系統或製品可包含用於評估表1中所列之標靶1-100之甲基化狀態的試劑。在其他實施例中,本發明套組、裝置、系統或製品可包含用於評估表1中所列之標靶之全部(不包括一或多個表1中所列之標靶)之甲基化狀態的試劑。舉例而言,本發明套組、裝置、系統或製品可包含用於評估表1中所列之標靶1-1848之甲基化狀態的試劑,但不包含用於評估表1中所列之標靶1849之甲基化狀態的試劑等。
本發明套組、裝置、系統或製品可包含用於評估靶聚核苷酸之甲基化狀態的任何適合試劑。舉例而言,試劑可包含以下、基本上由以下組成或由以下組成:經組態以與待評估其甲基化狀態之標靶中之各者雜交的探針或引子。在一些實施例中,試劑包含以下、基本上由以下組成或由以下組成:經組態以與待評估其甲基化狀態之標靶中之各者雜交的單個探針或引子。在其他實施例中,試劑包含以下、基本上由以下組成或由以下組成:經組態以與待評估其甲基化狀態之標靶中之各者雜交的多個探針或引子。
在一些實施例中,本發明套組、裝置、系統或製品中之一或多個引子包含以下、基本上由以下組成或由以下組成:表1中所列之SEQ ID NO: 1-17504中所闡述之序列、其互補或實質上互補序列或其任何組合。對於表1中所列之各標靶,本發明套組、裝置、系統或製品可包含一或多個該標靶之對應引子、基本上由一或多個該標靶之對應引子組成或由一或多個該標靶之對應引子組成。舉例而言,對於表1中所列之標靶1,本發明套組、裝置、系統或製品可包含以下、基本上由以下組成或由以下組成:表1中所列之SEQ ID NO: 1-10中所闡述之序列中之任一者,例如1、2、3、4、5、6、7、8、9或10個包含以下、基本上由以下組成或由以下組成之引子:SEQ ID NO: 1-10中所闡述之序列、其互補或實質上互補序列或其任何組合。類似地,對於表1中所列之標靶2,本發明套組、裝置、系統或製品可包含以下、基本上由以下組成或由以下組成:表1中所列之SEQ ID NO: 11-20中所闡述之序列中之任一者,例如1、2、3、4、5、6、7、8、9或10個包含以下、基本上由以下組成或由以下組成之引子:SEQ ID NO: 11-20中所闡述之序列、其互補或實質上互補序列或其任何組合。如針對上表1中所列之標靶1或2所說明,對於表1中所列之標靶3-1849中之任一者,本發明套組、裝置、系統或製品可包含以下、基本上由以下組成或由以下組成:表1中所列之對應序列中之任一者、其互補或實質上互補序列或其任何組合。
在一些實施例中,本發明套組、裝置、系統或製品可包含常用引子,例如用於擴增待評估其甲基化狀態之標靶中之各者的常用引子。例示性常用引子可包含以下、基本上由以下組成或由以下組成:SEQ ID NO:17505 CACTCTTTCCCTACACGACGC)中所闡述之序列或其互補或實質上互補序列。
本發明套組、裝置、系統或製品可進一步包含任何其他適合試劑。在一些實施例中,本發明套組、裝置、系統或製品可進一步包含2017年4月19日申請之美國臨時申請案第62/487,422號及2017年4月19日申請之美國臨時申請案第62/487,423號中所揭示及/或所主張之任何其他適合試劑。
舉例而言,本發明套組、裝置、系統或製品可進一步包含用於將標靶與樣品分離之試劑。
在另一實例中,本發明套組、裝置、系統或製品可進一步包含用於製備標靶之庫之試劑。可包括用於製備標靶之庫之任何適合試劑。在一些實施例中,用於製備標靶之庫之試劑可包含酶,例如接合酶或單股DNA (single-stranded DNA,ssDNA)接合酶。可包括任何適合ssDNA接合酶,例如棲熱菌噬菌體(Thermus
bacteriophage) RNA接合酶,諸如噬菌體TS2126 RNA接合酶(例如,CircLigase™及CircLigase II™),或古細菌(archaebacterium) RNA接合酶,諸如嗜熱自養甲烷桿菌(Methanobacterium thermoautotrophicum
) RNA接合酶1。
在再一實例中,本發明套組、裝置、系統或製品可進一步包含用於擴增標靶或標靶之庫之試劑。可包括用於擴增標靶或標靶之庫之任何適合試劑。在一些實施例中,用於擴增標靶或標靶之庫之試劑可包含酶,例如打算用於聚核苷酸擴增反應中之酶。例示性聚核苷酸擴增反應包括聚合酶鏈反應(PCR)、股置換擴增(SDA)、轉錄介導擴增(TMA)、接合酶鏈反應(LCR)、基於核酸序列之擴增(NASBA)、引子延伸、滾環擴增(RCA)、自持續序列複製(3SR)及環介導等溫擴增(LAMP)。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含用於純化標靶、標靶之庫、經擴增標靶或經擴增標靶之庫之試劑。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含用於評估標靶之甲基化狀態之試劑。可包括用於評估標靶之甲基化狀態之任何適合試劑。在一些實施例中,用於評估標靶之甲基化狀態之試劑可為待用於聚核苷酸甲基化(例如DNA甲基化)偵測方法中之試劑。例示性聚核苷酸甲基化或DNA甲基化偵測方法包括質譜法、甲基化特異性PCR (MSP)、亞硫酸氫鹽定序、藉由接合介導PCR檢定(HELP檢定)、Glal水解及接合銜接子相關PCR檢定(GLAD-PCR檢定)之HpaII微小片段增濃、限制性標誌基因組掃描(RLGS)、甲基化DNA免疫沈澱(MeDIP或mDIP)、焦磷酸定序、針對DNA腺嘌呤甲基轉移酶活性之分子斷裂光檢定、甲基敏感性南方墨點法(Southern blotting)及高解析度熔融(high resolution Melt,HRM)分析。
用於評估標靶之甲基化狀態之試劑可為化學劑,例如亞硫酸氫鹽或亞硫酸氫鈉。用於評估標靶之甲基化狀態之試劑亦可為生物劑,例如多肽或酶。
可包括任何適合酶。在一些實施例中,酶可為甲基化敏感性限制酶(MSRE)。MSRE可在其未經甲基化時在殘基上選擇性裂解。MSRE亦可在其經甲基化時在殘基上選擇性裂解。例示性MSRE可選自由以下組成之群:Hpa
II、Sal
I、Sal
I-HF®
、ScrF
I、Bbe
I、Not
I、Sma
I、Xma
I、Mbo
I、BstB
I、Cla
I、Mlu
I、Nae
I、Nar
I、Pvu
I、Sac
II、Hha
I及其組合。
在一些實施例中,酶可為聚核苷酸聚合酶。聚核苷酸聚合酶經組態以用於聚核苷酸擴增反應,例如PCR。可包括任何適合聚核苷酸聚合酶。舉例而言,聚核苷酸聚合酶可為DNA聚合酶,例如無3'至5'外切核酸酶活性之DNA聚合酶。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含用於使來自樣品之雙股聚核苷酸變性以獲得單股聚核苷酸之變性試劑。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含用於接合反應之擁擠劑。在一個態樣中,擁擠劑包含聚乙二醇(PEG),諸如PEG 4000或PEG 6000、聚葡萄糖(Dextran)及/或聚蔗糖。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含一組引子,其各自包含與銜接子反向互補及/或可與銜接子雜交的序列以將單股聚核苷酸轉化為雙股聚核苷酸。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含用於移除引子二聚體及/或引子銜接子雙螺旋體之試劑。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含包括對靶序列(例如,EGFR基因序列)具有特異性之序列的引子以獲得包含靶序列之序列資訊之經擴增線性雙股接合產物。在另一態樣中,套組可進一步包含用於定序經擴增線性雙股接合產物之定序銜接子及/或樣品特異性條形碼。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含一組以上章節B中所述之經分離之聚核苷酸。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含參考樣品及/或對照基因座之資訊。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含用於一或多種組分及/或使用套組、裝置、系統或製品之說明書的獨立容器,例如小瓶。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含含有可執行指令之電腦可讀取媒體,該等指令用於基於甲基化狀態評估來獲得樣品之甲基化量度。電腦可讀取媒體可經組態以任何適合之形式,例如以平均甲基化頻率、甲基化單倍型負荷、未甲基化單倍型負荷、不一致讀數百分比或其組合之形式獲得甲基化量度。
在又一實例中,本發明套組、裝置、系統或製品可進一步包含含有可執行指令之電腦可讀取媒體,該等指令用於使用甲基化量度進行分類。例示性分類演算法可為線性判別分析、邏輯回歸、單純貝氏分類(naïve bayes classification)、感知器分類、二次分類、k最近相鄰法、提昇方法、決策樹、隨機森林(random forest)、神經網路、學習向量量化或支持向量機(support vector machine)或其組合。
本發明套組、裝置、系統或製品可出於任何適合用途或目的經組態。舉例而言,本發明套組、裝置、系統或製品可經組態以評估個體之癌症或贅瘤,例如以評估個體之肺癌或結直腸癌或以用於個體之泛癌分析或剖析。
在一些實施例中,套組可另外包含用於偵測多肽存在之試劑。該等試劑可為抗體或特異性結合於多肽之其他結合分子。在一些實施例中,該等抗體或結合分子可能夠由於多形現象區分多肽之結構變異,且因此可用於基因分型。抗體或結合分子可用可偵測標記物(諸如,放射性同位素、螢光化合物、生物發光化合物、化學發光化合物、金屬螯合劑或酶)進行標記。套組中可包括用於進行結合檢定之其他試劑,諸如ELISA。
在一些實施例中,套組包含用於對至少兩個、至少三個、至少五個、至少十個或更多個標記物基因分型之試劑。標記物可為聚核苷酸標記物(諸如癌症相關突變或SNP)或多肽標記物(諸如蛋白質之過度表現或轉譯後修飾,包括高磷酸化或低磷酸化)或其任何組合。在一些實施例中,套組可進一步包含表面或基板(諸如微陣列)以用於捕獲用於偵測經擴增核酸之探針。
套組可進一步包含經分區之載體工具,以緊密限制容納一或多個容器工具,諸如小瓶、管及其類似物,容器工具中之各者包含用於該方法之獨立元件中之一者。舉例而言,容器工具中之一者可包含經可偵測地標記或可經可偵測地標記之探針。該探針可為對生物標記物具有特異性之聚核苷酸。套組亦可具有含有用於擴增靶核酸序列之核苷酸的容器及/或包含與報導基因分子結合之報導基因工具(諸如酶、螢光或放射性同位素標記)的容器。
套組通常包含上文所述之容器及一種或多種包含自商業及使用者觀點來看合乎需要之材料的其他容器,該等材料包括緩衝液、稀釋劑、過濾器、針、注射器及具有使用說明書之藥品說明書(package insert)。容器上可存在標籤以指示組合物係用於特定療法或非治療性應用,且亦可指示用於活體內或活體外用途(諸如上文所述之彼等)之說明。
套組可進一步包含一組用於製備組織或細胞或體液樣品及自樣品製備核酸(諸如ctDNA)之說明書及材料。
D. 用於評估個體之癌症或贅瘤之方法
在再一態樣中,本文提供一種用於評估個體之癌症或贅瘤之方法,該方法包含:a)提供來自個體之樣品,其含有至少兩種該個體之靶聚核苷酸,該至少兩種靶聚核苷酸具有表1中所列之標靶1至標靶1849中之至少兩者之聚核苷酸序列或其互補或實質上互補序列;b)評估該至少兩種靶聚核苷酸之甲基化狀態;及c)基於該至少兩種靶聚核苷酸之甲基化狀態之評估,評估該個體之癌症或贅瘤。
本發明方法可對任何適合之樣品使用,例如獲自或來源於待評估其癌症或贅瘤狀態之個體的任何適合之樣品。舉例而言,樣品可包含循環無細胞DNA或腫瘤DNA (ctDNA)。在另一實例中,樣品可為血液、血清、血漿或體液樣品或其任何組合。
靶或模板聚核苷酸可為靶DNA分子、RNA分子或錯合物或其組合。DNA可包括常規基因組DNA、染色體DNA、染色體外DNA (諸如粒線體DNA)或其片段。在其他實施例中,靶DNA或模板DNA為經處理DNA,例如已經歷酶消化、交聯、化學或物理剪切、亞硫酸氫鹽轉化及/或降解之DNA。
在一些實施例中,本文揭示之所關注之靶核酸分子為不含細胞之DNA,諸如不含細胞之胎兒DNA (亦稱為「cfDNA」)或ctDNA。cfDNA在懷孕的母親之體內,諸如在血液中循環,且表示胎兒基因組,而ctDNA在癌症患者之體內,諸如在血液中循環,且一般經預片段化。在其他實施例中,本文揭示之所關注之靶核酸分子為古老及/或受損DNA,例如,由於在損害條件(諸如在福馬林固定之樣品或部分消化的樣品中)下儲存。
隨著癌細胞死亡,其將DNA釋放至血流中。稱為循環腫瘤DNA (ctDNA)之此DNA經高度片段化,平均長度為大約150個鹼基對。一旦移除白血細胞,ctDNA一般包含極小部分的剩餘血漿DNA,例如,ctDNA可構成低於約10%之血漿DNA。一般而言,此百分比低於約1%,例如低於約0.5%或低於約0.01%。另外,血漿DNA之總量一般非常低,例如為血漿之約10 ng/mL。
可使用各種方法(包括下一代定序)來查詢ctDNA中之變異體。由於ctDNA與血漿DNA之比率低,由於PCR及定序誤差難以稱變異體具有高可信度。獨特分子標識符(unique molecular identifier,UMI)可用於標記原始分子,以使得可見任何變異體可與共同序列進行比較。此為將真陽性與偽陽性區分開的有效方式。若變異體與共同序列匹配,則其為真陽性。否則,將其自分析中移除。此外,必須將高百分比之原始分子變為定序庫,以使得敏感度保持高水平,亦即變異體不由於丟棄而遺漏。因此,在庫建構期間接合效率可為重要的。
在一個態樣中,如2017年4月19日申請之美國臨時申請案第62/487,423號中所揭示及/或所主張之用於提高接合效率同時仍靶向基因組之選定區域之技術可用於製備打算在本發明方法中分析之靶聚核苷酸。在一個實施例中,首先使由定序偵測之聚核苷酸(諸如ctDNA)去磷酸化以移除5'磷酸酯,從而防止ctDNA與其自身接合。隨後使ctDNA變性以使得所有DNA為單股的。單股DNA接合酶Circligase™用於使銜接子與ctDNA之3'端接合。在一個態樣中,銜接子在5'端上含有2個特異性鹼基以使接合效率最佳化,隨後為UMI。在一個態樣中,銜接子之3'端含有碳間隔基以防止銜接子自接合。在另一態樣中,接合反應使用諸如PEG 4000之擁擠劑進一步最佳化。在一個態樣中,在接合之後,使用與銜接子反向互補之引子使分子成為雙股的。此允許在未藉由標準純化移除的可用DNA之情況下有效地移除過量未接合之銜接子。
在一個態樣中,隨後使用半靶向PCR擴增DNA。一個引子與銜接子反向互補,而另一個(例如,作為引子池中之一個引子)與基因組之特異性靶向區域黏接。特異性引子經設計以使引子-二聚體相互作用及脫靶黏接降至最低。在一個態樣中,由於小DNA尺寸,靶特異性引子經進一步最佳化以緊靠著特異性變異體。在另一清除之後,PCR添加全長定序銜接子及條形碼。隨後例如在Illumina機器上定序最終庫。
在一個態樣中,儘管具有約30,000 bp之相對較小標靶區域,但半靶向PCR使得富集>約40,000倍之原始分子組。在一個態樣中,本發明方法之總轉化率為至少60%,意指至少約3倍以上之原始分子在與標準庫建構及雜交捕獲進行比較時轉化為可定序材料。在其他實施例中,總轉化率在約60%與約70%之間、在約70%與約80%之間、在約80%與約90%之間或超過90%。在其他態樣中,遺傳或基因組變異體之對偶基因分數為約0.05%、約0.1%、約0.5%、約1%或約2%。
本發明方法可用於評估任何適合個體之癌症或贅瘤。舉例而言,本發明方法可用於評估哺乳動物之癌症或贅瘤。哺乳動物可為非人類哺乳動物,例如寵物、農耕動物、伴侶動物或實驗動物。哺乳動物較佳為人類。舉例而言,個體可為需要針對癌症或贅瘤風險進行篩選之人類、高風險組之人類、已診斷為患有癌症或贅瘤但需要進一步分級之人類、已診斷為患有癌症或贅瘤且處於活性治療之下之人類或患有癌症或贅瘤及處於緩解中之人類。
本發明方法可包含評估任何適合數目個表1中所列之標靶之甲基化狀態。舉例而言,該等方法可包含評估至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個或數值範圍或其子範圍的經分離之聚核苷酸或與表1中所列之標靶1至標靶1849中之全部對應的經分離之聚核苷酸。
可使用任何適合之方法或試劑評估靶聚核苷酸之甲基化狀態。舉例而言,可使用經組態以與靶聚核苷酸中之各者雜交之探針或引子評估靶聚核苷酸之甲基化狀態。在一些實施例中,可使用經組態以與靶聚核苷酸雜交之單個探針或引子評估靶聚核苷酸之甲基化狀態。在其他實施例中,可使用經組態以與靶聚核苷酸雜交之多個探針或引子評估靶聚核苷酸之甲基化狀態。
在一些實施例中,本發明方法中所用之一或多個引子可包含以下、基本上由以下組成或由以下組成:表1中所列之SEQ ID NO: 1-17504中之任一者中所闡述之序列、其互補或實質上互補序列或其任何組合。對於表1中所列之各標靶,本發明方法中所用之一或多個引子可包含以下、基本上由以下組成或由以下組成:該標靶之一或多個對應引子。舉例而言,對於表1中所列之標靶1,本發明方法中所用之一或多個引子可包含以下、基本上由以下組成或由以下組成:表1中所列之SEQ ID NO: 1-10中所闡述之序列中之任一者,例如1、2、3、4、5、6、7、8、9或10個包含以下、基本上由以下組成或由以下組成之引子:SEQ ID NO: 1-10中所闡述之序列、其互補或實質上互補序列或其任何組合。類似地,對於表1中所列之標靶2,本發明方法中所用之一或多個引子可包含以下、基本上由以下組成或由以下組成:表1中所列之SEQ ID NO: 11-20中所闡述之序列中之任一者,例如1、2、3、4、5、6、7、8、9或10個包含以下、基本上由以下組成或由以下組成之引子:SEQ ID NO: 11-20中所闡述之序列、其互補或實質上互補序列或其任何組合。如針對上表1中所列之標靶1或2所說明,對於表1中所列之標靶3-1849中之任一者,本發明方法中所用之一或多個引子可包含以下、基本上由以下組成或由以下組成:表1中所列之對應序列中之任一者、其互補或實質上互補序列或其任何組合。
本發明方法可進一步包含使用常用引子以擴增待評估其甲基化狀態之靶聚核苷酸中之各者。例示性常用引子可包含以下、基本上由以下組成或由以下組成:SEQ ID NO:17505 CACTCTTTCCCTACACGACGC)中所闡述之序列或其互補或實質上互補序列。
本發明方法可進一步包含任何其他適合步驟。在一些實施例中,本發明方法可進一步包含2017年4月19日申請之美國臨時申請案第62/487,422號及2017年4月19日申請之美國臨時申請案第62/487,423號中所揭示及/或所主張之任何其他適合步驟。舉例而言,2017年4月19日申請之美國臨時申請案第62/487,423號中所揭示及/或所主張之用於建構單股聚核苷酸、將單股聚核苷酸庫轉化為雙股聚核苷酸庫、半靶向擴增雙股聚核苷酸庫及建構序列庫以及分析定序讀數的技術及步驟可用於獲得及/或製備待分析之靶聚核苷酸。
舉例而言,本發明方法可進一步包含將靶聚核苷酸與樣品分離。
在另一實例中,本發明方法可進一步包含製備靶聚核苷酸之庫。可使用用於製備標靶之庫之任何適合試劑。在一些實施例中,用於製備標靶之庫之試劑可包含酶,例如接合酶或單股DNA (ssDNA)接合酶。可包括任何適合ssDNA接合酶,例如棲熱菌噬菌體RNA接合酶,諸如噬菌體TS2126 RNA接合酶(例如,CircLigase™及CircLigase II™),或古細菌RNA接合酶,諸如嗜熱自養甲烷桿菌RNA接合酶1。
在再一實例中,本發明方法可進一步包含擴增靶聚核苷酸。可使用用於擴增標靶或標靶之庫之任何適合試劑。在一些實施例中,用於擴增標靶或標靶之庫之試劑可包含酶,例如打算用於聚核苷酸擴增反應中之酶。例示性聚核苷酸擴增反應包括聚合酶鏈反應(PCR)、股置換擴增(SDA)、轉錄介導擴增(TMA)、接合酶鏈反應(LCR)、基於核酸序列之擴增(NASBA)、引子延伸、滾環擴增(RCA)、自持續序列複製(3SR)及環介導等溫擴增(LAMP)。
在又一實例中,本發明方法可進一步包含純化靶聚核苷酸、靶聚核苷酸之庫、經擴增靶聚核苷酸或經擴增靶聚核苷酸之庫。
可使用任何適合之方法及/或試劑評估靶聚核苷酸之甲基化狀態。在一些實施例中,可使用以下評估靶聚核苷酸之甲基化狀態:質譜法、甲基化特異性PCR (MSP)、甲基化敏感性定序(例如亞硫酸氫鹽定序)、藉由接合介導PCR檢定(HELP檢定)、Glal水解及接合銜接子相關PCR檢定(GLAD-PCR檢定)之HpaII微小片段增濃、限制性標誌基因組掃描(RLGS)、甲基化DNA免疫沈澱(MeDIP或mDIP)、焦磷酸定序、針對DNA腺嘌呤甲基轉移酶活性之分子斷裂光檢定、甲基敏感性南方墨點法或高解析度熔融(HRM)分析。
在其他實施例中,可使用化學劑例如亞硫酸氫鹽或亞硫酸氫鈉)評估靶聚核苷酸之甲基化狀態。在再其他實施例中,可使用生物劑(例如多肽或酶)評估靶聚核苷酸之甲基化狀態。
可使用任何適合酶。在一些實施例中,酶可為甲基化敏感性限制酶(MSRE)。MSRE可在其未經甲基化時在殘基上選擇性裂解。MSRE亦可在其經甲基化時在殘基上選擇性裂解。例示性MSRE可選自由以下組成之群:Hpa
II、Sal
I、Sal
I-HF®
、ScrF
I、Bbe
I、Not
I、Sma
I、Xma
I、Mbo
I、BstB
I、Cla
I、Mlu
I、Nae
I、Nar
I、Pvu
I、Sac
II、Hha
I及其組合。
在一些實施例中,酶可為聚核苷酸聚合酶。聚核苷酸聚合酶可用於聚核苷酸擴增反應,例如PCR。可使用任何適合聚核苷酸聚合酶。舉例而言,聚核苷酸聚合酶可為DNA聚合酶,例如無3'至5'外切核酸酶活性之DNA聚合酶。
在一些實施例中,可使用甲基化敏感性定序(例如亞硫酸氫鹽定序)評估靶聚核苷酸之甲基化狀態。亞硫酸氫鹽轉化為使用亞硫酸氫鹽測定DNA之甲基化模式之方法。DNA甲基化為涉及將甲基添加至胞嘧啶或腺嘌呤DNA核苷酸之生物化學過程。DNA甲基化隨著細胞分裂且自胚胎幹細胞分化成特定組織穩定地改變細胞中基因之表現。在亞硫酸氫鹽轉化中,靶核酸首先用將未甲基化胞嘧啶特異性轉化為尿嘧啶同時不影響甲基化胞嘧啶之亞硫酸氫鹽試劑處理。亞硫酸氫鹽轉化之一個結果為由於序列互補缺失而破壞原始標靶之雙股構形。在樣品製備及分析或診斷測試期間,靶序列以兩個獨立單股DNA之形式存在。靶核酸序列常常亦以非常低的濃度存在。由於其在循環中通常低的濃度及極低的變異體對偶基因分率,此為循環腫瘤DNA (亦稱為「不含細胞之腫瘤DNA」或「ctDNA」)之尤其重要的考慮因素。
可使用任何適合型式之甲基化敏感性定序。舉例而言,甲基化敏感性定序可用選自由以下組成之群之型式進行:Maxam-Gilbert定序、鏈封端方法、鳥槍定序、橋式PCR、單分子即時定序、離子半導體(ion torrent定序)、藉由合成定序、藉由接合定序(SOLiD定序)、鏈封端(Sanger定序)、大規模平行簽名定序(MPSS)、聚合酶選殖定序、454焦磷酸定序、Illumina (Solexa)定序、DNA奈米球定序、heliscope單分子定序、單分子即時(SMRT)定序、奈米孔DNA定序、穿隧電流DNA定序、藉由雜交定序、藉由質譜定序、微流體Sanger定序、基於顯微法之技術、RNAP定序及活體外病毒高通量定序。
在一些實施例中,本發明方法可進一步包含在例如甲基化敏感性定序(例如亞硫酸氫鹽定序)之前,獲得線性單股接合產物之庫,線性單股接合產物中之各者包括連接至銜接子之線性單股靶聚核苷酸,該銜接子包含獨特分子標識符(UMI)序列,其標記與銜接子接合之單股靶聚核苷酸。來自靶聚核苷酸之定序讀數可首先經銜接子修整以移除起源於庫建構過程之任何銜接子序列,從而獲得經修整定序讀數。可使用比對程式將經修整定序讀數映射至參考基因組,例如人類參考基因組,以獲得比對讀數檔案。可將比對讀數檔案分組為對應於來自表1中所列之標靶1至標靶1849之各標靶區域或其互補或實質上互補序列的組,其可用於甲基化狀態評估。
可評估靶聚核苷酸中之一者、多者或各者之甲基化狀態。在一些實施例中,可評估靶聚核苷酸中之各者之甲基化狀態例如以平均甲基化頻率、甲基化單倍型負荷、未甲基化單倍型負荷、不一致讀數百分比或其組合之形式獲得甲基化量度。
可使用來自靶聚核苷酸中之各者之甲基化量度評估樣品之甲基化狀態。可以任何適合之方式分析或使用甲基化量度。舉例而言,靶聚核苷酸中之各者之甲基化量度可與臨限值或參考值進行比較以評估樣品之甲基化狀態。
在另一實例中,數值甲基化矩陣可使用來自靶聚核苷酸中之各者之甲基化量度進行運算以評估樣品之甲基化狀態。數值甲基化矩陣可呈任何適合之型式。在一些實施例中,來自樣品之數值甲基化矩陣可包含單個數值或值。在其他實施例中,來自樣品之數值甲基化矩陣可包含多個數值或值。可使用任何適合之公式或演算法獲得或運算數值甲基化矩陣。在一些實施例中,數值甲基化矩陣可使用分類演算法進行運算,例如線性判別分析、邏輯回歸、單純貝氏分類、感知器分類、二次分類、k最近相鄰法、提昇方法、決策樹、隨機森林、神經網路、學習向量量化或支持向量機或其組合。
在評估樣品之甲基化狀態中可以任何適合之方式使用甲基化矩陣。舉例而言,甲基化矩陣可與臨限值或參考值進行比較以評估樣品之甲基化狀態。
可依序或同步評估來自多個樣品(例如來自多個個體之多個樣品)之至少兩種靶聚核苷酸之甲基化狀態。在一些實施例中,可依序評估來自多個樣品(例如來自多個個體之多個樣品)之至少兩種靶聚核苷酸之甲基化狀態。舉例而言,可依序評估至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個或數值範圍或其子範圍的經分離之聚核苷酸或與表1中所列之標靶1至標靶1849中之全部對應的經分離之聚核苷酸之甲基化狀態。在其他實施例中,可同步評估來自多個樣品(例如來自多個個體之多個樣品)之至少兩種靶聚核苷酸之甲基化狀態。舉例而言,可同步評估至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個或數值範圍或其子範圍的經分離之聚核苷酸或與表1中所列之標靶1至標靶1849中之全部對應的經分離之聚核苷酸之甲基化狀態。
在一些實施例中,使用電腦獲得靶聚核苷酸中之各者之甲基化量度。在其他實施例中,基於來自靶聚核苷酸中之各者之甲基化量度,使用電腦獲得樣品之甲基化矩陣。
可出於任何適合之目的使用本發明方法。舉例而言,本發明方法可用於個體之癌症或贅瘤之診斷、預後、分級、風險評估或治療監測。
本發明方法可用於評估任何適合類型之個體之癌症或贅瘤。舉例而言,本發明方法可用於評估個體之淋巴瘤、白血病、腦癌、多發性骨髓瘤、胰臟癌、肝癌、胃癌、乳癌、腎癌、肺癌、結直腸癌、結腸癌、前列腺癌、卵巢癌、子宮頸癌、皮膚癌、食道癌或頭頸癌。
在一些實施例中,本發明方法可用於個體之肺癌之診斷、預後、分級、風險評估或治療監測。肺癌可為非小細胞肺癌或小細胞肺癌。例示性非小細胞肺癌可為肺之腺癌(亦稱為肺部腺癌)、肺之鱗狀細胞癌(SCC)或大細胞癌(LCC)。
在其他實施例中,本發明方法可用於個體之結直腸癌之診斷、預後、分級、風險評估或治療監測。在再其他實施例中,本發明方法可用於個體之泛癌分析或剖析之診斷、預後、分級、風險評估或治療監測。
可依序同步同步評估多個個體之癌症或贅瘤。在一些實施例中,可依序評估多個個體之癌症或贅瘤。舉例而言,可依序評估至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、1,900、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000個或更多個個體之癌症或贅瘤。在其他實施例中,可同步評估多個個體之癌症或贅瘤。舉例而言,可同步評估至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、1,900、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000個或更多個個體之癌症或贅瘤。
本發明測試可具有任何適合之敏感度。舉例而言,本發明測試之敏感度可為至少10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%、99.999%、99.9999%或100%。
本發明測試可具有任何適合之特異度。舉例而言,本發明測試之特異度可為至少10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%、99.999%、99.9999%或100%。
本發明方法可進一步包含基於個體之癌症或贅瘤之評估治療個體或改變個體之治療。舉例而言,本發明方法可進一步包含基於人類患者之癌症或贅瘤之評估治療人類患者或改變人類患者之治療。例示性治療可為化學療法、放射線療法、免疫療法、細胞療法、手術、用藥物(例如小分子藥物或大分子藥物,諸如抗體藥物)進行之治療。
本發明方法可進一步包含基於個體之癌症或贅瘤之評估,使個體進行其他測試,例如黃金標準診斷或預後測試。舉例而言,本發明方法可進一步包含基於人類患者之癌症或贅瘤之評估,使人類患者進行其他測試,例如黃金標準診斷或預後測試。例示性測試可為任何適合類型之測試,例如活體內測試、活體外測試、對分子(諸如DNA、RNA、蛋白質、肽、錯合物或其組合)之測試、免疫測試、分子測試、細胞測試、組織測試、器官測試或全身測試等。
E. 例示性資料分析方法 預處理
在一些實施例中,定序讀數首先使用諸如Cutadapt (http://journal.embnet.org/index.php/embnetjournal/article/view/200/479)或Trimmomatic (https://www.ncbi.nlm.nih.gov/pubmed/24695404)之修整程式經銜接子修整(以移除起源於定序庫建構過程之任何合成銜接子序列)。隨後使用諸如Bowtie (http://bowtie-bio.sourceforge.net/index.shtml)、Bowtie2 (http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)或BWA (http://bio-bwa.sourceforge.net)之比對程式將經修整讀數映射至人類參考基因組。隨後使用例如Samtools (https://github.com/samtools/samtools)之適合工具分選及索引所得比對讀數檔案。隨後將讀數分組為對應於可用於甲基化量度運算之各標靶區域之組。
甲基化量度運算
在一些實施例中,對於各標靶,使用比對讀數運算表示個別區域之甲基化狀態之「甲基化量度」。可使用之四個量度為平均甲基化頻率(AMF)、甲基化單倍型負荷(MHL)、未甲基化單倍型負荷(UMHL)及不一致讀數百分比(PDR)。
平均甲基化頻率藉由對標靶區域內之CpG位點處所觀測到之胞嘧啶鹼基之數目求和且除以標靶區域內之CpG位點處所觀測到之胞嘧啶及胸嘧啶鹼基之數目來運算:
其中N
為標靶區域內之讀數之數目,i
為標靶區域中之第i
個讀數,Ci
為在第i
個讀數中所觀測到之胞嘧啶之數目,且Ti
為在第i
個讀數中所觀測到之胸嘧啶之數目。
甲基化單倍型負荷藉由取標靶區域內之相鄰CpG位點之所有可能子串且計算展示各子串內之完全甲基化之讀數之分數的加權和來運算:
其中n
為標靶區域內之CpG位點之數目,Li
為當前子串之長度,Ci
為在長度Li
之子串內之CpG位點處含有所有胞嘧啶的讀數之數目,且Ni
為含有長度Li
之子串的讀數之數目。
未甲基化單倍型負荷藉由取標靶區域內之相鄰CpG位點之所有可能子串且計算展示各子串內之無甲基化之讀數之分數的加權和來運算:
其中n
為標靶區域內之CpG位點之數目,Li
為當前子串之長度,Ti
為在長度Li
之子串內之CpG位點處含有所有胸嘧啶的讀數之數目,且Ni
為含有長度Li
之子串的讀數之數目。
不一致讀數百分比藉由取一百減在標靶區域內之CpG位點處展示所有胞嘧啶或所有胸嘧啶之各區域內之讀數之百分比來運算:
其中Ni
為標靶區域內之讀數之數目,Ci
為在完全覆蓋之CpG位點處含有胞嘧啶之讀數之數目,且Ti
為在完全覆蓋之CpG位點處含有胸嘧啶之讀數之數目。
分類
在一些實施例中,使用各標靶區域之甲基化量度,(用各標靶區域之一列、各樣品之一行及表示該區域及樣品之甲基化量度)運算數值矩陣。樣品隨後使用分類演算法進行分類,諸如線性判別分析、邏輯回歸、單純貝氏分類、感知器分類、二次分類、k最近相鄰法、提昇方法、決策樹、隨機森林、神經網路、學習向量量化或支持向量機或其組合。
邏輯回歸、k最近相鄰法、隨機森林或支持向量機。
邏輯回歸分類涉及使用一組已知樣品將呈癌性之樣品之機率之方程式與甲基化量度值之加權和曲線擬合。對來自已知類別之樣品之資料使用最小二乘回歸,估計用於以下方程式之參數:
其中n
為標靶區域之集合,i
為當前標靶區域,Mi
為第i
個標靶區域之甲基化量度值,ß i
為第i
個標靶區域之最小二乘參數,且p
為樣品為癌症樣品之機率。一旦使用已知樣品導出此方程式之參數,則藉由運算甲基化量度值之加權和、使用所推導出的方程式運算機率且與臨限值進行比較,可將未知樣品分類為癌症或健康。
K最近相鄰演算法使用未知樣品及其k
最近相鄰者與已知類別之間之甲基化量度值之距離對未知樣品進行分類。首先,運算當前樣品與所有其他樣品之甲基化量度值之間之距離(在此情況下為歐幾里得距離(Euclidean distance)):
其中N
為已知樣品之集合,i
為當前已知樣品,n
為標靶區域之集合,j
為當前標靶區域,Mj
為第j
個標靶區域中之未知樣品之甲基化量度值,mij
為第j
個標靶區域中之第i
個已知樣品之甲基化量度值,且Ei
為當前樣品與第i
個已知樣品之間之歐幾里得距離。具有最低歐幾里得距離之k
個已知樣品之類別用於確定未知樣品之類別;將具有最高出現率之類別分配給未知樣品。
在K最近相鄰法中,藉由鑑別k
個最類似(其中k
為任何數目個吾等選擇)之已知樣品將未知樣品分類為正常或癌症。若未知樣品更類似於已知正常樣品,則吾等將其分類為正常;若其更類似於癌症樣品,則吾等將其分類為癌症。以下為說明可如何進行K最近相鄰法分析之假設實例。
假設吾等觀察2個標靶區域且使用MHL甲基化量度以用於吾等檢定,且吾等想要使用k
= 3之K最近相鄰法。吾等將首先運行一些吾等知道為健康的樣品及一些吾等知道為癌症的樣品,且運算各樣品中之各標靶之MHL值。假設吾等運行4個各類型之已知樣品,且獲得下表2中所示之矩陣。
表2
隨後吾等可處理未知樣品。假設吾等運行未知樣品,且獲得下表3中所示之值。
表3
基於吾等觀測到之值,吾等鑑別最類似於下表4中所示之吾等未知樣品的k
=3樣品。
表4
由於此等3個最近相鄰者中之大部分為癌症,吾等將未知樣品分類為癌症。
隨機森林分類涉及使用隨機所選子組之已知類別之樣品及子組標靶區域形成多個決策樹;未知樣品之甲基化量度值隨後經歷各個個別決策樹,且多數議決用於分類。舉例而言,使用已知資料,可建構以下三個決策樹:
隨後將含有MHL值(MHL1
:0.6,MHL2
:0.2,MHL3
:0.6)之未知樣品分類為癌症,此係因為其將具有兩個議決用於癌症且一個議決用於健康。
支持向量機在不同類別之已知樣品之間建構超平面,這使各已知樣品與超平面之間之距離達至最大。此平面隨後用作「隔板」以對未知樣品進行分類,其中落在平面之不同側上之樣品經不同地分類。為說明使用2個標靶區域之實例,在空間中標繪已知樣品之甲基化量度值,且在不同基團之間繪製超平面(參見圖1),其中X1
為第一標靶區域之甲基化量度值,X2
為第二標靶區域之甲基化量度值,已知癌症樣品以黑色繪製,已知健康樣品以白色繪製,且黑線表示超平面。為對未知樣品(以橙色展示)進行分類,將甲基化量度值與超平面進行比較;若樣品屬於與健康已知樣品相同的側(如其在本文中所展示),則將樣品分類為健康。圖1之影像僅出於說明之目的取自維基百科:https://en.wikipedia.org/wiki/Support_vector_machine)且不表示任何DNA甲基化狀態分析或癌症評估。
F. 藉由庫建構及聚核苷酸定序之例示性聚核苷酸片段分析
在一個態樣中,本發明方法之靶(或模板)聚核苷酸為片段化聚核苷酸,例如介於約100個殘基至約1000個殘基範圍內,且在一些實施例中,介於約150個殘基至約400個殘基範圍內。
靶DNA或模板DNA可包括常規基因組DNA、染色體DNA、染色體外DNA(諸如粒線體DNA)或其片段。在其他實施例中,靶DNA或模板DNA為經處理DNA,例如已經歷酶消化、交聯、化學或物理剪切、亞硫酸氫鹽轉化及/或降解之DNA。
亞硫酸氫鹽轉化為使用亞硫酸氫鹽測定DNA之甲基化模式之方法。DNA甲基化為涉及將甲基添加至胞嘧啶或腺嘌呤DNA核苷酸之生物化學過程。DNA甲基化隨著細胞分裂且自胚胎幹細胞分化成特定組織穩定地改變細胞中基因之表現。在亞硫酸氫鹽轉化中,靶核酸首先用將未甲基化胞嘧啶特異性轉化為尿嘧啶同時不影響甲基化胞嘧啶之亞硫酸氫鹽試劑處理。亞硫酸氫鹽轉化之一個結果為由於序列互補缺失而破壞原始標靶之雙股構形。在樣品製備及分析或診斷測試期間,靶序列以兩個獨立單股DNA之形式存在。靶核酸序列常常亦以非常低的濃度存在。由於其在循環中通常低的濃度及極低的變異體對偶基因分率,此為循環腫瘤DNA (亦稱為「不含細胞之腫瘤DNA」或「ctDNA」)之尤其重要的考慮因素。
在一些實施例中,本文揭示之所關注之核酸分子為不含細胞之DNA,諸如不含細胞之胎兒DNA (亦稱為「cfDNA」)或ctDNA。cfDNA在懷孕的母親之體內,諸如在血液中循環,且表示胎兒基因組,而ctDNA在癌症患者之體內,諸如在血液中循環,且一般經預片段化。在其他實施例中,本文揭示之所關注之核酸分子為古老及/或受損DNA,例如,由於在損害條件(諸如在福馬林固定之樣品或部分消化的樣品中)下儲存。
隨著癌細胞死亡,其將DNA釋放至血流中。稱為循環腫瘤DNA (ctDNA)之此DNA經高度片段化,平均長度為大約150個鹼基對。一旦移除白血細胞,ctDNA一般包含極小部分的剩餘血漿DNA,例如,ctDNA可構成低於約10%之血漿DNA。一般而言,此百分比低於約1%,例如低於約0.5%或低於約0.01%。另外,血漿DNA之總量一般非常低,例如為血漿之約10 ng/mL。
可使用各種方法(包括下一代定序)來查詢ctDNA中之變異體。由於ctDNA與血漿DNA之比率低,由於PCR及定序誤差難以稱變異體具有高可信度。獨特分子標識符(UMI)通常用於標記原始分子,以使得可見任何變異體可與共同序列進行比較。此為將真陽性與偽陽性區分開的有效方式。若變異體與共同序列匹配,則其為真陽性。否則,將其自分析中移除。此外,必須將高百分比之原始分子變為定序庫,以使得敏感度保持高水平,亦即變異體不由於丟棄而遺漏。因此,在庫建構期間接合效率極其重要。
在一個態樣中,本文提供用於大大提高接合效率同時仍靶向基因組之選定區域之技術。在一個實施例中,首先使由定序偵測之聚核苷酸(諸如ctDNA)去磷酸化以移除5'磷酸酯,從而防止ctDNA與其自身接合。隨後使ctDNA變性以使得所有DNA為單股的。單股DNA接合酶Circligase™用於使銜接子與ctDNA之3'端接合。在一個態樣中,銜接子在5'端上含有2個特異性鹼基以使接合效率最佳化,隨後為UMI。在一個態樣中,銜接子之3'端含有碳間隔基以防止銜接子自接合。在另一態樣中,接合反應使用諸如PEG 4000之擁擠劑進一步最佳化。在一個態樣中,在接合之後,使用與銜接子反向互補之引子使分子成為雙股的。此允許在未藉由標準純化移除的可用DNA之情況下有效地移除過量未接合之銜接子。
在一個態樣中,隨後使用半靶向PCR擴增DNA。一個引子與銜接子反向互補,而另一個(例如,作為引子池中之一個引子)與基因組之特異性靶向區域黏接。特異性引子經設計以使引子-二聚體相互作用及脫靶黏接降至最低。在一個態樣中,由於小DNA尺寸,靶特異性引子經進一步最佳化以緊靠著特異性變異體。在另一清除之後,PCR添加全長定序銜接子及條形碼。隨後例如在Illumina機器上定序最終庫。
在一個態樣中,儘管具有約30,000 bp之相對較小標靶區域,但半靶向PCR使得富集>約40,000倍之原始分子組。在一個態樣中,本發明方法之總轉化率為至少60%,意指至少約3倍以上之原始分子在與標準庫建構及雜交捕獲進行比較時轉化為可定序材料。在其他實施例中,總轉化率在約60%與約70%之間、在約70%與約80%之間、在約80%與約90%之間或超過90%。在一個態樣中,本發明方法因此能夠精確稱為遺傳或基因組變異體,諸如SNV、插入缺失、CNV及以極低突變型對偶基因分數,例如低至0.01%融合。在其他態樣中,遺傳或基因組變異體之對偶基因分數為約0.05%、約0.1%、約0.5%、約1%或約2%。
以下章節更詳細地描述本發明方法之某些步驟。單股聚核苷酸庫及建構其之方法
用於例如ctDNA之下一代定序的庫建構一般由若干步驟組成,包括末端修復、A-拖尾及銜接子分子之雙股接合。此等接合分子可隨後在某些基因組區域使用雜交捕獲富集1000-2000倍。儘管在過去若干年內在庫建構方面有若干改進,但該方法仍保持低效,從而導致許多原始分子在各種步驟期間損失。雙股接合效率仍較低,其中約20%-30%之分子經適當接合。另外,許多分子在純化及雜交捕獲步驟期間損失,使得最終轉化率接近10-20%。當詢問ctDNA中發現之低對偶基因部分變異體時,敏感度仍較低。此在稱為低對偶基因部分突變體時限制精確度,因為在觀察具有低對偶基因部分之庫時,低效率將導致靈敏度損失。
另外,諸如ctDNA之某些聚核苷酸之小尺寸防止使用基於標記之庫建構。舉例而言,聚核苷酸首先(例如用生物素)標記以產生靶向庫,且隨後藉由捕獲標記(例如藉由抗生蛋白鏈菌素)富集。以此方式,相關區域之庫富集約1000-2000倍。最終,進行PCR以擴增及索引用於定序之分子。然而,基於PCR之方法證明難以將UMI添加至初始分子且導致高錯誤率。
在一個態樣中,本文所述之組合物、套組及方法解決以上問題。在一些實施例中,組合物、套組及方法適用於對核酸分子進行定序,包括但不限於各種庫之建構、各種擴增反應(諸如藉由PCR及/或引子延伸)、建構庫之純化及定序讀數之分析。
在某些態樣中,定序庫可例如自含有片段化聚核苷酸(諸如片段DNA)之樣品製備。在一個態樣中,樣品獲自天然存在之樣品,例如直接來自個體,諸如組織流體或體液,包括但不限於血液、血漿、血清、腦脊髓液、滑液、尿液、汗液、精液、痰、淚液、黏液或羊水。在其他態樣中,可藉由形成DNA片段(例如藉由剪切DNA)及將本文中之銜接子附接至DNA片段來製備定序庫。在特定實施例中,片段化聚核苷酸及銜接子為單股的。
片段(例如,ctDNA或藉由使較長DNA股片段化形成之片段)有時稱為「插入物」,因為其可與諸如本文所揭示之單股銜接子的銜接子相鄰地「插入」或接合。RNA分子亦可例如藉由逆轉錄RNA分子以形成附接至銜接子之DNA分子定序。
在一個態樣中,提供一種包含將一組銜接子接合至單股聚核苷酸之文庫的方法,且在該方法中,該接合由單股DNA (ssDNA)接合酶催化。如本文所用,ssDNA連接酶能夠在不存在互補序列下接合ssDNA之末端。舉例而言,CircLigase™ ssDNA接合酶及CircLigase™ II ssDNA接合酶均為熱穩定的接合酶,其通常用於催化具有5'-磷酸酯基及3'-羥基之ssDNA模板之分子內接合(亦即,環化)。相比於接合在互補DNA序列上彼此鄰接黏接之DNA末端的T4 DNA接合酶及Ampligase®
DNA接合酶,ssDNA接合酶在不存在互補序列之情況下接合ssDNA之末端。因此,酶適用於由線性ssDNA製備圓形ssDNA分子。圓形ssDNA分子可用作滾環複製或滾環轉錄之底物。除了其對ssDNA之活性以外,CircLigase酶亦具有將具有接合3'-羥基核糖核苷酸及5'-磷酸化核糖核苷酸或脫氧核糖核苷酸之單股核酸之活性。
可在本發明中使用CircLigase™ ssDNA接合酶或CircLigase™ II ssDNA接合酶。兩種酶為不同的,因為CircLigase I比CircLigase II的腺苷酸化低得多且需要ATP來實現最佳活性。CircLigase I在ATP存在下重新環化ssDNA。CircLigase II幾乎100%腺苷酸化,因此不必將ATP添加至反應緩衝液。CircLigase II充當化學計算量反應,其中酶結合在酶活性位點中經腺苷酸化之寡核苷酸之5'-端,且隨後接合寡核苷酸且停止。因為反應不含有ATP,所以CircLigase II在1:1之酶:寡核苷酸組態中起作用。一旦環化完成,圓形ssDNA自活性位點釋放且反應停止。
在一個態樣中,各單股聚核苷酸在5'端處經阻斷以防止在5'端處接合,各銜接子包含標記與銜接子接合之單股聚核苷酸之獨特分子標識符(UMI)序列,各銜接子在3'端處經阻斷以防止在3'端處接合,且銜接子5'端與單股聚核苷酸之3'端藉由ssDNA接合酶接合以形成線性接合產物,從而獲得線性單股接合產物之庫。單股DNA之模板獨立環化描述於WO2010/094040 A1中,其揭示內容以全文併入本文中。然而,WO2010/094040 A1僅揭示單股聚核苷酸之分子內接合(例如,環化)。
因此,本發明方法以非習知方式使用ssDNA接合酶,諸如CircLigase或CircLigase II。代替環化,本發明接合方法旨在在單股靶聚核苷酸與銜接子分子之間產生線性接合產物。在一個態樣中,本發明使用ssDNA連接酶來進行分子內接合,例如用於將銜接子與單股聚核苷酸接合。為了進行,在一個態樣中,單股聚核苷酸在5'端處經阻斷以防止環化。以此方式,防止ssDNA之3'端與其自身5'端之分子內接合以及一個ssDNA之3'端與同一庫內另一個ssDNA之5'端之分子間接合。因此,在一個態樣中,在接合反應期間防止單股聚核苷酸之環化及線性串聯體(含有單股聚核苷酸及/或銜接子)之形成。如圖6中所示,各單股聚核苷酸之阻斷可包含在其5'端處去磷酸化以防止在該端處接合。
在另一態樣中,在3'端處阻斷各銜接子以防止在3'端處接合。以此方式,防止銜接子之3'端與其自身5'端之分子內接合以及一個銜接子分子之3'端與另一個銜接子分子之5'端之分子間接合。各轉接器之阻斷可包含碳間隔基、ddCTP、ddATP、ddTTP、ddGTP、己二醇、三乙二醇(TEG)及/或六乙二醇,以防止在其3'端處接合。因此,在一個態樣中,在接合反應期間防止單股銜接子之環化及線性串聯體(含有單股聚核苷酸及/或銜接子)之形成。
銜接子可以任何適合組合包含一或多個間隔基之一或多個複本。舉例而言,Gansauge及Meyer揭示一種包含C3間隔基之十個複本及生物素標記之TEG間隔基之銜接子。Gansauge及Meyer (2013), 「Single-stranded DNA library preparation for the sequencing of ancient or damaged DNA」,Nature Protocols
, 8(4): 737-48,其以全文引用之方式併入本文中. 然而,緊接在接合之後,此參考物需要經由生物素-抗生蛋白鏈菌素相互作用捕獲所接合之ssDNA。此步驟可造成庫中之ssDNA分子之顯著損失。隨後參考物將所捕獲之ssDNA轉化為dsDNA,而ssDNA保持在珠粒上捕獲。
如圖6中所示,本發明不需要在接合之後立即捕獲接合之ssDNA。相反,接合之ssDNA在其轉化為dsDNA時保持處於接合反應體積。
在一個態樣中,庫中之ssDNA之接合效率較高,例如至少約40%、至少約50%、至少約60%、至少約70%、至少約80%、至少約85%、至少約90%、至少約95%或至少約99%之樣品中之單股聚核苷酸與銜接子接合。在特定實施例中,接合效率為約80%。藉由此大大改進之接合效率,如下文所解釋,本發明所主張之方法仍能夠靶向基因組之選定區域。
在一個態樣中,銜接子具有以下結構:/5'Phos/N1
N2
. . .N i
-UMI-M1
M2
. . .M j
-Blocker,其中「5'Phos」表示5'磷酸酯基,「N1
N2
. . .N i
」表示序列5'至UMI序列,「M1
M2
. . .M j
」表示序列3'至UMI序列,且「Blocker」指示阻斷銜接子之3'端以防止與其接合。i
及j
均為整數,其中i
可為1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或大於30;且j
可為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或大於50。在具體實施例中,i
可為2。在一些實施例中,N1
N2
. . .N i
之5'端處之二核苷酸序列N1
N2
可為GA (5'至3')、GG (5'至3')、AA (5'至3')或 AG (5'至3')以增強效率。
在一個態樣中,M1
M2
. . .M j
之一部分或全部在後續步驟中用於設計反向互補序列,其用作將接合單股聚核苷酸轉化為雙股聚核苷酸之引子,及/或用於半靶向PCR以擴增選定靶序列(引子對之另一引子為標靶特異性引子)。在一個態樣中,M1
M2
. . .M j
序列包含AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG (SEQ ID NO:17506)或其一部分,其包含約18與22之間之核苷酸殘基。
在另一態樣中,「Blocker」在一或多個阻斷基團之一或多個複本中在5'至3'方向上以任何適合組合及順序包含碳間隔基、ddCTP、ddATP、ddTTP、ddGTP、己二醇、三乙二醇(TEG)及/或六乙二醇。
在一個態樣中,使用UMI促進測定、選擇及/或分離靶序列之無誤差定序讀數,且可以高精確度及高通量選擇定序讀數。該等經驗證之無誤差定序讀數適用於需要序列保真度之任何技術,包括建構已知序列之較大分子、多形現象及/或突變篩選、大規模平行定序及定量方法以排除方法中之偏差。
在一個態樣中,獨特分子標識符與包含單股靶聚核苷酸及銜接子之經接合建構體相關聯且唯一地鑑別該經接合建構體。換言之,具有相同序列之兩個單股靶聚核苷酸可接合至在其UMI序列處彼此不同之兩個不同銜接子;所得接合產物不同,且各接合產物(而非具有相同序列之靶聚核苷酸)藉由UMI唯一鑑別。在另一態樣中,當單股接合產物轉化為雙股聚核苷酸且擴增時,可在重複複製期間引入擴增誤差,即使可獲得極高保真度聚合酶。因此,甚至低錯誤率可具有顯著影響,尤其在大庫之建構中。儘管大規模平行定序在成本及通量方面具有優勢,但可由擴增及/或偵測技術之限制包含讀數之精確度。
藉由使用UMI,本發明方法能夠鑑別無誤差擴增產物及/或定序讀數,且排除具有來自分析之技術誤差的彼等擴增產物及/或定序讀數。具有相同UMI之擴增產物及/或定序讀數可證實為相關(下降一致),且因此具有相同UMI之分子之間的序列差異可鑑別為技術誤差而非序列中之真實差異(例如,野生型序列與癌症相關突變序列之間的序列差異)。換言之,因為各單股接合產物可由其UMI鑑別為獨特的,所以若未引入技術誤差,則所有其後代(由於擴增及/或定序)應具有相同靶序列。然而,若在擴增及/或定序期間將諸如單核苷酸插入之誤差引入靶序列中,則一些擴增產物及/或定序讀數與下降一致(例如共用相同UMI)將具有插入,而其他擴增產物及/或定序讀數將不插入。具有插入之產物與不具有插入之產物之間的確切比將取決於誤差在擴增及/或定序過程期間發生時而變化。一般而言,當使用極高保真度聚合酶時,無錯誤之產物將占大部分。在另一態樣中,因為可鑑別下降一致之擴增產物及/或定序讀數,所以可使用來自多個分子之資料確定共同序列,從而達成高通量定序之高精確度。
在一個態樣中,UMI為退化核酸序列,且UMI中之核苷酸數目經設計使得由UMI序列表示之潛在及實際序列之數目大於初始庫之靶單股靶聚核苷酸之總數。在一個態樣中,UMI序列多樣性(或關於各單一UMI序列之「獨特性」)可藉由使用藉由在各位置用所有四種鹼基之混合物合成而隨機產生之序列之退化集合來提供。或者,可合成一組不同但預定義之序列且將其接合至初始單股聚核苷酸庫。UMI組之多樣性需要足夠使得下降不相關之分子因此不會經誤認。在一個態樣中,「獨特」分子標識符無需絕對獨特,且可用於不同靶單股聚核苷酸上,其限制條件為其與下降一致之分子不同且不會誤認係顯而易見的。可自核苷酸之隨機總成產生之大量UMI序列提供可唯一地鑑別各個別接合產物之高機率。舉例而言,若UMI包含在各位置處由A、C、G及T之混合物合成之12聚體,則存在412
種可能的序列。若UMI包含在各位置處由A、C、G及T之混合物合成之20聚體,則存在420
(約1012
)種可能的序列。使用該等隨機標識符允許具有單股靶聚核苷酸之大庫可個別地彼此區別。
在特定態樣中,UMI為5聚體、6聚體、7聚體、8聚體、9聚體、10聚體、11聚體、12聚體、13聚體、14聚體、15聚體、16聚體、17聚體、18聚體、19聚體、20聚體、21聚體、22聚體、23聚體、24聚體、25聚體或甚至更長退化序列。在一個態樣中,銜接子具有以下結構:/5'Phos/ GANNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG/ 3SpC3/,其中「NNNNNNNNNNNN」表示12聚體UMI序列,且「3SpC3」表示3'碳間隔基。GANNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG之序列為SEQ ID NO:17507。
DNA濃度可藉由添加諸如鈷六胺之縮合劑及諸如亞精胺之生源多元胺,或藉由使用諸如聚乙二醇(PEG)之擁擠劑而人工增加,該等擁擠劑亦增加酶之有效濃度。在一個態樣中,諸如鈷六胺之添加劑可專門產生分子間反應,產生線性接合產物而非圓形產物。因此,在單股標靶聚核苷酸之5'端及單股銜接子之3'端可不完全阻斷以防止接合之情況下,諸如鈷六胺之添加劑可用於增強分子間反應且進一步防止單股靶聚核苷酸及/或銜接子之環化。
在一些實施例中,接合子之超過一種組態可用於同一接合反應中。舉例而言,可使用銜接子之兩種組態:
第1組態: /5'Phos/N1
N2
. . .N i
-UMI1
-M1
M2
. . .M j
-Blocker1
,及
第2組態: /5'Phos/P1
P2
. . .P k
-UMI2
-Q1
Q2
. . .Q l
-Blocker2
。
N1
N2
. . .N i
及P1
P2
. . .P k
可為相同或不同的,UMI1
及UMI2
可為相同或不同的,M1
M2
. . .M j
及Q1
Q2
. . .Q l
可為相同或不同的,且Blocker1
及Blocker2
可為相同或不同的。在一個實施例中,UMI1
不同於UMI2
(例如,UMI1
為12聚體退化序列,而UMI2
為13聚體退化序列),而銜接子之其他特點相同。在另一實施例中,N1
N2
. . .N i
不同於P1
P2
. . .P k
(例如,一個為AG而另一個為GA),而銜接子之其他特點相同。在又一實施例中,M1
M2
. . .M j
不同於Q1
Q2
. . .Q l
,而銜接子之其他特點相同。在再一實施例中,Blocker1
與Blocker2
不同,而銜接子之其他特點相同。
在接合反應之後,無任何純化需要(例如使接合產物與過量未接合之銜接子分子分離)之單股接合產物可立即經歷轉化為雙股接合產物。另外,單股靶聚核苷酸及銜接子均不需要捕獲在固體載體上(例如藉由生物素-抗生蛋白鏈菌素介導結合至珠粒)以便將接合產物後續轉化為雙股聚核苷酸及/或擴增步驟。因此,本發明方法由於對單股接合產物之純化或分離而避免及/或減少DNA樣品(諸如ctDNA)中之突變之已較小對偶基因片段的缺失。相反,在一個態樣中,單股接合產物保留於針對經歷引子延伸之溶液中。單股聚核苷酸庫轉化為雙股聚核苷酸庫
在如圖6中所示之一個態樣中,建構含有單股接合產物之庫後,該方法可進一步包含將線性單股接合產物之庫轉換為線性雙股接合產物之庫。在一個態樣中,轉化使用引子或一組引子,其各自包含與銜接子反向互補及/或可與銜接子雜交之序列。
對於具有以下結構之銜接子:/5'Phos/N1
N2
. . .N i
-UMI-M1
M2
. . .M j
-Blocker,引子可包含可與M1
M2
. . .M j
反向互補及/或雜交之序列。在此實例中,在引子與具有結構ssDNA-N1
N2
. . .N i
-UMI-M1
M2
. . .M j
-Blocker之接合產物雜交時,引子延長反應可將ssDNA-N1
N2
. . .N i
-UMI序列(且視情況,M1
M2
. . .M j
之全部或一部分)轉化為雙股聚核苷酸。在一個具體實例中,反向互補引子包含SEQ ID NO:17505中所闡述之序列:CACTCTTTCCCTACACGACGC (5'至3')。
在一些實施例中,引子可能不為M1
M2
. . .M j
之完美反向互補序列或其一部分;儘管如此,在嚴格條件下引子可與M1
M2
. . .M j
雜交(且因此ssDNA與銜接子接合)。
在前述實施例中之任一者中,該方法可進一步包含擴增及/或純化線性雙股接合產物之庫。在一個態樣中,雙股接合產物經純化且尺寸經選擇以移除未結合之銜接子分子及/或未結合之引子,及/或形成於銜接子與其反向互補引子之間的錯合物。可使用任何適合之方法移除一般短於所需雙股接合產物之此等片段。舉例而言,使用來自Qiagen之PCR純化管柱可幫助消除來自樣品之較小片段且在2%經認證之低範圍超瓊脂糖凝膠上操作管柱純化樣品可幫助選擇所需片段尺寸。包括AMPure方法之基於珠粒之DNA純化亦有助於移除較小片段。在一些實施例中,所需雙股接合產物尺寸為約100 bp至約600 bp,諸如約100 bp至約400 bp、約150 bp至約200 bp、約200 bp至約250 bp及約250 bp至約300 bp。在一個實施例中,dsDNA (>150 bp且<400 bp)例如藉由懸浮於Tri-EDTA緩衝液中之溶離珠粒來純化及收集。
在一個態樣中,純化基於珠粒。在另一態樣中,純化係基於尺寸選擇,例如純化步驟選擇性純化長度在約50個核苷酸與約1000個核苷酸之間的聚核苷酸,例如移除長度為約40個核苷酸之銜接子(及約40 bp之引子二聚體及/或引子-銜接子雙螺旋體)。在一個態樣中,純化基於管柱,例如藉由使用dsDNA或ssDNA純化管柱,諸如來自Zymo或Qiagen之彼等。
在另一態樣中,純化不包含使用特異性結合對(諸如生物素/抗生蛋白鏈菌素),其中之一者附接至線性雙股接合產物且其他者附接至固體載體(諸如珠粒)。
在前述實施例中之任一者中,本文中之方法可進一步包含例如藉由聚合酶鏈反應(PCR)擴增線性雙股接合產物之庫,以獲得包含靶序列之序列資訊之線性雙股接合產物之經擴增庫。此擴增可為無偏性擴增,例如藉由將通用銜接子對接合至雙股接合產物之末端且用通用引子對擴增所有經標記之雙股接合產物。在其他實施例中,代替無偏性擴增或除無偏性擴增之外,進行半靶向擴增。可在無偏性擴增之前或之後進行半靶向擴增。雙股聚核苷酸庫之半靶向擴增
在如圖6中所示之一個態樣中,雙股接合產物庫之半靶向擴增包含使用包含可與銜接子反向互補及/或雜交之序列的引子,及可與靶序列(例如EGFR基因序列)雜交之引子或可與相同靶序列或多個靶序列雜交之引子。
對於具有以下結構之銜接子:/5'Phos/N1
N2
. . .N i
-UMI-M1
M2
. . .M j
-Blocker,引子可包含可與M1
M2
. . .M j
反向互補及/或雜交之序列。以此方式,當引子與dsDNA之一個股雜交且標靶特異性引子與dsDNA之另一股雜交時,PCR產物將含有靶序列以及N1
N2
. . .N i
-UMI序列(且視情況,M1
M2
. . .M j
序列之全部或一部分)。在一個具體實例中,反向互補引子包含SEQ ID NO:17505中所闡述之序列:CACTCTTTCCCTACACGACGC (5'至3')。
在一個態樣中,可使用複數個標靶特異性引子,其各自包含對相同或不同靶序列具有特異性之序列。換言之,引子可具有相同或不同靶序列。在一些實施例中,標靶特異性引子之池包含約5、約10、約25、約50、約100、約150、約200、約250、約300、約400、約500、約600、約700、約800、約900、約1000或超過約1000個不同引子,諸如約104
、約105
、約106
或更多個引子。在其他實施例中,該池包含約20與約60個之間、約60與約100個之間、約100與約140個之間、約140與約180個之間、約180與約220個之間、約220與約260個之間、約260與約300個之間、約300與約350個之間或約350與約400個之間之不同引子。在一個態樣中,標靶特異性引子池與一個常見反向互補引子一起使用,其中常見反向互補引子與該池中之各個別標靶特異性引子形成引子對,以半靶向方式擴增引子中及/或之間的靶序列。因此,在此態樣中,半靶向擴增不為全基因組擴增。
由於ctDNA片段隨機,因此在一個態樣中,標靶特異性引子之引子位置可為重要的。舉例而言,若引子降落跨越斷點,則其可導致較低轉化率。較大標靶特異性引子池及/或使用相同靶序列之多個部分重疊引子可解決該問題。
在一個態樣中,靶序列之序列資訊可包含突變、單核苷酸多形現象(SNP)、複本數變異(CNV)或表觀遺傳改變。在一個態樣中,突變包含點突變、插入、刪除、反轉、截短、融合、擴增或其任何組合。
在一些實施例中,線性雙股接合產物之經擴增庫可為除全基因組庫(例如半靶向之基因組庫)以外的庫。
在一些實施例中,該方法可進一步包含純化線性雙股接合產物之擴增庫。可使用任何適合之方法移除包括引子二聚體之較小片段。舉例而言,使用來自Qiagen之PCR純化管柱可幫助消除來自樣品之較小片段且在2%經認證之低範圍超瓊脂糖凝膠上操作管柱純化樣品可幫助選擇所需片段尺寸。包括AMPure方法之基於珠粒之DNA純化亦有助於移除較小片段。在一些實施例中,擴增產物尺寸為約100 bp至約600 bp,諸如約100 bp至約400 bp、約150 bp至約200 bp、約200 bp至約250 bps及約250 bp至約300 bp。在一個實施例中,dsDNA (>150 bp且<400 bp)例如藉由懸浮於Tri-EDTA緩衝液中之溶離珠粒來純化及收集。
在一個態樣中,純化基於珠粒。在另一態樣中,純化係基於尺寸選擇,例如純化步驟選擇性純化長度大於約150個核苷酸之聚核苷酸。在另一態樣中,純化不包含使用特異性結合對(諸如生物素/抗生蛋白鏈菌素),其中之一者附接至線性雙股接合產物且其他者附接至固體載體(諸如珠粒)。在一個態樣中,純化基於管柱,例如藉由使用dsDNA或ssDNA純化管柱,諸如來自Zymo或Qiagen之彼等。序列庫之建構及定序讀數之分析
在一個態樣中,該方法進一步包含對線性雙股接合產物之純化擴增庫進行定序。在一個態樣中,定序步驟包含將定序銜接子及/或樣品特異性條形碼附接至各線性雙股接合產物。在一個特定態樣中,附接步驟使用聚合酶鏈反應(PCR)進行。
圖7展示包含用於定序之靶分子之建構體之例示性組態。對於Illumina定序,在各端上,此等建構具有流動細胞結合位點P5及P7,其使得庫片段附著至流動細胞表面。單股庫片段之P5及P7區域黏接至其在流動細胞槽表面上之互補寡核苷酸。流動細胞寡聚物充當引子且合成與庫片段互補之股。接著,洗掉初始股,留下在定向混合物中共價結合至流動細胞表面之片段複本。隨後藉由橋式擴增產生各片段之複本,產生簇。隨後,P5區裂解,使得僅含有由P7區附接之片段的簇。此確保所有複本在相同方向上定序。定序引子黏接至片段之P5端,且藉由合成方法開始定序。當樣品帶條碼時執行索引讀數。當讀數1完成時,移除來自讀數1之所有事物且添加索引引子,其在片段之P7端處黏接且對條形碼進行定序。接著,自模板剝除所有事物,其藉由橋式擴增形成簇,如在讀數1中。此留下在定向混合物中共價結合至流動細胞表面之片段複本。以此時間,切割P7而非P5,使得僅含有由P5區附接之片段的簇。此確保所有複本在同一方向(相對讀數1)中定序。定序引子黏接至P7區且對模板之另一端進行定序。
次世代定序法平台,諸如MiSeq (Illumina Inc., San Diego, CA)可用於高度多個檢定讀數。多種統計工具,諸如比例測試、基於錯誤發現率之多個比較校正(參見Benjamini及Hochberg, 1995,Journal of the Royal Statistical Society Series B
(Methodological) 57, 289-300)及多個測試之Bonferroni校正可用於分析檢定結果。另外,發展用於分析來自RNA-Seq資料之不同表現之方法可用於降低各靶序列之差異且增加分析中之總功率。參見Smyth, 2004, Stat. Appl. Genet. Mol. Biol. 3, Article 3。
總體而言,在一些實施例中,本發明方法之轉化率為至少約40%、至少約50%、至少約60%、至少約70%、至少約80%、至少約90%或至少約95%。在一個態樣中,轉化率為初始庫中產生定序讀數之靶向單股聚核苷酸之百分比。
在前述實施例中之任一者中,該方法可用於診斷及/或預後個體之疾病或病況、預測個體對治療之反應性、鑑別疾病/病況或治療之藥物遺傳學標記及/或篩選遺傳資訊之群體。在一個態樣中,疾病或病況為癌症或贅瘤,且治療為癌症或贅瘤治療。
突變型DNA分子提供優於癌症相關生物標記之獨特優勢,因為其十分具有特異性。儘管突變以低速率(約10− 9
至10− 10
個突變/bp/代)出現於個別正常細胞中,該等突變表示總正常DNA之此類微小部分,其為低於某些技術方法之偵測極限的數量級。若干研究已顯示,可在CRC患者之大便、尿液及血液中偵測到突變型DNA (Osborn及Ahlquist, Stool screening for colorectal cancer: molecular approaches,Gastroenterology
2005;128:192-206)。
基於本文中之定序結果,可進行患者中循環腫瘤DNA之偵測,且可作出癌症之診斷及關於腫瘤復發之預測。基於該等預測,可作出治療及監測決策。舉例而言,指示未來復發之循環腫瘤DNA可引起額外或更積極療法以及額外或更複雜的成像及監測。循環DNA係指異位為腫瘤之DNA。
可監測ctDNA之樣品包括血液及大便。血液樣品可為例如血液之一部分,諸如血清或血漿。類似地,大便可經分級分離以純化來自其他組分之DNA。腫瘤樣品用於鑑別腫瘤中體細胞突變基因,其可用作體內其他位置之腫瘤的標記。因此,作為一實例,腫瘤中之特定體細胞突變可藉由此項技術中已知之任何標準方式鑑別。典型方式包括使用對偶基因特異性探針、對偶基因特異性擴增、引子延伸等直接定序腫瘤DNA。一旦鑑別出體細胞突變,其可用於身體之其他區室中以區分腫瘤衍生之DNA與來源於身體其他細胞之DNA。體細胞突變係藉由確定其不出現在相同患者身體之正常組織中來證實。可以此方式診斷及/或監測之腫瘤類型實際上不受限制。可使用將細胞及/或DNA流入血液或大便或其他體液中之任何腫瘤。除結直腸腫瘤以外,該等腫瘤包括乳房腫瘤、肺腫瘤、腎臟腫瘤、肝臟腫瘤、胰臟腫瘤、胃腫瘤、大腦腫瘤、頭頸部腫瘤、淋巴管腫瘤、卵巢腫瘤、子宮腫瘤、骨骼腫瘤、血液腫瘤等。
在一個態樣中,本文所揭示之方法可用以建構庫用於定序及/或確定靶序列之一或多個區域之表觀遺傳狀態(epigenetic status/state)。DNA甲基化首先為發現之表觀遺傳標記。後生學為對由除基礎DNA序列改變之外的機制所造成之基因表現或細胞表型改變的研究。甲基化主要涉及將甲基添加至二核苷酸CpG之胞嘧啶殘基之羰-5位且與轉錄活性之壓制或抑制相關。
亞硫酸氫鹽轉化為使用亞硫酸氫鹽試劑處理DNA以測定其甲基化模式。用亞硫酸氫鹽處理DNA將胞嘧啶殘基轉化為尿嘧啶,但保持5-甲基胞嘧啶殘基不受影響。因此,亞硫酸氫鹽處理在視個別胞嘧啶殘基之甲基化狀態而定之DNA序列中引入特定變化。可對所改變之序列進行各種分析以擷取此資訊,例如以便區分由亞硫酸氫鹽轉化產生之單核苷酸多形現象(SNP)。美國專利第7,620,386號、美國專利第9,365,902號及美國專利申請公開案2006/0134643,其所有以引用之方式併入本文中,舉例說明關於偵測由於亞硫酸氫鹽轉化改變的序列的一般熟習此項技術者已知之方法。
如上文所論述,亞硫酸氫鹽轉化之一種結果為由於序列互補缺失而破壞初始標靶之雙股構形。雖然此可造成建構雙股庫之傳統方法的問題,但在一個態樣中,本發明方法獨特地適合於自用於定序分析之亞硫酸氫鹽轉化樣品建構單股庫。
在另一態樣中,本發明方法可用於與用於判定甲基化狀態(methylation state/status)之方法組合,例如如2017年4月19日申請之標題為「Compositions and Methods for Detection of Genomic Variance and DNA Methylation Status」之美國臨時申請案第___號(代理人案號737993000100)中所述,其出於所有目的以全文引用之方式併入本文中。在一個實施例中,在去磷酸化及/或變性步驟之前使樣品與甲基化敏感性限制酶(MSRE)接觸,且隨後藉由如本文中所揭示之接合建構單股庫來分析甲基化概況。其他例示性實施例
在前述實施例中之任一者中,ssDNA接合酶可為棲熱菌噬菌體RNA接合酶,諸如噬菌體TS2126 RNA接合酶(例如,CircLigase™及CircLigase II™),或古細菌RNA接合酶,諸如嗜熱自養甲烷桿菌RNA接合酶1。在其他態樣中,ssDNA接合酶為:RNA接合酶,諸如T4 RNA接合酶,例如T4 RNA接合酶I,例如New England Biosciences,M0204S,T4 RNA接合酶2,例如New England Biosciences,M0239S,T4 RNA接合酶2截短,例如New England Biosciences,M0242S,T4 RNA接合酶2截短之KQ,例如M0373S,或T4 RNA接合酶2截短之K227Q,例如New England Biosciences,M0351S。在前述實施例中之任一者中套組亦可包含熱穩定5' App DNA/RNA接合酶,例如New England Biosciences,M0319S,或T4 DNA接合酶,例如New England Biosciences,M0202S。
在一些實施例中,本發明方法包含使用單股DNA (ssDNA)接合酶接合銜接子之組與單股聚核苷酸之庫。可使用任何適合之ssDNA接合酶,包括本文所揭示之接合酶。銜接子可以任何適合之含量或濃度使用,例如約1 μM至約100 μM,諸如約1 μM、10 μM、20 μM、30 μM、40 μM、50 μM、60 μM、70 μM、80 μM、90 μM或100 μM或其任何子範圍。銜接子可包含或以任何適合之序列或鹼基起始。舉例而言,銜接子序列可以鹼基之所有2 bp組合起始。
在一些實施例中,接合反應可在擁擠劑存在下進行。在一個態樣中,擁擠劑包含聚乙二醇(PEG),諸如PEG 4000、PEG 6000或PEG 8000、聚葡萄糖及/或聚蔗糖。擁擠劑(例如PEG)可以任何適合之含量或濃度使用。舉例而言,擁擠劑(例如PEG)可以約0% (w/v)至約25% (w/v),例如以約0% (w/v)、1% (w/v)、2% (w/v)、3% (w/v)、4%(w/v)、5% (w/v)、6% (w/v)、7%(w/v)、8% (w/v)、9%(w/v)、10% (w/v)、11%(w/v)、12% (w/v)、13%(w/v)、14% (w/v)、15% (w/v)、16% (w/v)、17% (w/v)、18% (w/v)、19% (w/v)、20% (w/v)、21% (w/v)、22% (w/v)、23% (w/v)、24% (w/v)或25% (w/v)或其任何子範圍之含量或濃度使用。
在一些實施例中,接合反應可進行任何適合之時間長度。舉例而言,接合反應可進行約2至約16小時,例如約2小時、3小時、4小時、5小時、6小時、7小時、8小時、9小時、10小時、11小時、12小時、13小時、14小時、15小時或16小時或其任何子範圍之時間。
在一些實施例中,接合反應中之ssDNA接合酶可以任何適合之體積使用。舉例而言,接合反應中之ssDNA接合酶可以約0.5 μl至約2 μl,例如以約0.5 μl、0.6 μl、0.7 μl、0.8 μl、0.9 μl 1 μl、1.1 μl、1.2 μl、1.3 μl、1.4 μl、1.5 μl、1.6 μl、1.7 μl、1.8 μl、1.9 μl或2 μl或其任何子範圍之體積使用。
在一些實施例中,連接反應可在接合增強劑,例如甜菜鹼存在下進行。接合增強劑,例如甜菜鹼可以任何適合之體積,例如約0 ul至約1 μl,例如以約0 μl、0.1 μl、0.2 μl、0.3 μl、0.4 μl、0.5 μl、0.6 μl、0.7 μl、0.8 μl、0.9 μl、1 μl或其任何子範圍使用。
在一些實施例中,接合反應可在以下例示性反應混合物(20 μl)中使用T4 RNA接合酶I (例如來自New England Biosciences,M0204S之T4 RNA接合酶I)進行:1 ×反應緩衝液(50 mM Tris-HCl,pH 7.5,10 mM MgCl2,1 mM DTT)、25% (wt/vol) PEG 8000、1 mM六胺氯化鈷(視情況存在)、1 μl (10單位) T4 RNA接合酶及1 mM ATP。反應可在25℃下培育16小時。反應可藉由添加40 μl之10 mM Tris-HCl pH 8.0,2.5 mM EDTA停止。
在一些實施例中,接合反應可在以下例示性反應混合物(20 μl)中使用熱穩定5' App DNA/RNA接合酶(例如來自New England Biosciences,M0319S之熱穩定5' App DNA/RNA接合酶)進行:ssDNA/RNA基板20 pmol (1 pmol/ul)、5´ App DNA寡核苷酸40 pmol (2 pmol/µl)、10 × NEBuffer 1 (2 µl)、50 mM MnCl2 (僅針對ssDNA) (2 µl)、熱穩定5´ App DNA/RNA接合酶(2 µl (40 pmol))及無核酸酶水(至20 µl)。反應可在65℃下培育1小時。反應可藉由在90℃下加熱3分鐘停止。
在一些實施例中,接合反應可例如在以下例示性反應混合物(20 μl)中使用T4 RNA接合酶2 (例如來自New England Biosciences,M0239S之T4 RNA接合酶2)進行:T4 RNA接合酶緩衝液(2 µl)、酶(1 µl)、PEG (10 µl)、DNA (1 µl)、銜接子(2 µl)及水(4 µl)。反應可在25℃下培育16小時。反應可藉由在65℃下加熱20分鐘停止。
在一些實施例中,接合反應可在以下例示性反應混合物(20 μl)中使用T4 RNA接合酶2截短(例如來自New England Biosciences,M0242S之T4 RNA接合酶2截短)進行:T4 RNA接合酶緩衝液(2 µl)、酶(1 µl)、PEG (10 µl)、DNA (1 µl)、銜接子(2 µl)及水(4 µl)。反應可在25℃下培育16小時。反應可藉由在65℃下加熱20分鐘停止。
在一些實施例中,接合反應可在以下例示性反應混合物(20 μl)中使用T4 RNA接合酶2截短之K227Q (例如來自New England Biosciences,M0351S之T4 RNA接合酶2截短之K227Q)進行:T4 RNA接合酶緩衝液(2 µl)、酶(1 µl)、PEG (10 µl)、DNA (1 µl)、腺苷酸化銜接子(0.72 µl)及水(5.28 µl)。反應可在25℃下培育16小時。反應可藉由在65℃下加熱20分鐘停止。
在一些實施例中,接合反應可在以下例示性反應混合物(20 μl)中使用T4 RNA接合酶2截短之KQ(例如來自New England Biosciences,M0373S之T4 RNA接合酶2截短之KQ)進行:T4 RNA接合酶緩衝液(2 µl)、酶(1 µl)、PEG (10 µl)、DNA (1 µl)、腺苷酸化銜接子(0.72 µl)及水(5.28 µl)。反應可在25℃下培育16小時。反應可藉由在65℃下加熱20分鐘停止。
在一些實施例中,接合反應可例如在以下例示性反應混合物(20 μl)中使用T4 DNA接合酶 (例如來自New England Biosciences,M0202S之T4 DNA接合酶)進行:T4 RNA接合酶緩衝液(2 µl)、酶(1 µl)、PEG (10 µl)、DNA (1 µl)、腺苷酸化銜接子(0.72 µl)及水(5.28 µl)。反應可在16℃下培育16小時。反應可藉由在65℃下加熱10分鐘停止。
第二股合成步驟可使用任何適合之酶進行。舉例而言,第二股合成步驟可使用Bst聚合酶,例如New England Biosciences,M0275S或Klenow片段(3'->5'外-),例如New England Biosciences,M0212S進行。
在一些實施例中,第二股合成步驟可在以下例示性反應混合物(10 μl)中使用Bst聚合酶(例如New England Biosciences,M0275S)進行:水(1.5 μl)、引子(0.5 μl)、dNTP (1 μl)、ThermoPol反應緩衝液(5 μl)及Bst (2 μl)。反應可在62℃下培育2分鐘且在65℃下培育30分鐘。反應後,進一步純化雙股DNA分子。
在一些實施例中,第二股合成步驟可在以下例示性反應混合物(10 μl)中使用Klenow片段(3'->5'外-) (例如New England Biosciences,M0212S)進行:水(0.5 μl)、引子(0.5 μl)、dNTP (1 μl)、NEB緩衝液(2 μl)及外- (3 μl)。反應可在37℃下培育5分鐘且在75℃下培育20分鐘。反應後,進一步純化雙股DNA分子。
第二股合成後,但在第一或半靶向PCR之前,可純化雙股DNA。雙股DNA可使用任何適合之技術或程序純化。舉例而言,雙股DNA可使用以下套組中之任一者純化:Zymo清洗及濃縮器、Zymo research, D4103;Qiaquick, Qiagen, 28104;Zymo ssDNA純化套組,Zymo Research, D7010;Zymo寡核苷酸純化套組,Zymo Research, D4060;及AmpureXP珠粒,Beckman Coulter, A63882:1.2 ×-4 ×珠粒比率。
第一或半靶向PCR可使用任何適合之酶或反應條件進行。舉例而言,聚核苷酸或DNA股可在約52℃至約72℃,例如在約52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃或72℃之範圍或其任何子範圍內之溫度下黏接。第一或半靶向PCR可進行任何適合之輪個循環。舉例而言,第一或半靶向PCR可進行10-40個循環,例如10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40個循環。引子池可以任何適合之濃度使用。舉例而言,引子池可以約5 nm至約200 nM,例如以約5 nm、6 nm、7 nm、8 nm、9 nm、10 nm、20 nm、30 nm、40 nm、50 nm、60 nm、70 nm、80 nm、90 nm、100 nm、110 nm、120 nm、130 nm、140 nm、150 nm、160 nm、170 nm、180 nm、190 nm或200 nm範圍或其任何子範圍內之濃度使用。
第一或半靶向PCR可使用任何適合之溫度循環條件進行。舉例而言,第一或半靶向PCR可使用以下循環條件中之任一者進行:95℃ 3分鐘,(95℃ 15秒,62℃ 30秒,72℃ 90秒) × 3或× 5;或(95℃ 15秒,72℃ 90秒)× 23或× 21,72℃ 1分鐘,4℃永久。
在一些實施例中,第一或半靶向PCR可在以下例示性反應混合物(50 μl)中使用KAPA SYBR FAST (例如KAPA biosciences,KK4600)進行:DNA (2 μl)、KAPASYBR (25 μl)、引子池(每一者26 nM) (10 μl)、A引子(100 μM) (0.4 μl)及水(12.6 μl)。第一或半靶向PCR可使用以下循環條件中之任一者進行:95℃ 30秒,(95℃ 10秒,50-56℃,45秒,72℃ 35秒) × 40。
在一些實施例中,第一或半靶向PCR可在以下例示性反應混合物(50 μl)中使用KAPA HiFi (例如KAPA Biosciences,KK2601)進行:DNA (15 μl)、KAPAHiFi (25 μl)、引子池(每一者26 nM) (10 μl)及A引子(100 μM) (0.4 μl)。第一或半靶向PCR可使用以下循環條件中之任一者進行:95℃ 3 min,(98℃ 20秒,53-54℃ 15秒,72℃ 35秒) × 15,72℃ 2分鐘,4℃永久。
亞硫酸氫鹽轉化可使用任何適合之技術、程序或試劑進行。在一些實施例中,亞硫酸氫鹽轉化可使用以下套組及提供於套組中之程序中之任一者進行:EpiMark亞硫酸氫鹽轉化套組,New England Biosciences,E3318S;EZ DNA甲基化套組,Zymo Research,D5001;MethylCode亞硫酸氫鹽轉化套組,Thermo Fisher Scientific,MECOV50;EZ DNA甲基化黃金套組,Zymo Research,D5005;EZ DNA甲基化直接套組,Zymo Research,D5020;EZ DNA甲基化 Lightning套組,Zymo Research,D5030T;EpiJET亞硫酸氫鹽轉化套組,Thermo Fisher Scientific,K1461;或EpiTect亞硫酸氫鹽套組,Qiagen,59104。
在一些實施例中,DNA分子可使用實例4中所說明之程序製備,包括以下步驟:建構單股聚核苷酸、將單股聚核苷酸庫轉化為雙股聚核苷酸庫、半靶向擴增雙股聚核苷酸庫及建構序列庫。可使用任何適合之方法或程序進一步分析該等DNA分子之甲基化狀態。
G. 實例.實例 1 . 偵測結腸組織中之癌症
在此實例中,分析10個表1中所列之標靶區域之甲基化狀態:標靶30、標靶369、標靶677、標靶1558、標靶1628、標靶1691、標靶1725、標靶1795、標靶1823、標靶1841。甲基化量度運算為未甲基化單倍型負荷(uMHL)。分析中所用之分類方法為支持向量機。
研發查詢上文所列之10個標靶區域之實驗組。使用實驗組處理八個(8)健康結腸及40個結腸癌組織樣品,且運算各標靶區域之uMHL量度以形成資料矩陣。為了研發基於SVM之分類器,選擇4種健康結腸及20種結腸癌組織樣品之子組作為「訓練」組。訓練組樣品用於使基於SVM之分類器擬合於Python (使用scikit學習庫) (圖2)。基於SVM之分類器隨後用於預測剩餘24個「測試」組樣品之類別。分類器能夠在測試組中達成100%精確度且正確地鑑別結腸組織樣品是否為癌性。實例 2 . 偵測血漿中之肺癌
在此實例中,分析95個表1中所列之標靶區域之甲基化狀態:標靶35、標靶36、標靶102、標靶115、標靶117、標靶118、標靶120、標靶136、標靶141、標靶154、標靶155、標靶166、標靶207、標靶226、標靶241、標靶243、標靶252、標靶253、標靶267、標靶284、標靶338、標靶397、標靶398、標靶422、標靶423、標靶432、標靶439、標靶440、標靶445、標靶460、標靶461、標靶504、標靶514、標靶574、標靶575、標靶589、標靶596、標靶625、標靶626、標靶637、標靶640、標靶650、標靶674、標靶691、標靶693、標靶710、標靶736、標靶840、標靶852、標靶867、標靶868、標靶884、標靶903、標靶911、標靶916、標靶926、標靶936、標靶940、標靶941、標靶1005、標靶1041、標靶1048、標靶1085、標靶1093、標靶1113、標靶1139、標靶1181、標靶1182、標靶1183、標靶1216、標靶1229、標靶1240、標靶1311、標靶1324、標靶1333、標靶1340、標靶1342、標靶1356、標靶1357、標靶1385、標靶1392、標靶1403、標靶1408、標靶1489、標靶1521、標靶1566、標靶1584、標靶1609、標靶1616、標靶1626、標靶1630、標靶1635、標靶1655及標靶1656。甲基化量度運算為不一致讀數百分比(PDR)。分析中所用之分類方法為K最近相鄰法。
研發查詢上文所列之95個標靶區域之實驗組。使用實驗組處理四十(40)個肺癌組織樣品、10個健康血漿樣品及4個肺癌血漿樣品,且針對各標靶區域運算PDR量度以形成資料矩陣。為了研發基於K最近相鄰法之分類器,選擇10個健康血漿及40個肺癌組織樣品之子組作為「訓練」組。對於剩餘測試組樣品,在Python (使用seaborn.clustermap函數)中運算所有訓練組樣品之歐幾里得距離(圖3a)。各樣品分配至其最近訓練組相鄰者之類別;此導致血漿樣品中75.00%之靈敏度及100.00%之特異度。
測試或分析結果展示於圖3b中。各豎直線表示單個樣品。紫色樣品為已知癌症樣品。綠色樣品為已知正常樣品。紅色樣品為未知樣品(對於其,實情為癌症樣品)。藍色樣品為未知樣品(對於其,實情為正常樣品)。在此分析中,所有五個藍色樣品最類似於綠色樣品,因此其皆稱為正常(針對100%之特異度)。四個紅色樣品中之三個最類似於紫色樣品,因此四個中之三個稱為癌症(對於75%之敏感度)。一個紅色樣品最類似於綠色樣品,因此其誤稱為正常樣品。實例 3 . 血漿中之泛癌偵測
在此實例中,分析86個表1中所列之標靶區域之甲基化狀態:標靶11、標靶35、標靶36、標靶102、標靶115、標靶141、標靶154、標靶155、標靶168、標靶184、標靶209、標靶210、標靶211、標靶226、標靶241、標靶284、標靶323、標靶333、標靶338、標靶397、標靶432、標靶439、標靶440、標靶460、標靶472、標靶482、標靶485、標靶570、標靶574、標靶589、標靶596、標靶616、標靶637、標靶660、標靶661、標靶674、標靶692、標靶693、標靶710、標靶728、標靶840、標靶852、標靶867、標靶868、標靶903、標靶911、標靶916、標靶940、標靶941、標靶942、標靶1048、標靶1055、標靶1061、標靶1085、標靶1093、標靶1116、標靶1122、標靶1129、標靶1139、標靶1142、標靶1190、標靶1191、標靶1212、標靶1213、標靶1216、標靶1229、標靶1247、標靶1248、標靶1296、標靶1297、標靶1311、標靶1322、標靶1324、標靶1340、標靶1342、標靶1343、標靶1356、標靶1378、標靶1392、標靶1403、標靶1447、標靶1522、標靶1535、標靶1543、標靶1566、標靶1616。甲基化量度運算為平均甲基化頻率(AMF)。分析中所用之分類方法為邏輯回歸。
研發查詢上文所列之86個標靶區域之實驗組。使用實驗組處理二十(20)個健康血漿樣品、5個肺癌血漿樣品、4個肝癌血漿樣品、1個乳癌血漿樣品、1個卵巢癌血漿樣品及2個食道癌血漿樣品,且針對各標靶區域運算AMF量度以形成資料矩陣。為了研發基於邏輯回歸之分類器,選擇10個健康血漿及6個癌症血漿樣品之子組作為「訓練」組。邏輯回歸模型擬合於Python (使用sklearn模塊)中之所有標靶區域中之平均甲基化值之總和(圖4)。隨後預測剩餘測試組樣品之癌症狀態;此導致血漿樣品中85.71%之敏感度及80.00%之特異度。實例 4
在此實例中,模板(例如,待定序之聚核苷酸)為低於約200 bp長之短DNA片段。此等DNA片段可包括來自血漿之經提取DNA、酶處理(例如,藉由片段化酶)之基因組DNA或物理上剪切之DNA。可末端修復物理上剪切之DNA。在特定態樣中,模板具有用於接合之3'羥基。
通常,在37℃下在100 mM MOPS (pH 7.5)、20 mM KCl、10 mM MgCl2
、2 mM DTT及5 mM MnCl2
中將10-30 ng之適當製備之模板DNA去磷酸化10分鐘,例如使用1 U FastAP熱敏鹼性磷酸酶(Thermo Scientific)。隨後例如在95℃下使DNA變性2分鐘,且將其置於冰上1分鐘。
單股銜接子由具有5'磷酸酯基及3'碳間隔基之IDT合成。5'端含有GA,隨後為12聚體獨特分子標識符(UMI)序列。典型單股銜接子具有以下序列:/5Phos/GANNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG/3SpC3/ (「5Phos」表示5'磷酸酯基,「NNNNNNNNNNNN」表示12聚體UMI序列,且「3SpC3」表示3'碳間隔基)。
隨後使用去磷酸化之單股DNA作為模板進行接合反應。以下最終濃縮物用於接合反應:50 mM MOPS (pH 7.5)、10 mM KCl、5 mM MgCl2
、1 mM DTT及2.5 mM MnCl2
、50% PEG 4000、0.5 µM銜接子、125 µM ATP及200 U Epicentre Circligase™。反應在60℃下培育2小時,在80℃下培育10分鐘,在85℃下培育2分鐘,且保持在4℃下。
隨後藉由添加先前反應體積至以下來使DNA成為雙股:10 mM Tris-HCl (pH 8.3)、50 mM KCl、1.5 mM MgCl2
、1.25 U Taq DNA聚合物(NEB)、1 µM反向互補引子(與銜接子反向互補之引子)及200 µM dNTP混合物。反應在95℃下培育30秒,在62℃下培育2分鐘,在68℃下培育10分鐘,且保持在4℃下。典型反向互補引子包含SEQ ID NO:17505中所闡述之序列:CACTCTTTCCCTACACGACGC (5'至3')。以下為銜接子與反向互補引子之間之比對:
隨後使用1.6 (珠粒比率) × AmPure®
XP珠粒純化反應。添加珠粒且培育10分鐘。混合物隨後轉移至磁體中5分鐘。隨後移除上清液。珠粒用150 µL 80%乙醇洗滌2次,每次30秒。隨後移除所有殘餘乙醇且在室溫下將珠粒自磁體乾燥3分鐘。將15 µl低TE緩衝液(Thermo Fisher)添加至珠粒中且培育2分鐘。隨後使珠粒返回至磁體中1分鐘。移除上清液且儲存用於下一反應。在一個態樣中,珠粒比率在純化過程中引起尺寸選擇性,且可選擇移除短於約100 bp之分子的珠粒比率(諸如1.6 ×)。
一組PCR引子經設計以使引子-引子相互作用及脫靶黏接降至最低。引子經進一步優化以緊密接近於特定變異體。一旦設計,則藉由IDT合成引子。將引子以相等體積比混合至引子池。使用以下試劑進行半靶向PCR反應:來自先前反應之所有純化DNA、1 × KAPA 2G多重主混合物、來自池之66 nM各引子及800 nM反向互補引子。反應經歷以下熱循環程式:95℃ 3分鐘,(95℃ 15秒,72℃ 90秒) × 20,72℃ 1分鐘,且保持在4℃下。
隨後使用1.6 (珠粒比率) × AmPure®
XP珠粒純化反應。添加珠粒且培育10分鐘。混合物隨後轉移至磁體中5分鐘。隨後移除上清液。珠粒用150 µL 80%乙醇洗滌2次,每次30秒。隨後移除所有殘餘乙醇且在室溫下將珠粒自磁體乾燥3分鐘。將20 µl低TE緩衝液(Thermo Fisher)添加至珠粒中且培育2分鐘。隨後使珠粒返回至磁體中1分鐘。移除上清液且儲存用於下一反應。可選擇移除短於約100 bp之分子的珠粒比率(諸如1.6 ×),包括游離銜接子分子、游離引子分子及/或銜接子/引子二聚體。
隨後完成另一PCR反應以添加全長定序銜接子及樣品特異性條形碼。PCR反應含有以下:來自先前反應之2 µL經純化DNA、1 × NEB超Q5 II主混合物、400 nM通用引子及400 nM條形碼特異性引子。反應經歷以下熱循環程式:95℃ 3分鐘,(98℃ 10秒,65℃ 75秒) × 10,65℃ 2分鐘,且保持在4℃下。
隨後使用0.8 (珠粒比率) × AmPure®
XP珠粒純化反應。添加珠粒且培育10分鐘。混合物隨後轉移至磁體中5分鐘。隨後移除上清液。珠粒用150 µL 80%乙醇洗滌2次,每次30秒。隨後移除所有殘餘乙醇且在室溫下將珠粒自磁體乾燥3分鐘。將25 µl低TE緩衝液(Thermo Fisher)添加至珠粒中且培育2分鐘。隨後使珠粒返回至磁體中1分鐘。移除上清液且準備進行定序。可選擇移除短於約200 bp之大部分分子的珠粒比率(諸如0.8 ×)。
圖1說明例示性支持向量機分析。圖1之影像取自維基百科(Wikipedia):https :// en . wikipedia . org / wiki / Support _ vector _ machine
),且不表示任何DNA甲基化狀態分析或癌症評估。
圖2說明如實例1中所述之結腸組織中之癌症的偵測。
圖3a及3b說明如實例2中所述之血漿中之肺癌的偵測。
圖4說明如實例3中所述之血漿中之泛癌(pan-cancer)的偵測。
圖5 (表1)顯示例示性標靶區域及引子。
圖6說明根據本發明之一個態樣,用於構築單股聚核苷酸庫且使用該庫進行定序分析之步驟。
圖7說明根據本發明之一個態樣,包含用於定序之靶分子之構築體。
Claims (111)
- 一種經分離之聚核苷酸之組,其包含以下、由以下組成或基本上由以下組成:至少兩種經分離之聚核苷酸,該等經分離之聚核苷酸中之各者具有表1中所列之標靶1至標靶1849中之任一者之聚核苷酸序列或其互補或實質上互補序列。
- 如請求項1之組,其包含以下、由以下組成或基本上由以下組成:表1中所列之標靶1至標靶1849中之至少10、50、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個該等經分離之聚核苷酸或與之全部對應的該等經分離之聚核苷酸。
- 如請求項1或2之組,其包含表1中所列之標靶1至標靶1849中之至少10、50、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個該等經分離之聚核苷酸或與之全部對應的該等經分離之聚核苷酸。
- 如請求項1或2之組,其由以下組成:表1中所列之標靶1至標靶1849中之至少10、50、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個該等經分離之聚核苷酸或與之全部對應的該等經分離之聚核苷酸。
- 如請求項1或2之組,其基本上由以下組成:表1中所列之標靶1至標靶1849中之至少10、50、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800、更多個該等經分離之聚核苷酸或與之全部對應的該等經分離之聚核苷酸。
- 如請求項1至5中任一項之組,其中該等經分離之聚核苷酸為DNA分子、RNA分子或其組合。
- 如請求項1至6中任一項之組,其中該等經分離之聚核苷酸固定在基板上。
- 如請求項7之組,其中該基板包含固體表面、多孔表面或其組合。
- 如請求項7或8之組,其中該基板為珠粒、管、微量滴定盤、膜、凝膠或玻璃載片之一部分。
- 如請求項7至9中任一項之組,其中該等經分離之聚核苷酸分子在空間上彼此分開地固定在基板上。
- 一種套組或系統,其包含如請求項1至10中任一項之組。
- 如請求項11之套組或系統,其經組態以評估表1中所列之標靶1至標靶1849中之至少兩者之甲基化狀態。
- 如請求項12之套組或系統,其經組態以評估表1中所列之標靶1至標靶1849中至少10、50、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800個或全部之甲基化狀態。
- 如請求項11至13中任一項之套組或系統,其中該等經分離之聚核苷酸經組態為對照聚核苷酸。
- 如請求項14之套組或系統,其中該等經分離之聚核苷酸之濃度水準為約1飛莫耳至約1毫莫耳。
- 一種套組或系統,其包含用於評估表1中所列之標靶1至標靶1849中之至少兩者之甲基化狀態的試劑。
- 如請求項16之套組或系統,其包含用於評估表1中所列之標靶1至標靶1849中之至少10、50、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800個或全部之甲基化狀態的試劑。
- 如請求項16或17之套組或系統,其中該等試劑包含以下、基本上由以下組成或由以下組成:經組態以與待評估其甲基化狀態之該等標靶中之各者雜交的探針或引子。
- 如請求項18之套組或系統,其中該等試劑包含以下、基本上由以下組成或由以下組成:經組態以與待評估其甲基化狀態之該等標靶中之各者雜交的單個探針或引子。
- 如請求項18之套組或系統,其中該等試劑包含以下、基本上由以下組成或由以下組成:經組態以與待評估其甲基化狀態之該等標靶中之各者雜交的多個探針或引子。
- 如請求項18至20中任一項之套組或系統,其中該一或多個引子包含以下、基本上由以下組成或由以下組成:SEQ ID NO:1至SEQ ID NO:17504中之任一者中所闡述之序列、其互補或實質上互補序列或其任何組合。
- 如請求項16至21中任一項之套組或系統,其進一步包含用於擴增待評估其甲基化狀態之該等標靶中之各者的常用引子。
- 如請求項22之套組或系統,其中該常用引子包含以下、基本上由以下組成或由以下組成:SEQ ID NO. 17505中所闡述之序列或其互補或實質上互補序列。
- 如請求項16至23中任一項之套組或系統,其進一步包含用於將該等標靶與樣品分離之試劑。
- 如請求項16至24中任一項之套組或系統,其進一步包含用於製備該等標靶之庫之試劑。
- 如請求項25之套組或系統,其中用於製備該等標靶之庫之該試劑包含酶,例如接合酶或單股DNA (ssDNA)接合酶。
- 如請求項26之套組或系統,其中該ssDNA接合酶為T4 RNA接合酶I、熱穩定5' App DNA/RNA接合酶、T4 RNA接合酶2、截短之T4 RNA接合酶2,例如T4 RNA接合酶2截短、T4 RNA接合酶2截短之K227Q、T4 RNA接合酶2截短之KQ或T4 DNA接合酶、棲熱菌噬菌體(Thermus bacteriophage) RNA接合酶,諸如噬菌體TS2126 RNA接合酶(例如,CircLigase™及CircLigase II™)或古細菌(archaebacterium) RNA接合酶,諸如嗜熱自養甲烷桿菌(Methanobacterium thermoautotrophicum) RNA接合酶1。
- 如請求項16至27中任一項之套組或系統,其進一步包含用於擴增該等標靶或該等標靶之庫之試劑。
- 如請求項28之套組或系統,其中用於擴增該等標靶或該等標靶之庫之該試劑包含酶,例如用於選自由以下組成之群之聚核苷酸擴增反應中之酶:聚合酶鏈反應(PCR)、股置換擴增(SDA)、轉錄介導擴增(TMA)、接合酶鏈反應(LCR)、基於核酸序列之擴增(NASBA)、引子延伸、滾環擴增(RCA)、自持續序列複製(3SR)及環介導等溫擴增(LAMP)。
- 如請求項16至29中任一項之套組或系統,其進一步包含用於純化該等標靶、該等標靶之庫、經擴增標靶或經擴增標靶之庫之試劑。
- 如請求項16至30中任一項之套組或系統,其進一步包含用於評估該等標靶之甲基化狀態之試劑。
- 如請求項31之套組或系統,其中用於評估該等標靶之甲基化狀態之該試劑為用於例如DNA甲基化之聚核苷酸甲基化中之試劑,偵測方法選自由以下組成之群:質譜法、甲基化特異性PCR (MSP)、亞硫酸氫鹽定序、藉由接合介導PCR檢定(HELP檢定)、Glal水解及接合銜接子相關PCR檢定(GLAD-PCR檢定)之HpaII微小片段增濃、限制性標誌基因組掃描(RLGS)、甲基化DNA免疫沈澱(MeDIP或mDIP)、焦磷酸定序、針對DNA腺嘌呤甲基轉移酶活性之分子斷裂光檢定、甲基敏感性南方墨點法(Southern blotting)及高解析度熔融(high resolution Melt,HRM)分析。
- 如請求項31或32之套組或系統,其中用於評估該等標靶之甲基化狀態之該試劑為化學劑,例如亞硫酸氫鹽或亞硫酸氫鈉。
- 如請求項31或32之套組或系統,其中用於評估該等標靶之甲基化狀態之該試劑為生物劑,例如多肽或酶。
- 如請求項34之套組或系統,其中該酶為甲基化敏感性限制酶(MSRE)。
- 如請求項35之套組或系統,其中該MSRE在其未經甲基化時在殘基上選擇性裂解。
- 如請求項35之套組或系統,其中該MSRE在其經甲基化時在該殘基上選擇性裂解。
- 如請求項35至38中任一項之套組或系統,其中該MSRE選自由以下組成之群:HpaII、SalI、SalI-HF®、ScrFI、BbeI、NotI、SmaI、XmaI、MboI、BstBI、ClaI、MluI、NaeI、NarI、PvuI、SacII、HhaI及其組合。
- 如請求項34之套組或系統,其中該酶為聚核苷酸聚合酶。
- 如請求項39之套組或系統,其中該聚核苷酸聚合酶經組態以用於PCR。
- 如請求項40之套組或系統,其中該聚核苷酸聚合酶為DNA聚合酶,例如無3'至5'外切核酸酶活性之DNA聚合酶。
- 如請求項16至41中任一項之套組或系統,其進一步包含如請求項1至10中任一項之組。
- 如請求項16至42中任一項之套組或系統,其進一步包含對照基因座之參考樣品及/或資訊。
- 如請求項16至43中任一項之套組或系統,其進一步包含用於一或多種組分及/或使用該套組或系統之說明書的獨立容器,例如小瓶。
- 如請求項16至44中任一項之套組或系統,其進一步包含含有可執行指令之電腦可讀取媒體,該等指令用於基於該甲基化狀態評估來獲得樣品之甲基化量度。
- 如請求項45之套組或系統,其中該電腦可讀取媒體經組態以平均甲基化頻率、甲基化單倍型負荷、未甲基化單倍型負荷、不一致讀數百分比或其組合之形式獲得甲基化量度。
- 如請求項16至46中任一項之套組或系統,其經組態以評估個體之癌症或贅瘤。
- 如請求項47之套組或系統,其經組態以評估個體之肺癌或結直腸癌。
- 如請求項47之套組或系統,其經組態以用於個體之泛癌分析或剖析。
- 一種用於評估個體之癌症或贅瘤之方法,該方法包含: a) 提供來自個體之樣品,其含有該個體之至少兩種靶聚核苷酸,該至少兩種靶聚核苷酸具有表1中所列之標靶1至標靶1849中之至少兩者之聚核苷酸序列或其互補或實質上互補序列; b) 評估該至少兩種靶聚核苷酸之甲基化狀態;及 c) 基於該至少兩種靶聚核苷酸之甲基化狀態之評估,評估該個體之癌症或贅瘤。
- 如請求項50之方法,其中該樣品包含循環無細胞DNA或腫瘤DNA (ctDNA)。
- 如請求項50或51之方法,其中該樣品為血液、血清、血漿或體液樣品或其任何組合。
- 如請求項50至52中任一項之方法,其中該個體為哺乳動物。
- 如請求項53之方法,其中該哺乳動物為非人類哺乳動物,例如寵物、農耕動物、伴侶動物或實驗動物。
- 如請求項53之方法,其中該哺乳動物為人類。
- 如請求項50至55中任一項之方法,其包含評估具有表1中所列之標靶1至標靶1849中之至少10、50、100、200、300、400、500、600、700、800、900、1,000、1,100、1,200、1,300、1,400、1,500、1,600、1,700、1,800個或全部之聚核苷酸序列或其互補或實質上互補序列之靶聚核苷酸的甲基化狀態。
- 如請求項50至56中任一項之方法,其中該靶聚核苷酸之甲基化狀態使用經組態以與該等靶聚核苷酸中之各者雜交的探針或引子評估。
- 如請求項50至57中任一項之方法,其中該靶聚核苷酸之甲基化狀態使用經組態以與該靶聚核苷酸雜交的單個探針或引子評估。
- 如請求項50至57中任一項之方法,其中該靶聚核苷酸之甲基化狀態使用經組態以與該靶聚核苷酸雜交的多個探針或引子評估。
- 如請求項50至59中任一項之方法,其中該一或多個引子包含以下、基本上由以下組成或由以下組成:SEQ ID NO:1至SEQ ID NO:17504中之任一者中所闡述之序列、其互補或實質上互補序列或其任何組合。
- 如請求項50至60中任一項之方法,其進一步包含使用常用引子以擴增待評估其甲基化狀態之該靶聚核苷酸中之各者。
- 如請求項61之方法,其中該常用引子包含以下、基本上由以下組成或由以下組成:SEQ ID NO:17505中所闡述之序列、其互補或實質上互補序列。
- 如請求項50至62中任一項之方法,其進一步包含將該等靶聚核苷酸與樣品分離。
- 如請求項50至63中任一項之方法,其進一步包含製備該等靶聚核苷酸之庫。
- 如請求項64之方法,其中該等靶聚核苷酸之庫使用例如接合酶或單股DNA (ssDNA)接合酶之酶製備。
- 如請求項65之方法,其中該ssDNA接合酶為T4 RNA接合酶I、熱穩定5' App DNA/RNA接合酶、T4 RNA接合酶2、截短之T4 RNA接合酶2,例如T4 RNA接合酶2截短、T4 RNA接合酶2截短之K227Q、T4 RNA接合酶2截短之KQ或T4 DNA接合酶、棲熱菌噬菌體RNA接合酶,諸如噬菌體TS2126 RNA接合酶(例如,CircLigase™及CircLigase II™)或古細菌RNA接合酶,諸如嗜熱自養甲烷桿菌RNA接合酶1。
- 如請求項50至66中任一項之方法,其進一步包含擴增該等靶聚核苷酸。
- 如請求項67之方法,其中該等靶聚核苷酸使用選自由以下組成之群之程序擴增:聚合酶鏈反應(PCR)、股置換擴增(SDA)、轉錄介導擴增(TMA)、接合酶鏈反應(LCR)、基於核酸序列之擴增(NASBA)、引子延伸、滾環擴增(RCA)、自持續序列複製(3SR)及環介導等溫擴增(LAMP)。
- 如請求項50至68中任一項之方法,其進一步包含純化該等靶聚核苷酸、該等靶聚核苷酸之庫、經擴增靶聚核苷酸或經擴增靶聚核苷酸之庫。
- 如請求項50至69中任一項之方法,其中該靶聚核苷酸之甲基化狀態使用以下評估:質譜法、甲基化特異性PCR (MSP)、例如亞硫酸氫鹽定序之甲基化敏感性定序、藉由接合介導PCR檢定(HELP檢定)、Glal水解及接合銜接子相關PCR檢定(GLAD-PCR檢定)之HpaII微小片段增濃、限制性標誌基因組掃描(RLGS)、甲基化DNA免疫沈澱(MeDIP或mDIP)、焦磷酸定序、針對DNA腺嘌呤甲基轉移酶活性之分子斷裂光檢定、甲基敏感性南方墨點法或高解析度熔融(HRM)分析。
- 如請求項70之方法,其中評估靶聚核苷酸之甲基化狀態包含使用化學劑,例如亞硫酸氫鹽或亞硫酸氫鈉。
- 如請求項70之方法,其中評估靶聚核苷酸之甲基化狀態包含使用生物劑,例如多肽或酶。
- 如請求項72之方法,其中該酶為甲基化敏感性限制酶(MSRE)。
- 如請求項73之方法,其中該MSRE在其未經甲基化時在殘基上選擇性裂解。
- 如請求項73之方法,其中該MSRE在其經甲基化時在該殘基上選擇性裂解。
- 如請求項73至75之方法,其中該MSRE選自由以下組成之群:HpaII、SalI、SalI-HF®、ScrFI、BbeI、NotI、SmaI、XmaI、MboI、BstBI、ClaI、MluI、NaeI、NarI、PvuI、SacII、HhaI及其組合。
- 如請求項72之方法,其中該酶為聚核苷酸聚合酶。
- 如請求項77之方法,其中該聚核苷酸聚合酶經組態以用於PCR中。
- 如請求項78之方法,其中該聚核苷酸聚合酶為DNA聚合酶,例如無3'至5'外切核酸酶活性之DNA聚合酶。
- 如請求項50至79中任一項之方法,其中該靶聚核苷酸之甲基化狀態使用甲基化敏感性定序,例如亞硫酸氫鹽定序評估。
- 如請求項80之方法,其中該甲基化敏感性定序利用選自由以下組成之群之型式進行:Maxam-Gilbert定序、鏈封端方法、鳥槍定序、橋式PCR、單分子即時定序、離子半導體(ion torrent定序)、藉由合成定序、藉由接合定序(SOLiD定序)、鏈封端(Sanger定序)、大規模平行簽名定序(MPSS)、聚合酶選殖定序、454焦磷酸定序、Illumina (Solexa)定序、DNA奈米球定序、heliscope單分子定序、單分子即時(SMRT)定序、奈米孔DNA定序、穿隧電流DNA定序、藉由雜交定序、藉由質譜定序、微流體Sanger定序、基於顯微法之技術、RNAP定序及活體外病毒高通量定序。
- 如請求項80或81之方法,其進一步包含,在該甲基化敏感性定序,例如亞硫酸氫鹽定序之前,獲得線性單股接合產物之庫,該線性單股接合產物中之各者包括連接至銜接子之線性單股靶聚核苷酸,該銜接子包含獨特分子標識符(UMI)序列,其標記與該銜接子接合之該單股靶聚核苷酸。
- 如請求項82之方法,其中來自該等靶聚核苷酸之定序讀數首先經銜接子修整以移除起源於庫建構過程之任何銜接子序列,從而獲得經修整定序讀數。
- 如請求項83之方法,其中使用比對程式將該等經修整定序讀數映射至參考基因組,例如人類參考基因組,以獲得比對讀數檔案。
- 如請求項84之方法,其中將該比對讀數檔案分組為對應於來自表1中所列之標靶1至標靶1849之各標靶區域或其互補序列或實質上互補序列的組,其可用於甲基化狀態評估。
- 如請求項50至85中任一項之方法,其中評估該等靶聚核苷酸中之各者之甲基化狀態。
- 如請求項86之方法,其中評估該等靶聚核苷酸中之各者之甲基化狀態例如以平均甲基化頻率、甲基化單倍型負荷、未甲基化單倍型負荷、不一致讀數百分比或其組合之形式獲得甲基化量度。
- 如請求項87之方法,其中樣品之甲基化狀態使用來自該等靶聚核苷酸中之各者之甲基化量度評估。
- 如請求項88之方法,其中該等靶聚核苷酸中之各者之甲基化量度與臨限值或參考值進行比較以評估樣品之甲基化狀態。
- 如請求項88或89之方法,其中數值甲基化矩陣使用來自該等靶聚核苷酸中之各者之甲基化量度進行運算以評估樣品之甲基化狀態。
- 如請求項90之方法,其中來自樣品之該數值甲基化矩陣包含單個數值或值。
- 如請求項90之方法,其中來自樣品之該數值甲基化矩陣包含多個數值或值。
- 如請求項90至92中任一項之方法,其中該數值甲基化矩陣使用分類演算法運算。
- 如請求項93之方法,其中該分類演算法為線性判別分析、邏輯回歸、單純貝氏分類(naïve bayes classification)、感知器分類、二次分類、k最近相鄰法、提昇方法、決策樹、隨機森林(random forest)、神經網路、學習向量量化或支持向量機(support vector machine)。
- 如請求項90至94中任一項之方法,其中該甲基化矩陣與臨限值或參考值進行比較以評估樣品之甲基化狀態。
- 如請求項87至95中任一項之方法,其中該等靶聚核苷酸中之各者之甲基化量度使用電腦獲得。
- 如請求項90至96中任一項之方法,其中基於該等靶聚核苷酸中之各者之甲基化量度,該樣品之甲基化矩陣使用電腦獲得。
- 如請求項50至97中任一項之方法,其中來自多個樣品,例如來自多個個體之多個樣品之至少兩種靶聚核苷酸之甲基化狀態係依序或同步評估。
- 如請求項50至98中任一項之方法,其用於個體之癌症或贅瘤之診斷、預後、分級、風險評估或治療監測。
- 如請求項99之方法,其中該癌症為淋巴瘤、白血病、腦癌、多發性骨髓瘤、胰臟癌、肝癌、胃癌、乳癌、腎癌、肺癌、結直腸癌、結腸癌、前列腺癌、卵巢癌、子宮頸癌、皮膚癌、食道癌或頭頸癌。
- 如請求項99之方法,其用於個體之肺癌之診斷、預後、分級、風險評估或治療監測。
- 如請求項101之方法,其中該肺癌為非小細胞肺癌或小細胞肺癌。
- 如請求項102之方法,其中該非小細胞肺癌為肺之腺癌(亦稱為肺部腺癌)、肺之鱗狀細胞癌(SCC)或大細胞癌(LCC)。
- 如請求項99之方法,其用於個體之結直腸癌之診斷、預後、分級、風險評估或治療監測。
- 如請求項99之方法,其用於個體之泛癌分析或剖析之診斷、預後、分級、風險評估或治療監測。
- 如請求項50至105中任一項之方法,其中多個個體之癌症或贅瘤依序或同步進行評估。
- 如請求項50至106中任一項之方法,其敏感度為至少10%。
- 如請求項50至107中任一項之方法,其特異度為至少10%。
- 如請求項50至108中任一項之方法,其進一步包含基於個體之癌症或贅瘤之該評估治療該個體或改變該個體之治療。
- 如請求項109之方法,其包含基於人類患者之癌症或贅瘤之該評估治療該人類患者或改變該人類患者之治療。
- 如請求項109或110之方法,其中該治療為化學療法、放射線療法、免疫療法、細胞療法、手術、用例如小分子藥物或大分子藥物諸如抗體藥物之藥物進行之治療。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862656820P | 2018-04-12 | 2018-04-12 | |
US62/656,820 | 2018-04-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202012638A true TW202012638A (zh) | 2020-04-01 |
Family
ID=68163272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108112820A TW202012638A (zh) | 2018-04-12 | 2019-04-12 | 用於癌症及贅瘤之評估的組合物及方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20210388445A1 (zh) |
EP (1) | EP3775290A4 (zh) |
JP (1) | JP2021520809A (zh) |
KR (1) | KR20210003795A (zh) |
CN (1) | CN112352057A (zh) |
AU (1) | AU2019253569A1 (zh) |
CA (1) | CA3096668A1 (zh) |
SG (1) | SG11202009866XA (zh) |
TW (1) | TW202012638A (zh) |
WO (1) | WO2019199696A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2019234843A1 (en) | 2018-03-13 | 2020-09-24 | Grail, Llc | Anomalous fragment detection and classification |
WO2019195268A2 (en) | 2018-04-02 | 2019-10-10 | Grail, Inc. | Methylation markers and targeted methylation probe panels |
WO2020069350A1 (en) | 2018-09-27 | 2020-04-02 | Grail, Inc. | Methylation markers and targeted methylation probe panel |
US11795495B1 (en) * | 2019-10-02 | 2023-10-24 | FOXO Labs Inc. | Machine learned epigenetic status estimator |
JP2022553575A (ja) * | 2019-10-31 | 2022-12-23 | マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチ | 卵巣癌の検出 |
CN111833965B (zh) * | 2019-11-08 | 2024-06-04 | 中国科学院北京基因组研究所(国家生物信息中心) | 一种尿沉渣基因组dna的分类方法、装置和用途 |
WO2021107081A1 (ja) * | 2019-11-27 | 2021-06-03 | 学校法人慶應義塾 | 上部尿路上皮癌の判定方法 |
WO2021185061A1 (en) * | 2020-03-20 | 2021-09-23 | Singlera Health Technologies (Shanghai) Ltd. | Methods and kits for screening colorectal neoplasm |
EP4419714A1 (en) * | 2021-11-23 | 2024-08-28 | Pleno, Inc. | Encoded assays |
TW202328459A (zh) * | 2021-12-20 | 2023-07-16 | 大陸商江蘇鵾遠生物技術有限公司 | 一種腫瘤檢測方法及應用 |
CN114959038A (zh) * | 2022-06-13 | 2022-08-30 | 湖南宏雅基因技术有限公司 | 一种hoxa9基因甲基化检测试剂及其应用 |
CN117766028A (zh) * | 2022-09-16 | 2024-03-26 | 深圳吉因加医学检验实验室 | 一种基于甲基化差异预测样本来源的方法及装置 |
WO2024178248A1 (en) * | 2023-02-22 | 2024-08-29 | University Of Southern California | Pan-cancer early detection and mrd cfdna methylation |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2420840A1 (en) * | 2000-09-01 | 2003-02-27 | Epigenomics Ag | Method for determining the degree of methylation of defined cytosines in genomic dna in the sequence context 5'-cpg-3' |
ES2443230T3 (es) * | 2007-02-21 | 2014-02-18 | Oslo Universitetssykehus Hf | Nuevos marcadores para el cáncer |
US20100297067A1 (en) * | 2007-05-14 | 2010-11-25 | The Johns Hopkins University | Methylation markers for prostate cancer and methods of use |
US7843254B2 (en) * | 2007-10-31 | 2010-11-30 | Texas Instruments Incorporated | Methods and apparatus to produce fully isolated NPN-based bandgap reference |
WO2009108917A2 (en) * | 2008-02-29 | 2009-09-03 | Oncomethylome Sciences, S.A. | Markers for improved detection of breast cancer |
WO2011112845A2 (en) * | 2010-03-11 | 2011-09-15 | Board Of Regents, The University Of Texas System | Methods and compositions related to a multi-methylation assay to predict patient outcome |
DK3608421T3 (da) * | 2012-05-18 | 2022-09-05 | Clinical Genomics Pty Ltd | Fremgangsmåde til screening for colorektal cancer |
CA2902207A1 (en) * | 2013-02-21 | 2014-08-28 | Toma Biosciences, Inc. | Methods, compositions, and kits for nucleic acid analysis |
EP2886659A1 (en) * | 2013-12-20 | 2015-06-24 | AIT Austrian Institute of Technology GmbH | Gene methylation based colorectal cancer diagnosis |
EP3224377B1 (en) * | 2014-11-25 | 2020-01-01 | AIT Austrian Institute of Technology GmbH | Diagnosis of lung cancer |
US10801060B2 (en) * | 2015-02-24 | 2020-10-13 | Zymo Research Corporation | Assays to determine DNA methylation and DNA methylation markers of cancer |
US10961590B2 (en) * | 2015-09-17 | 2021-03-30 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Cancer detection methods |
US10385406B2 (en) * | 2016-05-05 | 2019-08-20 | Exact Sciences Development Company, Llc | Detection of lung neoplasia by analysis of methylated DNA |
-
2019
- 2019-04-08 CN CN201980039559.6A patent/CN112352057A/zh active Pending
- 2019-04-08 KR KR1020207032480A patent/KR20210003795A/ko active Search and Examination
- 2019-04-08 JP JP2020555453A patent/JP2021520809A/ja active Pending
- 2019-04-08 US US17/066,144 patent/US20210388445A1/en active Pending
- 2019-04-08 WO PCT/US2019/026395 patent/WO2019199696A1/en active Application Filing
- 2019-04-08 EP EP19785565.3A patent/EP3775290A4/en active Pending
- 2019-04-08 SG SG11202009866XA patent/SG11202009866XA/en unknown
- 2019-04-08 AU AU2019253569A patent/AU2019253569A1/en active Pending
- 2019-04-08 CA CA3096668A patent/CA3096668A1/en active Pending
- 2019-04-12 TW TW108112820A patent/TW202012638A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2019199696A1 (en) | 2019-10-17 |
KR20210003795A (ko) | 2021-01-12 |
US20210388445A1 (en) | 2021-12-16 |
CN112352057A (zh) | 2021-02-09 |
EP3775290A4 (en) | 2021-12-29 |
JP2021520809A (ja) | 2021-08-26 |
AU2019253569A1 (en) | 2020-10-29 |
SG11202009866XA (en) | 2020-11-27 |
EP3775290A1 (en) | 2021-02-17 |
CA3096668A1 (en) | 2019-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI797118B (zh) | 用於資料庫建立及序列分析之組合物及方法 | |
TW202012638A (zh) | 用於癌症及贅瘤之評估的組合物及方法 | |
US20200048697A1 (en) | Compositions and methods for detection of genomic variance and DNA methylation status | |
US20150126376A1 (en) | Compositions and methods for sensitive mutation detection in nucleic acid molecules | |
US11149305B2 (en) | Detection of rare sequence variants, methods and compositions therefor | |
US11608518B2 (en) | Methods for analyzing nucleic acids | |
EP3775274B1 (en) | Detection method of somatic genetic anomalies, combination of capture probes and kit of detection | |
US20240026440A1 (en) | Methods of labelling nucleic acids | |
CN110869515A (zh) | 用于基因组重排检测的测序方法 | |
EP4172357B1 (en) | Methods and compositions for analyzing nucleic acid | |
US20230112730A1 (en) | Compositions and methods for oncology precision assays | |
WO2024137858A2 (en) | Methods and compositions for assessing colorectal cancer | |
JP2024529674A (ja) | 同時での変異検出およびメチル化分析のための方法 |