TW201718874A - 血漿dna之單分子定序 - Google Patents

血漿dna之單分子定序 Download PDF

Info

Publication number
TW201718874A
TW201718874A TW105125873A TW105125873A TW201718874A TW 201718874 A TW201718874 A TW 201718874A TW 105125873 A TW105125873 A TW 105125873A TW 105125873 A TW105125873 A TW 105125873A TW 201718874 A TW201718874 A TW 201718874A
Authority
TW
Taiwan
Prior art keywords
dna fragments
dna
sequence
nanopore
sequencing
Prior art date
Application number
TW105125873A
Other languages
English (en)
Other versions
TWI728994B (zh
Inventor
煜明 盧
慧君 趙
淑恒 鄭
Original Assignee
香港中文大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港中文大學 filed Critical 香港中文大學
Publication of TW201718874A publication Critical patent/TW201718874A/zh
Application granted granted Critical
Publication of TWI728994B publication Critical patent/TWI728994B/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/151Modifications characterised by repeat or repeated sequences, e.g. VNTR, microsatellite, concatemer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/197Modifications characterised by incorporating a spacer/coupling moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/631Detection means characterised by use of a special device being a biochannel or pore

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Nanotechnology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

實施例可包括一種測定核酸序列之方法。該方法可包括接收複數個DNA片段。該方法亦可包括串聯該等DNA片段之第一組以獲得串聯體。該方法可包括對該串聯體執行單分子定序以獲得該串聯體之第一序列。在一些實施例中,單分子定序可使用奈米孔執行,且該方法可包括使該串聯體通過奈米孔。隨後可在該串聯體通過該奈米孔時偵測到第一電信號。該第一電信號可對應於該串聯體之第一序列。此外,該方法可包括分析該第一電信號以確定該第一序列。可比對該第一序列之子序列以鑑別對應於該等DNA片段之該第一組中之每一者的序列。

Description

血漿DNA之單分子定序 相關申請案之交叉參考
本申請案主張2015年8月12日申請之美國臨時申請案第62/204,396號之優先權權益,其內容出於所有目的以引用的方式併入本文中。
目前臨床上可藉由母本血漿DNA定序進行非侵襲性產前測試(NIPT)來篩選胎兒染色體非整倍性(1)。不同於羊膜穿刺術,母本血漿DNA定序不會造成任何流產風險。此等測試具有接近99%的敏感性及接近99%的特異性(1)。因此,自從NIPT於2011年第一次可在市面上購得,對NIPT之臨床需求就大幅增加。
大規模平行定序為染色體非整倍性之NIPT的當前所用大部分實驗室方案的核心要素(2)。因為儀器成本高,所以彼等測試當前在參考實驗室執行。Oxford Nanopore Technologies已研發出一種基於奈米孔的DNA定序平台(3)。奈米孔定序器具有相對較低的設備成本且佔據面積小。各流槽花費500至900美元且可使用多次,長達48小時。定序速度亦相對較快,每秒可自各奈米孔讀取30個鹼基。該等特徵將有利於在臨床實驗室中使用。但當前奈米孔技術對於通常用於NIPT之樣品(例如,血漿)而言效率低。
當分析含相對較小的DNA片段之樣品時,實施例提高單分子定序技術之效率。舉例而言,可顯著增加樣品中之DNA片段之濃度,從而允許 更多DNA片段與定序裝置(例如,奈米孔)相互作用。另舉例而言,將DNA片段組合成串聯體,得到可讀取的較長分子,從而允許經由一個分子之定序有效地讀取多個DNA片段(亦即,最初在樣品中之DNA片段)。可使用生物信息學程序偵測作為同一串聯體之各部分的不同DNA片段。實施例亦可組合這兩種技術。
實施例可包括一種測定核酸序列之方法。該方法可包括接收複數個DNA片段。該方法亦可包括串聯該等DNA片段之第一組以獲得第一串聯體。該方法可包括執行第一串聯體之單分子定序以獲得第一串聯體之第一序列。在一些實施例中,單分子定序可使用奈米孔執行,且該方法可包括使第一串聯體通過第一奈米孔。隨後可在第一串聯體通過第一奈米孔時偵測到第一電信號。第一電信號可對應於第一串聯體之第一序列。
其他實施例可包括一種測定核酸序列之方法。該方法可包括接收複數個DNA片段。可串聯DNA片段之第一組以獲得第一串聯體。可使經螢光標記之核苷酸與串聯體雜交。可偵測第一螢光信號,其中第一螢光信號對應於特定核苷酸。隨後可裂解掉螢光標記且可添加經另一螢光標記之核苷酸,且可重複該過程。
實施例可包括一種藉由電腦系統執行的方法。該方法可包括接收由串聯DNA片段之第一組產生的第一串聯體的第一序列。該方法亦可包括比對第一序列之子序列以鑑別對應於DNA片段之第一組之各DNA片段的片段序列。
一些實施例可包括一種對不含細胞之DNA片段進行定序的方法。不含細胞之DNA片段可包括血漿DNA片段。該方法可包括接收包括複數個DNA片段之生物樣品。生物樣品可具有第一濃度之DNA片段。該方法亦可包括濃縮生物樣品以具有第二濃度之DNA片段。DNA片段之第二濃度可比DNA片段之第一濃度高出5倍或超過5倍。該方法可進一步包括使複數個DNA片段通過基板上之奈米孔。關於複數個DNA片段中之每一者, 可在DNA片段通過奈米孔時偵測電信號。電信號可對應於DNA片段之序列。
實施例可包括一種對不含細胞之DNA片段進行定序的方法。該方法可包括濃縮生物樣品以具有第二濃度之DNA片段,DNA片段之第二濃度比DNA片段之初始濃度高出5倍或超過5倍。該方法可進一步包括單分子定序技術。DNA片段可與經螢光標記之核苷酸雜交。該方法亦可包括偵測來自經螢光標記之核苷酸的信號,其中該信號對應於該核苷酸。可裂解掉經螢光標記之核苷酸,且可重複該過程以鑑別額外核苷酸及DNA片段之序列。
實施例亦可包括電腦產品,該電腦產品包括電腦可讀取媒體,其儲存複數個用於執行本文所述之DNA定序方法中之任一者的操作的指令。一些實施例可包括電腦產品及一或多個用於執行儲存於電腦可讀取媒體上之指令的處理器。其他實施例包括用於執行該等方法中之任一者的系統。
其他實施例係關於與本文所述之方法相關之系統、可攜式消費型裝置及電腦可讀取媒體。
可參考以下詳細描述及隨附圖式來獲得對本發明實施例之性質及優勢的較佳理解。
術語
「組織」對應於一組細胞,其共同歸類為一個功能單元。可在單一組織中找到超過一種類型之細胞。不同類型的組織可由不同類型的細胞(例如肝細胞、肺泡細胞或血細胞)組成,但亦可對應於來自不同生物體(母親與胎兒)的組織或對應於健康細胞與腫瘤細胞。
生物樣品」係指自個體(例如人類,諸如孕婦、癌症患者或疑似患有癌症者、器官移植接受者,或疑似具有涉及器官之疾病過程(例如心臟心肌梗塞或腦中風或造血系統貧血)的個體)獲得且含有所關注之一或多種核酸分子的任何樣品。生物樣品可為體液,諸如血液、血漿、血清、尿液、陰道流體、來自水囊腫(例如睪丸)之流體、陰道沖洗液、胸膜液、腹水液、腦脊髓液、唾液、汗液、淚液、痰、支氣管肺泡灌洗液、乳頭排放液、來自身體不同部分(例如甲狀腺、乳房)之抽吸流體等。亦可使用糞便樣品。在各種實施例中,不含細胞之DNA已增濃之生物樣品(例如經由離心方案獲得的血漿樣品)中的大部分DNA可不含細胞,例如大於50%、60%、70%、80%、90%、95%或99%的DNA可不含細胞。離心方案可包括例如3,000g×10分鐘,獲得流體部分,且在例如30,000g下另外再離心10分鐘以移除殘餘細胞。樣品中之不含細胞之DNA可源自各種組織之細胞,且因此樣品可包括不含細胞之DNA之混合物。
核酸」可指去氧核糖核苷酸或核糖核苷酸及其呈單股或雙股形式之聚合物。該術語可涵蓋含有已知核苷酸類似物或經修飾主鏈殘基或鍵聯之核酸,其為合成的、天然產生的及非天然產生的,具有與參考核酸類似之結合性質,且以類似於參考核苷酸之方式代謝。該等類似物之實例可包括(但不限於)硫代磷酸酯、胺基磷酸酯、膦酸甲酯、對掌性膦酸甲酯、2- O-甲基核糖核苷酸、肽核酸(PNA)。
除非另外指示,否則特定核酸序列亦隱含地涵蓋其經保守修飾之變異體(例如簡併密碼子取代)及互補序列,以及明確指示之序列。特定言之,簡併密碼子取代可藉由產生一或多個(或所有)所選擇之密碼子之第三位置經混合鹼基及/或去氧肌苷殘基取代之序列來達成(Batzer等人,Nucleic Acid Res.19:5081(1991);Ohtsuka等人,J.Biol.Chem.260:2605-2608(1985);Rossolini等人,Mol.Cell.Probes 8:91-98(1994))。術語核酸可與基因、cDNA、mRNA、寡核苷酸及聚核苷酸互換使用。
除非上下文另外清楚地指出,否則術語「核苷酸」除指代天然產生之核糖核苷酸或去氧核糖核苷酸單體之外,應理解亦指其關於核苷酸正使用之特定情況(例如,與互補鹼基雜交)在功能上等效的相關結構變異體,包括衍生物及類似物。
串聯體」為由已組合成單一分子之獨立DNA片段構成的連續DNA分子。串聯體之獨立DNA片段中之各者可具有或可不具有相同序列。串聯體中之DNA片段中之至少一些可具有不同序列。用於製造串聯體之獨立DNA片段可源自存在於生物樣品中之各種組織,例如當DNA片段為不含細胞之DNA片段時,如可以血漿及其他不含細胞之DNA混合物形式出現。
序列讀數」係指自核酸分子之任何部分或全部定序的一串核苷酸。舉例而言,序列讀數可為存在於生物樣品中之整個核酸片段。序列讀數可自單分子定序獲得。「單分子定序」係指對單模板DNA分子進行定序以獲得序列讀數,而不需要解讀來自模板DNA分子之純系複本之鹼基序列資訊。單分子定序可對整個分子或DNA分子之僅一部分進行定序。可對DNA分子之大部分進行定序,例如大於50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%。
關於定序,「信號」可指在某一時刻獲得的量測結果。該等信號之實例包括光信號或電信號。光信號可提供對應於特定顏色之影像,特定顏色對應於特定鹼基,例如在發生雜交時。單一影像可為一批定序裝置(例如,奈米孔或其他定序體積)之單一影像,從而具有含諸多光信號之單一影像。電信號可為在某一時刻電極兩端的量測結果。某一時間段的電信號可提供DNA分子序列中之一或多個鹼基。電信號可包括電流信號或電壓信號。
奈米孔」係指可將分子或分子之一部分置放於其中的開口,其中可基於在奈米孔中之分子部分的一或多種性質偵測信號。奈米孔可由各種材料構成,諸如聚合物、金屬或其他固態材料、蛋白質或其組合。
分類」係指與樣品之特定性質相關的任何數字或其他字元。舉例而言,符號「+」(或詞語「陽性」)可表示樣品歸類為具有缺失或擴增。分類可為二元的(例如陽性或陰性)或具有更多分類層級(例如1至10或0至1之量表)。術語「截止值」及「臨限值」係指操作中所用之預定數字。舉例而言,截止大小可指不包括超過該大小之片段。臨限值可指高於或低於該值,特定分類適用。可在此等情況中之任一者中使用此等術語中之任一者。
如本文所用之術語「染色體非整倍性」意謂染色體之定量與二倍體基因組之定量的差異。該差異可為增加或丟失。其可涉及整一條染色體或染色體之某個區域。
如本文所用之術語「序列不平衡」或「畸變」意謂臨床相關染色體區域之數量與參考數量的如藉由至少一個截止值所限定的任何顯著偏差。序列不平衡可包括染色體量不平衡、對偶基因不平衡、突變量不平衡、複本數不平衡、單倍型量不平衡及其他類似不平衡。舉例而言,對偶基因不平衡可在腫瘤基因組中之兩個對偶基因中的一個對偶基因之基因缺失或一個對偶基因之基因擴增或差異擴增,從而引起樣品中之特定基因座不平衡 時出現。另舉例而言,患者可能具有腫瘤抑制基因的遺傳性突變。患者可能隨後繼續發展出腫瘤,其中腫瘤抑制基因之非突變對偶基因缺失。因此,在腫瘤內,存在突變量不平衡。當腫瘤之DNA釋放至患者血漿中時,腫瘤DNA將與患者之組成性DNA(來自正常細胞)在血漿中混合。經由使用本文所述之方法,可偵測到血漿中之此DNA混合物之突變量不平衡。畸變可包括染色體區域缺失或擴增。
術語「大小概況」大體上關於生物樣品中之DNA片段的大小。大小概況可為提供各種大小之DNA片段之量的分佈的直方圖。可使用各種統計參數(亦稱作大小參數或僅參數)區分一個大小概況與另一大小概況。一個參數為具有某一特定大小或大小範圍之DNA片段相對於所有DNA片段或相對於具有另一大小或大小範圍之DNA片段的百分比。
10‧‧‧電腦系統
71‧‧‧輸入/輸出(I/O)控制器
72‧‧‧系統記憶體
73‧‧‧中央處理器
74‧‧‧印表機
75‧‧‧系統匯流排
76‧‧‧監測器
77‧‧‧輸入/輸出(I/O)埠
78‧‧‧鍵盤
79‧‧‧儲存裝置
81‧‧‧外部介面
82‧‧‧顯示配接器
85‧‧‧資料收集裝置
102‧‧‧奈米孔
104‧‧‧DNA分子
106‧‧‧電極
108‧‧‧電極
110‧‧‧電源
112‧‧‧電流
114‧‧‧儀錶
152‧‧‧DNA片段
154‧‧‧DNA片段
156‧‧‧DNA片段
158‧‧‧DNA片段
160‧‧‧串聯體
202‧‧‧DNA片段
204‧‧‧DNA片段
206‧‧‧DNA片段
208‧‧‧DNA片段
210‧‧‧間隔DNA片段
212‧‧‧串聯體
300‧‧‧方法
302‧‧‧方塊
304‧‧‧方塊
306‧‧‧方塊
350‧‧‧方法
352‧‧‧方塊
354‧‧‧方塊
356‧‧‧方塊
358‧‧‧方塊
360‧‧‧方塊
362‧‧‧方塊
400‧‧‧方法
402‧‧‧方塊
404‧‧‧方塊
500‧‧‧方法
502‧‧‧方塊
504‧‧‧方塊
506‧‧‧方塊
508‧‧‧方塊
510‧‧‧方塊
1500‧‧‧系統
1502‧‧‧患者
1504‧‧‧提取裝置
1506‧‧‧製備裝置
1508‧‧‧單分子定序裝置
1510‧‧‧電腦系統
圖1A顯示根據本發明實施例之奈米孔裝置及核酸的簡圖。
圖1B展示根據本發明實施例串聯DNA片段之方法。
圖2描繪根據本發明實施例將DNA片段與間隔DNA片段串聯在一起的方法。
圖3A顯示藉由串聯DNA片段及使用根據本發明實施例之單分子定序進行DNA片段定序之方法的簡化方塊流程圖。
圖3B顯示使用根據本發明實施例之奈米孔定序進行DNA片段定序之方法的簡化方塊流程圖。
圖4顯示根據本發明實施例分析串聯體之序列之方法的簡化方塊流程圖。
圖5顯示根據本發明實施例藉由使DNA片段之濃度增加多倍以對DNA片段進行更有效地定序之方法的簡化方塊流程圖。
圖6顯示根據本發明實施例藉由奈米孔定序器定序之血漿DNA池的大小分佈。繪製在0至500個鹼基對之範圍內之經定序血漿DNA片段的頻率分佈。
圖7顯示根據本發明實施例,根據藉由奈米孔定序及藉由Illumina定序平台獲得的資料,來自含女性胎兒之母本血漿的血漿DNA之大小概況。
圖8顯示根據本發明實施例,染色體之讀數分佈對比自可映射人類基因組預測的分佈。讀取每個樣品池中各染色體的奈米孔序列之比例分佈。 灰色填充條表示源自各別人類染色體之核苷酸,基於參考人類基因組之可映射部分(hg 19)的比例。其餘有色條表示血漿DNA樣品中與各別人類染色體對準之經定序讀數的比例。
圖9顯示根據本發明實施例使用奈米孔定序及大規模平行定序對癌症患者之血漿DNA進行定序的結果之Circos圖。
圖10顯示根據本發明實施例之經串聯DNA分子的大小分佈。
圖11顯示根據本發明實施例源自非妊娠女性之串聯鏈段的血漿DNA分子之大小分佈。
圖12顯示根據本發明實施例來自非妊娠女性之串聯血漿DNA的對準鏈段之基因組表示。
圖13顯示根據本發明實施例源自懷有男性胎兒之女性的串聯鏈段的血漿DNA分子之大小分佈。
圖14顯示根據本發明實施例來自懷有男性胎兒之女性的串聯血漿DNA之對準鏈段的基因組表示。
圖15顯示根據本發明實施例執行之系統的方塊圖。
圖16顯示可與根據本發明實施例之系統及方法一起使用的例示性電腦系統的方塊圖。
實施例可提高單分子定序在應用於生物樣品(例如,血漿或血清)中之不含細胞之DNA片段時的效率,該等DNA片段為約200個鹼基之相對較短的片段。因為不含細胞之DNA片段(諸如血漿DNA片段)小或短且通常以低濃度存在於生物樣品中,所以預期使用奈米孔對不含細胞之DNA片段進行定序可能無法提供準確結果。通過小孔之小片段使得難以在片段於奈米孔中的同時對片段進行定序。此外,在小片段之情況下,鑒於所預測的定序誤差,與參考基因組比對可能更困難。奈米孔定序可具有約10-15%之定序誤差。在實施例中,可藉由串聯DNA片段以產生較長分子進行定序來提高效率。在其他實施例中,可藉由增加樣品中之DNA片段之濃度來提高效率。
沒有此等發展,對血漿DNA之單分子定序可能就不切實可行。藉由此等方法,可藉由單分子定序偵測一系列血漿DNA畸變。實施例可適用於諸多醫學領域,包括產前診斷、癌症評定、發炎性疾病管理、自體免疫疾病評定及急性醫療,諸如創傷。另外,已報導,可藉由單分子定序區分 甲基化胞嘧啶與未甲基化胞嘧啶(12)。吾人先前已報導,藉由偵測血漿DNA之甲基化圖譜,我們能夠測定胎兒DNA分數,用異常胎盤甲基化圖譜偵測妊娠相關疾病,偵測與癌症及全身性紅斑性狼瘡症相關的異常甲基化(7,9,11)。因此,實施例亦可用於偵測甲基化之應用中。
I. DNA片段之單分子定序
血漿或血清DNA為存在於人類個體之循環中之不含細胞的核酸分子且在細胞死亡過程期間釋放,作為自然轉換或病理過程之一部分。因為DNA分子釋放至循環中,作為細胞降解過程之一部分,所以其以短片段(<200bp)形式循環且以低濃度存在。已知健康個體中之大部分血漿DNA源自血液細胞(6)。
在妊娠期間,胎盤貢獻血漿DNA分子至母體循環中且為非侵襲性產前診斷提供接近胎兒DNA之方式(7)。腫瘤及癌症具有高細胞轉換速率且貢獻DNA至血漿中,其中染色體及基因異常可以非侵襲性地偵測且充當用於癌症診斷、監測、篩選及預測的液態生檢(8,9)。諸如心肌梗塞、中風、肝炎及其他病況之發炎病況亦導致來自發炎器官之血漿DNA貢獻增加(10)。諸如全身性紅斑性狼瘡症之自體免疫疾病亦與血漿DNA異常相關(11)。在以上所提及之疾病中,血漿DNA圖譜可顯示與疾病、染色體或亞染色體複本數畸變(複本數增加或丟失,非整倍性)、異常甲基化(高甲基化或低甲基化)及大小概況異常(額外量之短DNA分子或額外量之長DNA分子)相關的單核苷酸變異。綜上所述,循環中之不含細胞之DNA分析已變成研發各種疾病之分子診斷測試的重要手段。
單分子定序不限於由Oxford Nanopore Technologies製造的形式,因為可以高速鑑別各DNA鹼基,所以為進行DNA定序分析的有吸引力的平台。因為避免了擴增步驟,所以文庫構築之工作流程得以簡化。其可對DNA之連續延伸段,多達數百個千鹼基進行定序。然而,該等優點不容易應用於血漿DNA分析。首先,血漿DNA分子為短片段,長度通常<200 bp。血漿及血清中之DNA濃度基本上低於組織生檢中之DNA濃度。因此,當向奈米孔定序器施加血漿DNA樣品時,定序效率低。換言之,樣品中之DNA過稀且血漿DNA分子找到通向奈米孔之路的頻率過低。即使在血漿DNA分子找到通向奈米孔之路且得以定序時,因為其長度短,所以定序資訊僅提供極少量的關於人類基因組的資訊。單倍體人類基因組的大小為3.3×109個鹼基。此外,可預測使用奈米孔定序之錯誤率,使得短DNA片段之定序比定序長DNA片段時甚至更不準確。因此,吾人旨在研發用於增大血漿DNA分子可用奈米孔及其他單分子定序裝置處理之頻率或可能性的方法。
A. 奈米孔定序
奈米孔定序為一種形式之單分子定序器,其中經由使用奈米孔偵測DNA鹼基。Oxford Nanopore Technologies使用蛋白質孔,α-溶血素。該等孔之基質製造成位於膜上(5)。除蛋白質孔之外,奈米孔亦可為固態奈米孔,其中奈米孔係在半導體材料中製造,包括矽化合物(諸如氮化矽)及石墨烯。各孔可連接至電路。
圖1A顯示根據本發明技術之實施例的奈米孔102及DNA分子104的簡圖。電極106及電極108可限定奈米孔之部分或可位於奈米孔附近。電極106及電極108顯示為具有可為錐形或三角形之末端。在一些實施例中,電極可具有不同形狀。舉例而言,電極可具有平直末端、半球形末端或圓形末端。兩個電極可不具有相同形狀。舉例而言,一個電極可具有錐形末端且另一電極可為平直電極。電極之間的距離可等於、小於或大於奈米孔之直徑或寬度。電極106及電極108可連接至電源110。電流112可自電極106穿隧至電極108。電源110可與複數個奈米孔及各對電極電通信。
當DNA分子104通過奈米孔102時,電流將發生變化,其可藉由儀錶114量測。不同DNA鹼基(即A、C、G、T)將誘導不同量值的電流變化。藉由觀察各奈米孔之電壓或電流模式,可測定已通過奈米孔102之DNA分 子104的序列。因為該定序之敏感性足以偵測單個DNA分子上之DNA鹼基,亦即不需要擴增DNA定序文庫,所以序列偵測速度得到大幅提昇。
然而,缺點在於,相比於自各DNA分子之擴增純系偵測共同序列的定序技術(諸如Illumina定序),DNA鹼基鑑別之準確性相對較差。然而,已顯示,當解讀2D讀數時,鹼基偵測準確性大大提高(3)。當製備用於奈米孔定序之DNA樣品時,向各雙股DNA分子之一個末端添加髮夾轉接蛋白。當此類DNA分子接近奈米孔時,雙股將分開,且當可偵測到電流變化時,現在的單股DNA分子之一個末端將通過奈米孔。當定序接近此單一末端之末端時,藉由髮夾連接之互補股將繼續通過奈米孔且得以定序。當DNA分子之兩股均定序好時,可衍生出共同序列且此稱為2D讀數。如文獻中所報導,2D讀數之鹼基判讀準確性高於1D讀數(僅自單股解讀之序列)。
B. 其他單分子定序
實施例亦可包括除使用奈米孔之技術以外的單分子定序技術。舉例而言,藉由Helicos單分子定序器(SeqLL),DNA分子可雜交至玻璃表面上。隨後可向各DNA分子中添加經螢光標記之核苷酸,且可擷取影像。隨後可裂解掉及洗掉螢光分子且可添加經另一螢光標記之核苷酸,且重複該過程。各核苷酸可具有不同螢光標記,使得DNA得以定序。
另一實例可包括Pacific Biosciences單分子即時(SMRT)定序法。在此方法中,可將DNA聚合酶黏附至零模式波導(ZWM)之底部。聚合酶隨後可捕捉單個DNA分子。隨後可將經螢光標記之核苷酸併入DNA-酶複合物中。偵測器隨後可偵測螢光信號,且可進行鹼基判讀。螢光標籤隨後可裂解且可自ZWM擴散出去。該過程可用各類型具有不同螢光標記之核苷酸重複,使得DNA得以定序。
II. 提高效率
為提高效率,一項選擇為擴增血漿DNA池以在施加至定序腔室或流 槽之有限體積內增大樣品中之遺傳物質之量。然而,採用此類方案將意謂不再執行單分子定序,因為現在將對初始DNA模板及所有所複製之DNA片段進行定序。當嘗試獲得關於初始DNA片段之定量資訊(例如指定基因組區域(諸如整個染色體)中初始DNA片段之複本數)時,如此使用所複製之DNA片段會產生誤差。
在以下部分中,描述兩種用於提高效率之方法。在一種方法中,在執行單分子定序之前,DNA片段可串聯形成串聯體。在另一種方法中,在單分子定序之前(例如,在奈米孔定序之前),高度濃縮樣品中之DNA片段。
A. 串聯體
在一些實施例中,可串聯DNA片段(例如,血漿DNA片段),如圖1B中所示。串聯可將一系列DNA片段彼此連接。舉例而言,樣品中可存在DNA片段152及DNA片段154。作為將DNA片段彼此連接之初始程序,可藉由向末端添加磷酸酯基來製備DNA片段152及DNA片段154之末端,產生DNA片段156及DNA片段158。隨後可藉由連接酶以平端連接將DNA片段連接在一起,形成長DNA分子,例如串聯體160。串聯體160可視為新分子,其為DNA片段152及154之組合。串聯體160之序列將為對應於DNA片段152及154之子序列的組合。
圖2顯示類似的串聯體形成方法,其中在DNA片段之間具有間隔片段(亦僅稱作「間隔子」)。DNA片段202及DNA片段204可經歷「加A尾(A-tailing)」,其中可向DNA片段各股之一個末端中添加核苷酸A,形成DNA片段206及DNA片段208。間隔DNA片段210可具有已知序列,其中在間隔DNA片段各股之一個末端上具有核苷酸T。間隔DNA片段之已知序列可小於20個鹼基對,包括4至10個鹼基對及10至20個鹼基對,不包括添加至間隔片段末端上的核苷酸A或T。亦可在間隔DNA片段及血漿DNA片段之末端使用其他互補核苷酸。間隔DNA片段210隨後可藉由連接酶與 DNA片段206及DNA片段208相連,形成長DNA分子,顯示為串聯體212。可將間隔DNA片段置放於不為間隔子的兩個DNA片段之間。舉例而言,一個間隔DNA片段可在兩個自生物樣品中取出的DNA片段之間。串聯體212之序列可為對應於DNA片段206及208以及一或多個間隔DNA片段210之序列的組合。
在一些實施例中,間隔片段可指示一個DNA片段之末端及另一DNA片段之開頭,例如當間隔片段之已知序列未出現在對應於個體之參考基因組(例如,人類基因組)中或以小於特定倍數(例如,小於2或3)出現時。電腦系統可藉由比較子序列與預期的一組一或多個用於間隔片段之已知序列來鑑別間隔片段之序列。在一些實施方案中,間隔片段可僅為在單一位置之A-T組合。在該等實施方案中,A及T可主要用於連接,與任何關於DNA片段何時開始及結束之鑑別截然不同。
含間隔子之方法可包括鑑別對應於生物樣品之DNA片段的子序列之起始鹼基。起始鹼基之鑑別可基於間隔DNA片段之已知序列中之一者的鑑別。子序列之終止鹼基可基於鑑別在子序列之後的間隔DNA片段之已知序列中之一者來鑑別。
藉由此等方法,當長分子(串聯體)到達奈米孔時,可對多個血漿DNA片段進行定序,因為串聯體可在單個長分子中包括若干個血漿DNA片段。因為血漿DNA分子可為天然雙股,所以可在串聯體末端施加髮夾轉接蛋白,使得可產生2D讀數,亦即讀取兩股。在定序之後,可鑑別併入串聯體中之血漿DNA分子的初始單位。自若干DNA片段創建出長分子且在奈米孔中對長分子進行定序的效率大於等待相同的若干個分子分別移動至奈米孔中進行定序。
1. 在單分子定序中使用
圖3A顯示藉由串聯DNA片段及使用根據本發明實施例之單分子定序進行DNA片段定序之方法300的簡化方塊流程圖。
在方塊302,方法300可包括接收複數個DNA片段。複數個DNA片段可為來自生物樣品之不含細胞之DNA片段。生物樣品可為血漿或血清。DNA片段可與生物樣品之其他組分分離,例如血漿與其他血液組分分離。DNA片段可為本文所述之任何DNA片段。
在方塊304,方法300可包括串聯DNA片段之第一組以獲得第一串聯體。串聯可藉由本文所述之任何方法進行。第一串聯體可包括除第一組以外之DNA片段。因此,第一組DNA片段並非構成第一串聯體之全部DNA片段。第一串聯體中之其他DNA片段可包括間隔DNA片段。
方塊306顯示,方法300亦可包括執行第一串聯體之單分子定序以獲得第一串聯體之第一序列。單分子定序可包括奈米孔定序。可向定序裝置提供第一串聯體作為執行單分子定序之一部分。定序裝置可為奈米孔裝置、光波導、經組態以使得串聯體雜交至流槽上的流槽或任何發生單一DNA分子之序列偵測的反應槽或位置。流槽之實例可包括寡核苷酸黏著於流槽表面之流槽,其中寡核苷酸可與第一串聯體雜交。方法300可進一步包括使用定序裝置偵測對應於第一串聯體之複數個信號。複數個信號可對應於第一串聯體之第一序列。信號可包括來自螢光標記或與第一串聯體結合的具有光學可偵測信號之其他標記的信號。來自螢光標記之信號可藉由光學偵測器、雷射、電荷耦合裝置、零模式波導、可測定光學事件之存在或不存在的其他光學敏感裝置或其組合偵測。
2. 偵測奈米孔中之電信號
圖3B顯示使用根據本發明實施例之奈米孔定序進行DNA片段定序之方法350的簡化方塊流程圖。在方法350中,定序裝置為奈米孔,其可以奈米孔陣列形式存在於基板上。方法350之態樣可在實施方法300時執行。
在方塊352,方法350可包括接收複數個DNA片段。複數個DNA片段可為來自生物樣品之不含細胞之DNA片段。生物樣品可為血漿或血清。 DNA片段可與生物樣品之其他組分分離,例如血漿與其他血液組分分離。
可在用於進行串聯之容器中接收DNA片段。容器可為小瓶或管子,諸如艾本德管(Eppendorf tube)。DNA片段可在容器中與連接酶及緩衝劑混合。
方塊354顯示方法350亦可包括串聯DNA片段之第一組以獲得第一串聯體。串聯可藉由本文所述之任何方法進行。第一串聯體可包括除第一組以外之DNA片段。因此,第一組DNA片段並非構成第一串聯體之全部DNA片段。
可平行執行多個串聯製程,其中各製程形成獨立串聯體。各種串聯體可具有不同長度,例如因為不同DNA片段可具有不同長度且因為可將不同數目之DNA片段併入串聯體中。舉例而言,一個串聯體可由3個DNA片段構成且另一串聯體可由100個DNA片段構成。
在方塊356中,方法350可進一步包括使第一串聯體通過第一奈米孔。第一奈米孔可為基板上之複數個奈米孔中之一者。使第一串聯體通過第一奈米孔可包括使第一串聯體之第一股通過奈米孔。在第一股通過奈米孔之後,第一串聯體之第二股可通過奈米孔。第一股及第二股可藉由髮夾轉接蛋白連接。以此方式,兩股均可得以定序,其可為鹼基判讀提供較大準確性。可比較兩股之電信號作為鹼基判讀之一部分。
在方塊358中,隨後可在第一串聯體通過第一奈米孔時偵測到第一電信號。第一電信號可對應於第一串聯體之第一序列。第一電信號可包括電流或電壓。在不存在第一串聯體通過第一奈米孔的情況下,在電極之間有離子電流通過。當諸如串聯體之生物分子通過電極之間時,生物分子會影響離子或電子在電極之間的通過。因此,電流或電壓會減小。變化之量值可能與在電極之間的生物分子部分相關。舉例而言,當特定核苷酸或官能基通過電極之間時,電流或電壓可具有特定電信號簽名。
在一些實施例中,奈米孔可為電路之一部分,該電路包括兩個電極。兩個電極之間的電流可基於奈米孔中存在何種核苷酸(鹼基)或相應標籤而改變。可使用任何適合量測電路中之電壓或電流的技術偵測第一電信號。
在方塊360中,方法350可包括分析第一電信號以確定第一序列。分析可包括比較電信號模式與對應於特定鹼基之已知模式。奈米孔之鹼基判讀可包括使用不同模型,包括隱馬爾可夫模型(hidden Markov model),如Schreiber J.及Karplus K.,「Analysis of nanopore data using hidden Markov models」,Bioinformatics 2015 31:1897-1903中所論述,其出於所有目的以引用的方式併入本文中。分析可包括藉由電腦系統分析第一股及第二股之第一電信號以確定第一序列。舉例而言,可測定第一股及第二股之序列,且可將兩個序列互相比較。該等序列應該為互補的。不互補之位置可以例如忽略或再分析。
在一些實施例中,第一電信號之分析可用於確定第一串聯體之各個位點(例如CpG位點)的甲基化分類。甲基化分類可包括鹼基是否甲基化、是否存在異常甲基化(高甲基化或低甲基化)(例如,諸如CpG島之區域是否具有異常甲基化)及串聯體是否經羥基甲基化。
在方塊362中,方法350可包括比對第一序列之子序列以鑑別對應於DNA片段之第一組中之每一者的片段序列。子序列可為第一序列中之任一組相鄰鹼基,例如如藉由滑動窗指定。可執行與參考基因組之比對,其可在與參考基因組比對時考慮到錯配。下文更詳細地描述子序列之比對。
可對DNA片段之第二組執行串聯以獲得第二串聯體,以及對DNA片段之其他組執行串聯以獲得其他串聯體。串聯體中之每一者可具有與其他串聯體不同的DNA片段組合或排列。串聯體中之每一者可通過複數個奈米孔之第一奈米孔或其他奈米孔,該等奈米孔可包括定序裝置。可在其他串聯體中之每一者通過奈米孔時獲得其他電信號。其他電信號可對應於其 他串聯體之對應序列。涉及其他串聯體之詳情可類似於涉及第一串聯體之方法。
方法350亦可包括測定第一串聯體之第一組DNA片段中之每一者的大小。亦可測定其他串聯體之其他組DNA片段之DNA片段的大小。舉例而言,可藉由比對子序列與參考基因組或已知間隔序列來測定DNA片段之大小。舉例而言,若可鑑別間隔序列,則可按兩個間隔序列之間的鹼基之數目鑑別DNA片段之長度。在使用間隔序列之該等實施例中,DNA片段之經鑑別序列不必與參考基因組比對來鑑別該等序列,因為間隔序列可提供該等資訊。此外,可在與參考基因組比對之後或代替與參考基因組比對,組裝DNA片段之序列。當與參考基因組比對時,測定DNA片段之大小可包括測定與參考基因組之單一區域對準的最長子序列之長度。
3. 比對子序列
圖4中所示,實施例可包括藉由電腦系統執行之方法400。圖4顯示根據本發明實施例分析串聯體之序列之方法的簡化方塊流程圖。
在方塊402中,方法400可包括接收由串聯DNA片段之第一組產生的第一串聯體的第一序列。在一些實施例中,第一串聯體可藉由串聯DNA片段之第一組及DNA片段之第二組產生。可自鹼基判讀常式接收第一序列,鹼基判讀常式可存在於定序裝置上,定序裝置中亦可存在電腦系統。作為另一實例,電腦系統可與定序裝置分開且可基於網路連接或經由可卸除式記憶體裝置接收第一序列。串聯體可為任何串聯體,例如如本文所述。
在方塊404中,方法400亦可包括比對第一序列之子序列以鑑別對應於DNA片段之第一組之各DNA片段的片段序列。在一些實施例中,比對子序列可包括比對子序列與DNA片段之第二組。DNA片段之第二組可為如本文所述之間隔DNA。間隔DNA可為已知序列,其可小於或等於20個核苷酸,包括15至20、10至15及5至10個核苷酸。
在一些實施例中,方法400可包括比對第一序列之子序列與參考基因組。參考基因組可為人類基因組。為鑑別血漿DNA分子之初始單位,實施例可經由窗口比對長DNA序列與人類基因組。舉例而言,滑動窗(例如,100-300個鹼基)可選自串聯體之長序列,且可比對窗序列(子序列)與參考基因組。參考基因組可為人類參考基因組之衍生物,例如(但不限於)人類基因組序列之子集、重複序列遮蔽之基因組、外顯子組或含中等或平衡GC含量之基因組的一部分。
窗口可以小於窗口長度之量(例如,20-50個鹼基)向前移動(滑動)或反轉。窗口在其新位置時可視為第二窗口。此第二窗口之子序列亦可與參考基因組比對。若第二窗口之子序列與參考基因組中與參考基因組之前一個子序列重疊的子序列對準,則該兩個子序列可視為同一DNA片段之一部分。若兩個滑動窗與參考基因組之不同的非相鄰或非重疊區域對準,則兩個DNA片段之序列可得以區分。
若該子序列不與該基因組對準,但前一子序列或後一子序列與該基因組對準,則可鑑別兩個DNA片段之間的交集(邊緣)。可分析兩個DNA片段所對準之區域以確定特定交點(例如,一個DNA片段之起始鹼基及另一DNA片段之終止鹼基)。此交集可為DNA片段子序列之終止或開始。當在串聯體構築中不使用間隔子時,此方法可能尤其適用。在其他實施例中,可向初始分子之末端添加特定序列(例如,特定條形碼或間隔子),且彼等特定序列可指示一個分子之終止及另一分子之起始。
因此,實施例中可發現屬於人類基因組上之不同區域的DNA鹼基延伸段或鏈段(通常長度長達數百個鹼基)。DNA鹼基之各相鄰延伸段或鏈段可表示一個初始血漿DNA分子。與人類基因組之不同遠端部分對準的相鄰並列的DNA延伸段或鏈段可屬於組裝成串聯體之其他血漿DNA分子。
窗口之大小及窗口移動或滑動之步長的大小可基於針對DNA片段之大小的所要解析度進行調節。較小的步長大小可增加DNA片段之測定大 小的解析度,同時增加計算強度。較大的窗口大小可能無法識別小於該窗口大小之DNA片段,而較小的窗口大小可能無法產生與基因組之獨特對準。
窗口大小及步長大小可進行動態調節。舉例而言,可使用大的步長大小使潛在匹配區域變窄,且隨後可減小步長大小以更精確地鑑別匹配。子序列之比對可為與參考基因組之染色體或染色體區域的比對。子序列之比對可包括允許多個或一定頻率之錯配以考慮到定序誤差。舉例而言,序列之比對可允許小於或等於約10-15%之錯配。
如下文所論述,此方法可有效對血漿DNA分子進行定序,鑑別人類染色體,偵測各染色體之核苷酸含量之間的比例差異及測定初始血漿DNA樣品在串聯之前的大小概況。串聯體可包括來自整個基因組之DNA片段。串聯體中之DNA片段可自所有或幾乎所有染色體隨機分佈。
B. 增加濃度
另一實施例可包括增加裝載至流槽之樣品腔室上的血漿DNA文庫之濃度。一般不預期增加血漿DNA之濃度來提高奈米孔定序之效率。奈米孔具有相對較高的定序誤差,且鑒於來自血漿及其他不含細胞之樣品的分析用DNA片段小以及該等不含細胞之樣品中之DNA濃度低,所以預期奈米孔將無法有效地對片段進行定序。預期增加DNA片段之濃度不會解決此問題。然而,藉由濃縮所提取之DNA或輸入定序文庫,到達奈米孔或其他單分子分析技術之DNA分子的可能性增大。所提取DNA之濃縮涉及超過所需水準濃縮以獲得與定序技術相容的體積。在一些情況下,所提取DNA之濃度可增加超過10倍。換言之,體積可降低至小於初始體積之10%。
圖5顯示根據本發明實施例藉由使DNA片段之濃度增加多倍以對DNA片段進行更有效地定序之方法500的簡化方塊流程圖。方法500可用於各種單分子定序平台。在所提供之實例中,描述了奈米孔定序平台。
在方塊502中,方法500可包括接收包括複數個DNA片段之生物樣品。生物樣品可具有於起始體積中之第一濃度之DNA片段。生物樣品可為各種類型,例如如本文所述。舉例而言,生物樣品可為血漿或血清。
在方塊504中,方法500亦可包括濃縮生物樣品以具有第二濃度之DNA片段。作為各種實例,DNA片段之第二濃度可比DNA片段之第一濃度高出5倍或超過5倍、6倍或超過6倍、7倍或超過7倍、8倍或超過8倍、9倍或超過9倍、10倍或超過10倍、50倍或超過50倍、100倍或超過100倍、500倍或超過500倍、或1000倍或超過1000倍。濃度可按照體積或按照質量量測。
濃縮可以各種方式實現,如熟習此項技術者將瞭解。舉例而言,可藉由真空乾燥、藉由滲流或過濾移除流體或藉由熟習此項技術者已知之其他濃縮技術濃縮生物樣品。過濾或滲流可與離心及迫使流體穿過大小過濾器或分子篩相組合。半透膜可允許流體沿一個方向流動,亦可用於濃縮。濃縮後生物樣品之體積減小量可與濃度增加量成反比。舉例而言,若濃度增加5倍,則體積可減小5倍。
濃度之增加量可顯著大於習知製程中。在一些習知製程中,自一定體積之血漿中提取較小體積之血漿DNA。為減小體積以滿足分析儀器中之反應體積或其他要求,可進一步濃縮體積。舉例而言,在習知製程中,可自4mL血漿中提取210μL血漿DNA。可將210μL血漿DNA濃縮至85μL以便提供100μL之總反應體積。藉由習知製程,濃度增加小於3倍,且血漿DNA未濃縮至可提高定序準確性或精確性。在本發明方法中,增加的濃度可引起DNA片段更頻繁地通過奈米孔或其他定序裝置且因此改良偵測及分析。
在方塊506中,方法500可進一步包括使複數個DNA片段通過基板上之奈米孔。在一些實施例中,方法可包括除奈米孔以外之單分子定序技術。舉例而言,定序技術可包括Pacific Biosciences之SMRT技術或藉由 SeqLL進行Helicos定序。單分子定序技術可包括Eid J.等人,「Real-time DNA sequencing from single polymerase molecules」,Science 2009 323:133-138中所述之技術,其內容出於所有目的以引用的方式併入本文中。
在方塊508中,關於複數個DNA片段中之每一者,可在DNA片段通過奈米孔時偵測電信號。電信號可對應於DNA片段之序列或子序列。電信號可包括電流或電壓或本文所述之任何電信號。當使用其他定序技術時,可使用螢光信號代替電信號。
在方塊510中,方法500可包括分析電信號以確定DNA片段之序列或子序列。方法500可包括測定該DNA片段之大小及複數個DNA片段之大小,例如藉由使用比對資訊。因此,亦可確定DNA片段之大小分佈。基於DNA片段之大小分佈,亦可確定染色體差異,例如如2010年11月5日申請之名為「Size-based genomics」的美國申請案第12/940,992號、2011年11月30日申請之名為「Detection of genetic or molecular aberrations associated with cancer」的美國申請案第13/308,473號及2013年3月7日申請之名為「Size-based analysis of fetal DNA fraction in maternal plasma」的美國申請案第13/789,553號中所述。
在一些實施例中,電信號可對應於第一串聯體之甲基化分類。甲基化分類可包括鹼基是否甲基化、是否存在異常甲基化(高甲基化或低甲基化)及串聯體是否經羥基甲基化。
方法可包括比對DNA片段之序列或子序列與參考基因組。特定言之,該比對可為與參考基因組之特定染色體或染色體區域的比對。
可使同一個DNA片段通過同一個奈米孔多次。在每次通過時,可偵測電信號。可比較不同通過之電信號以便幫助鑑別序列。增加DNA片段之濃度可與除奈米孔以外之單分子定序技術一起使用。
III. 使用增加濃度之實例
實例顯示,可濃縮血漿DNA以增大奈米孔定序之效率同時提供準確結果。使用增加濃度進行之定序進一步描述於Cheng S.H.等人,「Noninvasive prenatal testing by nanopore sequencing of maternal plasma DNA:feasibility assessment」,Clin.Chem.61:10(2015)中。
A. 材料及方法
自藉由簽署知情同意書且得到機構批准招募的四組個體獲得血漿樣品,這四組個體即為懷有男性胎兒之妊娠末三個月女性、懷有女性胎兒之妊娠末三個月女性、成年男性及非妊娠女性。合併各組之EDTA血漿樣品,每組得到至少20mL血漿。使用QIAamp DSP DNA血液微型套組(Qiagen,Germany)提取經合併之血漿樣品(2)。藉由Speedvac濃縮器(Thermo Fisher Scientific,Waltham,MA)將每池1,050μL經溶離之血漿DNA濃縮至85μL。使用末端修復及加A尾模組(New England Biolabs,Ipswich,MA)及基因組DNA定序套組(SQK-MAP-005,Oxford Nanopore Technologies,UK)完全消耗各池經濃縮血漿DNA以製備DNA文庫。將各文庫(150μL)全部裝載至MinION流槽(v7.3)(Nanopore)上且定序。使用METRICHORTM軟體(Nanopore)對輸出資料檔案進行鹼基判讀。提取2D讀數且使用LAST基因組規模序列比較軟體(Computational Biology Research Consortium,Japan)與參考基因組hg19進行比對。
進行定序直至各文庫均已耗盡且耗時6至24小時。26.9%-32.5%之讀數通過鹼基判讀器。關於來自懷有男性胎兒之妊娠女性、懷有女性胎兒之妊娠女性、成年男性及非妊娠女性之血漿池,2D讀數數目分別為56,844、50,268、35,878及36,167。所觀察到的平均一致性為82.7%(81.4-84.5%),該一致性為讀數中與參考序列中之匹配鹼基對準之鹼基的比例(3)。在2D讀數中,將16.9%(15.6-23.9%)與獨特基因組位置比對且進行進一步分析。
與人類基因組比對之經定序血漿DNA片段的長度範圍為76至5,776 bp,且在162bp(155-168bp)達到峰值(圖6)。圖6中之圖中之每一者顯示在x軸上以鹼基對計之經定序血漿DNA片段之大小,及以所定序之全部血漿DNA片段之百分比計的血漿DNA片段大小之頻率。該等圖為來自含男性胎兒之母本血漿、含女性胎兒之母本血漿、男性血漿及非妊娠女性血漿之DNA定序結果。四種血漿中之峰值血漿DNA大小與我們先前基於Illumina之定序平台的發現一致(4)。自奈米孔定序資料觀察到少量(0.06-0.3%)長血漿DNA片段(>1,000bp),但在其他定序平台上之前述資料分析並未觀察到(4)。
圖7顯示來自含女性胎兒之母本血漿的血漿DNA之大小概況,其來自藉由奈米孔定序獲得及藉由Illumina定序平台獲得的資料。奈米孔定序資料為與圖6中含女性胎兒之母本血漿相同的資料。圖7中之大小概況具有類似形狀,在大致相同大小下具有峰值。舉例而言,奈米孔定序中小於或等於150bp之片段與161至170bp之片段的大小比率為1.21,與Illumina定序中之1.10形成對比。此等結果顯示,血漿DNA之大小概況可使用奈米孔及濃縮血漿DNA準確地測定。在藉由奈米孔定序獲得之資料中在250-400bp範圍中之峰比藉由Illumina定序顯著。此峰對應於源自雙核小體之不含細胞之DNA,且峰之存在情況隨個體而變。另外,Illumina定序對此大小範圍中之片段進行定序可能不太有效。
B. 讀數分析
圖8顯示染色體之讀數分佈對比自可映射的人類基因組(經標記之hg19)預測之分佈。染色體列於x軸上。在y軸上,藉由相對於自各樣品定序之獨特對準之讀數的總數計數與各染色體對準之讀數的數目,計算出各樣品中各染色體之讀數的比例分佈(基因組表示)且按頻率及百分比形式表示。用hg19繪製之圖為含男性胎兒之母本血漿、含女性胎兒之母本血漿、男性血漿及非妊娠女性血漿之結果。所有四個血漿DNA池之體染色體的讀數分佈類似於關於可映射的人類基因組所預測之彼等讀數分佈。
觀察到X染色體及Y染色體之讀數分佈存在差異。男性血漿中映射至X染色體之讀數的比例(2.70%)低於女性血漿中(5.22%)。偵測成年男性(0.30%)血漿DNA池中之Y染色體序列,但不偵測非妊娠女性血漿DNA池。
懷有男性胎兒之女性的血漿DNA池具有0.11%與Y染色體對準之讀數。與前述資料(2)一致,懷有女性胎兒之女性的血漿DNA池具有0.018%與Y染色體序列對準之讀數。在懷有女性胎兒之女性中與Y染色體對準之讀數的存在可為與男性基因組比對時之已知誤差的結果。含男性胎兒之母本血漿DNA池的X染色體序列比懷有女性胎兒之女性少大約1%。
觀察到X染色體及Y染色體之讀數的相對分佈與預測結果類似。男性血漿所顯示之Y染色體比來自妊娠女性及非妊娠女性之血漿中的Y染色體多。男性血漿之X染色體比來自妊娠女性及非妊娠女性之血漿中的X染色體少。男性血漿中X染色體之量為非妊娠女性中的約一半,因為男性僅具有一條X染色體而女性具有兩條X染色體,所以如此預測。含男性胎兒之母本血漿中Y染色體之讀數分佈高於含女性胎兒之母本血漿及女性血漿。
因此,男性胎兒及女性胎兒之間的胎兒DNA序列及X染色體量差異可藉由奈米孔定序及濃縮血漿DNA來偵測。男性胎兒之X染色體量等於具有單染色體X或特納症候群(Turner syndrome)之女性胎兒的X染色體量。因此,此觀察結果表明使用奈米孔定序進行非侵襲性偵測胎兒染色體非整倍性(諸如單染色體X或複本數畸變)的潛在可行性。因為單染色體X表示基因組中一個染色體複本之減少,所以複本數變化程度等於三染色體,其中在基因組中增加一個染色體複本。因此,此等資料亦反映出,我們的方案可應用於非侵襲性偵測胎兒三染色體21、三染色體18、三染色體13及其他胎兒染色體非整倍性。此等資料表明基於奈米孔定序之NIPT及定點照護NIPT的可行性。
IV. 使用增加的濃度進行癌症定序
可使用循環中之不含細胞之DNA作為用於即時監測癌症之「液態生檢」。不含細胞之DNA展現出存在於潛在腫瘤中之基因異常,其可藉由大規模平行定序技術偵測。癌症患者之血漿DNA中之此等染色體畸變亦可使用奈米孔定序偵測。藉由奈米孔定序及大規模平行定序在Illumina之平台上分析來自兩名肝細胞癌(HCC)患者之血漿DNA樣品。
A. 材料及方法
在操作之前,自兩名經診斷患有HCC之患者各收集二十毫升周邊血液。藉由在1600×g下離心10分鐘,隨後在16000×g下離心10分鐘分離血漿。使用QIAamp DSP DNA血液微型套組(Qiagen)自8mL血漿提取DNA。使四分之三之血漿DNA進行奈米孔定序,且其餘DNA藉由NextSeq 500(Illumina)定序。
藉由末端修復/加A尾模組(NEB)及奈米孔定序套組(SQK-NSK007,Oxford Nanopore Technologies)製備奈米孔定序文庫。將文庫完全裝載至MinION流槽(R9版)上且在MinION Mk1B定序器(Nanopore)上定序。使用METRICHORTM軟體(Nanopore)對輸出資料檔案進行鹼基判讀。提取2D讀數且使用LAST軟體與參考基因組hg19比對。如先前所述對血漿DNA執行Illumina定序(8)。
B. 結果
計算各樣品之與各染色體臂對準之讀數的比例分佈(基因組表示,GR)。換言之,與染色體臂p或q臂對準之高品質通過過濾器讀數之數目按佔自樣品定序之所有高品質通過過濾器讀數之比例形式表示。隨後計算相對於正常個體之血漿DNA樣品的GR差值。若染色體臂之GR比對照組之平均值高3個標準差,則該區域視為展現複本數增加。若染色體臂之GR比對照組之平均值低3個標準差,則該區域視為展現複本數丟失。
圖9顯示藉由奈米孔定序(外環)及藉由Illumina之平台(內環)所得,在HCC之兩種情況(HOT530及HOT536)下GR的差異。在外面標記不同染色 體。分析區域為染色體臂。染色體增加用綠條表示且自各別環之中心向外延伸。染色體丟失用紅條表示且自各別環之中心向內延伸。如圖9中所見,奈米孔定序結果與由Illumina之平台產生的結果基本上一致。經定序樣品亦顯示出DNA比來自非癌症個體之血漿DNA長的趨勢。此實例顯示,藉由增加濃度法進行奈米孔定序可用於分析癌症患者之血漿DNA。
V. 使用串聯體之實例
血漿DNA分子通常較短(<200bp),且奈米孔定序器通常可用於定序長DNA分子。短血漿DNA分子之定序效率可藉由連接或接合個別分子以構築長DNA分子(稱為串聯體)而得到改良。
A. 材料及方法 1. 產生血漿DNA串聯體
測試來自兩個不同個體之樣品。自非妊娠女性個體及懷有男性胎兒之女性個體收集二十毫升周邊靜脈血液。在1600×g下離心10分鐘且在16000×g下進一步離心10分鐘之後收集血漿。隨後使用QIAamp DSP DNA血液微型套組(Qiagen)自8mL血漿提取DNA,產生體積為420μl之血漿DNA。藉由SpeedVac濃縮器(Thermo Scientific)將所提取之DNA濃縮至85μL且藉由NEBNext末端修復模組(New England Biolabs,NEB)進行末端修復。經末端修復之DNA使用MinElute反應淨化套組(Qiagen)純化且用20μL緩衝液EB溶離。隨後,藉由添加20μL Blunt/TA連接酶主混合物(NEB),在25℃下培育4小時來串聯血漿DNA,且在培育之後用MinElute反應淨化套組純化。
2. 奈米孔定序
隨後將經串聯之DNA用於藉由末端修復及加A尾模組(NEB)及基因組DNA定序套組(SQK-MAP-005,Oxford Nanopore Technologies)製備之奈米孔定序文庫。將文庫全部裝載至MinION流槽(v7.3)(Nanopore)上且定序。使用METRICHORTM軟體(Nanopore)對輸出資料檔案進行鹼基判讀。 提取2D讀數。
3. 比對
使用LAST軟體執行比對。找到各可能的開始位置之初始匹配。該等匹配限於與參考基因組中出現次數最多的最小長度之匹配,或該等匹配限於特定預定長度。根據此等初始匹配,執行比此等初始匹配長之額外序列比對且基於定序誤差之所要容限,保留具有一定間隙評分的序列比對。若多個比對共用同一終點,則保留具有最高評分之比對。以此方式,鑑別出與人類基因組對準之片段。LAST中所用之參數及規則可視準確性及精確性考慮因素而改變。
B. 結果
在MinION上對經串聯之血漿DNA定序6小時,直至文庫耗盡為止。
1. 非妊娠女性
鹼基判讀產生2,234個2D讀數,其中讀數長度在86至8,672bp範圍內。圖10顯示自非妊娠女性定序之串聯體之大小的頻率分佈曲線。串聯體之以鹼基對計之大小示出在x軸上。在y軸上繪製指定串聯體大小在經定序樣品中存在之頻率,用百分比表示。為改良圖之可讀性,未示出在8,672bp離群值資料點處之離群值資料點。關於各定序樣品,偵測到約20至50個長DNA分子。
定序分子之大小比通常小於200bp之血漿DNA片段典型長度長得多。此等資料表明,血漿DNA片段已成功組裝為串聯體。隨後將讀數與人類基因組(hg19)比對。隨後分離屬於人類基因組上之不相交區域之鹼基延伸段或鏈段且將其視為一個血漿DNA片段。總計獲得3,801個獨特映射鏈段,即經定序血漿DNA片段,且80.6%之獨特映射鏈段顯示出與參考基因組一致的序列。
圖11顯示非妊娠女性之對準鏈段之大小分佈。此等對準鏈段之大小在78至560bp間變化,且大部分小於200bp。峰值大小為162bp。平均大 小為173bp。中值大小為162bp,其與藉由大規模平行定序在Illumina之平台上獲得且亦藉由奈米孔定序使用濃度增加之DNA片段獲得的血漿DNA大小之前述觀察結果一致。
圖12顯示對準鏈段相比於男性參考基因組之計算分佈。計算與各染色體對準之鏈段的比例分佈(基因組表示)。所計算之分佈類似於hg19在所有體染色體中之分佈。關於性染色體,X染色體之基因組表示為5.79%,此為針對女性樣品所預計的。未發現與Y染色體之未對準。因此與奈米孔一起使用串聯體之方法可區分女性血漿與男性血漿。
2. 懷有男性胎兒之女性
當獲取血液樣品時,妊娠女性體內之男性胎兒具有38週4天之胎齡。該妊娠視為正常。在針對奈米孔定序進行處理之前,串聯血漿DNA片段。串聯體大小在100至13,466bp範圍內,其中中值大小為676bp且平均大小為965bp。
圖13顯示懷有男性胎兒之女性的串聯體之對準鏈段的大小概況。大小概況為血漿DNA的典型特徵。片段之中值大小為196bp。峰值大小為174bp,且大小範圍為92至2,934bp。僅約0.4%之片段具有大於2,000bp之大小。此分佈類似於藉由使用串聯體、增加濃度或大規模平行定序之方法獲得的其他大小分佈。舉例而言,該分佈類似於針對懷有男性胎兒之母本血漿使用增加濃度法所發現的大小分佈,如圖6中所示。
圖14顯示懷有男性胎兒之女性之對準鏈段的所計算之染色體分佈對比男性及非妊娠女性之參考基因組。串聯體之分佈顯示X染色體含量介於男性X染色體含量與非妊娠女性X染色體含量之間。這表明X染色體資料反映正常男性胎兒之X染色體之單染色體。此外,串聯體顯示出源自胎兒之Y染色體的跡象。藉由自參考基因組定序獲得之讀數分佈的一些偏差可為分析僅限於參考基因組之可對準部分的結果。然而,如此等結果所示,使用串聯體之方法可區分含男性胎兒之母本血漿與男性或非妊娠女性。此 等方法可能可用於區分含男性胎兒之母本血漿與含女性胎兒之母本血漿。
VI. 例示性定序系統
圖15顯示根據本發明實施例之用於執行單分子定序之系統1500的方塊圖。可藉由提取裝置1504自患者1502獲得生物樣品。生物樣品可為任何體液或本文所述之任何生物樣品。提取裝置1504可包括注射器、柳葉刀、拭子或用於收集諸如尿液之樣品的容器或小瓶。提取裝置1504可包括QIAamp DSP DNA血液微型套組(Qiagen,Germany)(2)。生物樣品可含有不含細胞之DNA片段,將其遞送至製備裝置1506。製備裝置1506可包括產生對單分子定序更有效的一種形式之不含細胞之DNA片段的裝置。舉例而言,製備裝置1506之輸出可為不含細胞之DNA片段的串聯體或濃縮樣品。
當產生串聯體時,製備裝置1506可包括用於增加濃度之真空乾燥器,諸如SpeedVac濃縮器(Thermo Scientific),或藉由滲流或過濾移除流體之超濃縮器。關於串聯體,濃度可不增加五倍或超過五倍。製備裝置1506可包括用於修復DNA片段末端之模組,諸如NEBNext末端修復模組(New England Biolabs,NEB)。此外,製備裝置1506可包括用於純化經末端修復之DNA的套組,諸如MinElute反應淨化套組(Qiagen)。製備裝置1506亦可包括可將連接酶(例如,Blunt/TA連接酶主混合物(NEB))在一定溫度下培育數小時(例如,25℃,4小時)的培育箱。製備裝置1506可包括用於在反應之後純化串聯體的額外套組,其可包括MinElute反應淨化套組(Qiagen)。製備裝置1506亦可包括機器人液體處置器,其可混合及轉移流體。
當產生濃度增加之不含細胞之DNA片段時,製備裝置1506可包括真空乾燥器(例如,Speedvac濃縮器(Thermo Fisher Scientific,Waltham,MA))或藉由滲流或過濾移除流體之超濃縮器。製備裝置1506亦可包括末端修復及加A尾模組(New England Biolabs,Ipswich,MA)。製備裝置 1506亦可包括機器人液體處置器,其可混合及轉移流體。
可將串聯體或經濃縮之DNA片段自製備裝置1506遞送至單分子定序裝置1508以獲得序列讀數。單分子定序裝置1508亦可包括諸如MinION流槽(v7.3)(Nanopore)、SMRT技術(Pacific Biosciences)或Helicos單分子定序器(SeqLL)之裝置。單分子定序裝置1508亦可包括與奈米孔相關之套組,諸如基因組DNA定序套組(SQK-MAP-005,Oxford Nanopore Technologies,UK)或奈米孔定序套組(SQK-NSK007,Oxford Nanopore Technologies)。
單分子定序裝置1508可自串聯體或經濃縮之DNA片段輸出序列讀數。序列讀數可按資料檔案形式輸出且可藉由電腦系統1510分析。電腦系統可為具有用於分析序列讀數之軟體的專用電腦系統。可使用METRICHORTM軟體(Nanopore)對輸出資料檔案進行鹼基判讀。可提取2D讀數且使用LAST軟體比對。電腦系統可為圖16中之電腦系統10,如下文所述。
VII. 電腦系統
本文中提及之任何電腦系統均可利用任何適合數目之子系統。該等子系統之實例顯示於圖16之電腦系統10中。在一些實施例中,電腦系統包括單一電腦設備,其中子系統可為電腦設備之組件。在其他實施例中,電腦系統可包括具有內部組件之多個電腦設備,其各自為一個子系統。電腦系統可包括桌上型及膝上型電腦、平板電腦、行動電話及其他行動裝置。
圖6中所示之子系統經由系統匯流排75互連。顯示其他子系統,諸如印表機74、鍵盤78、儲存裝置79、耦合至顯示配接器82之監測器76及其他裝置。耦合至輸入/輸出(I/O)控制器71之周邊裝置及I/O裝置可藉由此項技術中已知之任何數目之構件(諸如輸入/輸出(I/O)埠77(例如,USB、FireWire®))連接至電腦系統。舉例而言,I/O埠77或外部介面81(例如, 乙太網路、Wi-Fi等)可用於將電腦系統10連接至廣域網路(諸如,網際網路、鼠標輸入裝置或掃描儀)。經由系統匯流排75互連允許中央處理器73與各子系統通信及控制系統記憶體72或儲存裝置79(例如固接磁碟,諸如硬碟機,或光碟)執行複數個指令,以及子系統之間的資訊交換。系統記憶體72及/或儲存裝置79可體現電腦可讀取媒體。另一子系統為資料收集裝置85,諸如攝影機、麥克風、加速計及類似者。本文所提及之任何資料可自一個組件輸出至另一組件且可輸出至使用者。
電腦系統可包括複數個相同組件或子系統,例如藉由外部介面81、藉由內部介面或經由可卸除式儲存裝置連接到一起,該等可卸除式儲存裝置可自一個組件連接至另一組件且卸除。在一些實施例中,電腦系統、子系統或設備可經網路通信。在該等情況下,可將一台電腦視為用戶端且另一台電腦視為伺服器,其中各自可為同一電腦系統之一部分。用戶端及伺服器各自可包括多個系統、子系統或組件。
實施例之態樣可使用硬體(例如特殊應用積體電路或場可程式化閘陣列)、以邏輯控制形式實施及/或使用電腦軟體、使用普通可程式化處理器、以模組化或整合方式實施。如本文中所使用,處理器包括位於同一積體晶片上之單核心處理器、多核心處理器,或位於單一電路板上或網路化之多個處理單元。基於本發明及本文所提供之教示,一般熟習此項技術者將知道及瞭解使用硬體及硬體與軟體之組合來實施本發明實施例的其他方式及/或方法。
描述於本申請案中之任何軟體組件或功能可作為待由處理器執行的使用任何適合之電腦語言(諸如Java、C、C++、C#、Objective-C、Swift)或腳本語言(諸如Perl或Python)的軟體程式碼,使用例如習知或目標定向技術來執行。軟體程式碼可以一系列指令或命令形式儲存於電腦可讀取媒體上進行儲存及/或傳輸。適合的非暫時性電腦可讀取媒體可包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、磁性媒體(諸如硬碟機或軟碟機)或 光學媒體,諸如光盤(CD)或DVD(數位化通用光碟)、快閃記憶體及其類似者。電腦可讀取媒體可為該等儲存或傳輸裝置之任意組合。
該等程式亦可使用適合於藉助有線、光學及/或符合多種方案之無線網路(包括網際網路)傳輸的載波信號來編碼及傳輸。因此,電腦可讀取媒體可使用經由該等程式編碼的資料信號建立。以程式碼編碼之電腦可讀取媒體可與相容裝置一起封裝或與其他裝置分開提供(例如,經由網際網路下載)。任何該等電腦可讀取媒體可存在於單一電腦產品(例如,硬碟機、CD或整個電腦系統)上或其內部,且可存在於系統或網路內之不同電腦產品上或其內部。電腦系統可包括用於向使用者提供本文所提及之任何結果的監測器、印表機或其他適合之顯示器。
本文所描述之任何方法可完全或部分地使用電腦系統來進行,該電腦系統包括一或多個可經組態以執行步驟的處理器。因此,實施例可針對經組態以執行本文所描述之任何方法之步驟的電腦系統,潛在地使用不同組件執行各別步驟或各別步驟組。儘管本文中方法之步驟以經編號之步驟呈現,但其可同時或以不同次序執行。另外,此等步驟之部分可與其他方法之其他步驟之部分一起使用。另外,可視情況選用全部或部分步驟。另外,任何方法中之任何步驟可使用用於執行此等步驟的模組、單元、電路或其他構件來執行。
可在不脫離本發明之實施例的精神及範疇的情況下以任何適合之方式組合特定實施例之特定細節。然而,本發明之其他實施例可針對與各個別態樣或此等個別態樣之特定組合相關的特定實施例。
已出於說明及描述之目的呈現本發明之例示性實施例的上述描述。其並不意欲為窮盡性的或將本發明限於所描述之確切形式,且鑒於以上教示,許多修改及變化為可能的。
除非專門相反地指出,否則「一(a/an)」或「該(the)」之敍述欲意謂「一或多個」。除非專門相反地指出,否則「或」之使用欲意謂「包括 或」而並非「互斥或」。提及「第一」組件不一定需要提供第二組件。此外,除非有明確陳述,否則提及「第一」或「第二」組件不會將所提及組件限於特定位置。
本文所提及之所有專利、專利申請案、公開案及描述均出於所有目的以全文引用之方式併入。不承認任一者為先前技術。
VIII. 參考文獻:
1. Dondorp W, de Wert G, Bombard Y, Bianchi DW, Bergmann C, Borry P, et al. Noninvasive prenatal testing for aneuploidy and beyond: Challenges of responsible innovation in prenatal screening. Eur J Hum Genet 2015.
2. Chiu RWK, Chan KCA, Gao Y, Lau VYM, Zheng W, Leung TY, et al. Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of dna in maternal plasma. Proc Natl Acad Sci USA 2008;105:20458-63.
3. Jain M, Fiddes IT, Miga KH, Olsen HE, Paten B, Akeson M. Improved data analysis for the MinION nanopore sequencer. Nat Methods 2015;12:351-6.
4. Lo YMD, Chan KCA, Sun H, Chen EZ, Jiang P, Lun FMF, et al. Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus. Sci Transl Med 2010;2:61ra91-61ra91.
5. Bayley H. Nanopore sequencing: From imagination to reality. Clin Chem 2015;61:25-31.
6. Zheng YW, Chan KCA, Sun H, Jiang P, Su X, Chen EZ, et al. Nonhematopoietically derived DNA is shorter than hematopoietically derived DNA in plasma: A transplantation model. Clin Chem 2012;58:549-58.
7. Lun FMF, Chiu RWK, Sun K, Leung TY, Jiang P, Chan KCA, et al. Noninvasive prenatal methylomic analysis by genomewide bisulfite sequencing of maternal plasma DNA. Clin Chem 2013;59:1583-94.
8. Chan KCA, Jiang P, Zheng YW, Liao GJW, Sun H, Wong J, et al. Cancer genome scanning in plasma: Detection of tumor-associated copy number aberrations, single-nucleotide variants, and tumoral heterogeneity by massively parallel sequencing. Clin Chem 2013;59:211-24.
9. Chan KCA, Jiang P, Chan CWM, Sun K, Wong J, Hui EP, et al. Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberrations by plasma DNA bisulfite sequencing. Proc Natl Acad Sci U S A 2013;110:18761-8.
10. Chan RWY, Wong J, Chan HLY, Mok TSK, Lo WYW, Lee V, et al. Aberrant concentrations of liver-derived plasma albumin mrna in liver pathologies. Clin Chem 2010;56:82-9.
11. Chan RWY, Jiang P, Peng X, Tam LS, Liao GJW, Li EK, et al. Plasma DNA aberrations in systemic lupus erythematosus revealed by genomic and methylomic sequencing. Proc Natl Acad Sci U S A 2014;111:E5302-11.
12. Schreiber J, Wescoe ZL, Abu-Shumays R, Vivian JT, Baatar B, Karplus K, Akeson M. Error rates for nanopore discrimination among cytosine, methylcytosine, and hydroxymethylcytosine along individual DNA strands. Proc Natl Acad Sci U S A 2013;110:18910-5.
1500‧‧‧系統
1502‧‧‧患者
1504‧‧‧提取裝置
1506‧‧‧製備裝置
1508‧‧‧單分子定序裝置
1510‧‧‧電腦系統

Claims (39)

  1. 一種方法,其包含:接收複數個DNA片段;串聯該複數個DNA片段之第一組以獲得第一串聯體;及對該第一串聯體執行單分子定序以獲得該第一串聯體之第一序列。
  2. 如請求項1之方法,其進一步包含:向定序裝置提供該第一串聯體作為執行該單分子定序之一部分;及使用該定序裝置偵測對應於該第一串聯體之複數個信號,該複數個信號對應於該第一串聯體之該第一序列。
  3. 如請求項2之方法,其中該定序裝置包括第一奈米孔,該方法進一步包含:使該第一串聯體通過該第一奈米孔;及當該第一串聯體通過該第一奈米孔時偵測到第一電信號,該等第一電信號對應於該第一串聯體之該第一序列,其中該複數個信號包括該等第一電信號。
  4. 如請求項3之方法,其進一步包含藉由電腦系統執行以下操作:分析該等第一電信號以確定該第一序列;及將該第一序列之子序列與參考基因組比對以鑑別對應於該等DNA片段之該第一組中之每一者的片段序列。
  5. 如請求項3之方法,其中使該第一串聯體通過該第一奈米孔包括:使該第一串聯體之第一股通過該第一奈米孔;及隨後,使該第一串聯體之第二股通過該第一奈米孔。
  6. 如請求項5之方法,其進一步包含 藉由電腦系統分析該第一股及該第二股之該等第一電信號以確定該第一序列。
  7. 如請求項3之方法,其中該第一奈米孔為基板上複數個奈米孔中之一者。
  8. 如請求項7之方法,其進一步包含:串聯該等DNA片段之第二組以獲得第二串聯體;使該第二串聯體通過該複數個奈米孔之第二奈米孔;及當該第二串聯體通過該第二奈米孔時偵測到複數個第二電信號,該等第二電信號對應於該第二串聯體之第二序列。
  9. 如請求項2之方法,其進一步包含:使經螢光標記之核苷酸與該第一串聯體雜交,及偵測螢光信號,該螢光信號對應於核苷酸。
  10. 如請求項1之方法,其進一步包含藉由電腦系統執行以下操作:將該第一序列之子序列與參考基因組比對以鑑別對應於該等DNA片段之該第一組中之每一者的片段序列。
  11. 如請求項10之方法,其進一步包含:基於該等子序列之該比對,確定該複數個DNA片段之該第一組中之每一者的大小。
  12. 如請求項10之方法,其中:串聯該複數個DNA片段之該第一組包含串聯該複數個DNA片段之該第一組及該複數個DNA片段之具有已知序列的第二組,其中該複數個DNA片段之該第二組穿插在該複數個DNA片段之該第一組中,及比對該第一序列之子序列包含將子序列與該等已知序列進行比對以鑑別該複數個DNA片段之該第二組在該第一串聯體中之位置。
  13. 如請求項12之方法,其中該串聯將該複數個DNA片段之該第二組之 一個DNA片段置放在該複數個DNA片段之該第一組之兩個DNA片段之間。
  14. 如請求項13之方法,其進一步包含藉由該電腦系統執行以下操作:基於鑑別該複數個DNA片段之該第二組之該等已知序列中之一者係在該第一子序列之前,藉由該電腦系統鑑別對應於該複數個DNA片段之該第一組之第一DNA片段的第一子序列的起始鹼基;及基於鑑別該複數個DNA片段之該第二組之該等已知序列中之一者係在該第一子序列之後,藉由該電腦系統鑑別對應於該複數個DNA片段之該第一組之該第一DNA片段的該第一子序列的終止鹼基。
  15. 如請求項12之方法,其中該複數個DNA片段之該第二組之各DNA片段包含小於或等於7個核苷酸之已知序列。
  16. 如請求項12之方法,其中該複數個DNA片段之該第二組中之每一者具有相同已知序列。
  17. 如請求項10之方法,其中該等子序列之該比對包括:比對該第一序列之滑動窗與該參考基因組,各滑動窗對應於與該參考基因組對準之子序列;及鑑別何時兩個滑動窗與該參考基因組之不同區域對準以區分該複數個DNA片段之該第一組之兩個DNA片段之序列。
  18. 如請求項17之方法,其進一步包含藉由該電腦系統執行以下操作:基於與該參考基因組之該等不同區域對準的該兩個滑動窗,確定該複數個DNA片段之該第一組之第一DNA片段的第一子序列之終止或開始。
  19. 如請求項17之方法,其中該參考基因組之該等不同區域包含在不同染色體上之區域。
  20. 如請求項17之方法,其中該兩個滑動窗之間的一或多個窗口經鑑別為不與該參考基因組對準。
  21. 如請求項20之方法,其進一步包含測定該複數個DNA片段之該第一組之第一DNA片段的大小,其中測定該第一DNA片段之大小包含:測定與該參考基因組之單一區域對準的最長子序列之長度。
  22. 如請求項1之方法,其中該複數個DNA片段為來自生物樣品之不含細胞之DNA片段。
  23. 如請求項22之方法,其中該生物樣品為血漿或血清。
  24. 一種方法,其包含:接收包括複數個DNA片段之生物樣品,該生物樣品具有第一濃度之DNA片段;濃縮該生物樣品以具有第二濃度之DNA片段,DNA片段之該第二濃度比DNA片段之該第一濃度高出5倍或超過5倍;使該複數個DNA片段通過基板上之奈米孔;及關於該複數個DNA片段中之每一者:當該DNA片段通過奈米孔時偵測電信號,該等電信號對應於該DNA片段之序列。
  25. 如請求項24之方法,其中DNA片段之該第二濃度比DNA片段之該第一濃度高出10倍或超過10倍。
  26. 如請求項24之方法,其進一步包含:關於該複數個DNA片段中之每一者:分析該等電信號以確定該序列,及將該序列與參考基因組中之染色體區域比對。
  27. 如請求項24之方法,其中DNA片段之該第一濃度係根據單位體積,且DNA片段之該第二濃度係根據單位體積。
  28. 如請求項24之方法,其中DNA片段之該第一濃度係根據單位質量,且DNA片段之該第二濃度係根據單位質量。
  29. 一種方法,其包含藉由電腦系統執行以下操作: 接收由串聯DNA片段之第一組產生的第一串聯體的第一序列;及比對該第一序列之子序列以鑑別對應於該等DNA片段之第一組之各DNA片段的片段序列。
  30. 如請求項29之方法,其中:該第一串聯體係藉由串聯DNA片段之該第一組及DNA片段之第二組產生,及比對該第一序列之子序列包含比對子序列與DNA片段之該第二組。
  31. 如請求項30之方法,其中DNA片段之該第二組之各DNA片段包含小於或等於7個核苷酸之已知序列。
  32. 如請求項29之方法,其中比對該第一序列之子序列包含比對該第一序列之子序列與參考基因組。
  33. 如請求項32之方法,其中該等子序列之該比對包括:比對該第一序列之窗口與該參考基因組;及鑑別何時兩個窗口與該參考基因組之不同區域對準。
  34. 如請求項33之方法,其中該兩個窗口之間的一或多個窗口經鑑別為不與該參考基因組對準。
  35. 一種電腦產品,其包含電腦可讀取媒體,該電腦可讀取媒體儲存複數個用於控制該電腦系統執行如請求項29至34中任一項之操作的指令。
  36. 一種系統,其包含:如請求項35之電腦產品;及一或多個處理器,其用於執行儲存於該電腦可讀取媒體上的指令。
  37. 一種系統,其包含用於執行如請求項29至34中任一項之步驟的構件。
  38. 一種系統,其經組態以執行如請求項29至34中任一項之步驟。
  39. 一種系統,其包含分別執行如請求項29至34中任一項之步驟的模組。
TW105125873A 2015-08-12 2016-08-12 血漿dna之單分子定序 TWI728994B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562204396P 2015-08-12 2015-08-12
US62/204,396 2015-08-12

Publications (2)

Publication Number Publication Date
TW201718874A true TW201718874A (zh) 2017-06-01
TWI728994B TWI728994B (zh) 2021-06-01

Family

ID=57983895

Family Applications (2)

Application Number Title Priority Date Filing Date
TW110115619A TWI793586B (zh) 2015-08-12 2016-08-12 血漿dna之單分子定序
TW105125873A TWI728994B (zh) 2015-08-12 2016-08-12 血漿dna之單分子定序

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW110115619A TWI793586B (zh) 2015-08-12 2016-08-12 血漿dna之單分子定序

Country Status (12)

Country Link
US (2) US11319586B2 (zh)
EP (1) EP3334843A4 (zh)
JP (1) JP6867045B2 (zh)
CN (2) CN107849607B (zh)
AU (3) AU2016305103C1 (zh)
CA (1) CA2995422A1 (zh)
HK (2) HK1245850A1 (zh)
IL (3) IL285795B (zh)
MY (1) MY188348A (zh)
SA (1) SA518390907B1 (zh)
TW (2) TWI793586B (zh)
WO (1) WO2017025059A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200060410A (ko) * 2017-09-07 2020-05-29 쿠퍼제노믹스, 인크. 비침습적 착상전 유전자 진단을 위한 방법과 시스템 (systems and methods for non-invasive preimplantation genetic diagnosis)
CN111527044A (zh) 2017-10-26 2020-08-11 阿尔缇玛基因组学公司 用于序列判定的方法和系统
SG11201903333SA (en) 2017-12-29 2019-08-27 Clear Labs Inc Automated priming and library loading services
WO2019204720A1 (en) * 2018-04-20 2019-10-24 The Regents Of The University Of California Nucleic acid sequencing methods and computer-readable media for practicing same
CN113795887A (zh) 2019-03-10 2021-12-14 阿尔缇玛基因组学公司 用于序列判定的方法和系统
CN115315513A (zh) * 2019-11-25 2022-11-08 威廉马歇莱思大学 用于纳米孔测序的线性dna组装
US20230249178A1 (en) 2020-07-08 2023-08-10 Roche Sequencing Solutions, Inc. Split-pool synthesis apparatus and methods of performing split-pool synthesis
JP2023545478A (ja) 2020-10-15 2023-10-30 カパ バイオシステムズ,インコーポレイティド 次世代配列決定ライブラリ調製のための電気泳動デバイスおよび方法
WO2022194764A1 (en) 2021-03-15 2022-09-22 F. Hoffmann-La Roche Ag Targeted next-generation sequencing via anchored primer extension
WO2022200485A1 (en) 2021-03-26 2022-09-29 F. Hoffmann-La Roche Ag Hybridization buffer formulations
WO2022207682A1 (en) 2021-04-01 2022-10-06 F. Hoffmann-La Roche Ag Immune cell counting of sars-cov-2 patients based on immune repertoire sequencing
EP4323539A1 (en) * 2021-04-12 2024-02-21 The Chinese University of Hong Kong Base modification analysis using electrical signals
WO2023023561A1 (en) * 2021-08-17 2023-02-23 Quantapore, Inc. Multiplex binding assays with optical nanopore readout
IL312140A (en) * 2021-10-18 2024-06-01 Belgian Volition Srl Using nanoporous tiling to determine the source of DNA in the bloodstream
WO2024003332A1 (en) 2022-06-30 2024-01-04 F. Hoffmann-La Roche Ag Controlling for tagmentation sequencing library insert size using archaeal histone-like proteins
CN114898802B (zh) * 2022-07-14 2022-09-30 臻和(北京)生物科技有限公司 基于血浆游离dna甲基化测序数据的末端序列频率分布特征确定方法、评价方法及装置
WO2024046992A1 (en) 2022-09-02 2024-03-07 F. Hoffmann-La Roche Ag Improvements to next-generation target enrichment performance

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020197618A1 (en) 2001-01-20 2002-12-26 Sampson Jeffrey R. Synthesis and amplification of unstructured nucleic acids for rapid sequencing
GB0504774D0 (en) * 2005-03-08 2005-04-13 Lingvitae As Method
JP2008161056A (ja) 2005-04-08 2008-07-17 Hiroaki Mita Dna配列解析装置、dna配列解析方法およびプログラム
KR102516709B1 (ko) 2007-07-23 2023-04-03 더 차이니즈 유니버시티 오브 홍콩 핵산 서열 불균형의 결정
DE102008061772A1 (de) * 2008-12-11 2010-06-17 Febit Holding Gmbh Verfahren zur Untersuchung von Nukleinsäure-Populationen
US9175341B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
CA2779695C (en) 2009-11-05 2016-05-24 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
EP4212630A1 (en) 2009-11-06 2023-07-19 The Chinese University of Hong Kong Size-based genomic analysis
KR20120045922A (ko) * 2010-11-01 2012-05-09 엘지전자 주식회사 나노 포어를 포함하는 염기 서열 결정 장치
KR102185244B1 (ko) 2010-11-30 2020-12-02 더 차이니즈 유니버시티 오브 홍콩 암과 연관된 유전적 또는 분자적 이상들의 검출
US9957560B2 (en) * 2011-07-25 2018-05-01 Oxford Nanopore Technologies Ltd. Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
US20130040827A1 (en) 2011-08-14 2013-02-14 Stephen C. Macevicz Method and compositions for detecting and sequencing nucleic acids
CA2861457A1 (en) 2012-01-20 2013-07-25 Genia Technologies, Inc. Nanopore based molecular detection and sequencing
WO2013185137A1 (en) * 2012-06-08 2013-12-12 Pacific Biosciences Of California, Inc. Modified base detection with nanopore sequencing
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
GB201215449D0 (en) 2012-08-30 2012-10-17 Zoragen Biotechnologies Llp Method of detecting chromosonal abnormalities
IL299444A (en) 2012-09-20 2023-02-01 Univ Hong Kong Chinese Non-invasive determination of fetal or tumor methylation from plasma
CN104946737B (zh) * 2013-12-11 2019-02-22 安可济控股有限公司 用于检测罕见序列变体的组合物和方法
EP3218519B1 (en) 2014-11-11 2020-12-02 BGI Shenzhen Multi-pass sequencing
US10916945B2 (en) 2016-05-10 2021-02-09 Nec Corporation Demand and supply adjustment system, control apparatus, control method, and program

Also Published As

Publication number Publication date
AU2020202153A1 (en) 2020-04-16
EP3334843A4 (en) 2019-01-02
CA2995422A1 (en) 2017-02-16
HK1245850A1 (zh) 2018-08-31
SA518390907B1 (ar) 2021-09-08
JP2018531583A (ja) 2018-11-01
EP3334843A1 (en) 2018-06-20
TWI728994B (zh) 2021-06-01
IL285795B (en) 2022-07-01
US20220205038A1 (en) 2022-06-30
AU2016305103B2 (en) 2020-01-02
CN107849607A (zh) 2018-03-27
IL294192B1 (en) 2023-04-01
TW202130815A (zh) 2021-08-16
US20170044606A1 (en) 2017-02-16
HK1248286A1 (zh) 2018-10-12
CN107849607B (zh) 2022-10-11
IL257074B (en) 2021-09-30
IL285795A (en) 2021-09-30
IL257074A (en) 2018-03-29
TWI793586B (zh) 2023-02-21
AU2023202572A1 (en) 2023-05-18
CN115433769A (zh) 2022-12-06
JP2021118691A (ja) 2021-08-12
MY188348A (en) 2021-12-02
WO2017025059A1 (en) 2017-02-16
AU2016305103C1 (en) 2020-06-04
JP6867045B2 (ja) 2021-04-28
IL294192A (en) 2022-08-01
AU2016305103A1 (en) 2018-03-22
US11319586B2 (en) 2022-05-03
IL294192B2 (en) 2023-08-01
AU2020202153B2 (en) 2023-02-02

Similar Documents

Publication Publication Date Title
AU2020202153B2 (en) Single-molecule sequencing of plasma DNA
JP6817259B2 (ja) 癌の検出のための血漿dna中のサイズ及び数異常の使用
JP6392904B2 (ja) Dnaのサイズに基づく解析
TWI661049B (zh) 使用不含細胞之dna片段大小以測定複製數變異之方法
JP6161607B2 (ja) サンプルにおける異なる異数性の有無を決定する方法
TWI727938B (zh) 血漿粒線體dna分析之應用
JP7506408B2 (ja) 血漿dnaの単分子配列決定