JP6814875B2 - 確率的配列決定プロセスのための塩基呼出 - Google Patents
確率的配列決定プロセスのための塩基呼出 Download PDFInfo
- Publication number
- JP6814875B2 JP6814875B2 JP2019506441A JP2019506441A JP6814875B2 JP 6814875 B2 JP6814875 B2 JP 6814875B2 JP 2019506441 A JP2019506441 A JP 2019506441A JP 2019506441 A JP2019506441 A JP 2019506441A JP 6814875 B2 JP6814875 B2 JP 6814875B2
- Authority
- JP
- Japan
- Prior art keywords
- state
- cell
- sequencing
- states
- signal values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012163 sequencing technique Methods 0.000 title claims description 146
- 238000000034 method Methods 0.000 title claims description 126
- 230000008569 process Effects 0.000 title description 24
- 125000003729 nucleotide group Chemical group 0.000 claims description 187
- 239000002773 nucleotide Substances 0.000 claims description 186
- 230000006870 function Effects 0.000 claims description 149
- 150000007523 nucleic acids Chemical class 0.000 claims description 124
- 108020004707 nucleic acids Proteins 0.000 claims description 116
- 102000039446 nucleic acids Human genes 0.000 claims description 116
- 239000011148 porous material Substances 0.000 claims description 88
- 238000005259 measurement Methods 0.000 claims description 76
- 230000007704 transition Effects 0.000 claims description 76
- 238000009826 distribution Methods 0.000 claims description 44
- 238000010586 diagram Methods 0.000 claims description 30
- 239000011159 matrix material Substances 0.000 claims description 27
- 230000036962 time dependent Effects 0.000 claims description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 8
- 238000013477 bayesian statistics method Methods 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 description 191
- 239000010410 layer Substances 0.000 description 111
- 239000003990 capacitor Substances 0.000 description 55
- 102000004190 Enzymes Human genes 0.000 description 36
- 108090000790 Enzymes Proteins 0.000 description 36
- 239000000203 mixture Substances 0.000 description 34
- 239000000232 Lipid Bilayer Substances 0.000 description 32
- 239000012528 membrane Substances 0.000 description 21
- 206010021033 Hypomenorrhoea Diseases 0.000 description 20
- 238000010606 normalization Methods 0.000 description 16
- 238000001514 detection method Methods 0.000 description 14
- 239000003792 electrolyte Substances 0.000 description 14
- 239000000523 sample Substances 0.000 description 12
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 11
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 11
- 230000008859 change Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000005684 electric field Effects 0.000 description 10
- 238000007672 fourth generation sequencing Methods 0.000 description 10
- 230000010354 integration Effects 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 7
- 230000008878 coupling Effects 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 6
- 238000005315 distribution function Methods 0.000 description 6
- 150000002500 ions Chemical class 0.000 description 6
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 5
- 239000002202 Polyethylene glycol Substances 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 230000000638 stimulation Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 230000006820 DNA synthesis Effects 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108010010677 Phosphodiesterase I Proteins 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000000704 physical effect Effects 0.000 description 3
- 229910052697 platinum Inorganic materials 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- KILNVBDSWZSGLL-KXQOOQHDSA-N 1,2-dihexadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCC KILNVBDSWZSGLL-KXQOOQHDSA-N 0.000 description 2
- PORPENFLTBBHSG-MGBGTMOVSA-N 1,2-dihexadecanoyl-sn-glycerol-3-phosphate Chemical group CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(O)=O)OC(=O)CCCCCCCCCCCCCCC PORPENFLTBBHSG-MGBGTMOVSA-N 0.000 description 2
- RYCNUMLMNKHWPZ-SNVBAGLBSA-N 1-acetyl-sn-glycero-3-phosphocholine Chemical compound CC(=O)OC[C@@H](O)COP([O-])(=O)OCC[N+](C)(C)C RYCNUMLMNKHWPZ-SNVBAGLBSA-N 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 2
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 2
- 101100496858 Mus musculus Colec12 gene Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 229920000388 Polyphosphate Polymers 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 229910052581 Si3N4 Inorganic materials 0.000 description 2
- BLRPTPMANUNPDV-UHFFFAOYSA-N Silane Chemical compound [SiH4] BLRPTPMANUNPDV-UHFFFAOYSA-N 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- NRTOMJZYCJJWKI-UHFFFAOYSA-N Titanium nitride Chemical compound [Ti]#N NRTOMJZYCJJWKI-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- ATBOMIWRCZXYSZ-XZBBILGWSA-N [1-[2,3-dihydroxypropoxy(hydroxy)phosphoryl]oxy-3-hexadecanoyloxypropan-2-yl] (9e,12e)-octadeca-9,12-dienoate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCC(O)CO)OC(=O)CCCCCCC\C=C\C\C=C\CCCCC ATBOMIWRCZXYSZ-XZBBILGWSA-N 0.000 description 2
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 239000003989 dielectric material Substances 0.000 description 2
- BBQKXICLDJHVSR-QTNFYWBSSA-L dilithium;(2s)-2-aminopentanedioate Chemical compound [Li+].[Li+].[O-]C(=O)[C@@H](N)CCC([O-])=O BBQKXICLDJHVSR-QTNFYWBSSA-L 0.000 description 2
- WDRWZVWLVBXVOI-QTNFYWBSSA-L dipotassium;(2s)-2-aminopentanedioate Chemical compound [K+].[K+].[O-]C(=O)[C@@H](N)CCC([O-])=O WDRWZVWLVBXVOI-QTNFYWBSSA-L 0.000 description 2
- 238000007599 discharging Methods 0.000 description 2
- PXEDJBXQKAGXNJ-QTNFYWBSSA-L disodium L-glutamate Chemical compound [Na+].[Na+].[O-]C(=O)[C@@H](N)CCC([O-])=O PXEDJBXQKAGXNJ-QTNFYWBSSA-L 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000006317 isomerization reaction Methods 0.000 description 2
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 239000011565 manganese chloride Substances 0.000 description 2
- 235000002867 manganese chloride Nutrition 0.000 description 2
- 229940099607 manganese chloride Drugs 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 235000013919 monopotassium glutamate Nutrition 0.000 description 2
- 235000013923 monosodium glutamate Nutrition 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 2
- 150000003904 phospholipids Chemical class 0.000 description 2
- 239000001205 polyphosphate Substances 0.000 description 2
- 235000011176 polyphosphates Nutrition 0.000 description 2
- 235000011056 potassium acetate Nutrition 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 229910000077 silane Inorganic materials 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- HQVNEWCFYHHQES-UHFFFAOYSA-N silicon nitride Chemical compound N12[Si]34N5[Si]62N3[Si]51N64 HQVNEWCFYHHQES-UHFFFAOYSA-N 0.000 description 2
- 239000001632 sodium acetate Substances 0.000 description 2
- 235000017281 sodium acetate Nutrition 0.000 description 2
- 229940073490 sodium glutamate Drugs 0.000 description 2
- 229910001631 strontium chloride Inorganic materials 0.000 description 2
- AHBGXTDRMVNFER-UHFFFAOYSA-L strontium dichloride Chemical compound [Cl-].[Cl-].[Sr+2] AHBGXTDRMVNFER-UHFFFAOYSA-L 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- ISDBCJSGCHUHFI-PKIBUDCSSA-N (2s)-2,3-bis(3,7,11,15-tetramethylhexadecoxy)propan-1-ol Chemical compound CC(C)CCCC(C)CCCC(C)CCCC(C)CCOC[C@H](CO)OCCC(C)CCCC(C)CCCC(C)CCCC(C)C ISDBCJSGCHUHFI-PKIBUDCSSA-N 0.000 description 1
- TZCPCKNHXULUIY-RGULYWFUSA-N 1,2-distearoyl-sn-glycero-3-phosphoserine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCCCCCCCCCCCC TZCPCKNHXULUIY-RGULYWFUSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108020004513 Bacterial RNA Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 1
- ZWZWYGMENQVNFU-UHFFFAOYSA-N Glycerophosphorylserin Natural products OC(=O)C(N)COP(O)(=O)OCC(O)CO ZWZWYGMENQVNFU-UHFFFAOYSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 208000031481 Pathologic Constriction Diseases 0.000 description 1
- 239000004642 Polyimide Substances 0.000 description 1
- 241000205156 Pyrococcus furiosus Species 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- 241000205180 Thermococcus litoralis Species 0.000 description 1
- NMRGXROOSPKRTL-SUJDGPGCSA-N [(2r)-2,3-bis(3,7,11,15-tetramethylhexadecoxy)propyl] 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CC(C)CCCC(C)CCCC(C)CCCC(C)CCOC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OCCC(C)CCCC(C)CCCC(C)CCCC(C)C NMRGXROOSPKRTL-SUJDGPGCSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 239000008151 electrolyte solution Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 150000002270 gangliosides Chemical class 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 239000010439 graphite Substances 0.000 description 1
- 229910002804 graphite Inorganic materials 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000011810 insulating material Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000013554 lipid monolayer Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 150000004767 nitrides Chemical class 0.000 description 1
- 238000003203 nucleic acid sequencing method Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010587 phase diagram Methods 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 229920001721 polyimide Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000006462 rearrangement reaction Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000026280 response to electrical stimulus Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 230000036262 stenosis Effects 0.000 description 1
- 208000037804 stenosis Diseases 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 238000001447 template-directed synthesis Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000006276 transfer reaction Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/416—Systems
- G01N27/447—Systems using electrophoresis
- G01N27/44756—Apparatus specially adapted therefor
- G01N27/44791—Microapparatus
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48721—Investigating individual macromolecules, e.g. by translocation through nanopores
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Epidemiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Dispersion Chemistry (AREA)
- Electrochemistry (AREA)
Description
特に明記されない限り、本明細書中で使用されている技術的および科学的用語は、当業者によって一般に理解されているのと同じ意味を有する。本明細書中に記載されているのと類似または等価の方法、装置、および材料が、開示技術の実施に使用できる。下記の用語は、頻繁に使用されている一定の用語の理解を促進するために提供されるのであって、本開示の範囲を制限するものではない。本明細書中で使用されている略語は、化学および生物学的分野の範囲内における慣用の意味を有する。
態様により、例えば配列決定プロセスの確率的性質を考慮し、核酸の配列の測定における改良された正確性が提供できる。一部の態様では、所与の配列決定セルに特別な時間ベースの測定(例えばヒストグラムの形成)を使用して、特定期間にわたって測定された塩基の配列を決定するための特注モデルを生成することができる。該モデルは、それぞれが異なる状態(例えばナノポアの異なる状態)に対応する確率関数を含みうる。そのような確率関数は、その特定セルについて得られた測定のヒストグラムにフィットさせることができるので、確率関数をその特定セルに合わせることにより、増大した正確性を提供できる。確率関数は、核酸の配列決定操作の間中更新できるので、配列決定セルの物理的性質のドリフトを考慮に入れることができる。
図1は、ナノポアセル150のアレイ140を有するナノポアセンサーチップ100の態様を示す上面図である。各ナノポアセル150は、ナノポアセンサーチップ100のシリコン基板上に集積された制御回路を含む。一部の態様において、側壁136がアレイ140に含まれてナノポアセル150のグループを分離し、各グループが特徴付けのための異なるサンプルを受け入れるようにすることもできる。各ナノポアセルは、核酸を配列決定するために使用できる。一部の態様において、ナノポアセンサーチップ100は、カバープレート130を含んでもよい。一部の態様において、ナノポアセンサーチップ100は、コンピュータプロセッサなどの他の回路とのインターフェースのために複数のピン110を含むこともできる。
ナノポアセンサーチップ100のナノポアセル150は、多様な方法で実施することができる。例えば、一部の態様において、異なるサイズおよび/または化学構造のタグを、配列決定される核酸分子の異なるヌクレオチドに付けることができる。一部の態様において、配列決定される核酸分子の鋳型に対する相補鎖は、異なるポリマータグ付きヌクレオチドを鋳型とハイブリダイズすることによって合成することができる。一部の実施において、核酸分子と付着タグは、どちらもナノポアを通って移動できるので、ナノポアを通るイオン電流は、ヌクレオチドに付けられたタグの特定のサイズおよび/または構造のために、ナノポア内にあるヌクレオチドを示すことができる。一部の実施においては、タグだけがナノポア内に移動できる。ナノポア中の異なるタグを検出するための多数の異なる方法もあるであろう。
図2に、ポリヌクレオチドまたはポリペプチドの特徴付けに使用できる図1のナノポアセンサーチップ100中のナノポアセル150のような、ナノポアセンサーチップ中のナノポアセル200の態様を示す。ナノポアセル200は、誘電体層201および204から形成されたウェル205;ウェル205上に形成された脂質二重層214などの膜;および脂質二重層214上にあって脂質二重層214によりウェル205から分離されているサンプルチャンバ215を含みうる。ウェル205は、一定容量の電解質206を含有でき、サンプルチャンバ215は、ナノポアを含有するバルク電解質208、例えば可溶性タンパク質ナノポア膜貫通分子複合体(PNTMC)、および目的の被検体(例えば、配列決定される核酸分子)を保持できる。
ナノポアセンサーチップ100中のナノポアセル150のような、ナノポアセンサーチップ中のナノポアセルは、合成による単一分子ナノポアベースの配列決定(Nano−SBS)技術を用いる並行配列決定を可能にしうる。
図4に、ナノポアセル200のようなナノポアセル中の電気回路400(図2の電気回路222の部分を含みうる)の態様を示す。上記のように、一部の態様において、電気回路400は、ナノポアセンサーチップ中の複数のナノポアセルまたは全ナノポアセル間で共有できる、従って共通電極とも呼べる対電極410を含む。共通電極は、電圧源VLIQ420に接続することにより、ナノポアセル中の脂質二重層(例えば脂質二重層214)と接触しているバルク電解質(例えばバルク電解質208)に共通電位を印加するように構成できる。一部の態様においては、AC非ファラデーモードを利用して電圧VLIQをACシグナル(例えば矩形波)で変調し、それをナノポアセル中の脂質二重層と接触しているバルク電解質に印加することができる。一部の態様において、VLIQは±200〜250mVの振幅および例えば25〜400Hzの周波数を有する矩形波である。対電極410と脂質二重層(例えば脂質二重層214)間のバルク電解質は、例えば100μF以上の大型キャパシタ(図示せず)によってモデル化することができる。
核酸の配列決定を実施するためには、タグ付きヌクレオチドが核酸に付加されている間に積分キャパシタ(例えば積分キャパシタ408(ncap)またはキャパシタ426(CBilayer))の電圧レベルをサンプリングし、ADC(例えばADC435)によって変換すればよい。ヌクレオチドのタグは、例えば印加電圧がVPREよりVLIQが低いような場合、対電極および作用電極を通じて印加されるナノポア全体の電界によってナノポアの胴部に押し込まれうる。
通り抜け事象は、タグ付きヌクレオチドが鋳型(例えば核酸フラグメント)に結合し、タグがナノポアの胴部に入りそして出るときのことである。これは通り抜け事象中に何回も起こりうる。タグがナノポアの胴部にある場合、ナノポアの抵抗は高くなり、ナノポアを流れる電流は少なくなりうる。
ACサイクル中、積分キャパシタ上の電圧はADCによって何回もサンプリングされうる。例えば、一態様において、AC電圧シグナルはシステム全体に例えば約100Hzで印加され、ADCの取得速度はセルあたり約2000Hzでありうる。従って、ACサイクル(AC波形のサイクル)あたり捕捉される約20のデータ点(電圧測定値)がありうる。AC波形の1サイクルに対応するデータ点はセットと呼ぶことができる。ACサイクルに対するデータ点のセットには、例えば、VLIQがVPREより低い場合に捕捉されるサブセットがありうる。これはタグがナノポアの胴部に押し込まれている明モード(期間)に対応しうる。別のサブセットは、例えば、VLIQがVPREより高い場合に印加電界によってタグがナノポアの胴部から押し出された暗モード(期間)に対応しうる。
各データ点について、スイッチ401が開放されている場合、積分キャパシタ(例えば積分キャパシタ408(ncap)またはキャパシタ426(CBilayer))の電圧は、VLIQによる充電/放電の結果、例えばVLIQがVPREより高い場合、VPREからVLIQへの増加として、またはVLIQがVPREより低い場合、VPREからVLIQへの減少として、減衰様式で変化する。最終電圧値は、作用電極が充電するとVLIQから逸脱しうる。積分キャパシタ上の電圧レベルの変化速度は、ナノポアを含みうる、ひいてはナノポア内の分子(例えばタグ付きヌクレオチドのタグ)を含みうる二重層の抵抗の値に支配されうる。電圧レベルはスイッチ401の開放後、所定の時間に測定できる。
ナノポアセンサーチップの使用可能な各ナノポアについては、核酸の配列決定をするために実動モード(production mode)を実施することができる。配列決定中に捕捉されたADC出力データは、より高い正確性を提供するために正規化することができる。正規化は、サイクル形状、ゲインドリフト、電荷注入オフセット、およびベースラインシフトなどのオフセット効果に対処できる。一部の実施において、通り抜け事象に対応する明期間サイクルのシグナル値は、そのサイクルについて単一のシグナル値(例えば平均)が得られるようにまたはサイクル内減衰(一種のサイクル形状効果)を低減するために測定シグナルに対して調整が行えるように、平坦化することができる。ゲインドリフトは、一般的に、シグナル全体を拡大縮小し、数百から数千秒のオーダーで変化させる。例として、ゲインドリフトは、溶液(ポア抵抗)の変化または二重層キャパシタンスの変化によって誘発されうる。ベースラインシフトは、〜100msの時間スケールで発生し、作用電極における電圧オフセットに関連する。ベースラインシフトは、明期間から暗期間への配列決定セル中の電荷バランスを維持する必要性の結果、通り抜けによる有効整流比の変化によって推進されうる。
鋳型核酸の配列が所望されるが、配列の特定の塩基は、測定から推測される必要がある。システムの様々な物理的特性が、そのような決定を実施するのを困難にしうる。シグナルの測定(例えばADC層)から鋳型核酸(鋳型層)の配列を決定するプロセスにおいて、様々なデータ層は異なるレベルの推測に対応しうる。様々なデータ層は、鋳型層、酵素層、ポア層、および単一層を含む。様々なデータ層を議論する前に、ヌクレオチドの取込みおよびタグの通り抜けの様々な状態について説明する。
図6に、本発明の態様に従って、タグ付きヌクレオチドを用いる核酸配列決定のためのプロセス600の態様を示す。ステージAは、そのようなタグ付きヌクレオチドを用いてヌクレオチドの配列決定を実施しようとしている配列決定セルを示す。ナノポア601が膜602に形成されている。酵素603(例えばDNAポリメラーゼなどのポリメラーゼ)がナノポアに会合している。一部の場合、ポリメラーゼ603はナノポア601に共有結合されている。ポリメラーゼ603は、配列決定される核酸分子604と会合している。一部の態様において、核酸分子604は円形である。一部の場合、核酸分子604は線形である。一部の態様において、核酸プライマー605は核酸分子604の部分にハイブリダイズされている。ポリメラーゼ603は、1本鎖核酸分子604を鋳型として用いて、プライマー605上へのヌクレオチド606の取込みを触媒する。ヌクレオチド606はタグ種(“タグ”)607を含む。
図7に、本発明の態様に従って、配列決定セル700および対応データ層の簡略図を示す。鋳型核酸分子704が、膜714内のナノポア701を用いて、酵素703による合成によって配列決定されているところが示されている。図7は、ヌクレオチド706を鋳型核酸分子704に触媒するプロセスにおける酵素703を示している。従って、酵素703は、塩基Tに対応する結合状態にある。タグ707は、ナノポア701に入り込んでいないので、非通り抜け状態にある。ADC735は、非通り抜け状態(図示)および通り抜け状態のナノポア701の抵抗を測定して(例えば電圧または電流の測定により)、タグ707を識別することができる。これによってヌクレオチド706の識別が提供されることにより、鋳型核酸分子704の配列中の1個の塩基が得られる。
鋳型核酸分子704の配列は鋳型層の塩基に対応する。鋳型核酸分子704の配列は、鋳型核酸分子704に触媒されたヌクレオチドの触媒状態に対応するはずである。図7に、GAGTTTTATCGCTTCC(配列番号1)の配列例を示す。この配列は、測定シグナル値を用いてコンピュータシステムによって実施された塩基呼出手順の所望出力である。しかし、以下に説明するように、配列は直接測定されるわけではない。従って、鋳型層は隠れ層と見なすことができる。鋳型層は、それが実際の物理的分子に対応しているので、物理的状態の最高レベルの情報と見なすことができ、誤差ゼロと見なすことができる。
酵素層は、自由流動しているヌクレオチドと酵素703に関連する活性部位との結合事象の配列である。図7に、酵素層の例GAAGTTATATC−CTTCC(配列番号2)を示す。酵素層も直接測定されないので、隠れ層と見なすことができる。
通り抜け事象に対応するポア層は、理想化された酵素−タグ結合事象の下に示されている。図7に、ポア層の例:GGGGGGAAAAAAAAAAAAGGGGGGGTTTTTTTTAAAAAATTATCCCCCCCCCCCC−CCCCTTTCCCCCCCCCCC(配列番号3)を示す。ポア層も直接測定されないので、隠れ層と見なすことができる。
シグナル層は、電圧がADC735によって測定されると示される。これはスイッチが開放された後(例えばスイッチ401)、特定時間の後に行われた電圧測定値に対応する。電圧測定値は、積分キャパシタ408(ncap)における電圧に対応しうる。他のシグナル値も使用できる。
図9に、本発明の態様に従って、通り抜け状態にある図7の配列決定セル700と、ある層のサンプルデータの簡略図を示す。図9は、シグナル層910を観測層として示している。図9は、結合状態にあるヌクレオチド706と、通り抜け状態にあるタグ707を有する配列決定セル700を示している。タグ707のこのような通り抜けは、ナノポア701の抵抗を増大させるので、測定ADC値は低下する。
一つまたは複数の隠れ層(例えば、ポア層、酵素層、および鋳型層)を再構築するためのプロセスは、塩基呼出パイプライン(ハードウェアおよび/またはソフトウェアを含みうる)において進めることができる。そのような塩基呼出パイプラインは、コンピュータシステム、例えば図1のナノチップワークステーション120、図2のプロセッサ224、および/または図4のデジタルプロセッサ430を用いて実行できる。
様々な態様において、一つまたは複数のHMMをパイプラインの様々な時点で使用することができる。例えば、HMMの隠れ配列は、経時的な結合状態(事象)の配列でありうる。この隠れ配列の決定は、ACモードの使用によってさらに困難になりうる。DCモードでは、結合事象があるたびに、タグは多少の遅れの後通り抜ける。一連のパルスがあり、それぞれ結合事象に対応し、連続的な結合事象が異なる塩基に対するものである場合、おそらく異なるシグナルレベルを有する。しかし、ACモードが使用されると、そのようなパルスは、例えばACシグナルの明期間のようなより小さい観測に分断されてしまう。
図13に、隠れマルコフモデル(HMM)を用いて隠れ状態を決定するための時間トレース1300を示す。この例では、隠れ状態は、ポリメラーゼ(結合)状態またはポア(通り抜け)状態に対応しうる。トレース1300は、いくつかの離散した時間ステップ1310(例えば、タイムスタンプまたは時間インデックスによって識別される)を含む。例として、各時間ステップは、異なる測定シグナル値(すなわち連続した測定シグナルは同じ明期間からのものでありうる)に対応しうるか、またはACサイクル(例えば明期間あたり1点、これは通り抜け事象に対応すると識別されたシグナル値から決定できる)に対応しうる。様々な実施において、単一の値は、所与の明期間の通り抜けシグナル値の平均またはメジアンとして決定できる。明期間の通り抜けシグナル値は、開チャンネルと通り抜けチャンネル間を区別するカットオフ値(重み付きのハードカットオフまたはソフトカットオフ)に基づいて、非通り抜けシグナル(例えば、通り抜けが即時でない場合の明期間の開始時に起こりうるような)から区別することができる。
HMMプロセスの最初の部分で、可能性ある様々な状態について記載している。前述のように、一部の態様において、4種類の塩基に対する4つの結合状態(おそらくは1つの集合的結合状態に対応する)と1つの非結合状態に対応する5つの酵素状態がある。ポア状態に対しては様々な状態が定義できる。例えば、フィルタリング手順を用いて結合状態および非結合状態に対応する時間を識別する場合、通り抜けおよび非通り抜け(開チャンネル)の2つの状態が定義できる。この場合、二つの確率関数が決定できる(例えば混合分布モデルについて)。一つは通り抜け確率関数であり、一つは非通り抜け確率関数である。通り抜け状態を異なるタグごとに4つの通り抜け状態に分ける場合、5つのポア状態が定義できる。
状態が定義されたら、状態間の遷移確率が決定できる。そのようなペアワイズ遷移確率は遷移行列を形成する。遷移行列は正方行列である。従って、30の状態があると、遷移行列は30×30の行列となる。遷移行列は、これらの状態間の遷移の統計知識に基づいて、一つの状態から次の状態へ移動する配列決定セルの経時的な確率を記述する。
出力テーブルまたは関数は、所与の状態についての観測パラメーターに関する情報を提供する。例えば、各状態は、一般的に、観測パラメーター、例えばナノポアにある特定のタグに関連する電圧または電流について、特定範囲の値を有しうる。
図15Aに、各5つの状態について異なる範囲にある観測パラメーターの確率を含む出力テーブルの例を示す。行は5つの状態S0〜S4に対応する。例えば、1つの非結合状態および4つの結合状態に対応している。列Y0〜Y4は異なる範囲のシグナル値(例えば正規化されたシグナル値について)に対応する。例えば、Y0は(>0.9)に対応し;Y1は(0.9−0.67)に対応し;Y2は(0.45−0.67)に対応し;Y3は(0.23−0.45)に対応し;そしてY4は(0.0−0.23)に対応する。5つの範囲が示されているが、追加の範囲も使用できる。範囲は、所与の状態にある確率がゼロで無視される範囲間の値と重なり合わない。
出力関数(例えば確率密度関数、PDF)は、同じ範囲内の観測パラメーターのすべての値を同じ発生確率を有するとして扱うのとは対照的に、連続関数として確率を提供できる。PDFは、観測パラメーターの所与の値についてそれぞれの状態にある確率を提供することができる。
一部の態様において、ピークおよび/または谷の検出技術を実施すれば、ピークの位置を決定することができる。例えば、Daviesの谷検出法が、例えば、谷が負の方向でピークに変換でき、逆さ谷(inverted valley)の間の分離をピークと識別できる場合、使用できる。当業者には分かる通り、様々なピークおよび/または谷検出技術が使用できる。ヒストグラムは、例えばカーネル密度推定(KDE)を用いてビニングアーチファクト(binning artifacts)を平滑化することができるので、ピーク検出をより容易に実施することが可能となる。
状態が定義され、遷移確率および出力確率関数が決定されたら、隠れ状態を復号して鋳型核酸に結合された塩基を決定することができる。一部の態様において、遷移確率および出力確率関数は、隠れ状態が復号される前に、所与のセルについて配列決定の実行全体にわたって完全に決定されうる。
PDFおよび各時間ステップにおける測定シグナル値を用いて、観測テーブルが作成できる。各時間ステップについて、測定シグナル値を用いて各状態(例えば酵素状態)の確率を決定することができる。
遷移行列および観測テーブルを使用してトレリス線図(グラフ)を作成することができ、トレリスを通る最適経路は結合事象を提供する。トレリス線図を通る最適経路は、システムは無記憶であるというマルコフ性に基づいて決定できる。どの時点でも、その時間の状態を決定する際、前の列だけが考慮されうる。それより前の列は考慮されない。トレリス線図では、一つの時間ステップにおけるヌクレオチド状態は、ペアワイズ遷移確率に従って、次の時間ステップにおけるヌクレオチド状態に結びつけることができる。
塩基呼出を決定するための一態様において、すべての結合事象を塩基呼出と見なすことができる。そのような手順は、配列決定セルがつっかえず(stutter)、例えば、ヌクレオチドは取り込まれたが触媒されず、同じ種類の新しいヌクレオチドが取り込まれて、後で触媒されれば、正確でありうる。例えば、結合事象があるたびに、触媒される前に離れ落ちる機会が50%あると仮定する。結合事象のリストが分析できれば、塩基呼出の数を減らすことができる。例えば、同じ塩基について二つ以上の連続結合事象があるたびに、その数は半分にすることができる。二つ以上の場合とは対照的に、ヌクレオチドについて時には一つの結合事象しか並んでいないことに対処するために修正を行うことができる。
一部の態様において、塩基の品質スコアが提供できる。品質スコアは、単一分子観測に固有の確率的挙動を反映したものでありうる。塩基呼出の品質は時間または読み出し長さに伴って劣化することはないであろうが、所与の鋳型核酸上の異なる時点でランダムになされる異なる塩基呼出については異なる品質スコアがあるかもしれない。塩基呼出の品質スコアが高いほど、塩基呼出が正しいことの信頼度が大きいことを示しうる。例えば、PDFのピークに近いシグナル値は、PDFのピークから遠いシグナル値よりも、高い品質スコアを有する塩基呼出をもたらすことができる。ベースコーラー(basecaller)(例えばHMMを使用する)の出力の一つは、そのような品質スコアでありうる。
P(statei)は遷移確率から決定できる。
前述のように、混合分布モデル(または他のPDF)のパラメーターの初期値は、同様のポアおよびタグを使用する他の配列決定セルからの測定値に基づいて決定できる。PDFは最近の測定に基づいて更新でき、ポアごとに決定できる。一部の状態のPDFは実験ごとに非常に安定していることがある。そのような状態は特徴付けでき、出力関数の形状が決定できる。他の状態は、時間経過と共に変化しうるおよび/またはポアごとに異なりうる。
図18に、本発明の態様に従って、核酸の配列決定をするために、配列決定セルを使用して時間依存性確率関数を決定する方法1800のフローチャートを示す。方法1800の側面は、方法1000と同様に実施できる。
前述のように、初期確率関数は、配列決定実行全体のシグナル値を用いて決定することができる。これらの初期確率関数は時間非依存性PDFとして決定できる。ベースコーラー(例えばHMMを使用する)を、例えば方法1000の態様に記載されているのと同様に実施して、初期塩基呼出を決定することができる。時間非依存性PDFを用いるそのようなベースコーラーの初回パスは、特定のタグ/塩基を高度に示す(例えば関連塩基呼出に対するより高い確率および/または品質スコア)明白なシグナル値を識別できる。これらの高品質シグナル値は時間依存性PDFに対する更新を決定するために使用でき、それによって時間依存性PDFの決定からのノイズが削減される。
追加のポア状態の出力PDFは、例えば非結合タグが各PDFで表されている場合、変動しうる。例えば、非結合GタグのPDFは、結合GのPDFとは異なる位置にピークを有する形状を有しうる。部分積分状態の場合、タグが非通り抜け状態から通り抜け状態に進むので、PDFは開チャンネルからピークに至るまでより均一な分布を有しうる。従って、部分積分状態は、二つの状態、例えば開チャンネルとAとの間をつなぐであろう別個のPDFを有しうる。
ポリメラーゼを使用する態様において、ポリメラーゼは、4種類のヌクレオチドの一つと結合状態かまたは活性部位にヌクレオチドがない非結合状態でありうる。同じ手順(例えば本明細書中に記載のような)で全5つの結合状態を分類する代わりに、一部の態様では、測定されたシグナル値を結合状態または非結合状態に対応するとして分類する初期分類子を使用することができる。そのような2状態分類子は2つの隠れ状態を有するHMMでありうるが、他の2状態分類子も使用できる。
第一の分類子は、正規化または非正規化シグナル値に対して動作できる。タグおよびポアを用いる態様において、2状態分類子は、シグナル値が開チャンネル状態または通り抜け状態(タグがポア内にある)に対応しているかどうかを決定できる。正規化されたシグナル値の例として(例えばOC分率)、非結合状態のピークはおよそ1.0でありうるので、1.0より十分低い任意の値(例えば0.9未満)は結合状態に対応する。
図19に、本発明の態様に従って、2状態分類子と第二の分類子を用いて核酸の配列を決定するために配列決定セルを使用する方法1900のフローチャートを示す。方法1900の側面は、方法1000および/または方法1800と同様に実施できる。
ブロック1960で、核酸の配列が提供される。ブロック1960は、方法1800のブロック1870と同様に実施できる。
図20に、本発明の態様に従って、シグナルトレース2010、拡大トレース2020、正規化シグナル値2030、およびヒストグラム2040の例を示す。シグナルトレース2010についての本実施例で、HMM復号は、最も可能性の高い結合状態の配列を、ATAGCTAGCACAGAGAGCGACAGCATACTACTCACTGACGCAGAGCG(配列番号4)と識別している。拡大トレース2020は、開チャンネルおよび暗チャンネルの二つの暗バンドを示している。正規化シグナル値2030(暗チャンネル除去)は、正規化の結果、拡大トレース2020よりも平坦なデータを示している。ヒストグラム2040は、正規化シグナル値2030のプロットに表された時間間隔におけるシグナル値の組に対応している。
本明細書中に記載されたコンピュータシステムはいずれも、任意の適切な数のサブシステムを利用できる。そのようなサブシステムの例は図23のコンピュータシステム10に示されている。一部の態様において、コンピュータシステムは、単一のコンピュータ装置を含み、サブシステムはコンピュータ装置のコンポーネントでありうる。他の態様では、コンピュータシステムは複数のコンピュータ装置を含み、それぞれが内部コンポーネントを有するサブシステムでありうる。コンピュータシステムは、デスクトップおよびラップトップコンピュータ、タブレット、携帯電話およびその他のモバイル機器を含みうる。
75 システムバス
100 ナノポアセンサーチップ
110 ピン
130 カバープレート
136 側壁
140 アレイ
150 ナノポアセル
200 ナノポアセル
300 ナノポアセル
340 遮断シグナル
400 電気回路
401 スイッチ
408 積分キャパシタ
422 電気モデル
510 電圧シグナル
522 データ点
600 核酸配列決定のプロセス
601 ナノポア
603 酵素
604 核酸分子
605 プライマー
606 ヌクレオチド
607 タグ
700 配列決定セル
701 ナノポア
703 酵素
704 核酸分子
706 ヌクレオチド
707 タグ
714 膜
800 酵素層
810 パルス
1100 正規化されたシグナル値のプロット
1150 ヒストグラム
1200 配列決定セル
1300 時間トレース
2010 シグナルトレース
2020 拡大トレース
2030 正規化シグナル値
2040 ヒストグラム
2140 中間図
2150 高ズーム図
Claims (17)
- コンピュータシステムに接続された配列決定セルを使用して核酸の配列を決定する方法であって、前記方法が:
−配列決定セルのための第一の時間間隔にわたって核酸から測定された第一の組のシグナル値を得ること、ここで第一の組のシグナル値は配列決定セルの4つのセル状態のそれぞれの測定値を含み、4つのセル状態は異なる種類のヌクレオチドに対応するものである;
−第一の組のシグナル値の第一のヒストグラムを作成すること、ここで第一のヒストグラムは複数のカウントを記憶するデータ構造であり、各カウントはビン内のシグナル値の数に対応するものであり、第一のヒストグラムの各ビンは異なる数値に対応するものである;
ここで、4つのセル状態の各セル状態に対して:
−そのセル状態にあることの出力確率を異なる数値に割り当てる確率関数を決定すること、ここで確率関数は第一のヒストグラムのビンに対する複数のカウントを使用して決定されるものである;
−核酸の4つのヌクレオチド状態間のペアワイズ遷移確率を提供する遷移行列を決定すること、ここで4つのヌクレオチド状態は異なる種類のヌクレオチドに対応するものである;
−T個の時間ステップにわたるトレリス線図を作成すること、ここで各時間ステップは第一の組のシグナル値の1つのシグナル値に対応するものであり、所与の時間ステップにおけるトレリス線図は4つのヌクレオチド状態を含むものであり、そのそれぞれが対応するセル状態の確率関数を用いて決定された出力確率を有するものであり、ある時間ステップでのヌクレオチド状態はペアワイズ遷移確率に従って次の時間ステップでのヌクレオチド状態に結びつけられるものである;および、
−各時間ステップにおけるヌクレオチド状態を識別するために、出力確率およびペアワイズ遷移確率に基づいてトレリス線図を通る最適経路を決定すること;
を含み、
−T個の時間ステップにおけるヌクレオチド状態を用いて核酸の配列を含む塩基を決定すること;ならびに、
−核酸の配列を提供すること、
を含む、前記方法。 - 配列決定セルがナノポアをさらに含み、配列決定セル全体に印加される電圧を有し、そして4つのセル状態がナノポアのポア状態に対応する、請求項1に記載の方法。
- 電圧が、参照電圧に対して第一の部分と第二の部分とを有する交流シグナルを含み、第一の組のシグナル値が交流シグナルの第一の部分の間に測定される、請求項2に記載の方法。
- 配列決定セルが核酸を配列決定するためのポリメラーゼを含み、ヌクレオチド状態がポリメラーゼの結合状態に対応し、第一の組のシグナル値がナノポアを通り抜けるヌクレオチドに結合されたタグ分子がないことに対応する配列決定セルの第五のセル状態に対する測定値であることをさらに含む、請求項3に記載の方法。
- ヌクレオチド状態が、セル状態のサブ状態およびポリメラーゼの結合状態を含むシステム状態に対応し、システム状態はポリメラーゼに対する非結合状態とポア状態についての通り抜け状態との組合せを含む、請求項4に記載の方法。
- さらに、
−他の配列決定セルについての他の核酸から測定された他の組のシグナル値を得ることを含み、
そして、他の配列決定セルのそれぞれに対して:
−別の組のシグナル値から別のヒストグラムを作成すること、
−第一のヒストグラムを用いて配列決定セルに固有の確率関数を決定すること、および
−配列決定セルに固有の確率関数を用いて、配列決定セルにおける核酸の配列を含む塩基を決定すること、
を含む、請求項1に記載の方法。 - 第一のヒストグラムを用いる確率関数の決定が、各確率関数を第一のヒストグラムのピークにフィッティングさせることを含む、請求項1に記載の方法。
- トレリス線図を通る最適経路が、ビタビ復号を用いて決定される、請求項1に記載の方法。
- さらに、
第二の時間間隔に対応する第二の確率関数を決定することを含み、
確率関数と第二の確率関数は時間依存性確率関数のセットを形成し、ここで第二の確率関数は、確率関数と、配列決定セルについての第二の時間間隔にわたって核酸から測定された第二の組のシグナル値から決定された第二のヒストグラムとを用いて決定され、核酸の配列を含む塩基は時間依存性確率関数のセットを用いて決定される、請求項1に記載の方法。 - 配列決定セルが核酸を配列決定するためのポリメラーゼを含み、第一の組のシグナル値は配列決定セルの5つの結合状態のそれぞれの測定値を含み、4つの結合状態は異なる種類のヌクレオチドに対応し、第五の結合状態はヌクレオチドがポリメラーゼの活性部位にないことに対応し、4つの結合状態はまとめて結合状態に対応し、第五の結合状態は非結合状態に対応する請求項1に記載の方法であって、前記方法がさらに、
−第一の組のシグナル値のそれぞれを第一の分類手順を用いて結合状態または非結合状態に対応するとして分類すること、ここで第一の分類手順は2状態分類子である;および、
−サブセットのシグナル値を結合状態に対応するとして識別すること、ここでトレリス線図を用いてサブセットのシグナル値に対応するヌクレオチド状態が決定される、
を含む、請求項1に記載の方法。 - 配列決定セルが核酸を配列決定するためにナノポアに結合されたポリメラーゼを含み、そして第一の組のシグナル値を得ることが配列決定セル全体に電圧を印加することを含み、
ここで前記電圧は参照電圧に対して第一の部分と第二の部分とを有する交流シグナルを含み、
ここで第一の組のシグナル値の少なくとも一部が、タグ分子が配列決定セルのナノポアを通り抜ける時に交流シグナルの第一の部分の間に測定され、前記タグ分子は特定のヌクレオチドに対応する、請求項1に記載の方法。 - コンピュータシステムに接続された配列決定セルを使用して核酸の配列を決定する方法であって、前記方法が:
−配列決定セルについての第一の時間間隔にわたって核酸から測定された第一の組のシグナル値を得ること、ここで第一の組のシグナル値は配列決定セルの4つのセル状態のそれぞれの測定値を含み、4つのセル状態は異なる種類のヌクレオチドに対応するものである;
−第一の組のシグナル値の第一のヒストグラムを作成すること、ここで第一のヒストグラムは複数のカウントを記憶するデータ構造であり、各カウントはビン内のシグナル値の数に対応するものであり、第一のヒストグラムの各ビンは異なる数値に対応するものである;
ここで、4つのセル状態の各セル状態に対して:
−そのセル状態にあることの出力確率を異なる数値に割り当てる初期確率関数を決定すること;および、
−初期確率関数と第一のヒストグラムを使用して、そのセル状態にあることの出力確率を異なる数値に割り当てる第一の確率関数を決定すること、ここで前記第一の確率関数は第一の時間間隔に対応するものである;
−第二の時間間隔に対応する第二の確率関数を決定すること、ここで第一の確率関数と第二の確率関数は時間依存性確率関数のセットを形成し、第二の確率関数は、第一の確率関数と、配列決定セルについての第二の時間間隔にわたって核酸から測定された第二の組のシグナル値から決定された第二のヒストグラムとを用いて決定されるものである;
−時間依存性確率関数のセットを用いて核酸の配列を含む塩基を決定すること;および、
−核酸の配列を提供すること、
を含む、前記方法。 - 初期確率関数が、一つまたは複数の他の配列決定セルから測定されたシグナル値を用いて決定される、請求項12に記載の方法。
- 初期確率関数が、第一の時間間隔より早い時間間隔から測定されたシグナル値を用いて決定される、請求項12に記載の方法。
- 初期確率関数が、核酸の配列決定における第一の時間間隔と他の時間間隔とを含むより長い時間間隔にわたって測定されたシグナル値を用いて決定される、請求項12に記載の方法。
- 第一の確率関数が、ベイズ統計を用いて事後分布として第二の確率関数を決定するために、事前分布として使用される、請求項12に記載の方法。
- 時間依存性確率関数のセットを使用する塩基の決定が、
−核酸の4つのヌクレオチド状態間のペアワイズ遷移確率を提供する遷移行列を決定すること、ここで4つのヌクレオチド状態は核酸の異なるヌクレオチドに対応するものである;
−T個の時間ステップにわたるトレリス線図を作成すること、ここで各時間ステップは第一の組のシグナル値の1つのシグナル値に対応するものであり、所与の時間ステップにおけるトレリス線図は4つのヌクレオチド状態を含むものであり、そのそれぞれが対応するセル状態の時間依存性確率関数を用いて決定された出力確率を有し、そして所与の時間ステップに対応するものであり、ある時間ステップでのヌクレオチド状態はペアワイズ遷移確率に従って次の時間ステップでのヌクレオチド状態に結びつけられるものである;および、
−各時間ステップにおける塩基呼出を識別するために、出力確率およびペアワイズ遷移確率に基づいてトレリス線図を通る最適経路を決定すること;
を含む、請求項12に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662372258P | 2016-08-08 | 2016-08-08 | |
US62/372,258 | 2016-08-08 | ||
US201662384650P | 2016-09-07 | 2016-09-07 | |
US62/384,650 | 2016-09-07 | ||
PCT/EP2017/069820 WO2018029108A1 (en) | 2016-08-08 | 2017-08-04 | Basecalling for stochastic sequencing processes |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019531536A JP2019531536A (ja) | 2019-10-31 |
JP6814875B2 true JP6814875B2 (ja) | 2021-01-20 |
Family
ID=59677206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019506441A Active JP6814875B2 (ja) | 2016-08-08 | 2017-08-04 | 確率的配列決定プロセスのための塩基呼出 |
Country Status (5)
Country | Link |
---|---|
US (3) | US10648027B2 (ja) |
EP (1) | EP3497233B1 (ja) |
JP (1) | JP6814875B2 (ja) |
CN (1) | CN109952382B (ja) |
WO (1) | WO2018029108A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3497233B1 (en) * | 2016-08-08 | 2021-11-10 | F. Hoffmann-La Roche AG | Basecalling for stochastic sequencing processes |
EP3512963A1 (en) | 2016-09-15 | 2019-07-24 | H. Hoffnabb-La Roche Ag | Nanopore-based sequencing using voltage mode with hybrid mode stimuli |
TWI738018B (zh) * | 2018-06-27 | 2021-09-01 | 瑞士商赫孚孟拉羅股份公司 | 用於核酸定序之感測器晶片及方法、定序系統、及電腦產品 |
JP2022511880A (ja) * | 2018-12-11 | 2022-02-01 | エフ.ホフマン-ラ ロシュ アーゲー | 膜における自己制限性プロテイン細孔挿入のためのシステム及び方法 |
US11783917B2 (en) | 2019-03-21 | 2023-10-10 | Illumina, Inc. | Artificial intelligence-based base calling |
US11210554B2 (en) | 2019-03-21 | 2021-12-28 | Illumina, Inc. | Artificial intelligence-based generation of sequencing metadata |
US11423306B2 (en) | 2019-05-16 | 2022-08-23 | Illumina, Inc. | Systems and devices for characterization and performance analysis of pixel-based sequencing |
US11593649B2 (en) | 2019-05-16 | 2023-02-28 | Illumina, Inc. | Base calling using convolutions |
JP2022544464A (ja) * | 2019-07-31 | 2022-10-19 | エーエックスバイオ インコーポレイテッド | 標的分子を評価するためのシステム及び方法 |
EP4107735A2 (en) | 2020-02-20 | 2022-12-28 | Illumina, Inc. | Artificial intelligence-based many-to-many base calling |
US20220336054A1 (en) | 2021-04-15 | 2022-10-20 | Illumina, Inc. | Deep Convolutional Neural Networks to Predict Variant Pathogenicity using Three-Dimensional (3D) Protein Structures |
WO2023059599A1 (en) | 2021-10-04 | 2023-04-13 | F. Hoffmann-La Roche Ag | Online base call compression |
CN113854990B (zh) * | 2021-10-27 | 2024-05-31 | 青岛海信日立空调系统有限公司 | 一种心跳检测方法及装置 |
EP4419714A1 (en) * | 2021-11-23 | 2024-08-28 | Pleno, Inc. | Encoded assays |
WO2024124497A1 (zh) * | 2022-12-15 | 2024-06-20 | 深圳华大生命科学研究院 | 基于机器学习的纳米孔测序信号状态的识别方法、机器学习模型的训练方法和装置 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE9702008D0 (sv) | 1997-05-28 | 1997-05-28 | Pharmacia Biotech Ab | A method and a system for nucleic acid seouence analysis |
US7039238B2 (en) | 2000-12-01 | 2006-05-02 | Sri International | Data relationship model |
CN101401101B (zh) | 2006-03-10 | 2014-06-04 | 皇家飞利浦电子股份有限公司 | 用于通过谱分析鉴定dna模式的方法和系统 |
US8703422B2 (en) | 2007-06-06 | 2014-04-22 | Pacific Biosciences Of California, Inc. | Methods and processes for calling bases in sequence by incorporation methods |
CA2689626C (en) | 2007-06-06 | 2016-10-25 | Pacific Biosciences Of California, Inc. | Methods and processes for calling bases in sequence by incorporation methods |
US8452546B1 (en) | 2008-11-07 | 2013-05-28 | Electronic Biosciences, Inc. | Method for deducing a polymer sequence from a nominal base-by-base measurement |
US8370079B2 (en) | 2008-11-20 | 2013-02-05 | Pacific Biosciences Of California, Inc. | Algorithms for sequence determination |
US9175338B2 (en) | 2008-12-11 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Methods for identifying nucleic acid modifications |
WO2010068289A2 (en) | 2008-12-11 | 2010-06-17 | Pacific Biosciences Of California, Inc. | Classification of nucleic acid templates |
US9017937B1 (en) * | 2009-04-10 | 2015-04-28 | Pacific Biosciences Of California, Inc. | Nanopore sequencing using ratiometric impedance |
CA2760155A1 (en) | 2009-04-27 | 2010-11-11 | Pacific Biosciences Of California, Inc. | Real-time sequencing methods and systems |
US9063156B2 (en) | 2009-06-12 | 2015-06-23 | Pacific Biosciences Of California, Inc. | Real-time analytical methods and systems |
WO2012071434A2 (en) | 2010-11-22 | 2012-05-31 | Life Technologies Corporation | Model-based residual correction of intensities |
EP3269825B1 (en) | 2011-09-23 | 2020-02-19 | Oxford Nanopore Technologies Limited | Analysis of a polymer comprising polymer units |
CN104379761B (zh) | 2012-04-09 | 2017-03-01 | 纽约哥伦比亚大学理事会 | 纳米孔的制备方法和其用途 |
ES2779699T3 (es) | 2012-06-20 | 2020-08-18 | Univ Columbia | Secuenciación de ácidos nucleicos mediante detección en nanoporos de moléculas de etiqueta |
US9605309B2 (en) | 2012-11-09 | 2017-03-28 | Genia Technologies, Inc. | Nucleic acid sequencing using tags |
US20160171153A1 (en) | 2013-01-17 | 2016-06-16 | Edico Genome, Inc. | Bioinformatics Systems, Apparatuses, And Methods Executed On An Integrated Circuit Processing Platform |
US9679104B2 (en) | 2013-01-17 | 2017-06-13 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10068054B2 (en) | 2013-01-17 | 2018-09-04 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10847251B2 (en) | 2013-01-17 | 2020-11-24 | Illumina, Inc. | Genomic infrastructure for on-site or cloud-based DNA and RNA processing and analysis |
EP2994749A4 (en) | 2013-01-17 | 2017-07-19 | Edico Genome Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
EP2994544B1 (en) * | 2013-05-06 | 2019-10-02 | Pacific Biosciences Of California, Inc. | Real-time electronic sequencing |
ES2735015T3 (es) | 2013-11-26 | 2019-12-13 | Illumina Inc | Composiciones y métodos para secuenciar polinucleótidos |
HUE050641T2 (hu) | 2013-12-03 | 2020-12-28 | Illumina Inc | Eljárások és rendszerek képadat elemzésére |
EP3084002A4 (en) | 2013-12-16 | 2017-08-23 | Complete Genomics, Inc. | Basecaller for dna sequencing using machine learning |
US9697327B2 (en) | 2014-02-24 | 2017-07-04 | Edico Genome Corporation | Dynamic genome reference generation for improved NGS accuracy and reproducibility |
EP3120277A1 (en) | 2014-03-21 | 2017-01-25 | Oxford Nanopore Technologies Limited | Analysis of a polymer from multi-dimensional measurements |
GB201408652D0 (en) | 2014-05-15 | 2014-07-02 | Oxford Nanopore Tech Ltd | Model adjustment during analysis of a polymer from nanopore measurements |
US9557294B2 (en) | 2014-12-19 | 2017-01-31 | Genia Technologies, Inc. | Nanopore-based sequencing with varying voltage stimulus |
US9863904B2 (en) | 2014-12-19 | 2018-01-09 | Genia Technologies, Inc. | Nanopore-based sequencing with varying voltage stimulus |
CN107209814B (zh) * | 2015-01-13 | 2021-10-15 | 10X基因组学有限公司 | 用于使结构变异和相位信息可视化的系统和方法 |
WO2016164363A1 (en) | 2015-04-06 | 2016-10-13 | The Regents Of The University Of California | Methods for determing base locations in a polynucleotide |
WO2016179437A1 (en) | 2015-05-07 | 2016-11-10 | Pacific Biosciences Of California, Inc. | Multiprocessor pipeline architecture |
US10185803B2 (en) | 2015-06-15 | 2019-01-22 | Deep Genomics Incorporated | Systems and methods for classifying, prioritizing and interpreting genetic variants and therapies using a deep neural network |
US20170270245A1 (en) | 2016-01-11 | 2017-09-21 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods for performing secondary and/or tertiary processing |
CN108885648A (zh) | 2016-02-09 | 2018-11-23 | 托马生物科学公司 | 用于分析核酸的系统和方法 |
US11124827B2 (en) | 2016-06-23 | 2021-09-21 | Roche Sequencing Solutions, Inc. | Period-to-period analysis of AC signals from nanopore sequencing |
WO2017223515A1 (en) | 2016-06-23 | 2017-12-28 | F. Hoffman-La Roche Ag | Formation and calibration of nanopore sequencing cells |
EP3497233B1 (en) * | 2016-08-08 | 2021-11-10 | F. Hoffmann-La Roche AG | Basecalling for stochastic sequencing processes |
WO2018109102A1 (en) * | 2016-12-15 | 2018-06-21 | F. Hoffmann-La Roche Ag | Adaptive nanopore signal compression |
-
2017
- 2017-08-04 EP EP17754653.8A patent/EP3497233B1/en active Active
- 2017-08-04 WO PCT/EP2017/069820 patent/WO2018029108A1/en unknown
- 2017-08-04 US US15/669,207 patent/US10648027B2/en active Active
- 2017-08-04 CN CN201780062141.8A patent/CN109952382B/zh active Active
- 2017-08-04 JP JP2019506441A patent/JP6814875B2/ja active Active
-
2020
- 2020-04-08 US US16/843,528 patent/US11293062B2/en active Active
-
2022
- 2022-03-01 US US17/683,890 patent/US11788132B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2018029108A1 (en) | 2018-02-15 |
JP2019531536A (ja) | 2019-10-31 |
US10648027B2 (en) | 2020-05-12 |
US11788132B2 (en) | 2023-10-17 |
CN109952382B (zh) | 2023-11-14 |
EP3497233B1 (en) | 2021-11-10 |
US11293062B2 (en) | 2022-04-05 |
US20200232026A1 (en) | 2020-07-23 |
US20180037948A1 (en) | 2018-02-08 |
US20220267840A1 (en) | 2022-08-25 |
CN109952382A (zh) | 2019-06-28 |
EP3497233A1 (en) | 2019-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6814875B2 (ja) | 確率的配列決定プロセスのための塩基呼出 | |
US11892444B2 (en) | Formation and calibration of nanopore sequencing cells | |
US20210395815A1 (en) | Period-to-period analysis of ac signals from nanopore sequencing | |
CN111512155B (zh) | 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声 | |
CN109791138B (zh) | 纳米孔电压方法 | |
JP7012841B2 (ja) | 浸透性の不均衡を利用した膜内のタンパク質ナノポアの除去および再挿入 | |
CN112292462B (zh) | 生化传感器阵列中的多路复用模拟部件 | |
CN115485553A (zh) | 用于使用捕获的电荷形成双层以及以纳米孔阵列插入孔的系统和方法 | |
JP7503571B2 (ja) | 浸透圧不均衡を用いて膜にナノ細孔を挿入するためのシステムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6814875 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |