WO2019132713A1 - Способ безметочного одномолекулярного секвенирования днк и устройство для его реализации - Google Patents
Способ безметочного одномолекулярного секвенирования днк и устройство для его реализации Download PDFInfo
- Publication number
- WO2019132713A1 WO2019132713A1 PCT/RU2018/000202 RU2018000202W WO2019132713A1 WO 2019132713 A1 WO2019132713 A1 WO 2019132713A1 RU 2018000202 W RU2018000202 W RU 2018000202W WO 2019132713 A1 WO2019132713 A1 WO 2019132713A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- polymerase
- dna
- nucleic acid
- sensor
- matrix
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 149
- 238000001712 DNA sequencing Methods 0.000 title description 5
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 294
- 239000002773 nucleotide Substances 0.000 claims abstract description 293
- 239000011159 matrix material Substances 0.000 claims abstract description 186
- 239000012634 fragment Substances 0.000 claims abstract description 159
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 157
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 102
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 102
- 238000000926 separation method Methods 0.000 claims abstract description 62
- 239000000203 mixture Substances 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 40
- 239000012224 working solution Substances 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 238000003780 insertion Methods 0.000 claims abstract description 6
- 230000037431 insertion Effects 0.000 claims abstract description 6
- 238000012163 sequencing technique Methods 0.000 claims description 156
- 239000011541 reaction mixture Substances 0.000 claims description 109
- 230000015572 biosynthetic process Effects 0.000 claims description 57
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 56
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 55
- 239000002070 nanowire Substances 0.000 claims description 52
- 238000006243 chemical reaction Methods 0.000 claims description 49
- 241000894007 species Species 0.000 claims description 46
- 108020004414 DNA Proteins 0.000 claims description 41
- 239000007864 aqueous solution Substances 0.000 claims description 34
- 230000005669 field effect Effects 0.000 claims description 28
- 230000002829 reductive effect Effects 0.000 claims description 28
- 238000012546 transfer Methods 0.000 claims description 28
- 238000010348 incorporation Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 24
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 23
- 102000004190 Enzymes Human genes 0.000 claims description 19
- 108090000790 Enzymes Proteins 0.000 claims description 19
- 239000004065 semiconductor Substances 0.000 claims description 18
- 238000013467 fragmentation Methods 0.000 claims description 14
- 238000006062 fragmentation reaction Methods 0.000 claims description 14
- 235000011178 triphosphate Nutrition 0.000 claims description 14
- 239000001226 triphosphate Substances 0.000 claims description 14
- 230000005714 functional activity Effects 0.000 claims description 13
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 9
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 9
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 8
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 claims description 7
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 7
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 claims description 7
- 239000007787 solid Substances 0.000 claims description 7
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 6
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 6
- PGAVKCOVUIYSFO-XVFCMESISA-N UTP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-XVFCMESISA-N 0.000 claims description 6
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 6
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 6
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 claims description 6
- 229950010342 uridine triphosphate Drugs 0.000 claims description 6
- PGAVKCOVUIYSFO-UHFFFAOYSA-N uridine-triphosphate Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 claims description 6
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 claims description 5
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 claims description 5
- 230000003100 immobilizing effect Effects 0.000 claims description 5
- 108091028664 Ribonucleotide Proteins 0.000 claims description 3
- 239000005547 deoxyribonucleotide Substances 0.000 claims description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 claims description 3
- 239000002336 ribonucleotide Substances 0.000 claims description 3
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 3
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 3
- 240000006240 Linum usitatissimum Species 0.000 claims description 2
- 235000004431 Linum usitatissimum Nutrition 0.000 claims description 2
- 239000003990 capacitor Substances 0.000 claims description 2
- 235000014676 Phragmites communis Nutrition 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 216
- 238000005516 engineering process Methods 0.000 description 42
- 239000010410 layer Substances 0.000 description 40
- 102000053602 DNA Human genes 0.000 description 37
- 239000000243 solution Substances 0.000 description 34
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 32
- 238000006116 polymerization reaction Methods 0.000 description 32
- 108090000623 proteins and genes Proteins 0.000 description 28
- 230000000694 effects Effects 0.000 description 26
- 238000003786 synthesis reaction Methods 0.000 description 26
- 102000004169 proteins and genes Human genes 0.000 description 24
- 150000002500 ions Chemical class 0.000 description 23
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 23
- 230000000875 corresponding effect Effects 0.000 description 22
- 235000018102 proteins Nutrition 0.000 description 22
- 239000013615 primer Substances 0.000 description 21
- 238000009739 binding Methods 0.000 description 20
- 229960002685 biotin Drugs 0.000 description 20
- 239000011616 biotin Substances 0.000 description 20
- 238000002474 experimental method Methods 0.000 description 20
- 230000006820 DNA synthesis Effects 0.000 description 19
- 230000027455 binding Effects 0.000 description 19
- 235000020958 biotin Nutrition 0.000 description 19
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 239000000523 sample Substances 0.000 description 18
- 108091034117 Oligonucleotide Proteins 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 17
- 238000009826 distribution Methods 0.000 description 17
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 16
- 238000010586 diagram Methods 0.000 description 16
- -1 nucleoside triphosphates Chemical class 0.000 description 16
- 239000010703 silicon Substances 0.000 description 16
- 229910052710 silicon Inorganic materials 0.000 description 16
- 239000000758 substrate Substances 0.000 description 16
- 108020004682 Single-Stranded DNA Proteins 0.000 description 14
- 230000001934 delay Effects 0.000 description 14
- 238000003752 polymerase chain reaction Methods 0.000 description 14
- 102000012410 DNA Ligases Human genes 0.000 description 13
- 108010061982 DNA Ligases Proteins 0.000 description 13
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 230000035945 sensitivity Effects 0.000 description 13
- 125000003396 thiol group Chemical group [H]S* 0.000 description 13
- 230000003321 amplification Effects 0.000 description 12
- 238000006073 displacement reaction Methods 0.000 description 12
- 239000010931 gold Substances 0.000 description 12
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 12
- 239000002086 nanomaterial Substances 0.000 description 12
- 238000003199 nucleic acid amplification method Methods 0.000 description 12
- 239000002245 particle Substances 0.000 description 12
- 108010090804 Streptavidin Proteins 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 11
- 230000005684 electric field Effects 0.000 description 11
- 238000005259 measurement Methods 0.000 description 11
- 229910052751 metal Inorganic materials 0.000 description 11
- 239000002184 metal Substances 0.000 description 11
- 229910000077 silane Inorganic materials 0.000 description 10
- 235000012239 silicon dioxide Nutrition 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 230000001276 controlling effect Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 238000009792 diffusion process Methods 0.000 description 9
- 229920001223 polyethylene glycol Polymers 0.000 description 9
- 238000005096 rolling process Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 8
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 8
- 229910052737 gold Inorganic materials 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- MGFYIUFZLHCRTH-UHFFFAOYSA-N nitrilotriacetic acid Chemical compound OC(=O)CN(CC(O)=O)CC(O)=O MGFYIUFZLHCRTH-UHFFFAOYSA-N 0.000 description 8
- 239000000377 silicon dioxide Substances 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 239000007853 buffer solution Substances 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 238000001125 extrusion Methods 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 108020004638 Circular DNA Proteins 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 239000002094 self assembled monolayer Substances 0.000 description 6
- 230000005641 tunneling Effects 0.000 description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 241000701533 Escherichia virus T4 Species 0.000 description 5
- 108060002716 Exonuclease Proteins 0.000 description 5
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 238000005530 etching Methods 0.000 description 5
- 102000013165 exonuclease Human genes 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000012160 loading buffer Substances 0.000 description 5
- 239000002777 nucleoside Substances 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 108091028732 Concatemer Proteins 0.000 description 4
- 102220550419 Dihydropyrimidinase-related protein 2_D66A_mutation Human genes 0.000 description 4
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 4
- 239000007795 chemical reaction product Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 239000004020 conductor Substances 0.000 description 4
- GPRLSGONYQIRFK-UHFFFAOYSA-N hydron Chemical compound [H+] GPRLSGONYQIRFK-UHFFFAOYSA-N 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000011068 loading method Methods 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 229910001425 magnesium ion Inorganic materials 0.000 description 4
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000010409 thin film Substances 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 239000003155 DNA primer Substances 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 150000001412 amines Chemical class 0.000 description 3
- 150000001615 biotins Chemical class 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 239000006059 cover glass Substances 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 239000003792 electrolyte Substances 0.000 description 3
- 238000000609 electron-beam lithography Methods 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000002164 ion-beam lithography Methods 0.000 description 3
- 238000001459 lithography Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000037230 mobility Effects 0.000 description 3
- 230000009871 nonspecific binding Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000004544 sputter deposition Methods 0.000 description 3
- 238000002604 ultrasonography Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 241001143500 Aceraceae Species 0.000 description 2
- 241000701844 Bacillus virus phi29 Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102100033743 Biotin-[acetyl-CoA-carboxylase] ligase Human genes 0.000 description 2
- 108020001019 DNA Primers Proteins 0.000 description 2
- 102220567511 Dihydropyrimidinase-related protein 2_D12A_mutation Human genes 0.000 description 2
- 241000701867 Enterobacteria phage T7 Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 2
- 102100029075 Exonuclease 1 Human genes 0.000 description 2
- KRHYYFGTRYWZRS-UHFFFAOYSA-N Fluorane Chemical compound F KRHYYFGTRYWZRS-UHFFFAOYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 108010010677 Phosphodiesterase I Proteins 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- 229910004298 SiO 2 Inorganic materials 0.000 description 2
- BLRPTPMANUNPDV-UHFFFAOYSA-N Silane Chemical compound [SiH4] BLRPTPMANUNPDV-UHFFFAOYSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 125000003295 alanine group Chemical class N[C@@H](C)C(=O)* 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 125000002619 bicyclic group Chemical group 0.000 description 2
- 230000006287 biotinylation Effects 0.000 description 2
- 238000007413 biotinylation Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 150000001945 cysteines Chemical class 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 238000000151 deposition Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000012212 insulator Substances 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- WQZPXLIPGULRSR-UHFFFAOYSA-N n-methylsulfanylpropan-1-amine Chemical compound CCCNSC WQZPXLIPGULRSR-UHFFFAOYSA-N 0.000 description 2
- 238000003203 nucleic acid sequencing method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 2
- 239000010453 quartz Substances 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- 230000003007 single stranded DNA break Effects 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000001179 sorption measurement Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- YUYCVXFAYWRXLS-UHFFFAOYSA-N trimethoxysilane Chemical compound CO[SiH](OC)OC YUYCVXFAYWRXLS-UHFFFAOYSA-N 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical compound CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- ZRTJVRDXVSDKPX-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 3-acetylsulfanylpropanoate Chemical compound CC(=O)SCCC(=O)ON1C(=O)CCC1=O ZRTJVRDXVSDKPX-UHFFFAOYSA-N 0.000 description 1
- DIXRLQJYISYSEL-UHFFFAOYSA-N 11-aminoundecane-1-thiol Chemical compound NCCCCCCCCCCCS DIXRLQJYISYSEL-UHFFFAOYSA-N 0.000 description 1
- TZVOTYCXLFYAPY-UHFFFAOYSA-N 2-sulfanylhexadecanoic acid Chemical compound CCCCCCCCCCCCCCC(S)C(O)=O TZVOTYCXLFYAPY-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- 108020004634 Archaeal DNA Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000193399 Bacillus smithii Species 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 108050003866 Bifunctional ligase/repressor BirA Proteins 0.000 description 1
- PCDQPRRSZKQHHS-XVFCMESISA-N CTP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-XVFCMESISA-N 0.000 description 1
- 108020005031 Concatenated DNA Proteins 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000008301 DNA looping mechanism Effects 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102220550448 Dihydropyrimidinase-related protein 2_E14A_mutation Human genes 0.000 description 1
- 102220550417 Dihydropyrimidinase-related protein 2_N62H_mutation Human genes 0.000 description 1
- 102220550431 Dihydropyrimidinase-related protein 2_T15I_mutation Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 244000148064 Enicostema verticillatum Species 0.000 description 1
- 101000686777 Escherichia phage T7 T7 RNA polymerase Proteins 0.000 description 1
- 102000004150 Flap endonucleases Human genes 0.000 description 1
- 108090000652 Flap endonucleases Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 238000007397 LAMP assay Methods 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 241000549556 Nanos Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- 239000004820 Pressure-sensitive adhesive Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 108010065868 RNA polymerase SP6 Proteins 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 108091029474 Y RNA Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000003570 air Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 210000003756 cervix mucus Anatomy 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- NZNMSOFKMUBTKW-UHFFFAOYSA-N cyclohexanecarboxylic acid Chemical compound OC(=O)C1CCCCC1 NZNMSOFKMUBTKW-UHFFFAOYSA-N 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 238000002848 electrochemical method Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000013412 genome amplification Methods 0.000 description 1
- 229920001903 high density polyethylene Polymers 0.000 description 1
- 239000004700 high-density polyethylene Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000005660 hydrophilic surface Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000138 intercalating agent Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000009916 joint effect Effects 0.000 description 1
- 238000002898 library design Methods 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- UEGPKNKPLBYCNK-UHFFFAOYSA-L magnesium acetate Chemical compound [Mg+2].CC([O-])=O.CC([O-])=O UEGPKNKPLBYCNK-UHFFFAOYSA-L 0.000 description 1
- 229940069446 magnesium acetate Drugs 0.000 description 1
- 235000011285 magnesium acetate Nutrition 0.000 description 1
- 239000011654 magnesium acetate Substances 0.000 description 1
- 239000002122 magnetic nanoparticle Substances 0.000 description 1
- 238000001755 magnetron sputter deposition Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 229940050561 matrix product Drugs 0.000 description 1
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000001451 molecular beam epitaxy Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910021421 monocrystalline silicon Inorganic materials 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000002663 nebulization Methods 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 239000012811 non-conductive material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- XKMLYUALXHKNFT-UHFFFAOYSA-N rGTP Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O XKMLYUALXHKNFT-UHFFFAOYSA-N 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000001846 repelling effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000027756 respiratory electron transport chain Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 235000004400 serine Nutrition 0.000 description 1
- 150000003355 serines Chemical class 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 229910052814 silicon oxide Inorganic materials 0.000 description 1
- 238000010583 slow cooling Methods 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000009210 therapy by ultrasound Methods 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 229940005605 valeric acid Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L3/00—Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
- B01L3/50—Containers for the purpose of retaining a material to be analysed, e.g. test tubes
- B01L3/502—Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures
- B01L3/5027—Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures by integrated microfluidic structures, i.e. dimensions of channels and chambers are such that surface tension forces are important, e.g. lab-on-a-chip
- B01L3/502715—Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures by integrated microfluidic structures, i.e. dimensions of channels and chambers are such that surface tension forces are important, e.g. lab-on-a-chip characterised by interfacing components, e.g. fluidic, electrical, optical or mechanical interfaces
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L3/00—Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
- B01L3/50—Containers for the purpose of retaining a material to be analysed, e.g. test tubes
- B01L3/502—Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures
- B01L3/5027—Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures by integrated microfluidic structures, i.e. dimensions of channels and chambers are such that surface tension forces are important, e.g. lab-on-a-chip
- B01L3/502761—Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures by integrated microfluidic structures, i.e. dimensions of channels and chambers are such that surface tension forces are important, e.g. lab-on-a-chip specially adapted for handling suspended solids or molecules independently from the bulk fluid flow, e.g. for trapping or sorting beads, for physically stretching molecules
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L7/00—Heating or cooling apparatus; Heat insulating devices
- B01L7/52—Heating or cooling apparatus; Heat insulating devices with provision for submitting samples to a predetermined sequence of different temperatures, e.g. for treating nucleic acid samples
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2200/00—Solutions for specific problems relating to chemical or physical laboratory apparatus
- B01L2200/02—Adapting objects or devices to another
- B01L2200/026—Fluid interfacing between devices or objects, e.g. connectors, inlet details
- B01L2200/027—Fluid interfacing between devices or objects, e.g. connectors, inlet details for microfluidic devices
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2200/00—Solutions for specific problems relating to chemical or physical laboratory apparatus
- B01L2200/06—Fluid handling related problems
- B01L2200/0647—Handling flowable solids, e.g. microscopic beads, cells, particles
- B01L2200/0663—Stretching or orienting elongated molecules or particles
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2200/00—Solutions for specific problems relating to chemical or physical laboratory apparatus
- B01L2200/14—Process control and prevention of errors
- B01L2200/143—Quality control, feedback systems
- B01L2200/147—Employing temperature sensors
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/02—Identification, exchange or storage of information
- B01L2300/023—Sending and receiving of information, e.g. using bluetooth
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/02—Identification, exchange or storage of information
- B01L2300/025—Displaying results or values with integrated means
- B01L2300/027—Digital display, e.g. LCD, LED
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/06—Auxiliary integrated devices, integrated components
- B01L2300/0627—Sensor or part of a sensor is integrated
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/06—Auxiliary integrated devices, integrated components
- B01L2300/0627—Sensor or part of a sensor is integrated
- B01L2300/0636—Integrated biosensor, microarrays
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/06—Auxiliary integrated devices, integrated components
- B01L2300/0627—Sensor or part of a sensor is integrated
- B01L2300/0645—Electrodes
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2300/00—Additional constructional details
- B01L2300/18—Means for temperature control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01L—CHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
- B01L2400/00—Moving or stopping fluids
- B01L2400/04—Moving fluids with specific forces or mechanical means
- B01L2400/0403—Moving fluids with specific forces or mechanical means specific forces
- B01L2400/0415—Moving fluids with specific forces or mechanical means specific forces electrical forces, e.g. electrokinetic
Definitions
- the group of inventions relates to the field of technology for determining the nucleotide sequence, or sequencing, of nucleic acids, namely, DNA or RNA.
- the disclosed invention may find application in the genetic diagnosis of various diseases of humans and animals, as well as in other areas of applied or scientific activities.
- sequencing by ligation techniques for example, the SOLD sequencing method used by Life Technologies / Thermo Fisher; the Combinatorial Probe-Anchor Ligation TM sequencing method (cPAL TM) used by BGI / Complete Genomics
- sequential synthesis sequencing including: (a) cyclic sequencing, used by both lllumina Inc.
- the first (1) and second (2) technology groups mentioned above are collectively called the second generation sequencing technologies (SGS), and the third (3) group are the third generation sequencing technologies (TGS).
- SGS second generation sequencing technologies
- TGS third generation sequencing technologies
- Sequencing using ligation techniques SOUD and cPAL
- SOUD and cPAL uses expensive fluorophore-labeled probes, their sequencing speed, and reading length is limited by the intrinsic properties of the DNA ligase.
- the sequencing methods by synthesis from lllumina and Qiagen are faster and give reading up to 300 base pairs (bp) compared to sequencing by ligation methods, but also depend on expensive fluorescently labeled molecules, terminator nucleotides.
- Ion Torrent / Thermo Fisher semiconductor sequencing is currently the only commercially available tagless sequencing method, but it still relies on single nucleotide addition cycles, unlike real-time single-molecule sequencing (SMRT), driven by high-performance DNA polymerase .
- SMRT real-time single-molecule sequencing
- the latter method is the only fast commercial real-time sequencing method with long reads.
- the disadvantages of the SMRT method are the use of labeled nucleotides and cumbersome expensive optics, high error rate, high sensitivity to portable impurities introduced during library construction, and significantly lower throughput compared to, for example, lllumina, SOUD, Ion Torrent / Thermo Fisher and BGI methods / Complete Genomics.
- SGS sequencing platforms perform cluster sequencing (cloned ensembles of DNA molecules amplified using DNA polymerase), while TGS technologies directly determine the nucleotide sequence of individual molecules.
- SGS uses “flush and scan” technologies (for example, lllumina) or “flush and measure” electrical signals (Ion Torrent), and TGS platforms use continuous sequential control technologies without having to stop between reading steps. Sequencing of TGS occurs very quickly, and the rate is determined by the rate of polymerase synthesis or the rate at which DNA moves through the nanopore.
- TGS technologies do not require pre-amplification of DNA (during library preparation or cluster generation), thereby simplifying the difficulties associated with amplification (such as the occurrence of errors and discrimination of library DNA fragments with high GC and / or AT contents).
- Long continuous nucleic acid sequences obtained by TGS significantly help in phasing the genomes and, thus, reduce the need for additional methods for assembling the genome.
- TGS technologies provide a short processing cycle time, their main disadvantage in competition compared to SGS technologies is a high error rate, lower data output for one sequencing cell, and high cost for each sequenced sequence. To expand the biomedical applications of TGS, it is necessary to minimize the number of errors, increase sequencing performance, reduce costs.
- the present disclosure provides methods, devices, and compositions thereof for low-cost, high-performance, tagless, single-molecule, real-time sequencing with electronic readout. These methods are a new technology for sequencing nucleic acids and can be used for various biomedical, agricultural and biological purposes.
- nucleotide in the description of the invention is to be understood, depending on the embodiment as ribonucleotides, e.g., adenosine triphosphate, guanosine triphosphate, cytidine triphosphate, and uridine triphosphate, denoted ATP, GTP, CTP, UTP), and deoxyribonucleotides, such as dezoksiadenozintrifosfat, dezoksiguanozintrifosfat, dezoksitsitidintrifosfat and deoxythymidine triphosphate (dATP, dGTP, dCTP, dTTP).
- dATP dezoksiadenozintrifosfat
- dezoksiguanozintrifosfat dezoksitsitidintrifosfat and deoxythymidine triphosphate
- dATP dezoksiadenozintrifosfat
- the reaction mixture is an aqueous solution containing all the necessary substances to ensure the polymerization reaction of single-stranded DNA fragments that are part of a polymerase-DNA fragment complex immobilized on the sensor surface of a chip array cell.
- the charge separation resulting from the incorporation of a nucleotide into a growing nucleic acid chain by polymerase means the separation of one pair of charges (the attachment of an electron to the growing nucleic acid chain and the release of a hydrogen ion into the solution), which objectively occurs whenever a nucleotide is incorporated into DNA fragment or RNA.
- a sensor is an electronic device, one or several electrical characteristics of which are modulated as a result of the formation of one pair of unbound charges occurring in close proximity to the sensor surface, as a result of the nucleotide being inserted into the polymerizable DNA fragment by polymerase.
- a cell is an electronic device that includes a sensor and an analog-to-digital circuit, which at each discrete time interval converts the value of the modulated sensor characteristic into a logical "0" or "1", depending on its size.
- a matrix of sensor cells is an ordered array of cells, organized in the form of rows and columns, usually in the form of a square or rectangle containing vertical and horizontal shift registers that provide output of digital data from each cell of the matrix beyond its borders for a subsequent, for example, computer processing.
- the microcircuit of the matrix of sensor cells is a set of matrix of sensor cells and an analog-digital circuit that includes a clock pulse generator, a reference voltage source, a controller for controlling the cell operation modes, which ensure the functioning of cells and matrix registers and manufactured in one technological cycle.
- An offset electrode is called a metallic conductor of one form or another, for example, in the form of a grid, which is somehow attached to the chip cover (made of non-conductive material), in working condition in working solution, galvanically connected to the reference voltage source of the microcircuit, providing potential with the electrode of each cell of the matrix, the presence of an electric field in the solution, which promotes the fastest removal of a hydrogen ion from the place of separation of a pair of charges when inserted AANII polymerase nucleotide polymerizable DNA fragment.
- a sequence diagram in the present invention refers to a sequence of discrete time intervals, in which the logical unit "indicates those discrete time intervals during which the charge separation results of nucleotide incorporation by polymerase were recorded by the analog-digital cell circuit, and the time intervals are indicated by logical zeroes" when such facts were not registered.
- the discrete time interval is called the period of clock pulses, ensuring the operation of the analog-digital circuit of the cell.
- Processivity is the ability of an enzyme to carry out a sequence of chemical reactions without releasing the substrate.
- Polymerase processivity is the average number of nucleotides added by the enzyme to the growing chain in one binding with the surface of the matrix of the microcircuit.
- the present invention is the creation of a fast, highly accurate and inexpensive method for determining the nucleotide sequence, or sequencing, of nucleic acids.
- this problem is solved by implementing several technical solutions.
- Three main provisions are implemented jointly to ensure the technical result: (1) minimum manipulation of reagents and DNA that are involved in the biochemical reaction; (2) registration by the electronic sensor of a useful signal of the facts of the separation of one pair of charges that occur as a result of the incorporation of each nucleotide into the growing DNA strand by the DNA polymerase; (3) the original sequencing algorithm, which makes it possible to separate in time the procedure for generating useful signals and the procedure for generating target information, as a result of processing useful signals, - which makes it possible to discard the labels for nucleotides.
- Some embodiments of the invention include the method described above, in which the circumscribed nucleic acid fragments indicated in (a) have at least one single-stranded region (see Fig. 1A and 1B); the complexes indicated in (b and c) additionally include a sequencing primer having a nucleotide sequence complementary to the indicated single-stranded region; and the conditions for the functional activity of the polymerase additionally include conditions for the formation of a duplex of the sequencing primer with a complementary portion of the specified looped single-stranded deoxyribonucleic acid fragment (see Fig. 1A and 1B).
- the looped-off fragments indicated in (a) do not have single-stranded portions capable of forming a duplex with a sequencing primer (see Fig. 1B), therefore the complexes (b and c) do not include the sequencing primer (see Fig. 1B); and DNA synthesis is initiated by polymerase from an artificially created free 3 ’end in one of the chains of a double-stranded looped fragment.
- nucleic acid is DNA
- polymerase having affinity for nucleic acid is a DNA polymerase
- nucleotides added in steps (c) and (e) are deoxyadenosine triphosphate, deoxyguano phosphate, deoxycytidine triphosphate or deoxythymidine triphosphate.
- a DNA polymerase suitable for carrying out the method includes at least the following enzymes: Phi29 polymerase, large Bst fragment of DNA polymerase, VentR TM polymerase, large Bsm fragment of DNA polymerase, Klenow fragment of DNA polymerase I.
- RNA polymerase RNA polymerase
- nucleotides added in steps (c) and (e) are adenosine triphosphate, guanosine triphosphate, cytidine triphosphate and / or uridine triphosphate.
- stages (c) and (e) in the method described above, in stages (c) and (e) four different conditions are provided for the functional activity of the polymerase, namely, the addition of four different mixtures of deoxynucleoside triphosphates to the sensor surface; each of the four different conditions for the functional activity of the polymerase is present continuously for a period of time sufficient to synthesize at least one copy of the looped DNA fragment, or at least five copies of the looped DNA fragment.
- the analysis of the sequence of time intervals used to determine the nucleotide sequence of the specified nucleic acid molecule includes at least three steps:
- nucleic acid fragments from four sequences of logical zeros and units obtained after the first stage of data conversion for each nucleic acid fragment;
- nucleotide sequences of nucleic acid fragments are converted into a detectable nucleotide sequence of the indicated nucleic acid molecule.
- steps (c) and (e) in the method described above, in steps (c) and (e), four different conditions are simultaneously used for the functional activity of the polymerase, including: (i) the presence of four spatially separated matrixes of cells containing the said sensors; and (ii) parallel addition of four different mixtures of deoxynucleoside triphosphates to the surface of sensors located in four spatially separated matrixes of sensor cells.
- the analysis of the sequence of time intervals used to determine the nucleotide sequence of the specified nucleic acid molecule includes at least four steps: 1) the sequences of time intervals between each recorded charge separation facts resulting from the incorporation of unlabeled nucleotides into a growing nucleic acid chain by the polymerase are obtained from sensors of cells of four matrices; the nucleotides of the type whose concentration is was known and reduced in the reaction mixture, and the zeros indicated the nucleotides of the species whose concentration was normal Flax in the same reaction mixture over the surface of the matrix on which cells transformed output sequence;
- nucleotide sequences of nucleic acid fragments are converted into a detectable nucleotide sequence of the indicated nucleic acid molecule.
- a device for determining the nucleotide sequence of a nucleic acid molecule contains: 1) at least one chip of the matrix of sensor cells, including a matrix with a multitude of sensor cells and an analog-digital circuit; 2) microfluidic device to ensure the supply of working solutions to the sensors of the cells of the chip matrix; 3) a device for processing and displaying data for controlling the operating modes of the microfluidic device and the chip array of sensor cells for converting the data of the output sequences of the cells of the matrix into the nucleotide sequence of the specified nucleic acid molecule.
- each cell of the matrix includes: a sensor, the surface of which is suitable for immobilizing the polymerase complex, recording the facts of the separation of one pair of charges in an aqueous solution, resulting from the incorporation of each nucleotide into a polymerizable DNA fragment by polymerase, and forming signals corresponding to registered facts of charge pair separation; analog-to-digital cell circuit for the formation of output sequences of discrete time intervals corresponding to the sensor signals; and 2) the analog-digital circuit of the chip array of sensor cells includes: a circuit for generating currents, voltages and clock frequencies necessary for the operation of analog-digital circuits of the matrix cells; a scheme for transmitting the output sequences of the cells of the matrix to the device for processing and displaying data; a scheme for decrypting data received from a device for processing and displaying data.
- a solid surface suitable for immobilizing a polymerase complex is a sensor surface modified to allow immobilization of a polymerase complex. Functional variants of the sensor surface modification will be discussed below.
- the analog-digital circuit of the chip array of sensor cells is made with the possibility of generating currents, voltages and clock frequencies necessary for the operation of analog-digital circuits of the matrix cells, controlling the transfer of the output sequences of the matrix cells to the device for processing and displaying data.
- the device also contains a microfluidic device for supplying working solutions to the sensors of the chip array cells, a control device for the microfluidic device, a chip array of sensor cells, data transfer from the chip to the processing and display device, and a processing and display device for controlling the operating modes of the microfluidic device, chips sensor cell arrays, to convert the data of the output sequences of the matrix cells into the nucleotide sequence of nucleic acid sequences.
- each discrete time interval in the output sequences is denoted by a logical zero or one, and the logical unit is that time interval in which the cell sensor registered the fact that a pair of charges separated as a result of the reaction.
- the device further includes a device for maintaining the temperature of the working solution above the surface of the chip array, controlled by the processing and display device.
- the senor can be made in the form of a nanowire field-effect transistor, a single-electron transistor, a diode, a field-effect transistor, or a semiconductor structure (electronic circuit) with an S-shaped or N-shaped volt-ampere or transfer characteristic.
- Some embodiments of the invention include a sequential sequencing method, in which the sequencing device contains only one chip array of sensor cells, and the reaction mixtures are fed alternately to the surface of the matrix chip. In this case, the device for processing and displaying data converts the data of the output sequences from the cells of the chip matrix into the nucleotide sequence of the nucleic acid molecule in three successive stages.
- the output sequence data obtained from the matrix cells of the microcircuit is successively converted into the sequence form of logical zeroes and ones, and the logical unit indicates the embedding of the nucleotides of the species, the concentration of which was known and reduced in the corresponding reaction mixture, and the logical zeroes marked the nucleotides of the species concentration which was normal in the same reaction mixture;
- nucleotide sequences of nucleic acid fragments of four sequences of logical zeros and units, obtained after the first stage of data conversion from the same cell of the chip matrix, are formed;
- nucleotide sequences of nucleic acid fragments can be converted into nucleic acid nucleic acid sequences.
- Some embodiments of the invention include a parallel sequencing method in which the sequencing device contains four chips of the sensor cell array, and the reaction mixtures are fed simultaneously, asynchronously to the matrix surface of each chip.
- the device for processing and displaying converts the data of the output sequences, obtained from all the cells of all the matrices of the microcircuits, into the nucleotide sequence of the nucleic acid molecule in four successive stages.
- the data of the output sequences obtained from the cells of the matrices of four microcircuits are converted into the form of sequences of logical zeros and ones, the nucleotides of the species whose concentration was known and reduced in the reaction mixture are designated by a logical unit, was normal in the same reaction mixture over the surface of the matrix of the chip from whose cells the output sequences are converted;
- the number of sequences of logical zeros and ones is reduced to the number of fragments obtained after fragmentation of the initial nucleic acid, by sorting, comparing, selecting and averaging sequences of logical zeros and units obtained from clones of one fragment immobilized as part of complexes on the surface of the sensors of the cells of the matrix of one chip are in one sequence of logical zeros and ones;
- nucleotide sequences of nucleic acid fragments are formed from four sequences of logical zeros and ones, taken one from each of the four microchips; in the fourth stage, the nucleo
- Some embodiments of the invention include a combined sequencing method in which the sequencing device contains two or three chips of the sensor cell array, and a portion of the reaction mixtures are fed simultaneously, asynchronously to the matrix surface of each chip, and the rest of the reaction mixtures are fed in series with the portion of the reaction mixtures .
- a reduced concentration of nucleotides of the same type is used in the reaction mixtures, against the normal concentration of the nucleotides of three other species in the reaction mixture (the essence of the sequencing method does not change if the reaction mixture contains nucleotides of the same type, the concentration of which is normal and the nucleotides of the other three types reduced; or, if the reaction mixture contains one type of nucleotides, the concentration of which is increased and the other three types of nucleotides, normals, etc.).
- a sequential sequencing method is used as it does not require the mandatory amplification of the nucleic acid taken for sequencing.
- the proposed device for single-molecular tagless sequencing provides improved accuracy of nucleic acid sequencing compared to existing sequencing devices due to repeated polymerization of the gummed DNA fragment of the complex in the same reaction mixture, which makes it possible to average the duration of time intervals before embedding each nucleotide in a looped DNA fragment sa and increases the likelihood of correct location on the DNA fragment of the nucleotides of the species, the concentration of which is reduced in this reaction mixture;
- the proposed device for single-molecular tagless sequencing provides enhanced sequencing performance due to the possibility of using the synthesis sequencing method (SBS) with the maximum possible rate polymerization of the DNA fragment (obtaining the resected human genome in less than 12 hours);
- SBS synthesis sequencing method
- the proposed single-molecular tagless sequencing device provides a lower device cost and sequencing result compared to other sequencing devices (less than $ 1000 for resequenced human genome), due to the absence of expensive labels for nucleotides, low reagent consumption, low cost of sensor array of sensor cells made on the basis of industrial semiconductor technology.
- Figure 1 presents a schematic representation of variants of looped DNA fragments and the corresponding formed complexes of these fragments with polymerase.
- A single stranded DNA ring;
- B dumbbell-shaped circular DNA;
- B A double-stranded DNA ring in which one chain is covalently closed and the second is not.
- FIG. 2 shows a diagram of a possible variant of the sample preparation method.
- FIG. 3 is a schematic representation of the sequence of steps of the sequencing procedure in preferred embodiments of the invention.
- A Sequential sequencing procedure: sequential addition of four reaction mixtures of nucleoside triphosphates, each of the mixtures having one type of nucleoside triphosphates, the molecules of which are concentrated to limit the rate of synthesis;
- B Parallel sequencing procedure: including preliminary separation of complexes into four parts, their immobilization on the sensor surface of the cells of the matrix of four microchips, followed by asynchronous addition of one of four different reaction mixtures of nucleoside triphosphates on the surface of the matrix of each of the four microchips
- FIG. 4 schematically shows a variant of the procedure of immobilization on the sensor surface of a single polymerase complex, the start and stop of polymerization of a looped nucleic acid fragment ..
- FIG. 5A for a single-matrix sequential sequencing device, the time sequences of discrete time intervals formed by the chip array cell pattern as a result of polymerization of the same DNA fragment in the complex are shown sequentially in four reaction mixtures, in each of which the nucleotide concentration is reduced only one type, whose name is written in smaller type around the Y axis; the logical unit “1” indicates the time intervals in which the cell sensor recorded the facts of the separation of a pair of charges as a result of the reaction.
- FIG. 5B is a diagram of the formation of the resulting nucleotide sequence of a fragment of 4 sequences, each of which was obtained in the previous data processing step (see Fig. 5A).
- FIG. 6A shows an image obtained on a Zeiss Axiovert fluorescence microscope, DNA synthesis reaction products obtained by the mechanism of Phi29 polymerase “rolling ring replication”, which are immobilized in ternary complexes on the prepared surface of the cover glass; The products of the reaction of DNA synthesis are stained with the intercalatory dye GelStar Stain. The ability of Phi29 DNA polymerase immobilized on a hard surface to synthesize DNA from a circular matrix was demonstrated.
- FIG. 6B shows an image obtained on a Zeiss Axiovert fluorescence microscope, which shows the few products of the DNA synthesis reaction, obtained only from those ternary complexes that nonspecifically immobilized onto the PEG-biotin surface of the cover glass.
- FIG. 7 shows the distribution of time delays for each type of nucleotide.
- the delay value in arbitrary units of time On the Y axis, the number of delays of the durations on the X axis obtained by numerical experiments. A situation is presented when the concentrations of each type of nucleotide in the reaction mixture are the same.
- On Fig shows the distribution of time delays for each type of nucleotides (X axis - the amount of delay in arbitrary units of time, Y axis - the number of delays defined on the X axis duration) provided a decrease in 100 times the concentration of nucleotides of the same type And in the reaction mixture.
- FIG. 9A shows the distribution of the average delay time for the case when the concentrations of each of the types of nucleotides in the solution are the same (X-axis is the delay number, Y-axis is the average delay value, in conventional units of time, calculated for the current delay number).
- FIG. 9B shows the distribution of the average delay time for each type of nucleotide provided that a 10-fold reduction in the concentration of nucleotides of the same type — nucleotides of type A in the reaction mixture (X-axis is the delay number, Y-axis is the average delay value for the current delay number).
- Figure 10 presents the block diagram of the chip matrix cells of the sensors in one of the variants of the invention.
- Roman numbers I, II, III, IV denote sections of the matrix of sensor cells, each, for example, 2000x2000 cells in size;
- the numbers 1, 2, 3, 4 in the circles indicate the outputs of the horizontal shift registers that output digital data from cells located, respectively, in sections I, II, III, IV.
- Numbers in rectangular (square) shapes denote: 1 — sensor cell; 2 - vertical shift register of digital data transfer from sensor cells of the matrix section, arranged in one row; 3 - USB data transfer interface between the computer and the microchip: 4 - horizontal shift register of digital data transfer from the vertical shift registers of one section of the matrix of sensor cells; 5 - displacement electrode, the potential on which is set by the voltage source, which is regulated by the controller; 6 - the connector between the voltage source of the microcircuit and the bias electrode, which is located on the cover of the microcircuit; 7 - the controller for controlling the operation modes of the microcircuit; 8 - adjustable clock generator, to which a quartz resonator is connected to the outside of the microcircuit; 9 - adjustable source of secondary power.
- FIG. Figure 11 shows a block diagram of a four-matrix device that implements one of the variants of a single-molecular, markless method for sequencing nucleic acids.
- the chip array of sensor cells with a microfluidic device lid is the main component of a single-molecular sequencing device 12, the microfluidic device includes four tanks of small volume 10 to accommodate four aqueous solutions with reaction mixtures; three large-volume tanks 11 for placing in them, respectively, a buffer solution, complexes, for example, a “polymerase-fragment of DNA primer”, spent solutions; electrically driven pump 13 for each chip 12 of a sequencing device; shut-off valves 14 with an electric drive, providing the possibility of separate supply of buffer solution, solution with substances for immobilization of complexes, solution with the reaction mixture on the surface of the matrix chip 12; electrodes 15 for measuring the conductivity of the solution at the outlet of each cover of the chip 12; Peltier element 16 (which is part of the device for maintaining the temperature of the working solution) for each chip 12 of
- Fig.12. shows a block diagram of a sensor cell matrix with a triple complex immobilized on its surface.
- Polymerase complex primer fragment of DNA immobilized on the sensor surface, indicated by the number
- the number 21 indicates the layers of an insulating dielectric (for example, silicon dioxide Si02)
- the number 22 indicates the aqueous solution of the reaction mixture, which ensures the polymerization reaction of the DNA fragment
- the number 23 indicates the displacement electrode, the entire cell surface is protected from the solution by a passivating insulating layer 24 sensor
- FIG. Figure 13 shows a block diagram of a sensor cell matrix, manufactured according to standard CMOS technology, with a triple complex immobilized on its surface.
- the polymerase-primer-DNA fragment complex immobilized on the sensor surface is indicated by the number 25, the p-type silicon substrate in which the sensor was manufactured, the analog-digital circuit of the cell, the matrix of cells, the analog-digital circuit of the chip, etc. indicated by the number 26, the number 30 indicates the layers of an insulating dielectric (for example, silicon dioxide Si02), the number 28 indicates an aqueous solution of the reaction mixture, providing the polymerization reaction of the DNA fragment, the number 29 indicates the displacement electrode, passivating the insulating layer 27 The entire cell surface is protected from the solution, with the exception of the sensor surface.
- the number 25 the p-type silicon substrate in which the sensor was manufactured
- the analog-digital circuit of the cell the matrix of cells
- the analog-digital circuit of the chip etc. indicated by the number 26
- the number 30 indicates the layers of an
- FIG. 14 shows a block diagram of two sensors of the matrix cell: with a triple polymerase complex 31 immobilized on the prepared surface of the sensor, and with a surface of the sensor 37 protected from specific binding to the complex, and an analog-digital block diagram of the cell.
- the number 32 denotes a p-type silicon substrate in which a sensor is manufactured, an analog-digital cell circuit, a matrix of cells, an analog-digital circuit of a microcircuit, etc.
- 36 denotes insulating dielectric layers (for example, Si02);
- 34 denotes an aqueous solution of the reaction mixture, providing for the polymerization reaction of the DNA fragment, the number 35 indicates the displacement electrode; passivating insulating layer 33 is protected from the solution of the entire surface of the cell with the exception of the surface of two sensors.
- FIG. 15 depicts the structures of a sensor and an analog-digital circuit of a cell using the phenomenon of stochastic resonance to register a signal generated by a sensor from the result of a pair of charges separating as a result of embedding a nucleotide with polymerase into a polymerized DNA fragment.
- the number 38 shows a polymerase – primer – DNA fragment complex immobilized on the sensor surface, a p-type silicon substrate in which the sensor is manufactured, an analog-digital circuit of a cell, a matrix of cells, an analog-digital circuit of a chip, etc., is denoted by number 39, the number 40 denotes the insulating dielectric layers (for example, silicon dioxide
- the number 41 indicates the aqueous solution of the reaction mixture, which ensures the polymerization reaction of the DNA fragment;
- Example 5 describes the use of the stochastic resonance phenomenon by the specified cell scheme.
- Fig presents a structural diagram of a nanowire transistor with an immobilized triple complex, which consists of a planar thin-film metal nanostructure deposited on a dielectric layer 49 covering the substrate 45;
- the thin-film metal electrode nanostructure 46 contacts to the nanowire together with the metal channel-nanowire 50 is formed on a dielectric substrate by photo- and electron lithography using photo- and electronic resist, etching technology of the exposed area and technology of metal sputtering by magnetron or thermal method.
- the control electrode can also serve as a conductive sublayer (for example, doped silicon) under the dielectric layer 49.
- the supply electrodes To eliminate the contact of the supply electrodes with the aqueous solution in the microfluid cell, they are covered with a thin layer of dielectric 51 applied through the mask. Also the numbers 44, 47, 48 show, respectively, the immobilized polymerase complex, the aqueous solution of the reaction mixture and the displacement electrode.
- FIG. 17 shows the electrical potential distribution for a single particle carrying a unit charge.
- FIG. 18 shows the potential distribution along the axis connecting the center of the nanowire with the center of the charged particle, and normalized to the potential value on the surface of the nanowire from the particle side, the nanowire diameter is 100 nm (X axis is the distance in meters, Y axis - atomic units) .
- FIG. 19 shows how individual nanowire transistors can be placed in an integrated structure, which is a chip with an array of nanowire transistors with an address bus that allows an individual measurement on each nanotransistor.
- FIG. 20 is a photograph of a formed nanowire transistor with a dielectric layer Si0 2 thickened to 600 nm under the supplying metal contacts and a surface insulating layer Si0 2 with a thickness of 200 nm;
- the number 52 indicates the nanowire, 53 the contact pads, 54 the metal conductors, 55 the dielectric layer, which isolates the conductors from the aqueous solution.
- FIG. 21 is a photograph of a kind of finally formed nanowire transistor structures in the central area of the chip; 56 is designated double dielectric layer under conductors to eliminate leakage currents.
- FIG. 22 shows the equivalent electric circuit of a single-electron transistor.
- FIG. 23 shows: a - Volt-ampere characteristic of the transistor (the solid line is the state of the Coulomb blockade; the dotted one is the fully unlocked transistor); b - Modulation characteristic of a single-electron transistor.
- FIG. 24 shows the equivalent circuit of a single-electron transistor - an electrometer with a measured charge source Qx, with its own capacitance Cs and the capacitance of the coupling Sd.
- FIG. 25 is a schematic representation of a single-molecule transistor with suspended electrodes: M is a molecule deposited in a gap and fixed there using SH-rpynn.
- FIG. Figure 26 shows a photograph of a SOI structure with hanging electrodes above the substrate.
- FIG. 27 is a photograph of a nanostructure of a single-electron transistor with a nano-gap obtained by electron-beam lithography.
- FIG. 28 is a photograph of an electro-migration nano-gap (electro-trapping).
- FIG. 29 is a photograph of a nanospark prepared by ion-beam lithography (FIB technology).
- FIG. 30 is a photograph of a nanostructure of 16 cells for transistors with nano-gaps.
- FIG. Figure 31 shows a photograph of one of the 16 cells from the transistor with a nanospark (the bar indicates a distance of 100 nm).
- FIG. 32 shows a photograph of the central electrode island in the structure of a single-electron transistor from a nanowire obtained by using FIB technology to form the required geometry of nanostructures.
- FIG. 33 is a photograph of the formed nanogap to create a molecular single-electron transistor.
- FIG. 34 shows the test voltage-current characteristic of the formed nano-gap; showing the dependence of the leakage current through the nano-gap on the voltage across it (along the X axis - the voltage value, in Volts, along the Y axis - current value, in Amps) the form of this dependence shows that the nanos gap was formed.
- the proposed method of single-molecule electronic sequencing of nucleic acids is based on the following regularities.
- the grounds one DNA strand binds to the bases of another DNA strand due to hydrogen bonds according to strictly defined Chargaff rules (for example, nucleotide A forms a pair with T,
- G forms a pair with C), so it is sufficient to determine the sequence of bases in one strand in order to determine the nucleotide sequence of the DNA being sequenced. Identifying the names of the bases in a sequence of one chain
- DNA during the polymerization reaction is called sequencing by synthesis
- the average (average) time intervals before embedding nucleotides of this type will have a greater (at a reduced concentration) or less increased concentration) duration compared with the average (average) duration of the time intervals before embedding the nucleotides of the other three species, which have optimal concentrations in this working mixture for i polymerization reaction of a DNA molecule or
- RNA Ribonucleic acid
- concentration of one type of nucleotide versus normal concentrations of three other types of nucleotides in the reaction mixture, while the rate of incorporation of nucleotides of that type, which is lowered, on average, becomes lower than the rate of embedding of nucleotides of other species, the concentration of which is normal.
- a significantly lower concentration of one of the nucleotides is achieved when its concentration is less than the concentration of other nucleotides 5-10 times. In some embodiments of the invention, a significantly lower concentration of one of the nucleotides is achieved when its concentration is less than the concentration of other nucleotides by 10-20 times. In some embodiments of the invention, a significantly lower concentration of one of the nucleotides is achieved when its concentration is less than the concentration of other nucleotides 20-40 times. In other embodiments of the invention, a significantly lower concentration of one of the nucleotides is reached when its concentration is 40-100 times lower than the concentration of other nucleotides.
- the error of measurement results is a random variable with multiple measurement results by the same measurement tool, and therefore it can be reduced by averaging the results of multiple measurements; averaging N uncorrelated, statistically independent measurement results (i.e., in the absence of constant, for example, artificial interference (50-60 Hz, etc.)) allows to reduce the random component of the result error VN times until it becomes so small that the total error will be determined by the systematic component of the error. 7 RKK);
- the use of this type of DNA polymerase allows one to increase the sequencing accuracy several times due to averaging information about the length of time intervals before the facts of charge separation (facts of nucleotide embedding).
- one chip of sensor cell array is used, in which a triple complex “primer-polymerase-matrix” is immobilized on the surface of each sensor, after which four types of reaction mixtures are sequentially fed to the surface of the matrix (each reaction mixture is fed once, the order of supply reaction mixtures can be any), characterized in that in each reaction mixture the concentration of only one type of nucleotides is lowered against the normal concentration ation of the other three kinds of nucleotides; the duration of each reaction mixture’s location above the sensors of the matrix cells depends on the rate of nucleotide incorporation by the DNA polymerase (nucleotides per second) and is determined by the time it takes for the DNA / RNA polymerase to “copy” the looped nucleic acid fragment as many times as necessary to achieve given sequencing accuracy.
- the number of sequenced copies is inversely proportional to the length of one looped DNA in the nucleotides. For example, if the length of the copy of the matrix is 1000 nucleotides, the matrix can be read a maximum of 80 times, for a total of all four reaction mixtures; those. Information on the synthesis of 20 copies can be obtained in each reaction mixture. When the length of the copy of the matrix is 5000 nucleotides, the matrix can be read a maximum of 16 times, for a total of all four reaction mixtures, i.e.
- the looped matrix is read as many times in each reaction mixture as is required to obtain the desired accuracy of DNA fragment sequencing, for example, as shown in Example 9 below.
- a parallel sequencing method four spatially isolated matrices of sensor cells are applied, the primer-matrix-polymerase complex is immobilized to the surface of each sensor of each matrix, after which only one of the four reaction mixtures is fed to the surface of each of the four matrices.
- the reaction mixture lowers the concentration of one type of nucleotide versus the normal concentration of the other three types of nucleotides; oh cell of each matrix as many times as required to achieve a given sequencing accuracy; polymerization reactions of DNA fragments in each cell of each matrices occur asynchronously.
- the matrix can be read 16 times in each of the four reaction mixtures, i.e. sequencing accuracy with a parallel sequencing method can be significantly increased against the sequential sequencing method by accurately determining the nucleotide sequence of longer DNA fragments. But such a potential increase in accuracy is achieved by increasing by 4 times the number of chips of sensor cells, an additional amount of reagents, and hence the cost of sequencing.
- the principal advantage of a sequential sequencing method against a parallel method is the absence of the need for preliminary amplification of the sequenced DNA / RNA molecule when constructing a library.
- the parallel method works only if the original DNA was fragmented, and the fragments were amplified konponally in the process of library design (for example, using PCR) to ensure that the clones of each initial fragment of the nucleic acid molecule hit all four matrices in the ternary complexes. Also, with the same accuracy of the sequencing result, the cost of the sequencing result in a sequential way is noticeably lower.
- the sequential sequencing method is inferior to the parallel only in performance. Determining the name of the species of each nucleotide in the analyzed DNA / RNA sequence in a sequential sequencing method occurs in three stages:
- the 20 mixes, but the output sequences of discrete time intervals come from the cells of the matrix to the computer in real time, so the computer will issue a command to change the reaction mixture or to wash the chip matrix with the buffer solution only after each of the output sequences of discrete time intervals of the cell goes to the computer as many times as the user specified before starting the sequencing procedure).
- the possible number of sequencing cycles in each reaction mixture is determined mainly by the length of the DNA / RNA fragments being sequenced and the polymerase processivity.
- short and long time intervals before nucleotide embedding are statistically determined (the number of logical zeroes “0” is compared to each logical unit “1”) for each output sequence of discrete time intervals obtained at the first stage, and for each cell, the data in the form of four sequences of logical units “1” and zeros “0” (one for each reaction mixture) in such a way that each long interval of time is now indicated by the logical unit “1”
- nucleotide sequence of a DNA fragment For each cell, data on the locations of nucleotides of known species on each of the four sequences of logical units "1" and zeros "0" are compared with each other, and by the method of elimination, following the rule that a nucleotide can be located at the same position in the nucleotide sequence of a DNA fragment one species, form the resulting nucleotide sequence of the DNA fragment to be sequenced.
- nucleotide sequences of DNA / RNA fragments make up the nucleotide sequence of the entire original DNA / RNA using a computer program that implements, depending on the problem to be solved, for example, the RACA algorithm (Kim J, et al., Proc Natl Acad Sci USA, 2013 Jan 29; 110 (5): 1785-90) or the Ragout algorithm for the reference assembly (Kolmogorov M, et al., Bioinformatics, 2014 Jun 15; 30 (12): i302-9), or the algorithms for de novo assembly, for example, algorithms based on the graphical method De Bruijn (Compeau P, et al., Nature Biotechnology, 2011, 29 (11): 987-991) or any other suitable algorithms.
- the sensor of each cell of each matrix records the facts of charge separation as a result of embedding each nucleotide into a polymerized DNA / RNA fragment immobilized as part of a complex on its surface.
- the charge separation recorded by the sensor is converted by the analog-digital circuit of the sensor cell into a useful signal in the form of an output sequence of discrete time intervals designated by logical units “1" and zeros “0”, with the logical unit “marked by those time intervals in which the cell was registered facts of charge separation; output sequences are transmitted to a device for processing and displaying data, for example, a computer.
- the short and long time intervals before nucleotide embedding are statistically determined (the number of logical zeros “0” is compared before each logical unit “1”) for each output sequence of discrete time intervals obtained at the first stage, and for each cell of each matrix, the data is overwritten in the form of one sequence of logical units “1” and zeros “0” in such a way that now the logical unit “1” denotes each long time interval corresponding to embedding well leotidov species whose concentration has been lowered in the respective reaction mixture, and is known as a logical zero "0" are indicated by short time intervals corresponding to the incorporation of nucleotides species whose concentration was normal in the same reaction mixture.
- parallel sequencing method involves the amplification of fragments obtained after fragmentation of nucleic acid, then separately for each chip matrix cells of sensors minimize the number of sequences of logical units “1” and zeros “0” by sorting, comparing, selecting, averaging the same with a certain probability sequences of logical units “ 1 ”and zeros“ 0 ”and convert them into one sequence of logical units“ 1 ”and zeros“ 0 ”.
- the fragment nucleotide sequences are formed s nucleic acids.
- the nucleotide sequences of nucleic acid fragments make up the complete nucleotide sequence of the original sample DNA / RNA using a computer program that implements, depending on the problem to be solved, for example, the RACA algorithm (Kim J, et al., Proc Natl Acad Sci USA, 2013 Jan 29; 110 (5): 1785-90) or the Ragout algorithm for the reference assembly (Kolmogorov M, et al., Bioinformatics, 2014 Jun 15; 30 (12): i302-9), or the algorithms for de novo assembly, For example, algorithms based on the graphic method De Bruijn (Compeau P, et al., Nature Biotechnology, 2011, 29 (1 1): 987-991) or any other suitable algoritm.
- the registration of the fact of charge separation when a DNA nuclease is added by a polymerase is carried out by measuring the modulation of the current in the channel of the field effect transistor by induced potential on the sensor surface (gate field-effect transistor).
- the fact of charge separation can be registered by measuring the capacitance or conductivity of the surrounding solution.
- Registration is carried out using an electronic sensor located on the surface of a matrix cell and made on the basis of a nano-sized semiconductor structure, for example, a nanowire field-effect transistor, a single-electron transistor, a field-effect transistor, a diode, or on the basis of an S-shaped or N-shaped current-voltage or transfer characteristic (for example, a special diode) used in the circuit and implementing the effect of stochastic resonance to improve the signal-to-noise ratio.
- a nano-sized semiconductor structure for example, a nanowire field-effect transistor, a single-electron transistor, a field-effect transistor, a diode, or on the basis of an S-shaped or N-shaped current-voltage or transfer characteristic (for example, a special diode) used in the circuit and implementing the effect of stochastic resonance to improve the signal-to-noise ratio.
- the DNA polymerase – matrix complex be immobilized on the sensor surface for a sufficiently long time, longer than the process time of the DNA polymerase.
- a sensor with a modified surface for immobilization of the polymerase complex on the surface.
- the analog-digital electronic circuit of the matrix cell reads the sensor signals, marks the moments of their receipt by the logical unit "1" on the generated output sequence of discrete time intervals, and transmits it to the computer in real time.
- nucleotide species whose concentration is reduced in the reaction mixture above the matrix, is known, then the locations of nucleotides of this species in the sequence of the nucleic acid to be sequenced are determined by the results of the analysis of the length of time intervals before or between useful signals (logical “1”) formed .
- each fact of separating a pair of charges when embedding complementary nucleotides into the polymerized nucleic acid fragment is performed at the minimum, the same (with a certain accuracy) distance from the sensor surface, - thereby ensuring the effective recording of charge separation facts during the polymerization of nucleic acid fragments, including long fragments (thousands of Dov).
- the invention provides a method for sequencing nucleic acids, which belongs to a group of methods for sequencing by the method of synthesis (SBS), and is based on the discovery of the results of the incorporation of nucleotide polymerase into the polymerizable nucleic acid strand.
- SBS method of synthesis
- the method of the present invention uses natural nucleotides and polymerase, which has no amino acid modifications necessary to improve the incorporation of synthetic nucleotides with attached fluorophores or other chemical modifications.
- the basic principle of the method of the present invention is based on the real-time detection of a pair of charge separation events accompanying the incorporation of nucleotides by a single polymerase molecule into a growing strand of single nucleic acid molecules in the DNA polymerase-matrix complex immobilized on the sensor surface. Detection of a series of single charge separation events is carried out by a sensitive electronic sensor. In reactions with four different initial conditions, each of which is determined by one of four types of nucleotides that are in a lower concentration, time series of charge separation events are recorded, showing time delays when the nucleotides of the depleted species are turned on.
- the invention provides a method for sequencing nucleic acids, comprising: providing a plurality of nanosensor elements (cells) located in a matrix, each cell comprising a charge sensitive device (nanosensor), an amplifier and an analog-to-digital signal converter, source, drain and gate (nanoscale transistor); providing a sample containing a plurality of looped molecules of the target nucleic acid; providing oligonucleotide primer and annealing conditions with the formation of a complex of primer-matrix; contacting the primer template with a polymerase enzyme to form a polymerase – primer – DNA template ternary complex; ensuring the conditions of connection of the ternary complex to the surface of the nanosensor, leading to the formation of a multitude of nanosensors with single triple complexes immobilized on their surface; subjecting said ternary complexes to four polymerization reactions, each in the reaction mixture, containing all four deoxynucleoside triphosphates (dATP, sGHTP,
- each reaction mixture has one deoxynucleoside triphosphate (or nucleoside triphosphate) present in a reduced concentration; detection of a pair of charge separation events accompanying the incorporation of a nucleotide into a polymerized fragment of a single-stranded nucleic acid; registration of time series of facts of charge pair separation and identification of long time intervals preceding the inclusion of depleted nucleotides for each of the four reaction mixtures, and thus searching for the positions of each depleted nucleotide along the target nucleic acid molecule comparing sequences of nucleotide positions of the depleted species for all four reaction mixtures and determining the nucleotide sequence of the target nucleic acid molecule.
- the present invention relates to nucleic acid sequencing methods involving sequential or parallel polymerization reactions with four reaction mixtures, each of which has one of four depleted nucleotides, for example, where reaction mixture 1 contains a low concentration of nucleotides A, mixture 2 G, a mixture of 3 - T and a mixture of 4 - C; in which the multiplicity of nucleic acid re-synthesis of the target sequence is calculated for each of the four reaction mixtures in such a way as to allow the polymerase to copy the number of the target nucleic acids so many times to achieve high (required) accuracy of sequencing.
- a parallel sequencing method four matrices of nanosensors are used, and four reaction mixtures, which can be simultaneously added to four matrices.
- the present invention relates to single-molecule electron sequencing, including the production of a plurality of ring target nucleic acid molecules (libraries), conditions for assembling a triple polymerase complex and attaching said complex to the surface of a nanosensor, a composition of reaction mixtures and conditions for replication (or transcription) of the type rolling ring.
- the device contains a microfluidic device that provides the supply of reagents to the sensors of the cells of the chip matrix; directly to the matrix cell chip sensors (at least one); electronic control device: microfluidic device, microcircuit, data exchange with a device for processing and displaying data (computer); a computer with special software that registers and stores the primary signals generated by the sensors of the cells of the chip array, analyzes, processes this data and determines the nucleotide sequences of the target nucleic acids from its many fragments.
- the device for processing and displaying data can be performed on the basis of a wide range of electronic computing devices, for example, a personal computer, laptop, server cluster, etc.
- the specified device contains one or more processors that perform the main computational work when implementing the steps of the method and random access memory (RAM), designed for the operational storage of commands executed by one or more processors.
- RAM random access memory
- sample preparation process of the present invention is described in more detail, including the isolation of nucleic acids, the construction of a library, the formation of polymerase – DNA matrix complexes and their immobilization on the surface of sensors in cells of a microchip matrix.
- Nucleic acids used in sequencing methods and systems in embodiments of the invention may be single-stranded and double-stranded, or may contain single-stranded and double-stranded sequences.
- nucleic acids can be genomic DNA, mitochondrial DNA, cDNA, mRNA, ribosomal RNA, small RNA, non-coding RNA, small nuclear RNA, small nucleolar RNA and Y RNA.
- nucleic acids are extracted and purified from a sample or sample.
- the implementation of RNA is converted into DNA during reverse transcription with the participation of reverse transcriptase, a specialized DNA polymerase capable of synthesizing a DNA strand using RNA as a matrix.
- Nucleic acids used in embodiments of the invention can be isolated / obtained from any organism of interest. Such organisms can be, for example, animals (for example, mammals, including humans and primates), plants, fungi, or pathogens, such as bacteria or viruses.
- the implementation of the nucleic acids are bacterial or viral nucleic acids.
- Nucleic acids are obtained from samples of organisms of interest.
- samples include cells, body fluids (including, but not limited to, blood, urine, serum, lymph, saliva, anal and vaginal secretions, sweat, and seminal fluid), environmental samples (for example, water, soil, air, agriculture), biological weapon agent samples, research samples (for example, products of nucleic acid amplification reactions, such as PCR or whole genome amplification reactions), purified samples, such as purified genomic DNA, RNA preparations, and primary samples (bacteria, viruses, etc.).
- body fluids including, but not limited to, blood, urine, serum, lymph, saliva, anal and vaginal secretions, sweat, and seminal fluid
- environmental samples for example, water, soil, air, agriculture
- biological weapon agent samples for example, water, soil, air, agriculture
- research samples for example, products of nucleic acid amplification reactions, such as PCR or whole genome amplification reactions
- purified samples such as purified genomic DNA, RNA preparations, and primary samples (bacter
- nucleic acids for example, genomic DNA
- Methods for obtaining nucleic acids are well known in the field of research (for example, Sambrook et al., Molecular Cloning: A Laboratory Manual (1999)).
- the nucleic acids used in this sentence are genomic DNA.
- the implementation of nucleic acids are part of the genome (for example, part of the genome of interest for a particular ⁇ specific application, for example, a sample of genes that may carry mutations in a private sample of a population, for example, patients with cancer).
- the nucleic acids are exomic DNA, for example, a portion of the entire genome enriched in transcribable DNA sequences.
- the implementation of the nucleic acids are part or full of the transcript, for example, the set of all mRNA or transcripts produced by the cell or population of cells.
- the implementation of the nucleic acid are fragmented. Any fragmentation method can be used.
- the implementation of nucleic acids are fragmented by mechanical means (for example, ultrasonic, acoustic, or nebulization), chemical or enzymatic methods (for example, by using endonucleases). Methods of fragmentation of nucleic acids are well known in the field of the present invention (for example, US 9127306 B2).
- the implementation of fragmentation is performed by ultrasound (for example, using a focused ultrasonic feed from Covaris, USA).
- the implementation of fragmentation is performed by treating nucleic acids with nucleases or their mixtures (for example, a mixture of Nukpeaz Fragmentase, New England Biolabs, USA).
- the size of the fragmented nucleic acid is in the range of 50-200 base pairs (bp). In some embodiments, the size of the fragmented nucleic acid is in the range of 100-500 bp. In some embodiments, the size of the fragmented nucleic acid is in the range of 200-2000 bp. In some embodiments, the size of the fragmented nucleic acid is in the range of 500-5000 bp.
- the size of the fragmented nucleic acid is in the range of 1000-10000 bp.
- the implementation of the size of the fragmented DNA is in the range of 3000-20000 p.
- the size of the fragmented DNA is in the range of 5000-40000 bp.
- the methods described in this section are the extraction / extraction of nucleic acids from biological samples and their preparation for sequencing.
- Some methods for extracting nucleic acids from samples / samples of various origins use cell lysing enzymes, ultrasonic treatment, high pressure presses, or a combination of any of these methods.
- nucleic acids after nucleic acids are released from the cell, they are further purified from cell wall debris, proteins, and other components using commercially available methods including the use of proteinases, organic solvents, desalting techniques, spin columns, and the binding of nucleic acids to a functionalized matrix, for example, magnetic nanoparticles.
- the nucleic acid is a cell-free free nucleic acid (for example, a so-called liquid biopsy) and does not require an extraction process from the cell.
- Methods for constructing nucleic acid libraries of the present invention are the ultimate goal of creating a circular DNA template that serves as a substrate for the DNA polymerase in the rolling ring replication reaction (PKC), the preferred method of DNA synthesis used in the present invention.
- PLC rolling ring replication reaction
- Such a looped DNA template with an unknown nucleotide sequence is sequenced with multiple repetitions using the methods outlined in this invention to achieve high accuracy in the determination of nucleotides in the ring matrix sequence.
- the looped matrix is a DNA polymer
- polymerase is RNA polymerase, such as bacteriophage T7 RNA polymerase, and the sequencing process is performed by “rolling ring transcription” (Mohsen and Kool, Ace. Chem. Res. 2016, v 49 (11): 2540-2550).
- the loopback matrix for polymerase is a covalently closed, fully single-stranded DNA ring ( Figure 1A). Design methods for such single-stranded matrices are well known in the field of science to which the present invention pertains. An example of such a method is given in detail in FIG. 2
- the looped matrix may be in the form of a double-stranded DNA ring having a “cut” or “gap” in one strand (Fig. 1B).
- the resulting 3 'end serves as a DNA polymerase binding site and the start of DNA synthesis.
- Such a matrix can be obtained as a result of two enzymatic reactions. First the ligation of the double-stranded adapter is performed.
- DNA ligase to the end of the double stranded DNA fragment of the sample.
- both ligation of “blunt” ends and ligation of an adapter having a protruding 3 ’T-terminus with a DNA fragment with nucleotides added to the 3’ ends can be used.
- the matrix may topologically be a closed, partially double-stranded structure of the “DNA dumbbell” type.
- This structure allows you to determine the sequence of two DNA strands of the double-stranded part of the “DNA dumbbell” (Fig. 1B), semantic and antisense, during sequencing by the RCA mechanism.
- Methods for constructing such DNA dumbbells are well known in the art (for example, Travers KJ, et al., Nucleic Acids Research, 2010, Vol. 38, No. 15 e159).
- the method of constructing libraries of single-stranded looped DNA molecules consists of several successive steps.
- An example of such a method is shown in FIG. 1 and consists of the following steps: (a) fragmentation of DNA obtained from a sample to obtain a variety of DNA fragments; (b) selection and selection of fragmented DNA by size; (c) denaturation of double-stranded fragmented DNA of the desired size to produce single-stranded DNA, where denaturation is produced by thermal or chemical exposure; (d) reparation of 5'- and 3'-ends for the reduction of 5'-phosphate and 3'-hydroxyl groups; (e) ligation of 5 ′ and 3 ′ semi-adapters to repaired single-stranded DNA fragments, thus obtaining a multitude of single-stranded DNA fragments bordered on the flanks with upper chains to the semi adapters; (e) amplification of the obtained ligated molecules using the polymerase chain reaction (PCR), where the forward and reverse primers are oligonucle
- DNA fragmentation is accomplished by sonication of the DNA by exposure to ultrasound (eg, DNA Shearing for NGS: with the M220 TM Focused-ultrasonicator TM, Application Notes, www.covarisinc.com; Fisher et al., Genome Biology, 201 1, 12: R1)
- DNA is enzymatically fragmented, for example, by the enzyme Fragmentase (New England Biolabs Inc., USA), resulting in the formation of fragments with 5'- and 3'-ends having phosphate and hydroxyl groups, respectively.
- the resulting fragments are selected by size in order to narrow the interval of fragment size variation (range of fragment size variability) and thus obtain libraries with more homogeneous looped fragments.
- nucleic acid fragments of 1000-2000 bp in size are selected.
- nucleic acid fragments from 2000 to 4000 bp are selected.
- nucleic acid fragments of a size of 6,000 to 10,000 are selected. In some embodiments, the implementation of selected nucleic acid fragments with a size of 10000-20000. In some embodiments, the implementation of selected nucleic acid fragments of size 20000-40000.
- the implementation of the selection of fragments by size is carried out by the method of Solid Phase Reversible Immobilization (SPRI) developed in the Whitehead Institute (DeAngelis MM, et al., Nucleic Acids Res, 1995, 23: 4742-4743), which uses magnetic balls that bind to DNA , for example, AMPureXP beads (Beckman Coulter, Inc. USA).
- SPRI Solid Phase Reversible Immobilization
- the implementation of the selection of high molecular weight DNA fragments (up to 50 K. p. O.) in size is carried out using automatic DNA fractionation using a special tool, for example, BluePippin (Sage Science, Inc., USA).
- a plurality of DNA fragments resulting from fragmentation must be flanked adapters - partially or completely double-stranded DNA molecules, obtained by annealing two oligonucleotides with a known sequence.
- double-stranded DNA fragments obtained using ultrasonic fragmentation undergo DNA repair reactions to restore 5 ’phosphate and 3’ hydroxyl end groups, and turn 5 ’and 3’ protruding and / or recessive ends into blunt. This is achieved by incubating fragmented DNA with phage T4 polynucleotide kinase, phage T4 DNA polymerase, and sometimes additionally with Maples DNA fragment of polymerase I E. coli.
- DNA when DNA is fragmented enzymatically, for example, by the enzyme Fragmentase (New England Biolabs Inc., USA), there is no need to restore 5 ′ and 3 ′ terminal chemical groups, since the enzymatic fragmentation method maintains the integrity of 5 ′ phosphate and 3 ′ hydroxyl groups in the sites of DNA attack used, nucleases.
- the fragmented DNA when the adapters are stitched by blunt-end ligation, however, the fragmented DNA is processed with the DNA polymerase of phage T4 and sometimes additionally of Maples with DNA fragment of Polymerase I to make the ends blunt before the ligation of double-stranded adapters at the edges of the fragments.
- the implementation of fragmented DNA is first denatured and then ligated in single-stranded form to the adapters, as shown in FIG. 1.
- the repair of the ends is limited to the restoration of 5 ’phosphate and 3’ hydroxyl groups, if the DNA was fragmented by physical means, for example, by ultrasound, and is not required at all if the DNA was enzymatically fragmented.
- DNA ligase for example, phage T4 DNA ligase or phage T7 DNA ligase
- two adapters are stitched to double-stranded DNA fragments in a random, non-directional way — a blunt-end ligation reaction catalyzed by DNA ligase, which leads to the formation of three types of molecules: flanked by adapters A (AA combination), adapters B (BB combination), and adapter A and adapter B (AB combination).
- adapters are used that are not capable of ligation between each other, i.e. not forming homo and heterodimers. Selection and enrichment of the library with DNA fragments that have a combination of AB, is performed using PCR using primers homologous to the regions of adapters A and B (Drmanac R. et al.,
- nucleotide A is first added to the 3 'ends of double-stranded DNA fragments using Maples (Klenow) A fragment of a mutant DNA polymerase I that does not have 3'> 5 'exonuclease activity (3' ⁇ > 5 'exo), or Taq polymerase.
- adapters are used, which are two oligonucleotides annealed at each other, forming double-stranded oligonucleotides with 5 'phosphate groups and protruding T nucleotides at the 3 ′ ends.
- an adapter having a protruding nucleotide T at the ligated end has a partially double-stranded structure, for example, in the form of a Y-structure, often called a “fork” (described in US 6287825 B1; US 7741463 B2), or adapter "(described in US 7368265 B2).
- a library of DNA fragments with attached adapters undergoes PCR amplification using forward and reverse primers with phosphorylated 5 'ends, which allows such molecules to be covalently looped using DNA ligase in the next step, the fragment looping step.
- DNA fragments with attached adapters are phosphorylated by polynucleotide kinase and looped without prior DNA amplification.
- the implementation of the DNA looping fragments with sewn adapters includes the following steps: (a) denaturation of PCR-amplified or non-amplified DNA fragments, and (b) subsequent intramolecular ligation using an auxiliary oligonucleotide “bridge,” Denatured DNA fragments are annealed with a “bridge” oligonucleotide in the presence of DNA ligase, such as phage T4 ligase, which leads to the formation of covalently closed single-stranded circular DNA.
- DNA ligase such as phage T4 ligase
- unlocked linear single-chain fragments and an excess of oligonucleotide “bridge” are digested (hydrolyzed) as a result of processing the ligated DNA mixture with exonucleases, for example, a mixture of Exonuclease I and Exonuclease III of E. coli.
- the DNA rings thus obtained are a library of DNA fragments from a sample of interest, ready for the sequencing procedure described in the present invention.
- the entire library of DNA from an individual sample, or the individual individual molecules that make up the library are labeled by adding barcodes [Kinde I, et al., Parallel sequencing. Proc Natl Acad Sci USA.
- Barcode sequences are selected from N-sequence sequences, where the length of the barcode N determines the size of the final set of barcodes selected according to the criterion close to 100% of the probability to distinguish the barcodes from each other. In some embodiments, a single set of bar codes is used.
- two or more sets of barcodes are used, which makes it possible to increase the number of labeled libraries (or labeled individual molecules of one DNA library) due to the possibility of applying a combinatorial barcoding scheme (Fig. 1).
- barcoding is used to tag individual libraries for simultaneous sequencing after mixing. The use of such barcoding options in sequencing technologies is called multiplex sequencing (Smith et al., Nucleic Acid Research, 2010, v. 38 (13), e142).
- the sequencing method presented in the present invention can be classified as a single-molecule asynchronous electronic sequencing method in real time. It does not require multiple modifications of the polymerase, except for the modification for its immobilization on the sensor surface.
- the sequencing method of the present invention can use both DNA and RNA polymerase.
- the polymerase can be RNA polymerase, which may be selected from the group of polymerases consisting of phage T7 RNA polymerase, phage TK RNA polymerase, RNA polymerase RNA polymerase SP6, and E. coli RNA polymerase. These polymerases initiate RNA synthesis in a specialized region of double-stranded DNA, called the promoter.
- TKK rolling ring transcription
- a DNA polymerase is used.
- a polymerase must meet several requirements in order to make DNA sequencing possible according to the method presented in the present invention, namely: (a) have strong chain extrusion activity and lack of 5'-3 'flap-endonuclease activity; (b) the absence of 3'- 5 'zuconuclease activity; (c) high processivity of DNA synthesis; (d) to be able to be attached to the sensor surface in a way that would not change its functional properties, such as (a) and (c).
- the method presented here does not need to introduce mutational changes in the amino acid sequence of the polymerase so that it can use chemically modified nucleotides for the synthesis, as the polymerase used in The present invention deals with natural unmodified nucleotides.
- the chain extrusion activity is required by the polymerase of the present invention in order to be able to carry out DNA synthesis using looped DNA as a template, such as single-stranded DNA rings or “dumbbell DNA” structures. This type of DNA synthesis, called
- DNA is required by polymerase to polymerize tens of thousands of bp. after a single act of binding to the DNA substrate.
- the absence of 3’-5 ’zconuclease activity is necessary for polymerase to carry out DNA synthesis in the 5’-3’ direction, without the ability to remove the nucleotide just inserted into the DNA chain due to the nucleotide corrective activity. If the polymerase has such correctional activity, it can sometimes include the same nucleotide twice or more in the growing polynucleotide chain, which will result in a double (triple, etc.) registration by the sensor of the inclusion of this nucleotide, and therefore the error sequencing.
- Many of today's known polymerases Maples DNA fragment of polymerase I, DNA polymerase of phage Phi29), and many archaeal DNA polymerases
- Pfu polymerase for example, Pfu polymerase
- Pfu polymerase have such exonuclease activity that is important for high fidelity reproduction during natural DNA synthesis, as it allows for the correction of the random insertion of irregular nucleotides, but is unacceptable for sequencing using the method of the present invention.
- mutant 3′-5 ′ exochomerase is used, for example, Phi29 phage mutant DNA polymerase.
- An example of a DNA polymerase of Phi29 phage with the absence of 3'-5 'zxonuclease activity is its double-mutated polymerase derivative resulting in the replacement of two amino acids - D12A / D66A (Lagunavicius, A., et al, RNA, 2008; 14: 503-513) .
- a DNA polymerase for the present invention may be selected from the group of polymerases, including: phage PY29 DNA polymerase (3'-5 'exo), Large Fragment Bst DNA polymerase, Bst 2.0 DNA polymerase (the resulting in silico design of the homologue Large Fragment of DNA Polymerase I from Bacillus stearothermophilus, New England Biolabs, USA), Large Bsm Fragment of DNA Polymerase (part of DNA polymerase protein from Bacillus smithii, Thermo Fisher Inc., USA), VentR TM (3'-5 'ex-) DNA polymerase, Maples DNA fragment of polymerase I E.COM, and a large fragment of Bsu DNA polymerase.
- phage PY29 DNA polymerase 3'-5 'exo
- Large Fragment Bst DNA polymerase the resulting in silico design of the homologue Large Fragment of DNA Polymerase I from Bacillus stearothermophilus,
- the PPA is initiated on a matrix representing the DNA primer-DNA ring complex or DNA primer-dumbbell DNA complex, a polymerase with a strong DNA strand displacement activity, which is a prerequisite for a highly advanced RCC mechanism.
- chain extrusion describes the ability of a polymerase to displace the underlying counter-DNA chain along the synthesis path. Phi29 phage DNA polymerase has the strongest activity of extrusion of the DNA chain among known polymerases and is most active within the temperature range of 20-37 ° C.
- Bsm DNA polymerase does not have 5 '-> 3' and 3 '-> 5' exonuclease activities, and the Big Fragment of Bsm DNA polymerase has a strong chain extrusion activity and is active in a wide temperature range from 30 ° C to 63 ° C with optimum synthesis temperature of 60 ° C.
- a large Fragment of Bsu DNA polymerase has a moderate chain extrusion activity and operates in a moderate temperature range, 20-37 ° C.
- a large Fragment of Bst DNA polymerase on the other hand, being an enzyme that displaces the chain well, has a high optimal temperature of 65 ° C.
- DNA polymerase (optimal reaction temperature 60-70 ° C) and 96-7 DNA polymerase
- optimal reaction temperature is 50-55 ° C
- RKK Long mediated isothermal amplification
- the PKK reaction uses a “rolling ring,” a replicative structure in which only one strand of DNA ring duplex is used as a matrix for multiple replication rounds, and leads to linear amplification of DNA as linear single-stranded concatemers by re-synthesizing the same strand from the ring matrix .
- a “rolling ring” is formed when DNA synthesis initiated at the 3'-end of the primer annealed on a single-stranded ring (or the 3'-end of the nickname of the single-stranded break in double-stranded DNA, or the 3'-end of the "gap” in the DNA) , reaches the 5'-end of the same annealed on the ring primer (in the case of single-stranded DNA of the ring), or double-stranded stretch of DNA "dumbbells", or the 5 'end of the "nickname” or "gap”. Then DNA polymerase begins to displace the overlying 5 'end and the DNA chain itself, which does not serve as a template for the synthesis of a new DNA. Thus, with the RCM, only one chain is copied.
- the end product of the RCM is a connected end-to-end
- RKK catalyzed by the DNA polymerase of phi29 phage, produces concatemer products> 50 kbp in size. in just 20-30 minutes of synthesis.
- Such newly synthesized long linear single-stranded molecules spontaneously fold in a random fashion into spirals measuring hundreds of nanometers and even several micrometers in length.
- the implementation of the RSC is initiated at the 3'-end of the "nickname" or "gap" in a fully double-stranded circular DNA.
- the DNA polymerase does not first copy the entire single-stranded ring matrix (as in the case of a single-stranded ring) or the single-stranded portion of the “dumbbell” DNA before starting to displace the underlying chain, and immediately (or one or more nucleotides) begins to force out the 5 'end above the lying DNA duplex.
- the implementation before the polymerase is placed on the surface to begin sequencing by the RCC mechanism the formation of the Polymerase-Primer-DNA Matrix complexes is carried out.
- This is achieved by a two-step process: (a) annealing-hybridizing oligonucleotide primers for sequencing with single-stranded DNA rings (ssDNA) or single-strand dumbbell DNA loops by heating the mixture to a temperature of> 95 ° C followed by slow cooling to ⁇ 22-30 ° C leading to the formation of a binary complex "Primer-DNA Matrix”; (b) the subsequent addition of loading buffer (a buffer that promotes the binding of the polymerase to the sensor surface, i.e., “loading” polymerase to the surface) and DNA polymerase phage PY29, leading to polymerase binding to the complex "Primer-DNA Matrix" and the formation of the so-called “frozen” or "inactive” (ie not functioning at the moment, but ready to synth
- immobilization complexes containing a DNA matrix can be assembled in one step by adding loading buffer and DNA polymerase, for example, Phi29 phage, directly to double-stranded DNA (dsDNA) rings having a “nick” or “gap” in one of the DNA chains (binary complex "Polymerase-DNA Matrix”), as the primer is not needed to start sequencing in this case.
- DNA polymerase for example, Phi29 phage
- dsDNA double-stranded DNA
- dsDNA double-stranded DNA
- dsDNA double-stranded DNA
- synthesis of DNA by ternary complexes in the reaction mixture is initiated in order to obtain relatively cumbersome structures representing ternary complexes associated with single-chain products of limited synthesis, coiled into a small size.
- the linear size of such a complex should correspond approximately to the length of the cell side of the sensor, which is controlled by the duration of the RSC over time. This limited time-controlled RSC is initiated by adding all four nucleotides and magnesium ions to the formed triple complexes in solution.
- the PKK reaction is stopped by adding a chemical agent, for example ethylenediaminetetraacetic acid, to the reaction mixture of a chelating magnesium ion. (EDTA).
- a chemical agent for example ethylenediaminetetraacetic acid
- EDTA ethylenediaminetetraacetic acid
- rolled concatenated the particles have a cross-sectional diameter of at least 5 nanometers, at least 5 nanometers, at least 10 nanometers, at least 20 nanometers, at least 30 nanometers, at least 40 nanometers, at least 50 nanometers, at least 100 nanometers, at least 500 nanometers, at least 800 nanometers, at least 1 micrometer, at least 2 micrometers and more.
- Such bulky structures consisting of a random helix attached to the polymerase and the original DNA matrix (“Polymerase-DNA Matrix-RKK Product”) can be used in the methods of the present invention so that only one polymerase complex can communicate with the surface of only one sensor. due to the effect of steric hindrance (steric hindrance effect). Thus, the possibility of binding two or more ternary complexes with one sensor is excluded. However, the probability of binding more than one ternary complex with one sensor is quite high when using ternary complexes that are not subjected to limited RCM, when the load of the complexes follows the Poisson distribution (Poisson Distribution), because, due to its small size compared to the surface area, complex with the sensor surface independent of each other.
- Poisson Distribution Poisson Distribution
- Such a method of loading the RCM intermediate of the reaction, instead of the native triple complexes, also makes it possible to bypass the Poisson rule and to achieve almost 100% filling of the sensor matrix with single triple complexes.
- the loading of ternary complexes that have not undergone limited synthesis follows the Poisson distribution and, at best, results in ⁇ 40% of the sensors filled with only one immobilized ternary complex.
- the implementation of the linear size of the Polymerase-DNA Matrix-RSC Product complexes is approximately the same as the sensor cross-section, and is at least 5-10 nanometers. In some embodiments, the implementation of the linear size of the Polymerase-DNA Matrix-Product PKK complexes is at least 10-20 nanometers (nm), or 20-50 nm, or 50-100 nm, or 100-1000 nm, or 1-2 micrometer.
- the methods of the present invention are based on the detection of single acts of charge separation (the formation of one proton and one electron) occurring in the active center of a polymerase enzyme when it embeds a nucleotide into a DNA strand growing during synthesis.
- the active polymerase center in the composition of the ternary complex must be located sufficiently close to the sensor surface.
- the polymerase is located about 100 nm from the unmodified surface of the sensor, about 80 nm from the unmodified surface of the sensor, about 60 nm from the unmodified sensor surface, about 50 nm from the unmodified sensor surface, about 20 nm from the unmodified sensor surface, about 15 nm from the unmodified sensor surface, about 10 nm from the unmodified sensor surface, about 5 nm from the unmodified sensor surface.
- the polymerase is located less than about 5 nm from the unmodified sensor surface: about 4 nm from the unmodified sensor surface, about 3 nm from the unmodified sensor surface, about 2 nm from the unmodified sensor surface, or about 1 nm from the unmodified sensor surface .
- a pre-assembled complex Polymerase-Primer-DNA Matrix or Polymerase
- DNA Matrix RSC Product should be bound to the sensor surface due to the polymerase part of the complex.
- the polymerase molecule must be a certain way (chemically, or genetically, or biochemically) modified to create a binding site that when interacting with the chemical (s) group (s), or ligand (s), or protein ( s) attached to the sensor surface could form a chemical bond (s) strong enough to withstand the physical and chemical environmental conditions associated with the sequencing process.
- the identification of potential sites for modification on the DNA polymerase surface of phage PY29 is greatly facilitated by the presence of a known three-dimensional protein structure (Berman AJ, et al., EMBO J.
- the implementation of the polymerase is immobilized on the surface due to bioaffin binding.
- polymerase is modified by creating one, two or more biotin labels on the surface of the protein.
- a biotin label can be an artificial AviTag peptide consisting of
- the isolated protein is biotinylated in vitro by treating Biotin-protein ligase (EC 6.3.4.15), which activates biotin to form biotinyl 5 'adenylate and transfers biotin to AviTag polymerase.
- Biotin-protein ligase EC 6.3.4.15
- Avidity LLC USA
- AVB101 commercialized strains, for example, AVB101, in which it is possible to induce AviTag biotinylation in vivo when increasing the bacterial mass.
- biotinylated polymerase can be selectively immobilized on the surface of the sensor that carries the molecule (s) of streptavidin, a protein that has strong affinity for biotin.
- the surface consists of silicon dioxide (SiO2)
- it is first coated with biotin-PEG-silane (for example, biotin-polyethylene glycol-trimethoxysilane from Laysan Bio., Lnc.,
- the sensor surface can be modified so-called.
- AviTag which are in turn associated with the remaining free valencies on streptavidin molecules.
- depositing biotin-PEG-silane (or a mixture of biotin-PEG-silane and mPEG-silane) using solvent-based covalent grafting technique (solvent-based, covalent grafting technique) improves the specificity of biotinylated polymerase attachment by repelling non-specific protein adsorption.
- solvent-based covalent grafting technique solvent-based, covalent grafting technique
- a successful example of using AviTag technology is the successful incorporation of two biotin “legs” into DNA polymerase, where the surface-bound polymerase has become more processable (John G. K. Williams, et al, Nucleic
- bioaffin binding when the sensor surface is coated with gold (Au), polymerase can also be used, modified by creating one, two, or more biotin labels on the protein surface.
- Biotin is a vitamin and is a bicyclic
- biotinylation agent 5 ring and carboxyl group on the side chain of valeric acid.
- This carboxyl group of biotin after modification may become a biotinylation agent.
- biotin functionalized NHS-ester, hydrazide, or maleimide retain the intact bicyclic ring required for binding to avidin (S. Luo and DR Walt. Anal. Chem. 61: 1069 (1989); and RN Orth, TG Clark and HG Craighead , Biomed. Microdevices, 2003, 5, 29).
- Biotins with these functional groups can be applied directly to the surface of gold coated with a self-assembling monolayer (SSM) due to reaction with amines, thiols, or other suitable reaction groups at the ends of the SMS.
- SSM self-assembling monolayer
- biotin molecules can be created on the surface of gold directly by forming SMS with a number of chemical compounds based on sulfur (S) containing biotin and hydroxyl groups (J. Spinke, et al, J. Chem. Phys., 1993, 99, 7012).
- S sulfur
- polymerase is immobilized on the surface of gold due to binding with biotins on the SSM through the formation of a biotin-streptavidin-biotin sandwich.
- the surface containing silicon dioxide (SiO 2 ) can be modified by adding a poly-histidine tag, for example, six histidine amino acid bases, to the N-terminus or C-terminus of the protein.
- a poly-histidine tag for example, six histidine amino acid bases
- Ni-HTA-PEG Ni-nitrilotriacetate acid-PEG
- Cy-NTA-PEG Cu-nitrilotriacetate acid-PEG
- the polymerase for bioaffin binding to a surface containing gold (Au), is modified by adding a poly-histidine tag, for example, six histidinab [His] 6 amino acid bases, to the N- or C-terminus of the protein. With this modification [Hisfe-labeled polymerase is immobilized on the sensor surface through interaction with a poly-histidine tag, for example, six histidinab [His] 6 amino acid bases, to the N- or C-terminus of the protein. With this modification [Hisfe-labeled polymerase is immobilized on the sensor surface through interaction with
- NTA nitrilotriacetate acid
- a modification of the surface of gold can be obtained, for example, by the following method in two stages: first, using a mercaptohexadecanoic acid, a highly ordered carboxyl-terminated layer is formed, and then the carboxyl group is condensed with a nitrilotriacetate acid derivative containing an amino group to form a peptide bond.
- the density of NTA groups is controlled by the reaction conditions (Thao, T. Le, et al. Phys. Chem. Chem. Phys.,
- NTA groups (Greta J. Wegner, et al. Anal. Chem., 2003, 75 (18), pp 4740-4746). It is also possible to attach NTAs with terminal amino groups to the SMS bearing NHS-terminal groups, as described in Vallina-Garcia R, et al., Biosens Bioelectron, 2007 Sep 30; 23 (2): 210-7.
- the polymerase carrying one or more sulfhydryl (thiol) groups (-SH) on its surface is immobilized on the surface of a sensor modified with a maleimide reactive group.
- Sulfhydryl groups are located in the side chains of cysteine (Cys, C). Often they are part of the secondary or tertiary structure of a protein, and can be linked through side chains by disulfide bonds (-SS-).
- the covalent bond between the maleimide group and the sulfhydryl group is one of the most selective and easy reactions in the chemistry of bioconjugation.
- thiol groups can be used to direct the protein binding reaction to the surface away from the active sites of the enzymes. Immobilization on the surface is carried out as follows: first, sulfhydryl group (s) are created on the protein surface by reducing disulfide bonds, or after chemical modification of primary amines by introducing SH-groups using specific reagents. Then these sulfhydryl groups are covalently bound to the surface modified (activated) by maleimide. Although disulfide bonds between the two cysteines in proteins are very stable, they can be regenerated by reducing agents (R-SH) such as dithiothreitol
- the sulfhydryl groups that already exist in polymerase on the protein surface can be used to immobilize on the maleimide-activated surface, or new cysteines can be created in a given portion of the protein lying on the surface, based on the three-dimensional structure of the enzyme.
- new cysteines can be created in a given portion of the protein lying on the surface, based on the three-dimensional structure of the enzyme.
- Ser polar and isosteric amino acids
- Al alanines
- a chemical reaction based on self-assembling monolayer (SMS) alkanethiols at the ends of which functional groups are located, such as an amine or carboxyl group, can be used to bind a polymerase having sulfhydryl groups onto the sensor surface containing gold (Au).
- SMS self-assembling monolayer
- the sulfur atoms of alkanethiols interact with gold to form strong stable bonds, and the chains of methylenes contribute to the self-assembly of the alkanethiol layer due to van der Waals forces.
- the terminal amine CMS is modified with the amine-sulfhydryl crosslinker CCMCC (sulfosuccinimidyl 4- (1M-maleimidomethyl) cyclohexane-1 -carboxylate), which contains NHS-ester and maleimide reactive groups at opposite ends.
- CCMCC amine-sulfhydryl crosslinker
- the result is an activated CMS with terminal maleimide groups ready to covalently bind an enzyme having sulfhydryl group (s) available for binding.
- a linear heterobifunctional PEG reagent having maleimide and silane is used to bind a polymerase having sulfhydryl groups on the surface of the sensor containing silicon dioxide: for example, made by CreativePEG Works Inc., USA (Ogorzalek, TL, Examining the Behavior of the Surface Tethered Enzymes, Diss. University of Michigan, 2015).
- Maleimide interacts with the sulfhydryl group, and silane with the hydroxylated surface of silicon dioxide.
- PEG inhibits non-specific binding of charged molecules, such as DNA and proteins, to the surface.
- the device contains a chip array of sensor cells, which is the main component of the device for single-molecule sequencing (sequencer) in all variants of its design.
- Each cell of the microcircuit matrix organizes the polymerization procedure for a single single-stranded nucleic acid fragment, consisting of a polymerase – DNA primer matrix complex immobilized on the prepared cell surface of the cell, the results of nucleotide incorporation by single-stranded DNA fragments (hereinafter the reaction) in each cell of the matrix is converted into a useful signal by a cell sensor and is recorded by an analog-digital cell circuit; polymerization reactions of DNA fragments in the cells of the matrix occur independently of each other.
- the nucleotide embedding rate was chosen simultaneously for all cells of the matrix, in a wide range: from 1st nucleotide per second or less, and up to 50-60 nucleotides per second or more, by controlling the values of reaction parameters such as temperature, pH of the solution the concentration of nucleotides in the reaction mixture, the choice of the variant of the gene modification of a polymerase;
- the matrix chip with the appropriate number of sensor cells was selected (it can contain from less than 1,048,576 to 256,000,000 or more cells in the matrix);
- a one-matrix or four-matrix version of the sequencer design is chosen to apply the sequential or parallel sequencing method, respectively.
- the implementation of the nucleotide embedding rate is 0.1-2 nucleotides per second. In some embodiments, the implementation of the nucleotide embedding rate is 1 to 10 nucleotides per second. In some embodiments, the implementation of the nucleotide embedding rate is 10-50 nucleotides per second. In some embodiments, the implementation of the nucleotide embedding rate is 50-100 nucleotides per second.
- the chip array of sensor cells can be manufactured according to standard semiconductor CMOS technological process or according to individual technological process (depending on which sensor design is used). Ensuring access of the biomaterial to the sensor surface of each cell of the matrix is implemented by a set of standard technological operations provided by the technological process, and the subsequent processing of these surfaces in one way or another, variants of which are described in the section "Approaches and immobilization technologies ".
- a chip array of sensor cells can either contain all of the below listed blocks, or contain only a part of them.
- FIG. ten One of the possible variants of the chip layout of the matrix of sensor cells is shown in FIG. ten.
- the matrix of sensor cells includes:
- Sensor cells located in rows and columns of the matrix, each of which consists of:
- Clocked trigger for example, D trigger with a tri-state output
- D trigger for overwriting the signal from the Schmitt trigger output to the output of the cell circuit
- Temperature sensor with a measurement circuit and data transfer to the chip controller.
- the controller of data exchange with the device for processing and displaying data (computer) via USB interface providing data output from each cell of the matrix to the computer, controlling the values of the reference voltages and the frequency of clock pulses necessary for the operation of analog-digital circuits of the matrix, controlling the temperature of the microcircuit and the aqueous solution above its surface (or only the temperature of the aqueous solution above the surface of the chip matrix).
- the clock generator forms a grid of frequencies for the operation of analog-digital circuits of the matrix cells and shift registers of data transfer, controlled by the controller.
- Reference Voltage Source - provides the necessary currents and voltages for the elements of the analog-digital matrix cell circuits, data transfer registers.
- FIG. eleven An example of a variant of the block diagram of four matrix devices that implement a single-molecule sequencing method is shown in FIG. eleven.
- the chip array of sensor cells with a microfluidic device cover 12 is the main component of a single-molecular sequencing device.
- microfluidic device which provides:
- the temperature value to be maintained is transmitted to the chip controller by the data processing and display (computer) device;
- composition of the microfluidic device may include:
- a cover of a chip of a matrix of cells of sensors for the one-matrix sequencing device and four covers of a chip of a matrix of a cell of sensors for a 4th matrix sequencing device, - for keeping solutions on the surface of a matrix of a chip, - pump 13 with electric drive, for each chip 12 of the sequencing device;
- Peltier element 16 (which is part of the device for maintaining the temperature of the working solution) for each chip 12 of the sequencing device;
- the temperature sensor can be discrete, semiconductor, or other type integrated into the chip cover of the sensor cell array, with an electrical signal generating circuit integrated into the chip circuit;
- the microfluidic device and each chip 12 of the array of sensor cells operate under the control of the controller 17 and the processing and display device (computer) 18 of the sequencing device, which are also an integral part of the sequencing device.
- the device for processing and displaying data 18, which includes one or several processors, is used to receive, process and store data on sequenced nucleic acids, as well as to control all sequencing procedures.
- the microfluidic device and the microcircuit can be operated under the control of the microchip controller, the corresponding commands to which are transmitted by the data processing and display device (computer).
- the data storage device can be a hard disk (HDD), solid-state drive (SSD), flash memory (NAND-flash, EEPROM, Secure Digital, etc.), optical disk (CD, DVD, Blue Ray), mini disk or their combination.
- HDD hard disk
- SSD solid-state drive
- flash memory NAND-flash, EEPROM, Secure Digital, etc.
- CD, DVD, Blue Ray mini disk or their combination.
- Example 1 The replication of the rolling ring (RSC) with the “Polymerase-Primer-DNA Matrix” triple complex occurs on a solid sensor surface.
- Thermal cycling was carried out under the following conditions: 98 ° C for 30 sec; then 30 cycles - 98 ° ⁇ 10 sec, 58 ° ⁇ 30 sec, 72 ° ⁇ 40 sec; further 72 ° C 2 min.
- the double-stranded products were purified using a DNA purification kit and eluted with 50 ⁇ l of 50 mM Tris pH 8.0.
- Exonuclease I and Exonuclease III were added to the ligation mixture to a final concentration of 0.7 Units / ⁇ l and 1 Units / ⁇ l, respectively, and the reaction digestion continued for 30 min at 37 ° C. The reaction was stopped by adding EDTA to a final concentration of 25 mM.
- Covalently closed single-chain rings were purified from the reaction mixture using NucleoSpin® Gel and the PCR Clean-Up Kit (Clontech, Takara Co., Japan).
- the “bridge” oligonucleotide was also used as a primer for RSC, from which DNA synthesis was initiated by the polymerase of phage PY29.
- first 100 femtomoles of the ryc rings were mixed with a bridge oligonucleotide (final concentration 0.5 microM) in a buffer of 10 mM Tris pH8.0 / 25 mM NaCI / 0.1 mM EDTA, heated to 94 ° C for 3 minutes, cooled to 52 ° C for 5 minutes, and then slowly cooled to 30 ° C.
- Primer-Matrix complexes were obtained.
- the complex was added 10X loading buffer to 1X final concentration: 50 mM Tris-HC1 / 10 mM (NH4) 2 SC> 4/4 mM DTT / 0.05% Tween 80, pH 7.5.
- the Echo ' (D66A) DNA polymerase of phage PY29 carrying the N-terminal Biotin tag was added to the mixture, creating a 2-fold excess of the “Primer- Matrix "in relation to polymerase.
- the mixture was incubated at 10 ° C for 15 min to form ternary complexes.
- streptavidin protein was immobilized on a biotinylated PEG layer by adding 20 ⁇ l of 0.1 mg / ml streptavidin dissolved in a buffer containing 10 mM Tris-HC1 / 50 tmM NaCI pH 8.0. After a one-minute incubation, the excess streptavidin was removed from the flow cell by washing it with 100 ⁇ l of the same buffer. After that, ternary complexes were added to the cell and immobilized on PEG-Biotin-Streptavidin surfaces for 15 min at 10 ° ⁇ . As a control, ternary complexes were also placed in a second flow cell, the surface of which was not treated with streptavidin.
- the complexes that were not bound to the surface were removed from the flow cells by washing with 200 ⁇ l of 1x loading buffer. Then, in order to start the PKK reaction, a solution of 1x Loading Buffer with 10 mM MgCI 2 (final concentration) and 400 nM dNTP (final concentration of each nucleotide) was fed into the flow cell. RCC reaction lasted 20 minutes at 30 ° C. The reaction was stopped by the addition of 25 mM EDTA pH 8.0.
- control sample of the surface of the cover glass is not passivated by streptavidin, and therefore is not capable of binding the ternary complex, which leads to the absence of visible products of DNA synthesis by polymerase. Separate few products visible on the control surface arise due to the weak nonspecific binding of the ternary complexes with the PEG-biotin surface (see Fig. 6B).
- Example 2 A semiconductor sensor and a matrix cell circuit manufactured by semiconductor CMOS technology.
- FIG. 12-14 Examples of possible sensor cell designs are presented in FIG. 12-14, 16, 17, including the scheme that implements the function of stochastic resonance shown in FIG. 15.
- the polymerization reaction of a DNA fragment by polymerase complex 19, 25, 31, 38 immobilized on the cell sensor surface, as a result of the interaction of the polymerase with reagents of the reaction mixture solution 22, 28, 34, 41, is accompanied by separation and localization of the negative charge (electron) and the free proton around activated segment of the DNA fragment.
- the reaction results in the generation of an electron - proton pair, followed by localization of the electron on the activated segment of the DNA fragment and proton drift in the aqueous solution of the reaction mixture in the external electric field of the cell towards the bias electrode 23, 29, 35, 42, which is connected to voltage source controlled by the controller of the sensor cell array chip.
- a fundamentally important circumstance providing the very possibility of an induced potential appearing at the reading electrode, is the presence of an electric field in an aqueous solution, which increases the proton drift velocity, which provides a large value for the characteristic time ⁇ ep complete screening of the proton by negative solution ions.
- the electric field in an aqueous solution is created by the applied potential to the bias electrode, which is located, for example, on the inside of the chip cover.
- the bias voltage is set by a controlled voltage source (supply) relative to the potential of the common electrode (not shown in the Figures).
- the bias voltage source is controlled by the chip controller, which has feedback to the analog-digital cell circuit. After all preparatory to sequencing operations are completed, the processing unit and display (computer) transmits data to the controller of the chip that the polymerization reactions of DNA fragments, most likely, began in the cells.
- the controller of the chip After decoding this data, the controller of the chip analyzes the values of the logical quantities in a sequence of time intervals from the output of the analog
- the polymerization reaction of a DNA fragment in a cell is organized in such a way that there are on average several, for example, five insertions of complementary nucleotides by polymerase per second.
- Each nucleotide embedding is accompanied by the separation of one pair of charges.
- the fact of the separation of each pair of charges is recorded and converted by the cell sensor into an electrical signal, which is first amplified by a differential charge amplifier, then
- the induced potential at the gate of the field-effect transistor modulates the amplitude of the current in the channel of the transistor, the drain of which is connected to the differential charge amplifier; another input of the differential amplifier is connected, for example, to the drain of the sensor field-effect transistor, the transistor of which forms the background signal of FIG. 14.
- the output of the differential amplifier is connected to the input of the amplifier, the purpose of which is to form at its output a voltage amplitude of the useful signal of such a magnitude that is sufficient to switch the Schmitt trigger, based on a positive feedback comparator, into a logical “G .
- the Schmitt trigger output is connected to the D-flip-flop input, which is clocked by the cell dividing circuit by the clock frequency of the chip generator, overwriting the logical values (“1” and “O”) from the Schmitt trigger output to the D-flip-flop output with a frequency exceeding the frequency (temp)
- the output of the analog-digital circuit will form a sequence of discrete time intervals, similar to those the sequences shown in FIG. 5 A: the logical unit indicates the time intervals when the sensor and the analog-digital circuit of the cell were, respectively, recorded and formed signals about the facts of charge separation near the reading electrode.
- the values of the parameters of the aqueous solution of the reaction mixture such as: pH, solution temperature, nucleotide concentrations of all species that provide the desired rate of polymerization of the DNA fragment, are calculated, and then the values of these parameters are set for the working solutions before sequencing.
- the electric field at the interface reading the electrode - solution is determined by the superposition of the fields of the above charges: a negative charge of one electron localized on the active segment of the DNA fragment, and a positive charge of the drifting proton, and can be represented by:
- m r is the proton mobility in the electrolyte
- E is the intensity of the superposition of fields in the electrolyte near the reading electrode
- t is the current time
- e is the dielectric constant of the working solution
- q is the elementary charge
- e 0 is the vacuum dielectric constant.
- the time taken for the potential of the reading electrode to saturate is determined, which is determined by the proton drift velocity in the diffusion part of the double layer
- the average value of the electric field in this gap will be 5 V / cm (or 500 V / m). Then the proton drift time in the external field can be estimated as:
- the magnitude of the induced potential will be 4x10 4 V, and the output voltage of the electrometric amplifier will be equal to 14.5 xU 6 V. Note that in aqueous solution with a higher ionic strength, for the location of the location of the electron on the DNA fragment after the separation of charges in the diffusion part of the double layer, the distance between this place and the surface of the reading electrode will need to be reduced, which will lead to a larger amount of induced sweat tial for reading electrode capacity than 4x1 O 4 V.
- the specified dimensions of the reading electrode (gate of the transistor), the sensor design, the cell, the analog-digital circuit of the cell, the matrix of cells, the microchip of the matrix of cells of the sensors as a whole, can be realized by means of semiconductor industrial technologies, for example, the use of TSMC technology with technological standards for a transistor gate length of 28 nm or less.
- Example 3 Nanoscale sensor based on nanowire field effect transistor.
- a nanoscale sensor based on a nanowire field effect transistor is designed to record the results of the separation of a pair of charges near the sensor surface after each polymerase nucleotide incorporation into a polymerized DNA fragment. in the composition of the polymerase complex 44 immobilized to the surface of the nanowire.
- the block diagram of a nanowire transistor with an immobilized triple complex is shown in FIG. 16, and consists of a planar thin-film metal nanostructure deposited on a dielectric layer 49 covering the substrate 45;
- the thin-film metal electrode nanostructure 46 (contacts to the nanowire) together with the metal channel-nanowire 50 is formed on a dielectric substrate by photo- and electron lithography using photo- and electronic resist, etching technology of the exposed area and technology of metal sputtering by magnetron or thermal method.
- the control electrode can also serve as a conductive sublayer (for example, doped silicon) under the dielectric layer 49.
- the supply electrodes To eliminate the contact of the supply electrodes with the aqueous solution in the microfluid cell, they are covered with a thin layer of dielectric 51 applied through the mask. Also the numbers 44, 47, 48 show, respectively, the immobilized polymerase complex, the aqueous solution of the reaction mixture and the displacement electrode.
- the conductivity of the transistor channel depends on the electric field in which the nanowire (NP) is located. Local changes of a field of sufficient size can also change the conductivity of the nanowire, which makes it possible to register a local charge change in the nanowire using such a device, as well as to attach small charged particles to the nanowire surface.
- Nanowire transistor can be implemented on the basis of SOI technology.
- the SOI material (silicon on the insulator) is a monocrystalline silicon layer separated from the silicon substrate by a layer of silicon oxide. In this upper layer of silicon, nanostructures of various configurations are formed. With the use of SOI material, it is possible to make suspended NPs. At first, the NP structure is formed in the upper silicon layer by the lithographic method. Then the sample is placed in a solution of hydrofluoric acid, as a result of which the Si0 2 layer located under the NP is removed. In this case, wide areas of silicon serve as a mask for etching SiO 2 , and thin the wire is suspended due to the “subtrain” under it, due to the isotropy of the Si0 2 etching process.
- the dielectric layer of the SOI plate Due to the large area of the supply electrodes (several mm 2 ), the current leakage through the dielectric layer of the SOI plate became significant (more than 10 pA) and 5 to block it, the dielectric layer was thickened by two successive spraying of Si0 2 with a thickness of 200 nm over the entire chip surface with the exception of the central region 80x80 ⁇ m 2 with nanostructures (in Figs. 20 and 21, the boundary of the additional insulating layer is visible). As a result of the improvement carried out, the leakage from the substrate to the contact pads practically disappeared with applied voltages up to 10 V.
- the dielectric layer was thickened by the methods of photolithography and magnetron sputtering, a large-size part of the structure was formed containing Ti supply electrodes with a thickness of 100-160 nm.
- the bottom silicon layer (substrate) was used as the gate electrode of the field-effect transistor.
- FIG. 21 shows a view of the final 20 formed structures of nanowire transistors in the central area of the chip.
- the NP geometry in the transistor can be implemented in various forms, for example, in linear or in V shaped.
- the conductivity of a p-type semiconductor channel is determined by the expression: s * p P p o
- the sensitivity of the sensor can be characterized by a dimensionless parameter
- P p is the modulation of the hole concentration due to a change in potential.
- This parameter corresponds to the volume ratio between the part of the nanowire where the concentration is effectively modulated by the electric potential and the rest of the volume. It can be seen that it will be maximal when the Debye shielding length in a semiconductor is much larger than the radius of the nanowire lo »R. This parameter can be represented explicitly:
- Df corresponds to the change in potential in the nanowire, which is described by the function found and thus obtain an estimate of the maximum sensitivity of the sensor on a nanowire field-effect transistor.
- FIG. 17 shows the calculated electrical potential distribution for the case of a single particle carrying a unit charge.
- FIG. 17 b) shows a graph of equipotential lines; in the center of the closed circuits is a charged particle; the dotted line shows the nanowire boundary.
- R 50 nm.
- the potential distribution is represented along the axis connecting the center of the nanowire with the center of the charged particle, and is normalized to the value of the potential on the surface of the nanowire from the side of the particle.
- the design features of the device make it possible to significantly simplify the method of its manufacture, avoiding the laborious and complex processes of doping and annealing necessary for the formation of ohmic contacts to the silicon regions of the drain and source of the transistor.
- the capabilities of the SOI material used also make it possible to form a suspended channel-nanowire, partially removing the Si0 2 sublayer, which is the source of charge fluctuations that increase the intrinsic noise of the transistor.
- a transistor with a suspended nanowire channel will have greater sensitivity, both by reducing its own noise and by increasing the working surface of the nanowire.
- Individual nanowire transistors can be placed in an integrated structure, which is a chip with an array of nanowire transistors with an address bus that allows for individual measurement on each nanotransistor, as shown in FIG. nineteen.
- Example 4 A nanoscale sensor based on a single-electron transistor is designed to generate a signal from the result of the separation of a pair of charges in after polymerase incorporation of a nucleotide into a polymerized DNA fragment.
- a single-electron transistor is an electronic nanostructure consisting of two ultra-small series-connected tunnel junctions and C 2 , between which an electrode (island) is located, connected to the control electrode (gate) through the capacitor C 0 , as shown in FIG. 22
- the current-voltage characteristic of the transistor does not have a blocking section (dashed line).
- the process of correlated electron tunneling at voltages of the order of V 0ff and less characteristic is that electrons come and go from the island transistor one after the other. For this reason, the transistor is called one-electron.
- a single-electron transistor is characterized by very high sensitivity to changes in charge on the central island. Even a small change in the charge of the island dQ, which can be substantially less than the electron charge e, leads to a noticeable change in the dl current of the transistor (see Figure 26) and can be detected. This property of a single-electron transistor allows it to be used as a unique electrometer with sub-electronic sensitivity.
- Such a transistor can be created using a single molecule as a “island” of a single-electron transistor. This is the basis of modern molecular single-electronics.
- the minimum value of the noise level in a single-electron transistor, and, consequently, the maximum sensitivity, is achieved at a bias voltage V, slightly exceeding the threshold of the Coulomb blockade Voff.
- the minimum noise is a function of the magnitude of the measured charge Qx.
- the maximum sensitivity estimate of a single-electron transistor can be represented by the expression: where SI (O) is the spectral density of fluctuations of the tunneling current at low frequencies. The magnitude of the measured charge is determined by fluctuations in the number of tunnel events in each of the transitions of the transistor.
- the time of tunneling is proportional to 1 / R1 R2, and, accordingly, it decreases with increasing of the larger resistance. Note that on one of the slopes The modulation characteristic of an unbalanced transistor increases the value of the derivative dl / dQg, which leads to an increase in the output signal.
- the excess noise in a single-electron transistor is of a charge nature. It is shown that the level of output noise in a single-electron transistor depends on the position of the operating point (namely,
- the task of creating a molecular transistor is divided into two subtasks. The first is the creation of electrodes with a nanogap between them, which would allow to study objects of nanometer size. The second is the placement and fixation of a single molecule between such electrodes.
- Nano-gaps can be formed in various ways:
- electrochemical methods such as the deposition of metal in the region of the pre-formed gap or the creation of a gap by etching: electromigration,
- FIG. 25 is a schematic representation of a single-molecule transistor with suspended electrodes: M is a molecule deposited in a gap and fixed there using SH-rpynn.
- FIG. Figure 26 shows a photograph of a SOI structure with hanging electrodes above the substrate.
- FIG. Figure 27 shows a photograph of a nanostructure of a single-electron transistor with a nanospark obtained by electron-beam lithography.
- FIG. 28 shows a photograph of a nanospace obtained by electromigration (electro trapping).
- FIG. Figure 29 shows a photograph of a nanospark prepared by ion-beam lithography (FIB technology).
- FIG. 30 shows a photograph of a fabricated nanostructure of 16 cells for transistors with nano-gaps.
- FIG. Figure 31 shows a photograph of one of the 16 cells based on a transistor with a nanospark.
- FIG. 32 shows a photograph of the formed central electrode-island in the structure of a single-electron transistor made of a nanowire.
- FIG. 33 is a photograph of the formed nanogap to create a molecular single-electron transistor.
- FIG. 34 shows the current-voltage characteristic of a transistor structure with a nano-gap; the shape of the leakage current indicates that the nanospark is formed.
- Example 5 A nanoscale sensor with a scheme of stochastic resonance.
- a circuit that implements a stochastic resonance mode consisting of a semiconductor element (or a group of elements) having a transfer characteristic or voltage-current characteristic with a bistability region, including an offset circuit can be added to the chip array cell circuit. (setting the operating point) DC, including the source (generator) noise, including the formation of the output signal.
- the scheme of stochastic resonance is implemented by connecting a signal source, as well as an offset circuit.
- FIG. 15 An embodiment of a sensor cell that uses stochastic resonance to detect charge separation facts is shown in FIG. 15.
- the cell circuit contains a sensor field effect transistor, on the gate of which the polymerase molecule is immobilized, consisting of complex 38, bipolar transistor V1, as well as voltage sources U0 (offset voltage), 11pete (voltage supply of the sensor circuit) and UN (noise voltage).
- U0 offset voltage
- 11pete voltage supply of the sensor circuit
- UN noise voltage
- UBX is understood here as the potential difference between the common wire of the circuit and the gate of the field-effect transistor.
- the S-shaped transfer characteristic in this circuit is formed due to the presence of positive voltage feedback, realized by applying an amplified signal from the drain of the field-effect transistor (p + -stock in Fig. 15) to the base of the bipolar transistor V1 through the resistive divider circuit R5-R4, and an amplified signal to the source circuit of the field-effect transistor (p + -stock in Fig. 15) through a common resistor R3.
- the circuit parameters (type and characteristics of the transistor V1 and the ratings of the resistors R1-R5) are chosen so as to ensure the appearance of bistability on the transfer characteristic of the circuit [1].
- the input signal of the UBX circuit is defined as the sum of the noise signal UN and the signal, i.e. the potential induced on the gate of the field-effect transistor, as described in the “Detailed disclosure of the invention” section.
- the latter modulates the probability of finding the Schmitt trigger circuit between two stable states within the range of the bistability of the transfer characteristic.
- any device can be used that generates a noise voltage UN with the required characteristics.
- various schemes on shift registers can be considered, including those with analog-digital conversion at the output, noise generators on thermal or breakdown sources (the thermal noise of the current through the resistance or noise of the breakdown current is amplified reverse biased pn junction, etc.).
- Fig. 15 shows how, for these purposes, the signal 11out goes to the integrator (low frequency filter) Yi1, and then to the normalizing amplifier Yi2 and the comparator Yi3, from the output of which the generated pulses go to the D flip-flop Yi4. From the output of the D-flip-flop, the time-sampled digital signal DATA is fed to the corresponding data bus of the chip matrix for further transfer to the computer.
- the above sensor circuit based on stochastic resonance can be used similarly to the circuit in FIG. 14, in a two-channel version, which will allow to subtract from the signal the level of the background potential of the working mixture.
- Example 6 The formation of the primary signals and their conversion into the nucleotide sequence of the DNA fragment to be sequenced.
- FIG. 5 shows the main stages of the formation and transformation of data on the nucleotide sequence of a DNA fragment of the following composition: AACGTCTTCAGGGCTAGCACCAT.
- the analog-digital circuit of the cell forms a time sequence of discrete time intervals, each of which is indicated by a logical "1" unit and "0" by zero, and the logical unit "1" denotes those time intervals when the cell sensor registered the fact of separation of one pair of charges, accompanying polymerase nucleotide insertion into the polymerizable DNA fragment, and the corresponding signal is generated.
- cells will be sequentially formed by four time sequences, which (four above) are shown in FIG. 5A. It can be seen that in each time sequence, the number of discrete time intervals, denoted by the logical zero “0”, is different before each interval, indicated by the logical unit “1”; Conventionally, one can speak of short and long time intervals before nucleotide insertion.
- time sequences in real time are transmitted to a computer, in which special software reads, sums, compares, analyzes the lengths of time intervals before embedding each nucleotide, i.e. determines the number of discrete time intervals, denoted by a logical zero "0", before each time interval, indicated by the logical unit "1".
- a computer program compares data on the locations of nucleotides of known species in each of the four sequences of logical units "1" and zeros "0" with each other, and by the method of elimination, following the rule that in one position in the nucleotide sequence of the fragment DNA can be located only one nucleotide species
- Example 7 Block diagram of the matrix cell sensor cells.
- the block diagram of the chip array of sensor cells is presented in FIG. 10.
- the microcircuit is intended for use as part of a device that implements a single-molecule nucleic acid sequencing method.
- the chip array of sensor cells can consist, for example, of 16,000,000 sensor cells, which are organized into a matrix with the number of columns and rows 4000x4000, which is divided into four sections; a block diagram of the chip is presented in the figure below.
- the numbers 1, 2, 3, 4 in the circles indicate the outputs of the horizontal shift registers that output digital data from cells located, respectively, in sections I, II, III, IV. Numbers in rectangular
- the information output circuit from the matrix cells is functionally organized similarly to the information output circuit in a CCD with a row transfer of charge.
- the output state of the D-flip-flop of the digital circuit of each cell located in the matrix column is overwritten into a vertical shift register for transferring logical data (“or“ 0 ”) to a horizontal shift register, from which data via the USB interface goes to the computer.
- the microcircuit controller provides data exchange with a personal computer via USB interface, provides data analysis from each output cell array register, on the basis of which it controls the frequency of clock pulses and the voltage value ensuring the operation of the electrical circuitry of each cell of the matrix.
- the matrix circuit of the sensor cells receives a supply voltage of 5 V.
- the supply voltage can be supplied to the chip from an independent power source, for example, from a battery.
- a special driver is pre-installed on the computer, which ensures the coordination of the sensor matrix chip controller with the personal computer at the software level. This driver provides the primary setting of the parameters of the chip array of sensor cells, the operational management of work and the exchange of data between the chip and the computer. Due to the high data transfer rate, a high bandwidth interface is used, for example, USB2.0 (400 Mbps).
- Example 8 A numerical experiment to determine the quality of time delays before embedding nucleotides in DNA polymerization reactions in the sequencing process using the proposed method.
- the delay is the time that the polymerase awaits the approach of the complementary nucleotide to the copy site before it is inserted into the polymerized DNA fragment.
- the delay distribution for nucleotides of each species is shown in FIG. 7; on the X axis, the value of the delay in arbitrary units of time is noted, on the Y axis, the number of delays of the durations on the X axis obtained by numerical experiments. As can be seen from the figure: most of the delays are equal to zero for the case when the concentrations of nucleotides of each type in the reaction mixture are the same. If the concentration of nucleotides of one species in the reaction mixture is reduced against the normal concentration of nucleotides of other species, then numerical experiments will show the distribution shown in FIG. 8.
- FIG. 9 shows the results of calculations when the concentration of nucleotides of 4 types is the same in the reaction mixture.
- FIG. 9B shows the results of calculations when the concentration of nucleotides of type A is 10 times less than the normal concentration of nucleotides of 3 other species; this graph shows that the delay for nucleotides of the depleted species on average longer than for nucleotides of other species.
- the calculations were performed for an oligonucleotide, the nucleotide sequence of which is presented below.
- FIG. 9B it can be seen that a certain threshold value, for example, the number 15, will unambiguously separate the time delays for nucleotides of the depleted species and for nucleotides of the non-depleted species.
- the effect shown in FIG. 9A and 9B show the average delay times at each position of the DNA sequence after the K series of independent experiments.
- nucleotide sequence of the DNA fragment into which nucleotides of type A have been attached By averaging the data on the K experiments in depletion of the reaction mixture with nucleotides, for example, of type A, one can accurately determine the positions in the nucleotide sequence of the DNA fragment into which nucleotides of type A have been attached. nucleotide sequence of the same DNA fragment.
- the sequencing algorithm is based on the diffusion mechanism of nucleotide movement to the assembly site, where the polymerase inserts complementary nucleotides into the polymerized nucleic acid fragment, and on the hypothesis that the average ratio of the length of time intervals before nucleotide incorporation with a reduced concentration to the length of time intervals before nucleotide integration with a normal concentration will be the greater, the greater the difference in their concentrations.
- a mathematical model was developed and numerical experiments were conducted, the results of which confirmed the accuracy of the hypothesis.
- Numerical experiments on the recovery of the nucleotide DNA sequence were performed on the basis of two software modules: the module from Example 8, which was used to generate time delays before embedding each nucleotide during the polymerization reaction of the DNA fragment and the module that restores the original nucleotide sequence of the DNA fragment from these time values delays.
- the module for restoring the original nucleotide sequence of DNA processes statistically the results from several independent experiments.
- Tables 1, 2, 3 present statistically processed results from 2000 experiments on the calculation of the accuracy of reconstructing looped nucleotide sequences of DNA fragments in the form of a dumbbell: for matrix DNA fragments of 1000, 2000, 3000 and 5000 nucleotides connected by a “bridge” 25 nucleotides in length on each side of the “dumbbell”.
- the proposed sequencing algorithm does not require labels for nucleotides, since useful information is the length of time before each nucleotide is inserted.
- the sequencing algorithm is unique because, unlike most well-known sequencing algorithms, the procedure for generating a useful signal and the procedure for its identification, i.e. determining the name of the type of nucleotides to which this signal corresponds. Due to this property, the algorithm allows you to choose the accuracy of the sequencing result that is required. In this case, the more time is given for the sequencing procedure, the more accurate the result can be obtained. Depending on the problem being solved, at the sample preparation stage, conditions can be formed that will provide the desired sequencing result.
- the first column of Tables 1 and 2 shows the number of runs, i.e. cycles of complete polymerization of a DNA fragment
- the second column shows the number of experiments in which the nucleotide sequence was not restored with 100% accuracy.
- the third, fourth and fifth columns show the number of nucleotides, respectively, the minimum, maximum and average, which were not restored. in sequenced DNA fragments.
- the sixth column shows, averaged over 2000 experiments, the accuracy of the recovery of sequenced DNA fragments.
- the length of the fragment being sequenced depends on the polymerase processability and the sequencing device chosen: one matrix or four matrix ones.
- polymerase – DNA fragment complexes are immobilized on sensors on the surface of cells of the microcircuit matrix, in cells of which four reaction mixtures are alternately fed, differing by the fact that in each of them the concentration of nucleotides of only one type is lowered, and each time the other kind of.
- the above reaction mixtures are each fed to the surface of their chip matrix, in the cells of which, on the sensors, complexes with the clones of the original DNA fragments are immobilized; in this case, the same polymerase works in the same cell with only one reaction mixture and can also embed 80,000 nucleotides. In this case, you can sequence DNA fragments with a length of 10,000 nucleotides or more, again, depending on the desired accuracy.
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Clinical Laboratory Science (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Hematology (AREA)
- Dispersion Chemistry (AREA)
- Fluid Mechanics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Предложены способ и устройство для определения нуклеотидной последовательности. Способ включает иммобилизацию на поверхности сенсора закольцованных фрагментов нуклеиновой кислоты и полимеразы и добавление на поверхность сенсора смеси немеченых нуклеотидов. При этом в добавляемой смеси вид одного нуклеотида присутствует в значительно меньшей концентрации по сравнению с другими. Определяют временные интервалы между каждым фактом разделения зарядов и повторяют стадии добавления смеси и регистрации. При этом при каждом повторении вид нуклеотида, присутствующего в добавляемой смеси в значительно меньшей концентрации по сравнению с другими видами, изменяется. Нуклеотидную последовательность молекулы нуклеиновой кислоты определяют на основе анализа временных интервалов между каждым зарегистрированным фактом разделения зарядов, произошедшим в результате встраивания полимеразой указанных немеченых нуклеотидов в растушую цепь нуклеиновой кислоты. Устройство содержит матрицу с множеством ячеек сенсоров и аналого- цифровую схему, микрофлюидное устройство для обеспечения подачи рабочих растворов к сенсорам, устройство обработки и отображения данных.
Description
СПОСОБ БЕЗМЕТОЧНОГО ОДНОМОЛЕКУЛЯРНОГО СЕКВЕНИРОВАНИЯ
ДНК И УСТРОЙСТВО ДЛЯ ЕГО РЕАЛИЗАЦИИ
Область техники
Группа изобретений относится к области технологии определения нуклеотидной последовательности, или секвенирования, нуклеиновых кислот, а именно, ДНК или РНК. Раскрываемое изобретение может найти применение при генетической диагностике различных заболеваний человека и животных, а также в других областях прикладной или научной деятельности.
Уровень техники
В течение последних двух десятилетий были разработаны многие новые методы высокопродуктивного секвенирования нуклеиновых кислот и некоторые из них в настоящее время широко используются в медицинских, сельскохозяйственных задачах, в вопросах безопасности, идентификации личности, в пищевых и биотехнологиях. Эти методы относятся к трем основным группам технологий: (1) секвенирование методами лигирования (например, метод секвенирования SOLD, используемый Life Technologies / Thermo Fisher; метод секвенирования Combinatorial Probe-Anchor Ligation™ (cPAL™), используемый BGI/Complete Genomics); (2) секвенирование методами последовательного синтеза, включающее: (а) циклическое секвенирование, используемое как lllumina Inc., так и Qiagen Inc., (б) метод одномолекулярного виртуального терминирования в режиме реального времени, используемый Helicos BioSciences, (с) подход с поочередным однонуклеотидным присоединением, включая 454 пиросеквенирование с оптическим считыванием, используемый Roche Inc., и метод на основе ионно-чувствительного полевого транзистора с электронным считыванием, используемый Ion Torrent / ThermoFisher; (3) одномолекулярные методы секвенирования в режиме реального времени, позволяющие получать при прочтении длинные непрерывные последовательности нуклеиновых кислот (длинные риды) из одной реакции: (а) одномолекулярное секвенирование в реальном времени (SMRT), основанное на обнаружении нуклеотидов в волноводе размером меньше длины волны (ZMW) от Pacific Biosciences, которое использует нуклеотиды, меченые флуорофорами, и (б) безметочный метод секвенирования, использующий электронный способ считывания сигнала при прохождении фрагмента дезоксирибонуклеиновой кислоты (ДНК) через нанопору, используемый Oxford Nanopore Technologies. Первая (1) и вторая (2) группы технологий, упомянутые выше, в совокупности называются технологиями секвенирования второго поколения (SGS), а третья (3) группа - технологиями секвенирования третьего поколения (TGS).
Секвенирование с помощью методов лигирования (SOUD и cPAL) использует дорогостоящие меченые флуорофором зонды, их скорость секвенирования, а также длина считывания ограничена внутренними свойствами ДНК-лигаз. Методы секвенирования путем синтеза от lllumina и Qiagen быстрее и дают считывание длиной до 300 пар оснований (п.о.) по сравнению с секвенированием методами лигирования, но также зависят от дорогостоящих флуоресцентно меченных молекул, терминаторных нуклеотидов. Полупроводниковое секвенирование от Ion Torrent / Thermo Fisher в настоящее время является единственным коммерчески доступным методом безметочного секвенирования, но он по-прежнему полагается на циклы добавления одиночных нуклеотидов, в отличие от одномолекулярного секвенирования в реальном времени (SMRT-метода), движимого высокопроизводительной ДНК-полимеразой. Последний метод является единственным быстрым коммерческим методом секвенирования с длинными ридами в режиме реального времени. Недостатками метода SMRT являются использование меченых нуклеотидов и громоздкой дорогой оптики, высокая частота ошибок, высокая чувствительность к переносимым примесям, введенным при построении библиотеки, и значительно меньшая пропускная способность по сравнению, например, с методами lllumina, SOUD, Ion Torrent / Thermo Fisher и BGI/Complete Genomics. Эти недостатки метода SMRT приводят к высокой стоимости как инструмента, так и секвенируемой нуклеотидной последовательности.
Платформы секвенирования SGS, за исключением метода виртуального терминирования Helicos BioSciences, выполняют секвенирование кластеров (ансамблей клонированных амплифицированных с помощью ДНК-полимеразы молекул ДНК), тогда как технологии TGS непосредственно определяют нуклеотидную последовательность отдельных молекул. Кроме того, на платформах SGS используются технологии «промывка и сканирование» (например, lllumina) или «промывка и измерение» электрического сигнала (Ion Torrent), а платформы TGS - непрерывные технологии непрерывного последовательного управления, без необходимости останавливаться между шагами чтения. Секвенирование TGS происходит очень быстро, и скорость определяется скоростью синтеза полимеразы или скоростью перемещения ДНК через нанопору. Кроме того, технологии TGS не требуют предварительной амплификации ДНК (во время подготовки библиотеки или генерации кластеров), тем самым упрощая сложности, связанные с амплификацией (такие как возникновение ошибок и дискриминация фрагментов ДНК библиотеки с высоким содержанием GC и\или АТ). Длинные непрерывные последовательности нуклеиновых кислот, полученные методами TGS (длинные риды), значительно помогают в фазировании геномов и, таким образом, уменьшают потребность в дополнительных методах для сборки генома.
Несмотря на то, что технологии TGS обеспечивают короткий временной цикл обработки, их основным недостатком в конкурентной борьбе по сравнению с технологиями SGS является высокая частота ошибок, более низкий выход данных для одной ячейки секвенирования и высокая стоимость для каждой секвенированной последовательности. Для расширения биомедицинских применений TGS необходимо минимизировать количество ошибок, увеличить производительность секвенирования, снизить стоимость. Настоящее описание представляет способы, устройства и их композиции для низкозатратного, высокопроизводительного, безметочного одномолекулярного секвенирования в реальном времени с электронным считыванием. Эти способы представляют собой новую технологию секвенирования нуклеиновых кислот и могут использоваться в различных биомедицинских, сельскохозяйственных и биологических целях.
Определения и термины
Для лучшего понимания настоящего изобретения ниже приведены некоторые термины, примененные в настоящем описании изобретения.
В описании данного изобретения слова «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные слова далее по тексту, за исключением специально оговариваемых случаев, не предназначены для того, чтобы их истолковывали как «состоит только из».
Под нуклеотидом в описании данного изобретения следует понимать, в зависимости от варианта реализации, как рибонуклеотиды, например, аденозинтрифосфат, гуанозинтрифосфат, цитидинтрифосфат и уридинтрифосфат, обозначаемые ATP, GTP, СТР, UTP), так и дезоксирибонуклеотиды, например, дезоксиаденозинтрифосфат, дезоксигуанозинтрифосфат, дезоксицитидинтрифосфат и дезокситимидинтрифосфат (dATP, dGTP, dCTP, dTTP). В предпочтительных вариантах изобретения используются нуклеотиды, не содержащие меток и модификаций.
Под реакционной смесью понимается водный раствор, содержащий все необходимые вещества для обеспечения выполнения реакции полимеризации одноцепочечных фрагментов ДНК, находящихся в составе комплекса «полимераза- фрагмент ДНК», иммобилизованного на поверхности сенсора ячейки матрицы микросхемы.
Под разделением зарядов, происходящим в результате встраивания полимеразой нуклеотида в растущую цепь нуклеиновой кислоты, следует понимать разделение одной пары зарядов (присоединение электрона к растущей цепи нуклеиновой кислоты и выделение иона водорода в раствор), которое объективно происходит всякий раз, когда происходит встраивание нуклеотида в полимеризуемый фрагмент ДНК или РНК.
Сенсором называется электронное устройство, одна или несколько электрических характеристик которого модулируются в результате образования одной пары несвязанных зарядов, происходящего в непосредственной близости от поверхности сенсора, в результате встраивания полимеразой нуклеотида в полимеризуемый фрагмент ДНК.
Ячейкой называется электронное устройство, включающее в себя сенсор и аналого-цифровую схему, которая в каждый дискретный интервал времени преобразует значение модулируемой характеристики сенсора в логический «0» или «1 » в зависимости от ее величины.
Матрицей ячеек сенсоров называется упорядоченный массив из ячеек, организованный в виде строк и столбцов, как правило, в форме квадрата или прямоугольника, содержащей вертикальные и горизонтальные сдвиговые регистры, обеспечивающие вывод цифровых данных от каждой ячейки матрицы за ее границы, для последующей, например, компьютерной обработки.
Микросхемой матрицы ячеек сенсоров называется совокупность матрицы ячеек сенсоров и аналого-цифровой схемы, включающей в себя генератор тактовых импульсов, источник опорного напряжения, контроллер управления режимами работы ячеек, обеспечивающей функционирование ячеек и регистров матрицы и изготовленных в одном технологическом цикле.
Электродом смещения называется металлический проводник той или иной формы, например, в форме решетки, тем или иным способом закрепленный на крышке микросхемы (изготовленной из токонепроводящего материала), в рабочем состоянии находящийся в рабочем растворе, гальванически связанный с источником опорного напряжения микросхемы, обеспечивающий разницей потенциалов с электродом каждой ячейки матрицы наличие электрического поля в растворе, которое способствует скорейшему удалению иона водорода от места разделения пары зарядов при встраивании полимеразой нуклеотида в полимеризуемый фрагмент ДНК.
Циклограммой в настоящем изобретении названа последовательность дискретных интервалов времени, в которой логической единицей “ обозначены те дискретные интервалы времени, в течении которых аналого-цифровой схемой ячейки были зарегистрированы факты разделения зарядов в результате встраивания полимеразой нуклеотидов, а логическими нулями “0” обозначены дискретные интервалы времени, когда таких фактов зарегистрировано не было. Дискретным интервалом времени назван период тактовых импульсов, обеспечивающих работу аналого-цифровой схемы ячейки.
Процессивность (англ processivity)— это способность фермента осуществлять последовательность химических реакций, без высвобождения субстрата. В случае
полимеразы процессивность это среднее число нуклеотидов, добавляемое ферментом к растущей цепи за одно связывание с поверхностью матрицы микросхемы.
Если не определено отдельно, технические и научные термины в данной заявке имеют стандартные значения, общепринятые в научной и технической литературе.
Сущность изобретения
Задачей настоящего изобретения является создание быстрого, высокоточного и недорогого метода определения нуклеотидной последовательности, или секвенирования, нуклеиновых кислот. В настоящем изобретении указанная задача решается путем реализации нескольких технических решений. Реализуются совместно три основных положения, позволяющие обеспечить технический результат: (1) минимум манипуляций с реагентами и ДНК, которые участвуют в биохимической реакции; (2) регистрация электронным сенсором полезного сигнала о фактах разделения одной пары зарядов, которые происходят в результате встраивания полимеразой ДНК каждого нуклеотида в растущую цепь ДНК; (3) оригинальный алгоритм секвенирования, который позволяет разделить во времени процедуру формирования полезных сигналов и процедуру формирования целевой информации, как результат обработки полезных сигналов, - что позволяет отказаться от меток для нуклеотидов.
Указанная задача решается путем создания способа определения нуклеотидной последовательности молекулы нуклеиновой кислоты, включающего по меньшей мере следующие стадии:
(а) получение образца нуклеиновой кислоты, представляющего собой множество закольцованных фрагментов нуклеиновой кислоты; (б) иммобилизация на твердой поверхности комплексов, состоящих по меньшей мере из указанных закольцованных фрагментов нуклеиновой кислоты и полимеразы, имеющей сродство к нуклеиновой кислоте, где твердая поверхность представляет собой поверхность сенсора, а иммобилизация сохраняет функциональность полимеразы и обеспечивает нахождение полимеразы вблизи поверхности сенсора в течение всего процесса определения нуклеотидной последовательности; (в) обеспечение условий для функциональной активности указанной полимеразы, заключающейся в катализе присоединения нуклеотидов к растущей цепи нуклеиновой кислоты, где условия для функциональной активности полимеразы включают: добавление на поверхность сенсора смеси двух или более видов немеченых дезоксирибонуклеотидов, выбранных из группы, состоящей из дезоксиаденозинтрифосфата, дезоксигуанозинтрифосфата, дезоксицитидинтрифосфата и дезокситимидинтрифосфата, или добавление на поверхность сенсора смеси двух или более видов немеченых рибонуклеотидов, выбранных из группы, состоящей из аденозинтрифосфата, гуанозинтрифосфата, цитидинтрифосфата и уридинтрифосфата, при этом в указанной смеси нуклеотид одного вида присутствует в значительно меньшей
концентрации, чем нуклеотиды других видов; (г) регистрация сенсором факта разделения зарядов, происходящего в результате встраивания полимеразой нуклеотида в растущую цепь нуклеиновой кислоты, и определение временных интервалов между каждым последующим зарегистрированным фактом разделения зарядов; (д) по меньшей мере однократное повторение стадий (в) и (г), при этом при каждом повторении вид нуклеотида, присутствующего в добавляемой смеси нуклеотидов в значительно меньшей концентрации по сравнению с другими видами, изменяется; (е) определение нуклеотидной последовательности указанной молекулы нуклеиновой кислоты, основанное на анализе определенных на стадиях (г) и (д) временных интервалов между каждым зарегистрированным фактом разделения зарядов, где разделения зарядов произошли в результате встраивания полимеразой указанных немеченых нуклеотидов в растущую цепь нуклеиновой кислоты.
Некоторые варианты изобретения включают в себя описанный выше способ, в котором указанные в (а) закольцованные фрагменты нуклеиновой кислоты имеют по меньшей мере один одноцепочечный участок (см. Фиг. 1А и 1Б); указанные в (б и в) комплексы, дополнительно включают секвенирующий праймер, имеющий нуклеотидную последовательность, комплементарную указанному одноцепочечному участку; и условия для функциональной активности полимеразы дополнительно включают условия, обеспечивающие образование дуплекса секвенирующего праймера с комплементарным участком указанного закольцованного одноцепочечного фрагмента дезоксирибонуклеиновой кислоты (см. Фиг. 1А и 1Б).
В некоторых вариантах изобретения указанные в (а) закольцованные фрагменты не имеют одноцепочечных участков способных образовать дуплекс с секвенирующим праймером (см. Фиг. 1В), поэтому указанные в (б и в) комплексы не включают секвенирующий праймер (см. Фиг. 1В); а синтез ДНК инициируется полимеразой с искусственно созданного свободного 3’ конца в одной из цепей двухцепочечного закольцованного фрагмента.
Некоторые варианты изобретения включают в себя описанный выше способ, в котором нуклеиновой кислотой является ДНК; полимеразой, имеющей сродство к нуклеиновой кислоте, является ДНК полимераза, и нуклеотидами, добавляемыми на стадиях (в) и (д), являются дезоксиаденозинтрифосфат, дезоксигуанозинтрифосфат, дезоксицитидинтрифосфат или дезокситимидинтрифосфат. ДНК полимераза, пригодная для осуществления способа, включает по меньшей мере следующие ферменты: полимераза Phi29, большой фрагмент Bst ДНК полимеразы, полимераза VentR™, большой фрагмент Bsm ДНК полимеразы, Klenow фрагмент ДНК полимеразы I. Другие варианты изобретения включают в себя описанный выше способ, в котором полимеразой, имеющей сродство к нуклеиновой кислоте, является РНК полимераза; и нуклеотидами,
добавляемыми на стадиях (в) и (д), являются аденозинтрифосфат, гуанозинтрифосфат, цитидинтрифосфат и/или уридинтрифосфат.
В некоторых предпочтительных вариантах изобретения в описанном выше способе на стадиях (в) и (д) происходит обеспечение четырех различных условий для функциональной активности полимеразы, а именно, добавление четырех различных смесей дезоксинуклеозидтрифосфатов на поверхность сенсора; при этом каждое из четырех различных условий для функциональной активности полимеразы присутствует непрерывно в течение интервала времени, достаточного для синтеза по меньшей мере одной копии закольцованного фрагмента ДНК, или по меньшей мере пяти копий закольцованного фрагмента ДНК. В этом случае анализ последовательности временных интервалов, используемый для определения нуклеотидной последовательности указанной молекулы нуклеиновой кислоты, включает по меньшей мере три этапа:
1) полученные последовательности временных интервалов между каждыми зарегистрированными фактами разделения зарядов, произошедшими в результате встраивания полимеразой немеченых нуклеотидов в растущую цепь нуклеиновой кислоты, преобразуют в форму последовательностей логических нулей и единиц, причем в каждой такой последовательности логической единицей обозначены факты встраивания нуклеотидов того вида, концентрация которого была известна и понижена в соответствующей этой последовательности реакционной смеси, а логическими нулями обозначены нуклеотиды видов, концентрация которых была нормальной в той же реакционной смеси;
2) формируют нуклеотидные последовательности фрагментов нуклеиновой кислоты из четырех последовательностей логических нулей и единиц, полученных после первого этапа преобразования данных для каждого фрагмента нуклеиновой кислоты;
3) нуклеотидные последовательности фрагментов нуклеиновых кислот преобразуют в определяемую нуклеотидную последовательность указанной молекулы нуклеиновой кислоты.
В других предпочтительных вариантах изобретения в описанном выше способе на стадиях (в) и (д) происходит одновременное использование четырех различных условий для функциональной активности полимеразы, включающее: (i) наличие четырех пространственно разнесенных матриц ячеек, содержащих указанные сенсоры; и (ii) параллельное добавление четырех различных смесей дезоксинуклеозидтрифосфатов на поверхность сенсоров, находящихся в четырёх пространственно разнесенных матрицах ячеек сенсоров. В этом случае анализ последовательности временных интервалов, используемый для определения нуклеотидной последовательности указанной молекулы нуклеиновой кислоты, включает по меньшей мере четыре этапа:
1) полученные от сенсоров ячеек четырех матриц последовательности временных интервалов между каждыми зарегистрированными фактами разделения зарядов, произошедшими в результате встраивания полимеразой немеченых нуклеотидов в растущую цепь нуклеиновой кислоты, преобразуют в форму последовательностей логических нулей и единиц, причем логической единицей обозначены нуклеотиды того вида, концентрация которого была известна и понижена в реакционной смеси, а логическими нулями обозначены нуклеотиды видов, концентрация которых была нормальной в той же реакционной смеси над поверхностью той матрицы, от ячеек которой преобразуются выходные последовательности;
2) уменьшают количества последовательностей логических нулей и единиц до количества фрагментов, полученных после фрагментации исходной нуклеиновой кислоты, посредством операций сортировки, сравнения, выбора и усреднения одинаковых с определенной вероятностью последовательностей логических нулей и единиц, полученных от клонов одного фрагмента, иммобилизованных в составе комплексов на поверхности сенсоров ячеек одной матрицы, в одну последовательность логических нулей и единиц;
3) формируют нуклеотидные последовательности фрагментов нуклеиновой кислоты из четырех полученных последовательностей логических нулей и единиц,
4) нуклеотидные последовательности фрагментов нуклеиновых кислот преобразуют в определяемую нуклеотидную последовательность указанной молекулы нуклеиновой кислоты.
Указанная задача также решается путем создания устройства, реализующего тот или иной вариант способа одномолекулярного, безметочного секвенирования нуклеиновых кислот, описанный выше. Устройство для определения нуклеотидной последовательности молекулы нуклеиновой кислоты содержит: 1) по меньшей мере одну микросхему матрицы ячеек сенсоров, включающую матрицу с множеством ячеек сенсоров и аналого-цифровую схему; 2) микрофлюидное устройство для обеспечения подачи рабочих растворов к сенсорам ячеек матрицы микросхемы; 3) устройство обработки и отображения данных для управления режимами работы микрофлюидного устройства и микросхемы матрицы ячеек сенсоров для преобразования данных выходных последовательностей ячеек матрицы в нуклеотидную последовательность указанной молекулы нуклеиновой кислоты. В некоторых предпочтительных вариантах изобретения устройство характеризуется тем, что 1) каждая ячейка матрицы включает: сенсор, поверхность которого пригодна для иммобилизации полимеразного комплекса, регистрирующий факты разделения одной пары зарядов в водном растворе, происходящие в результате встраивания полимеразой каждого нуклеотида в полимеризуемый фрагмент ДНК комплекса, и формирующий сигналы, соответствующие
зарегистрированным фактам разделения пар зарядов; аналого-цифровую схему ячейки для формирования выходных последовательностей дискретных интервалов времени соответствующих сигналам сенсора; и 2) аналого-цифровая схема микросхемы матрицы ячеек сенсоров включает: схему формирования токов, напряжений и тактовых частот, необходимых для работы аналого-цифровых схем ячеек матрицы; схему передачи выходных последовательностей ячеек матрицы в устройство обработки и отображения данных; схему дешифрирования данных, полученных от устройства обработки и отображения данных.
Твердая поверхность, пригодная для иммобилизации полимеразного комплекса, представляет собой поверхность сенсора, модифицированная для возможности иммобилизации полимеразного комплекса. Функциональные варианты модификации поверхности сенсора будут рассмотрены ниже. Аналого-цифровая схема микросхемы матрицы ячеек сенсоров выполнена с возможностью формирования токов, напряжений и тактовых частот, необходимых для работы аналого-цифровых схем ячеек матрицы, управления передачей выходных последовательностей ячеек матрицы в устройство обработки и отображения данных. Устройство также содержит микрофлюидное устройство для обеспечения подачи рабочих растворов к сенсорам ячеек матрицы микросхемы, устройство управления микрофлюидным устройством, микросхемой матрицы ячеек сенсоров, передачей данных от микросхемы к устройству обработки и отображения данных и устройство обработки и отображения данных для управления режимами работы микрофлюидного устройства, микросхемы матрицы ячеек сенсоров, для преобразования данных выходных последовательностей ячеек матрицы в нуклеотидную последовательность молекулы нуклеиновой кислоты.
Некоторые варианты изобретения подразумевают, что каждый дискретный интервал времени в выходных последовательностях обозначен логическими нулем или единицей, причем логической единицей обозначен тот интервал времени, в котором сенсором ячейки был зарегистрирован факт разделения пары зарядов в результате реакции.
В некоторых вариантах изобретения устройство дополнительно включает устройство поддержания температуры рабочего раствора над поверхностью матрицы микросхемы, управляемое устройством обработки и отображения данных.
В разных вариантах изобретения сенсор может быть выполнен в виде нанопроводного полевого транзистора, одноэлектронного транзистора, диода, полевого транзистора, или полупроводниковой структуры (электронной схемы) с S-образной или N- образной вольтамперной или передаточной характеристиками.
Некоторые варианты изобретения включают в себя последовательный способ секвенирования, при котором устройство секвенирования содержит только одну микросхему матрицы ячеек сенсоров, а реакционные смеси подаются поочередно на поверхность матрицы микросхемы. При этом устройство обработки и отображения данных преобразует данные выходных последовательностей от ячеек матрицы микросхемы в нуклеотидную последовательность молекулы нуклеиновой кислоты в три последовательных этапа.
На первом этапе данные выходных последовательностей, полученные от ячеек матрицы микросхемы последовательно преобразуются в форму последовательностей логических нулей и единиц, причем логической единицей обозначены факты встраивания нуклеотидов вида, концентрация которого была известна и понижена в соответствующей реакционной смеси, а логическими нулями обозначены нуклеотиды видов, концентрация которых была нормальной в той же смеси реакции; на втором этапе формируются нуклеотидные последовательности фрагментов нуклеиновой кислоты из четырех последовательностей логических нулей и единиц, полученных после первого этапа преобразования данных с одной и той же ячейки матрицы микросхемы; на третьем этапе нуклеотидные последовательности фрагментов нуклеиновых кислот могут быть преобразованы в нуклеотидные последовательности нуклеиновых кислот.
Некоторые варианты изобретения включают в себя параллельный способ секвенирования, при котором устройство секвенирования содержит четыре микросхемы матрицы ячеек сенсоров, а реакционные смеси подаются одновременно, асинхронно на поверхность матрицы каждой микросхемы. При этом устройство обработки и отображения преобразует данные выходных последовательностей, полученные ото всех ячеек всех матриц микросхем, в нуклеотидную последовательность молекулы нуклеиновой кислоты в четыре последовательных этапа.
На первом этапе данные выходных последовательностей, полученные от ячеек матриц четырех микросхем, преобразуются в форму последовательностей логических нулей и единиц, причем логической единицей обозначены нуклеотиды того вида, концентрация которого была известна и понижена в реакционной смеси, а логическими нулями обозначены нуклеотиды видов, концентрация которых была нормальной в той же реакционной смеси над поверхностью матрицы той микросхемы, от ячеек которой преобразуются выходные последовательности; на на втором этапе производится уменьшение количества последовательностей логических нулей и единиц до количества фрагментов, полученных после фрагментации исходной нуклеиновой кислоты, посредством операций сортировки, сравнения, выбора и усреднения одинаковых с определенной вероятностью последовательностей логических нулей и
единиц, полученных от клонов одного фрагмента, иммобилизованных в составе комплексов на поверхности сенсоров ячеек матрицы одной микросхемы, - в одну последовательность логических нулей и единиц; на третьем этапе формируются нуклеотидные последовательности фрагментов нуклеиновой кислоты из четырех последовательностей логических нулей и единиц, взятых по одной от каждой из четырех микросхем; на четвертом этапе нуклеотидные последовательности фрагментов нуклеиновых кислот могут быть преобразованы в нуклеотидные последовательности нуклеиновых кислот.
Некоторые варианты изобретения включают в себя комбинированный способ секвенирования, при котором устройство секвенирования содержит две или три микросхемы матрицы ячеек сенсоров, и часть реакционных смесей подаются одновременно, асинхронно на поверхность матрицы каждой микросхемы, а оставшаяся часть реакционных смесей подается последовательно с первоначально поданной частью реакционных смесей.
В предпочтительных вариантах изобретения в реакционных смесях применяется пониженная концентрация нуклеотидов одного вида, против нормальной концентрации нуклеотидов трех других видов в реакционной смеси (суть способа секвенирования не изменится, если реакционная смесь содержит нуклеотиды одного вида, концентрация которых нормальна и нуклеотиды трех других видов, концентрация которых понижена; или, если реакционная смесь содержит нуклеотиды одного вида, концентрация которых повышена и нуклеотиды трех других видов, концентрация которых нормальна, и т.п.).
В предпочтительных вариантах изобретения для целей медицинской диагностики применяется последовательный способ секвенирования, как не требующий обязательной амплификации нуклеиновой кислоты, взятой для секвенирования.
При осуществлении изобретения достигаются следующие технические результаты: предложенное устройство одномолекулярного безметочного секвенирования обеспечивает повышение точности секвенирования нуклеиновых кислот по сравнению с существующими устройствами секвенирования за счет многократной полимеризации закольцованного фрагмента ДНК комплекса в одной и той же реакционной смеси, что обеспечивает возможность усреднения длительности интервалов времени перед встраиванием каждого нуклеотида в закольцованном фрагменте ДНК комплекса и повышает вероятность правильного определения мест расположения на фрагменте ДНК нуклеотидов вида, концентрация которого понижена в этой реакционной смеси;
предложенное устройство одномолекулярного безметочного секвенирования обеспечивает повышенную производительность секвенирования за счет возможности использования способа секвенирования синтезом (SBS) с предельно возможным темпом
полимеризации фрагмента ДНК (получение ресеквенированного генома человека менее, чем за 12 часов);
предложенное устройство одномолекулярного безметочного секвенирования обеспечивает более низкую стоимость устройства и результата секвенирования по сравнению с другими устройствами секвенирования (менее $1000 за ресеквенированный геном человека), за счет отсутствия дорогостоящих меток для нуклеотидов, низкого расхода реагентов, невысокой стоимости микросхемы матрицы ячеек сенсоров, изготовленной на основе промышленной полупроводниковой технологии.
Краткое описание чертежей
Прилагаемые чертежи, которые включены в состав настоящего описания и являются его частью, иллюстрируют варианты осуществления изобретения и совместно с вышеприведенным общим описанием изобретения и нижеприведенным подробным описанием вариантов осуществления служат для пояснения принципов настоящего изобретения.
На фиг.1 представлено схематическое изображение вариантов закольцованных фрагментов ДНК и соответствующих сформированных комплексов этих фрагментов с полимеразой. (А) одноцепочечное кольцо ДНК; (Б) гантелеобразная кольцевая ДНК; (В) двухцепочечное кольцо ДНК в котором одна цепь ковалентно-замкнута, а вторая - нет.
На фиг. 2 изображена схема возможного варианта метода пробоподготовки.
На фиг.З представлено схематическое изображение последовательности шагов процедуры секвенирования в предпочтительных вариантах изобретения. (А) Последовательная процедура секвенирования: последовательное добавление четырех реакционных смесей нуклеозидтрифосфатов, причем каждая из смесей имеет один вид нуклеозидтрифосфатов, молекулы которого находятся в концентрации, ограничивающей темп синтеза; (Б) Параллельная процедура секвенирования: включающая предварительное разделение комплексов на четыре части, их иммобилизацию на поверхности сенсоров ячеек матриц четырех микросхем, с последующим асинхронным добавлением по одной из четырех различных реакционных смесей нуклеозидтрифосфатов на поверхности ячеек матрицы каждой из четырех микросхем.
На фиг. 4 схематически изображен вариант процедуры иммобилизации на поверхность сенсора единичного полимеразного комплекса, начало и остановка полимеризации закольцованного фрагмента нуклеиновой кислоты..
На фиг. 5А для одноматричного, последовательного устройства секвенирования представлены временные последовательности дискретных интервалов времени, сформированных схемой ячейки матрицы микросхемы в результате полимеризации одного и того же фрагмента ДНК в составе комплекса последовательно, в четырех реакционных смесях, в каждой из которых понижена концентрация нуклеотидов только
одного вида, имя которого написано более мелким шрифтом около оси Y; логической единицей “1” отмечены интервалы времени, в которых сенсором ячейки были зарегистрированы факты разделения пары зарядов в результате реакции.
На фиг. 5Б представлена схема формирования результирующей нуклеотидной последовательности фрагмента из 4-х последовательностей, каждая из которых получена на предыдущем шаге обработки данных (см. фиг. 5А).
На фиг. 6 А показано изображение, полученное на флюоресцентном микроскопе Zeiss Axiovert, продуктов реакции синтеза ДНК, полученных путем механизма «репликации катящегося кольца» Phi29 полимеразами, которые иммобилизованы в составе тройных комплексов на подготовленной поверхности покровного стекла; продукты реакции синтеза ДНК окрашены ДНК интеркаляторным красителем GelStar Stain. Продемонстрирована способность ДНК полимеразы Phi29, иммобилизованной на твердую поверхность, осуществлять синтез ДНК с кольцевой матрицы.
На фиг. 6 Б показано изображение, полученное на флюоресцентном микроскопе Zeiss Axiovert, на котором видны немногочисленные продукты реакции синтеза ДНК, полученные только от тех тройных комплексов, которые неспецифически иммобилизовались на PEG-биотин поверхность покровного стекла.
На фиг. 7 показано распределение временных задержек для каждого вида нуклеотидов. По оси X - величина задержки в условных единицах времени, по оси Y - количество задержек определенных на оси X длительностей, полученных численными экспериментами. Представлена ситуация, когда концентрации каждого из видов нуклеотидов в реакционной смеси одинаковы.
На фиг.8 показано распределение временных задержек для каждого вида нуклеотидов (по оси X - величина задержки в условных единицах времени, по оси Y - количество задержек определенных на оси X длительностей) при условии уменьшения в 100 раз концентрации нуклеотидов одного вида, - нуклеотидов вида А в реакционной смеси.
На фиг. 9А показано распределение среднего значения времени задержки для случая, когда концентрации каждого из видов нуклеотидов в растворе одинаковы (по оси X - номер задержки, по оси Y - среднее значение задержки в условных единицах времени, рассчитанное для текущего номера задержки).
На фиг. 9Б показано распределение среднего значения времени задержки для каждого вида нуклеотидов при условии уменьшения в 10 раз концентрации нуклеотидов одного вида, - нуклеотидов вида А в реакционной смеси (по оси X - номер задержки, по оси Y - среднее значение задержки в условных единицах времени, рассчитанное для текущего номера задержки).
На фиг.10 представлена структурная схема микросхемы матрицы ячеек сенсоров в одном из вариантов изобретения. Числами римскими I, II, III, IV - обозначены секции матрицы ячеек сенсоров, каждая, например, размером 2000x2000 ячеек; числами 1, 2, 3, 4 в кружочках обозначены выходы горизонтальных сдвиговых регистров, выводящих цифровые данные из ячеек, расположенных, соответственно, в секциях I, II, III, IV. Числами в прямоугольных (квадратных) формах обозначены: 1 - ячейка сенсоров; 2 - вертикальный сдвиговый регистр переноса цифровых данных из ячеек сенсоров секции матрицы, расположенных в один ряд; 3 - USB интерфейс передачи данных между компьютером и микросхемой: 4 - горизонтальный сдвиговый регистр переноса цифровых данных из вертикальных сдвиговых регистров одной секции матрицы ячеек сенсоров; 5 - электрод смещения, потенциал на котором устанавливается источником напряжения, который регулируется контроллером; 6 - разъем между источником напряжения микросхемы и электродом смещения, который расположен на крышке микросхемы; 7 - контроллер управления режимами работы микросхемы; 8 - регулируемый генератор тактовой частоты, к которому извне микросхемы подсоединяется кварцевый резонатор; 9 - регулируемый источник вторичного питания.
На фиг. 11 изображена структурная схема четырехматричного устройства, реализующего один из вариантов одномолекулярного, безметочного способа секвенирования нуклеиновых кислот. Микросхема матрицы ячеек сенсоров с крышкой микрофлюидного устройства является основным компонентом устройства одномолекулярного секвенирования 12, микрофлюидное устройство включает в себя четыре бака малого объема 10 для размещения в них четырех водных растворов с реакционными смесями; три бака большого объема 11 для размещения в них, соответственно, буферного раствора, комплексов, например, «полимераза-фрагмент ДНК-праймер», отработанных растворов; насос 13 с электрическим приводом, для каждой микросхемы 12 устройства секвенирования; отсечные клапаны 14 с электрическим приводом, обеспечивающие возможность раздельной подачи буферного раствора, раствора с веществами для иммобилизации комплексов, раствора с реакционной смесью на поверхность матрицы микросхемы 12; электроды 15 для измерения проводимости раствора на выходном патрубке каждой крышки микросхемы 12; элемент Пельтье 16 (входящий в состав устройства поддержания температуры рабочего раствора) для каждой микросхемы 12 устройства секвенирования; микрофлюидное устройство и каждая микросхема 12 устройства секвенирования работают под управлением контроллера 17 и устройства обработки и отображения данных (компьютера) 18. Функции контроллера 17 могут быть реализованы внутри микросхемы 12.
На фиг.12. изображена структурная схема сенсора ячейки матрицы с иммобилизованным на его поверхность тройным комплексом. Комплекс “полимераза-
праймер-фрагмент ДНК”, иммобилизованный на поверхности сенсора, обозначен числом
19, подложка из кремния p-типа в которой изготовлен сенсор, аналого-цифровая схема ячейки, матрица ячеек, аналого-цифровая схема микросхемы и т.д., обозначена числом
20, числом 21 обозначены слои изолирующего диэлектрика (например, диоксида кремния Si02), числом 22 обозначен водный раствор реакционной смеси, обеспечивающая проведение реакции полимеризации фрагмента ДНК, числом 23 обозначен электрод смещения, пассивирующим изолирующим слоем 24 защищена от раствора вся поверхность ячейки за исключением поверхности сенсора.
На фиг. 13 изображена структурная схема сенсора ячейки матрицы, изготовленной по стандартной КМОП технологии, с иммобилизованным на его поверхность тройным комплексом. Комплекс “полимераза-праймер-фрагмент ДНК”, иммобилизованный на поверхности сенсора, обозначен числом 25, подложка из кремния p-типа в которой изготовлен сенсор, аналого-цифровая схема ячейки, матрица ячеек, аналого-цифровая схема микросхемы и т.д., обозначена числом 26, числом 30 обозначены слои изолирующего диэлектрика (например, диоксида кремния Si02), числом 28 обозначен водный раствор реакционной смеси, обеспечивающая проведение реакции полимеризации фрагмента ДНК, числом 29 обозначен электрод смещения, пассивирующим изолирующим слоем 27 защищена от раствора вся поверхность ячейки за исключением поверхности сенсора.
На фиг. 14 представлена структурная схема двух сенсоров ячейки матрицы: с иммобилизованным на подготовленную поверхность сенсора тройным полимеразным комплексом 31, и с поверхностью сенсора 37, защищенной от специфического связывания с комплексом, и аналого-цифровая структурная схемы ячейки. Числом 32 обозначена подложка из кремния p-типа, в которой изготовлен сенсор, аналого-цифровая схема ячейки, матрица ячеек, аналого-цифровая схема микросхемы и т.д., числом 36 обозначены слои изолирующего диэлектрика (например, диоксида кремния Si02), числом 34 обозначен водный раствор реакционной смеси, обеспечивающий проведение реакции полимеризации фрагмента ДНК, числом 35 обозначен электрод смещения; пассивирующим изолирующим слоем 33 защищена от раствора вся поверхность ячейки за исключением поверхности двух сенсоров.
На фиг.15 изображены структуры сенсора и аналого-цифровой схемы ячейки, использующей явление стохастического резонанса для регистрации сформированного сенсором сигнала от результата разделения пары зарядов в результате встраивания полимеразой нуклеотида в полимеризуемый фрагмент ДНК. Числом 38 показан комплекс “полимераза-праймер-фрагмент ДНК”, иммобилизованный на поверхности сенсора, подложка из кремния p-типа в которой изготовлен сенсор, аналого-цифровая схема ячейки, матрица ячеек, аналого-цифровая схема микросхемы и т.д., обозначена числом
39, числом 40 обозначены слои изолирующего диэлектрика (например, диоксида кремния
Si02), числом 41 обозначен водный раствор реакционной смеси, обеспечивающая проведение реакции полимеризации фрагмента ДНК, числом 42 обозначен электрод смещения, пассивирующим изолирующим слоем 43 защищена от раствора вся поверхность ячейки за исключением поверхности сенсора. В Примере 5 приведено описание применения явления стохастического резонанса указанной схемой ячейки.
На Фиг.16 представлена структурная схема нанопроводного транзистора с иммобилизованным тройным комплексом, которая состоит из планарной тонкопленочной металлической наноструктуры, нанесенной на слой диэлектрика 49, покрывающий подложку 45; тонкопленочная металлическая электродная наноструктура 46 (контакты к нанопроводу) совместно с металлическим каналом-нанопроводом 50 формируется на диэлектрической подложке методами фото- и электронной литографии с использованием фото- и электронного резиста, технологии травления экспонированной области и технологии напыления металла магнетронным или термическим способом. Управляющим электродом также может служить проводящий подслой (например, допированный кремний), находящийся под слоем диэлектрика 49. Для устранения контакта подводящих электродов с водным раствором в микрофлюдной ячейке они покрываются тонким слоем диэлектрика 51, наносимого через маску. Также числами 44, 47, 48 показаны, соответственно, иммобилизованный полимеразный комплекс, водный раствор реакционной смеси и электрод смещения.
На Фиг. 17 представлено распределение электрического потенциала для одной частицы, несущей единичный заряд.
На Фиг. 18 представлено распределение потенциала вдоль оси, соединяющей центр нанопровода с центром заряженной частицы, и нормировано на значение потенциала на поверхности нанопровода со стороны частицы, диаметр нанопровода 100 нм (по оси X - расстояние в метрах, по оси Y - a. u. (atomic units)).
На ФИГ. 19 показано, как отдельные нанопроводные транзисторы могут быть размещены в интегральной структуре, представляющей собой чип с массивом нанопроводных транзисторов с адресной шиной, позволяющей осуществлять индивидуальное измерение на каждом нанотранзисторе.
На Фиг. 20 представлена фотография сформированного нанопроводного транзистора с утолщенным до 600 нм диэлектрическим слоем Si02 под подводящими металлическими контактами и поверхностным изолирующим слоем Si02 толщиной 200 нм; числом 52 обозначен нанопровод, 53 - контактные площадки, 54 - металлические проводники, 55 - слой диэлектрика, изолирующий проводники от водного раствора.
На Фиг. 21 представлена фотография вида окончательно сформированных структур нанопроводных транзисторов в центральной области чипа; числом 56 обозначен
двойной слой диэлектрика под проводниками для исключения токов утечки.
На Фиг. 22 показана эквивалентная электрическая схема одноэлектронного транзистора.
На Фиг. 23 представлены: а - Вольт-амперная характеристика транзистора (сплошная линия - состояние кулоновской блокады; пунктирная - полностью разблокированный транзистор); б - Модуляционная характеристика одноэлектронного транзистора.
На Фиг. 24 представлена эквивалентная схема одноэлектронного транзистора - электрометра с источником измеряемого заряда Qx, имеющим собственную емкость Cs и емкость связи Сд.
На Фиг. 25 представлено схематическое изображение одномолекулярного транзистора с подвешенными электродами: М - молекула, осажденная в зазор и зафиксированная там при помощи SH-rpynn.
На Фиг. 26 показана фотография КНИ-структуры с висящими электродами над подложкой.
На Фиг. 27 представлена фотография наноструктуры одноэлектронного транзистора с нанозазором, полученным методом электронно-лучевой литографии.
На Фиг. 28 представлена фотография нанозазора, полученного методом электромиграции (электротреппинг).
На Фиг. 29 представлена фотография нанозазора, полученного методом ионно- лучевой литографии (FIB-технология).
На Фиг. 30 представлена фотография наноструктуры из 16 ячеек для транзисторов с нанозазорами.
На Фиг. 31 представлена фотография одной из 16 ячеек из транзистора с нанозазором (чертой указано расстояние 100 нм).
На Фиг. 32 представлена фотография центрального электрода-острова в структуре одноэлектронного транзистора из нанопровода, полученного применением FIB - технологии для формирования необходимой геометрии наноструктур.
На Фиг. 33 представлена фотография сформированного нанозазора для создания молекулярного одноэлектронного транзистора.
На Фиг. 34 представлена тестовая вольтамперная характеристика сформированного нанозазора; показывающая зависимость тока утечки через нанозазор от напряжения на нем (по оси X - величина напряжения, в Вольтах, по оси Y - величина тока, в Амперах); форма этой зависимости показывает, что нанозазор был сформирован.
Подробное раскрытие изобретения
Предлагаемый способ электронного одномолекулярного секвенирования нуклеиновых кислот основан на следующих закономерностях. Во-первых, основания
одной цепи ДНК соединяются с основаниями другой цепи ДНК за счет водородных связей по строго определенным правилам Чаргаффа (например, нуклеотид А образует пару с Т,
G образует пару с С), поэтому достаточно определить последовательность оснований в одной цепи для того, чтобы определить нуклеотидную последовательность секвенируемой ДНК. Определение имен оснований в последовательности одной цепи
ДНК в ходе реакции полимеризации называется секвенированием путем синтеза
(sequencing by synthesis, SBS) и применяется в настоящем способе секвенирования нуклеиновых кислот, ДНК или РНК. Во-вторых, в результате встраивания полимеразой каждого комплементарного нуклеотида в полимеризуемый фрагмент ДНК/РНК происходит разделение зарядов (Pourmand N, et al., Proc Natl Acad Sci U S A, 2006 Apr
25; 103(17): 6466-70): один электрон остается на полимеризуемом фрагменте ДНК/РНК, а один протон выделяется в водный раствор. В-третьих, сразу после разделения зарядов электрон и ион водорода индуцируют на поверхности электронного сенсора противозаряды одинаковой величины, но противоположного знака, которые компенсируют друг друга, но только на то время, пока ион водорода не удалится от места своего образования на некоторое расстояние в результате тепловой диффузии и действия электрического поля, сформированного зарядом электрода смещения ячейки.
После чего, на поверхности электронного сенсора остается нескомпенсированный противозаряд, индуцированный электроном (Pourmand N, et al., Proc Natl Acad Sci U S A,
2006 Apr 25;103(17):6466-70), результат воздействия которого на электронный сенсор преобразуется последним в электрический сигнал и регистрируется последующей схемой усиления и обработки сигнала, как факт разделения зарядов (факт встраивания нуклеотида) и отмечается на выходной циклограмме логической единицей. В-четвертых, результаты регистрации фактов разделения зарядов будут иметь хорошую повторяемость, если разделение зарядов в ячейке матрицы происходят в одном и том же месте ячейки относительно сенсора этой ячейки, при одинаковых условиях реакции для каждого встраиваемого нуклеотида. В-пятых, если концентрация одного вида нуклеотидов в реакционной смеси изменена (понижена или повышена) и имя этого вида нуклеотидов известно, тогда усредненные (средние) интервалы времени перед встраиванием нуклеотидов именно этого вида будут иметь большую (при пониженной концентрации) или меньшую (при повышенной концентрации) длительность, по сравнению с усредненной (средней) длительностью интервалов времени перед встраиванием нуклеотидов трех других видов, которые имеют оптимальные концентрации в этой рабочей смеси для осуществления реакции полимеризации молекулы ДНК или
РНК. Предпочтительным является вариант с меньшей концентрацией одного вида нуклеотида против нормальных концентраций трех других видов нуклеотидов в реакционной смеси, при этом темп встраивания нуклеотидов того вида, концентрация
которого понижена, в среднем становится ниже, чем темп встраивания нуклеотидов других видов, концентрация которых нормальна.
В некоторых вариантах изобретения значительно меньшая концентрация одного из нуклеотидов достигается, когда его концентрация меньше, чем концентрация других нуклеотидов в 5-10 раз. В некоторых вариантах изобретения значительно меньшая концентрация одного из нуклеотидов достигается, когда его концентрация меньше, чем концентрация других нуклеотидов в 10-20 раз. В некоторых вариантах изобретения значительно меньшая концентрация одного из нуклеотидов достигается, когда его концентрация меньше, чем концентрация других нуклеотидов в 20-40 раз. В других вариантах изобретения значительно меньшая концентрация одного из нуклеотидов достигается, когда его концентрация меньше, чем концентрация других нуклеотидов в 40- 100 раз. В-шестых, погрешность результатов измерений является случайной величиной при множестве результатов измерений одним и тем же средством измерений, и поэтому её можно уменьшить путем усреднения результатов многократных измерений; усреднение N некоррелированных, статистически независимых результатов измерений (т.е. при отсутствии постоянных, например, искусственных помех (50-60 Гц и т.д.)) позволяет уменьшать случайную составляющую погрешности результата в VN раз до тех пор, пока она не станет настолько малой, что суммарная погрешность будет определяться систематической составляющей погрешности. В-седьмых, существуют ДНК-полимеразы, например фага Phi29, обладающие способностью вытеснять растущую цепь формирующейся ДНК, когда синтез, а значит и“чтение” ДНК, может производиться несколько раз по закольцованному фрагменту ДНК, аналогично «репликации по типу катящегося кольца” (РКК); применение такого вида ДНК полимераз позволяет увеличить точность секвенирования в несколько раз за счет усреднения информации о длительности интервалов времени перед фактами разделения зарядов (фактами встраивания нуклеотидов).
Предлагаемый метод одномолекулярного секвенирования нуклеиновых кислот возможно реализовать двумя основными способами: последовательным и параллельным, каждый из которых имеет свои преимущества. Для реализации каждого из
способов ниже приведены примеры используемых устройств, которые приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.
При последовательном способе одномолекулярного секвенирования применяется одна микросхема матрицы ячеек сенсоров, в которой на поверхность каждого сенсора иммобилизуют тройной комплекс «праймер-полимераза-матрица», после чего на поверхность матрицы последовательно подаются четыре вида реакционных смесей (каждая реакционная смесь подается один раз, очередность подачи реакционных смесей может быть любой), отличающихся тем, что в каждой реакционной смеси понижена концентрация только одного вида нуклеотидов против нормальной концентрации трех остальных видов нуклеотидов; длительность времени нахождения каждой реакционной смеси над сенсорами ячеек матрицы микросхемы зависит от темпа встраивания нуклеотидов ДНК полимеразой (нуклеотиды в секунду) и определяется временем, которое необходимо для ДНК/РНК полимеразы, чтобы “скопировать” закольцованный фрагмент нуклеиновой кислоты столько раз, сколько требуется для достижения заданной точности секвенирования. Исходя из факта, что конечное число синтезированных копий ограничено процессивностью полимеразы (например, средняя процессивность ДНК полимеразы РЫ29 равна ~80,000 нуклеотидов), количество секвенированных копий обратно пропорционально длине в нуклеотидах одной копии закольцованной ДНК. Например, при длине копии матрицы в 1000 нуклеотидов можно прочитать матрицу максимум 80 раз, суммарно для всех четырех реакционных смесей; т.е. в каждой реакционной смеси может быть получена информация о синтезе 20 копий. При длине копии матрицы в 5000 нуклеотидов можно прочитать матрицу максимум 16 раз, суммарно для всех четырех реакционных смесей, т.е. в каждой реакционной смеси может быть получена информация о синтезе четырех копий каждой матрицы. В предпочтительных вариантах изобретения закольцованная матрица прочитывается столько раз в каждой реакционной смеси, сколько требуется для получения желаемой точности секвенирования фрагмента ДНК, например, так, как показано в Примере 9 ниже.
При параллельном способе секвенирования применяются четыре пространственно изолированные матрицы ячеек сенсоров, на поверхность каждого сенсора каждой матрицы иммобилизуют комплекс «праймер-матрица-полимераза», после чего на поверхность каждой из четырех матриц подают только одну из четырех реакционных смесей, отличающихся тем, что в каждой реакционной смеси понижена концентрация одного вида нуклеотидов против нормальной концентрации трех остальных видов нуклеотидов;“копируют” закольцованный фрагмент нуклеиновой кислоты в каждой ячейке каждой матрицы столько раз, сколько требуется для достижения заданной точности секвенирования; реакции полимеризации фрагментов ДНК в каждой ячейке каждой
матрицы происходят асинхронно. Учитывая процессивность ДНК полимеразы РЫ29, равную ~80,000 нуклеотидов, и факт, что эта процессивность является лимитирующим фактором в каждой из четырёх изолированных матриц, получающих параллельно четыре реакционных смеси, а не в единственной матрице, как при последовательном способе секвенирования (см. выше), то максимальное количество копий, потенциально прочитанных полимеразой в каждой реакционной смеси будет в четыре раза больше, чем при последовательном способе секвенирования. Так, при длине копии матрицы в 1000 нуклеотидов, можно прочитать матрицу в каждой из четырех реакционных смесей максимум 80 раз, т.е. в каждой реакционной смеси может быть получено до 80-ти выходных последовательностей дискретных интервалов времени от каждой ячейки матрицы. При длине копии матрицы в 5000 нуклеотидов можно прочитать матрицу в каждой из четырех реакционных смесей 16 раз, т.е. точность секвенирования при параллельном способе секвенирования может быть значительно увеличена против последовательного способа секвенирования за счет точного определения нуклеотидной последовательности более длинных фрагментов ДНК. Но такое потенциально возможное увеличение точности достигается за счет увеличения в 4 раза количества микросхем матриц ячеек сенсоров, дополнительного количества реагентов, а значит и стоимости секвенирования.
Возможна реализация предлагаемого метода одномолекулярного секвенирования и комбинированным способом: последовательно-параллельным: две матрицы, на каждую последовательно подаются две реакционных смеси из четырех подготовленных, в каждой реакционной смеси понижена концентрация только одного вида нуклеотидов, в каждой реакционной смеси - своего вида. Но комбинированный способ не имеет преимуществ по предельным значениям технико-экономических характеристик ни перед последовательным способом, ни перед параллельным.
Принципиальным преимуществом последовательного способа секвенирования против параллельного способа является отсутствие необходимости в предварительной амплификации секвенируемой молекулы ДНК/РНК при конструировании библиотеки. Параллельный способ работает только тогда, если исходная ДНК была фрагментирована, а фрагменты кпонально амплифицированы в процессе конструирования библиотеки (например, с помощью ПЦР), чтобы обеспечить попадание клонов каждого исходного фрагмента молекулы нуклеиновой кислоты на все четыре матрицы, в составе тройных комплексов. Также, при той же точности результата секвенирования, стоимость результата секвенирования последовательным способом заметно ниже. Последовательный способ секвенирования уступает параллельному только по производительности.
Определение имени вида каждого нуклеотида в анализируемой последовательности ДНК/РНК при последовательном способе секвенирования происходит в три этапа:
На первом этапе сенсором каждой ячейки матрицы производится регистрация
5 фактов разделения зарядов в результате встраивания каждого нуклеотида в полимеризуемый фрагмент ДНК/РНК, иммобилизованный в составе комплекса на его поверхности. Зарегистрированные сенсором факты разделения зарядов преобразуются аналого-цифровой схемой ячейки сенсора в полезный сигнал в форме выходной последовательности дискретных интервалов времени, причем логической единицей“1” ю отмечены те интервалы времени, в которых сенсором ячейки были зарегистрированы факты разделения зарядов; выходные последовательности передаются в устройство обработки и отображения данных, например, компьютер. Для получения предельно точной информации о местах расположения на выходной последовательности дискретных интервалов времени нуклеотидов вида, концентрация которого понижена в реакционной смеси, выполняют несколько циклов секвенирования закольцованного фрагмента ДНК в каждой ячейке матрицы, одинаковое для каждой реакционной смеси количество циклов, и получают соответствующее число выходных последовательностей дискретных интервалов времени (вероятно, потребуются разные количества времени на полимеризацию одного и того же фрагмента ДНК в каждой из четырех реакционных
20 смесей, но выходные последовательности дискретных интервалов времени поступают от ячеек матрицы в компьютер в реальном времени, поэтому компьютер отдаст команду на смену реакционной смеси или на промывку буферным раствором матрицы микросхемы только после того, как каждая из выходных последовательностей дискретных интервалов времени ячейки поступит в компьютер столько раз, сколько было задано пользователем перед началом процедуры секвенирования). Возможное количество циклов секвенирования в каждой реакционной смеси определяется в основном длиной секвенируемых фрагментов ДНК/РНК и процессивностью полимеразы.
На втором этапе статистически определяют короткие и длинные интервалы времени перед встраиванием нуклеотидов (сравнивают количество логических нулей“0” зо перед каждой логической единицей “1”) для каждой выходной последовательности дискретных интервалов времени, полученных на первом этапе, и для каждой ячейки перезаписывают данные в виде четырех последовательностей логических единиц“1” и нулей “0” (по одной для каждой реакционной смеси) таким образом, что теперь логической единицей «1» обозначен каждый длинный интервал времени,
35 соответствующий встраиванию нуклеотидов вида, концентрация которого была понижена в соответствующей реакционной смеси и известна, а логическим нулем «0» обозначаются
короткие интервалы времени, соответствующие встраиванию нуклеотидов видов, концентрация которых была нормальна в этой же реакционной смеси.
Для каждой ячейки сопоставляют данные о местах расположения нуклеотидов известных видов на каждой из четырех последовательностей логических единиц «1» и нулей «0» друг с другом, и методом исключения, следуя правилу, что на одной позиции в нуклеотидной последовательности фрагмента ДНК может располагаться нуклеотид только одного вида, формируют результирующую нуклеотидную последовательность секвенируемого фрагмента ДНК.
На третьем этапе из нуклеотидных последовательностей фрагментов ДНК/РНК составляют нуклеотидную последовательность всей исходной ДНК/РНК с помощью компьютерной программы, реализующей, в зависимости от решаемой задачи, например, алгоритм RACA (Kim J, et al., Proc Natl Acad Sci U S A, 2013 Jan 29; 110(5): 1785-90) или алгоритм Ragout для референсной сборки (Kolmogorov М, et al., Bioinformatics, 2014 Jun 15;30(12):i302-9), или же алгоритмы для сборки de novo, например, алгоритмы основанные на графическом методе De Bruijn (Compeau Р, et al., Nature Biotechnology, 2011 , 29 (11): 987-991) или любые другие подходящие алгоритмы.
Определение имени вида каждого нуклеотида в анализируемой последовательности ДНК/РНК при параллельном способе секвенирования производится в четыре этапа:
На первом этапе сенсором каждой ячейки каждой матрицы производится регистрация фактов разделения зарядов в результате встраивания каждого нуклеотида в полимеризуемый фрагмент ДНК/РНК, иммобилизованный в составе комплекса на его поверхности. Зарегистрированные сенсором факты разделения зарядов преобразуются аналого-цифровой схемой ячейки сенсора в полезный сигнал в форме выходной последовательности дискретных интервалов времени, обозначенных логическими единицами“1" и нулями“0”, причем логической единицей“ отмечены те интервалы времени, в которых сенсором ячейки были зарегистрированы факты разделения зарядов; выходные последовательности передаются в устройство обработки и отображения данных, например, компьютер. Для получения предельно точной информации о местах расположения на выходной последовательности дискретных интервалов времени нуклеотидов вида, концентрация которого понижена в реакционной смеси над конкретной матрицей, выполняют несколько циклов секвенирования закольцованного фрагмента ДНК в каждой ячейке каждой матрицы и получают соответствующее число выходных последовательностей дискретных интервалов времени. Возможное количество циклов секвенирования определяется в основном длиной секвенируемых фрагментов ДНК/РНК, процессивностью полимеразы и выполняется одинаковое количество раз в каждой ячейке каждой матрицы.
На втором этапе статистически определяют короткие и длинные интервалы времени перед встраиванием нуклеотидов (сравнивают количество логических нулей“0” перед каждой логической единицей “1”) для каждой выходной последовательности дискретных интервалов времени, полученных на первом этапе, и для каждой ячейки каждой матрицы перезаписывают данные в виде одной последовательности логических единиц“1” и нулей“0” таким образом, что теперь логической единицей «1 » обозначен каждый длинный интервал времени, соответствующий встраиванию нуклеотидов вида, концентрация которого была понижена в соответствующей реакционной смеси и известна, а логическим нулем «0» обозначаются короткие интервалы времени, соответствующие встраиванию нуклеотидов видов, концентрация которых была нормальна в этой же реакционной смеси.
Т.к. параллельный способ секвенирования предполагает амплификацию фрагментов, полученных после фрагментации нуклеиновой кислоты, то отдельно для каждой микросхемы матрицы ячеек сенсоров минимизируют количество последовательностей логических единиц “1” и нулей “0” посредством сортировки, сравнения, выбора, усреднения одинаковых с определенной вероятностью последовательностей логических единиц“1” и нулей “0” и преобразования их в одну последовательность логических единиц“1” и нулей“0”.
На третьем этапе, посредством сортировки, сравнения и исключения - из четырех последовательностей логических единиц“ и нулей “0”, взятых от каждой из четырех микросхем матриц ячеек сенсоров, сопоставляя данные о местах расположения нуклеотидов известных видов на каждой из четырех последовательностей логических единиц «1 » и нулей «0» друг с другом, и следуя правилу, что на одной позиции в нуклеотидной последовательности фрагмента ДНК может располагаться нуклеотид только одного вида, - формируют нуклеотидные последовательности фрагментов нуклеиновых кислот.
На четвертом этапе из нуклеотидных последовательностей фрагментов нуклеиновой кислоты составляют полную нуклеотидную последовательность исходной ДНК/РНК образца с помощью компьютерной программы, реализующей, в зависимости от решаемой задачи, например, алгоритм RACA (Kim J, et al., Proc Natl Acad Sci U S A, 2013 Jan 29; 110(5): 1785-90) или алгоритм Ragout для референсной сборки (Kolmogorov М, et al., Bioinformatics, 2014 Jun 15;30(12):i302-9), или же алгоритмы для сборки de novo, например, алгоритмы основанные на графическом методе De Bruijn (Compeau Р, et al., Nature Biotechnology, 2011 , 29 (1 1): 987-991) или любой другой подходящий алгоритм.
В предпочтительных вариантах изобретения регистрацию факта разделения зарядов при присоединении ДНК полимеразой очередного нуклеотида осуществляют измерением модуляции тока в канале полевого транзистора посредством
индуцированного потенциала на поверхности сенсора (затвора полевого транзистора). В других вариантах изобретения факт разделения зарядов можно зарегистрировать путем измерения емкости или проводимости окружающего раствора. Регистрацию проводят с помощью электронного сенсора, расположенного на поверхности ячейки матрицы и изготовленного на основе наноразмерной полупроводниковой структуры, например, нанопроводного полевого транзистора, одноэлектронного транзистора, полевого транзистора, диода, или на основе структуры с S-образной или N-образной вольтамперной или передаточной характеристикой (например, диод специальной конструкции), используемой в составе схемы и реализующей эффект стохастического резонанса для улучшения отношения сигнал/шум.
Для воспроизводимой регистрации полезного сигнала необходимо, чтобы комплекс «полимераза-матрица ДНК» был иммобилизован на поверхности сенсора достаточно продолжительное время, большее, чем процессивное время ДНК полимеразы. Для этого используют сенсор с модифицированной поверхностью для иммобилизации полимеразного комплекса на поверхности. Аналого-цифровая электронная схема ячейки матрицы считывает сигналы сенсора, отмечает моменты их получения логической единицей "1" на формируемой выходной последовательности дискретных интервалов времени, и передает ее в компьютер в реальном времени. Т.к. имя вида нуклеотидов, концентрация которого понижена в реакционной смеси над матрицей, известно, то места расположения нуклеотидов этого вида в последовательности секвенируемой нуклеиновой кислоты определяются результатами анализа длительности интервалов времени перед полезными сигналами или между ними (логическими“1”), сформированными в ячейках этой матрицы.
Принципиально, что за счет иммобилизации комплекса“полимераза-матрица ДНК” в непосредственной близости от поверхности сенсора, каждый факт разделения пары зарядов при встраиваниях комплементарных нуклеотидов в полимеризуемый фрагмент нуклеиновой кислоты производится на минимальном, одинаковом (с определенной точностью) расстоянии от поверхности сенсора, - тем самым обеспечивая эффективную регистрацию фактов разделения зарядов в ходе полимеризации фрагментов нуклеиновой кислоты, в том числе длинных фрагментов (тысячи пар нуклеотидов).
В сочетании с применением безметочного алгоритма секвенирования ДНК, становится возможным в каждой ячейке матрицы организовать процедуру регистрации результатов встраивания комплементарных нуклеотидов в растущую цепь фрагмента нуклеиновой кислоты, и, на основе информации о величине дискретных интервалов времени между зарегистрированными результатами встраивания нуклеотидов, установить имя вида каждого нуклеотида в последовательности исходного фрагмента нуклеиновой кислоты.
Использование изобретения позволит повысить производительность и точность процедуры секвенирования молекул нуклеиновой кислоты, в том числе для целей применения в медицинской диагностике.
В некоторых аспектах изобретение обеспечивает способ секвенирования нуклеиновых кислот, который относится к группе методов секвенирования по методу синтеза (SBS), и основан на обнаружении результатов включения полимеразой нуклеотидов в полимеризуемую нить нуклеиновой кислоты. В отличие от ряда современных способов коммерческого секвенирования этой группы, в способе по настоящему изобретению используют природные нуклеотиды и полимеразу, которая не имеет модификаций аминокислот необходимых для улучшения включения синтетических нуклеотидов с присоединенными флуорофорами или другими химическими модификациями. Основной принцип способа настоящего изобретения основан на обнаружении в реальном времени событий разделения пары зарядов, сопровождающих включение нуклеотидов молекулой одиночной полимеразы в растущую нить одиночных молекул нуклеиновой кислоты в комплексе «полимераза-матрица ДНК», иммобилизованном на поверхности сенсора. Обнаружение серий событий однократного разделения зарядов осуществляется чувствительным к изменению заряду электронным сенсором. В реакциях с четырьмя различными начальными условиями, каждое из которых определено одним из четырех видов нуклеотидов, находящимся в пониженной концентрации, регистрируются временные ряды событий разделения зарядов, показывающие временные задержки при включении нуклеотидов обедненного вида. Анализ полученных четырех временных рядов этих событий при реакции одного полимеразного комплекса приводит к определению нуклеотидной последовательности исследуемой молекулы нуклеиновой кислоты. Раскрытые здесь методы могут быть классифицированы как методы реального времени, одномолекулярные, электронные, асинхронные методы секвенирования.
В некоторых аспектах изобретение обеспечивает способ секвенирования нуклеиновых кислот, содержащий: обеспечение множества наносенсорных элементов (ячеек), размещенных в матрице, причем каждая ячейка содержит чувствительное к заряду устройство (наносенсор), усилитель и аналого-цифровой преобразователь сигнала, причем наносенсор содержит, например, исток, сток и затвор (наноразмерный транзистор); обеспечение образца, содержащего множество закольцованных молекул целевой нуклеиновой кислоты; обеспечение олигонуклеотидного праймера и условий отжига с образованием комплекса праймера-матрицы; контактирование праймер-матрицы с ферментом полимеразы с образованием тройного комплекса «полимераза-праймер- матрица ДНК»; обеспечение условий присоединения тройного комплекса к поверхности наносенсора, приводящих к образованию множества наносенсоров с
иммобилизованными на их поверхности одиночными тройными комплексами; подвергая указанные тройные комплексы четырем реакциям полимеризации, каждую в реакционной смеси, содержащую все четыре дезоксинуклеозидтрифосфата (dATP, сГГТР, dGTP, dCTP),
(или нуклеозидтрифосфаты ATP, UTP, GTP, СТР), где каждая реакционная смесь имеет один дезоксинуклеозидтрифосфат (или нуклеозидтрифосфат), присутствующий в пониженной концентрации; обнаружение событий разделения пары зарядов, сопровождающих включение нуклеотида в полимеризуемый фрагмент одноцепочечной нуклеиновой кислоты; регистрация временных рядов фактов разделения пар зарядов и идентификацию длинных временных интервалов, предшествующих включению обедненных нуклеотидов для каждой из четырех реакционных смесей, и, таким образом, поиск положений каждого нуклеотида обедненного вида вдоль целевой молекулы нуклеиновой кислоты; сравнивая последовательности положений нуклеотидов обедненного вида для всех четырех реакционных смесей и определяя нуклеотидную последовательность целевой молекулы нуклеиновой кислоты.
В некоторых аспектах настоящее изобретение относится к способам секвенирования нуклеиновых кислот, включающим последовательное или параллельное проведение реакций полимеризаций с четырьмя реакционными смесями, каждая из которых имеет один обедненный нуклеотид из четырех, где, например, реакционная смесь 1 содержит низкую концентрацию нуклеотидов А, смесь 2 - G, смесь 3 - Т и смесь 4 - С; в котором кратность повторного синтеза нуклеиновой кислоты целевой последовательности рассчитана для каждой из четырех реакционных смесей таким образом, чтобы позволить полимеразе копировать количество целевых нуклеиновых кислот столько раз, чтобы достичь высокой (требуемой) точности секвенирования. В параллельном методе секвенирования используются четыре матрицы наносенсоров, и четыре реакционных смеси, которые одновременно могут добавляться к четырем матрицам.
В некоторых вариантах осуществления настоящее изобретение относится к электронному одномолекулярному секвенированию, включающему получение множества кольцевых молекул целевой нуклеиновой кислоты (библиотек), условий сборки тройного полимеразного комплекса и присоединения указанного комплекса к поверхности наносенсора, композиции реакционных смесей и условия репликации (или транскрипции) по типу «катящегося кольца».
Для реализации вышеуказанных способов согласно заявляемым вариантам осуществления используют устройство электронного одномолекулярного секвенирования, которое также является предметом настоящего изобретения. Устройство содержит микрофлюидное устройство, обеспечивающую подачу реагентов к сенсорам ячеек матрицы микросхемы; непосредственно саму микросхему матрицы ячеек
сенсоров (по меньшей мере одну); устройство электронного управления: микрофлюидным устройством, микросхемой, обменом данными с устройство обработки и отображения данных (компьютером); компьютер со специальным программным обеспечением, которое регистрирует и хранит первичные сигналы, генерируемые сенсорами ячеек матрицы микросхемы, анализирует, обрабатывает эти данные и определяет нуклеотидные последовательности целевых нуклеиновых кислот из множества ее фрагментов.
Устройство обработки и отображения данных может выполняться на базе широкого спектра электронно-вычислительных устройство, например, персонального компьютера, ноутбука, серверного кластера и т.п. В общем случае указанное устройство содержит один или более процессоров, выполняющих основную вычислительную работу при реализации этапов способа и оперативную память (ОЗУ), предназначенную для оперативного хранения команд, исполняемых одним или более процессорами.
Ниже более подробно описывается процесс пробоподготовки по настоящему изобретению, включающий выделение нуклеиновых кислот, конструирование библиотеки, образование комплексов «полимераза-матрица ДНК» и их иммобилизация на поверхности сенсоров ячеек матрицы микросхемы.
Нуклеиновые кислоты, используемые в методах и системах секвенирования в вариантах изобретения, могут быть одноцепочечными и двухцепочечными, или же содержать участки одноцепочечных и двухцепочечных последовательностей. Например, нуклеиновые кислоты могут представлять собой геномную ДНК, митохондриальную ДНК, кДНК, мРНК, рибосомальную РНК, малую РНК, некодирующую РНК, малую ядерную РНК, малую ядрышковую РНК и Y РНК. В некоторых вариантах осуществления нуклеиновые кислоты экстрагируются и очищаются из образца или пробы. В некоторых вариантах осуществления РНК конвертируется в ДНК в процессе обратной транскрипции при участии обратной транскриптазы - специализированной ДНК полимеразы, способной синтезировать цепь ДНК используя РНК в качестве матрицы. Нуклеиновые кислоты (например, геномная ДНК), используемые в вариантах изобретения, могут быть изолированы\получены из любого интересующего организма. Такими организмами могут быть, например, животные (например, млекопитающие, включая человека и приматов), растения, грибы, или патогены, такие как бактерии или вирусы. В некоторых вариантах осуществления нуклеиновые кислоты (например, геномная ДНК или РНК) являются бактериальными или вирусными нуклеиновыми кислотами.
Нуклеиновые кислоты получают из образцов интересующих организмов. Неограничивающие примеры образцов включают клетки, жидкости организма (включая, но не ограничивая, кровь, мочу, сыворотку, лимфу, слюну, анальные и вагинальные выделения, пот и семенную жидкость), пробы из окружающей среды (например, образцы
воды, почвы, воздуха, сельского хозяйства), образцы агентов биологического оружия, исследовательские образцы (например, продукты реакций амплификации нуклеиновых кислот, таких как ПЦР или реакции амплификации всего генома), очищенные образцы, такие как очищенная геномная ДНК, препараты РНК, и необработанные первичные образцы (бактерии, вирусы, и т.д.).
Методы получения нуклеиновых кислот (например, геномной ДНК) хорошо известны в данной области исследований (например, Sambrook et al., Molecular Cloning: A Laboratory Manual (1999)).
В некоторых вариантах осуществления нуклеиновые кислоты, используемые в данном предложении представляют собой геномную ДНК. В некоторых вариантах осуществления нуклеиновые кислоты представляют собой часть генома (например, часть генома представляющую интерес для определенного\конкретного применения, например, выборка генов которые могут нести мутации в частной выборке популяции, например, пациентов имеющих рак). В некоторых вариантах осуществления нуклеиновые кислоты представляют собой экзомную ДНК, например, часть полного генома, обогащенную транскрибируемыми последовательностями ДНК. В некоторых вариантах осуществления нуклеиновые кислоты представляют собой часть или полный транскриптом, например, набор всех мРНК или транскриптов производимых клеткой или популяцией клеток.
В некоторых вариантах осуществления нуклеиновые кислоты (например, геномная ДНК) подвергаются фрагментированию. Может быть использован любой метод фрагментации. Например, в некоторых вариантах осуществления нуклеиновые кислоты фрагментируются механическим способом (например, ультразвуковым, акустическим, или небулизацией), химическими или энзиматическими методами (например, путем использования эндонуклеаз). Методы фрагментации нуклеиновых кислот хорошо известны в области данного изобретения (например, US 9127306 В2). В некоторых вариантах осуществления фрагментация производится ультразвуком (например, используя сфокусированный ультразвуковой облучатель фирмы Covaris, США). В других вариантах осуществления фрагментация производится путем обработки нуклеиновых кислот нуклеазами или их смесями (например, смесь нукпеаз Fragmentase, New England Biolabs, США). В некоторых вариантах осуществления размер фрагментированной нуклеиновой кислоты находится в интервале 50-200 пар оснований (п.о.). В некоторых вариантах осуществления размер фрагментированной нуклеиновой кислоты находится в интервале 100-500 п.о. В некоторых вариантах осуществления размер фрагментированной нуклеиновой кислоты находится в интервале 200-2000 п.о. В некоторых вариантах осуществления размер фрагментированной нуклеиновой кислоты находится в интервале 500-5000 п.о. В некоторых вариантах осуществления размер фрагментированной нуклеиновой кислоты находится в интервале 1000-10000 п.о. В
некоторых вариантах осуществления размер фрагментированной ДНК находится в интервале 3000-20000 п.о. В некоторых вариантах осуществления размер фрагментированной ДНК находится в интервале 5000-40000 п.о.
В некоторых вариантах осуществления методы, описанные в данном разделе, представляют собой выделение\экстракцию нуклеиновых кислот из биологических образцов и их подготовку к секвенированию. Некоторые методы экстракции нуклеиновых кислот из образцов\проб различного происхождения используют лизирующие клетку ферменты, ультразвуковую обработку, высокое давление пресса, или комбинацию любых из этих методов. Во многих случаях после высвобождения нуклеиновых кислот из клетки они дополнительно очищаются от дебриса клеточной стенки, белков, и других компонентов с помощью коммерчески доступных методов включающих использование протеиназ, органических растворителей, технику обессоливания, спин-колонок, а также связывание нуклеиновых кислот с функционализированным матриксом, например, магнитными наночастицами. В некоторых случаях нуклеиновая кислота представляет собой бесклеточную свободную нуклеиновую кислоту (например, т.н. жидкостная биопсия) и не требует процесса экстракции из клетки.
Методы конструирования библиотек нуклеиновых кислот представленного изобретения имеют конечной целью создание кольцевой ДНК матрицы которая служит субстратом для ДНК полимеразы в реакции «репликации по механизму катящегося кольца» (РКК) - предпочтительного способа ДНК синтеза используемого в представленном изобретении. Такая закольцованная ДНК матрица с неизвестной нуклеотидной последовательностью секвенируется с многократной повторяемостью методами, изложенными в данном изобретении для достижения высокой точности определения нуклеотидов в последовательности кольцевой матрицы.
В некоторых вариантах осуществления закольцованная матрица представляет собой полимер ДНК, а полимеразой служит РНК полимераза, например РНК полимераза бактериофага Т7, и процесс секвенирования производится путем «транскрипции по механизму катящегося кольца» (Mohsen and Kool, Асе. Chem. Res., 2016, v. 49 (11): 2540- 2550). В некоторых вариантах осуществления закольцованной матрицей для полимеразы служит ковалентно-замкнутое полностью одноцепочечное кольцо ДНК (Фиг. 1А). Методы конструирования таких одноцепочечных матриц хорошо известны в области науки к которой относится настоящее изобретение. Пример такого метода приведен в деталях на Фиг. 2.
В некоторых вариантах осуществления закольцованная матрица может быть в форме двухцепочечного ДНК кольца, имеющего «надрез» или «брешь» в одной цепи (Фиг. 1В). При этом образующийся 3’ конец служит сайтом связывания ДНК полимеразы и начала синтеза ДНК. Такая матрица может быть получена в результате двух
энзиматических реакций. Сначала производится лигирование двухцепочечного адаптера
ДНК лигазой к концу двухцепочечного фрагмента ДНК образца. При этом может быть использовано как лигирование «тупых» концов, так и лигирование адаптера, имеющего выступающий 3’ Т-конец с ДНК фрагментом у которого на 3’ концы добавлены нуклеотиды
А. Затем окаймленный адаптерами двухцепочечный фрагмент ДНК напрямую закольцовывается с помощью ДНК лигазы, либо для закольцовывания добавляется дополнительный «адаптер-мостик» с концами совместимыми с концами уже пришитых адаптеров (например, используются комплементарные «липкие» концы).
В других вариантах осуществления матрица может топологически представлять собой закольцовано замкнутую частично двухцепочечную структуру вида «ДНК гантели». Такая структура позволяет определять последовательность сразу двух цепей ДНК двухцепочечной части «ДНК гантели» (Фиг. 1Б), смысловой и антисмысловой, при секвенировании путём механизма РКК. Методы конструирования таких ДНК гантелей хорошо известны в данной области техники (например, Travers KJ, et al., Nucleic Acids Research, 2010, Vol. 38, No. 15 e159).
В некоторых вариантах осуществления метод конструирования библиотек одноцепочечных закольцованных ДНК молекул состоит из нескольких последовательных шагов. Пример такого метода приведен на Фиг. 1 и состоит из следующих шагов: (а) фрагментирование ДНК полученной из образца для получения множества ДНК фрагментов; (б) селекция и отбор фрагментированной ДНК по размеру; (в) денатурация двухцепочечной фрагментированной ДНК нужного размера для получения одноцепочечной ДНК, где денатурация производится термическим или химическим воздействием; (г) репарирование 5’- и З’-концов для восстановления 5’-фосфатных и 3’- гидроксильных групп; (д) лигирование 5’ и 3’ полуадаптеров к репарированным одноцепочечным фрагментам ДНК, получая таким образом множество одноцепочечных фрагментов ДНК, окаймленных по флангам верхними цепями полу адаптеров; (е) амплификация полученных лигированных молекул с помощью полимеразной цепной реакции (ПЦР), где прямой и обратный праймеры представляют собой олигонуклеотиды гомологичные последовательностям пришитых полуадаптеров; (ж) денатурация амплифицированных фрагментов ДНК для превращения их в одноцепочечную форму; (з) закольцовывание одноцепочечных фрагментов ДНК, состоящее из (1) отжига олигонуклеотида-«мостика» к концам одноцепочечных фрагментов, сближающее таким образом 5’- и З’-концы последовательностей адаптеров и приводящее к образованию двухцепочечного никированного (содержащего «ник» - одноцепочечный разрыв ДНК) участка в закольцованном одноцепочечном фрагменте, и (2) лигирования с помощью ДНК лигазы упомянутого «ника» (одноцепочечного разрыва ДНК) приводящее к образованию ковалентно-замкнутых закольцованных одноцепочечных ДНК молекул; (и) переваривание
с помощью экзонуклеаз оставшихся (направленная деградация\разрушение) незакольцованных линейных фрагментов ДНК, а также олигонуклеотида-«мостика», как свободного в растворе, так и отожженного, приводящее к образованию библиотеки одноцепочечных кольцевых ДНК.
В некоторых вариантах осуществления фрагментация ДНК осуществляется с помощью разрыва ДНК воздействием ультразвуком (например, DNA Shearing for NGS: with the M220™ Focused-ultrasonicator™, Application Notes, www.covarisinc.com; Fisher et al., Genome Biology, 201 1 , 12:R1) В некоторых вариантах осуществления ДНК фрагментируется энзиматически, например, ферментом Fragmentase (New England Biolabs Inc., США) приводя к образованию фрагментов с 5’- и З’-концами имеющими фосфатные и гидроксильные группы соответственно.
В некоторых вариантах осуществления после фрагментации ДНК производят селекцию получившихся фрагментов по размеру, чтобы сузить интервал разброса размеров фрагментов (диапазон вариабильности размеров фрагментов) и таким образом получить библиотеки с более однородными по размеру закольцованными фрагментами. В некоторых вариантах осуществления отбираются фрагменты нуклеиновой кислоты размером 200-400 п.о. В некоторых вариантах осуществления отбираются фрагменты нуклеиновой кислоты размером 400-1000 п.о. В некоторых вариантах осуществления отбираются фрагменты нуклеиновой кислоты размером 1000-2000 п.о. В некоторых вариантах осуществления отбираются фрагменты нуклеиновой кислоты размером 2000- 4000 п.о. В некоторых вариантах осуществления отбираются фрагменты нуклеиновой кислоты размером 4000-6000 п.о. В некоторых вариантах осуществления отбираются фрагменты нуклеиновой кислоты размером 6000-10000. В некоторых вариантах осуществления отбираются фрагменты нуклеиновой кислоты размером 10000-20000. В некоторых вариантах осуществления отбираются фрагменты нуклеиновой кислоты размером 20000-40000.
В некоторых вариантах осуществления селекция фрагментов по размеру осуществляется методом Solid Phase Reversible Immobilisation (SPRI) разработанным в Whitehead Institute (DeAngelis MM, et al., Nucleic Acids Res, 1995, 23: 4742-4743), который использует магнитные шарики, связывающиеся с ДНК, например, AMPureXP beads (Beckman Coulter, Inc. США). В некоторых вариантах осуществления селекция высокомолекулярных фрагментов ДНК (вплоть до 50 к.п.о.) по размеру проводится с помощью автоматического фракционирования ДНК, используя специальный инструмент, например, BluePippin (Sage Science, Inc., США).
Для конструирования библиотеки фрагментов нуклеиновой кислоты, подходящей для метода секвенирования, представленного в настоящем изобретении, множество ДНК фрагментов, образуемых в результате фрагментации, должны быть фланкированы
адаптерами - частично или полностью двухцепочечными молекулами ДНК, получаемыми путем отжига двух олигонуклеотидов с известной последовательностью.
Методы/способы прикрепления адаптеров к 5’- и З’-концам ДНК фрагментов хорошо известны в области науки к которой относится настоящее изобретение, и основаны на реакции лигирования ДНК с помощью фермента ДНК лигазы, например, ДНК лигазы фага
Т4 (New England Biolabs Inc., США).
В некоторых вариантах осуществления перед лигированием адаптеров двухцепочечные фрагменты ДНК, полученные с помощью ультразвуковой фрагментации, подвергаются реакциям репарации ДНК, чтобы восстановить 5’ фосфатные и 3’ гидроксильные концевые группы, и превратить 5’ и 3’ выступающие и/или рецессированные концы в тупые. Это достигается инкубацией фрагментированной ДНК с полинуклеотид-киназой фага Т4, ДНК полимеразой фага Т4, и иногда дополнительно с Кленов Фрагментом ДНК полимеразы I Е. coli.
В некоторых вариантах осуществления, когда ДНК фрагментируется энзиматически, например, ферментом Fragmentase (New England Biolabs Inc., США), нет необходимости проводить восстановление 5’ и 3’ концевых химических групп, так как энзиматический метод фрагментации сохраняет целостность 5’ фосфатных и 3’ гидроксильных групп в местах атаки ДНК используемыми, нуклеазами. В некоторых вариантах осуществления, когда адаптеры пришиваются методом лигирования тупых концов, тем не менее, фрагментированная ультразвуком ДНК обрабатывается ДНК полимеразой фага Т4 и иногда дополнительно Кленов Фрагментом ДНК полимеразы I, чтобы сделать концы тупыми перед лигированием двухцепочечных адаптеров по краям фрагментов.
В предпочтительных вариантах осуществления фрагментированную ДНК сначала денатурируют, а затем лигируют в одноцепочечной форме к адаптерам, как показано на Фиг. 1. В этом случае репарация концов ограничивается восстановлением 5’ фосфатных и 3’ гидроксильных групп, если ДНК была фрагментирована физическим способом, например, ультразвуком, и её не требуется вообще, если ДНК была фрагментирована энзиматически. Далее за репарацией концов следует направленное пришивание 5’ и 3’ полу-адаптеров с помощью ДНК лигазы (например, ДНК лигазы фага Т4 или ДНК лигазы фага Т7), приводящее к образованию двухцепочечных участков ДНК, имеющих «ник» в месте стыка фрагмента и адаптеров который «зашивается» ДНК лигазой.
В некоторых вариантах осуществления два адаптера (например, адаптер А и адаптер В) пришиваются к двухцепочечным фрагментам ДНК случайным ненаправленным способом - реакцией лигирования тупых концов, катализируемой ДНК лигазой, что приводит к образованию трёх типов молекул: фланкированных адаптерами А (АА комбинация), адаптерами В (ВВ комбинация), и адаптером А и адаптером В (АВ
комбинация). При таком способе используются адаптеры, не способные к лигированию между собой, т.е. не образующие гомо- и гетеродимеры. Отбор и обогащение библиотеки фрагментами ДНК, имеющими комбинацию АВ, производится с помощью ПЦР, использующей праймеры, гомологичные участкам адаптеров А и В (Drmanac R. et al.,
Science, 2010, v.327 (5961):78-81).
В некоторых вариантах осуществления к 3’ концам двухцепочечных фрагментов ДНК сначала добавляется нуклеотид А с помощью Кленов (Klenow) Фрагмента мутантной ДНК полимеразы I, не имеющей 3'~>5' экзонуклеазной активности (3'~>5' ехо-), или Taq полимеразы. В этом случае используются адаптеры, представляющие собой два отожженных друг на друга олигонуклеотида, образующих двухцепочечные олигонуклеотиды с 5' фосфатными группами и выступающими Т нуклеотидами на 3’ концах. В некоторых вариантах осуществления адаптер, имеющий выступающий нуклеотид Т на лигируемом конце, имеет частично двухцепочечную структуру, например, в форме Y-структуры, часто называемой «вилкой» (описано в US 6287825 В1 ; US 7741463 В2), или в форме“заколки-адаптера» (описано в US 7368265 В2).
В некоторых вариантах осуществления библиотека фрагментов ДНК с пришитыми адаптерами подвергается ПЦР амплификации, использующей прямой и обратный праймеры с фосфорилированными 5’ концами, что позволяет ковалентно закольцевать такие молекулы с помощью ДНК лигазы на следующем этапе, этапе закольцовывания фрагментов. В некоторых вариантах осуществления ДНК фрагменты с прикреплёнными адаптерами фосфорилируются полинуклеотид киназой и закольцовываются без предварительной ДНК амплификации.
В некоторых вариантах осуществления закольцовывание ДНК фрагментов с пришитыми адаптерами включает в себя следующие этапы: (а) денатурация амплифицированных с помощью ПЦР или не амплифицированных фрагментов ДНК, и (б) последующее внутри-молекулярное лигирование с использованием вспомогательного олигонуклеотида-«мостика», при котором денатурированные ДНК фрагменты отжигаются с олигонуклеотидом-«мостиком» в присутствии ДНК лигазы, например лигазы фага Т4, что приводит к образованию ковалентно замкнутых одноцепочечных кольцевых ДНК.
В некоторых вариантах осуществления, для обогащения библиотеки кольцевыми молекулами, незакольцевавшиеся линейные одноцепочечные фрагменты и избыток олигонуклеотида - «мостика» перевариваются (гидролизуются) в результате обработки лигированной смеси ДНК экзонуклеазами, например смесью Экзонуклазы I и Экзонуклеазы III Е. coli. Полученные таким образом кольца ДНК представляют собой библиотеку фрагментов ДНК из интересующего образца, готовую к процедуре секвенирования методом, описываемым в настоящем изобретении.
В некоторых вариантах осуществления вся библиотека ДНК из индивидуального образца, или же отдельные индивидуальные молекулы, составляющие библиотеку, метятся путем добавления баркодов [Kinde I, et al., Detection and quantification of rare mutations with massively parallel sequencing. Proc Natl Acad Sci USA. 2011 ; 108: 9530-35 и Kivioja T, et al. Counting absolute numbers of molecules using unique molecular identifiers. Nat Methods. 2012; 9: 72-4] к последовательности адаптеров, либо перед их лигированием с фрагментами ДНК образца, или в процессе ПЦР амплификации ДНК, когда баркоды являются частью последовательности ПЦР праймера(ов). Последовательности баркодов выбираются из последовательностей N-меров, где длина баркода N определяет размер конечного набора баркодов, отобранного по критерию близкой к 100% вероятности различить баркоды друг от друга. В некоторых вариантах осуществления используется один набор баркодов. В некоторых вариантах осуществления используется два или более наборов баркодов, что позволяет увеличить число меченых библиотек (или меченых индивидуальных молекул одной ДНК библиотеки) за счет возможности применить комбинаторную схему баркодирования (Фиг. 1). В некоторых вариантах осуществления баркодирование используется для мечения индивидуальных библиотек в целях их одновременного секвенирования после смешивания. Использование таких вариантов баркодирования в технологиях секвенирования называется мультиплексным секвенированием (Smith et al., Nucleic Acid Research, 2010, v. 38 (13), e142).
Метод секвенирования, представленный в настоящем изобретении, может быть классифицирован как одномолекулярный асинхронный электронный метод секвенирования в реальном времени. Он не требует множественных модификаций полимеразы, за исключением модификации для ее иммобилизации на поверхности сенсора. Метод секвенирования настоящего изобретения может использовать как ДНК, так и РНК полимеразы. В некоторых вариантах осуществления полимеразой может являться РНК полимераза, которая может быть выбрана из группы полимераз состоящей из РНК полимеразы фага Т7, РНК полимеразы фага ТЗ, РНК полимеразы фага SP6, и РНК полимеразы Е. coli. Эти полимеразы инициируют синтез РНК в специализированном участке двухцепочечной ДНК, называемом промотером. Транскрипция с закольцованной ДНК матрицы по механизму «транскрипции катящегося кольца» (ТКК) была продемонстрирована для РНК полимеразы фага Т7 (Mohsen and Kool, Асе. Chem. Res., 2016, v. 49 (11 ): 2540-2550).
В предпочтительных вариантах осуществления данного изобретения применяется ДНК полимераза. Однако такая полимераза должна соответствовать нескольким требованиям, чтобы сделать возможным секвенирование ДНК по методу, представленному в настоящем изобретении, а именно: (а) обладать сильной активностью вытеснения цепи и отсутствием 5’-3’ флап-эндонуклеазной активности; (б) отсутствием 3’-
5’ зкзонуклеазной активности; (в) высокой процессивностью синтеза ДНК; (г) иметь возможность быть прикрепленной к поверхности сенсора способом, который бы не изменял ее функциональные свойства, такие как (а) и (в). В сравнении с методами секвенирования второго (например, lllumina) и третьего (например, Pacific Biosciences) поколения в представленном здесь методе отсутствует необходимость вводить мутационные изменения в аминокислотную последовательность полимеразы, чтобы она могла использовать для синтеза химически модифицированные нуклеотиды, так как полимераза, используемая в настоящем изобретении, имеет дело с природными не модифицированными нуклеотидами. Активность вытеснения цепи необходима полимеразе настоящего изобретения, чтобы быть способной проводить синтез ДНК, используя в качестве матрицы закольцованную ДНК, такую как одноцепочечные ДНК кольца или структуры типа «ДНК гантели». Такой тип синтеза ДНК, называемый
«репликацией по механизму катящегося кольца» (РКК), копирует последовательность закольцованной матрицы множество раз, что приводит к образованию длинных конкатемерных одноцепочечных продуктов синтеза. Высокая процессивность синтеза
ДНК необходима полимеразе для полимеризации десятков тысяч п.о. после единственного акта связывания с ДНК субстратом. Отсутствие 3’-5’ зкзонуклеазной активности необходимо полимеразе для осуществления синтеза ДНК в 5’-3’ направлении, без возможности удалять только что встроенный в цепь ДНК нуклеотид за счет зкзонуклеазной коррекционной активности. Если же полимераза будет иметь такую коррекционную активность, она может иногда включать в растущую полинуклеотидную цепь один и тот же нуклеотид дважды и более раз, что приведёт к двойной (тройной, и т.д.) регистрации сенсором включения этого нуклеотида, а значит, ошибке секвенирования. Многие из известных сегодня полимераз (Кленов Фрагмент ДНК полимеразы I, ДНК полимераза фага Phi29), и многие архейные ДНК полимеразы
(например, Pfu полимераза) имеют такую экзонуклеазную активность, которая важна для высокой точности воспроизведения при естественном ДНК синтезе, так как позволяет проводить коррекцию случайного встраивания неправильных нуклеотидов, но является неприемлемой для секвенирования методом настоящего изобретения.
В предпочтительных вариантах осуществления используется мутантная 3’-5’ ехо- полимераза, например, мутантная ДНК полимераза фага Phi29. Примером ДНК полимеразы фага Phi29 с отсутствием 3’-5’ зкзонуклеазной активности является ее производная полимераза с двойной мутацией, приводящей к замене двух аминокислот - D12A/D66A (Lagunavicius, A., et al, RNA, 2008; 14: 503-513). Другие мутации гена полимеразы фага Phi29 приводящие к заменам одиночных аминокислот, N62D и T15I, также значительно снижают 3’-5’ экзонуклеазную активность (De Vega М, et al, EMBO J, 1996, 15: 1182-1 192). Получены и другие одиночные и двойные мутантные варианты
полимеразы фага Phi29 снижающие в 100-1000 раз 3’-5’ экзонуклеазную активность полимеразы по сравнению с ферментом дикого типа, как, например, D12A, Е14А, D66A, и
E14A/D66A (описаны в патенте US 5198543).
В некоторых вариантах осуществления ДНК полимераза для настоящего изобретения может быть выбрана из группы полимераз, включающих: ДНК полимеразу фага РЫ29 (3’-5’ ехо-), Большой Фрагмент Bst ДНК полимеразы, Bst 2.0 ДНК полимераза (полученная в результате in silico дизайна гомолога Большого Фрагмента ДНК полимеразы I из Bacillus stearothermophilus, New England Biolabs, США), Большой Фрагмент Bsm ДНК полимеразы (часть белка ДНК полимеразы из Bacillus smithii, Thermo Fisher Inc., США), VentR™ (3’-5’ ехо-) ДНК полимераза, Кленов Фрагмент ДНК полимеразы I Е. соМ, и большой фрагмент Bsu ДНК полимеразы.
В некоторых вариантах осуществления РРК инициируется на матрице, представляющей комплекс «ДНК праймер-ДНК кольцо» или «ДНК праймер-ДНК гантеля», полимеразой, обладающей сильной активностью вытеснения цепи ДНК, что является необходимым условием для высокопроцессивного механизма РКК. Термин "вытеснение цепи" описывает способность полимеразы вытеснять по пути синтеза нижележащую встречную цепь ДНК. ДНК полимераза фага Phi29 обладает самой сильной активностью вытеснения цепи ДНК среди известных полимераз и наиболее активна в пределах диапазона температур 20-37 °С. Bsm ДНК полимераза не имеет 5'->3' и 3'->5' экзонуклеазных активностей, а Большой Фрагмент Bsm ДНК полимеразы имеет сильную активность вытеснения цепи и активен в широком диапазоне температур от 30°С до 63 °С с оптимальной для синтеза температурой 60 °С. Большой Фрагмент Bsu ДНК полимеразы имеет умеренную активность вытеснения цепи и работает в умеренном диапазоне температур, 20-37 °С. Большой Фрагмент Bst ДНК полимеразы, с другой стороны, будучи ферментом, хорошо вытесняющим цепь, имеет высокую оптимальную температуру 65 °С. Две другие полимеразы производства Nippon Gene Ltd. (Япония), Csa
ДНК полимераза (оптимальная температура реакции 60-70 °С) и 96-7 ДНК полимераза
(оптимальная температура реакции 50-55 °С), тоже обладают сильной активностью вытеснения цепи и используются в реакциях ДНКХРНК амплификации, таких как РКК или
LAMP (Loop mediated isothermal amplification). Реакция PKK использует «катящееся кольцо», репликативную структуру, в которой только одна цепь кольцевого дуплекса ДНК используется как матрица для множества раундов репликации, и приводит к линейной амплификации ДНК в виде линейных одноцепочечных конкатемеров за счет повторного синтеза одной и той же цепи с кольцевой матрицы. «Катящееся кольцо» образуется тогда, когда синтез ДНК, инициированный на З'-конце праймера, отожженного на одноцепочечном кольце (или З'-конце «ника» -одноцепочечного разрыва в двухцепочечной ДНК, или З'-конце «бреши» в ДНК), достигает 5'-конца этого же отожженного на кольце праймера (в случае одноцепочечного ДНК кольца), или двухцепочечного участка ДНК «гантели», или 5' конца «ника» или «бреши». Затем ДНК полимераза начинает вытеснять вышележащий 5' конец и саму цепь ДНК, не служащую матрицей для синтеза новой ДНК. Таким образом, при РКК копируется только одна цепь
ДНК. Элонгация синтезируемой цепи продолжается, и ДНК полимераза движется вокруг кольца, таким образом копируя последовательность ДНК кольцевой матрицы множество раз. Конечный продукт РКК представляет собой соединенное конец-в-конец
(конкатенированное) большое число копий кольца в виде одноцепочечной ДНК. Конечная длина такой конкатенированной ДНК зависит от процессивности ДНК полимеразы. Так,
РКК, катализируемая ДНК полимеразой фага Phi29, производит конкатемерные продукты размером >50 тыс. п.о. всего за 20-30 минут синтеза. Такие вновь синтезированные длинные линейные одноцепочечные молекулы спонтанно сворачиваются случайным образом в спирали размером в сотни нанометров и даже нескольких микрометров в длину.
В некоторых вариантах осуществления РКК инициируется на З'-конце «ника» или «бреши» в полностью двухцепочечной кольцевой ДНК. В этом случае ДНК полимераза не копирует сначала всю одноцепочечную кольцевую матрицу (как в случае одноцепочечного кольца) или же одноцепочечную часть ДНК «гантели» прежде чем начать вытеснять выше лежащую цепь, а сразу (или через один или несколько нуклеотидов) начинает вытеснять 5’ конец выше лежашего ДНК дуплекса.
В некоторых вариантах осуществления перед тем как полимераза помещается на поверхность, чтобы начать секвенирование по механизму РКК, осуществляется формирование комплексов «Полимераза-Праймер-ДНК Матрица». Это достигается путем двухступенчатого процесса: (а) отжиг-гибридизация олигонуклеотидных праймеров секвенирования с кольцами одноцепочечной ДНК (оцДНК) или одноцепочечными петлями ДНК «гантель» путем нагрева смеси до температуры >95 °С с последующим медленным охлаждением до ~ 22-30 °С приводящая к образованию бинарного комплекса «Праймер- ДНК Матрица»; (б) последующее добавление загрузочного буфера (буфер, способствующий связыванию полимеразы с поверхностью сенсора, т.е. «загрузке»
полимеразы на поверхность) и ДНК полимеразы фага РЫ29, приводящее к связыванию полимеразы с комплексом «Праймер-ДНК Матрица» и образование таким образом так называемого "замороженного" или "неактивного" (т.е. не функционирующего в данный момент, но готового к синтезу при наличии кофакторов) тройного комплекса
«Полимераза-Праймер-ДНК Матрица». На этом этапе нуклеотиды и ионы магния отсутствуют в реакционной смеси, чтобы предотвратить инициацию ДНК синтеза. Далее перед началом инициации реакции секвенирования неактивные тройные комплексы загружаются в проточную ячейку, подаются на поверхность матрицы и иммобилизуются на поверхности сенсоров ячеек матрицы.
В некоторых вариантах осуществления комплексы для иммобилизации, содержащие ДНК матрицу, могут быть собраны в один этап добавлением загрузочного буфера и ДНК полимеразы, например, фага Phi29, непосредственно к двухцепочечным ДНК (дцДНК) кольцам, имеющим «ник» или «брешь» в одной из цепей ДНК (бинарный комплекс «Полимераза-ДНК Матрица»), так как праймер для начала секвенирования в этом случае не нужен. Как и в других вариантах осуществления, нуклеотиды и ионы магния отсутствуют в реакционной смеси, чтобы предотвратить инициацию ДНК синтеза. Далее перед началом инициации реакции секвенирования неактивные бинарные комплексы загружаются в проточную ячейку и иммобилизуются на поверхности матрицы сенсоров, представляющей собой чип секвенирования.
В некоторых вариантах осуществления перед загрузкой тройных комплексов в проточную ячейку и их иммобилизацией на поверхности сенсоров инициируется контролируемый, ограниченный по времени РКК синтез ДНК тройными комплексами в реакционной смеси, чтобы получить относительно громоздкие структуры, представляющие собой тройные комплексы, связанные с одноцепочечными продуктами ограниченного синтеза, свернутыми в спираль небольшого размера. Линейный размер такого комплекса должен примерно соответствовать длине стороны ячейки сенсора, что контролируется длительностью РКК по времени. Такая ограниченная контролируемая по времени РКК инициируется добавлением всех четырёх нуклеотидов и ионов магния к сформированным тройным комплексам в растворе. После добавления кофакторов ДНК синтеза и инкубации при 25-30° С в течение времени, необходимого для получения продукта определенной длины, например, 2-5 минут, РКК реакция останавливается при помощи добавления в реакционную смесь хелатирующего ионы магния химического агента, например, этилендиаминтетрауксусной кислоты (ЭДТА). Сворачивание образованных конкатемерных РКК продуктов в случайную спираль, прикрепленную к исходной ДНК матрице и полимеразе, приводит к образованию компактных структур ДНК определенного диаметра. Длина продуктов РКК синтеза зависит линейно от времени реакции РКК, а их диаметр - не линейно. В некоторых аспектах свернутые конкатемерные
частицы имеют диаметр поперечного сечения по крайней мере 5 нанометров, по крайней мере 5 нанометров, по крайней мере 10 нанометров, по крайней мере 20 нанометров, по крайней мере 30 нанометров, по крайней мере 40 нанометров, по крайней мере 50 нанометров, по крайней мере 100 нанометров, по крайней мере 500 нанометров, по крайней мере 800 нанометров, по крайней мере 1 микрометр, по крайней мере 2 микрометра и более.
Такие громоздкие структуры, состоящие из случайной спирали, прикрепленной к полимеразе и исходной ДНК матрице («Полимераза-ДНК Матрица-РКК Продукт»), могут быть использованы в методах настоящего изобретения, для того чтобы только один полимеразный комплекс мог связаться с поверхностью только одного сенсора за счет эффекта стерического препятствия (steric hindrance effect). Таким образом, исключается возможность связывание двух и более тройных комплексов с одним сенсором. Однако, вероятность связывания более одного тройного комплекса с одним сенсором достаточно высока при использовании тройных комплексов, не подвергшихся ограниченной РКК, когда загрузка комплексов следует вероятностному распределению Пуассона (Poisson Distribution), так как ввиду малости своего размера по сравнению с площадью поверхности, события связывания тройного комплекса с поверхностью сенсора независимы друг от друга. Такой метод загрузки интермедиата реакции РКК, вместо нативных тройных комплексов, также позволяет обойти правило Пуассона и добиться почти 100% заполнения матрицы сенсоров единичными тройными комплексами. Загрузка же тройных комплексов, не подвергшихся ограниченному синтезу, следует распределению Пуассона и приводит в лучшем случае к ~40% заполненности сенсоров только одним иммобилизованным тройным комплексом.
В некоторых вариантах осуществления линейный размер комплексов «Полимераза-ДНК Матрица-РКК Продукт» примерно такой же, как поперечное сечение сенсора, и составляет по крайней мере 5-10 нанометров. В некоторых вариантах осуществления линейный размер комплексов «Полимераза-ДНК Матрица-Продукт РКК» составляет по крайней мере 10-20 нанометров (нм), или 20-50 нм, или 50-100 нм, или 100- 1000 нм, или 1-2 микрометра.
Методы настоящего изобретения основаны на детекции единичных актов разделения заряда (образование одного протона и одного электрона) происходящих в активном центре фермента полимеразы при встраивании ею нуклеотида в растущую при синтезе цепь ДНК. Для того чтобы обнаружить такие единичные явления активный центр полимеразы в составе тройного комплекса должен быть расположен достаточно близко к поверхности сенсора. В некоторых случаях полимераза расположена на расстоянии примерно 100 нм от немодифицированной поверхности сенсора, примерно 80 нм от немодифицированной поверхности сенсора, примерно 60 нм от немодифицированной
поверхности сенсора, примерно 50 нм от немодифицированной поверхности сенсора, примерно 20 нм от немодифицированной поверхности сенсора, примерно 15 нм от немодифицированной поверхности сенсора, примерно 10 нм от немодифицированной поверхности сенсора, примерно 5 нм от немодифицированной поверхности сенсора. В других случаях, полимераза расположена на расстоянии меньше чем примерно 5 нм от немодифицированной поверхности сенсора: примерно 4 нм от немодифицированной поверхности сенсора, примерно 3 нм от немодифицированной поверхности сенсора, примерно 2 нм от немодифицированной поверхности сенсора, или примерно 1 нм от немодифицированной поверхности сенсора. Чтобы соответствовать этим требованиям, собранный заранее комплекс, «Полимераза-Праймер-ДНК Матрица» или «Полимераза-
ДНК Матрица-РКК Продукт», должен быть привязан к поверхности сенсора за счёт полимеразной части комплекса. Чтобы добиться этого, молекула полимеразы должна быть определённым способом (химически, или генетически, или биохимически) модифицирована так, чтобы создать участок связывания, который бы при взаимодействии с химической(ими) группой(ами), или лигандом (ами), или белком (ами), прикрепленными на поверхности сенсора, мог образовать химическую связь(и) достаточно крепкую, чтобы выдержать физические и химические условия среды, сопутствующие процессу секвенирования. В частности, определение потенциальных участков для модификации на поверхности ДНК полимеразы фага РЫ29 значительно облегчается наличием известной трехмерной структуры белка (Berman AJ, et al., EMBO J.
(2007) 26 p.3494-3505). Очень важно, чтобы контролируемая модификация полимеразы была последовательно одинаковой для всех молекул полимеразы в комплексах. Тогда все молекулы полимеразы, привязанные к массиву сенсоров, будут ориентированы одинаково и будут иметь последовательно одинаковое расстояние от активного центра фермента до поверхности сенсора, а значит меньшую вариабельность в детектировании акта встраивания нуклеотида при секвенировании. Таким образом, и полимераза, и поверхность сенсора должны быть модифицированы так, чтобы полимеразная часть комплекса могла связаться с поверхностью сенсора на как можно более близком расстоянии, чтобы сенсор мог детектировать событие встраивания каждого нуклеотида.
Подходы и технологии иммобилизации можно условно разбить на три группы: физическая сорбция, биоафинное связывание и ковалентное связывание. Только два последних типа иммобилизации могут быть осуществлены в полностью контролируемом режиме в плане заданной трехмерной ориентации фермента относительно поверхности. Среди них ковалентная иммобилизация наиболее предпочтительна из-за ее специфичности, стабильности и быстроты.
В некоторых вариантах осуществления полимераза иммобилизуется на поверхности за счёт биоафинного связывания. Например, полимераза модифицируется
путем создания одной, двух и более биотиновых меток на поверхности белка. Такая биотиновая метка может представлять собой искусственный пептид AviTag, состоящий из
15 аминокислот (GLNDIFEAQKIEWHE) (Avidity LLC, США; см. http://www.avidity.com), который специфически узнается ферментом Биотин Лигазой (BirA) из Е. Со//', который биотинилирует аминокислоту лизин (К) в AviTag (Beckett D., et al., Protein Sci. 1999 Apr;
8(4):921-9; M. Fairhead and M. Howarth, Methods Mol Biol. 2015 ; 1266: 171-184). После идентификации места на поверхности полимеразы для встраивания AviTag производится модификация гена полимеразы, и AviTag становится интегральной частью фермента.
Далее выделенный белок биотинилируется in vitro путем обработки Биотин-протеин лигазой (ЕС 6.3.4.15), которая активирует биотин с образованием биотинил 5' аденилата и переносит биотин на AviTag полимеразы. Avidity LLC (США) коммерциализировала также штаммы, например, AVB101 , в которых можно при наращивании бактериальной массы индуцировать биотинилирование AviTag in vivo. Такая биотинилированная полимераза может быть селективно иммобилизованна на поверхности сенсора, несущего молекулу(ы) стрептавидина, белка имеющего сильную афинность к биотину.
Формирующийся стрептавидин-биотин комплекс является самым сильным не ковалентным взаимодействием (Kd = 10 15 М) из известных между белком и лигандом.
Модификация поверхности сенсора осуществляется в несколько этапов. Если поверхность состоит из диоксида кремния (Si02), она сначала покрывается биотин-ПЭГ- силаном (например, биотин-полиэтиленгликоль-триметоксисиланом от Laysan Bio. ,lnc.,
США) или смесью биотин-ПЭГ-силана и ПЭГ-силана (например, 2-
[метокси(полиэтиленокси)6-9пропил] триметоксисилан, Мол.Вес 460-590 от Gelest, Inc.).
В качестве альтернативы поверхность сенсора может быть модифицирована т.н. ZeroBkg
«щёткой» биотин-ПЭГа (производится MicroSurfaces Inc. США). Следующим этапом такая пегилированная и биотинилированная поверхность обрабатывается тетрамерным белком стрептавидином, который связывается с одним или двумя биотинами на поверхности, образуя тем самым слой стрептавидина. После удаления несвязавшегося стрептавидина добавляются ДНК-полимеразные комплексы, несущие биотиновую группу в составе
AviTag, которые связываются в свою очередь с оставшимися свободными валентностями на молекулах стрептавидина. В целом депозитирование биотин-ПЭГ-силана (или смеси биотин-ПЭГ-силана и мПЭГ-силана) с помощью техники ковалентного переноса из растворителя (solvent-based, covalent grafting technique) улучшает специфичность прикрепления биотинилированной полимеразы за счёт отталкивания неспецифической адсорбции белков. Успешным примером использования AviTag технологии является удачная встройка двух биотиновых «ножек» в ДНК полимеразу, где привязанная к поверхности полимераза стала более процессивной (John G. К. Williams, et al, Nucleic
Acids Research, 2008, Vol. 36, No. 18 e121).
В некоторых вариантах осуществления биоафинного связывания, когда поверхность сенсора покрыта золотом (Аи) тоже может быть использована полимераза, модифицированная путем создания одной, двух и более биотиновых меток на поверхности белка. Биотин является витамином и представляет собой бициклическое
5 кольцо и карбоксильную группу на боковой цепи валериановой кислоты. Эта карбоксильная группа биотина после модификации может стать биотинилирующим агентом. Такие функциализированные NHS-эфиром, гидразидом, или малеимидом биотины сохраняют интактным бициклическое кольцо, нужное для связывания с авидином (S. Luo и D. R. Walt. Anal. Chem. 61 :1069 (1989); и R. N. Orth, T. G. Clark и H. G. ю Craighead, Biomed. Microdevices, 2003, 5, 29). Биотины с этими функциональными группами могут быть нанесены непосредственно на поверхность золота, покрытую самособирающимся монослоем (ССМ) за счёт реакции с аминами, тиолами, или другими подходящими реакционными группами на концах ССМ. Также молекулы биотина могут быть созданы на поверхности золота непосредственно путём образования ССМ рядом химических соединений на основе серы (S) содержащих биотиновые и гидроксильные группы (J. Spinke, et al, J. Chem. Phys., 1993, 99, 7012). Таким образом, полимераза иммобилизуется на поверхности золота за счёт связывания с биотинами на ССМ через формирование «сэндвича» биотин-стрептавидин-биотин.
В некоторых вариантах осуществления для биоафинного связывания с
20 поверхностью, содержащей диоксид кремния (Si02), полимераза может быть модифицирована с помощью добавления поли-гистидиновой метки, например шести аминокислотных оснований гистидина, к N-концу или С-концу белка. При такой модификации [Ню^-меченная полимераза иммобилизуется на поверхности сенсора через взаимодействие с хелатирующими ионами Си2+ или Ni2+, прикрепленными к слою высокоплотного полиэтиленгликоля (ПЭГ), покрывающего Si02 поверхность сенсора. Такая обработка сенсора, Ni-HTA-ПЭГ (Ni-нитрилотриацетатная кислота-ПЭГ) или Си- НТА- ПЭГ (Си-нитрилотриацетатная кислота-ПЭГ) (MicroSurfaces Inc., США), создает высоко гидрофильную поверхность, препятствующую неспецифическому связыванию полимеразного комплекса с поверхностью.
зо В некоторых вариантах осуществления для биоафинного связывания с поверхностью, содержащей золото (Аи), полимераза модифицирована с помощью добавления поли-гистидиновой метки, например шести аминокислотных оснований гистидинаб [His]6, к N- или С-концу белка. При такой модификации [Hisfe-меченная полимераза иммобилизуется на поверхности сенсора через взаимодействие с
35 хелатирующими ионами Си2+ или Ni2+, прикрепленными к самособирающемуся монослою (ССМ), имеющему НТА (нитрилотриацетатная кислота) группы. Такая модификация поверхности золота может быть получена, например, следующим способом в два этапа:
сначала используя меркаптогексадеканоевую кислоту формируется высокоупорядоченный слой с концевыми карбоксильными группами, а затем карбоксильная группа конденсируется с помощью производного нитрилотриацетатной кислоты содержащей аминогруппу для формирования пептидной связи. Плотность НТА групп контролируется условиями реакции (Thao Т. Le, et al, Phys. Chem. Chem. Phys.,
2011 ,13, 5271-5278). CCM с НТА группами можно получить и другим способом, например, обработкой ССМ собранного из 11-меркаптоундециламина гетеробифункционал ьным линкером N-сукцинимидил S-ацетилтиопропионатом (САТП), что приводит к образованию на поверхности ССМ концевых сульфгидрильных групп. Затем реакция малеимид-НТА молекул с сульфгидрильными группами приводит к образованию поверхности покрытой
НТА-группами (Greta J. Wegner, et al, Anal. Chem., 2003, 75 (18), pp 4740-4746). Можно также прикрепить НТА с концевыми аминогруппами к ССМ несущему NHS-концевые группы, как описано в Vallina-Garcia R, et al, Biosens Bioelectron, 2007 Sep 30;23(2):210-7.
Ещё можно использовать самособирающийся на Au-поверхности полимер, представляющий собой полиакриламид-ко-п-акрилоксисукцинимид кополимер, функционализированный тандемом активного эфира (NHS) сшитого с 3-
(метилтио)пропиламином (МТП) и НТА. В результате получается гидрофильная пленка толщиной 2-5 нм несущая НТА-группы (Thompson LB, et al, Phys Chem Chem Phys. 2010
May 7; 12(17):4301-8).
В некоторых вариантах осуществления полимераза, несущая одну или больше сульфгидрильных (тиоловых) групп (-SH) на ее поверхности, иммобилизуется на поверхности сенсора, модифицированной малеимидной реактивной группой. Сульфгидрильные группы находятся в боковых цепях цистеина (Cys, С). Часто они являются частью вторичной или третичной структуры белка, и могут быть соединены через боковые цепи дисульфидными связями (-S-S-). Ковалентная связь между малеимидной группой и сульфгидрильной группой является одной из наиболее селективных и легких реакций в химии биоконьюгации. Большим преимуществом такой стратегии является то, что для ковалентной иммобилизации белка в общем случае не нужна пришивка специальных меток-«тэгов» и химических модификаций белка. Кроме того, тиольные группы могут быть использованы, чтобы направить реакцию связывания белка с поверхностью подальше от активных центров ферментов. Иммобилизация на поверхности проводится следующим образом: сначала создаются сульфгидрильные группа(ы) на поверхности белка путём восстановления дисульфидных связей, или после химической модификации первичных аминов путем введения SH-групп с помощью специфических реагентов. Затем эти сульфгидрильные группы ковалентно связываются с поверхностью, модифицированной (активированной) малеимидом. Хотя дисульфидные связи между двумя цистеинами в белках являются очень стабильными,
они могут быть восстановлены редуцирующими агентами (R-SH) такими как дитиотрейтол
(ДТТ), 2-меркаптоэтанол, и т.д. ,
В некоторых вариантах осуществления для иммобилизации на активированной малеимидом поверхности могут использованы уже существующие в полимеразе сульфгидрильные группы, находящиеся на поверхности белка, или же новые цистеины могут быть созданы в заданных участка белка, лежащих на поверхности, основываясь на данных трёхмерной структуры фермента. Для создания новых остатков Cys желательно заменять на них поверхностно лежащие серины (Ser) (полярная и изостеричная аминокислота) и аланины (Ala) (маленькая, гидрофобная аминокислота), так как такие замены меньше всего нарушают существующую структуру белка. При необходимости «зарытые» внутрь белка и не вовлеченные в дисульфидные связи Cys остатки могут быть элиминированы заменой на, например, Ser и Ala.
В некоторых вариантах осуществления для связывания полимеразы имеющей сульфгидрильные группы на поверхность сенсора, содержащую золото (Аи), может использована химическая реакция, основанная на самособирающемся монослое (ССМ) алкантиолов, на концах которых расположены функциональные группы, такие как амин или карбоксильная группа. Атомы серы алкантиолов взаимодействуют с золотом, образуя крепкие стабильные связи, а цепи метиленов способствуют самосборке алкантиолового слоя за счет сил ван дер Ваальса. Затем ССМ с концевым амином модифицируется с помощью амин-сульфгидрил кросслинкера ССМЦК (сульфосукцинимидил 4-(1М-малеимидометил)циклогексан-1 -карбоксилат), который содержит NHS-эфир и малеимидные рективные группы на противоположных концах. В результате получается активированный ССМ с концевыми малеимидными группами готовыми ковалентно связать фермент, имеющий доступную для связывания сульфгидрильную группу(ы).
В некоторых вариантах осуществления для связывания полимеразы, имеющей сульфгидрильные группы, на поверхность сенсора, содержащую диоксид кремния, используется линейный гетеробифункциональный ПЭГ реагент, имеющий малеимид и силан: МАП-ПЭГ-Силан, например сделанный CreativePEG Works Inc., США (Ogorzalek, TL, Examining the Behavior of Surface Tethered Enzymes, Diss. University of Michigan, 2015). Малеимид взаимодействует с сульфгидрильной группой, а силан - с гидроксилированной поверхностью диоксида кремния. ПЭГ подавляет неспецифическое связывание заряженных молекул, например, ДНК и белков, с поверхностью.
Ниже приведено более подробное описание вариантов устройства секвенирования, реализующих одномолекулярный способ секвенирования, которые также являются предметом настоящего изобретения.
Устройство содержит микросхему матрицы ячеек сенсоров, которая является основным компонентом устройства одномолекулярного секвенирования (секвенатор) во всех вариантах его конструктивного исполнения.
В каждой ячейке матрицы микросхемы организуют выполнение процедуры полимеризации одного одноцепочечного фрагмента нуклеиновой кислоты, в составе иммобилизованного на подготовленную поверхность сенсора ячейки комплекса «полимераза-матрица ДНК-праймер», результаты встраивания нуклеотидов полимеразой в ходе реакции полимеризации одноцепочечных фрагментов ДНК (далее - реакция) в каждой ячейке матрицы преобразуются в полезный сигнал сенсором ячейки и регистрируется аналого-цифровой схемой ячейки; реакции полимеризации фрагментов ДНК в ячейках матрицы происходят независимо друг от друга.
В зависимости от решаемой задачи секвенирования может быть:
- выбран темп встраивания нуклеотидов одновременно для всех ячеек матрицы, в широком диапазоне: от 1-го нуклеотида в секунду и менее, и до 50-60-ти нуклеотидов в секунду и более, посредством управления значениями таких параметров реакции, как температура, pH раствора, концентрация нуклеотидов в реакционной смеси, выбором варианта генной модификации той или иной полимеразы;
- выбрана микросхема матрицы с соответствующим количеством ячеек сенсоров (может содержать от менее чем 1 048 576 до 256 000 000 и более ячеек в матрице);
- выбран одноматричный или четырехматричный вариант конструкции секвенатора для применения последовательного или параллельного способа секвенирования, соответственно.
В некоторых вариантах осуществления темп встраивания нуклеотида составляет 0.1 - 2 нуклеотида в секунду. В некоторых вариантах осуществления темп встраивания нуклеотида составляет 1 - 10 нуклеотидов в секунду. В некоторых вариантах осуществления темп встраивания нуклеотида составляет 10-50 нуклеотидов в секунду. В некоторых вариантах осуществления темп встраивания нуклеотида составляет 50 - 100 нуклеотидов в секунду.
Микросхема матрицы ячеек сенсоров может изготавливаться по стандартному полупроводниковому КМОП технологическому процессу или по индивидуальному технологическому процессу (в зависимости от того, какая конструкция сенсора применяется). Обеспечение доступа биоматериала к поверхности сенсора каждой ячейки матрицы реализуется набором стандартных технологических операций, предусмотренных технологическим процессом, и последующей обработкой этих поверхностей тем или иным способом, варианты которых описаны в разделе «Подходы и технологии иммобилизации ...».
Например, микросхема матрицы ячеек сенсоров может как содержать все ниже перечисленные блоки, так и содержать только часть из них. Один из возможных вариантов структурной схемы микросхемы матрицы ячеек сенсоров показан на Фиг. 10.
1. Матрица ячеек сенсоров включает в себя:
1.1. Ячейки сенсоров, расположенные в рядах и столбцах матрицы, каждая из которых состоит из:
1.1.1. Электронного сенсора Ns1, формирующего полезный сигнал;
1.1.2. Электронного сенсора N°2, формирующего фоновый сигнал;
1.1.3. Дифференциальный зарядовый усилителя, подключенного к сенсорам;
1.1.4. усилителя сигнала (повторителя);
1.1.5. Триггера Шмитта (для исключения влияния шумов входного сигнала на выходной сигнал)
1.1.6. Делителя тактовой частоты, схема тактирования триггера;
1.1.7. Тактируемого триггера (например, D триггер с выходом с тремя состояниями) для перезаписи сигнала с выхода триггера Шмитта на выход схемы ячейки;
1.2. Датчик температуры со схемой измерения и передачей данных в контроллер микросхемы.
1.3. Вертикальный сдвиговый регистр переноса данных от выхода схем ячеек - для каждого столбца ячеек матрицы.
1.4. Горизонтальный сдвиговый регистр переноса данных из вертикальных регистров на выход микросхемы.
2. Контроллер обмена данными с устройством обработки и отображения данных (компьютером) по интерфейсу USB, обеспечивающий вывод данных от каждой ячейки матрицы в компьютер, управляющий величинами опорных напряжений и частотой тактовых импульсов, необходимых для работы аналого-цифровых схем ячеек матрицы, управляющий температурой микросхемы и водного раствора над ее поверхностью (или только температурой водного раствора над поверхностью матрицы микросхемы).
3. Генератор тактовой частоты формирует сетку частот для работы аналого- цифровых схем ячеек матрицы и сдвиговых регистров переноса данных, управляемых контроллером.
4. Источник опорных напряжений - обеспечивает необходимыми токами и напряжениями элементы аналого-цифровых схем ячеек матрицы, регистры переноса данных.
5. Электрод смещения и управляемый контроллером источник напряжения для него.
6. USB интерфейс передачи данных между компьютером и микросхемой.
Пример варианта структурной схемы четырех матричного устройства, реализующего одномолекулярный способ секвенирования, показан на Фиг. 11.
Микросхема матрицы ячеек сенсоров с крышкой микрофлюидного устройства 12 является основным компонентом устройства одномолекулярного секвенирования.
Неотъемлемой частью устройства секвенирования в любом из его вариантов конструктивного выполнения является микрофлюидное устройство, которое обеспечивает:
- подачу водных растворов на поверхность матриц микросхем с целью иммобилизации комплексов на поверхность сенсоров ячеек матрицы,
- подачу водных растворов реакционных смесей на поверхность матриц микросхем 12 с целью обеспечения проведения реакций в ячейках матриц,
- подачу буферного раствора на поверхность матриц микросхем 12 с целью подготовки этих поверхностей к процедурам иммобилизации комплексов и секвенирования,
- измерение проводимости раствора на выходе крышки микросхемы 12 с целью определения качества промывки буферным раствором поверхности матрицы микросхемы 12,
- регулирование температуры матрицы микросхемы 12 и водного раствора над ней посредством элемента Пельтье посредством контроллера микросхемы на основании показаний датчика температуры; значение температуры, которое необходимо поддерживать, передается контроллеру микросхемы устройством обработки и отображения данных (компьютером);
- слив растворов с поверхности матрицы микросхемы 12.
В состав микрофлюидного устройства (изображено на Фиг. 11) может входить:
- четыре бака малого объема для размещения в них четырех растворов 10 с реакционными смесями;
- один бак большого объема 11 для размещения в нем буферного раствора,
- один бак большого объема 11 для размещения в нем комплексов, например, «полимераза-фрагмент ДНК-праймер»,
- один бак большого объема 11 для размещения в нем раствора веществ, необходимых для подготовки поверхности матрицы микросхемы к иммобилизации комплексов на поверхности сенсоров ячеек матриц микросхемы,
- один бак большого объема 11 для слива растворов с поверхности матрицы микросхемы;
- крышка микросхемы матрицы ячеек сенсоров для одноматричного устройства секвенирования, и четыре крышки микросхемы матрицы ячеек сенсоров для 4-х матричного устройства секвенирования, - для удержания растворов на поверхности матрицы микросхемы,
- насос 13 с электрическим приводом, для каждой микросхемы 12 устройства секвенирования;
- отсечные клапана 14 с электрическим приводом, обеспечивающие возможность раздельной подачи буферного раствора, раствора с веществами для иммобилизации комплексов, раствора с реакционной смесью на поверхность матрицы микросхемы 12;
- элемент Пельтье 16 (входящий в состав устройства поддержания температуры рабочего раствора) для каждой микросхемы 12 устройства секвенирования;
- датчик температуры полупроводникового типа, интегрированный в состав схемы микросхемы вместе со схемой формирования электрического сигнала, соответствующего показаниям датчика; датчик температуры может быть дискретным, полупроводникового или иного типа, интегрированным в крышку микросхемы матрицы ячеек сенсоров, со схемой формирования электрического сигнала, интегрированного в состав схемы микросхемы;
- электроды 15 для измерения проводимости раствора на выходном патрубке каждой крышки микросхемы 12.
Микрофлюидное устройство и каждая микросхема 12 матрицы ячеек сенсоров работают под управлением контроллера 17 и устройства обработки и отображения данных (компьютера) 18 устройства секвенирования, которые также являются неотъемлемой частью устройства секвенирования. Устройство обработки и отображения данных 18, включающее один или несколько процессоров, служит для приема, обработки и хранения данных о секвенируемых нуклеиновых кислотах, а также для управления всеми процедурами секвенирования. Как вариант, микрофлюидное устройство и микросхема могут работать под управлением контроллера микросхемы, соответствующие команды которому передаются устройством обработки и отображения данных (компьютером).
Средство хранения данных может представлять собой жесткий диск (HDD), твердотельный накопитель (SSD), флэш-память (NAND- flash, EEPROM, Secure Digital и т.п.), оптический диск (CD, DVD, Blue Ray), мини диск или их совокупность.
Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные эксперименты приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть понятно, что возможно осуществление различных модификаций без отступления.
Нижеследующие примеры работы устройства приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения от сути настоящего изобретения.
Пример 1. Репликация катящегося кольца (РКК) тройным комплексом «Полимераза-Праймер-ДНК Матрица» происходит на твердой поверхности сенсора.
Чтобы сконструировать кольцевую одноцепочечную ДНК матрицу для синтеза ДНК полимеразой фага РЫ29 в качестве матрицы для ПЦР использовали 10 нг олигонуклеотида Ультрамера длиной 177 нт (Integrated DNA Technologies Inc., США). Реакция проводилась в реакционной смеси в объеме 50 мкл содержащем 2х Q5 Polymerase смесь (New England Biolabs, Inc., США), матрицу, и 500 нМ прямого и обратного ПЦР праймеров.
Термоциклирование проводилось в следующих условиях: 98 °С 30 сек; затем 30 циклов - 98 °С 10 сек, 58 °С 30 сек, 72 °С 40 сек; далее 72 °С 2 мин. По завершению ПЦР двухцепочечные продукты были очищены используя набор для очистки ДНК и элюированы 50 мкл 50 мМ Трис pH 8.0.
2 пикомоля (пм) ПЦР продукта были смешаны со 100 пм олигонуклеотида- «мостика», денатурированы нагреванием 3 мин при 95°С с последующим кратким охлаждением 3 мин во льду, и закольцованы лигированием 1 час при 37 °С в 1х ТА Буфере (33 мМ Трис-ацетат pH 7.5, 66 мМ калий ацетат, 10 мМ магний ацетат, и 0.5 мМ ДТТ.) с добавлением 1 мМ АТФ, 2 Единиц/мкл Т4 ДНК Лигазы (New England Biolabs, Inc., США). Для переваривания остатков не закольцованного ПЦР продукта и избытков олигонуклеотида-«мостика» к лигазной смеси были добавлены Экзонуклеаза I и Экзонуклеаза III (обе от Enzymatics, Inc., США) до конечной концентрации 0.7 Единиц/мкл и 1 Единиц/мкл соответственно, и реакция переваривания продолжалась 30 мин при 37°С. Реакция была остановлена добавлением ЭДТА до конечной концентрации 25 мМ.
Ковалентно-замкнутые одноцепочечные кольца (оцКольца) были очищены из реакционной смеси используя NucleoSpin® Gel и PCR Clean-Up Kit (Clontech, Takara Co., Япония).
В приводимом примере олигонуклеотид-«мостик» использовался также в качестве праймера для РКК, с которого инициировался синтез ДНК полимеразой фага РЫ29. Для получения тройных комплексов «Полимераза-Праймер-ДНК Матрица» сначала 100 фемтомолей оцКолец были смешаны с олигонуклеотидом-«мостиком» (конечная концентрация 0.5 микроМоль) в буфере 10 мМ Трис рН8.0/25 мМ NaCI/0.1 мМ ЭДТА, нагреты до 94 °С на протяжении 3 мин, охлаждены до 52 °С в течении 5 мин, и затем медленно охлаждены до 30 °С. В результате этого были получены комплексы «Праймер- Матрица». Затем к комплексам был добавлен 10х Загрузочный Буфер до 1х конечной концентрации: 50 мМ Трис-НС1/10 мМ (NH4)2SC>4/4 мМ ДТТ/0.05% Твин-80 pH 7.5. Затем к смеси была добавлена Ехо‘ (D66A) ДНК полимераза фага РЫ29 несущая N- терминальную Биотин-метку, создавая 2-х кратный избыток комплекса «Праймер-
Матрица» по отношению к полимеразе. Смесь инкубировалась при 10 °С в течении 15 мин для образования тройных комплексов. Метод прикрепления к полимеразе биотиновой метки хорошо известен в уровне техники (например, Beckett D., et al, Protein Sci., 1999 Apr; 8(4):921-9; Fairhead и Howarth, Methods Mol Biol., 2015, 1266: 171-184).
Тройные комплексы были помещены в проточную ячейку, сделанную из ПЭГилированного с помощью ПЭГ-силана (2-[methoxy(polyethyleneoxy) 6-9 propyl] trimethoxysilane, MPEOPS, MW = 460-590, Gelest Inc., США) стеклянного слайда, тонкого покровного стекла, модифицированного ПЭГ-биотином (MicroSurfaces Inc., США), и чувствительного к давлению адгезивного материала толщиной 100 микрометров (PSA, ЗМ Inc., США) играющего роль спэйсера. Перед помещением тройных комплексов белок стрептавидин был иммобилизован на биотинилированном слое ПЭГ в результате добавления 20 мкл 0.1 мг/мл стрептавидина, растворенного в буфере, содержащем 10 мМ Трис-НС1/50 тмМ NaCI pH 8.0. После одноминутной инкубации избыток стрептавидина был удален из проточной ячейки ее промывкой 100 мкл того же буфера. После этого в ячейку были добавлены тройные комплексы и иммобилизованы на ПЭГ- Биотин-Стрептавидин поверхности в течении 15 мин при 10°С. В качестве контроля тройные комплексы были также помещены во вторую проточную ячейку, поверхность которой не была обработана стрептавидином. Не связавшиеся с поверхностью комплексы были удалены из проточных ячеек промыванием 200 мкл 1х Загрузочного Буфера. Затем, чтобы запустить РКК реакцию, в проточную ячейку был подан раствор 1х Загрузочного Буфера с добавкой 10 мМ MgCI2 (конечная концентрация) и 400 нМ dNTP (конечная концентрация каждого нуклеотида). РКК реакция продолжалась 20 мин при 30°С. Реакция была остановлена добавлением 25 мМ раствора ЭДТА pH 8.0.
Для того, чтобы визуализировать продукты реакции ДНК синтеза, выполненного Phi29 полимеразой на поверхности чипа, продукты реакции были окрашены ДНК интеркаляторным красителем GelStar Stain (Lonza Rockland Inc., Rockland, USA), разведенным 10 000 раз в буфере: 10 мМ Трис-НС1/50 mM NaCI pH 8.0. Сразу после добавления красителя в проточную ячейку чип помещался на флюоресцентный микроскоп Zeiss Axiovert, освещался 480 нанометровым лазером, и окрашивание продуктов записывалось на цифровую камеру. Результаты этого эксперимента представлены на Фиг. 6А, и демонстрируют способность иммобилизованной на поверхности ДНК полимеразы Phi29 осуществлять синтез ДНК с кольцевой матрицы. Контрольный образец поверхности покровного стекла не пассивирован стрептавидином, а значит не способен связывать тройной комплекс, что и приводит к отсутствию видимых продуктов синтеза ДНК полимеразой. Отдельные немногочисленные продукты, видимые на контрольной поверхности, возникают за счет слабого неспецифического связывания тройных комплексов с PEG-биотин поверхностью (см. Фиг. 6Б).
Пример 2. Полупроводниковый сенсор и схема ячейки матрицы, изготовленные по полупроводниковой КМОП технологии.
Примеры возможных конструкций ячейки сенсора представлены на Фиг. 12-14, 16, 17, в том числе со схемой, реализующей функцию стохастического резонанса, представленной на Фиг. 15.
Реакция полимеризации фрагмента ДНК полимеразой комплекса 19, 25, 31, 38, иммобилизованного на поверхности сенсора ячейки, в результате взаимодействия полимеразы с реагентами раствора реакционной смеси 22, 28, 34, 41, сопровождается разделением и локализацией отрицательного заряда (электрона) и свободного протона около активированного сегмента фрагмента ДНК. Таким образом, результатом реакции является генерация пары электрон - протон, с последующей локализацией электрона на активированном сегменте фрагмента ДНК и дрейфом протона в водном растворе реакционной смеси во внешнем электрическом поле ячейки по направлению к электроду смещения 23, 29, 35, 42, который подключен к источнику напряжения, управляемому контроллером микросхемы матрицы ячеек сенсоров. В процессе дрейфа протона происходит его экранировка отрицательными ионами раствора (например, ОН ) за характерное время тэп. Кроме того, локализованный электрон, находящийся в области диффузионного слоя, в течении некоторого характерного времени тээ также будет экранирован ионами раствора. Таким образом, на приемном электроде (т.е. в объеме затворной области канала транзистора считывающего заряд - далее считывающий электрод), с характерным временем дрейфа Та протона в рабочем растворе растет величина заряда, индуцированного суперпозицией полей от локализованного на активированном сегменте фрагмента ДНК отрицательного заряда и положительного заряда протона, дрейфующего от места разделения зарядов во внешнем поле в направлении электрода смещения, усугубленного развивающейся экранировкой протона ионами гидроксильных групп. Т.е. принципиально важным обстоятельством, обеспечивающим саму возможность появления индуцированного потенциала на считывающем электроде, является наличие электрического поля в водном растворе, которое увеличивает скорость дрейфа протона, что обеспечивает большую величину для характерного времени тэп полной экранировки протона отрицательными ионами раствора. Электрическое поле в водном растворе создается приложенным потенциалом к электроду смещения, который расположен, например, на внутренней стороне крышки микросхемы. Напряжение смещения задается управляемым источником напряжения (питания) относительно потенциала общего электрода (на Фигурах не показан). Источником напряжения смещения управляет контроллер микросхемы, имеющий обратную связь с аналого-цифровой схемой ячейки. После того, как все подготовительные к секвенированию операции завершены, устройство обработки и
отображения (компьютер) передает данные контроллеру микросхемы о том, что реакции полимеризации фрагментов ДНК, с большой долей вероятности, начались в ячейках.
После декодирования этих данных контроллер микросхемы анализирует значения логических величин в последовательности временных интервалов с выхода аналого-
5 цифровой схемы ячейки, последовательно, с временной задержкой, управляет увеличением напряжения с выхода источника напряжения (питания) смещения от нуля
Вольт до некоторой величины, которая обеспечивает регистрацию и формирование сигнала. Механизм индуцирования заряда на поверхности затвора полевого транзистора в ходе реакции полимеризации фрагмента ДНК и регистрации результата его ю образования описан, например, в работах Надара Пурманда (Pourmand N, et al., Proc Natl
Acad Sci USA, 2006 Apr 25; 103(17):6466-70; Pourmand N, et al., A label-free CMOS DNA microarray based on charge sensing, in Proceedings of the IEEE Instrumentation and
Measurement Technology Conference, Victoria, BC, Canada, May 12-15, 2008).
Реакция полимеризации фрагмента ДНК в ячейке организована таким образом, что происходит в среднем несколько, например, пять встраиваний полимеразой комплементарных нуклеотидов в секунду. Каждое встраивание нуклеотида сопровождается разделением одной пары зарядов. Факт разделения каждой пары зарядов регистрируется и преобразуется сенсором ячейки в электрический сигнал, который сначала усиливается дифференциальным зарядовым усилителем, потом
20 усилителем, с выхода которого поступает на компаратор с положительной обратной связью (триггер Шмитта); с выхода которого сигнал уже в цифровой форме фиксируется, например, D-триггером, установкой его выхода в состояние логической“Г.
Функционально, индуцированный потенциал на затворе полевого транзистора модулирует амплитуду тока в канале транзистора, сток которого подключен к дифференциальному зарядовому усилителю; другой вход дифференциального усилителя подключен, например, к стоку полевого транзистора сенсора, транзистором которого формируют фоновый сигнал Фиг. 14. Выход дифференциального усилителя соединен со входом усилителя, назначение которого состоит в том, чтобы сформировать на своем выходе амплитуду напряжения полезного сигнала такой величины, которая зо достаточна для переключения триггера Шмитта, построенного на основе компаратора с положительной обратной связью, в состояние логической“Г. Выход триггера Шмитта соединен со входом D-триггера, который тактируется схемой деления ячейки тактовой частотой генератора микросхемы, перезаписывая логические значения (“1” и “О”) с выхода триггера Шмитта на выход D-триггера с частотой, превышающую частоту (темп)
35 встраивания нуклеотидов в ходе реакции полимеризации, например, в четыре раза. В результате, на выходе аналого-цифровой схемы будут формироваться последовательности дискретных интервалов времени, аналогичные тем
последовательностям, которые представлены на Фиг. 5 А: логической единицей обозначаются интервалы времени, когда сенсором и аналого-цифровой схемой ячейки были, соответственно, зарегистрированы и сформированы сигналы о фактах разделения зарядов вблизи от считывающего электрода. Сопоставить зарегистрированные факты разделения пар зарядов с их причиной (встраиванием полимеразой комплементарного нуклеотида) помогает знание априори темпа встраивания полимеразой нуклеотидов трех видов, концентрация которых нормальна в водном растворе реакционной смеси. Сначала производится расчет значений параметров водного раствора реакционной смеси, таких как: pH, температура раствора, концентрации нуклеотидов всех видов, которые обеспечивают желаемый темп полимеризации фрагмента ДНК, а потом значения этих параметров устанавливаются для рабочих растворов перед началом секвенирования.
Напряженность электрического поля на границе раздела считывающий электрод - раствор определяется суперпозицией полей от упомянутых выше зарядов: локализованного на активном сегменте фрагмента ДНК отрицательного заряда величиной в один электрон, и положительного заряда дрейфующего протона, и может быть представлена выражением:
Здесь mr -подвижность протона в электролите, Е- напряженность суперпозиции полей в электролите близ считывающего электрода, t - текущее время, xm - расстояние от места локализации электрона на фрагменте ДНК до плоскости границы раздела электрод - раствор (х=0), e - диэлектрическая проницаемость рабочего раствора, q - элементарный заряд, e0 - диэлектрическая постоянная вакуума.
Для определения возможности полупроводниковым сенсором регистрировать результат разделения одной пары зарядов были выполнены соответствующие расчеты. Оценки параметров ячейки выполнялись для размеров считывающего электрода (затвора полевого транзистора) 30 нм х 100 нм, для водного раствора с рН=7,5 концентрации протонов и ионов (ОН ) взята равной ~ N(H+)=N(OH 1) ~ 3,3x10 10 моль/см3 (в 1 см 3 находится N(H+)~N(OH 1) = 2x1014 штук), т.е. расстояние между ними (ионами гидроксильных групп и протонами) в водном растворе r0= (NM0Ha) 1/3= 2x105 см = 0,2 мкм= 2x107 м; коэффициент диффузии протона в водном растворе принят равным Dp=9,3x105
см2/Вс, коэффициент диффузии иона гидроксильной группы принят равным D0H = 5x105 см2/Вс; для коэффициента диэлектрической проницаемости водного раствора приняли значение равным 30.
Дрейфовые характеристики протонов и ионов (ОН ) в водном растворе (характерные времена экранирования этих зарядов) будут определяться минимальным электрическим полем E*=V/{[(NMOH3) 1/3]2e0e4tG. Характерное время экранирования указанных зарядов с концентрацией ионов NMOHOB В ВОДНОМ растворе оценивали как t*=[N(H+)]
1/3/(m иона*Е )J где r0=[N(H)+] 1/3 =[N(OH )]’1/3 - среднее расстояние между взаимно одноименными и взаимно разноименными ионами гидроксильных групп (ОН ) и протонами (Н+); подвижности ионов гидроксильных групп (ОН‘ ) и протонов (Н+) рассчитали и приняли равными: mr= 3,54Ю 7м2/Вс, m0H = 1,075Ю‘7м2/Вс.
Оценили величину минимальной напряженности электрического поля Е* от дрейфующего протона, которое, взаимодействуя с отрицательными ионами раствора, будет определять время экранирования протона:
Е* = q/{[(NMOHa)’1/3]2 e0e 4тт =(1 ,6x10‘19)/{[2х10‘7]2х 8,85x1 СГ12хЗОх4хЗ, 14} = 1 ,1х103 В/м.
Это минимальное поле (поле на максимальных расстояниях между протоном и гидроксильной группой), которое и будет определять время экранирования протона.
Для случая расположения активного сегмента фрагмента ДНК в диффузионной части (но вне приповерхностной части (слой Гельмгольца двойного слоя)) двойного слоя оценили время выхода потенциала считывающего электрода на насыщение, которое определяется скоростью дрейфа протона в диффузионной части двойного слоя:
тэ *‘> тр= Go/(mr·E**)=(2·10 7/3,54·107·5·103)=s г-Ю^ с, где Е**~ 5-103 В/м , - это оценка снизу; понятно, что оценка времени экранирования протона сверху будет на порядок меньше. Также понятно, что если время экранирования протона после его образования в результате разделения пары зарядов стремится к нулю, то ставится под вопрос сама возможность появления индуцированного потенциала на считывающем электроде.
Если принять расстояние от считывающего электрода до электрода смещения, находящегося под отрицательным потенциалом, например, 0,5 В, равным 1 мм, то средняя величина электрического поля в этом промежутке будет равно 5 В/см (или 500 В/м). Тогда время дрейфа протона во внешнем поле можно оценить, как:
t2=(2xm)/(MPEB„)=2«10’8/(3,54*10 7·500)~ 104 с
За это время протон уйдет от места разделения зарядов хт на расстояние:
1_(тЭр)=Цр »Е*»Тэр=3,54х10 7х500х10^=1 ,8x10 8м=18 нм.
Таким образом, влияние электрического поля дрейфующего протона на процесс индуцирования заряда на считывающем электроде уменьшается с течением времени за счет дрейфа протона, а не за счет его экранирования подвижными ионами водного раствора (гидроксильными группами ОН ). Индуцированный заряд на емкости считывающего электрода преобразуется в потенциал, который модулирует ток в канале полевого транзистора, который, в свою очередь, можно считывать во внешнюю цепь посредством зарядочувствительного (электрометрического) усилителя.
Для считывающего электрода размером 30 нм х 100 нм, при расстоянии между местом локализации электрона на фрагменте ДНК после разделения зарядов и поверхностью считывающего электрода в 20 нм, и диэлектрической проницаемости водного раствора равной 30, для емкости считывающего электрода получаем величину Сэ=4х1016Ф. Заметим, что емкость хорошего зарядочувствительного
(электрометрического) усилителя составляет величину Свх. = 1015 Ф. При указанных параметрах ячейки, с учетом возникающего емкостного делителя, величина индуцированного потенциала составит 4x104 В, а выходное напряжение электрометрического усилителя окажется равным 14,5 хЮ6 В. Заметим, что в водном растворе с большей ионной силой, для расположения места локализации электрона на фрагменте ДНК после разделения зарядов в диффузионной части двойного слоя, расстояние между этим местом и поверхностью считывающего электрода необходимо будет уменьшить, что приведет к большей величине индуцированного потенциала на емкости считывающего электрода, чем 4x1 O4 В.
Оценки электрических шумов при принятых значениях параметров ячейки и водного раствора реакционной смеси показали следующие величины:
ток дробового шума ~ 3,5x1015А,
напряжение теплового шума ~ 4,2 мкВ,
ток генерационно-рекомбинационного шума ~ 2,5·1017A,
напряжение генерационно-рекомбинационного шума ~ 24 нВ.
Таким образом, результаты анализа и расчета величин электрофизических параметров физико-химических процессов сопровождающих процесс секвенирования фрагмента ДНК в ячейке подтверждают возможность регистрации результата разделения одной пары зарядов, которое сопровождает встраивание полимеразой нуклеотида в полимеризуемый фрагмент ДНК, предложена методика регистрации и ее схемная реализация.
Указанные размеры считывающего электрода (затвора транзистора), конструкции сенсора, ячейки, аналого-цифровую схему ячейки, матрицу ячеек, микросхему матрицы ячеек сенсоров в целом, - возможно реализовать средствами полупроводниковых
промышленных технологий, например, применением технологии TSMC с технологическими нормами на длину затвора транзистора 28 нм и менее.
Пример 3. Наноразмерный сенсор на основе нанопроводного полевого транзистора.
Наноразмерный сенсор на основе нанопроводного полевого транзистора предназначен для регистрации результатов разделения пары зарядов около поверхности сенсора после каждого встраивания полимеразой нуклеотидов в полимеризуемый фрагмент ДНК. в составе иммобилизованного на поверхность нанопровода полимеразного комплекса 44.
Структурная схема нанопроводного транзистора с иммобилизованным тройным комплексом представлена на Фиг. 16, и состоит из планарной тонкопленочной металлической наноструктуры, нанесенной на слой диэлектрика 49, покрывающий подложку 45; тонкопленочная металлическая электродная наноструктура 46 (контакты к нанопроводу) совместно с металлическим каналом-нанопроводом 50 формируется на диэлектрической подложке методами фото- и электронной литографии с использованием фото- и электронного резиста, технологии травления экспонированной области и технологии напыления металла магнетронным или термическим способом. Управляющим электродом также может служить проводящий подслой (например, допированный кремний), находящийся под слоем диэлектрика 49. Для устранения контакта подводящих электродов с водным раствором в микрофлюдной ячейке они покрываются тонким слоем диэлектрика 51, наносимого через маску. Также числами 44, 47, 48 показаны, соответственно, иммобилизованный полимеразный комплекс, водный раствор реакционной смеси и электрод смещения.
Проводимость канала транзистора зависит от напряженности электрического поля, в котором находится нанопровод (НП). Локальные изменения поля достаточной величины также способны изменить проводимость нанопровода, что дает возможность регистрации с помощью такого устройства локального изменения заряда в области нанопровода, а также присоединения к (или отсоединении от) поверхности нанопровода малых заряженных частиц.
Нанопроводной транзистор может быть реализован на основе КНИ-технологии. КНИ-материал (кремний на изоляторе) представляет собой слой монокристаллического кремния, отделенный от кремниевой подложки слоем оксида кремния. В этом верхнем слое кремния и формируют наноструктуры различных конфигураций. С использованием КНИ-материала можно изготавливать подвешенные НП. Сначала литографическим методом в верхнем слое кремния формируется структура НП. Затем образец помещается в раствор плавиковой кислоты, в результате чего удалялся расположенный под НП слой Si02. При этом широкие области кремния служат маской для травления Si02, а тонкий
провод оказывается подвешенным за счет «подтрава» под него, обусловленного изотропностью процесса травления Si02.
Из-за большой площади подводящих электродов (несколько мм2) утечка тока через диэлектрический слой пластины КНИ становилась значительной (более 10 рА) и 5 для ее блокировки производилось утолщение диэлектрического слоя двумя последовательными напылениями Si02 толщиной по 200 нм на всю поверхность чипа, за исключением центральной области 80x80 мкм2 с наноструктурами (на Фиг. 20 и 21 видна граница дополнительного изолирующего слоя). В результате проведенного усовершенствования утечка с подложки на контактные площадки практически исчезала ю при приложенных напряжениях до 10 В.
После утолщения диэлектрического слоя методами фотолитографии и магнетронного напыления формировалась крупноразмерная часть структуры, содержащая подводящие Ti электроды толщиной 100-160 нм. В качестве затворного электрода полевого транзистора использовался нижний слой кремния (подложка).
15 На заключительном этапе изготовления для проведения измерений в жидкостной среде происходила изоляция всех открытых токопроводящих поверхностей структуры транзистора путем напыления слоя Si02 толщиной 200 нм. Изоляционный слой покрывал Ti электроды и большую часть площади кремниевых контактных площадок, оставляя открытой канал-нанопровод транзистора. На Фиг. 21 показан вид окончательно 20 сформированных структур нанопроводных транзисторов в центральной области чипа.
В зависимости от технологических требований геометрия НП в транзисторе может быть реализована в различных формах, например, в линейной или в V образной.
Удельная проводимость полупроводникового канала p-типа определяется выражением: s * рРро
25 где р - подвижность дырок. Чувствительность сенсора можно характеризовать безразмерным параметром
где Рр- модуляция концентрации дырок, обусловленная изменением потенциала. Данный параметр соответствует объемному отношению между той частью нанопровода, где зо концентрация эффективно модулирована электрическим потенциалом, и остальным объемом. Видно, что он будет максимальным, когда длина экранирования Дебая в полупроводнике много больше радиуса нанопровода lo » R. Данный параметр можно представить в явном виде:
где Df соответствует изменению потенциала в нанопроводе, которое описывается найденной функцией
и таким образом получить оценку максимальной чувствительности сенсора на нанопроводном полевом транзисторе.
На Фиг. 17 показано рассчитанное распределение электрического потенциала для случая одной частицы, несущей единичный заряд. На Фиг. 17 а) показано распределение потенциала на плоскости z = ф(х, у) перпендикулярной оси нанопровода, с началом координат в центре нанопровода. Значения потенциала вблизи заряженной частицы не показаны, поскольку в этой области потенциал стремится к бесконечности. На Фиг. 17 б) показан график эквипотенциальных линий; в центре замкнутых контуров находится заряженная частица; пунктирной линией показана граница нанопровода.
Профиль распределения потенциала вдоль оси, соединяющей центр нанопровода с центром частицы, представлен на Фиг. 18. Расчеты сделаны для следующих параметров: частица находится на расстоянии h = 6 нм от нанопровода, радиус которого
R = 50 нм. Длина экранирования Дебая в электролите Ко = 10 нм (концентрация ионов, с = 1 мМ), концентрация примесей в р-допированном кремниевом канале Л/А = 1015 см 3.
Распределение потенциала представлено вдоль оси, соединяющей центр нанопровода с центром заряженной частицы, и нормировано на значение потенциала на поверхности нанопровода со стороны частицы.
В случае детектирования отдельных заряженных объектов, поле единичного электрона проникает вглубь нанопровода и способно целиком «пережать» проводящий канал в силу малости поперечных размеров полупроводникового нанопровода, как показано на рисунке Figure 3d в статье [Salfi J., et al. Direct observation of single-charge- detection capability of nanowire field-effect transistors // Nature Nanotechnology. 2010. - Sep. Vol. 5, no. 10. P. 737-741]. Чувствительность сенсора в этом режиме может быть исключительно высока. В упомянутой статье показано, что в случае детектирования с помощью нанопровода единичных электронов, расположенных в зарядовых ловушках на поверхности специально приготовленного образца, зарядовая чувствительность достигает величины 4*10-5еЛ/Г ц при криогенных температурах. При комнатных температурах в работе [Denis Е. Presnov, et al. A highly pH-sensitive nanowire field-effect transistor
based on silicon on insulator /Beilstein J. Nanotechnol. 2013, 4, 330-335] была дана оценка предельной зарядовой чувствительности нанопроводного транзистора величиной 5*10~^qNG Ц.
Особенности конструкции устройства позволяют существенно упростить метод его изготовления, избегая трудоемких и сложных процессов легирования и отжига, необходимых для формирования омических контактов к кремниевым областям стока и истока транзистора. Возможности применяемого материала КНИ позволяют также сформировать подвешенный канал-нанопровод, частично удалив подслой Si02, который является источником зарядовых флуктуаций, увеличивающих собственный шум транзистора. Транзистор с подвешенным каналом-нанопроводом будет обладать большей чувствительностью как за счет уменьшения собственного шума, так и за счет увеличения рабочей поверхности нанопровода.
Отдельные нанопроводные транзисторы могут быть размещены в интегральной структуре, представляющей собой чип с массивом нанопроводных транзисторов с адресной шиной, позволяющей осуществлять индивидуальное измерение на каждом нанотранзисторе, как это показано на Фиг. 19.
Пример 4. Наноразмерный сенсор на основе одноэлектронного транзистора предназначен для формирования сигнала от результата разделения пары зарядов в после встраивания полимеразой нуклеотида в полимеризуемый фрагмент ДНК.
Одноэлектронным транзистором называется электронная наноструктура, состоящая из двух сверхмалых последовательно соединенных туннельных переходов и С2, между которыми расположен электрод (остров), соединенный с управляющим электродом (затвором) через емкость С0, как показано рисунке Фиг. 22.
Вольтамперная характеристика этого устройства, представленная на рисунке Фиг. 23, имеет характерную область кулоновской блокады (сплошная линия) при напряжениях V2W2 < V0ff = e/Cs (Cs - полная емкость острова транзистора) и нулевом напряжении на управляющем электроде, когда туннелирования электронов не происходит ввиду энергетической невыгодности такого процесса.
При напряжениях Vg на управляющем электроде, соответствующих CoVg = Qg - е/2 +пе туннелирование возможно при любых V и, в этом случае, вольтамперная характеристика транзистора не имеет блокадного участка (пунктирная линия). В связи с этим зависимость тока транзистора / ( V=const ) от величины поляризационного заряда Qg на центральном острове, получившая название модуляционной характеристики, имеет вид периодической функции с периодом по заряду в один электрон е, т.е. /(Q0+e) = /(Q0) (Рисунок 26). Процесс коррелированного туннелирования электронов при напряжениях порядка V0ff и менее характерен тем, что электроны приходят и уходят с острова
транзистора последовательно один за другим. По этой причине транзистор назван одноэлектронным.
Для того, чтобы одноэлектронные эффекты были хорошо различимы на фоне тепловых и квантовых флуктуаций, характерная электростатическая (Кулоновская) энергия системы (e2/2Cs) должна значительно превосходить характерную энергию тепловых (кТ) и квантовых (~ /, где = RC) флуктуаций, т.е. должны выполняться условия:
где Rq - квантовое сопротивление, R - туннельное сопротивление переходов.
Одноэлектронный транзистор характеризуется весьма высокой чувствительностью к изменению заряда на центральном острове. Даже небольшое изменение заряда острова dQ, которое может быть существенно меньше, чем заряд электрона е, приводит к заметному изменению dl тока транзистора (см. Рисунок 26) и может быть зарегистрировано. Это свойство одноэлектронного транзистора позволяет использовать его как уникальный электрометр с субэлектронной чувствительностью.
Как следует из формулы (1), характерные размеры элементов одноэлектронных устройств, определяющие их ёмкость, напрямую влияют на рабочую температуру устройств. Оценивая по этой формуле характерные значения емкостей и размеров туннельных переходов, необходимых для нормальной работы одноэлектронных устройств при комнатной температуре Т=300 К, получаем ёмкость С=10 18- 10 19 F, и, соответственно, размеры порядка нанометра. Такой транзистор можно создать, используя в качестве «острова» одноэлектронного транзистора одиночную молекулу. Это и является основой современной молекулярной одноэлектроники.
Минимальное значение уровня шума в одноэлектронном транзисторе, а, следовательно, максимальная чувствительность, достигается при смещающем напряжении V, незначительно превышающем порог кулоновской блокады Voff. Кроме того, минимум шума является функцией величины измеряемого заряда Qx.
Помимо оптимизации параметров транзистора и режимов его работы, получены выражения для оценки максимальной чувствительности одноэлектронного транзистора при учете низкочастотных флуктуаций тока транзистора. В случаях, когда собственная емкость источника сигнала при нулевом напряжении Cs 0, измеряемый заряд Qx, показанные на рисунке эквивалентной схемы одноэлектронного транзистора Фиг. 24, оценка максимальной чувствительности одноэлектронного транзистора может быть представлена выражением:
где SI(O) - спектральная плотность флуктуаций туннельного тока на низких частотах. Величина измеряемого заряда определяется флуктуациями числа туннельных событий в каждом из переходов транзистора.
В случае классических шумов результат (2) упрощается когда собственная емкость источника заряда мала Cs 0, а сопротивления и емкости его переходов одинаковы (С =
Соотношение (2) принимает простой вид и в случае большой
емкости источника сигнала Cs, когда источник заряда удобнее SV = SQ jC, описывать как источник напряжения - ):
где R = min(R1 ,R2).
Как видно из формул (3) и (4), шумы транзистора уменьшаются с уменьшением температуры и сопротивления переходов, однако при Т = 0 заметную роль начинают играть квантовые флуктуации, не описываемые формулой (2). Оценка абсолютного минимума квантового шума дает:
Существует по крайней мере два способа уменьшения квантового шума в одноэлектронном транзисторе. Один из способов - выбор рабочей точки транзистора, близкой к е/2, при V ~ Vt (где Vt - модулируемый порог кулоновской блокады), в этом случае вероятность сотуннелирования уменьшается при уменьшении Vt, поэтому вклад квантового шума минимален. Сотуннелированием называют квантовый процесс перехода электрона с одного внешнего электрода на другой через виртуальное промежуточное и энергетически невыгодное состояние заряженного острова транзистора). Второй способ - использование сильно несимметричного одноэлектронного транзистора (R1 » R2). Классический шум в транзисторе зависит преимущественно от меньшего из сопротивлений, т.о. увеличение второго сопротивления не существенно. Однако, время сотуннелирования пропорционально 1/R1 R2, и, соответственно, оно уменьшается при увеличении большего из сопротивлений. Отметим, что на одном из склонов
модуляционной характеристики несимметричного транзистора увеличивается значение производной dl/dQg, что приводит к увеличению выходного сигнала.
Спектр шума одноэлектронного транзистора имеет ярко выраженную компоненту 1/f. Экспериментальные значения уровня шума транзисторов планарной геометрии
КГ3 +10 ^e/Jnj „п г . . . составляют величину > v ' на частоте f = 10 Гц [Wei Lu, Zhongqmg Ji, Loren
Pfeiffer, K. W. West & A. J. Rimberg, Real-time detection of electron tunnelling in a quantum dot, Nature, V. 423, 2003, PP 422-425.].
Многочисленные эксперименты показали, что предельные характеристики одноэлектронных устройств определяются уровнем флуктуаций поляризационного фонового заряда, которые на низких частотах доминируют над их естественными компонентами.
В большинстве случаев избыточный шум в одноэлектронном транзисторе имеет зарядовую природу. Показано, что уровень выходного шума в одноэлектронном транзисторе зависит от положения рабочей точки (а именно от коэффициента
dI/dOr
преобразования 1 '* ), причем, при максимуме производной выходной шум максимален. В то же время при пересчете в зарядовые единицы уровень шума оказывается примерно одинаковым для всех рабочих точек. Это указывает на то, что регистрируемый избыточный шум имеет зарядовую природу, т.е. выходной шум является реакцией транзистора на флуктуации зарядов в его непосредственном окружении.
Одно из проявлений шума фоновых зарядов - телеграфный шум тока со случайным переключением между 2, 3 и более уровнями с эквивалентной величиной скачков вплоть до 0.2 е. Телеграфный шум - вид шума, довольно часто проявляющийся в одноэлектронных структурах. Его наблюдение и изучение позволило сделать вывод, что природа избыточного шума связана с совокупным влиянием зарядовых двух-уровневых флуктуаторов, в большом количестве распределенных в толще диэлектрика, окружающего остров транзистора и, по-видимому, связанных с несовершенством структуры этой среды.
Задача создания молекулярного транзистора разделяется на две подзадачи. Первая - создание электродов с нанозазором между ними, который бы позволил исследовать объекты нанометровых размеров. Вторая - помещение и закрепление одиночной молекулы между такими электродами.
Нанозазоры могут быть сформированы различными способами:
метод“механически контролируемого разрыва нанопровода”,
“усовершенствованная” электронно-лучевая литография,
электрохимические методы (такие как осаждение металла в область предварительно сформированного зазора или создание зазора путем травления:
электромиграция,
- абляционная литография просвечивающим электронным микроскопом,
ионно-лучевая литография,
метод, в котором используется молекулярно-лучевая эпитаксия.
На Фиг. 25 представлено схематическое изображение одномолекулярного транзистора с подвешенными электродами: М - молекула, осажденная в зазор и зафиксированная там при помощи SH-rpynn.
На Фиг. 26 показана фотография КНИ-структуры с висящими электродами над подложкой.
На Фиг. 27 показана фотография наноструктуры одноэлектронного транзистора с нанозазором, полученным методом электронно-лучевой литографии.
На Фиг. 28 показана фотография нанозазора, полученный методом электромиграции (электротреппинг).
На Фиг. 29 показана фотография нанозазора, полученного методом ионно- лучевой литографии (FIB-технология).
На Фиг. 30 показана фотография изготовленной наноструктуры из 16 ячеек для транзисторов с нанозазорами.
На Фиг. 31 показана фотография одной из 16-ти ячеек на основе транзистора с нанозазором.
На Фиг. 32 показана фотография сформированного центрального электрода- острова в структуре одноэлектронного транзистора из нанопровода.
На Фиг. 33 представлена фотография сформированного нанозазора для создания молекулярного одноэлектронного транзистора.
На Фиг. 34 представлена вольт-амперная характеристика транзисторной структуры с нанозазором; форма тока утечки показывает, что нанозазор сформирован.
На сегодняшний день одноэлектронные транзисторы обладают максимальной зарядовой чувствительностью. Известны публикации с описанием схемы одноэлектронного транзистора для детектирования отдельных молекул, например, стрептавидина [Nakajima, A.; Kudo, Т.; Furuse, S. Biomolecule detection based on Si single- electron transistors for practical use. Appl. Phys. Lett. 2013, 103.].
Пример 5. Наноразмерный сенсор со схемой стохастического резонанса.
Опционально, для повышения отношения уровня сигнала к уровню шума в схему ячейки матрицы микросхемы может быть добавлена схема, реализующий режим стохастического резонанса, состоящая из полупроводникового элемента (или группы элементов), имеющего передаточную характеристику или вольт-амперную характеристику с областью бистабильности, включающую схему смещения (задание рабочей точки) по постоянному току, включающую источник (генератор) шума,
включающую схему формирования выходного сигнала. Схема стохастического резонанса реализуется посредством подключения источника сигнала, а также схемы смещения
(задания рабочей точки) по постоянному току, источника (генератора) шума ко входу полупроводникового элемента (устройства, или группы элементов), реализующего передаточную характеристику или вольт-амперную характеристику с областью бистабильности, и подключения выхода полупроводникового элемента (устройства, или группы элементов), реализующего передаточную характеристику или вольт-амперную характеристику с областью бистабильности, ко входу схемы ячейки, в которой формируется выходной цифровой сигнал.
Вариант реализации ячейки сенсора, использующей стохастический резонанс для обнаружения фактов разделения зарядов показан на Фиг. 15. Схема ячейки содержит полевой транзистор сенсора, на затвор которого иммобилизуется молекула полимеразы, в составе комплекса 38, биполярный транзистор V1 , а также источники напряжений U0 (напряжение смещения), 11пит (напряжение питания схемы сенсора) и UN (напряжение шума). Выходной сигнал снимается с контактов ивых.
Полевой транзистор сенсора и биполярный транзистор V1 совместно образуют триггер Шмитта, реализующий S-образную передаточную характеристику UBbix=F(UBx). Под UBX здесь понимают разность потенциалов между общим проводом схемы и затвором полевого транзистора. S-образная передаточная характеристика в данной схеме образуется за счёт наличия положительной обратной связи по напряжению, реализуемой посредством подачи усиливаемого сигнала со стока полевого транзистора (р+-сток на Фиг. 15) на базу биполярного транзистора V1 через цепь резистивного делителя R5-R4, и усиленного сигнала в цепь истока полевого транзистора (р+-исток на Фиг. 15) через общий резистор R3. Параметры схемы (тип и характеристики транзистора V1 и номиналы резисторов R1-R5) выбираются таким образом, чтобы обеспечить появление бистабильности на передаточной характеристике схемы [1]. При этом входной сигнал схемы UBX определяется как сумма сигнала шума UN и сигнала, т.е. потенциала, индуцированного на затворе полевого транзистора, как это описано в разделе “Подробное раскрытие изобретения”. При совместном действии сигнала напряжения, индуцированного на затворе полевого транзистора и сигнала шума, под действием последнего изменяется (модулируется) вероятность нахождения схемы триггера Шмитта между двумя устойчивыми состояниями в пределах области бистабильности передаточной характеристики. Это приводит к появлению на выходе схемы (напряжение ивых) импульсов напряжения в моменты времени, когда на затворе полевого транзистора сенсора индуцируется потенциал. Параметры (статистика распределения, дисперсия) сигнала шума UN задаётся таким образом, чтобы обеспечить описанный выше режим стохастического резонанса [2-5], т.е. чтобы в схеме происходило усиление отношения
«сигнал-шум», что и проявляется в виде импульсов напряжения на выходе схемы. Таким образом, указанная схема сенсора, не обеспечивая усиление полезного сигнала по напряжению, в то же время усиливает отношение «сигнал-шум», что делает слабый полезный сигнал доступным для дальнейшей обработки.
В качестве источника шума может быть использовано любое устройство, формирующее напряжение шума UN с требуемыми характеристиками. В качестве примеров таких источников (но не ограничиваясь ими) могут быть рассмотрены всевозможные схемы на сдвиговых регистрах, в том числе, с аналого-цифровым преобразованием на выходе, генераторы шума на тепловых или пробойных источниках (усиливаются тепловые шумы тока через сопротивление или шум тока пробоя обратно смещенного р-п-перехода, и т.п.).
Сигнал с выхода схемы на основе эффекта стохастического резонанса подаётся для последующего усиления, нормализации и преобразования в цифровую форму. На Фиг.15 показано, как для этих целей сигнал 11вых поступает на интегратор (фильтр низкой частоты) Yi1 , а далее - на нормирующий усилитель Yi2 и компаратор Yi3, с выхода которого сформированные импульсы поступают на D-триггер Yi4. С выхода D-триггера дискретизированный во времени цифровой сигнал DATA поступает на соответствующую шину данных матрицы микросхемы для дальнейшей передачи в компьютер. Приведённая схема сенсора на основе стохастического резонанса может быть использована аналогично для схемы на Фиг. 14, в двухканальном исполнении, что позволит вычитать из сигнала уровень фонового потенциала рабочей смеси.
Пример 6. Формирование первичных сигналов и их преобразование в нуклеотидную последовательность секвенируемого фрагмента ДНК.
На Фиг. 5 показаны основные стадии формирования и преобразования данных о нуклеотидной последовательности фрагмента ДНК следующего состава: AACGTCTTCAGGGCTAGCACCAT .
Аналого-цифровая схема ячейки формирует временную последовательность дискретных интервалов времени, каждый из которых обозначен логическими «1 » единицей и «0» нулем, причем логической единицей «1» обозначены те интервалы времени, когда сенсором ячейки был зарегистрирован факт разделения одной пары зарядов, сопровождающий встраивание полимеразой нуклеотида в полимеризуемый фрагмент ДНК, и сформирован соответствующий сигнал. Если последовательно проводить полимеризацию указанного фрагмента ДНК в составе комплекса, иммобилизованного на поверхность сенсора ячейки, в четырех различных реакционных смесях, отличающихся тем, что в каждой из них понижена концентрация нуклеотидов только одного вида, и в каждой смеси вида отличного от других смесей, то схемой ячейки будут последовательно сформированы четыре временных последовательности, которые
(четыре сверху) показаны на Фиг. 5А. Можно видеть, что на каждой временной последовательности количество дискретных интервалов времени, обозначенных логическим нулем «0», различно перед каждым интервалом, обозначенным логической единицей «1 »; условно, можно говорить о коротких и длинных интервалах времени перед встраиванием нуклеотидов. Указанные временные последовательности в реальном времени (т.е. в процессе их формирования) передаются в компьютер, в котором специальное программное обеспечение считывает, суммирует, сравнивает, анализирует длительности интервалов времени перед встраиванием каждого нуклеотида, т.е. определяет количество дискретных интервалов времени, обозначенных логическим нулем «0», перед каждым интервалом времени, обозначенным логической единицей «1 ».
Согласно алгоритму секвенирования, длинные (в среднем) интервалы времени наблюдаются перед встраиванием нуклеотидов вида, концентрация которого была понижена против нормальной концентрации нуклеотидов трех других видов в реакционной смеси. Т.к. на этапе пробоподготовки известно имя вида нуклеотидов, концентрация которого понижена для каждой реакционной смеси, то на первой стадии преобразования данных компьютерная программа преобразует каждую временную последовательность в последовательность логических единиц «1 » и логических нулей
«0»; причем теперь логической единицей «1 » обозначен каждый длинный интервал времени, соответствующий встраиванию нуклеотидов вида, концентрация которого была понижена в соответствующей реакционной смеси и известна, а логическим нулем «0» обозначаются короткие интервалы времени, соответствующие встраиванию нуклеотидов видов, концентрация которых была нормальна в этой же реакционной смеси. Полученные таким образом последовательности логических единиц «1 » и логических нулей «0» представлены на Фиг. 5Б. На следующей стадии преобразования данных, компьютерная программа сопоставляет данные о местах расположения нуклеотидов известных видов на каждой из четырех последовательностей логических единиц «1 » и нулей «0» друг с другом, и методом исключения, следуя правилу, что на одной позиции в нуклеотидной последовательности фрагмента ДНК может располагаться нуклеотид только одного вида,
- формирует результирующую нуклеотидную последовательность секвенируемого фрагмента ДНК: AACGTCTTCAGGGCTAGCACCAT .
Пример 7. Структурная схема микросхемы матрицы ячеек сенсоров.
Структурная схема микросхемы матрицы ячеек сенсоров представлена на Фиг. 10. Микросхема предназначена для применения в составе устройства, реализующего одномолекулярный способ секвенирования нуклеиновых кислот. Микросхема матрицы ячеек сенсоров может состоять, например, из 16 000 000 ячеек сенсоров, которые организованы в матрицу с количеством столбцов и строк 4000x4000, которая поделена на четыре секции; структурная схема микросхемы представлена на рисунке ниже. Числами
римскими I, II, III, IV - обозначены секции матрицы ячеек сенсоров, каждая, например, размером 2000x2000 ячеек; числами 1 , 2, 3, 4 в кружочках обозначены выходы горизонтальных сдвиговых регистров, выводящих цифровые данные из ячеек, расположенных, соответственно, в секциях I, II, III, IV. Числами в прямоугольных
(квадратных) формах обозначены: 1 - ячейка сенсоров; 2 - вертикальный сдвиговый регистр переноса цифровых данных из ячеек сенсоров секции матрицы, расположенных в один ряд; 3 - USB интерфейс передачи данных между компьютером и микросхемой: 4 - горизонтальный сдвиговый регистр переноса цифровых данных из вертикальных сдвиговых регистров одной секции матрицы ячеек сенсоров; 5 - электрод смещения, потенциал на котором устанавливается источником напряжения, регулируемого контроллером; 6 - разъем между источником напряжения микросхемы и электродом смещения, который расположен на крышке микросхемы; 7 - контроллер управления режимами работы микросхемы; 8 - регулируемый генератор тактовой частоты, к которому извне микросхемы подсоединяется кварцевый резонатор; 9 - регулируемый источник вторичного питания.
Схема вывода информации из ячеек матрицы функционально организована аналогично схеме вывода информации в матрице ПЗС со строчным переносом заряда. Состояние выхода D-триггера цифровой схемы каждой ячейки, расположенной в столбце матрицы, перезаписывается в вертикальный сдвиговый регистр, предназначенный для переноса логических данных (“ или “0”) в горизонтальный сдвиговый регистр, из которого данные через USB интерфейс поступают в компьютер.
Контроллер микросхемы обеспечивает обмен данными с персональным компьютером по интерфейсу USB, обеспечивает анализ данных с каждого выходного регистра матрицы ячеек, на основании которого управляет частотой тактовых импульсов и величиной напряжения, обеспечивающих функционирование электрической схемы каждой ячейки матрицы. Через USB интерфейс схема матрицы ячеек сенсоров получает напряжение питания 5 В. Напряжение питания может подаваться на микросхему от автономного источника питания, например, от аккумуляторной батареи. На компьютере предустанавливается специальный драйвер, который обеспечивает согласование с персональным компьютером на уровне программного обеспечения работу контроллера микросхемы матрицы сенсора. Этот драйвер обеспечивает первичную настройку параметров микросхемы матрицы ячеек сенсоров, оперативное управление работой и обмен данными между микросхемой и компьютером. Ввиду высокой скорости передачи данных применяется интерфейс с высокой пропускной способностью, например, USB2.0 (400 Мбит в секунду).
Пример 8. Численный эксперимент по определению качества временных задержек перед встраиванием нуклеотидов в реакции полимеризации ДНК в процессе секвенирования предложенным способом.
Численные эксперименты по определению временных задержек перед встраиванием нуклеотидов в ходе реакции полимеризации ДНК для различных соотношений концентраций нуклеотидов 4-х видов были выполнены на основе клеточного автомата [Марголус Н., Тоффоли Т. Машины клеточных автоматов: Пер. с англ. - М.: Мир, 1991. 280 с; Margolus, N., Physics-like models of computation, Physica D 10, 8195 (1984)] с применением разработанной кинетической модели диффузионного процесса в реакции полимеризации ДНК [Manturov А.О., Grigoryev A.V., DNA SEQUENCING BY SYNTHESIS BASED ON ELONGATION DELAY DETECTION, Progress in Biomedical Optics and Imaging - Proceedings of SPIE Optical Technologies in Biophysics and Medicine XVI; Laser Physics and Photonics XVI; and Computational Biophysics. 2014. С. 94481Т].
Задержка - это время, которое полимераза ожидает подхода комплементарного нуклеотида к сайту копирования перед его встраиванием в полимеризуемый фрагмент ДНК. Распределение задержек для нуклеотидов каждого вида представлено на Фиг. 7; по оси X отмечается величина задержки в условных единицах времени, по оси Y - количество задержек определенных на оси X длительностей, полученных численными экспериментами. Как видно из рисунка: большинство задержек равны нулю для случая, когда концентрации нуклеотидов каждого вида в реакционной смеси одинаковы. Если концентрация нуклеотидов одного вида в реакционной смеси будет уменьшена против нормальной концентрации нуклеотидов остальных видов, то численные эксперименты покажут распределение, представленное на Фиг. 8. Из этого распределения видно, что уменьшение концентрации нуклеотидов вида А уменьшает количество коротких по времени задержек для этих нуклеотидов и увеличивает количество длинных по времени задержек для нуклеотидов остальных видов. Среднее время задержки для нуклеотидов 4-х видов в ходе реакции полимеризации ДНК представлено на Фиг. 9. Время средней задержки рассчитывается методом скользящего окна в 50 тактов клеточного автомата. На графиках, по оси Y отложено рассчитанное среднее значение задержки в условных единицах для текущего номера задержки. На Фиг. 9А показаны результаты расчетов, когда концентрация нуклеотидов 4-х видов одинакова в реакционной смеси. На Фиг. 9Б представлены результаты расчетов, когда концентрация нуклеотидов вида А в 10 раз меньше нормальной концентрации нуклеотидов 3-х других видов; на этом графике видно, что задержки для нуклеотидов обедненного вида в среднем продолжительней, чем для нуклеотидов остальных видов. Расчеты выполнены для олигонуклеотида, нуклеотидная последовательность которого представлена ниже.
На Фиг. 9Б видно, что некоторое пороговое значение, например, число 15, будет однозначно разделять задержки по времени для нуклеотидов обедненного вида и для нуклеотидов не обедненных видов. Эффект, представленный на фиг. 9А и 9Б показывает средние времена задержек в каждой позиции нуклеотидной последовательности ДНК после серии К независимых экспериментов. Усредняя данные по К экспериментам при обеднении реакционной смеси нуклеотидами, например, вида А, можно точно определить позиции в нуклеотидной последовательности фрагмента ДНК, в которые были присоединены нуклеотиды вида А. Поочередно, обедняя нуклеотиды остальных видов, аналогичным образом определяются положения нуклеотидов остальных видов, в нуклеотидной последовательности того же фрагмента ДНК.
Перечень последовательностей, примененных в численных экспериментах: SEQ ID NO:1 - Олигонуклеотид-ультрамер использованный для получения
одноцепочечной кольцевой ДНК (IDT Inc., США)
5’-
/Phos/CATGTAGTGTACGATCCGACTTTACTTCAGCGTCCGTCGCAAGGAAATCTAGCCGTC
GAGGCGCTATTGGAGACTAGCTGACACCACCGTGCCAACTGAAGAAGGGCAGCTATGCGT
CCTGTTGACAATTATCTTTAACTCGTTTATTGGTTAGTCAAGGTCCAAGCCTGCTATGGA-3’
SEQ ID NO:2 - Прямой ПЦР праймер 5’-/Phos/CATGTAGTGTACGATCCGACTT-3’
SEQ ID NO:3 - Обратный ПЦР праймер 5’-TCCATAGCAGGCTTGGACCT-3
SEQ ID NO:4 - Олигонуклеотид-«мостик» 5’-GTACACTACATGTCCATAGCAGGCTTG-3’
Пример 9. Численный эксперимент по реконструкции ДНК.
Алгоритм секвенирования основан на диффузионном механизме движения нуклеотидов к сайту сборки, где полимераза встраивает комплементарные нуклеотиды в полимеризуемый фрагмент нуклеиновой кислоты, и на гипотезе, что в среднем отношение длительности интервалов времени перед встраиванием нуклеотидов с пониженной концентрацией к длительности интервалов времени перед встраиванием нуклеотидов с нормальной концентрацией будет тем больше, чем будет больше разница в их концентрациях. Для проверки этой гипотезы была разработана математическая модель и проведены численные эксперименты, результаты которых подтвердили достоверность гипотезы.
Численные эксперименты по восстановлению нуклеотидной последовательности ДНК выполнены на базе двух программных модулей: модуля из Примера 8, который использовался для генерации величин временных задержек перед встраиванием каждого нуклеотида в ходе реакции полимеризации фрагмента ДНК и модуля, который восстанавливает исходную нуклеотидную последовательность фрагмента ДНК из данных величин временных задержек.
Модуль для восстановления исходной нуклеотидной последовательности ДНК обрабатывает статистически результаты от нескольких независимых экспериментов. В Таблицах 1, 2, 3 представлены статистически обработанные результаты от 2000 экспериментов по расчету точности восстановления закольцованных нуклеотидных последовательностей фрагментов ДНК в форме «гантель» (dumbbell): для матричных фрагментов ДНК длиной 1000, 2000, 3000 и 5000 нуклеотидов, соединенных“мостиком” длиной в 25 нуклеотидов с каждой стороны“гантели”.
Предлагаемый алгоритм секвенирования не требует меток для нуклеотидов, т.к. полезной информацией является длительность интервала времени перед встраиванием каждого нуклеотида.
Алгоритм секвенирования является уникальным потому, что в отличии от большинства известных алгоритмов секвенирования, в нем разделены во времени процедура формирования полезного сигнала и процедура его идентификации, т.е. определение имени того вида нуклеотидов, которому этот сигнал соответствует. Именно благодаря этому свойству алгоритм позволяет выбирать ту точность результата секвенирования, которая требуется. При этом, чем больше времени дается на процедуру секвенирования, - тем более точный результат можно получить. В зависимости от решаемой задачи, на этапе пробоподготовке, можно сформировать условия, которые обеспечат желаемый по точности результат секвенирования.
Характеристики молекул, участвующих в процедуре секвенирования, накладывают свои ограничения на параметры результатов секвенирования, и можно дать им следующие оценки, при условии, что применяемая полимераза РЫ29 имеет процессивность в 80 000 нуклеотидов.
Результаты расчетов для отношения концентраций одного вида нуклеотидов к трем другим видам, как 1 :10 показали, что точность секвенирования фрагмента ДНК составляет в среднем 86,9138% для фрагментов длиной 2000 нуклеотидов и эта точность практически не зависит от длины фрагмента, т.к. результат встраивания каждого нуклеотида не зависит от результатов встраивания других нуклеотидов в тот же полимеризуемый фрагмент нуклеиновой кислоты. Таблица 1 с результатами расчетов при отношении пониженной концентрации одного вида нуклеотидов к трем другим, как 1 :10, со статистической обработкой двух тысяч численных экспериментов для фрагментов нуклеиновой кислоты в 2000 нуклеотидов, организованных в форме "гантели" (dumbbell), представлена ниже:
Таблица 1.
Кол-во Кол-во не Мин-ное Макс-ное Среднее Точность прогонов восстановленных
кол-во кол-во кол-во восстановления полностью
Таблица 2 с результатами расчетов при отношении пониженной концентрации одного вида нуклеотидов к трем другим, как 1 : 10, со статистической обработкой двух тысяч численных экспериментов для фрагментов нуклеиновой кислоты в 5000 нуклеотидов, организованных в форме "гантели" (dumbbell), представлена ниже:
Таблица 2.
В первом столбце Таблиц 1 и 2 показано количество прогонов, т.е. циклов полной полимеризации фрагмента ДНК, во втором столбце показано количество экспериментов, в которых нуклеотидная последовательность не была восстановлена со 100% точностью. В третьем, четвертом и пятом столбцах показано количество нуклеотидов, соответственно, минимальное, максимальное и среднее, которые не были восстановлены
в секвенируемых фрагментах ДНК. В шестом столбце показана, усредненная по 2000-м экспериментов, точность восстановления секвенируемых фрагментов ДНК.
Понятно, что если установить соотношение концентраций, например, 1 :20, то увеличивается точность после одного прочтения, т.е. меняется время на точность.
Соответствующие результаты расчетов, со статистической обработкой двух тысяч численных экспериментов для фрагментов нуклеиновой кислоты в 2000 нуклеотидов, организованных в форме "гантели" (dumbbell), показаны в Таблице 3 ниже:
Таблица 3.
Длина секвенируемого фрагмента зависит от процессивности полимеразы и выбранного устройства секвенирования: одно матричного или четырех матричного.
В первом случае, на поверхность ячеек матриц микросхемы, в ячейках которой, на сенсорах иммобилизованы комплексы "полимераза-фрагмент ДНК" поочередно подаются четыре реакционных смеси, отличающиеся тем, что в каждом из них понижена концентрация нуклеотидов только одного вида, и всякий раз - другого вида. В этом случае, т.к. одна и таже полимераза работает в одной и той же ячейке, но с 4-мя разными реакционными смесями, - в одной реакционной смеси она сможет встроить только 20 000 нуклеотидов; в зависимости от желаемой точности секвенирования фрагмента ДНК можно выбрать, например, фрагмент ДНК длиной 5 000 нуклеотидов, провести 4-е цикла его полимеризации и получить точность 99,88%; а можно взять фрагмент длиной 3000 нуклеотидов и получить точность 99,997% и т.д.
Во втором случае, указанные выше реакционные смеси подаются каждая на поверхность своей матрицы микросхемы, в ячейках которых, на сенсорах иммобилизованы комплексы с клонами исходных фрагментов ДНК; в этом случае одна и таже полимераза работает в одной и той же ячейке только с одной реакционной смесью и так же может встроить 80 000 нуклеотидов. В этом случае можно секвенировать
фрагменты ДНК длиной 10 000 нуклеотидов и более, опять же, в зависимости от желаемой точности.
Используемая литература:
1. Trajkovic L.J. and Willson A.N., Jr. Complementary two-transistor-circuits and negative differerential Resistance // IEEE Trans. Circuits Syst., vol.37,pp.1258-1266, Oct.1990.
2. Kramers H.A. Brownian motion in a field of force and the diffusion model of chemical reactions. Physica v.7(4), p.284-304. -1940.
3. Benzi R., Sutera A., Vulpiani A. The Mechanism of Stochastic Resonance. Journal of Physics A: Mathematical and General, 1981 , 14: 453-457.
4. Fauve S., Heslot F. Stochastic resonance in a bistable system. Physics Lett. A 97 (1-2). - 1983. p. 5-7.
5. Gammaitoni L. et al. Stochastic resonance. Reviews of Modern Physics, Vol. 70, No. 1 , Jan.
1998. p.223-287.
Claims
1. Способ определения нуклеотидной последовательности молекулы нуклеиновой кислоты, включающий по меньшей мере следующие стадии:
(а) получение образца, приготовленного из указанной молекулы нуклеиновой кислоты, представляющего собой множество закольцованных фрагментов нуклеиновой кислоты;
(б) иммобилизация на твердой поверхности комплексов, состоящих по меньшей мере из указанных закольцованных фрагментов нуклеиновой кислоты и полимеразы, имеющей сродство к нуклеиновой кислоте, где твердая поверхность представляет собой поверхность сенсора, а иммобилизация сохраняет функциональность полимеразы и обеспечивает нахождение полимеразы вблизи поверхности сенсора в течение всего процесса определения нуклеотидной последовательности;
(в) обеспечение условий для функциональной активности указанной полимеразы, заключающейся в катализе присоединения нуклеотидов к растущей цепи нуклеиновой кислоты, где условия для функциональной активности полимеразы включают: добавление на поверхность сенсора смеси двух или более видов немеченых дезоксирибонуклеотидов, выбранных из группы, состоящей из дезоксиаденозинтрифосфата, дезоксигуанозинтрифосфата, дезоксицитидинтрифосфата и дезокситимидинтрифосфата, или добавление на поверхность сенсора смеси двух или более видов немеченых рибонуклеотидов, выбранных из группы, состоящей из аденозинтрифосфата, гуанозинтрифосфата, цитидинтрифосфата и уридинтрифосфата, при этом в указанной смеси нуклеотид одного вида присутствует в значительно меньшей концентрации, чем нуклеотиды других видов;
(г) регистрация сенсором факта разделения зарядов, происходящего в результате встраивания полимеразой нуклеотида в растущую цепь нуклеиновой кислоты, и определение временных интервалов между каждым последующим зарегистрированным фактом разделения зарядов;
(д) по меньшей мере однократное повторение стадий (в) и (г), при этом при каждом повторении вид нуклеотида, присутствующего в добавляемой смеси нуклеотидов в значительно меньшей концентрации по сравнению с другими видами, изменяется.
(е) определение нуклеотидной последовательности указанной молекулы нуклеиновой кислоты, основанное на анализе определенных на стадиях (г) и (д)
временных интервалов между каждым зарегистрированным фактом разделения зарядов, где разделения зарядов произошли в результате встраивания полимеразой указанных немеченых нуклеотидов в растущую цепь нуклеиновой кислоты.
2. Способ по п. 1 , в котором
5 указанные в (а) закольцованные фрагменты нуклеиновой кислоты имеют по меньшей мере один одноцепочечный участок; указанные в (б) комплексы, иммобилизованные на твердой поверхности, дополнительно включают секвенирующий праймер, имеющий нуклеотидную последовательность, комплементарную указанному одноцепочечному участку; и ю условия для функциональной активности полимеразы на стадиях (в) и (д) дополнительно включают условия, обеспечивающие образование дуплекса секвенирующего праймера с комплементарным участком указанного одноцепочечного закольцованного фрагмента нуклеиновой кислоты.
3. Способ по п. 2, в котором нуклеиновой кислотой является ДНК; полимеразой,
15 имеющей сродство к нуклеиновой кислоте, является ДНК полимераза; и нуклеотидами, добавляемыми на стадиях (в) и (д), являются дезоксиаденозинтрифосфат, дезоксигуанозинтрифосфат, дезоксицитидинтрифосфат и/или дезокситимидинтрифосфат.
4. Способ по п. 3, в котором используется ДНК полимераза, выбранная из
20 следующего списка: полимераза Phi29, большой фрагмент Bst ДНК полимеразы, полимераза VentR™, большой фрагмент Bsm ДНК полимеразы, Klenow фрагмент ДНК полимеразы I.
5. Способ по п. 1 , в котором полимеразой, имеющей сродство к нуклеиновой кислоте, является РНК полимераза; и нуклеотидами, добавляемыми на стадиях (в) и (д),
25 являются аденозинтрифосфат, гуанозинтрифосфат, цитидинтрифосфат и/или у рид и нтрифосфат.
6. Способ по п. 3, в котором на стадиях (в) и (д) добавляют на поверхность сенсора дезоксинуклеозидтрифосфаты четырех разных видов, а именно дезоксиаденозинтрифосфат, дезоксигуанозинтрифосфат, дезоксицитидинтрифосфат и зо дезокситимидинтрифосфат, которые вместе образуют смесь дезоксинуклеозидтрифосфатов.
7. Способ по п. 6, в котором на стадиях (в) и (д) происходит обеспечение четырех различных условий для функциональной активности полимеразы, а именно, добавление четырех различных смесей дезоксинуклеозидтрифосфатов на поверхность сенсора.
8. Способ по п. 7, в котором каждое из четырех различных условий для функциональной активности полимеразы присутствует непрерывно в течение интервала времени, достаточного для синтеза по меньшей мере одной копии закольцованного фрагмента ДНК.
9. Способ по п. 8, в котором каждое из четырех различных условий для функциональной активности полимеразы присутствует непрерывно в течение интервала времени, достаточного для синтеза по меньшей мере пяти копий закольцованного фрагмента ДНК.
10. Способ по п. 9, в котором анализ последовательности временных интервалов, используемый для определения нуклеотидной последовательности указанной молекулы нуклеиновой кислоты, включает по меньшей мере три этапа:
1) полученные последовательности временных интервалов между каждыми зарегистрированными фактами разделения зарядов, произошедшими в результате встраивания полимеразой немеченых нуклеотидов в растущую цепь нуклеиновой кислоты, преобразуют в форму последовательностей логических нулей и единиц, причем в каждой такой последовательности логической единицей обозначены факты встраивания нуклеотидов того вида, концентрация которого была известна и понижена в соответствующей этой последовательности реакционной смеси, а логическими нулями обозначены нуклеотиды видов, концентрация которых была нормальной в той же реакционной смеси;
2) формируют нуклеотидные последовательности фрагментов нуклеиновой кислоты из четырех последовательностей логических нулей и единиц, полученных после первого этапа преобразования данных для каждого фрагмента нуклеиновой кислоты;
3) нуклеотидные последовательности фрагментов нуклеиновых кислот преобразуют в определяемую нуклеотидную последовательность указанной молекулы нуклеиновой кислоты.
11. Способ по п. 6, в котором на стадиях (в) и (д) происходит одновременное использование четырех различных условий для функциональной активности полимеразы, включающее: (i) наличие четырех пространственно разнесенных матриц ячеек, содержащих указанные сенсоры; и (ii) параллельное добавление четырех различных смесей дезоксинуклеозидтрифосфатов на поверхность сенсоров, находящихся в четырёх пространственно разнесенных матрицах ячеек сенсоров.
12. Способ по п. 11, в котором анализ последовательности временных интервалов, используемый для определения нуклеотидной последовательности указанной молекулы нуклеиновой кислоты, включает по меньшей мере четыре этапа:
1) полученные от сенсоров ячеек четырех матриц последовательности временных интервалов между каждыми зарегистрированными фактами разделения зарядов, произошедшими в результате встраивания полимеразой немеченых нуклеотидов в растущую цепь нуклеиновой кислоты, преобразуют в форму последовательностей логических нулей и единиц, причем логической единицей обозначены нуклеотиды того вида, концентрация которого была известна и понижена в реакционной смеси, а логическими нулями обозначены нуклеотиды видов, концентрация которых была нормальной в той же реакционной смеси над поверхностью той матрицы, от ячеек которой преобразуются выходные последовательности;
2) уменьшают количества последовательностей логических нулей и единиц до количества фрагментов, полученных после фрагментации исходной нуклеиновой кислоты, посредством операций сортировки, сравнения, выбора и усреднения одинаковых с определенной вероятностью последовательностей логических нулей и единиц, полученных от клонов одного фрагмента, иммобилизованных в составе комплексов на поверхности сенсоров ячеек одной матрицы, в одну последовательность логических нулей и единиц;
3) формируют нуклеотидные последовательности фрагментов нуклеиновой кислоты из четырех полученных последовательностей логических нулей и единиц,
4) нуклеотидные последовательности фрагментов нуклеиновых кислот преобразуют в определяемую нуклеотидную последовательность указанной молекулы нуклеиновой кислоты.
13. Устройство для определения нуклеотидной последовательности молекулы нуклеиновой кислоты для осуществления способа по любому из пп. 1-12, содержащее
1) по меньшей мере одну микросхему матрицы ячеек сенсоров, включающую матрицу с множеством ячеек сенсоров и аналого-цифровую схему;
2) микрофлюидное устройство для обеспечения подачи рабочих растворов к сенсорам ячеек матрицы микросхемы;
3) устройство обработки и отображения данных для управления режимами работы микрофлюидного устройства и микросхемы матрицы ячеек сенсоров для преобразования данных выходных последовательностей ячеек матрицы в нуклеотидную последовательность указанной молекулы нуклеиновой кислоты.
14. Устройство по п.13, характеризующееся тем, что
1) каждая ячейка матрицы включает:
сенсор, поверхность которого пригодна для иммобилизации полимеразного комплекса, регистрирующий факты разделения одной пары зарядов в водном растворе, происходящие в результате встраивания полимеразой каждого нуклеотида в полимеризуемый фрагмент ДНК комплекса, и формирующий сигналы, соответствующие зарегистрированным фактам разделения пар зарядов;
аналого-цифровую схему ячейки для формирования выходных последовательностей дискретных интервалов времени соответствующих сигналам сенсора;
и
2) аналого-цифровая схема микросхемы матрицы ячеек сенсоров включает: схему формирования токов, напряжений и тактовых частот, необходимых для работы аналого-цифровых схем ячеек матрицы;
схему передачи выходных последовательностей ячеек матрицы в устройство обработки и отображения данных;
схему дешифрирования данных, полученных от устройства обработки и отображения данных.
15. Устройство по п. 13, в котором каждый дискретный интервал времени обозначен логическими нулем или единицей, причем логической единицей обозначен тот интервал времени, в котором сенсором ячейки был зарегистрирован факт разделения пары зарядов в результате реакции.
16. Устройство п. 13, которое дополнительно включает устройство поддержания температуры рабочего раствора над поверхностью матрицы микросхемы, управляемое устройством обработки и отображения данных.
17. Устройство по п. 13, в котором сенсор может быть выполнен в виде нанопроводного полевого транзистора, одноэлектронного транзистора, диода, конденсатора, полевого транзистора, или полупроводниковой структуры (электронной схемы) с S-образной или N-образной вольтамперной или передаточной характеристикой.
18. Устройство по п. 13, содержащее устройство управления микрофлюидным устройством, микросхемой матрицы ячеек сенсоров, и обменом данными между микросхемой и устройством обработки и отображения данных.
19. Устройство по п. 17, которое включает ровно одну микросхему матрицы ячеек сенсоров.
20. Устройство по п. 19, в котором устройство обработки и отображения данных преобразует данные выходных последовательностей от ячеек матрицы
микросхемы в нуклеотидную последовательность указанной молекулы нуклеиновой кислоты в три последовательных этапа.
21. Устройство по п. 13, которое включает четыре микросхемы матриц ячеек сенсоров.
22. Устройство по п. 21 , в котором устройство обработки и отображения преобразует данные в нуклеотидную последовательность молекулы нуклеиновой кислоты в четыре последовательных этапа.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/484,461 US11034998B2 (en) | 2017-12-26 | 2018-03-29 | Method for label-free single-molecule DNA sequencing and device for implementing same |
US17/316,416 US20210301336A1 (en) | 2017-12-26 | 2021-05-10 | Method for label-free single-molecule dna sequencing and device for implementing same |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2017135756 | 2017-12-26 | ||
RU2017135756A RU2679494C1 (ru) | 2017-12-26 | 2017-12-26 | Способ безметочного одномолекулярного секвенирования ДНК и устройство для его реализации |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US16/484,461 A-371-Of-International US11034998B2 (en) | 2017-12-26 | 2018-03-29 | Method for label-free single-molecule DNA sequencing and device for implementing same |
US17/316,416 Continuation-In-Part US20210301336A1 (en) | 2017-12-26 | 2021-05-10 | Method for label-free single-molecule dna sequencing and device for implementing same |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2019132713A1 true WO2019132713A1 (ru) | 2019-07-04 |
Family
ID=65442376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/RU2018/000202 WO2019132713A1 (ru) | 2017-12-26 | 2018-03-29 | Способ безметочного одномолекулярного секвенирования днк и устройство для его реализации |
Country Status (3)
Country | Link |
---|---|
US (1) | US11034998B2 (ru) |
RU (1) | RU2679494C1 (ru) |
WO (1) | WO2019132713A1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3674702A1 (en) * | 2018-12-27 | 2020-07-01 | Imec VZW | Method for sequencing a polynucleotide using a biofet |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019056581A (ja) * | 2017-09-20 | 2019-04-11 | ソニーセミコンダクタソリューションズ株式会社 | 電荷検出センサおよび電位計測システム |
EP3647779A1 (en) * | 2018-11-05 | 2020-05-06 | Imec VZW | Field-effect transistor-based biosensor comprising electrolyte-screening layer |
KR20220022087A (ko) * | 2019-06-18 | 2022-02-24 | 일루미나, 인코포레이티드 | 전도성 채널에 대한 중합효소 부착 |
RU2724507C1 (ru) * | 2019-08-30 | 2020-06-23 | Ооо "Гамма-Днк" | Способ регистрации результата реакции полимеризации днк и устройство для его реализации |
CN115551639A (zh) * | 2020-04-21 | 2022-12-30 | 赫孚孟拉罗股份公司 | 具有单分子传感器阵列的高通量核酸定序 |
WO2022020206A1 (en) * | 2020-07-24 | 2022-01-27 | Palogen, Inc. | Nanochannel systems and methods for detecting pathogens using same |
KR102547706B1 (ko) * | 2021-03-16 | 2023-06-29 | 주식회사 멤스팩 | 신속 바이오 진단키트 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013166303A1 (en) * | 2012-05-02 | 2013-11-07 | Ibis Biosciences, Inc. | Dna sequencing |
RU2539038C1 (ru) * | 2013-11-02 | 2015-01-10 | Общество с ограниченной ответственностью "Гамма" | Способ секвенирования днк и устройство для его осуществления (варианты) |
EA022475B1 (ru) * | 2010-10-19 | 2016-01-29 | Ооо "Центр Инновационных Технологий-Нано" | Способ секвенирования днк |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7875440B2 (en) * | 1998-05-01 | 2011-01-25 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
US6280939B1 (en) * | 1998-09-01 | 2001-08-28 | Veeco Instruments, Inc. | Method and apparatus for DNA sequencing using a local sensitive force detector |
US6770472B2 (en) | 2000-11-17 | 2004-08-03 | The Board Of Trustees Of The Leland Stanford Junior University | Direct DNA sequencing with a transcription protein and a nanometer scale electrometer |
US7170050B2 (en) * | 2004-09-17 | 2007-01-30 | Pacific Biosciences Of California, Inc. | Apparatus and methods for optical analysis of molecules |
WO2007111924A2 (en) | 2006-03-23 | 2007-10-04 | The Board Of Trustees Of The Leland Stanford Junior University | Motion resolved molecular sequencing |
US9175338B2 (en) * | 2008-12-11 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Methods for identifying nucleic acid modifications |
US9164053B2 (en) * | 2011-09-26 | 2015-10-20 | The Regents Of The University Of California | Electronic device for monitoring single molecule dynamics |
EP2994544B1 (en) | 2013-05-06 | 2019-10-02 | Pacific Biosciences Of California, Inc. | Real-time electronic sequencing |
IL255446B2 (en) * | 2015-05-12 | 2024-01-01 | Illumina Inc | Field effect device and method for sequencing amino acids |
JP7166586B2 (ja) | 2015-06-25 | 2022-11-08 | ロズウェル バイオテクノロジーズ,インコーポレイテッド | 生体分子センサーおよび方法 |
EP3332033B1 (en) | 2015-08-06 | 2021-04-21 | Pacific Biosciences of California, Inc. | Single-molecule nanofet sequencing systems and methods |
KR20180105699A (ko) | 2016-01-28 | 2018-09-28 | 로스웰 바이오테크놀로지스 인코포레이티드 | 대규모 분자 전자소자 센서 어레이들을 이용하여 분석물들을 측정하는 방법들 및 장치 |
EP3882616A1 (en) | 2016-02-09 | 2021-09-22 | Roswell Biotechnologies, Inc | Electronic label-free dna and genome sequencing |
US10508296B2 (en) | 2017-04-25 | 2019-12-17 | Roswell Biotechnologies, Inc. | Enzymatic circuits for molecular sensors |
EP3622086A4 (en) | 2017-05-09 | 2021-04-21 | Roswell Biotechnologies, Inc | LINK PROBE CIRCUITS FOR MOLECULAR SENSORS |
-
2017
- 2017-12-26 RU RU2017135756A patent/RU2679494C1/ru active
-
2018
- 2018-03-29 WO PCT/RU2018/000202 patent/WO2019132713A1/ru active Application Filing
- 2018-03-29 US US16/484,461 patent/US11034998B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EA022475B1 (ru) * | 2010-10-19 | 2016-01-29 | Ооо "Центр Инновационных Технологий-Нано" | Способ секвенирования днк |
WO2013166303A1 (en) * | 2012-05-02 | 2013-11-07 | Ibis Biosciences, Inc. | Dna sequencing |
RU2539038C1 (ru) * | 2013-11-02 | 2015-01-10 | Общество с ограниченной ответственностью "Гамма" | Способ секвенирования днк и устройство для его осуществления (варианты) |
Non-Patent Citations (1)
Title |
---|
SLIADNEV M.N., MIKROCHIPOVYE SISTEMY DLYA MOLEKULIARNO-GENETICHESKOGO ANALIZA // ROP. KHIM. ZH. (ZH. ROP. KHIM. OB-VA IM. D.I. MENDELEEVA, 2011, pages 123 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3674702A1 (en) * | 2018-12-27 | 2020-07-01 | Imec VZW | Method for sequencing a polynucleotide using a biofet |
Also Published As
Publication number | Publication date |
---|---|
RU2679494C1 (ru) | 2019-02-11 |
US20190360039A1 (en) | 2019-11-28 |
US11034998B2 (en) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2679494C1 (ru) | Способ безметочного одномолекулярного секвенирования ДНК и устройство для его реализации | |
US20220373495A1 (en) | Active-electrode integrated biosensor array and methods for use thereof | |
KR102464547B1 (ko) | 정보 저장을 위한 방법, 조성물, 및 장치 | |
US9791402B2 (en) | Nanostructured microelectrodes and biosensing devices incorporating the same | |
CN104955958B (zh) | 使用标记的核酸测序 | |
CN112384296B (zh) | 用于直接电测量酶活性的装置、系统和方法 | |
JP2018522543A (ja) | 分子タグ付けのための方法、システム、組成物、キット、装置、及びコンピュータ可読媒体 | |
KR20190075010A (ko) | 생체분자의 측정 및 시퀀싱을 위한 시스템 및 방법 | |
US8465926B2 (en) | Method and system for real time quantification and monitoring of nucleic acid amplification using electroconductive or electrochemically active labels | |
CN105308062A (zh) | 用于基于纳米结构的核酸测序的方法和组合物 | |
CN112831544B (zh) | 一种基于CRISPR/Cas12a系统的生物检测方法和生物检测装置 | |
Lindsay | Biochemistry and semiconductor electronics—the next big hit for silicon? | |
WO2017211027A1 (zh) | 一种通过检测焦磷酸电荷的基因测序方法 | |
RU2780050C1 (ru) | Способ безметочного одномолекулярного секвенирования днк и устройство для его реализации на основе зарядочувствительного сенсора | |
US20210301336A1 (en) | Method for label-free single-molecule dna sequencing and device for implementing same | |
US20200377944A1 (en) | Compositions and methods for unidirectional nucleic acid sequencing | |
CN112204154B (zh) | Dna-孔隙-聚合酶复合物的酶促富集 | |
RU2724507C1 (ru) | Способ регистрации результата реакции полимеризации днк и устройство для его реализации | |
US20040096859A1 (en) | Method for detecting and/or quantifying an analyte | |
JP2022524982A (ja) | バイオポリマー同定のためのデバイスおよび方法 | |
WO2023130019A2 (en) | Spatial omics platforms and systems | |
WO2021053744A1 (ja) | アダプター分子、当該アダプター分子と生体分子とが結合した生体分子-アダプター分子複合体、生体分子分析装置及び生体分子分析方法 | |
Lunn | Exploiting DNA surfaces for sensing and nanomaterial applications | |
JP2009060798A (ja) | 核酸の検出方法および核酸検出キット |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 18895737 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 16/11/2020) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 18895737 Country of ref document: EP Kind code of ref document: A1 |