ES2880331T3 - Variantes de polimerasa - Google Patents
Variantes de polimerasa Download PDFInfo
- Publication number
- ES2880331T3 ES2880331T3 ES17708201T ES17708201T ES2880331T3 ES 2880331 T3 ES2880331 T3 ES 2880331T3 ES 17708201 T ES17708201 T ES 17708201T ES 17708201 T ES17708201 T ES 17708201T ES 2880331 T3 ES2880331 T3 ES 2880331T3
- Authority
- ES
- Spain
- Prior art keywords
- pol6
- nanopore
- variant
- polymerase
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000001413 amino acids Chemical class 0.000 claims abstract description 58
- 102000004190 Enzymes Human genes 0.000 claims abstract description 51
- 108090000790 Enzymes Proteins 0.000 claims abstract description 51
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 48
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 43
- 229920001184 polypeptide Polymers 0.000 claims abstract description 41
- 230000004048 modification Effects 0.000 claims abstract description 22
- 238000012986 modification Methods 0.000 claims abstract description 22
- 102220617662 BET1 homolog_E585K_mutation Human genes 0.000 claims abstract description 19
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims abstract description 18
- 230000000694 effects Effects 0.000 claims abstract description 17
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 16
- 125000003729 nucleotide group Chemical group 0.000 claims description 123
- 239000002773 nucleotide Substances 0.000 claims description 119
- 108020004414 DNA Proteins 0.000 claims description 86
- 102000053602 DNA Human genes 0.000 claims description 80
- 238000000034 method Methods 0.000 claims description 69
- 238000007672 fourth generation sequencing Methods 0.000 claims description 64
- 150000003839 salts Chemical class 0.000 claims description 60
- 150000007523 nucleic acids Chemical class 0.000 claims description 47
- 102000039446 nucleic acids Human genes 0.000 claims description 46
- 108020004707 nucleic acids Proteins 0.000 claims description 46
- 238000012163 sequencing technique Methods 0.000 claims description 46
- 238000010494 dissociation reaction Methods 0.000 claims description 40
- 230000005593 dissociations Effects 0.000 claims description 40
- 239000002157 polynucleotide Substances 0.000 claims description 38
- 102000040430 polynucleotide Human genes 0.000 claims description 35
- 108091033319 polynucleotide Proteins 0.000 claims description 35
- 238000006467 substitution reaction Methods 0.000 claims description 29
- 239000012528 membrane Substances 0.000 claims description 28
- 238000006116 polymerization reaction Methods 0.000 claims description 17
- 238000002493 microarray Methods 0.000 claims description 16
- 239000000203 mixture Substances 0.000 claims description 16
- 238000010348 incorporation Methods 0.000 claims description 13
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 11
- 230000007423 decrease Effects 0.000 claims description 11
- 101710092462 Alpha-hemolysin Proteins 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 9
- 239000013604 expression vector Substances 0.000 claims description 8
- 230000002441 reversible effect Effects 0.000 claims description 6
- 102220474639 5,6-dihydroxyindole-2-carboxylic acid oxidase_D44A_mutation Human genes 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 2
- 230000000717 retained effect Effects 0.000 claims description 2
- 235000001014 amino acid Nutrition 0.000 description 53
- 229940088598 enzyme Drugs 0.000 description 43
- 108090000623 proteins and genes Proteins 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 24
- 239000000523 sample Substances 0.000 description 22
- 230000035772 mutation Effects 0.000 description 21
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 18
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 18
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 description 16
- 230000027455 binding Effects 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 16
- 235000018102 proteins Nutrition 0.000 description 15
- 102000004169 proteins and genes Human genes 0.000 description 15
- 230000003068 static effect Effects 0.000 description 14
- 239000000232 Lipid Bilayer Substances 0.000 description 13
- 108091034117 Oligonucleotide Proteins 0.000 description 12
- 125000000539 amino acid group Chemical group 0.000 description 12
- 239000003153 chemical reaction reagent Substances 0.000 description 12
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerol Substances OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 229920000642 polymer Polymers 0.000 description 11
- 230000003362 replicative effect Effects 0.000 description 10
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 10
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 9
- 229920002477 rna polymer Polymers 0.000 description 9
- -1 Mg 2+ Chemical class 0.000 description 8
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 239000001103 potassium chloride Substances 0.000 description 8
- 235000011164 potassium chloride Nutrition 0.000 description 8
- 230000004568 DNA-binding Effects 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- 239000001814 pectin Substances 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 239000011148 porous material Substances 0.000 description 7
- 239000004117 Lignosulphonate Substances 0.000 description 6
- 239000004118 Natrolite-phonolite Substances 0.000 description 6
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 6
- 150000001720 carbohydrates Chemical group 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- 239000002777 nucleoside Substances 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 241000193403 Clostridium Species 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000004225 ferrous lactate Substances 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 229910000160 potassium phosphate Inorganic materials 0.000 description 5
- 235000011009 potassium phosphates Nutrition 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 4
- 229920001213 Polysorbate 20 Polymers 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 235000021317 phosphate Nutrition 0.000 description 4
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 4
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 229940104230 thymidine Drugs 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- 241000095992 Clostridium phage phiCPV4 Species 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- 230000006820 DNA synthesis Effects 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 3
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 229910017052 cobalt Inorganic materials 0.000 description 3
- 239000010941 cobalt Substances 0.000 description 3
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 229910052500 inorganic mineral Inorganic materials 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 235000010755 mineral Nutrition 0.000 description 3
- 239000011707 mineral Substances 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000001226 triphosphate Substances 0.000 description 3
- 235000011178 triphosphate Nutrition 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 108010048586 SpyCatcher peptide Proteins 0.000 description 2
- 108010092505 SpyTag peptide Proteins 0.000 description 2
- 108060008539 Transglutaminase Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 229940054340 bacillus coagulans Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- NLSCHDZTHVNDCP-UHFFFAOYSA-N caesium nitrate Chemical compound [Cs+].[O-][N+]([O-])=O NLSCHDZTHVNDCP-UHFFFAOYSA-N 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- WDRWZVWLVBXVOI-QTNFYWBSSA-L dipotassium;(2s)-2-aminopentanedioate Chemical group [K+].[K+].[O-]C(=O)[C@@H](N)CCC([O-])=O WDRWZVWLVBXVOI-QTNFYWBSSA-L 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 239000003228 hemolysin Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000006011 modification reaction Methods 0.000 description 2
- 235000013919 monopotassium glutamate Nutrition 0.000 description 2
- QCOXCILKVHKOGO-UHFFFAOYSA-N n-(2-nitramidoethyl)nitramide Chemical compound [O-][N+](=O)NCCN[N+]([O-])=O QCOXCILKVHKOGO-UHFFFAOYSA-N 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 239000002751 oligonucleotide probe Substances 0.000 description 2
- 150000002972 pentoses Chemical class 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000012266 salt solution Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 108010018381 streptavidin-binding peptide Proteins 0.000 description 2
- 230000006918 subunit interaction Effects 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 102000003601 transglutaminase Human genes 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- GOUHYARYYWKXHS-UHFFFAOYSA-M 4-formylbenzoate Chemical compound [O-]C(=O)C1=CC=C(C=O)C=C1 GOUHYARYYWKXHS-UHFFFAOYSA-M 0.000 description 1
- HBBSDZXXUIHKJE-UHFFFAOYSA-N 6-hydrazinylpyridine-3-carboxylic acid Chemical compound NNC1=CC=C(C(O)=O)C=N1 HBBSDZXXUIHKJE-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000228257 Aspergillus sp. Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical compound OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- CPELXLSAUQHCOX-UHFFFAOYSA-M Bromide Chemical compound [Br-] CPELXLSAUQHCOX-UHFFFAOYSA-M 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101100545272 Caenorhabditis elegans zif-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- XFXPMWWXUTWYJX-UHFFFAOYSA-N Cyanide Chemical compound N#[C-] XFXPMWWXUTWYJX-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 241000187480 Mycobacterium smegmatis Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- UGJBHEZMOKVTIM-UHFFFAOYSA-N N-formylglycine Chemical compound OC(=O)CNC=O UGJBHEZMOKVTIM-UHFFFAOYSA-N 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 238000012220 PCR site-directed mutagenesis Methods 0.000 description 1
- 241000194109 Paenibacillus lautus Species 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 229920000388 Polyphosphate Polymers 0.000 description 1
- 102100029812 Protein S100-A12 Human genes 0.000 description 1
- 101710110949 Protein S100-A12 Proteins 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000607149 Salmonella sp. Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000607758 Shigella sp. Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 241001468239 Streptomyces murinus Species 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- YDHWWBZFRZWVHO-UHFFFAOYSA-H [oxido-[oxido(phosphonatooxy)phosphoryl]oxyphosphoryl] phosphate Chemical compound [O-]P([O-])(=O)OP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O YDHWWBZFRZWVHO-UHFFFAOYSA-H 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 150000003934 aromatic aldehydes Chemical class 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 239000012131 assay buffer Substances 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- QTPILKSJIOLICA-UHFFFAOYSA-N bis[hydroxy(phosphonooxy)phosphoryl] hydrogen phosphate Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(=O)OP(O)(=O)OP(O)(O)=O QTPILKSJIOLICA-UHFFFAOYSA-N 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical class [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 159000000007 calcium salts Chemical class 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 230000001036 exonucleolytic effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000015784 hyperosmotic salinity response Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- KJLLKLRVCJAFRY-UHFFFAOYSA-N mebutizide Chemical compound ClC1=C(S(N)(=O)=O)C=C2S(=O)(=O)NC(C(C)C(C)CC)NC2=C1 KJLLKLRVCJAFRY-UHFFFAOYSA-N 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 229920002113 octoxynol Polymers 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 125000001805 pentosyl group Chemical group 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000001205 polyphosphate Substances 0.000 description 1
- 235000011176 polyphosphates Nutrition 0.000 description 1
- XAEFZNCEHLXOMS-UHFFFAOYSA-M potassium benzoate Chemical compound [K+].[O-]C(=O)C1=CC=CC=C1 XAEFZNCEHLXOMS-UHFFFAOYSA-M 0.000 description 1
- FGIUAXJPYTZDNR-UHFFFAOYSA-N potassium nitrate Chemical compound [K+].[O-][N+]([O-])=O FGIUAXJPYTZDNR-UHFFFAOYSA-N 0.000 description 1
- OTYBMLCTZGSZBG-UHFFFAOYSA-L potassium sulfate Chemical compound [K+].[K+].[O-]S([O-])(=O)=O OTYBMLCTZGSZBG-UHFFFAOYSA-L 0.000 description 1
- 229910052939 potassium sulfate Inorganic materials 0.000 description 1
- 235000011151 potassium sulphates Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 125000003607 serino group Chemical class [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 229910001631 strontium chloride Inorganic materials 0.000 description 1
- AHBGXTDRMVNFER-UHFFFAOYSA-L strontium dichloride Chemical compound [Cl-].[Cl-].[Sr+2] AHBGXTDRMVNFER-UHFFFAOYSA-L 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07007—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Una enzima Pol6 variante que tiene actividad polimerasa, comprendiendo dicha enzima Pol6 variante un polipéptido que tiene una secuencia de aminoácidos al menos un 70 % idéntica al polipéptido original de longitud completa de SEQ ID NO: 2, y una modificación correspondiente al aminoácido E585K.
Description
DESCRIPCIÓN
Variantes de polimerasa
Campo técnico
Se proporcionan ADN polimerasas modificadas. Las ADN polimerasas comprenden mutaciones que potencian la procesividad de las polimerasas, en particular, en procedimientos de secuenciación por nanoporos.
Antecedentes
Los nanoporos han surgido recientemente como una plataforma sin marcadores para interrogar la secuencia y la estructura en los ácidos nucleicos. Los datos se informan típicamente como una serie temporal de corriente iónica a medida que se determina la secuencia de ADN cuando se aplica un campo eléctrico aplicado a través de un único poro controlado por un amplificador de bloqueo de voltaje. Se pueden examinar de cientos a miles de moléculas en un ancho de banda y resolución espacial altos.
Un obstáculo crucial para el éxito de los nanoporos como herramienta de análisis de ADN fiable es la procesividad, lo que afecta la longitud de lectura promedio. Esta y otras propiedades deseables se pueden potenciar modificando polimerasas para incrementar la cantidad de información de secuencia obtenida de una reacción de secuenciación.
Sumario de la invención
En un aspecto, se proporciona una enzima Pol6 variante que tiene actividad polimerasa. La enzima Pol6 variante comprende un polipéptido que tiene una secuencia de aminoácidos al menos un 70 % idéntica al polipéptido original de longitud completa de SEQ ID NO: 2, y una modificación E585K, la modificación produce un polipéptido variante que tiene procesividad incrementada en relación con el polipéptido original. En algunos modos de realización, la procesividad incrementada comprende una disminución en la velocidad de disociación de molde que es al menos dos veces menor que la de la Pol6 original. En algunos modos de realización, la procesividad de la Pol6 variante comprende un incremento en la longitud de lectura producida por la Pol6 variante que es mayor que la longitud de lectura producida por la Pol6 original no modificada. La Pol6 variante comprende además las sustituciones aminoacídicas D44A, S366A, T529M y A547F. En algunos modos de realización, la Pol6 variante se fija a un nanoporo monomérico o a uno oligomérico.
En otro aspecto, se proporciona una composición que comprende una enzima Pol6 variante que tiene actividad polimerasa. En algunos modos de realización, la composición comprende una enzima Pol6 variante como se describe anteriormente.
En otro aspecto, se proporciona una pluralidad de polinucleótidos que codifican una enzima Pol6 variante. En algunos modos de realización, la pluralidad de polinucleótidos codifica una enzima Pol6 variante como se describe anteriormente.
En otro aspecto, se proporciona un vector de expresión que comprende un polinucleótido que codifica una enzima Pol6 variante que tiene actividad polimerasa. En algunos modos de realización, el vector de expresión comprende uno cualquiera de una pluralidad de polinucleótidos que codifican una enzima Pol6 variante que comprende un polipéptido como se describe anteriormente.
En otro aspecto, se proporciona una pluralidad de células huésped, cada una transformada o transfectada con un vector de expresión que codifica una enzima Pol6 variante como se describe anteriormente que tiene actividad polimerasa.
En otro aspecto, se proporciona un procedimiento para preparar una enzima Pol6 variante que tiene actividad polimerasa como se describe anteriormente. En algunos modos de realización, el procedimiento comprende cultivar células huésped que se transforman o transfectan con un vector de expresión que codifica una cualquiera de las polimerasas Pol6 variantes descritas en el presente documento.
En otro aspecto, se proporciona una micromatriz para secuenciar una muestra de ácido nucleico. La micromatriz comprende una pluralidad de complejos de secuenciación por nanoporos, que comprenden una polimerasa Pol6 variante como se describe anteriormente.
En otro aspecto, se proporciona un procedimiento para secuenciar por nanoporos una muestra de ácido nucleico. El procedimiento comprende (a) proporcionar nucleótidos marcados a un complejo de secuenciación por nanoporos que comprende una Pol6 variante como se describe en otra parte en el presente documento, en el que un nucleótido marcado individual de dichos nucleótidos marcados contiene una marca acoplada a un nucleótido, siendo detectable esta marca con la ayuda del nanoporo; (b) bajo una alta concentración de sal, llevar a cabo una reacción de polimerización con la ayuda de la enzima Pol6 variante del complejo de secuenciación por nanoporos,
incorporando de este modo un nucleótido marcado individual de los nucleótidos marcados en una hebra en crecimiento complementaria a una molécula de ácido nucleico monocatenario de la muestra de ácido nucleico; y (c) detectar, con la ayuda del nanoporo, una marca asociada con el nucleótido marcado individual durante la incorporación del nucleótido marcado individual, en el que la marca se detecta con la ayuda del nanoporo mientras que el nucleótido está asociado con la polimerasa Pol6 variante. La enzima Pol6 variante que comprende un polipéptido que tiene una secuencia de aminoácidos al menos un 70 % idéntica al polipéptido original de longitud completa de SEQ ID NO: 2, y una modificación E585K. La modificación produce un polipéptido variante que tiene procesividad incrementada en relación con el polipéptido original. En algunos modos de realización, la procesividad incrementada comprende una disminución en la velocidad de disociación de molde que es al menos dos veces menor que la de la Pol6 original. En algunos modos de realización, la procesividad de la Pol6 variante comprende un incremento en la longitud de lectura producida por la Pol6 variante que es mayor que la longitud de lectura producida por la Pol6 original no modificada. En algunos modos de realización, la Pol6 variante comprende además sustituciones aminoacídicas D44A, S366A, T529M y A547F. En algunos modos de realización, la muestra de ácido nucleico es ADN bicatenario. En algunos modos de realización, la muestra de ácido nucleico es ADN monocatenario. En algunos modos de realización, la muestra de ácido nucleico es ARN retrotranscrito. En algunos modos de realización, el nanoporo es un nanoporo monomérico, por ejemplo, OmpG. En otros modos de realización, el nanoporo es un nanoporo oligomérico, por ejemplo, un nanoporo de alfa-hemolisina. En algunos modos de realización, la secuenciación por nanoporos se realiza a una alta concentración de sal que es al menos sal 100 mM.
Breve descripción de los dibujos
La figura 1 ilustra las etapas catalíticas mínimas requeridas para la incorporación de un único nucleótido por la ADN polimerasa. La reacción comienza con la unión de la enzima (E) ADN polimerasa libre a un complejo de ADN cebador/molde doble (ADNn) que da como resultado un complejo enzima-ADN binario (EADNn). kas.ADN indica la velocidad de asociación de la enzima con el molde; y kdis.ADN indica la velocidad de disociación de la enzima del complejo enzima-ADN. El equilibrio determinado por las velocidades kas.ADN y kdis.ADN definen la procesividad estática del complejo polimerasa-molde. Por tanto, la procesividad estática de la enzima se puede incrementar por un incremento en la velocidad de asociación, kas.ADN, y/o una disminución en la velocidad de disociación, kdis.ADN. La adición del nucleótido (dNTP) correcto en presencia de cationes divalentes, tales como Mg2+, promueve la formación del complejo ternario enzima-ADN-dNTP (EADNn dNTPMg2+). La kas, nucleótido indica la velocidad de unión a nucleótido de la enzima. La kdis, nucleótido indica la velocidad de disociación de nucleótido del complejo moldeenzima. El equilibrio determinado por la kas, nucleótido y la kdis, nucleótido define la procesividad replicativa de la polimerasa. Por tanto, se puede incrementar la procesividad replicativa de la polimerasa por un incremento en la velocidad de asociación de nucleótido, k as, nucleótido, y/o una disminución en la velocidad de disociación de nucleótido, kdis, nucleótido. La unión del dNTP induce el primer cambio conformacional de la enzima en el complejo ternario. Se forma un enlace fosfodiéster entre el a-fosfato del dNTP entrante y el 3'-OH del molde/extremo de cebador para producir una base de nucleótido añadida al extremo del cebador (£*ADNn+i ■ PP i). La reacción genera un pirofosfato (PP i) y un protón. Un segundo cambio conformacional permite la liberación del PP i para completar un ciclo de incorporación de nucleótido.
La figura 2 ilustra un molde ejemplar usado en el ensayo de desplazamiento. Se hace referencia al ejemplo 3.
La figura 3 A-D es un gráfico que muestra datos representativos de un ensayo de desplazamiento estático para una polimerasa Pol6 original ((A); Pol6-44-D44A; SEQ ID NO: 4), y polimerasas Pol6 variantes Pol6-44-D44A-E585K ((B); SEQ ID NO: 6); Pol6-44-A44D-E585K+L731K ((C); SEQ ID NO: 7); y Pol6-44-A44D-E585K+M738K ((D); Se Q ID NO: 8). Se hace referencia al ejemplo 3.
Descripción detallada
La invención se describirá ahora en detalle a modo de referencia usando solo las siguientes definiciones y ejemplos. Todas las patentes y publicaciones, incluyendo todas las secuencias divulgadas en dichas patentes y publicaciones, a las que se hace referencia en el presente documento, se incorporan expresamente por referencia.
A menos que se defina de otro modo en el presente documento, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que se entiende comúnmente por un experto en la técnica a la que pertenece la presente invención. Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 2.a ED., John Wiley and Sons, Nueva York (1994), y Hale y Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, NY (1991) proporcionan a un experto un diccionario general de muchos de los términos usados en la presente invención. Aunque cualquier procedimiento y material similar o equivalente a los descritos en el presente documento se puede usar en la práctica o pruebas de la presente invención, se describen los procedimientos y materiales preferentes. Los profesionales sanitarios se dirigen en particular a Sambrook et al., 1989, y Ausubel FM et al., 1993, para consultar definiciones y términos de la técnica. Se ha de entender que la presente invención no está limitada a la metodología, protocolos y reactivos particulares descritos, ya que estos pueden variar.
Los intervalos numéricos incluyen los números que definen el intervalo. El término aproximadamente se usa en el presente documento para querer decir más o menos un diez por ciento (10 %) de un valor. Por ejemplo, "aproximadamente 100" se refiere a cualquier número entre 90 y 110.
A menos que se indique de otro modo, los ácidos nucleicos se escriben de izquierda a derecha en una orientación de 5' a 3'; las secuencias de aminoácidos se escriben de izquierda a derecha en una orientación de amino a carboxilo, respectivamente.
Los títulos proporcionados en el presente documento no son limitaciones de los diversos aspectos o modos de realización de la invención que se pueden tener por referencia a la memoria descriptiva como un todo. En consecuencia, los términos definidos inmediatamente a continuación se definen más completamente por referencia a la memoria descriptiva como un todo.
Todas las patentes y publicaciones, incluyendo todas las secuencias divulgadas en dichas patentes y publicaciones, a las que se hace referencia en el presente documento, se incorporan expresamente por referencia.
Definiciones
En el presente documento, el término "procesividad" se refiere a la capacidad de una polimerasa para permanecer fijada al molde y realizar múltiples reacciones de modificación. Las "reacciones de modificación" incluyen pero no se limitan a polimerización y escisión exonucleolítica. En algunos modos de realización, "procesividad" se refiere a la capacidad de una ADN polimerasa para realizar una secuencia de etapas de polimerización sin disociación intermedia de la enzima de las cadenas de ADN en crecimiento. Típicamente, la "procesividad" de una ADN polimerasa se mide por el número de nucleótidos (por ejemplo 20 nts, 300 nts, 0,5-1 kb, o más) que se incorporan, es decir, se polimerizan por una polimerasa para producir una hebra de ADN en crecimiento antes de la disociación de la ADN polimerasa de la hebra de ADN en crecimiento. La procesividad de la síntesis de ADN por una ADN polimerasa se define como el número de nucleótidos que una polimerasa puede incorporar en el ADN durante un único acontecimiento de unión al molde, antes de disociarse de un molde de ADN. La eficacia global de la síntesis de ADN se incrementa cuando se incrementa la procesividad de una polimerasa. La "procesividad" puede depender de la naturaleza de la polimerasa, la secuencia de un molde de ADN y condiciones de reacción, por ejemplo, concentración de sal, temperatura o la presencia de proteínas específicas. Como se usa en el presente documento, el término "alta procesividad" se refiere a una procesividad mayor a 20 nts (por ejemplo, mayor a 40 nts, 60 nts, 80 nts, 100 nts, 120 nts, 140 nts, 160 nts, 180 nts, 200 nts, 220 nts, 240 nts, 260 nts, 280 nts, 300 nts, 320 nts, 340 nts, 360 nts, 380 nts, 400 nts o más) por asociación/disociación con el molde. Cuanto mayor sea la procesividad de una polimerasa, mayor será el número de nucleótidos que se pueden incorporar antes de la disociación de la polimerasa del molde y, por lo tanto, más larga será la secuencia (longitud de lectura) que se puede obtener. La procesividad se puede medir de acuerdo con los procedimientos definidos en el presente documento y en el documento WO 01/92501 A1 (MJ Bioworks, Inc., Improved Nucleic Acid Modifying Enzymes, publicado el 6 de diciembre de 2001). La procesividad engloba la procesividad estática y la procesividad replicativa.
En el presente documento, el término "procesividad estática" se refiere a la permanencia de un complejo polimerasa-molde en ausencia de incorporación de nucleótidos, es decir, en ausencia de síntesis de polinucleótidos, como se determina por la velocidad de asociación de la polimerasa con el molde, kas.ADN, y la velocidad de disociación de la polimerasa del complejo polimerasa-molde, kd isA D N . La procesividad estática se define en ausencia de síntesis de polinucleótidos.
En el presente documento, el término "procesividad replicativa" se refiere a la permanencia de un complejo polimerasa-molde durante la incorporación de nucleótidos, es decir, en presencia de síntesis de polinucleótidos, como se determina por la velocidad de asociación de la polimerasa con el molde, kas.nucleótido, y la velocidad de disociación de la polimerasa del complejo polimerasa-molde, kdisnucleótido.
El término "velocidad de asociación", cuando se usa en referencia a una polimerasa dada, en el presente documento se refiere a la velocidad a la que una polimerasa se asocia con un molde. La velocidad de asociación se puede interpretar como una constante en el tiempo para la asociación ("kas, a d n ") de una polimerasa con un molde de ácido nucleico en un conjunto definido de condiciones de reacción. Algunos ensayos ejemplares para medir la constante en el tiempo de disociación de una polimerasa se describen además a continuación. En algunos modos de realización, la constante en el tiempo de disociación se puede medir en unidades de tiempo inverso, por ejemplo, s_1 o min-1.
El término "velocidad de disociación", cuando se usa en referencia a una polimerasa dada, en el presente documento se refiere a la velocidad a la que una polimerasa se disocia del molde del complejo polimerasa-molde. La velocidad de disociación se puede interpretar como una constante en el tiempo para la disociación ("kdis, a d n ") de una polimerasa de un molde de ácido nucleico en un conjunto definido de condiciones de reacción. Algunos ensayos ejemplares para medir la constante en el tiempo de disociación de una polimerasa se describen además a continuación. En algunos modos de realización, la constante en el tiempo de disociación se puede medir en unidades de tiempo inverso, por ejemplo, s_1 o min_1.
En el presente documento, el término "longitud de lectura" se refiere al número de nucleótidos que una polimerasa incorpora en una hebra de ácido nucleico de manera dependiente del molde antes de la disociación del molde. En el presente documento, el término "alta concentración de sal" se refiere a una concentración de sal, es decir, sal monovalente que es al menos sal 100 mM y hasta 1 M.
En el presente documento, los términos "polinucleótido" y "ácido nucleico" se usan de manera intercambiable para referirse a una molécula de polímero compuesta por monómeros de nucleótidos enlazados covalentemente en una cadena. El ADN monocatenario (ácido desoxirribonucleico mc; ADNmc), el ADN bicatenario (ADNbc) y el ARN (ácido ribonucleico) son ejemplos de polinucleótidos.
En el presente documento, el término "aminoácido", en su sentido más amplio, se refiere a cualquier compuesto y/o sustancia que se puede incorporar en una cadena polipeptídica. En algunos modos de realización, un aminoácido tiene la estructura general H2N-C(H)(R)-COOH. En algunos modos de realización, un aminoácido es un aminoácido natural. En algunos modos de realización, un aminoácido es un aminoácido sintético; en algunos modos de realización, un aminoácido es un D-aminoácido; en algunos modos de realización, un aminoácido es un L-aminoácido. "Aminoácido estándar" se refiere a cualquiera de los veinte L-aminoácidos estándar encontrados comúnmente en péptidos naturales. "Aminoácido no estándar" se refiere a cualquier aminoácido, distinto de los aminoácidos estándar, independientemente de si se prepara sintéticamente o se obtiene de una fuente natural. Como se usa en el presente documento, "aminoácido sintético" engloba aminoácidos modificados químicamente, incluyendo pero sin limitarse a sales, derivados de aminoácidos (tales como amidas) y/o sustituciones. Los aminoácidos, incluyendo aminoácidos carboxi y/o aminoterminales en péptidos, se pueden modificar por metilación, amidación, acetilación y/o sustitución con otros grupos químicos sin afectar negativamente a su actividad. Los aminoácidos pueden participar en un enlace disulfuro. El término "aminoácido" se usa de manera intercambiable con "residuo aminoacídico" y se puede referir a un aminoácido libre y/o a un residuo aminoacídico de un péptido. Será evidente a partir del contexto en el que se usa el término si se refiere a un aminoácido libre o a un residuo de un péptido. Cabe destacar que todas las secuencias de residuos aminoacídicos se representan en el presente documento por fórmulas con una orientación izquierda y derecha que está en el sentido convencional del extremo amino al extremo carboxílico.
En el presente documento, el término "complejo de secuenciación por nanoporos" se refiere a un nanoporo unido a una enzima, por ejemplo, una polimerasa, que a su vez está asociada con un polímero, por ejemplo, un polinucleótido o una proteína. El complejo de secuenciación por nanoporos se sitúa en una membrana, por ejemplo, una bicapa lipídica, donde funciona para identificar componentes poliméricos, por ejemplo, nucleótidos o aminoácidos.
En el presente documento, el término "complejo enzima-polímero" se refiere a una enzima, por ejemplo, polimerasa que está asociada/acoplada con un polímero, por ejemplo, polinucleótido o proteína.
En el presente documento, el término "complejo enzima-nanoporo" se refiere a un nanoporo que está asociado/acoplado con una enzima de secuenciación, por ejemplo, una polimerasa Pol6 variante. En algunos modos de realización, el nanoporo se puede unir de forma reversible o irreversible a la enzima de secuenciación. Los términos "alfa-hemolisina", "a-hemolisina", "aHL", "aHL", "a-HL" y "a-HL" se usan de manera intercambiable y en el presente documento se refieren a una proteína que se autoensambla para producir un canal de nanoporos transmembranario lleno de agua heptamérico.
En el presente documento, el término "OmpG" se refiere a un nanoporo monomérico de proteína G de membrana externa.
En el presente documento, el término "nucleótido" se refiere a una unidad monomérica de ADN o ARN que consiste en un resto glucídico (pentosa), un fosfato y una base heterocíclica nitrogenada. La base se une al resto glucídico por medio del carbono glucosídico (carbono 1' de la pentosa) y esa combinación de base y glúcido es un nucleósido. Cuando el nucleósido contiene un grupo fosfato enlazado en la posición 3' o 5' de la pentosa se denomina nucleótido. Una secuencia de nucleótidos unidos de forma funcional se denomina típicamente en el presente documento "secuencia de bases" o "secuencia de nucleótidos," y se representa en el presente documento por una fórmula con una orientación de izquierda a derecha que está en el sentido convencional del extremo 5' al extremo 3'.
En el presente documento, el término "análogo de nucleótido" se refiere a análogos de nucleósidos trifosfato, por ejemplo, nucleósidos trifosfato de (S)-glicerol (gNTP) de las nucleobases comunes: adenina, citosina, guanina, uracilo y timidina (Horhota et al., Organic Letters, 8:5345-5347 [2006]).
En el presente documento, el término "marca" se refiere a un resto detectable que puede ser átomos o moléculas, o una colección de átomos o moléculas. Una marca puede proporcionar una firma óptica, electroquímica,
magnética o electrostática (por ejemplo, inductiva, capacitiva), que se puede detectar con la ayuda de un nanoporo. En el presente documento, el término "nucleótido marcado" se refiere a un nucleótido que tiene una marca fijada en su fosfato terminal.
En el presente documento, el término "enzima de secuenciación" se refiere a la enzima de un complejo de secuenciación por nanoporos donde sirve para identificar componentes poliméricos, por ejemplo, nucleótidos o aminoácidos.
En el presente documento, el término "polimerasa" se refiere a una enzima que cataliza la polimerización de nucleótidos (es decir, la actividad polimerasa). El término polimerasa engloba ADN polimerasas, ARN polimerasas y retrotranscriptasas. Una "ADN polimerasa" cataliza la polimerización de desoxinucleótidos. Una "ARN polimerasa" cataliza la polimerización de ribonucleótidos. Una "retrotranscriptasa" cataliza la polimerización de desoxinucleótidos que son complementarios a un molde de ARN.
En el presente documento, los términos "molécula de ADN molde" y "hebra de molde" se usan de manera intercambiable para referirse a una hebra de un ácido nucleico del que se sintetiza una hebra de ácido nucleico complementaria por una ADN polimerasa, por ejemplo, en una reacción de extensión de cebador.
En el presente documento, el término "polinucleótido de muestra" se refiere a un polinucleótido obtenido de una muestra, por ejemplo, una muestra biológica.
El término "manera dependiente de molde" se refiere a un proceso que implica la extensión dependiente de molde de una molécula de cebador (por ejemplo, la síntesis de ADN por ADN polimerasa). El término "manera dependiente de molde" se refiere típicamente a la síntesis de polinucleótidos de ARN o ADN en la que la secuencia de la hebra de polinucleótido recién sintetizada se dicta por las normas bien conocidas del emparejamiento de bases complementarias (véase, por ejemplo, Watson, J. D. et al., en: Molecular Biology of the Gene, 4.a ed., W. A. Benjamin, Inc., Menlo Park, Calif. (1987)).
En el presente documento, el término "nanoporo" se refiere a un canal o paso formado o de otro modo proporcionado en una membrana. Una membrana puede ser una membrana orgánica, tal como una bicapa lipídica, o una membrana sintética, tal como una membrana formada de un material polimérico. El nanoporo se puede disponer contiguo o cercano a un circuito de detección o un electrodo acoplado a un circuito de detección, tal como, por ejemplo, un circuito con semiconductor complementario de óxido metálico (CMOS) o transistor de efecto campo (FET). En algunos ejemplos, un nanoporo tiene un ancho o diámetro característico del orden de 0,1 Nm a aproximadamente 1o0o nm. Algunos nanoporos son proteínas. La OmpG y la alfa-hemolisina son ejemplos de un nanoporo proteico.
En el presente documento, el término "nanoporo monomérico" se refiere a una proteína nanoporo que consiste en una única subunidad. La OmpG es un ejemplo de un nanoporo monomérico.
En el presente documento, el término "nanoporo oligomérico" se refiere a nanoporos que se pueden componer de múltiples subunidades idénticas, múltiples subunidades distintas o una mezcla de subunidades idénticas y distintas. Los nanoporos con subunidades idénticas se denominan "nanoporos homooligoméricos". Los nanoporos que contienen dos o más subunidades polipeptídicas distintas se denominan "nanoporos heterooligoméricos". La alfa hemolisina es un ejemplo de un nanoporo oligomérico.
En el presente documento, el término "natural" se refiere a un gen o producto génico (por ejemplo, una proteína) que tiene las características de ese gen o producto génico cuando se aísla de una fuente natural.
En el presente documento, el término "original" se refiere a una proteína, por ejemplo, un nanoporo o una enzima, a la que se le hacen modificaciones, por ejemplo, sustitución/sustituciones, inserción/inserciones, deleción/deleciones y/o truncamiento(s), para producir variantes de la misma. Este término también se refiere al polipéptido con el que se compara y alinea una variante. El polipéptido original puede ser uno natural, o puede ser una variante del mismo, preparado por cualquier medio adecuado.
En el presente documento, el término "mutación" se refiere a un cambio introducido en una secuencia original incluyendo, pero sin limitarse a, sustituciones, inserciones, deleciones (incluyendo truncamientos). Las consecuencias de una mutación incluyen, pero no se limitan a, la creación de un nuevo carácter, propiedad, función, fenotipo o rasgo no encontrado en la secuencia original.
En el presente documento, el término "variante" se refiere a una proteína modificada, por ejemplo, una polimerasa Pol6 variante, que presenta características alteradas cuando se compara con la proteína original, por ejemplo, procesividad alterada.
En el presente documento, el término "purificado" se refiere a un polipéptido que está presente en una muestra a
una concentración de al menos un 95 % en peso, o al menos un 98 % en peso de la muestra en la que está contenido.
Nomenclatura
En la presente descripción y reivindicaciones, se usan los códigos de una letra y tres letras convencionales para los residuos aminoacídicos.
Para facilidad de referencia, las variantes de polimerasa de la solicitud se describen por el uso de la siguiente nomenclatura:
Aminoácido(s) original(es): posición/posiciones: aminoácido(s) sustituido(s). De acuerdo con esta nomenclatura, por ejemplo, la sustitución de serina por una alanina en la posición 242 se muestra como:
Las mutaciones múltiples se separan por signos de más, es decir:
Glu585Lys+Leu731 Lys o E585K+L731K
que representan mutaciones en las posiciones 585 y 731 que sustituyen ácido glutámico y ácido leucina por lisina y leucina por lisina, respectivamente.
Cuando uno o más residuos aminoacídicos alternativos se pueden insertar en una posición dada, se indica como: E585K/R o E585K o E585R.
Polipéptidos de polimerasa Pol6 variante
En la secuenciación por nanoporos, las altas concentraciones de sal aumentan la proporción de señal con respecto a ruido para mediciones de nanoporos basadas en corrientes iónicas. Sin embargo, a altas concentraciones de sal, el complejo polimerasa-molde de ADN se vuelve inestable y da lugar a altas tasas de recambio de polimerasa y disminución de la detección de adiciones de nucleótidos secuenciales, es decir, la longitud de las lecturas de secuencia, durante las reacciones de polimerización.
La presente divulgación proporciona polipéptidos de polimerasa Pol6 variante, composiciones que comprenden los polipéptidos de variante de Pol6 y procedimientos para usar los polipéptidos de Pol6 variante para determinar la secuenciación de ácidos nucleicos, por ejemplo, por secuenciación por nanoporos. Las polimerasas Pol6 variantes poseen velocidades disminuidas de disociación de molde del complejo polimerasa-molde, lo que da como resultado procesividad incrementada en relación con los polipéptidos de Pol6 original de los que se derivan. La procesabilidad incrementada se obtiene a altas concentraciones de sal, como se describe en otra parte en el presente documento.
Las variantes de polimerasa proporcionadas en el presente documento se pueden usar en la secuenciación de polinucleótidos basada en chip como se describe en el documento WO2013/188841 (Genia Technologies, Inc., Chip Set-Up and High-Accuracy Nucleic Acid Sequencing, publicado el 19 de diciembre de 2013).
Las características deseadas de una polimerasa que encuentra uso en la secuenciación de ADN son:
a. kdis nucleótido lenta y/o kdis,ADN lenta
b. kas,nucleótido rápida y/o kas,ADN rápida
c. Alta fidelidad
d. Baja actividad exonucleasa
e. Desplazamiento de la hebra de ADN
f. kquím
g. Estabilidad incrementada
h. Procesividad incrementada
i. Tolerancia a la sal
j. Compatible con fijación a nanoporo
k. Capacidad para incorporar polifosfatos que tienen 4, 5, 6, 7 u 8 fosfatos, por ejemplo, nucleótidos tetrafosfato, pentafosfato, hexafosfato, heptafosfato u octofosfato
l. Exactitud de secuenciación
m. Longitudes de lectura largas, es decir, lecturas continuas largas.
Las variantes de polimerasa Pol6 proporcionadas en el presente documento comprenden modificaciones que se genomanipulan para incrementar la procesividad y que se pueden combinar con modificaciones adicionales que imparten o potencian una o más de las características deseadas de una polimerasa para secuenciar polinucleótidos, por ejemplo, ADN.
En un aspecto, la divulgación proporciona polipéptidos de polimerasa Pol6 variante que presentan procesividad incrementada en comparación con los polipéptidos originales de los que se derivan. Los polipéptidos de Pol6 variantes poseen procesividad replicativa intrínseca larga en condiciones de bajo contenido de sal naturales. Como se ilustra en la figura 1, la procesividad de una polimerasa, por ejemplo, la Pol6 variante, está relacionada con la procesividad estática y la procesividad replicativa. La procesividad estática es la capacidad del complejo polimerasa-molde de permanecer asociado en ausencia de polimerización de nucleótidos y, por lo tanto, depende de las velocidades de asociación, kas, a d n y la velocidad de disociación, kdis, a d n . Por tanto, la procesividad estática se puede incrementar por un incremento en kas, a d n y/o una disminución en kdis, a d n . En presencia de nucleótidos y Mg2+ la polimerasa lleva a cabo rondas secuenciales de incorporación de nucleótidos hasta que se disocia del complejo polimerasa-molde, como se determina por la velocidad de disociación de la polimerasa del complejo polimerasa-molde (fci¡s,ADN). La procesividad replicativa es la capacidad de la polimerasa, cuando forma un complejo con el molde, para incorporar nucleótidos de manera dependiente del molde. Por tanto, la procesividad global de la polimerasa depende de su procesividad estática y replicativa. Por tanto, la procesividad de una polimerasa se puede incrementar por un incremento de la procesividad estática y/o la procesividad replicativa.
En algunos modos de realización, el polipéptido original es un polipéptido de Pol6 natural. Los polipéptidos de Pol6 variante se pueden derivar de una región codificante de ácido nucleico de secuencia natural (s Eq ID NO: 1) del fago de Clostridium phiCPV4 original natural más una marca His; SEQ ID NO: 1, región codificante de proteína) y disponible en otra parte (National Center for Bioinformatics o GenBank con números de acceso AFH27113). Una polimerasa Pol6 original natural puede ser un homólogo de la Pol6 original de Clostridium que se puede usar como punto de partida para proporcionar polimerasas variantes que tienen una procesividad incrementada. Se apreciará que otras polimerasas que tienen un alto grado de homología con el fago de Clostrium sp. cepa phiCPV4 pueden servir como Pol6 original sin anular el alcance de las composiciones y procedimientos proporcionados en el presente documento. Los homólogos de la Pol6 original del fago de Clostridium pueden compartir identidad de secuencia con la Pol6 del fago de Clostridium (SEQ ID NO: 1) de al menos un 70 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %. Por ejemplo, se puede derivar una Pol6 variante a partir de un homólogo del fago de Clostridium que sea al menos un 7o % idéntica a la Pol6 original del fago de Clostridium.
En otros modos de realización, los polipéptidos de Pol6 variante se pueden derivar de una Pol6 original variante. En algunos modos de realización, la polimerasa Pol6 original variante es la polimerasa Pol6 de SEQ ID NO: 2. En otros modos de realización, la polimerasa Pol6 original variante comprende modificaciones que eliminan/disminuyen la actividad exonucleasa de la polimerasa (solicitud provisional de EE. UU. P529). Aún en otros modos de realización, la polimerasa se puede mutar para reducir la velocidad a la que la polimerasa incorpora un nucleótido en una hebra de ácido nucleico (por ejemplo, una hebra de ácido nucleico en crecimiento). En algunos casos, la velocidad a la que se incorpora un nucleótido en una hebra de ácido nucleico se puede reducir funcionalizando el nucleótido y/o la hebra molde para proporcionar un impedimento estérico, tal como, por ejemplo, a través de la metilación de la hebra de ácido nucleico molde. En algunos casos, la velocidad se reduce incorporando nucleótidos metilados (P521). En otros modos de realización, el polipéptido original es una variante de Pol6 en la que se han introducido mutaciones adicionales para mejorar las características deseadas de una polimerasa usada en la secuenciación por nanoporos. La Pol6 variante puede compartir identidad de secuencia con la Pol6 original de SEQ ID NO: 2 de al menos un 70 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 98 % o al menos un 99 %.
Las posiciones de los aminoácidos responsables de la interacción del ADN se predijeron en base a las estructuras cristalinas de Phi29 unidas al molde de ADN (Berman et al., EMBO J. 2007, publicado en línea http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1933411/).
En algunos modos de realización, la modificación de uno o más aminoácidos en el sitio de unión del ADN puede ser una o más de una sustitución, una deleción o una inserción, esta(s) modificación/modificaciones retiene(n) la actividad polimerasa de la polimerasa variante, y disminuye(n) la velocidad de disociación del polinucleótido del complejo Pol-ADN en relación con el de la Pol6 original. La(s) modificación/modificaciones aminoacídica(s) se puede(n) hacer en uno o más de los residuos aminoacídicos correspondientes a los residuos aminoacídicos V173, N175, N176, N177, I178, V179, Y180, S211, Y212, I214, Y338, T339, G340, G341, T343, H344, A345, D417, I418,
F419, K420, I421, G422, G434, A436, Y441, G559, T560, Q662, N563, E566, E565, D568, L569, I570, M571, D572, N574, G575, L576, L577, T578, F579, T580, G581, S582, V583, T584, Y596, E587, G588, E590, F591, V667, L668, G669, Q670, L685, C687, C688, G689, L690, P691, S692, A694, L708, G709, Q717, R718, V721, I734, I737, M738, F739, D693, L731, F732, T733, T287, G288, M289, R290, T291, A292, S293, S294, I295, Y342, V436, S437, G438, Q439, E440 y E585, de SEQ ID NO: 2. En algunos modos de realización, la enzima Pol6 variante que tiene actividad polimerasa, comprende una secuencia de aminoácidos al menos un 70 % idéntica a la de la Pol6 original de longitud completa de SEQ ID NO: 2, y tiene una modificación en uno o más de los aminoácidos correspondientes a los residuos aminoacídicos V173, N175, N176, N177, I178, V179, Y180, S211, Y212, I214, Y338, T339, G340, G341, T343, H344, A345, D417, I418, F419, K420, I421, G422, G434, A436, Y441, G559, T560, Q662, N563, E566, E565, D568, L569, I570, M571, D572, N574, G575, L576, L577, T578, F579, T580, G581, S582, V583, T584, Y596, E587, G588, E590, F591, V667, L668, G669, Q670, L685, C687, C688, G689, L690, P691, S692, A694, L708, G709, Q717, R718, V721, I734, I737, M738, F739, D693, L731, F732, T733, T287, G288, M289, R290, T291, A292, S293, S294, I295, Y342, V436, S437, G438, Q439, E440 y E585, de SEQ ID NO: 2.
En algunos modos de realización, la mutación de uno o más aminoácidos del sitio de unión al ADN es una sustitución a un aminoácido cargado positivamente. Por ejemplo, cualquiera de uno o más de los aminoácidos correspondientes a los residuos aminoacídicos V173, N175, N176, N177, I178, V179, Y180, S211, Y212, I214, Y338, T339, G340, G341, T343, H344, A345, D417, I418, F419, K420, I421, G422, G434, A436, Y441, G559, T560, Q662, N563, E566, E565, D568, L569, I570, M571, D572, N574, G575, L576, L577, T578, F579, T580, G581, S582, V583, T584, Y596, E587, G588, E590, F591, V667, L668, G669, Q670, L685, C687, C688, G689, L690, P691, S692, A694, L708, G709, Q717, R718, V721, I734, I737, M738, F739, D693, L731, F732, T733, T287, G288, M289, R290, T291, A292, S293, S294, I295, Y342, V436, S437, G438, Q439, E440 y E585 de SEQ ID NO: 2 se puede mutar a K, R o H. En algunos modos de realización, la mutación del uno o más aminoácidos del sitio de unión al ADN es una sustitución a K. Por ejemplo, la polimerasa Pol6 variante puede comprender el amino uno o ambas de las sustituciones aminoacídicas E585K, L731K y M738K. En algunos modos de realización, la polimerasa Pol6 variante comprende la sustitución E585K. En otros modos de realización, la polimerasa Pol6 comprende las sustituciones E585K+L731K. Aún en otros modos de realización, la polimerasa Pol6 comprende las sustituciones E585K+M738K. En otros modos de realización, al menos dos, al menos tres, al menos cuatro, al menos cinco, al menos seis aminoácidos o más del sitio de unión al ADN están mutados. Las enzimas Pol6 variantes resultantes retienen la actividad polimerasa y presentan una velocidad de disociación disminuida del polinucleótido del complejo Pol-ADN en relación con la velocidad de disociación presentada en la polimerasa original que carece de las mismas mutaciones. En algunos modos de realización, la modificación de la Pol6 original produce una polimerasa Pol6 variante que tiene una velocidad de disociación del molde que es al menos 2 veces menor que la de la Pol6 original. Las modificaciones de la Pol6 original pueden producir polimerasas Pol6 variantes que tienen una velocidad de disociación del molde que es al menos 3 veces menor que la de la Pol6 original, al menos 4 veces menor que la de la Pol6 original, al menos 5 veces menor que la de la Pol6 original, al menos 6 veces menor que la de la Pol6 original, al menos 7 veces menor que la de la Pol6 original, al menos 8 veces menor que la de la Pol6 original, al menos 9 veces menor que la de la Pol6 original, al menos 10 veces menor que la de la Pol6 original.
La velocidad de disociación disminuida del molde posibilita la producción de lecturas más largas. La longitud de lectura promedio del producto polimerizado producido por las polimerasas Pol6 variantes proporcionadas en el presente documento es mayor que la producida usando la polimerasa Pol6 original no modificada correspondiente. En algunos modos de realización, la longitud de lectura producida por la polimerasa Pol6 variante es al menos 100, al menos 200, al menos 300, al menos 400, al menos 500 o más nucleótidos más larga que la lectura obtenida usando la polimerasa Pol6 original no modificada.
En otro aspecto, la exactitud de las polimerasas Pol6 variantes proporcionadas en el presente documento se puede medir en términos de lecturas sin errores obtenidas a partir de la reacción de la polimerasa Pol6 variante que son mayores de 100, 200, 300, 400, 500, 750, 1000, 5000, 10.000, 100.000 nucleótidos de longitud. La exactitud de la polimerasa Pol6 variante (incluyendo, por ejemplo, la exactitud en una reacción de secuenciación dada) se puede medir en términos del número total de lecturas "perfectas" (es decir, sin errores) obtenidas a partir de una reacción de la polimerasa que son mayores de 100, 200, 300, 400, 500, 750, 1000, 5000, 10.000, 100.000 nucleótidos de longitud. La exactitud de la polimerasa se puede medir en términos de la lectura perfecta más larga (típicamente medida en términos del número de nucleótidos incluidos en la lectura) que se obtiene a partir de una reacción de la polimerasa.
En algunos modos de realización, se puede evaluar una polimerasa Pol6 variante frente a una polimerasa conocida o de referencia en condiciones similares o idénticas. En algunos modos de realización, las condiciones pueden incluir secuenciar una molécula de ácido nucleico en presencia de una solución de alta fuerza iónica. En algunos modos de realización, las polimerasas Pol6 variantes proporcionadas en el presente documento catalizan la polimerización de ADN en soluciones de altas concentraciones de sal, es decir, soluciones con alto contenido de sal, en las que presentan la procesividad incrementada en relación con su Pol6 original. En algunos modos de realización, la procesividad incrementada se presenta a una alta concentración de sal que puede ser de aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650,
700, 750, 800 mM o mayor. Las sales típicas incluyen sales de elementos metálicos. Las soluciones con alto contenido de sal pueden incluir una o más de una sal de potasio, sal de sodio, sal de cesio, sal de calcio, cobalto, níquel, aluminio, manganeso, cinc y litio. Las sales también pueden incluir la sal de bicarbonato, sulfato, cloruro, carbonato, nitrato, nitrito, bromuro, citrato, acetato, cianuro, óxido o fosfato de un elemento metálico conocido por los expertos en la técnica. En algunos modos de realización, la sal es glutamato de potasio (K-glu), cloruro de potasio (KCl), sulfato de potasio (K2SO4), nitrato de potasio (KNO3), cloruro de cesio (CsCl) o nitrato de cesio (CSNO3). En algunos modos de realización, la solución con alto contenido de sal incluye K-Glu (glutamato de potasio) u otra sal monovalente. Además, una sal mineral útil en la invención puede incluir una mezcla o combinación de sales minerales. Las combinaciones de sales minerales que se pueden usar en la invención incluyen K-Glu y KCl, K-Glu y K2SO4 , K-Glu y KNO3 , K-Glu y CsCl, K-Glu y CsNO3 , K-Glu y KNO3 , K-Glu y CsCl, K-Glu y CsNO3 , K-Glu y CsCl, K-Glu y CsNO3 , KCl y K2SO4 , KCl y KNO3 , KCl y CsCl, KCl y CsNO3 , K2SO4 y KNO3 , K2SO4 y CsCl, K2SO4 y CsNO3 , KNO3 y CsCl, KNO3 y CsNO3, y CsCl y CsNO3. Las sales anteriores se pueden usar en las reacciones de polimerización de secuenciación a una concentración en el intervalo de 50 a 1 M, en el intervalo de 100 a 800 mM, en el intervalo de 200 a 700 mM, en el intervalo de 300 a 600 mM, en el intervalo de 400 a 500 mM. En algunos modos de realización, la alta concentración de sal puede ser de al menos 150 mM y hasta 500 mM. En otros modos de realización, la alta concentración de sal puede ser mayor de 500 mM.
La velocidad de polimerización de las polimerasas Pol6 variantes a altas concentraciones de sal es de al menos 1 base/segundo, al menos 5 bases/segundo, al menos 10 bases/segundo, al menos 20 bases/segundo, al menos 30 bases/segundo, al menos 40 bases/segundo, al menos 50 bases/segundo o más. En algunos modos de realización, la velocidad de polimerización de la polimerasa Pol6 variante es de al menos 1 base/segundo a sal 100 mM, 1 base/segundo a sal 200 mM, al menos 1 base/segundo a sal 300 mM, al menos 1 base/segundo a sal 400 mM, al menos 1 base/segundo a sal 500 mM, al menos 1 base/segundo a sal 600 mM, al menos 1 base/segundo a sal 700 mM, al menos 1 base/segundo a sal 800 mM, al menos 1 base/segundo a sal 800 mM, al menos 1 base/segundo a sal 900 mM, al menos 1 base/segundo a sal 1 M. En algunos modos de realización, la velocidad de polimerización de la polimerasa Pol6 variante está entre 1 y 10 bases/segundo a sal 100 mM, entre 1 y 10 bases/segundo a sal 200 mM, entre 1 y 10 bases/segundo a sal 300 mM, entre 1 y 10 bases/segundo a sal 400 mM, entre 1 y 10 bases/segundo a sal 500 mM, entre 1 y 10 bases sal 600 mM, entre 1 y 10 bases a sal 700 mM, entre 1 y 10 bases/segundo a sal 800 mM, entre 1 y 10 bases/segundo a sal 800 mM, entre 1 y 10 bases/segundo a sal 900 mM o entre 1 y 10 bases/segundo a sal 1 M.
Secuencia de ADN que codifica las variantes de Pol6
Las secuencias de ADN que codifican una Pol6 original natural se pueden aislar de cualquier célula o microorganismo que produzca la Pol6 en cuestión, usando diversos procedimientos bien conocidos en la técnica. Los ejemplos de secuencias de ADN que codifican el fago de Clostridium natural phiCPV4, es decir, Pol6 natural, se proporcionan en el presente documento como los nucleótidos 28-2220 de SEQ ID NO: 3, y como los nucleótidos de 421 a 2610 de SEQ ID NO: 5. Además de la P0I6 natural, la SEQ ID NO: 3 comprende en su extremo 5' nucleótidos que codifican una marca de histidina (H¡S6; HHHHHH; SEQ ID NO: 9). La SEQ ID NO: 5 comprende en su extremo 5' nucleótidos que codifican la marca de histidina (H¡S6 (SEQ ID NO: 9)) y un péptido SpyCatcher SGDYDIPTTENLYFQGAMVDTLSGLSSEQGQSGDMTIEEDSATHIKFSKRDEDG KELAGATMELRDSSGKTISTWISDGQVKDFYLYPGKYTFVETAAPDGYEVATAIT FTVNEQGQVTVNGKATKGDAHI (SEQ ,D N0:10)
En primer lugar, se puede construir una colección de ADN genómico y/o ADNc usando ADN cromosómico o ARN mensajero del organismo que produce la Pol6 que se va a estudiar. A continuación, si es conocida la secuencia de aminoácidos de Pol6, se pueden sintetizar sondas oligonucleotídicas marcadas homólogas y usarse para identificar clones que codifican Pol6 a partir de una colección genómica preparada a partir del organismo en cuestión. De forma alternativa, una sonda oligonucleotídica marcada que contiene secuencias homólogas con respecto a un gen Pol6 conocido se puede usar como sonda para identificar clones que codifican Pol6, usando condiciones de hibridación y lavado de menor restricción.
De forma alternativa, la secuencia de ADN que codifica la Pol6 se puede preparar sintéticamente por procedimientos estándar establecidos, por ejemplo, el procedimiento de fosforamidita descrito por S. L. Beaucage y M. H. Caruthers (1981) o el procedimiento descrito por Matthes et al. (1984). En el procedimiento de la fosforamidita, se sintetizan los oligonucleótidos, por ejemplo, en un sintetizador de ADN automático, se purifican, hibridan, fijan y clonan en vectores apropiados.
Finalmente, la secuencia de ADN puede ser de origen genómico y sintético mixto, de origen sintético y de ADNc mixto o de origen genómico y de ADNc mixto, preparada fijando fragmentos de origen sintético, genómico o de ADNc (como sea apropiado, los fragmentos correspondientes a diversas partes de la secuencia de ADN completa),
de acuerdo con técnicas estándar. La secuencia de ADN también se puede preparar por reacción en cadena de la polimerasa (PCR) usando cebadores específicos, por ejemplo, como se describe en la patente de EE. UU. n.° 4.683.202 o R. K. Saiki et al. (1988).
Mutagénesis dirigida al sitio
Una vez que se ha aislado o sintetizado una secuencia de ADN que codifica Pol6, y se han identificado los sitios deseables para la mutación, se pueden introducir mutaciones usando oligonucleótidos sintéticos. Estos oligonucleótidos contienen secuencias de nucleótidos que flanquean los sitios de mutación deseados; los nucleótidos mutantes se insertan durante la síntesis de oligonucleótidos. En un procedimiento específico, se crea un hueco de ADN monocatenario, que une la secuencia que codifica Pol6, o una porción de la misma, en un vector que porta el gen Pol6. A continuación, el nucleótido sintético, que porta la mutación deseada, se hibrida con una porción homóloga del ADN monocatenario. A continuación, se rellena el hueco restante con ADN polimerasa I (fragmento de Klenow) y se fija la construcción usando ligasa T4. Un ejemplo específico de este procedimiento se describe en Morinaga et al. (1984). La patente de EE. UU. n.° 4.760.025 divulga la introducción de oligonucleótidos que codifican múltiples mutaciones realizando alteraciones menores del casete. Sin embargo, se puede introducir una variedad incluso mayor de mutaciones en cualquier momento por el procedimiento de Morinaga, porque se pueden introducir una multitud de oligonucleótidos, de diversas longitudes. Otros procedimientos que efectúan mutagénesis dirigida al sitio incluyen el procedimiento de Kunkel, mutagénesis por inserción de un casete y mutagénesis dirigida al sitio por PCR. Los procedimientos alternativos para proporcionar variantes incluyen barajado de genes, por ejemplo, como se describe en el documento WO 95/22625 (de Affymax Technologies N.V.) o en el documento Wo 96/00343 (de Novo Nordisk A/S) u otras técnicas correspondientes que dan como resultado una enzima híbrida que comprende la(s) mutación/mutaciones, por ejemplo, sustitución/sustituciones y/o deleción/deleciones, en cuestión.
Expresión de variantes de Pol6
Se puede usar una secuencia de ADN que codifica una variante de Pol6 para expresar una Pol6, usando un vector de expresión, que típicamente incluye secuencias de control que codifican un promotor, operador, sitio de unión al ribosoma, señal de inicio de la traducción y, opcionalmente, un gen represor o diversos genes activadores. Los ejemplos de vectores que se pueden usar para expresar la Pol6 variante incluyen los vectores del sistema de expresión pET (Novagen).
Un vector de expresión recombinante que porta secuencias de ADN puede ser cualquier vector, que se puede someter de forma práctica a procedimientos de ADN recombinante, y la elección del vector dependerá a menudo de la célula huésped en la que se va a introducir. Por tanto, el vector puede ser un vector de replicación autónoma, es decir, un vector que existe como una entidad extracromosómica, con una replicación que es independiente de la replicación cromosómica, por ejemplo, un plásmido, un bacteriófago o un elemento extracromosómico, minicromosoma o un cromosoma artificial. De forma alternativa, el vector puede ser uno que, cuando se introduce en una célula huésped, se integra en el genoma de la célula huésped y se replica conjuntamente con el/los cromosoma(s) en los que se ha integrado.
Los procedimientos usados para fijar la construcción de ADN que codifica una variante de Pol6, y para insertarla en vectores adecuados que contienen la información necesaria para la replicación, son bien conocidos por los expertos en la técnica (véase, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, cuarta edición, Cold Spring Harbor, 2012).
Se puede producir una variante de Pol6 en una célula que puede ser de un organismo superior tal como un mamífero o un insecto, pero preferentemente es una célula microbiana, por ejemplo, una célula bacteriana o una fúngica (incluyendo levadura). Los ejemplos de bacterias adecuadas son bacterias gramnegativas tales como E. coli, o bacterias grampositivas tales como Bacillus sp., por ejemplo, Bacillus subtilis, Bacillus licheniformis, Bacillus lentus, Bacillus brevis, Geobacillus stearothermophilus, Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus coagulans, Bacillus circulars, Bacillus lautus, Bacillus megaterium, Bacillus thuringiensis o Streptomyces sp., por ejemplo, Streptomyces lividans o Streptomyces murinus. Un organismo de levadura se puede seleccionar de una especie de Saccharomyces o Schizosaccharomyces, por ejemplo, Saccharomyces cerevisiae, o de un hongo filamentoso Aspergillus sp., por ejemplo, Aspergillus oyzae o Aspergillus niger. La célula huésped es típicamente bacteriana y preferentemente E. coli.
En otro aspecto, se proporciona un procedimiento de producción de una variante de Pol6, comprendiendo este procedimiento cultivar una célula huésped como se describe anteriormente en condiciones propicias para la producción de la variante y recuperar la variante de las células y/o medio de cultivo. El medio usado para cultivar las células puede ser cualquier medio convencional adecuado para hacer crecer la célula huésped en cuestión y obtener la expresión de la variante de Pol6. Los medios adecuados están disponibles en proveedores comerciales o se pueden preparar de acuerdo con recetas publicadas (por ejemplo, como se describe en los catálogos de la American Type Culture Collection).
La variante de Pol6 secretada de las células huésped se puede recuperar de forma práctica del medio de cultivo por procedimientos bien conocidos, que incluyen la separación de las células del medio por centrifugación o filtración, y la precipitación de los componentes proteicos del medio por medio de una sal tal como sulfato de amonio, seguido del uso de procedimientos cromatográficos tales como cromatografía de intercambio iónico, cromatografía de afinidad o similares. En algunos modos de realización, la purificación de la Pol6 variante se puede obtener por cromatografía de afinidad de polipéptidos de Pol6 unidos a una marca de afinidad. Varias marcas de afinidad o epítopo que se pueden usar en la purificación de las variantes de Pol6 incluyen marca de hexahistidina (SEQ ID NO: 9), marca FLAG, marca Strep II, marca de péptido de unión a estreptavidina (SBP), péptido de unión a calmodulina (CBP), glutatión S-transferasa (GST), proteína de unión a maltosa (MBP), marca S, marca HA y marca c-Myc. En algunos modos de realización, se usa una marca de hexahistidina (SEQ ID NO: 9) en la purificación de Pol6. La marca de afinidad se puede fijar covalentemente al polipéptido de Pol6 variante por un conector de proteína. De forma alternativa, la marca de afinidad se puede codificar por el ácido nucleico que comprende la secuencia que codifica la Pol6 variante, y expresarse como una proteína de fusión. Por ejemplo, en algunos modos de realización, una marca His6 (SEQ ID nO: 9) se expresa N terminal con respecto al polipéptido de Pol6 variante (SEQ ID NO: 2). En otros modos de realización, la marca His6 (SEQ ID NO: 9) se puede expresar contigua a un conector, por ejemplo, SpyCatcher, y N terminal con respecto a Pol6 para proporcionar un His6-SpyCatcher-polipéptido de Pol6 (SEQ ID NO: 4). El polipéptido SpyCatcher se puede unir covalentemente a un nanoporo que comprende el péptido SpyTag AHIVMVDAYKPTK (SEQ ID NO: 11).
Complejos de secuenciación por nanoporos de Pol6: fijación de Pol6 a nanoporos
La secuenciación por nanoporos con la ayuda de las polimerasas Pol6 variantes se logra por complejos de secuenciación por nanoporos de Pol6, que se forman uniendo la polimerasa Pol6 variante a un nanoporo. En algunos modos de realización, una polimerasa Pol6 variante se pone en contacto con el molde de ADN de muestra para formar el complejo Pol6-ADN, que posteriormente se une a un nanoporo para formar el complejo de secuenciación por nanoporos de Pol6. En otros modos de realización, la polimerasa Pol6 se fija en primer lugar al nanoporo y posteriormente se pone en contacto con el molde de ADN de muestra para formar el complejo de secuenciación por nanoporos de Pol6. Los procedimientos para ensamblar complejos de secuenciación por nanoporos se describen en la solicitud provisional de EE. UU. n.° 62/281.719 presentada el 21 de enero de 2016.
Las mediciones del flujo de corriente iónica a través de un nanoporo se hacen a través de un nanoporo que se ha reconstituido para producir una membrana lipídica. En algunos casos, el nanoporo se inserta en la membrana (por ejemplo, por electroporación, por difusión). El nanoporo se puede insertar por una señal de estímulo tal como estímulo eléctrico, estímulo de presión, estímulo de flujo de líquido, estímulo de burbuja de gas, sonicación, sonido, vibración o cualquier combinación de los mismos. En algunos casos, la membrana se forma con ayuda de una burbuja y el nanoporo se inserta en la membrana con ayuda de un estímulo eléctrico. En otros modos de realización, el nanoporo se inserta por sí mismo en la membrana. Los procedimientos para ensamblar una bicapa lipídica, formar un nanoporo en una bicapa lipídica y secuenciar moléculas de ácido nucleico se pueden encontrar en las publicaciones de patente de PCT n.° WO2011/097028 y WO2015/061510, que se incorporan en el presente documento como referencia en su totalidad.
La Pol6 variante sola o cuando forma un complejo como un complejo Pol6-molde de ADN se puede fijar al nanoporo antes de que el nanoporo se inserte en la membrana lipídica o después de la inserción del nanoporo en la membrana lipídica.
Los nanoporos del complejo de secuenciación por nanoporos de Pol6 incluyen, sin limitación, nanoporos biológicos, nanoporos de estado sólido y nanoporos de estado sólido-biológicos híbridos. Los nanoporos biológicos de los complejos de secuenciación por nanoporos de Pol6 incluyen OmpG de E. coli, sp., Salmonella sp., Shigella sp. y Pseudomonas sp. y alfa hemolisina de S. aureus sp., MspA de M. smegmatis sp. Los nanoporos pueden ser nanoporos naturales, nanoporos variantes o nanoporos variantes modificados.
Se pueden genomanipular nanoporos variantes para que posean características que están alteradas en relación con las de la enzima original. Véase, por ejemplo, la solicitud de patente de EE. uU. n.° 14/924.861 presentada el 28 de octubre de 2015, titulada "alpha-Hemolysin Variants with Altered Characteristics". En algunos modos de realización, las características están alteradas en relación con la enzima natural. En algunos modos de realización, el nanoporo variante del complejo de secuenciación por nanoporos se genomanipula para reducir el ruido de corriente iónica del nanoporo original del que se deriva. Un ejemplo de un nanoporo variante que tiene una característica alterada es el nanoporo de OmpG que tiene una o más mutaciones en el sitio de constricción (solicitud de patente provisional de EE. UU. n.° 62/222.197, titulada "OmpG Variants", presentada el 22 de septiembre de 2015, que se incorpora por referencia en el presente documento en su totalidad), que disminuyen el nivel de ruido iónico en relación con el de la OmpG original. El ruido de corriente iónica reducido permite el uso de estas variantes de nanoporos de OmpG en la detección de una única molécula de polinucleótidos y proteínas. En otros modos de realización, el polipéptido de OmpG variante se puede mutar además para unirse a adaptadores moleculares, que mientras residen en el poro ralentizan el movimiento de los analitos, por ejemplo, bases de nucleótidos, a través del poro y, en consecuencia, mejoran la exactitud de la identificación del analito (Astier et al., J Am Chem Soc 10.1021/ja057123+, publicado en línea el 30 de diciembre de 2005).
Los nanoporos variantes modificados son típicamente nanoporos multiméricos con subunidades que se han genomanipulado para afectar la interacción entre subunidades (solicitudes de patentes provisionales de EE. UU. n.° 62/232.175 y 62/244.852, tituladas "Alpha-Hemolysin Variants", presentadas el 24 de septiembre de 2015 y el 22 de octubre de 2015, respectivamente, que se incorporan por referencia en el presente documento en su totalidad). Las interacciones de subunidades alteradas se pueden aprovechar para especificar la secuencia y el orden con el que se oligomerizan los monómeros para formar el nanoporo multimérico en una bicapa lipídica. Esta técnica proporciona el control de la estequiometría de las subunidades que forman el nanoporo. Un ejemplo de un nanoporo multimérico con subunidades que se pueden modificar para determinar la secuencia de interacción de las subunidades durante la oligomerización es un nanoporo aHL.
En algunos modos de realización, se fija una única polimerasa Pol6 a cada nanoporo. En otros modos de realización, se fijan dos o más polimerasas Pol6 a un nanoporo monomérico o a una subunidad de un nanoporo oligomérico.
Medios de fijación
La Pol6 variante sola o cuando forma un complejo como un complejo Pol6-molde de ADN se puede fijar al nanoporo de cualquier modo adecuado. Se puede lograr la fijación de complejos enzima-polímero a los nanoporos usando el sistema peptídico SpyTag/SpyCatcher (Zakeri et al. PNAS109:E690-E697 [2012]) fijación química natural (Thapa et al., Molecules 19:14461-14483 [2014]), sistema de sortasa (Wu y Guo, J Carbohydr Chem 31:48-66 [2012]; Heck et al., Appl Microbiol Biotechnol 97:461-475 [2013]), sistemas de transglutaminasa (Dennler et al., Bioconjug Chem 25:569-578 [2014]), enlace de formilglicina (Rashidian et al., Bioconjug Chem 24:1277-1294 [2013]) u otras técnicas de fijación química conocidas en la técnica.
En algunos casos, la polimerasa Pol6 variante se une al nanoporo usando la química Solulink™. Solulink™ puede ser una reacción entre HyNic (ácido 6-hidracino-nicotínico, una hidracina aromática) y 4FB (4-formil benzoato, un aldehído aromático). En algunos casos, la polimerasa se une al nanoporo usando la química Click (disponible de LifeTechnologies, por ejemplo).
En algunos casos, se introducen mutaciones de dedos de cinc en la molécula de nanoporo y a continuación se usa una molécula (por ejemplo, una molécula intermedia de ADN) para unir la polimerasa Pol6 a los sitios de dedos de cinc en el nanoporo, por ejemplo, a-hemolisina.
Adicionalmente, la Pol6 variante sola o cuando forma un complejo como un complejo Pol6-molde de ADN complejo enzima-polímero, se puede fijar a un nanoporo, por ejemplo, aHL, OmpG, por medio de una molécula conectora que se fija a un nanoporo en un sitio de fijación. En algunos casos, el complejo Pol6-ADN se fija al nanoporo con grapas moleculares. En algunos casos, las grapas moleculares comprenden tres secuencias de aminoácidos (indicadas como conectores A, B y C). El conector A se puede extender desde un monómero de nanoporo, el conector B se puede extender desde la polimerasa sola o desde la polimerasa del complejo polimerasa-ADN, y el conector C a continuación puede unir los conectores A y B (por ejemplo, envolviendo ambos conectores A y B) y por tanto unir la polimerasa Pol6 variante sola o como complejo Pol6 variante-ADN al nanoporo. El conector C también se puede construir para ser parte del conector A o conector B, reduciendo por tanto el número de moléculas conectoras.
Otros conectores que pueden encontrar uso en la fijación de la polimerasa Pol6 variante a un nanoporo son el enlace genético directo (por ejemplo, el conector de aminoácidos (GGGGS)i_3 (SEQ ID NO: 14)), la unión mediada por transglutaminasa (por ejemplo, RSKLG (SEQ ID NO: 15)), la unión mediada por sortasa y la unión química a través de modificaciones de cisterna. En el presente documento, los conectores específicos contemplados como útiles son (GGGGS)i-3 (SEQ ID NO: 14), la marca K (RSKLG (SEQ ID NO: 15)) en el extremo N, el sitio ATEV (12 25), el sitio ATEV extremo N de SpyCatcher (12-49).
Un procedimiento ejemplar para fijar un complejo Pol6-ADN a un nanoporo en una membrana implica fijar una molécula conectora a un nanoporo o mutar un nanoporo para que tenga un sitio de fijación y a continuación fijar un complejo polimerasa-polinucleótido al sitio de fijación o al conector de fijación. El complejo polimerasapolinucleótido se fija al sitio de fijación o al conector de fijación después de que se inserta el nanoporo en la membrana. En algunos casos, se fija un complejo polimerasa-polinucleótido a cada uno de una pluralidad de nanoporos que se insertan en una membrana y se disponen sobre pocillos y/o electrodos de una micromatriz. En algunos modos de realización, la enzima del complejo enzima-polímero se expresa como una proteína de fusión que comprende un péptido conector. En algunos modos de realización, una polimerasa es la enzima del complejo enzima-polímero y un polinucleótido es el polímero. La polimerasa del complejo polimerasa-polinucleótido se expresa como una proteína de fusión que comprende un polipéptido SpyCatcher, que se puede unir covalentemente a un nanoporo que comprende un péptido SpyTag (Zakeri et al. PNAS109:E690-E697 [2012]). Un complejo Pol6 variante-DNA se puede fijar a un nanoporo usando los procedimientos descritos, por ejemplo,
en el documento PCT/US2013/068967 (publicado como documento WO2014/074727; Genia Technologies, Inc.), el documento PCT/US2005/009702 (publicado como documento WO2006/028508; Presidente y miembros de la Universidad de Harvard) y el documento PCT/US2011/065640 (publicado como documento WO2012/083249;
Universidad de Columbia).
Micromatrices
Los nanoporos de los complejos de secuenciación por nanoporos de Pol6 variante descritos en el presente documento se pueden insertar en una membrana, por ejemplo, una bicapa lipídica, y disponerse contiguos o cercanos a un electrodo de detección de un circuito de detección, tal como un circuito integrado de un detector basado en nanoporos, por ejemplo, una micromatriz. El nanoporo se puede insertar en una membrana y disponerse un pocillo y/o electrodos de detección en la micromatriz. Se pueden proporcionar múltiples detectores de nanoporos como matrices. Las micromatrices y los procedimientos para preparar micromatrices se describen en el documento PCT/US2014/061854 (publicado como documento WO2015/061511, Genia Technologies, Inc.), que se incorpora en el presente documento por referencia en su totalidad.
En un aspecto, se proporciona una micromatriz que comprende una pluralidad de complejos de secuenciación por nanoporos de Pol6 como se describe en otra parte en el presente documento. La micromatriz puede comprender nanoporos, teniendo cada uno una polimerasa Pol6 variante que tiene procesividad incrementada en relación con la Pol6 original. La Pol6 variante comprende una modificación en uno o más residuos aminoacídicos correspondientes a los residuos aminoacídicos V173, N175, N176, N177, I178, V179, Y180, S211, Y212, I214, Y338, T339, G340, G341, T343, H344, A345, D417, I418, F419, K420, I421, G422, G434, A436, Y441, G559,
SEQ ID NO: 2. En algunos modos de realización, la modificación es una sustitución al aminoácido K, R y/o H. En algunos modos de realización, la sustitución es una sustitución a K. En algunos modos de realización, la Pol6 variante comprende la sustitución E585K. En otros modos de realización, la Pol6 variante comprende la sustitución de dos aminoácidos E585K+L731K. Aún en otros modos de realización, la Pol6 variante comprende la sustitución de dos aminoácidos E585K+L731K. Las sustituciones aminoacídicas se pueden hacer en una polimerasa Pol6 original que comprende una marca His6 (SEQ ID NO: 9) y un péptido SpyCatcher como viene dada en la polimerasa de SEQ ID NO: 4.
Las polimerasas Pol6 variantes resultantes tienen procesividad incrementada en relación con su polimerasa Pol6 original. En algunos modos de realización, las polimerasas Pol6 variantes tienen procesividad incrementada a una alta concentración de sal. En algunos modos de realización, la procesividad incrementada se retiene a una alta concentración de sal de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800 mM o mayor. En algunos modos de realización, el incremento en la procesividad se presenta a una alta concentración de sal de más de 100 mM. El incremento en la procesividad comprende una disminución en la velocidad de disociación de molde que es al menos 2 veces menor que la de la Pol6 original. Las modificaciones de la Pol6 original pueden producir polimerasas Pol6 variantes que tienen una velocidad de disociación del molde que es al menos 3 veces menor que la de la Pol6 original, al menos 4 veces menor que la de la Pol6 original, al menos 5 veces menor que la de la Pol6 original, al menos 6 veces menor que la de la Pol6 original, al menos 7 veces menor que la de la Pol6 original, al menos 8 veces menor que la de la Pol6 original, al menos 9 veces menor que la de la Pol6 original, al menos 10 veces menor que la de la Pol6 original.
Para modos de realización que incluyen una matriz de nanoporos en una membrana, por ejemplo, bicapa lipídica, la densidad de complejos de nanoporos de secuenciación puede ser alta. Las matrices de alta densidad se caracterizan por tener una superficie de membrana que tiene una densidad de complejos de secuenciación por nanoporos de Pol6 mayor o igual a aproximadamente 500 complejos de secuenciación por nanoporos por 1 mm 2.
En algunos modos de realización, la superficie tiene una densidad de complejos de secuenciación por nanoporos discretos de aproximadamente 100, aproximadamente 200, aproximadamente 300, aproximadamente 400, aproximadamente 500, aproximadamente 600, aproximadamente 700, aproximadamente 800, aproximadamente 900, aproximadamente 1000, aproximadamente 2000, aproximadamente 3000, aproximadamente 4000, aproximadamente 5000, aproximadamente 6000, aproximadamente 7000, aproximadamente 8000, aproximadamente 9000, aproximadamente 10.000, aproximadamente 20.000, aproximadamente 40.000, aproximadamente 60.000, aproximadamente 80.000, aproximadamente 100.000 o aproximadamente 500.000 complejos de secuenciación por nanoporos por 1 mm2. En algunos modos de realización, la superficie tiene una densidad de complejos de secuenciación por nanoporos discretos de al menos aproximadamente 200, al menos aproximadamente 300, al menos aproximadamente 400, al menos aproximadamente 500, al menos aproximadamente 600, al menos aproximadamente 700, al menos aproximadamente 800, al menos aproximadamente 900, al menos aproximadamente 1000, al menos aproximadamente 2000, al menos aproximadamente 3000, al menos aproximadamente 4000, al menos aproximadamente 5000, al menos aproximadamente 6000, al menos aproximadamente 7000, al menos aproximadamente 8000, al menos aproximadamente 9000, al menos aproximadamente 10.000, al menos aproximadamente 20.000, al menos
aproximadamente 40.000, al menos aproximadamente 60.000, al menos aproximadamente 80.000, al menos aproximadamente 100.000 o al menos aproximadamente 500.000 complejos de secuenciación por nanoporos por 1 mm2
Los procedimientos de la invención implican la medición de una corriente que pasa a través del poro durante la interacción con el nucleótido. En algunos modos de realización, secuenciar una molécula de ácido nucleico puede requerir la aplicación de una corriente continua (por ejemplo, de modo que el sentido en el que se mueve la molécula a través del nanoporo no se invierta). Sin embargo, hacer funcionar un detector de nanoporos durante largos períodos de tiempo usando una corriente continua puede cambiar la composición del electrodo, desequilibrar las concentraciones de iones a través del nanoporo y tener otros efectos indeseables. La aplicación de una forma de onda de corriente alterna (CA) puede evitar estos efectos indeseables y tener determinadas ventajas, como se describe a continuación. Los procedimientos de secuenciación de ácidos nucleicos descritos en el presente documento que utilizaron nucleótidos marcados son totalmente compatibles con los voltajes aplicados de CA y, por lo tanto, se pueden usar para lograr dichas ventajas.
Las condiciones adecuadas para medir las corrientes iónicas a través de los poros de las proteínas transmembranarias son conocidos en la técnica y se proporcionan ejemplos en el presente documento en la sección experimental. El procedimiento se lleva a cabo con un voltaje aplicado a través de la membrana y el poro. El voltaje usado es típicamente de -400 mV a 400 mV. El voltaje usado está preferentemente en un intervalo que tiene un límite inferior seleccionado de -400 mV, -300 mV, -200 mV, -150 mV, -100 mV, -50 mV, -20 mV y 0 mV y un límite superior seleccionado independientemente de 10 mV, 20 mV, 50 mV, 100 mV, 150 mV, 200 mV, 300 mV y 400 mV. El voltaje usado está más preferentemente en el intervalo de 100 mV a 240 mV y lo más preferentemente en el intervalo de 160 mV a 240 mV. Es posible incrementar la discriminación entre diferentes nucleótidos por un poro de la invención usando un potencial aplicado incrementado. La secuenciación de ácidos nucleicos usando formas de onda de CA y nucleótidos marcados se describe en la publicación de patente de EE. UU. US2014/0134616 titulada "Nucleic Acid Sequencing Using Tags", presentada el 6 de noviembre de 2013, que se incorpora en el presente documento por referencia en su totalidad. Además de los nucleótidos marcados descritos en el documento US2014/0134616, la secuenciación se puede realizar usando análogos de nucleótidos que carecen de un glúcido o un resto acíclico, por ejemplo, nucleósidos trifosfato de (S)-glicerol (gNTP) de las cuatro nucleobases comunes: adenina, citosina, guanina y timidina (Horhota et al. Organic Letters, 8:5345-5347 [2006]).
Procedimientos para secuenciar polinucleótidos
Las moléculas que se caracterizan usando las polimerasas Pol6 variantes de los complejos de secuenciación por nanoporos de Pol6 descritos en el presente documento pueden ser de diversos tipos, incluyendo moléculas cargadas o polares tales como moléculas poliméricas cargadas o polares. Los ejemplos específicos incluyen moléculas de ácido ribonucleico (ARN) y ácido desoxirribonucleico (ADN). El ADN puede ser una molécula de ADN monocatenario (ADNmc) o una de ADN bicatenario (ADNbc). El ácido ribonucleico se puede retrotranscribir y a continuación secuenciarse.
En un aspecto, se proporcionan procedimientos para secuenciar ácidos nucleicos usando las polimerasas Pol6 variantes descritas en el presente documento. En algunos modos de realización, los procedimientos comprenden proporcionar una polimerasa Pol6 variante que tiene una velocidad disminuida de disociación de molde, y fijar un complejo polimerasa Pol6 variante-molde aislado a un nanoporo insertado en una membrana lipídica de una micromatriz para formar un complejo de secuenciación por nanoporos. En otros modos de realización, los procedimientos de secuenciación comprenden proporcionar una polimerasa Pol6 variante que tiene una velocidad disminuida de disociación de molde, fijar el complejo Pol6-molde a un nanoporo para proporcionar un complejo de secuenciación por nanoporos e insertar el complejo de secuenciación por nanoporos en una membrana lipídica de una micromatriz.
Los complejos de secuenciación por nanoporos que comprenden polimerasa Pol6 variante se pueden usar para determinar la secuencia de ácidos nucleicos de acuerdo con otras plataformas de secuenciación por nanoporos conocidas en la técnica que utilizan enzimas en la secuenciación de polinucleótidos. Por ejemplo, los complejos de secuenciación por nanoporos que comprenden las polimerasas Pol6 variantes descritas en el presente documento se pueden preparar de acuerdo con el procedimiento descrito para secuenciar ácidos nucleicos de acuerdo con los procedimientos basados en helicasa y exonucleasa de Oxford Nanopore (Oxford, RU), Illumina (San Diego, CA) y la secuenciación por expansión de nanoporos de Stratos Genomics (Seattle, WA).
En algunos modos de realización, la secuenciación de ácidos nucleicos comprende preparar complejos de secuenciación por nanoporos que comprenden la enzima polimerasa Pol6 variante descrita en el presente documento, y determinar secuencias de polinucleótidos usando nucleótidos marcados como se describe en el documento PCT/US2013/068967 (titulado "Nucleic Acid Sequencing Using Tags" presentado el 7 de noviembre de 2013, que se incorpora en el presente documento por referencia en su totalidad). Por ejemplo, un complejo de secuenciación por nanoporos que está situado en una membrana (por ejemplo, una bicapa lipídica) contiguo a, o de forma cercana para detectar, a uno o más electrodos detectores, puede detectar la incorporación de un
nucleótido marcado por una polimerasa a medida que se incorpora la base de nucleótido en una hebra que es complementaria a la del polinucleótido asociado con la polimerasa, y la marca del nucleótido se detecta por el nanoporo. El complejo Pol6 variante-ADN se puede asociar con el nanoporo como se proporciona en el presente documento.
Las marcas de los nucleótidos marcados pueden incluir grupos químicos o moléculas que se pueden detectar por un nanoporo. Los ejemplos de marcas usadas para proporcionar nucleótidos marcados se describen al menos en los párrafos de [0414] a [0452] del documento PCT/US2013/068967. Los nucleótidos se pueden incorporar a partir de una mezcla de diferentes nucleótidos, por ejemplo, una mezcla de dNTP marcados donde N es adenosina (A), citidina (C), timidina (T), guanosina (G) o uracilo (U). De forma alternativa, se pueden incorporar nucleótidos a partir de soluciones alternas de dNTP marcados individuales, es decir, dATP marcado seguido de dCTP marcado, seguido de dGTP marcado, etc. La determinación de una secuencia de polinucleótidos se puede producir cuando el nanoporo detecta las marcas cuando fluyen a través de o están contiguas al nanoporo, cuando las marcas residen en el nanoporo y/o cuando las marcas se presentan al nanoporo. La marca de cada nucleótido marcado se puede acoplar a la base de nucleótido en cualquier posición incluyendo, pero sin limitarse a un resto fosfato (por ejemplo, gamma fosfato), glúcido o base nitrogenada del nucleótido. En algunos casos, las marcas se detectan mientras que las marcas están asociadas con una polimerasa durante la incorporación de marcas de nucleótidos. La marca puede continuar detectándose hasta que la marca se transloca a través del nanoporo después de la incorporación de nucleótido y la posterior escisión y/o liberación de la marca. En algunos casos, los acontecimientos de incorporación de nucleótido liberan marcas de los nucleótidos marcados y las marcas pasan a través de un nanoporo y se detectan. La marca se puede liberar por la polimerasa, o escindir/liberar de cualquier manera adecuada, incluyendo, sin limitación, la escisión por una enzima localizada cerca de la polimerasa. De este modo, la base incorporada se puede identificar (es decir, A, C, G, T o U) porque se libera una marca única de cada tipo de nucleótido (es decir, adenina, citosina, guanina, timina o uracilo). En algunas situaciones, los acontecimientos de incorporación de nucleótido no liberan marcas. En un caso de este tipo, una marca acoplada a un nucleótido incorporado se detecta con la ayuda de un nanoporo. En algunos ejemplos, la marca se puede mover a través o cercana al nanoporo y detectarse con la ayuda del nanoporo.
En algunos casos, los nucleótidos marcados que no se incorporan pasan a través del nanoporo. El procedimiento puede distinguir entre marcas asociadas con nucleótidos no incorporados y marcas asociadas con nucleótidos incorporados en base al espacio de tiempo en que el nucleótido marcado se detecta por el nanoporo. En un modo de realización, un nucleótido no incorporado se detecta por el nanoporo durante menos de aproximadamente 1 milisegundo y un nucleótido incorporado se detecta por el nanoporo durante al menos aproximadamente 1 milisegundo.
Por tanto, en un aspecto, la divulgación proporciona un procedimiento para secuenciar un polinucleótido de una muestra, por ejemplo, una muestra biológica, con la ayuda de un complejo de secuenciación por nanoporos de polimerasa Pol6 variante. El polinucleótido de muestra se combina con la polimerasa Pol6 variante, para proporcionar la porción de complejo enzima Pol6 variante-polímero del complejo de secuenciación por nanoporos. En un modo de realización, el polinucleótido de muestra es una hebra de ADNmc de muestra, que se combina con una ADN polimerasa para proporcionar un complejo ADN polimerasa-ADN. La hebra de ADNmc de muestra de ADN polimerasa de Pol6 variante se fija posteriormente a un nanoporo que se ha insertado en una membrana, por ejemplo, una bicapa lipídica, para proporcionar el complejo de secuenciación por nanoporos. La porción de nanoporos del complejo de secuenciación se sitúa en la membrana contigua o cercana a un electrodo detector, como se describe en otra parte en el presente documento. El complejo de secuenciación por nanoporos resultante puede determinar la secuencia de bases de nucleótidos del ADN de muestra como se describe en otra parte en el presente documento. En otros modos de realización, el complejo de secuenciación por nanoporos determina la secuencia de ADN bicatenario. En otros modos de realización, el complejo de secuenciación por nanoporos determina la secuencia de ADN monocatenario. Aún en otros modos de realización, el complejo de secuenciación por nanoporos determina la secuencia de ARN secuenciando el producto retrotranscrito.
En un modo de realización, el procedimiento proporciona la secuenciación de una muestra de ácido nucleico con la ayuda de una micromatriz que comprende una pluralidad de complejos de secuenciación por nanoporos de Pol6.
En algunos modos de realización, se proporciona un procedimiento para secuenciar por nanoporos una muestra de ácido nucleico. El procedimiento comprende usar complejos de secuenciación por nanoporos que comprenden las polimerasas Pol6 variantes proporcionadas en el presente documento. En un modo de realización, el procedimiento comprende proporcionar nucleótidos marcados a un complejo de secuenciación por nanoporos de Pol6 y, en condiciones de alto contenido de sal, llevar a cabo una reacción de polimerización para incorporar los nucleótidos de manera dependiente de molde, y detectar la marca de cada uno de los nucleótidos incorporados para determinar la secuencia del ADN molde.
En un modo de realización, se proporcionan nucleótidos marcados a un complejo de secuenciación por nanoporos de Pol6 que comprende una polimerasa Pol6 variante proporcionada en el presente documento, y en condiciones de alto contenido de sal, llevar a cabo una reacción de polimerización con la ayuda de la enzima Pol6 variante de dicho complejo de secuenciación por nanoporos, para incorporar nucleótidos marcados en una hebra en
crecimiento complementaria a una molécula de ácido nucleico monocatenario de la muestra de ácido nucleico; y detectar, con la ayuda del nanoporo, una marca asociada con dicho nucleótido marcado individual durante la incorporación del nucleótido marcado individual, en el que la marca se detecta con la ayuda de dicho nanoporo mientras que el nucleótido está asociado con la polimerasa Pol6 variante.
Otros modos de realización del procedimiento de secuenciación que comprenden el uso de nucleótidos marcados con los presentes complejos de secuenciación por nanoporos para secuenciar polinucleótidos se proporcionan en el documento WO2014/074727, que se incorpora en el presente documento por referencia en su totalidad.
La secuenciación de ácidos nucleicos usando formas de onda de CA y nucleótidos marcados se describe en la publicación de patente de EE. UU. US2014/0134616 titulada "Nucleic Acid Sequencing Using Tags", presentada el 6 de noviembre de 2013, que se incorpora en el presente documento por referencia en su totalidad. Además de los nucleótidos marcados descritos en el documento US2014/0134616, la secuenciación se puede realizar usando análogos de nucleótidos que carecen de un glúcido o un resto acíclico, por ejemplo, nucleósidos trifosfato de (S)-glicerol (gNTP) de las cinco nucleobases comunes: adenina, citosina, guanina, uracilo y timidina (Horhota et al.
Organic Letters, 8:5345-5347 [2006]).
Reactivos y kits
También se proporcionan reactivos de secuenciación para la secuenciación o amplificación de ADN, por ejemplo, secuenciación por nanoporos, comprendiendo el/los reactivo(s) una polimerasa Pol6 variante que tiene al menos un 70 % de identidad con el polipéptido original de longitud completa de SEQ ID NO: 2 que comprende una o más sustituciones aminoacídicas de residuos aminoacídicos correspondientes a los aminoácidos V173, N175, N176, N177, I178, V179, Y180, S211, Y212, I214, Y338, T339, G340, G341, T343, H344, A345, D417, I418, F419, K420, I421, G422, G434, A436, Y441, G559, T560, Q662, N563, E566, E565, D568, L569, I570, M571, D572, N574, G575, L576, L577, T578, F579, T580, G581, S582, V583, T584, Y596, E587, G588, E590, F591, V667, L668, G669, Q670, L685, C687, C688, G689, L690, P691, S692, A694, L708, G709, Q717, R718, V721, I734, I737, M738, F739, D693, L731, F732, T733, T287, G288, M289, R290, T291, A292, S293, S294, I295, Y342, V436, S437, G438, Q439, E440 y E585 de SEQ ID NO: 2. En algunos modos de realización, la(s) sustitución/sustituciones aminoacídica(s) es a K, R y/o H. En algunos modos de realización, el reactivo de secuenciación comprende la polimerasa Pol6 variante de SEQ ID NO: 6, SEQ ID NO: 7 o SEQ ID NO: 8. En algunos modos de realización, el reactivo de secuenciación comprende un polinucleótido que codifica una cualquiera de las polimerasas Pol6 tolerantes a sal variantes proporcionadas en el presente documento.
En otro aspecto, se proporciona un kit que comprende un reactivo de secuenciación para la secuenciación de ADN proporcionado en el presente documento. En algunos modos de realización, el kit comprende además un tampón y/o nucleótidos.
En la divulgación experimental que sigue, se aplican las siguientes abreviaturas: eq (equivalentes); M (Molar); |j M (micromolar); N (normal); mol (moles); mmol (milimoles); jmol (micromoles); nmol (nanomoles); g (gramos); mg (miligramos); kg (kilogramos); jg (microgramos); l (litros); ml (mililitros); jl (microlitros); cm (centímetros); mm (milímetros); jm (micrómetros); nm (nanómetros); °C (grados centígrados); h (horas); min (minutos); s (segundos); ms (milisegundos).
Ejemplos
Ejemplo 1
Mutagénesis dirigida
Se realizó mutagénesis dirigida al sitio para mutar uno o más aminoácidos del supuesto sitio de unión al ADN de la polimerasa Pol6-44-X1 variante original (SEQ ID NO: 4). Pol6-44-X1 se derivó de Pol6 natural para comprender las siguientes sustituciones: (Pol6-S366A T529M A547F D44A).
El ADN de SEQ ID NO: 4 que codifica la polimerasa variante Pol6-44-X1 (SEQ ID NO: 5) se adquirió de una fuente comercial (DNA 2.0, Menlo Park, California). Se verificó la secuencia por secuenciación.
La Pol6-44-X1 se expresó como una proteína de fusión que tiene una marca His N terminal (secuencia subrayada en la SEQ ID NO: 4) y dominio SpyCatcher (secuencia en cursiva en negrita en la SEQ ID NO: 4).
La variante de polimerasa Pol6-44-X1 (SEQ ID NO: 4) se derivó de pol6 natural (SEQ ID NO: 2), y la numeración de las mutaciones aminoacídicas descritas para Pol6-D44A-X1 se refiere a las posiciones de los aminoácidos de SEQ ID NO: 2. Las posiciones racionales para tener un impacto en la procesividad de Pol6 se identificaron en base al análisis de la estructura cristalina de Phi 29 en su forma de apo, forma unida al ADN y forma de nucleótidos de ADN (Berman et al. 2007).
Para el cribado primario, cada una de las posiciones racionales se mutó a Lys (K) usando el protocolo de mutagénesis de New England Biolabs Q5 (Ipswich, MA). Los siguientes aminoácidos se mutaron a Lys: V173, N175, N176, N177, I178, V179, Y180, S211, Y212, I214, Y338, T339, G340, G341, T343, H344, A345, D417, I418, F419, K420, I421, G422, G434, A436, Y441, G559, T560, Q662, N563, E566, E565, D568, L569, I570, M571, D572, N574, G575, L576, L577, T578, F579, T580, G581, S582, V583, T584, Y596, E587, G588, E590, F591, V667, L668, G669, Q670, L685, C687, C688, G689, L690, P691, S692, A694, L708, G709, Q717, R718, V721, I734, I737, M738, F739, D693, L731, F732, T733, T287, G288, M289, R290, T291, A292, S293, S294, I295, Y342, V436, S437, G438, Q439, E440 y E585.
También se generaron combinaciones de sustituciones a Lys (K) en dos o más de los aminoácidos V173, N175, N176, N177, I178, V179, Y180, S211, Y212, I214, Y338, T339, G340, G341, T343, H344, A345, D417, I418, F419, K420, I421, G422, G434, A436, Y441, G559, T560, Q662, N563, E566, E565, D568, L569, I570, M571, D572, N574, G575, L576, L577, T578, F579, T580, G581, S582, V583, T584, Y596, E587, G588, E590, F591, V667, L668, G669, Q670, L685, C687, C688, G689, L690, P691, S692, A694, L708, G709, Q717, R718, V721, I734, I737, M738, F739, D693, L731, F732, T733, T287, G288, M289, R290, T291, A292, S293, S294, I295, Y342, V436, S437, G438, Q439, E440 y E585.
Los cebadores para cada reacción de mutagénesis se diseñaron usando el protocolo de NEBaseChanger y se encargaron en formato de placa de 96 pocillos de IDT.
Los cebadores directo e inverso se fosforilaron en 5' en formato de alto rendimiento (HTP) usando la polinucleótido cinasa (PNK) T4 adquirida en NEB. Una reacción de 25 |jl típica contenía 15 |jl de cebador a 10 |j M, 5 |jl de tampón de reacción 5X (de NEB), 1,25 jil de enzima PNK, 3,75 jil de agua. Se realizó la reacción a 37 °C durante 30 min y se termoinactivó la enzima a 65 °C durante 20 min.
Se realizó la mutagénesis por PCR usando ADN polimerasa Q5 de NEB. Una reacción de 25 jil típica contenía 5 jil de tampón Q5, 5 jil de potenciador de GC, 0,5 ul de dNTP 10 mM, 1,25 jil de cebadores directo e inverso de mutagénesis fosforilada 10 jiM, 0,25 jil de polimerasa Q5 y 1 jil de 5 ng/ml de molde de Pol6 natural, es decir, His-Pol6, y 10,75 jil de H2O.
Una vez que se completó la PCR, se añadieron 0,5 jil de Dpn1 a 25 jil de la mezcla de PCR y se incubó a 37 °C durante 1 h.
Se añadieron 2,5 jil de mezcla Blunt/TA ligase master mix a 2,5 jil de producto de PCR tratado con Dpn1 y la mezcla de reacción se incubó a temperatura ambiente durante 1 h.
Se añadió 1 jil de mezcla de fijación a 20 ul de células BL21DE3 en 96 pocillos (EMD Millipore) y se incubó en hielo durante 5 min.
Las células se sometieron a choque térmico a 42 °C durante exactamente 30 s usando el termociclador de PCR y se colocaron en hielo durante 2 min.
Se añadieron 80 jil de SOC a las células, que a continuación se incubaron a 37 °C durante 1 h sin agitar.
Se añadieron 100 jil de SOC o agua ultrapura a las células, que a continuación se sembraron en placas de agar LB de 48 pocillos que comprendían 50-100 jig/ml de kanamicina. Las células se cultivaron durante la noche a 37 °C.
Ejemplo 2
Expresión y purificación
Las variantes de la polimerasa original Pol6-44-X1 (SEQ ID NO: 4) se expresaron y purificaron usando un procedimiento de alto rendimiento como sigue.
El ADN que codifica las variantes en el vector de plásmido de expresión pD441 se transformó en E. coli competente y se prepararon reservas de glicerol de las células transformadas. Comenzando a partir de una pequeña selección de las reservas de glicerol, cultivar 1 ml de cultivo iniciador en LB con glucosa al 0,2 % y 100 jig/ml de kanamicina durante aproximadamente 8 h. Transferir 25 jil de cultivo iniciador en fase logarítmica a 1 ml de medios de expresión (medios de autoinducción Terrific Broth (TB) complementados con glucosa al 0,2 %, fosfato de potasio 50 mM, MgCl25 mM y 100 jig/ml de kanamicina) en placas de 96 pocillos profundos. Se incubaron las placas con agitación a 250-300 rpm durante 36-40 h a 28 °C.
A continuación, se recogieron las células por medio de centrifugación a 3200 x g durante 30 minutos a 4 °C. Se separaron por decantación los medios y se resuspendió el sedimento celular en 200 jl de tampón de lisis preenfriado (fosfato de potasio 20 mM pH 7,5, NaCl 100 mM, Tween20 al 0,5 %, TCEP 5 mM, imidazol 10 mM,
PMSF 1 mM, BugBuster 1X, 100 |jg/ml de inhibidores de lisozima y proteasa) e incubar a temperatura ambiente durante 20 min con agitación suave. A continuación, añadir 20 jl de una reserva 10x hasta una concentración final de 100 jg/ml de DNasa, MgCb 5 mM, 100 jg/ml de RNasa I e incubar en hielo durante 5-10 min para producir un lisado. Complementar el lisado con 200 jl de fosfato de potasio 1 M, pH 7,5 (la concentración final será de aproximadamente 0,5 M de fosfato de potasio en 400 jl de lisado) y filtrar a través de placas de filtro Pall (pieza n.° 5053, filtros de 3 micrómetros) por medio de centrifugación a aproximadamente 1500 rpm a 4 °C durante 10 minutos. A continuación, se aplicaron los lisados clarificados a placas de cobalto His-Pur de 96 pocillos equilibradas (pieza n.° 90095 de Pierce) y se unieron durante 15-30 min.
Se recogió el flujo pasante (FT) por centrifugación a 500xG durante 3 min. A continuación, se lavó 3 veces el FT con 400 ul de tampón de lavado 1 (fosfato de potasio 0,5 M pH 7,5, NaCl 1 M, TCEP 5 mM, imidazol 20 mM+Tween20 al 0,5 %). A continuación, se lavó el FT dos veces en 400 ul de tampón de lavado 2 (Tris 50 mM pH 7,4, KCl 200 mM, TCEP 5 mM, Tween20 al 0,5 %, imidazol 20 mM).
Se eluyó la Pol6 usando 200 jl de tampón de elución (Tris 50 mM pH 7,4, KCl 200 mM, TCEP 5 mM, Tween20 al 0,5 %, imidazol 300 mM, glicerol al 25 %) y se recogió después de 1-2 min de incubación. Volver a aplicar eluido a la misma placa con His-Pur 2-3 veces para obtener Pol6 concentrada en el eluido. La polimerasa purificada es >95 % pura como se evalúa por SDS-PAGE. La concentración de proteína es de ~3 uM (0,35 mg/ml) con una proporción 260/280 de 0,6 como se evalúa por Nanodrop.
La procesividad de la polimerasa se verificó por un ensayo de desplazamiento de fluorescencia (véase el ejemplo 3) como función de la velocidad de disociación del molde polinucleotídico.
Ejemplo 3
Ensayo de procesividad estática
Se analizó el efecto de las mutaciones de los aminoácidos del sitio de unión a ADN de la polimerasa variante Pol6-44-X1, es decir, Pol6-44-D44A, sobre la procesividad de la polimerasa variante usando un ensayo de procesividad estática con lo que se determinó la disociación del molde de ADN de las polimerasas variantes en ausencia de síntesis de polinucleótidos.
El ensayo es un ensayo FRET con lo que se mide la fluorescencia emitida por un sustrato de molde de ADN fluorogénico en presencia de un molde de ADN competidor no fluorogénico. En referencia a la figura 2, el ensayo FRET usa un molde de ADN fluorogénico que comprende un molde de ADN marcado con fluoróforo Cy5 /Cy5/AGA GTG ATA GTA TGA TTA TGT AGA TGT AGG ATT TGA TAT GTG
AGT AGC CGA ATG AAA CCT T/¡SpC3/TT GGT TTC ATT CGG-3’) (SEQ ID NO 12 y 16)), y al que se ha unido un oligonucleótido complementario que comprende un extintor 3BHQ-2 (5 -TTTTCA TAA TCA TAC TATCAC TCT /3BHQ_2/-3’ (SEQ ID NO: 13)). Se incuba una ADN polimerasa con el molde-oligonucleótido para formar un complejo polimerasa-molde-oligonucleótido. La velocidad de disociación de la polimerasa variante del complejo moldeoligonucleótido se mide a medida que la polimerasa variante se desplaza a lo largo del tiempo por un molde de ADN no fluorogénico competidor JAM1G. A continuación, se determina la cantidad de complejo polimerasa no desplazada-molde-oligonucleótido extendiendo el molde en horquilla y midiendo el nivel de fluorescencia a medida que se desplaza el oligonucleótido.
Se usó un tampón de ensayo que comprendía HEPES 208,3 mM pH 7,5, Kglu 75 mM, EDTA 3,0 mM, Triton X-100 al 0,4 %, TCEP 41,7 mM, 208,3 u/ml de BSA y molde de ADN marcado con Cy5 en horquilla 750 nM, para preparar una reserva de trabajo de reactivo A.
Se mezclaron de tres a cinco microlitros de la variante de polimerasa con veintiún microlitros de reactivo A (reactivo A:variante de Pol = 3:5) y se incubó durante 30 minutos a temperatura ambiente para permitir la formación de complejos polimerasa-molde de ADN/oligonucleótido.
Después de la incubación, se añadieron 8 ul de la solución que comprendía los complejos polimerasa-molde de ADN/oligonucleótido a cada uno de los pocillos de una placa de media área de 96 pocillos Costar.
Se añadieron diecisiete microlitros de una solución madre de reactivo "sal y caza" que comprendía molde de ADN competidor (KGlu 488 mM y molde de ADN de caza JamG1 2,7 mM) a cada uno de los pocillos que contenían la mezcla de polimerasa-molde de ADN/oligonucleótido. La mezcla se colocó en un lector de placas Polarstar de BMG (BMG Labtech, Cary, NC).
Se añadieron veinte microlitros de reactivo B (HepES 25 mM pH 7,5, K-glu 500 mM, Triton-X 100 al 0,05 %, TCEP 5 mM, 25 ug/ul de BSA, dN6P 20 uM y MgCb 5 mM) a los complejos en los pocillos para iniciar la extensión del molde de ADN, y se midió la fluorescencia resultante en el tiempo =0, 30 minutos, 60 minutos, 90 minutos, 120 minutos y 180 minutos.
El valor de fluorescencia de la línea de base se restó de todos los valores y se calculó el porcentaje de amplitud, donde la amplitud máxima en el tiempo T=0 es de un 100 %; la amplitud en el tiempo T=30 min amplitud = (Amp a T=30/Amp a T=0)%. A continuación, se calculó la velocidad de disociación como la pendiente de la curva. Los resultados se proporcionan en la tabla 1 a continuación.
Tabla 1
Las curvas de disociación para la polimerasa original Pol6-44-X1 y variantes de la misma: Pol6-44-X1-E585K, Pol6-44-X1 -E585K-L731K y Pol6-44-X1-E585K-M738K, se muestran en la figura 3A, 3B, 3C y 3D, respectivamente.
Los datos muestran que la polimerasa Pol6 variante que comprende mutaciones que sustituyen uno o más aminoácidos del sitio de unión a ADN con un aminoácido cargado positivamente, por ejemplo, lisina (K), presenta una disminución en la velocidad de disociación del molde de ADN y, por lo tanto, procesividad incrementada. En consecuencia, también se espera que estas polimerasas variantes tengan un tiempo de vida de secuenciación incrementado y que incrementen la longitud de las lecturas durante los acontecimientos de secuenciación.
Ejemplo 4
Fijación a nanoporo
Este ejemplo proporciona procedimientos de fijación de una polimerasa variante a un nanoporo, por ejemplo, ahemolisina, OmpG.
Se expresó la marca His de variante de pol6 SpyCatcher (SEQ ID NO: 4) de acuerdo con el ejemplo 2 y se purificó usando una columna de afinidad con cobalto. La polimerasa SpyCatcher y una proteína SpyTag-nanoporo se incuban durante la noche a 4 °C en SrCl2 3 mM para formar el complejo polimerasa-nanoporo. El complejo polimerasa-molde se forma, se purifica y se fija a un nanoporo para formar complejos de secuenciación por nanoporos. Los procedimientos para preparar y purificar complejos polimerasa-molde se describen en la solicitud provisional de EE. UU. "Purification of Polymerase Complexes" 62/260.194 presentada el 25 de noviembre de 2015, que se incorpora en el presente documento por referencia en su totalidad. Los complejos de secuenciación por nanoporos se pueden formar por la unión secuencial de la polimerasa variante al nanoporo para formar un complejo enzima-nanoporo, seguido de asociación del molde para formar el complejo de secuenciación por nanoporos. De forma alternativa, se pueden formar complejos de secuenciación por nanoporos asociando en primer lugar el molde con la polimerasa variante para formar un complejo molde-enzima y, posteriormente, fijar el complejo molde-enzima al nanoporo. Los procedimientos para formar complejos de secuenciación por nanoporos se describen en la solicitud provisional de Ee. UU.62/281.719 presentada el 21 de enero de 2016, que se incorpora en el presente documento por referencia en su totalidad.
Se puede acoplar una polimerasa al nanoporo por cualquier medio adecuado. Véanse, por ejemplo, el documento PCT/US2013/068967 (publicado como WO2014/074727; Genia Technologies, Inc.), el documento PCT/US2005/009702 (publicado como WO2006/028508; Presidente y miembros de la Universidad de Harvard) y el documento PCT/US2011/065640 (publicado como WO2012/083249; Universidad de Columbia).
Una ADN polimerasa pol6 variante se acopla a un nanoporo proteína (por ejemplo, alfa-hemolisina, OmpG), a través de una molécula conectora. Específicamente, se usa el sistema SpyTag y SpyCatcher, que forma espontáneamente enlaces isopeptídicos covalentes en condiciones fisiológicas. Véase, por ejemplo, Li et al, J Mol Biol., 23 enero de 2014;426(2):309-17.
Secuenciación por nanoporos
Se determinó la capacidad de una polimerasa Pol6 variante unida a nanoporo de unirse a nucleótidos marcados y de este modo permitir la detección de corrientes de canal bloqueado en el nanoporo al que está fijado la polimerasa. Se comparó la procesividad incrementada de las polimerasas Pol6 variantes con la de la Pol6 original que carece de las modificaciones de la enzima variante.
La polimerasa Pol6 variante se pone en contacto con el molde de ADN para formar el complejo Pol6 variante-ADN, que posteriormente se fija a un nanoporo incrustado en una bicapa lipídica sobre un pocillo en un chip detector de semiconductores, también llamado micromatriz. La bicapa de lípidos se forma y el nanoporo con el complejo polimerasa Pol6 variante-ADN fijado, es decir, el complejo de secuenciación por nanoporos de Pol6 variante, se inserta como se describe en el documento PCT/US2014/061853 (titulado "Methods for Forming Lipid Bilayers on Biochips" y presentado el 22 de octubre de 2014).
De forma alternativa, el nanoporo se incrusta en la bicapa lipídica y el complejo Pol6 variante-ADN se fija in situ.
Una mezcla de nucleótidos marcados, donde la marca es un polímero de 30 nucleótidos de timina (T30) que consiste en T-T303 uM, C-T303 uM, G-T303 uM y A-T303 uM, en condiciones estáticas (KGlu 500 mM, CaCl2 3 mM, HEPES 20 mM, pH 8,0), se hace fluir sobre los nanoporos a una tasa de 0,834 ul/segundo.
Se aplica una corriente alterna de 210 mV de pico a pico a 25 Hz, y se evalúa la captura de marcas de nucleótidos a medida que las bases de nucleótidos se incorporan en la hebra de ADN copiada por la polimerasa unida al nanoporo.
La procesividad de la Pol6 variante se compara con la de la Pol6 original no modificada para determinar un incremento en la longitud de lectura y/o la velocidad de síntesis de polinucleótidos y/o una disminución en el error de secuenciación.
Texto libre del listado de secuencias
SEQ ID NO: 1 - Pol6 natural (ADN polimerasa [fago de Clostridium phiCPV4]; GenBank: AFH27113.1)
001 mdkhtqyvke hsfnydeykk anfdkiecli fdtesctnye ndntgarvyg wglgvtrnhn
061 miygqnlnqf wevcqnifnd wyhdnkhtik itktkkgfpk rkyikfpiav hnlgwdvefl
121 kyslvengfn ydkgllktvf skgapyqtvt dveepktfhi vqnnnivygc nvymdkffev
181 enkdgsttei glcldffdsy kiitcaesqf hnyvhdvdpm fykmgeeydy dtwrspthkq
241 ttlelryqyn diymlrevie qfyidglcgg elpltgmrta ssiafnvlkk mtfgeektee
301 gyinyfeldk ktkfeflrkr iemesytggy thanhkavgk tinkigcsld inssypsqma
361 ykvfpygkpv rktwgrkpkt eknevyliev gfdfvepkhe eyaldifkig avnskalspi
421 tgavsgqeyf ctnikdgkai pvykelkdtk Ittnynvvlt sveyefwikh fnfgvflkkde
481 ydcfevdnle ftglkigsil yykaekgkfk pyvdhftkmk venkklgnkp Itnqakliln
541 gaygkfgtkq nkeekdlimd knglltftgs vteyegkefy rpyasfvtay grlqlwnaii
601 yavgvenfly cdtdsiycnr evnsliedmn aigetidkti Igkwdvehvf dkfkvlgqkk
661 ymyhdckedk tdlkccglps darkiiigqg fdefylgknv egkkqrkkvi ggcllldtlf
721 tikkimf*
SEQ ID NO: 2 - Pol6 (con marca His)
MHHHHHHHHS GGSDKHTQYV KEHSFNYDEY KKANFDKIEC LIFDTESCTN
50
YENDNTGARV YGWGLGVTRN HNMIYGQNLN QFWEVCQNIF NDWYHDNKHT
100
IKITKTKKGF PKRKYIKFPI AVHNLGWDVE FLKYSLVENG FNYDKGLLKT
150
VFSKGAPYQT VTDVEEPKTF HIVQNNNIVY GCNVYMDKFF EVENKDGSTT
2 Ü 0
EIGLCLDFFD SYKIITCAES QFHNYVHDVD PMFYKMGEEY DYDTWRSPTH
250
KQTTLELRYQ YNDIYMLREV IEQFYIDGLC GGELPLTGMR TASSIAFNVL
300
KKMTFGEEKT EEGYINYFEL DK.KTKFEFLR KR1EMESYTG GYTHANHKAV
3BO
GKTINKIGCS LDINSSYPSQ MAYKVFPYGK PVRKTWGRKP KTBKNEVYLI
400
EVGFDFVEPK HEEYALDIFK IGAVNSKALS PITGAVSGQE YFCTNIKDGK
450
AIPVYKELKD TKLTTNYNW LTSVEYEFWI KHFNFGVFKK DEYDCFEVDN
500
LEFTGLKIGS ILYYKAEKGK FKPYVDHFTK MKVENKKLGN KPLTNQAKLI
550
LNGAYGKFGT KQNKEEKDLI MDKNGLLTFT GSVTEYEGKE FYRPYASFVT
000
AYGRLQLWNA IIYAVGVENF l y c d t d s iy c NREVNSLIED MNAIGETIDK
£j 50
TILGKWDVEH VFDKFKVLGQ KKYMYHDCKE DKTDLKCCGL PSDARKIIIG
700
QGFDEFYLGK NVEGKKQRKK VIGGCLLLDT LFTIKKIMF+
739
SEQ ID NO: 3 - Pol6 con marca His (secuencia de ADN)
ATGCATCACC ATCATCATCA CCACCACAGC GGCGGTTCCG ACAAACACAC
50
GCAGTACGTC AAAGAGCATA GCTTCAATTA TGACGAGTAT AAGAAAGCGA
100
ATTTCGACAA GATCGAGTGC CTGATCTTTG ACACCGAGAG CTGCACGAAT
150
TATGAGAACG ATAATACCGG TGCACGTGTT TACGGTTGGG GTCTTGGCGT
2 00
CACCCGCAAC CACAATATGA TCTACGGCCA AAATCTGAAT CAGTTTTGGG
250
AAGTATGCCA GAACATTTTC AATGATTGGT ATCACGACAA CAAACATACC
300
ATTAAGATTA CCAAGACCAA GAAAGGCTTC CCGAAACGTA AGTACATTAA
350
GTTTCCGATT GCAGTTCACA ATTTGGGCTG GGATGTTGAA TTCCTGAAGT
400
ATAGCCTGGT GGAGAATGGT TTCAATTACG ACAAGGGTCT GCTGAAAACT
450
GTTTTTAGCA AGGGTGCGCC GTACCAAACC GTGACCGATG TTGAGGAACC
500
GAAAACGTTC CATATCGTCC AGAATAACAA CATCGTTTAT GGTTGTAACG
550
TGTATATGGA CAAATTCTTT GAGGTCGAGA ACAAAGACGG CTCTACCACC
600
GAGATTGGCC TGTGCTTGGA TTTCTTCGAT AGCTATAAGA TCATCACGTG
650
TGCTGAGAGC CAGTTCCACA ATTACGTTCA TGATGTGGAT CCAATGTTCT
700
ACAAAATGGG TGAAGAGTAT GAT TAC GATA CTTGGCGTAG CCCGACGCAC
750
AAGCAGACCA CCCTGGAGCT GCGCTACCAA TACAATGATA TCTATATGCT
800
GCGTGAAGTC ATCGAACAGT TTTACATTGA CGGTTTATGT GGCGGCGAGC
850
TGCCGCTGAC CGGCATGCGC ACCGCTTCCA GCATTGCGTT CAACGTGCTG
900
AAAAAGATGA CCTTTGGTGA GGAAAAGACG GAAGAGGGCT ACATCAACTA
950
TTTTGAATTG GACAAGAAAA CCAAATTCGA GTTTCTGCGT AAGCGCATTG 1000
AAATGGAATC GTACACCGGT GGCTATACGC ACGCAAATCA CAAAGCCGTT
1050
GGTAAGACTA TTAACAAGAT CGGTTGCTCT TTGGACATTA ACAGCTCATA
1100
CCCTTCGCAG ATGGCGTACA AGGTCTTTCC GTATGGCAAA CCGGTTCGTA
1150
AGACCTGGGG TCGTAAACCA AAGACCGAGA AGAACGAAGT TTATCTGATT
1200
GAAGTTGGCT TTGACTTCGT GGAGCCGAAA CACGAAGAAT ACGCGCTGGA
1250
TATCTTTAAG ATTGGTGCGG TGAACTCTAA AGCGCTGAGC CCGATCACCG
1300
GCGCTGTCAG CGGTCAAGAG TATTTCTGTA CGAACATTAA AGACGGCAAA
1350
GCAATCCCGG TTTACAAAGA ACTGAAGGAC ACCAAATTGA CCACTAACTA
1400
CAATGTCGTG CTGACCAGCG TGGAGTACGA GTTCTGGATC AAACACTTCA
1450
ATTTTGGTGT GTTTAAGAAA GACGAGTACG ACTGTTTCGA AGTTGACAAT
1500
CTGGAGTTTA CGGGTCTGAA GATTGGTTCC ATTCTGTACT ACAAGGCAGA
1550
GAAAGGCAAG TTTAAACCTT ACGTGGATCA CTTCACGAAA ATGAAAGTGG
1600
AGAACAAGAA ACTGGGTAAT AAGCCGCTGA CGAATCAGGC AAAGCTGATT
1650
CTGAACGGTG CGTACGGCAA ATTCGGCACC AAACAAAACA AAGAAGAGAA
1700
AGATTTGATC ATGGATAAGA ACGGTTTGCT GACCTTCACG GGTAGCGTCA
1750
CGGAATACGA GGGTAAAGAA TTCTATCGTC CGTATGCGAG CTTCGTTACT
1800
GCCTATGGTC GCCTGCAACT GTGGAACGCG ATTATCTACG CGGTTGGTGT
1850
GGAGAATTTT CTGTACTGCG ACACCGACAG CATCTATTGT AACCGTGAAG 1900
TTAACAGCCT CATTGAGGAT ATGAACGCCA TTGGTGAAAC CATCGATAAA
1950
ACGATTCTGG GTAAATGGGA CGTGGAGCAT GTCTTTGATA AGTTTAAGGT
2000
CCTGGGCCAG AAGAAGTACA TGTATCATGA TTGCAAAGAA GATAAAACGG
2050
ACCTGAAGTG TTGCGGTCTG CCGAGCGATG CCCGTAAGAT TATCATTGGT
2100
CAAGGTTTCG ACGAGTTTTA TCTGGGCAAA AATGTCGAAG GTAAGAAGCA
2150
ACGCAAAAAA GTGATCGGCG GTTGCCTGCT GCTGGACACC CTGTTTACGA
2200
TCAAGAAAAT CATGTTCTAA
2220
SEQ ID NO: 4 - Pol6-44-X1 con marca His/SpyCatcher
MHHHHHHHHS GDYDIPTTEN LYFQGAMVDT LSGLSSEQGQ SGDMTIEEDS
50
ATH1KFSKRD EDGKELAGAT MELRDSSGKT ISTWISDGQV KDFYLYPGKY
100
TFVETAAPDG YEVATAITFT VNEQGQVTVN GKATKGDAHI GGSDKHTQYV
150
KEHSFNYDEY KKANFDKIEC LIFATESCTN YENDNTGARV YGWGLGVTRN
200
HNMIYGQNLN QFWEVCQNIF WDWYHDNKHT IKITKTKKGF PKRKYIKFPI
250
AVHNLGWDVE FLKYSLVENG FNYDKGLLKT VFSKGAPYQT VTDVEEPKTF
300
HIVQNNNIVY GCNVYMDKFF EVENKDGSTT EIGLCLDFFD SYKIITCAES
350
QFHNYVHDVD PMFYKMGEEY DYDTWRSPTH KQTTLELRYQ YNDIYMLREV
400
IEQFYIDGLC GGELPLTGMR TASSIAFNVL KKMTFGEEKT EEGYIWYFEL
450
DKKTKFEFLR KRIEMESYTG GYTHANHKAV GKTIKKIGCS LDIKSAYPSQ 500
MAYKVFPYGK PVRKTWGRKP KTEKNEVYLI EVGFDFVEPK HEEYALDIFK
550
IGAVNSKALS PITGAVSGQE YFCTNIKDGK AIPVYKELKD TKLTTNYNW
600
LTSVEYEFWI KHFNFGVFKK DEYDCFEVDN LEFTGLKIGS ILYYKAEKGK
650
FKPYVDHFMK MKVENKKLGN KPLTNQFKLI LNGAYGKFGT KQNKEEKDLI
700
MDKNGLLTFT GSVTEYEGKE FYRPYASFVT AYGRLQLWNA IIYAVGVEWF
750
LYCDTDSIYC NREVNSLIED MNAIGETIDK TILGKWDVEH VFDKFKVLGQ
800
KKYMYHDCKE DKTDLKCCGL PSD A R K IIIG QGFDEFYLGK NVEGKKQRKK
850
VIGGCLLLDT AFTIKKIMF*
869
SEQ ID NO: 5 - Pol6-44-X1 con marca His/SpyCatcher (secuencia de ADN) ATGCATCACC ATCATCATCA CCACCA CAGC GGTGACTACG ACATCCCGAC
50
CACCGAGAAC CTGTACTTCC AGGGCGCCAT GGTGGACACA CTGAGCGGTC
100 TGAGCAGTGA ACAGGGCCAG AGCGGCGACA TGACCATTGA AGAGGACAGC 150
GCCACCCACA TCAAGTTCAG CAAGCGTGAC GAGGACGGTA AGGAACTGGC
2 00
CGGCGCCACC ATGGAACTGC GTGACAGCAG CGGCAAGACC ATCAGCACCT
2 50
GGATCAGCGA TGGCCAGGTG AAGGACTTCT ACCTGTACCC GGGCAAGTAC
300
ACCTTCGTGG AGACAGCCGC ACCGGACGGT TACGAGGTTG CCACCGCCAT
350
CACCTTCACC GTGAACGAGC AGGGCCAAGT GACCGTTAAC GGCAAGGCCA
4 00
CCAAGGGTGA CGCCCACATC GGCGGTTCCG ACAAACACAC GCAGTACGTC 4 50
AAAGAGCATA GCTTCAATTA TGACGAGTAT AAGAAAGCGA ATTTCGACAA
500
GATCGAGTGC CTGATCTTTG CGACCGAGAG CTGCACGAAT TATGAGAACG
550
ATAATACCGG TGCACGTGTT TACGGTTGGG GTCTTGGCGT CACCCGCAAC
600
CACAATATGA TCTACGGCCA AAATCTGAAT CAGTTTTGGG AAGTATGCCA
650
GAACATTTTC AATGATTGGT ATCACGACAA CAAACATACC ATTAAGATTA
700
CCAAGACCAA GAAAGGCTTC CCGAAACGTA AGTACATTAA GTTTCCGATT
750
GCAGTT CACA ATTTGGGCTG GGATGTTGAA TTCCTGAAGT ATAGCCTGGT
800
GGAGAATGGT TTCAATTACG ACAAGGGT CT GCTGAAAACT GTTTTTAGCA
850
AGGGTGCGCC GTACCAAACC GTGACCGATG TTGAGGAACC GAAAACGTTC
900
CATATCGTCC AGAATAACAA CATCGTTTAT GGTTGTAACG TGTATATGGA
950
CAAATTCTTT GAGGTCGAGA ACAAAGACGG CTCTACCACC GAGATTGGCC
1000
TGTGCTTGGA TTTCTTCGAT AGCTATAAGA TCATCACGTG TGCTGAGAGC
1050
CAGTTCCACA ATTACGTTCA TGATGTGGAT CCAATGTTCT ACAAAATGGG
1100
TGAAGAGTAT GAT TAC GATA CTTGGCGTAG CCCGACGCAC AAGCAGACCA
1150
CCCTGGAGCT GCGCTACCAA TACAATGATA TCTATATGCT GCGTGAAGTC
1200
ATCGAACAGT TTTACATTGA CGGTTTATGT GGCGGCGAGC TGCCGCTGAC
1250
CGGCATGCGC ACCGCTTCCA GCATTGCGTT CAACGTGCTG AAAAAGATGA
1300
CCTTTGGTGA GGAAAAGACG GAAGAGGGCT ACATCAACTA TTTTGAATTG 1350
GACAAGAAAA CCAAATTCGA GTTTCTGCGT AAGCGCATTG AAATGGAATC
1400
GTACACCGGT GGCTATACGC ACGCAAATCA CAAAGCCGTT GGTAAGACTA
1450
TTAACAAGAT CGGTTGCTCT TTGGACATTA ACAGCGCGTA CCCTTCGCAG
1500
ATGGCGTACA AGGTCTTTCC GTATGGCAAA CCGGTTCGTA AGACCTGGGG
1550
TCGTAAACCA AAGACCGAGA AGAACGAAGT TTATCTGATT GAAGTTGGCT
1600
TTGACTTCGT GGAGCCGAAA CACGAAGAAT ACGCGCTGGA TATCTTTAAG
1650
ATTGGTGCGG TGAACTCTAA AGCGCTGAGC CCGATCACCG GCGCTGTCAG
1700
CGGTCAAGAG TATTTCTGTA CGAACATTAA AGACGGCAAA GCAATCCCGG
1750
TTTACAAAGA ACTGAAGGAC ACCAAATTGA CCACTAACTA CAATGTCGTG
1800
CTGACCAGCG TGGAGTACGA GTTCTGGATC AAACACTTCA ATTTTGGTGT
1850
GTTTAAGAAA GACGAGTACG ACTGTTTCGA AGTTGACAAT CTGGAGTTTA
1900
CGGGTCTGAA GATTGGTTCC ATTCTGTACT ACAAGGCAGA GAAAGGCAAG
1950
TTTAAACCTT ACGTGGATCA CTTCATGAAA ATGAAAGTGG AGAACAAGAA
2 000
ACTGGGTAAT AAGCCGCTGA CGAATCAGTT TAAGCTGATT CTGAACGGTG
2 050
CGTACGGCAA ATTCGGCACC AAACAAAACA AAGAAGAGAA AGATTTGATC
2 100
ATGGATAAGA ACGGTTTGCT GACCTTCACG GGTAGCGTCA CGGAATACGA
2 150
GGGTAAAGAA TTCTATCGTC CGTATGCGAG CTTCGTTACT GCCTATGGTC
2 200
GCCTGCAACT GTGGAACGCG ATTATCTACG CGGTTGGTGT GGAGAATTTT
225 0
CTGTACTGCG ACACCGACAG CATCTATTGT AACCGTGAAG TTAACAGCCT
230 0
CATTGAGGAT ATGAACGCCA TTGGTGAAAC CATCGATAAA ACGATTCTGG
235 0
GTAAATGGGA CGTGGAGCAT GTCTTTGATA AGTTTAAGGT CCTGGGCCAG
240 0
AAGAAGTACA TGTATCATGA TTGCAAAGAA GATAAAACGG ACCTGAAGTG
245 0
TTGCGGTCTG CCGAGCGATG CCCGTAAGAT TATCATTGGT CAAGGTTTCG
250 0
ACGAGTTTTA TCTGGGCAAA AATGTCGAAG GTAAGAAGCA ACGCAAAAAA
255 0
GTGATCGGCG GTTGCCTGCT GCTGGACACC CTGTTTACGA TCAAGAAAAT
260 0
CATGTTCTAA
261 0
SEQ ID NO: 6 - Pol6-44-X1 con marca His/SpyCatcher E585K de SEQ ID NO: 2 que corresponde a E715K de
SEQ ID NO: 6
MHHHHHHHHS
GDYDIPTTEN LYFQGANVDT LSGLSSEQGQ SGDMTIEEDS
50
ATHIKFSKRD EDGKELAGAT MELRDSSGKT ISTWISDGQV KDFYLYPGKY
100
TFVETAAPDG YEVATA1TFT VNEQGQVTVN GKATKGDAHI
GGSDKHTQYV
150
KEHSFNYDEY KKANFDKIEC L IF A T E S C T N YENDNTGARV YGWGLGVTRN
200
HNMIYGQNLN QFW EVCQNIF NDWYHDNKHT IK IT K T K K G F P K R K Y IK F P I
250
AVHNLGWDVE FLKYSLVENG FNYDKGLLKT VFSKGAPYQT VTDVEEPKTF
300
HIVQNNN IVY GCNVYMDKFF EVENKDGSTT E IG L C L D FF D S Y K IIT C A E S
35 0
QFHNYVHDVD PMFYKMGEEY DYDTWRSPTH KQTTLELRYQ YNDIYMLREV
400
IEQFYIDGLC GGELPLTGMR TASSIAFNVL KKMTFGEEKT EEGYINYFEL
450
DKKTKFEFLR KRIEMESYTG GYTHANHKAV GKTINKIGCS LDINSAYPSQ
500
MAYKVFPYGK PVRKTWGRKP KTEKNEVYLI EVGFDFVEPK HEEYALDIFK
550
IGAVNSKALS PITGAVSGQE YFCTNIKDGK AIPVYKELKD TKLTTNYNW
600
LTSVEYEFWI KHFNFGVFKK DEYDCFEVDN LEFTGLKIGS ILYYKAEKGK
650
FKPYVDHFMK MKVENKKLGN KPLTNQFKLI LNGAYGKFGT KQNKEEKDLI
700
MDKNGLLTFT GSVTKYEGKE FYRPYASFVT AYGRLQLWNA IIYAVGVENF
750
LYCDTDSIYC NREVNSLIED MNAIGETIDK TILGKWDVEH VFDKFKVLGQ
800
KKYMYHDCKE DKTDLKCCGL PSDARKIIIG QGFDEFYLGK NVEGKKQRKK
850
VIGGCLLLDT LFTIKKIMF*
869
SEQ ID NO: 7 - Pol6-44-X1 con marca His/SpyCatcher E585K+L731K de SEQ ID NO: 2 que corresponde a E715K+L861K de SEQ ID NO: 6
MHHHHHHHHS GDYDIPTTEN LYFQGAMVDT LSGLSSEQGQ SGDHTIEEDS
50
ATHIKFSKRD EDGKELAGAT MELRDSSGKT ISTWISDGQV KDFYLYPGKY
100
TFVETAAPDG YEVATAITFT VWEQGQVTVN GKATKGDAHI GGSDKHTQYV
150
KEHSFWYDEY KKAWFDKIEC LIFATESCTN YENDNTGARV YGWGLGVTRN
200
HNMIYGQNLN QFWEVCQWIF NDWYHDNKHT IKITKTKKGF PKRKYIKFPI
250
AVHWLGWDVE FLKYSLVEWG FWYDKGLLKT VFSKGAPYQT VTDVEEPKTF
300
HIVQNNNIVY GCNVYMDKFF EVEWKDGSTT EIGLCLDFFD SYKIITCAES
350
QFHNYVHDVD PMFYKMGEEY DYDTWRSPTH KQTTLELRYQ YNDIYMLREV
400
IEQFYIDGLC GGELPLTGMR TASSIAFWVL KKMTFGEEKT EEGYINYFEL
450
DKKTKFEFLR KRIEMESYTG GYTHAWHKAV GKTINKIGCS LDINSAYPSQ
500
MAYKVFPYGK PVRKTWGRKP KTEKWEVYLI EVGFDFVEPK HEEYALDIFK
550
IGAVNSKALS PITGAVSGQE YFCTWIKDGK AIPVYKELKD TKLTTNYNVV
600
LTSVEYEFWI KHFWFGVFKK DEYDCFEVDN LEFTGLKIGS ILYYKAEKGK
650
FKPYVDHFMK MKVEWKKLGW KPLTWQFKLI LNGAYGKFGT KQNKEEKDLI
700
MDKNGLLTFT GSVTJCYEGKE FYRPYASFVT AYGRLQLWNA IIYAVGVENF
750
LYCDTDSIYC NREVNSLIED MNAIGETIDK TILGKWDVEH VFDKFKVLGQ
800
KKYMYHDCKE DKTDLKCCGL PSDARKIIIG QGFDEFYLGK NVEGKKQRKK
850
VIGGCLLLDT KFTIKKIMF*
869
SEQ ID NO: 8 - Pol6-44-X1 con marca His/SpyCatcher E585K+M738K de SEQ ID NO: 2 que corresponde a E715K+M868K de SEQ ID NO: 6
MHHHHHHHHg GDYDIPTTEN LYFQGAMVDT LSGLSSEQGQ SGDMTIEEDS
50
ATHIKFSKRD EDGKELAGAT MELRDSSGKT ISTWISDGQV KDFYLYPGKY
100
TFVETAAPDG YEVATAITFT VNEQGQVTVN GKATKGDAHI GGSDKHTQYV
150
KEHSFNYDEY KKANFDKIEC LIFATESCTN YENDNTGARV YGWGLGVTRN 200
HNMIYGQNLN QFWEVCQNIF NDWYHDNKHT IKITKTKKGF PKRKYIKFPI
250
AVHNLGWDVE FLKYSLVENG FNYDKGLLKT VFSKGAPYQT VTDVEEPKTF
300
HIVQNNNIVY GCNVYMDKFF EVENKDGSTT EIGLCLDFFD SYKIITCAES
350
QFHNYVHDVD PMFYKMGEEY DYDTWRSPTH KQTTLELRYQ YNDIYMLREV
400
IEQFYIDGLC GGELPLTGMR TASSIAFNVL KKMTFGEEKT EEGYINYFEL
450
DKKTKFEFLR KRIEMESYTG GYTHANHKAV GKTINKIGCS LDINSAYPSQ
500
MAYKVFPYGK PVRKTWGRKP KTEKNEVYLI EVGFDFVEPK HEEYALDIFK
550
IGAVNSKALS PITGAVSGQE YFCTNIKDGK AIPVYKELKD TKLTTNYNW
600
LTSVEYEFWI KHFNFGVFKK DEYDCFEVDN LEFTGLKIGS ILYYKAEKGK
650
FKPYVDHFMK MKVENKKLGN KPLTNQFKLI LNGAYGKFGT KQNKEEKDLI
700
MDKNGLLTFT GSVTKYEGKE FYRPYASFVT AYGRLQLWNA IIYAVGVENF
750
LYCDTDSIYC NREVNSLIED MNAIGETIDK TILGKWDVEH VFDKFKVLGQ
800
KKYMYHDCKE DKTDLKCCGL PSDARKIIIG QGFDEFYLGK NVEGKKQRKK
850
VIGGCLLLDT LFTIKKIKF*
869
SEQ ID NO: 9 - marca His 6 HHHHHH
[00175] SEQ ID NO: 10 - SpyCatcher
SG DYDIPTTENLYFQ G AM VDTLSG LSSEQ G Q SG DM TIEEDSATH IK FSK RDEDG K ELAG ATM ELRDSSG K TISTW ISDG Q VK DFYLYPG K YTFVETAAPDG YEVATAITF TVNEQGQVTVNGKATKGDAHI SEQ ID NO: 11 - SpyTag AHIVMVDAYKPTK
[00177] SEQ ID NO: 12 y 16 - molde de ADN fluorogénico marcado con Cy5
■Cy5/ AGA GTG ATA GTA TGA TTA TGT AGA TGT AGG ATT TGA
TAT GTG AGT AGC CGA ATG AAA CCT T /Í S p C 3 /T T GGT TTC ATT CGG SEQ ID NO: 13 - oligonucleótido extintor marcado con tinte Black Hole Quencher®
TTT TCA TAA TCA TAC TAT CAC TCT /3BHQ 2
Claims (22)
1. Una enzima Pol6 variante que tiene actividad polimerasa, comprendiendo dicha enzima Pol6 variante un polipéptido que tiene una secuencia de aminoácidos al menos un 70 % idéntica al polipéptido original de longitud completa de SEQ ID NO: 2, y una modificación correspondiente al aminoácido E585K.
2. La Pol6 variante de una cualquiera de la reivindicación 1, en la que dicha modificación produce un polipéptido variante que tiene procesividad incrementada en relación con el polipéptido original.
3. La Pol6 variante de la reivindicación 2, en la que dicha procesividad incrementada se retiene a una alta concentración de sal mayor de 100 mM.
4. La Pol6 variante de la reivindicación 3, en la que dicha procesividad comprende una disminución en la velocidad de disociación de molde que es al menos dos veces menor que la de la Pol6 original.
5. La Pol6 variante de la reivindicación 3, en la que dicha procesividad de dicha Pol6 variante comprende un incremento en la longitud de lectura producida por dicha Pol6 variante que es mayor que la longitud de lectura producida por la Pol6 original no modificada.
6. La Pol6 variante de una cualquiera de las reivindicaciones 1-5, que comprende además las sustituciones aminoacídicas D44A, S366A, T529M y A547F.
7. La Pol6 variante de una cualquiera de las reivindicaciones 1-5 fijada a un nanoporo monomérico o a uno oligomérico.
8. Una composición que comprende la enzima Pol6 variante de una cualquiera de las reivindicaciones 1-7.
9. Una pluralidad de polinucleótidos que codifican dicha enzima Pol6 variante de una cualquiera de las reivindicaciones 1-6.
10. Un vector de expresión que comprende un polinucleótido que codifica una enzima Pol6 variante de una cualquiera de las reivindicaciones 1-6.
11. Una pluralidad de células huésped, cada una transformada o transfectada con el vector de expresión de la reivindicación 10.
12. Un procedimiento de preparación de una enzima Pol6 variante de una cualquiera de las reivindicaciones 1 6, que comprende cultivar dicha pluralidad de células huésped de acuerdo con la reivindicación 11.
13. El procedimiento de la reivindicación 12, que comprende además aislar dicha enzima Pol6 variante.
14. Una micromatriz para secuenciar una muestra de ácido nucleico, comprendiendo dicha micromatriz una pluralidad de complejos de secuenciación por nanoporos, comprendiendo dichos complejos de secuenciación por nanoporos una Pol6 variante de una cualquiera de las reivindicaciones 1-7 fijada al nanoporo formado en una membrana y dispuesto contiguo a un electrodo.
15. Un procedimiento para secuenciar por nanoporos una muestra de ácido nucleico, comprendiendo dicho procedimiento:
(a) proporcionar nucleótidos marcados a un complejo de secuenciación por nanoporos que comprende una Pol6 variante de una cualquiera de las reivindicaciones 1-7, en el que un nucleótido marcado individual de dichos nucleótidos marcados contiene una marca acoplada a un nucleótido, siendo detectable esta marca con la ayuda de dicho nanoporo;
(b) en una alta concentración de sal, llevar a cabo una reacción de polimerización con la ayuda de dicha enzima Pol6 variante de dicho complejo de secuenciación por nanoporos, incorporando de este modo un nucleótido marcado individual de dichos nucleótidos marcados en una cadena en crecimiento complementaria a una molécula de ácido nucleico monocatenario de dicha muestra de ácido nucleico; y
(c) detectar, con la ayuda de dicho nanoporo, una marca asociada con dicho nucleótido marcado individual durante la incorporación de dicho nucleótido marcado individual, en el que dicha marca se detecta con la ayuda de dicho nanoporo mientras que dicho nucleótido está asociado con dicha polimerasa Pol6 variante.
16. El procedimiento de la reivindicación 12, en el que dicha muestra de ácido nucleico es ADN bicatenario.
17. El procedimiento de la reivindicación 12, en el que dicha muestra de ácido nucleico es ADN monocatenario.
18. El procedimiento de la reivindicación 12, en el que dicha muestra de ácido nucleico es ARN retrotranscrito.
19. El procedimiento de la reivindicación 15, en el que dicho nanoporo es un nanoporo monomérico o un nanoporo oligomérico.
20. El procedimiento de reivindicación 19, en el que dicho nanoporo monomérico es un nanoporo OmpG.
21. El procedimiento de la reivindicación 19, en el que dicho nanoporo oligomérico es un nanoporo de alfahemolisina.
22. El procedimiento de la reivindicación 15, en el que dicha alta concentración de sal es sal al menos 100 mM.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201662301619P | 2016-02-29 | 2016-02-29 | |
| PCT/EP2017/054502 WO2017148862A1 (en) | 2016-02-29 | 2017-02-27 | Polymerase variants |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2880331T3 true ES2880331T3 (es) | 2021-11-24 |
Family
ID=58192278
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES17708201T Active ES2880331T3 (es) | 2016-02-29 | 2017-02-27 | Variantes de polimerasa |
Country Status (3)
| Country | Link |
|---|---|
| EP (2) | EP3423576B1 (es) |
| ES (1) | ES2880331T3 (es) |
| WO (1) | WO2017148862A1 (es) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10308918B2 (en) | 2015-02-02 | 2019-06-04 | Roche Molecular Systems, Inc. | Polymerase variants |
| US10526588B2 (en) | 2015-05-14 | 2020-01-07 | Roche Sequencing Solutions, Inc. | Polymerase variants and uses thereof |
| US20170268052A1 (en) | 2016-02-29 | 2017-09-21 | Genia Technologies, Inc. | Polymerase-template complexes |
| CN108699539B (zh) | 2016-02-29 | 2022-11-18 | 吉尼亚科技公司 | 外切核酸酶缺陷的聚合酶 |
| US10590480B2 (en) | 2016-02-29 | 2020-03-17 | Roche Sequencing Solutions, Inc. | Polymerase variants |
| WO2018054970A2 (en) | 2016-09-22 | 2018-03-29 | F. Hoffmann-La Roche Ag | Pol6 polymerase variants |
| CN116348479A (zh) | 2020-09-30 | 2023-06-27 | 豪夫迈·罗氏有限公司 | 用于产生丝状噬菌体的细菌菌毛蛋白质复合物FimGt-DsF稳定蛋白质复合物 |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US529A (en) | 1837-12-20 | Secret safety-lock | ||
| US4760025A (en) | 1984-05-29 | 1988-07-26 | Genencor, Inc. | Modified enzymes and methods for making same |
| US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
| US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
| DE4422198C2 (de) | 1994-06-24 | 1997-08-28 | Audi Ag | Verfahren zum Steuern der elektrischen Beheizung eines Katalysators |
| US6627424B1 (en) | 2000-05-26 | 2003-09-30 | Mj Bioworks, Inc. | Nucleic acid modifying enzymes |
| US7238485B2 (en) | 2004-03-23 | 2007-07-03 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
| CA2995178C (en) | 2010-02-08 | 2023-09-12 | Genia Technologies, Inc. | Method and system for forming a nanopore in a lipid bilayer |
| WO2012083249A2 (en) | 2010-12-17 | 2012-06-21 | The Trustees Of Columbia University In The City Of New York | Dna sequencing by synthesis using modified nucleotides and nanopore detection |
| EP2861768A4 (en) | 2012-06-15 | 2016-03-02 | Genia Technologies Inc | CHIP SETUP AND HIGH ACCURACY NUCLEIC ACID SEQUENCING |
| US9605309B2 (en) | 2012-11-09 | 2017-03-28 | Genia Technologies, Inc. | Nucleic acid sequencing using tags |
| US9567630B2 (en) | 2013-10-23 | 2017-02-14 | Genia Technologies, Inc. | Methods for forming lipid bilayers on biochips |
| US10308918B2 (en) * | 2015-02-02 | 2019-06-04 | Roche Molecular Systems, Inc. | Polymerase variants |
-
2017
- 2017-02-27 ES ES17708201T patent/ES2880331T3/es active Active
- 2017-02-27 EP EP17708201.3A patent/EP3423576B1/en active Active
- 2017-02-27 WO PCT/EP2017/054502 patent/WO2017148862A1/en not_active Ceased
- 2017-02-27 EP EP21164826.6A patent/EP3929283A1/en not_active Withdrawn
Also Published As
| Publication number | Publication date |
|---|---|
| EP3929283A1 (en) | 2021-12-29 |
| EP3423576A1 (en) | 2019-01-09 |
| EP3423576B1 (en) | 2021-05-12 |
| WO2017148862A1 (en) | 2017-09-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2880331T3 (es) | Variantes de polimerasa | |
| US10590480B2 (en) | Polymerase variants | |
| US11034999B2 (en) | Polymerase-template complexes | |
| AU2014335915B2 (en) | Modified helicases | |
| US12037366B2 (en) | OMPG variants | |
| ES2804843T3 (es) | Variantes de polimerasa | |
| CN111235245B (zh) | 方法 | |
| JP2021121221A (ja) | ポリメラーゼバリアントおよびその使用 | |
| JP6959931B2 (ja) | エキソヌクレアーゼ欠損ポリメラーゼ | |
| CN106460061B (zh) | 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法 | |
| EP3204511A1 (en) | Mutant pores | |
| JP2019531073A (ja) | Pol6ポリメラーゼバリアント | |
| CN112204154B (zh) | Dna-孔隙-聚合酶复合物的酶促富集 | |
| WO2017050723A1 (en) | Pol7 polymerase variants |

