CN107636168A - 方法 - Google Patents
方法 Download PDFInfo
- Publication number
- CN107636168A CN107636168A CN201680022991.0A CN201680022991A CN107636168A CN 107636168 A CN107636168 A CN 107636168A CN 201680022991 A CN201680022991 A CN 201680022991A CN 107636168 A CN107636168 A CN 107636168A
- Authority
- CN
- China
- Prior art keywords
- polynucleotide
- seq
- pore
- monomer
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 168
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 348
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 348
- 239000002157 polynucleotide Substances 0.000 claims abstract description 348
- 239000000178 monomer Substances 0.000 claims description 617
- 239000011148 porous material Substances 0.000 claims description 355
- 235000001014 amino acid Nutrition 0.000 claims description 323
- 150000001413 amino acids Chemical class 0.000 claims description 288
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 228
- 230000004048 modification Effects 0.000 claims description 124
- 238000012986 modification Methods 0.000 claims description 124
- 230000001939 inductive effect Effects 0.000 claims description 100
- 108060004795 Methyltransferase Proteins 0.000 claims description 92
- 239000012528 membrane Substances 0.000 claims description 91
- 108090000623 proteins and genes Proteins 0.000 claims description 89
- 239000002773 nucleotide Substances 0.000 claims description 82
- 125000003729 nucleotide group Chemical group 0.000 claims description 81
- 239000013598 vector Substances 0.000 claims description 79
- 210000004027 cell Anatomy 0.000 claims description 71
- 102000004169 proteins and genes Human genes 0.000 claims description 71
- 235000018102 proteins Nutrition 0.000 claims description 70
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 65
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 56
- 235000003704 aspartic acid Nutrition 0.000 claims description 53
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 53
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 45
- 102000014914 Carrier Proteins Human genes 0.000 claims description 44
- 229920001184 polypeptide Polymers 0.000 claims description 43
- 108091008324 binding proteins Proteins 0.000 claims description 42
- 238000005259 measurement Methods 0.000 claims description 32
- 230000033001 locomotion Effects 0.000 claims description 28
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 claims description 26
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 claims description 26
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 claims description 26
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 claims description 25
- 239000012634 fragment Substances 0.000 claims description 24
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 15
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 15
- 239000004475 Arginine Substances 0.000 claims description 14
- 239000004471 Glycine Substances 0.000 claims description 14
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 14
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 12
- 229910019142 PO4 Inorganic materials 0.000 claims description 11
- 229960000723 ampicillin Drugs 0.000 claims description 10
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 claims description 10
- 239000003550 marker Substances 0.000 claims description 10
- 230000001131 transforming effect Effects 0.000 claims description 9
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 claims description 8
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 8
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 8
- 229930027917 kanamycin Natural products 0.000 claims description 8
- 229960000318 kanamycin Drugs 0.000 claims description 8
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 claims description 8
- 229930182823 kanamycin A Natural products 0.000 claims description 8
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 8
- 239000010452 phosphate Substances 0.000 claims description 8
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 claims description 7
- 239000008101 lactose Substances 0.000 claims description 7
- 210000000170 cell membrane Anatomy 0.000 claims description 5
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 claims description 4
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 4
- FMTYQCFBDMZGTQ-NVKWYWNSSA-N NCC(=O)O.N[C@@H](CO)C(=O)O.N[C@@H](CC(=O)O)C(=O)O.NCC(=O)O Chemical compound NCC(=O)O.N[C@@H](CO)C(=O)O.N[C@@H](CC(=O)O)C(=O)O.NCC(=O)O FMTYQCFBDMZGTQ-NVKWYWNSSA-N 0.000 claims description 2
- 238000002847 impedance measurement Methods 0.000 claims description 2
- 230000005641 tunneling Effects 0.000 claims description 2
- 230000005669 field effect Effects 0.000 claims 1
- 239000007787 solid Substances 0.000 claims 1
- 229940024606 amino acid Drugs 0.000 description 308
- 102220580933 Induced myeloid leukemia cell differentiation protein Mcl-1_F56V_mutation Human genes 0.000 description 109
- 125000003275 alpha amino acid group Chemical group 0.000 description 82
- 102200160490 rs1800299 Human genes 0.000 description 70
- 230000035772 mutation Effects 0.000 description 65
- 102220347769 c.268G>A Human genes 0.000 description 64
- 238000006467 substitution reaction Methods 0.000 description 61
- 108020004414 DNA Proteins 0.000 description 60
- 102000053602 DNA Human genes 0.000 description 58
- 102220289580 rs33916541 Human genes 0.000 description 46
- 102200026914 rs730882246 Human genes 0.000 description 46
- 102220143003 rs753997345 Human genes 0.000 description 46
- 102000004190 Enzymes Human genes 0.000 description 38
- 108090000790 Enzymes Proteins 0.000 description 38
- 238000012217 deletion Methods 0.000 description 34
- 230000037430 deletion Effects 0.000 description 34
- 102220533243 Glycophorin-B_Y51A_mutation Human genes 0.000 description 31
- -1 nucleotide monophosphates Chemical class 0.000 description 28
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 27
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 27
- 235000009582 asparagine Nutrition 0.000 description 27
- 229960001230 asparagine Drugs 0.000 description 27
- 239000000523 sample Substances 0.000 description 26
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 24
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 23
- 102200152572 rs1060503493 Human genes 0.000 description 23
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 21
- 235000013922 glutamic acid Nutrition 0.000 description 21
- 239000004220 glutamic acid Substances 0.000 description 21
- 102000035160 transmembrane proteins Human genes 0.000 description 21
- 108091005703 transmembrane proteins Proteins 0.000 description 21
- 235000014304 histidine Nutrition 0.000 description 20
- 150000007523 nucleic acids Chemical class 0.000 description 20
- 239000013612 plasmid Substances 0.000 description 20
- 239000013604 expression vector Substances 0.000 description 19
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 18
- 241000588724 Escherichia coli Species 0.000 description 17
- 239000000499 gel Substances 0.000 description 16
- 238000007792 addition Methods 0.000 description 15
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 14
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 14
- 235000018417 cysteine Nutrition 0.000 description 14
- 230000003993 interaction Effects 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 102000039446 nucleic acids Human genes 0.000 description 14
- 108020004707 nucleic acids Proteins 0.000 description 14
- 102220217675 rs370859268 Human genes 0.000 description 14
- 239000000126 substance Substances 0.000 description 14
- 102220498733 Interleukin-6 receptor subunit alpha_N55A_mutation Human genes 0.000 description 13
- 235000009697 arginine Nutrition 0.000 description 13
- 238000012512 characterization method Methods 0.000 description 13
- 230000001965 increasing effect Effects 0.000 description 13
- 239000010410 layer Substances 0.000 description 13
- 235000006109 methionine Nutrition 0.000 description 13
- 108091006146 Channels Proteins 0.000 description 12
- 239000000232 Lipid Bilayer Substances 0.000 description 12
- 239000000872 buffer Substances 0.000 description 12
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 12
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 12
- 150000002411 histidines Chemical class 0.000 description 12
- 229930182817 methionine Natural products 0.000 description 12
- 102220282693 rs1308150896 Human genes 0.000 description 12
- 102200110776 rs199601548 Human genes 0.000 description 12
- 150000003839 salts Chemical class 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 12
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 11
- 229920001400 block copolymer Polymers 0.000 description 11
- 230000006698 induction Effects 0.000 description 11
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 11
- 229960000310 isoleucine Drugs 0.000 description 11
- 238000006384 oligomerization reaction Methods 0.000 description 11
- 239000008188 pellet Substances 0.000 description 11
- 102100022536 Helicase POLQ-like Human genes 0.000 description 10
- 101000899334 Homo sapiens Helicase POLQ-like Proteins 0.000 description 10
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 229920000428 triblock copolymer Polymers 0.000 description 10
- 108060002716 Exonuclease Proteins 0.000 description 9
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 9
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 9
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 9
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 9
- 235000004279 alanine Nutrition 0.000 description 9
- 238000010168 coupling process Methods 0.000 description 9
- 102000013165 exonuclease Human genes 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000004927 fusion Effects 0.000 description 9
- 235000018977 lysine Nutrition 0.000 description 9
- 239000004177 patent blue V Substances 0.000 description 9
- 235000021317 phosphate Nutrition 0.000 description 9
- 239000002151 riboflavin Substances 0.000 description 9
- 238000003756 stirring Methods 0.000 description 9
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 9
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 8
- 239000004472 Lysine Substances 0.000 description 8
- 210000004899 c-terminal region Anatomy 0.000 description 8
- 238000005119 centrifugation Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 230000008878 coupling Effects 0.000 description 8
- 238000005859 coupling reaction Methods 0.000 description 8
- 238000005034 decoration Methods 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 8
- 150000002632 lipids Chemical class 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 7
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 7
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 7
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000002209 hydrophobic effect Effects 0.000 description 7
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 229920002477 rna polymer Polymers 0.000 description 7
- 239000007858 starting material Substances 0.000 description 7
- 235000000346 sugar Nutrition 0.000 description 7
- 239000004474 valine Substances 0.000 description 7
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 6
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 6
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 6
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 6
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 6
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 6
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 6
- 235000013928 guanylic acid Nutrition 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 125000006850 spacer group Chemical group 0.000 description 6
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 6
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 5
- 101710092462 Alpha-hemolysin Proteins 0.000 description 5
- 102220645750 Keratin-associated protein 6-3_Y51S_mutation Human genes 0.000 description 5
- 101710174798 Lysenin Proteins 0.000 description 5
- 241000187480 Mycobacterium smegmatis Species 0.000 description 5
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- 102220637688 Ras-related protein Rab-33A_D91G_mutation Human genes 0.000 description 5
- 241000589499 Thermus thermophilus Species 0.000 description 5
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 5
- 239000004473 Threonine Substances 0.000 description 5
- 239000012491 analyte Substances 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 5
- JSRLJPSBLDHEIO-SHYZEUOFSA-N dUMP Chemical compound O1[C@H](COP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 JSRLJPSBLDHEIO-SHYZEUOFSA-N 0.000 description 5
- 238000010828 elution Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000010438 heat treatment Methods 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 150000002500 ions Chemical class 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 229910052698 phosphorus Inorganic materials 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 4
- 150000008574 D-amino acids Chemical class 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102220490323 Matrix metalloproteinase-27_N55Q_mutation Human genes 0.000 description 4
- 108010013381 Porins Proteins 0.000 description 4
- 102000017033 Porins Human genes 0.000 description 4
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 4
- 241000295644 Staphylococcaceae Species 0.000 description 4
- 239000007983 Tris buffer Substances 0.000 description 4
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 239000007864 aqueous solution Substances 0.000 description 4
- 125000003118 aryl group Chemical group 0.000 description 4
- 239000002800 charge carrier Substances 0.000 description 4
- ZOOGRGPOEVQQDX-KHLHZJAASA-N cyclic guanosine monophosphate Chemical compound C([C@H]1O2)O[P@](O)(=O)O[C@@H]1[C@H](O)[C@H]2N1C(N=C(NC2=O)N)=C2N=C1 ZOOGRGPOEVQQDX-KHLHZJAASA-N 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000010561 standard procedure Methods 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 235000019527 sweetened beverage Nutrition 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 229920000858 Cyclodextrin Polymers 0.000 description 3
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 241000701959 Escherichia virus Lambda Species 0.000 description 3
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 3
- 102100029075 Exonuclease 1 Human genes 0.000 description 3
- 108091093094 Glycol nucleic acid Proteins 0.000 description 3
- 102220489310 Melanoma-associated antigen 11_S57P_mutation Human genes 0.000 description 3
- 102220528479 Myelin protein P0_S54P_mutation Human genes 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 102220608764 Sorting nexin-29_Y51L_mutation Human genes 0.000 description 3
- 108091046915 Threose nucleic acid Proteins 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 102220418127 c.164A>G Human genes 0.000 description 3
- 230000006037 cell lysis Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 3
- 239000004175 ponceau 4R Substances 0.000 description 3
- 230000037452 priming Effects 0.000 description 3
- 230000009257 reactivity Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 230000008093 supporting effect Effects 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 2
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- XMIIGOLPHOKFCH-UHFFFAOYSA-N 3-phenylpropionic acid Chemical compound OC(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000283725 Bos Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 102220523563 C-C motif chemokine 2_Y51D_mutation Human genes 0.000 description 2
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- 108020004638 Circular DNA Proteins 0.000 description 2
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 2
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- 241000222722 Leishmania <genus> Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 241000588653 Neisseria Species 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- OZBFLQITCMCIOY-FOUAGVGXSA-N OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO Chemical compound OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO OZBFLQITCMCIOY-FOUAGVGXSA-N 0.000 description 2
- 108091093078 Pyrimidine dimer Proteins 0.000 description 2
- 102220572773 RNA-binding protein FUS_D91Q_mutation Human genes 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 102220501775 Small nuclear ribonucleoprotein-associated proteins B and B'_N55T_mutation Human genes 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 102220600132 Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial_Q42R_mutation Human genes 0.000 description 2
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 2
- 241001313536 Thermothelomyces thermophila Species 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 101710183280 Topoisomerase Proteins 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 108010073429 Type V Secretion Systems Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- BZDVTEPMYMHZCR-JGVFFNPUSA-N [(2s,5r)-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methyl phosphono hydrogen phosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)CC1 BZDVTEPMYMHZCR-JGVFFNPUSA-N 0.000 description 2
- 230000010933 acylation Effects 0.000 description 2
- 238000005917 acylation reaction Methods 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 2
- 150000001299 aldehydes Chemical class 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000000376 autoradiography Methods 0.000 description 2
- 239000002585 base Substances 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 150000003841 chloride salts Chemical class 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 229920001577 copolymer Polymers 0.000 description 2
- 229940097362 cyclodextrins Drugs 0.000 description 2
- 150000001945 cysteines Chemical class 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- DAEAPNUQQAICNR-RRKCRQDMSA-K dADP(3-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP([O-])(=O)OP([O-])([O-])=O)O1 DAEAPNUQQAICNR-RRKCRQDMSA-K 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 2
- CIKGWCTVFSRMJU-KVQBGUIXSA-N dGDP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 CIKGWCTVFSRMJU-KVQBGUIXSA-N 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- QHWZTVCCBMIIKE-SHYZEUOFSA-N dUDP Chemical compound O1[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 QHWZTVCCBMIIKE-SHYZEUOFSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000000111 isothermal titration calorimetry Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 125000003588 lysine group Chemical class [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- SJFKGZZCMREBQH-UHFFFAOYSA-N methyl ethanimidate Chemical compound COC(C)=N SJFKGZZCMREBQH-UHFFFAOYSA-N 0.000 description 2
- 150000004712 monophosphates Chemical class 0.000 description 2
- 230000003606 oligomerizing effect Effects 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 239000000276 potassium ferrocyanide Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 239000013635 pyrimidine dimer Substances 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006722 reduction reaction Methods 0.000 description 2
- 238000005932 reductive alkylation reaction Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 102220278155 rs149010606 Human genes 0.000 description 2
- 102220034241 rs483352780 Human genes 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 239000012279 sodium borohydride Substances 0.000 description 2
- 229910000033 sodium borohydride Inorganic materials 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 230000003335 steric effect Effects 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- XOGGUFAVLNCTRS-UHFFFAOYSA-N tetrapotassium;iron(2+);hexacyanide Chemical compound [K+].[K+].[K+].[K+].[Fe+2].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] XOGGUFAVLNCTRS-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- SEPPVOUBHWNCAW-FNORWQNLSA-N (E)-4-oxonon-2-enal Chemical compound CCCCCC(=O)\C=C\C=O SEPPVOUBHWNCAW-FNORWQNLSA-N 0.000 description 1
- BMQZYMYBQZGEEY-UHFFFAOYSA-M 1-ethyl-3-methylimidazolium chloride Chemical compound [Cl-].CCN1C=C[N+](C)=C1 BMQZYMYBQZGEEY-UHFFFAOYSA-M 0.000 description 1
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- DJQYYYCQOZMCRC-UHFFFAOYSA-N 2-aminopropane-1,3-dithiol Chemical group SCC(N)CS DJQYYYCQOZMCRC-UHFFFAOYSA-N 0.000 description 1
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-FOEKBKJKSA-N 3654-96-4 Chemical compound C[35S]CC[C@H](N)C(O)=O FFEARJCKVFRZRR-FOEKBKJKSA-N 0.000 description 1
- LLBZPESJRQGYMB-UHFFFAOYSA-N 4-one Natural products O1C(C(=O)CC)CC(C)C11C2(C)CCC(C3(C)C(C(C)(CO)C(OC4C(C(O)C(O)C(COC5C(C(O)C(O)CO5)OC5C(C(OC6C(C(O)C(O)C(CO)O6)O)C(O)C(CO)O5)OC5C(C(O)C(O)C(C)O5)O)O4)O)CC3)CC3)=C3C2(C)CC1 LLBZPESJRQGYMB-UHFFFAOYSA-N 0.000 description 1
- NJQONZSFUKNYOY-JXOAFFINSA-N 5-methylcytidine 5'-monophosphate Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 NJQONZSFUKNYOY-JXOAFFINSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 101100031699 Bacillus subtilis (strain 168) bglP gene Proteins 0.000 description 1
- 108010071023 Bacterial Outer Membrane Proteins Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102220484866 C-type lectin domain family 4 member A_W21A_mutation Human genes 0.000 description 1
- 102220548139 Calpain-2 catalytic subunit_D22E_mutation Human genes 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- YTBSYETUWUMLBZ-QWWZWVQMSA-N D-threose Chemical compound OC[C@@H](O)[C@H](O)C=O YTBSYETUWUMLBZ-QWWZWVQMSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 101100133212 Drosophila melanogaster NetB gene Proteins 0.000 description 1
- 102220523789 E3 ubiquitin-protein ligase NEDD4_E57R_mutation Human genes 0.000 description 1
- 238000004435 EPR spectroscopy Methods 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 101000875449 Escherichia phage lambda Exonuclease Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 108010006464 Hemolysin Proteins Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 108010014603 Leukocidins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102220567073 Medium-wave-sensitive opsin 2_K49R_mutation Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 1
- OHLUUHNLEMFGTQ-UHFFFAOYSA-N N-methylacetamide Chemical compound CNC(C)=O OHLUUHNLEMFGTQ-UHFFFAOYSA-N 0.000 description 1
- 241000187654 Nocardia Species 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101710203389 Outer membrane porin F Proteins 0.000 description 1
- 101710203388 Outer membrane porin G Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 241000589540 Pseudomonas fluorescens Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 244000299790 Rheum rhabarbarum Species 0.000 description 1
- 235000009411 Rheum rhabarbarum Nutrition 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- XEFQLINVKFYRCS-UHFFFAOYSA-N Triclosan Chemical compound OC1=CC(Cl)=CC=C1OC1=CC=C(Cl)C=C1Cl XEFQLINVKFYRCS-UHFFFAOYSA-N 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- KPUOHXMVCZBWQC-JXOAFFINSA-N [(2r,3s,4r,5r)-5-[4-amino-5-(hydroxymethyl)-2-oxopyrimidin-1-yl]-3,4-dihydroxyoxolan-2-yl]methyl dihydrogen phosphate Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 KPUOHXMVCZBWQC-JXOAFFINSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- ASJWEHCPLGMOJE-LJMGSBPFSA-N ac1l3rvh Chemical class N1C(=O)NC(=O)[C@@]2(C)[C@@]3(C)C(=O)NC(=O)N[C@H]3[C@H]21 ASJWEHCPLGMOJE-LJMGSBPFSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 229910001514 alkali metal chloride Inorganic materials 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 102220407501 c.290G>T Human genes 0.000 description 1
- VTJUKNSKBAOEHE-UHFFFAOYSA-N calixarene Chemical class COC(=O)COC1=C(CC=2C(=C(CC=3C(=C(C4)C=C(C=3)C(C)(C)C)OCC(=O)OC)C=C(C=2)C(C)(C)C)OCC(=O)OC)C=C(C(C)(C)C)C=C1CC1=C(OCC(=O)OC)C4=CC(C(C)(C)C)=C1 VTJUKNSKBAOEHE-UHFFFAOYSA-N 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001718 carbodiimides Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 150000003983 crown ethers Chemical class 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- OGQYPPBGSLZBEG-UHFFFAOYSA-N dimethyl(dioctadecyl)azanium Chemical compound CCCCCCCCCCCCCCCCCC[N+](C)(C)CCCCCCCCCCCCCCCCCC OGQYPPBGSLZBEG-UHFFFAOYSA-N 0.000 description 1
- 150000002009 diols Chemical group 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 210000003617 erythrocyte membrane Anatomy 0.000 description 1
- 239000004174 erythrosine Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 239000003228 hemolysin Substances 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 229920001600 hydrophobic polymer Polymers 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000002608 ionic liquid Substances 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 150000002678 macrocyclic compounds Chemical class 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 150000002742 methionines Chemical class 0.000 description 1
- 108010077055 methylated bovine serum albumin Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 108010014203 outer membrane phospholipase A Proteins 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 101150056906 recJ gene Proteins 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 1
- 229960001225 rifampicin Drugs 0.000 description 1
- 102220198221 rs1057519921 Human genes 0.000 description 1
- 102200010672 rs137853072 Human genes 0.000 description 1
- 102220036433 rs35389822 Human genes 0.000 description 1
- 102200076325 rs5658 Human genes 0.000 description 1
- 102220056649 rs730881058 Human genes 0.000 description 1
- 102220188881 rs747642461 Human genes 0.000 description 1
- 102220213938 rs768671254 Human genes 0.000 description 1
- 102220158369 rs886047453 Human genes 0.000 description 1
- 239000012146 running buffer Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 101150072534 sbcB gene Proteins 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 238000011218 seed culture Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 150000003573 thiols Chemical group 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 229960003500 triclosan Drugs 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- MQAYPFVXSPHGJM-UHFFFAOYSA-M trimethyl(phenyl)azanium;chloride Chemical compound [Cl-].C[N+](C)(C)C1=CC=CC=C1 MQAYPFVXSPHGJM-UHFFFAOYSA-M 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 101150097442 xthA gene Proteins 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48721—Investigating individual macromolecules, e.g. by translocation through nanopores
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B82—NANOTECHNOLOGY
- B82B—NANOSTRUCTURES FORMED BY MANIPULATION OF INDIVIDUAL ATOMS, MOLECULES, OR LIMITED COLLECTIONS OF ATOMS OR MOLECULES AS DISCRETE UNITS; MANUFACTURE OR TREATMENT THEREOF
- B82B3/00—Manufacture or treatment of nanostructures by manipulation of individual atoms or molecules, or limited collections of atoms or molecules as discrete units
- B82B3/0042—Assembling discrete nanostructures into nanostructural devices
- B82B3/0047—Bonding two or more elements
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2565/00—Nucleic acid analysis characterised by mode or means of detection
- C12Q2565/60—Detection means characterised by use of a special device
- C12Q2565/631—Detection means characterised by use of a special device being a biochannel or pore
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Nanotechnology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Manufacturing & Machinery (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及一种制备异源寡聚孔的新方法。本发明还涉及使用该方法制备的异源寡聚孔和使用该异源寡聚孔进行的多核苷酸表征。
Description
技术领域
本发明涉及一种制备异源寡聚孔的新方法。本发明还涉及使用该方法制备的异源寡聚孔和使用异源寡聚孔进行的多核苷酸表征。
背景技术
目前很多应用中都需要快速廉价的多核苷酸(例如DNA或RNA)测序和鉴定技术。现有技术缓慢且昂贵,这主要是因为它们依靠扩增技术来产生大量的多核苷酸,并且需要大量的专门的荧光化学物质用于信号检测。
跨膜孔(纳米孔)具有作为聚合物和各种小分子的直接电生物传感器的巨大潜力。特别是,最近的焦点是将纳米孔作为潜在的DNA测序技术。
当跨纳米孔施加电势时,当分析物(例如核苷酸)在桶状体中短暂驻留一段时间后,电流发生变化。核苷酸的纳米孔检测给出了已知标记和持续时间的电流变化。在链测序方法中,使单个多核苷酸链穿过孔,得到对核苷酸的鉴别。链测序可以包括使用多核苷酸结合蛋白来控制多核苷酸穿过孔的运动。
Msp的不同形式是来自耻垢分枝杆菌(Mycobacterium smegmatis)的孔蛋白。MspA为来自耻垢分枝杆菌的157kDa八聚体孔蛋白。野生型MspA不以允许DNA被表征或被测序的方式与DNA相互作用。MspA的结构以及其与DNA相互作用及表征DNA所需的修饰已有大量文献记载(Butler,2007,核酸的纳米孔分析,哲学博士论文,华盛顿大学;Gundlach,ProcNatl Acad Sci USA.2010年9月14;107(37):16060-5.Epub 2010年8月26;以及国际申请No.PCT/GB2012/050301(公布号为WO/2012/107778)。负电荷,例如位置90、91和93处的电荷,通常被从孔中除去以使其成为中性。
发明内容
发明人出人意料地证明了,可通过差异表达两种不同的单体在单个细胞中制备包含特定化学计量比的两种不同单体的异源寡聚孔。
因此,本发明提供了一种制备包含特定化学计量比的两种不同单体的异源寡聚孔的方法,包括:(a)在第一可诱导载体中用第一不同单体转染或转化细胞;(b)在第二可诱导载体中用第二不同单体转染或转化细胞;和(c)诱导所述第一和第二可诱导载体,使得所述细胞以特定化学计量比产生包含所述第一和第二不同单体的异源寡聚孔。
本发明还提供了:
-一种使用本发明方法制备的异源寡聚孔;
-一种表征目标多核苷酸的方法,包括:
a)使多核苷酸与本发明的异源寡聚孔接触,使得所述多核苷酸移动通过所述孔;和
b)当多核苷酸相对于所述孔移动时获取一个或多个测量值,其中所述测量值指示所述多核苷酸的一个或多个特征,并从而表征目标多核苷酸;
-一种用于表征目标多核苷酸的试剂盒,包括(a)本发明的异源寡聚孔,和(b)膜的组分;
-一种用于表征样品中目标多核苷酸的设备,包括(a)本发明的多个异源寡聚孔,和(b)多个膜;
-一种表征目标多核苷酸的方法,包括:
a)使多核苷酸与本发明的异源寡聚孔、聚合酶和标记的核苷酸接触,使得通过聚合酶将磷酸盐标记的物质顺序添加到目标多核苷酸,其中磷酸盐物质含有对每个核苷酸特异性的标记;和
b)使用孔检测磷酸盐标记的物质,从而表征多核苷酸;
-一种形成用于表征目标多核苷酸的传感器的方法,包括形成本发明的异源寡聚孔与多核苷酸结合蛋白之间的复合物,并从而形成用于表征所述目标多核苷酸的传感器;和
-用于表征目标多核苷酸的传感器,包括本发明的异源寡聚孔和多核苷酸结合蛋白之间的复合物。
附图说明
图1显示了10%TGX凝胶,带有用考马斯染色而可视化的条带。泳道(Lane)1对应于蛋白质分子量标记。凝胶侧面的数字对应于kDa。泳道2对应于纯化的MspA2。泳道3对应于在85℃下加热后的MspA 2。泳道4对应于在50%DMSO中加热至100℃后的MspA 2。泳道5对应于纯化的MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K)8=MspA 6(均聚纳米孔作为参考)。泳道6对应于在50%DMSO中加热至100℃之后的MspA 6(在这些条件下,寡聚孔可以分解成其组成单体的亚单元)。条带A对应于包含8个单体单元的寡聚MspA同源/异源孔。条带B对应于含有附着的BasTL-H6的MspA 2的单体单元。条带C对应于不含有附着的BasTL-H6的MspA单体单元。
图2显示了7.5%Tris HCl凝胶,其对具有或不具有不同长度的BasTL标签的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(具有以下突变的SEQ IDNO:2:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)的寡聚作用进行了比较。泳道A对应于没有附着于任何单体的标签的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8。泳道B对应于MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K(单体和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL)单体的2∶1混合物。泳道C对应于同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去20aa))8。泳道D对应于MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去20aa))单体的2∶1混合物。泳道E对应于同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去40aa))8。泳道F对应于MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去40aa))单体的2∶1混合物。凝胶带旁边引述的比例对应于标记的单体:未标记的单体的比例。
图3显示了5%Tris HCl凝胶,其比较了将多种不同标签连接到C末端时MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体的寡聚作用。泳道A对应于没有附加到任何单体的标签的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8。泳道B对应于在85℃热处理15分钟的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8。泳道C对应于尝试对同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/D10H6)8(具有以下突变的SEQ ID NO:2:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K,其中在C末端附着有D10H6标签)进行寡聚。泳道D对应于尝试对在85℃热处理15分钟的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/D10H6)8(具有以下突变的SEQ ID NO:2:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K,其中在C末端附着有D10H6标签)进行寡聚。泳道E对应于尝试对同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/R8)8(具有以下突变的SEQ ID NO:2:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K,其中在C末端附着有R8标签)进行寡聚。泳道F对应于尝试对在85℃热处理15分钟的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/R8)8(具有以下突变的SEQID NO:2:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K,其中在C末端附着有R8标签)进行寡聚。泳道G对应于尝试对同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/R8H6)8(具有以下突变的SEQ ID NO:2:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K,其中在C末端附着有R8H6标签)进行寡聚。泳道H对应于尝试对在85℃热处理15分钟的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/R8H6)8(具有以下突变的SEQ ID NO:2:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K,其中在C末端附着有R8H6标签)进行寡聚。白点表示在每个泳道形成的MspA同源寡聚体。
序列表的说明
SEQ ID NO:1示出了编码野生型MspA单体的密码子优化的多核苷酸序列。该突变体缺少信号序列。
SEQ ID NO:2示出了野生型MspA单体的成熟形式的氨基酸序列。该突变体缺少信号序列。
SEQ ID NO:3示出了编码α-溶血素-E111N/K147N(α-HL-NN;Stoddart等人,PNAS,2009;106(19):7702-7707)的一个单体的多核苷酸序列。
SEQ ID NO:4示出了α-HL-NN的一个单体的氨基酸顺序。
SEQ ID NO:5至7示出了MspB、C和D的氨基酸序列。
SEQ ID NO:8示出了编码Phi29 DNA聚合酶的多核苷酸序列。
SEQ ID NO:9示出了Phi29 DNA聚合酶的氨基酸顺序。
SEQ ID NO:10示出了来自大肠杆菌的sbcB基因的密码子优化的多核苷酸序列。它编码来自大肠杆菌的核酸外切酶I(EcoExo I)。
SEQ ID NO:11示出了来自大肠杆菌的核酸外切酶I(EcoExo I)的氨基酸序列。
SEQ ID NO:12示出了来自大肠杆菌的xthA基因的密码子优化的多核苷酸序列。它编码来自大肠杆菌的核酸外切酶III。
SEQ ID NO:13示出了来自大肠杆菌的核酸外切酶III的氨基酸序列。该酶从双链DNA(dsDNA)的一条链以3′-5′方向进行5′单磷酸核苷的分布消化。链上的酶引发需要约4个核苷酸的5′突出端(overhang)。
SEQ ID NO:14示出了来自嗜热栖热菌(T.thermophilus)的recJ基因的密码子优化的多核苷酸序列。它编码来自嗜热栖热菌的RecJ酶(TthRecJ-cd)。
SEQ ID NO:15示出了来自嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。该酶从ssDNA以5′-3′方向进行5′单磷酸核苷的进行性(processive)消化。链上的酶引发需要至少4个核苷酸。
SEQ ID NO:16示出了衍生自细菌噬菌体λexo(redX)基因的密码子优化的多核苷酸序列。它编码细菌噬菌体λ核酸外切酶。
SEQ ID NO:17示出了细菌噬菌体λ核酸外切酶的氨基酸序列。该序列是组装成三聚体的三个相同亚基之一。该酶从dsDNA的一条链以5′-3′方向进行核苷酸的高度进行性消化(http://www.neb.com/nebecomm/products/productM0262.asp)。链上的酶引发优先需要约4个具有5′磷酸的核苷酸的5′突出端。
SEQ ID NO:18示出了Hel308 Mbu的氨基酸序列。
SEQ ID NO:19示出了Hel308 Csy的氨基酸序列。
SEQ ID NO:20示出了Hel308 Tga的氨基酸序列。
SEQ ID NO:21示出了Hel308 Mhu的氨基酸顺序。
SEQ ID NO:22示出了TraI Eco的氨基酸顺序。
SEQ ID NO:23示出了XPD Mbu的氨基酸顺序。
SEQ ID NO:24示出了Dda 1993的氨基酸顺序。
SEQ ID NO:25示出了Trwc Cba的氨基酸顺序。
SEQ ID NO:26示出了BasTL的氨基酸顺序。该序列附着在MspA单体的C末端。
SEQ ID NO:27示出了编码实施例1和2中使用的序列的多核苷酸。
SEQ ID NO:28示出了编码实施例1和2中使用的序列的多核苷酸。
SEQ ID NO:29示出了编码实施例3中使用的多核苷酸。
SEQ ID NO:30示出了编码实施例3中使用的多核苷酸。
SEQ ID NO:31示出了胞溶素(lysenin)单体的氨基酸顺序。
SEQ ID NO:32示出了来自大肠杆菌菌株K-12的亚株MC4100的野生型CsgG单体的成熟形式的氨基酸序列。该单体缺少信号序列。对该CsgG使用的缩写为CsgG=CsgG-Eco。
具体实施方式
应该理解的是,所公开的产品和方法的不同应用可以根据本领域的特定需要进行调节。还应理解,本文使用的术语仅用于描述本发明的具体实施方案,并且不意在限制。
此外,除非内容另有明确规定,否则用于本说明书和所附权利要求书中的单数形式“一”,“一个”,和“所述”包括复数指代。因此,例如,涉及“多核苷酸”时包括两个或更多个多核苷酸,涉及“多核苷酸结合蛋白”时包括两个或更多个该蛋白,涉及“解旋酶”时包括两个或更多个解旋酶,涉及“单体”时包括两个或更多个单体,涉及“孔”时包括两个或更多个孔,等等。
文本无论在上文还是下文中引用的所有出版物、专利和专利申请,以全文引用的方式纳入本文。
本发明的方法
异源寡聚孔
本发明提供一种制备异源寡聚孔的方法。所述异源寡聚孔含有足够的单体以形成孔。所述单体可以是任何类型。所述孔通常包含至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,至少10个单体,至少11个单体,至少12个单体,至少13个单体或至少14个单体,例如3,4,5,6,7,8,9,10,11,12,13或14个单体。所述孔优选包括七个,八个或九个单体。
所述孔是异源寡聚孔,因为它包含两种不同的单体。所述孔可以是异源寡聚孔,因为它包含至少两种不同的单体。所述两种单体可以任何方式不同。基于其氨基酸序列,第二不同单体通常不同于第一不同单体。基于1,2,3,4,5,10,15,20,30,40或更多个氨基酸差异,第二不同单体可与第一不同单体不同。可以用如下所述的标签来修饰第二不同单体。
异源寡聚孔通常衍生自或基于跨膜蛋白孔。异源寡聚孔通常是跨膜蛋白孔的变体。异源寡聚孔通常是跨膜蛋白孔的变体,其中孔中的一个或多个单体已被修饰,使得其不同于其他单体。异源寡聚孔通常包含来自跨膜蛋白孔的单体,例如MspA,MspB,MspC或MspD,其中孔中的一个或多个单体已经被修饰,使得其不同于其他单体。
异源寡聚孔通常不包含两个各自来自两个不同跨膜蛋白孔的不同单体。特别是,异源寡聚孔通常不包含来自MspA的第一单体和来自α-溶血素的第二单体。异源寡聚孔可以包括两个各自来自两个不同Msp孔的不同单体,例如MspA,MspB,MspC和MspD中的两个。
异源寡聚孔可以衍生自或基于任何跨膜蛋白孔。跨膜孔是在一定程度上穿过膜的结构。它允许由施加电位驱动的水合离子流过膜或在膜内流动。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流动到膜的另一侧。然而,跨膜孔不一定要穿过膜。它可以是一端封闭的。例如,孔可以是膜中的可使水合离子沿其流动或流入其中的阱、间隙、通道、沟槽或狭缝。
任何跨膜蛋白孔可用于本发明。跨膜蛋白孔通常是多肽的集合,即寡聚体,其围绕中心轴排列以形成通道。该通道允许水合离子、核苷酸或多核苷酸从膜的一侧流到膜的另一侧。在本发明中,跨膜蛋白孔能够形成允许由施加电位驱动的水合离子从膜的一侧流到另一侧的孔。跨膜蛋白孔优选允许诸如核苷酸或多核苷酸的分析物从膜例如三嵌段共聚物膜的一侧流到另一侧。跨膜蛋白孔通常允许多核苷酸如DNA或RNA移动通过孔。
跨膜蛋白孔是寡聚体。跨膜蛋白孔优选由几个重复的亚基组成,例如至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,至少10个,至少11个单体,至少12个单体,至少13个单体或至少14个单体,如3,4,5,6,7,8,9,10,11,12,13或14个单体。孔优选为三聚体、四聚体、五聚体、六聚体、七聚体、八聚体或九聚体的孔。天然存在的跨膜蛋白孔可以是同源寡聚体或异源寡聚体。
跨膜蛋白孔通常包含离子可以流过的桶状体或通道。孔的亚基通常围绕中心轴并且向跨膜β桶状体或通道或者跨膜α-螺旋束或通道贡献链。
跨膜蛋白孔的桶状体或通道通常包含能促进与分析物,例如核苷酸,多核苷酸或核酸相互作用的氨基酸。这些氨基酸优选位于桶状体或通道的收缩口(constriction)附近。跨膜蛋白孔通常包含一个或多个带正电荷的氨基酸,例如精氨酸、赖氨酸或组氨酸,或芳族氨基酸,例如酪氨酸或色氨酸。这些氨基酸通常能促进孔和核苷酸、多核苷酸或核酸之间的相互作用。
本发明使用的跨膜蛋白孔可以衍生自β-桶状体孔或α-螺旋束孔。β-桶状体孔包括由β链形成的桶状体或通道。合适的β-桶状体孔包括但不限于形成毒素的β-孔,例如α-溶血素、炭疽毒素、NetB、CytK和杀白细胞素以及细菌的外膜蛋白/孔蛋白,例如耻垢分枝杆菌孔蛋白(Msp),例如MspA,MspB,MspC或MspD,来自皮疽诺卡菌(Nocardia farcinica)的NfpAB孔,外膜孔蛋白F(OmpF),外膜孔蛋白G(OmpG),外膜磷脂酶A和奈瑟氏菌属(Neisseria)自体转运脂蛋白(NalP),以及其他孔,如胞溶素,CsgG和FRAC。α-螺旋束孔包括由α-螺旋形成的桶状体或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和α外膜蛋白,例如WZA和ClyA毒素。跨膜孔可以衍生自胞溶素。国际申请号PCT/GB2013/050667(公布号为WO 2013/153359)中公开了合适的衍生自胞质素的孔。跨膜孔可以衍生自CsgG。衍生自CsgG的合适的孔在国际申请号PCT/EP2015/069965中公开。跨膜孔可以衍生自Msp,例如MspA,或衍生自α-溶血素(α-HL)。
异源寡聚孔可以衍生自或基于MspA或其变体,即衍生自七个或更多个单体的跨膜孔,所述单体包含SEQ ID NO:2所示序列或其变体。异源寡聚孔更优选衍生自包含8或9个单体的孔,所述单体包含SEQ ID NO:2所示序列或其变体。第一不同单体优选包含SEQ ID NO:2所示序列或其变体。第二不同单体优选包含SEQ ID NO:2所示序列或其变体。最优选地,第一和第二不同单体包含SEQ ID NO:2所示序列的不同变体。下文更详细地论述SEQ ID NO:2及其变体。
异源寡聚孔也可以衍生自或基于α-溶血素(α-HL)。野生型α-HL孔由七个相同的单体或亚基组成(即,其是七聚体)。α-溶血素-NN的一个单体或亚基的序列示于SEQ ID NO:4中。异源寡聚孔可以衍生自包含七个单体的跨膜蛋白孔,每个所述单体包含SEQ ID NO:4所示序列或其变体。根据本发明制备的异源寡聚孔可以包含两种不同的单体,每个单体包含SEQ ID NO:4所示序列或其变体。第一不同单体优选包含SEQ ID NO:4所示序列或其变体。第二不同单体优选包含SEQ ID NO:4所示的序列或其变体。最优选地,第一和第二不同单体包含SEQ ID NO:4所示序列的不同变体。
SEQ ID NO:4的氨基酸1,7至21,31至34,45至51,63至66,72,92至97,104至111,124至136,149至153,160至164,173至206,210至213,217,218,223至228,236至242,262至265,272至274,287至290和294形成环区域。SEQ ID NO:4的残基113和147构成α-HL的桶状体或通道内的收缩口的一部分。
SEQ ID NO:4的变体是具有下述氨基酸序列的蛋白质:从SEQ ID NO:4的氨基酸序列变化而来并保持其成孔能力。可以使用本领域已知的任何方法测定变体形成孔的能力。例如,可以将该变体与其他合适的亚基一起插入两亲层,例如三嵌段共聚物膜,并且可以确定其寡聚形成孔的能力。将亚基插入两亲层如三嵌段共聚物膜的方法是本领域已知的。
所述变体可以包括用以促进共价连接的修饰。所述变体优选包含一个或多个促进连接到例如其他单体的反应性半胱氨酸残基。例如,所述变体可以包括在SEQ ID NO:4的8,9,17,18,19,44,45,50,51,237,239和287位和/或氨基或羧基末端的一个或多个位置的半胱氨酸。优选的变体包括将SEQ ID NO:4的8,9,17,237,239和287位的残基用半胱氨酸(A8C,T9C,N17C,K237C,S239C或E287C)取代。所述变体优选是国际申请号PCT/GB09/001690(公布号为WO 2010/004273)、PCT/GB09/001679(公布号为WO 2010/004265)或PCT/GB10/000133(公布号为WO 2010/086603)中所述的任意一个变体。
所述变体还可以包括用以促进与核苷酸的任何相互作用的修饰。
所述变体可以是天然存在的变体,其由生物体例如葡萄球菌属(Staphylococcus)细菌天然表达。或者,所述变体可以由细菌如大肠杆菌体外表达或重组表达。变体还包括通过重组技术产生的非天然存在的变体。在SEQ ID NO:4的氨基酸序列的整个长度上,基于氨基酸相似性或同一性,变体将优选与该序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变体多肽可以与SEQ ID NO:4的氨基酸序列在整个序列上至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%并且更优选至少95%,97%或99%同源。在200个或更多个例如230,250,270或280或更多个连续氨基酸的延伸段上,可以具有至少80%,例如至少85%,90%或95%的氨基酸相似性或同一性(“严格同源性(hardhomology)”)。同源性可以如下所述确定。
异源寡聚孔也可以衍生自或基于胞溶素。野生型α-HL孔由至少7个,至少8个,至少9个或至少10个,优选9个相同的单体或亚基形成(即,其是七聚体)。胞溶素的一个单体或亚单的序列示于SEQ ID NO:31中。异源寡聚孔可以衍生自包含至少7个,至少8个,至少9个或至少1个,优选9个单体的跨膜蛋白孔,所述每个单体包含SEQ ID NO:31所示序列或其变体。根据本发明产生的异源寡聚孔可以包含两种不同的单体,每个单体包含SEQ ID NO:31所示序列或其变体。第一不同单体优选包含SEQ ID NO:31所示序列或其变体。第二不同单体优选包含SEQ ID NO:31所示序列或其变体。最优选地,第一和第二不同单体包含SEQ ID NO:31所示序列的不同变体。
所述变体优选包含来自SEQ ID NO:2的约位置44至约位置126的一个或多个修饰,其改变单体与多核苷酸相互作用的能力。这类修饰在国际申请号PCT/GB2013/050667(公布号为WO2013153359)中公开。
单体与多核苷酸相互作用的能力可以使用本领域公知的方法确定。单体可以以任何方式与多核苷酸相互作用,例如,通过非共价相互作用,如疏水相互作用,氢键,范德华力,pi(π)-阳离子相互作用或静电力。例如,该区域结合多核苷酸的能力可以使用常规结合试验测定。合适的试验包括但不限于基于荧光的结合试验、核磁共振(NMR)、等温滴定量热法(ITC)或电子自旋共振(ESR)光谱。或者,包含一个或多个突变体单体的孔与多核苷酸相互作用的能力可以使用上述或下文论述的任何方法来确定。
一个或多个修饰在SEQ ID NO:2的约位置44至约位置126的区域内。一个或多个修饰优选在以下任何一个区域内:从大约位置40到大约位置125,从大约位置50到大约位置120,从大约位置60到大约位置110以及大约位置70到大约位置100。如果进行一个或多个修饰以改善对多核苷酸的捕获,则这些修饰更优选在以下任意一个区域内进行:从大约位置44到大约位置103,从大约位置68到大约位置103,从大约位置84到大约位置103,从大约位置44到大约位置97,从大约位置68到大约位置97,或从大约位置84到大约位置97。如果进行一个或多个修饰以改善对多核苷酸的识别或鉴别,则这些修饰更优选在以下任何一个区域内进行:从大约位置44至大约位置109,从大约位置44至大约位置97或大约位置48至大约位置88。所述区域优选从SEQ ID NO:2的大约位置44至大约位置67。
如果所述一个或多个修饰旨在改善对多核苷酸的识别或鉴别,则优选除了改进多核苷酸捕获的一个或多个修饰之外进行所述修饰。这允许由突变体单体形成的孔有效捕获多核苷酸,然后表征多核苷酸,如估计其序列,如下所述。
对蛋白质纳米孔进行的改变其与多核苷酸相互作用的能力的修饰,特别是提高其捕获和/或识别或鉴别多核苷酸的能力的修饰,在本领域中有大量记载。例如,这样的修饰在WO 2010/034018和WO 2010/055307中公开。根据本发明可以对胞溶素单体进行类似修饰。国际申请号PCT/GB2013/050667(公布号为WO2013153359)公开了优选的修饰。
可以进行任何数量的修饰,例如1,2,5,10,15,20,30或更多个修饰。可以进行任何修饰,只要单体与多核苷酸相互作用的能力发生变化即可。合适的修饰包括但不限于氨基酸取代,氨基酸添加和氨基酸缺失。所述一个或多个修饰优选为一个或多个取代。这将在下面更详细地论述。
所述一个或多个修饰优选(a)改变单体的空间效应,或优选改变区域的空间效应,(b)改变单体的净电荷,或优选改变区域的净电荷,(c)改变单体或优选地区域与多核苷酸氢键键合的能力,(d)引入或除去通过离域电子pi系统进行相互作用的化学基团,和/或(e)改变结构的单体,或者优选地改变区域的结构。所述一个或多个修饰更优选地得到(a)至(e)的任何组合,例如(a)和(b);(a)和(c);(a)和(d);(a)和(e);(b)和(c);(b)和(d);(b)和(e);(c)和(d);(c)和(e);(d)和(e),(a),(b)和(c);(a),(b)和(d);(a),(b)和(e);(a),(c)和(d);(a),(c)和(e);(a),(d)和(e);(b),(c)和(d);(b),(c)和(e);(b),(d)和(e);(c),(d)和(e);(a),(b),(c)和d);(a),(b),(c)和(e);(a),(b),(d)和(e);(a),(c),(d)和(e);(b),(c),(d)和(e);和(a),(b),(c)和(d)。
SEQ ID NO:31的变体是具有下述氨基酸序列的蛋白质:其从SEQ ID NO:31的氨基酸序列变化而来并保持其成孔能力。可以使用本领域已知的和如上所述的任何方法来测定变体形成孔的能力。
在SEQ ID NO:31的氨基酸序列的整个长度上,基于氨基酸相似性或同一性,变体将优选与该序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变体多肽可以与SEQ ID NO:31的氨基酸序列在整个序列上至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%且更优选至少95%,97%或99%同源。在200或更多个例如230,250,270或280个或更多个连续氨基酸的延伸段上,可以具有至少80%,例如至少85%,90%或95%的氨基酸相似性或同一性(“严格同源性”)。同源性可以如下所述确定。
异源寡聚孔也可以衍生自或基于CsgG。野生型CsgG孔由至少7个,至少8个,至少9个或至少10个,优选9个相同的单体或亚基形成(即,其是七聚体)。SEQ ID NO:32中示出了CsgG的一个单体或亚单的序列。异源寡聚孔可以衍生自包含至少7个,至少8个,至少9个或至少10个,优选9个单体的跨膜蛋白孔,每个单体包含SEQ ID NO:32所示序列或其变体。根据本发明产生的异源寡聚孔可以包含两种不同的单体,每个单体包含SEQ ID NO:32所示序列或其变体。第一不同单体优选包含SEQ ID NO:32所示序列或其变体。第二不同单体优选包含SEQ ID NO:32所示序列或其变体。最优选地,第一和第二不同单体包含SEQ ID NO:32所示序列的不同变体。
在本文的所有论述中,对各氨基酸使用标准单字母代码。这些标准单字母代码如下:丙氨酸(A),精氨酸(R),天冬酰胺(N),天冬氨酸(D),半胱氨酸(C),谷氨酸(E),谷氨酰胺(Q),甘氨酸(G),组氨酸(H),异亮氨酸(I),亮氨酸(L),赖氨酸(K),甲硫氨酸(M),苯丙氨酸(F),脯氨酸(P),丝氨酸(S),苏氨酸(T),色氨酸(W),酪氨酸(Y)和缬氨酸(V)。还使用标准替代符号,即Q42R表示42位置的Q被R替代。
SEQ ID NO:32的变体包含以下一个或多个:(i)以下位置的一个或多个突变(即以下一个或多个位置的突变):N40,D43,E44,S54,S57,Q62,R97,E101,E124,E131,R142,T150和R192,例如以下位置的一个或多个突变(即,一个或多个以下位置的突变):N40,D43,E44,S54,S57,Q62,E101,E131和T150或N40,D43,E44,E101和E131;(ii)Y51/N55,Y51/F56,N55/F56或Y51/N55/F56处的突变;(iii)Q42R或Q42K;(iv)K49R;(v)N102R,N102F,N102Y或N102W;(vi)D149N,D149Q或D149R;(vii)E185N,E185Q或E185R;(viii)D195N,D195Q或D195R;(ix)E201N,E201Q或E201R;(x)E203N,E203Q或E203R;和(xi)一个或多个以下位置的缺失:F48,K49,P50,Y51,P52,A53,S54,N55,F56和S57。变体可以包含(i)至(xi)的任何组合。
如果变体包含(i)和(iii)至(xi)中的任一个,则其还可包含Y51,N55和F56中的一个或多个处的突变,例如Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56处的突变。
在(i)中,变体可以包含N40,D43,E44,S54,S57,Q62,R97,E101,E124,E131,R142,T150和R192的任何数目和组合的突变。在(i)中,变体优选包含在以下位置的一个或多个突变(即在一个或多个以下位置的突变):N40,D43,E44,S54,S57,Q62,E101,E131和T150。在(i)中,变体优选包含以下位置的一个或多个突变(即在一个或多个以下位置的突变):N40,D43,E44,E101和E131。在(i)中,变体优选包含在S54和/或S57的突变。在(i)中,变体更优选包含在以下位置的突变:(a)S54和/或S57和(b)Y51,N55和F56中的一个或多个,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56处。如果在(xi)中缺失S54和/或S57,则它/们不能在(i)中突变,反之亦然。在(i)中,变体优选包含在T150的突变,例如在T150I。或者变体优选包含在以下位置的突变:(a)T150和(b)Y51,N55和F56中的一个或多个,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56。在(i)中,变体优选包含在Q62的突变,例如在Q62R或Q62K。或者,变体优选包含在以下位置的突变:(a)Q62和(b)Y51,N55和F56中的一个或多个,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56。变体可包含在D43,E44,Q62或其任何组合例如D43,E44,Q62,D43/E44,D43/Q62,E44/Q62或D43/E44/Q62的突变。或者变体优选包含在以下位置的突变:(a)D43,E44,Q62,D43/E44,D43/Q62,E44/Q62或D43/E44/Q62,和(b)Y51,N55和F56中的一个或多个,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56。
在(ii)中以及本申请的其他地方,/符号表示“和”,因此Y51/N55是Y51和N55。在(ii)中,变体优选包含在Y51/N55的突变。已经提出,CsgG中的收缩口由残基Y51,N55和F56的侧链形成的三个堆叠的同心环组成(Goyal等人,2014,Nature,516,250-253)。因此(ii)中的这些残基的突变可以减少当多核苷酸移动通过孔时对电流有贡献的核苷酸的数目,从而使得更容易识别观察到的电流(当多核苷酸移动通过孔时)和多核苷酸之间的直接关系。Y56可以以下面参考本发明方法中可用的变体和孔而论述的任何方式进行突变。
在(v)中,变体可以包含N102R,N102F,N102Y或N102W。变体优选包含(a)N102R,N102F,N102Y或N102W,和(b)在Y51,N55和F56中的一个或多个处的突变,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56。
在(xi)中,可以缺失K49,P50,Y51,P52,A53,S54,N55,F56和S57中的任何数量和组合。优选地,可以缺失K49,P50,Y51,P52,A53,S54,N55和S57中的一个或多个。如果在(xi)中缺失Y51,N55和F56中的任意一个,则它/它们不能在(ii)中突变,反之亦然。
在(i)中,变体优选包含以下取代中的一个或多个:N40R,N40K,D43N,D43Q,D43R,D43K,E44N,E44Q,E44R,E44K,S54P,S57P,Q62R,Q62K,R97N,R97G,R97L,E101N,E101Q,E101R,E101K,E101F,E101Y,E101W,E124N,E124Q,E124R,E124K,E124F,E124Y,E124W,E131D,R142E,R142N,T1501,R192E和R192N,例如N40R,N40K,D43N,D43Q,D43R,D43K,E44N,E44Q,E44R,E44K,S54P,S57P,Q62R,Q62K,E101N,E101Q,E101R,E101K,E101F,E101Y,E101W,E131D和T150I中的一个或多个,或者N40R,N40K,D43N,D43Q,D43R,D43K,E44N,E44Q,E44R,E44K,E101N,E101Q,E101R,E101K,E101F,E101Y,E101W和E131D中的一个或多个。变体可以包括任何数目和组合的这些取代。在(i)中,变体优选包含S54P和/或S57P。在(i)中,变体优选包含(a)S54P和/或S57P和(b)在Y51,N55和F56中的一个或多个处的突变,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56。Y51,N55和F56中的一个或多个处的突变可以是以下论述的任意个。在(i)中,变体优选包含F56A/S57P或S54P/F56A。变体优选包含T150I。或者变体优选包含在以下位置的突变:(a)T150I和(b)Y51,N55和F56中的一个或多个,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56。
在(i)中,变体优选包含Q62R或Q62K。或者,变体优选包含(a)Q62R或Q62K和(b)在Y51,N55和F56中的一个或多个处的突变,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56。变体可包含D43N,E44N,Q62R或Q62K或其任何组合,例如D43N,E44N,Q62R,Q62K,D43N/E44N,D43N/Q62R,D43N/Q62K,E44N/Q62R,E44N/Q62K,D43N/E44N/Q62R或D43N/E44N/Q62K。或者,变体优选包含(a)D43N,E44N,Q62R,Q62K,D43N/E44N,D43N/Q62R,D43N/Q62K,E44N/Q62R,E44N/Q62K,D43N/E44N/Q62R或D43N/E44N/Q62K,(b)在Y51,N55和F56中的一个或多个处的突变,例如在Y51,N55,F56,Y51/N55,Y51/F56,N55/F56或Y51/N55/F56。
在(i)中,变体优选包含D43N。
在(i)中,变体优选包含E101R,E101S,E101F或E101N。
在(i)中,变体优选包含E124N,E124Q,E124R,E124K,E124F,E124Y,E124W或E124D,例如E124N。
在(i)中,变体优选包含R142E和R142N。
在(i)中,变体优选包含R97N,R97G或R97L。
在(i)中,变体优选包含R192E和R192N。
在(ii)中,变体优选包含F56N/N55Q,F56N/N55R,F56N/N55K,F56N/N55S,F56N/N55G,F56N/N55A,F56N/N55T,F56Q/N55Q,F56Q/N55R,F56Q/N55K,F56Q/N55S,F56Q/N55G,F56Q/N55A,F56Q/N55T,F56R/N55Q,F56R/N55R,F56R/N55K,F56R/N55S,F56R/N55G,F56R/N55A,F56R/N55T,F56S/N55Q,F56S/N55R,F56S/N55K,F56S/N55S,F56S/N55G,F56S/N55A,F56S/N55T,F56G/N55Q,F56G/N55R,F56G/N55K,F56G/N55S,F56G/N55G,F56G/N55A,F56G/N55T,F56A/N55Q,F56A/N55R,F56A/N55K,F56A/N55S,F56A/N55G,F56A/N55A,F56A/N55T,F56K/N55Q,F56K/N55R,F56K/N55K,F56K/N55S,F56K/N55G,F56K/N55A,F56K/N55T,F56N/Y51L,F56N/Y51V,F56N/Y51A,F56N/Y51N,F56N/Y51Q,F56N/Y51S,F56N/Y51G,F56Q/Y51L,F56Q/Y51V,F56Q/Y51A,F56Q/Y51N,F56Q/Y51Q,F56Q/Y51S,F56Q/Y51G,F56R/Y51L,F56R/Y51V,F56R/Y51A,F56R/Y51N,F56R/Y51Q,F56R/Y51S,F56R/Y51G,F56S/Y51L,F56S/Y51V,F56S/Y51A,F56S/Y51N,F56S/Y51Q,F56S/Y51S,F56S/Y51G,F56G/Y51L,F56G/Y51V,F56G/Y51A,F56G/Y51N,F56G/Y51Q,F56G/Y51S,F56G/Y51G,F56A/Y51L,F56A/Y51V,F56A/Y51A,F56A/Y51N,F56A/Y51Q,F56A/Y51S,F56A/Y51G,F56K/Y51L,F56K/Y51V,F56K/Y51A,F56K/Y51N,F56K/Y51Q,F56K/Y51S,F56K/Y51G,N55Q/Y51L,N55Q/Y51V,N55Q/Y51A,N55Q/Y51N,N55Q/Y51Q,N55Q/Y51S,N55Q/Y51G,N55R/Y51L,N55R/Y51V,N55R/Y51A,N55R/Y51N,N55R/Y51Q,N55R/Y51S,N55R/Y51G,N55K/Y51L,N55K/Y51V,N55K/Y51A,N55K/Y51N,N55K/Y51Q,N55K/Y51S,N55K/Y51G,N55S/Y51L,N55S/Y51V,N55S/Y51A,N55S/Y51N,N55S/Y51Q,N55S/Y51S,N55S/Y51G,N55G/Y51L,N55G/Y51V,N55G/Y51A,N55G/Y51N,N55G/Y51Q,N55G/Y51S,N55G/Y51G,N55A/Y51L,N55A/Y51V,N55A/Y51A,N55A/Y51N,N55A/Y51Q,N55A/Y51S,N55A/Y51G,N55T/Y51L,N55T/Y51V,N55T/Y51A,N55T/Y51N,N55T/Y51Q,N55T/Y51S,N55T/Y51G,F56N/N55Q/Y51L,F56N/N55Q/Y51V,F56N/N55Q/Y51A,F56N/N55Q/Y51N,F56N/N55Q/Y51Q,F56N/N55Q/Y51S,F56N/N55Q/Y51G,F56N/N55R/Y51L,F56N/N55R/Y51V,F56N/N55R/Y51A,F56N/N55R/Y51N,F56N/N55R/Y51Q,F56N/N55R/Y51S,F56N/N55R/Y51G,F56N/N55K/Y51L,F56N/N55K/Y51V,F56N/N55K/Y51A,F56N/N55K/Y51N,F56N/N55K/Y51Q,F56N/N55K/Y51S,F56N/N55K/Y51G,F56N/N55S/Y51L,F56N/N55S/Y51V,F56N/N55S/Y51A,F56N/N55S/Y51N,F56N/N55S/Y51Q,F56N/N55S/Y51S,F56N/N55S/Y51G,F56N/N55G/Y51L,F56N/N55G/Y51V,F56N/N55G/Y51A,F56N/N55G/Y51N,F56N/N55G/Y51Q,F56N/N55G/Y51S,F56N/N55G/Y51G,F56N/N55A/Y51L,F56N/N55A/Y51V,F56N/N55A/Y51A,F56N/N55A/Y51N,F56N/N55A/Y51Q,F56N/N55A/Y51S,F56N/N55A/Y51G,F56N/N55T/Y51L,F56N/N55T/Y51V,F56N/N55T/Y51A,F56N/N55T/Y51N,F56N/N55T/Y51Q,F56N/N55T/Y51S,F56N/N55T/Y51G,F56Q/N55Q/Y51L,F56Q/N55Q/Y51V,F56Q/N55Q/Y51A,F56Q/N55Q/Y51N,F56Q/N55Q/Y51Q,F56Q/N55Q/Y51S,F56Q/N55Q/Y51G,F56Q/N55R/Y51L,F56Q/N55R/Y51V,F56Q/N55R/Y51A,F56Q/N55R/Y51N,F56Q/N55R/Y51Q,F56Q/N55R/Y51S,F56Q/N55R/Y51G,F56Q/N55K/Y51L,F56Q/N55K/Y51V,F56Q/N55K/Y51A,F56Q/N55K/Y51N,F56Q/N55K/Y51Q,F56Q/N55K/Y51S,F56Q/N55K/Y51G,F56Q/N55S/Y51L,F56Q/N55S/Y51V,F56Q/N55S/Y51A,F56Q/N55S/Y51N,F56Q/N55S/Y51Q,F56Q/N55S/Y51S,F56Q/N55S/Y51G,F56Q/N55G/Y51L,F56Q/N55G/Y51V,F56Q/N55G/Y51A,F56Q/N55G/Y51N,F56Q/N55G/Y51Q,F56Q/N55G/Y51S,F56Q/N55G/Y51G,F56Q/N55A/Y51L,F56Q/N55A/Y51V,F56Q/N55A/Y51A,F56Q/N55A/Y51N,F56Q/N55A/Y51Q,F56Q/N55A/Y51S,F56Q/N55A/Y51G,F56Q/N55T/Y51L,F56Q/N55T/Y51V,F56Q/N55T/Y51A,F56Q/N55T/Y51N,F56Q/N55T/Y51Q,F56Q/N55T/Y51S,F56Q/N55T/Y51G,F56R/N55Q/Y51L,F56R/N55Q/Y51V,F56R/N55Q/Y51A,F56R/N55Q/Y51N,F56R/N55Q/Y51Q,F56R/N55Q/Y51S,F56R/N55Q/Y51G,F56R/N55R/Y51L,F56R/N55R/Y51V,F56R/N55R/Y51A,F56R/N55R/Y51N,F56R/N55R/Y51Q,F56R/N55R/Y51S,F56R/N55R/Y51G,F56R/N55K/Y51L,F56R/N55K/Y51V,F56R/N55K/Y51A,F56R/N55K/Y51N,F56R/N55K/Y51Q,F56R/N55K/Y51S,F56R/N55K/Y51G,F56R/N55S/Y51L,F56R/N55S/Y51V,F56R/N55S/Y51A,F56R/N55S/Y51N,F56R/N55S/Y51Q,F56R/N55S/Y51S,F56R/N55S/Y51G,F56R/N55G/Y51L,F56R/N55G/Y51V,F56R/N55G/Y51A,F56R/N55G/Y51N,F56R/N55G/Y51Q,F56R/N55G/Y51S,F56R/N55G/Y51G,F56R/N55A/Y51L,F56R/N55A/Y51V,F56R/N55A/Y51A,F56R/N55A/Y51N,F56R/N55A/Y51Q,F56R/N55A/Y51S,F56R/N55A/Y51G,F56R/N55T/Y51L,F56R/N55T/Y51V,F56R/N55T/Y51A,F56R/N55T/Y51N,F56R/N55T/Y51Q,F56R/N55T/Y51S,F56R/N55T/Y51G,F56S/N55Q/Y51L,F56S/N55Q/Y51V,F56S/N55Q/Y51A,F56S/N55Q/Y51N,F56S/N55Q/Y51Q,F56S/N55Q/Y51S,F56S/N55Q/Y51G,F56S/N55R/Y51L,F56S/N55R/Y51V,F56S/N55R/Y51A,F56S/N55R/Y51N,F56S/N55R/Y51Q,F56S/N55R/Y51S,F56S/N55R/Y51G,F56S/N55K/Y51L,F56S/N55K/Y51V,F56S/N55K/Y51A,F56S/N55K/Y51N,F56S/N55K/Y51Q,F56S/N55K/Y51S,F56S/N55K/Y51G,F56S/N55S/Y51L,F56S/N55S/Y51V,F56S/N55S/Y51A,F56S/N55S/Y51N,F56S/N55S/Y51Q,F56S/N55S/Y51S,F56S/N55S/Y51G,F56S/N55G/Y51L,F56S/N55G/Y51V,F56S/N55G/Y51A,F56S/N55G/Y51N,F56S/N55G/Y51Q,F56S/N55G/Y51S,F56S/N55G/Y51G,F56S/N55A/Y51L,F56S/N55A/Y51V,F56S/N55A/Y51A,F56S/N55A/Y51N,F56S/N55A/Y51Q,F56S/N55A/Y51S,F56S/N55A/Y51G,F56S/N55T/Y51L,F56S/N55T/Y51V,F56S/N55T/Y51A,F56S/N55T/Y51N,F56S/N55T/Y51Q,F56S/N55T/Y51S,F56S/N55T/Y51G,F56G/N55Q/Y51L,F56G/N55Q/Y51V,F56G/N55Q/Y51A,F56G/N55Q/Y51N,F56G/N55Q/Y51Q,F56G/N55Q/Y51S,F56G/N55Q/Y51G,F56G/N55R/Y51L,F56G/N55R/Y51V,F56G/N55R/Y51A,F56G/N55R/Y51N,F56G/N55R/Y51Q,F56G/N55R/Y51S,F56G/N55R/Y51G,F56G/N55K/Y51L,F56G/N55K/Y51V,F56G/N55K/Y51A,F56G/N55K/Y51N,F56G/N55K/Y51Q,F56G/N55K/Y51S,F56G/N55K/Y51G,F56G/N55S/Y51L,F56G/N55S/Y51V,F56G/N55S/Y51A,F56G/N55S/Y51N,F56G/N55S/Y51Q,F56G/N55S/Y51S,F56G/N55S/Y51G,F56G/N55G/Y51L,F56G/N55G/Y51V,F56G/N55G/Y51A,F56G/N55G/Y51N,F56G/N55G/Y51Q,F56G/N55G/Y51S,F56G/N55G/Y51G,F56G/N55A/Y51L,F56G/N55A/Y51V,F56G/N55A/Y51A,F56G/N55A/Y51N,F56G/N55A/Y51Q,F56G/N55A/Y51S,F56G/N55A/Y51G,F56G/N55T/Y51L,F56G/N55T/Y51V,F56G/N55T/Y51A,F56G/N55T/Y51N,F56G/N55T/Y51Q,F56G/N55T/Y51S,F56G/N55T/Y51G,F56A/N55Q/Y51L,F56A/N55Q/Y51V,F56A/N55Q/Y51A,F56A/N55Q/Y51N,F56A/N55Q/Y51Q,F56A/N55Q/Y51S,F56A/N55Q/Y51G,F56A/N55R/Y51L,F56A/N55R/Y51V,F56A/N55R/Y51A,F56A/N55R/Y51N,F56A/N55R/Y51Q,F56A/N55R/Y51S,F56A/N55R/Y51G,F56A/N55K/Y51L,F56A/N55K/Y51V,F56A/N55K/Y51A,F56A/N55K/Y51N,F56A/N55K/Y51Q,F56A/N55K/Y51S,F56A/N55K/Y51G,F56A/N55S/Y51L,F56A/N55S/Y51V,F56A/N55S/Y51A,F56A/N55S/Y51N,F56A/N55S/Y51Q,F56A/N55S/Y51S,F56A/N55S/Y51G,F56A/N55G/Y51L,F56A/N55G/Y51V,F56A/N55G/Y51A,F56A/N55G/Y51N,F56A/N55G/Y51Q,F56A/N55G/Y51S,F56A/N55G/Y51G,F56A/N55A/Y51L,F56A/N55A/Y51V,F56A/N55A/Y51A,F56A/N55A/Y51N,F56A/N55A/Y51Q,F56A/N55A/Y51S,F56A/N55A/Y51G,F56A/N55T/Y51L,F56A/N55T/Y51V,F56A/N55T/Y51A,F56A/N55T/Y51N,F56A/N55T/Y51Q,F56A/N55T/Y51S,F56A/N55T/Y51G,F56K/N55Q/Y51L,F56K/N55Q/Y51V,F56K/N55Q/Y51A,F56K/N55Q/Y51N,F56K/N55Q/Y51Q,F56K/N55Q/Y51S,F56K/N55Q/Y51G,F56K/N55R/Y51L,F56K/N55R/Y51V,F56K/N55R/Y51A,F56K/N55R/Y51N,F56K/N55R/Y51Q,F56K/N55R/Y51S,F56K/N55R/Y51G,F56K/N55K/Y51L,F56K/N55K/Y51V,F56K/N55K/Y51A,F56K/N55K/Y51N,F56K/N55K/Y51Q,F56K/N55K/Y51S,F56K/N55K/Y51G,F56K/N55S/Y51L,F56K/N55S/Y51V,F56K/N55S/Y51A,F56K/N55S/Y51N,F56K/N55S/Y51Q,F56K/N55S/Y51S,F56K/N55S/Y51G,F56K/N55G/Y51L,F56K/N55G/Y51V,F56K/N55G/Y51A,F56K/N55G/Y51N,F56K/N55G/Y51Q,F56K/N55G/Y51S,F56K/N55G/Y51G,F56K/N55A/Y51L,F56K/N55A/Y51V,F56K/N55A/Y51A,F56K/N55A/Y51N,F56K/N55A/Y51Q,F56K/N55A/Y51S,F56K/N55A/Y51G,F56K/N55T/Y51L,F56K/N55T/Y51V,F56K/N55T/Y51A,F56K/N55T/Y51N,F56K/N55T/Y51Q,F56K/N55T/Y51S,F56K/N55T/Y51G,F56E/N55R,F56E/N55K,F56D/N55R,F56D/N55K,F56R/N55E,F56R/N55D,F56K/N55E或F56K/N55D。
在(ii)中,变体优选包含Y51R/F56Q,Y51N/F56N,Y51M/F56Q,Y51L/F56Q,Y51I/F56Q,Y51V/F56Q,Y51A/F56Q,Y51P/F56Q,Y51G/F56Q,Y51C/F56Q,Y51Q/F56Q,Y51N/F56Q,Y51S/F56Q,Y51E/F56Q,Y51D/F56Q,Y51K/F56Q或Y51H/F56Q。
在(ii)中,变体优选包含Y51T/F56Q,Y51Q/F56Q或Y51A/F56Q。
在(ii)中,变体优选包含Y51T/F56F,Y51T/F56M,Y51T/F56L,Y51T/F56I,Y51T/F56V,Y51T/F56A,Y51T/F56P,Y51T/F56G,Y51T/F56C,Y51T/F56Q,Y51T/F56N,Y51T/F56T,Y51T/F56S,Y51T/F56E,Y51T/F56D,Y51T/F56K,Y51T/F56H或Y51T/F56R。
在(ii)中,变体优选包含Y51T/N55Q,Y51T/N55S或Y51T/N55A。
在(ii)中,变体优选包含Y51A/F56F,Y51A/F56L,Y51A/F56I,Y51A/F56V,Y51A/F56A,Y51A/F56P,Y51A/F56G,Y51A/F56C,Y51A/F56Q,Y51A/F56N,Y51A/F56T,Y51A/F56S,Y51A/F56E,Y51A/F56D,Y51A/F56K,Y51A/F56H或Y51A/F56R。
在(ii)中,变体优选包含Y51C/F56A,Y51E/F56A,Y51D/F56A,Y51K/F56A,Y51H/F56A,Y51Q/F56A,Y51N/F56A,Y51S/F56A,Y51P/F56A或Y51V/F56A。
在(xi)中,变体优选包含Y51/P52,Y51/P52/A53,P50至P52,P50至A53,K49至Y51,K49至A53的缺失,和用单个脯氨酸(P),K49至S54的替换,和用单个P,Y51至A53,Y51至S54,N55/F56,N55至S57,N55/F56的替换,和用单个P,N55/F56的替换,和用单个甘氨酸(G),N55/F56的替换,和用单个丙氨酸(A),N55/F56的替换,和用单个P及Y51N,N55/F56的替换,和用单个P及Y51Q,N55/F56的替换,和用单个P及Y51S,N55/F56的替换,和用单个G及Y51N,N55/F56的替换,和用单个G及Y51Q,N55/F56的替换,和用单个G及Y51S,N55/F56的替换,和用单个A及Y51N,N55/F56的替换,和用单个A/Y51Q或N55/F56的替换,和用单个A及Y51S的替换。
SEQ ID NO:32的优选变体在国际申请No.PCT/EP2015/069965中公开。
SEQ ID NO:32的变体是具有以下氨基酸序列的蛋白质:其从SEQ ID NO:32的氨基酸序列变化而来并保持其成孔能力。可以使用本领域已知的和如上所述的任何方法来测定变体形成孔的能力。
在SEQ ID NO:32的氨基酸序列的整个长度上,基于氨基酸相似性或同一性,变体将优选与该序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变体多肽可以与SEQ ID NO:32的氨基酸序列在整个序列上至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%且更优选至少95%,97%或99%同源。在200或更多个,例如230,250,270或280或更多个连续氨基酸的延伸段上,可以具有至少80%,例如至少85%,90%或95%的氨基酸相似性或同一性(“严格同源性”)。同源性可以如下所述确定。
除了上述论述的那些外,可以对SEQ ID NO:4,31或32的氨基酸序列进行氨基酸取代,例如多达1,2,3,4,5,10,20或30个取代。可以如上所述进行保守取代。
SEQ ID NO:4,31或32的氨基酸序列的一个或多个氨基酸残基可另外从上述多肽中缺失。可以缺失多达1,2,3,4,5,10,20或30个残基,或更多。
变体可以是SEQ ID NO:4,31或32的片段。这样的片段保持成孔活性。片段长度可以至少为50,100,200或250个氨基酸。片段优选包含SEQ ID NO:4,31或32的成孔结构域。片段通常包括SEQ ID NO:4的残基119,121,135,113和139。
替代地或另外地,将一个或多个氨基酸添加到上述多肽。可以在SEQ ID NO:4,31或32的氨基酸序列的氨基末端或羧基末端或其变体或片段处提供延伸。延伸可能相当短,例如1至10个氨基酸长度。或者,延伸可以更长,例如多达50或100个氨基酸。载体蛋白可以与孔或变体融合。
如上所述,SEQ ID NO:4,31或32的变体是具有下述氨基酸序列的亚基:其从SEQID NO:4,31或32的氨基酸序列变化而来并保留其形成孔的能力。变体通常包含SEQ ID NO:4,31或32的负责孔形成的区域。含有β-桶状体的α-HL的孔形成能力由每个亚基中的β链提供。SEQ ID NO:4的变体通常包含形成β链的SEQ ID NO:4中的区域。上文论述了形成β链的SEQ ID NO:4的氨基酸。可以对形成β链的SEQ ID NO:4的区域进行一个或多个修饰,只要所得变体保持其形成孔的能力即可。可以对SEQ ID NO:4的β链区域如上所述进行具体修饰。
SEQ ID NO:4,31或32的变体优选包括在其α-螺旋和/或环区域内的一个或多个修饰,例如取代、添加或缺失。形成α-螺旋和环的氨基酸在上文已论述。
可以修饰SEQ ID NO:4,31或32的变体以影响其寡聚作用和/或有助于其鉴定或纯化,如下所述。
在一些实施方案中,异源寡聚孔被化学修饰。孔可以以任何方式在任何位置进行化学修饰。下面论述了适当的修饰。这类修饰可以应用于本发明中产生的任何孔。
构建体
本发明的异源寡聚孔可以包括含有两个或更多个共价连接的单体的构建体。第一不同单体可以构成包含两个或更多个基因融合单体的第一不同构建体的一部分。第二不同单体可以构成包含两个或更多个基因融合单体的第二不同构建体的一部分。第一和第二不同构建体可以以上文和下文论述的任何方式彼此不同。
第一不同构建体和第二不同构建体保留了形成孔的能力。这可以如上所述来确定。每个构建体可以包含至少2个,至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个或至少10个单体。每个构建体优选包含两个单体。两个或更多个单体可以相同或不同。
构建体中的单体优选大致相同的长度或相同的长度。构建体中单体的桶状体优选大致相同的长度或相同的长度。长度可以以氨基酸数量和/或长度单位来测量。构建体中的单体优选具有相同数目的氨基酸从桶状体中缺失,例如从MspA(SEQ ID NO:2)中的位置72至82和/或位置111至121。如下所述,一个或多个不同的构建体可以连接到标签或其BasTL序列或片段,这使得它比孔中的其他构建体更长。
构建体中的单体是基因融合的。如果整个构建体从单个多核苷酸序列表达,则单体是基因融合的。单体的编码序列可以以任何方式组合以形成编码该构建体的单个多核苷酸序列。
单体可以以任何构造基因融合。单体可以通过其末端氨基酸融合。例如,一个单体的氨基末端可以与另一个单体的羧基末端融合。构建体中的第二个和随后的单体(沿氨基至羧基方向)的氨基末端(各自与前一单体的羧基末端融合)可以包含一个甲硫氨酸。例如,如果M是单体(不含氨基末端甲硫氨酸),并且mM是具有氨基末端甲硫氨酸的单体,则构建体可以包含序列mM-mM,mM-mM-mM或mM-mM-mM-mM。这些甲硫氨酸的存在通常来源于在编码整个构建体的多核苷酸内编码单体的多核苷酸的5′端的起始密码子(即ATG)的表达。构建体中的第二个和随后的单体(在氨基至羧基方向)可缺少甲硫氨酸(例如,mM-M,mM-M-M或mM-M-M-M)。
两个或更多个单体可以直接基因融合在一起。单体优选使用连接体进行基因融合。连接体可以设计成限制单体的移动。优选的连接体是氨基酸序列(即肽连接体)。可以使用以下论述的任何肽连接体。
孔含有足够的用以形成孔的构建体和(如有必要)单体。例如,八聚体孔可以包含(a)四个构建体,每个构建体包含两个单体,(b)两个构建体,每个构建体包含四个单体,或(b)一个包含两个单体的构建体,和六个不构成构建体一部分的单体。例如,九聚体孔可以包含(a)四个各自包含两个单体的构建体,和一个不构成构建体一部分的单体,(b)两个各自包含四个单体的构建体,和一个不构成构建体一部分的单体,或(b)一个包含两个单体的构建体和七个不构成构建体一部分的单体。本领域技术人员可以设想构建体和单体的其他组合。
本发明的孔通常包含(a)一个包含两个单体的构建体,和(b)5,6,7或8个单体。构建体可以是上面论述的那些中的任何构建体。
另一个典型的孔包含多于一个的本发明构建体,例如两个,三个或四个本发明构建体。如果需要,这些孔还包含足够的用以形成孔的额外单体或构建体。所述额外单体可以是上面论述的那些中的任何单体。
本发明的另一个孔仅包括含有2单体的构建体,例如,孔可以包括4,5,6,7或8个含有2单体的构建体。
一个或多个构建体可以如上所述化学修饰。在下面的所有论述中,涉及第一不同单体和/或第二不同单体,特别是特定化学计量比的实施方案同样适用于第一不同构建体和/或第二不同构建体。术语单体和构建体在以下所有论述中可互换使用。
特定化学计量比
通过本发明方法制备的异源寡聚孔包含具有特定化学计量比的两种不同单体。特定化学计量比通常是预先确定的。它也可以称为所需的化学计量比。
所述特定化学计量比是异源寡聚孔中第一不同单体与第二不同单体的比例。如果异源寡聚孔包含3个单体,则第一不同单体与第二不同单体的特定化学计量比可以是1∶2或2∶1。如果异源寡聚孔包括4个单体,则第一不同单体与第二不同单体的特定化学计量比可以是1∶3,2∶2或3∶1。如果异源寡聚孔包含5个单体,则第一不同单体与第二不同单体的特定化学计量比可以是1∶4,2∶3,3∶2或4∶1。如果异源寡聚孔包含6个单体,则第一不同单体与第二不同单体的特定化学计量比可以是1∶5,2∶4,3∶3,4∶2或5∶1。如果异源寡聚孔包含7个单体,则第一不同单体与第二不同单体的特定化学计量比可以是1∶6,2∶5,3∶4,4∶3,5∶2或6∶1。如果异源寡聚孔包含8个单体,则第一不同单体与第二不同单体的特定化学计量比可以是1∶7,2∶6,3∶5,4∶4,5∶3,6∶2或7∶1。如果异源寡聚孔包含9个单体,则第一不同单体与第二不同单体的特定化学计量比可以是1∶8,2∶7,3∶6,4∶5,5∶4,6∶3,7∶2或8∶1。如果异源寡聚孔包含10个单体,则第一不同单体与第二不同单体的特定化学计量比可以是1∶9,2∶8,3∶7,4∶6,5∶5,6∶4,7∶3,8∶2或9∶1。
第一不同单体与第二不同单体的特定化学计量比至少为5∶1,例如至少6∶1,至少7∶1,至少8∶1或至少9∶1。第一不同单体与第二不同单体的特定化学计量比最优选为6∶1或7∶1。
本发明的方法制备包含特定化学计量比的两种不同单体的异源寡聚孔。这意味着在细胞中产生的大部分孔包含特定化学计量比的两种不同单体。例如,细胞产生的异源寡聚孔的至少55%包含特定化学计量比的两种不同单体。至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少97%,至少98%或至少99%的由细胞产生的异源寡聚孔包含特定化学计量比的两种不同单体。在一些情况下,细胞产生的全部异源寡聚孔,即100%的异源寡聚孔,包含特定化学计量比的两种不同单体。可以使用本领域中的方法来测量包含特定化学计量比的两种不同单体的细胞产生的异源寡聚孔的%。例如,如果所述不同单体之一如下所述进行标记,则包含不同比率的不同单体的异源寡聚孔将具有不同的大小。可以使用凝胶电泳鉴定和定量不同大小的异源寡聚孔。
载体
本发明的方法包括用两个不同的单体转染或转化细胞。转染或转化包括将多核苷酸(例如核酸)引入细胞中。转染或转化通常涉及非病毒性方法。
在第一可诱导载体或第一可诱导表达载体中用第一不同单体转染或转化细胞。也可以在第二可诱导载体或第二可诱导表达载体中,用第二不同单体转染或转化细胞。该方法可以包括用第一和第二可诱导载体或可诱导表达载体以任何顺序转染或转化细胞。该方法可以包括在第二可诱导载体或第二可诱导表达载体之前用第一可诱导载体或第一可诱导表达载体转染或转化细胞。该方法可以包括在第一可诱导载体或第一诱导表达载体之前用第二可诱导载体或第二可诱导表达载体转染或转化细胞。该方法可以包括同时用第一和第二可诱导载体或第一和第二可诱导表达载体转染或转化细胞。在诱导第一和第二可诱导载体使得细胞产生包含特定化学计量比的第一和第二不同单体的异源寡聚孔之前,用第一和第二可诱导载体或第一和第二可诱导表达载体转染或转化细胞。
通常在第一可诱导载体或第一可诱导表达载体中用编码第一不同单体的多核苷酸序列转染或转化细胞。还通常在第二可诱导载体或第二可诱导表达载体中用编码第二不同单体的多核苷酸序列转染或转化细胞。
编码单体的多核苷酸序列可以使用本领域的标准方法得到和复制。编码野生型孔的染色体DNA可以从产生生物体如金黄色葡萄球菌(Staphyloccoccus aureus)、耻垢分枝杆菌或大肠杆菌的孔中提取。可以使用包括特异性引物的PCR扩增编码孔亚基的基因。然后可以对扩增的序列进行定点诱变(site-directed mutagenesis)。合适的定点诱变的方法是本领域已知的,并且包括例如组合链反应。多核苷酸可以使用众所周知的技术制备,例如Sambrook,J.and Russell,D.(2001).Molecular Cloning:A Laboratory Manual,3rdEdition.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY中记载的方法。它们也可以商购获得。
然后将得到的多核苷酸序列并入重组可复制载体如克隆载体中。载体可用于在相容的宿主细胞中复制多核苷酸。因此,多核苷酸序列可以通过将多核苷酸引入可复制载体中,将该载体引入相容的宿主细胞中,然后在引起载体复制的条件下使宿主细胞生长,来制备。载体可以从宿主细胞中回收。用于克隆多核苷酸的合适的宿主细胞是本领域已知的并且在下文中更详细地描述。
多核苷酸序列可以克隆到合适的表达载体中。在表达载体中,多核苷酸序列通常可操作地连接到能够通过宿主细胞提供编码序列的表达的控制序列。这样的表达载体可用于表达单体。编码第一不同单体的多核苷酸序列优选可操作地连接到第一可诱导载体或第一可诱导表达载体中的第一可诱导控制序列,例如第一可诱导启动子。编码第二不同单体的多核苷酸序列优选可操作地连接到第二可诱导载体或第二可诱导表达载体中的第二可诱导控制序列,例如第二可诱导启动子。
术语“可操作地连接”是指并置(juxtaposition),其中,所描述的组分具有允许它们以其预期方式起作用的关系。“可操作地连接”到编码序列的控制序列以这样的方式连接:在与控制序列相容的条件下实现编码序列的表达。可以将相同或不同的多核苷酸序列的多个拷贝引入载体中。
第一可诱导载体和第二可诱导载体通常是可诱导的,因为它们各自包含可诱导启动子。第一可诱导载体通常包含第一可诱导启动子,第二可诱导载体通常包含第二可诱导启动子。第一和/或第二可诱导启动子可以是阿拉伯糖启动子,丙酸酯启动子,鼠李糖可诱导启动子,木糖启动子或乳糖启动子。编码第一不同单体的多核苷酸序列优选可操作地连接到阿拉伯糖启动子,丙酸酯启动子,鼠李糖可诱导启动子,木糖启动子或乳糖启动子。编码第二不同单体的多核苷酸序列优选可操作地连接到阿拉伯糖启动子,丙酸酯启动子,鼠李糖可诱导启动子,木糖启动子或乳糖启动子。
第一可诱导载体和第二可诱导载体中的启动子优选是不同的。第一可诱导载体优选包含鼠李糖可诱导启动子,第二可诱导载体包含乳糖启动子。编码第一不同单体的多核苷酸序列优选可操作地连接到鼠李糖可诱导启动子,并且编码第二不同单体的多核苷酸序列优选可操作地连接到乳糖启动子。第一可诱导载体或第一可诱导启动子优选由鼠李糖诱导。第二可诱导载体或第二可诱导启动子优选由异丙基β-D-硫代半乳糖吡喃糖苷(IPTG)诱导。
第一和第二可诱导载体优选进行差异诱导。差异诱导在下面更详细地论述。
第一可诱导载体和/或第二可诱导载体可以是例如质粒,病毒或噬菌体载体。第一可诱导载体和/或第二可诱导载体可以包括复制起点。
第一可诱导载体和/或第二可诱导载体可以含有一个或多个选择标记基因,例如四环素抗性基因,三氯生抗性基因,氨苄青霉素抗性基因或卡那霉素抗性基因。第一可诱导载体优选包括第一选择标记,第二可诱导载体优选包括第二选择标记。第一和第二选择标记优选彼此不同。如果选择标记不同,则可以直接确认细胞已被两个载体转染或转化。第一选择标记优选为对卡那霉素提供抗性的基因。第二选择标记优选为对氨苄青霉素提供抗性的基因。
根据本发明转染或转化的细胞可以称为宿主细胞。该方法可以包括在将要转染或转化细胞的条件下使细胞与第一和第二可诱导载体接触。合适的条件是本领域已知的(参见,例如,Sambrook,J.and Russell,D.见上文)。
细胞通常以高水平表达第一和/或第二不同单体。通常将细胞选择为与用于转染或转化该细胞的表达载体相容。用于本发明的合适的细胞包括原核细胞和真核细胞。原核细胞优选为细菌细胞。合适的细菌细胞包括但不限于,大肠杆菌,棒状杆菌和荧光假单胞菌。任何具有DE3溶原体的大肠杆菌细胞,例如C41(DE3),BL21(DE3),JM109(DE3),B834(DE3),TUNER,Origami和Origami B都可以表达包含T7启动子的载体。
合适的真核细胞包括但不限于,酿酒酵母(Saccharomyces cerevisiae),巴斯德毕赤酵母(Pichia pastoris),丝状真菌如曲霉属(Aspergillus),木霉属(Trichoderma)和嗜热毁丝霉C1(Myceliophthora thermophila C1),杆状病毒感染的昆虫细胞如Sf9,Sf21和高五株(High Five strain),非裂解性昆虫细胞,利什曼原虫(Leishmania)细胞,植物细胞,如烟草植物细胞,和哺乳动物细胞,如原牛(Bos primigenius)细胞(Bovine),小家鼠(Mus musculus)细胞(Mouse),中国仓鼠卵巢(CHO)细胞,人胚胎肾(HEK)细胞,幼仓鼠肾(BHK)细胞和HeLa细胞。其他优选的哺乳动物细胞包括但不限于PC12,HEK293,HEK293A,HEK293T,CHO,BHK-21,HeLa,ARPE-19,RAW264.7和COS细胞。
宿主细胞优选为大肠杆菌。
重组表达的第一和第二不同单体通常在细胞膜中自组装成异源寡聚孔。在步骤(c)中,第一和第二单体优选在细胞中以特定化学计量比表达,并且异源寡聚孔在细胞膜中形成。
差异诱导
该方法优选包括差异诱导第一和第二可诱导载体。这通常包括以不同的方式诱导第一和第二可诱导载体。例如,可以通过鼠李糖诱导第一可诱导载体,并且可以通过异丙基β-D-硫代半乳糖吡喃糖苷(IPTG)诱导第二可诱导载体。技术人员可以进行控制实验以确定差异诱导对异源寡聚孔中第一和第二不同单体的化学计量比的影响。
该方法优选包括以不同的程度诱导第一和第二可诱导载体。这通常包括以不同的程度诱导第一和第二可诱导载体。通常使用不同浓度的诱导化学物质或分子,将第一和第二可诱导载体诱导到不同程度。本领域技术人员可以进行控制实验以确定将载体进行不同程度的诱导对异源寡聚孔中第一和第二不同单体化学计量比的影响。
第一和第二可诱导载体可以差异诱导到不同的程度。
表达比例
使用本发明制备的异源孔可以包括具有特定化学计量比的第一和第二不同单体,因为细胞以特定比例表达第一和第二不同单体。在步骤(c)中,第一和第二不同单体优选由细胞以下述比例表达:允许形成包含特定化学计量比的第一和第二不同单体的异源寡聚孔。然而,第一和第二不同单体不需要以特定化学计量比表达。表达第一和第二不同单体的所述比例可以允许形成不同的异源寡聚孔,所述异源寡聚孔包含具有特定化学计量比的第一和第二不同单体的不同比例。例如,如果异源寡聚孔包含8个单体,并且第一不同单体与第二不同单体的特定化学计量比为7∶1,则所述不同的单体可以下述比例表达:允许形成含有6∶2,7∶1和8∶0比例的第一和第二不同单体的异源寡聚孔。具有特定化学计量比的异源寡聚孔可以按下面更详细的论述进行纯化。
第一不同单体与第二不同单体的表达比例可以使用例如SDS-PAGE,蛋白印迹法(白印迹法)或质谱法等常规方法测量。可以如上所述,通过差异诱导第一和第二可诱导载体和/或诱导它们到不同程度来影响表达比例。
第一和第二不同单体的表达比例也可通过修饰其中一者或两者而被影响。优选对第一和第二不同单体中的至少一个,例如这两者,进行修饰,以影响其表达——与其在不存在修饰时的表达相比。与不存在修饰时的表达相比,可以修饰第一不同单体以增加或减少其表达。与不存在修饰时的表达相比,可以修饰第二不同单体以增加或减少其表达。修饰或缺乏修饰的优选组合示于下表1中。
第一不同单体 | 第二不同单体 |
增加其表达的修饰 | 无修饰 |
无修饰 | 增加其表达的修饰 |
减少其表达的修饰 | 无修饰 |
无修饰 | 减少其表达的修饰 |
增加其表达的修饰 | 减少其表达的修饰 |
减少其表达的修饰 | 增加其表达的修饰 |
增加其表达的修饰 | 增加其表达的修饰 |
减少其表达的修饰 | 减少其表达的修饰 |
表1
可以对第一不同单体和/或第二不同单体的表达进行任何程度的影响。例如,第一不同单体和/或第二不同单体的表达可以增加或减少至少5%,例如至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少100%,至少150%,至少200%,少300%,至少400%,至少500%。可以使用例如SDS-PAGE,蛋白印迹法,UV280浓度测量或质谱法等常规方法确定单体的表达水平。影响单体表达的修饰能力可以通过在相同细胞中相同条件下将修饰单体的表达与未修饰单体的表达进行比较来确定。
将两个单体的表达增加或减少到不同程度可以有助于确保单体以近似特定化学计量比表达。
技术人员将能够设计影响单体表达的修饰。修饰优选是将肽、多肽或蛋白质序列与单体进行基因融合,使得肽、多肽或蛋白质序列用单体表达。如果单体和肽、多肽或蛋白质序列从单个多核苷酸序列表达,则将它们进行基因融合。下文将参照标签更详细地论述减少单体表达的优选方法。
影响寡聚作用的修饰
使用本发明制备的异源孔可以包括具有特定化学计量比的第一和第二不同单体,因为第一和第二不同单体中的一个或两个被修饰以影响其寡聚能力。优选修饰第一和第二不同单体中的至少一个,例如两个,以影响其与自身或与其他不同单体寡聚的能力。可以修饰第一不同单体以增加或减少其与第二不同单体寡聚的能力。可以修饰第二不同单体以增加或减少其与第一不同单体寡聚的能力。增加单体寡聚的能力将增加其在使用所述方法产生的异源寡聚孔中的发生率(incidence),并因此可以影响特定化学计量比。相反,减少单体寡聚的能力将降低其在使用所述方法产生的异源寡聚孔中的发生率。
在下表2中示出了修饰或缺乏修饰的优选组合。
第一不同单体 | 第二不同单体 |
增加其寡聚能力的修饰 | 无修饰 |
无修饰 | 增加其寡聚能力的修饰 |
减少其寡聚能力的修饰 | 无修饰 |
无修饰 | 减少其寡聚能力的修饰 |
增加其寡聚能力的修饰 | 减少其寡聚能力的修饰 |
减少其寡聚能力的修饰 | 增加其寡聚能力的修饰 |
增加其寡聚能力的修饰 | 增加其寡聚能力的修饰 |
减少其寡聚能力的修饰 | 减少其寡聚能力的修饰 |
表2
可以对第一不同单体和/或第二不同单体与其他单体寡聚的能力进行任何程度的影响。例如,第一不同单体和/或第二不同单体与其他单体寡聚的能力可以增加或减少至少5%,例如至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少100%,至少150%,至少200%,至少300%,至少400%,至少500%。可以使用例如SDS-PAGE,蛋白印迹法,UV280浓度测量,尺寸排色谱法或质谱法等常规方法确定单体寡聚的能力。影响单体寡聚的修饰能力可以通过在相同条件下将修饰单体和未修饰单体与相同单体的寡聚作用进行比较来确定。
增加或减少两个单体寡聚的能力至不同程度有助于确保异源寡聚孔包含特定化学计量比的两种不同单体。
技术人员将能够设计影响单体寡聚能力的修饰。修饰优选是将肽、多肽或蛋白质序列基因融合至单体,使得肽、多肽或蛋白质序列用单体表达。基因融合如上所述。基因融合可以在单体的氨基(N)和/或羧基(C)末端。降低单体寡聚能力的优选方法将在下面参照标签更详细地论述。修饰优选是单体的截短(truncation)。截短可以在单体的氨基(N)和/或羧基(C)末端。修饰优选是负责寡聚的单体的氨基酸/区域的一个或多个突变。
负责寡聚的葡萄球菌α-溶血素的氨基酸和区域是本领域已知的。Walker andBayley,Journal of Biological Chemistry,第270卷,第39期,9月29日发行,第23065-23071页,1995公开了通过半胱氨酸扫描诱变靶向化学修饰(scanning mutagenesisandtargeted chemical modification)鉴定的葡萄球菌α-溶血素的膜结合、寡聚和孔形成活性的关键残基。Panchal和Bayley,Journal of Biological Chemistry,第270卷,第39期,9月29日发行,第23072-23076页,1995公开了通过反向诱变揭示的葡萄球菌α-溶血素中的残基之间的相互作用。Cheley等人,Protein Engineering等10卷第12期,第1433-1443页,1997公开了通过去除形成跨膜β-桶状体的残基进行构象约束的葡萄球菌α-溶血素的自发寡聚。Jayasinghe等人,The Journal Of Biological Chemistry第281卷第4期第2195-2204页2006年1月27日公开了葡萄球菌α-溶血素的氨基封闭物(amino latch)在孔形成中的作用,并揭示了n末端和位置217之间的协作相互作用。
标签
标签还可以用于允许第一和第二不同单体以特定化学计量比在细胞中表达和/或影响单体寡聚的能力。标签优选为肽或多肽。一个或多个肽或多肽标签可以基因融合到第一和/或第二不同单体。如果单体和标签(一个或多个)从单个多核苷酸序列表达,则它们进行基因融合。一个或多个标签的存在可以增加或降低不同单体被表达的能力。一个或多个标签的存在可以增加或降低不同单体与其自身或异源寡聚孔中的其他单体寡聚的能力。
第二不同单体优选基因融合到肽或多肽标签,这与不存在标签时该单体的表达相比降低了该单体与其自身寡聚的能力或降低了该单体的表达。肽或多肽标签优选在第二不同单体的羧基(C)末端基因融合,并降低其与自身寡聚的能力。第二不同单体在存在和不存在标签时寡聚的能力可以如上文所述测量。
肽或多肽标签优选在第二不同单体的氨基(N)末端基因融合,并且与不存在标签时该单体的表达相比减少了该单体的表达。在存在和不存在标签的情况下,可以如上文所述测量第二不同单体的表达。
肽或多肽标签可以是任何长度。肽的长度优选为1,2,3,4或5个氨基酸。多肽的长度优选大于5个氨基酸,例如长度为8,10,12,20,30,40,50或100个氨基酸或更多。肽或多肽可以包含任何天然存在或非天然存在的氨基酸。
标签优选包含两个或更多个连续的精氨酸(R)残基或天冬氨酸(D)残基。标签更优选包含(a)1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19或20个连续的精氨酸(R)残基或天冬氨酸(D)残基和/或(b)1,2,3,4,5,6,7,,8,9,10,11,12,13,14,15,16,17,18,19或20个连续组氨酸(H)残基。标签最优选包含(a)4,6,8或10个连续的精氨酸(R)残基或天冬氨酸(D)残基和/或(b)6或9个连续的组氨酸(H)残基。
标签优选还包含丝氨酸-甘氨酸(SG),天冬酰胺-甘氨酸-天冬氨酸-丝氨酸(NGDS)或甘氨酸-天冬氨酸-丝氨酸-甘氨酸(GDSG)。
优选的标签包括但不限于R8SG,D6SG,R6SG,R8,NGDSD6SG,D4SG,R4SG,D4,D6,GDSGD4SG,R4H6,D4H6,D8,R6,D10,R4,D4,D8H6,R8H9,D10H6,R6H6和D6。
第二不同单体优选具有在其氨基(N)末端基因融合的以下标签之一:R8SG,D6SG,R6SG,R8,NGDSD6SG,D4SG,R4SG,D4,D6和GDSGD4SG。第二不同单体优选具有在其羧基(C)末端基因融合的以下标签之一:R4H6,D4H6,D8,R6,D10,R4,D4,D8H6,R8,R8H9,D10H6,R6H6和D6。第二不同单体优选具有在其羧基(C)末端基因融合的下标签之一:D4H6,D8,D10,D4,D8H6,R8,R8H9,D10H6,R6H6和D6。
本发明的方法优选还包括(d)使用标签纯化包含特定化学计量比的两种不同单体的异源寡聚孔。例如,可以使用连续的组氨酸(H)残基(hist标签)纯化特定化学计量比的两种不同单体。例如,如果异源寡聚孔包含8个单体,则第一不同单体与第二不同单体的特定化学计量比为7∶1,并且第二不同单体基因融合到his标签,his标签可以用于纯化含有比例为7∶1的第一和第二不同单体的孔。含有8∶0比例的第一和第二不同单体的孔——如果使用his标签——和his标签的洗脱浓度可以设计成,使得不同单体不以6∶2的比例纯化。
第二不同单体优选基因融合到BasTL序列(SEQ ID NO:26)或其片段。与不存在BasTL序列(SEQ ID NO:26)或其片段相比,这可能增加或降低第二不同单体与其自身寡聚的能力。该片段可以是任何长度,例如40个或更多,50个或更多,60个或更多,70个或更多,80个或更多或90个或更多的氨基酸长度。该片段优选包含在BasTL序列(SEQ ID NO:26)中的连续氨基酸。该片段优选通过从羧基(C)末端缺失20个氨基酸或40个氨基酸形成。BasTL序列或其片段优选在第二不同单体的羧基(C)末端进行基因融合。BasTL序列或其片段优选在第二不同单体的羧基(C)末端进行基因融合,并且将如上定义的标签与第二不同单体分离。例如,第第二不同单体从N到C可以具有以下结构:单体-SEQ ID NO:26-H6。
异源寡聚孔
本发明提供了使用本发明方法制备的异源寡聚孔。上述任何实施方案都适用于本发明的孔。
所述孔具有改善的多核苷酸读取性质,即显示改善的多核苷酸捕获和核苷酸鉴别。特别是,本发明的孔比野生型更容易捕获核苷酸和多核苷酸。此外,本发明的孔显示出增加的电流范围,这使得更容易区分不同的核苷酸,并显示出减少的状态变化,这增加了信噪比。此外,当多核苷酸移动通过从突变体构建的孔时,对电流作出贡献的核苷酸数量减少。这使得更容易鉴定多核苷酸移动通过孔时观察到的电流和多核苷酸序列之间的直接关系。本发明的孔还可以显示出改善的多核苷酸运动,如下面更详细论述的。
本发明的孔也可以在一系列条件下区分不同核苷酸。特别地,所述孔在有利于核酸表征(如测序)的条件下区分各核苷酸。本发明的孔可区分不同核苷酸的程度可通过改变施加的电位、盐浓度、缓冲液、温度和添加剂如脲、甜菜碱和DTT的存在,进行控制。这允许对孔的功能进行微调,特别是在测序时。这将在下面更详细地论述。本发明的孔也可用于从与一个或多个单体的相互作用而不是在核苷酸上通过核苷酸碱基来识别多核苷酸聚合物。
一般来说,异源寡聚孔相比于同源寡聚孔的主要优点是相对于(或不同于)其他单体改变、修改孔的一个或多个单体或使孔的一个或多个单体突变的能力。所述一个或多个单体的任何部分可以发生改变或突变,例如所述一个或多个单体的能形成与多核苷酸相互作用的孔的一部分的部分,或所述一个或多个单体的能形成孔的顶部并与多核苷酸结合蛋白相互作用的部分。通过使孔非对称地(即,在一个或多个单体中不同地)突变,从孔获得的电流信号的范围、形状和水平,以及信噪比,可以不能通过突变所有单体来实现的方式发生改变。
本发明的孔可以被分离、基本被分离、纯化或基本被纯化。如果本发明的孔完全不含任何其他组分,例如脂质或其他孔,则本发明的孔被分离或纯化。如果孔中混有不会干扰其预期用途的载体或稀释剂,则孔基本被分离。例如,如果孔以含有小于10%,小于5%,小于2%或小于1%的其他组分(如三嵌段共聚物、脂质或其他孔)的形式存在,则孔基本被分离或基本被纯化。或者,本发明的孔可以存在于膜中。下面论述合适的膜。
本发明的孔可以单独的孔或单个孔存在。或者,本发明的孔可以存在于两个或更多个孔的同源或异源群体中。
本发明的孔是异源寡聚孔。异源寡聚孔含有足够的用以形成孔的单体。所述单体可以是任何类型。孔通常包含至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,至少10个单体,至少11个单体,至少12个单体,至少13个单体或至少14个单体,如3,4,5,6,7,8,9,10,11,12,13或14个单体。孔优选包括七个、八个或九个单体。
如果孔中至少一个单体与其余单体不同,则孔是异质寡聚孔。所述至少一个单体可以以任何方式不同。所述至少一个单体通常在其氨基酸序列的基础上不同于其他单体。所述至少一个单体可以在1,2,3,4,5,10,15,20或更多个氨基酸差异的基础上不同于其余单体。两个、三个或四个单体可与孔中其余单体相同或不同。孔中的所有单体可彼此不同。优选地,只有一个单体与孔中的其余单体不同,即其余单体是相同的。
异源寡聚孔优选衍生自Msp,并且包括具有净负电荷的收缩部分(narrowing)。这种孔在与本申请共同申请的英国申请1502809.5中公开。优选地,只有一个单体不同于孔中的其余单体,并且只有一个单体在其形成收缩部分的区域中一个或多个带负电荷的氨基酸的基础上与其余单体不同。
所述收缩部分具有净负电荷。所述收缩部分通常是孔通道中最窄的部分。孔的收缩部分通常不是帽区域或桶状体区域的一部分。收缩部分的内径(即,通过收缩部分的通道的直径)通常为约25埃或更小,例如约或更小,约或更小,约或更小,约或更小,约或更小或约或更小。
收缩部分有净负电荷。收缩部分在生理pH值下具有净负电荷。当pH在2至12,2.5至11,3至10范围内时,更优选在4至9,5至8.5的范围内时或甚至更优选在6至8或6.5至7.5范围内时,收缩部分通常具有净负电荷。
收缩部分的净电荷可以使用本领域已知的方法测量。例如,收缩部分的净电荷可以使用常规方法在特定pH下计算。
收缩部分通常包含一个或多个带负电荷的氨基酸。收缩部分可以包含任何数量的带负电荷的氨基酸,例如1,2,3,4,5,6,7,8,9,10,11,12或更多个带负电荷的氨基酸。收缩部分优选包含一个、两个、三个或四个带负电荷的氨基酸。带负电荷的氨基酸是具有净负电荷的氨基酸。带负电荷的氨基酸包括但不限于天冬氨酸(D)和谷氨酸(E)。本领域技术人员还可以构思其他带负电荷的氨基酸。例如,半胱氨酸(C)可以用带负电荷的分子修饰。
如果收缩部分含有多于一个的带负电荷的氨基酸,例如两个、三个或四个带负电荷的氨基酸,则它们优选地在不同的单体中,即不全部在相同的单体中。例如,如果有两个带负电荷的氨基酸,则每个氨基酸可以在不同的单体中。如果有三个带负电荷的氨基酸,则它们可以在两个或三个不同的单体中。如果收缩部分含有多于一个的带负电荷的氨基酸,例如两个、三个或四个带负电荷的氨基酸,则它们可以在相同的单体中。
收缩部分中的其余氨基酸优选不带电。不带电的氨基酸通常是不带电荷的、非极性的和/或芳香族的氨基酸。不带电荷的氨基酸、非极性氨基酸和/或芳族氨基酸可以是天然存在的或非天然存在的。它们可以是合成的或修饰的。不带电荷的氨基酸没有净电荷。合适的不带电的氨基酸包括但不限于半胱氨酸(C),丝氨酸(S),苏氨酸(T),甲硫氨酸(M),天冬酰胺(N)和谷氨酰胺(Q)。非极性氨基酸具有非极性侧链。合适的非极性氨基酸包括但不限于甘氨酸(G),丙氨酸(A),脯氨酸(P),异亮氨酸(I),亮氨酸(L)和缬氨酸(V)。芳香族氨基酸具有芳香族侧链。合适的芳香族氨基酸包括但不限于组氨酸(H),苯丙氨酸(F),色氨酸(W)和酪氨酸(Y)。除了一个或多个带负电荷的氨基酸之外,收缩部分中可以存在任何数目和组合的这些氨基酸。
如果收缩部分包含一个或多个带正电荷的氨基酸,则收缩部分中优选带正电荷的氨基酸比带负电荷的氨基酸更少。收缩部分优选不包含任何带正电荷的氨基酸。带正电荷的氨基酸包括但不限于组氨酸(H)、赖氨酸(K)和精氨酸(R)。
孔中的各单体优选具有大致相同的长度或相同的长度。孔中各单体的桶状体优选具有大致相同的长度或相同的长度。长度可以以氨基酸数量和/或长度单位来测量。桶状体缺失在下面更详细地论述。孔中各单体优选具有从SEQ ID NO:2的位置72至82和/或位置111至121缺失的相同数量的氨基酸。如上所述,可以连接一个或多个单体到标签或BasTL序列或其片段,这使得它比孔中的其他单体长。
在上述所有实施方案中,突变体单体的一个或多个,例如2,3,4,5,6,7,8,9或10个可以如下所述化学修饰。
孔优选包含八个单体,每个单体包含SEQ ID NO:2所示序列或其变体。SEQ ID NO:2是野生型MspA单体。孔优选包含两个不同单体,每个单体包含SEQ ID NO:2所示序列或其变体,其中第一不同单体与第二不同单体的特定化学计量比为7∶1或8∶1,最优选7∶1。
SEQ ID NO:2的变体是具有下述氨基酸序列的多肽:从SEQ ID NO:2的氨基酸序列变化而来并保留其形成孔的能力。所述变体或每个变体可以仅包含与SEQ ID NO:2比较的氨基酸取代,或可以包含氨基酸缺失。变体将在下面更详细地论述。
异源寡聚孔可以包含任何数量的含SEQ ID NO:2的单体,例如含SEQ ID NO:2的1,2,3或4个单体。孔可以包含任何数量的含SEQ ID NO:2的变体的单体,例如含SEQ ID NO:2的变体的1,2,3,4,5,6,7或8个单体。孔中的所有单体优选包含SEQ ID NO:2的变体,即孔中的全部单体与SEQ ID NO:2中所示野生型序列相比已经以某种方式被修饰。合适的修饰在下文论述。
孔可以包括七个第一不同单体和一个第二不同单体,每个第一不同单体包括含有D90N、D91N和D93N的SEQ ID NO:2的变体,所述第二不同单体包括SEQ ID NO:2。
SEQ ID NO:2中的氨基酸83至111对包括含有SEQ ID NO:2的单体的孔的收缩部分有贡献。本发明孔中的收缩部分优选包含每个单体中对应于SEQ ID NO:2的位置83至111的氨基酸。包含SEQ ID NO:2的变体的单体中的氨基酸对应于SEQ ID NO:2中与它们对齐的位置。可以使用任何对齐方法,包括以下论述的任何方法。如果仅对SEQ ID NO:2进行氨基酸取代以产生变体,则变体中与SEQ ID NO:2中位置83至111相对应的氨基酸将编号为83至111,即变体中的位置90对应在SEQ ID NO:2中的位置90。如果缺失SEQ ID NO:2的部分以产生变体,或将氨基酸添加到SEQ ID NO:2以形成变体,则变体中对应于SEQ ID NO:2的位置83至111的氨基酸将不被编号为83至111。举例说明,SEQ ID NO:2的位置71至111(即SEQ IDNO:3)如下所示。SEQ ID NO:2的变体的相应部分——其仅通过缺失位置72和73(来自桶状体)和取代D91N和D93N(粗体)而与SEQ ID NO:2不同——示于SEQ ID NO:4中。
...PWSLGVGINFSYTTPNILIDDGDITAPPFGLNSVITPNLFPGVSISADLGN...(SEQ ID NO:3)
变体中的位置D90,N91和N93(SEQ ID NO:4中下划线部分)分别对应于SEQ ID NO:2中的位置D88,D89和D91(因为SEQ ID NO:2中的氨基酸72和73被从变体中删除)。基于此,技术人员可以确定变体中哪些氨基酸与SEQ ID NO:2中的位置83至111相对应。
收缩部分更优选包含每个单体中对应于SEQ ID NO:2的位置88,90,91,92,93,102,103和105的氨基酸。如果单体或每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则收缩部分优选包含变体中位置88,90,91,92,93,102,103和105处的氨基酸。
收缩部分更优选包含每个单体中对应于SEQ ID NO:2的位置90,91,93和105的氨基酸。如果单体或每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则收缩部分更优选包含变体中位置90,91,93和105处的氨基酸。
第二不同单体优选通过在与SEQ ID NO:2的位置88,90,91,92,93,102,103和105对应的一个或多个位置处包含带负电荷的氨基酸而与第一不同单体不同。带负电荷的氨基酸可以存在于对应于SEQ ID NO:2的位置88,90,91,92,93,102,103和105的任何数目和组合的位置处。优选的组合在下面更详细地论述。带负电荷的氨基酸如上所述。如果孔中的每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则第二不同单体优选通过在位置88,90,91,92,93,102,103和105中的一个或多个处包含带负电荷的氨基酸而与第一不同单体不同。
第二不同单体优选通过在对应于SEQ ID NO:2的位置90,91,93和105的一个或多个位置处包含带负电荷的氨基酸而与第一不同单体不同。带负电荷氨基酸可以在对应于SEQ ID NO:2的位置90,91,93和105的任何数目和组合位置处存在,即(i)90;(ii)91;(iii)93;(iv)105;(v)90和91;(vi)90和93;(vii)90和105;(viii)91和93;(ix)91和105;(x)93和105;(xi)90,91和93;(xii)90,91和105;(xiii)90,93和105;(xiv)91,93和105;或(xv)90,91,93和105。
第二不同单体优选通过在对应于SEQ ID NO:2的以下位置的位置处包含带负电荷的氨基酸而与第一不同单体不同:(x)90;(xi)91;(xii)93;(xiii)90和91;(xiv)90和93;(xv)91和93;(xvi)105;(xvii)90和105;或(xviii)90,91和105。带负电荷的氨基酸如上文所述。如果孔中的每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则第二不同单体优选通过在位置90,91,93和105中的一个或多个位置处包含带负电荷的氨基酸而与第一不同单体不同。所述一个或多个单体可以通过在上述(i)至(xv)或(x)至(xviii)中论述的位置90,91,93和105的任何组合处包含带负电荷的氨基酸而不同。
优选地,第二不同单体通过在其收缩部分形成区域中包含一个或多个带负电荷的氨基酸,例如1,2,3或4个带负电荷的氨基酸而与第一不同单体不同。例如,第二不同单体优选通过在对应于SEQ ID NO:2的位置90,91,93和105的一个或多个位置处包含带负电荷的氨基酸而与第一不同单体不同。第二不同单体可以包含与上述(i)至(xv)或(xv)至(xviii)中论述的SEQ ID NO:2的位置90,91,93和105相对应的任何数目和组合的位置处包含带负电荷的氨基酸。
在上述任何实施方案中,第一不同单体优选在与SEQ ID NO:2的位置90和/或91对应的位置处包含不带电的氨基酸。第一不同单体优选在与SEQ ID NO:2的位置90,91和/或93对应的位置处包含不带电的氨基酸。如果孔中的每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则第一不同单体优选在位置90和/或91或位置90,91和/或93处包含不带电的氨基酸。可以存在任何不带电荷且上文论述的氨基酸。氨基酸优选为天冬酰胺(N)或谷氨酰胺(Q)。
本发明的优选的孔是这样的孔:其中,
(a)第二不同单体在与SEQ ID NO:2的位置90对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90对应的位置处包含天冬酰胺(N);
(b)第二不同单体在与SEQ ID NO:2的位置91对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置91对应的位置处包含天冬酰胺(N);
(c)第二不同单体在与SEQ ID NO:2的位置90和91对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90和91对应的位置处包含天冬酰胺(N);
(d)第二不同单体在与SEQ ID NO:2的位置90对应的位置处包含谷氨酸(E),第一不同单体在与SEQ ID NO:2的位置90对应的位置处包含天冬酰胺(N);
(e)第二不同单体在与SEQ ID NO:2的位置91对应的位置处包含谷氨酸(E),第一不同单体在与SEQ ID NO:2的位置91对应的位置处包含天冬酰胺(N);
(f)第二不同单体在与SEQ ID NO:2的位置90和91对应的位置处包含谷氨酸(E),第一不同单体在与SEQ ID NO:2的位置90和91对应的位置处包含天冬酰胺(N);
(g)第二不同单体在与SEQ ID NO:2的位置90对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90对应的位置处包含谷氨酰胺(Q);
(h)第二不同单体在与SEQ ID NO:2的位置91对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置91对应的位置处包含谷氨酰胺(Q);
(i)第二不同单体在与SEQ ID NO:2的位置90和91对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90和91对应的位置处包含谷氨酰胺(Q);
(j)第二不同单体在与SEQ ID NO:2的位置90对应的位置处包含谷氨酸(E),第一不同单体在与SEQ ID NO:2的位置90对应的位置处包含谷氨酰胺(Q);
(k)第二不同单体在与SEQ ID NO:2的位置91对应的位置处包含谷氨酸(E),第一不同单体在与SEQ ID NO:2的位置91对应的位置处包含谷氨酰胺(Q);
(l)第二不同单体在与SEQ ID NO:2的位置90和91对应的位置处包含谷氨酸(E),第一不同单体在与SEQ ID NO:2的位置90和91对应的位置处包含谷氨酰胺(Q);
(m)第二不同单体在与SEQ ID NO:2的位置88对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置88对应的位置处包含天冬酰胺(N);
(n)第二不同单体在与SEQ ID NO:2的位置88对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置88对应的位置处包含谷氨酰胺(Q);
(o)第二不同单体在与SEQ ID NO:2的位置103对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置103对应的位置处包含丝氨酸(S);
(p)第二不同单体在与SEQ ID NO:2的位置105对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置105对应的位置处包含异亮氨酸(I);
(q)第二不同单体在与SEQ ID NO:2的位置88和90对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置88和90对应的位置处包含天冬酰胺(N);
(r)第二不同单体在与SEQ ID NO:2的位置88和90对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置88和90对应的位置处包含谷氨酰胺(Q);
(s)第二不同单体在与SEQ ID NO:2的位置90和103对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90和103对应的位置处分别包含天冬酰胺(N)和丝氨酸(S);
(t)第二不同单体在与SEQ ID NO:2的位置90和103对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90和103对应的位置处分别包含谷氨酰胺(Q)和丝氨酸(S);
(u)第二不同单体在与SEQ ID NO:2的位置90和105对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90和105对应的位置处分别包含天冬酰胺(N)和异亮氨酸(I);
(v)第二不同单体在与SEQ ID NO:2的位置90和105对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90和105对应的位置处分别包含谷氨酰胺(Q)和异亮氨酸(I);
(w)第二不同单体在与SEQ ID NO:2的位置90和93对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90和93对应的位置处包含天冬酰胺(N);
(x)第二不同单体在与SEQ ID NO:2的位置90和93对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置90和93对应的位置处包含谷氨酰胺(Q);
(v)第二不同单体在与SEQ ID NO:2的位置91和93对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置91和93对应的位置处包含天冬酰胺(N);
(z)第二不同单体在与SEQ ID NO:2的位置91和93对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置91和93对应的位置处包含谷氨酰胺(Q);
(aa)第二不同单体在与SEQ ID NO:2的位置93对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置93对应的位置处包含天冬酰胺(N);
(ab)第二不同单体在与SEQ ID NO:2的位置93对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置93对应的位置处包含谷氨酰胺(Q);
(ac)第二不同单体在与SEQ ID NO:2的位置90对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置93对应的位置处包含天冬氨酸(D);
(ad)第二不同单体在与SEQ ID NO:2的位置90和93对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置93对应的位置处包含天冬氨酸(D);
(ae)第二不同单体在与SEQ ID NO:2的位置91和93对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置93对应的位置处包含天冬氨酸(D);
(af)第二不同单体在与SEQ ID NO:2的位置90对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置93对应的位置处包含天冬氨酸(D);
(ag)第二不同单体在与SEQ ID NO:2的位置88和105对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置88和105对应的位置处包含天冬酰胺(N)和异亮氨酸(I);或
(ah)第二不同单体在与SEQ ID NO:2的位置88和105对应的位置处包含天冬氨酸(D),第一不同单体在与SEQ ID NO:2的位置88和105对应的位置处分别包含谷氨酰胺(Q)和异亮氨酸(I)。
在上述(a)至(ah)的任一项中,如果孔中的每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则与SEQ ID NO:2中的位置相对应的位置具有与SEQ ID NO:2中的位置相同的数目。例如,如果(a)中,孔中的每个单体包含其中仅进行氨基酸取代的SEQ IDNO:2的变体,则第二不同单体在位置90包含天冬氨酸(D),第一不同单体在位置90包含天冬酰胺(N)。
SEQ ID NO:2的变体是具有下述氨基酸序列的多肽:从SEQ ID NO:2的氨基酸序列变化而来并且保留其形成孔的能力。可以使用本领域已知的任何方法测定变体形成孔的能力。例如,可以将变体与其他合适的亚基一起插入两亲层中,并且可以确定其寡聚形成孔的能力。本领域已知将亚基插入例如两亲层的膜中的方法。例如,亚基可以在含有三嵌段共聚物膜的溶液中以纯化的形式悬浮,使得其扩散到膜并通过结合到膜并组装成功能状态而被插入。变体可以以各种方式被修饰。
本发明的孔可以包含任何数量的各自包含SEQ ID NO:2的变体的单体,例如各自包含SEQ ID NO:2的变体的1,2,3,4,5,6,7或8个单体。在优选的实施方案中,孔中的所有单体都包含SEQ ID NO:2的变体。
SEQ ID NO:2的变体或每个变体优选在与SEQ ID NO:2的位置G75,G77,L88,D118,Q126,D134和E139相对应的位置中的一个或多个处包含突变或取代。如果孔中的单体或者每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则变体或每个变体优选在位置位置G75,G77,L88,D118,Q126,D134和E139中的一个或多个处包含突变或取代。所述变体或者每个变体更优选包含G75S,G77S,L88N,D118R,Q126R,D134R和E139K中的一个或多个。下面更详细地论述这些突变的目的。
刚性(Rigidity)
SEQ ID NO:2的变体或每个变体优选在对应于SEQ ID NO:2中的位置108的位置处包含脯氨酸(P)。如果孔中的单体或每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则变体或每个变体优选包含位置108处的P。
桶状体缺失
在SEQ ID NO:2的变体或每个变体中,(a)优选缺失对应于SEQ ID NO:2的位置72至82的2,4,6,8或10个氨基酸,和(b)优选缺失对应于SEQ ID NO:2的位置111至121的2,4,6,8或10个氨基酸。换言之,当形成变体时,优选从SEQ ID NO:2的桶状体区域的下行链(位置72至82)和上行链(位置111至121)缺失2,4,6,8或10个氨基酸。从位置72到82和11至121的氨基酸的缺失改变变体中随后的氨基酸的编号,如上文所述。
从位置72至82缺失的氨基酸数量可以不同于从位置111至121缺失的氨基酸数量。从位置72至82缺失的氨基酸数量优选与从位置111至121缺失的氨基酸数量相同。
可以缺失位置72至82的氨基酸和位置111至121的氨基酸的任何组合。SEQ ID NO:2中桶状体的下行链和上行链中的大多数氨基酸在疏水性和亲水性之间交替。疏水性氨基酸选自色氨酸(W),亮氨酸(L),缬氨酸(V),异亮氨酸(I),苯丙氨酸(F)和酪氨酸(Y)。亲水性氨基酸选自丝氨酸(S),甘氨酸(G),天冬酰胺(N),脯氨酸(P)和天冬氨酸(D)。疏水性和亲水性氨基酸之间的交替得到形成孔的桶状体的一部分的β片状体。
位置72至82的缺失后剩余的氨基酸(即,2,4,6,8或10个氨基酸已从位置72至82缺失)优选包含3,5,7或9个连续的且在疏水和亲水性之间交替的氨基酸。
位置111至121的缺失后剩余的氨基酸(即,2,4,6,8或10个氨基酸已从位置111至121缺失)优选包含3,5,7或9个连续的且在疏水和亲水性之间交替的氨基酸。
从位置72至82缺失的氨基酸可以对应于从位置111至121缺失的氨基酸,如下表3所示。例如,如果L74和G75从位置72至82缺失,则D118和L119可以从位置111至121缺失。
表3-SEQ ID NO:2的桶状体中的对应氨基酸
从位置72至82缺失的氨基酸的一个或多个位置可不对应于从位置111至121缺失的氨基酸的一个或多个位置,如表3所示。例如,如果L74和G75从位置72至82缺失,A117和D118可以从位置111至121缺失。
从位置72至82中缺失的(全部)氨基酸的位置可不对应于从位置111至121中缺失的(全部)氨基酸的位置,如表3所示。例如,如果L74和G75从位置72至82缺失,I115和S116可以从位置111到121缺失。
从位置72至82中缺失的氨基酸优选是连续的。从位置111至121中缺失的氨基酸优选是连续的。从位置72至82缺失的氨基酸和从位置111至121缺失的氨基酸优选是连续的。
SEQ ID NO:2所示序列的变体或每个变体优选为这样的变体:其中(i)L74,G75,D118和L119已缺失,(ii)G75,V76,A117和D118已缺失,(iii)V76,G77,S116和A117已缺失,(iv)G77,I78,I115和S116已缺失,(v)I78,N79,S114和I115已缺失,(vi)N79,F80,V113和S114已缺失或(vii)F80,S81,G112和V113已缺失。EQ ID NO:2所示的序列的变体或每个变体优选为这样的变体:其中L74,G75,V76,G77,S116,A117,D118和L119已缺失。SEQ ID NO:2所示序列的变体或每个变体优选为这样的变体:其中L74,G75,N79,F80,V113,S114,D118和L119已缺失或L74,G75,F80,S81,G112,V113,D118和L119已缺失。
技术人员可以识别可以根据本发明鉴定可缺失的氨基酸的其他组合。
位置90和91
在SEQ ID NO:2中,氨基酸90和91都是天冬氨酸(D)。如果包含变体的单体对收缩部分的负电荷有贡献,则所述变体可以在与SEQ ID NO:2的位置90和/或91相对应的位置包含带负电荷的氨基酸,例如天冬氨酸(D)或谷氨酸(E)。如果变体在与SEQ ID NO:2的位置90和/或91相对应的位置包含谷氨酸(E)或非天然带负电荷的氨基酸,则它或它们可通过取代而引入。如果单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则所述变体可以在位置90和/或91包含带负电荷的氨基酸,例如天冬氨酸(D)或谷氨酸(E)。
如果包含变体的单体对收缩部分的负电荷没有贡献,则所述变体可以在与SEQ IDNO:2的位置90和/或91对应的位置处不包含带负电荷的氨基酸。变体可以在与SEQ ID NO:2的位置90和/或91对应的位置处包含任何不带电的上文论述的氨基酸。如果单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则所述变体可以在与位置90和/或91对应的位置处不包含带负电荷的氨基酸。变体优选可以在与SEQ ID NO:2的位置90和/或91对应的位置处,或在位置90和/或91处包含丝氨酸(S),谷氨酰胺(Q),亮氨酸(L),甲硫氨酸(M),异亮氨酸(I),丙氨酸(A),缬氨酸(V),甘氨酸(G),苯丙酸(F),色氨酸(W),酪氨酸(Y),组氨酸(H),苏氨酸(T),精氨酸(R),赖氨酸(K),天冬酰胺(N)或半胱氨酸(C)。本发明设想了位置90和91处的这些氨基酸的任何组合。变体优选在与SEQ ID NO:2的位置90和/或91对应的位置处或在位置90和/或91处包含天冬酰胺(N)或谷氨酰胺(Q)。这些氨基酸优选通过取代而在位置90和/或91插入。
位置93
在野生型MspA中,氨基酸93是天冬氨酸(D)。如果包含变体的单体对收缩部分的负电荷有贡献,则所述变体可以在与SEQ ID NO:2的位置93相对应的位置处包含带负电荷的氨基酸,例如天冬氨酸(D)或谷氨酸(E)。如果变体在与SEQ ID NO:2的位置93相对应的位置包含谷氨酸(E)或非天然带负电荷的氨基酸,则它可通过取代而引入。如果孔中的单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则所述变体可以在位置93包含带负电荷的氨基酸,例如天冬氨酸(D)或谷氨酸(E)。
如果包含变体的单体对收缩部分的负电荷没有贡献,则所述变体可以在与SEQ IDNO:2的位置93相对应的位置处不包含带负电荷的氨基酸。如果孔中的单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则所述变体可以在位置93不包含带负电荷的氨基酸,例如天冬氨酸(D)或谷氨酸(E)。变体优可以在与SEQ ID NO:2的位置93相对应的位置处包含不带电的且上文论述的任何氨基酸。变体优选可以在与SEQ ID NO:2的位置93对应的位置处或位置93处包含丝氨酸(S),谷氨酰胺(Q),亮氨酸(L),甲硫氨酸(M),异亮氨酸(I),丙氨酸(A),缬氨酸(V),甘氨酸(G),苯丙酸(F),色氨酸(W),酪氨酸(Y),组氨酸(H),苏氨酸(T),精氨酸(R),赖氨酸(K),天冬酰胺(N)或半胱氨酸(C)。变体优选在与SEQ ID NO:2的位置93相对应的位置处或位置93处包含天冬酰胺(N)。这些氨基酸优选通过取代在位置93插入。
帽形成区域
在SEQ ID NO:2中,氨基酸1至72和122至184形成孔的帽。在这些氨基酸中,V9,Q12,D13,R14,T15,W40,I49,P53,G54,D56,E57,E59,T61,E63,Y66,Q67,I68,F70,P123,I125,Q126,E127,V128,A129,T130,F131,S132,V133,D134,S136,G137,E139,V144,H148,T150,V151,T152,F163,R165,I167,S169,T170和S173面向孔的通道内。
桶状体形成区域
在SEQ ID NO:2中,氨基酸72至82和112至121形成孔的桶状体。在这些氨基酸中,S73,G75,G77,N79,S81,G112,S114,S116,D118和G120面向孔的通道内。S73,G75,G77,N79,S81在下行链中面向内,G112,S114,S116,D118和G120在上行链中面向内。
减少的净负电荷
所述变体或每个变体优选包含一个或多个减少单体的帽形成区域和/或桶状体形成区域中面向内的氨基酸的净负电荷的修饰。变体优选包含两个或更多个减少单体的帽形成区域和/或桶状体形成区域中面向内的氨基酸的净负电荷的修饰。对桶状体形成区域的任何这样的修饰是除了上述本发明的缺失之外。
变体可以包括任何数量的修饰,例如1个或更多,2个或更多,3个或更多,4个或更多,5个或更多,6个或更多,7个或更多,8个或更多,9个或更多,10个或更多,15个或更多,20个或更多,30个或更多,或40个或更多的修饰。
可以通过本领域已知的任何方式来减少净负电荷。净负电荷以不影响突变体单体形成孔的能力的方式降低。这可以如上所述测量。
帽形成区域和/或桶状体形成区域中面向内的氨基酸的净负电荷可以减少。这意味着帽形成区域和/或成桶状体形成区域中面向内的氨基酸比SEQ ID NO:2包含更少的带负电荷的氨基酸和/或包含比SEQ ID NO:2更多的带正电荷的氨基酸。所述一个或多个修饰可以导致在帽形成区域和/或桶状体形成区域中面向内的氨基酸中的净正电荷
可以使用本领域已知的方法测量净电荷。例如,可以使用常规方法计算帽形成区域和/或桶状体形成区域中面向内的氨基酸的净电荷。
所述一个或多个修饰优选是带负电荷的氨基酸的一个或多个缺失。去除一个或多个带负电荷的氨基酸减少了帽形成区域和/或桶状体形成区域内面向内的氨基酸的净负电荷。带负电荷的氨基酸是具有净负电荷的氨基酸。带负电荷的氨基酸包括但不限于天冬氨酸(D)和谷氨酸(E)。从蛋白质(如MspA单体)缺失氨基酸的方法是本领域熟知的。
所述一个或多个修饰优选是用一个或多个带正电荷、不带电荷的、非极性和/或芳香族氨基酸取代一个或多个带负电荷的氨基酸。带正电荷的氨基酸是具有净正电荷的氨基酸。带正电荷的氨基酸可以是天然存在的或非天然存在的。带正电荷的氨基酸可以是合成的或修饰的。例如,具有净正电荷的修饰的氨基酸可以专门设计用于本发明。对氨基酸的许多不同类型的修饰是本领域公知的。
优选的天然存在的带正电荷的氨基酸包括但不限于组氨酸(H),赖氨酸(K)和精氨酸(R)。H,K和/或R的任何数量和组合可以替代帽形成区域和/或桶状体形成区域中面向内的氨基酸。
不带电荷的氨基酸、非极性氨基酸和/或芳香族氨基酸可以是天然存在的或非天然存在的。它们可以是合成的或修饰的。不带电氨基酸没有净电荷。合适的不带电氨基酸包括但不限于半胱氨酸(C),丝氨酸(S),苏氨酸(T),甲硫氨酸(M),天冬酰胺(N)和谷氨酰胺(Q)。非极性氨基酸具有非极性侧链。合适的非极性氨基酸包括但不限于甘氨酸(G),丙氨酸(A),脯氨酸(P),异亮氨酸(I),亮氨酸(L)和缬氨酸(V)。芳香族氨基酸具有芳香侧链。合适的芳族氨基酸包括但不限于组氨酸(H),苯丙氨酸(F),色氨酸(W)和酪氨酸(Y)。这些氨基酸的任何数目和组合可以被代入帽形成区域和/或桶状体形成区域中面向内的氨基酸中。
所述一个或多个带负电荷的氨基酸优选用丙氨酸(A),缬氨酸(V),天冬酰胺(N),谷氨酰胺(Q)或甘氨酸(G)取代。优选的取代包括但不限于用A取代D,用V取代D,用N取代D,用Q取代D和用G代替D。
所述一个或多个修饰优选是带正电荷的氨基酸的一个或多个引入。正电荷的引入减少了净负电荷。所述一个或多个带正电荷的氨基酸可以通过添加或取代引入。任何氨基酸可以被带正电荷的氨基酸取代。一个或多个不带电荷的氨基酸、非极性氨基酸和/或芳香族氨基酸可以被一个或多个带正电荷的氨基酸取代。可以引入任何数量的带正电荷的氨基酸。
野生型MspA包含位置126处的极性谷氨酰胺(Q)。所述一个或多个修饰优选减少在与SEQ ID NO:2中的位置126对应的变体中的位置处的净负电荷。如果单体包含其中仅发生氨基酸取代的SEQ ID NO:2的变体,则一个或多个修饰优选减少对应于位置126的变体中的位置处的净负电荷。所述一个或多个修饰优选增加对应于位置126的位置或位置126处的净正电荷。这可以通过用带正电荷的氨基酸替代位置126处或相邻或附近的面向内的氨基酸来实现。所述变体或每个变体优选包含对应于位置126的位置处或位置126处的带正电荷的氨基酸。所述变体或每个变体优选包含对应于SEQ ID NO:2中的位置123,125,127和128的一个或多个位置处或位置123,125,127和128中的一个或多个处的带正电荷的氨基酸。所述变体或每个变体可以包含在对应于位置123,125,127和128的位置处或在位置123,125,127和128中的一个或多个位置处的任何数量和组合的带正电荷的氨基酸。带正电荷的氨基酸可以通过添加或取代而引入。
所述一个或多个修饰优选是引入一个或多个带正电荷的氨基酸,其中和一个或多个带负电荷的氨基酸。负电荷的中和减少了净负电荷。所述一个或多个带正电荷的氨基酸可以通过添加或取代引入。任何氨基酸可以被带正电荷的氨基酸取代。一个或多个不带电荷的氨基酸、非极性氨基酸和/或芳香族氨基酸可以被一个或多个带正电荷的氨基酸取代。可以引入任何数量的带正电荷的氨基酸。该数量通常与被中和的带负电荷的氨基酸的数量相同。
所述一个或多个带正电荷的氨基酸可以在帽形成区域和/或桶状体形成区域中的任何位置处引入,只要它们中和所述一个或多个面向内的带负电荷的氨基酸的负电荷即可。为了有效地中和帽形成区域中的负电荷,在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体中通常有5个或更少的氨基酸。在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体的帽形成区域中,优选具有4个或更少,3个或更少或2个或更少的氨基酸。在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体的帽形成区域中更优选具有两个氨基酸。每个带正电荷的氨基酸最优选在相邻的变体的帽形成区域引到其要中和的带负电荷的氨基酸。
为了有效地中和桶状体形成区域中的负电荷,在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间通常具有5个或更少的面向内的氨基酸。在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体的桶状体形成区域中,优选具有4个或更少,3个或更少或2个或更少的面向内的氨基酸。在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体的桶状体形成区域中,更优选具有一个面向内的氨基酸。每个带正电荷的氨基酸最优选在相邻的变体的桶状体形成区域的面向内的位置引入到其要中和的带负电荷的氨基酸。
SEQ ID NO:2包含在位置118和134处的天冬氨酸(D)和在位置139处的谷氨酸(E)。每个单体中的氨基酸118存在于孔的桶状体内。所述变体或每个变体优选在对应于SEQ IDNO:2的位置114,116,120,123,70,73,75,77和79的一个或多个位置处包含带正电荷的氨基酸。如果孔中的所述单体或每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则变体优选在位置114,116,120,123,70,73,75,77和79中的一个或多个处包含带正电荷的氨基酸。这些位置中的一个或多个处的正电荷中和位置118处的负电荷。带正电荷的氨基酸可以存在于任意数目和组合的下述位置处:所述位置对应于位置114,116,120,123,70,73,75,77和79;或存在于位置114,116,120,123,70,73,75,77和79处。氨基酸可以通过添加或取代而引入。
每个单体中的氨基酸134和139是帽的一部分。所述或每个变体优选在对应于SEQID NO:2的位置129,132,136,137,59,61和63的一个或多个位置处包含带正电荷的氨基酸。如果孔中的所述或每个单体包含其中仅进行氨基酸取代的SEQ ID NO:2的变体,则所述或每个变体优选在位置129,132,136,137,59,61和63中的一个或多个处包含带正电荷的氨基酸。这些位置中的一个或多个处的正电荷中和在位置134处的负电荷。带正电荷的氨基酸可以存在于下述任意数目和组合的位置处:所述位置对应于SEQ ID NO:2中的位置129,132,136,137,59,61和63;或存在于位置129,132,136,137,59,61和63处。氨基酸可以通过添加或取代而引入。
变体优选在对应于SEQ ID NO:2的位置137,138,141,143,45,47,49和51的一个或多个位置处或在位置137,138,141,143,45,47,49和51处包含带正电荷的氨基酸。这些位置中的一个或多个处的正电荷中和在位置139处的负电荷。带正电荷的氨基酸可以存在于任何数目和组合的下述位置处:所述位置对应于SEQ ID NO:2中的位置137,138,141,143,45,47,49和51;或存在于位置137,138,141,143,45,47,49和51。氨基酸可以通过添加或取代而引入。
位置118,126,134和139
所述一个或多个修饰优选地减少在对应于SEQ ID NO:2中的位置118,126,134和139的一个或多个位置处或在位置118,126,134和139处的净负电荷。所述一个或多个修饰优选地减少在对应于下述位置的位置处或在下述位置处的净负电荷:SEQ ID NO:2中的118;126;134;139;118和126;118和134;118和139;126和134;126和139;134和139;118,126和134;118,126和139;118,134和139;126,134和139;或118,126,134和139。
所述变体优选在对应于SEQ ID NO:2的位置118,126,134和139的一个或多个位置处或在位置118,126,134和139处不包含天冬氨酸(D)或谷氨酸(E)。所述变体优选在上述对应于位置118,126,134和139的任意组合位置处或在位置118,126,134和139处不包含天冬氨酸(D)或谷氨酸(E)。所述变体更优选在下述位置处包含精氨酸(R)、甘氨酸(G)或天冬酰胺(N):在与SEQ ID NO:2的位置118,126,134和139对应的一个或多个位置处或在位置118,126,134和139处,例如上述公开的位置118,126,134和139的任意组合位置处。所述变体最优选包含D118R,Q126R,D134R和E139K。
引入或替代天然存在的氨基酸的方法是本领域公知的。例如,通过在多核苷酸编码突变体单体的相关位置处用甲硫氨酸的密码子(ATG)替代精氨酸的密码子(CGT),甲硫氨酸(M)可以被精氨酸(R)取代。然后可以如上所述表达多核苷酸。
所述一个或多个修饰优选是一个或多个带负电荷的氨基酸的一个或多个化学修饰,其中和带负电荷的氨基酸的负电荷。例如,一个或多个带负电荷的氨基酸可以与碳二亚胺反应。
其他修饰
所述变体优选地包括以下中的一个或多个:
(e)在对应于SEQ ID NO:2的位置75的位置处或在位置75处的丝氨酸(S);
(f)在对应于SEQ ID NO:2的位置77的位置处或在位置77处的丝氨酸(S);和
(g)在对应于SEQ ID NO:2的位置88的位置处或在位置88处的天冬酰胺(N)或赖氨酸(K)。
所述变体可包含(e)至(g)的任意数目和组合,包括(e),(f),(g),(e)和(f),(f)和(g),(e)和(g)和(e),(f)和(g)。变体优选包含G75S,G77S和L88N。
所述变体最优选包含(a)D90N,D91N,D93N,D118R,D134R和E139K,(b)L88N,D90N,D91N,D93N,D118R,D134R和E139K,(c)G75S,G77S,L88N,D90N,D91N,D93N,D118R,Q126R,D134R和E139K或(d)G75S,G77S,L88N,D90N,D91N,D118R,Q126R,D134R和E139K。其中,(a)至(d)中所述的位置对应于SEQ ID NO:2中的那些位置或者为所述变体中的位置。
所述变体优选地还包含以下中的一个或多个:
(i)在对应于SEQ ID NO:2的位置89的位置处或在位置89处的苯丙氨酸(F);
(j)在对应于SEQ ID NO:2的位置95的位置处或在位置95处的谷氨酸(E)和在对应于SEQ ID NO:2的位置98的位置处或在位置98处的赖氨酸(K);
(l)在对应于SEQ ID NO:2的位置96的位置处或在位置96处的天冬氨酸(D);
(m)在对应于SEQ ID NO:2的位置102的位置处或在位置102处的甘氨酸(G);
(n)在对应于SEQ ID NO:2的位置103的位置处或在位置103处的丙氨酸(A);和
(o)在对应于位置108的位置处或在位108处的丙氨酸(A)、丝氨酸(S)或脯氨酸(P)。
所述变体可以包括(i)至(o)的任何数量和组合。
改善的运动
所述或每个变体优选在与多核苷酸结合蛋白相互作用的变体的一部分中包含一个或多个修饰。当运动由多核苷酸结合蛋白控制时,这改善了目标多核苷酸相对于含变体的孔的运动。这些修饰及其优点在国际申请号PCT/GB2015/051291(公布号为WO 2015/166276)中有论述。所述一个或多个修饰优选提供了目标多核苷酸相对于(例如穿过)含变体的跨膜孔的更一致的运动。所述一个或多个修饰优选地减少了与目标多核苷酸相对于(例如穿过)含变体的跨膜孔的运动相关的噪声。如果目标多核苷酸是双链的,则所述一个或多个修饰优选地减少与互补链相对于模板链的运动相关的噪声和/或提供互补链相对于模板链的更一致的运动。这有利于双链目标多核苷酸的链测序。双链多核苷酸的两条链优选通过桥接部分连接,例如发夹环或发夹环适配器。这将在下面更详细地论述。
可以进行任何数目的修饰,例如2个或更多,3个或更多,5个或更多,10个或更多,15个或更多,20个或更多,25个或更多,30个或更多,50个或更多或者100个或更多的修饰。
与多核苷酸结合蛋白相互作用的变体部分通常在下述位置包含氨基酸:对应于SEQ ID NO:2的位置12,14,48,52,53,54,55,56,57,58,59,60,134,135,136,137,138,139,169和170处,或在位置12,14,48,52,53,54,55,56,57,58,59,60,134,135,136,137,138,139,169和170处。
与多核苷酸结合蛋白相互作用的变体部分优选在下述位置包含氨基酸:
(a)对应于SEQ ID NO:2中的位置12,14,52,54,56,57,59,134,136,138,139和169,或在位置12,14,52,54,56,57,59,134,136,138,139和169处;
(b)SEQ ID NO:2中的位置12,14,56,57,59,134,136,139和169,或在位置12,14,56,57,59,134,136,139和169处;
(c)SEQ ID NO:2中的56,57,59,134,136,139和169,或在位置56,57,59,134,136,139和169处;或
(d)SEQ ID NO:2中的56,57,59,134和139,或在位置56,57,59,134和139处。
可以根据本发明进行任何修饰。所述变体可以包括一个或多个修饰,所述修饰(a)改变电荷,(b)改变空间位置,(c)改变氢键,(d)改变π堆叠,或(e)改变变体中与多核苷酸结合蛋白相互作用的部分的结构。可以改变这些中的任何数量和组合。例如,该方法可以包括进行下述多个修饰之一:{a};{b};{c};{d};{e};{a,b};{a,c};{a,d};{a,e};{b,c};{b,d};{b,e};{c,d};{c,e};{d,e};{a,b,c};{a,b,d};{a,b,e};{a,c,d};{a,c,e};{a,d,e};{b,c,d};{b,c,e};{b,d,e};{c,d,e};{a,b,c,d};{a,b,c,e};{a,b,d,e};{a,c,d,e};{b,c,d,e};或{a,b,c,d,e}。
当修饰变体时,所述一个或多个修饰通常涉及引入或替代一个或多个氨基酸。本发明通常涉及进行一个或多个氨基酸取代。
改变电荷的修饰可涉及增加净负电荷或减少净负电荷。该方法优选包括进行一个或多个减少与多核苷酸结合蛋白相互作用的变体部分的净负电荷的修饰。上文更详细地论述了减少净负电荷的修饰。在优选的实施方案中,所述变体在对应于SEQ ID NO:2的位置56,57,59,134和139的一个或多个位置处或在位置56,57,59,134和139处不包含天冬氨酸(D)或谷氨酸(E)。变体优选包含以下中的一个或多个:(a)D56N或D56R,(b)E57N或E57R,(c)E59N或E59R,(d)D134N或D134R,和(e)E139N,E139R或E139K。变体可以包括这些修饰中的任何数量和组合。例如,单体中的一个或多个可以包括{a};{b};{c};{d};{e};{a,b};{a,c};{a,d};{a,e};{b,c};{b,d};{b,e};{c,d};{c,e};{d,e};{a,b,c};{a,b,d};{a,b,e};{a,c,d};{a,c,e};{a,d,e};{b,c,d};{b,c,e};{b,d,e};{c,d,e};{a,b,c,d};{a,b,c,e};{a,b,d,e};{a,c,d,e};{b,c,d,e};或{a,b,c,d,e}。
改变空间位置的修饰可涉及增加或减少氨基酸残基的大小,例如通过置换。例如,可通过引入一个或多个大体积的氨基酸,例如苯丙氨酸(F),色氨酸(W),酪氨酸(Y)和组氨酸(H),来增加空间位置。
改变氢键的修饰可涉及引入或替换一个或多个可进行氢键键合的氨基酸。
改变π堆叠的修饰可涉及引入或替换通过离域电子π系统而相互作用的氨基酸。例如,可通过引入一个或多个芳香族氨基酸,例如苯丙氨酸(F),色氨酸(W),酪氨酸(Y)和组氨酸(H),来增加π堆叠。
变体
除了上述特定突变之外,变体可以包括其他突变。在SEQ ID NO:2的氨基酸序列的整个长度上,基于氨基酸相似性或同一性,变体将优选与该序列至少50%同源。更优选地,基于氨基酸相似性或同一性,所述变体可以与SEQ ID NO:2的氨基酸序列在整个序列上至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%且更优选至少95%,97%或99%同源。在100或更多个例如125,150,175或200或更多个连续氨基酸的延伸段上,可以具有至少80%,例如至少85%,90%或95%的氨基酸相似性或同一性(“严格同源性”)。
可使用本领域的标准方法确定同源性。例如,UWGCG软件包提供了可用于计算同源性的BESTFIT程序,例如使用其默认设置(Devereux等人(1984)Nucleic AcidsResearch12,p387-395)。PILEUP和BLAST算法可用于计算同源性或比对序列(line upsequence)(例如识别等同残基或相应序列(通常基于其默认设置)),例如Altschul S.F.(1993)J Mol Evol 36:290-300;Altschul,S.F et al(1990)J Mol Biol 215:403-10中所述。用于进行BLAST分析的软件可通过国家生物技术信息中心(National Center forBiotechnology Information)
(http://www.ncbi.nlm.nih.gov/)公开获得。
可以使用配对识别(pairwise identity)或通过应用例如BLOSUM62的评分矩阵,并转换为等同身份来测量相似性。由于它们代表功能变化而不是演变的变化(evolvedchange),因此在确定同源性时,故意突变的位置将被掩盖。通过对蛋白质序列的综合数据库使用例如PSIBLAST的位置特异性评分矩阵,可以更灵敏地确定相似性。可以使用反映氨基酸化学物理性质而不是随进化的时间尺度的取代频率(例如电荷)的不同评分矩阵。
SEQ ID NO:2是野生型MspA单体的成熟形式。与MspA相比,变体可包含MspB,C或D单体中的任何突变。MspB,C和D的成熟形式示于SEQ ID NO:5至7中。特别地,变体可以包含存在于MspB中的以下取代:A138P。变体可以包含存在于MspC中的一个或多个以下取代:A96G,N102E和A138P。所述变体可以包含存在于MspD中的一个或多个以下突变:G1,L2V,E5Q,L8V,D13G,W21A,D22E,K47T,I49H,I68V,D91G,A96Q,N102D,S103T,V104I,S136K和G141A的缺失。所述变体可以包含来自MspB、C和D的一个或多个突变和取代的组合。
可以对SEQ ID NO:2中除上述论述的那些氨基酸序列之外的氨基酸序列进行氨基酸取代,例如多达1,2,3,4,5,10,20或30个取代。保守取代可将氨基酸用具有相似化学结构、相似化学性质或相似侧链体积的其他氨基酸替换。引入的氨基酸可与其所替代的氨基酸具有相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。或者,保守取代可以引入另一种芳香族或脂肪族的氨基酸来代替之前存在的芳香族或脂肪族氨基酸。保守的氨基酸变化是本领域公知的,并且可以根据下表4中限定的20个主要氨基酸的性质进行选择。当氨基酸具有相似的极性时,这也可以参考表5中氨基酸侧链的亲水性大小来确定。
表4-氨基酸的化学性能
表5-亲水性大小
SEQ ID NO:2的氨基酸序列的一个或多个氨基酸残基可以另外从上述多肽中缺失。可以缺失多达1,2,3,4,5,10,20或30或更多个残基。
所述变体可以包括SEQ ID NO:2的片段。这类片段保留有形成孔的活性。各片段可以至少为50、100、150或200个氨基酸长度。这类片段可用于产生孔。片段优选含有SEQ IDNO:2的形成孔的结构域。各片段必须包括对应于SEQ ID NO:2的位置88,90,91,105,118和134的残基之一。通常,各片段包括SEQ ID NO:2的残基88,90,91,105,118和134的全部。
一个或多个氨基酸可以替代地或另外地添加到上述的多肽。可以在SEQ ID NO:2或其多肽变体或其片段的氨基酸序列的氨基末端或羧基末端提供一延伸。所述延伸可以是非常短的,例如1至10个氨基酸长度。替代地,所述延伸可以更长,例如多达50或100个氨基酸。载体蛋白可以根据本发明融合到氨基酸序列。其他融合蛋白在下文更详细地论述。
如上所述,变体是具有下述氨基酸序列的多肽:其由SEQ ID NO:2的氨基酸序列变化而来并保留有其形成孔的能力。变体通常含有SEQ ID NO:2的负责形成孔的区域。含有β-桶状体的Msp的形成孔的能力由每个亚基中的β-片状体提供。SEQ ID NO:2的变体通常含有SEQ ID NO:2中形成β-片状体的区域。对SEQ ID NO:2中形成β-片状体的区域进行一个或多个修饰,只要所得变体保留其形成孔的能力即可。SEQ ID NO:2的变体优选在其α-螺旋和/或环形区域中包括一个或多个修饰,例如取代、添加或缺失。
可以修饰单体以帮助其鉴定或纯化,例如通过添加链霉亲和素标签或通过添加信号序列来促进其从单体不天然含有这种序列的细胞分泌。下面更详细地论述其他合适的标签。单体可用显示标记物(revealing label)标记。显示标记物可以是允许检测单体的任何合适的标记物。合适的标记物如下所述。
单体也可以使用D-氨基酸制备。例如,单体可以包含L-氨基酸和D-氨基酸的混合物。这是制备这种蛋白质或肽的领域中常规的。
所述单体通常包含一个或多个特定修饰以促进核苷酸鉴别。所述单体也可以含有其他非特异性修饰,只要它们不影响孔形成即可。许多非特异性侧链修饰是本领域已知的,并且可对衍生自Msp的单体的侧链进行这类修饰。这类修饰包括例如通过与醛进行反应然后用NaBH4还原而进行的氨基酸的还原烷基化,用乙酰亚胺酸甲酯(methylacetimidate)进行的脒基化,或用乙酸酐进行的酰化。
所述单体可以使用本领域已知的标准方法制备。单体可以合成制备或通过重组方式制备。例如,所述单体可以通过体外翻译和转录(IVTT)合成。用于制备孔和单体的适宜方法在国际申请号PCT/GB09/001690(公布号为WO 2010/004273),PCT/GB09/001679(公布号为WO 2010/004265)或PCT/GB10/000133(公布号为WO 2010/086603)中有论述。将孔插入膜中的方法是本领域已知的。
化学修饰
在一些实施方案中,单体经化学修饰。一旦单体根据本发明形成了异源寡聚孔,所述单体通常被化学改性。所述单体可以任何方式和在任何位置进行化学修饰。所述单体优选通过将分子连接到一个或多个半胱氨酸(半胱氨酸连接),将分子连接到一个或多个赖氨酸,将分子连接到一个或多个非天然氨基酸,表位的酶修饰或末端的修饰而进行化学修饰。用于进行这种修饰的合适方法是本领域公知的。所述单体可以通过任何分子的连接而进行化学修饰。例如,所述单体可以通过连接染料或荧光团而进行化学修饰。
在另一个实施方案中,所述单体可以连接到多核苷酸结合蛋白。这形成了可用于本发明的测序方法的模块化测序系统。多核苷酸结合蛋白在下面论述。
多核苷酸结合蛋白优选共价连接到单体上。蛋白质可以使用本领域已知的任何方法共价连接到单体上。单体和蛋白质可以化学融合或基因融合。如果整个构建体由单个多核苷酸序列表达,则单体和蛋白质进行基因融合。单体与多核苷酸结合蛋白的基因融合在国际申请号PCT/GB09/001679(公布号为WO 2010/004265)。
如果多核苷酸结合蛋白通过半胱氨酸连接体连接,则一个或多个半胱氨酸优选已通过取代引入单体中。所述单体可以在对应于SEQ ID NO:2的位置10至15,51至60,136至139和168至172的一个或多个位置或在位置10至15,51至60,136至139和168至172处的半胱氨酸残基。这些位置存在于在同系物中具有低保守性——表明可以耐受突变或插入——的环形区域中。因此,它们适用于连接多核苷酸结合蛋白。半胱氨酸残基的反应性可以通过如上所述的修饰来增强。
多核苷酸结合蛋白可以直接连接到单体或通过一个或多个连接体连接到单体。该分子可以使用国际申请号PCT/GB10/000132(公布号WO 2010/086602)中描述的杂交连接体连接到单体上。或者,可以使用肽连接体。肽连接体是氨基酸序列。肽连接体的长度、柔韧性和亲水性通常被设计成使其不影响所述单体和分子的功能。优选的柔性肽连接体是2至20个,例如4,6,8,10或16个丝氨酸和/或甘氨酸的延伸段。更优选的柔性连接体包括(SG)1,(SG)2,(SG)3,(SG)4,(SG)5和(SG)8,其中S是丝氨酸,G是甘氨酸。优选的刚性连接体是2至30个,例如4,6,8,16或24个脯氨酸的延伸段。更优选的刚性连接体包括(P)12,其中P是脯氨酸。
所述单体可以用分子适配器和多核苷酸结合蛋白进行化学修饰。
半胱氨酸残基的反应性可以通过修饰相邻残基来增强。例如,侧翼(flanking)精氨酸,组氨酸或赖氨酸残基的碱基将半胱氨酸硫醇基团的pKa改变为更具反应性的S-基团的pKa。半胱氨酸残基的反应性可以通过硫醇保护基如dTNB保护。这些保护基可以在连接体连接之前与单体的一个或多个半胱氨酸残基反应。
所述分子(用它对单体进行化学修饰)可以直接连接到所述单体,或通过连接体连接到所述单体,如国际申请号PCT/GB09/001690(公布号WO 2010/004273),PCT/GB09/001679(公布号WO 2010/004265)或PCT/GB10/000133(公布号WO 2010/086603)中所公开。
本文所述的任何蛋白质,例如本发明的单体和孔可以通过下述进行修饰以帮助其鉴定或纯化:例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、链霉亲和素标签、旗帜标签、SUMO标签、GST标签或MBP标签,或者通过添加信号序列以促进它们从其中多肽不天然含有这类序列的细胞分泌。引入遗传标签的替代方法是将标签化学反应到蛋白质上的天然或工程位置上。这的一个实例是使凝胶转移试剂与在蛋白质外部工程化的半胱氨酸反应。这已经被证明是一种分离溶血素异源寡聚物的方法(Chem Biol.1997 Jul;4(7):497-505)。
本文所述的任何蛋白质,例如本发明的单体和孔,可以用显示标记物标记。显示标记物可以是允许检测蛋白质的任何合适的标记物。合适的标记物包括但不限于荧光分子、放射性同位素,例如,125I,35S,酶,抗体,抗原,多核苷酸和配体如生物素。
本文所述的任何蛋白质,例如本发明的单体或孔,可以通过合成或通过重组方法制备。例如,蛋白质可以通过体外翻译和转录(IVTF)合成。蛋白质的氨基酸序列可以被修饰以包括非天然存在的氨基酸或增加蛋白质的稳定性。当通过合成方法制备蛋白质时,可以在制备过程中引入这种氨基酸。蛋白质也可在合成或重组制备之后被改变。
也可以使用D-氨基酸制备蛋白质。例如,蛋白质可以包含L-氨基酸和D-氨基酸的混合物。这是制备这种蛋白质或肽的领域中常规的。
蛋白质还可以含有其他非特异性修饰,只要它们不干扰蛋白质的功能即可。许多非特异性侧链修饰是本领域已知的,并且可以制备成蛋白质的侧链。这样的修饰包括例如通过与醛反应然后用NaBH4还原反应进行氨基酸的还原烷基化,用乙酰亚胺酸甲酯进行脒基化,或用乙酸酐进行酰化。
本文描述的任何蛋白质,包括本发明的单体和孔,可以使用本发明的方法或本领域已知的标准方法来制备。可以使用本领域的标准方法导出和复制编码蛋白质的多核苷酸序列。编码蛋白质的多核苷酸序列可以使用本领域的标准技术在细菌宿主细胞中表达。蛋白质可以通过从重组表达载体原位表达多肽而在细胞中产生。表达载体可任选携带可诱导启动子以控制多肽的表达。这些方法在Sambrook,J.和Russell,D.(2001).MolecularCloning:A Laboratory Manual,3rd Edition.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY.中有描述。
蛋白质可以从产生蛋白质的生物体或重组表达后通过任何蛋白质液相色谱系统在纯化后进行大规模制备。典型的蛋白质液相色谱系统包括FPLC,AKTA系统,Bio-Cad系统,Bio-Rad BioLogic系统和Gilson HPLC系统。
构建体
本发明的异源寡聚孔可以包括含有两个或更多个共价连接的单体的第一不同构建体,和含有两个或更多个共价连接的单体的第二不同构建体。上述任何构造实施方案均适用于本发明的孔。
多核苷酸表征
本发明提供了表征目标多核苷酸的方法。该方法包括测量目标多核苷酸的一个或多个特征。目标多核苷酸也可称为模板多核苷酸或感兴趣的多核苷酸。
多核苷酸
多核苷酸,例如核酸,是包含两个或更多个核苷酸的大分子。所述多核苷酸或核酸可以包括任何核苷酸的任何组合。核苷酸可以是天然存在的或人造的。多核苷酸中的一个或多个核苷酸可被氧化或甲基化。多核苷酸中的一个或多个核苷酸可被损坏。例如,多核苷酸可以包含嘧啶二聚体。这种二聚体通常与紫外线造成的损伤相关,并且是皮肤黑素瘤的主要原因。多核苷酸中的一个或多个核苷酸可被修改,例如用标记物或标签修改。合适的标记物如下所述。多核苷酸可以包含一个或多个间隔区(spacer)。
核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基和糖形成核苷。
核碱基通常是杂环的。核碱基包括但不限于嘌呤和嘧啶,更具体地包括腺嘌呤(A),鸟嘌呤(G),胸腺嘧啶(T),尿嘧啶(U)和胞嘧啶(C)。
糖通常是戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。糖优选为脱氧核糖。
多核苷酸优选包含以下核苷:脱氧腺苷(dA),脱氧尿苷(dU)和/或胸苷(dT),脱氧鸟苷(dG)和脱氧胞苷(dC))。
核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有一磷酸盐、二磷酸盐或三磷酸盐。核苷酸可以包含多于三个的磷酸盐,例如4或5个磷酸盐。磷酸盐可以连接在核苷酸的5′或3′侧。核苷酸包括但不限于单磷酸腺苷(AMP),单磷酸鸟苷(GMP),单磷酸胸苷(TMP),单磷酸尿苷(UMP),单磷酸5-甲基胞苷,单磷酸5-羟甲基胞苷,单磷酸胞苷(CMP)),环状单磷酸腺苷(cAMP),环状单磷酸鸟苷(cGMP),单磷酸脱氧腺苷(dAMP),单磷酸脱氧鸟苷(dGMP),单磷酸脱氧胸苷(dTMP),单磷酸脱氧尿苷(dUMP),单磷酸脱氧胞苷(dCMP)和脱氧甲基单磷酸胞苷。核苷酸优选选自AMP,TMP,GMP,CMP,UMP,dAMP,dTMP,dGMP,dCMP和dUMP。
核苷酸可以是非碱性的(即缺乏核碱基)。核苷酸也可以缺少核碱基和糖(即C3间隔区)。
多核苷酸中的核苷酸可以以任何方式彼此连接。核苷酸通常通过它们的糖和磷酸基团连接,如在核酸中一样。核苷酸可以通过其核碱基连接,如嘧啶二聚体中一样。
多核苷酸可以是单链的或双链的。多核苷酸的至少一部分优选是双链的。
多核苷酸可以是核酸,例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含与一条DNA链杂交的一条RNA链。多核苷酸可以是本领域已知的任何合成核酸,例如肽核酸(PNA),甘油核酸(GNA),苏糖核酸(TNA),锁定核酸(LNA)或其他具有核苷酸侧链的合成聚合物。PNA骨架由通过肽键连接的重复的N-(2-氨基乙基)-甘氨酸单元组成。GNA骨架由通过磷酸二酯键连接的重复的二醇单元组成。TNA骨架由通过磷酸二酯键连接在一起的重复的苏糖组成。LNA由如上所述的核糖核苷酸形成,其具有连接核糖部分中的2′氧和4′碳的额外的桥。
多核苷酸最优选为核糖核酸(RNA)或脱氧核糖核酸(DNA)。
多核苷酸可以是任何长度。例如,多核苷酸可以是至少10个,至少50个,至少100个,至少150个,至少200个,至少250个,至少300个,至少400个或至少500个核苷酸或核苷酸对的长度。多核苷酸可以是1000或更多个核苷酸或核苷酸对,5000或更多个核苷酸或核苷酸对的长度或100000或更多个核苷酸或核苷酸对的长度。
可以研究任何数量的多核苷酸。例如,本发明的方法可涉及表征2,3,4,5,6,7,8,9,10,20,30,50,100或更多个核苷酸。如果两个或更多个多核苷酸被表征,则它们可以是不同的多核苷酸或相同多核苷酸的两种情形。
多核苷酸可以是天然存在的或人造的。例如,所述方法可以用于验证制造的寡核苷酸的序列。所述方法通常在体外进行。
样品
每个分析物通常存在于任何合适的样品中。本发明通常针对已知含有或怀疑含有分析物的两个或更多个样品实施。替换地,本发明可以对两个或更多个样品实施,以确认对已知或预期存在于样品中的两个或更多个分析物的鉴别。
所述样品可以是生物样品。本发明可以使用至少一种从任何生物体或微生物获得或提取的样品体外进行。所述生物体或微生物通常是古菌(archaeal)、原核的或真核的,并且通常属于以下五界之一:植物界、动物界、真菌、原核生物界和原生生物。本发明针对从任何病毒中获得或提取的样品在体外实施。所述样品优选是液体样品。样品通常包括患者的体液。所述样品可以是尿液、淋巴液、唾液、粘液或羊水,但优选血液、血浆或血清。通常,所述样品来源于人,但替代地,其可以来自其他哺乳动物,如来自商业上养殖的动物如马、牛、羊、鱼、鸡或猪,或者可以是宠物如猫或狗。或者,第一样品和/或第二样品可以是植物来源的,例如从商业作物获得的样品,例如谷类、豆类、水果或蔬菜,如小麦、大麦、燕麦、油菜、玉米、大豆、大米、大黄、香蕉、苹果、西红柿、土豆、葡萄、烟草、菜豆、扁豆、甘蔗、可可、棉花。
样品可以是非生物样品。非生物样品优选为流体样品。非生物样品的实例包括手术液,饮用水、海水或河水等水,以及实验室试验用试剂。
样品通常在本发明使用之前进行处理,例如通过离心,或经由膜过滤掉不想要的分子或细胞如红细胞。样品可以在取出后立即测量。样品也可以典型地在测定之前储存,优选低于-70℃。
表征
该方法可涉及测量多核苷酸的二个、三个、四个或五个或更多个特征。一个或多个特征优选选自(i)多核苷酸的长度,(ii)多核苷酸的同一性,(iii)多核苷酸的序列,(iv)二核苷酸的二级结构,和(v)多核苷酸是否被修饰。可以根据本发明测量(i)至(v)的任何组合,例如{i},{ii},{iii},{iv},{v},{i,ii},{i,iii},{i,iv},{i,v},{ii,iii},{ii,iv},{ii,v},{iii,iv},{iii,v},{iv,v},{i,ii,iii},{i,ii,iv},{i,ii,v},{i,iii,iv},{i,iii,v},{i,iv,v},{ii,iii,iv},{ii,iii,v},{ii,iv,v},{iii,iv,v},{i,ii,iii,iv},{i,ii,iii,v},{i,ii,iv,v},{i,iii,iv,v},{ii,iii,iv,v}或{i,ii,iii,iv,v}。可以测量与第二多核苷酸相比而言的第一多核苷酸的(i)至(v)的不同组合,包括以上所列的任何组合。
对于(i),多核苷酸的长度可以例如通过确定多核苷酸与孔之间的相互作用的次数或多核苷酸与孔之间的相互作用的持续时间来测量。
对于(ii),多核苷酸的同一性可以以多种方式测量。多核苷酸的同一性可以结合多核苷酸序列的测量来测量或不结合多核苷酸序列的测量来测量。前者较简单;对多核苷酸进行测序,从而识别出。后者可以通过几种方式完成。例如,可以测量多核苷酸中特定基序的存在(不测量多核苷酸的其余序列)。或者,该方法中可以测量特定电和/或光信号来识别来自特定来源的多核苷酸。
对于(iii),可以如前所述确定多核苷酸的序列。Stoddart D等人,Proc NatlAcad Sci,12;106(19):7702-7,Lieberman KR等人,J Am Chem Soc.2010;132(50):17961-72和国际申请WO 2000/28312中描述了合适的测序方法,特别是使用电测量的测序方法。
对于(iv),所述二级结构可以以各种方式测量。例如,如果该方法涉及电测量,则可以使用停留时间的变化或流过孔的电流的变化来测量二次结构。这可以区分单链和双链多核苷酸的区域。
对于(v),可以测量是否存在任何修饰。该方法优选包括通过甲基化、氧化、损伤、用一个或多个蛋白质或用一个或多个标记物、标签或间隔区,来确定多核苷酸是否被修饰。特异性修饰将导致与孔的特异性相互作用,其可以使用下述方法测量。例如,可以基于在甲基胞嘧啶与每个核苷酸相互作用期间流过孔的电流,将甲基胞嘧啶与胞嘧啶区别开。
目标多核苷酸与本发明的异源寡聚孔接触。孔通常存在于膜中。合适的膜在下面论述。该方法可以使用适用于研究膜/孔系统——其中孔存在于膜中——的任何设备来进行。该方法可以使用适用于跨膜孔感测的任何设备来进行。例如,该设备包括含有水性溶液的腔室和将所述腔室分为两个部分的屏障。所述屏障通常具有形成包含所述孔的膜的孔洞。或者,所述屏障形成存在有所述孔的所述膜。
该方法可以使用在国际申请号PCT/GB08/000562(WO 2008/102120)中描述的设备来实施。
可以进行各种不同类型的测量。这包括但不限于:电测量和光学测量。可能的电测量包括:电流测量,阻抗测量,隧道测量(tunnelling measurement)(Ivanov AP等人,NanoLett.2011 Jan 12;11(1):279-85)和FET测量(国际申请WO 2005/124888)。光学测量可以与电测量结合(Soni GV等人,Rev Sci Instrum.2010 Jan;81(1):014301)。测量可以是跨膜电流测量,例如流经孔的离子电流的测量。
可以使用标准单通道记录设备进行电测量,如Stoddart D等人,Proc Natl AcadSci,12;106(19):7702-7,Lieberman KR等人,J Am Chem Soc.2010;132(50):17961-72和国际申请WO 2000/28312中所述。或者,可以使用多通道系统进行电测量系统,例如国际申请WO 2009/077734和国际申请WO 2011/067559中所述。
该方法优选以跨膜施加的电位进行。所施加的电位可以是电压电位。或者,施加的电位可以是化学电位。这方面的一个例子是跨膜使用盐梯度,所述膜例如两亲层。在Holden等人,J Am Chem Soc.2007 Jul 11;129(27):8650-5中公开了盐梯度。在某些情况下,使用多核苷酸相对于孔移动时通过孔的电流来估计或确定多核苷酸的序列。这就是链测序。
该方法可以包括测量多核苷酸相对于孔移动时通过孔的电流。因此,该方法中使用的设备还可以包括能够穿过膜和孔施加电位和测量电信号的电路。该方法可以使用膜片钳或电压钳进行。这些方法优选涉及使用电压钳。
本发明的方法可以包括测量多核苷酸相对于孔移动时通过该孔的电流。测量通过跨膜蛋白孔的离子电流的合适条件是本领域已知的并且在实施例中公开。该方法通常通过跨膜和孔施加电压而进行。所使用的电压通常为+5V至-5V,例如从+4V至-4V,+3V至-3V或+2V至-2V。所使用的电压通常为-600mV至+600mV或-400mV至+400mV。所使用的电压优选在具有选自-400mV,-300mV,-200mV,-150mV,-100mV,-50mV,-20mV和0mV的下限和独立地选自+10mV,+20mV,+50mV,+100mV,+150mV,+200mV,+300mV和+400mV的上限的范围内。所使用的电压更优选在100mV至240mV的范围内,最优选在120mV至220mV的范围内。通过使用增加的施加电位,可以增加通过孔对不同核苷酸之间的识别。
该方法通常在任何电荷载体例如金属盐,例如碱金属盐,卤化物盐,如氯化物盐,如碱金属氯化物盐的存在下进行。电荷载体可以包括离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基咪唑鎓氯化物。在上述示例性设备中,盐存在于腔室内的水性溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl)或亚铁氰化钾和铁氰化钾的混合物。KCl、NaCl和亚铁氰化钾和铁氰化钾的混合物是优选的。跨膜的电荷载体可以是不对称的。例如,在膜的每一侧上,电荷载体的类型和/或浓度可以不同。
盐浓度可处于饱和状态。盐浓度可以为3M或更低,通常为0.1至2.5M,0.3至1.9M,0.5至1.8M,0.7至1.7M,0.9至1.6M或1M至1.4M。盐浓度优选为150mM至1M。该方法优选使用至少0.3M的盐浓度进行,例如至少0.4M,至少0.5M,至少0.6M,至少0.8M,至少1.0M,至少1.5M,至少2.0M,至少2.5M或至少3.0M。高的盐浓度提供高的信噪比并允许在正常电流波动的背景下,识别出代表核苷酸存在的电流。
该方法通常在存在缓冲液的情况下进行。在上述示例性设备中,缓冲液存在于腔室中的水性溶液中。本发明的方法中可以使用任何缓冲液。通常,缓冲液是磷酸盐缓冲液。其他合适的缓冲液是HEPES和Tris-HCl缓冲液。该方法通常在4.0至12.0,4.5至10.0,5.0至9.0,5.5至8.8,6.0至8.7或7.0至8.8或7.5至8.5的pH下进行。所使用的pH优选为约7.5。
该方法可以在0℃至100℃,15℃至95℃,16℃至90℃,17℃至85℃,18℃至80℃,19℃至70℃,或20℃至60℃进行。该方法通常在室温下进行。所述方法任选地在支持酶功能的温度下进行,例如约37℃。
多核苷酸结合蛋白
步骤(a)优选包括使多核苷酸与多核苷酸结合蛋白接触,使得所述蛋白控制多核苷酸通过孔的运动。
更优选地,该方法包括(a)使多核苷酸与本发明的孔和多核苷酸结合蛋白接触,使得所述蛋白控制多核苷酸通过孔的运动,和(b)当多核苷酸相对于孔移动时获取一个或多个测量值,其中测量值表示多核苷酸的一个或多个特征,从而表征多核苷酸。
多核苷酸结合蛋白可以是能够结合多核苷酸并控制其通过孔的运动的任何蛋白质。确定蛋白质是否结合到多核苷酸时本领域中较简单的。所述蛋白质通常与多核苷酸相互作用并且修饰多核苷酸的至少一种性质。该蛋白质可以通过将多核苷酸裂解以形成各单个的核苷酸或短链的核苷酸,例如二核苷酸或三核苷酸,来修饰所述多核苷酸。蛋白质可以通过将多核苷酸定向到或将其移动到特定的位置,即控制其运动,来修饰多核苷酸。
多核苷酸结合蛋白优选衍生自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用并修饰多核苷酸的至少一种性质的多肽。该酶可以通过将多核苷酸裂解以形成各单个的核苷酸或短链的核苷酸,例如二核苷酸或三核苷酸,来修饰所述多核苷酸。酶可以通过将多核苷酸定向到或将其移动到特定位置来修饰所述多核苷酸。多核苷酸处理酶不需要显示酶活性,只要其能够结合多核苷酸并控制其通过孔的运动即可。例如,该酶可以被修饰以除去其酶活性,或者可以在防止其作为酶起作用的条件下使用。这类条件将在下面更详细地论述。
多核苷酸处理酶优选衍生自溶核酶。在酶的构建体中使用的多核苷酸处理酶更优选地衍生自任何酶分类(EC)组3.1.11,3.1.13,3.1.14,3.1.15,3.1.16,3.1.21,3.1.22,3.1.25,3.1.26,3.1.27,3.1.30和3.1.31中的成员。该酶可以是国际申请号PCT/GB10/000133(公布号WO 2010/086603)中公开的任何酶。
优选的酶是聚合酶、核酸外切酶、解旋酶和拓扑异构酶,例如促旋酶。合适的酶包括但不限于,来自大肠杆菌的核酸外切酶I(SEQ ID NO:11),来自大肠杆菌的核酸外切酶III(SEQ ID NO:13),来自嗜热栖热菌的RecJ(SEQ ID NO:15),和细菌噬菌体λ核酸外切酶(SEQ ID NO:17),TatD核酸外切酶及其变体。包含SEQ ID NO:15所示序列或其变体的三个亚基相互作用,形成三聚体核酸外切酶。聚合酶可以是3173 DNA聚合酶(其可从Corporation商购得到),SD聚合酶(从商购得到)或其变体。该酶优选为Phi29 DNA聚合酶(SEQ ID NO:9)或其变体。拓扑异构酶优选为酶分类(EC)组5.99.1.2和5.99.1.3中的任何成员。
该酶最优选衍生自解旋酶,例如Hel308 Mbu(SEQ ID NO:18),Hel308 Csy(SEQ IDNO:19),Hel308(Tga),Hel308 Mhu(SEQ ID NO:21),TraI Eco(SEQ ID NO:22),XPD Mbu(SEQ ID NO:23)或其变体。本发明中可以使用任何解旋酶。解旋酶可以是或来自Hel308解旋酶,RecD解旋酶,如TraI解旋酶或TrwC解旋酶,XPD解旋酶或Dda解旋酶。解旋酶可以是国际申请PCT/GB2012/052579(公布号WO 2013/057495);PCT/GB2012/053274(公布号WO2013/098562);PCT/GB2012/053273(公布号WO 2013098561);PCT/GB2013/051925(公布号WO 2014/013260);PCT/GB2013/051924(公布号WO 2014/013259);PCT/GB2013/051928(公布号WO 2014/013262);PCT/GB2014/052736(公布号WO 2015/055981)和PCT/GB2015/052916中公布的任何解旋酶、经修饰的解旋酶或解旋酶构建体。
解旋酶优选包含SEQ ID NO:25(Trwc Cba)或其变体所示的序列,SEQ ID NO:18(Hel308 Mbu)或其变体所示的序列,或SEQ ID NO:24(Dda)或其变体所示的序列。变体可以以下对于跨膜孔所论述的任何方式不用于天然序列。SEQ ID NO:24的优选变体包括(a)E94C和A360C或(b)E94C,A360C,C109A和C136A,然后任选地(ΔM1)G1G2(即缺失M1,然后添加G1和G2)。
根据本发明可以使用任何数量的解旋酶。例如,可以使用1,2,3,4,5,6,7,8,9,10或更多个解旋酶。在一些实施方案中,可以使用不同数量的解旋酶。
本发明的方法优选包括使多核苷酸与两个或更多个解旋酶接触。所述两个或更多个解旋酶通常是相同的解旋酶。所述两个或更多个解旋酶可以是不同的解旋酶。
所述两个或更多个解旋酶可以是上述解旋酶的任何组合。所述两个或更多个解旋酶可以是两个或更多个Dda解旋酶。所述两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。所述两个或更多个解旋酶可以是同一解旋酶的不同变体。
所述两个或更多个解旋酶优选彼此连接。所述两个或更多个解旋酶更优选彼此共价连接。解旋酶可以以任何顺序并使用任何方法连接。用于本发明的优选的解旋酶构建体在国际申请No.PCT/GB2013/051925(公布号WO 2014/013260);PCT/GB2013/051924(公布号WO 2014/013259);PCT/GB2013/051928(公布号WO 2014/013262);PCT/GB2014/052736(公布号WO 2015/055981)和PCT/GB2015/052916中有描述。
SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的变体是具有以下氨基酸序列的酶:从SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列变化而来并且保持多核苷酸结合能力。这可以使用本领域已知的任何方法来测量。例如,变体可以与多核苷酸接触,并且其结合多核苷酸以及沿多核苷酸移动的能力可以测量。变体可以包括促进多核苷酸的结合和/或促进其在高盐浓度和/或室温下的活性的修饰。可以对变体进行修饰,使得它们结合到多核苷酸(即保留多核苷酸结合能力),但不起到解旋酶的作用(即,当提供有用以促进移动的所有必需组分例如ATP和Mg2+时,不沿多核苷酸移动)。这类修饰是本领域已知的。例如,解旋酶中Mg2+结合结构域的修饰通常导致不起解旋酶作用的变体。这些类型的变体可以用作分子制动器(见下文)。
在SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列的整个长度上,基于氨基酸相似性或同一性,变体将优选与该序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变体多肽可以与SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列在整个序列上至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%且更优选至少95%,97%或99%同源。在200或更多个,例如230,250,270,280,300,400,500,600,700,800,900或1000或更多个连续氨基酸的延伸段上,可以具有至少80%,例如至少85%,90%或95%的氨基酸相似性或同一性(“严格同源性”)。如上所述确定同源性。所述变体可以以上文参照SEQ ID NO:2和4论述的任何方式不同于野生型序列。酶可以共价连接到孔。可以使用任何方法将酶共价连接到孔上。
优选的分子制动器是TrwC Cba-Q594A(具有突变Q594A的SEQ ID NO:25)。该变体不具有解旋酶的作用(即,当提供有便于移动的所有必需组分,例如ATP和Mg2+时,可结合多核苷酸但不会沿其移动)。
在链测序中,所述多核苷酸顺着或逆着所施加电位移位穿过所述孔。逐渐地或进行性地作用于双链多核苷酸上的核酸外切酶可在施加的电位下用在所述孔的顺侧上使剩余的单链穿过,或者在反向电位下用在所述孔的反侧上使剩余的单链穿过。同样地,解开双链DNA的解旋酶也可以类似的方式使用。也可以使用聚合酶。还有可能用于需要使链逆着施加电位移位的测序应用中,但是在反向电位或没有电位的情况下DNA必须首先被所述酶“捕获”。然后随着在结合之后电位被切换回,所述链将从顺侧到反侧而穿过所述孔并通过电流保持延伸的构造。单链DNA核酸外切酶或单链DNA依赖性聚合酶可用作分子马达,用于将最近移位的单链以受控并逐步的方式逆着施加的电位从反侧到顺侧穿过所述孔而拉回。
所述方法中可以使用任何解旋酶。解旋酶可以两种模式相对于所述孔起作用。首先,所述方法优选使用解旋酶实施,使得所述解旋酶顺着由施加电压产生的场而移动所述多核苷酸穿过所述孔。在这种模式下,多核苷酸的5′端首先在孔中被捕获,然后解旋酶将多核苷酸移动到孔中,使得多核苷酸顺着所述场穿过所述孔,直到其最终移位穿至膜的反侧。替代地,所述方法优选以下述方式实施:使得解旋酶将多核苷酸逆着由施加电压产生的场移动穿过所述孔。在这种模式下,多核苷酸的3′端首先在孔中被捕获,然后解旋酶使多核苷酸移动穿过所述孔,使得多核苷酸逆着施加的场被拉出所述孔,直到其最终返回至膜的顺侧。
所述方法也可以按相反的方向实施。使多核苷酸的3′端首先在孔中被捕获,然后解旋酶可以将多核苷酸移动到所述孔中,使得多核苷酸顺着所述场穿过所述孔,直到其最终移位穿至膜的反侧。
当解旋酶不具有有助于移动的必要组分或被修饰为阻碍或阻止其移动时,所述解旋酶可以结合到多核苷酸,并在多核苷酸被所施加场拉入孔中时用作减缓多核苷酸的移动的制动器。在非活性模式下,多核苷酸是否在3′或5′端被捕获并不重要,是所施加的场用起制动器作用的酶朝着反侧将多核苷酸拉入孔中。当在非活性模式时,解旋酶对多核苷酸的移动控制可以多种方式描述,包括齿合(ratcheting)、滑动和制动。缺少解旋酶活性的解旋酶变体也可以这种方式使用。
所述多核苷酸可与多核苷酸结合蛋白及孔以任何顺序接触。优选的是,当多核苷酸与多核苷酸结合蛋白(如解旋酶)及孔接触时,多核苷酸首先与蛋白质形成复合物。然后当跨所述孔施加电压时,多核苷酸/蛋白质复合物与所述孔形成复合物,并控制多核苷酸穿过所述孔的移动。
使用多核苷酸结合蛋白的方法中的任何步骤通常在游离核苷酸或游离核苷酸类似物以及促进多核苷酸结合蛋白起作用的酶辅因子存在下实施。所述游离核苷酸可以是上述各多核苷酸中的任意一个或多个。所述游离核苷酸包括但不限于,腺苷单磷酸(AMP),腺苷二磷酸(ADP),腺苷三磷酸(ATP),鸟苷单磷酸(GMP),鸟苷二磷酸(GDP),鸟苷三磷酸(GTP),胸苷单磷酸(TMP),胸苷二磷酸(TDP),胸苷三磷酸(TTP),尿苷单磷酸(UMP),尿苷二磷酸(UDP),尿苷三磷酸(UTP),胞苷单磷酸(CMP),胞苷二磷酸(CDP),胞苷三磷酸(CTP),环状腺苷单磷酸(cAMP),环状鸟苷单磷酸(cGMP),脱氧腺苷单磷酸(dAMP),脱氧腺苷二磷酸(dADP),脱氧腺苷三磷酸(dATP),脱氧鸟苷单磷酸(dGMP),脱氧鸟苷二磷酸(dGDP),脱氧鸟苷三磷酸(dGTP),脱氧胸苷单磷酸(dTMP),脱氧胸苷二磷酸(dTDP),脱氧胸苷三磷酸(dTTP),脱氧尿苷单磷酸(dUMP),脱氧尿苷二磷酸(dUDP),脱氧尿苷三磷酸(dUTP),脱氧胞苷单磷酸(dCMP),脱氧胞苷二磷酸(dCDP)和脱氧胞苷三磷酸(dCTP)。所述游离核苷酸优选选自AMP,TMP,GMP,CMP,UMP,dAMP,dTMP,dGMP或dCMP。所述游离核苷酸优选为腺苷三磷酸(ATP)。所述酶辅因子为使构建体发挥功能的因子。所述酶辅因子优选为二价金属阳离子。所述二价金属阳离子优选为Mg2+,Mn2+,Ca2+或Co2+。所述酶辅因子最优选为Mg2+。
解旋酶(一个或多个)和分子制动器(一个或多个)
在优选的实施方案中,所述方法包括:
(a)提供多核苷酸,其具有一个或多个解旋酶和一个或多个分子制动器连接到所述多核苷酸;
(b)使所述多核苷酸与本发明的孔接触并跨所述孔施加电势,使得所述一个或多个解旋酶和所述一个或多个分子制动器联合在一起来控制所述多核苷酸通过所述孔的移动;
(c)当所述多核苷酸相对于所述孔移动时,获取一个或多个测量值,其中所述测量值表示所述多核苷酸的一个或多个特征,由此表征所述多核苷酸。
这类方法在国际申请PCT/GB2014/052737(公布号为WO2015/110777)中有详细论述。
所述一个或多个解旋酶可以是上文论述的任何解旋酶。所述一个或多个分子制动器可以是能结合到所述多核苷酸并减缓所述多核苷酸通过所述孔的移动的任何化合物或分子。所述一个或多个分子制动器优选包含能结合到所述多核苷酸的一种或多种化合物。所述一种或多种化合物优选为一种或多种大环化合物。合适的大环化合物包括,但不限于,环糊精、杯芳烃、环肽、冠醚、葫芦脲、柱芳烃、其衍生物或其组合。所述环糊精或其衍生物可以是任何在Eliseev,A.V.,and Schneider,H-J.(1994)J.Am.Chem.Soc.116,6081-6088中公开的那些。该试剂更优选为七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。
所述一个或多个分子制动器优选为一个或多个单链结合蛋白(SSB)。所述一个或多个分子制动器更优选为包含不具有净负电荷的羧基末端(C-末端)区域的单链结合蛋白(SSB),或为(ii)C-末端区域中包含能减少C-末端区域的净负电荷的一个或多个修饰的经修饰SSB。所述一个或多个分子制动器最优选为在国际申请No.PCT/GB2013/051924(公布号为WO 2014/013259)中公开的任何SSB。
所述一个或多个分子制动器优选为一个或多个多核苷酸结合蛋白。所述多核苷酸结合蛋白可以是能够结合到多核苷酸并控制其移动通过所述孔的任何蛋白质。现有技术中可直接确定蛋白质是否结合到多核苷酸。所述蛋白通常与多核苷酸相互作用并修饰所述多核苷酸的至少一种特性。所述蛋白可通过使多核苷酸裂解形成各单个核苷酸或短链核苷酸,如二核苷酸或三核苷酸,来修饰所述多核苷酸。该部分可以通过将多核苷酸定向或将其移动到特定位置,即控制其移动,来修饰所述多核苷酸。
所述多核苷酸结合蛋白优选衍生自多核苷酸处理酶。所述一个或多个分子制动器可以衍生自上述的任何多核苷酸处理酶。用作分子制动器的Phi29聚合酶的经修饰的变体(SEQ ID NO:8)在美国专利No.5576204中公开。充当分子制动器的Phi29聚合酶的经修饰的变体(SEQ ID NO:8)在美国专利5,576,204中有公开。所述一个或多个分子制动器优选衍生自解旋酶。
可以使用任何数目的衍生自解旋酶的分子制动器。例如,可以使用1、2、3、4、5、6、7、8、9、10或更多个解旋酶作为分子制动器。如果使用两个或更多个解旋酶作为分子制动器,所述两个或更多个解旋酶通常是相同的解旋酶。所述两个或更多个解旋酶可以是不同的解旋酶。
所述两个或更多个解旋酶可以是上文提到的解旋酶的任意组合。所述两个或更多个解旋酶可以是两个或更多个Dda解旋酶。所述两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。所述两个或更多个解旋酶可以是相同解旋酶的不同变体。
所述两个或更多个解螺旋酶优选彼此连接。所述两个或更多个解旋酶更优选彼此共价连接。所述解旋酶可以以任何顺序使用任何方法连接。从解旋酶衍生的所述一个或多个分子制动器优选被修饰以减少多核苷酸结合结构域域中开口的大小,所述多核苷酸可在至少一个构象状态下通过所述开口从解旋酶解绑。这在WO 2014/013260中公开。
用于本发明的优选的解旋酶构建体在国际申请No.PCT/GB2013/051925(公布号WO2014/013260);PCT/GB2013/051924(公布号WO 2014/013259)和PCT/GB2013/051928(公布号WO 2014/013262);和在PCT/GB2014/052736(公布号WO/2015/055981)中有描述。
间隔区
所述一个或多个解旋酶可以在一个或多个间隔区停滞,如在国际申请No.PCT/GB2014/050175(公布号WO 2014/135838)中论述的。本发明中可以使用在该国际申请中公开的一个或多个解旋酶和一个或多个间隔区的任意构造。
膜
本发明的孔可以存在于膜中。在本发明方法中,多核苷酸通常与本发明的孔在膜中接触。任何膜可以按照本发明使用。合适的膜是本领域公知的。所述膜优选为两亲层。两亲层是由具有亲水性和亲脂性的两亲分子形成的层,如磷脂。所述两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在本领域中是已知的,且包括,例如,嵌段共聚物(Gonzalez-Perez等人,Langmuir,2009,25,10447-10450)。嵌段共聚物是其中两个或更多个单体亚基一起聚合以生成单个聚合物链的聚合物材料。嵌段共聚物通常具有由每个单体亚基贡献的特性。然而,嵌段共聚物可具有由各个亚基形成的聚合物不具有的独特的特性。嵌段共聚物可以被加工,使得单体亚基中的一个是疏水性的(即亲脂的),而其他亚基在含水介质中是亲水性的。在这种情况下,该嵌段共聚物可具有两亲特性,并且可以形成模仿生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚基组成),但也可以由多于两个的单体亚基构成以形成充当两亲物的更复杂的排列。所述共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选为三嵌段共聚物膜。
古细菌双极四醚脂质是天然存在的脂质,其被构造为使得所述脂质形成单层膜。这些脂质通常在恶劣的生物环境、嗜热菌、嗜盐菌和嗜酸菌中生存的嗜极菌(extremophiles)中被发现。它们的稳定性被认为是从最终双层的融合性质中衍生的。比较简单的是,通过生成具有亲水性-疏水性-亲水性一般基序的三嵌段聚合物构造模仿这些生物实体的嵌段共聚物材料。所述材料可以形成行为类似于脂质双层且包含从囊泡到层状膜的一系列相行为的单体膜。由这些三嵌段共聚物形成的膜与生物脂质膜相比持有一些优点。因为三嵌段共聚物是合成的,因此可以仔细控制其确切构造以提供用于形成膜和与孔及其他蛋白相互作用所需的正确链长度和特性。
嵌段共聚物也可以从不被分类为脂质子材料的亚基构建;例如疏水性聚合物可从硅氧烷或其他非基于烃的单体制成。嵌段共聚物的亲水性子段也可具有低的蛋白质结合特性,这使得当暴露于未处理的生物样品时,其可生成高抗性的膜。该头部基团单元也可以从非经典的脂质头部基团衍生。
三嵌段共聚物膜与生物脂质膜相比,还具有增强的机械稳定性和环境稳定性,例如高得多的操作温度或pH范围。嵌段共聚物的合成性质为定制用于广泛应用范围的基于聚合物的膜提供了平台(platform)。
所述膜最优选为在国际申请No.PCT/GB2013/052766(公布号WO 2014/06443)或PCT/GB2013/052767(公布号WO/2014/064444)中公开的膜之一。
所述两亲分子可以是经化学修饰的或官能化的以有助于多核苷酸的耦合。
该两亲层可以是单层或双层。两亲层通常是平面的。两亲层可以是弯曲的。两亲层可以被支撑。
两亲膜通常天然是移动的,本质上充当具有约10-8cm s-1的脂质扩散速率的二维流体。这意味着孔和耦合的多核苷酸通常在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,并充当用于一系列实验研究的优秀的平台。例如,脂质双层可通过单通道记录用于膜蛋白的体外研究。或者,脂质双层可用作生物传感器以检测一系列物质的存在。脂质双层可以是任何脂质双层。合适的脂质双层包括,但不限于,平面脂双层、支撑双层或脂质体。脂质双层优选平面脂质双层。合适的脂质双层在国际申请No.PCT/GB08/000563(公布号WO 2008/102121)、国际申请No.PCT/GB08/004127(公布号WO2009/077734)和国际申请No.PCT GB2006/001057(公布号WO 2006/100484)中公开。
偶联
多核苷酸优选与包含本发明的孔的膜偶联。该方法可以包括将多核苷酸与包含本发明的孔的膜偶联。多核苷酸优选使用一个或多个锚偶联到膜上。多核苷酸可以使用任何已知的方法与膜偶联。合适的偶联方法在国际申请号No.PCT/GB2012/051191(公布号WO2012/164270)和PCT/GB2015/050991(公布号WO 2015/150786)中有公开。
双链多核苷酸
所述多核苷酸可以是双链的。如果多核苷酸是双链的,则在接触步骤之前,所述方法优选进一步包括将桥连部分,例如,发夹环,接合到所述多核苷酸的一端。然后所述多核苷酸的两条链可在所述多核苷酸与本发明的孔接触时或接触之前分离。当多核苷酸穿过所述孔的移动是由多核苷酸结合蛋白,如解旋酶或分子制动器控制时,所述两条链可以被分离。
以这种方式连接并询问双链构建体上的两条链提高了表征的效率和准确性,如PCT/GB2010/000160(公布号WO 2010/086622)和PCT/GB2012/051786(公布号WO 2013/014451)中所述。
修饰的多核苷酸
在表征之前,目标多核苷酸可通过使该多核苷酸与聚合酶和一组游离核苷酸在其中所述聚合酶使用所述目标多核苷酸作为模板形成经修饰多核苷酸的条件下接触而进行修饰,其中所述聚合酶在形成所述经修饰的多核苷酸时将目标多核苷酸中的一个或多个核苷酸物质用不同核苷酸物质替代。然后,可对经修饰多核苷酸提供一个或多个连接到该多核苷酸的解旋酶和一个或多个连接到该多核苷酸的分子制动器。这类修饰在国际申请PCT/GB2015/050483(公布号WO2015/124935)中进行了描述。上面论述的任何聚合酶均可以使用。聚合酶优选为Klenow或9°North。
其他表征方法
在另一个实施方案中,通过检测被标记的且当聚合酶将核苷酸插入多核苷酸时释放的物质来表征所述多核苷酸。所述聚合酶使用所述多核苷酸作为模板。各个标记的物质对每个核苷酸具有特异性。使所述多核苷酸与本发明的孔、聚合酶和标记的核苷酸接触,使得在核苷酸通过聚合酶添加到所述多核苷酸(一个或多个)时,磷酸盐标记的物质依次释放,其中磷酸盐物质包含对每个核苷酸特异性的标记物。所述聚合酶可以是任何上文论述的聚合酶。使用所述孔检测磷酸盐标记的物质,从而表征所述多核苷酸。这类方法在欧洲申请No.13187149.3(公布号EP2682460)中有公开。上文论述的任何实施方案同样适用于该方法。
试剂盒
本发明还提供了一种用于特征目标多核苷酸的试剂盒。所述试剂盒包括本发明的异源寡聚孔和膜的组分。所述膜优选由所述组分形成。所述孔优选存在于所述膜中。所述试剂盒可以包含上文公开的任何膜(例如两亲层或三嵌段共聚物膜)的组分。
所述试剂盒还可以包含多核苷酸结合蛋白。
所述试剂盒可以进一步包含用于将多核苷酸与膜偶联的一个或多个锚。
所述试剂盒优选用于表征双链多核苷酸,并且优选包含Y适配器和桥接部分适配器,例如发夹环适配器。Y适配器优选具有一个或多个连接的解旋酶,并且桥接部分适配器或发夹环适配器优选具有连接的一个或多个分子制动器。Y适配器优选包含用于将多核苷酸与膜偶联的一个或多个第一锚,桥接部分适配器或发夹环适配器优选包含用于将多核苷酸与膜偶联的一个或多个第二锚,并且桥接部分适配器或发夹环适配器与膜偶联的强度优选大于Y适配器与膜偶联的强度。
本发明的试剂盒还可以包含一种或多种使上述任何实施方案能够进行的其他试剂或仪器。这类试剂或仪器包括以下中的一种或多种:合适的缓冲液(一种或多种;水性溶液),从受试者获得样品的工具(例如包含针的容器或仪器),用于扩增和/或表达多核苷酸的工具,或者电压钳或膜片钳设备。试剂可以干燥状态存在于试剂盒中,使得流体样品重新悬浮所述试剂。所述试剂盒还可以任选地包括使试剂盒能够用于本发明方法的说明书,或关于该方法可以用于哪种生物体的详细资料。
设备
本发明还提供了用于表征目标多核苷酸的设备。该设备包括多个本发明的异源寡聚孔和包括多个膜。所述的多个孔优选存在于所述多个膜中。孔和膜的数量优选相等。优选地,每个膜中存在单个孔。
所述设备优选进一步包括用于实施本发明方法的说明书。所述设备可以是任何用于多核苷酸分析的常规设备,例如阵列或芯片。上面论述的关于本发明方法的任何实施方案同样适用于本发明的设备。所述设备可以进一步包括存在于本发明试剂盒中的任何特征。
所述设备优选被设置成用于实施本发明方法。
所述设备优选包括:
传感器装置,其能够支持所述多个孔和膜并且可操作为使用所述孔和膜来实施多核苷酸表征;和
至少一个端口,其用于传输实施表征所用的材料。
或者,所述设备优选包括:
传感器装置,其能够支持所述多个孔和膜并可操作为使用所述孔和膜来实施多核苷酸表征;和
至少一个存储器,用于容纳实施表征所用的材料。
所述设备更优选包括:
传感器装置,其能够支持所述膜和多个孔和膜并可操作为使用所述孔和膜来实施多核苷酸表征;
至少一个存储器,其用于容纳实施表征所用的材料;
流体系统,其配置成将材料从至少一个所述存储器可控地供应到所述传感器装置;和
一个或多个容器,其用于接收各个样品,所述流体系统被配置成将所述样品选择性地从一个或多个容器供应到所述传感器装置。
所述设备可以是在国际申请No.PCT/GB08/004127(公布号WO 2009/077734),PCT/GB10/000789(公布号WO 2010/122293),国际申请No.PCT/GB10/002206(公布号WO 2011/067559)或国际申请No.PCT/US99/25679(公布号WO 00/28312)中描述的任何设备。
形成传感器的方法
本发明还提供了形成用于表征目标多核苷酸的传感器的方法。该方法包括在本发明的异源寡聚孔和多核苷酸结合蛋白(例如解旋酶或核酸外切酶)之间形成复合物。所述复合物可以通过在目标多核苷酸的存在下使所述孔和所述蛋白接触然后跨所述孔施加电位而形成。所施加的电位可以是如上所述的化学电位或电压电位。或者,述复合物可以通过将所述孔共价连接到所述蛋白而形成。用于共价连接的方法是本领域已知的,并且例如在国际申请No.PCT/GB09/001679(公布号WO 2010/004265)和PCT/GB10/000133(公布号WO2010/086603)中公开。所述复合物是用于表征目标多核苷酸的传感器。所述方法优选包括在本发明的异源寡聚孔和解旋酶之间形成复合物。上述任何实施方案同样适用于该方法。
本发明还提供了用于表征目标多核苷酸的传感器。该传感器包括本发明的异源寡聚孔与多核苷酸结合蛋白之间形成的复合物。上述任何实施方案同样适用于本发明的传感器。
以下实施例示意说明本发明。
实施例1
该实施例描述了用于纯化MspA异源寡聚孔的按比例放大的大肠杆菌纯化方法。下面描述了突变的异源寡聚纳米孔MspA 1=MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL)1(SEQ ID NO:2,在七个单体中具有以下突变:D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K且在七个单体中具有以下氨基酸的缺失:L74/G75/D118/L119,以及在一个单体中具有以下突变:D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL,其中BasTL具有SEQ ID NO:26并且连接在C末端,且在一个单体中就有以下氨基酸的缺失:L74/G75/D118/L119)的制备。该方法适用于制备其他异源寡聚纳米孔。
合成编码MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K)(SEQ ID NO:2,在单体中具有以下突变:D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K和在单体中具有以下氨基酸的缺失:L74/G75/D118/L119)的多肽的DNA(SEQID NO:27)(GenScript USA Inc.)并克隆到含有卡那霉素抗性基因的pRham载体中。pRham载体的蛋白质表达可以由鼠李糖诱导。合成编码多肽的DNA(SEQ ID NO:28)MspA-(Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL/H6)(SEQ ID NO:2,单体中具有以下突变:D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL,其中BasTL具有SEQ ID NO:26,并连接到C末端,六个组氨酸(H6)连接到C末端的BasTL的3’端,并且在一个单体中具有以下氨基酸的缺失:L74/G75/D118/L119)(GenScript USA Inc)并克隆到含有氨苄青霉素抗性基因的pT7载体中。可以通过IPTG(异丙基β-D-硫代半乳糖吡喃糖苷)诱导pT7载体的蛋白质表达。将两种DNA溶液的浓度调节至400ng/uL。然后将两种DNA溶液以1∶1的比例混合在一起,并使用1uL该混合物转化Lemo21(DE3)感受态的(competent)大肠杆菌细胞(50μl,NEB,目录号C2528H)。然后将转化的细胞用SOC培养基(100μl)在37℃下搅拌培育2小时。然后将细胞接种(plated out)在含有氨苄青霉素(0.1mg/ml)和卡那霉素(0.034mg/ml)的LB琼脂上,并在37℃培育约16小时。
在含有氨苄青霉素和卡那霉素的LB平板中生长的细菌菌落已经用两种质粒进行了转化:含有MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K)的DNA的PRham和含有MspA-(Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL/H6)的DNA的pT7。使用一个这样的菌落来接种含有氨苄青霉素(0.1mg/ml)和卡那霉素(0.034mg/ml)的Terrific Broth(TB)培养基(10mL)的起子培养物(starter culture)。所述起子培养物在37℃搅拌下生长直到OD600达到0.8-1.0。然后使用1mL起子培养物接种500mL含有氨苄青霉素(0.1mg/ml)和卡那霉素(0.034mg/ml)的TB培养基。培养物在37℃搅拌下生长直到OD600达到0.8-1.0。然后将培养物的温度调节至18℃,并通过添加IPTG(0.5mM终浓度)和鼠李糖(1.5%终浓度)引发诱导。在18℃搅拌下进行约18小时的诱导。
诱导后,通过以6,000g离心30分钟使培养物沉淀(was pelleted)。然后将沉淀(pellet)重悬于50mM Tris pH9.0(每克沉淀约12.5ml缓冲液)中。将悬浮液充分混合直到其完全均匀。通过超声处理(开启6×30秒,关闭6×30秒)进行细胞裂解。将DDM加入到细胞裂解物中至1%终浓度,并在频繁拌和下将混合物在37℃下培育45分钟。通过以20,000g离心45分钟使裂解物沉淀,然后分离上清液。含有不同寡聚物的单体和混合物两种形式的上清液通过如下所述的柱色谱法纯化。
将样品用50mM Tris,500mM NaCl,0.1%DDM,pH 8.0(缓冲液A)以1∶1稀释,并施加到5ml His Crude FF柱(GE Healthcare)上。将柱洗涤直到维持10个柱体积的稳定基线。通过用15mM咪唑(Sigma/Aldrich Biopuriss等级)洗涤所述柱除去松散结合的蛋白质直到保持稳定的基线。用200mM咪唑(Sigma/Aldrich Biopuriss等级)进行洗脱。
合并洗脱峰,加热至85℃达15分钟以除去热不稳定的污染蛋白质。然后将加热的溶液在20,000g下离心10分钟,弃去沉淀。将上清液在缓冲液A中在120ml Sephadex S200柱(GE Healthcare)上以1ml/min进行凝胶过滤。样品以约60ml体积洗脱。洗脱峰在10%TGX(Bio Rad)上运行,以确认感兴趣的MspA1的异源孔的存在。将所鉴定的级分合并,接着进行进一步纯化。
将样品在缓冲液A中加载到1ml His HP柱(GE Healthcare)上。一旦稳定的基线维持10个柱体积,则用15mM咪唑(Sigma/Aldrich Biopuriss等级)洗涤该柱。在60分钟内用15mM咪唑至80mM咪唑(Sigma/Aldrich Biopuriss等级)的梯度以1ml/min洗脱MspA 1。通过将洗脱中的咪唑浓度增加至100mM,洗脱含有多于一个His标签的异源孔的其他构象。
下面列出的异源寡聚纳米孔也是使用该方法制备。在每种情况下,将编码非标记亚基的DNA克隆到pRham载体中,并将编码含有BasTL-H6的亚基的DNA克隆到pT7载体中,然后如上述实施例中所述进行纯化。
MspA 2=MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO:2,在七个单体中具有以下突变:
D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K,并且在七个单体中具有以下氨基酸的缺失:L74/G75/D118/L119,以及在一个单体中具有以下突变:
D56N/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BasTL/H6,其中,所述BasTL具有SEQ ID NO:26,所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端,在一个单体中具有以下氨基酸的缺失:L74/G75/D118/L119)
MspA 3=MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91G/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO:2,在七个单体中具有以下突变:
D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K并且在七个单体中具有以下氨基酸的缺失:L74/G75/D118/L119,以及在一个单体中具有以下突变:
D56N/E59R/L88N/D91G/N108P/Q126R/D134R/E139K/BasTL/H6,其中,所述BasTL具有SEQ ID NO:26,所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端,在一个单体中具有以下氨基酸的缺失:L74/G75/D118/L119)
MspA 4=MspA-((Del-L74/G75/D118/L119)D56F/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56F/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO:2,在七个单体中具有以下突变:
D56F/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K并且在七个单体中具有以下氨基酸的缺失:L74/G75/D118/L119,以及在一个单体中具有以下突变:
D56F/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BasTL/H6,其中,所述BasTL具有SEQ ID NO:26,所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端,在一个单体中具有以下氨基酸的缺失:L74/G75/D118/L119)
MspA 5=MspA-((Del-L74/G75/D118/L119)D56F/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56F/E59R/L88N/D91G/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO:2,在七个单体中具有以下突变:
D56F/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K并且在七个单体中具有以下氨基酸的缺失:L74/G75/D118/L119,以及在一个单体中具有以下突变:
D56F/E59R/L88N/D91G/N108P/Q126R/D134R/E139K/BasTL/H6,其中,所述BasTL具有SEQ ID NO:26,所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端,在一个单体中具有以下氨基酸的缺失:L74/G75/D118/L119)
MspA 7=MspA-((Del-L74/G75/D118/L119)(D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)(D56N/E59R/L88N/D91Q/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO:2,在七个单体中具有以下突变:
D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K并且在七个单体中具有以下氨基酸的缺失:L74/G75/D118/L119,以及在一个单体中具有以下突变:
D56N/E59R/L88N/D91Q/N108P/Q126R/D134R/E139K/BasTL/H6,其中,所述BasTL具有SEQ ID NO:26,所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端,在一个单体中具有以下氨基酸的缺失:L74/G75/D118/L119)
纯化的MspA 2的一个实例如图1所示。蛋白质在10%TGX凝胶(BioRad)中分析,并用考马斯染色(coomasie staining)而显现。泳道3显示了纯化的MspA-2,其具有对应于由8个单体单元寡聚而构成的异源寡聚孔的条带。泳道4显示经热处理后的纯化MspA-2,所述热处理将孔分解成其单体单元。在泳道4中观察到两个条带——一个条带对应于连接了BasTL-H6的单体单元(条带B),一个条带对应于没有连接BasTL-H6的单体单元。这说明泳道8中的纯化孔分解成两个不同的单体单元,这证明已经形成了MspA-2异源孔。
实施例2
该实施例描述了对照实验,其显示了两个单体的共转化和随后的受控表达是获得感兴趣的异源孔所必需的。单独转化但在相同培养物中一起生长的两个亚基不产生异源寡聚孔。
将编码多肽的DNA(SEQ ID NO:27)MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R//D134R/E139K)(SEQ ID NO:2,在单体中具有以下突变:D56N/E59R/L88N/D90N/D91N/Q126R//D134R/E139K,并且在单体中具有以下氨基酸的缺失:L74/G75/D118/L119)和编码多肽的DNA(SEQ ID NO:28)MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/Q126R//D134R/E139K)(SEQ ID NO:2,在单体中具有以下突变:D56N/E59R/L88N/D91N/Q126R//D134R/E139K,并且在单体中具有以下氨基酸的缺失:L74/G75/D118/L119)克隆到含有氨苄青霉素抗性基因的pT7载体中。将这两个编码多肽的DNA分别转化到BL21 DE3 PlysS感受态细胞中。通过用来自每个转化体的单个菌落接种含有0.1mg/ml氨苄青霉素的10ml的TB培养基来制备起子培养物。起子培养物在37℃搅拌下生长至OD600为0.8。通过添加1ml每个亚基的起子培养物,用两个亚基接种含有0.1mg/ml氨苄青霉素的500ml TB培养基。使接种的培养物生长至OD600为0.8。一旦达到所需的OD600,将培养物冷却至18℃,并通过添加1mM IPTG诱导。然后将培养物在18℃下搅拌培育8小时。
培育后,将样品进行裂解作为标准——通过以6,000g离心30分钟使培养物沉淀,将沉淀重新悬浮于50mM Tris pH9(约12.5ml/克沉淀)中。将悬浮液混合直至完全均匀。细胞裂解通过超声处理进行(开启6x30秒,关闭6x30秒)。将DDM加入到裂解物中(1%终浓度),然后在频繁拌和下在37℃培育45分钟。通过在20,000g离心45分钟使裂解物沉淀。然后将样品在加热至85℃之前和之后在7.5%Tris HCl凝胶上可视化,以确定是否形成异源孔。
对于所有测试的样品,没有观察到异源孔。这证实了将相同的细菌细胞用编码两个亚基的所述DNA进行共转化,并随后以受控方式诱导表达是获得感兴趣的异源孔所必需的。
实施例3
该实施例描述了为了确定有利于形成稳定的7∶1异源孔的最佳IPTG:鼠李糖的比例而研究的许多不同条件。
简言之,含有编码MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)(SEQ ID NO:2,在单体中具有以下突变:D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K,并且在单体中具有以下氨基酸的缺失:L74/G75/D118/L119)的多肽的DNA(SEQ ID NO:29)的pRham载体和含有编码MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BastL/H6)(SEQ ID NO:2,在单体中具有以下突变:D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K,其中BasTL具有SEQ IDNO:26并且连接到C末端,所述六个组氨酸(H6)连接到BasTL的C末端的3’端,并且在单体中具有以下氨基酸的缺失:L74/G75/D118/L119)的多肽的DNA(SEQ ID NO:30)的pT7载体共转化为Lemo21(DE3)感受态大肠杆菌细胞并在含有0.1mg/ml氨苄青霉素和0.034mg/ml卡那霉素的500ml TB培养基中生长,如实施例1中所述。一旦培养物达到OD600为0.85,则将其等分成14×10ml子培养物。用如下所示不同量的鼠李糖和IPTG诱导每个子培养物:
1)0.5%鼠李糖/1mM IPTG
2)1%鼠李糖/1mM IPTG
3)1%鼠李糖/0.5mM IPTG
4)1.5%鼠李糖/1mM IPTG
5)1.5%鼠李糖/0.5mM IPTG
6)2%鼠李糖/1mM IPTG
7)2%鼠李糖/0.5mM IPTG
8)3%鼠李糖/1mM IPTG
9)3%鼠李糖/0.5mM IPTG
10)1%鼠李糖/0.25mM IPTG
11)0.5%鼠李糖/0.5mM IPTG
12)0.5%鼠李糖/0.25mM IPTG
13)0%鼠李糖/1mM IPTG
14)0.5%鼠李糖/0mM IPTG
在18℃搅拌下进行约18小时的诱导。通过在6,000g离心30分钟使培养物沉淀。将沉淀重悬于50mM Tris pH9(约12.5ml/克沉淀)中。将悬浮液混合直到完全均匀。通过超声处理进行细胞裂解(开启6×30秒,关闭6×30秒)。将DDM加入到细胞裂解物中(1%终浓度),然后在频繁拌和下在37℃下培育45分钟。通过在20,000g离心45分钟使裂解物沉淀。
溶解后,将样品按照制造商所说明的在Qiagen NiNTA琼脂糖珠上批量纯化。洗脱液分成两等份。将一个等份试样保持不加热,并将另一个等份加热至85℃,以评估两个样品在10%TGX(电泳槽(bio rad))凝胶上可视化之前的热稳定性。凝胶分析证实,具有1.5%鼠李糖和0.5mM IPTG的条件5时得到了最多量的稳定的兴趣MspA-2的异源孔。
实施例4
该实施例描述了,如何研究许多不同标签它们改变单体寡聚效率的能力。为了本实验的目的,将不同长度和电荷的不同标签添加到MspA单体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(SEQ ID NO:2,具有以下突变:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)的N或C终端。通过本领域已知的PCR方法产生这种构建体的DNA。通过QIAGEN Plasmid Midi Kit(目录号12145)制备含有T7启动子和有或没有标签的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(SEQID NO:2,具有以下突变:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)的DNA的环状DNA质粒,并将样品的浓度调节至400ng/uL。通过使用用于环状DNA的大肠杆菌T7-S30提取系统(Promega,No.L1130),通过偶联的体外转录和翻译(IVTT)产生蛋白质。使用制备的兔红细胞膜(rRBCM)来促进单体寡聚成为其寡聚物。将感兴趣单体的DNA(16ul,400ng/ul)用于100uL IVTT反应,产生同源寡聚孔——其中寡聚物中的所有单体均相同。将两个单体的DNA(例如:标记和未标记的版本)以特定比例混合在一起,并将该DNA混合物(16μl,400ng/uL)用于100uL IVTT反应,以产生异源寡聚孔。根据所使用的DNA的比例(未标记的:标记的),在反应中产生一系列异源寡聚物(例如:8∶0,7∶1,6∶2,5∶3等)。因此,调整两个单体之间的DNA的比例以偏向所产生的所需的寡聚孔(例如:8∶0,7∶1中的多个而不是3∶5,2∶6)。
为了在IVTT中产生蛋白质,将50uL的rRBCM(10mM Mops pH 7.4,2mg/mL)在1.5mLEppendorf管中离心并除去上清液。将沉淀重新悬浮于进行100uL IVTT反应所需的IVTT试剂中。将试剂盒中提供的减去了半胱氨酸的完整氨基酸混合物(1mM)和减去了甲硫氨酸的完整氨基酸混合物(1mM),以等体积混合,产生用于产生高浓度蛋白质所需的工作氨基酸溶液。将10uL该氨基酸混合物与预混合溶液(40uL),L-[35S]甲硫氨酸(2uL,PerkinElmer,商品编号NEG009A001MC),如上所述的质粒DNA(16uL,400ng/uL)和补充有利福平(最终20μg/ml)的T7-S30提取物(30uL)混合。在37℃进行1.5小时蛋白质合成,以产生放射性标记的IVTT蛋白质。由于在IVTT反应混合物中存在rRBCM和大肠杆菌细胞膜,所以在反应中合成的单体在膜上组装以产生同源或异源寡聚纳米孔。离心后,用MBSA(100uL,用NaOH滴定的10mMMOPS,150mM NaCl,pH 7.4,含有1mg/ml BSA)洗涤所得的膜沉淀物,并将沉淀重新悬浮于100uL的1xlaemmli样品缓冲液中。将样品分成两份,将一份样品在85℃加热15分钟以评估寡聚物的热稳定性。加热和/或未加热的样品用TGS运行缓冲液在5%或7.5%Tris HCl凝胶中在50mV进行电泳16小时。将凝胶干燥并进行放射自显影(autoradiography)以显现蛋白质。
4.1-标签长度的影响
通过改变标签的长度,可以偏向产生所需寡聚物。在以下的实施例中,将MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(SEQ ID NO:2,具有以下突变:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)用完整长度的BasTL(SEQ ID NO:26)和截断型的BasTL进行标记。将标记的单体寡聚成其同源寡聚物或与未标记的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(SEQ ID NO:2,具有以下突变:G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)混合,以产生异源寡聚物。将加热的样品在7.5%Tris HCl凝胶上运行(参见图2)。
图2的泳道A显示了MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8同源寡聚物。泳道C和E分别显示了MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去20aa))8和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去40aa))8的同源寡聚物。虽然在每个实验中使用相同量的DNA,但是与未标记的版本相比(图2中显示出更暗的条带的泳道A),当连接长多肽标签(BasTL为这种情况)(图2的泳道C和E)时,产生的同源寡聚物的量减少。图2的泳道B、D和F显示了当MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)分别与MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL),MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去20aa))和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去40aa))混合时产生的异源寡聚物。图2的每个泳道中的每个条带具有在相应条带旁边标记的凝胶中产生条带的单体单元的比例(未标记的单体:标记的单体)。结果表明,通过改变标签的长度,可以操纵所需的异源寡聚物的产生。
4.2标签电荷的影响
将MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体在N或C末端用不同长度的各种带电荷的标签进行修饰。在IVTT实验中分析了这些单体形成孔的能力。所测试的不同标签的完整列表包括R8SG,D6SG,R6SG,R8,NGDSD6SG,D4SG,R4SG,D4,D6,GDSGD4SG,R4H6,D4H6,D8,R6,D10,R4,D4,D8H6,R8H9,D10H6和R6H6。用D10H6,R8或R8H6标签标记的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体在下文和图3中更详细地描述。
图3展示了5%Tris HCl凝胶,其比较了当多种不同标签连接到MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体的C末端时该单体的寡聚。图3中的白色圆圈表示在每个通道中形成的MspA同源寡聚体。泳道A显示了在C末端没有任何标签时的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体能很好地寡聚。泳道B显示了由MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体形成的寡聚物在至少高达85℃时仍稳定。泳道C显示了在MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体C末端的D10H6标签能阻止其完全寡聚,或至少形成的寡聚物不是SDS稳定的。泳道E和F显示了虽然MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体的C末端的R8标签能很好地寡聚,但是寡聚物的热稳定性因添加标签而受到损害。泳道G显示了与泳道A中未标记单体相比,MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体C末端的R8H6标签降低了其寡聚化能力。泳道H显示了与R8标签相似地,R8H6标签也损害了其寡聚物的热稳定性。
Claims (44)
1.一种包含特定化学计量比的两种不同单体的异源寡聚孔的制备方法,包括:(a)在第一可诱导载体中用第一不同单体转染或转化细胞;(b)在第二可诱导载体中用第二不同单体转染或转化所述细胞;和(c)诱导所述第一和第二可诱导载体,使得所述细胞产生包含特定化学计量比的所述第一和第二不同单体的异源寡聚孔。
2.根据权利要求1所述的方法,其中所述第一不同单体与所述第二不同单体的所述特定化学计量比为至少5∶1。
3.根据权利要求1或2所述的方法,其中所述第一不同单体与所述第二不同单体的所述特定化学计量比为6∶1或7∶1。
4.根据前述权利要求中任一项所述的方法,其中所述第一和第二可诱导载体是可差异诱导的。
5.根据权利要求4所述的方法,其中步骤(c)包括差异诱导所述第一和第二可诱导载体。
6.根据权利要求5所述的方法,其中步骤(c)包括以不同的程度诱导所述第一和第二可诱导载体。
7.根据前述权利要求中任一项所述的方法,其中在步骤(c)中,所述第一和第二不同单体由所述细胞以使得形成包含所述特定化学计量比的所述第一和第二不同单体的异源寡聚孔的比例进行表达。
8.根据前述权利要求中任一项所述的方法,其中对所述第一和第二不同单体中的至少一个进行修饰,以与其不存在修饰时的表达相比影响其表达。
9.根据前述权利要求中任一项所述的方法,其中所述第一和第二不同单体中的至少一个进行修饰,以影响其与自身或与其他不同单体寡聚的能力。
10.根据前述权利要求中任一项所述的方法,其中所述第一可诱导载体和/或所述第二可诱导载体包括阿拉伯糖启动子、丙酸酯启动子、鼠李糖可诱导启动子、木糖启动子或乳糖启动子。
11.根据前述权利要求中任一项所述的方法,其中所述第一可诱导载体包括鼠李糖可诱导启动子,所述第二可诱导载体包括乳糖启动子。
12.根据前述权利要求中任一项所述的方法,其中所述第一可诱导载体由鼠李糖诱导,所述第二可诱导载体由异丙基β-D-硫代半乳糖吡喃糖苷(IPTG)诱导。
13.根据前述权利要求中任一项所述的方法,其中所述第二不同单体与肽或多肽标签进行基因融合,所述肽或多肽标签能降低所述第二不同单体与自身寡聚的能力或降低其与不存在标签时的表达相比其表达。
14.根据权利要求13所述的方法,其中所述标签在所述第二不同单体的羧基(C)末端进行基因融合,并降低其与自身寡聚的能力
15.根据权利要求13所述的方法,其中所述标签在所述第二不同单体的氨基(N)末端进行基因融合,并与不存在标签时其表达相比降低其表达。
16.根据权利要求13-15中任一项所述的方法,其中所述标签包括(a)4,6,8或10个连续的精氨酸(R)残基或天冬氨酸(D)残基,和/或(b)6或9个连续的组氨酸(H)残基。
17.根据权利要求16所述的方法,其中所述标签进一步包括丝氨酸-甘氨酸(SG)、天冬酰胺-甘氨酸-天冬氨酸-丝氨酸(NGDS)或甘氨酸-天冬氨酸-丝氨酸-甘氨酸(GDSG)。
18.根据权利要求13-17中任一项所述的方法,其中所述方法进一步包括(d)使用所述标签纯化包含所述特定化学计量比的两种不同单体的异源寡聚孔。
19.根据前述权利要求中任一项所述的方法,其中所述第二不同单体与BasTL序列(SEQID NO:26)或其片段进行基因融合。
20.根据权利要求19所述的方法,其中所述BasTL序列或其片段在所述第二不同单体的羧基(C)末端进行基因融合,或者其中所述BasTL序列或其片段在所述第二不同单体的羧基(C)末端进行基因融合并将所述标签——如果存在的话——与所述第二不同单体分离。
21.根据前述权利要求中任一项所述的方法,其中所述第一可诱导载体包含第一选择标记,所述第二可诱导载体包含第二选择标记。
22.根据权利要求21所述的方法,其中所述第一和第二选择标记彼此不同。
23.根据权利要求22所述的方法,其中所述第一选择标记为提供对卡那霉素的抗性的基因,所述第二选择标记为提供对氨苄青霉素的抗性的基因。
24.根据前述权利要求中任一项所述的方法,其中在步骤(c)中,所述第一和第二单体在细胞中以特定化学计量比进行表达,所述异源寡聚孔在细胞膜中形成。
25.根据前述权利要求中任一项所述的方法,其中所述细胞为大肠杆菌。
26.一种异源寡聚孔,其使用根据前述权利要求中任一项所述的方法制备。
27.根据权利要求26所述的异源寡聚孔,其中所述孔包括两种不同单体,每种单体包括SEQ ID NO:2中所示序列或其变体,并且其中所述第一不同单体与所述第二不同单体的特定化学计量比为7∶1。
28.根据权利要求27所述的异源寡聚孔,其中所述第二不同单体不同于所述第一不同单体之处在于,在对应于SEQ ID NO:2的位置88,90,91,92,93,102,103和105的一个或多个位置处含有带负电荷的氨基酸。
29.根据权利要求28所述的异源寡聚孔,其中所述第二不同单体不同于所述第一不同单体之处在于,在对应于SEQ ID NO:2的位置90,91,93和105的一个或多个位置处含有带负电荷的氨基酸。
30.一种表征目标多核苷酸的方法,包括:
a)使多核苷酸与权利要求25-28中任一项所述的异源寡聚孔接触,使得所述多核苷酸移动通过所述孔;和
b)在所述多核苷酸相对于所述孔移动时获取一个或多个测量值,其中所述测量值指示所述多核苷酸的一个或多个特征,并从而表征所述目标多核苷酸。
31.根据权利要求30所述的方法,其中所述一个或多个特征选自(i)多核苷酸的长度,(ii)多核苷酸的同一性,(iii)多核苷酸的序列,(iv)二核苷酸的二级结构,和(v)多核苷酸是否被修饰。
32.根据权利要求30或31所述的方法,其中多核苷酸的所述一个或多个特征通过电测量和/或光学测量进行测量。
33.根据权利要求32所述的方法,其中所述电测量为电流测量、阻抗测量、隧道测量或场效应晶体管(FET)测量。
34.根据权利要求30-33中任一项所述的方法,其中步骤a)进一步包括,使所述多核苷酸与多核苷酸结合蛋白接触,使得所述蛋白控制所述多核苷酸通过所述孔的运动。
35.根据权利要求34所述的方法,其中所述方法进一步包括:
a)使所述多核苷酸与所述孔和多核苷酸结合蛋白接触,使得所述多核苷酸移动通过所述孔,并且所述蛋白控制所述多核苷酸通过所述孔的移动;和
b)当所述多核苷酸相对于所述孔移动时测量通过所述孔的电流,其中所述电流表示所述多核苷酸的一个或多个特征,从而表征所述目标多核苷酸。
36.根据权利要求34或35所述的方法,其中所述多核苷酸结合蛋白为解旋酶或衍生自解旋酶。
37.根据权利要求30-36中任一项所述的方法,其中所述孔在膜中。
38.根据权利要求37所述的方法,其中所述膜为两亲层或固态层。
39.根据权利要求37或38所述的方法,其中所述多核苷酸在与所述孔接触之前偶联到所述膜。
40.一种用于表征目标多核苷酸的试剂盒,包括(a)权利要求25-28中任一项所述的异源寡聚孔,和(b)膜的组分。
41.一种用于表征样品中的目标多核苷酸的设备,包括(a)多个权利要求25-28中任一项所述的异源寡聚孔,和(b)多个膜。
42.一种用于表征目标多核苷酸的方法,包括:
a)使多核苷酸与权利要求25-28中任一项所述的异源寡聚孔、聚合酶和标记的核苷酸接触,使得通过聚合酶将磷酸盐标记的物质顺序添加到目标多核苷酸,其中磷酸盐物质含有对每个核苷酸特异性的标记;和
b)使用所述孔检测磷酸盐标记的物质,并从而表征所述多核苷酸。
43.一种形成用于表征目标多核苷酸的传感器的方法,包括在权利要求25-28中任一项所述的异源寡聚孔和多核苷酸结合蛋白之间形成复合物,并从而形成用于表征目标多核苷酸的传感器。
44.一种用于表征目标多核苷酸的传感器,包括在权利要求25-28中任一项所述的异源寡聚孔和多核苷酸结合蛋白之间形成的复合物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1502810.3 | 2015-02-19 | ||
GB201502810A GB201502810D0 (en) | 2015-02-19 | 2015-02-19 | Method |
PCT/GB2016/050391 WO2016132124A1 (en) | 2015-02-19 | 2016-02-17 | Method |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107636168A true CN107636168A (zh) | 2018-01-26 |
Family
ID=52821883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680022991.0A Pending CN107636168A (zh) | 2015-02-19 | 2016-02-17 | 方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11307192B2 (zh) |
EP (1) | EP3259351B1 (zh) |
CN (1) | CN107636168A (zh) |
GB (1) | GB201502810D0 (zh) |
WO (1) | WO2016132124A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111499705A (zh) * | 2019-01-30 | 2020-08-07 | 深圳市梅丽纳米孔科技有限公司 | 一种突变NfpAB纳米孔、测试系统及制作方法与应用 |
CN112805372A (zh) * | 2018-10-11 | 2021-05-14 | 深圳华大生命科学研究院 | 热稳定性提升的Phi29 DNA聚合酶突变体及其在测序中的应用 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6271505B2 (ja) | 2012-04-10 | 2018-01-31 | オックスフォード ナノポール テクノロジーズ リミテッド | 変異体ライセニンポア |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
CN111534504B (zh) | 2014-01-22 | 2024-06-21 | 牛津纳米孔科技公开有限公司 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
CN106459159B (zh) | 2014-05-02 | 2021-11-30 | 牛津纳米孔技术公司 | 突变孔 |
CN114605507A (zh) | 2014-09-01 | 2022-06-10 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
US10266885B2 (en) | 2014-10-07 | 2019-04-23 | Oxford Nanopore Technologies Ltd. | Mutant pores |
GB201502809D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
CN107735686B (zh) | 2015-04-14 | 2021-06-11 | 鲁汶天主教大学 | 具有内部蛋白质衔接子的纳米孔 |
CA3011830A1 (en) | 2015-12-08 | 2017-06-15 | Katholieke Universiteit Leuven Ku Leuven Research & Development | Modified nanopores, compositions comprising the same, and uses thereof |
WO2017149317A1 (en) | 2016-03-02 | 2017-09-08 | Oxford Nanopore Technologies Limited | Mutant pore |
CN118256605A (zh) | 2016-04-06 | 2024-06-28 | 牛津纳米孔科技公开有限公司 | 突变体孔 |
GB201707122D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
SG11201913174PA (en) | 2017-06-30 | 2020-01-30 | Vib Vzw | Novel protein pores |
GB202112235D0 (en) * | 2021-08-26 | 2021-10-13 | Oxford Nanopore Tech Ltd | Nanopore |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102174554A (zh) * | 2011-01-24 | 2011-09-07 | 内蒙古民族大学 | 双控双调节原核表达载体系统及其构建方法和用途 |
CN103460040A (zh) * | 2011-02-11 | 2013-12-18 | 牛津纳米孔技术有限公司 | 突变型孔 |
Family Cites Families (89)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5198543A (en) | 1989-03-24 | 1993-03-30 | Consejo Superior Investigaciones Cientificas | PHI29 DNA polymerase |
US5795782A (en) | 1995-03-17 | 1998-08-18 | President & Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
US6362002B1 (en) | 1995-03-17 | 2002-03-26 | President And Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
JP3891620B2 (ja) | 1996-11-14 | 2007-03-14 | 株式会社アイシン・コスモス研究所 | ヘアピン型構造の核酸プローブ分子、及び該核酸プローブ分子を利用した核酸検出方法 |
US20020197614A1 (en) | 1997-05-16 | 2002-12-26 | Mosaic Technologies, Inc. | Electrophoretic analysis of target molecules using adapter molecules |
WO1999005167A1 (en) | 1997-07-25 | 1999-02-04 | University Of Massachusetts | Designed protein pores as components for biosensors |
US6743605B1 (en) | 1998-06-24 | 2004-06-01 | Enzo Life Sciences, Inc. | Linear amplification of specific nucleic acid sequences |
US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
US6426231B1 (en) | 1998-11-18 | 2002-07-30 | The Texas A&M University System | Analyte sensing mediated by adapter/carrier molecules |
NO986133D0 (no) | 1998-12-23 | 1998-12-23 | Preben Lexow | FremgangsmÕte for DNA-sekvensering |
US6627067B1 (en) | 1999-06-22 | 2003-09-30 | President And Fellows Of Harvard College | Molecular and atomic scale evaluation of biopolymers |
JP2003508054A (ja) | 1999-08-31 | 2003-03-04 | ニーデルバイス,ミヒャエル | チャンネル形成性タンパク質の製造方法 |
US6916665B2 (en) | 2000-02-11 | 2005-07-12 | The Texas A&M University System | Biosensor compositions and methods of use |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
AU2002239284A1 (en) | 2000-11-27 | 2002-06-03 | The Regents Of The University Of California | Methods and devices for characterizing duplex nucleic acid molecules |
US6863833B1 (en) | 2001-06-29 | 2005-03-08 | The Board Of Trustees Of The Leland Stanford Junior University | Microfabricated apertures for supporting bilayer lipid membranes |
EP1504114B1 (en) | 2002-05-10 | 2017-07-12 | The Texas A & M University System | Stochastic sensing through covalent interactions |
DE602004025801D1 (de) | 2003-03-25 | 2010-04-15 | Stratagene California | Dna-polymerasefusionen und deren verwendungen |
US7163658B2 (en) | 2003-04-23 | 2007-01-16 | Rouvain Bension | Rapid sequencing of polymers |
JP2005253427A (ja) | 2004-03-15 | 2005-09-22 | Aisin Seiki Co Ltd | 核酸検出方法及び核酸単離方法 |
WO2006028508A2 (en) | 2004-03-23 | 2006-03-16 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
WO2005124888A1 (en) | 2004-06-08 | 2005-12-29 | President And Fellows Of Harvard College | Suspended carbon nanotube field effect transistor |
US20060105461A1 (en) | 2004-10-22 | 2006-05-18 | May Tom-Moy | Nanopore analysis system |
WO2007084103A2 (en) | 2004-12-21 | 2007-07-26 | The Texas A & M University System | High temperature ion channels and pores |
GB0505971D0 (en) | 2005-03-23 | 2005-04-27 | Isis Innovation | Delivery of molecules to a lipid bilayer |
KR100730350B1 (ko) | 2005-10-17 | 2007-06-19 | 삼성전자주식회사 | 표면처리된 나노포어를 이용한 dna 검출방법 및검출장치 |
GB0523282D0 (en) | 2005-11-15 | 2005-12-21 | Isis Innovation | Methods using pores |
EP1963530B1 (en) | 2005-12-22 | 2011-07-27 | Pacific Biosciences of California, Inc. | Active surface coupled polymerases |
US7638034B2 (en) | 2006-09-21 | 2009-12-29 | Los Alamos National Security, Llc | Electrochemical detection of single molecules using abiotic nanopores having electrically tunable dimensions |
US20110121840A1 (en) | 2007-02-20 | 2011-05-26 | Gurdial Singh Sanghera | Lipid Bilayer Sensor System |
CA2684801C (en) | 2007-04-04 | 2017-10-10 | The Regents Of The University Of California | Compositions, devices, systems, and methods for using a nanopore |
GB0716264D0 (en) | 2007-08-21 | 2007-09-26 | Isis Innovation | Bilayers |
EP2195648B1 (en) | 2007-09-12 | 2019-05-08 | President and Fellows of Harvard College | High-resolution molecular graphene sensor comprising an aperture in the graphene layer |
GB2453377A (en) | 2007-10-05 | 2009-04-08 | Isis Innovation | Transmembrane protein pores and molecular adapters therefore. |
GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
US8231969B2 (en) | 2008-03-26 | 2012-07-31 | University Of Utah Research Foundation | Asymmetrically functionalized nanoparticles |
CA2991818C (en) | 2008-03-28 | 2022-10-11 | Pacific Biosciences Of California, Inc. | Compositions and methods for nucleic acid sequencing |
US8772041B2 (en) | 2008-05-22 | 2014-07-08 | The Regents Of The University Of California | Membrane precursors and membranes formed therefrom |
US8652771B2 (en) | 2008-05-28 | 2014-02-18 | University of Souther California | Measurement of succinate in urine samples as a biomarker of kidney damage in diabetic subjects |
CN102245760A (zh) | 2008-07-07 | 2011-11-16 | 牛津纳米孔技术有限公司 | 酶-孔构建体 |
CA2730068A1 (en) | 2008-07-07 | 2010-01-14 | Oxford Nanopore Technologies Limited | Base-detecting pore |
CA2774710C (en) | 2008-09-22 | 2016-08-02 | University Of Washington | Msp nanopores and related methods |
US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
GB0820927D0 (en) | 2008-11-14 | 2008-12-24 | Isis Innovation | Method |
CA2750879C (en) | 2009-01-30 | 2018-05-22 | Oxford Nanopore Technologies Limited | Adaptors for nucleic acid constructs in transmembrane sequencing |
CN102482330A (zh) | 2009-01-30 | 2012-05-30 | 牛津纳米孔技术有限公司 | 酶突变体 |
GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
AU2010240670B2 (en) | 2009-04-20 | 2015-08-20 | Oxford Nanopore Technologies Limited | Lipid bilayer sensor array |
US9127313B2 (en) | 2009-12-01 | 2015-09-08 | Oxford Nanopore Technologies Limited | Biochemical analysis instrument |
EP3933402A1 (en) | 2010-02-23 | 2022-01-05 | University of Washington | Method of making unsupported artificial mycolic acid membranes |
WO2011125015A2 (en) | 2010-04-05 | 2011-10-13 | Bar-Ilan University | Protease-activatable pore-forming polypeptides |
EP2622343B1 (en) | 2010-10-01 | 2016-01-20 | Oxford Nanopore Technologies Limited | Biochemical analysis apparatus using nanopores |
CN102116783B (zh) | 2010-12-31 | 2013-05-29 | 北京普源精电科技有限公司 | 一种波形显示方法 |
SG10201604316WA (en) | 2011-05-27 | 2016-07-28 | Oxford Nanopore Tech Ltd | Coupling method |
US9580480B2 (en) * | 2011-05-31 | 2017-02-28 | Massachusetts Institute Of Technology | Cell-directed synthesis of multifunctional nanopatterns and nanomaterials |
KR20140050067A (ko) | 2011-07-25 | 2014-04-28 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 막횡단 포어를 사용한 이중 가닥 폴리뉴클레오티드 서열분석을 위한 헤어핀 루프 방법 |
EP2758545B1 (en) | 2011-09-23 | 2017-07-26 | Oxford Nanopore Technologies Limited | Analysis of a polymer comprising polymer units |
KR20140090633A (ko) | 2011-10-21 | 2014-07-17 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법 |
US9617591B2 (en) | 2011-12-29 | 2017-04-11 | Oxford Nanopore Technologies Ltd. | Method for characterising a polynucleotide by using a XPD helicase |
AU2012360244B2 (en) | 2011-12-29 | 2018-08-23 | Oxford Nanopore Technologies Limited | Enzyme method |
EP2807476A4 (en) | 2012-01-20 | 2015-12-09 | Genia Technologies Inc | MOLECULAR DETECTION AND SEQUENCING USING NANOPORES |
JP6271505B2 (ja) | 2012-04-10 | 2018-01-31 | オックスフォード ナノポール テクノロジーズ リミテッド | 変異体ライセニンポア |
TWI655213B (zh) | 2012-07-13 | 2019-04-01 | 目立康股份有限公司 | 自我組織化肽衍生物的製造方法 |
WO2014013259A1 (en) | 2012-07-19 | 2014-01-23 | Oxford Nanopore Technologies Limited | Ssb method |
WO2014013260A1 (en) | 2012-07-19 | 2014-01-23 | Oxford Nanopore Technologies Limited | Modified helicases |
AU2013291765C1 (en) | 2012-07-19 | 2019-08-08 | Oxford Nanopore Technologies Limited | Enzyme construct |
JP6375301B2 (ja) | 2012-10-26 | 2018-08-15 | オックスフォード ナノポール テクノロジーズ リミテッド | 液滴界面 |
GB201313121D0 (en) | 2013-07-23 | 2013-09-04 | Oxford Nanopore Tech Ltd | Array of volumes of polar medium |
CN105074458B (zh) | 2013-02-07 | 2019-06-28 | 耶路撒冷希伯来大学伊森姆研究发展有限公司 | 杂化纳米孔及其用于检测分析物的用途 |
GB201314695D0 (en) | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
CN105209634B (zh) | 2013-03-08 | 2020-05-12 | 牛津纳米孔技术公司 | 酶停滞方法 |
US10613076B2 (en) | 2013-03-14 | 2020-04-07 | The Trustees Of Boston University | Optoelectronic control of solid-state nanopores |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
WO2015051378A1 (en) | 2013-10-04 | 2015-04-09 | University Of Washington Through Its Center For Commercialization | Systems and methods for nanopore-based analysis of nucleic acids |
GB201406151D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
JP6677640B2 (ja) | 2013-10-18 | 2020-04-08 | オックスフォード ナノポール テクノロジーズ リミテッド | 修飾酵素 |
CN111534504B (zh) | 2014-01-22 | 2024-06-21 | 牛津纳米孔科技公开有限公司 | 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法 |
GB201406155D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
GB201403096D0 (en) | 2014-02-21 | 2014-04-09 | Oxford Nanopore Tech Ltd | Sample preparation method |
US10337060B2 (en) | 2014-04-04 | 2019-07-02 | Oxford Nanopore Technologies Ltd. | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
CN106459159B (zh) | 2014-05-02 | 2021-11-30 | 牛津纳米孔技术公司 | 突变孔 |
FR3023394B1 (fr) | 2014-07-02 | 2017-12-29 | Adn Access Data Networks | Dispositif permettant de faciliter l'enseignement de la langue amharique et d'en normaliser l'ecriture |
CN114605507A (zh) | 2014-09-01 | 2022-06-10 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
US10266885B2 (en) | 2014-10-07 | 2019-04-23 | Oxford Nanopore Technologies Ltd. | Mutant pores |
GB201502809D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
CN107735686B (zh) | 2015-04-14 | 2021-06-11 | 鲁汶天主教大学 | 具有内部蛋白质衔接子的纳米孔 |
CA3011830A1 (en) | 2015-12-08 | 2017-06-15 | Katholieke Universiteit Leuven Ku Leuven Research & Development | Modified nanopores, compositions comprising the same, and uses thereof |
WO2017149317A1 (en) | 2016-03-02 | 2017-09-08 | Oxford Nanopore Technologies Limited | Mutant pore |
CN118256605A (zh) | 2016-04-06 | 2024-06-28 | 牛津纳米孔科技公开有限公司 | 突变体孔 |
-
2015
- 2015-02-19 GB GB201502810A patent/GB201502810D0/en not_active Ceased
-
2016
- 2016-02-17 CN CN201680022991.0A patent/CN107636168A/zh active Pending
- 2016-02-17 WO PCT/GB2016/050391 patent/WO2016132124A1/en active Application Filing
- 2016-02-17 EP EP16708439.1A patent/EP3259351B1/en active Active
- 2016-02-17 US US15/551,884 patent/US11307192B2/en active Active
-
2022
- 2022-03-14 US US17/693,922 patent/US20220283141A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102174554A (zh) * | 2011-01-24 | 2011-09-07 | 内蒙古民族大学 | 双控双调节原核表达载体系统及其构建方法和用途 |
CN103460040A (zh) * | 2011-02-11 | 2013-12-18 | 牛津纳米孔技术有限公司 | 突变型孔 |
Non-Patent Citations (2)
Title |
---|
PAUL RUCKER: "Recombinant ferritin: modulation of subunit stoichiometry in bacterial expression systems", 《PROTEIN ENGINEERING》 * |
WEIYANG: "A New Method for Protein Coexpression in Escherichia coli Using Two Incompatible Plasmids", 《PROTEIN EXPRESSION AND PURIFICATION》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112805372A (zh) * | 2018-10-11 | 2021-05-14 | 深圳华大生命科学研究院 | 热稳定性提升的Phi29 DNA聚合酶突变体及其在测序中的应用 |
CN112805372B (zh) * | 2018-10-11 | 2023-10-31 | 深圳华大生命科学研究院 | 热稳定性提升的Phi29 DNA聚合酶突变体及其在测序中的应用 |
CN111499705A (zh) * | 2019-01-30 | 2020-08-07 | 深圳市梅丽纳米孔科技有限公司 | 一种突变NfpAB纳米孔、测试系统及制作方法与应用 |
CN111499705B (zh) * | 2019-01-30 | 2023-08-08 | 深圳市梅丽纳米孔科技有限公司 | 一种突变NfpAB纳米孔、测试系统及制作方法与应用 |
Also Published As
Publication number | Publication date |
---|---|
US11307192B2 (en) | 2022-04-19 |
US20180095066A1 (en) | 2018-04-05 |
EP3259351B1 (en) | 2020-11-25 |
WO2016132124A1 (en) | 2016-08-25 |
US20220283141A1 (en) | 2022-09-08 |
GB201502810D0 (en) | 2015-04-08 |
EP3259351A1 (en) | 2017-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220283141A1 (en) | Method | |
US11739377B2 (en) | Method of improving the movement of a target polynucleotide with respect to a transmembrane pore | |
KR102472805B1 (ko) | 돌연변이체 포어 | |
US10266885B2 (en) | Mutant pores | |
CN105705656B (zh) | 方法 | |
KR102083695B1 (ko) | 돌연변이체 리세닌 기공 | |
CN117965707A (zh) | 经修饰的酶 | |
CN115777019A (zh) | 经修饰的Prp43解旋酶及其用途 | |
US11845779B2 (en) | Mutant aerolysin and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: oxford Applicant after: Oxford nanopore Technology Public Co.,Ltd. Address before: Oxfordshire Applicant before: OXFORD NANOPORE TECHNOLOGIES LTD. |
|
CB02 | Change of applicant information |