CN111164096B - 一种Mmup单体变体及其应用 - Google Patents
一种Mmup单体变体及其应用 Download PDFInfo
- Publication number
- CN111164096B CN111164096B CN201980002430.8A CN201980002430A CN111164096B CN 111164096 B CN111164096 B CN 111164096B CN 201980002430 A CN201980002430 A CN 201980002430A CN 111164096 B CN111164096 B CN 111164096B
- Authority
- CN
- China
- Prior art keywords
- mmup
- variant
- monomer
- porin
- monomeric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000178 monomer Substances 0.000 title claims abstract description 247
- 108010013381 Porins Proteins 0.000 claims abstract description 131
- 102000017033 Porins Human genes 0.000 claims abstract description 130
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 94
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 94
- 239000002157 polynucleotide Substances 0.000 claims abstract description 94
- 238000000034 method Methods 0.000 claims abstract description 32
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 5
- 125000003729 nucleotide group Chemical group 0.000 claims description 60
- 239000002773 nucleotide Substances 0.000 claims description 59
- 108090000623 proteins and genes Proteins 0.000 claims description 46
- 108060004795 Methyltransferase Proteins 0.000 claims description 37
- 102000004169 proteins and genes Human genes 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 29
- 239000011148 porous material Substances 0.000 claims description 25
- 108091006146 Channels Proteins 0.000 claims description 24
- 241000894006 Bacteria Species 0.000 claims description 19
- 230000005945 translocation Effects 0.000 claims description 18
- 108060002716 Exonuclease Proteins 0.000 claims description 12
- 102000013165 exonuclease Human genes 0.000 claims description 12
- 102000044158 nucleic acid binding protein Human genes 0.000 claims description 12
- 108700020942 nucleic acid binding protein Proteins 0.000 claims description 12
- 102100034343 Integrase Human genes 0.000 claims description 8
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 8
- 108010017842 Telomerase Proteins 0.000 claims description 8
- 101710183280 Topoisomerase Proteins 0.000 claims description 8
- 102000008579 Transposases Human genes 0.000 claims description 7
- 108010020764 Transposases Proteins 0.000 claims description 7
- 230000001939 inductive effect Effects 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 3
- 241000186359 Mycobacterium Species 0.000 claims description 2
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 241000894007 species Species 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 229920001184 polypeptide Polymers 0.000 abstract description 2
- 108090000765 processed proteins & peptides Proteins 0.000 abstract description 2
- 102000004196 processed proteins & peptides Human genes 0.000 abstract description 2
- 230000035772 mutation Effects 0.000 description 64
- 108020004414 DNA Proteins 0.000 description 39
- 229940024606 amino acid Drugs 0.000 description 32
- 235000001014 amino acid Nutrition 0.000 description 32
- 235000018102 proteins Nutrition 0.000 description 32
- 150000001413 amino acids Chemical class 0.000 description 31
- 238000012163 sequencing technique Methods 0.000 description 21
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 20
- 102220572773 RNA-binding protein FUS_D91Q_mutation Human genes 0.000 description 20
- 102000004190 Enzymes Human genes 0.000 description 17
- 108090000790 Enzymes Proteins 0.000 description 17
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 17
- 239000004472 Lysine Substances 0.000 description 17
- 239000012528 membrane Substances 0.000 description 17
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 16
- 235000004279 alanine Nutrition 0.000 description 16
- 239000013612 plasmid Substances 0.000 description 16
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 14
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 14
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 14
- 235000009582 asparagine Nutrition 0.000 description 14
- 229960001230 asparagine Drugs 0.000 description 14
- 239000000232 Lipid Bilayer Substances 0.000 description 13
- 102000039446 nucleic acids Human genes 0.000 description 12
- 108020004707 nucleic acids Proteins 0.000 description 12
- 150000007523 nucleic acids Chemical class 0.000 description 12
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 11
- 238000005259 measurement Methods 0.000 description 11
- 239000004475 Arginine Substances 0.000 description 10
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 10
- 235000003704 aspartic acid Nutrition 0.000 description 10
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 10
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 10
- 239000006228 supernatant Substances 0.000 description 10
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 8
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 8
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 8
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 8
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 8
- 239000004473 Threonine Substances 0.000 description 8
- 239000000872 buffer Substances 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 102000014914 Carrier Proteins Human genes 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 108091008324 binding proteins Proteins 0.000 description 6
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 6
- 229960000310 isoleucine Drugs 0.000 description 6
- -1 polymerase Proteins 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 239000004474 valine Substances 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 5
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 5
- 235000012000 cholesterol Nutrition 0.000 description 5
- 238000007672 fourth generation sequencing Methods 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- 108091093094 Glycol nucleic acid Proteins 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 108091093037 Peptide nucleic acid Proteins 0.000 description 4
- 241001052560 Thallis Species 0.000 description 4
- 108091046915 Threose nucleic acid Proteins 0.000 description 4
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- 238000007667 floating Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000012466 permeate Substances 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 238000001542 size-exclusion chromatography Methods 0.000 description 4
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 3
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 3
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 3
- 239000007995 HEPES buffer Substances 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 3
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 3
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 230000008602 contraction Effects 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 3
- 235000013928 guanylic acid Nutrition 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 239000002808 molecular sieve Substances 0.000 description 3
- 150000003904 phospholipids Chemical class 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 3
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 3
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 3
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 2
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 description 2
- RDFMDVXONNIGBC-UHFFFAOYSA-N 2-aminoheptanoic acid Chemical compound CCCCCC(N)C(O)=O RDFMDVXONNIGBC-UHFFFAOYSA-N 0.000 description 2
- PECYZEOJVXMISF-UHFFFAOYSA-N 3-aminoalanine Chemical compound [NH3+]CC(N)C([O-])=O PECYZEOJVXMISF-UHFFFAOYSA-N 0.000 description 2
- 208000035657 Abasia Diseases 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical group CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- NXVGBGZQQFDUTM-XVYDVKMFSA-N Asn-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N NXVGBGZQQFDUTM-XVYDVKMFSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 2
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 2
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 2
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 2
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 2
- RRBLZNIIMHSHQF-FXQIFTODSA-N Gln-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N RRBLZNIIMHSHQF-FXQIFTODSA-N 0.000 description 2
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 2
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 2
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 2
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- GZBZACMXFIPIDX-WHFBIAKZSA-N Gly-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)C(=O)O GZBZACMXFIPIDX-WHFBIAKZSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 108091070641 Hel308 family Proteins 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 2
- 241000187480 Mycobacterium smegmatis Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- KSPIYJQBLVDRRI-UHFFFAOYSA-N N-methylisoleucine Chemical compound CCC(C)C(NC)C(O)=O KSPIYJQBLVDRRI-UHFFFAOYSA-N 0.000 description 2
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 2
- BSJCSHIAMSGQGN-BVSLBCMMSA-N Phe-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O BSJCSHIAMSGQGN-BVSLBCMMSA-N 0.000 description 2
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 2
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 2
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 2
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 2
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 2
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 2
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 241000205091 Sulfolobus solfataricus Species 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 2
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- RYXOUTORDIUWNI-BPUTZDHNSA-N Trp-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RYXOUTORDIUWNI-BPUTZDHNSA-N 0.000 description 2
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- DWJQKEZKLQCHKO-SRVKXCTJSA-N Tyr-Asn-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O DWJQKEZKLQCHKO-SRVKXCTJSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- QWCKQJZIFLGMSD-UHFFFAOYSA-N alpha-aminobutyric acid Chemical compound CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 238000005349 anion exchange Methods 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 239000003012 bilayer membrane Substances 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- ZOOGRGPOEVQQDX-KHLHZJAASA-N cyclic guanosine monophosphate Chemical compound C([C@H]1O2)O[P@](O)(=O)O[C@@H]1[C@H](O)[C@H]2N1C(N=C(NC2=O)N)=C2N=C1 ZOOGRGPOEVQQDX-KHLHZJAASA-N 0.000 description 2
- JSRLJPSBLDHEIO-SHYZEUOFSA-N dUMP Chemical compound O1[C@H](COP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 JSRLJPSBLDHEIO-SHYZEUOFSA-N 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 2
- 230000005684 electric field Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 239000002054 inoculum Substances 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 230000003381 solubilizing effect Effects 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229920001059 synthetic polymer Polymers 0.000 description 2
- FEOZZFHAVXYAMB-UHFFFAOYSA-N tetraethylene glycol monooctyl ether Chemical compound CCCCCCCCOCCOCCOCCOCCO FEOZZFHAVXYAMB-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical class CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005641 tunneling Effects 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- BJBUEDPLEOHJGE-UHFFFAOYSA-N (2R,3S)-3-Hydroxy-2-pyrolidinecarboxylic acid Natural products OC1CCNC1C(O)=O BJBUEDPLEOHJGE-UHFFFAOYSA-N 0.000 description 1
- VEVRNHHLCPGNDU-MUGJNUQGSA-N (2s)-2-amino-5-[1-[(5s)-5-amino-5-carboxypentyl]-3,5-bis[(3s)-3-amino-3-carboxypropyl]pyridin-1-ium-4-yl]pentanoate Chemical compound OC(=O)[C@@H](N)CCCC[N+]1=CC(CC[C@H](N)C(O)=O)=C(CCC[C@H](N)C([O-])=O)C(CC[C@H](N)C(O)=O)=C1 VEVRNHHLCPGNDU-MUGJNUQGSA-N 0.000 description 1
- JHTPBGFVWWSHDL-UHFFFAOYSA-N 1,4-dichloro-2-isothiocyanatobenzene Chemical compound ClC1=CC=C(Cl)C(N=C=S)=C1 JHTPBGFVWWSHDL-UHFFFAOYSA-N 0.000 description 1
- BDNDQOCRJGGSJO-UHFFFAOYSA-N 1-amino-2-phenylpropan-2-ol Chemical compound NCC(O)(C)C1=CC=CC=C1 BDNDQOCRJGGSJO-UHFFFAOYSA-N 0.000 description 1
- OGNSCSPNOLGXSM-UHFFFAOYSA-N 2,4-diaminobutyric acid Chemical compound NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- XABCFXXGZPWJQP-UHFFFAOYSA-N 3-aminoadipic acid Chemical compound OC(=O)CC(N)CCC(O)=O XABCFXXGZPWJQP-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 1
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 1
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241001518086 Bartonella henselae Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 1
- 241000606678 Coxiella burnetii Species 0.000 description 1
- UVZFZTWNHOQWNK-NAKRPEOUSA-N Cys-Ile-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UVZFZTWNHOQWNK-NAKRPEOUSA-N 0.000 description 1
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 1
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 1
- AFYGNOJUTMXQIG-FXQIFTODSA-N Cys-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N AFYGNOJUTMXQIG-FXQIFTODSA-N 0.000 description 1
- 241000192091 Deinococcus radiodurans Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- YVYVMJNUENBOOL-KBIXCLLPSA-N Glu-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YVYVMJNUENBOOL-KBIXCLLPSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- JDAYMLXPUJRSDJ-XIRDDKMYSA-N Glu-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 JDAYMLXPUJRSDJ-XIRDDKMYSA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 1
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 1
- YYOCMTFVGKDNQP-IHRRRGAJSA-N His-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YYOCMTFVGKDNQP-IHRRRGAJSA-N 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- LCWXJXMHJVIJFK-UHFFFAOYSA-N Hydroxylysine Natural products NCC(O)CC(N)CC(O)=O LCWXJXMHJVIJFK-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 1
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 1
- VNDQNDYEPSXHLU-JUKXBJQTSA-N Ile-His-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N VNDQNDYEPSXHLU-JUKXBJQTSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- JUQLUIFNNFIIKC-YFKPBYRVSA-N L-2-aminopimelic acid Chemical compound OC(=O)[C@@H](N)CCCCC(O)=O JUQLUIFNNFIIKC-YFKPBYRVSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- AGPKZVBTJJNPAG-UHNVWZDZSA-N L-allo-Isoleucine Chemical compound CC[C@@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-UHNVWZDZSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- POMXSEDNUXYPGK-IHRRRGAJSA-N Leu-Met-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N POMXSEDNUXYPGK-IHRRRGAJSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 1
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- YPIGGYHFMKJNKV-UHFFFAOYSA-N N-ethylglycine Chemical compound CC[NH2+]CC([O-])=O YPIGGYHFMKJNKV-UHFFFAOYSA-N 0.000 description 1
- 108010065338 N-ethylglycine Proteins 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- AKCRVYNORCOYQT-YFKPBYRVSA-N N-methyl-L-valine Chemical compound CN[C@@H](C(C)C)C(O)=O AKCRVYNORCOYQT-YFKPBYRVSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 108010077895 Sarcosine Proteins 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- XPVIVVLLLOFBRH-XIRDDKMYSA-N Ser-Trp-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)CO)C(O)=O XPVIVVLLLOFBRH-XIRDDKMYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 101000865057 Thermococcus litoralis DNA polymerase Proteins 0.000 description 1
- 241000589500 Thermus aquaticus Species 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- VOCHZIJXPRBVSI-XIRDDKMYSA-N Trp-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N VOCHZIJXPRBVSI-XIRDDKMYSA-N 0.000 description 1
- PWPJLBWYRTVYQS-PMVMPFDFSA-N Trp-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PWPJLBWYRTVYQS-PMVMPFDFSA-N 0.000 description 1
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 1
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- XKVXSCHXGJOQND-ZOBUZTSGSA-N Val-Asp-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N XKVXSCHXGJOQND-ZOBUZTSGSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229960002684 aminocaproic acid Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 229940092524 bartonella henselae Drugs 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 150000001945 cysteines Chemical class 0.000 description 1
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Natural products NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 description 1
- LTFMZDNNPPEQNG-UHFFFAOYSA-N deoxyguanylic acid Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1CC(O)C(COP(O)(O)=O)O1 LTFMZDNNPPEQNG-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 238000002847 impedance measurement Methods 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 108010009932 leucyl-alanyl-glycyl-valine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- YSMODUONRAFBET-WHFBIAKZSA-N threo-5-hydroxy-L-lysine Chemical compound NC[C@@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-WHFBIAKZSA-N 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- BJBUEDPLEOHJGE-IMJSIDKUSA-N trans-3-hydroxy-L-proline Chemical compound O[C@H]1CC[NH2+][C@@H]1C([O-])=O BJBUEDPLEOHJGE-IMJSIDKUSA-N 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010029599 tyrosyl-glutamyl-tryptophan Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/35—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Mycobacteriaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Analytical Chemistry (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Polyesters Or Polycarbonates (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本发明提供了一种包含SEQ ID NO:1第91‑99位任意一个或多个氨基酸突变的氨基酸序列的Mmup单体变体、以及包含至少一个Mmup单体变体的孔蛋白或构建体及其用途。本发明还提供了一种表征目标多核苷酸的方法。
Description
技术领域
本发明涉及核酸特性的表征技术领域,具体涉及一种Mmup单体变体、包含Mmup单体变体的孔蛋白及构建体,及应用所述Mmup单体变体或孔蛋白进行表征目标多核苷酸的方法。
背景技术
纳米孔测序技术是一种以单链核酸分子作为测序单元,利用一个能够提供离子电流通道的纳米孔,使得单链核酸分子在电场力驱动下通过该纳米孔,当多核苷酸通过纳米孔易位时,会由于物理占位效应而产生相对应的阻塞电流,对产生的不同信号实时读取进而分析得到多核苷酸序列信息的基因测序技术。纳米孔测序技术具有以下优势:在无需扩增的情况下,即可简便的建库;阅读速度快,单链分子的阅读速度能够达到每小时数万个碱基;阅读长度更长,通常可以达到数千个碱基;可以直接进行甲基化的DNA或RNA的测量。
但是,每一个或一系列核苷酸在电场力的作用下通过纳米孔蛋白时,会产生一种特定的阻塞电流,此时记录的电流信号与多核苷酸的序列虽是对应关系,却通常是3-4个核苷酸控制某些级别的电流水平,所以仍然需要提高精确度。目前,可以通过改变多核苷酸结构、在纳米孔处的持续时间以及开发新的纳米孔从而控制多核苷酸的易位来提高精确度。
例如:专利US20150065354A1公开了一种使用XPD解旋酶表征目标多核苷酸的方法,所述方法利用孔和XPD解旋酶。该发明所述的XPD解旋酶可以控制目标多核苷酸穿过所述孔的运动。
专利US20170268055A1公开了一种用于多核苷酸测序的组合物和方法,该方法利用用目标多核苷酸通过孔的易位分步易位步骤来表征目标多核苷酸,包括表征多核苷酸的序列的方法和组合物。
专利CN106103741A公开了将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法,该发明还涉及表征靶多核苷酸的新方法。
专利CN102216783B公开了一种耻垢分枝杆菌孔蛋白(Msp)纳米孔以及使用该纳米孔进行测序,其中,将野生型Msp的90或91位点突变以提高分析物在测序时的电导,并降低分析物在测序中的转位速度。
然而,现有技术中并未提到Mmup单体变体及在测序中的应用,且现有技术中可以用于测序的孔蛋白种类很少。
因此,本发明进一步提供了一种新的纳米孔蛋白,通过将不能被用于测序的野生型Mmup蛋白进行突变制备了Mmup单体变体,并证实了该Mmup单体变体在测序中的功能。
发明内容
本发明证明了制备Mmup突变型蛋白特定位点突变的Mmup单体变体,可以用于纳米孔测序,然而野生型Mmup单体并没有该功能。并且,应用本发明所述的孔蛋白进行纳米孔测序,可以明显的看出各种不同核苷酸电流信号的差别,具备较高的测序精确度。
本发明所述的“Mmup”来源于产粘液分枝杆菌。优选的,所述的“Mmup”来源于Mycolicibacterium mucogenicum。
具体的,本发明的第一方面,提供了一种Mmup单体变体,所述的Mmup单体变体包含SEQ ID NO:1第91-99位任意一个或多个氨基酸突变的氨基酸序列。
优选的,所述的Mmup单体变体包含第91位天冬氨酸(D)和/或第99位丙氨酸(A)的突变。
在本发明的一个具体实施方式中,所述的Mmup单体变体包含第91位天冬氨酸(D)的突变。
在本发明的另一个具体实施方式中,所述的Mmup单体变体包含第99位丙氨酸(A)的突变。
在本发明的还一个具体实施方式中,所述的Mmup单体变体包含第91位天冬氨酸(D)和第99位丙氨酸(A)的突变。
优选的,所述的Mmup单体变体包含至少一种如下突变:
D91突变为:脯氨酸(P)、色氨酸(W)、精氨酸(R)、谷氨酰胺(Q)、赖氨酸(K)、苯丙氨酸(F)、丝氨酸(S)、天冬酰胺(N)、半胱氨酸(C)、异亮氨酸(I)、亮氨酸(L)或缬氨酸(V),或者,非天然氨基酸;或者,
A99突变为:脯氨酸(P)、苯丙氨酸(F)、异亮氨酸(I)、亮氨酸(L)、缬氨酸(V)、赖氨酸(K)或精氨酸(R),或者,非天然氨基酸。
进一步优选的,所述的Mmup单体变体包含D91K和/或A99K的突变。
在本发明的一个具体实施方式中,所述的Mmup单体变体包含D91K的突变。
在本发明的另一个具体实施方式中,所述的Mmup单体变体包含A99K的突变。
在本发明的还一个实施方式中,所述的Mmup单体变体包含D91K和A99K的突变。
优选的,所述的Mmup单体变体还包含SEQ ID NO:1第80-90位和/或100-120位任意一个或多个氨基酸突变的氨基酸序列。
进一步优选的,所述的Mmup单体变体还包含SEQ ID NO:1第1-79位和/或121-186位任意一个或多个氨基酸突变的氨基酸序列。
优选的,所述的Mmup单体变体还包含第89位亮氨酸(L)的突变、第110位天冬酰胺(N)的突变、第120位天冬氨酸(D)的突变、第136位天冬酰胺(N)的突变或第141位丝氨酸(S)的突变中的一种或两种以上的组合。
进一步优选的,所述的Mmup单体变体包含至少一种如下突变:
L89突变为:天冬酰胺(N)、丙氨酸(A)、谷氨酰胺(Q)、甘氨酸(G)、丝氨酸(S)、苏氨酸(T)、赖氨酸(K)或脯氨酸(P),或者,非天然氨基酸;或者,
N110突变为:脯氨酸(P)、丙氨酸(A)、异亮氨酸(I)或亮氨酸(L),或者,非天然氨基酸;或者,
D120突变为:精氨酸(R)、赖氨酸(K)、天冬酰胺(N)、谷氨酰胺(Q)、丙氨酸(A)、丝氨酸(S)、甘氨酸(G)或苏氨酸(T),或者,非天然氨基酸;或者,
N136突变为:精氨酸(R)、赖氨酸(K)、谷氨酰胺(Q)、丙氨酸(A)、丝氨酸(S)或苏氨酸(T),或者,非天然氨基酸;或者,
S141突变为:精氨酸(R)、赖氨酸(K)、谷氨酰胺(Q)、丙氨酸(A)、丝氨酸(S)或苏氨酸(T),或者,非天然氨基酸。
优选的,所述的Mmup单体变体还可以包含除上述突变类型以外的其他突变型,只要所述的突变不影响多核苷酸通过孔蛋白时对不同多核苷酸的区分即可。
优选的,所述的Mmup单体变体还可以包括引入半胱氨酸的突变,以连接用于测序的分子,例如核酸结合蛋白等。
优选的,所述的Mmup单体变体可以只包含孔蛋白形成结构域的收缩区和环形区片段序列,且保留孔形成活性。可以去除多余的残基或者增加其他氨基酸残基,且保留孔形成活性。所述的片段长度可以为至少12、20、40、50、100或150个氨基酸。
优选的,所述的Mmup单体变体可以是经过修饰的,以便于鉴定或纯化。例如:通过添加天冬氨酸残基(asp标签)、链霉亲和素标签、flag标签或组氨酸残基(His标签)。
优选的,所述Mmup单体变体可带有显示标记物。例如:荧光分子、放射性同位素125I、放射性同位素35S、多核苷酸、生物素、抗原或抗体。
优选的,所述的Mmup单体变体还包括分子发动机。优选的,所述的分子发动机是酶。进一步优选的,所述的酶是聚合酶、外切核酸酶或Klenow片段。
本发明的第二方面,提供了一种包含至少一个本发明任一所述Mmup单体变体的构建体。其中,所述的构建体保留了形成孔的能力。
优选的,所述的构建体包含1-50个Mmup单体变体,其中,所述的Mmup单体变体相同或不同。具体的,所述的构建体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个所述Mmup单体变体,其中,所述的Mmup单体变体相同或不同。
进一步优选的,所述的构建体包含1-20个Mmup单体变体,其中,所述的Mmup单体变体相同或不同。具体的,所述的构建体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个Mmup单体变体,其中,所述的Mmup单体变体相同或不同。
优选的,所述的构建体还包含野生型Mmup单体。
进一步优选的,所述的构建体包含1-50个野生型Mmup单体。具体的,所述的构建体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个野生型Mmup单体。
在本发明的一个具体实施方式中,所述的构建体包含1-20个野生型Mmup单体。具体的,所述的构建体包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个野生型Mmup单体。
最为优选的,所述的构建体包含4-10个相同或不同的Mmup单体变体。
在本发明的一个具体实施方式中,所述的构建体包含4、6、8、10个相同或不同的Mmup单体变体。
优选的,所述的Mmup单体变体与Mmup单体变体、野生型Mmup单体与野生型Mmup单体、Mmup单体变体与野生型Mmup单体之间通过共价连接。
优选的,所述的Mmup单体变体与Mmup单体变体、野生型Mmup单体与野生型Mmup单体、Mmup单体变体与野生型Mmup单体之间是遗传上融合的。
本发明的第三方面,提供了一种包含至少一个Mmup单体变体的孔蛋白,所述的Mmup单体变体包含SEQ ID NO:1第91-99位任意一个或多个氨基酸突变的氨基酸序列,所述的突变导致当多聚核苷酸单链通过所述包含至少一个Mmup单体变体的孔蛋白时,产生由于不同种类的核苷酸的物理或化学性质的不同而造成的孔内电阻的差异。
优选的,所述的突变导致电荷性质或者氨基酸疏水性质变化。
优选的,所述的电阻的差异是指可用于表征多核苷酸的特征,所述的特征包括多核苷酸的来源、长度、大小、分子量、同一性、序列、二级结构、浓度或目标多核苷酸是否被修饰。进一步优选的,所述的电阻的差异是指可用于表征多核苷酸的序列特征,即所述的孔蛋白可以用于测序,精确的区分多核苷酸的不同碱基。
优选的,所述的多核苷酸可以是是天然存在的或人工合成的。进一步优选的,所述的多核苷酸可以是天然的DNA、RNA或者经过修饰的DNA或RNA。
更进一步优选的,所述的目标多核苷酸中的一个或多个核苷酸可以是经过修饰的,例如甲基化、氧化、损伤、脱碱基的、蛋白标记、带有标签或多核苷酸序列中间连接一段间隔物。
更进一步优选的,所述人工合成的核酸选自肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁定核酸(LNA)或其他具有核苷侧链的合成聚合物。
优选的,所述的目标多核苷酸为单链、双链或至少一部分是双链的。
优选的,所述的Mmup单体变体包含第91位天冬氨酸(D)和/或第99位丙氨酸(A)的突变。
在本发明的一个具体实施方式中,所述的Mmup单体变体包含第91位天冬氨酸(D)的突变。
在本发明的另一个具体实施方式中,所述的Mmup单体变体包含第99位丙氨酸(A)的突变。
在本发明的还一个具体实施方式中,所述的Mmup单体变体包含第91位天冬氨酸(D)和第99位丙氨酸(A)的突变。
进一步优选的,所述的Mmup单体变体包含至少一种如下突变:
D91突变为:脯氨酸(P)、色氨酸(W)、精氨酸(R)、谷氨酰胺(Q)、赖氨酸(K)、苯丙氨酸(F)、丝氨酸(S)、天冬酰胺(N)、半胱氨酸(C)、异亮氨酸(I)、亮氨酸(L)或缬氨酸(V),或者,非天然氨基酸;或者,
A99突变为:脯氨酸(P)、苯丙氨酸(F)、异亮氨酸(I)、亮氨酸(L)、缬氨酸(V)、赖氨酸(K)或精氨酸(R),或者,非天然氨基酸。
更进一步优选的,所述的Mmup单体变体包含D91K和/或A99K的突变。
在本发明的一个具体实施方式中,所述的Mmup单体变体包含D91K和A99K的突变。
优选的,所述的Mmup单体变体还包含SEQ ID NO:1第80-90位和/或100-120位任意一个或多个氨基酸突变的氨基酸序列。
进一步优选的,所述的Mmup单体变体还包含SEQ ID NO:1第1-79位和/或121-186位任意一个或多个氨基酸突变的氨基酸序列。
优选的,所述的Mmup单体变体还包含第89位亮氨酸(L)的突变、第110位天冬酰胺(N)的突变、第120位天冬氨酸(D)的突变、第136位天冬酰胺(N)的突变或第141位丝氨酸(S)的突变中的一种或两种以上的组合。
进一步优选的,所述的Mmup单体变体还包含至少一种如下突变:
L89突变为:天冬酰胺(N)、丙氨酸(A)、谷氨酰胺(Q)、甘氨酸(G)、丝氨酸(S)、苏氨酸(T)、赖氨酸(K)或脯氨酸(P),或者,非天然氨基酸;或者,
N110突变为:脯氨酸(P)、丙氨酸(A)、异亮氨酸(I)或亮氨酸(L),或者,非天然氨基酸;或者,
D120突变为:精氨酸(R)、赖氨酸(K)、天冬酰胺(N)、谷氨酰胺(Q)、丙氨酸(A)、丝氨酸(S)、甘氨酸(G)或苏氨酸(T),或者,非天然氨基酸;或者,
N136突变为:精氨酸(R)、赖氨酸(K)、谷氨酰胺(Q)、丙氨酸(A)、丝氨酸(S)或苏氨酸(T),或者,非天然氨基酸;或者,
S141突变为:精氨酸(R)、赖氨酸(K)、谷氨酰胺(Q)、丙氨酸(A)、丝氨酸(S)或苏氨酸(T),或者,非天然氨基酸。
优选的,所述包含至少一个Mmup单体变体的孔蛋白包含至少1-50个Mmup单体变体,其中,所述的Mmup单体变体相同或不同。
具体的,所述包含至少一个Mmup单体变体的孔蛋白包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个所述Mmup单体变体,所述的Mmup单体变体相同或不同。
进一步优选的,所述包含至少一个Mmup单体变体的孔蛋白包含至少1-20个Mmup单体变体,其中,所述的Mmup单体变体相同或不同。
具体的,所述包含至少一个Mmup单体变体的孔蛋白包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个所述Mmup单体变体,所述的Mmup单体变体相同或不同。
优选的,所述包含至少一个Mmup单体变体的孔蛋白还包含野生型Mmup单体。
优选的,所述包含至少一个Mmup单体变体的孔蛋白包含1-50个野生型Mmup单体。
具体的,所述包含至少一个Mmup单体变体的孔蛋白包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个野生型Mmup单体。
进一步优选的,所述包含至少一个Mmup单体变体的孔蛋白包含1-20个野生型Mmup单体。
具体的,所述包含至少一个Mmup单体变体的孔蛋白包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个野生型Mmup单体。
在本发明的一个具体实施方式中,所述包含至少一个Mmup单体变体的孔蛋白包含4-10个相同或不同的Mmup单体变体。
在本发明的一个具体实施方式中,所述包含至少一个Mmup单体变体的孔蛋白包含4、6、8、10个相同或不同的Mmup单体变体。
优选的,所述的Mmup单体变体与Mmup单体变体、野生型Mmup单体与野生型Mmup单体、Mmup单体变体与野生型Mmup单体之间通过共价连接。
优选的,所述的Mmup单体变体与Mmup单体变体、野生型Mmup单体与野生型Mmup单体、Mmup单体变体与野生型Mmup单体之间是遗传上融合的。
优选的,所述包含在包含至少一个Mmup单体变体的孔蛋白中的Mmup单体变体相同或不同。例如:所述包含至少一个Mmup单体变体的孔蛋白可以包含八个相同或者不同的Mmup单体变体。优选的,所述包含至少一个Mmup单体变体的孔蛋白包含一个Mmup单体变体和七个相同单体,其中,所述Mmup单体变体与相同单体不同。或者,所述包含至少一个Mmup单体变体的孔蛋白包含两个相同或不同的Mmup单体变体和六个相同单体,其中,所述的Mmup单体变体与相同单体不同。或者,所述包含至少一个Mmup单体变体的孔蛋白包含三个相同或不同的的Mmup单体变体和五个相同单体,其中,所述的Mmup单体变体与相同单体不同。或者,所述包含至少一个Mmup单体变体的孔蛋白包含四个相同或不同的的Mmup单体变体和四个相同单体,其中,所述的Mmup单体变体与相同单体不同。或者,所述包含至少一个Mmup单体变体的孔蛋白包含五个相同或不同的的Mmup单体变体和三个相同单体,其中,所述的Mmup单体变体与相同单体不同。或者,所述包含至少一个Mmup单体变体的孔蛋白包含六个相同或不同的的Mmup单体变体和两个相同单体,其中,所述的Mmup单体变体与相同单体不同。或者,所述包含至少一个Mmup单体变体的孔蛋白包含七个相同或不同的的Mmup单体变体和一个单体,其中,所述的Mmup单体变体与一个单体不同。
优选的,所述包含至少一个Mmup单体变体的孔蛋白包含八个相同或不同的所述的Mmup单体变体。
优选的,所述包含至少一个Mmup单体变体的孔蛋白可以为同源的或异源的。
优选的,所述包含至少一个Mmup单体变体的孔蛋白包含收缩区和环形区。
优选的,所述包含至少一个Mmup单体变体的孔蛋白的收缩区孔道直径小于野生型Mmup单体组成的孔蛋白的收缩区孔道直径。进一步优选的,所述包含至少一个Mmup单体变体的孔蛋白的收缩区孔道直径小于 或更进一步优选的,所述包含至少一个Mmup单体变体的孔蛋白的收缩区孔道直径小于 或
优选的,所述的Mmup单体变体还可以包含除上述突变类型以外的其他突变型,只要所述的突变不影响多核苷酸通过孔蛋白时对不同多核苷酸的区分即可。
优选的,所述的单体变体还可以包括引入半胱氨酸的突变,以连接用于测序的分子,例如核酸结合蛋白等。
优选的,所述的Mmup单体变体可以只包含孔蛋白形成结构域的收缩区和环形区片段序列,且保留孔形成活性。可以去除多余的残基或者增加其他氨基酸残基,且保留孔形成活性。所述的片段长度可以为至少12、20、40、50、100或150个氨基酸。
优选的,所述的Mmup单体变体可以是经过修饰的,以便于鉴定或纯化。例如:通过添加天冬氨酸残基(asp标签)、链霉亲和素标签、flag标签或组氨酸残基(His标签)。
优选的,所述Mmup单体变体可带有显示标记物。例如:荧光分子、放射性同位素125I、放射性同位素35S、多核苷酸、生物素、抗原或抗体。
优选的,所述的Mmup单体变体还包括分子发动机。优选的,所述的分子发动机是酶。进一步优选的,所述的酶是聚合酶、外切核酸酶或Klenow片段。
优选的,所述包含至少一个Mmup单体变体的孔蛋白还包括帽状体形成区和/或桶状体形成区域。
优选的,所述包含至少一个Mmup单体变体的孔蛋白允许水合离子在施加的电势的驱动下从膜的一侧流向膜的另一层。其中,所述的膜为双层膜,进一步优选为脂质双层膜。
本发明的第四方面,提供了一种编码本发明任一所述包含至少一个Mmup单体变体的孔蛋白、本发明任一所述的Mmup单体变体或者本发明任一所述构建体的核苷酸序列。
优选的,所述的编码所述Mmup单体变体的核苷酸序列与SEQ ID NO:2或SEQ IDNO:11所示序列具有70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%同源性,且编码所述Mmup单体变体的核苷酸的序列。
在本发明的一个具体实施方式中,所述的编码所述Mmup单体变体的核苷酸序列为SEQ ID NO:11所示。
本发明的第五方面,提供了一种包含编码本发明所述的Mmup单体变体、本发明所述的孔蛋白或者本发明所述构建体的核苷酸序列的载体。
优选的,所述的载体可以提供有复制起点、任选用于表达所述核苷酸序列的启动子以及任选所述启动子的调节信号基因的质粒、病毒或噬菌体载体。所述载体可含有一个或多个选择性标记基因,例如四环素抗性基因。启动子和其他表达调节信号可被选择为与所述表达载体设计用于的宿主细胞相容。所述的启动子选自T7、trc、lac、ara或λL启动子。
本发明所述的Mmup单体变体可以采用化学合成或者重组方式制备,优选为重组方式制备。
优选的,所述的载体包含与编码本发明任一所述包含至少一个Mmup单体变体的孔蛋白、本发明任一所述的Mmup单体变体或者本发明任一所述构建体的核苷酸序列可操作性连接的启动子。
进一步优选的,所述的启动子为诱导型启动子或组成型启动子,其中,所述的诱导型启动子为乙酰胺诱导型启动子。
优选的,所述编码包含至少一个Mmup单体变体的孔蛋白的核苷酸序列包含至少一条编码Mmup单体变体的核苷酸序列。
进一步优选的,所述编码包含至少一个Mmup单体变体的孔蛋白的核苷酸序列还包含至少一条编码野生型Mmup单体的核苷酸序列。
更进一步优选的,所述编码Mmup单体变体的核苷酸序列与编码Mmup单体变体的核苷酸序列,编码Mmup单体变体的核苷酸序列与编码野生型Mmup单体的核苷酸序列,或者,编码野生型Mmup单体的核苷酸序列与编码野生型Mmup单体的核苷酸序列之间通过编码氨基酸连接体序列连接。
本发明的第六方面,提供了一种表达本发明任一所述的Mmup单体变体、本发明任一所述构建体或本发明任一所述包含至少一个Mmup单体变体的孔蛋白的突变细菌,所述的细菌包含:
(a)野生型Mmup单体的缺失;和(b)本发明任一所述的载体。
优选的,所述的细菌包含与编码Mmup单体变体、包含Mmup单体变体的构建体或者包含Mmup单体变体的孔蛋白的核苷酸序列可操作性连接的启动子的载体。
进一步优选的,所述的Mmup单体变体包括Mmup单体变体的旁系同源物或同系物。
进一步优选的,所述的包含Mmup单体变体的构建体包括Mmup单体变体的旁系同源物或同系物构建体或单体。
进一步优选的,所述的包含Mmup单体变体的孔蛋白包括Mmup单体变体的旁系同源物或同系物孔蛋白或单体。
优选的,所述的细菌还可以包含与编码野生型Mmup单体、包含野生型Mmup单体的构建体或者包含野生型Mmup单体的孔蛋白的核苷酸序列可操作性连接的启动子的载体。
进一步优选的,野生型Mmup单体包括野生型Mmup单体的旁系同源物或同系物单体。
进一步优选的,所述包含野生型Mmup单体的构建体为野生型Mmup单体旁系同源物或同系物构建体或单体。
进一步优选的,所述包含野生型Mmup单体的孔蛋白为野生型Mmup单体的旁系同源物或同系物孔蛋白或单体。
优选的,所述的细菌为产粘液分枝杆菌。
本发明的第七方面,提供了一种产生Mmup孔蛋白的方法,所述的方法包括用包含本发明任一所述的载体转化本发明任一所述的细菌,诱导细菌表达Mmup孔蛋白。
本发明的第八方面,提供了一种Mmup单体变体的制备方法,所述的载体可引入适合的宿主细胞中,通过将所述编码Mmup单体变体的核苷酸序列插入载体中,将所述载体引入相容的细菌宿主细胞并且在允许所述核苷酸表达的条件下培养所述宿主细胞来产生本发明所述的Mmup单体变体。
本发明的第九方面,提供了一种包含本发明所述核苷酸序列或所述载体的细胞。
优选的,所述的细胞可以为大肠杆菌等等。更优选的,所述的细胞为dam+型菌株(例如DH5α菌株)。
本发明的第十方面,提供了一种表征目标多核苷酸的方法,包括:
(a)将目标多核苷酸与本发明任一所述包含至少一个Mmup单体变体的孔蛋白接触,使得所述目标多核苷酸序列穿过包含至少一个Mmup单体变体的孔蛋白;和
(b)获取目标多核苷酸穿过包含至少一个Mmup单体变体的孔蛋白时核苷酸与包含至少一个Mmup单体变体的孔蛋白相互作用的一个或多个特征,以表征所述目标多核苷酸。
优选的,重复步骤(a)、(b)一次或多次。
优选的,所述的步骤(a)中目标多核苷酸可以与衍生自多核苷酸处理酶结合,从而控制转位速度。进一步优选的,所述的多核苷酸处理酶是能够与多核苷酸相互作用并修饰其至少一种性质的多肽。其中,所述的多核苷酸处理酶可以具有酶活性也可以不具有酶活性,只要该酶结合多核苷酸且控制其在孔中的转位速度即可。其中,所述的核酸可以与一个或多个多核苷酸处理酶。
优选的,所述的多核苷酸处理酶为溶核酶。进一步优选的,所述的多核苷酸处理酶包括但不限于核酸结合蛋白、解旋酶、聚合酶、核酸外切酶、端粒酶、反转录酶、转位酶或拓扑异构酶。
在本发明的一个具体实施方式中,所述的多核苷酸处理酶为促旋酶。
优选的,所述步骤(a)中还包括目标多核苷酸与核酸结合蛋白、解旋酶、核酸外切酶、端粒酶、拓扑异构酶、反转录酶、转位酶和/或聚合酶中的一种或两种以上的组合接触的步骤,使得所述目标多核苷酸序列穿过孔蛋白的转位速度小于核酸结合蛋白、解旋酶、核酸外切酶、端粒酶、拓扑异构酶、反转录酶、转位酶和/或聚合酶不存在时的转位速度。
进一步优选的,所述的核酸结合蛋白包括但不限于修饰或者野生的真核单链结合蛋白、细菌单链结合蛋白、古生单链结合蛋白、病毒单链结合蛋白或双链结合蛋白中的一种或两种以上的组合。所述的核酸结合蛋白包括但不限于来自Escherichia coli的SSBEco、来自Bartonella henselae的SSBBhe、来自Coxiella burnetii的SSBCbu、来自Thermathogamaritima的SSBTma、来自Helicobacter pylori的SSBHpy、来自Deinococcus radiodurans的SSBDra、来自Thermus aquaticus的SSBTaq、来自Mycobacterium smegmatis的SSBMsm、来自Sulfolobus solfataricus的SSBSso、来自Sulfolobus solfataricus的SSBSso7D、来自Homo sapiens的SSBMHsmt、来自Mycobacterium leprae的SSBMle、来自Bacteriohage T4的gp32T4、来自Bacteriophage RB69的gp32RB69或来自Bacteriohage T7的gp2.5T7。
进一步优选的,所述的解旋酶可以为任一Hel308家族解旋酶及修饰的Hel308家族解旋酶、RecD解旋酶及其变体、TrwC解旋酶及其变体、Dda解旋酶及其变体、TraI Eco及其变体、XPD Mbu及其变体。
进一步优选的,所述的聚合酶包括但不限于修饰或者野生的DNA聚合酶,包括但不限于Phi29DNA聚合酶、Tts DNA聚合酶、M2DNA聚合酶、VENT DNA聚合酶、T5DNA聚合酶、PRD1DNA聚合酶、Bst DNA聚合酶或REPLI-gscDNA聚合酶。
进一步优选的,所述的核酸外切酶包括但不限于修饰或者野生的来自大肠杆菌的核酸外切酶I、来自大肠杆菌的核酸外切酶III、来自噬菌体λ核酸外切酶或者来自嗜热栖热菌的RecJ。在本发明的一个具体实施方式中,所述步骤(a)中包括目标多核苷酸与解旋酶接触的步骤,所述的解旋酶为EF8813,所述的解旋酶的氨基酸序列为SEQ ID NO:3所示,所述解旋酶的核苷酸序列为SEQ ID NO:4所示。优选的,所述的目标多核苷酸可以与一个或多个解旋酶接触。进一步优选的,所述的目标多核苷酸可以与2-20个解旋酶、甚至更多个的解旋酶接触。其中,所述与目标多核苷酸结合的解旋酶可以相同也可以不同。且与目标多核苷酸结合的多个解旋酶彼此共价连接。
优选的,所述的一个或多个特征选自目标多核苷酸的来源、长度、大小、分子量、同一性、序列、二级结构、浓度或目标多核苷酸是否被修饰。
在本发明的一个具体实施方式中,所述的特征为序列。
优选的,所述步骤(b)中所述一个或多个特征通过电测量和/或光学测量进行。
进一步优选的,通过电测量和/或光测量产生电信号和/或光信号,而每种核苷酸对应一种信号水平,继而将电信号和/或光信号转化为核苷酸的序列特征。
本发明所述的电测量选自电流测量、阻抗测量、场效应晶体管(FET)测量、隧道测量或风洞测量。
本发明所述的电信号选自电流、电压、隧穿、电阻、电位、电导率或横向电测量的测量值。
在本发明的一个具体实施方式中,所述的电信号为穿过所述孔的电流。即所述电流以核苷酸特异性方式通过所述孔,如果检测到与核苷酸相关特征性电流流经所述孔,则存在所述的核苷酸。反之,则不存在。然而,对于相似核苷酸或者修饰的核苷酸之间的区分,则根据电流的幅度确定。
优选的,采用本发明所述的孔蛋白进行多核苷酸的表征过程中产生的电导高于野生型Mmup单体形成的孔。
优选的,所述的方法还包括横跨目标多核苷酸接触的孔蛋白施加电势差的步骤。其中,所述的电势差足以将目标多核苷酸从孔蛋白的通道中转位。
优选的,所述的目标多核苷酸可以是天然的DNA、RNA或者经过修饰的DNA或RNA。
本发明所述的目标多核苷酸为含有一个或多个核苷酸的大分子。
本发明所述的目标多核苷酸可以是天然存在的或人工合成的。优选的,所述的目标多核苷酸中的一个或多个核苷酸可以是经过修饰的,例如甲基化、氧化、损伤、脱碱基的、蛋白标记、带有标签或多核苷酸序列中间连接一段间隔物。优选的,所述人工合成的核酸选自肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁定核酸(LNA)、或其他具有核苷侧链的合成聚合物。
优选的,所述的孔蛋白允许水合离子在施加的电势的驱动下从膜的一侧流向膜的另一层。其中,所述的膜可形成离子、核苷酸和核酸流的屏障。进一步优选的,所述的膜为双层膜,进一步优选为脂质双层膜。所述的脂质双层膜包括但不限于磷脂、糖脂、胆固醇、分枝菌酸中的一种或两种以上的混合物。
优选的,所述的孔蛋白通道位于第一导电性液体介质与第二导电性液体介质之间,其中,至少一种导电性液体介质包含目标多核苷酸,并且第一导电性液体介质与第二导电性液体介质可以相同,也可以不同,只要可以达到分析目标多核苷酸一个或多个特征的目的即可。
优选的,所述的目标多核苷酸为单链、双链或至少一部分是双链的。
在本发明所述的一个具体实施方式中,所述的目标多核苷酸为至少一部分是双链的。其中所述的双链部分构成Y衔体结构,所述的Y衔体结构包含优先螺入所述孔蛋白的前导序列,所述的前导序列3’端连接硫醇、生物素或胆固醇,用来与脂质双层膜的一层膜结合,以为目标多核苷酸指向正确的方向并具有拉动的作用。
在本发明的一个具体实施方式中,所述的前导序列3’端连接胆固醇,用来与脂质双层膜的一层膜结合。
调节表征目标多核苷酸过程中的电压、盐浓度、缓冲液、添加剂或温度可以控制本发明所述的孔蛋白在表征目标多核苷酸中对不同核苷酸的区分程度。其中,所述的添加剂选自DTT、脲或甜菜碱。
优选的,所述的电压范围为-250mV至+250mV。进一步优选的,所述的电压选自-250mV、-210mV、-180mV、-140mV、-110mV、-90mV、-70mV、-40mV、0mV、+40mV、+70mV、+90mV、+110mV、+140mV、+180mV、+210mV、+250mV。
在本发明的一个具体实施方式中,所述的电压为-180mV至+180mV。
在本发明的一个具体实施方式中,所述的方法包括:将所述的孔蛋白插入膜中,然后将目标多核苷酸与所述的孔蛋白、核酸结合蛋白、聚合酶、核酸外切酶、端粒酶、拓扑异构酶、反转录酶、转位酶和/或解旋酶接触,向横跨目标多核苷酸接触的孔蛋白施加电势差,使得所述目标多核苷酸序列穿过孔蛋白;和
获取目标多核苷酸穿过孔蛋白时核苷酸与孔蛋白相互作用的电流特征,以鉴别多核苷酸为是否存在、为何种核苷酸或者是否经过修饰。
优选的,所述的孔蛋白插入膜中的方法可以为任何本领域已知的可以达到表征多核苷酸目的的方法。进一步优选的,所述孔蛋白可以以纯化形式悬浮于含有脂双层的溶液中,使得其扩散到所述脂双层并且通过结合到所述脂双层并组装为有功能的状态而插入到所述脂双层中。
本发明的第十一方面,提供了一种本发明任一所述包含至少一个Mmup单体变体的孔蛋白、本发明任一所述的Mmup单体变体、本发明任一所述构建体、本发明所述的核苷酸序列、本发明任一所述的载体或者本发明任一所述的突变细菌在表征目标多核苷酸中的应用。
本发明的第十二方面,提供了一种表征目标多核苷酸的试剂盒,所述的试剂盒包括本发明任一所述包含至少一个Mmup单体变体的孔蛋白、本发明任一所述的Mmup单体变体、本发明任一所述构建体、本发明所述的核苷酸序列、本发明任一所述的载体或者本发明任一所述的突变细菌。
优选的,所述的Mmup单体变体、所述的构建体、所述的核苷酸序列、所述的载体、所述的细胞或所述的孔蛋白均可以为多个。
优选的,所述的试剂盒还包括一个或多个核酸结合蛋白、解旋酶、核酸外切酶、端粒酶、拓扑异构酶、反转录酶、转位酶和/或聚合酶中的一种或两种以上的组合。
优选的,所述的试剂盒还包括脂质双层的芯片,所述的孔蛋白横跨脂质双层。
优选的,所述的试剂盒包含一个或多个脂质双层,每个脂质双层包含一个或多个所述的孔蛋白。
优选的,所述的试剂盒还包括实施表征目标多核苷酸的试剂或装置。进一步优选的,所述的试剂包括缓冲剂、PCR扩增所需的工具。
本发明的第十三方面,提供了一种表征目标多核苷酸的装置,所述的装置包括本发明任一所述包含至少一个Mmup单体变体的孔蛋白、本发明任一所述的Mmup单体变体、本发明任一所述构建体、本发明所述的核苷酸序列、本发明任一所述的载体或者本发明任一所述的突变细菌。
优选的,所述的装置还包括一个或多个核酸结合蛋白、解旋酶、核酸外切酶、端粒酶、拓扑异构酶、反转录酶、转位酶和/或聚合酶中的一种或两种以上的组合。
优选的,所述的装置还包括支撑所述孔蛋白并可传输孔蛋白与多核苷酸相互作用的信号的传感器,至少一个用于存储目标多核苷酸的存储器,和实施表征过程所需的溶液。
优选的,所述的装置还包括膜片钳放大器和/或数据获取装置。
本发明的第十四方面,提供了一种表征目标多核苷酸的传感器,所述的传感器包括本发明任一所述包含至少一个Mmup单体变体的孔蛋白、本发明任一所述的Mmup单体变体、本发明任一所述构建体、本发明所述的核苷酸序列、本发明任一所述的载体或者本发明任一所述的突变细菌。
本发明所述的“非天然氨基酸”为非在蛋白质中天然发现的包含氨基和羧基的化合物。优选的,所述的非天然氨基酸为本领域已知的任何非天然氨基酸。进一步优选的,所述的非天然氨基酸包括但不限于N-乙基天冬氨酰、羟基赖氨酸、3-羟基脯氨酸、2-氨基丁酸、β-丙氨酸、β-氨基丙酸、2-氨基己二酸、3-氨基己二酸、4-氨基丁酸、6-氨基己酸、2-氨基庚酸、别-异亮氨酸、异锁链赖氨酸、4-羟基脯氨酸、别-羟基赖氨酸、2-氨基异丁酸、N-甲基甘氨酸、N-甲基异亮氨酸、3-氨基异丁酸、6-N-甲基赖氨酸、2,4-二氨基丁酸、N-甲基缬氨酸、鸟氨酸、正亮氨酸、正缬氨酸、锁链素、2,2’-二氨基庚二酸、2,3-二氨基丙酸、N-乙基甘氨酸或2-氨基庚二酸等等。
本发明所述的“修饰的……基酸”为侧链被化学修饰的氨基酸。例如:翻译后修饰的氨基酸,或者,侧链包含新型官能团(如硫氢基、氨基或羧基),或者,侧链包含产生信号的部分(如荧光基团或放射性标记)。
本发明所述的“核苷酸”包括但不局限于:腺苷单磷酸(AMP)、鸟苷单磷酸(GMP)、胸苷单磷酸(TMP)、尿苷单磷酸(UMP)、胞嘧啶核苷单磷酸(CMP)、环状腺苷单磷酸(cAMP)、环状鸟苷单磷酸(cGMP)脱氧腺苷单磷酸(dAMP)、脱氧鸟苷单磷酸(dGMP)、脱氧胸苷单磷酸(dTMP)、脱氧尿苷单磷酸(dUMP)和脱氧胞苷单磷酸(dCMP)。优选的,所述核苷酸选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。
本发明所述的“和/或”包括择一列出的项目以及任何数量的项目组合。
本发明所述的“包括”是开放式的描述,含有所描述的指定成分或步骤,以及不会实质上影响的其他指定成分或步骤。
本发明所述的“约”用于表示该数值和用于测定该数值的装置或方法所允许的标准差。
本发明所述的“同源性”,是指在使用蛋白序列或核苷酸序列的方面,本领域技术人员可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的序列一致性。
本发明所述的“Mmup单体变体”是指与野生型Mmup单体具有至少或至多70、75、80、85、90、91、92、93、94、95、96、97、98、99、99.5或99.9%或更多、或可来自其间的任何范围、但小于100%的同一性并且当与一个或多个其他Mmup单体变体或野生型Mmup单体结合时保持形成通道的能力的Mmup单体变体。任选地,Mmup单体变体被进一步确定为在促进完全形成的通道形成孔蛋白的收缩区和/或环形区的形成的序列部分中包含突变。Mmup单体变体可以是例如重组蛋白。Mmup单体变体可包含本文中描述的任何突变。
本发明所述的″Mmup单体变体的旁系同源物或同系物孔蛋白″是指与野生型Mmup单体的旁系同源物或同系物孔蛋白具有至少或至多70、75、80、85、90、91、92、93、94、95、96、97、98、99、99.5或99.9%或更多,或可来自其间的任何范围,但小于100%的同一性并且保持通道形成能力的Mmup单体变体的旁系同源物或同系物孔蛋白。任选地,Mmup单体变体的旁系同源物或同系物孔蛋白被进一步确定为在序列的该部分包含突变,所述部分促进完全形成的通道形成孔蛋白的收缩区和/或环形区的形成。Mmup单体变体的旁系同源物或同系物孔蛋白可以例如是重组蛋白质。任何Mmup单体变体的旁系同源物或同系物孔蛋白可以任选地用于本文中的任何实施方案。
本发明所述的“Mmup单体变体的旁系同源物或同系物构建体”是指与野生型Mmup单体的旁系同源物或同系物构建体具有至少或至多70、75、80、85、90、91、92、93、94、95、96、97、98、99、99.5或99.9%或更多,或可来自其间的任何范围,但小于100%的同一性并且保持通道形成能力的Mmup单体变体的旁系同源物或同系物构建体。任选地,Mmup单体变体的旁系同源物或同系物构建体被进一步确定为在序列的该部分包含突变,所述部分促进完全形成的通道形成孔蛋白的收缩区和/或环形区的形成。Mmup单体变体的旁系同源物或同系物构建体可以例如是重组蛋白质。任何Mmup单体变体的旁系同源物或同系物构建体可以任选地用于本文中的任何实施方案。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:Mmup-(D91K/A99K)单体变体蛋白分子排阻层析的纯化结果,其中,1-6泳道显示的是分子筛分离的不同组分的SDS-PAGE电泳检测结果。
图2:包含Mmup单体变体的纳米孔蛋白(D91K/A99K)的棍棒模型,图中主要显示了通道孔道收缩区和环形区的氨基酸分布特征,尤其是收缩区和环形区的关键氨基酸残基分布,指向孔道中心的氨基酸残基91位的赖氨酸和92位的天冬酰胺,孔道直径约为99位的赖氨酸参与通道复合物的正确组装,其中,同源建模通过SWISS MODEL完成,模板pdb位1uun。
图3:包含野生型Mmup单体的纳米孔通道的棍棒模型,图中主要显示了孔道收缩区和环形区的氨基酸分布特征,尤其是收缩区和环形区的关键氨基酸残基,主要有91位的天冬氨酸,92位的天冬酰胺,93位的缬氨酸和94位的丝氨酸,由D91和N92形成的收缩区直径分别为和其中,同源建模通过SWISS MODEL完成,模板pdb位1uun。
图4:包含野生型Mmup单体的纳米孔基于同源建模的卡通示意图。其中,区域1对应于帽状体形成区,区域2对应于桶状体形成区域,区域3对应于收缩区和环形区。
图5:待测DNA构建体X2&cX2-80-15的结构图,其中区段a对应于SEQ ID NO:7,b对应于解旋酶EF8813-1(含有N端组氨酸标签及其融合有TOPV-HI结构域的变体蛋白,SEQ IDNO:3-4),所述解旋酶可以结合到标记为a的区段,区段c对应于SEQ ID NO:6,区段d对应于SEQ ID NO:5,区段e对应于SEQ ID NO:8,其5′端45个碱基与测试链c段区域互补配对,3′端含有40个胸腺嘧啶和对应于g的3′胆固醇TEG标记,区段f对应于SEQ ID NO:9。
图6:待测DNA构建体S1T&S1MC的结构图,其中区段a对应于SEQ ID NO:10,b对应于解旋酶EF8813-1(含有N端组氨酸标签及其融合有TOPV-HI结构域的变体蛋白,SEQ ID NO:3-4),所述解旋酶可以结合到标记为a的区段,区段h指的是仅保留磷酸骨架的dspacer,标注为x,区段c对应于SEQ ID NO:12,区段d对应于SEQ ID NO:13,区段e对应于SEQ ID NO:14,其5′端45个碱基与测试链c段区域互补配对,3′端含有20个胸腺嘧啶和对应于g的3′胆固醇TEG标记,区段f对应于SEQ ID NO:15。
图7:包含野生型Mmup单体的纳米孔通道在±180mV电压的单通道行为特征,其中,y轴坐标=电流(pA),x轴坐标=时间(s)。
图8:包含Mmup单体变体(D91K/A99K)的纳米孔蛋白在+180mV,0mV和-180mV电压下开孔电流及其门控特征,其中,y轴坐标=电流(pA),x轴坐标=时间(s)。
图9:包含Mmup单体变体(D91K/A99K)的纳米孔蛋白在+180mV和0mV电压下核酸通过纳米孔的信号特征,其中,y轴坐标=电流(pA),x轴坐标=时间(s)。
图10:当解旋酶(EF8813-1)控制DNA构建体X2穿过包含Mmup单体变体(D91K/A99K)的纳米孔蛋白移位时的部分示例电流轨迹,其中,两条轨迹的y轴坐标(左-20至180,右10至80)=电流(pA),x轴坐标(左15:04:25.5至15:04:37.5,右15:04:34.1至15:04:37.1)=时间(s),右图为左图虚线部分显示了电流轨迹的放大结果。
图11:当解旋酶(EF8813-1)控制DNA构建体X2穿过包含Mmup单体变体(D91K/A99K)的纳米孔蛋白移位时的电流轨迹的全过程电流变化结果,其中,y轴坐标=电流(pA),x轴坐标=时间(s)。
图12:当解旋酶(EF8813-1)控制DNA构建体S1T穿过包含Mmup单体变体(D91K/A99K)的纳米孔蛋白移位时的部分示例电流轨迹,其中,两条轨迹的y轴坐标=电流(pA),x轴坐标=时间(s),右图为左图虚线部分显示的电流轨迹的放大结果,箭头指示的电流最大值显示的是dspacer的特征峰。
图13:当解旋酶(EF8813-1)控制DNA构建体S1T穿过包含Mmup单体变体(D91K/A99K)的纳米孔蛋白移位时的电流轨迹的全过程电流变化结果,其中,y轴坐标=电流(pA),x轴坐标=时间(s)。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的部分实施例,而不是全部。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1Mmup单体变体的制备
一、质粒的构建
Mmup单体变体蛋白质序列通过对应氨基酸的密码子优化,并在基因两端添加合适的限制性内切酶酶切位点,具体的5’端添加NcoI位点ccatgg,3’端添加xhoI位点ctcgag,之后进行基因合成,合成后的基因克隆到表达载体pET24b中。
二、目的基因的定点突变,制备Mmup单体变体核苷酸序列
诱导突变基因(PCR反应)以待突变的质粒为模板,用设计的引物及KOD plus高保真酶进行PCR扩增反应,诱导目的基因突变。
具体步骤如下:
1、设计点突变引物,准备模板质粒DNA,进行50μL PCR反应体系扩增。用DH5α菌株作为宿主菌。在end+型菌株中常有克隆数低的现象,但是对突变效率没有影响。其中,提取模板质粒DNA使用QIGEN质粒提纯试剂盒。
点突变引物:
SEQ ID NO:16
GACCCCGAACATTTTACTGAAAAATGTGAGCCCGGCGACCCTGAAAGGTGTTGGTTGGGGTGGC
SEQ ID NO:17
GCCACCCCAACCAACACCTTTCAGGGTCGCCGGGCTCACATTTTTCAGTAAAATGTTCGGGGTC
50μL PCR反应体系:
PCR扩增反应
循环温度反应时间:
PCR扩增反应完成,获得Mmup单体变体核苷酸序列,冰浴5min,然后置于室温(避免反复冻融)。
2、模板消化,提取Mmup单体变体基因
PCR反应结束后使用DpnI酶消化甲基化质粒从而选择突变质粒DNA。准备PCR反应产物。具体步骤为:加入1μL(10U/μL)DpnI酶37℃温育2小时。(当质粒DNA用量过多时DpnI酶可能发生与样品反应不完全的现象。如果突变率低,可以适当延长反应时间或增加DpnI酶用量)
3、转化,获得含有Mmup单体变体基因的菌株
反应完毕后在质粒DNA上会产生缺口,因此当把这个质粒DNA转入E.coli中时选择DH5α。具体步骤为:将4μL突变质粒DNA样品加到50μL DH5α感受态细胞里,然后放置在冰上30min,42℃热击90s,之后立即冰浴2min,加入500μL SOC培养基37℃培养1小时,最后取100μL菌液涂布抗性筛选平板。
4、测序验证
挑取4个转化子培养测序,选取突变正确的阳性转化子提取质粒保存备用。
三、制备Mmup单体变体
将测序验证正确的Mmup单体变体质粒转入BL21(DE3)中培养。然后蛋白纯化,其中,蛋白纯化用试剂配方见表1。
吸取20μL包含Mmup单体变体质粒的BL21(DE3)甘油菌接于20mL(1:1000)含有终浓度50mg/mL卡那霉素的新鲜LB培养基,37℃,200rpm摇菌过夜活化;次日按1%接种量扩大培养至含有终浓度50mg/mL卡那霉素的2L的LB培养基中。37℃,220rpm培养至OD600=0.6-0.8后冰浴迅速降温,之后向培养体系中加入IPTG至终浓度1mM,15℃,220rpm诱导表达过夜。次日6000rpm,4℃离心15min收集菌体,按照菌体:裂解缓冲液=1:10(m/v)比例重悬菌体,之后加入混合蛋白酶抑制剂和终浓度2%的Triton X-100,高压破碎至菌液变清。
室温,搅拌增溶1~2h,14000rpm,4℃离心30min,收集上清液。上清用0.45μm滤膜过滤后用阴离子交换柱纯化,离子柱预先用Buffer B平衡,上清使用5mL/min流速过柱,收集穿透液。之后用Buffer B洗脱杂蛋白,最后用Buffer C:0-1M盐浓度线性梯度洗脱,收集洗脱组分。收集的穿透液样品加入终浓度40%的硫酸铵,冰浴沉淀2h,之后14000rpm,4℃离心30min,收集漂浮的沉淀物。漂浮的沉淀物加入一定体积含有0.5%C8E4(四甘醇单辛基醚)去污剂的分子筛缓冲液重新溶解,4℃孵育过夜。
次日将过夜孵育的样品47000g,4℃离心30min,收集上清液。上清液进行最后一步的分子排阻层析纯化,收集目的组分即为Mmup单体变体。分子排阻层析结果见图1。
表1 蛋白纯化用试剂的配方
实施例2孔蛋白的制备
吸取20μL包含Mmup单体变体质粒的BL21(DE3)甘油菌接于20mL(1:1000)含有终浓度50mg/mL卡那霉素的新鲜LB培养基,37℃,200rpm摇菌过夜活化;次日按1%接种量扩大培养至含有终浓度50mg/mL卡那霉素的2L的LB培养基中。37℃,220rpm培养至OD600=0.6-0.8后冰浴迅速降温,之后向培养体系中加入IPTG至终浓度1mM,15℃,220rpm诱导表达过夜。次日6000rpm,4℃离心15min收集菌体,按照菌体:裂解缓冲液=1:10(m/v)比例重悬菌体,之后加入混合蛋白酶抑制剂和终浓度2%的Triton X-100,高压破碎至菌液变清。
室温,搅拌增溶1~2h,14000rpm,4℃离心30min,收集上清液。上清用0.45μm滤膜过滤后用阴离子交换柱纯化,离子柱预先用Buffer B平衡,上清使用5mL/min流速过柱,收集穿透液。之后用Buffer B洗脱杂蛋白,最后用Buffer C:0-1M盐浓度线性梯度洗脱,收集洗脱组分。收集的穿透液样品加入终浓度40%的硫酸铵,冰浴沉淀2h,之后14000rpm,4℃离心30min,收集漂浮的沉淀物。漂浮的沉淀物加入一定体积含有0.5%C8E4去污剂的分子筛缓冲液重新溶解,4℃孵育过夜。
次日将过夜孵育的样品47000g,4℃离心30min,收集上清液。上清液进行最后一步的分子排阻层析纯化,收集目的组分即为Mmup单体变体。
实施例3孔蛋白的测序应用
在缓冲液(400mM KCl,10mM HEPES pH 8.0,50mM MgCl2)中,将单个纳米孔蛋白插入磷脂双分子层中,并从单个纳米孔蛋白获得电测量值。
具体步骤如下:
在将氨基酸序列为D91K/A99K突变的SEQ ID NO:1的单个孔蛋白(Mmup单体变体孔蛋白,棍棒模型如图2所示)插入所述磷脂双分子层之后,使缓冲液(400mM KCl,10mM HEPESpH 8.0,50mM MgCl2)流经该系统,以除去任何过量的Mmup单体变体孔蛋白。将DNA构建体X2&cX2-80-15或S1T&S1MC(1~2nM终浓度)加入所述Mmup单体变体孔蛋白实验系统中,混匀后,使缓冲液(400mM KCl,10mM HEPES pH 8.0,50mM MgCl2)流经该系统,以除去任何过量的DNA构建体X2&cX2-80-15或S1T&S1MC。然后将解旋酶(EF8813-1,15nM终浓度)、燃料(ATP3mM终浓度)预混物加入所述单个Mmup单体变体的孔蛋白实验系统中,并在+180mV电压下监测Mmup单体变体的孔蛋白的测序情况。
对照组与上述步骤相同,仅将Mmup单体变体的孔蛋白替换为野生型Mmup单体的纳米孔(棍棒模型及立体结构如图3、4所示)。其中,野生型Mmup单体的纳米孔的棍棒模型显示了孔道收缩区和环形区的氨基酸分布特征,尤其是收缩区和环形区的关键氨基酸残基,主要有91位的天冬氨酸,92位的天冬酰胺,93位的缬氨酸和94位的丝氨酸,由D91和N92形成的收缩区直径分别为和与野生型Mmup单体的纳米孔对比,包含Mmup单体变体的纳米孔蛋白(棍棒模型如图2所示)棍棒模型显示了突变后通道孔道收缩区和环形区的氨基酸分布特征,尤其是收缩区和环形区的关键氨基酸残基分布,指向孔道中心的氨基酸残基91位的赖氨酸和92位的天冬酰胺,孔道直径约为99位的赖氨酸参与通道复合物的正确组装。
其中,X2&cX2-80-15(具体结构如图5)具体序列如下:
X2:
TGGTTTTTGTTTGTTTTTAGAATTTTTTTACACTACCACTGCTAGCATTTTTCA(SEQ ID NO:5)
TTTCTCACTATCCCGTTCTCATTGGTGCACCATCTTTTTTTGGTT(SEQ ID NO:6)
TTTTTGCAGCAGCAT(SEQ ID NO:7)
cX2-80-15:
AACCAAAAAAAGATGGTGCACCAATGAGAACGGGATAGTGAGAAA(SEQ ID NO:8)
TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT(SEQ ID NO:9)
其中,S1T&S1MC(具体结构如图6)具体序列如下:
S1T:
TTTTTTTTTTTTTTCCTTCC(SEQ ID NO:10)
X(区段h)
TTCTTTTCCCGTCCGCTCGT(SEQ ID NO:12)
TCGCGCCTGTCTGCTTGTTTTTTTTTTTCTTTTTTTTTTTCTCACTATCGCATTCTCATGCAGGTCGGTGGTCGCAGTA(SEQ ID NO:13)
S1MC:
ACGAGCGGACGGGAAAAGAA(SEQ ID NO:14)
TTTTTTTTTTTTTTTTTTTT(SEQ ID NO:15)
测试结果见图7-13,图7示出了包含野生型Mmup单体的纳米孔通道在±180mV电压的单通道行为特征。测试体系中包含野生型Mmup单体的纳米孔通道在+180mV条件下全开放电流约为380pA,门控明显,有强烈的残留核酸过孔信号;-180mV条件下全开放电流接近-350pA,门控更强,对膜的扰动很剧烈。显然,包含野生型Mmup单体的纳米孔通道无法满足测序纳米孔蛋白的要求,无法完成测序目的。
图8示出了包含Mmup单体变体(D91K/A99K)的纳米孔蛋白在在+180mV,0mV和-180mV电压下开孔电流及其门控特征,其正向门控消失,孔蛋白可以在外加电压下保持稳定的开放状态。在180mv,400mm KCl盐浓度下可以产生160pA左右的开孔电流。图9示出了包含Mmup单体变体(D91K/A99K)的纳米孔蛋白在+180mV和0mV电压下核酸通过纳米孔的信号。
当解旋酶(EF8813-1)控制DNA构建体X2穿过包含Mmup单体变体(D91K/A99K)的纳米孔蛋白移位时的部分示例电流轨迹,右图为左图(15:04:25.5至15:04:37.5)中虚线部分显示的时间为15:04:34.1至15:04:37.1的电流轨迹的放大结果(参见图10)。当解旋酶(EF8813-1)控制DNA构建体X2穿过包含Mmup单体变体(D91K/A99K)的纳米孔蛋白移位时的电流轨迹的全过程电流变化结果参见图11。
当解旋酶(EF8813-1)控制DNA构建体S1T穿过包含Mmup单体变体(D91K/A99K)的纳米孔蛋白移位时的部分示例电流轨迹,右图为左图虚线部分显示的电流轨迹的放大结果,其中箭头指示的电流最大值显示的是dspacer的特征峰(参见图12)。当解旋酶(EF8813-1)控制DNA构建体S1T穿过包含Mmup单体变体(D91K/A99K)的纳米孔蛋白移位时的电流轨迹的全过程电流变化结果参见图13。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
序列表
<110> 北京齐碳科技有限公司
<120> 一种Mmup单体变体及其应用
<130> 1
<160> 17
<170> PatentIn version 3.5
<210> 1
<211> 186
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Gly Val Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr
1 5 10 15
Leu Thr Val Gln Gln Cys Asp Thr Phe Leu Asn Gly Val Phe Pro Leu
20 25 30
Asp Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Lys Ala Arg
35 40 45
Tyr Asn Cys Ala Gly Lys Gly Cys Asp Glu Phe Ala Gly Ala Leu Glu
50 55 60
Leu Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn
65 70 75 80
Phe Ser Tyr Gln Thr Pro Asn Ile Leu Leu Lys Asn Val Ser Pro Ala
85 90 95
Thr Leu Lys Gly Val Gly Trp Gly Gly Ile Ile Thr Pro Asn Leu Phe
100 105 110
Pro Gly Val Thr Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln
115 120 125
Glu Val Ala Thr Phe Ser Val Asn Val Ala Gly Pro Ser Gly Ala Val
130 135 140
Ala Val Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val
145 150 155 160
Leu Leu Arg Pro Phe Ala Arg Leu Val Ser Glu Thr Gly Asp Ser Val
165 170 175
Thr Thr Tyr Gly Glu Pro Trp Asn Met Asn
180 185
<210> 2
<211> 561
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 2
atgggagtag ataatgaact atcattagtt gatggacaag ataggacact gaccgtgcag 60
caatgcgaca ccttcctgaa cggcgttttt ccgctggatc gtaaccgtct gacccgtgaa 120
tggttccaca gcggcaaggc gcgttacaac tgcgcgggta aaggctgcga tgagtttgcg 180
ggtgcgctgg aactgggcta ccagatcggt ttcccgtgga gcctgggtgt gggcatcaac 240
tttagctatc aaaccccgaa cattctgctg aagaacgtga gcccggcgac cctgaaaggt 300
gttggctggg gtggcatcat taccccgaac ctgttcccgg gtgtgaccat tagcgcggac 360
ctgggtaacg gtccgggtat tcaagaggtt gcgaccttta gcgtgaacgt tgcgggtccg 420
agcggtgcgg tggcggttag caacgcgcac ggcaccgtga ccggtgcggc gggtggcgtt 480
ctgctgcgtc cgtttgcgcg tctggttagc gagaccggtg atagcgttac cacctatggt 540
gaaccgtgga acatgaactg a 561
<210> 3
<211> 863
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Lys Ile Glu Ser Leu Asp Leu Pro Asp Glu Val
20 25 30
Lys Gln Phe Tyr Leu Asp Ser Gly Ile Leu Glu Leu Tyr Pro Pro Gln
35 40 45
Ala Glu Ala Val Glu Lys Gly Leu Leu Glu Gly Arg Asn Leu Leu Ala
50 55 60
Ala Ile Pro Thr Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met
65 70 75 80
Leu Lys Ser Ile Leu Asn Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu
85 90 95
Arg Ala Leu Ala Ser Glu Lys Phe Lys Arg Phe Arg Glu Phe Ser Lys
100 105 110
Leu Gly Ile Arg Val Gly Ile Ser Thr Gly Asp Tyr Asp Leu Arg Asp
115 120 125
Glu Gly Leu Gly Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr
130 135 140
Asp Ser Leu Leu Arg Asn Glu Thr Val Trp Met Gln Glu Ile Ser Val
145 150 155 160
Val Val Ala Asp Glu Val His Leu Ile Asp Ser Pro Asp Arg Gly Pro
165 170 175
Thr Leu Glu Ile Thr Leu Ala Lys Leu Arg Lys Met Asn Pro Ser Cys
180 185 190
Gln Ile Leu Ala Leu Ser Ala Thr Ile Gly Asn Ala Asp Glu Leu Ala
195 200 205
Ala Trp Leu Glu Ala Gly Leu Val Leu Ser Glu Trp Arg Pro Thr Glu
210 215 220
Leu Arg Glu Gly Val Phe Phe Asn Gly Thr Phe Tyr Cys Lys Asp Arg
225 230 235 240
Glu Lys Ser Ile Glu Gln Ser Thr Lys Asp Glu Ala Val Asn Leu Val
245 250 255
Leu Asp Thr Leu Arg Glu Asp Gly Gln Cys Leu Val Phe Glu Asn Ser
260 265 270
Arg Lys Asn Cys Met Ala Phe Ala Lys Lys Ala Ser Ser Ala Val Lys
275 280 285
Lys Ile Leu Ser Ala Glu Asp Lys Glu Ala Leu Ala Glu Ile Ala Asp
290 295 300
Glu Val Leu Glu Asn Ser Glu Thr Asp Thr Ser Ala Ala Leu Ala Ala
305 310 315 320
Cys Ile Arg Ser Gly Thr Ala Phe His His Ala Gly Leu Thr Thr Pro
325 330 335
Leu Arg Glu Leu Val Glu Asp Gly Phe Arg Ala Gly Lys Ile Lys Leu
340 345 350
Ile Ser Ser Thr Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg
355 360 365
Arg Val Val Ile Arg Ser Tyr Arg Arg Tyr Ser Ser Glu Asp Gly Met
370 375 380
Gln Pro Ile Pro Val Ile Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly
385 390 395 400
Arg Pro Arg Leu Asp Pro Tyr Gly Glu Ala Val Leu Val Ala Lys Ser
405 410 415
Tyr Glu Glu Phe Val Phe Leu Phe Arg Asn Tyr Ile Glu Ala Asp Ala
420 425 430
Glu Asp Ile Trp Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His
435 440 445
Val Leu Ser Thr Ile Ser Asn Gly Phe Ala Arg Thr Lys Glu Glu Leu
450 455 460
Met Glu Phe Leu Glu Ala Thr Phe Phe Ala Phe Gln Tyr Ser Asn Phe
465 470 475 480
Gly Leu Ser Thr Val Val Asp Glu Cys Leu Asn Phe Leu Arg Gln Glu
485 490 495
Glu Met Leu Glu Lys Thr Asp Thr Leu Ile Ser Thr Ser Phe Gly Lys
500 505 510
Leu Val Ser Lys Leu Tyr Ile Asp Pro Leu Ser Ala Ala Arg Ile Val
515 520 525
Lys Gly Leu Lys Glu Ala Lys Ile Leu Thr Glu Leu Thr Leu Leu His
530 535 540
Leu Val Cys Ser Thr Pro Asp Met Arg Leu Leu Tyr Met Arg Asn Gln
545 550 555 560
Asp Tyr Gln Asp Ile Asn Asp Tyr Val Ile Ala His Ala Asp Glu Phe
565 570 575
Val Arg Val Pro Ser Pro Phe Asn Tyr Thr Glu Tyr Glu Trp Phe Leu
580 585 590
Gly Glu Val Lys Thr Ser Leu Leu Leu Val Asp Trp Ile His Glu Lys
595 600 605
Ser Glu Asn Glu Ile Cys Leu Lys Phe Gly Ile Gly Glu Gly Asp Ile
610 615 620
His Ala Ile Ala Asp Ile Ala Glu Trp Leu Met His Val Thr Ala Gln
625 630 635 640
Leu Ala Arg Leu Leu Glu Leu Lys Gly Ala Lys Glu Ala Ala Glu Leu
645 650 655
Glu Lys Arg Ile His Tyr Gly Ala Ser Pro Glu Leu Met Asp Leu Leu
660 665 670
Asp Ile Arg Gly Ile Gly Arg Met Arg Ala Arg Lys Leu Tyr Glu Ser
675 680 685
Gly Phe Arg Ser Ser Ala Glu Leu Ala Gly Ala Asp Pro Val Lys Val
690 695 700
Ala Ala Leu Leu Gly Pro Lys Ile Ala Asp Arg Ile Phe Lys Gln Ile
705 710 715 720
Gly Arg Arg Glu Val Leu Pro Glu Ile Ala Glu Pro Thr Leu Pro Glu
725 730 735
Lys Ser Pro Ser Ser Gly Gln Lys Thr Ile Asn Asp Tyr Gly Thr Gly
740 745 750
Gly Gly Gly Ser Trp Lys Glu Trp Leu Glu Arg Lys Val Gly Glu Gly
755 760 765
Arg Ala Arg Arg Leu Ile Glu Tyr Phe Gly Ser Ala Gly Glu Val Gly
770 775 780
Lys Leu Val Glu Asn Ala Glu Val Ser Lys Leu Leu Glu Val Pro Gly
785 790 795 800
Ile Gly Asp Glu Ala Val Ala Arg Leu Val Pro Gly Tyr Lys Thr Leu
805 810 815
Arg Asp Ala Gly Leu Thr Pro Ala Glu Ala Glu Arg Val Leu Lys Arg
820 825 830
Tyr Gly Ser Val Ser Lys Val Gln Glu Gly Ala Thr Pro Asp Glu Leu
835 840 845
Arg Glu Leu Gly Leu Gly Asp Ala Lys Ile Ala Arg Ile Leu Gly
850 855 860
<210> 4
<211> 2592
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 4
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgaagatcg aaagcctgga cctgccggac gaagttaaac agttttacct ggatagcggt 120
attttagaac tgtacccgcc gcaggcagaa gcagtagaaa aaggcctgtt agaaggacgt 180
aatctgctgg cagcaattcc gaccgcaagc ggtaagacac tgctggctga attagcaatg 240
ctgaaaagca tactgaatgg gggaaaagca ctgtatattg ttccgctgag agcactggca 300
tcagaaaaat ttaaacgttt tagagagttc agcaagttag gtataagagt gggtattagc 360
acaggagact atgacctgag agatgaaggt ctgggtgtta atgatattat tgtggcaaca 420
agcgaaaaaa ccgatagcct gctgcgtaat gaaaccgttt ggatgcagga aattagcgtt 480
gttgttgcag atgaagttca tctgattgat agcccggatc gtggtccgac cctggaaatt 540
accctggcaa aactgcgtaa aatgaatccg agctgtcaga ttctggcact gagcgcaacc 600
attggtaatg cagatgaact ggcagcatgg ctggaagcag gtctggttct gagcgaatgg 660
cgtccgaccg aactgcgtga aggtgttttt tttaatggta cattttattg taaagatcgt 720
gaaaaaagca ttgaacagag caccaaagat gaagcagtta atctggttct ggataccctg 780
cgtgaagatg gtcagtgtct ggtttttgaa aatagccgta aaaattgtat ggcatttgca 840
aaaaaagcaa gcagcgcagt taaaaaaatt ctgagcgcag aagataaaga agcactggca 900
gaaattgcag atgaagttct ggaaaatagc gaaaccgata ccagcgcagc actggcagca 960
tgtattcgta gcggtacagc atttcatcat gcaggtctga ccaccccgct gcgtgaactg 1020
gttgaagatg gttttcgtgc aggtaaaatt aaactgatta gcagcacccc gaccctggca 1080
gcaggtctga atctgccggc acgtcgtgtt gttattcgta gctatcgtcg ttatagcagc 1140
gaagatggta tgcagccgat tccggttatt gaatataaac agatggcagg tcgtgcaggt 1200
cgtccgcgtc tggaccctta tggtgaagca gttctggttg caaaaagcta tgaagaattt 1260
gtttttctgt ttcgtaatta tattgaagca gatgcagaag atatttggag caaactgggt 1320
acagaaaatg cactgcgtac ccatgttctg agcaccatta gcaatggttt tgcacgtacc 1380
aaagaagaac tgatggaatt tctggaagca accttttttg catttcagta tagcaatttt 1440
ggtctgagca ccgttgttga tgaatgtctg aattttctgc gtcaggaaga aatgctggaa 1500
aaaaccgata ccctgattag caccagcttt ggtaaactgg ttagcaaact gtatattgat 1560
ccgctgagcg cagcacgtat tgttaaaggt ctgaaagaag caaaaattct gaccgaactg 1620
accctgctgc atctggtttg tagcaccccg gatatgcgtc tgctgtatat gcgtaatcag 1680
gattatcagg atattaatga ttatgttatt gcacatgcag atgaatttgt tcgtgttccg 1740
agcccgttta attataccga atatgaatgg tttctgggtg aagttaaaac cagcctgctg 1800
ctggttgatt ggattcatga aaaaagcgaa aatgaaattt gtctgaaatt tggtattggt 1860
gaaggtgata ttcatgcaat tgcagatatt gcagaatggc tgatgcatgt taccgcacag 1920
ctggcacgtc tgctggaact gaaaggtgca aaagaagcag cagaactgga aaaacgtatt 1980
cattatggtg caagcccgga actgatggat ctgctggata ttcgtggtat tggtcgtatg 2040
cgtgcacgta aactgtatga aagcggtttt cgtagcagcg cagaactggc aggtgcagat 2100
ccggttaaag ttgcagcact gctgggtccg aaaattgcag atcgtatttt taaacagatt 2160
ggtcgtcgtg aagttctgcc ggaaattgca gaaccgaccc tgccggaaaa aagcccgagc 2220
agcggtcaga aaaccattaa tgattatggt accggtggag gcggttcctg gaaggaatgg 2280
ctggagcgta aggttggcga gggccgtgcg cgtcgcctga tcgagtattt cggcagcgcg 2340
ggtgaggttg gcaaattggt cgagaatgcg gaagtcagca aattgctgga agttccgggt 2400
atcggcgacg aggctgtggc tcgcctggtg ccgggttata agaccctgcg cgatgccggt 2460
ctgaccccgg cagaagcaga gcgcgtgctg aagcgctacg gcagcgtcag caaagtgcag 2520
gaaggcgcaa cgccggacga attgcgcgag ttaggtctgg gcgacgccaa gattgcccgc 2580
attctgggtt aa 2592
<210> 5
<211> 54
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 5
tggtttttgt ttgtttttag aattttttta cactaccact gctagcattt ttca 54
<210> 6
<211> 45
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 6
tttctcacta tcccgttctc attggtgcac catctttttt tggtt 45
<210> 7
<211> 15
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 7
tttttgcagc agcat 15
<210> 8
<211> 45
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 8
aaccaaaaaa agatggtgca ccaatgagaa cgggatagtg agaaa 45
<210> 9
<211> 40
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 9
tttttttttt tttttttttt tttttttttt tttttttttt 40
<210> 10
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 10
tttttttttt ttttccttcc 20
<210> 11
<211> 561
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 11
atgggagtag ataatgaact atcattagtt gatggacaag ataggacact gaccgtgcag 60
caatgcgaca ccttcctgaa cggcgttttt ccgctggatc gtaaccgtct gacccgtgaa 120
tggttccaca gcggcaaggc gcgttacaac tgcgcgggta aaggctgcga tgagtttgcg 180
ggtgcgctgg aactgggcta ccagatcggt ttcccgtgga gcctgggtgt gggcatcaac 240
tttagctatc aaaccccgaa cattctgctg aagaacgtga gcccggcgac cctgaaaggt 300
gttggctggg gtggcatcat taccccgaac ctgttcccgg gtgtgaccat tagcgcggac 360
ctgggtaacg gtccgggtat tcaagaggtt gcgaccttta gcgtgaacgt tgcgggtccg 420
agcggtgcgg tggcggttag caacgcgcac ggcaccgtga ccggtgcggc gggtggcgtt 480
ctgctgcgtc cgtttgcgcg tctggttagc gagaccggtg atagcgttac cacctatggt 540
gaaccgtgga acatgaactg a 561
<210> 12
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 12
ttcttttccc gtccgctcgt 20
<210> 13
<211> 79
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 13
tcgcgcctgt ctgcttgttt ttttttttct tttttttttt ctcactatcg cattctcatg 60
caggtcggtg gtcgcagta 79
<210> 14
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 14
acgagcggac gggaaaagaa 20
<210> 15
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 15
tttttttttt tttttttttt 20
<210> 16
<211> 64
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 16
gaccccgaac attttactga aaaatgtgag cccggcgacc ctgaaaggtg ttggttgggg 60
tggc 64
<210> 17
<211> 64
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 17
gccaccccaa ccaacacctt tcagggtcgc cgggctcaca tttttcagta aaatgttcgg 60
ggtc 64
<210> 18
<211> 186
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 18
Met Gly Val Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr
1 5 10 15
Leu Thr Val Gln Gln Cys Asp Thr Phe Leu Asn Gly Val Phe Pro Leu
20 25 30
Asp Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Lys Ala Arg
35 40 45
Tyr Asn Cys Ala Gly Lys Gly Cys Asp Glu Phe Ala Gly Ala Leu Glu
50 55 60
Leu Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn
65 70 75 80
Phe Ser Tyr Gln Thr Pro Asn Ile Leu Leu Asp Asn Val Ser Pro Ala
85 90 95
Thr Leu Ala Gly Val Gly Trp Gly Gly Ile Ile Thr Pro Asn Leu Phe
100 105 110
Pro Gly Val Thr Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln
115 120 125
Glu Val Ala Thr Phe Ser Val Asn Val Ala Gly Pro Ser Gly Ala Val
130 135 140
Ala Val Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val
145 150 155 160
Leu Leu Arg Pro Phe Ala Arg Leu Val Ser Glu Thr Gly Asp Ser Val
165 170 175
Thr Thr Tyr Gly Glu Pro Trp Asn Met Asn
180 185
Claims (25)
1.一种Mmup单体变体,其特征在于,所述的Mmup单体变体的氨基酸序列如SEQ ID NO:1所示。
2.一种包含权利要求1所述Mmup单体变体的构建体。
3.根据权利要求2所述的构建体,其特征在于,所述构建体包含1-20个Mmup单体变体。
4.根据权利要求2-3任一所述的构建体,其特征在于,所述构建体包含4-10个Mmup单体变体。
5.一种包含至少一个Mmup单体变体的孔蛋白,其特征在于,所述Mmup单体变体为权利要求1中所述的Mmup单体变体,当多聚核苷酸单链通过所述包含至少一个Mmup单体变体的孔蛋白时,产生由于不同种类的核苷酸的物理或化学性质的不同而造成的孔内电阻的差异。
6.根据权利要求5所述包含至少一个Mmup单体变体的孔蛋白,其特征在于,所述包含至少一个Mmup单体变体的孔蛋白包含1-20个Mmup单体变体。
7.根据权利要求6所述包含至少一个Mmup单体变体的孔蛋白,其特征在于,所述包含至少一个Mmup单体变体的孔蛋白包含4-10个Mmup单体变体。
8.根据权利要求5所述包含至少一个Mmup单体变体的孔蛋白,其特征在于,所述包含至少一个Mmup单体变体的孔蛋白包含收缩区和环形区。
9.根据权利要求8所述包含至少一个Mmup单体变体的孔蛋白,其特征在于,所述包含至少一个Mmup单体变体的孔蛋白的收缩区孔道直径小于野生型Mmup单体组成的孔蛋白的收缩区孔道直径。
10.根据权利要求9所述包含至少一个Mmup单体变体的孔蛋白,其特征在于,所述包含至少一个Mmup单体变体的孔蛋白的收缩区孔道直径小于15.5Å。
11.根据权利要求10所述包含至少一个Mmup单体变体的孔蛋白,所述包含至少一个Mmup单体变体的孔蛋白的收缩区孔道直径小于13.5Å。
12.根据权利要求8-11任一所述包含至少一个Mmup单体变体的孔蛋白,其特征在于,所述包含至少一个Mmup单体变体的孔蛋白还包括帽状体形成区和/或桶状体形成区域。
13.一种编码权利要求1所述的Mmup单体变体、权利要求2-4任一所述构建体或者权利要求5-12任一所述包含至少一个Mmup单体变体的孔蛋白的核苷酸序列。
14.一种包含权利要求13所述核苷酸序列的载体。
15.根据权利要求14所述的载体,其特征在于,所述的载体包含与编码权利要求1所述的Mmup单体变体、权利要求2-4任一所述构建体或者权利要求5-12任一所述包含至少一个Mmup单体变体的孔蛋白的核苷酸序列可操作性连接的启动子。
16.根据权利要求15所述的载体,其特征在于,所述的启动子为诱导型启动子或组成型启动子,其中,所述的诱导型启动子为乙酰胺诱导型启动子。
17.根据权利要求14-16任一所述的载体,其特征在于,所述编码包含至少一个Mmup单体变体的孔蛋白的核苷酸序列包含至少一条编码Mmup单体变体的核苷酸序列。
18.一种表达权利要求1所述的Mmup单体变体、权利要求2-4任一所述构建体或权利要求5-12任一所述包含至少一个Mmup单体变体的孔蛋白的细菌,其特征在于,所述的细菌包含:
(a)野生型Mmup单体的缺失;和(b)权利要求14-17任一所述的载体。
19.根据权利要求18所述的细菌,其特征在于,所述的细菌为产粘液分枝杆菌。
20.一种产生Mmup孔蛋白的方法,其特征在于,所述的方法包括用包含权利要求14-17任一所述的载体转化权利要求18或19所述的细菌,诱导细菌表达Mmup孔蛋白。
21.一种表征目标多核苷酸的方法,其特征在于,包括:
步骤(a):将目标多核苷酸与权利要求5-12任一所述包含至少一个Mmup单体变体的孔蛋白接触,使得所述目标多核苷酸序列穿过包含至少一个Mmup单体变体的孔蛋白;和
步骤(b):获取目标多核苷酸穿过包含至少一个Mmup单体变体的孔蛋白时核苷酸与包含至少一个Mmup单体变体的孔蛋白相互作用的一个或多个特征,以表征所述目标多核苷酸。
22.根据权利要求21所述的方法,其特征在于,所述步骤(a)中还包括目标多核苷酸与核酸结合蛋白、解旋酶、核酸外切酶、端粒酶、拓扑异构酶、反转录酶、转位酶和/或聚合酶中的一种或两种以上的组合接触的步骤,使得所述目标多核苷酸序列穿过孔蛋白的转位速度小于核酸结合蛋白、解旋酶、核酸外切酶、端粒酶、拓扑异构酶、反转录酶、转位酶和/或聚合酶不存在时的转位速度。
23.根据权利要求21或22所述的方法,其特征在于,所述的方法还包括横跨目标多核苷酸接触的孔蛋白施加电势差的步骤。
24.一种权利要求5-12任一所述包含至少一个Mmup单体变体的孔蛋白、权利要求1所述的Mmup单体变体、权利要求2-4任一所述构建体、权利要求13所述的核苷酸序列、权利要求14-17任一所述的载体或者权利要求18或19所述的细菌在表征目标多核苷酸中的应用。
25.一种表征目标多核苷酸的试剂盒,其特征在于,所述的试剂盒包括权利要求5-12任一所述包含至少一个Mmup单体变体的孔蛋白、权利要求1所述的Mmup单体变体、权利要求2-4任一所述构建体、权利要求13所述的核苷酸序列、权利要求14-17任一所述的载体或者权利要求18或19任一所述的细菌。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910936950 | 2019-09-29 | ||
CN2019109369508 | 2019-09-29 | ||
PCT/CN2019/109332 WO2021056598A1 (zh) | 2019-09-29 | 2019-09-30 | 一种Mmup单体变体及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111164096A CN111164096A (zh) | 2020-05-15 |
CN111164096B true CN111164096B (zh) | 2021-02-19 |
Family
ID=70562369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980002430.8A Active CN111164096B (zh) | 2019-09-29 | 2019-09-30 | 一种Mmup单体变体及其应用 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4036107A4 (zh) |
CN (1) | CN111164096B (zh) |
IL (1) | IL291787A (zh) |
ZA (1) | ZA202203618B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114599666B (zh) * | 2020-06-19 | 2024-08-06 | 北京齐碳科技有限公司 | 一种Pif1-like解旋酶及其应用 |
CN113480620B (zh) * | 2021-08-18 | 2024-02-06 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
CN113651876B (zh) * | 2021-08-18 | 2024-02-02 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
CN113896776B (zh) * | 2021-10-12 | 2024-02-06 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
CN113912683B (zh) * | 2021-10-12 | 2024-02-06 | 成都齐碳科技有限公司 | 孔蛋白单体的突变体、蛋白孔及其应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2774710C (en) * | 2008-09-22 | 2016-08-02 | University Of Washington | Msp nanopores and related methods |
KR101939420B1 (ko) * | 2011-02-11 | 2019-01-16 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 돌연변이체 세공 |
GB201502809D0 (en) * | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
US20170268052A1 (en) * | 2016-02-29 | 2017-09-21 | Genia Technologies, Inc. | Polymerase-template complexes |
CN105801676B (zh) * | 2016-04-13 | 2020-02-18 | 东南大学 | 一种突变MspA蛋白单体及其表达基因和应用 |
-
2019
- 2019-09-30 EP EP19947045.1A patent/EP4036107A4/en active Pending
- 2019-09-30 IL IL291787A patent/IL291787A/en unknown
- 2019-09-30 CN CN201980002430.8A patent/CN111164096B/zh active Active
-
2022
- 2022-03-29 ZA ZA2022/03618A patent/ZA202203618B/en unknown
Non-Patent Citations (3)
Title |
---|
MspA nanopore as a single-molecule tool: From sequencing to SPRNT;Andrew H. Laszlo et al.;《HHS Public Access》;20160801;第105卷;第75-89页 * |
MspA蛋白质纳米传感器的制备及其单分子检测应用;段静;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170515(第5期);第I140-173页 * |
基于纳米孔的DNA测序技术;李梦臻 等;《国外医药抗生素分册》;20170531;第38卷(第3期);第125-128页 * |
Also Published As
Publication number | Publication date |
---|---|
EP4036107A1 (en) | 2022-08-03 |
ZA202203618B (en) | 2023-02-22 |
IL291787A (en) | 2022-07-01 |
EP4036107A9 (en) | 2024-03-06 |
CN111164096A (zh) | 2020-05-15 |
EP4036107A4 (en) | 2024-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111164096B (zh) | 一种Mmup单体变体及其应用 | |
CN111164097B (zh) | 一种Mnep单体变体及其应用 | |
EP3619224B1 (en) | Transmembrane pore consisting of two csgg pores | |
CN108699138B (zh) | 突变孔 | |
CN106459159B (zh) | 突变孔 | |
KR102083695B1 (ko) | 돌연변이체 리세닌 기공 | |
JP2022518095A (ja) | 細孔 | |
CN113754743B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
JP2020530276A (ja) | 新規タンパク質細孔 | |
CN114957412B (zh) | 一种新型孔蛋白单体及其应用 | |
CN113480620A (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN109071618A (zh) | 突变体孔 | |
CN113773373B (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN109937252B (zh) | 重组dna聚合酶 | |
CN113912683A (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN113735948A (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
CN112500459A (zh) | Aerolysin突变纳米孔及其在分子生物检测方面的应用 | |
WO2021056598A1 (zh) | 一种Mmup单体变体及其应用 | |
WO2021056599A1 (zh) | 一种Mnep单体变体及其应用 | |
WO2023019471A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023050031A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023060419A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023019470A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023060418A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 | |
WO2023060420A1 (zh) | 孔蛋白单体的突变体、蛋白孔及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |