PL243940B1 - Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy - Google Patents
Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy Download PDFInfo
- Publication number
- PL243940B1 PL243940B1 PL437909A PL43790921A PL243940B1 PL 243940 B1 PL243940 B1 PL 243940B1 PL 437909 A PL437909 A PL 437909A PL 43790921 A PL43790921 A PL 43790921A PL 243940 B1 PL243940 B1 PL 243940B1
- Authority
- PL
- Poland
- Prior art keywords
- leu
- glu
- ala
- lys
- arg
- Prior art date
Links
- 239000013612 plasmid Substances 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000002360 preparation method Methods 0.000 title description 3
- 238000010367 cloning Methods 0.000 claims abstract description 17
- 241001678559 COVID-19 virus Species 0.000 claims abstract description 8
- 108090000623 proteins and genes Proteins 0.000 claims description 66
- 108020004414 DNA Proteins 0.000 claims description 64
- 102000004169 proteins and genes Human genes 0.000 claims description 49
- 238000006243 chemical reaction Methods 0.000 claims description 38
- 125000003729 nucleotide group Chemical group 0.000 claims description 28
- 239000002773 nucleotide Substances 0.000 claims description 27
- 108010006785 Taq Polymerase Proteins 0.000 claims description 18
- 102000004190 Enzymes Human genes 0.000 claims description 16
- 108090000790 Enzymes Proteins 0.000 claims description 16
- 239000000203 mixture Substances 0.000 claims description 16
- 239000000047 product Substances 0.000 claims description 13
- 241000588724 Escherichia coli Species 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 9
- 102000037865 fusion proteins Human genes 0.000 claims description 9
- 108020001507 fusion proteins Proteins 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 238000011534 incubation Methods 0.000 claims description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 8
- 230000003321 amplification Effects 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 7
- 229930027917 kanamycin Natural products 0.000 claims description 7
- 229960000318 kanamycin Drugs 0.000 claims description 7
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 claims description 7
- 229930182823 kanamycin A Natural products 0.000 claims description 7
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 7
- 238000000926 separation method Methods 0.000 claims description 6
- 230000035939 shock Effects 0.000 claims description 6
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 5
- 239000011543 agarose gel Substances 0.000 claims description 5
- 230000029087 digestion Effects 0.000 claims description 5
- 230000006698 induction Effects 0.000 claims description 5
- 101710096438 DNA-binding protein Proteins 0.000 claims description 4
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 claims description 4
- 229960005542 ethidium bromide Drugs 0.000 claims description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 claims description 4
- 239000002184 metal Substances 0.000 claims description 4
- 108020004635 Complementary DNA Proteins 0.000 claims description 3
- 238000010804 cDNA synthesis Methods 0.000 claims description 3
- 229960005091 chloramphenicol Drugs 0.000 claims description 3
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 claims description 3
- 239000002299 complementary DNA Substances 0.000 claims description 3
- 238000001962 electrophoresis Methods 0.000 claims description 3
- 239000000706 filtrate Substances 0.000 claims description 3
- 239000000499 gel Substances 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 239000008188 pellet Substances 0.000 claims description 3
- 229920002401 polyacrylamide Polymers 0.000 claims description 3
- 230000003716 rejuvenation Effects 0.000 claims description 3
- 239000006228 supernatant Substances 0.000 claims description 3
- 230000014616 translation Effects 0.000 claims description 3
- 239000008223 sterile water Substances 0.000 claims description 2
- 108010049041 glutamylalanine Proteins 0.000 description 16
- 210000004027 cell Anatomy 0.000 description 15
- 102000053602 DNA Human genes 0.000 description 14
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 14
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 13
- 108091034117 Oligonucleotide Proteins 0.000 description 13
- 125000003275 alpha amino acid group Chemical group 0.000 description 13
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 12
- 108010087924 alanylproline Proteins 0.000 description 12
- 108010034529 leucyl-lysine Proteins 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- 230000004927 fusion Effects 0.000 description 11
- 241000894006 Bacteria Species 0.000 description 10
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 10
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 9
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 8
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 8
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 8
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 8
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 8
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 8
- 108020004682 Single-Stranded DNA Proteins 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 108010070643 prolylglutamic acid Proteins 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 7
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 6
- 102000004594 DNA Polymerase I Human genes 0.000 description 6
- 101710176276 SSB protein Proteins 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 210000003813 thumb Anatomy 0.000 description 6
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 5
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 5
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 5
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 5
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 5
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 5
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 5
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 5
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 5
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 5
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 5
- 241000323142 Nanoarchaeum equitans Species 0.000 description 5
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 5
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 5
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010020688 glycylhistidine Proteins 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 4
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 4
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 4
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 4
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 4
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 4
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 4
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 4
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 4
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 4
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 4
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 4
- OAIGZYFGCNNVIE-ZPFDUUQYSA-N Ala-Val-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O OAIGZYFGCNNVIE-ZPFDUUQYSA-N 0.000 description 4
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 4
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 4
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 4
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 4
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 4
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 4
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 4
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 4
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 4
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 4
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 4
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 4
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 4
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 4
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 4
- MFTVXYMXSAQZNL-DJFWLOJKSA-N Asp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)O)N MFTVXYMXSAQZNL-DJFWLOJKSA-N 0.000 description 4
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 4
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 4
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 4
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 4
- LGGHQRZIJSYRHA-GUBZILKMSA-N Asp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N LGGHQRZIJSYRHA-GUBZILKMSA-N 0.000 description 4
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 4
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 4
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 4
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 4
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 4
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 4
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 4
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 4
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 4
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 4
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 4
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 4
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 4
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 4
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 4
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 4
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 4
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 4
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 4
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 4
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 4
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 4
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 4
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 4
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 4
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 4
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 4
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 4
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 4
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 4
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 4
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 4
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 4
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 4
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 4
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 4
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 4
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 4
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 4
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 4
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 4
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 4
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 4
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 4
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 4
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 4
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 4
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 4
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 4
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 4
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 4
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 4
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 4
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 4
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 4
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 4
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 4
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 4
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 4
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 4
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 4
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 4
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 4
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 4
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 4
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 4
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 4
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 4
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 4
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 4
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 4
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 4
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 4
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 4
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 4
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 4
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 4
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 4
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 4
- TUZSWDCTCGTVDJ-PJODQICGSA-N Met-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 TUZSWDCTCGTVDJ-PJODQICGSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 4
- LNIIRLODKOWQIY-IHRRRGAJSA-N Phe-Asn-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LNIIRLODKOWQIY-IHRRRGAJSA-N 0.000 description 4
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 4
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 4
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 4
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 4
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 4
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 4
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 4
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 4
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 4
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 4
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 4
- SNSYSBUTTJBPDG-OKZBNKHCSA-N Pro-Trp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N4CCC[C@@H]4C(=O)O SNSYSBUTTJBPDG-OKZBNKHCSA-N 0.000 description 4
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 4
- 108010025216 RVF peptide Proteins 0.000 description 4
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 4
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 4
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 4
- FRPNVPKQVFHSQY-BPUTZDHNSA-N Ser-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FRPNVPKQVFHSQY-BPUTZDHNSA-N 0.000 description 4
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 4
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 4
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 4
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 4
- GYUUYCIXELGTJS-MEYUZBJRSA-N Thr-Phe-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O GYUUYCIXELGTJS-MEYUZBJRSA-N 0.000 description 4
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 4
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 4
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 4
- OETOOJXFNSEYHQ-WFBYXXMGSA-N Trp-Ala-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 OETOOJXFNSEYHQ-WFBYXXMGSA-N 0.000 description 4
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 4
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 4
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 4
- YTZYHKOSHOXTHA-TUSQITKMSA-N Trp-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=3C4=CC=CC=C4NC=3)CC(C)C)C(O)=O)=CNC2=C1 YTZYHKOSHOXTHA-TUSQITKMSA-N 0.000 description 4
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 4
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 4
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 4
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 4
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 4
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 4
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 4
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 4
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 4
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 4
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 4
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 4
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 4
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 4
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 4
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 4
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 108010011559 alanylphenylalanine Proteins 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 230000001036 exonucleolytic effect Effects 0.000 description 4
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 4
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 4
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 108010000761 leucylarginine Proteins 0.000 description 4
- 108010012058 leucyltyrosine Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 108010068488 methionylphenylalanine Proteins 0.000 description 4
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 108010080629 tryptophan-leucine Proteins 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 3
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 3
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 3
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 3
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 3
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 3
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 3
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 3
- SFKMXFWWDUGXRT-NWLDYVSISA-N Glu-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N)O SFKMXFWWDUGXRT-NWLDYVSISA-N 0.000 description 3
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 3
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 3
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 3
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 3
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 3
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 3
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 3
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 3
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 3
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 108010036533 arginylvaline Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000006116 polymerization reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 2
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 2
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 2
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 2
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 2
- QPQDWBAJWOGAMJ-IHPCNDPISA-N Phe-Asp-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 QPQDWBAJWOGAMJ-IHPCNDPISA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- PDRMRVHPAQKTLT-NAKRPEOUSA-N Cys-Ile-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O PDRMRVHPAQKTLT-NAKRPEOUSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- 241000323143 Ignicoccus hospitalis Species 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 1
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 1
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 1
- -1 Mg2+ ions Chemical class 0.000 description 1
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 1
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 1
- 241000589500 Thermus aquaticus Species 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- HXNVJPQADLRHGR-JBACZVJFSA-N Trp-Glu-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXNVJPQADLRHGR-JBACZVJFSA-N 0.000 description 1
- DTPWXZXGFAHEKL-NWLDYVSISA-N Trp-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DTPWXZXGFAHEKL-NWLDYVSISA-N 0.000 description 1
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 1
- YKZVPMUGEJXEOR-JYJNAYRXSA-N Val-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N YKZVPMUGEJXEOR-JYJNAYRXSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 241000617156 archaeon Species 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 210000003811 finger Anatomy 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 125000004437 phosphorous atom Chemical group 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 108010065320 prolyl-lysyl-glutamyl-lysine Proteins 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000013120 recombinational repair Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108700014590 single-stranded DNA binding proteins Proteins 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/85—Fusion polypeptide containing an RNA binding domain
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSB oraz sposób jej klonowania. Ponadto przedmiotem wynalazku jest wyizolowany plazmid rekombinantowy, startery oraz zastosowanie polimerazy do powielania specyficznych sekwencji wirusa SARS CoV-2.
Description
Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSB oraz sposób jej klonowania. Ponadto przedmiotem wynalazku jest wyizolowany plazmid rekombinantowy, startery oraz zastosowanie polimerazy do powielania specyficznych sekwencji wirusa SARS CoV-2.
Białka SSB - (ang. Single Stranded DNA Binding protein - białka wiążące się do jednoniciowego DNA) występują we wszystkich organizmach żywych. Biorą udział we wszystkich procesach, w których generowane są fragmenty jednoniciowego DNA, takich jak: replikacja, rekombinacja i naprawa DNA. Chronią jednoniciowe DNA (ssDNA) przed degradacją i jednocześnie współdziałają z innymi białkami w komórce. Znane są białka SSB-podobne, które są białkami syntetyzowanymi przez komórki ssaków, drożdży, archeonów i bakterii. W zależności od źródła, z którego pochodzą, białka te różnią się masą cząsteczkową, ilością podjednostek wchodzących w skład natywnej cząsteczki, wielkością miejsca wiązania.
Mechanizm wiązania się białka z ssDNA polega na upakowaniu (ang. stacking) aromaty cznych reszt aminokwasowych między zasady w łańcuchu oligonukleotydowym oraz oddziaływaniu dodatnio naładowanych reszt aminokwasowych ze szkieletem fosforanowym w cząsteczce ssDNA. Wiązanie to jest na tyle silne, że nie rozpada się pod wpływem niskich stężeń NaCl. Do rozpadu kompleksu ssDNA - SSB w komórce potrzebne jest wysokie stężenie soli zawierających Mg2+. Długość fragmentu ssDNA wiązanego przez SSB ulega skróceniu o 35%.
Mimo przynależności białka NeqSSB do rodziny białek SSB odbiega ono swoimi cechami od klasycznych białek SSB, stąd określane jest jako białko NeqSSB-podobne. Białko to pochodzi z hipertermofilnego archeona Nanoarchaeum equitans, który pasożytuje w craenarchaeonie Ignicoccus hospitalis. Optymalne warunki wzrostu tego mikroorganizmu wymagają ściśle beztlenowych warunków i temperatury 90°C. Co ciekawe Nanoarchaeum equitans posiada najmniejszy znany genom składający się z 490,885 par zasad. W przeciwieństwie do większości znanych organizmów o obniżonych genomach, posiada pełny zestaw enzymów biorących udział w replikacji, naprawie i rekombinacji DNA, w tym białko SSB.
Białko NeqSSB podobnie jak inne białka z tej rodziny posiada naturalną zdolność wiązania DNA. Składa się z 243 reszt aminokwasowych, a w swojej strukturze ma jedną domenę OB (fig. 1). Wykazuje biologiczną aktywność jako monomer, podobnie do niektórych wirusowych białek SSB. Badania wskazują na jego nietypowe dla innych białek SSB zdolności wiązania wszystkich form DNA (ssDNA, dsDNA) oraz mRNA bez strukturalnych preferencji. Za wiązanie z kwasami nukleotydowymi odpowiadają domeny białka NeqSSB I, II i III - za domeny najsilniej wiążące odpowiedzialna jest domena II i III. Ponadto białko charakteryzuje się wysoką termostabilnością. Czas półtrwania przy zachowaniu aktywności bi ologicznej wynosi 5 min w 100°C, natomiast temperatura topnienia to 100,2°C.
Polimeraza DNA to enzym, który odgrywa zasadniczą rolę w procesie replikacji i naprawie DNA. Znalazła ona zastosowanie w reakcji PCR (ang. Polymerase Chain Reaction), gdzie katalizuje proces syntezy DNA in vitro, odpowiadając za dołączanie kolejnych nukleotydów do końca 3’OH nici DNA. Oprócz właściwości polimeryzacyjnej może posiadać również zdolności do hydrolizy cząsteczek DNA dzięki obecności domeny egzonukleolitycznej. Pomimo tego, że polimerazy pełnią takie same funkcje tzn. są odpowiedzialne za syntezę nici DNA, to ich budowa i posiadane aktywności znacząco się różnią. Katalizują one mechanizm przyłączania kolejnych nukleotydów do końca 3’OH nici DNA. Budowa tych polimeraz zarówno u bakterii, archeonów jak i eukariotów wykazuje podobieństwo pod względem struktury i obecności 3 podstawowych subdomen palca, śródręcza i kciuka, którym przypisane są ściśle określone funkcje. Polimerazy DNA wykazują zróżnicowanie pod względem szybkości katalizy, procesywności, obecności lub braku współdziałających podjednostek białkowych, czy wykazywaniu aktywności nukleolitycznej. Ogólny podział polimeraz DNA klasyfikuje je do 7 różnych rodzin: A, B, C, D, X, Y i RT. Przedstawicieli polimerazy DNA bakteryjnych odnaleźć można w rodzinach A, B, C, X, Y, archenów B, D, X i Y, a polimerazy DNA eukariotyczne należą do rodzin A, B, X, Y i RT.
Podstawowym zadaniem polimerazy DNA jest dobudowywanie nukleotydów komplementarnych do końca 3’OH łańcucha DNA. W mechanizmie tym można zaobserwować kilka istotnych etapów. Pierwszy polega na przyłączeniu enzymu do matrycy DNA. Powstały kompleks DNA-DNA asocjuje odpowiednie dNTP (trifosforany deoksyrybonukeotydów) w wyniku ataku nukleofilowego końca 3’OH na atom fosforu nukleotydu. Ostatni etap prowadzi do powstania wiązania fosfodiestrowego i uwolnieniu pirofosforanu. Pierwszy etap, czyli związanie polimerazy z matrycą - starterem wymusza zmianę konformacji subdomeny kciuka i ścisłe dopasowanie się do cząsteczki DNA. Subdomena kciuka obraca się względem subdomeny śródręcza, a zakonserwowane reszty na szczycie kciuka wykonują przeciwległy skręt. W ten sposób polimeraza DNA oddziałuje z małym rowkiem DNA za pośrednictwem odpowiednio wygiętej subdomeny kciuka. Wszystko to sprawia, że 3 zasady w obrębie startera ulegają wygięciu i cząsteczka DNA znajduje się wystarczająco blisko miejsca aktywnego enzymu. Wzmocnienie wygięcia nici DNA umożliwione jest dzięki kolejnym interakcjom z polimerazą. Tym razem subdomena śródręcza determinuje rotację dwóch pierwszych zasad matrycy DNA o odpowiednio 900 i 1800, obracając w ten sposób zasady na zewnątrz helisy i tworząc konformację w kształcie litery S. Konformacja ta jest więc indukowana przez oddziaływanie DNA z subdomeną kciuka, śródręcza oraz interakcją matrycy z centrum aktywnym.
Najpowszechniej używaną polimerazą DNA pochodzenia bakteryjnego jest wyizolowana z Thermus aquaticus polimeraza Taq. Ten odkryty w 1976 roku enzym, który zrewolucjonizował oblicze biologii molekularnej, zbudowany jest z 832 reszt aminokwasowych o masie molekularnej 94 kDa . Warto zauważyć, że jego najwyższa aktywność osiągana jest w temperaturze od 72°C do 80°C. Polimeryzacja możliwa jest dzięki przyłączeniu DNA do centrum aktywnego enzymu, w którym najistotniejsze reszty aminokwasowe to Arg682, Lys785, Tyr766, Arg821, His811.
Polimeraza DNA Taq posiada trzy domeny: egzonukleolityczną 5’^3‘, nieaktywną egzonukleolityczną 3’^5’ oraz polimeryzacyjną 5’^3’. Delecja domeny egzonukleolitycznej np. u polimerazy DNA Taq, pozwala na uzyskanie funkcjonalnego białka, ale o częściowo zmienionych cechach w stosunku do enzymu natywnego. Pozbawiona aktywności 5’^3’ egzonukleazy polimeraza DNA TaqA289 (TaqStoffel, KlenTaq) charakteryzuje się zwiększoną termostabilnością, nieco zwiększonym zapotrzebowaniem na jony Mg2+, natomiast nowo zsyntetyzowana nić DNA obdarzona jest mniejszą liczbą błędów.
Badania polegające na otrzymaniu polimerazy DNA z delecją kolejnych reszt aminokwasowych z N-końca wykazały, że krytyczne dla zachowania optymalnej termostabilności i aktywności reszty aminokwasowe znajdują się w regionie od 303 do 335. Struktura krystalograficzna enzymu wykazuje, że reszty aminokwasowe z tego obszaru formują trzy β-kartki oddziałujące z pozostałą częścią enzymu.
Obecnie reakcje PCR wykazują bardzo szerokie zastosowanie w diagnostyce, biologii molekularnej czy inżynierii genetycznej. Ich efektywność jest nieodłącznie związana ze stosowaną polimerazą, której stawiane są coraz większe wymagania związane z amplifikacją problematycznych matryc DNA, dlatego konieczne jest poszukiwanie polimeraz DNA o nowych, przydatnych cechach lub ulepszanie już stosowanych. Przedstawione przez nas rozwiązanie jakim jest polimeraza Taq w fuzji z białkiem wiążącym DNA pozwoli na zwiększenie jej powinowactwa do matrycy DNA, a tym samym korzystnie wpłynie na pożądane w diagnostyce cechy tj. procesywność, wydajność, amplifikacja trudnych matryc bogatych w GC czy amplifikacja DNA z próbek klinicznych pozwalająca na znaczne przyspieszenie diagnoz y w przypadku wielu chorób bakteryjnych lub wirusowych oraz uwiarygodnienie otrzymanych wyników.
Celem wynalazku jest stworzenie nowej polimerazy TaqPol z białkiem NeqSSB, która będzie miała zastosowanie do powielania specyficznych sekwencji wirusa SARS CoV-2.
Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSB, wiążącym wszystkie rodzaje DNA i RNA. Modyfikacjom poddano trzy warianty polimerazy TaqPol-NeqSSB:
- TaqPol-NeqSSBFull - cała sekwencja aminokwasowa polimerazy DNA I Taq z całą sekwencją aminokwasową białka NeqSSB (SEQ. ID 1);
- TaqPol-NeqSSBII+III - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 2); - TaqPol-NeqSSBIII - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 3).
Wszystkie warianty polimerazy TaqPol połączono z białkiem NeqSSB na C-końcu polimerazy za pomocą 6-aminokwasowego linkera (SEQ. ID 4).
Przedmiotem wynalazku jest Polimeraza TaqPol-NeqSSB o SEQ. ID 1-3. Przedmiotem wynalazku jest również sposób klonowania polimerazy TaqPol-NeqSSB o SEQ. ID 1-3, którą otrzymuje się DNA insertu przeznaczonego do klonowania, które polega na przeprowadzeniu dwóch niezależnych reakcji PCR:
- w pierwszej reakcji amplifikacji otrzymuje się produkt o sekwencji nukleotydowej odpowiadającej sekwencji genu kodującego polimerazę DNA Taq z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu;
- drugi produkt zawiera sekwencję nukleotydową genu kodującego białko NeqSSB wiążąceg o DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu;
- matrycę do reakcji PCR stanowi wyizolowane genomowe DNA,
- otrzymane produkty w dwóch powyższych reakcjach rozdziela się w żelu agarozowym z bromkiem etydyny i poddaje się izolacji z żelu.
Sposób, gdzie produkty dwóch reakcji PCR służą, jako inserty w reakcji Gibsona, gdzie:
- Trawienie plazmidu pET30EKLIC
- w celu zlinearyzowania plazmidu pET30EKLIC poddaje się go trawieniu enzymem BamHI i NdeI (NEB), które tną w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA,
- reakcję trawienia DNA wektora prowadzi się przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu,
- potrawiony plazmid poddaje się rozdziałowi elektroforetycznemu i izoluje się;
- Reakcja składania genów
- reakcję Gibsona prowadzi się w termocyklerze w 50°C przez 60 min, gdzie mieszanina zawiera bufor, nukleotydy, enzymy, wodę jałową, insert I, Insert II, wektor,
- po reakcji mieszanina dodaje się do świeżo przygotowanych komórek kompetentnych E. coli TOP10,
- otrzymaną mieszaninę inkubuje się w lodzie przez 40 min, po tym czasie inkubacji przeprowadza się szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie, po szoku termicznym komórki poddaje się 60 min inkubacji w 37°C z dodatkiem 600 ml LB, po tym czasie komórki wiruje się (10 min, 1800 obr/min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny, płytki inkubowano przez ok. 16 h w 37°C.
Sposób, gdzie w celu uzyskania białka fuzyjnego Taq-NeqSSB, komórki E. coli BL RIL poddaje się transformacji z użyciem DNA plazmidu rekombinantowego pET30-TaqPol-NeqSSB i przeprowadza się produkcję pożądanych białek fuzyjnych, hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzi się przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodaje się IPTG do końcowego stężenia 0,1 mM; po indukcji hodowle prowadzi się jeszcze przez 5 h, po czym wiruje się (10 min, 5000 obr/min) i poddaje się oczyszczaniu metodą metalopowinowactwa; rezultaty produkcji białek analizuje się za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących.
Przedmiotem wynalazku jest również wyizolowany plazmid rekombinantowy, który obejmuje fragment nukleotydowej sekwencji białka kodujące polimerazę TaqPol-NeqSSB Full od 5076 do 8336 z plazmidu pET30EKLIC o SEQ. ID. 9, TaqPol-NeqSSBII+III od 5076 do 8159 z plazmidu pET30EKLIC o SEQ. ID. 10 oraz TaqPol-NeqSSBIII od 5076 do 7886 z plazmidu pET30EKLIC o SEQ. ID. 11.
Wyizolowany plazmid pET30-TaqPol-NeqSSB Full o sekwencji SEQ.ID. 9, plazmid pET30-TaqPol-NeqSSBII+III o sekwencji SEQ.ID. 10, plazmid pET30-TaqPol-NeqSSBIII o sekwencji SEQ.ID. 11.
Przedmiotem wynalazku są również startery do klonowania polimerazy TaqPol-NeqSSB
Full/II+III/III o sekwencjach SEQ.ID?12-23.
Przedmiotem wynalazku jest polimeraza TaqPol-NeqSSBFull/II+III/III o SEQ. ID 1,2 i 3 do zastosowania do powielania specyficznych sekwencji wirusa SARS CoV-2.
Opis figur:
Fig. 1 - schematyczne przedstawienie białka NeqSSB z podstawową domeną OB
Fig. 2 - przedstawia schemat klonowania metodą Gibsona.
Fig. 3 - przedstawia rozdział elektroforetyczny przedstawiający wyniki oczyszczania polimerazy DNA TaqPol-NeqSSBFul (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) na kolumnie ze złożem His-Trap
M - Białkowy marker wielkości (14,4-116 kDa) o wielkości białek wzorcowych: 116; 66,2; 45; 35; 25; 18,4; 14,4 kDa;
- Lizat komórkowy E. coli BL RIL/pET30-TaqPol-NeqSSBFull/II+III/III po sonikacji i denaturacji białek gospodarza
- Frakcja niezwiązana z kolumną
- Frakcja po płukaniu buforem B (200 ml)
- Frakcja po elucji buforem C (30 ml)
Fig. 4 - przedstawia rozdział elektroforetyczny w 2% żelu agarozowym z bromkiem etydyny przedstawiający porównanie czułości polimerazy TaqPol-NeqSSBFull (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) w seryjnych 10-krotnych rozcieńczeniach matrycowego DNA
Fig. 5 - przedstawia wykres zależności fluorescencji barwnika SybrGreen w czasie prowadzenia reakcji RT qPCR z zastosowaniem polimerazy TaqPol-NeqSSBFull (A), TaqPol-NeqSSBII+III (B), TaqPol-NeqSSBIII (C) w reakcji identyfikacji wirusa SARS-CoV-2 bezpośrednio z wymazu.
Opis sekwencji:
SEQ. ID 1 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBFull, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z białkiem NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.
SEQ.ID.2 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBII+III, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z domeną II i III białka NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.
SEQ.ID 3 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej TaqPol-NeqSSBIII, gdzie: Główny rdzeń polimerazy stanowi polimeraza Taq, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z domeną III białka NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.
SEQ.ID. 4 - przedstawia sekwencję aminokwasową łącznika/linkera
SEQ.ID.5 - przedstawia sekwencję aminokwasową polimerazy TaqPol
SEQ.ID. 6 - przedstawia sekwencję aminokwasową białka NeqSSB.
SEQ.ID. 7 - przedstawia sekwencję aminokwasową II domeny białka NeqSSB
SEQ.ID. 8 - przedstawia sekwencję aminokwasową III domeny białka NeqSSB
SEQ.ID. 9 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSBFull
SEQ.ID. 10 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSB II+III
SEQ.ID. 11 - przedstawia sekwencję plazmidu z genem kodującym białko TaqPol-NeqSSBIII
SEQ.ID. 12-23 - przedstawia sekwencje starterów
Wynalazek ilustrują następujące przykłady wykonania, niestanowiące jego ograniczenia Przykład 1:
I. Gen kodujący polimerazę, wektor ekspresyjny, system ekspresyjny
a) Gen kodujący polimerazę: TaqPol-NeqSSBFull; TaqPol-NeqSSBII+III; TaqPol-NeqSSBIII
Sekwencję aminokwasową polimerazy TaqPol-NeqSSB Full//II+III/III (TaqPol-NeqSSBFull; TaqPol-NeqSSBII+III; TaqPol-NeqSSBIII) wydłużono o sekwencję domeny histydynowej niezbędnej do efektywnego oczyszczania polimerazy metodą metalopowinowactwa. Domena 6xHis przyłączona została na C-końcu polimerazy. Sekwencja nukleotydowa polimerazy (TaqPol-NeqSSBFull, TaqPol-NeqSSBII+III, TaqPol-NeqSSBIII) została przedstawiona na SEQ. ID 1-3.
Polimeraza TaqPol-NeqSSB, wiążącym wszystkie rodzaje DNA i RNA. Modyfikacjom poddano trzy warianty polimerazy TaqPol-NeqSSB: - TaqPol-NeqSSBFull - cała sekwencja aminokwasowa polimerazy DNA I Taq z całą sekwencją aminokwasową białka NeqSSB (SEQ. ID 1);
- TaqPol-NeqSSBII+III - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 2);
- TaqPol-NeqSSBIII - polimeraza DNA I Taq w fuzji z domeną II i III białka NeqSSB (SEQ. ID 3).
Wszystkie warianty polimerazy TaqPol połączono z białkiem NeqSSB na C-końcu polimerazy za pomocą 6-aminokwasowego linkera (SEQ. ID 4).
b) Wektor ekspresyjny
Przy wyborze wektora do ekspresji enzymu kierowano się możliwością:
- selekcji antybiotykowej klonów
- przeprowadzenia klonowania i jego namnożenia w komórkach bakteryjnych
- obecność promotora umożliwiającego łatwy sposób kontroli i indukcji ekspresji
Wybrano wektor pET30EKLIC niosący gen oporności na kanamycynę, bakteryjne Ori replikacji oraz sekwencję promotora laktozowego T7 pozwalającą na indukcję ekspresji za pomocą IPTG. Wektor posiada miejsca rozpoznania dla enzymów restrykcyjnych BamHI i Ndel, które tną DNA plazmidowe w dwóch miejscach, dając dwa niekomplementarne lepkie końce niezbędne na etapie klonowania
c) System ekspresyjny
Do ekspresji termostabilnej polimerazy fuzyjnej Pwo-NeqSSB wybrano system prokariotyczny E. coli, który jest najczęściej stosowanym układem do nadprodukcji białek zarówno na skalę laboratoryjną jak i przemysłową. Wytypowano szczepy IP-Free dostępne przez firmę Promega: Escherichia coli BL21(DE3)pLysS.
PL 243940 Β1
d) Zaprojektowanie starterów SEQ.ID 12-23
Polimeraz fuzyjna składa się z dwóch białek, które kodowane są przez dwa niezależne geny. Wymuszało zastosowanie metody klonowania, która umożliwi wklonowanie kilku fragmentów DNA jednocześnie. Zastosowano metodę Gibsona, która wjednej reakcji umożliwia wygenerowanie lepkich końców (egzonukleaza 5’^3’), wydłużanie końców DNA (polimeraz DNA) oraz kowalencyjne połączenie dwóch końców DNA (ligaza DNA) kilku fragmentów jednocześnie. Zastosowano zestaw OverLap (firmy A&A Biotechnology). Schemat klonowania przedstawia fig 2.
Przykład 2:
II. Klonowanie polimerazy Taq-NeqSSB
a) Amplifikacja produktów przeznaczonych do klonowania
Otrzymanie DNA insertu przeznaczonego do klonowania polegało na przeprowadzeniu dwóch niezależnych reakcji PGR. Pierwsza z reakcji amplifikacji pozwoliła na otrzymanie produktu o sekwencji nukleotydowej odpowiadającej sekwencji polimerazy DNA z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu. Drugi produkt zawierał sekwencję nukleotydową białka wiążącego DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu. Matrycę do reakcji PCR stanowiło wyizolowane genomowe DNA. Otrzymane produkty w dwóch powyższych reakcjach rozdzielono w żelu agarozowym z bromkiem ety dyny i poddano izolacji z żelu z wykorzystaniem zestawu Gel-Out Concentrator (A&A Biotechnology). Produkty tych dwóch reakcji PCR posłużyły, jako inserty w reakcji Gibsona z wykorzystaniem zestawu OverLap Assembly mix (A&A Biotechnology).
b) Trawienie plazmidu pET30EKLIC
W celu zlinearyzowania plazmidu pET30EKLIC poddano go trawieniu enzymem BamHI i Ndel (NEB), który tnie w dwóch miejscach, zostawiając niekomplementarne do siebie końce DNA. Reakcja trawienia DNA wektora prowadzona była przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu zalecanych przez producenta.
Potrawiony plazmid poddano rozdziałowi elektroforetycznemu i wyizolowano zestawem Gel-Out Concentrator (A&A Biotechnology).
c) Reakcja składania genów
Reakcja Gibsona z wykorzystaniem zestawu OverLap Assembly mix prowadzona była w termocyklerze w 50°C przez 60 min. Skład mieszaniny znajduje się poniżej:
Składnik Ilość [ml]
Bufor 5^OverLap Assembly (A&A 4
Biotechnology)
Nuklcotydy [10 mM]2
Enzymy - OverLap ’ Assembly i W Λ 2
Biotechnology) ·
Woda jałowa3
Insert ! [I5:0ng/mlJ^-3
Insert II [150ng/ml]3 •- · ——* , , yj •'iiŁWgs
Wektor [150ng/ml] -3 Objętość końcowa20
Po reakcji mieszanina dodawana była do świeżo przygotowanych komórek kompetentnych E. coli TOP 10. d) Transformacja komórek kompetentnych
Mieszaninę po reakcji Gibsona dodano do 100 ml komórek kompetentnych E. coli TOP 10. Otrzymaną mieszaninę inkubowano w lodzie przez 40 min. Po tym czasie inkubacji przeprowadzono szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie. Po szoku termicznym komórki poddano 60 min inkubacji w 37°C z dodatkiem 600 ml LB. Po tym czasie komórki zwirowano (10 min, 1800 obr/min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny. Płytki inkubowano przez ok. 16 h w 37°C.
Przykład 3:
III. Ekspresja i oczyszczanie polimerazy TaqPol-Neq SSB
W celu uzyskania białka fuzyjnego TaqPol-NeqSSB, komórki E. coli BL RIL poddano transformacji z użyciem DNA plazmidu rekombinantowego pET30-TaqPol-NeqSSBFull/II+III/III i przeprowadzono produkcję pożądanych białek fuzyjnych. Hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzono przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodano IPTG do końcowego stężenia 0,1 mM. Po indukcji hodowle prowadzono jeszcze przez 4 h, po czym zwirowano (10 min, 5000 obr/min) i poddano oczyszczaniu metodą metalopowinowactwa. Rezultaty produkcji białek analizowano za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących (SDS-PAGE) (fig 3). Masa molekularna białka obliczona przy pomocy programu komputerowego Expasy wynosiła 118,2 kDa:
TaqPol-NeqSSBFull:
Ilość aminokwasów: 1080
Masa molekularna: 121987,88
Teoretyczna wartość pI: 6,55
TaqPol-NeqSSBII+III:
Ilość aminokwasów: 1021
Masa molekularna: 115179,84
Teoretyczna wartość pI: 6,37
TaqPol-NeqSSBIII:
Ilość aminokwasów: 930
Masa molekularna: 104933,93
Teoretyczna wartość pI: 6,34
Wyniki rozdziałów elektroforetycznych przedstawiających stopień oczyszczenia i stężenie białek po każdym etapie oczyszczania przedstawia fig. 3.
Przykład 4:
IV. Aktywność i zastosowanie polimerazy TaqPol-NeqSSB
1) Zastosowanie polimerazy w klasycznej reakcji PCR z detekcją w żelu agarozowym - target fragment plazmidowego DNA pUC19 o wielkości 1000 pz w różnym stężeniu matrycowego DNA, (fig.4).
2) Zastosowanie polimerazy w reakcji real-time RT-PCR - identyfikacja genu Orf lab, E oraz ludzkiego genu RP z wykorzystaniem różnych matryc RNA: totalnego RNA wirusa SARS-CoV-2 oraz bezpośrednio z wymazu zainfekowanego wirusem SARS-CoV-2. (fig.5).
Literatura:
[1] Vieille C, Burdette DS, Zeikus JG. Thermozymes. Biotechnol Annu Rev. 1996;2:1-83.
[2] Hamilton SC, Farchaus JW, Davis MC. DNA polymerases as engines for biotechnology. Bio- techniques. 2001;31(2):370-6, 378-80, 382-3.
[3] Chien A, Edgar DB, Trela JM. Deoxyribonucleic acid polymerase from the extreme thermophile
Thermus aquaticus. J Bacteriol. 1976; 127(3): 1550-7.
[4] Vainshtein I, Atrazhev a, Eom SH, Elliott JF, Wishart DS, Malcolm B. Peptide rescue of an N-terminal truncation of the Stoffel fragment of Taq DNA polymerase. Protein Sci. 1996;5(9): 1785-92.
[5] Barnes WM. The fidelity of Taq polymerase catalyzing PCR is improved by an N-terminal dele- tion. Gene. 1992;112(1):29-35.
[6] Rittie L, Perbal B. Enzymes used in molecular biology: a useful guide. J Cell Commun Signal.
2008;2(1-2):25-45.
[7] Olszewski M, Balsewicz J, Nowak M, Maciejewska N, Cyranka-Czaja A, Zalewska-Piątek B, et al.
Characterization of a Single-Stranded DNA-Binding-Like Protein from Nanoarchaeum equitans - Nucleic Acid Binding Protein with Broad Substrate Specificity. PLoS One. 2015; 10:e0126563.
PL 243940 Β1
SEQUENCE LISTING <110> Instytut Biotechnologii i Medycyny Molekularnej <120> Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy <130>
<150> P.437909 <151> 2021-05-19 <160> 26 <170> BiSSAP 1.3.6 <210> 1 <211> 1080 < 212> PRT < 213> Artificial Sequence <220>
< 223> fusion two protein < 400> 1
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu 15 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala
PL 243940 Β1
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
5560
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
70 7580
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu
9095
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135140
Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly
145 150 155160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170175
Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275
280
285
PL 243940 Β1
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375380
ThrThr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475480
Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg VaI Leu Phe Asp
485 490495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu LysThr Gly Lys Arg
500 505510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520525
Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530
535
540
PL 243940 Β1
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555560
His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570575
Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin
580 585590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu GlyTrp Leu Leu Val Ala
595 600605
Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615620
Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr
625 630 635640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665670
Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu
675 680685
Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg
690 695700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745750
Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His
770775
780
PL 243940 Β1
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825830
Gly Ser Gly Gly Val Asp Asp Glu Glu Glu Leu Ile Gin Leu Ile Ile
835 840845
Glu Lys Thr Gly Lys Ser Arg Glu Glu Ile Glu Lys Met Val Glu Glu
850 855860
Lys Ile Lys Ala Phe Asn Asn Leu Ile Ser Arg Arg Gly Ala Leu Leu
865 870 875880
Leu Val Ala Lys Lys Leu Gly Val Leu Tyr Lys Asn Thr Pro Lys Glu
885 890895
Lys Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly
900 905910
Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe
915 920925
Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile
930 935940
Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile
945 950 955960
Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile
965 970975
Asp Ser Tyr Lys Ile Leu Glu Ser Asp Leu Glu Ile Lys Pro Gin Lys
980 985990
Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr
995 10001005
Gin Lys Gly Thr He Val Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg
1010 10151020
Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp Trp Glu Ile Gly His
1025
1030
1035
1040
PL 243940 Β1
Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys
1045 10501055
Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala Thr Leu Lys Asp Leu
1060 10651070
Lys Ala Phe Lys Gly Glu Ala Asp
10751080 <210> 2 <211>1021 < 212> PRT < 213> Artificial Sequence <220>
< 223> fusion two protein < 400> 2
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1015
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
2530
Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala
4045
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
5560
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
70 7580
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu
9095
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100
105
110
PL 243940 Β1
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135140
Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly
145 150 155160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170175
Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340
345
350
PL 243940 Β1
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375380
Thr Thr Pro Glu Gly Val Ala Arg ArgTyr Gly Gly Glu Trp Thr Glu
385 390 395400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475480
Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp
485 490495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu LysThr Gly Lys Arg
500 505510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520525
Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555560
His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570575
Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin
580 585590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600605
PL 243940 Β1
Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615620
Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr
625 630 635640
Glu Thr Ala SerTrp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665670
Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu
675 680685
Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg
690 695700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745750
Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His
770 775780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825830
Gly Ser Gly Gly Val Asp Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr
835
840
845
PL 243940 Β1
Val Lys Val Lys Gly Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr
850 855860
Ser Lys Gly Lys Phe Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr
865 870 875880
Ile Lys Ala Ile Ile Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr
885 890895
Val Ile Glu Ala Ile Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn
900 905910
Leu Glu Leu His Ile Asp Ser Tyr Lys He Leu Glu Ser Asp Leu Glu
915 920925
Ile Lys Pro Gin Lys Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr
930 935940
Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val Ser Lys Ala Ile Leu
945 950 955960
Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp
965 970975
Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn
980 985990
Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala
995 10001005
Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu Ala Asp
1010 10151020 < 210> 3 < 211> 930 < 212> PRT < 213> Artificial Sequence <220>
<223> fusion two protein
PL 243940 Β1 <400> 3
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1015
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
2530
Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala
4045
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
5560
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
70 7580
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu
9095
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135140
Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly
145 150 155160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170175
Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225
230
235
240
PL 243940 Β1
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 2S0285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465
470
475
480
PL 243940 Β1
Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp
485 490495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520525
Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555560
His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570575
Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin
580 585590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600605
Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615620
Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr
625 630 635640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665670
Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu
675 680685
Ala Gin Ala Phe Ile Glu ArgTyr Phe Gin Ser Phe Pro Lys Val Arg
690 695700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730735
PL 243940 Β1
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745750
Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His
770 775780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825830
Gly Ser Gly Gly Val Asp Lys Pro Gin Lys Gin Glu Phe Val Gly Ile
835 840845
Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val
850 855860
Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr
865 870 875880
Phe Asn Asp Phe Asp Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly
885 890895
Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp
900 905910
Lys Val Glu Glu Ala Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu
915 920925
Ala Asp
930 <210> 4 <211>6 <212> PRT
PL 243940 Β1 < 213> Artificial Sequence <220>
< 223> Linker < 400> 4
Gly Ser Gly Gly Val Asp 1 5 <210>5 <211> 832 < 212> PRT < 213> Bacteria <prokaryote>
< 400> 5
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu 15 1015
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
2530
Leu Thr Thr Ser Arg Gly Glu Pro Val Gin Ala Val Tyr Gly Phe Ala
4045
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
5560
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
70 7580
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gin Leu
9095
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100
105
110
PL 243940 Β1
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135140
Leu Tyr Gin Leu Leu Ser Asp Arg Ile His Ala Leu His Pro Glu Gly
145 150 155160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170175
Asp Gin Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235240
Leu Ser Trp Asp Leu Ala Lys Val ArgThr Asp Leu Pro Leu Glu Val
245 250255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345350
Ala Lys Asp Leu SerVal Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360365
PL 243940 Β1
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly GluTrp Thr Glu
385 390 395400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475480
Pro Phe Asn Leu Asn Ser Arg Asp Gin Leu Glu Arg Val Leu Phe Asp
485 490495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520525
Val Glu Lys Ile Leu Gin Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555560
His Thr Arg Phe Asn Gin Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570575
Ser Asp Pro Asn Leu Gin Asn Ile Pro Val Arg Thr Pro Leu Gly Gin
580 585590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595
600
605
PL 243940 Β1
Leu Asp Tyr Ser Gin Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615620
Asp Glu Asn Leu Ile Arg Val Phe Gin Glu Gly Arg Asp Ile His Thr
625 630 635640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665670
Met Ser Ala His Arg Leu Ser Gin Glu Leu Ala Ile Pro Tyr Glu Glu
675 680685
Ala Gin Ala Phe Ile Glu Arg Tyr Phe Gin Ser Phe Pro Lys Val Arg
690 695700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745750
Val Gin Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gin Val His
770 775780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820
825
830
PL 243940 Β1 <210> 6 <211> 243 <212> PRT <213> Bacteria <prokaryote>
<400> 6
Met Asp Glu Glu Glu Leu Ile Gin Leu Ile Ile Glu Lys Thr Gly Lys
1015
Ser Arg Glu Glu Ile Glu Lys Met Val Glu Glu Lys Ile Lys Ala Phe
2530
Asn Asn Leu Ile Ser Arg Arg Gly Ala Leu Leu Leu Val Ala Lys Lys
4045
Leu Gly Val Leu Tyr Lys Asn Thr Pro Lys Glu Lys Lys Ile Gly Glu
5560
Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly Lys Ile Leu Lys Ser
70 7580
Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe Gin Pro Ile Ile Leu
9095
Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile Trp Asn Thr Asp Lys
100 105110
Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile Gly Lys Thr Lys Ile
115 120125
Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile Asp Ser Tyr Lys Ile
130 135140
Leu Glu Ser Asp Leu Glu Ile Lys Pro Gin Lys Gin Glu Phe Val Gly
145 150 155160
Ile Cys Ile Val Lys Tyr Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile
165 170175
Val Ser Lys Ala Ile Leu Thr Ser Leu Asp Arg Glu Leu Pro Val Val
180
185
190
PL 243940 Β1
Tyr Phe Asn Asp Phe Asp Trp Glu Ile Gly His Ile Tyr Lys Val Tyr
195 200205
Gly Lys Leu Lys Lys Asn Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala
210 215220
Asp Lys Val Glu Glu Ala Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly
225 230 235240
Glu Ala Asp <210> 7 <211> 92 <212> PRT <213> Bacteria <prokaryote>
<400> 7
Met Lys Ile Gly Glu Leu Glu Ser Trp Glu Tyr Val Lys Val Lys Gly
1015
Lys Ile Leu Lys Ser Phe Gly Leu Ile Ser Tyr Ser Lys Gly Lys Phe
2530
Gin Pro Ile Ile Leu Gly Asp Glu Thr Gly Thr Ile Lys Ala Ile Ile
4045
Trp Asn Thr Asp Lys Glu Leu Pro Glu Asn Thr Val Ile Glu Ala Ile
5560
Gly Lys Thr Lys Ile Asn Lys Lys Thr Gly Asn Leu Glu Leu His Ile
70 7580
Asp Ser Tyr Lys Ile Leu Glu Ser Asp Leu Glu Ile
8590 <210> 8 <211> 93
PL 243940 Β1 <212> PRT <213> Bacteria <prokaryote>
<400> 8
Met Lys Pro Gin Lys Gin Glu Phe Val Gly Ile Cys Ile Val Lys Tyr
1015
Pro Lys Lys Gin Thr Gin Lys Gly Thr Ile Val Ser Lys Ala Ile Leu
2530
Thr Ser Leu Asp Arg Glu Leu Pro Val Val Tyr Phe Asn Asp Phe Asp
4045
Trp Glu Ile Gly His Ile Tyr Lys Val Tyr Gly Lys Leu Lys Lys Asn
5560
Ile Lys Thr Gly Lys Ile Glu Phe Phe Ala Asp Lys Val Glu Glu Ala
70 7580
Thr Leu Lys Asp Leu Lys Ala Phe Lys Gly Glu Ala Asp
8590 <210> 9 < 211> 8539 < 212> DNA < 213> Artificial Sequence <220>
< 223> Fusion of two diffrent gene < 400> 9 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
PL 243940 Β1 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960
PL 243940 Β1 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920
PL 243940 Β1 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
PL 243940 Β1 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780
PL 243940 Β1 atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
PL 243940 Β1 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640
PL 243940 Β1 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgrtc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540
PL 243940 Β1 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500
PL 243940 Β1 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgatg atgaagagga actaatacaa ctaataatag 7620 aaaaaactgg caaatctcga gaggaaatag aaaaaatggt ggaagaaaaa attaaagctt 7680 ttaacaattt aatatctcgt aggggggctt tactattagt agcaaaaaaa cttggtgttt 7740 tgtataaaaa cactccgaaa gagaaaaaaa ttggcgaatt agaaagctgg gaatatgtaa 7800 aagtaaaggg caaaattctc aaatcttttg gattaattag ttattcgaaa gggaaattcc 7860 aacctattat tttaggagac gaaaccggta ctattaaagc tattatttgg aataccgata 7920 aagaattacc tgaaaacact gtaatagaag ctattgggaa aaccaaaatt aataagaaaa 7980 ctggcaattt agaattacat atagacagtt ataaaatttt agaaagcgat ttagagataa 8040 aaccccaaaa gcaagaattt gttgggattt gcatagttaa atatccaaaa aaacaaaccc 8100 aaaaaggcac aatagtatcg aaagcaattt taactagctt agatagggaa ttgcctgtag 8160 tatatttcaa cgattttgat tgggaaatag gccatatata taaagtatat ggaaagctta 8220 agaaaaacat aaaaactggt aaaatagaat ttttcgctga caaagttgag gaagcaacat 8280 taaaagatct aaaagctttt aaaggagagg ccgatcacca ccaccaccac cactaaggat 8340 ccgaattcga gctccgtcga caagcttgcg gccgcactcg agcaccacca ccaccaccac 8400
PL 243940 Β1 tgagatccgg ctgctaacaa agcccgaaag gaagctgagt tggctgctgc caccgctgag 8460 caataactag cataacccct tggggcctct aaacgggtct tgaggggttt tttgctgaaa 8520 ggaggaacta tatccggat 8539 <210> 10 <211> 8362 < 212> DNA < 213> ArtificiaI Sequence <220>
< 223> Fusion of two diffrent gene < 400> 10 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
PL 243940 Β1 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac 960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380
PL 243940 Β1 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280
PL 243940 Β1 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240
PL 243940 Β1 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccacta c cgagatgtcc gcacca acgc gcagcccgga ctcggta atg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140
PL 243940 Β1 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100
PL 243940 Β1 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000
PL 243940 Β1 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgctc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960
PL 243940 Β1 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgata aaattggcga attagaaagc tgggaatatg 7620 taaaagtaaa gggcaaaatt ctcaaatctt ttggattaat tagttattcg aaagggaaat 7680 tccaacctat tattttagga gacgaaaccg gtactattaa agctattatt tggaataccg 7740 ataaagaatt acctgaaaac actgtaatag aagctattgg gaaaaccaaa attaataaga 7800 aaactggcaa tttagaatta catatagaca gttataaaat tttagaaagc gatttagaga 7860
PL 243940 Β1 taaaacccca aaagcaagaa tttgttggga tttgcatagt taaatatcca aaaaaacaaa 7920 cccaaaaagg cacaatagta tcgaaagcaa ttttaactag cttagatagg gaattgcctg 7980 tagtatattt caacgatttt gattgggaaa taggccatat atataaagta tatggaaagc 8040 ttaagaaaaa cataaaaact ggtaaaatag aatttttcgc tgacaaagtt gaggaagcaa 8100 cattaaaaga tctaaaagct tttaaaggag aggccgatca ccaccaccac caccactaag 8160 gatccgaatt cgagctccgt cgacaagctt gcggccgcac tcgagcacca ccaccaccac 8220 cactgagatc cggctgctaa caaagcccga aaggaagctg agttggctgc tgccaccgct 8280 gagcaataac tagcataacc ccttggggcc tctaaacggg tcttgagggg ttttttgctg 8340 aaaggaggaa ctatatccgg at 8362 <210> 11 <211> 8089 < 212> DNA < 213> Artificial Sequence <220>
< 223> Fusion of two diffrent gene <400> 11
PL 243940 Β1 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat 600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa 660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc 720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga 780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc 840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac 900 cgttattcat tcgtgattgc gcctgagcga gacgaa ata c gcgatcgctg ttaaa aggac 960
PL 243940 Β1 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat 1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag 1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca 1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac 1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg 1260 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860
PL 243940 Β1 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
PL 243940 Β1 ttgtgagggt aaacaactgg cggtatggat gcggcgggac cagagaaaaa tcactcaggg 2880 tcaatgccag cgcttcgtta atacagatgt aggtgttcca cagggtagcc agcagcatcc 2940 tgcgatgcag atccggaaca taatggtgca gggcgctgac ttccgcgttt ccagacttta 3000 cgaaacacgg aaaccgaaga ccattcatgt tgttgctcag gtcgcagacg ttttgcagca 3060 gcagtcgctt cacgttcgct cgcgtatcgg tgattcattc tgctaaccag taaggcaacc 3120 ccgccagcct agccgggtcc tcaacgacag gagcacgatc atgcgcaccc gtggggccgc 3180 catgccggcg ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa 3240 ggcttgagcg agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc 3300 gctccagcga aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac 3360 gagttgcatg ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca 3420 ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc ccggtgccta 3480 atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3540 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3600 tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 3660 ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 3720
PL 243940 Β1 aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 3780 atcccacta c cgagatgtcc gcacca a cgc gcagcccgga ctcggta atg gcgcgcattg 3840 cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 3900 gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 3960 tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 4020 agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 4080 gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 4140 ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 4200 catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 4260 tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 4320 tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 4380 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680
PL 243940 Β1 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagca a c cgca cctgtg 49 20 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgag ggggatgctg cccctctttg 5100 agcccaaggg ccgggtcctc ctggtggacg gccaccacct ggcctaccgc accttccacg 5160 ccctgaaggg cctcaccacc agccgggggg agccggtgca ggcggtctac ggcttcgcca 5220 agagcctcct caaggccctc aaggaggacg gggacgcggt gatcgtggtc tttgacgcca 5280 aggccccctc cttccgccac gaggcctacg gggggtacaa ggcgggccgg gcccccacgc 5340 cggaggactt tccccggcaa ctcgccctca tcaaggagct ggtggacctc ctggggctgg 5400 cgcgcctcga ggtcccgggc tacgaggcgg acgacgtcct ggccagcctg gccaagaagg 5460 cggaaaagga gggctacgag gtccgcatcc tcaccgccga caaagacctt taccagctcc 5520 tttccgaccg catccacgcc ctccaccccg aggggtacct catcaccccg gcctggcttt 5580
PL 243940 Β1 gggaaaagta cggcctgagg cccgaccagt gggccgacta ccgggccctg accggggacg 5640 agtccgacaa ccttcccggg gtcaagggca tcggggagaa gacggcgagg aagcttctgg 5700 aggagtgggg gagcctggaa gccctcctca agaacctgga ccggctgaag cccgccatcc 5760 gggagaagat cctggcccac atggacgatc tgaagctctc ctgggacctg gccaaggtgc 5820 gcaccgacct gcccctggag gtggacttcg ccaaaaggcg ggagcccgac cgggagaggc 5880 ttagggcctt tctggagagg cttgagtttg gcagcctcct ccacgagttc ggccttctgg 5940 aaagccccaa ggccctggag gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct 6000 ttgtgctttc ccgcaaggag cccatgtggg ccgatcttct ggccctggcc gccgccaggg 6060 ggggccgggt ccaccgggcc cccgagcctt ataaagccct cagggacctg aaggaggcgc 6120 gggggcttct cgccaaagac ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc 6180 ccggcgacga ccccatgctc ctcgcctacc tcctggaccc ttccaacacc acccccgagg 6240 gggtggcccg gcgctacggc ggggagtgga cggaggaggc gggggagcgg gccgcccttt 6300 ccgagaggct cttcgccaac ctgtggggga ggcttgaggg ggaggagagg ctcctttggc 6360 tttaccggga ggtggagagg cccctttccg ctgtcctggc ccacatggag gccacggggg 6420 tgcgcctgga cgtggcctat ctcagggcct tgtccctgga ggtggccgag gagatcgccc 6480 gcctcgaggc cgaggtcttc cgcctggccg gccacccctt caacctcaac tcccgggacc 6540
PL 243940 Β1 agctggaaag ggtcctcttt gacgagctag ggcttcccgc catcggcaag acggagaaga 6600 ccggcaagcg ctccaccagc gccgccgtcc tggaggccct ccgcgaggcc caccccatcg 6660 tggagaagat cctgcagtac cgggagctca ccaagctgaa gagcacctac attgacccct 6720 tgccggacct catccacccc aggacgggcc gcctccacac ccgcttcaac cagacggcca 6780 cggccacggg caggctaagt agctccgatc ccaacctcca gaacatcccc gtccgcaccc 6840 cgcttgggca gaggatccgc cgggccttca tcgccgagga ggggtggcta ttggtggccc 6900 tggactatag ccagatagag ctcagggtgc tggcccacct ctccggcgac gagaacctga 6960 tccgggtctt ccaggagggg cgggacatcc acacggagac cgccagctgg atgttcggcg 7020 tcccccggga ggccgtggac cccctgatgc gccgggcggc caagaccatc aacttcgggg 7080 tcctctacgg catgtcggcc caccgcctct cccaggagct agccatccct tacgaggagg 7140 cccaggcctt cattgagcgc tactttcaga gcttccccaa ggtgcgggcc tggattgaga 7200 agaccctgga ggagggcagg aggcgggggt acgtggagac cctcttcggc cgccgccgct 7260 acgtgccaga cctagaggcc cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct 7320 tcaacatgcc cgtccagggc accgccgccg acctcatgaa gctggctatg gtgaagctct 7380 tccccaggct ggaggaaatg ggggccagga tgctccttca ggtccacgac gagctggtcc 7440
PL 243940 Β1 tcgaggcccc aaaagagagg gcggaggccg tggcccggct ggccaaggag gtcatggagg 7500 gggtgtatcc cctggccgtg cccctggagg tggaggtggg gataggggag gactggctct 7560 ccgccaagga gggcagcggt ggcgttgata aaccccaaaa gcaagaattt gttgggattt 7620 gcatagttaa atatccaaaa aaacaaaccc aaaaaggcac aatagtatcg aaagcaattt 7680 taactagctt agatagggaa ttgcctgtag tatatttcaa cgattttgat tgggaaatag 7740 gccatatata taaagtatat ggaaagctta agaaaaacat aaaaactggt aaaatagaat 7800 ttttcgctga caaagttgag gaagcaacat taaaagatct aaaagctttt aaaggagagg 7860 ccgatcacca ccaccaccac cactaaggat ccgaattcga gctccgtcga caagcttgcg 7920 gccgcactcg agcaccacca ccaccaccac tgagatccgg ctgctaacaa agcccgaaag 7980 gaagctgagt tggctgctgc caccgctgag caataactag cataacccct tggggcctct 8040 aaacgggtct tgaggggttt tttgctgaaa ggaggaacta tatccggat 8089 <210> 12 <211> 48 <212> DNA <213> ArtificiaI Sequence
PL 243940 Β1 <220>
<223> Oligonukleotide <400> 12 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 <210> 13 <211>41 <212> DNA <213> Artificial Sequence <22D>
<223> Oligonukleotide <400> 13 tcatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 14 <211> 51 < 212> DNA < 213> Artificial Sequence <220>
< 223> Oligonukleotide < 400> 14 agggcagcgg tggcgttgat gatgaagagg aactaataca actaataata g
PL 243940 Β1 <210> 15 <211> 80 < 212> DNA < 213> Artificial Sequence <220>
< 223> Oligonukleotide < 400> 15 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta aaagctttta 80 <210> 16 <211> 48 < 212> DNA < 213> Artificial Sequence <220>
<223> Oligonukleotide <400> 16 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 <210> 17
PL 243940 Β1 <211> 41 <212> DNA <213> Artificial Sequence <22O>
<223> Oligonukleotide <400> 17 tcatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 18 <211> 51 <212> DNA <213> Artificial Sequence <22O>
<223> Oligonukleotide <400> 18 agggcagcgg tggcgttgat gatgaagagg aactaataca actaataata g <210> 19 <211> 80 <212> DNA <213> Artificial Sequence
PL 243940 Β1 <220>
<223> Oligonukleotide <400> 19 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta aaagctttta <210> 20 <211> 48 < 212> DNA < 213> Artificial Sequence <220>
<223> Oligonukleotide <400> 20 aactttaaga aggagatata catatgaggg ggatgctgcc cctctttg 48 < 210> 21 <211>41 < 212> DNA < 213> Artificial Sequence <220>
<223> Oligonukleotide
PL 243940 Β1 <400> 21 ttatcaacgc caccgctgcc ctccttggcg gagagccagt c 41 <210> 22 <211> 45 <212> DNA <213> Artificial Sequence <220>
<223> Oligonukleotide <400> 22 agggcagcgg tggcgttgat aaaccccaaa agcaagaatt tgttg 45 <210> 23 <211> 70 < 212> DNA < 213> Artificial Sequence <220>
< 223> Oligonukleotide < 400> 23 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgatcggc 60 ctctccttta
Claims (8)
1. Polimeraza TaqPol-NeqSSB o SEQ. ID 1-3.
2. Sposób klonowania polimerazy TaqPol-NeqSSB o SEQ.ID 1-3 znamienny tym, że otrzymuje się DNA insertu przeznaczonego do klonowania, które polega na przeprowadzeniu dwóch niezależnych reakcji PCR:
- w pierwszej reakcji amplifikacji otrzymuje się produkt o sekwencji nukleotydowej odpowiadającej sekwencji genu kodującego polimerazę DNA Taq z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu;
- drugi produkt zawiera sekwencję nukleotydową genu kodującego białko NeqSSB wiążącego DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Taq na N-końcu;
- matrycę do reakcji PCR stanowi wyizolowane genomowe DNA,
- otrzymane produkty w dwóch powyższych reakcjach rozdziela się w żelu agarozowym z bromkiem etydyny i poddaje się izolacji z żelu.
3. Sposób według zastrz. 2, znamienny tym, że produkty dwóch reakcji PCR służą, jako inserty w reakcji Gibsona, gdzie:
- następuje trawienie plazmidu pET30EKLIC
- w celu zlinearyzowania plazmidu pET30EKLIC poddaje się go trawieniu enzymem BamHI i Ndel (NEB), które tną w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA,
- reakcję trawienia DNA wektora prowadzi się przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu,
- potrawiony plazmid poddaje się rozdziałowi elektroforetycznemu i izoluje się;
- Reakcja składania genów;
- reakcję Gibsona prowadzi się w termocyklerze w 50°C przez 60 min, gdzie mieszanina zawiera bufor, nukleotydy, enzymy, wodę jałową, insert I, Insert II, wektor,
- po reakcji mieszaninę dodaje się do świeżo przygotowanych komórek kompetentnych E. coli TOP10,
- otrzymaną mieszaninę inkubuje się w lodzie przez 40 min, po tym czasie inkubacji przeprowadza się szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie, po szoku termicznym komórki poddaje się 60 min inkubacji w 37°C z dodatkiem 600 ml LB, po tym czasie komórki wiruje się (10 min, 1800 obr/min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny, płytki inkubowano przez ok. 16 h w 37°C.
4. Sposób według zastrz. 3, znamienny tym, że w celu uzyskania białka fuzyjnego TaqPol-NeqSSB, komórki E. coli BL RIL. poddaje się transformacji z użyciem DNA plazmidu rekombinantowego pET30-Pwo-NeqSSB i przeprowadza się produkcję pożądanych białek fuzyjnych, hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzi się przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodaje się IPTG do końcowego stężenia 0,1 mM; po indukcji hodowle prowadzi się jeszcze przez 5 h, po czym wiruje się (10 min, 5000 obr/min) i poddaje się oczyszczaniu metodą metalopowinowactwa; rezultaty produkcji białek analizuje się za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących.
5. Wyizolowany plazmid rekombinantowy znamienny tym, że obejmuje fragment nukleotydowej sekwencji białka kodujące polimerazę TaqPol-NeqSSBFull/II+III/III od 5076 do 8336 z plazmidu pET30EKLIC o SeQ. ID. 9, 5076 do 8159 z plazmidu pET30EKLIC o SEQ. ID. 10 oraz od 5076 do 7886 z plazmidu pET30EKLIC o SEQ. ID. 11.
6. Wyizolowany plazmid pET30-TaqPol-NeqSSBFull/II+III/III o sekwencji SEQ.ID.9-11.
7. Startery do klonowania polimerazy TaqPol-NeqSSBFull/II+III/III o sekwencjach SEQ.ID. 12-23.
8. Polimeraza TaqPol-NeqSSBFull/II+III/III o SEQ. ID 1-3 do zastosowania do powielania specyficznych sekwencji wirusa SARS CoV-2.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PL437909A PL243940B1 (pl) | 2021-05-19 | 2021-05-19 | Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy |
PCT/PL2022/000031 WO2022245230A1 (en) | 2021-05-19 | 2022-05-18 | Taq-neqssb polymerase, the method of its obtaining, recombinant plasmid, primers, and application of the polymerase. |
EP22736399.1A EP4341389A1 (en) | 2021-05-19 | 2022-05-18 | Taq-neqssb polymerase, the method of its obtaining, recombinant plasmid, primers, and application of the polymerase |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PL437909A PL243940B1 (pl) | 2021-05-19 | 2021-05-19 | Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy |
Publications (2)
Publication Number | Publication Date |
---|---|
PL437909A1 PL437909A1 (pl) | 2022-11-21 |
PL243940B1 true PL243940B1 (pl) | 2023-11-06 |
Family
ID=82361283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL437909A PL243940B1 (pl) | 2021-05-19 | 2021-05-19 | Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4341389A1 (pl) |
PL (1) | PL243940B1 (pl) |
WO (1) | WO2022245230A1 (pl) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070059713A1 (en) * | 2005-09-09 | 2007-03-15 | Lee Jun E | SSB-DNA polymerase fusion proteins |
PL426093A1 (pl) * | 2018-06-27 | 2020-01-02 | Instytut Biotechnologii I Medycyny Molekularnej | Fuzyjna polimeraza kwasu jednołańcuchowego DNA Bst, cząsteczka kwasu nukleinowego kodująca fuzyjną polimerazę DNA NeqSSB-Bst, sposób jej otrzymywania oraz zastosowanie |
WO2020185702A2 (en) * | 2019-03-13 | 2020-09-17 | Abclonal Science, Inc. | Mutant taq polymerase for faster amplification |
-
2021
- 2021-05-19 PL PL437909A patent/PL243940B1/pl unknown
-
2022
- 2022-05-18 WO PCT/PL2022/000031 patent/WO2022245230A1/en active Application Filing
- 2022-05-18 EP EP22736399.1A patent/EP4341389A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022245230A1 (en) | 2022-11-24 |
EP4341389A1 (en) | 2024-03-27 |
WO2022245230A9 (en) | 2024-02-15 |
PL437909A1 (pl) | 2022-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113388538B (zh) | 重组酵母、构建方法和其在制备酪醇及衍生物中的应用 | |
CN111454978B (zh) | 用于特异性吸附重金属铅的表面展示工程菌及构建方法和应用 | |
CN111304232B (zh) | 基于膜表面融合表达策略纯化蛋白的方法及其应用 | |
US20030143685A1 (en) | Efficient protein expression system | |
CN111850007B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36864及应用 | |
CN111848758B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白突变体及应用 | |
CN113151214B (zh) | 一种具有脂肪酶活性的蛋白PnlipA及其基因和应用 | |
CN114774452B (zh) | 一种用于吸附溶液汞离子的工程大肠杆菌构建方法及应用 | |
CN113322243B (zh) | 蛋白质ugt236及其编码基因与应用 | |
CN112481282B (zh) | 一种特异性识别黄原胶侧链的碳水化合物结合模块cbm6b蛋白质及应用 | |
CN115216485A (zh) | 耐阿米卡星的重组质粒pET28a(+)-rmtB及其应用 | |
CN114875004B (zh) | 一种高立体选择性r转酮酶突变体及其编码基因和应用 | |
PL243940B1 (pl) | Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy | |
CN111848757B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36862及应用 | |
KR20060098528A (ko) | 대장균 발현 시스템을 이용한 인간 단백질 타이로신 탈인산화 효소의 발현 및 정제방법 | |
KR20180010642A (ko) | 돼지 설사병 백신용 섬모 및 독소를 대량 생산하는 형질전환 대장균 및 이에 의해 생산되는 섬모 및 독소를 항원으로 포함하는 돼지 설사병 예방용 백신 조성물 | |
CN113337491B (zh) | 一种提高角蛋白酶耐高温稳定性的结构域及其应用 | |
PL241698B1 (pl) | Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy | |
CN113122561B (zh) | 膜蛋白SohB的表达载体及其表达纯化方法 | |
CN113122558B (zh) | 膜蛋白AmpG的表达载体及其表达纯化方法 | |
CN113755460B (zh) | 一种用于制备二氢槲皮素的黄酮还原酶 | |
CN114591985B (zh) | 一种突变果胶裂解酶及应用 | |
CN111850006B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36865及应用 | |
KR20230137996A (ko) | 고 입체 선택성 r트랜스케톨라제 돌연변이체와 그 코딩 유전자 및 응용 | |
CN113122559A (zh) | 膜蛋白SecF的表达载体及其表达纯化方法 |