RU2836734C1 - Ферменты и их применение - Google Patents
Ферменты и их применение Download PDFInfo
- Publication number
- RU2836734C1 RU2836734C1 RU2020123094A RU2020123094A RU2836734C1 RU 2836734 C1 RU2836734 C1 RU 2836734C1 RU 2020123094 A RU2020123094 A RU 2020123094A RU 2020123094 A RU2020123094 A RU 2020123094A RU 2836734 C1 RU2836734 C1 RU 2836734C1
- Authority
- RU
- Russia
- Prior art keywords
- shc
- ambroxide
- homofarnesol
- seq
- hac
- Prior art date
Links
- 102000004190 Enzymes Human genes 0.000 title claims description 199
- 108090000790 Enzymes Proteins 0.000 title claims description 199
- 108091000048 Squalene hopene cyclase Proteins 0.000 claims abstract description 684
- YPZUZOLGGMJZJO-LQKXBSAESA-N ambroxan Chemical compound CC([C@@H]1CC2)(C)CCC[C@]1(C)[C@@H]1[C@]2(C)OCC1 YPZUZOLGGMJZJO-LQKXBSAESA-N 0.000 claims abstract description 394
- YPZUZOLGGMJZJO-UHFFFAOYSA-N ambrofix Natural products C1CC2C(C)(C)CCCC2(C)C2C1(C)OCC2 YPZUZOLGGMJZJO-UHFFFAOYSA-N 0.000 claims abstract description 323
- 238000006243 chemical reaction Methods 0.000 claims abstract description 308
- 238000000034 method Methods 0.000 claims abstract description 249
- 239000000203 mixture Substances 0.000 claims abstract description 130
- 230000000694 effects Effects 0.000 claims abstract description 102
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 89
- 238000004519 manufacturing process Methods 0.000 claims abstract description 57
- 239000002537 cosmetic Substances 0.000 claims abstract description 33
- 239000007790 solid phase Substances 0.000 claims abstract description 27
- 239000007787 solid Substances 0.000 claims abstract description 14
- 239000013078 crystal Substances 0.000 claims abstract description 13
- SYSQUGFVNFXIIT-UHFFFAOYSA-N n-[4-(1,3-benzoxazol-2-yl)phenyl]-4-nitrobenzenesulfonamide Chemical class C1=CC([N+](=O)[O-])=CC=C1S(=O)(=O)NC1=CC=C(C=2OC3=CC=CC=C3N=2)C=C1 SYSQUGFVNFXIIT-UHFFFAOYSA-N 0.000 claims abstract description 8
- KOICZDDAVPYKKX-UHFFFAOYSA-N (3E,7Z)-4,8,12-trimethyltrideca-3,7,11-trien-1-ol Chemical compound CC(=C/CCO)CCC=C(/CCC=C(C)C)C KOICZDDAVPYKKX-UHFFFAOYSA-N 0.000 claims description 275
- 239000000047 product Substances 0.000 claims description 176
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 claims description 102
- 239000000758 substrate Substances 0.000 claims description 97
- 239000011541 reaction mixture Substances 0.000 claims description 72
- 238000000605 extraction Methods 0.000 claims description 34
- 239000006227 byproduct Substances 0.000 claims description 33
- 239000003960 organic solvent Substances 0.000 claims description 32
- 239000007795 chemical reaction product Substances 0.000 claims description 31
- 238000004817 gas chromatography Methods 0.000 claims description 26
- 239000012071 phase Substances 0.000 claims description 26
- 229910052799 carbon Inorganic materials 0.000 claims description 17
- 230000002255 enzymatic effect Effects 0.000 claims description 17
- 238000004821 distillation Methods 0.000 claims description 16
- 239000008346 aqueous phase Substances 0.000 claims description 15
- 101710095468 Cyclase Proteins 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 12
- 239000003599 detergent Substances 0.000 claims description 10
- 229940095696 soap product Drugs 0.000 claims description 7
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 238000005899 aromatization reaction Methods 0.000 claims 1
- 239000000126 substance Substances 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 277
- 230000035772 mutation Effects 0.000 description 145
- 108090000623 proteins and genes Proteins 0.000 description 123
- 238000006467 substitution reaction Methods 0.000 description 98
- 239000002904 solvent Substances 0.000 description 81
- 150000001413 amino acids Chemical class 0.000 description 80
- 102000004169 proteins and genes Human genes 0.000 description 73
- 108090000765 processed proteins & peptides Proteins 0.000 description 67
- 229920001184 polypeptide Polymers 0.000 description 65
- 102000004196 processed proteins & peptides Human genes 0.000 description 65
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 59
- 239000011942 biocatalyst Substances 0.000 description 52
- 239000002773 nucleotide Substances 0.000 description 52
- 125000003729 nucleotide group Chemical group 0.000 description 52
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 51
- 239000013598 vector Substances 0.000 description 49
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 45
- 108020004414 DNA Proteins 0.000 description 45
- 150000001875 compounds Chemical class 0.000 description 43
- 239000000243 solution Substances 0.000 description 39
- 229910052757 nitrogen Inorganic materials 0.000 description 38
- 241000588724 Escherichia coli Species 0.000 description 37
- 244000005700 microbiome Species 0.000 description 37
- 229910052698 phosphorus Inorganic materials 0.000 description 36
- 230000014509 gene expression Effects 0.000 description 33
- 230000001965 increasing effect Effects 0.000 description 32
- 239000007858 starting material Substances 0.000 description 32
- 150000007523 nucleic acids Chemical class 0.000 description 30
- 239000013612 plasmid Substances 0.000 description 30
- 108091028043 Nucleic acid sequence Proteins 0.000 description 28
- 239000013504 Triton X-100 Substances 0.000 description 26
- 229920004890 Triton X-100 Polymers 0.000 description 26
- 238000012217 deletion Methods 0.000 description 26
- 230000037430 deletion Effects 0.000 description 26
- 238000000855 fermentation Methods 0.000 description 26
- 230000004151 fermentation Effects 0.000 description 26
- 238000012360 testing method Methods 0.000 description 26
- 102000039446 nucleic acids Human genes 0.000 description 25
- 108020004707 nucleic acids Proteins 0.000 description 25
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 24
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid group Chemical group C(CC(O)(C(=O)O)CC(=O)O)(=O)O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 24
- 239000002609 medium Substances 0.000 description 24
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 23
- 230000008569 process Effects 0.000 description 23
- 229960005174 ambroxol Drugs 0.000 description 22
- 239000002028 Biomass Substances 0.000 description 20
- JBDGDEWWOUBZPM-XYPYZODXSA-N ambroxol Chemical compound NC1=C(Br)C=C(Br)C=C1CN[C@@H]1CC[C@@H](O)CC1 JBDGDEWWOUBZPM-XYPYZODXSA-N 0.000 description 20
- 102000040430 polynucleotide Human genes 0.000 description 20
- 108091033319 polynucleotide Proteins 0.000 description 20
- 239000002157 polynucleotide Substances 0.000 description 20
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 19
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 19
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 19
- 239000003205 fragrance Substances 0.000 description 19
- 229940031439 squalene Drugs 0.000 description 19
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 18
- 239000000284 extract Substances 0.000 description 18
- 239000012634 fragment Substances 0.000 description 17
- 238000003780 insertion Methods 0.000 description 16
- 230000037431 insertion Effects 0.000 description 16
- 102220071703 rs764831888 Human genes 0.000 description 15
- 230000001953 sensory effect Effects 0.000 description 15
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 15
- 241000640374 Alicyclobacillus acidocaldarius Species 0.000 description 14
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 14
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 14
- 125000000539 amino acid group Chemical group 0.000 description 14
- 238000005119 centrifugation Methods 0.000 description 14
- 239000007979 citrate buffer Substances 0.000 description 14
- 235000015097 nutrients Nutrition 0.000 description 14
- 241000196324 Embryophyta Species 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 13
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 12
- 241000588902 Zymomonas mobilis Species 0.000 description 12
- 238000004140 cleaning Methods 0.000 description 12
- 230000003247 decreasing effect Effects 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 238000003756 stirring Methods 0.000 description 12
- 229910001868 water Inorganic materials 0.000 description 12
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 11
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 11
- 238000005481 NMR spectroscopy Methods 0.000 description 11
- 108010068380 arginylarginine Proteins 0.000 description 11
- 239000008103 glucose Substances 0.000 description 11
- 239000007788 liquid Substances 0.000 description 11
- 238000010956 selective crystallization Methods 0.000 description 11
- 108010080629 tryptophan-leucine Proteins 0.000 description 11
- 241000238631 Hexapoda Species 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- 238000007792 addition Methods 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 10
- 239000012528 membrane Substances 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 239000011780 sodium chloride Substances 0.000 description 10
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 9
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 9
- 230000001580 bacterial effect Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 9
- 238000010276 construction Methods 0.000 description 9
- 238000012258 culturing Methods 0.000 description 9
- 108010090894 prolylleucine Proteins 0.000 description 9
- 238000012216 screening Methods 0.000 description 9
- 101150012554 shc gene Proteins 0.000 description 9
- KOICZDDAVPYKKX-NCZFFCEISA-N (3e,7e)-4,8,12-trimethyltrideca-3,7,11-trien-1-ol Chemical class CC(C)=CCC\C(C)=C\CC\C(C)=C\CCO KOICZDDAVPYKKX-NCZFFCEISA-N 0.000 description 8
- JSNRRGGBADWTMC-UHFFFAOYSA-N (6E)-7,11-dimethyl-3-methylene-1,6,10-dodecatriene Chemical compound CC(C)=CCCC(C)=CCCC(=C)C=C JSNRRGGBADWTMC-UHFFFAOYSA-N 0.000 description 8
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 8
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 8
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 8
- 230000010261 cell growth Effects 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 230000006698 induction Effects 0.000 description 8
- 238000005580 one pot reaction Methods 0.000 description 8
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 8
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 7
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 7
- ZRKWMRDKSOPRRS-UHFFFAOYSA-N N-Methyl-N-nitrosourea Chemical compound O=NN(C)C(N)=O ZRKWMRDKSOPRRS-UHFFFAOYSA-N 0.000 description 7
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- 230000036983 biotransformation Effects 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 210000003527 eukaryotic cell Anatomy 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 238000002156 mixing Methods 0.000 description 7
- 108010031719 prolyl-serine Proteins 0.000 description 7
- 238000007363 ring formation reaction Methods 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 6
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 6
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 6
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 6
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 6
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 6
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 6
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 230000003796 beauty Effects 0.000 description 6
- 239000007853 buffer solution Substances 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 239000000470 constituent Substances 0.000 description 6
- 238000002425 crystallisation Methods 0.000 description 6
- 230000008025 crystallization Effects 0.000 description 6
- 239000004744 fabric Substances 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 6
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 6
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 6
- 239000006225 natural substrate Substances 0.000 description 6
- 239000012074 organic phase Substances 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 108010070643 prolylglutamic acid Proteins 0.000 description 6
- 229920002477 rna polymer Polymers 0.000 description 6
- AWDRATDZQPNJFN-VAYUFCLWSA-N taurodeoxycholic acid Chemical compound C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCS(O)(=O)=O)C)[C@@]2(C)[C@@H](O)C1 AWDRATDZQPNJFN-VAYUFCLWSA-N 0.000 description 6
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 5
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 5
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 5
- 241000193830 Bacillus <bacterium> Species 0.000 description 5
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 5
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 5
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 5
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 5
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 5
- 241000187747 Streptomyces Species 0.000 description 5
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 5
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 5
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010084389 glycyltryptophan Proteins 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 102220326505 rs767809270 Human genes 0.000 description 5
- 102220106769 rs879255496 Human genes 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000012289 standard assay Methods 0.000 description 5
- 239000004094 surface-active agent Substances 0.000 description 5
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 5
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 4
- QYIMSPSDBYKPPY-RSKUXYSASA-N (S)-2,3-epoxysqualene Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C=C(/C)CC\C=C(/C)CC[C@@H]1OC1(C)C QYIMSPSDBYKPPY-RSKUXYSASA-N 0.000 description 4
- UKPGFKQVRITNFM-KBPBESRZSA-N 2-[[2-[[(2s)-1-[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)NCC(O)=O)C1=CC=C(O)C=C1 UKPGFKQVRITNFM-KBPBESRZSA-N 0.000 description 4
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 4
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 4
- ZVWXMTTZJKBJCI-BHDSKKPTSA-N Ala-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 ZVWXMTTZJKBJCI-BHDSKKPTSA-N 0.000 description 4
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 4
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 4
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 4
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 4
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 4
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 4
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 4
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 4
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 4
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 4
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- 108010090461 DFG peptide Proteins 0.000 description 4
- 241000588722 Escherichia Species 0.000 description 4
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 4
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 4
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 4
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 4
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 4
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 4
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 4
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 4
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 4
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 4
- JNGJGFMFXREJNF-KBPBESRZSA-N Gly-Glu-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JNGJGFMFXREJNF-KBPBESRZSA-N 0.000 description 4
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 4
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 4
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 4
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 4
- RJVZMGQMJOQIAX-GJZGRUSLSA-N Gly-Trp-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(O)=O RJVZMGQMJOQIAX-GJZGRUSLSA-N 0.000 description 4
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- PBVQWNDMFFCPIZ-ULQDDVLXSA-N His-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 PBVQWNDMFFCPIZ-ULQDDVLXSA-N 0.000 description 4
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 4
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 4
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 4
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 4
- 241000186660 Lactobacillus Species 0.000 description 4
- 241000194036 Lactococcus Species 0.000 description 4
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 4
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 4
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 4
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 4
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 4
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 4
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 4
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 4
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 4
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 4
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 4
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 4
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 4
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 4
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 4
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 4
- OOXVBECOTYHTCK-WDSOQIARSA-N Met-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCSC)N OOXVBECOTYHTCK-WDSOQIARSA-N 0.000 description 4
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 4
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 4
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 4
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 4
- KLOQCCRTPHPIFN-DCAQKATOSA-N Pro-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 KLOQCCRTPHPIFN-DCAQKATOSA-N 0.000 description 4
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 4
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 4
- RTQKBZIRDWZLDF-BZSNNMDCSA-N Pro-Pro-Trp Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)O)CCN1C(=O)[C@@H]1CCCN1 RTQKBZIRDWZLDF-BZSNNMDCSA-N 0.000 description 4
- 241000589516 Pseudomonas Species 0.000 description 4
- 102100022944 SHC-transforming protein 3 Human genes 0.000 description 4
- TUYBIWUZWJUZDD-ACZMJKKPSA-N Ser-Cys-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O TUYBIWUZWJUZDD-ACZMJKKPSA-N 0.000 description 4
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 4
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 4
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 4
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 4
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 4
- 108010040633 Transforming Protein 3 Src Homology 2 Domain-Containing Proteins 0.000 description 4
- BYSKNUASOAGJSS-NQCBNZPSSA-N Trp-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BYSKNUASOAGJSS-NQCBNZPSSA-N 0.000 description 4
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 4
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 4
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 4
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 4
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 4
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 4
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 4
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 4
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 4
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 4
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 4
- 238000005273 aeration Methods 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010070783 alanyltyrosine Proteins 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000002210 biocatalytic effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 239000006285 cell suspension Substances 0.000 description 4
- NEHNMFOYXAPHSD-UHFFFAOYSA-N citronellal Chemical compound O=CCC(C)CCC=C(C)C NEHNMFOYXAPHSD-UHFFFAOYSA-N 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 4
- 238000005094 computer simulation Methods 0.000 description 4
- NLFBCYMMUAKCPC-KQQUZDAGSA-N ethyl (e)-3-[3-amino-2-cyano-1-[(e)-3-ethoxy-3-oxoprop-1-enyl]sulfanyl-3-oxoprop-1-enyl]sulfanylprop-2-enoate Chemical compound CCOC(=O)\C=C\SC(=C(C#N)C(N)=O)S\C=C\C(=O)OCC NLFBCYMMUAKCPC-KQQUZDAGSA-N 0.000 description 4
- 239000012467 final product Substances 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 108010008671 glycyl-tryptophyl-methionine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- -1 inter alia Chemical class 0.000 description 4
- 108010078274 isoleucylvaline Proteins 0.000 description 4
- ZYTMANIQRDEHIO-KXUCPTDWSA-N isopulegol Chemical compound C[C@@H]1CC[C@@H](C(C)=C)[C@H](O)C1 ZYTMANIQRDEHIO-KXUCPTDWSA-N 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 229940039696 lactobacillus Drugs 0.000 description 4
- 239000010410 layer Substances 0.000 description 4
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 4
- 239000007791 liquid phase Substances 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 108010068488 methionylphenylalanine Proteins 0.000 description 4
- 230000009965 odorless effect Effects 0.000 description 4
- 238000005191 phase separation Methods 0.000 description 4
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 102200099204 rs4280262 Human genes 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 239000011550 stock solution Substances 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 108010037335 tyrosyl-prolyl-glycyl-glycine Proteins 0.000 description 4
- 108010078580 tyrosylleucine Proteins 0.000 description 4
- APAPGJJZPJQKJJ-NTCAYCPXSA-N (6e)-2,6-dimethyl-10-methylidenedodeca-2,6-diene Chemical compound CCC(=C)CC\C=C(/C)CCC=C(C)C APAPGJJZPJQKJJ-NTCAYCPXSA-N 0.000 description 3
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 3
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 3
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 3
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 3
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 3
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 3
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 3
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 3
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 3
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 3
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 3
- XOASPVGNFAMYBD-WFBYXXMGSA-N Asp-Trp-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O XOASPVGNFAMYBD-WFBYXXMGSA-N 0.000 description 3
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 3
- HEPLXMBVMCXTBP-QWRGUYRKSA-N Cys-Phe-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O HEPLXMBVMCXTBP-QWRGUYRKSA-N 0.000 description 3
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 3
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 3
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 3
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 3
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 3
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 3
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 3
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 3
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 3
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 3
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- VYMGAXSNYUFVCK-GUBZILKMSA-N His-Gln-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N VYMGAXSNYUFVCK-GUBZILKMSA-N 0.000 description 3
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 3
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 3
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 3
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 3
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 3
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 3
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 3
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- YQNBKXUTWBRQCS-BVSLBCMMSA-N Phe-Arg-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 YQNBKXUTWBRQCS-BVSLBCMMSA-N 0.000 description 3
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 3
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 3
- 241000235648 Pichia Species 0.000 description 3
- SBYVDRLQAGENMY-DCAQKATOSA-N Pro-Asn-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O SBYVDRLQAGENMY-DCAQKATOSA-N 0.000 description 3
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 3
- DYMPSOABVJIFBS-IHRRRGAJSA-N Pro-Phe-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CS)C(=O)O DYMPSOABVJIFBS-IHRRRGAJSA-N 0.000 description 3
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 241000235070 Saccharomyces Species 0.000 description 3
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 3
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 3
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 3
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 3
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 3
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 3
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 3
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 3
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 3
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 3
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 3
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 3
- FEZASNVQLJQBHW-CABZTGNLSA-N Trp-Gly-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O)=CNC2=C1 FEZASNVQLJQBHW-CABZTGNLSA-N 0.000 description 3
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 3
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 3
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 3
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 3
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 3
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 3
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 3
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 3
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 3
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 3
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 3
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 3
- WHNSHJJNWNSTSU-BZSNNMDCSA-N Val-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 WHNSHJJNWNSTSU-BZSNNMDCSA-N 0.000 description 3
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 125000004432 carbon atom Chemical group C* 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- IMKJGXCIJJXALX-UHFFFAOYSA-N ent-Norambreinolide Natural products C1CC2C(C)(C)CCCC2(C)C2C1(C)OC(=O)C2 IMKJGXCIJJXALX-UHFFFAOYSA-N 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 3
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 3
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 3
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 3
- 235000019341 magnesium sulphate Nutrition 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000012044 organic layer Substances 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000006798 ring closing metathesis reaction Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 150000003505 terpenes Chemical class 0.000 description 3
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 3
- 229960003495 thiamine Drugs 0.000 description 3
- 235000019157 thiamine Nutrition 0.000 description 3
- 239000011721 thiamine Substances 0.000 description 3
- 239000011573 trace mineral Substances 0.000 description 3
- 235000013619 trace mineral Nutrition 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 108010038745 tryptophylglycine Proteins 0.000 description 3
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- 239000001871 (1R,2R,5S)-5-methyl-2-prop-1-en-2-ylcyclohexan-1-ol Substances 0.000 description 2
- CXENHBSYCFFKJS-UHFFFAOYSA-N (3E,6E)-3,7,11-Trimethyl-1,3,6,10-dodecatetraene Natural products CC(C)=CCCC(C)=CCC=C(C)C=C CXENHBSYCFFKJS-UHFFFAOYSA-N 0.000 description 2
- 239000001147 (3aR,5aS,9aS,9bR)-3a,6,6,9a-tetramethyl-2,4,5,5a,7,8,9,9b-octahydro-1H-benzo[e][1]benzofuran Substances 0.000 description 2
- KOICZDDAVPYKKX-AJXWQLJOSA-N (7E)-4,8,12-trimethyltrideca-3,7,11-trien-1-ol Chemical compound CC(=CCCO)CC\C=C(\CCC=C(C)C)/C KOICZDDAVPYKKX-AJXWQLJOSA-N 0.000 description 2
- JSNRRGGBADWTMC-QINSGFPZSA-N (E)-beta-Farnesene Natural products CC(C)=CCC\C(C)=C/CCC(=C)C=C JSNRRGGBADWTMC-QINSGFPZSA-N 0.000 description 2
- QPFMBZIOSGYJDE-UHFFFAOYSA-N 1,1,2,2-tetrachloroethane Chemical compound ClC(Cl)C(Cl)Cl QPFMBZIOSGYJDE-UHFFFAOYSA-N 0.000 description 2
- HTSGKJQDMSTCGS-UHFFFAOYSA-N 1,4-bis(4-chlorophenyl)-2-(4-methylphenyl)sulfonylbutane-1,4-dione Chemical compound C1=CC(C)=CC=C1S(=O)(=O)C(C(=O)C=1C=CC(Cl)=CC=1)CC(=O)C1=CC=C(Cl)C=C1 HTSGKJQDMSTCGS-UHFFFAOYSA-N 0.000 description 2
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- 102000055025 Adenosine deaminases Human genes 0.000 description 2
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 2
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 2
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- SGAUXNZEFIEAAI-GARJFASQSA-N Asn-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)C(=O)O SGAUXNZEFIEAAI-GARJFASQSA-N 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 2
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 2
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 2
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 2
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241001646647 Burkholderia ambifaria Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- FKLJPTJMIBLJAV-UHFFFAOYSA-N Compound IV Chemical compound O1N=C(C)C=C1CCCCCCCOC1=CC=C(C=2OCCN=2)C=C1 FKLJPTJMIBLJAV-UHFFFAOYSA-N 0.000 description 2
- RGSFGYAAUTVSQA-UHFFFAOYSA-N Cyclopentane Chemical compound C1CCCC1 RGSFGYAAUTVSQA-UHFFFAOYSA-N 0.000 description 2
- LVZWSLJZHVFIQJ-UHFFFAOYSA-N Cyclopropane Chemical compound C1CC1 LVZWSLJZHVFIQJ-UHFFFAOYSA-N 0.000 description 2
- WKELHWMCIXSVDT-UBHSHLNASA-N Cys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WKELHWMCIXSVDT-UBHSHLNASA-N 0.000 description 2
- ZAFNJMIOTHYJRJ-UHFFFAOYSA-N Diisopropyl ether Chemical compound CC(C)OC(C)C ZAFNJMIOTHYJRJ-UHFFFAOYSA-N 0.000 description 2
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 2
- 241000187804 Frankia alni Species 0.000 description 2
- 229930091371 Fructose Natural products 0.000 description 2
- 239000005715 Fructose Substances 0.000 description 2
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 2
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 2
- JPWIMMUNWUKOAD-STQMWFEESA-N Gly-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN JPWIMMUNWUKOAD-STQMWFEESA-N 0.000 description 2
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 2
- IFHJOBKVXBESRE-YUMQZZPRSA-N Gly-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN IFHJOBKVXBESRE-YUMQZZPRSA-N 0.000 description 2
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 2
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 2
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 2
- QHGBCRCMBCWMBJ-UHFFFAOYSA-N Ile-Glu-Ala-Lys Natural products CCC(C)C(N)C(=O)NC(CCC(O)=O)C(=O)NC(C)C(=O)NC(C(O)=O)CCCCN QHGBCRCMBCWMBJ-UHFFFAOYSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 2
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 2
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- IMKJGXCIJJXALX-SHUKQUCYSA-N Norambreinolide Chemical compound CC([C@@H]1CC2)(C)CCC[C@]1(C)[C@@H]1[C@]2(C)OC(=O)C1 IMKJGXCIJJXALX-SHUKQUCYSA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- OFBQJSOFQDEBGM-UHFFFAOYSA-N Pentane Chemical compound CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 2
- ZBYHVSHBZYHQBW-SRVKXCTJSA-N Phe-Cys-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZBYHVSHBZYHQBW-SRVKXCTJSA-N 0.000 description 2
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 2
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 2
- MTMJNKFZDQEVSY-BZSNNMDCSA-N Pro-Val-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MTMJNKFZDQEVSY-BZSNNMDCSA-N 0.000 description 2
- 102100022340 SHC-transforming protein 1 Human genes 0.000 description 2
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- HEDRZPFGACZZDS-MICDWDOJSA-N Trichloro(2H)methane Chemical compound [2H]C(Cl)(Cl)Cl HEDRZPFGACZZDS-MICDWDOJSA-N 0.000 description 2
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 2
- ACGIVBXINJFALS-HKUYNNGSSA-N Trp-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ACGIVBXINJFALS-HKUYNNGSSA-N 0.000 description 2
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- 108010027570 Xanthine phosphoribosyltransferase Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000001338 aliphatic hydrocarbons Chemical class 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- YSNRTFFURISHOU-UHFFFAOYSA-N beta-farnesene Natural products C=CC(C)CCC=C(C)CCC=C(C)C YSNRTFFURISHOU-UHFFFAOYSA-N 0.000 description 2
- DKPFZGUDAPQIHT-UHFFFAOYSA-N butyl acetate Chemical compound CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- MVPPADPHJFYWMZ-UHFFFAOYSA-N chlorobenzene Chemical compound ClC1=CC=CC=C1 MVPPADPHJFYWMZ-UHFFFAOYSA-N 0.000 description 2
- 229940069078 citric acid / sodium citrate Drugs 0.000 description 2
- 229930003633 citronellal Natural products 0.000 description 2
- 235000000983 citronellal Nutrition 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 238000010924 continuous production Methods 0.000 description 2
- 239000002178 crystalline material Substances 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- 238000005888 cyclopropanation reaction Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- SNRUBQQJIBEYMU-UHFFFAOYSA-N dodecane Chemical compound CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000005496 eutectics Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 229930009668 farnesene Natural products 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 239000006260 foam Substances 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 239000002608 ionic liquid Substances 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 229940095045 isopulegol Drugs 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- ZYTMANIQRDEHIO-UHFFFAOYSA-N neo-Isopulegol Natural products CC1CCC(C(C)=C)C(O)C1 ZYTMANIQRDEHIO-UHFFFAOYSA-N 0.000 description 2
- 238000002414 normal-phase solid-phase extraction Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 229940096995 sclareolide Drugs 0.000 description 2
- 238000011218 seed culture Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 2
- 239000008137 solubility enhancer Substances 0.000 description 2
- 230000007928 solubilization Effects 0.000 description 2
- 238000005063 solubilization Methods 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 235000007586 terpenes Nutrition 0.000 description 2
- NUMQCACRALPSHD-UHFFFAOYSA-N tert-butyl ethyl ether Chemical compound CCOC(C)(C)C NUMQCACRALPSHD-UHFFFAOYSA-N 0.000 description 2
- VZGDMQKNWNREIO-UHFFFAOYSA-N tetrachloromethane Chemical compound ClC(Cl)(Cl)Cl VZGDMQKNWNREIO-UHFFFAOYSA-N 0.000 description 2
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- FQTLCLSUCSAZDY-UHFFFAOYSA-N (+) E(S) nerolidol Natural products CC(C)=CCCC(C)=CCCC(C)(O)C=C FQTLCLSUCSAZDY-UHFFFAOYSA-N 0.000 description 1
- NOOLISFMXDJSKH-UTLUCORTSA-N (+)-Neomenthol Chemical compound CC(C)[C@@H]1CC[C@@H](C)C[C@@H]1O NOOLISFMXDJSKH-UTLUCORTSA-N 0.000 description 1
- CRDAMVZIKSXKFV-FBXUGWQNSA-N (2-cis,6-cis)-farnesol Chemical compound CC(C)=CCC\C(C)=C/CC\C(C)=C/CO CRDAMVZIKSXKFV-FBXUGWQNSA-N 0.000 description 1
- 239000000260 (2E,6E)-3,7,11-trimethyldodeca-2,6,10-trien-1-ol Substances 0.000 description 1
- YPZUZOLGGMJZJO-DARAHFNDSA-N (3ar,5as,9as,9bs)-3a,6,6,9a-tetramethyl-2,4,5,5a,7,8,9,9b-octahydro-1h-benzo[e][1]benzofuran Chemical compound CC([C@@H]1CC2)(C)CCC[C@]1(C)[C@H]1[C@]2(C)OCC1 YPZUZOLGGMJZJO-DARAHFNDSA-N 0.000 description 1
- XUFAHPAHNJCLLZ-WYEAJDFLSA-N (3as,4s,5as,9as,9br)-4-hydroxy-3a,6,6,9a-tetramethyl-1,4,5,5a,7,8,9,9b-octahydrobenzo[e][1]benzofuran-2-one Chemical compound C([C@@]12C)CCC(C)(C)[C@@H]1C[C@H](O)[C@]1(C)[C@@H]2CC(=O)O1 XUFAHPAHNJCLLZ-WYEAJDFLSA-N 0.000 description 1
- YPZUZOLGGMJZJO-SDADXPQNSA-N (3as,5as,9as,9bs)-3a,6,6,9a-tetramethyl-2,4,5,5a,7,8,9,9b-octahydro-1h-benzo[e][1]benzofuran Chemical compound CC([C@@H]1CC2)(C)CCC[C@]1(C)[C@H]1[C@@]2(C)OCC1 YPZUZOLGGMJZJO-SDADXPQNSA-N 0.000 description 1
- KIYYUMANFSBVAV-MZIWDXLGSA-N (3r,3as,5ar,5br,7ar,9s,11ar,11br,13ar,13bs)-5a,5b,8,8,11a,13b-hexamethyl-3-propan-2-yl-1,2,3,3a,4,5,6,7,7a,9,10,11,11b,12,13,13a-hexadecahydrocyclopenta[a]chrysen-9-ol Chemical compound C([C@]1(C)[C@H]2CC[C@H]34)C[C@H](O)C(C)(C)[C@@H]1CC[C@@]2(C)[C@]4(C)CC[C@@H]1[C@]3(C)CC[C@@H]1C(C)C KIYYUMANFSBVAV-MZIWDXLGSA-N 0.000 description 1
- KOICZDDAVPYKKX-HDVIWIBHSA-N (3z,7e)-4,8,12-trimethyltrideca-3,7,11-trien-1-ol Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C/CCO KOICZDDAVPYKKX-HDVIWIBHSA-N 0.000 description 1
- QDBXHTTXDKFFLV-GZTMPHGLSA-N (4Z,7aS,11aS)-5,8,8,11a-tetramethyl-2,3,6,7,7a,9,10,11-octahydro-1-benzoxonine Chemical compound C/C=1/CC[C@@H]2[C@@](OCC\C=1)(CCCC2(C)C)C QDBXHTTXDKFFLV-GZTMPHGLSA-N 0.000 description 1
- XBZYWSMVVKYHQN-MYPRUECHSA-N (4as,6as,6br,8ar,9r,10s,12ar,12br,14bs)-10-hydroxy-2,2,6a,6b,9,12a-hexamethyl-9-[(sulfooxy)methyl]-1,2,3,4,4a,5,6,6a,6b,7,8,8a,9,10,11,12,12a,12b,13,14b-icosahydropicene-4a-carboxylic acid Chemical compound C1C[C@H](O)[C@@](C)(COS(O)(=O)=O)[C@@H]2CC[C@@]3(C)[C@]4(C)CC[C@@]5(C(O)=O)CCC(C)(C)C[C@H]5C4=CC[C@@H]3[C@]21C XBZYWSMVVKYHQN-MYPRUECHSA-N 0.000 description 1
- SCYULBFZEHDVBN-UHFFFAOYSA-N 1,1-Dichloroethane Chemical compound CC(Cl)Cl SCYULBFZEHDVBN-UHFFFAOYSA-N 0.000 description 1
- RYHBNJHYFVUHQT-UHFFFAOYSA-N 1,4-Dioxane Chemical compound C1COCCO1 RYHBNJHYFVUHQT-UHFFFAOYSA-N 0.000 description 1
- OCJBOOLMMGQPQU-UHFFFAOYSA-N 1,4-dichlorobenzene Chemical compound ClC1=CC=C(Cl)C=C1 OCJBOOLMMGQPQU-UHFFFAOYSA-N 0.000 description 1
- DURPTKYDGMDSBL-UHFFFAOYSA-N 1-butoxybutane Chemical compound CCCCOCCCC DURPTKYDGMDSBL-UHFFFAOYSA-N 0.000 description 1
- BJVUJIDTICYHLL-UHFFFAOYSA-N 1-chloro-3,7,11-trimethyldodeca-2,6,10-triene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCl BJVUJIDTICYHLL-UHFFFAOYSA-N 0.000 description 1
- 238000001644 13C nuclear magnetic resonance spectroscopy Methods 0.000 description 1
- 238000005160 1H NMR spectroscopy Methods 0.000 description 1
- DQPMXYDFWRYWQV-UHFFFAOYSA-N 2-[[6-amino-2-[[2-[(2-amino-3-methylbutanoyl)amino]-3-hydroxybutanoyl]amino]hexanoyl]amino]acetic acid Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(=O)NC(CCCCN)C(=O)NCC(O)=O DQPMXYDFWRYWQV-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- HHXYJYBYNZMZKX-PYQRSULMSA-N 22(29)-Hopene Chemical compound C([C@]1(C)[C@H]2CC[C@H]34)CCC(C)(C)[C@@H]1CC[C@@]2(C)[C@]4(C)CC[C@@H]1[C@]3(C)CC[C@@H]1C(=C)C HHXYJYBYNZMZKX-PYQRSULMSA-N 0.000 description 1
- HHXYJYBYNZMZKX-UHFFFAOYSA-N 3,4:15,16-diepoxy-7-oxo-13(16),14-clerodadien-20,12-olide-(3alpha,4alpha)-form Natural products C12CCC3C4(C)CCCC(C)(C)C4CCC3(C)C1(C)CCC1C2(C)CCC1C(=C)C HHXYJYBYNZMZKX-UHFFFAOYSA-N 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- 241000589220 Acetobacter Species 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- NFDVJAKFMXHJEQ-HERUPUMHSA-N Ala-Asp-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NFDVJAKFMXHJEQ-HERUPUMHSA-N 0.000 description 1
- PWYFCPCBOYMOGB-LKTVYLICSA-N Ala-Gln-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PWYFCPCBOYMOGB-LKTVYLICSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 1
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- VWJFQGXPYOPXJH-ZLUOBGJFSA-N Asn-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)N VWJFQGXPYOPXJH-ZLUOBGJFSA-N 0.000 description 1
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- ICDDSTLEMLGSTB-GUBZILKMSA-N Asn-Met-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ICDDSTLEMLGSTB-GUBZILKMSA-N 0.000 description 1
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- KSZHWTRZPOTIGY-AVGNSLFASA-N Asn-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KSZHWTRZPOTIGY-AVGNSLFASA-N 0.000 description 1
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 1
- DPSUVAPLRQDWAO-YDHLFZDLSA-N Asn-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)N)N DPSUVAPLRQDWAO-YDHLFZDLSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 1
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- UBPMOJLRVMGTOQ-GARJFASQSA-N Asp-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)C(=O)O UBPMOJLRVMGTOQ-GARJFASQSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000228257 Aspergillus sp. Species 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000244202 Caenorhabditis Species 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- WTEVQBCEXWBHNA-UHFFFAOYSA-N Citral Natural products CC(C)=CCCC(C)=CC=O WTEVQBCEXWBHNA-UHFFFAOYSA-N 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 1
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 1
- KXUKWRVYDYIPSQ-CIUDSAMLSA-N Cys-Leu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUKWRVYDYIPSQ-CIUDSAMLSA-N 0.000 description 1
- POSRGGKLRWCUBE-CIUDSAMLSA-N Cys-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N POSRGGKLRWCUBE-CIUDSAMLSA-N 0.000 description 1
- UOEYKPDDHSFMLI-DCAQKATOSA-N Cys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N UOEYKPDDHSFMLI-DCAQKATOSA-N 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- NOOLISFMXDJSKH-UHFFFAOYSA-N DL-menthol Natural products CC(C)C1CCC(C)CC1O NOOLISFMXDJSKH-UHFFFAOYSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- JKPGHIQCHIIRMS-AVGNSLFASA-N Gln-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N JKPGHIQCHIIRMS-AVGNSLFASA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- RBSKVTZUFMIWFU-XEGUGMAKSA-N Gln-Trp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O RBSKVTZUFMIWFU-XEGUGMAKSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- GWKBAXRZPLSWJS-QEJZJMRPSA-N Glu-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GWKBAXRZPLSWJS-QEJZJMRPSA-N 0.000 description 1
- OLTHVCNYJAALPL-BHYGNILZSA-N Glu-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OLTHVCNYJAALPL-BHYGNILZSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- YYQGVXNKAXUTJU-YUMQZZPRSA-N Gly-Cys-His Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O YYQGVXNKAXUTJU-YUMQZZPRSA-N 0.000 description 1
- IANBSEOVTQNGBZ-BQBZGAKWSA-N Gly-Cys-Met Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(O)=O IANBSEOVTQNGBZ-BQBZGAKWSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- YJBMLTVVVRJNOK-SRVKXCTJSA-N His-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N YJBMLTVVVRJNOK-SRVKXCTJSA-N 0.000 description 1
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 1
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 1
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 1
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- ZNTSGDNUITWTRA-WDSOQIARSA-N His-Trp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O ZNTSGDNUITWTRA-WDSOQIARSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- MRVZCDSYLJXKKX-ACRUOGEOSA-N His-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N MRVZCDSYLJXKKX-ACRUOGEOSA-N 0.000 description 1
- 229930186351 Hopene Natural products 0.000 description 1
- DLTTWXWDLCGBRD-UHFFFAOYSA-N Hydroxyhopane Natural products CC12CCCC(C)(C)C1CCC1(C)C2CCC2C3(C)CCC(C(C)C)C3(O)CCC21C DLTTWXWDLCGBRD-UHFFFAOYSA-N 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- AQTWDZDISVGCAC-CFMVVWHZSA-N Ile-Asp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AQTWDZDISVGCAC-CFMVVWHZSA-N 0.000 description 1
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- GLLAUPMJCGKPFY-BLMTYFJBSA-N Ile-Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 GLLAUPMJCGKPFY-BLMTYFJBSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- 108010093096 Immobilized Enzymes Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 239000007836 KH2PO4 Substances 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 239000001358 L(+)-tartaric acid Substances 0.000 description 1
- 235000011002 L(+)-tartaric acid Nutrition 0.000 description 1
- FEWJPZIEWOKRBE-LWMBPPNESA-N L-(+)-Tartaric acid Natural products OC(=O)[C@@H](O)[C@H](O)C(O)=O FEWJPZIEWOKRBE-LWMBPPNESA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 1
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 1
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- URGPVYGVWLIRGT-DCAQKATOSA-N Lys-Met-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O URGPVYGVWLIRGT-DCAQKATOSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- YUTZYVTZDVZBJJ-IHPCNDPISA-N Lys-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YUTZYVTZDVZBJJ-IHPCNDPISA-N 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 1
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 1
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 1
- QTMIXEQWGNIPBL-JYJNAYRXSA-N Met-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N QTMIXEQWGNIPBL-JYJNAYRXSA-N 0.000 description 1
- MNGBICITWAPGAS-BPUTZDHNSA-N Met-Ser-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MNGBICITWAPGAS-BPUTZDHNSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- VOAKKHOIAFKOQZ-JYJNAYRXSA-N Met-Tyr-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 VOAKKHOIAFKOQZ-JYJNAYRXSA-N 0.000 description 1
- NTIZESTWPVYFNL-UHFFFAOYSA-N Methyl isobutyl ketone Chemical compound CC(C)CC(C)=O NTIZESTWPVYFNL-UHFFFAOYSA-N 0.000 description 1
- UIHCLUNTQKBZGK-UHFFFAOYSA-N Methyl isobutyl ketone Natural products CCC(C)C(C)=O UIHCLUNTQKBZGK-UHFFFAOYSA-N 0.000 description 1
- 241000589346 Methylococcus capsulatus Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- FQTLCLSUCSAZDY-ATGUSINASA-N Nerolidol Chemical compound CC(C)=CCC\C(C)=C\CC[C@](C)(O)C=C FQTLCLSUCSAZDY-ATGUSINASA-N 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 1
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- ACJULKNZOCRWEI-ULQDDVLXSA-N Phe-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O ACJULKNZOCRWEI-ULQDDVLXSA-N 0.000 description 1
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- PTLOFJZJADCNCD-DCAQKATOSA-N Pro-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 PTLOFJZJADCNCD-DCAQKATOSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- JRQCDSNPRNGWRG-AVGNSLFASA-N Pro-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2 JRQCDSNPRNGWRG-AVGNSLFASA-N 0.000 description 1
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 1
- ZTMLZUNPFDGPKY-VKOGCVSHSA-N Pro-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ZTMLZUNPFDGPKY-VKOGCVSHSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- PUQRDHNIOONJJN-AVGNSLFASA-N Pro-Lys-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PUQRDHNIOONJJN-AVGNSLFASA-N 0.000 description 1
- NTXFLJULRHQMDC-GUBZILKMSA-N Pro-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 NTXFLJULRHQMDC-GUBZILKMSA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- VVEQUISRWJDGMX-VKOGCVSHSA-N Pro-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 VVEQUISRWJDGMX-VKOGCVSHSA-N 0.000 description 1
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 1
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010052388 RGES peptide Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 244000182022 Salvia sclarea Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- XPVIVVLLLOFBRH-XIRDDKMYSA-N Ser-Trp-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)CO)C(O)=O XPVIVVLLLOFBRH-XIRDDKMYSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- YXGCIEUDOHILKR-IHRRRGAJSA-N Ser-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CO)N YXGCIEUDOHILKR-IHRRRGAJSA-N 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 241000248418 Tetrahymena pyriformis Species 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- XNRJFXBORWMIPY-DCPHZVHLSA-N Trp-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XNRJFXBORWMIPY-DCPHZVHLSA-N 0.000 description 1
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 1
- KZIQDVNORJKTMO-WDSOQIARSA-N Trp-Arg-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N KZIQDVNORJKTMO-WDSOQIARSA-N 0.000 description 1
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 1
- GKUROEIXVURAAO-BPUTZDHNSA-N Trp-Asp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GKUROEIXVURAAO-BPUTZDHNSA-N 0.000 description 1
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 1
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 1
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 1
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 1
- OCCYDHCUKXRPSJ-SXNHZJKMSA-N Trp-Ile-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OCCYDHCUKXRPSJ-SXNHZJKMSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- WKCFCVBOFKEVKY-HSCHXYMDSA-N Trp-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WKCFCVBOFKEVKY-HSCHXYMDSA-N 0.000 description 1
- CSOBBJWWODOYGW-ILWGZMRPSA-N Trp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O CSOBBJWWODOYGW-ILWGZMRPSA-N 0.000 description 1
- XDQGKIMTRSVSBC-WDSOQIARSA-N Trp-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CNC2=CC=CC=C12 XDQGKIMTRSVSBC-WDSOQIARSA-N 0.000 description 1
- JGLXHHQUSIULAK-OYDLWJJNSA-N Trp-Pro-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC=3C4=CC=CC=C4NC=3)N)C(O)=O)=CNC2=C1 JGLXHHQUSIULAK-OYDLWJJNSA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- WBZOZLNLXVBCNW-LTHWPDAASA-N Trp-Thr-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)[C@@H](C)O)=CNC2=C1 WBZOZLNLXVBCNW-LTHWPDAASA-N 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- XQMGDVVKFRLQKH-BBRMVZONSA-N Trp-Val-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O)=CNC2=C1 XQMGDVVKFRLQKH-BBRMVZONSA-N 0.000 description 1
- IEESWNWYUOETOT-BVSLBCMMSA-N Trp-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1ccccc1)C(O)=O IEESWNWYUOETOT-BVSLBCMMSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- QOIKZODVIPOPDD-AVGNSLFASA-N Tyr-Cys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOIKZODVIPOPDD-AVGNSLFASA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 1
- STTVVMWQKDOKAM-YESZJQIVSA-N Tyr-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O STTVVMWQKDOKAM-YESZJQIVSA-N 0.000 description 1
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- YSGAPESOXHFTQY-IHRRRGAJSA-N Tyr-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N YSGAPESOXHFTQY-IHRRRGAJSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- JPPXDMBGXJBTIB-ULQDDVLXSA-N Val-His-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N JPPXDMBGXJBTIB-ULQDDVLXSA-N 0.000 description 1
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- KWJSWFXHRJLFSX-NTEUORMPSA-N [(5E)-6,10-dimethylundeca-1,5,9-trien-2-yl]cyclopropane Chemical compound CC(C)=CCC\C(C)=C\CCC(=C)C1CC1 KWJSWFXHRJLFSX-NTEUORMPSA-N 0.000 description 1
- 239000008351 acetate buffer Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001336 alkenes Chemical group 0.000 description 1
- DLRVVLDZNNYCBX-CAPXFGMSSA-N allolactose Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@@H]1OC[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](O)O1 DLRVVLDZNNYCBX-CAPXFGMSSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 150000004945 aromatic hydrocarbons Chemical class 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 229940065181 bacillus anthracis Drugs 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000031709 bromination Effects 0.000 description 1
- 238000005893 bromination reaction Methods 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 239000012159 carrier gas Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- KRVSOGSZCMJSLX-UHFFFAOYSA-L chromic acid Substances O[Cr](O)(=O)=O KRVSOGSZCMJSLX-UHFFFAOYSA-L 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 229940043350 citral Drugs 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 229940125898 compound 5 Drugs 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000012043 crude product Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007333 cyanation reaction Methods 0.000 description 1
- 150000004292 cyclic ethers Chemical class 0.000 description 1
- WJTCGQSWYFHTAC-UHFFFAOYSA-N cyclooctane Chemical compound C1CCCCCCC1 WJTCGQSWYFHTAC-UHFFFAOYSA-N 0.000 description 1
- 239000004914 cyclooctane Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 229940117389 dichlorobenzene Drugs 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000004205 dimethyl polysiloxane Substances 0.000 description 1
- 235000013870 dimethyl polysiloxane Nutrition 0.000 description 1
- POLCUAVZOMRGSN-UHFFFAOYSA-N dipropyl ether Chemical compound CCCOCCC POLCUAVZOMRGSN-UHFFFAOYSA-N 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000002481 ethanol extraction Methods 0.000 description 1
- 239000000469 ethanolic extract Substances 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 229930002886 farnesol Natural products 0.000 description 1
- 229940043259 farnesol Drugs 0.000 description 1
- 239000012527 feed solution Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 239000004088 foaming agent Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- AWJWCTOOIBYHON-UHFFFAOYSA-N furo[3,4-b]pyrazine-5,7-dione Chemical compound C1=CN=C2C(=O)OC(=O)C2=N1 AWJWCTOOIBYHON-UHFFFAOYSA-N 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- WTEVQBCEXWBHNA-JXMROGBWSA-N geranial Chemical compound CC(C)=CCC\C(C)=C\C=O WTEVQBCEXWBHNA-JXMROGBWSA-N 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 1
- DMEGYFMYUHOHGS-UHFFFAOYSA-N heptamethylene Natural products C1CCCCCC1 DMEGYFMYUHOHGS-UHFFFAOYSA-N 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 150000002597 lactoses Chemical class 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 108020001756 ligand binding domains Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 210000000723 mammalian artificial chromosome Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 210000003574 melanophore Anatomy 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 229940041616 menthol Drugs 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- NQMRYBIKMRVZLB-UHFFFAOYSA-N methylamine hydrochloride Chemical compound [Cl-].[NH3+]C NQMRYBIKMRVZLB-UHFFFAOYSA-N 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 230000004001 molecular interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 238000003541 multi-stage reaction Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- WASNIKZYIWZQIP-AWEZNQCLSA-N nerolidol Natural products CC(=CCCC(=CCC[C@@H](O)C=C)C)C WASNIKZYIWZQIP-AWEZNQCLSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 238000006864 oxidative decomposition reaction Methods 0.000 description 1
- 238000010979 pH adjustment Methods 0.000 description 1
- 238000001139 pH measurement Methods 0.000 description 1
- JKDRQYIYVJVOPF-FDGPNNRMSA-L palladium(ii) acetylacetonate Chemical compound [Pd+2].C\C([O-])=C\C(C)=O.C\C([O-])=C\C(C)=O JKDRQYIYVJVOPF-FDGPNNRMSA-L 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000002572 peristaltic effect Effects 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 235000011007 phosphoric acid Nutrition 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000012429 reaction media Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010992 reflux Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000035910 sensory benefits Effects 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 235000017550 sodium carbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 229940045946 sodium taurodeoxycholate Drugs 0.000 description 1
- YXHRQQJFKOHLAP-FVCKGWAHSA-M sodium;2-[[(4r)-4-[(3r,5r,8r,9s,10s,12s,13r,14s,17r)-3,12-dihydroxy-10,13-dimethyl-2,3,4,5,6,7,8,9,11,12,14,15,16,17-tetradecahydro-1h-cyclopenta[a]phenanthren-17-yl]pentanoyl]amino]ethanesulfonate Chemical compound [Na+].C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 YXHRQQJFKOHLAP-FVCKGWAHSA-M 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000001256 steam distillation Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000012258 stirred mixture Substances 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- CRDAMVZIKSXKFV-UHFFFAOYSA-N trans-Farnesol Natural products CC(C)=CCCC(C)=CCCC(C)=CCO CRDAMVZIKSXKFV-UHFFFAOYSA-N 0.000 description 1
- JSNRRGGBADWTMC-NTCAYCPXSA-N trans-beta-farnesene Chemical compound CC(C)=CCC\C(C)=C\CCC(=C)C=C JSNRRGGBADWTMC-NTCAYCPXSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
- 239000008096 xylene Substances 0.000 description 1
- 150000003738 xylenes Chemical class 0.000 description 1
Abstract
Группа изобретений относится к биотехнологии, в частности к селективному получению (-)-амброксида. Предложен способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где смесь изомеров, содержащую (3Е,7Е)-гомофарнезол (ЕЕН), ферментативно конвертируют в (-)-амброксид или в смесь, содержащую (-)-амброксид, с использованием фермента сквален-гопен-циклазы/гомофарнезол-амброксид-циклазы (SHC/HAC), содержащего аминокислотную последовательность, имеющую по меньшей мере 30% идентичность c SEQ ID NO: 1, в подходящих реакционных условиях. Смесь изомеров, содержащая EEH, выбрана из по меньшей мере одной из [EE:EZ], [EE:ZE] и [EE:EZ:ZE]. (-)-Амброксид присутствует в твердой фазе в виде кристаллов или в аморфной форме. Способ приводит к получению продукта, содержащего 80-97% (-)-амброксида в твердой форме, который применяют в составе ароматизирующего продукта, или косметического продукта, или потребительского продукта. 5 н. и 19 з.п. ф-лы, 25 ил., 26 табл., 23 пр.
Description
ОБЛАСТЬ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к производным фермента сквален-гопен-циклазы (Squalene Hopene Cyclase)/гомофарнезол-амброксид-циклазы (Homofarnesol Ambrox Cyclase) (SHC/HAC), модифицированным по отношению к исходному белку SHC/HAC, к аминокислотным последовательностям, составляющим производные ферментов SHC/HAC, нуклеотидным последовательностям, кодирующим производные SHC/HAC, векторам, содержащим нуклеотидные последовательности, кодирующие производные SHC/HAC, и к рекомбинантным клеткам-хозяевам, содержащим нуклеотидные последовательности, кодирующие производные SHC/HAC. Настоящее изобретение также относится к средствам для функциональной экспрессии нуклеотидных последовательностей, кодирующих производные SHC/HAC, и к способам применения рекомбинантных микроорганизмов, содержащих нуклеотидные последовательности, кодирующие производные SHC/HAC и SHC/HAC дикого типа (WT), для получения амброксида, предпочтительно (-)-амброксида.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
Сквален-гопен-циклазы (SHC, ЕС 5.4.99.17) представляют собой мембраносвязанные прокариотические ферменты, действующие в качестве биокатализаторов реакции циклизации линейного тритерпеноида, представляющего собой сквален, с образованием гопена и гопанола. Ранние работы по SHC были сосредоточены на характеризации SHC термофильной и ацидофильной бактерии Alicyclobacillus acidocaldarius (ранее Bacillus acidocaldarius) (см. Neumann & Simon 1986, Biol Chem Hoppe-Seyler 367, 723-729; Seckler & Poralla 1986, Biochem Biophys Act 356-363 и Ochs et al 1990, J Bacteriol 174, 298-302). Однако позднее другие SHC были очищены из Zymomonas mobilis и Bradyrhizobium japonicum и охарактеризованы в отношении их природных (например, сквалена) и неприродных субстратов (например, гомофарнезола и цитраля) (см., например, WO 2010/139710, WO 2012/066059 и Seitz et al 2012, J. Molecular Catalysis B: Enzymatic 84, 72-77).
В более ранней работе авторов Neumann и Simon (1986 цитируется выше) раскрыто, что гомофарнезол является дополнительным субстратом для SHC Alicyclobacillus acidocaldarius (AacSHC). Однако, согласно публикациям, доля циклизации неприродного гомофарнезола очищенным AacSHC, как сообщили Neumann и Simon (1986), составляла лишь 3% от доли циклизации природного субстрата сквалена. Доля образования амброксида (продукт 2b) увеличивалась с повышением концентрации гомофарнезола (продукт 1b) с 0,25 мМ до 2,0 мМ и несколько уменьшалась в присутствии 4 мМ продукта 1b. Это различие в долях циклизации может отчасти объясняться тем, что природный субстрат SHC сквален в два раза превышает по размеру (С30-углеродное соединение) неприродный гомофарнезол, который представляет собой С16-углеродное соединение.
В (JP 2009060799 Као) также раскрыт способ получения амброксида из гомофарнезола с использованием SHC из A. acidocadarius. В то время как в JP 2009060799 сообщается о возможности использования микроорганизмов, содержащих SHC, для синтеза амброксида, в JP 2009060799 раскрыто получение амброксида из гомофарнезола только с использованием жидкого экстракта SHC. приготовленного из рекомбинантного микроорганизма, экспрессирующего ген SHC, но не с помощью целых клеток рекомбинантных микроорганизмов, экспрессирующих ген SHC. Процентная доля конверсии гомофарнезола в амброксид с использованием жидкого экстракта SHC была указана как 17,5% при проведении реакции при температуре 60°С в течение 14 часов при рН 5,2-6,0, но лишь 6,8% при проведении реакции при рН 6,6. Сообщалось, что процентная доля конверсии 3Е,7Е-гомофарнезола в амброксид с использованием жидкого экстракта SHC при 60°С при рН 5,6 в течение 64 часов составляет 63% при использовании концентрации субстрата гомофарнезола 0,2% (2 г/л).
В WO 2010/139719 А2 и ее эквивалентной заявке на патент США (US 2012/0135477 A1) описаны по меньшей мере три экстракта фермента SHC, обладающих активностью циклазы гомофарнезола до амброксида. Сообщается, что доли конверсии гомофарнезола ферментами SHC Zymomonas mobilis (Zmo) и SHC Bradyrhizobium japonicum (Bjp) составляли 41% при 16 ч реакции и 22% при использовании концентрации гомофарнезола 10 мМ (2,36 г/л), соответственно, при этом доля конверсии ферментом AacSHC согласно сообщениям составляла лишь 1,2% (предположительно при той же концентрации гомофарнезола), однако подробное описание эксперимента не приведено. Экстракты ферментов ZmoSHC и BjpSHC были приготовлены из рекомбинантного микроорганизма, экспрессирующего ген SHC, путем разрушения клеток-хозяев Е. coli, продуцирующих ферменты SHC, и отделения растворимых фракций SHC.
В публикации Seitz и соавт. (2012 цитируется выше) описана функциональная экспрессия и биохимическая характеризация трех ферментов SHC: двух из Z. mobilis (ZmoSHC1 и ZmoSHC2) и одного из A. acidocaldarius. Согласно публикации, «эффективную» конверсию (22,95%) гомофарнезола в амброксид наблюдали при использовании ZmoSHC1 дикого типа, при этом при использовании WT ZmoSHC2 конверсия гомофарнезола в амброксид не происходила, а при использовании AacSHC была обнаружена относительно низкая конверсия (3,4%) гомофарнезола в амброксид при использовании концентрации гомофарнезола 10 мМ (2,36 г/л). Склонность к относительно низкой конверсии гомофарнезола в амброксид, наблюдаемая для AacSHC, согласовывалась с результатами, полученными авторами Neumann и Simon (1986 цитируется выше) и обсуждаемыми в WO 2010/139719 А2, что также обсуждается выше. Три фермента SHC использовали в формате клеточной суспензии (посредством частичного разрушения клеток-хозяев Е. coli с использованием циклов замораживания и оттаивания) и в виде частично очищенных мембраносвязанных фракций.
В WO 2012/066059 раскрыты мутанты с циклазной активностью и их применение в способе биокаталитической конверсии терпенов, например, в частности, для получения изопулегола путем реакции циклизации цитронеллаля; в способе получения ментола и в способах биокаталитической конверсии других соединений со структурными мотивами терпенового типа. При выравнивании последовательностей различных SHC идентифицировано, что фенилаланин-486 (F486) является сильно консервативным аминокислотным остатком, и создана серия вариантов замен в ферменте SHC Zymomonas mobilis. Некоторые из этих замен приводили к утрате активности, тогда как другие приводили в результате к образованию нового терпеноидного продукта (изопулеголов) из терпеновых субстратов, таких как цитронеллаль.
В диссертации на соискание степени PhD Seitz (http://elib.uni-stuttgart.de/handle/11682/1400) в 2012 г. указано, что мутация F486Y в ZmoSHCl обеспечила снижение показателя биотрансформации гомофарнезола приблизительно в 1,5 раза, с 34,8% (WT ZmoSHCl) до 23,9% (мутантный ZmoSHCl F486Y). При тестировании мутантного эквивалента (Y420C) в AacSHC полагали, что ферментативная активность по отношению к субстратам большего размера будет снижаться, а активность, направленная на субстраты большего размера, будет повышаться. При тестировании этого мутанта в таких же условиях, как и дикого типа, и сравнении их ферментативной активности обнаружили, что мутант вообще не осуществлял какую-либо конверсию субстрата гомофарнезола. Таким образом, был сделан вывод о том, что аминокислотный остаток Y420 является критическим для активности AacSHC по отношению ко всем субстратам.
Другие исследования сайт-направленного мутагенеза SHC в данной области техники (например, Hoshino and Sato 2002, Chem Commun 291-301) были сосредоточены на действии мутаций в высоко консервативных участках (например, F601), и в большей степени на их действии на природные субстраты (т.е. на сквален или аналоги сквалена), чем на неприродные субстраты, такие как гомофарнезол.
Подводя итог вышесказанному, ограниченные сведения из уровня техники, относящиеся к способам биоконверсии для успешной конверсии гомофарнезола в амброксид, относятся только к относительно низким концентрациям/объемам субстрата гомофарнезола (в диапазоне концентраций от 0,25 мМ до 2 мМ до 10 мМ или около 0,06 г/л - 2,36 г/л) с использованием полипептида SHC дикого типа с активностью гомофарнезол-амброксид-циклазы (НАС). Источниками ферментов SHC с активностью НАС были либо: (i) жидкие экстракты, полученные путем разрушения клеток-хозяев Е. coli, содержащих ферменты SHC, и отделения нерастворимой фракции от растворимой жидкой фракции SHC; либо (ii) частично очищенные мембранные фракции; либо (iii) рекомбинантные целые клетки, экспрессирующие ген WT SHC и продуцирующие фермент SHC, для применения в реакциях биоконверсии гомофарнезола в амброксид с использованием солюбилизирующих агентов, включающих либо: (i) Тритон Х-100 в реакционной смеси (см. Neumann и Simon, 1986, цитируемый выше Seitz et al 2012, цитируемый выше JP2009060799); либо (ii) тауродезоксихолат (как описано в US 2012/0135477 A1).
При использовании этих экстрактов WT SHC и/или целых рекомбинантных клеток микроорганизмов, экспрессирующих ген SHC, было обнаружено, что получаемые доли конверсии изменяются в зависимости от источника фермента SHC, количества исходного вещества гомофарнезола и используемых реакционных условий. При использовании фермента SHC дикого типа 100% конверсия гомофарнезола в амброксид при указанных задействованных концентрациях (0,06-2,36 г/л) до сих пор не достигнута. Кроме того, в предварительных исследованиях с использованием производных SHC, полученных путем сайт-направленного мутагенеза, были только получены скорее отрицательные (т.е. сниженные доли конверсии гомофарнезола), чем положительные (т.е. улучшенные доли конверсии) результаты. Кроме того, в опубликованных исследованиях использовали только очищенные экстракты фермента SHC, или мембраносвязанные фракции фермента SHC, или целые рекомбинантные клетки микроорганизмов, экспрессирующих ген WT SHC в определенных реакционных условиях, при которых используются солюбилизирующие агенты, такие как Тритон X-100 или тауродезоксихолат. До сих пор не продемонстрировано, что рекомбинантный микроорганизм, содержащим либо WT, либо мутантный SHC, может обеспечить более эффективную и экономически результативную биоконверсию гомофарнезола в амброксид при использовании оптимизированных реакционных условий. Соответственно, желательно усовершенствовать цитируемые выше известные способы получения амброксида из гомофарнезола за счет по меньшей мере улучшения скорости, специфичности, выхода, производительности реакции и снижения затрат (за счет, например, упрощения способа при использовании либо рекомбинантных целых клеток микроорганизмов или при осуществлении метода «реакции, протекающей в одном реакционном сосуде», объединяющего стадии биокаталитического получения и биоконверсии).
КРАТКОЕ ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ
В различных аспектах настоящего изобретения предложены производные SHC/HAC, аминокислотные последовательности, составляющие производные фермента SHC/HAC, нуклеотидные последовательности, кодирующие производные фермента SHC/HAC, рекомбинантные клетки-хозяева, содержащие векторы с нуклеотидными последовательностями, кодирующими производные фермента SHC/HAC и применение рекомбинантных клеток-хозяев, содержащих либо производные фермента SHC/HAC, либо WT SHC/HAC, используемые в определенных реакционных условиях, в способах получения материалов амброксида, которые содержат изомер амброксида, обозначаемый как (-)-амброксид, и подобные амброксиду молекулы (в качестве побочных продуктов). В отличие от сведений предшествующего уровня техники, относящихся к AacSHC, автор изобретения впервые продемонстрировал, что цельно клеточный рекомбинантный микроорганизм, экспрессирующий ген производного SHC, можно использовать для биоконверсии гомофарнезола в амброксид. Кроме того, цельноклеточный рекомбинантный микроорганизм, экспрессирующий ген WT SHC и/или продуцирующий ферменты SHC, можно использовать для биоконверсии гомофарнезола в амброксид в определенных реакционных условиях, не раскрытых в предшествующем уровне техники.
Также было неожиданно обнаружено, что включение в аминокислотную последовательность эталонной последовательности WT SHC дикого типа вплоть до пяти аминокислотных изменений, раскрытых в настоящем описании, приводит к получению производных фермента SHC/HAC, которые обладают значительно лучшей долей конверсии гомофарнезола в амброксид по сравнению с немодифицированными эталонными ферментами SHC/HAC, как раскрыто в настоящем описании. Эти новые производные ферментов SHC/HAC полезны сами по себе и в комбинации для получения материалов амброксида, в частности (-)-амброксида, из субстратов гомофарнезола.
Дополнительное неожиданное открытие состоит в том, что, кроме одного мутанта (F601Y), производные фермента SHC, раскрытые в настоящем описании, как правило, содержат неконсервативные замены в положениях аминокислот в неконсервативном участке эталонной полипептидной последовательности SHC. Это открытие является неожиданным, поскольку изменения в консервативной области фермента более вероятно нарушают функцию фермента (по меньшей мере в отношении его природного субстрата), чем изменения в неконсервативной области белка.
Следующее неожиданное открытие состоит в том, что охарактеризованные производные ферменты SHC по настоящему изобретению оптимальнее работают (на неприродном субстрате, таком как гомофарнезол) при температуре около 35°С, чем при температуре около 60°С, которая является обычной реакционной температурой для термофильных микроорганизмов, таких как AacSHC. Применение производных SHC по настоящему изобретению в способах получения амброксида из гомофарнезола при пониженных реакционных температурах обладает значимыми экономическими преимуществами для цикла получения амброксида в промышленном масштабе.
Другое преимущество настоящего изобретения состоит в том, что производные фермента SHC по настоящему изобретению катализируют эффективный процесс биоконверсии, который при оптимизации с относительно высокой (например, около 50-кратной) концентрацией субстрата гомофарнезола по сравнению с концентрациями, ранее описанными в предшествующем уровне техники (например, ЕЕН при 125 г/л) может приводить к 100% конверсии субстрата гомофарнезола, тогда как эталонный белок WT SHC конвертирует только приблизительно 10% того же субстрата даже при высокой концентрации фермента/клеток. Цитированные документы предшествующего уровня техники относятся к применению очищенных мембранных экстрактов, содержащих SHC, или очищенных экстрактов SHC (полученных из микроорганизмов, экспрессирующих гены SHC), или к применению рекомбинантного микроорганизма, экспрессирующего ген WT SHC, в определенных реакционных условиях биоконверсии (например, с использованием определенных солюбилизирующих агентов). Но и теперь нигде не описана 100% конверсия гомофарнезола при значительно более низкой концентрации ЕЕН. Также нигде не описана «реакция, протекающая в одном реакционном сосуде», где на первой стадии рекомбинантные клетки растут и продуцируют фермент SHC и впоследствии конвертируют ЕЕН в (-)-амброксид в одном и том же реакторе. Дополнительное преимущество настоящего изобретения состоит в том, что, рекомбинантные клетки-хозяева, продуцирующие производные фермента SHC, демонстрируют высокие начальные скорости реакции, что позволяет получить большое количество продукта за относительно короткий период времени при использовании лишь относительно небольших количеств биокатализатора. Вкратце, отбор и эффективная экспрессия и применение рекомбинантных микроорганизмов, содержащих либо фермент WT SHC/HAC, либо определенные производные фермента SHC/HAC, в определенных реакционных условиях биоконверсии приводит к более эффективному процессу биоконверсии. Конечный продукт ((-)-амбр оксид) можно отделить и легко очистить. В отличие от цитируемых сведений из предшествующего уровня техники, производные фермента SHC/HAC применяют не в виде чистого фермента, а в цельноклеточном контексте (в качестве биокатализатора), что представляет собой более экономически эффективный, более удобный для использования и благоприятный для окружающей среды подход, поскольку он не требует дополнительных стадий очистки и выделения фермента.
Подводя итог, в настоящем изобретении предложен способ биоконверсии/биотрансформации для получения амброксида в рекомбинантном штамме микроорганизма, который (i) привлекателен с экономической точки зрения, (ii) благоприятен для окружающей среды и (iii) приводит к селективному получению (-)-амброксида в качестве преобладающего соединения, которое в селективных условиях кристаллизации эффективно отделяется от других побочных продуктов, не вносящих вклад в ольфакторное качество конечного продукта.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Используемый в настоящем описании термин «SHC» означает фермент сквален-гопен-циклазу из любого источника из перечисленных в таблицах 10-12. В предпочтительных воплощениях изобретения термин «SHC» включает в себя ферменты SHC из Zymomonas mobilis и ферменты SHC из Alicyclobacillus acidocaldarius, как раскрыто в заявке на патент компании BASF WO 2010/139719, заявке на патент США US 2012/01345477 A1, публикациях Seitz et al (2012, цитируется выше) и Seitz (2012, диссертация PhD, цитируется выше). Для простоты ссылки в настоящем описании используют обозначение «AacSHC» для SHC из Alicyclobacillus acidocaldarius, обозначение «ZmoSHC» для SHC из Zymomonas mobilis и обозначение «BjpSHC» для SHC из Bradyrhizobium japonicum. Процентное значение идентичности этих последовательностей относительно последовательности WT AacSHC и друг друга (которое может изменяться в зависимости от используемого алгоритма) приведено в таблицах 18 и 19.
Выравнивание последовательностей WT SHC, полученное Hoshino и Sato (2002, цитируется выше), указывает на то, что во всех четырех последовательностях было обнаружено множество мотивов, состоящих из коровой последовательности Gln-X-X-X-G1y-X-Trp, которая обнаружена шесть раз в последовательностях SHC обоих микроорганизмов, Z. mobilis и A. acidocaldarius (см. Фиг. 3 публикации Reipen et al 1995, Microbiology 141, 155-161). В Hoshino и Sato (2002, цитируется выше) сообщается, что ароматические аминокислоты с необычно высокой частотой встречаются в SHC, и в SHC было отмечено два характеристических мотива: один из которых представляет собой мотив QW, представленный специфическими аминокислотными мотивами [(K/R)(G/A)X2-3(F/Y/W)(L/IV)3X3QX2-5GXW], и альтернативный мотив, представляющий собой DXDDTA. В Wendt et al (1997, Science 277, 1811-1815 and 1999, J Mol Biol 286, 175-187) описан рентгеноструктурный анализ SHC из A. acidocaldarius. Мотив DXDDTA, по-видимому, соответствует активному центру SHC. Выравнивание иллюстративных последовательностей из предшествующего уровня техники демонстрирует множественные повторяющиеся мотивы, как показано на Фиг. 2 (из публикации Hoshino и Sato (2002, цитируется выше)) и на Фиг. 3 (из диссертации Seitz PhD (2012)) в настоящем описании.
Используемый в настоящем описании эталонный (или дикого типа) белок AacSHC относится к белку AacSHC, как изложено в SEQ ID NO: 1. Эталонный фермент AacSHC согласно настоящему описанию обладает активностью гомофарнезол-амброксид-циклазы (НАС), полезной при получении производных амброксида посредством биокаталитического взаимодействия SHC с субстратом гомофарнезолом. Основная реакция эталонного AacSHC состоит в циклизации линейного или нелинейного субстрата, такого как гомофарнезол, с получением амброксида.
Амброксид
При использовании в настоящем описании термин амброксид включает в себя (-)-амброксид формулы (I) либо в стереоизомерно чистой форме, либо в смеси с по меньшей мере одной или более чем одной из следующих молекул формулы (II), (IV) и/или (III).
(-)-Амброксид известен под торговыми наименованиями Ambrox (Firmenich), Ambroxan (Henkel), Ambrofix (Givaudan), Amberlyn (Quest), Cetalox Laevo (Firmenich), Ambermor (Aromor) и/или Norambrenolide Ether (Pacific).
(-)-Амброксид представляет собой промышленно значимое ароматизирующее соединение и длительное время используется в производстве ароматизирующих веществ. Особые желаемые сенсорные преимущества (-)-амброксида происходят от (-)-стереоизомера скорее, чем от (+)-стереоизомера. Запах (-)-стереоизомера описывают как подобный мускусному, древесному, теплому или янтарному, тогда как энантиомер (+)-амброксид имеет относительно слабую ароматную ноту. Запах и пороги восприятия запаха для продуктов, подобных амброксиду, также различаются. Хотя в продаже имеются различные материалы, обогащенные
(-)-амброксидом, желательно получить высоко обогащенные (-)-амброксидом материалы, в идеале - чистый (-)-амбр оксид.
Получение (-)-амброксида
(-)-Амброксид может быть получен из склареолида в соответствии с описанным ниже способом получения. Склареол представляет собой продукт, экстрагируемый из природного растения шалфея мускатного. Однако, поскольку в этом процессе используется натуральный исходное вещество, существующие потенциальные проблемы заключаются в том, что в нем задействована многостадийная реакция, которая является непрямой, количество и стабильность подачи исходного вещества может не всегда быть удовлетворительной, и реакция может быть неблагоприятной для окружающей среды в связи с использованием на стадии окислительного разложения (+)-склареола окисляющего агента, такого как хромовая кислота или перманганат.
(-)-Амброксид также синтезируют из гомофарнезола, используя различные пути. В качестве примера гомофарнезол может быть получен путем бромирования, цианирования и гидролиза неролидола с получением гомофарнезиловой кислоты с последующим восстановлением. Альтернативно, гомофарнезол может быть получен из фарнезола, фарнезил хлорид а, бета-фарнезена или других субстратов. Бета-фарнезен может быть конвертирован непосредственно в E,E-гомофарнезол (ЕЕН) или опосредованно в ЕЕН через E,E-гомофарнезат, который впоследствии конвертируют в ЕЕН. Обзор по получению (-)-амброксида из различных субстратов можно найти в US 2012/0135477 A1, WO 2010/139719, US 2013/0273619 A1, WO 2013/156398 А1, диссертации PhD Seitz (2012, цитируется выше) и в публикации Schaefer 2011 (Chemie Unserer Zeit 45, 374-388).
Хотя гомофарнезол может присутствовать в виде смеси четырех изомеров, (3Z,7Z), (3E,7Z), (3Z,7E) и (3Е,7Е) изомеров, исходя из литературы кажется, что (-)-амброксид получается только из (3Е,7Е) гомофарнезола (см. Neumann и Simon (1986), цитируется выше). Используемая в настоящем описании ссылка на (3Е,7Е)-гомофарнезол представляет собой ссылку на E,E-гомофарнезол, который также обозначается как ЕЕН.
В US 2012/0135477 A1 описана конверсия (3Z,7E) в (-)-амброксид с использованием ZmoSHC (SEQ ID NO: 2) (см. примеры 2-4), однако согласно публикации Schaefer (2011) (цитируется выше), (7Е, 3Z) конвертируется только в 9b-эпи-амброксид (т.е. соединение III), как описано выше, но не конвертируется в (-)-амброксид. Используемая в настоящем описании ссылка на (3Е,7Е)-гомофарнезол представляет собой ссылку на Е,Z-гомофарнезол, который также обозначен как EZH.
В некоторых воплощениях изобретения гомофарнезол предпочтительно содержит смесь (3Е,7Е) и (3Z,7E), обозначаемую в настоящем описании как стереоизомерная смесь EE:EZ (в частности, при ссылки на примеры и таблицу 20).
Стереоизомерная смесь EE:EZ гомофарнезола имеет номер по химическому реферативному журналу (Chemical Abstracts, CAS) 35826-67-6.
Как показано в примерах (например, см. примеры 5, 7, 9, 10, 11, 18, 19 и 20), в некоторых воплощениях изобретения исходное сырье/исходный вещество гомофарнезола представляет собой смесь изомеров.
Соответственно, в некоторых воплощениях изобретения исходное вещество гомофарнезола может также содержать смесь четырех изомеров EE:EZ:ZZ:ZE, которая соответствует (3Е,7Е) и (3Z,7E), (3Z,7Z и 3E,7Z).
В некоторых воплощениях изобретения исходное вещество гомофарнезола предпочтительно выбрано из одной или более из следующих групп: [(3Z,7Z), (3E,7Z), (3Z,7E) и (3Е,7Е)], [(3Z,7E) и (3Е,7Е)], [(3Z,7E), (3E,7Z)] и/или [(3Е,7Е) и (3E,7Z)].
Предпочтительно исходное вещество гомофарнезола выбрано из одной или более из следующих групп: [(3Е,7Е), (3Z,7E)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)].
Соответственно, в некоторых воплощениях изобретения соотношение EEH:EZH составляет приблизительно 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29; 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39; 60:40; 59:41; 58:42; 57:43; 56:44; 55:45; 54:46; 53:47; 52:48; 51:49; или приблизительно 50:50.
В некоторых воплощениях изобретения исходное вещество гомофарнезола предпочтительно содержит >90% E,E-гомофарнезола (ЕЕН).
В других воплощениях изобретения исходное вещество гомофарнезола содержит EE:EZ в массовом соотношении 86:14.
В некоторых воплощениях изобретения исходное вещество гомофарнезола содержит EE:EZ в массовом соотношении 80:20.
В некоторых воплощениях изобретения исходное вещество гомофарнезола содержит EE:EZ в массовом соотношении 70:30.
В следующих воплощениях изобретения исходное вещество гомофарнезола содержит EE:EZ в массовом соотношении 69:31.
В некоторых воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из смеси четырех изомеров EE:EZ:ZZ:ZE, которая соответствует (3Е,7Е) и (3Z,7E), (3Z,7Z) и (3E,7Z).
В некоторых воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из смеси изомеров, выбранных из одной или более из следующих групп: [(3Z,7Z), (3E,7Z), (3Z,7E) и (3Е,7Е)], [(3Z,7E) и (3Е,7Е)], [(3Z,7E), (3E,7Z)] и/или [(3Е,7Е) и (3E,7Z)].
Предпочтительно исходное вещество гомофарнезола состоит или по существу состоит из смеси изомеров, выбранных из одной или более из следующих групп: [(3Е,7Е), (3Z,7E)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)].
Соответственно, в некоторых воплощениях изобретения соотношение изомеров EEH:EZH состоит или по существу состоит из соотношения EEH:EZH приблизительно 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29; 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39; 60:40; 59:41; 58:42; 57:43; 56:44; 55:45; 54:46; 53:47; 52:48; 51:49; или приблизительно 50:50.
В некоторых воплощениях изобретения исходное вещество гомофарнезола предпочтительно состоит или по существу состоит из >90% Е,Е-гомофарнезола (ЕЕН).
В других воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из EE:EZ в массовом соотношении 86:14.
В некоторых воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из EE:EZ в массовом соотношении 80:20.
В некоторых воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из EE:EZ в массовом соотношении 70:30.
В следующих воплощениях изобретения исходное вещество гомофарнезола состоит или по существу состоит из EE:EZ в массовом соотношении 69:31.
В воплощениях настоящего изобретения амброксид получают с использованием производного фермента SHC/HAC.
Производное SHC/HAC
Используемый в настоящем описании термин «производное SHC/НАС» означает, что аминокислотная последовательность производного SHC/HAC представляет собой модифицированную аминокислотную последовательность или ее вариант, измененные по сравнению с аминокислотной последовательностью эталонной (или дикого типа) последовательности SHC, которая соответствует по меньшей мере SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4. Как правило, производные SHC/HAC содержат измененные формы SHC, имеющие по меньшей мере одно изменение, которое модифицирует (например, увеличивает) активность фермента по отношению к его субстрату (например, ЕЕН).
Производные SHC/HAC по настоящему изобретению тестируют на их активность гомофарнезол-амброксид-циклазы. Следовательно, эти производные SHC/HAC, которые конвертируют гомофарнезол в амброксид, в настоящем описании называют как производными НАС, так и производные SHC. Хотя в качестве примеров производных SHC/HAC были предложены ферменты, имеющие происхождение из источников, представляющих собой штаммы микроорганизмов Alicyclobacillus acidocaldarius, Zymomonas mobilis, Bradyrhizobium japonicum, настоящее изобретение также охватывает эквивалентные производные SHC/HAC из источников, представляющих собой другие штаммы микроорганизмов, включающих в себя, без ограничений, ферменты SHC/HAC из Methylococcus capsulatus, Frankia alni, Acetobacter pasteurianum и Tetrahymena pyriformis (см., например, WO 2010/139719, US 2012/01345477, WO 2012/066059 и таблицы 10-12).
Используемый в настоящем описании термин «изменение аминокислоты» означает инсерцию одной или более чем одной аминокислоты между двумя аминокислотами, делецию одной или более чем одной аминокислоты или замену (которая может быть консервативной или неконсервативной) одной или более чем одной аминокислоты на одну или более чем одну из других аминокислот относительно аминокислотной последовательности эталонной аминокислотной последовательности (такой как, например, аминокислотная последовательность дикого типа (WT) SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4). Изменения аминокислот могут быть легко идентифицированы путем сравнения аминокислотных последовательностей производного SHC/HAC и эталонной аминокислотной последовательности (такой как, например, аминокислотная последовательность дикого типа (WT) SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4). Примеры выравнивания аминокислотной последовательности WT SHC приведены на Фиг. 14 и в таблицах 18 и 19.
Консервативные аминокислотные замены могут быть выполнены, например, на основании подобия полярности, заряда, размера, растворимости, гидрофобности, гидрофильности и/или амфипатической природы задействованных аминокислотных остатков. 20 встречающихся в природе аминокислот, как описано выше, могут быть сгруппированы в шесть следующих стандартных групп аминокислот:
(1) гидрофобные: Met, Ala, Val, Leu, Ile;
(2) нейтральные гидрофильные: Cys, Ser, Thr; Asn, Gln;
(3) кислые: Asp, Glu;
(4) основные: His, Lys, Arg;
(5) остатки, влияющие на ориентацию цепи: Gly, Pro; и
(6) ароматические: Trp, Tyr, Phe.
Соответственно, используемый в настоящем описании термин «консервативные замены» означают замену аминокислоты на другую аминокислоту, включенную в перечень в пределах той же группы из шести стандартных групп аминокислот, представленных выше. Например, в модифицированном таким путем полипептиде замена Asp на Glu сохраняет один отрицательный заряд. Кроме того, глицин и пролин могут быть заменены друг на друга за счет их способности к прерыванию альфа-спиралей. Некоторые предпочтительные консервативные замены в пределах описанных выше шести групп представляют собой обмены внутри следующих подгрупп: (i) Ala, Val, Leu и Ile; (ii) Ser и Thr; (ii) Asn и Gln; (iv) Lys и Arg; и (v) Tyr и Phe. С учетом известного генетического кода и методов рекомбинантных ДНК и синтеза ДНК ученый-специалист сможет легко сконструировать ДНК, кодирующие консервативные варианты аминокислот.
Используемый в настоящем описании термин «неконсервативные замены» или «обмены неконсервативных аминокислот» определяют как обмены аминокислоты с другой аминокислотой, включенной в перечень другой группы из шести стандартных групп аминокислот (1)-(6), представленных выше. Как правило, производные SHC/HAC по настоящему изобретению получают с использованием неконсервативных замен, изменяющих биологическую функцию (например, активность НАС) раскрытых производных SHC/HAC.
Для простоты ссылки ниже указаны однобуквенные символы аминокислот, рекомендованные Комиссией по биохимической номенклатуре IUPAC-IUB. В целях ссылки также приведены трехбуквенные коды.
Изменения аминокислот, такие как аминокислотные замены, можно вводить, используя известные протоколы технологии рекомбинантных генов, включающие полимеразную цепную реакцию (ПЦР), клонирование генов, сайт-направленный мутагенез кДНК, трансфекция клеток-хозяев и транскрипция in-vitro, которые можно использовать для введения таких изменений в последовательность WT SHC с получением в результате производного фермента SHC/HAC. Впоследствии эти производные можно подвергать скринингу на функциональную активность SHC/HAC.
Производные фермента SHC/HAC
В настоящем изобретении предложено производное SHC/HAC и описан фермент, обладающий активностью гомофарнезол-амброксид-циклазы (НАС) и содержащий аминокислотную последовательность, которая имеет от 1 до приблизительно 50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно аминокислотной последовательности эталонной (или дикого типа) последовательности SHC в соответствии с по меньшей мере одной из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4.
В различных воплощениях изобретения мутация или комбинация мутаций усиливает активность производного SHC/HAC для конвертирования гомофарнезола в амброксид в сравнении с эталонными ферментами SHC, которые не демонстрируют эту делецию/добавление. Для направленного получения таких замен, делеций или инсерций в эталонной последовательности SHC можно использовать описанное в настоящем описании моделирование белков. Например, можно создать структурную модель аминокислотной последовательности SHC с использованием координат для AacSHC (как показано, например, на Фиг.19 и 20). Как продемонстрировано в настоящем описании, такая модель гомологии полезна для направленного усовершенствования конвертирования гомофарнезола в (-)-амброксид ферментами SHC.
Таким образом, в различных воплощениях изобретения производное SHC/HAC может иметь от приблизительно 1 до приблизительно 45 мутаций, от приблизительно 1 до приблизительно 40 мутаций, от приблизительно 1 до приблизительно 35 мутаций, от приблизительно 1 до приблизительно 30 мутаций, от приблизительно 1 до приблизительно 25 мутаций, от приблизительно 1 до приблизительно 20 мутаций, от приблизительно 1 до приблизительно 15 мутаций, от приблизительно 1 до приблизительно 10 мутаций или от приблизительно 1 до приблизительно 5 мутаций относительно аминокислотной последовательности эталонной (или дикого типа) последовательности SHC в соответствии с по меньшей мере одной из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4.
В различных воплощениях изобретения производное SHC/HAC содержит последовательность, имеющую по меньшей мере 5 или по меньшей мере 10 мутаций относительно аминокислотной последовательности эталонной (или дикого типа) последовательности SHC в соответствии с по меньшей мере одной из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, но не более 20 или 30 мутаций. В различных воплощениях изобретения производное SHC может иметь приблизительно 1 мутацию, приблизительно 2 мутации, приблизительно 3 мутации, приблизительно 4 мутации, приблизительно 5 мутаций, приблизительно 6 мутаций, приблизительно 7 мутаций, приблизительно 8 мутаций, приблизительно 9 мутаций, приблизительно 10 мутаций, приблизительно 11 мутаций, приблизительно 12 мутаций, приблизительно 13 мутаций, приблизительно 14 мутаций, приблизительно 15 мутаций, приблизительно 16 мутаций, приблизительно 17 мутаций, приблизительно 18 мутаций, приблизительно 19 мутаций, приблизительно 20 мутаций, приблизительно 21 мутацию, приблизительно 22 мутации, приблизительно 23 мутации, приблизительно 24 мутации, приблизительно 25 мутаций, приблизительно 26 мутаций, приблизительно 27 мутаций, приблизительно 28 мутаций, приблизительно 29 мутаций, приблизительно 30 мутаций, приблизительно 31 мутацию, приблизительно 32 мутации, приблизительно 33 мутации, приблизительно 34 мутации, приблизительно 35 мутаций, приблизительно 36 мутаций, приблизительно 37 мутаций, приблизительно 38 мутаций, приблизительно 39 мутаций, приблизительно 40 мутаций, приблизительно 41 мутацию, приблизительно 42 мутации, приблизительно 43 мутации, приблизительно 44 мутации, приблизительно 45 мутаций, приблизительно 46 мутаций, приблизительно 47 мутаций, приблизительно 48 мутаций, приблизительно 49 мутаций или приблизительно 50 мутаций относительно эталонного SHC (такого как, например, SEQ ID NO: 1, или 2, или 3, или 4.
В этих или в других воплощениях изобретения производное SHC/HAC может содержать аминокислотную последовательность, обладающую по меньшей мере приблизительно 50% идентичностью последовательности, по меньшей мере приблизительно 55% идентичностью последовательности, по меньшей мере приблизительно 60% идентичностью последовательности, по меньшей мере приблизительно 65% идентичностью последовательности, по меньшей мере приблизительно 70% идентичностью последовательности, по меньшей мере приблизительно 75% идентичностью последовательности, по меньшей мере приблизительно 80% идентичностью последовательности, по меньшей мере приблизительно 85% идентичностью последовательности, по меньшей мере приблизительно 90% идентичностью последовательности, по меньшей мере приблизительно 91% идентичностью последовательности, по меньшей мере приблизительно 92% идентичностью последовательности, по меньшей мере приблизительно 93% идентичностью последовательности, по меньшей мере приблизительно 94% идентичностью последовательности, по меньшей мере приблизительно 95% идентичностью последовательности, по меньшей мере приблизительно 96% идентичностью последовательности, по меньшей мере приблизительно 97% идентичностью последовательности, по меньшей мере приблизительно 98% идентичностью последовательности или по меньшей мере приблизительно 99% идентичностью последовательности WT SHC (такой как, например, SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4) или между эталонными последовательностями (см., например, таблицы 18 и 19, где показана идентичность 34-52% между AacSHC (SEQ ID NO: 1) и другими последовательностями SHC (например, ZmoSHC по WO 2010/139719).
В различных воплощениях изобретения вариант SHC обладает более высокой активностью конвертирования гомофарнезола в амброксид, чем фермент дикого типа, например более высокой продуктивностью в отношении (-)-амброксида при приведении в контакт с субстратом гомофарнезолом по сравнению с эталонным ферментом дикого типа (таким как, например, SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4).
Например, производное SHC/HAC может содержать аминокислотную последовательность, обладающую по меньшей мере: приблизительно 50% идентичностью, приблизительно 51% идентичностью, приблизительно 52% идентичностью, приблизительно 53% идентичностью, приблизительно 54% идентичностью, приблизительно 55% идентичностью, приблизительно 56% идентичностью, приблизительно 57% идентичностью, приблизительно 58% идентичностью, приблизительно 59% идентичностью, приблизительно 60% идентичностью, приблизительно 61% идентичностью, приблизительно 62% идентичностью, приблизительно 63% идентичностью, приблизительно 64% идентичностью, приблизительно 65% идентичностью, приблизительно 66% идентичностью, приблизительно 67% идентичностью, приблизительно 69% идентичностью, приблизительно 70% идентичностью, приблизительно 71% идентичностью, приблизительно 72% идентичностью, приблизительно 73% идентичностью, приблизительно 74% идентичностью, приблизительно 75% идентичностью, приблизительно 76% идентичностью, приблизительно 77% идентичностью, приблизительно 78% идентичностью, приблизительно 79% идентичностью, приблизительно 80% идентичностью, приблизительно 81% идентичностью, приблизительно 82% идентичностью, приблизительно 83% идентичностью, приблизительно 84% идентичностью, приблизительно 85% идентичностью, приблизительно 86% идентичностью, приблизительно 87% идентичностью, приблизительно 88% идентичностью, приблизительно 89% идентичностью, приблизительно 90% идентичностью, приблизительно 91% идентичностью, приблизительно 92% идентичностью, приблизительно 93% идентичностью, приблизительно 94% идентичностью, приблизительно 95% идентичностью, приблизительно 96% идентичностью, приблизительно 97% идентичностью, приблизительно 98% идентичностью или приблизительно 99% идентичностью последовательности эталонного SHC (такого как, например, SEQ ID NO: 1, или 2, или 3, или 4) или между эталонными последовательностями (см., например, таблицы 18 и 19, где показана идентичность 34-52% между AacSHC (SEQ ID NO: 1) и другими последовательностями SHC (например, ZmoSHC по WO 2010/139719).
Различные производные SHC/HAC, протестированные на активность фермента SHC, включены в перечень одной или более из таблиц 1-9. Таким образом, в различных воплощениях изобретения производное SHC/HAC может иметь по меньшей мере приблизительно 1, по меньшей мере приблизительно 2, по меньшей мере приблизительно 3, по меньшей мере приблизительно 4, по меньшей мере приблизительно 5, по меньшей мере приблизительно 6, по меньшей мере приблизительно 7, по меньшей мере приблизительно 8, по меньшей мере приблизительно 9 или по меньшей мере приблизительно 10 мутаций, выбранных из одной или более мутаций в таблицах 1-9. В некоторых воплощениях изобретения производное SHC/HAC представляет собой модифицированный полипептид SHC, содержащий аминокислотную последовательность, имеющую вплоть до 4 мутаций по сравнению с аминокислотной последовательностью дикого типа/эталонной аминокислотной последовательностью, соответствующей SEQ ID NO: 1, и содержит по меньшей мере замены F601Y или M132R в комбинации с по меньшей мере одной или более чем одной из замен F129L и/или I432T относительно SEQ ID NO: 1, а также необязательно содержит лидерную последовательность, поддерживающую экспрессию и активность в Е. coli.
В других воплощениях изобретения производное SHC/HAC представляет собой модифицированный полипептид SHC, содержащий аминокислотную последовательность, имеющую вплоть до 8 мутаций по сравнению с аминокислотной последовательностью дикого типа/эталонной аминокислотной последовательностью, соответствующей SEQ ID NO: 1 (или ее копией, модифицированной для экспрессии в Е. coli) и содержит одно или более изменений аминокислот, выбранных из группы, состоящей из положений 77, 92, 129, 132, 224, 432, 579, 601 и 605 относительно SEQ ID NO: 1, где производное SHC/HAC обладает модифицированной (например, повышенной) ферментативной активностью относительно SEQ ID NO: 1.
В одном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: Т77Х, I92X, F129X, М132Х, А224Х, I432X, Q579X, F601Y и F605W относительно SEQ ID NO: 1, где:
В Т77Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В I92X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F129X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R S, Т, V, W или Y.
В М132Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В А224Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R S, Т, V, W или Y.
В I432X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В Q579X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R S, Т, V, W или Y.
В F601X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F605X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В одном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: Т77А, 192V, F129L, M132R, A224V, I432T, Q579H, F601Y и F605W относительно SEQ ID NO: 1.
В другом воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: S129X, V145X, F182X, Y185X, G282X, I498X, Н646Х, и F698X относительно SEQ ID NO: 2, где:
В S129X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В V145X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F182X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В Y185X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В G282X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В I498X аминокислота X выбрана из: А, В, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В Н646Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F668X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F698X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В одном воплощении изобретения производное SHC содержит одну или более чем одну замен, выбранных из группы мутантов, состоящей из: S129A, V145V, F182L, Y185R, G282V, I498T, Н646Н, F668Y и F698X относительно SEQ ID NO: 2, как показано в таблице 2.
В дополнительном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: G85X, V100X, F137X, I140X, V233X, I450X, N598X, F620X и F624X относительно SEQ ID NO: 3, где:
В G85X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В V100X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F137X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R S, Т, V, W или Y.
В I140X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R S, Т, V, W или Y.
В V233X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В I450X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R S, Т, V, W или Y.
В N598X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F620X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R S, Т, V, W или Y.
В F624X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В одном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: G85A, V100V, F137L, I140R, V233V, I450T, N598H, F620Y и F624W относительно SEQ ID NO: 3, как показано в таблице 3 и в таблице 3а.
В дополнительном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: А88Х, V104X, F141X, Y144X, V241X, I459X, М607Х, F628X и F658X относительно SEQ ID NO: 4, где:
В А88Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В V104X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R S, Т, V, W или Y.
В F141X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В Y144X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В V241X аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В I459X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В М607Х аминокислота X выбрана из: А, С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F628X аминокислота X выбрана из: А С, D, Е, F, G, Н, I, K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В F658X аминокислота X выбрана из: А Q D, Е, F, G, Н, L K, L, М, N, Р, Q, R, S, Т, V, W или Y.
В дополнительном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы, состоящей из: А88А, V104V, F141L, Y144R, V241V, I459T, М607Н, F628Y и F658W относительно SEQ ID NO: 4, как показано в таблице 4.
Комбинации производных SHC
В одном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы мутантов, состоящей из: Т77А, F129L, M132R, I92V, A224V, I432T, Q579H и F601Y относительно SEQ ID NO: 1, как показано в таблице 5.
В одном воплощении изобретения производные SHC содержат одну или более чем одну замену, выбранную из группы мутантов, состоящей из: S129A, V145V, F182L, Y185R, G282V, I498T, Н646Н и F668Y относительно SEQ ID NO: 2, как показано в таблице 6.
В одном воплощении изобретения производные SHC содержат одну или более чем одну замену, выбранную из группы мутантов, состоящей из: G85A, V100V, F137L, I140R, V233V, I450T, N598H и F620Y относительно SEQ ID NO: 3, как показано в таблице 7.
В дополнительном воплощении изобретения производное SHC содержит одну или более чем одну замену, выбранную из группы, состоящей из: А88А, V104V, F141L, Y144R, V241V, I459T, М607Н, и F628Y относительно SEQ ID NO: 4, как показано в таблице 8.
В предпочтительном воплощении изобретения производное SHC содержит по меньшей мере замены F601Y или M132R в комбинации с по меньшей мере любой одной или более из F129L и/или I432T относительно SEQ ID NO: 1.
Производное SHC, обозначенное как SHC3, предложенное в настоящем изобретении, содержит следующую замену F601Y по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Hoshino и Sato (2002, цитируется выше) идентифицировали F601 как высококонсервативный аминокислотный остаток среди прокариотических и эукариотических биологических видов. Сообщали, что производное SHC F601Y характеризуется значительно повышенной Vmax для субстрата оксидосквалена (но не сквалена). Однако F601Y характеризуется снижением аффинности (т.е. повышенной KM) и снижением каталитической эффективности/активности (Kcat/KM) относительно WT AacSHC при использовании сквалена. В работе Hoshino и Sato (2002, цитируется выше) не приведены данные по эффективности AacSHC при использовании гомофарнезола в качестве субстрата фермента с мутацией F601Y.
Производное SHC, обозначенное как SHC10, предложенное в настоящем изобретении, содержит следующую замену F129L по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Производное SHC, обозначенное как SHC30, предложенное в настоящем изобретении, содержит следующую замену F601Y и F129L по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Производное SHC, обозначенное как SHC26, предложенное в настоящем изобретении, содержит следующую замену M132R и I432T по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Производное SHC, обозначенное как 215G2, предложенное в настоящем изобретении, содержит следующую замену M132R, I432T и A224V по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Производное SHC, обозначенное как SHC32, предложенное в настоящем изобретении, содержит следующую замену F601Y, M132R и I432T по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Производное SHC, обозначенное как SHC31, предложенное в настоящем изобретении, содержит следующую замену F129L, M132R и I432T по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Производное SHC, обозначенное как SHC33, предложенное в настоящем изобретении, содержит следующую замену F601Y, F129L, M132R и I432T по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Производное SHC, обозначенное как 101А10, предложенное в настоящем изобретении, содержит следующую замену F601Y и Q579H по сравнению с эталонным белком SHC (SEQ ID NO: 1).
Производное SHC, обозначенное как 111С8, предложенное в настоящем изобретении, содержит следующую замену Т77А+I92V и F129L по сравнению с эталонным белком SHC (SEQ ID NO: 1).
В предпочтительном воплощении изобретения производное SHC содержит по меньшей мере замены F668Y или Y185R в комбинации с по меньшей мере любой одной или более чем одной из F182L и/или I498T относительно SEQ ID NO: 2.
Производное SHC, обозначенное как SHC3ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Hoshino и Sato (2002, цитируется выше) идентифицировали F601 как высококонсервативный аминокислотный остаток среди прокариотических и эукариотических биологических видов. Сообщалось, что производное SHC F601Y характеризуется значительно повышенной Vmax для субстрата оксидосквалена (но не сквалена). Однако F601Y характеризуется снижением аффинности (т.е. повышенной KM) и снижением каталитической эффективности/активности (Kcat/KM) относительно WT AacSHC при использовании сквалена. В работе Hoshino и Sato (2002, цитируется выше) не приведены данные по эффективности AacSHC при использовании гомофарнезола в качестве субстрата фермента с мутацией F601Y. Производное SHC, эквивалентное F601Y в ZmoSHC1, представляет собой F668Y.
Производное SHC, обозначенное как SHC10ZM1, предложенное в настоящем изобретении, содержит следующую замену F182L по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Производное SHC, обозначенное как SHC30ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y и F182L по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Производное SHC, обозначенное как SHC26ZM1, предложенное в настоящем изобретении, содержит следующую замену Y185R и I498T по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Производное SHC, обозначенное как 215G2ZM1, предложенное в настоящем изобретении, содержит следующую замену Y185R, I498T и G282V по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Производное SHC, обозначенное как SHC32ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y, Y185R и I498T по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Производное SHC, обозначенное как SHC31ZM1, предложенное в настоящем изобретении, содержит следующую замену F182L, Y185R и I498T по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Производное SHC, обозначенное как SHC33ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y, F182L, Y185R и I498T по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Производное SHC, обозначенное как 101A10ZM1, предложенное в настоящем изобретении, содержит следующую замену F668Y и Н646Н по сравнению с эталонным белком SHC (SEQ ID NO: 2).
Производное SHC, обозначенное как 111C8ZM1, предложенное в настоящем изобретении, содержит следующую замену S129A+V145V и F182L по сравнению с эталонным белком SHC (SEQ ID NO: 2).
В предпочтительном воплощении изобретения производное SHC содержит по меньшей мере замены F620Y или I140R в комбинации с по меньшей мере любой одной или более чем одной из F137L и/или I450T относительно SEQ ID NO: 3.
Производное SHC, обозначенное как SHC3ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y по сравнению с эталонным белком SHC (SEQ ID NO: 3).
Hoshino и Sato (2002, цитируется выше) идентифицировали F601 как высококонсервативный аминокислотный остаток среди прокариотических и эукариотических биологических видов. Сообщалось, что производное SHC F601Y характеризуется значительно повышенной Vmax для субстрата оксидосквалена (но не сквалена). Однако F601Y характеризуется снижением аффинности (т.е. повышенной KM) и снижением каталитической эффективности/активности (Kcat/KM) относительно WT AacSHC при использовании сквалена. В работе Hoshino и Sato (2002, цитируется выше) не приведены данные по эффективности AacSHC при использовании гомофарнезола в качестве субстрата фермента с мутацией F601Y. Производное SHC, эквивалентное F601Y в ZmoSHC2, представляет собой F620Y.
Производное SHC, обозначенное как SHC10ZM2, предложенное в настоящем изобретении, содержит следующую замену F137L по сравнению с эталонным белком SHC (SEQ Ш NO: 3).
Производное SHC, обозначенное как SHC30ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y и F137L по сравнению с эталонным белком SHC (SEQ ID NO: 3).
Производное SHC, обозначенное как SHC26ZM2, предложенное в настоящем изобретении, содержит следующую замену I140R и I450T по сравнению с эталонным белком SHC (SEQ ID NO: 3).
Производное SHC, обозначенное как 215G2ZM2, предложенное в настоящем изобретении, содержит следующую замену I140R, I450T и V233V по сравнению с эталонным белком SHC (SEQ ID NO: 3).
Производное SHC, обозначенное как SHC32ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y, I140R и I450T по сравнению с эталонным белком SHC (SEQ ID NO: 3).
Производное SHC, обозначенное как SHC31ZM2, предложенное в настоящем изобретении, содержит следующую замену F137L, I140R и I450T по сравнению с эталонным белком SHC (SEQ ID NO: 3).
Производное SHC, обозначенное как SHC33ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y, F137L, I140R и I450T по сравнению с эталонным белком SHC (SEQ ID NO: 3).
Производное SHC, обозначенное как 101A10ZM2, предложенное в настоящем изобретении, содержит следующую замену F620Y и N598H по сравнению с эталонным белком SHC (SEQ ID NO: 3).
Производное SHC, обозначенное как 111C8ZM2, предложенное в настоящем изобретении, содержит следующую замену G85A+V100V и F137L по сравнению с эталонным белком SHC (SEQ ID NO: 3).
В предпочтительном воплощении изобретения производное SHC содержит по меньшей мере замены F628Y или Y144R в комбинации с по меньшей мере любой одной или более чем одной из F141L и/или I459T относительно SEQ ID NO: 4.
Производное SHC, обозначенное как SHC3Bjp, предложенное в настоящем изобретении, содержит следующую замену F628Y по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Hoshino и Sato (2002, цитируется выше) идентифицировали F601 как высококонсервативный аминокислотный остаток среди прокариотических и эукариотических биологических видов. Сообщалось, что производное SHC F601Y характеризуется значительно повышенной Vmax для субстрата оксидосквалена (но не сквалена). Однако F601Y характеризуется снижением аффинности (т.е. повышенной KM) и снижением каталитической эффективности/активности (Kcat/KM) относительно WT AacSHC при использовании сквалена. В работе Hoshino и Sato (2002, цитируется выше) не приведены данные по эффективности AacSHC при использовании гомофарнезола в качестве субстрата фермента с мутацией F601Y. Производное SHC, эквивалентное F601Y в BjpSHC, представляет собой F628Y.
Производное SHC, обозначенное как SHC10Bjp, предложенное в настоящем описании, содержит следующую замену F141L по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Производное SHC, обозначенное как SHC30Bjp, предложенное в настоящем описании, содержит следующую замену F628Y и F141L по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Производное SHC, обозначенное как SHC26Bjp, предложенное в настоящем описании, содержит следующую замену Y144R и I459T по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Производное SHC, обозначенное как 215G2Bjp, предложенное в настоящем описании, содержит следующую замену Y144R, I459T и V241V по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Производное SHC, обозначенное как SHC32Bjp, предложенное в настоящем описании, содержит следующую замену F628Y, Y144R и I459T по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Производное SHC, обозначенное как SHC31Bjp, предложенное в настоящем описании, содержит следующую замену F141L, Y144R и I459T по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Производное SHC, обозначенное как SHC33Bjp, предложенное в настоящем описании, содержит следующую замену F628Y, F141L, Y144R и I459 по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Производное SHC, обозначенное как 101A10Bjp, предложенное в настоящем описании, содержит следующую замену F628Y и М607Н по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Производное SHC, обозначенное как 111C8FBjp, предложенное в настоящем описании, содержит следующую замену А88А+V104V и F141L по сравнению с эталонным белком SHC (SEQ ID NO: 4).
Аминокислотные последовательности
В некоторых воплощениях изобретения производное AacSHC/HAC содержит один или более чем один полипептид, представленный в одной или более чем одной из SEQIDNO: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33,35, 37, 39 и/или 171.
Предпочтительно производные AacSHC/HAC согласно настоящему описанию имеют аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39 и/или SEQ ID NO: 171.
В других воплощениях изобретения производные ZmoSHC1/HAC содержат один или более чем один полипептид, представленный в одной или более чем одной из SEQ ID NO: 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75 и/или 173.
Предпочтительно производные ZmoSHC1/HAC согласно настоящему описанию имеют аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 75 и/или SEQ ID NO: 173.
В следующих воплощениях изобретения производные ZmoSHC2/HAC содержат один или более чем один полипептид, представленный в одной или более чем одной из SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111 и/или SEQ ID NO: 175.
В дополнительных воплощениях изобретения производные BjpSHC/HAC содержат один или более чем один полипептид, представленный в одной или более чем одной из: SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147 и/или SEQ ID NO: 177.
Выравнивание последовательностей
В связи с тем, что эталонные последовательности SHC, такие как, например, последовательности полипептидов AacSHC, ZmoSHC1, ZmoSHC2 и BjpSHC, имеют различную длину, аминокислотный остаток в положении X в эталонной последовательности AacSHC (SEQ ID NO: 1) соответствует другому положению аминокислоты В в эталонной последовательности ZmoSHC1 (SEQ ID NO: 2), другому положению аминокислоты J в эталонной последовательности ZmoSHC2 (SEQ ID NO: 3) и другому положению аминокислоты Z в эталонной последовательности BjpSHC (SEQ ID NO: 4). Кроме того, изменение эталонной последовательности SHC может также модифицировать последовательность производного SHC относительно этой эталонной последовательности SHC.
Термин «положение» относится к определенному остатку аминокислоты, находящемуся в эталонном белке SHC, идентифицированному определенной нумерацией аминокислот. Изменение эталонного белка SHC в результате инсерции или делеции аминокислоты приводит к различной нумерации между эталонной аминокислотной последовательностью SHC и аминокислотной последовательностью производного SHC. В качестве примера, в случае инсерции аминокислоты между аминокислотами 509 и 510 эталонного белка SHC, эта аминокислота после инсерции будет иметь номер 511 в белке-производном SHC, тогда как в эталонном белке SHC сохраняется номер 510.
Методы обнаружения активности WT SHC/HAC и производного SHC/HAC
Методы обнаружения и количественного определения активности WT SHC/HAC и/или производного фермента SHC/HAC описаны в настоящем описании и известны на уровне техники. В качестве примера активность WT SHC/HAC и/или производного фермента SHC/HAC можно определить путем инкубирования очищенного фермента SHC/HAC или экстрактов из клеток-хозяев, либо целостного рекомбинантного организма-хозяина, продуцирующего фермент SHC/HAC, с соответствующим субстратом в подходящих условиях и проведения анализа продуктов реакции (например, методом газовой хроматографии (GC) или анализа HPLC (высокоэффективной жидкостной хроматографией)). Дополнительные подробные сведения о количественном определении SHC/HAC и/или ферментативной активности SHC/HAC и анализе продуктов реакции приведены в примерах. Эти методы включают в себя продуцирование производного SHC в рекомбинантных клетках-хозяевах (например, E coli).
Используемый в настоящем описании термин «активность» означает способность фермента к взаимодействию с субстратом с получением целевого продукта. Активность может быть определена в тесте, известном как тест на активность, через увеличение количества целевого продукта, уменьшения количества субстрата (или исходных веществ) или через комбинации этих параметров в зависимости от времени. Производные SHC/HAC согласно настоящему описанию характеризуют по их способности к биоконверсии гомофарнезола в (-)-амброксид и демонстрируют биологическую активность, такую как активность НАС.
Используемый в настоящем описании термин «биологическая активность» относится к любой активности, которую может проявлять полипептид, включающей, без ограничений: ферментативную активность; активность связывания с другим соединением (например, связывание с другим полипептидом, в частности связывание с рецептором или связывание с нуклеиновой кислотой), ингибиторную активность (например, ингибиторную активность по отношению к ферменту), активирующую активность (например, активность, активирующую фермент) или токсические действия. Для варианта или производного не требуется, чтобы они проявляли такую активность в той же степени, что и родительский полипептид. Вариант рассматривают как вариант в контексте настоящей заявки, если он проявляет релевантную активность в степени, составляющей по меньшей мере 10% от активности родительского полипептида. Схожим образом производное рассматривают как вариант в контексте настоящей заявки, если он проявляет релевантную биологическую активность в степени, составляющей по меньшей мере 10% от активности родительского полипептида (поскольку термины производное и вариант на протяжении настоящего описания используют взаимозаменяемо).
В других воплощениях изобретения производные SHC/HAC согласно настоящему описанию демонстрируют лучший выход целевого продукта, чем эталонный белок SHC. Термин «выход целевого продукта» относится к количеству граммов извлекаемого продукта на один грамм исходного сырья (которое можно рассчитать как скорость конверсии в молярных процентах).
В дополнительных воплощениях изобретения производные SHC/HAC согласно настоящему описанию проявляют модифицированную (например, повышенную) целевую производительность относительно эталонного белка SHC. Термин «целевая производительность» относится к количеству извлекаемого целевого продукта в граммах на литр ферментационной емкости в час времени биоконверсии (т.е. времени после добавления субстрата).
В следующих воплощениях изобретения производные SHC/HAC согласно настоящему описанию проявляют модифицированный коэффициент выхода целевого продукта, чем эталонный белок SHC. Термин «коэффициент выхода целевого продукта» относится к соотношению между концентрацией полученного продукта и концентрацией производного SHC (например, очищенного фермента SHC или экстракта из рекомбинантных клеток-хозяев, экспрессирующих фермент SHC) в реакционной смеси.
В различных воплощениях изобретения производные SHC согласно настоящему описанию демонстрируют модифицированную (например, повышенную) кратность повышения ферментативной активности (например, модифицированную/повышенную активность гомофарнезол-амброксид-циклазы (НАС)) относительно эталонного белка SHC (например, SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4). Кратность этого повышения активности составляет по меньшей мере: 2, 3, 4, 6, 8, 10, 12, 14, 16, 18, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 и/или 100.
Нуклеотидные последовательности
Настоящее изобретение также относится к изолированным молекулам нуклеиновой кислоты, содержащим нуклеотидную последовательность, кодирующую производное SHC, как описано в настоящем описании.
Используемый в настоящем описании термин «молекула нуклеиновой кислоты» следует конкретно относить к полинуклеотидам согласно описанию, которые могут представлять собой ДНК, кДНК, геномную ДНК, синтетическую ДНК или РНК и могут быть двунитевыми или однонитевыми, смысловой и/или антисмысловой нитью.
Термин «молекула нуклеиновой кислоты» следует конкретно применять к описанному(-ым) в настоящем описании полинуклеотиду(-ам), например, в виде полноразмерной нуклеотидной последовательности или ее фрагментов или частей, которые кодируют полипептид, обладающий ферментативной активностью, например фермент метаболического пути или его фрагменты или части, соответственно.
Этот термин также включает в себя отдельную молекулу, такую как кДНК, где соответствующая геномная ДНК имеет интроны и, следовательно, отличающуюся последовательность; геномный фрагмент, в котором отсутствует по меньшей мере один из фланкирующих генов; фрагмент кДНК или геномной ДНК, образующийся в результате полимеразной цепной реакции (ПЦР), и в котором отсутствует по меньшей мере один из фланкирующих генов; фрагмент рестрикции, в котором отсутствует по меньшей мере один из фланкирующих генов; ДНК, кодирующую неприродный белок, такой как слитый белок (например, гистидиновую метку), мутеин или фрагмент данного белка; и нуклеиновую кислоту, представляющую собой вырожденный вариант кДНК или встречающейся в природе нуклеиновой кислоты. Кроме того, он включает в себя рекомбинантную нуклеотидную последовательность, составляющую участок гибридного гена, т.е. гена, кодирующего неприродный слитый белок. В слитых белках к белку может быть присоединена одна или более чем одна аминокислота (такая как, без ограничений, гистидин (His)), обычно на N-конце белка, но также на С-конце белка или в слитом виде внутри участков белка. Такие слитые белки или слитые векторы, кодирующие такие белки, как правило, предназначены для следующих целей: (i) повысить продуцирование рекомбинантных белков; (ii) повысить растворимость рекомбинантного белка; и (iii) способствовать очистке рекомбинантного белка путем обеспечения лиганда для аффинной очистки. Термин «молекула нуклеиновой кислоты» также включает в себя оптимизированные по кодонам последовательности, подходящие для экспрессии в конкретной клетке микроорганизма-хозяина (например, в клетке-хозяине Е. coli). Используемый в настоящем описании термин «оптимизированный по кодонам» означает кодирующую белок последовательность нуклеиновой кислоты, адаптированную для экспрессии в прокариотической или эукариотической клетке-хозяине, в частности в бактериальных клетках-хозяевах, таких как клетки-хозяева Е. coli, путем замены одного или более чем одного, или, предпочтительно, значительного числа кодонов кодонами, который чаще используются в генах бактериальных клеток-хозяев (например, Е. coli). В связи с этим нуклеотидная последовательность, кодирующая эталонные последовательности SEQ ID NO: 1, 2, 3 и/или 4 и все их варианты/производные, может представлять собой исходную последовательность, обнаруживаемую в источнике (например, AacSHC, ZmoSHC1, ZmoSHC2 или BjpSHC, соответственно), или ген, который может быть оптимизирован по кодонам для выбранных организмов-хозяев, таких как, например, Е. coli.
Молекула рибонуклеиновой кислоты (РНК) может быть получена путем транскрипции in vitro. Сегменты молекул ДНК также рассмотрены в пределах объема описания и могут быть получены, например, полимеразной цепной реакцией (ПЦР) или созданы путем обработки одной или более чем одной эндонуклеазой рестрикции. Сегменты молекулы нуклеиновой кислоты могут относиться к ДНК-фрагментам гена, в частности к фрагментам, представляющим собой частичные гены. Фрагмент может также содержать несколько открытых рамок считывания (ОРС), либо повторов одной и той же ОРС, либо различных ОРС. Этот термин следует конкретно относить к кодирующим нуклеотидным последовательностям, но в него также следует включать некодирующие нуклеотидные последовательности, например нетранскрибируемые или нетранслируемые последовательности, или последовательности, кодирующие полноразмерные или частичные полипептиды. Гены, используемые в настоящем описании, например, для сборки, диверсификации или рекомбинации, могут представлять собой либо некодирующие последовательности, либо кодирующие полипептиды последовательности, либо кодирующие белки последовательности или их участки или фрагменты, имеющие достаточную длину последовательности для успешного осуществления событий рекомбинации. Более конкретно, указанные гены имеют минимальную длину 3 пары оснований (п.о.), предпочтительно по меньшей мере 100 п.о., более предпочтительно по меньшей мере 300 п.о.
На основании вышеописанного будет ясно, что ссылка на изолированную ДНК не означает ДНК, находящуюся среди других молекул ДНК в количествах от сотен до миллионов, например, в составе библиотек кДНК, или геномных ДНК, или рестриктных фрагментов геномной ДНК, например в рестрикционной смеси или в пластинке геля на электрофорезе. Изолированная молекула нуклеиновой кислоты согласно настоящему описанию охватывает сегменты, которые сами по себе не обнаруживаются в естественном состоянии.
Используемый в настоящем описании термин «изолированная ДНК» может относиться к (1) ДНК, содержащей последовательность, не идентичную какой-либо встречающейся в природе последовательности, полинуклеотиду или нуклеиновой кислоте, не встречающимся в природе (например, полученным путем искусственного комбинирования (например, искусственных манипуляций с изолированными сегментами нуклеиновых кислот, например, методами генной инженерии) двух обычно разделенных сегментов последовательностей посредством вмешательства человека) или (2) в контексте ДНК, встречающейся в природе последовательности (например, кДНК или геномной ДНК), ДНК, не содержащей по меньшей мере один из генов, фланкирующих ген, содержащий интересующую ДНК, в геноме организма, в котором в природе встречается ген, содержащий интересующую ДНК.
Используемый в настоящем описании термин «изолированная ДНК», особенно по отношению к последовательности нуклеиновой кислоты, может также относиться к нуклеиновым кислотам или полинуклеотидам, полученным методами рекомбинантных ДНК, например, к конструкции ДНК, содержащей полинуклеотид, гетерологичный для клетки-хозяина, который, возможно, встраивают в клетку-хозяина. Химерная нуклеотидная последовательность может быть, в частности, получена в виде рекомбинантной молекулы. Термин «рекомбинация» конкретно применяют к сборке полинуклеотидов, соединению таких полинуклеотидов или их участков вместе, с рекомбинацией или без рекомбинации, с получением кроссоверного или мозаичного гена. Например, ее осуществляют, чтобы соединить вместе сегменты нуклеиновой кислоты, обладающие требуемыми функциями, для создания требуемой комбинации функций. Рекомбинантный ген, кодирующий описанный в настоящем описании полипептид, включает в себя кодирующую последовательность для этого полипептида, функционально связанную в смысловой ориентации с одной или более регуляторных областей, подходящих для экспрессии этого полипептида. В связи с тем, что многие микроорганизмы способны экспрессировать множественные генные продукты с полицистронной мРНК, при желании множество полипептидов можно экспрессировать под контролем одной регуляторной области для этих микроорганизмов. Кодирующую последовательность и регуляторную область считают функционально связанными, если регуляторная область и кодирующая последовательность расположены так, что регуляторная область эффективно осуществляет регуляцию транскрипции или трансляции этой последовательности.
Используемый в настоящем описании термин «рекомбинантный», особенно по отношению к ферментам, следует относить к ферментам, полученным методами рекомбинантных ДНК, т.е. полученным из клеток, трансформированных экзогенной конструкцией ДНК, кодирующей требуемый фермент. Термин «синтетические ферменты» означает ферменты, полученные путем химического синтеза. Химерный фермент может быть конкретно получен в виде рекомбинантной молекулы. Таким образом, термин «рекомбинантная ДНК» включает в себя рекомбинантную ДНК, встроенную либо в вектор в виде автономно реплицирующейся плазмиды или вируса, либо в геномную ДНК прокариотического или эукариотического организма (или в геном гомологичной клетки в положении, отличающемся от природной хромосомной локализации).
В следующем аспекте молекула (-ы) нуклеиновой кислоты согласно настоящему описанию функционально связана (-ы) с контрольными последовательностями экспрессии, что дает возможность экспрессии в прокариотических и/или эукариотических клетках-хозяевах. Используемый в настоящем описании термин «функционально связанный» означает встраивание в генетическую конструкцию так, чтобы контрольные последовательности экспрессии эффективно контролировали экспрессию интересующей кодирующей последовательности.
Транскрипционные/трансляционные регуляторные элементы, относящиеся к описанному выше, включают, без ограничений, индуцибельные и неиндуцибельные, конститутивные, регулируемые клеточным циклом, метаболически регулируемые промоторы, энхансеры, операторы, сайленсеры, репрессоры и другие элементы, известные специалистам в данной области техники, которые стимулируют или иным образом регулируют экспрессию гена. Такие регуляторные элементы включают, без ограничений, регуляторные элементы, направляющие конститутивную экспрессию или обеспечивающие возможность индуцибельной экспрессии, такие как, например, промотор
CUP-1, tet-репрессор, используемый, например, в системах tet-on или tet-off, регуляторные элементы lac-системы и trp-системы. В качестве примера, изопропил-β-D-1-тиогалактопиранозид (IPTG) является эффективным индуктором экспрессии генов в диапазоне концентраций от 100 мкМ до 1,0 мМ. Это соединение является молекулярным имитатором аллолактозы, являющейся метаболитом лактозы, который запускает транскрипцию lac оперона и, следовательно, используется для индукции экспрессии гена при нахождении гена под контролем lac оператора. Другим примером регуляторного элемента, который индуцирует экспрессию гена, является лактоза.
Аналогичным образом молекула (-ы) нуклеиновой кислоты согласно настоящему описанию может(гут) образовать участок гибридного гена, кодирующего дополнительные полипептидные последовательности, например последовательность, функционирующую в качестве маркера или репортера. Примеры маркерных и репортерных генов включают гены бета-лактамазы, хлорамфениколацетилтрансферазы (CAT), аденозиндезаминазы (ADA), аминогликозидфосфотрансферазы дигидрофолатредуктазы (DHFR), гигромицин-В-фосфотрансферазы (НРН), тимидинкиназы (ТК), lacZ (кодирующий бета-галактозидазу) и ксантингуанинфосфорибозилтрансферазы (XGPRT). Как и для многих стандартных процедур, связанных с осуществлением на практике изобретения согласно описанию, специалистам в данной области техники известны дополнительные полезные реагенты, например, дополнительные последовательности, которые могут выполнять функцию маркера или репортера.
В некотором воплощении в настоящем описании предложен рекомбинантный полипептид, кодирующий WT SHC или его описанное выше производное, который может быть встроен в вектор для экспрессии и дополнительной очистки. Одним из типов вектора является плазмида, представляющая собой кольцевую двунитевую петлю ДНК, в которой лигируют дополнительные сегменты ДНК. Определенные векторы могут контролировать экспрессию генов, с которыми они функционально связаны. Эти векторы называют «экспрессионными векторами». Обычно экспрессионные векторы, подходящие для методов рекомбинантных ДНК, представляют собой векторы плазмидного типа. Как правило, экспрессионный вектор содержит ген, такой как WT SHC или вариант SHC/HAC, как описано в настоящем описании. В настоящем описании термины «плазмида» и «вектор» используют взаимозаменяемо, поскольку плазмида является наиболее часто используемым типом вектора.
Такие векторы могут включать последовательности ДНК, включающие, без ограничений, последовательности ДНК, которые в природе отсутствуют в клетке-хозяине, последовательности ДНК, которые в нормальных условиях не транскрибируются в РНК или не транслируются в белок (не «экспрессируются»), и другие гены или последовательности ДНК, требуемые для введения в нерекомбинантную клетку-хозяина. Должно быть понятно, что, как правило, геном описанной в настоящем описании рекомбинантной клетки-хозяина дополняют в результате стабильного введения одного или более рекомбинантных генов. Тем не менее, в пределах объема настоящего описания можно также использовать репликативные плазмиды или векторы. Кроме того, настоящее изобретение можно осуществлять на практике с использованием низкокопийной, например однокопийной, или высококопийной плазмиды или вектора (пример, которых приведен в настоящем описании).
В предпочтительном воплощении изобретения вектор согласно настоящему описанию включает в себя плазмиды, фагмиды, фаги, космиды, искусственные бактериальные и искусственные дрожжевые хромосомы, конструкции типа нокаут или нок-ин, синтетические нуклеиново-кислотные последовательности или кассеты, и эти подгруппы могут быть получены в форме линейных полинуклеотидов, плазмид, мегаплазмид, синтетических или искусственных хромосом, таких как искусственные хромосомы растений, бактерий, млекопитающих или дрожжей.
Предпочтительно, чтобы белки, кодируемые встроенным полипептидом, после встраивания в вектор экспрессируются внутри клетки. В плазмиды могут быть встроены гены разнообразных субстратов. Плазмиды часто представляют собой стандартные векторы для клонирования, например бактериальные многокопийные плазмиды. Субстраты могут быть встроены в те же или другие плазмиды. Часто используют по меньшей мере два различных типа плазмид, имеющих различные типы селективных маркеров, что дает возможность отобрать клетки, содержащие по меньшей мере два типа векторов.
Как правило, бактериальные или дрожжевые клетки можно трансформировать любой одной или более чем одной из следующих нуклеотидных последовательностей, как хорошо известно в данной области техники. Для рекомбинации in vivo для трансформации клетки-хозяина используют ген, который должен рекомбинировать с геномом или с другими генами, используя стандартные методы трансформации. В соответствующем воплощении изобретения в конструкцию включают ДНК, обеспечивающую точку начала репликации. Точка начала репликации может быть целесообразно выбрана специалистом в данной области техники. В зависимости от природы генов в том случае, если в генах или в геноме уже присутствуют последовательности, которые могут сами по себе действовать в качестве точек начала репликации, дополнительная точка начала репликации может не требоваться.
Бактериальную или дрожжевую клетку можно трансформировать экзогенной или гетерологичной ДНК, если такая ДНК введена внутрь клетки. Трансформирующая ДНК может быть интегрирована, т.е. ковалентно связана с геномом клетки, или не интегрирована. У прокариот и дрожжей трансформирующая ДНК может сохраняться на эписомном элементе, таком как плазмида. Что касается эукариотических клеток, стабильно трансфицированной клеткой является клетка, в которой произошла интеграция трансфицированной ДНК в хромосому таким образом, что она наследуется дочерними клетками посредством репликации хромосомы. Эта стабильность демонстрируется на основании способности эукариотической клетки основывать клеточные линии или клоны, содержащие популяции дочерних клеток, содержащих трансформирующую ДНК.
Как правило, введенная ДНК исходно не является резидентной для хозяина, который является реципиентом ДНК, но в объем настоящего изобретения входит выделение сегмента ДНК из данного хозяина и последующее введение одной или более дополнительных копий этой ДНК в ту же клетку-хозяина, например, чтобы усилить продуцирование продукта гена или изменить паттерн экспрессии гена. В некоторых случаях введенная ДНК приведет к модификации или даже замене эндогенного гена или последовательности ДНК посредством, например, гомологической рекомбинации или сайт-направленного мутагенеза. Подходящие рекомбинантные клетки-хозяева включают микроорганизмы, растительные клетки и растения.
Признаками настоящего изобретения также являются рекомбинантные клетки-хозяева. Термином «рекомбинантная клетка-хозяин», которую также называют «генетически модифицированной клеткой-хозяином» или «трансгенной клеткой», обозначают клетку-хозяина, содержащую гетерологичную нуклеиновую кислоту, или клетку, геном которой дополнен по меньшей мере одной встроенной последовательностью ДНК. Клетка-хозяин по настоящему изобретению может быть сконструирована методами генной инженерии с полинуклеотидом или вектором, как описано выше.
Клетки-хозяева, которые можно использовать для целей изобретения, включают без ограничений прокариотические клетки, такие как бактерии (например, Е. coli и В. subtilis), которые могут быть трансформированы, например, рекомбинантной ДНК бактериофага, плазмидной ДНК, бактериальной искусственной хромосомой или космидными векторами экспрессии ДНК, содержащими полинуклеотидные молекулы по изобретению; простые эукариотические клетки, такие как дрожжи (например, Saccharomyces и Pichia), которые могут быть трансформированы рекомбинантными дрожжевыми экспрессионными векторами, содержащими полинуклеотидную молекулу по изобретению. В зависимости от клетки-хозяина и соответствующего вектора, используемого для введения полинуклеотида по изобретению, полинуклеотид может быть интегрирован, например, в хромосому или митохондриальную ДНК, либо может поддерживаться экстрахромосомально, например эписомально, либо может только временно содержаться в клетках.
Используемый в настоящем описании термин «клетка», в частности, со ссылкой на генетическое конструирование и включение в клетку одного или более генов или собранного кластера генов или со ссылкой на клетку-продуцент понимают как относящийся к любой прокариотической или эукариотической клетке. Как прокариотические, так и эукариотические клетки-хозяева рассматривают для применения в соответствии с изобретением, включая бактериальные клетки-хозяева, такие как Е. coli или Bacillus sp, дрожжевые клетки-хозяева, такие как S. cerevisiae, клетки-хозяева насекомых, таких как Spodoptora frugiperda, или человеческие клетки-хозяева, такие как клетки HeLa и Jurkat.
Более конкретно, клетка представляет собой эукариотическую клетку, предпочтительно клетку грибов, млекопитающих или растений, или прокариотическую клетку. Подходящие эукариотические клетки включают, например, без ограничений, клетки млекопитающих, дрожжевые клетки или клетки насекомых (включая Sf9), клетки амфибий (включая клетки-меланофоры) или клетки червей, включая клетки Caenorhabditis (включая Caenorhabditis elegans). Подходящие клетки млекопитающих включают, например, без ограничений клетки COS (включая Cos-1 и Cos-7), клетки СНО, клетки HEK293, клетки HEK293T, клетки HEK293 T-RexTM или другие способные к трансфекции эукариотические клеточные линии. Подходящие клетки бактерий включают, без ограничений, Е. coli.
Предпочтительно можно использовать прокариоты, такие как Е. coli, Bacillus, Streptomyces, или клетки млекопитающих, такие как клетки HeLa или клетки Jurkat, или клетки растений, такие как Arabidopsis.
Предпочтительно клетка представляет собой клетку Aspergillus sp. или клетку грибов, предпочтительно она может быть выбрана из группы, состоящей из родов Saccharomyces, Candida, Kluyveromyces, Hansenula, Schizosaccharomyces, Yarrowia, Pichia и Aspergillus.
Предпочтительно клетка-хозяин E. coli представляет собой клетку-хозяина E. coli, признанную в промышленности и регулирующими органами (включая, без ограничений, клетку-хозяина Е. coli K12 или, как продемонстрировано в примерах, клетку-хозяина Е. coli BL21).
Одна из предпочтительных клеток-хозяев для использования в настоящем изобретении представляет собой клетку Е. coli, которая может быть получена рекомбинантными методами, как описано в настоящем описании. Таким образом, рекомбинантная клетка-хозяин может представлять собой рекомбинантную клетку-хозяина Е. coli. Для Е. coli существуют библиотеки мутантов, плазмид, подробных компьютерных моделей метаболизма и другая информация, позволяющая осуществлять рациональный дизайн различных модулей для повышения выхода продукта. Для получения рекомбинантных микроорганизмов Е. coli можно использовать способы, аналогичные описанным выше для Saccharomyces.
В одном воплощении изобретения рекомбинантный микроорганизм Е. coli содержит нуклеотидные последовательности, кодирующие гены SHC (как раскрыто, например, в любой одной или более чем одной из таблиц 10, 11 и 12 в настоящем описании, или их функциональные эквиваленты/гомологи, включая, без ограничений, их варианты, мутанты гомологов, производные или фрагменты).
Предпочтительно рекомбинантный микроорганизм Е. coli содержит векторную конструкцию, представленную на Фиг. 5 и 21.
В другом предпочтительном воплощении изобретения рекомбинантный микроорганизм Е. coli содержит нуклеотидные последовательности, кодирующие WT SHC/HAC и производные WT SHC/HAC или их функциональные эквиваленты/гомологи, включая без ограничений их варианты, мутанты гомологов, производные или фрагменты, представленные в любой одной или более чем одной из таблицы 13, таблицы 14, таблицы 15, таблицы 16, таблицы 17 и/или таблицы 4а.
Другой предпочтительной клеткой-хозяином для использования в настоящем изобретении является S. cerevisiae, который является широко распространенным организмом-шасси в синтетической биологии. Таким образом, рекомбинантная клетка-хозяин может представлять собой S. cerevisiae. Для S. cerevisiae существуют библиотеки мутантов, плазмид, подробных компьютерных моделей метаболизма и другая информация, позволяющая осуществлять рациональный дизайн различных модулей для повышения выхода продукта. Известны способы создания рекомбинантных микроорганизмов S. cerevisiae.
Культивирование клеток осуществляют традиционным способом. Питательная среда для культивирования содержит источник углерода, по меньшей мере один источник азота и неорганические соли, а также к ней добавляют витамины. Компоненты этой питательной среды могут представлять собой компоненты, традиционно используемые для культивирования рассматриваемого вида микроорганизмов.
Источники углерода, используемые в настоящем способе, включают любую молекулу, которая может метаболизироваться рекомбинантной клеткой-хозяином, содействуя росту и/или продуцированию (-)-амброксида. Примеры приемлемых источников углерода включают, без ограничений, сахарозу (например, находящуюся в мелассах), фруктозу, ксилозу, глицерин, глюкозу, целлюлозу, крахмал, целлобиозу или другой содержащий глюкозу полимер.
В воплощениях изобретения, в которых используют дрожжи в качестве хозяина, приемлемы, например, источники углерода, такие как сахароза, фруктоза, ксилоза, этанол, глицерин и глюкоза. Организм-хозяин может обеспечиваться источником углерода на протяжении всего периода культивирования или, альтернативно, организм можно выращивать в течение некоторого периода времени в присутствии другого источника энергии, например белка, а затем обеспечивать его источником углерода только во время фазы подпитки.
Приемлемость рекомбинантного микроорганизма-хозяина для использования в способах по настоящему изобретению можно определить с помощью простых методик тестирования, используя хорошо известные методы. Например, тестируемый микроорганизм можно размножать в богатой питательной среде (например, в среде LB, среде с бакто-триптоном и дрожжевым экстрактом, питательной среде и т.п.) в условиях рН, температуры и аэрации, обычно используемых для размножения этого микроорганизма. После отбора рекомбинантных микроорганизмов (т.е. рекомбинантных клеток-хозяев), продуцирующих желаемые продукты биоконверсии, эти продукты, как правило, получают с использованием линии-продуцента клеток-хозяев в крупном масштабе с помощью подходящих экспрессионных систем и ферментации, например, путем продуцирования микроорганизмами в клеточной культуре.
В одном воплощении настоящего изобретения для культивирования клеток используют определенную минимальную питательную среду, такую как М9А.
Компоненты питательной среды М9А включают: 14 г/л KH2PO4, 16 г/л K2HPO4, 1 г/л Na3цитрат⋅2H2O, 7,5 г/л (NH4)2SO4, 0,25 г/л MgSO4⋅7H2O, 0,015 г/л CaCl2⋅2H2O, 5 г/л глюкозы и 1,25 г/л дрожжевого экстракта).
В другом воплощении настоящего изобретения использовали питательную среду, обогащенную питательными веществами, такую как среду LB. Компоненты питательной среды LB включают: 10 г/л триптона, 5 г/л дрожжевого экстракта, 5 г/л NaCl.
Другие примеры минеральной питательной среды и минеральная питательная среда М9 раскрыты, например, в патенте США US 6524831 В2 и в заявке на патент США US 2003/0092143 А1.
Рекомбинантный микроорганизм можно выращивать в периодической культуре, периодической культуре с подпиткой или в непрерывном процессе, либо использовать их комбинацию. Как правило, рекомбинантный микроорганизм выращивают в ферментере при определенной(-ых) температуре(-ах) в присутствии приемлемого источника питательных веществ, например источника углерода, в течение требуемого периода времени для получения достаточного количества фермента для биоконверсии гомофарнезола в амброксид и для получения желаемого количества амброксида, включая (-)-амброксид.
Рекомбинантные клетки-хозяева можно культивировать любым приемлемым способом, например, путем периодического культивирования или периодического культивирования с подпиткой.
Используемый в настоящем описании термин «периодическое культивирование» представляет собой способ культивирования, при котором не добавляют питательную среду для культивирования и не удаляют ее в процессе культивирования.
Используемый в настоящем описании термин «периодическое культивирование с подпиткой» представляет собой способ культивирования, при котором питательную среду для культивирования добавляют в процессе культивирования, но среду для культивирования не удаляют.
В одном воплощении настоящего изобретения предложен способ получения амброксида в клеточной системе, включающий экспрессию WT SHC или производных SHC/HAC в приемлемых условиях в клеточной системе, подачу в клеточную систему гомофарнезола, конвертирование гомофарнезола в амброксид с использованием WT SHC или производных SHC/HAC, полученных с использованием клеточной системы и, возможно, выделение вещества (-)-амброксида из системы. Для улучшения этого способа можно использовать экспрессию других нуклеотидных последовательностей. Способ биоконверсии может включать дополнительную экспрессию других нуклеотидных последовательностей в клеточной системе. Экспрессия других нуклеотидных последовательностей может усиливать биохимический путь биоконверсии для получения (-)-амброксида.
Следующее воплощение настоящего изобретения представляет собой способ биоконверсии для получения (-)-амброксида, включающий выращивание клеток-хозяев, содержащих гены WT SHC/HAC или производных SHC/HAC, продуцирование WT SHC/HAC или производных SHC/HAC в клетках-хозяевах, подачу гомофарнезола (например, ЕЕН) к клеткам-хозяевам, инкубацию клеток-хозяев в условиях рН, температуры и в присутствии солюбилизирующего агента, подходящих для стимуляции конвертирования гомофарнезола в амброксид и сбор (-)-амброксида. Продуцирование WT SHC/HAC и/или производных SHC/HAC в клетках-хозяевах обеспечивает способ получения (-)-амброксида при добавлении гомофарнезола к клеткам-хозяевам при подходящих реакционных условиях. Достижение конвертирования можно усилить путем добавления к реакционной смеси дополнительного количества биокатализатора и додецилсульфата натрия (SDS).
Рекомбинантную клетку-хозяина микроорганизма можно культивировать различными путями с целью обеспечения клеток, экспрессирующих WT SHC или производные SHC/HAC в приемлемых количествах для последующей стадии биоконверсии. Поскольку микроорганизмы, применяемые для стадии биоконверсии, широко варьируют (например, дрожжи, бактерии и грибы), условия культивирования, которые хорошо известны и документированы, несомненно, регулируют в соответствии со специфичными потребностями каждого биологического вида. Для получения клеток, полезных для использования на последующей стадии биоконверсии по настоящему изобретению, можно использовать любой из известных в данной области техники способов выращивания клеток рекомбинантного микроорганизма-хозяина. Как правило, клетки выращивают до определенной плотности (измеряемой как оптическая плотность (OD)), чтобы получить достаточное количество биомассы для реакции биоконверсии.
На количество получаемых клеток (биомассу) влияют не только выбранные условия культивирования, но также качество условий культивирования, влияющее на превращение биомассы в биокатализатор. Рекомбинантную клетку-хозяина микроорганизма, экспрессирующую ген WT SHC или производного SHC/HAC и продуцирующую ферменты WT SHC или производных SHC/HAC, называют биокатализатором, приемлемым для использования в реакции биоконверсии. В некоторых воплощениях изобретения биокатализатор представляет собой рекомбинантную целую клетку, продуцирующую WT SHC или производные SHC/HAC, либо он может находиться в суспензии или в иммобилизованном формате. В других воплощениях изобретения биокатализатор представляет собой мембранную фракцию или жидкую фракцию, приготовленную из рекомбинантных целых клеток, продуцирующих WT SHC или производное SHC/HAC (как раскрыто, например, в публикации Seitz et al 2012, цитируемой выше).
Рекомбинантная целая клетка, продуцирующая WT SHC или производные SHC/HAC, включает целые клетки, собранные из ферментера (для реакции биоконверсии), или клетки в ферментере (которые впоследствии используют в реакции, протекающей в одном реакционном сосуде). Рекомбинантная целая клетка, продуцирующая WT SHC или производные SHC/HAC, может включать интактную рекомбинантную целую клетку и/или клеточный дебрис. В любом случае WT SHC или производное SHC/HAC некоторым образом ассоциированы с мембраной (такой как клеточная мембрана) с целью приема субстрата (например, гомофарнезола) и/или взаимодействия с ним, где мембрана (такая как клеточная мембрана) может составлять часть или содержать целую клетку (например, рекомбинантную целую клетку). WT SHC или производные SHC/HAC могут также находиться в иммобилизованной форме (например, ассоциированы с носителем фермента), которая обеспечивает возможность взаимодействия WT SHC или производных SHC/HAC с субстратом (например, гомофарнезолом). WT SHC или производные SHC/HAC можно также использовать в растворимой форме.
В одном воплощении изобретения биокатализатор получают в достаточных количествах (для создания достаточной биомассы), собирают и промывают (и, возможно, хранят (например, в замороженном или лиофилизированном виде)) до стадии биоконверсии.
В следующем воплощении изобретения клетки получают в достаточных количествах (для создания достаточной биомассы), а затем регулируют реакционные условия без необходимости в сборе и промывании биокатализатора для реакции биоконверсии. Этот одностадийный способ (или способ реакции, протекающей в одном реакционном сосуде) обладает преимуществом, поскольку он упрощает процесс, при этом снижая затраты. Питательная среда для культивирования, используемая для выращивания клеток, также приемлема для использования в реакции биоконверсии при условии регулирования реакционных условий таким образом, чтобы способствовать реакции биоконверсии.
Оптимум рН для выращивания клеток находится в диапазоне 6,0-7,0. Оптимум рН для реакции биоконверсии зависит от типа используемого фермента SHC/HAC в реакции биоконверсии. рН регулируют, используя методы, хорошо известные специалистам в данной области техники.
Как показано в примере 9, для биоконверсии гомофарнезола в (-)-амброксид использовали способ «реакции, протекающей в одном реакционном сосуде», с коэффициентом конверсии 100%. Как показано в примере 18, для биоконверсии гомофарнезола в (-)-амброксид использовали способ «реакции, протекающей в одном реакционном сосуде», с коэффициентом конверсии 99%.
При использовании в настоящем описании любая ссылка на коэффициент конверсии 99%/100% для субстрата гомофарнезола в (-)-амброксид представляет собой ссылку на 99%/100% коэффициент конверсии 99%/100% для изомера гомофарнезола (т.е. ЕЕН), способного к конверсии в (-)-амброксид с использованием фермента, представляющего собой WT SHC/HAC или производное SHC/HAC.
Хотя в настоящем описании термины «смесь» или «реакционная смесь» можно использовать взаимозаменяемо с термином «питательная среда» (особенно по отношению к «реакции, протекающей в одном реакционном сосуде»), следует отметить, что для выращивания клеток для создания достаточного количества биомассы требуется питательная/ферментационная среда для культивирования клеток, а для стадии биоконверсии питательная среда не требуется, поскольку для реакции достаточно буферного раствора при подходящем рН.
Способы биоконверсии по настоящему изобретению осуществляют в условиях времени, температуры, рН и в присутствии солюбилизирующего агента, что обеспечивает превращение исходного сырья гомофарнезола в (-)-амброксид. рН реакционной смеси может находиться в диапазоне 4-8, предпочтительно от 5 до 6,5, более предпочтительно 4,8-6,0 для производных фермента SHC/HAC и в диапазоне для рН от приблизительно 5,0 до рН приблизительно 7,0 для фермента WT SHC, и его можно поддерживать путем добавления к реакционной смеси буферных растворов. Примером буферного раствора для этой цели является буферный раствор лимонной кислоты. Предпочтительная температура составляет от приблизительно 15°С до приблизительно 45°С, предпочтительно от приблизительно 20°С до приблизительно 40°С, хотя для термофильных организмов она может быть выше, вплоть до 55°С, особенно при использовании фермента WT (например, WT SHC/HAC) из термофильного микроорганизма. Температуру можно поддерживать постоянной или изменять в процессе биоконверсии.
Автор изобретения продемонстрировал, что может быть полезным включение в реакцию биоконверсии солюбилизирующего агента (например, поверхностно-активного вещества (ПАВ), детергента, усилителя растворимости, смешиваемого с водой органического растворителя и т.п.). Используемый в настоящем описании термин «поверхностно-активное вещество» означает компонент, который снижает поверхностное натяжение (или межфазное натяжение) между двумя жидкостями или между жидкостью и твердым веществом. Поверхностно-активные вещества могут действовать как детергенты, смачивающие вещества, эмульгаторы, пенообразующие средства и диспергирующие средства. Примеры поверхностно-активных веществ включают, без ограничений, Тритон Х-100, Твин 80, тауродезоксихолат, тауродезоксихолат натрия, додецилсульфат натрия (SDS) и/или лаурилсульфат натрия (SLS).
Хотя Тритон Х-100 можно использовать для частичной очистки фермента WT SHC/HAC или производного SHC/HAC (в растворимой или мембранной фракции/суспензионной форме), его также можно использовать в реакции биоконверсии (см., например, описание Seitz (2012, диссертация PhD, цитируется выше), а также описание в публикации Neumann и Simon (1986, цитируется выше) и JP 2009060799.
Однако неожиданно, как показано в примере 14, автор изобретения выбрал и идентифицировал SDS как особенно предпочтительное солюбилизирующее средство из большого перечня других солюбилизирующих средств, используемых реже. В частности, автор изобретения идентифицировал SDS как значительно лучшее солюбилизирующее средство, чем, например, Тритон Х-100, в отношении скорости реакции и выхода реакции биоконверсии гомофарнезола в (-)-амброксид (при использовании ЕЕН как при 4 г/л, так и при 125 г/л). Как показывают сравнительные данные в примере 12, автор изобретения продемонстрировал, что максимальная активность по меньшей мере одного производного SHC/HAC для биоконверсии гомофарнезола в (-)-амброксид с Тритоном Х-100 (в диапазоне концентрации от около 0,005% до 0,48%) в реакции составляла лишь около 20% активности, полученной с SDS (при концентрации около 0,07%).
Не желая ограничиваться теорией, считают, что применение SDS с рекомбинантными клетками-хозяевами микроорганизма может обладать преимуществом в связи с тем, что SDS может взаимодействовать преимущественно с мембраной клетки-хозяина, что делает фермент SHC (который является мембраносвязанным ферментом) более доступным для субстрата гомофарнезола. Кроме того, включение SDS в реакционную смесь в подходящей концентрации может улучшить свойства эмульсии (гомофарнезол в воде) и/или улучшить доступ субстрата гомофарнезола для фермента SHC внутри клетки-хозяина, в то же время предотвращая разрушение, например денатурацию фермента SHC (WT или производного SHC/HAC).
На концентрацию солюбилизирующего агента (например, SDS), используемого в реакции биоконверсии, влияет количество биомассы и концентрация субстрата (ЕЕН). Таким образом, существует некоторая степень взаимозависимости между концентрацией солюбилизирующего агента (например, SDS), количеством биомассы и концентрацией субстрата (ЕЕН). В качестве примера, при повышении концентрации субстрата гомофарнезола для эффективного протекания реакции биоконверсии требуются достаточные количества биокатализатора и солюбилизирующего агента (например, SDS). Например, в случае слишком низкой концентрации солюбилизирующего агента (например, SDS) может наблюдаться субоптимальная конверсия гомофарнезола. С другом стороны, например, при слишком высокой концентрации солюбилизирующего агента (например, SDS) может быть риск повреждения биокатализатора за счет разрушения интактной клетки микроорганизма и/или денатурации/инактивации фермента SHC/HAC.
Выбор приемлемой концентрации SDS в контексте количества биомассы и концентрации субстрата (ЕЕН) находится в пределах компетенции специалистов в данной области техники. В качестве примера, специалистам в данной области техники доступна прогностическая модель определения приемлемой концентраций SDS, субстрата (ЕЕН) и биомассы. В качестве дополнительного примера, в примере 3 показано, что концентрация SDS в диапазоне 0,010-0,075% является подходящей при использовании 4 г/л ЕЕН и биокатализатора при OD 10,0 (650 нм). В примере 7 показано, что при использовании 125 г/л ЕЕН с 2-кратной массой сырой биомассы приемлема скорректированная концентрация SDS (1,55%). Тем не менее исследование процентной доли конверсии ЕЕН в (-)-амброксид с использованием различных значений отношения SDS/клетки показало, что правильный выбор соотношения биокатализатора, субстрата гомофарнезола и солюбилизирующего агента (например, SDS) способствует разработке надежной системы реакции биоконверсии, которая демонстрирует определенную степень толерантности к диапазону концентраций SDS (см., например, Фиг. 17) и диапазонам рН (см. пример 15, Фиг. 18).
Температура реакции биоконверсии для фермента WT SHC (например, AacSHC) составляет приблизительно 45-60°С, предпочтительно 55°С.
Диапазон рН реакции биоконверсии для фермента WT SHC (например, AacSHC) составляет от приблизительно 5,0 до 7,0, более предпочтительно от приблизительно 5,6 до приблизительно 6,2, даже более предпочтительно приблизительно 6,0.
Температура реакции биоконверсии для производного фермента SHC/HAC составляет от приблизительно 34°С до приблизительно 50°С, предпочтительно приблизительно 35°С.
рН реакции биоконверсии для производного фермента SHC/HAC составляет приблизительно 4,8-6,4, предпочтительно приблизительно 5,2-6,0.
Предпочтительно солюбилизирующий агент, используемый в реакции биоконверсии, представляет собой SDS.
Концентрация SDS, используемая в реакции биоконверсии для фермента WT SHC (например, AacSHC), находится в диапазоне приблизительно 0,010-0,075%, предпочтительно приблизительно 0,030% при использовании приблизительно 4 г/л ЕЕН.
Концентрация SDS, используемая в реакции биоконверсии для производного фермента SHC/HAC, находится в диапазоне приблизительно 0,0025-0,090%, предпочтительно приблизительно 0,050% при использовании приблизительно 4 г/л ЕЕН.
При загрузке в реакционную смесь гомофарнезола при концентрации ЕЕН приблизительно 4 г/л ЕЕН биокатализатор загружают в реакционную смесь при OD 10,0 (650 нм)
Отношение [SDS]/[клетки] находится в диапазоне приблизительно 10:1-20:1, предпочтительно приблизительно 15:1-18:1, предпочтительно приблизительно 16:1, когда отношение количества биокатализатора к количеству гомофарнезола ЕЕН составляет приблизительно 2:1
Концентрация SDS в реакции биоконверсии для варианта фермента SHC находится в диапазоне приблизительно 1-2%, предпочтительно в диапазоне приблизительно 1,4-1,7%, еще более предпочтительно приблизительно 1,5% при концентрации гомофарнезола, составляющей приблизительно 125 г/л ЕЕН, и концентрации биокатализатор а, составляющей 250 г/л (соответствующей OD приблизительно 175 (650 нм)).
Отношение биокатализатора к субстрату гомофарнезолу ЕЕН находится в диапазоне приблизительно 0,5:1-2:1, в некоторых воплощениях изобретения 2:1, предпочтительно приблизительно 1:1 или 0,5:1.
В некоторых воплощениях изобретения амброксид получают с помощью биокатализатора, к которому добавляют субстрат гомофарнезол. Субстрат можно добавлять путем подачи с использованием известных средств (например, перистальтического насоса, инфузионного шприца и т.п.). Гомофарнезол является маслорастворимым соединением и предоставляется в масляной форме. С учетом того, что биокатализатор (клетки микроорганизмов, такие как интактная рекомбинантная целая клетка и/или клеточный дебрис и/или иммобилизованный фермент) находится в водной фазе, при добавлении гомофарнезола к реакционной смеси биоконверсии реакцию биоконверсии можно рассматривать как трехфазную систему (содержащую водную фазу, твердую фазу и масляную фазу). Это происходит даже в случае присутствия SDS. В качестве пояснения, при использовании в качестве биокатализатора растворимого WT SHC или SHC/HAC эту систему рассматривают как двухфазную.
Число присутствующих изомеров гомофарнезола может влиять на скорость реакции. Как показано в примере 11, производное фермента SHC/HAC способно к биоконверсии Е,Е-гомофарнезола в (-)-амброксид из сложной смеси изомеров гомофарнезола (например, EE:EZ:ZE:ZZ). Тем не менее, как правило, наблюдается снижение коэффициента конверсии, что согласуется с точкой зрения, что изомеры гомофарнезола, отличающиеся от ЕЕН, могут конкурировать с ЕЕН за доступ к производным фермента SHC/HAC и, следовательно, могут действовать как конкурентные ингибиторы конверсии ЕЕН в (-)-амброксид и/или также действовать в качестве альтернативных субстратов.
Соответственно, предпочтительно субстрат гомофарнезола содержит стереоизомерную смесь из 2-4 изомеров, предпочтительно из двух изомеров.
Соответственно, предпочтительно субстрат гомофарнезола состоит или по существу состоит из стереоизомерной смеси из 2-4 изомеров, предпочтительно из двух изомеров.
Предпочтительно субстрат гомофарнезола содержит стереоизомерную смесь EE:EZ.
Предпочтительно субстрат гомофарнезола состоит или по существу состоит из стереоизомерной смеси EE:EZ.
Как показано в примере 9, 100% конверсию смеси EE:EZ в массовом отношении 87:13 наблюдали в реакции ферментации и биоконверсии, «протекающей в одном реакционном сосуде», которую проводят в течение периода 22,5 дня. За этот период времени приблизительно 10 г ЕЕН претерпевало превращение.
Как подробно описано в примере 7, в предпочтительном воплощении изобретения используют ферментер для выращивания рекомбинантной клетки-хозяина, экспрессирующей ген производного SHC/HAC и продуцирующей активные производные ферментов SHC/HAC, до достаточной концентрации биомассы, приемлемой для использования в качестве биокатализатора, который используют в качестве биокатализатора в том же ферментере, который используют для конверсии источника гомофарнезола в (-)-амброксид в смеси с одним или более чем одним из побочных продуктов (II), (IV) и/или III (как показано, например, на Фиг. 12). Полученный в результате (-)-амброксид можно выделить путем экстракции/дистилляции паром или экстракции органическим растворителем, используя растворитель, не смешиваемый с водой (чтобы отделить продукты реакции и не прореагировавший субстрат от биокатализатора, который остается в водной фазе) с последующим выпариванием растворителя с получением неочищенного продукта реакции, который определяют с помощью анализа методом газовой хроматографии (GC). Способы экстракции/дистилляции паром и экстракции органическим растворителем известны специалистам в данной области техники.
В качестве примера, полученный в результате (-)-амброксид можно экстрагировать из всей реакционной смеси, используя органический растворитель, такой как не смешиваемый с водой растворитель (например, толуол). Альтернативно, полученный в результате (-)-амброксид можно выделить из твердой фазы реакционной смеси (полученной, например, центрифугированием или фильтрованием), используя смешиваемый с водой растворитель (например, этанол) или не смешиваемый с водой растворитель (например, толуол). В качестве следующего примера, (-)-амброксид присутствует в твердой фазе в виде кристаллов или в аморфной форме, и его можно отделить от остальной твердой фазы (клеточного материала или его дебриса) и жидкой фазы также с помощью фильтрования. В качестве следующего примера, при температуре выше температуры плавления (-)-амброксида (около 75°С) (-)-амброксид может образовать масляный слой на поверхности водной фазы, при этом масляный слой можно удалить и собрать. Чтобы обеспечить полное извлечение (-)-амброксида после удаления масляного слоя к водной фазе, содержащей биомассу, для экстракции любого остаточного (-)-амброксида, содержащегося в биомассе или вокруг биомассы, можно добавлять органический растворитель. Органический слой можно объединять с масляным слоем, после чего все вместе подвергают дополнительной обработке для выделения и очистки (-)-амброксида.
(-)-Амброксид можно дополнительно подвергать селективной кристаллизации для удаления побочных продуктов (II), (IV) и (III) и любого непрореагировавшего субстрата гомофарнезола из конечного продукта (-)-амброксида. Термин «селективная кристаллизация» относится к стадии процесса, посредством которого вызывают кристаллизацию (-)-амброксида из растворителя, при этом соединения (II), (III) и (IV) остаются в растворе кристаллизационного растворителя в такой степени, чтобы изолированный кристаллический материал содержал только продукт (-)-амброксид, или в случае содержания в нем каких-либо других соединений (II), (III) или (IV) они присутствовали только в ольфакторно приемлемых количествах.
На стадии селективной кристаллизации можно использовать смешиваемый с водой растворитель, такой как этанол или подобный растворитель. Ольфакторную чистоту конечного продукта (-)-амброксида определяют, используя 10% этанольный экстракт в воде, или путем тестирования кристаллического вещества. Конечный продукт (-)-амброксид тестируют в сравнении с имеющимся в продаже эталонным продуктом (-)-амброксидом в отношении его ольфакторной чистоты, качества и сенсорного профиля. Также проводят тестирование материала (-)-амброксида экспертами в исследованиях применения с целью определения соответствия материала спецификациям в отношении органолептического профиля. Различные применения (-)-амброксида включают, без ограничений, высококачественные ароматизирующие или потребительские продукты, такие как продукты по уходу за тканями, гигиено-косметические продукты, продукты для заботы о красоте и чистящие продукты, включая по существу все продукты, где используют доступные в настоящее время коммерчески применяемые ингредиенты, содержащие амброксид, включающие без ограничений: Ambrox (Firmenich), Ambroxan (Henkel), Ambrofix (Givaudan), Amberlyn (Quest), Cetalox Laevo (Firmenich), Ambermor (Aromor) и/или Norambrebolide Ether (Pacific).
На селективную кристаллизацию (-)-амброксида может влиять присутствие непрореагировавшего субстрата гомофарнезола, а также соотношение количеств (-)-амброксида и других обнаружимых побочных продуктов (II), (III) и/или (IV). Селективная кристаллизация все еще возможна даже в случае получения только 10% конверсии субстрата гомофарнезола в (-)-амброксид (как показано в примере 7 с использованием фермента WT SHC/HAC).
Примеры приемлемых смешиваемых с водой и не смешиваемых с водой органических растворителей, приемлемых для использования в экстракции и/или селективной кристаллизации (-)-амброксида, включают, без ограничений, алифатические углеводороды, предпочтительно имеющие от 5 до 8 атомов углерода, такие как пентан, циклопентан, гексан, циклогексан, гептан, октан или циклооктан, галогенированные алифатические углеводороды, предпочтительно имеющие один или два атома углерода, такие как дихлорметан, хлороформ, тетрахлорид углерода, дихлорэтан или тетрахлорэтан, ароматические углеводороды, такие как бензол, толуол и ксилолы, хлорбензол или дихлорбензол, алифатические ациклические и циклические простые эфиры или спирты, предпочтительно имеющие от 4 до 8 атомов углерода, такие как этанол, изопропанол, диэтиловый эфир, метил-трет-бутиловый эфир, этил-трет-бутиловый эфир, дипропиловый эфир, диизопропиловый эфир, дибутиловый эфир, тетрагидрофуран, или сложные эфиры, такие как этилацетат или н-бутилацетат, или кетоны, такие как метилизобутилкетон или диоксан, или их смеси. Особенно предпочтительно применяемыми растворителями являются упомянутые выше гептан, метил трет-бутиловый эфир (также известный как МТВЕ, трет-бутилметиловый эфир, третичный бутилметиловый эфир и третВМЕ), диизопропиловый эфир, тетрагидрофуран, этилацетат и/или их смеси.
Предпочтительно смешиваемый с водой растворитель, такой как этанол, используют для экстракции (-)-амброксида из твердой фазы реакционной смеси. Применение этанола обладает преимуществом, поскольку он прост в обращении, нетоксичен и благоприятен для окружающей среды.
Используемый в настоящем описании термин «изолированный» относится к продукту биоконверсии, такому как (-)-амброксид, который был отделен или очищен от сопутствующих ему компонентов. Объект, продуцируемый клеточной системой, отличающейся от источника, из которого она имеет происхождение в природе, является изолированным, поскольку он обязательно будет свободен от компонентов, сопутствующих ему в природе. Степень изоляции или чистоты можно измерить любым подходящим способом, например, с помощью анализа методом газовой хроматографии (GC), высокоэффективной жидкостной хроматографии (HPLC) или ядерного магнитного резонанса (NMR).
В некоторых воплощениях изобретения конечный продукт ((-)-амброксид) выделяют и очищают до однородности (например, по меньшей мере до 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% или 89,5% чистоты или 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 99,5% чистоты).
Желательно, количество продуцируемого (-)-амброксида может составлять от приблизительно 1 мг/л до приблизительно 20000 мг/л (20 г/л) или более, например от приблизительно 20 г/л до приблизительно 200 г/л или 100-200 г/л, предпочтительно приблизительно 125 г/л или 150 г/л или приблизительно 188 г/л.
Как показано в примере 7, по меньшей мере 125 г/л (-)-амброксида получают в реакции биоконверсии с использованием рекомбинантной клетки-хозяина Е. coli, продуцирующей производное фермента SHC/HAC, приблизительно за 2 дня.
Как показано в примере 19, можно проводить реакции биоконверсии при 188 г/л ЕЕН или более при условии достижения эффективного перемешивания, поскольку эффективность перемешивания, по-видимому, является единственным ограничением системы. Кроме того, биокатализатор с улучшенной активностью (например, в отношении вариантов SHC с дополнительно улучшенной активностью или в отношении повышенной производительности фермента SHC) может улучшить или сохранить производительность при использовании меньшего количества биомассы, что обладает преимуществом в отношении эффективности перемешивания.
Например, получают от приблизительно 1 до приблизительно 100 мг/л, от приблизительно 30 до приблизительно 100 мг/л, от приблизительно 50 до приблизительно 200 мг/л, от приблизительно 100 до приблизительно 500 мг/л, от приблизительно 100 до приблизительно 1000 мг/л, от приблизительно 250 до приблизительно 5000 мг/л, от приблизительно 1000 (1 г/л) до приблизительно 15000 мг/л (15 г/л) или от приблизительно 2000 (2 г/л) до приблизительно 10000 мг/л (10 г/л) или от приблизительно 2000 (2 г/л) до приблизительно 25000 мг/л (25 г/л) или от приблизительно 2000 (2 г/л) до приблизительно 25000 мг/л (25 г/л), 26000 мг/л (26 г/л), 27000 мг/л (27 г/л), 28000 мг/л (28 г/л), 29000 мг/л (29 г/л), 30000 мг/л (30 г/л), 40 г/л, 50 г/л, 60 г/л, 70 г/л, 80 г/л, 90 г/л, 100 г/л, 110 г/л, 120 г/л, 125 г/л, 130 г/л, 140 г/л, 150 г/л, 160 г/л, 170 г/л, 180 г/л, 190 г/л, или 200 г/л, или 300 г/л, или 400 г/л, или 500 г/л (-)-амброксида.
Предпочтительно за период времени от 48 до 72 часов получают (-)-амброксид в концентрации по меньшей мере 100 г/л.
Предпочтительно за период времени от приблизительно 48 до 72 часов получают (-)-амброксид в концентрации приблизительно 150 г/л.
Предпочтительно за период времени от приблизительно 48 до 72 часов получают (-)-амброксид в концентрации приблизительно 200 г/л.
Предпочтительно за период времени от приблизительно 48 до 72 часов получают (-)-амброксид в концентрации приблизительно 250 г/л.
Специалисту в данной области техники должно быть понятно, что более высокие совокупные титры продуктивности могут быть достигнуты путем применения непрерывного процесса, такого как извлечение продукта, подача субстрата и добавление или (частичная) замена биомассы.
Предпочтительно биоконверсия ЕЕН в (-)-амброксид в присутствии рекомбинантной клетки-хозяина, содержащей WT SHC/HAC или производное SHC/HAC приводит к выходу амброксида, составляющему 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 молярных процентов от используемого числа моль ЕЕН; особенно предпочтительно выход составляет от 5 до 100, от 10 до 100, 100, от 25 до 100, от 30 до 100, от 35 до 100, в частности, от 40 до 100, от 45 до 100, от 50 до 100, от 60 до 100, от 70 до 100 молярных процентов.
Активность фермента SHC/HAC определяют на основании коэффициента скорости реакции (количество продукта/(количество продукта + количество остаточного исходного материала)) × 100) в молярных процентах. Предпочтительно биоконверсия ЕЕН в (-)-амброксид в присутствии WT SHC/HAC или производного фермента SHC/HAC приводит к выходу (-)-амброксида, составляющему 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 молярных процентов от используемого числа моль ЕЕН; особенно предпочтительно выход составляет от 5 до 100, от 10 до 100, от 20 до 100, от 25 до 100, от 30 до 100, от 35 до 100, в частности, от 40 до 100, от 45 до 100, от 50 до 100, от 60 до 100, от 70 до 100.
В предпочтительном воплощении изобретения выход и/или коэффициент скорости реакции определяют за определенный период времени, например, 4, 6, 8, 10, 12, 16, 20, 24, 36 или 48 часов, в течение которого ЕЕН конвертируется в (-)-амброксид рекомбинантной клеткой-хозяином, содержащей нуклеотидную последовательность, кодирующую WTSHC или производное фермента SHC/HAC согласно настоящему изобретению. В следующем варианте реакцию проводят в точно определенных условиях, например, при 25°С, 30°С, 40°С, 50°С или 60°С. В частности, выход и/или коэффициент скорости реакции определяют путем проведения реакции конверсии ЕЕН в (-)-амброксид производными фермента SHC/HAC согласно изобретению при 35°С за период 24-72 часа.
В следующем воплощении настоящего изобретения рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность, кодирующую производное SHC/HAC, характеризуется тем, что она проявляет 2-, 3-, 4-, 5-, 6-, 7-, 8-, 9-, 10-, 11-, 12-, 13-, 14-, 15-, 16-, 17-, 18-, 19-, 20-, 21-, 22-, 23-, 24-, 25-, 26-, 27-, 28-, 29-, 30-, 31-, 32-, 33-, 34-, 35-, 36-, 37-, 38-, 39-, 40-, 41-, 42-, 43-, 44-, 45-, 46-, 47-, 48-, 49-, 50-, 51-, 52-, 53-, 54-, 55-, 56-, 57-, 58-, 59-, 60-, 61-, 62-, 63-, 64-, 65-, 66-, 67-, 68-, 69-, 70-, 71-, 72-, 73-, 74-, 75-, 76-, 77-, 78-, 79-, 80-, 81-, 82-, 83-, 84-, 85-, 86-, 87-, 88-, 89-, 90-, 91-, 92-, 93-, 94-, 95-, 96-, 97-, 98-, 99-, 100-, 200-, 500-, 1000-кратный или более высокий выход и/или коэффициент скорости реакции в реакции гомофарнезола с получением (-)-амброксида по сравнению с WT SHC или производным фермента SHC/HAC в одинаковых условиях. В данном случае термин «условие» относится к условиям реакции, таким как концентрация субстрата, концентрация фермента, период и/или температура реакции.
Успешная разработка способа биоконверсии для получения (-)-амброксида из гомофарнезола в рекомбинантном штамме Е. coli, содержащем нуклеотидную последовательность, кодирующую WT/эталонный SHC или производное SHC/HAC, может обеспечить снижение затрат и экономичный с промышленной точки зрения процесс производства (-)-амброксида.
Как показано в примере 7, настоящее изобретение обеспечивает 100% конверсию E,Е-гомофарнезола (125 г/л) в (-)-амброксид после 48 часов инкубации с оптимизированным производным SHC/HAC с 8-кратным улучшением выхода при использовании производного AacSHC по сравнению с ферментом WT AacSHC (см. Фиг. 11).
Для использования в получении амброксида в рекомбинантной клетке-хозяине также приемлемы функциональные гомологи полипептидов эталонного WT SHC/HAC или производного SHC/HAC, описанных в настоящем описании. Таким образом, рекомбинантная клетка-хозяин может включать в себя одну или более чем одну гетерологичную нуклеиновую кислоту, кодирующую функциональные гомологи описанных выше полипептидов, и/или гетерологичную нуклеиновую кислоту, кодирующую производное фермента SHC/HAC, как описано в настоящем описании.
Функциональный гомолог представляет собой полипептид, обладающий подобием последовательности с эталонным полипептидом и осуществляющий одну или более биохимических или физиологических функций эталонного полипептида. Функциональный гомолог и эталонный полипептид могут представлять собой встречающиеся в природе полипептиды, и подобие последовательностей может быть результатом конвергентных или дивергентных эволюционных событий. Как таковые, функциональные гомологи иногда обозначают в литературе как гомологи, ортологи или паралоги. Сами варианты встречающихся в природе функциональных гомологов, такие как полипептиды, кодируемые мутантами кодирующей последовательности дикого типа, могут быть функциональными гомологами. Функциональные гомологи можно также создать посредством сайт-направленного мутагенеза кодирующей последовательности для полипептида или комбинирования доменов из кодирующих последовательностей для различных встречающихся в природе полипептидов («замены доменов»). Методы модификации генов, кодирующих описанные выше функциональные гомологи, известны и включают среди прочего методы направленного развития, методы сайт-направленного мутагенеза и методы случайного мутагенеза и могут быть полезны для повышения специфической активности полипептида, изменения субстратной специфичности, изменения уровней экспрессии, изменения субклеточной локализации или модификации взаимодействий между полипептидами требуемым образом. Такие модифицированные полипептиды считают функциональными гомологами. Термин «функциональный гомолог» иногда применяют к нуклеиновой кислоте, кодирующей функционально гомологичный полипептид.
Функциональные гомологи можно идентифицировать с помощью анализа выравнивания нуклеотидных и аминокислотных последовательностей. Например, при проведении поиска нуклеотидных или полипептидных последовательностей в базе данных можно идентифицировать гомологи нуклеиново-кислотных последовательностей, кодирующих полипептиды производных SHC и т.п.
Для идентификации функциональных гомологов и/или в качестве меры гомологии между двумя нуклеотидными последовательностями можно также использовать гибридизацию. В качестве зонда для гибридизации можно использовать нуклеиново-кислотную последовательность, кодирующую любой из раскрытых в настоящем описании белков в соответствии со стандартными методами гибридизации. Гибридизация зонда с ДНК или РНК из тестируемого источника (например, из клетки млекопитающего) является показателем присутствия релевантной ДНК или РНК в тестируемом источнике. Условия гибридизации известны специалистам в данной области техники, и их можно найти в руководстве Current Protocols in Molecular Biology, John Wiley & Sons, N.Y., 6.3.1-6.3.6, 1991. Умеренные условия гибридизации определяют как эквивалентные гибридизации в 2х растворе хлорида натрия/цитрата натрия (SSC) при 30°С с последующей отмывкой в 1x SSC, 0,1% SDS при 50°С. Условия высокой степени жесткости определяют как эквивалентные гибридизации в 6х растворе хлорида натрия/цитрата натрия (SSC) при 45°С с последующей отмывкой в 0,2х SSC, 0,1% SDS при 65°С.
Анализ последовательностей для идентификации функциональных гомологов может также включать в себя анализ неизбыточных баз данных BLAST, Reciprocal BLAST или PSI-BLAST с использованием релевантной аминокислотной последовательности в качестве эталонной последовательности. В некоторых случаях аминокислотную последовательность выводят из нуклеотидной последовательности. Полипептиды в базе данных, имеющие более 40% идентичности последовательности, являются кандидатами для дополнительной оценки на пригодность для применения в реакции биоконверсии SHC/HAC. Подобие аминокислотных последовательностей дает возможность проведения консервативных аминокислотных замен, таких как замена одного гидрофобного остатка другим или замена одного полярного остатка другим. При желании можно проводить проверку таких кандидатов вручную, чтобы сузить число кандидатов для дальнейшей оценки. Проверку вручную можно проводить путем отбора тех кандидатов, в которых выявляются, например, консервативные функциональные домены.
Как правило, полипептиды, обладающие по меньшей мере приблизительно 30% идентичностью аминокислотной последовательности, полезны для идентификации консервативных областей. Консервативные области родственных полипептидов обладают по меньшей мере 30%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% идентичностью аминокислотной последовательности. В некоторых воплощениях изобретения консервативная область обладает по меньшей мере 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью аминокислотной последовательности. Идентичность аминокислотной последовательности можно определять, как описано выше и ниже.
Продуцируемый фермент WTSHC и/или производное фермента SHC/HAC основан на аминокислотной последовательности SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или их варианте, гомологе, мутанте, производном или фрагменте.
Продуцируемый фермент SHC основан на аминокислотной последовательности, обладающей по меньшей мере 30%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4.
Кроме того, продуцируемый эталонный SHC основан на аминокислотной последовательности, продуцируемой в Е. coli.
Процент (%) идентичности в отношении нуклеотидной последовательности гена определяют как процентную долю нуклеотидов в последовательности-кандидате ДНК, идентичных нуклеотидам в последовательности ДНК после выравнивания последовательности и при необходимости введения гэпов для достижения максимального процента идентичности последовательности, и не считают какие-либо консервативные замены как часть идентичности последовательности. Выравнивание в целях определения процента идентичности нуклеотидных последовательностей может быть достигнуто различными путями, находящимися в пределах компетенции специалистов в данной области техники, например, при использовании общедоступного компьютерного программного обеспечения. Специалисты в данной области техники могут определить подходящие параметры для измерения выравнивания, включая любые алгоритмы, требующиеся для достижения максимального выравнивания на протяжении всей длины сравниваемых последовательностей.
Термины «полипептид» и «белок» в настоящем описании используют взаимозаменяемо, и они означают любую цепь связанных пептидной связью аминокислот независимо от ее длины и посттрансляционных модификаций.
Используемый в настоящем описании термин «производное» включает, без ограничений, вариант. Термины «производное» и «вариант» в настоящем описании используют взаимозаменяемо
Используемый в настоящем описании термин «вариант» следует понимать как полипептид, который отличается по сравнению с полипептидом, от которого он имеет происхождение, одним или более чем одним изменением в аминокислотной последовательности. Полипептид, от которого имеет происхождение вариант, также известен как исходный или эталонный полипептид. Как правило, вариант конструируют искусственным путем, предпочтительно с использованием генных технологий. Как правило, полипептид, от которого имеет происхождение вариант, представляет собой белок дикого типа или домен белка дикого типа. Однако варианты, которые можно использовать в настоящем изобретении, могут также иметь происхождение от гомологов, ортологов или паралогов родительского полипептида или от искусственно сконструированных вариантов при условии, что этот вариант проявляет по меньшей мере одну биологическую активность родительского полипептида. Изменения в аминокислотной последовательности могут представлять собой замены аминокислот, инсерции, делеции, N-концевые укорочения или С-концевые укорочения или любую комбинацию этих изменений, которые могут встречаться в одном или нескольких сайтах.
В предпочтительных воплощениях изобретения вариант, который можно использовать в настоящем изобретении, характеризуется общим числом изменений в аминокислотной последовательность вплоть до 200 (вплоть до 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 или 200) (т.е. замен, инсерций, делеций, N-концевых укорочений и/или С-концевых укорочений). Аминокислотные замены могут быть консервативными и/или неконсервативными. В предпочтительных воплощениях изобретения вариант, который можно использовать в настоящем изобретении, отличается от белка или домена, от которого он имеет происхождение, заменами аминокислот, предпочтительно консервативными заменами аминокислот, в количестве вплоть до 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 или 100. Варианты могут дополнительно или альтернативно содержать делеции аминокислот, которые могут представлять собой N-концевые укорочения, С-концевые укорочения или внутренние делеции, либо любую их комбинацию. Такие варианты, содержащие N-концевые укорочения, С-концевые укорочения и/или внутренние делеции, в контексте настоящей заявки называют «делеционными вариантами» или «фрагментами». Термины «делеционный вариант» и «фрагмент» в настоящем описании используют взаимозаменяемо. Делеционный вариант может встречаться в природе (например, варианты сплайсинга) или может быть сконструирован искусственно, предпочтительно с помощью средств генных технологий. Как правило, белок или домен белка, от которого имеет происхождение делеционный вариант, представляет собой белок дикого типа. Однако делеционные варианты, которые можно использовать в настоящем изобретении, могут также иметь происхождение от гомологов, ортологов или паралогов родительского полипептида или от искусственно сконструированных вариантов при условии, что делеционные варианты проявляют по меньшей мере одну биологическую активность родительского полипептида. Предпочтительно делеционный вариант (или фрагмент) имеет делецию вплоть до 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 или 100 аминокислот на его N-конце и/или не его С-конце и/или внутри последовательности по сравнению с родительским полипептидом.
Используемый в настоящем описании «вариант» может быть альтернативно или дополнительно охарактеризован определенной степенью идентичности последовательности с родительским полипептидом, от которого он имеет происхождение. Вариант WT/эталонного SHC/HAC или производного SHC/HAC по настоящему изобретению может обладать по меньшей мере 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью последовательности соответствующего эталонного полипептида или соответствующего эталонного полинуклеотида.
Выражение «по меньшей мере 30%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере 81%, по меньшей мере 82%, по меньшей мере 83%, по меньшей мере 84%, по меньшей мере 85%, по меньшей мере 86%, по меньшей мере 87%, по меньшей мере 88%, по меньшей мере 89%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичности последовательности» на протяжении всего описания используют по отношению к сравнениям полипептидных и полинуклеотидных последовательностей.
Полинуклеотид, принадлежащий к семейству любого из раскрытых в настоящем описании ферментов, или белок можно идентифицировать на основании его подобия релевантному гену или белку соответственно. Например, идентификация может быть основана на идентичности последовательности. В некоторых предпочтительных воплощениях изобретение характеризуется изолированными молекулами нуклеиновой кислоты, по меньшей мере на 30%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, по меньшей мере на 81%, по меньшей мере на 82%, по меньшей мере на 83%, по меньшей мере на 84%, по меньшей мере на 85%, по меньшей мере на 86%, по меньшей мере на 87%, по меньшей мере на 88%, по меньшей мере на 89%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98% или по меньшей мере на 99% идентичными (а) молекуле нуклеиновой кислоты, кодирующей полипептид SEQ ID NO: 5-163 (см. таблицы 14-17 и таблицу 4а, приведенные в настоящем описании); (b) нуклеотидной последовательности SEQ ID NO: 6-168, 169, 170, 172, 174 и 176 (см. таблицы 14-17 и таблицу 4а, приведенные в настоящем описании) и (с) молекуле нуклеиновой кислоты, включающей в себя сегмент из по меньшей мере 30 (например, по меньшей мере 30, 40, 50, 60, 80, 100, 125, 150, 175, 200, 250, 300, 400, 500, 600, 700, 800, 850, 900, 950, 1000 или 1010) нуклеотидов SEQ ID NO: 6-168, 169, 170, 172, 174 и 176 (см. таблицы 14-17 и таблицу 4а, приведенные в настоящем описании).
Предпочтительно рассматриваемый полипептид и эталонный полипептид проявляют указанную идентичность последовательности на протяжении непрерывного отрезка из 20, 30, 40, 45, 50, 60, 70, 80, 90, 100 или более аминокислот. Предпочтительно рассматриваемый полинуклеотид и эталонный полинуклеотид проявляют указанную идентичность последовательности на протяжении непрерывного отрезка из 60, 90, 120, 135, 150, 180, 210, 240, 270, 300 или более нуклеотидов. В случае сравнения двух последовательностей и отсутствия уточненной эталонной последовательности, по сравнению с которой следует определять идентичность последовательности, идентичность последовательности следует рассчитывать по отношению к более длинной из двух подлежащих сравнению последовательностей, если конкретно не указано иное. Если эталонная последовательность указана, идентичность последовательности определяют на основании всей длины эталонной последовательности, указанной SEQ ID NO: 1, 2, 3 и/или 4, если конкретно не указано иное.
Например, пептидная последовательность, состоящая из 130 аминокислот, сравниваемая с аминокислотами полноразмерного эталонного SHC, содержащего 631 аминокислотный остаток, может проявлять максимальный процент идентичности последовательности 20,6% (130/631×100), а последовательность длиной 300 аминокислот может проявлять максимальный процент идентичности последовательности 47,5% (300/631×100). Подобие нуклеотидных и аминокислотных последовательностей, т.е. процент идентичности последовательности, можно определить посредством выравнивания последовательностей. Такие выравнивания можно осуществлять с помощью нескольких известных в данной области техники алгоритмов, предпочтительно с помощью математического алгоритма Karlin и Altschul (Karlin & Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5877), с помощью алгоритма hmmalign (пакет программ HMMER, http://hmmer.wustl.edu/) или с помощью алгоритма CLUSTAL (Thompson, J.D., Higgins, D.G. & Gibson, T.J. (1994) Nucleic Acids Res. 22, 4673-80), доступного, например, на сайте http://www.ebi.ac.uk/Tools/clustalw/ или на сайте http://www.ebi.ac.uk/Tools/clustalw2/index.html, или на сайте http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_clustalw.html или с помощью программы GAP (математического алгоритма университета Айовы), которую использовали при выравнивании последовательностей WTSHC, как представлено в таблице 18 настоящего документа, или с помощью математического алгоритма Myers и Miller (1989 - Cabios 4: 11-17), раскрытого и используемого при выравнивании последовательностей WTSHC в таблице 19, представленной в настоящем описании.
Предпочтительно используют параметры по умолчанию, представленные на сайте http://www.ebi.ac.uk/Tools/clustalw/ или http://www.ebi.ac.uk/Tools/clustalw2/index.html.
Степень идентичности последовательностей (совпадения последовательностей) можно рассчитать, используя, например, программы BLAST, BLAT или BlastZ (или BlastX). Подобный алгоритм включен в программы BLASTN и BLASTP Altschul et al (1990) J. Mol. Biol. 215, 403-410. Поиск полинуклеотидов BLAST проводят с помощью программы BLASTN, балл = 100, длина слова = 12, с получением полинуклеотидных последовательностей, гомологичных нуклеиновым кислотам, кодирующим релевантный белок.
Поиск белков BLAST выполняют с помощью программы BLASTP, балл = 50, длина слова = 3, с получением аминокислотных последовательностей, гомологичных полипептиду SrKO. Для получения выравнивания с использованием гэпов в сравнительных целях используют Gapped BLAST, как описано в публикации Altschul et al (1997) Nucleic Acids Res. 25, 3389-3402. При использовании программ BLAST и Gapped BLAST используют параметры соответствующих программ по умолчанию. Анализ совпадения последовательностей может быть дополнен установленными методами картирования по гомологии, такими как Shuffle-LAGAN (Brudno М., Bioinformatics 2003b, 19 Suppl 1:154-162) или метод марковских случайных полей. При ссылке на процент идентичности последовательностей в настоящей заявке эти проценты вычисляют по отношению ко всей длине более длинной последовательности, если конкретно не указано иное.
Сенсорный анализ продукта
В результате биоконверсии гомофарнезола в (-)-амброксид в соответствии с настоящим изобретением (-)-амброксид получают в качестве преобладающего соединения, но также могут быть получены соединения, отличающиеся от (-)-амброксида, которые могут придавать или не придавать приятные ольфакторные ноты смеси биоконверсии и, таким образом, могут положительным или отрицательным образом влиять на сенсорный характер конечного продукта (-)-амброксида. Соответственно, проводят сенсорный анализ, используя общепризнанные сенсорные тесты, которые проводят подготовленные эксперты (например, парфюмеры), и, таким образом, это тестирование может способствовать определению ольфакторной релевантности конечного продукта относительно эталонного продукта для химически релевантного целевого продукта. Как показывает сенсорный анализ в примере 22, удаление из (-)-амброксида одного или более соединений, представляющих собой побочные продукты, может улучшить запах остаточного соединения ((-)-амброксида) даже в том случае, когда удаляемые соединения как таковые не имеют запаха. Таким образом, усиление запаха (-)-амброксида наблюдали в отсутствие соединений II, III и IV.
Аспекты изобретения
1. Способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где (3Е,7Е)-гомофарнезол (ЕЕН) или смесь стереоизомеров, содержащую ЕЕН, конвертируют ферментативным путем в (-)-амброксид или в смесь, содержащую (-)-амброксид, где ферментативную конверсию осуществляют с использованием фермента SHC/HAC в реакционных условиях, подходящих для получения (-)-амброксида, и где смесь стереоизомеров, содержащая ЕЕН, по существу состоит из изомеров гомофарнезола, выбранных из группы, состоящей из [(3Е,7Е) и [(3Z,7E)] и/или [(3Е,7Е) и (3E,7Z)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенных как [EE:EZ], [EE:ZE] и [EE:EZ:ZE], соответственно.
2. Способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где (3Е,7Е)-гомофарнезол (ЕЕН) или смесь стереоизомеров, содержащую ЕЕН, ферментативно конвертируют с получением (-)-амброксида или смеси, содержащей (-)-амброксид, где ферментативную конверсию осуществляют с использованием фермента SHC/HAC в реакционных условиях, подходящих для получения (-)-амброксида, и где в случае проведения реакции в присутствии солюбилизирующего агента, Тритон Х-100 или тауродезоксихолат не используют в комбинации с ферментом SHC/HAC дикого типа.
3. Способ получения (-)-амброксида или смеси, содержащей (-)-амброксид, где (3Е,7Е)-гомофарнезол (ЕЕН) или смесь стереоизомеров, содержащую ЕЕН, конвертируют ферментативным путем в (-)-амброксид или в смесь, содержащую (-)-амброксид, где ферментативную конверсию осуществляют с использованием фермента SHC/HAC в реакционных условиях, подходящих для получения (-)-амброксида, и где смесь стереоизомеров, содержащая ЕЕН, по существу состоит из изомеров гомофарнезола, выбранных из группы, состоящей из [(3Е,7Е) и [(3Z,7E)] и/или [(3Е,7Е) и (3E,7Z)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенных как [EE:EZ], [EE:ZE] и [EE:EZ:ZE], соответственно, и где реакцию проводят в трехфазной системе, содержащей водную фазу, твердую фазу и масляную фазу.
4. Способ в соответствии с параграфом 1, или с параграфом 2, или с параграфом 3, который осуществляют с использованием полипептидной последовательности фермента SHC/HAC, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3; SEQ ID NO: 4, или производного SHC/HAC, выбранного из таблицы 1, таблицы 5, таблицы 2, таблицы 6, таблицы 3, таблицы 7, таблицы 4, таблицы 8 или таблицы 13, таблицы 14, или выбранного из SEQ ID NO: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 171, 173, 175, 177 и/или 178 или последовательности с по меньшей мере 30% идентичностью, по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 или SEQ ID NO: 4.
5. Способ по любому из параграфов 1-4, где используют рекомбинантные клетки-хозяева, продуцирующие фермент SHC/HAC.
6. Способ в соответствии с параграфом 4 или с параграфом 5, где нуклеотидная последовательность, кодирующая фермент SHC/HAC, выбрана из группы, состоящей из SEQ ID NO: 165, 166, 167, 168, 169 или SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 и/или 170, 172, 174 и/или 176.
7. Способ в соответствии с любым из параграфов 16, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8.
8. Способ в соответствии с любым из параграфов 17, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более чем одного из реакционных условий для фермента, представляющего собой SHC/HAC дикого типа или производное фермента SHC/HAC, которые представлены в таблице 24 или в таблице 24а, предпочтительно при рН в диапазоне от 5,0 до 6,2, предпочтительно при температуре 35°С.
9. Способ в соответствии с любым из параграфов 3-8, где соотношение SDS/клетки находится в диапазоне от 10:1 до 20:1, предпочтительно составляет 16:1 при соотношении биокатализатора и ЕЕН, которое составляет приблизительно 2:1.
10. Способ в соответствии с любым из параграфов 3-9, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5-2:1, предпочтительно составляет приблизительно 1:1 или 0,5:1.
11. Способ в соответствии с любым из параграфов 3-10, где стадии выращивания клеток и реакции биоконверсии осуществляют в одном реакционном сосуде.
12. Способ в соответствии с параграфом 2, где субстрат гомофарнезола содержит один или более чем один стереоизомер гомофарнезола.
13. Способ в соответствии с параграфом 12, где субстрат гомофарнезола содержит или по существу состоит из двух стереоизомеров гомофарнезола.
14. Способ в соответствии с параграфом 13, где субстрат гомофарнезола содержит или по существу состоит из стереоизомеров EE:EZ.
15. Способ в соответствии с параграфом 14, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29; 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39; и 60:40.
16. Способ в соответствии с параграфом 15, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 92:8; EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.
17. Способ в соответствии с параграфом 15 или с параграфом 16, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовом соотношении 80:20.
18. Способ в соответствии с любым из параграфов 1-17, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).
19. Способ в соответствии с любым из параграфов 1-18, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром или фильтрования.
20. Способ в соответствии с любым из параграфов 1-19, где (-)-амброксид выделяют из твердой фазы биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром.
21. Способ в соответствии с параграфом 19 или с параграфом 20, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.
22. Способ в соответствии с параграфом 21, где (-)-амброксид выделяют из реакционной смеси с использованием этанола или толуола.
23. Способ в соответствии с любым из параграфов 19-22, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.
24. Способ в соответствии с параграфом 23, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).
25. Способ в соответствии с любым из параграфов 1-24, где (-)-амброксид получают в диапазоне концентраций приблизительно 125-200 г/л.
26. (-)-Амброксид, получаемый способом по любому из параграфов 1-25, где (-)-амброксид имеет порог восприятия запаха от приблизительно 0,1 до приблизительно 0,5 нг/л.
27. (-)-Амброксид по параграфу 26 в твердой форме, предпочтительно в аморфной или кристаллической форме.
28. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по любому из параграфа 26 или параграфа 27.
29. Способ по параграфу 28, где продукт представляет собой ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.
30. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащий (-)-амброксид по любому из параграфа 26 или параграфа 27.
31. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 26 или параграфу 27 и один или более чем один дополнительный компонент.
32. Применение (-)-амброксида по параграфу 26 или параграфу 27 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.
33. Способ увеличения, усиления или придания аромата ароматизирующей композиции, включающий стадию смешивания с указанной ароматизирующей композицией продукта, увеличивающего или усиливающего аромат, полученного в соответствии со способом, включающим стадии:
(а) приготовления реакционной смеси, содержащей (-)-амброксид в смеси с одним или более чем одним из соединений побочных продуктов (II), (III) или (IV).
(б) экстрагирования (-)-амброксида в смеси с одним или более чем одним из соединений побочных продуктов (II), (III) или (IV); и
(в) селективной кристаллизации (-)-амброксида из экстракционной смеси;
где (-)-амброксид получают путем ферментативной конверсии (3Е,7Е)-гомофарнезола (ЕЕН) или смеси стереоизомеров, содержащей ЕЕН, с использованием фермента SHC/HAC в реакционных условиях, приемлемых для получения (-)-амброксида, и где смесь стереоизомеров, содержащая ЕЕН, по существу состоит из изомеров гомофарнезола, выбранных из группы, состоящей из [(3Е,7Е) и [(3Z,7E)] и/или [(3Е,7Е) и (3E,7Z)] и/или [(3Z,7E), (3Е,7Е) и (3E,7Z)], также обозначенную как [EE:EZ], [EE:ZE] и [EE:EZ:ZE], соответственно.
34. Способ по параграфу 33, где реакцию проводят в трехфазной системе, содержащей водную фазу, твердую фазу и масляную фазу.
35. Способ в соответствии с параграфом 33, или с параграфом 34, где процесс осуществляют с использованием фермента SHC/HAC с полипептидной последовательностью, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3; SEQ ID NO: 4, или производного SHC/HAC, выбранного из таблицы 1, таблицы 5, таблицы 2, таблицы 6, таблицы 3, таблицы 7, таблицы 4, таблицы 8 или таблицы 14, или выбранного из SEQ ID NO: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 171, 173, 175 и/или 178 или последовательности с по меньшей мере 30% идентичностью, по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 или SEQ ID NO: 4.
36. Способ по любому из параграфов 33-35, где используют рекомбинантные клетки-хозяева, продуцирующие фермент SHC/HAC.
37. Способ в соответствии с параграфом 35 или с параграфом 36, где нуклеотидная последовательность, кодирующая фермент SHC/HAC, выбрана из группы, состоящей из SEQ ID NO: 165, 166, 167, 168, 169 или SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 и/или 170, 172, 174 и/или 176.
38. Способ в соответствии с любым из параграфов 33-37, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8.
39. Способ в соответствии с любым из параграфов 33-38, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более чем одного из реакционных условий для фермента SHC/HAC дикого типа или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а, предпочтительно при рН в диапазоне от 5,0 до 6,2, предпочтительно при температуре 35°С.
40. Способ в соответствии с любым из параграфов 34-39, где соотношение SDS/клетки находится в диапазоне от 10:1 до 20:1, предпочтительно составляет 16:1 при соотношении биокатализатора и ЕЕН, которое составляет приблизительно 2:1.
41. Способ в соответствии с любым из параграфов 34-40, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5-2:1, предпочтительно составляет приблизительно 1:1 или 0,5:1.
42. Способ в соответствии с любым из параграфов 34-41, где стадии выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.
43. Способ в соответствии с любым из параграфов 33-42, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29; 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39; и 60:40.
44. Способ в соответствии с параграфом 43, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: EE:EZ 92:08; EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.
45. Способ в соответствии с параграфом 43 или с параграфом 44, где гомофарнезол содержит или по существу состоит из смеси стереоизомеров EE:EZ в массовом соотношении 80:20.
46. Способ в соответствии с любым из параграфов 33-45, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).
47. Способ в соответствии с любым из параграфов 33-46, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром или фильтрования.
48. Способ в соответствии с любым из параграфов 33-47, где (-)-амброксид выделяют из твердой фазы биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром.
49. Способ в соответствии с параграфом 47 или с параграфом 48, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.
50. Способ в соответствии с параграфом 49, где (-)-амброксид выделяют из реакционной смеси с использованием этанола или толуола.
51. Способ в соответствии с любым из параграфов 47-49, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.
52. Способ в соответствии с параграфом 51, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).
53. Способ в соответствии с любым из параграфов 33-52, где (-)-амброксид получают в диапазоне концентраций приблизительно 125-200 г/л.
54. Способ по любому из параграфов 33-53, где (-)-амброксид имеет порог восприятия запаха от приблизительно 0,1 до приблизительно 0,5 нг/л.
Дополнительные аспекты изобретения
1. Производное сквален-гопен-циклазы (SHC)/гомофарнезол-амброксид-циклазы (НАС), содержащее аминокислотную последовательность, имеющую 1-50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно SEQ ID NO: 1.
2. Производное SHC/HAC в соответствии с параграфом 1, где производное SHC содержит аминокислотную последовательность, имеющую от 1 до 40 мутаций, 1-30 мутаций, 1-20 мутаций, 1-10 мутаций или 1-6 мутаций относительно SEQ ID NO: 1.
3. Производное SHC/HAC в соответствии с параграфом 1 или с параграфом 2, где производное SHC содержит аминокислотную последовательность, обладающую по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью относительно SEQ ID NO: 1.
4. Производное SHC/HAC в соответствии с параграфом 3, где вариант SHC содержит аминокислотную последовательность, обладающую по меньшей мере 95% идентичностью SEQ ID NO: 1.
5. Производное SHC/HAC, содержащее 1-10 мутаций, независимо выбранных из замен, делеций или инсерций относительно SEQ ID NO: 1, где одна или более мутаций, отличающихся от мутации активного центра SHC, локализована/локализованы в домене 2 фермента SHC (Фиг. 19 и/или 20).
6. Производное SHC/HAC в соответствии с любым из параграфов 1-5, где одна или более мутаций относительно SEQ ID NO: 1 выбраны из таблицы 1, где, если выбрана только одна мутация, она представляет собой не F601Y.
7. Производное SHC/HAC по параграфу 6, где по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 мутаций выбраны из таблицы 1 или таблицы 5.
8. Производное SHC/HAC по параграфу 2, содержащее аминокислотную последовательность, которая имеет вплоть до 6 мутаций относительно SEQ ID NO: 1 и содержит по меньшей мере замены F601Y или M132R в комбинации с по меньшей мере одной или более из F129L и/или I432T.
9. Производное SHC/HAC в соответствии с параграфом 7, содержащее аминокислотную последовательность, имеющую вплоть до 8 изменений аминокислот относительно SEQ ID NO: 1 и, которое содержит одно или более чем одно изменение аминокислот в положении, выбранном из группы, состоящей из положений 77, 129, 132, 192, 224, 432, 579, 601 и 605 относительно SEQ ID NO: 1, где производное SHC/HAC обладает повышенной ферментативной активностью НАС относительно SEQ ID NO: 1.
10. Производное SHC/HAC в соответствии с параграфом 9, содержащее одну или более замен, выбранных из группы, состоящей из: Т77А, F129L, M132R, I92V, A224V, I432T, Q579H, F601Y и/или F605W относительно SEQ ID NO: 1.
11. Производное SHC/HAC в соответствии с параграфом 10, содержащее F601Y.
12. Производное SHC/HAC в соответствии с параграфом 10, содержащее F129L.
13. Производное SHC/HAC в соответствии с параграфом 10, содержащее F601Y и F129L.
14. Производное SHC/HAC в соответствии с параграфом 10, содержащее M132R и I432T.
15. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее аминокислотную замену A224V.
16. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F601Y.
17. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F129L.
18. Производное SHC/HAC в соответствии с параграфом 17, дополнительно содержащее F601Y.
19. Производное SHC/HAC в соответствии с параграфом 11, дополнительно содержащее Q579H.
20. Производное SHC/HAC в соответствии с параграфом 10, содержащее Т77А, и I92V, и F129L.
21. Производное SHC/HAC в соответствии с любым из параграфов 1-20, имеющее аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 и/или 171.
22. Изолированная нуклеотидная последовательность, кодирующая производное SHC в соответствии с любым из параграфов 1-21.
23. Изолированная нуклеотидная последовательность в соответствии с любым из параграфов 22, где нуклеотидная последовательность выбрана из группы, состоящей из SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 и/или 170.
24. Конструкция, содержащая нуклеотидную последовательность по параграфу 22 или параграфу 23.
25. Конструкция в соответствии с параграфом 24, содержащая промотор, функционально связанный с нуклеотидной последовательностью по параграфу 22 или 23.
26. Конструкция по параграфу 25, где промотор представляет собой индуцибельный или конститутивный промотор.
27. Вектор, содержащий конструкцию по любому из параграфов 24-26.
28. Вектор по параграфу 27, представляющий собой плазмиду.
29. Вектор в соответствии с параграфом 28, способный направлять экспрессию в клетках-хозяевах, выбранных из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.
30. Конструкция по любому из параграфов 24-26 или вектор в соответствии с любым из параграфов 27-29, где конструкция или вектор способны к интеграции в геном клетки-хозяина, выбранной из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.
31. Рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность в соответствии с параграфом 22 или 23, или конструкцию в соответствии с любым из параграфов 24-26 или 30, или вектор в соответствии с любым из параграфов 27-30.
32. Рекомбинантная клетка-хозяин в соответствии с параграфом 31, выбранная из группы прокариотических клеток-хозяев, состоящей из бактерий рода Escherichia, Streptomyces, Bacillus, Pseudomonas, Lactobacillus и Lactococcus.
33. Рекомбинантная клетка-хозяин по параграфу 32, представляющая собой клетку-хозяина Е. coli.
34. Рекомбинантная клетка-хозяин по параграфу 33, в которой происходит гиперэкспрессия гена, кодирующего производное SHC/HAC.
35. Способ получения производного SHC/HAC в соответствии с любым из параграфов 1-21, включающий стадию культивирования одной или более чем одной рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 в условиях, обеспечивающих возможность продуцирования производного фермента SHC/HAC.
36. Способ по параграфу 35, где культивирование клеток проводят в условиях, приемлемых для продуцирования биокатализатора.
37. Способ получения (-)-амброксида, включающий конверсию гомофарнезола в (-)-амброксид с использованием рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или с использованием рекомбинантной клетки-хозяина, содержащей SEQ ID NO: 169 или SEQ ID NO: 165, кодирующей WT SHC/HAC, где при использовании WT SHC/HAC биоконверсию гомофарнезола в (-)-амброксид проводят с солюбилизирующим агентом, отличающимся от Тритона Х-100 или тауродезоксихолата.
38. Способ в соответствии с параграфом 37, где конверсию гомофарнезола в (-)-амброксид проводят в подходящих реакционных условиях биоконверсии для WT SHC/HAC или производного фермента SHC/HAC.
39. Способ в соответствии с параграфом 37 или 38, где конверсию гомофарнезола в (-)-амброксид проводят при подходящих значениях рН, температуры, концентраций солюбилизирующего агента для WT SHC/HAC или производного фермента SHC/HAC.
40. Способ в соответствии с параграфом 39, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100 или тауродезоксихолата, для фермента WT SHC/HAC.
41. Способ в соответствии с любым из параграфов 37-40, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более одного из реакционных условий для фермента WT SHC/HAC или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а.
42. Способ по любому из параграфов 37-41, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5:1-2:1, предпочтительно составляет приблизительно 1:1 или 0,5:1.
43. Способ в соответствии с любым из параграфов 37-42, где стадии выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.
44. Способ в соответствии с любым из параграфов 37-43, где субстрат гомофарнезол содержит один или более стереоизомеров гомофарнезола.
45. Способ по параграфу 44, где субстрат гомофарнезол содержит два стереоизомера гомофарнезола.
46. Способ по параграфу 45, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.
47. Способ в соответствии с любым из параграфов 44-46, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 и 70:30.
48. Способ по параграфу 47, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.
49. Способ по параграфу 35 или 36, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении 80:20.
50. Способ по любому из параграфов 37-49, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).
51. Способ в соответствии с любым из параграфов 37-50, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром, или выделяют непосредственно кристаллы (-)-амброксида из биоконверсионной реакционной смеси с помощью фильтрования.
52. Способ в соответствии с параграфом 51, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.
53. Способ по параграфу 52, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.
54. Способ по параграфу 52 или 53, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).
55. (-)-Амброксид, получаемый способом по любому из параграфов 51-54.
56. (-)-Амброксид по параграфу 55 в твердой форме, предпочтительно в аморфной или кристаллической форме.
57. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по параграфу 55 или 56, предпочтительно в ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.
58. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащие (-)-амброксид по параграфу 55 или 56.
59. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 55 или 56 и один или более чем один дополнительный компонент.
60. Применение (-)-амброксида по параграфу 55 или 56 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта для ухода, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.
61. Применение производного фермента SHC/HAC по любому из параграфов 1-21, нуклеотидной последовательности в соответствии с параграфами 22 или 23, конструкции в соответствии с любым из параграфов 22-26 или 30, вектора в соответствии с любым из параграфов 27-30 или рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или рекомбинантной клетки-хозяина, экспрессирующей WT SHC/HAC, для биоконверсии гомофарнезола в (-)-амброксид, где фермент SHC/HAC применяют для реакции биоконверсии с солюбилизирующим агентом, отличающимся от Тритона Х-100.
62. Способ получения (-)-амброксида или смеси стереоизомеров (-)-амброксида, где (3Е,7Е)-гомофарнезол (ЕЕН) или смесь стереоизомеров (3Е,7Е)-гомофарнезола ферментативно конвертируют с получением (-)-амброксида или смеси стереоизомеров (-)-амброксида, где ферментативную конверсию осуществляют в реакционных условиях, приемлемых для получения (-)-амброксида, и при проведении реакции в присутствии солюбилизирующего агента Тритон Х-100 не используют в комбинации с ферментом WT SHC/HAC.
63. Способ в соответствии с параграфом 62, который осуществляют с использованием фермента SHC/HAC, выбранного из группы, состоящей из AacSHC (SEQ ID NO: 1), ZmoSHC1 (SEQ ID NO: 2), ZmoSHC2, (SEQ ID NO: 3); BjpSHC (SEQ ID NO: 4), производного фермента SHC/HAC, выбранного из таблицы 1, таблицы 5, таблицы 2, таблицы 6, таблицы 3, таблицы 7, таблицы 4 и/или таблицы 8 или последовательности с по меньшей мере 30% идентичностью, по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью с SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 и/или SEQ ID NO: 4.
64. Способ в соответствии с параграфом 63, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100, для фермента WT SHC.
65. Способ в соответствии с параграфом 64, где реакционные условия для WT SHC/HAC или каждого производного SHC/HAC представлены в таблице 24 или в таблице 24а.
66. Способ в соответствии с любым из параграфов 62-65, включающий (а) культивирование одной или более чем одной рекомбинантной клетки-хозяина, экспрессирующей фермент WT SHC или производное фермента SHC в условиях, обеспечивающих возможность экспрессии полипептида WT SHC или производного SHC/HAC, перед конверсией Е, E-гомофарнезола в (-)-амброксид.
67. Способ в соответствии с параграфом 66, где стадию культивирования и последующую стадию конверсии проводят в одном и том же реакционном сосуде в различных реакционных условиях.
68. Способ в соответствии с параграфом 67, где стадию культивирования осуществляют в диапазоне рН от приблизительно 6 до приблизительно 7, а стадию конверсии гомофарнезола в (-)-амброксид осуществляют в диапазоне рН приблизительно 4,8-5,5.
69. Способ в соответствии с любым из параграфов 62-68, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.
70. Способ по параграфу 69, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.
71. Способ по параграфу 70, где гомофарнезол содержит EE:EZ в массовом соотношении 80:20.
72. Способ по любому из параграфов 62-71, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).
73. Способ по любому из параграфов 62-72, где (-)-амброксид выделяют из реакционной смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром или фильтрования.
74. Способ в соответствии с параграфом 73, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.
75. Способ по параграфу 74, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.
76. Способ по параграфу 74 или 75, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).
77. (-)-Амброксид, получаемый способом по любому из параграфов 72-76.
78. (-)-Амброксид по параграфу 26 в твердой форме, предпочтительно в аморфной или кристаллической форме.
79. Способ получения продукта, включающий включение в продукт (-)-амброксида по любому из параграфа 77 или параграфа 78.
80. Способ по параграфу 79, где продукт представляет собой ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.
81. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащий (-)-амброксид по параграфу 77 или 78.
82. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 77 или 78 и один или более чем один дополнительный компоненто.
83. Применение (-)-амброксида по параграфу 77 или 78 в качестве составной части ароматизирующего продукта или потребительского косметического продукта для ухода.
Дополнительные аспекты изобретения (ZmoSHC1)
1. Производное сквален-гопен-циклазы (SHC)/гомофарнезол-амброксид-циклазы (НАС), содержащее аминокислотную последовательность, имеющую 1-50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно SEQ ID NO: 2.
2. Производное SHC/HAC в соответствии с параграфом 1, где производное SHC содержит аминокислотную последовательность, имеющую от 1 до 40 мутаций, 1-30 мутаций, 1-20 мутаций, 1-10 мутаций или 1-6 мутаций относительно SEQ ID NO: 2.
3. Производное SHC/HAC в соответствии с параграфом 1 или с параграфом 2, где производное SHC содержит аминокислотную последовательность, обладающую по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью относительно SEQ ID NO: 2.
4. Производное SHC/HAC в соответствии с параграфом 3, где вариант SHC содержит аминокислотную последовательность, обладающую по меньшей мере 95% идентичностью относительно SEQ ID NO: 2.
5. Производное SHC/HAC, содержащее 1-10 мутаций, независимо выбранных из замен, делеции или инсерций относительно SEQ ID NO: 2, где одна или более чем одна мутация, отличающаяся от мутации активного центра SHC, локализована/локализованы в домене 2 фермента SHC (Фиг. 19 и/или 20).
6. Производное SHC/HAC в соответствии с любым из параграфов 15, где одна или более мутаций относительно SEQ ID NO: 2 выбраны из таблицы 2, где, если выбрана только одна мутация, она представляет собой не F668Y.
7. Производное SHC/HAC по параграфу 6, где по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 мутаций выбраны из таблицы 2 и/или таблицы 6.
8. Производное SHC/HAC по параграфу 2, содержащее аминокислотную последовательность, которая имеет вплоть до 6 мутаций относительно SEQ ID NO: 2 и содержит по меньшей мере замены F668Y или Y185R в комбинации с по меньшей мере одной или более из F182L и/или I498T.
9. Производное SHC/HAC по параграфу 7, содержащее аминокислотную последовательность, имеющую вплоть до 8 изменений аминокислот относительно SEQ ID NO: 2, и которое содержит одно или более чем одно изменение аминокислот в положении, выбранном из группы, состоящей из положений 129, 145, 182, 185, 282, 498, 647 и 668 относительно SEQ ID NO: 2, где производное SHC/HAC обладает повышенной ферментативной активностью НАС относительно SEQ ID NO: 2.
10. Производное SHC/HAC в соответствии с параграфом 9, содержащее одну или более замен, выбранных из группы, состоящей из: S129A, V145V, F182L, Y185R, G282V, I498T, Н646Н и F668Y относительно SEQ ID NO: 2.
11. Производное SHC/HAC в соответствии с параграфом 10, содержащее F668Y.
12. Производное SHC/HAC в соответствии с параграфом 10, содержащее F182L.
13. Производное SHC/HAC в соответствии с параграфом 10, содержащее F668Y и F182L.
14. Производное SHC/HAC в соответствии с параграфом 10, содержащее Y185R и I498T.
15. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее G282V.
16. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F668Y.
17. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F182L.
18. Производное SHC/HAC в соответствии с параграфом 17, дополнительно содержащее F668Y.
19. Производное SHC/HAC в соответствии с параграфом 11, дополнительно содержащее Н646Н.
20. Производное SHC в соответствии с параграфом 10, содержащее S129A, и V145V, и F182L.
21. Производное SHC/HAC в соответствии с любым из параграфов 1-20, имеющее аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73 и/или 75.
22. Изолированная нуклеотидная последовательность, кодирующая производное SHC в соответствии с любым из параграфов 1-21.
23. Изолированная нуклеотидная последовательность в соответствии с параграфом 22, где нуклеотидная последовательность выбрана из группы, состоящей из SEQ ID NO: 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74 и/или 76.
24. Конструкция, содержащая нуклеотидную последовательность по параграфу 22 или параграфу 23.
25. Конструкция в соответствии с параграфом 24, содержащая промотор, функционально связанный с нуклеотидной последовательностью по параграфу 22 или 23.
26. Конструкция по параграфу 25, где промотор представляет собой индуцибельный или конститутивный промотор.
27. Вектор, содержащий конструкцию в соответствии с любым из параграфов 24-26.
28. Вектор по параграфу 27, представляющий собой плазмиду.
29. Вектор в соответствии с параграфом 28, способный направлять экспрессию в клетках-хозяевах, выбранных из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.
30. Конструкция по любому из параграфов 24-26 или вектор в соответствии с любым из параграфов 27-29, где конструкция или вектор способны к интеграции в геном клетки-хозяина, выбранной из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.
31. Рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность в соответствии с параграфом 22 или 23, или конструкцию в соответствии с любым из параграфов 24-26 или 30, или вектор в соответствии с любым из параграфов 27-30.
32. Рекомбинантная клетка-хозяин в соответствии с параграфом 31, выбранная из группы прокариотических клеток-хозяев, состоящей из бактерий рода Escherichia, Streptomyces, Bacillus, Pseudomonas, Lactobacillus и Lactococcus.
33. Рекомбинантная клетка-хозяин по параграфу 32, представляющая собой клетку-хозяина Е. coli.
34. Рекомбинантная клетка-хозяин по параграфу 33, в которой происходит гиперэкспрессия гена, кодирующего производное SHC/HAC.
35. Способ получения производного SHC/HAC в соответствии с любым из параграфов 1-21, включающий стадию культивирования одной или более чем одной рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 в условиях, обеспечивающих возможность продуцирования производного фермента SHC/HAC.
36. Способ по параграфу 35, где культивирование клеток проводят в условиях, приемлемых для продуцирования био катализатор а.
37. Способ получения (-)-амброксида, включающий конверсию гомофарнезола в (-)-амброксид с использованием рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или с использованием рекомбинантной клетки-хозяина, содержащей SEQ ID NO: 166, кодирующей WT SHC/HAC, где при использовании WT SHC/HAC биоконверсию гомофарнезола в (-)-амброксид проводят с солюбилизирующим агентом, отличающимся от Тритона Х-100.
38. Способ в соответствии с параграфом 37, где конверсию гомофарнезола в (-)-амброксид проводят в подходящих реакционных условиях биоконверсии для WT SHC/HAC или производного фермента SHC/HAC.
39. Способ в соответствии с параграфом 37 или 38, где конверсию гомофарнезола в (-)-амброксид проводят при подходящих значениях рН, температуры, концентраций солюбилизирующего агента для WT SHC/HAC или производного фермента SHC/HAC.
40. Способ в соответствии с параграфом 39, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100, для фермента WT SHC/HAC.
41. Способ в соответствии с любым из параграфов 37 40, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более чем одного из реакционных условий для фермента WT SHC/HAC или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а.
42. Способ по любому из параграфов 37-41, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5:1-2:1, предпочтительно составляет приблизительно 1:1 или 0,5:1.
43. Способ в соответствии с любым из параграфов 37-42, где стадии выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.
44. Способ в соответствии с любым из параграфов 37-43, где субстрат гомофарнезол содержит один или более чем один стереоизомер гомофарнезола.
45. Способ по параграфу 44, где субстрат гомофарнезол содержит два стереоизомера гомофарнезола.
46. Способ по параграфу 45, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.
47. Способ в соответствии с любым из параграфов 44 46, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 и 70:30.
48. Способ по параграфу 47, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.
49. Способ по параграфу 35 или 36, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении 80:20.
50. Способ по любому из параграфов 37-49, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).
51. Способ по любому из параграфов 37-50, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием этапа экстракции/дистилляции органическим растворителем или паром или фильтрования.
52. Способ в соответствии с параграфом 51, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.
53. Способ по параграфу 52, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.
54. Способ по параграфу 52 или 53, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).
55. (-)-Амброксид, получаемый способом по любому из параграфов 51-54.
56. (-)-Амброксид по параграфу 55 в твердой форме, предпочтительно в аморфной или кристаллической форме.
57. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по параграфу 55 или 56, предпочтительно в ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.
58. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащее (-)-амброксид по параграфу 55 или 56.
59. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 55 или 56 и один или более чем один дополнительный компонент.
60. Применение (-)-амброксида по параграфу 55 или 56 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта для ухода, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.
61. Применение производного фермента SHC/HAC по любому из параграфов 1-21, нуклеотидной последовательности в соответствии с параграфами 22 или 23, конструкции в соответствии с любым из параграфов 22-26 или 30, вектора в соответствии с любым из параграфов 27-30 или рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31 34 или рекомбинантной клетки-хозяина, экспрессирующей WT SHC/HAC, для биоконверсии гомофарнезола в (-)-амброксид, где фермент SHC/HAC используют для реакции биоконверсии с солюбилизирующим агентом, отличающимся от Тритона Х-100.
Дополнительные аспекты изобретения (ZmoSHC2)
1. Производное сквален-гопен-циклазы (8НС)/гомофарнезол-амброксид-циклазы (НАС), содержащее аминокислотную последовательность, имеющую 1-50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно SEQ ID NO: 3.
2. Производное SHC/HAC в соответствии с параграфом 1, где производное SHC содержит аминокислотную последовательность, имеющую от 1 до 40 мутаций, 1 30 мутаций, 1 20 мутаций, 1-10 мутаций или 1-6 мутаций относительно SEQ ID NO: 3.
3. Производное SHC/HAC в соответствии с параграфом 1 или с параграфом 2, где производное SHC содержит аминокислотную последовательность, обладающую по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью относительно SEQ ID NO: 3.
4. Производное SHC/HAC в соответствии с параграфом 3, где вариант SHC содержит аминокислотную последовательность, обладающую по меньшей мере 95% идентичностью относительно SEQ ID NO: 3.
5. Производное SHC/HAC, содержащее 1-10 мутаций, независимо выбранных из замен, делеций или инсерций относительно SEQ ID NO: 3, где одна или более чем одна мутация, отличающаяся от мутации активного центра SHC, локализована в домене 2 фермента SHC (Фиг. 19 и/или 20).
6. Производное SHC/HAC в соответствии с любым из параграфов 1-5, где одна или более чем одна мутация относительно SEQ ID NO: 3 выбрана из таблицы 3, где, если выбрана только одна мутация, она не является F620Y.
7. Производное SHC/HAC по параграфу 6, где по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 мутаций выбраны из таблицы 3 и/или таблицы 7.
8. Производное SHC/HAC по параграфу 2, содержащее аминокислотную последовательность, которая имеет вплоть до 6 мутаций относительно SEQ ID NO: 3 и содержит по меньшей мере замены F620Y или I140R в комбинации с по меньшей мере одной или более из F137L и/или I450T.
9. Производное SHC/HAC по параграфу 7, содержащее аминокислотную последовательность, имеющую вплоть до 8 изменений аминокислот относительно SEQ ID NO: 3 и содержащую одно или более чем одно изменение аминокислот в положении, выбранном из группы, состоящей из положений 85, 100, 137, 140, 233, 450, 598 и 620 относительно SEQ ID NO: 3, где производное SHC/HAC обладает повышенной ферментативной активностью НАС относительно SEQ ID NO: 3.
10. Производное SHC/HAC в соответствии с параграфом 9, содержащее одну или более чем одну замену, выбранную из группы, состоящей из: G85A, V100V, F137L, I140R, V233V, I450T, N598H и F620Y относительно SEQ ID NO: 3.
11. Производное SHC/HAC в соответствии с параграфом 10, содержащее F620Y.
12. Производное SHC/HAC в соответствии с параграфом 10, содержащее F137L.
13. Производное SHC/HAC в соответствии с параграфом 10, содержащее F620Y HF137L.
14. Производное SHC/HAC в соответствии с параграфом 10, содержащее I140R и I450T.
15. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее V233V.
16. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F620Y.
17. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F137L.
18. Производное SHC/HAC в соответствии с параграфом 17, дополнительно содержащее F620Y.
19. Производное SHC/HAC в соответствии с параграфом 11, дополнительно содержащее N598H.
20. Производное SHC в соответствии с параграфом 10, содержащее G85A, и V100V, HF137L.
21. Производное SHC/HAC в соответствии с любым из параграфов 1 20, имеющее аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109 и/или 111.
22. Изолированная нуклеотидная последовательность, кодирующая производное SHC в соответствии с любым из параграфов 121.
23. Изолированная нуклеотидная последовательность в соответствии с параграфом 22, где нуклеотидная последовательность выбрана из группы, состоящей из SEQ ID NO: 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110 и/или 112.
24. Конструкция, содержащая нуклеотидную последовательность по параграфу 22 или параграфу 23.
25. Конструкция в соответствии с параграфом 24, содержащая промотор, функционально связанный с нуклеотидной последовательностью по параграфу 22 или 23.
26. Конструкция по параграфу 25, где промотор представляет собой индуцибельный или конститутивный промотор.
27. Вектор, содержащий конструкцию в соответствии с любым из параграфов 24-26.
28. Вектор по параграфу 27, представляющий собой плазмиду.
29. Вектор в соответствии с параграфом 28, способный направлять экспрессию в клетках-хозяевах, выбранных из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.
30. Конструкция по любому из параграфов 24-26 или вектор в соответствии с любым из параграфов 27-29, где конструкция или вектор способны к интеграции в геном клетки-хозяина, выбранной из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.
31. Рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность в соответствии с параграфом 22 или 23, или конструкцию в соответствии с любым из параграфов 24-26 или 30, или вектор в соответствии с любым из параграфов 27-30.
32. Рекомбинантная клетка-хозяин в соответствии с параграфом 31, выбранная из группы прокариотических клеток-хозяев, состоящей из бактерий рода Escherichia, Streptomyces, Bacillus, Pseudomonas, Lactobacillus и Lactococcus.
33. Рекомбинантная клетка-хозяин по параграфу 32, представляющая собой клетку-хозяина Е. coli.
34. Рекомбинантная клетка-хозяин по параграфу 33, в которой происходит гиперэкспрессия гена, кодирующего производное SHC/HAC.
35. Способ получения производного SHC/HAC в соответствии с любым из параграфов 121, включающий стадии: (а) культивирование одной или более чем одной рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31 34 в условиях, обеспечивающих возможность продуцирования производного фермента SHC/HAC.
36. Способ по параграфу 35, где культивирование клеток проводят в условиях, приемлемых для продуцирования биокатализатора.
37. Способ получения (-)-амброксида, включающий конверсию гомофарнезола в (-)-амброксид с использованием рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31 34 или с использованием рекомбинантной клетки-хозяина, содержащей SEQ ID NO: 167, кодирующей WT SHC/HAC, где при использовании WT SHC/HAC биоконверсию гомофарнезола в (-)-амброксид проводят с солюбилизирующим агентом, отличающимся от Тритона Х-100.
38. Способ в соответствии с параграфом 37, где конверсию гомофарнезола в (-)-амброксид проводят в приемлемых реакционных условиях биоконверсии для WT SHC/HAC или производного фермента SHC/HAC.
39. Способ в соответствии с параграфом 37 или 38, где конверсию гомофарнезола в (-)-амброксид проводят при приемлемых значениях рН, температуры, концентраций солюбилизирующего агента для WT SHC/HAC или производного фермента SHC/HAC.
40. Способ в соответствии с параграфом 39, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100 для фермента WT SHC/HAC.
41. Способ в соответствии с любым из параграфов 37-40, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или чем одного более из реакционных условий для фермента WT SHC/HAC или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а.
42. Способ по любому из параграфов 37-41, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5:1-2:1, предпочтительно приблизительно 1:1 или 0,5:1.
43. Способ в соответствии с любым из параграфов 37-42, где этапы выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.
44. Способ в соответствии с любым из параграфов 37-43, где субстрат гомофарнезол содержит один или более чем один стереоизомер гомофарнезола.
45. Способ по параграфу 44, где субстрат гомофарнезол содержит два стереоизомера гомофарнезола.
46. Способ по параграфу 45, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.
47. Способ в соответствии с любым из параграфов 44-46, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 и 70:30.
48. Способ по параграфу 47, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.
49. Способ по параграфу 35 или 36, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении 80:20.
50. Способ по любому из параграфов 37-49, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).
51. Способ по любому из параграфов 37-50, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием этапа экстракции/дистилляции органическим растворителем или паром или фильтрования.
52. Способ в соответствии с параграфом 51, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.
53. Способ по параграфу 52, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.
54. Способ по параграфу 52 или 53, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).
55. (-)-Амброксид, получаемый способом по любому из параграфов 51-54.
56. (-)-Амброксид по параграфу 55 в твердой форме, предпочтительно в аморфной или кристаллической форме.
57. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по параграфу 55 или 56, предпочтительно в ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.
58. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащее (-)-амброксид по параграфу 55 или 56.
59. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 55 или 56 и один или более дополнительных компонентов.
60. Применение (-)-амброксида по параграфу 55 или 56 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта для ухода, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.
61. Применение производного фермента SHC/HAC по любому из параграфов 1-21, нуклеотидной последовательности в соответствии с параграфами 22 или 23, конструкции в соответствии с любым из параграфов 22-26 или 30, вектора в соответствии с любым из параграфов 27-30 или рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или рекомбинантной клетки-хозяина, экспрессирующей WT SHC/HAC, для биоконверсии гомофарнезола в (-)-амброксид, где фермент SHC/HAC применяют для реакции биоконверсии с солюбилизирующим агентом, отличающимся от Тритона Х-100.
Дополнительные аспекты изобретения (BJpSHC)
1. Производное сквален-гопен-циклазы (SHC)/гомофарнезол-амброксид-циклазы (НАС), содержащее аминокислотную последовательность, имеющую 1-50 мутаций, независимо выбранных из замен, делеций или инсерций, относительно SEQ ID NO: 4.
2. Производное SHC/HAC в соответствии с параграфом 1, где производное SHC содержит аминокислотную последовательность, имеющую от 1 до 40 мутаций, 1-30 мутаций, 1-20 мутаций, 1-10 мутаций или 1-6 мутаций относительно SEQ ID NO: 4.
3. Производное SHC/HAC в соответствии с параграфом 1 или с параграфом 2, где производное SHC содержит аминокислотную последовательность, обладающую по меньшей мере 40% идентичностью, по меньшей мере 50% идентичностью, или по меньшей мере 60% идентичностью, или по меньшей мере 70% идентичностью, или по меньшей мере 80% идентичностью, или по меньшей мере 90% идентичностью, или по меньшей мере 95% идентичностью, или по меньшей мере 96% идентичностью, или по меньшей мере 97% идентичностью, или по меньшей мере 98% идентичностью, или по меньшей мере 99% идентичностью относительно SEQ ID NO: 4.
4. Производное SHC/HAC в соответствии с параграфом 3, где вариант SHC содержит аминокислотную последовательность, обладающую по меньшей мере 95% идентичностью относительно SEQ ID NO: 4.
5. Производное SHC/HAC, содержащее 1-10 мутаций, независимо выбранных из замен, делеций или инсерций относительно SEQ ID NO: 4, где одна или более чем одна мутация, отличающаяся от мутации активного центра SHC, локализована в домене 2 фермента SHC (Фиг. 19 и/или 20).
6. Производное SHC/HAC в соответствии с любым из параграфов 15, где одна или более мутаций относительно SEQ ID NO: 4 выбраны из таблицы 4, где, если выбрана только одна мутация, она не является F628Y.
7. Производное SHC/HAC по параграфу 6, где по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 или 10 мутаций выбраны из таблицы 4 и/или таблицы 8.
8. Производное SHC/HAC по параграфу 2, содержащее аминокислотную последовательность, которая имеет вплоть до 6 мутаций относительно SEQ ID NO: 4 и содержит по меньшей мере замены F628Y или I140R в комбинации с по меньшей мере одной или более из F137L и/или I450T.
9. Производное SHC/HAC по параграфу 7, содержащее аминокислотную последовательность, имеющую вплоть до 8 изменений аминокислот относительно SEQ ID NO: 4 и содержащую одно или более чем одно изменение аминокислот в положении, выбранном из группы, состоящей из положений 88, 104, 141, 144, 241, 459, 607 и 628 относительно SEQ ID NO: 4, где производное SHC/HAC обладает повышенной ферментативной активностью НАС относительно SEQ ID NO: 4.
10. Производное SHC/HAC в соответствии с параграфом 9, содержащее одну или более замен, выбранных из группы, состоящей из: А88А, V104V, F141L, Y144R, V241V, I459T, М607Н и F628Y относительно SEQ ID NO: 4.
11. Производное SHC/HAC в соответствии с параграфом 10, содержащее F628Y.
12. Производное SHC/HAC в соответствии с параграфом 10, содержащее F141L.
13. Производное SHC/HAC в соответствии с параграфом 10, содержащее F628Y HF141L.
14. Производное SHC/HAC в соответствии с параграфом 10, содержащее Y144R и I459T.
15. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее V241V.
16. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F628Y.
17. Производное SHC/HAC в соответствии с параграфом 14, дополнительно содержащее F141L.
18. Производное SHC/HAC в соответствии с параграфом 17, дополнительно содержащее F628Y.
19. Производное SHC/HAC в соответствии с параграфом 11, дополнительно содержащее М607Н.
20. Производное SHC в соответствии с параграфом 10, содержащее S129A, и V145V, HF182L.
21. Производное SHC/HAC в соответствии с любым из параграфов 1 20, имеющее аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145 и/или 147.
22. Изолированная нуклеотидная последовательность, кодирующая производное SHC в соответствии с любым из параграфов 1-21.
23. Изолированная нуклеотидная последовательность в соответствии с параграфом 22, где нуклеотидная последовательность выбрана из группы, состоящей из SEQ ID NO: 114, 116, 118, 120, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146 и/или 148.
24. Конструкция, содержащая нуклеотидную последовательность по параграфу 22 или параграфу 23.
25. Конструкция в соответствии с параграфом 24, содержащая промотор, функционально связанный с нуклеотидной последовательностью по параграфу 22 или 23.
26. Конструкция по параграфу 25, где промотор представляет собой индуцибельный или конститутивный промотор.
27. Вектор, содержащий конструкцию в соответствии с любым из параграфов
24-26.
28. Вектор по параграфу 27, представляющий собой плазмиду.
29. Вектор в соответствии с параграфом 28, способный направлять экспрессию в клетках-хозяевах, выбранных из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.
30. Конструкция по любому из параграфов 24-26 или вектор в соответствии с любым из параграфов 27-29, где конструкция или вектор способны к интеграции в геном клетки-хозяина, выбранной из прокариотических, дрожжевых, растительных клеток-хозяев и клеток-хозяев насекомых.
31. Рекомбинантная клетка-хозяин, содержащая нуклеотидную последовательность в соответствии с параграфом 22 или 23, или конструкцию в соответствии с любым из параграфов 24-26 или 30, или вектор в соответствии с любым из параграфов 27-30.
32. Рекомбинантная клетка-хозяин в соответствии с параграфом 31, выбранная из группы прокариотических клеток-хозяев, состоящей из бактерий рода Escherichia, Streptomyces, Bacillus, Pseudomonas, Lactobacillus и Lactococcus.
33. Рекомбинантная клетка-хозяин по параграфу 32, представляющая собой клетку-хозяина Е. coli.
34. Рекомбинантная клетка-хозяин по параграфу 33, в которой происходит гиперэкспрессия гена, кодирующего производное SHC/HAC.
35. Способ получения производного SHC/HAC в соответствии с любым из параграфов 1-21, включающий стадии: (а) культивирование одной или более рекомбинантных клеток-хозяев в соответствии с любым из параграфов 31 34 в условиях, обеспечивающих возможность продуцирования производного фермента SHC/HAC.
36. Способ по параграфу 35, где культивирование клеток проводят в условиях, приемлемых для продуцирования био катализатор а.
37. Способ получения (-)-амброксида, включающий конверсию гомофарнезола в (-)-амброксид с использованием рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или с использованием рекомбинантной клетки-хозяина, содержащей SEQ ID NO: 168, кодирующей WT SHC/HAC, где при использовании WT SHC/HAC биоконверсию гомофарнезола в (-)-амброксид проводят с солюбилизирующим агентом, отличающимся от Тритона Х-100.
38. Способ в соответствии с параграфом 37, где конверсию гомофарнезола в (-)-амброксид проводят в приемлемых реакционных условиях биоконверсии для WT SHC/HAC или производного фермента SHC/HAC.
39. Способ в соответствии с параграфом 37 или 38, где конверсию гомофарнезола в (-)-амброксид проводят при приемлемых значениях рН, температуры, концентраций солюбилизирующего агента для WT SHC/HAC или производного фермента SHC/HAC.
40. Способ в соответствии с параграфом 39, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30°С до 60°С, при рН в диапазоне приблизительно 4-8 и в присутствии солюбилизирующего агента, отличающегося от Тритона Х-100, для фермента WT SHC/HAC.
41. Способ в соответствии с любым из параграфов 37 40, где конверсию гомофарнезола в (-)-амброксид проводят с использованием одного или более из реакционных условий для фермента WT SHC/HAC или производного фермента SHC/HAC, представленных в таблице 24 или в таблице 24а.
42. Способ по любому из параграфов 37-41, где массовое соотношение биокатализатора к гомофарнезолу находится в диапазоне от приблизительно 0,5:1-2:1, предпочтительно приблизительно 1:1 или 0,5:1.
43. Способ в соответствии с любым из параграфов 37-42, где этапы выращивания клеток и реакции биоконверсии проводят в одном реакционном сосуде.
44. Способ в соответствии с любым из параграфов 27-31, где субстрат гомофарнезол содержит один или более стереоизомеров гомофарнезола.
45. Способ по параграфу 44, где субстрат гомофарнезол содержит два стереоизомера гомофарнезола.
46. Способ по параграфу 45, где субстрат гомофарнезол содержит стереоизомеры EE:EZ.
47. Способ в соответствии с любым из параграфов 44-46, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 и 70:30.
48. Способ по параграфу 47, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и EE:EZ 66:34.
49. Способ по параграфу 35 или 36, где гомофарнезол содержит смесь стереоизомеров EE:EZ в массовом соотношении 80:20.
50. Способ по любому из параграфов 37-49, где (-)-амброксид получают с примесью по меньшей мере одного или более чем одного из побочных продуктов (II), (IV) и/или (III).
51. Способ по любому из параграфов 37-50, где (-)-амброксид выделяют из биоконверсионной реакционной смеси с использованием этапа экстракции/дистилляции органическим растворителем или паром или фильтрования.
52. Способ в соответствии с параграфом 51, где (-)-амброксид выделяют из реакционной смеси с использованием органического растворителя.
53. Способ по параграфу 52, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.
54. Способ по параграфу 52 или 53, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III).
55. (-)-Амброксид, получаемый способом по любому из параграфов 51-54.
56. (-)-Амброксид по параграфу 55 в твердой форме, предпочтительно в аморфной или кристаллической форме.
57. Способ получения продукта, содержащего (-)-амброксид, включающий включение в продукт (-)-амброксида по параграфу 55 или 56, предпочтительно в ароматизирующий продукт, косметический продукт, чистящий продукт, моющий продукт или мыльный продукт.
58. Ароматизирующий продукт, или косметический продукт, или потребительский продукт для ухода, содержащее (-)-амброксид по параграфу 55 или 56.
59. Ароматизирующая композиция, или косметическая композиция, или потребительская композиция для ухода, содержащая (-)-амброксид по параграфу 55 или 56 и один или более чем один дополнительный компонент.
60. Применение (-)-амброксида по параграфу 55 или 56 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта для ухода, такого как продукт для ухода за тканями, гигиено-косметический продукт, продукт для заботы о красоте и/или чистящий продукт.
61. Применение производного фермента SHC/HAC по любому из параграфов 1-21, нуклеотидной последовательности в соответствии с параграфами 22 или 23, конструкции в соответствии с любым из параграфов 22-26 или 30, вектора в соответствии с любым из параграфов 27-30 или рекомбинантной клетки-хозяина в соответствии с любым из параграфов 31-34 или рекомбинантной клетки-хозяина, экспрессирующей WT SHC/HAC, для биоконверсии гомофарнезола в (-)-амброксид, где фермент SHC/HAC применяют для реакции биоконверсии с солюбилизирующим агентом, отличающимся от Тритона Х-100.
В другом аспекте предложена модель кристаллической структуры (CMS) SHC, основанная на структурных координатах SHC, с аминокислотной последовательностью описанного в настоящем описании SHC или его производного. CMS SHC содержит домен связывающего кармана сквалена/гомофарнезола (squalene/homofarnesol binding pocket domain, SHBD), содержащий связывающий карман сквалена/гомофарнезола (SHBP) и субстрат сквален/гомофарнезол, связанный с SBD (например, см. Фиг. 19 и 20). Эта модель кристаллической структуры SHC (CMS) облегчает тестирование потенциальных производных-кандидатов фермента SHC/HAC in-silico.
Таким образом, в других воплощениях в настоящем изобретении предложен способ скрининга на фермент (например, производное SHC/HAC), способный к связыванию SHBD, включающий использование CMS SHC/HAC. В другом аспекте в настоящем изобретении предложен способ скрининга на фермент (например, эталонного фермента SHC или производного SHC/HAC), способный к связыванию SHBP, где способ включает приведение SHBP в контакт с тестируемым соединением (например, производным SHC) и определение наличия или отсутствия связывания тестируемого соединения с указанным SHBP. В некоторых воплощениях изобретения способ предназначен для скрининга тестируемого соединения (например, модулятора), полезного при модулировании активности производного фермента SHC.
В другом аспекте в настоящем изобретении предложен способ прогнозирования, имитации или моделирования молекулярных характеристик и/или молекулярных взаимодействий эталонного SHC и/или производного SHC/HAC со связывающим доменом сквалена/гомофарнезола (SHBD), включающий использование компьютерной модели, где в указанной компьютерной модели включены, использованы или изображены структурные координаты связывающего домена сквалена/гомофарнезола, как определено выше, для получения изображения указанного лиганд-связывающего домена и, возможно, вывода указанного изображения на дисплей.
Во всем тексте настоящего описания и следующей ниже формулы изобретения, если контекстом не требуется иное, под словом «содержать» и его вариантами, такими как «содержит» и «содержащий», следует понимать включение указанного целого числа, или стадии, либо группы целых чисел или стадий, но не исключение любого другого целого числа, или стадии, либо группы целых чисел или стадий. Термин «содержащий» также означает «включающий» и также «состоящий из», например, композиция, «содержащая» X, может состоять исключительно из X или может включать что-либо еще дополнительное, например, X+Y. Необходимо отметить, что используемые в настоящем описании и прилагаемой формуле изобретения формы единственного числа включают в себя соответствующие формы множественного числа, если контекстом явным образом не требуется иное. В качестве примера, ссылка на «ген» или «фермент» является ссылкой на «один или более чем один ген» или «один или более чем один фермент».
Должно быть понятно, что изобретение не ограничено конкретной методологией, протоколами и реагентами, описанными в настоящем описании, поскольку они могут варьировать. Должно быть также понятно, что используемая в настоящем описании терминология предназначена только для цели описания конкретных воплощений и не предназначена для ограничения объема настоящего изобретения, которое будет ограничено только прилагаемой формулой изобретения. Если не определено иное, все используемые в настоящем описании технические и научные термины имеют те же значения, которые обычно понятны специалистам в данной области техники. В соответствии с настоящим изобретением могут быть применены традиционные методы молекулярной биологии, микробиологии и рекомбинантных ДНК, которые входят в компетенцию специалистов в данной области техники.
Данное изобретение не ограничено в его применении к деталям конструкции и порядком расположения компонентов, приведенных в последующем описании или проиллюстрированных в графических материалах. Возможны другие воплощения изобретения и его применение на практике или осуществление различными путями. Используемые здесь формулировки и терминология также предназначены для описания настоящего изобретения, и их не следует рассматривать как ограничивающие.
Предпочтительно используемые в настоящем описании термины определены, как описано в публикации «А multilingual glossary of biotechnological terms: (IUPAC Recommendations))), Leuenberger, H.G.W, Nagel, B. and Kolbl, H. eds. (1995), Helvetica Chimica Acta, CH-4010 Basel, Switzerland).
Во всем тексте данного описания цитируется несколько документов. Каждый из цитируемых в настоящем описании документов (включая все патенты, заявки на патенты, научные публикации, спецификации производителя, номера последовательностей по каталогу GenBank и т.д.), приведенных выше или ниже, полностью включен в настоящий документ посредством ссылки.
Описанные в настоящем описании примеры являются иллюстративными для настоящего изобретения и не предназначены для его ограничения. В настоящем описании раскрыты различные воплощения настоящего изобретения. Многочисленные модификации и вариации описанных и проиллюстрированных в настоящем описании методов могут быть выполнены без отклонения от сущности и объема изобретения. Соответственно, следует понимать, что примеры являются только иллюстративными и не имеют ограничительного характера для объема изобретения.
SEQ ID NO: 1 (Alicyclobacillus acidocaldarius), AacSHC
SEQ ID NO: 2 (Zymomonas mobilis), ZmoSHC1
SEQ ID NO: 3 (Zymomonas mobilis), ZmoSHC2
SEQ ID NO: 4 (Bradyrhizobium japonicum), BjpSHC
SEQ ID NO: 149 (Burkholderia ambifaria)
SEQ ID NO: 151 (Burkholderia ambifaria)
SEQ ID NO: 153 (Bacillus anthracis)
SEQ ID NO: 155 (Frankia alni)
SEQ ID NO: 157 (Rhodopseudomonas patent)
SEQ ID NO: 159 (Streptomyces coelicolor)
SEQ ID NO: 169
Вариант 101А10 (SEQ ID NO: 30)
Вариант 101А10 (SEQ ID NO: 29)
Вариант 111C8 (SEQ ID NO: 28)
Вариант 111С8 (SEQ ID NO: 27)
Вариант SHC215G2 (SEQ ID NO: 22)
Вариант SHC215G2 (SEQ ID NO: 21)
Вариант SHC3 (SEQ ID NO: 26)
Вариант SHC3 (SEQ ID NO: 25)
Вариант SHC10 (SEQ ID NO: 32)
Вариант SHC10 (SEQ ID NO: 31)
Вариант SHC26 (SEQ ID NO: 24)
Вариант SHC26 (SEQ ID NO: 23)
Вариант SHC30 (SEQ ID NO: 34)
Вариант SHC30 (SEQ ID NO: 33)
Вариант SHC31 (SEQ ID NO: 36)
Вариант SHC31 (SEQ ID NO: 35)
Вариант SHC32 (SEQ ID NO: 38)
Вариант SHC32 (SEQ ID NO: 37)
Вариант SHC33 (SEQ ID NO: 40)
Вариант SHC33 (SEQ ID NO: 39)
Вариант F605W(SEQ ID NO: 170)
Вариант F605W (SEQ ID NO: 171)
SEQ ID NO: 166 (ZmoSHC1)
Диссертация Miriam Seitz доступна по ссылке http://elib.unistuttgart.de/handle/11682/1400
Escher S, Giersch W., Niclass Y, Bemardinello G and Ohloff G (1990). Configuration-odor relationships in 5β-Ambrox. Helv. Chim. Acta 73, 1935-1947.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
Для лучшего понимания настоящего изобретения приведена ссылка на сопроводительные графические материалы, в которых:
На Фиг. 1-4 показано выравнивание последовательностей отдельных производных AacSHC относительно AacSHC SEQ ID NO: 1. На Фиг. 1 сверху вниз изображены SEQ ID NO:: SEQ ID NO: 1, SEQ ID NO: 29, SEQ ID NO: 27, SEQ ID NO: 21, SEQ ID NO: 19, SEQ ID NO: 9, SEQ ID NO: 23, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37 и SEQ ID NO: 39.
На Фиг. 5 показана карта плазмиды.
На Фиг. 6 показаны относительные значения активности НАС AacSHC дикого типа и производных AacSHC, представленных в таблице 24, в стандартных условиях (рН 6,0, 55°С, 0,050% SDS, клетки до значения OD650 нм 10).
На Фиг. 7а показаны профили активности НАС производных AacSHC относительно WT AacSHC с использованием гомофарнезола качества EEH:EZH 87:13 и гомофарнезола чистоты 96% (определенной с использованием NMR).
На Фиг. 7b показано относительное повышение активности производных AacSHC относительно WT AacSHC (4 ч (начальная скорость) и выход через 22 ч) с использованием гомофарнезола качества EEH:EZH 87:13 и гомофарнезола чистоты 96% (определенной с использованием NMR).
На Фиг. 8а показаны профили активности НАС производных AacSHC относительно WT AacSHC с использованием гомофарнезола качества EEH:EZH 92:08 и гомофарнезола чистоты 100% (определенной методом NMR).
На Фиг. 8b показано относительное повышение активности производных AacSHC относительно WT AacSHC (4 ч (начальная скорость) и выход через 22 ч) с использованием гомофарнезола качества EEH:EZH 92:08 и гомофарнезола чистоты 100% (определенной методом NMR).
На Фиг. 9а показаны профили активности НАС производных AacSHC, приведенных в таблице 24, относительно WT AacSHC с использованием гомофарнезола качества EEH:EZH 66:33 и гомофарнезола чистоты 76% (определенной методом NMR).
На Фиг. 9b показано относительное повышение активности производных AacSHC относительно WT SHC (4 ч (начальная скорость) и выход через 22 ч) с использованием гомофарнезола качества EEH:EZH 66:33 и гомофарнезола чистоты 76% (определенной методом NMR).
На Фиг. 10 показаны результаты определения активности НАС для трех производных SHC, проявляющих приблизительно 10-кратное (215G2), 7-кратное (SHC26) и 6-кратное (SHC32) повышение активности по сравнению с ферментом AacSHC/HAC дикого типа.
На Фиг. 11 показана наблюдаемая конверсия E,E-гомофарнезола в амброксид производным SHC/HAC (215G2 SHC) и WT AacSHC. После 7 часов реакции (оценка начальной скорости реакции) конверсия вариантом 215G2 SHC была в 13 раз выше по сравнению с конверсией, достигаемой SHC дикого типа. После 48 часов реакции конверсия вариантом была приблизительно в 8 раз выше, чем для фермента дикого типа.
На Фиг. 12 показаны полученные продукты реакции (амброксид и продукт (IV)) при использовании ЕЕН в качестве исходного материала (для биоконверсии WT SHC и/или производным SHC/HAC); и полученные продукты реакции ((-)-амброксид (I) и продукты (II), (IV) и (III) (см. таблицу 21) при использовании EE:EZ в качестве исходного материала); для простоты ссылки соединения I-IV можно идентифицировать следующим образом:
I: (3aR,5aS,9aS,9bR)-3а,6,6,9а-тетраметилдодекагидронафто[2,1-b]фуран
(-)-Амброксид
II: (7aS, 11aS,Z)-5,8,8,11а-тетраметил-2,3,6,7,7а,8,9,10,11,11а-декагидробензо[b]оксонин
IV: (3aR,5aS,9aS,9bS)-3а,6,6,9а-тетраметилдодекагидронафто[2,1-b]фуран
III: (3aS,5aS,9aS,9bS)-3а,6,6,9а-тетраметилдодекагидронафто[2,1-b]фуран
9-эпи-Амброксид
На Фиг. 13 показан анализ GC продуктов реакции для амброксида и продуктов (II), (IV) и (III) в таблице 25.
На Фиг. 14 показан анализ GC продуктов реакции для амброксида и продуктов (II), (IV) и (III) в таблице 25.
На Фиг. 15 приведены сравнительные данные для активности варианта 215G2SHC в количественном анализе цельноклеточной биоконверсии в присутствии Тритона Х-100 или SDS.
На Фиг. 16 показана процентная доля конвертированного ЕЕН для различных соотношений SDS/клетки.
На Фиг. 17 показан % конверсии ЕЕН в стандартной реакции биоконверсии (как описано в примере 7) для трех различных концентраций SDS.
На Фиг. 18 показан % конверсии ЕЕН в стандартной реакции биоконверсии (как описано в примере 7) для трех различных значений рН.
На Фиг. 19 показана локализация мутаций, идентифицированных в вариантах SHC/НАС 101А10, 111С8 и 215G2, на кристаллической структуре SHC (в цвете): красный для варианта 215G2; пурпурный (винно-красный) для варианта 101А10 и зеленый для варианта 111С8. Для аминокислот, идентифицированных как ответственные за повышенную активность, боковые цепи выделены желтым цветом в сокристаллизованном аналоге субстрата. Другие мутации для идентифицированных вариантов без повышения активности отмечены синим цветом. Отмечено, что синие мутации распределены приблизительно пополам (т.е. 50:50) по 2 доменам фермента, при этом идентифицированные благоприятные мутации AacSHC локализованы, в основном (удаленно друг от друга), в домене 2. Единственное исключение составляет мутация F601Y, расположенная вблизи активного центра.
На Фиг. 20 показаны следующие мутации (черным и белым цветом): мутации, не оказывающие благоприятного действия на активность SHC/HAC, показаны черным цветом, они распределены по 2 доменам фермента SHC. Серым цветом показаны мутации, идентифицированные в вариантах SHC (101А10, 111С8 и 215G2), проявляющие повышенную активность SHC/HAC, и они расположены за единственным исключением в домене 2 фермента SHC. Выделена боковая цепь мутаций, вносящих вклад в повышенную активность вариантов.
На Фиг. 21 показана область клонирования и экспрессии плазмиды рЕТ-28а(+); номера SEQ ID для последовательностей на Фиг. 21 приведены ниже:
рЕТ 28а (нуклеотидная последовательность): SEQ ID NO: 179;
рЕТ 28а (аминокислотная последовательность): SEQ ID NO: 180;
рЕТ 28b (нуклеотидная последовательность): SEQ ID NO: 181;
рЕТ 28b (аминокислотная последовательность): SEQ ID NO: 182;
рЕТ 28с (нуклеотидная последовательность): SEQ ID NO: 183; и
рЕТ 28с (аминокислотная последовательность): SEQ ID NO: 184.
На Фиг. 22 показана объемная производительность 1,5х концентрированной реакционной смеси биоконверсии ЕЕН, содержащей 375 г/л клеток, 188 г/л ЕЕН, 2,33% SDS, по сравнению с объемной производительностью регулярной биоконверсии, которая была проведена параллельно при 125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS (пример 7).
На Фиг. 23 показана регулярная биоконверсия (125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS), которая была проведена, как описано в примере 7, но с заменой цитратного буферного раствора рН 5,4 на 0,5% или 0,9% NaCl, при этом все остальные параметры реакции не менялись. Параллельно в качестве контроля проводили биоконверсию в цитратном буферном растворе.
На Фиг. 24 показано изменение твердофазной экстракции (-)-амброксида по мере проведения отмывок толуолом в виде % от количества (-)-амброксида, исходно присутствовавшего в 200 мл всего реакционного бульона (за счет соотношения объемов бульон/толуол % в первом экстракте превышает 100%).
На Фиг. 25 показано изменение твердофазной экстракции (-)-амброксида по мере проведения отмывок этанолом в виде процентной доли от исходно присутствующего количества (-)-амброксида. После 4 отмывок (всего 640 мл EtOH, т.е. 3,2х начального объема всей реакционной смеси или 8х объема твердой фазы) было извлечено приблизительно 99% (-)-амброксида, первоначально присутствующего в реакционном бульоне.
ПРИМЕРЫ
Во избежание сомнений все ссылки на WT SHC и варианты SHC относятся к WT AacSHC (SEQ ID NO: 1) и его вариантам (например, перечисленным в таблице 23 и/или в таблице 24).
ПРИМЕР 1
Получение биокатализатора
Методы 1
Получение плазмиды SHC
Ген, кодирующий сквален-гопен-циклазу Alicyclobacillus acidocaldarius (AacSHC) встраивали в плазмиду рЕТ-28а(+), где он находился под контролем IPTG-индуцибельного промотора Т7 для продуцирования белка в Escherichia coli (см. Фиг. 5 и 21). Этой плазмидой трансформировали штамм Е. coli BL21(DE3), используя стандартный протокол трансформации с тепловым шоком.
Культуры в колбах Эрленмейера
Для продуцирования белка использовали либо комплексную (LB), либо минимальную питательную среду. Одним из примеров успешно используемой минимальной питательной среды является среда М9.
Приготовление среды
Выбранную по умолчанию минимальную питательную среду готовили, как описано ниже, для 350 мл культуры: к 35 мл исходного раствора лимонной кислоты/фосфата (133 г/л KH2PO4, 40 г/л (NH4)2HPO4, 17 г/л лимонной кислоты. Н2О с рН, доведенным до 6,3) добавляли 307 мл Н2О, при необходимости рН доводили до 6,8 32% раствором NaOH. После стерилизации в автоклаве добавляли 0,850 мл 50% раствора MgSO4, 0,035 мл раствора микроэлементов (состав приведен в следующем разделе), 0,035 мл раствора тиамина и 7 мл 20% раствора глюкозы.
Продуцирование биокатализатора SHC (продуцирование биокатализатора)
Для продуцирования биокатализатора в небольшом масштабе (SHC дикого типа или вариантов SHC) 350 мл культуры (питательной среды с добавлением 50 мкг/мл канамицина) инокулировали из предварительной культуры штамма Е. coli BL21(DE3), содержащего плазмиду для продуцирования SHC. Клетки выращивали до оптической плотности приблизительно 0,5 (OD650 нм) при 37°С при постоянном перемешивании (250 об/мин).
Затем продуцирование белка индуцировали добавлением IPTG до концентрации 300 мкМ с последующей инкубацией в течение 5-6 часов при постоянном встряхивании. Наконец, полученную в результате биомассу собирали центрифугированием, промывали 50 мМ буфером Трис-HCl рН 7,5. Клетки хранили в виде осадков при 4°С или -20°С до дальнейшего использования. Как правило, из 1 литра культуры получали от 2,5 до 4 грамм клеток независимо от используемой питательной среды.
Ферментации готовили и проводили в реакторах Infors НТ емкостью 750 мл. В ферментационный сосуд добавляли 168 мл деионизированной воды. Реакционный сосуд был оборудован всеми необходимыми датчиками (рО2, рН, отбора проб, гашения пены), устройством подачи С+N и бутылками с гидроксидом натрия и простерилизован в автоклаве. После стерилизации в автоклаве в реактор добавляют:
20 мл 10х буферного раствора фосфата/лимонной кислоты
14 мл 50% глюкозы
0,53 мл раствора MgSO4
2 мл раствора (NH4)2SO4
0,020 мл раствора микроэлементов
0,400 мл раствора тиамина
0,200 мл исходного раствора канамицина
Устанавливали следующие рабочие параметры: рН=6,95, рО2=40%, Т=30°С, перемешивание при 300 об/мин. Каскад: установка числа об/мин 300, минимум 300, максимум 1000, установка скорости потока л/мин 0,1, минимум 0, максимум 0,6. Контроль гашения пенообразования: 1:9.
В ферментер вносили посевную культуру до значения OD650 нм 0,4-0,5. Эту посевную культуру выращивали в питательной среде LB (с канамицином) при 37°С, 220 об/мин в течение 8 ч. Сначала ферментацию проводили в периодическом режиме в течение 11,5 ч, после чего начинали подачу С+N с раствором для подпитки (стерилизованный раствор глюкозы (143 мл Н2О+ 35 г глюкозы), в который после стерилизации было добавлено: 17,5 мл раствора (NH4)2SO4, 1,8 мл раствора MgSO4, 0,018 мл раствора микроэлементов, 0,360 мл раствора тиамина, 0,180 мл исходного раствора канамицина. Подпитку проводили при постоянной скорости потока приблизительно 4,2 мл/ч. Измерения глюкозы и NH4 + проводили извне для оценки доступности источников С и N в культуре. Обычно концентрация глюкозы оставалась очень низкой.
Культуры выращивали в течение суммарно 25 часов, где они, как правило, достигали значения OD650 нм 40-45. Затем продуцирование SHC начинали путем добавления в ферментер IPTG до концентрации приблизительно 1 мМ (в виде однократного добавления IPTG или в течение периода 3 4 часа с использованием инфузионного шприца), установки температуры на 40°С и рО2 на 20%. Индукцию продуцирования SHC продолжали в течение 16 ч при 40°С. По окончании индукции клетки собирали центрифугированием, промывали 0,1 М буферным раствором лимонной кислоты/цитрата натрия с рН 5,4 и хранили в виде осадков при температуре 4°С или -20°С до дальнейшего использования.
Результаты 1а
Как правило, при всех прочих неизменных условиях удельная активность продуцируемого биокатализатора была выше при использовании минимальной среды по сравнению с комплексной средой. Индукцию успешно осуществляли при температуре 30 или 37°С. Было отмечено, что при проведении индукции при 40-43°С получали биокатализатор с более высокой удельной активностью.
Результаты 1b
В приведенной ниже таблице 22 для 2 примеров показан объем культуры, оптическая плотность и количество клеток, как в начале, так и в конце индукции, а также количество собранной биомассы (сырая масса).
ПРИМЕР 2
Получение вариантов SHC и скрининг активности
Методы 2
Во избежание сомнений ЕЕ соответствует (3Е,7Е); смесь EZ соответствует (3Z,7E); ZE соответствует (7Z,3E); ZZ соответствует (7Z,3Z); и ЕЕН соответствует (3Е,7Е).
Программу изменения фермента проводили, используя ген SHC дикого типа (WT) Alicyclobacillus acidocaldarius (AacSHC) в качестве матрицы (GenBank М73834, Swissprot Р33247). Была создана библиотека из приблизительно 10500 вариантов SHC, которую подвергали скринингу на поиск вариантов, проявляющих повышенную способность к замыканию цикла ЕЕН. Скрининг проводили в реакциях в цитратном буфере с рН 6,0 (0,150 мл), содержащем 4 г/л ЕЕН и 0,050% SDS, при 55°С и при постоянном перемешивании.
При отборе лучших вариантов для валидации стандартный тест проводили в цитратном буферном растворе рН 6,0, содержащем 4 г/л ЕЕН, 0,050% SDS, клетки, экспрессирующие варианты SHC, до значения OD600 нм 10,0. Конечный объем составлял 1 мл, реакционные смеси инкубировали при 55°С и энергично перемешивали с помощью магнитной мешалки. Отбор проб реакционной смеси в различные моменты времени позволял исследовать профили активности (конверсию ЕЕН в (-)-амброксид), определяемые с помощью анализа методом газовой хроматографии (см. приведенные ниже методы анализа).
Из данного цикла валидации были получены 3 варианта с повышенной активностью замыкания цикла ЕЕН (101А10, 111С8 и 215G2), и впоследствии в этих 3 вариантах было идентифицировано в общей сложности 8 мутаций. Впоследствии было проведено исследование мутаций, чтобы определить, какие из них полезны в отношении замыкания цикла ЕЕН с образованием амброксида. Кроме этого производного AacSHC, был сконструирован другой вариант AacSHC, который содержал все идентифицированные полезные мутации (SHC33, как показано в таблице 23 ниже). Условия скрининга были следующими: 4 г/л ЕЕН, клетки до OD650 нм 10,0, SDS до 0,05% и 0,1% (2 концентрации), и реакции проводили при 55°С при постоянном перемешивании.
Результаты 2а
Результаты 2b
Из трех отобранных мутаций (101А10, 111С8 и 215G2) лучшую активность показала мутация 215G2.
ПРИМЕР 3
Оптимизированные реакционные условия с вариантами SHC
Исследуемые параметры реакции: температура, концентрация SDS и рН
Методы 3
Реакционные условия для вариантов производных SHC, идентифицированных в таблице 23, были индивидуально оптимизированы в отношении температуры, рН и концентрации SDS. С этой целью клетки Е. coli трансформировали плазмидой для продуцирования индивидуальных вариантов, культивировали их в колбах Эрленмейера и индуцировали продуцирование SHC, как описано выше. Таким образом, гарантировали, что все культуры содержат одинаковые или очень сходные количества SHC. Клетки собирали центрифугированием, промывали 0,1 М нитратным буферным раствором (рН 6,0) и хранили при -20°С до дальнейшего использования.
Результаты 3
Итоговые результаты этого исследования оптимизации приведены ниже в таблице. Цикл оптимизации также проводили с SHC дикого типа.
В следующей таблице 24 показаны оптимальные реакционные условия для дикого типа и вариантов, рассматриваемые для характеризации каждого производного фермента SHC/НАС.
Обсуждение 3
В примере 3 показаны различия, отмеченные в реакционных условиях для производных фермента SHC по сравнению с WT SHC. Для вариантов SHC наблюдали значимые отклонения оптимальных значений температуры, рН и концентрации SDS от SHC дикого типа. Лишь небольшое число мутаций оказали значимый эффект на оптимальные реакционные условия биоконверсии. Для определения оптимальных реакционных условий для отдельных вариантов SHC реакции проводили при нагрузке субстрата 4 г/л ЕЕН и клеток, продуцирующих фермент SHC дикого типа или его производные, при оптимальной плотности OD650 нм 10,0.
Температура
Данные в таблице 24 показывают неожиданный результат, что, тогда как фермент WT SHC обладает оптимальной активностью при 55°С (в диапазоне 45-60°С), ряд производных SHC обладает оптимальной активностью при 35°С (34-50°С). Применение производных SHC по настоящему изобретению в способах получения (-)-амброксида из Е,Е-гомофарнезола при пониженных температурах реакции обладает значительными экономическими преимуществами для получения (-)-амброксида в промышленном масштабе.
Солюбилизирующий агент
SDS был отобран и идентифицирован из длинного перечня возможных солюбилизирующих агентов, которые не были пригодными в реакции биоконверсии (дополнительную информацию см. в примере 14).
SDS лучше чем, например, Тритон Х-100, в отношении скорости и выхода реакции (оба агента тестировали при использовании 4 г/л ЕЕН и 125 г/л ЕЕН, как приведено в примере 7).
ПРИМЕР 4
Тестирование активности вариантов SHC по сравнению с ферментом WT SHC в стандартных условиях
Методы 4
Продуцирование вариантов для сравнения относительной активности биокатализаторов (как описано в таблице 24) описано ниже. Клетки Е. coli трансформировали плазмидой для продуцирования одного из вариантов SHC, и впоследствии клетки Е. coli культивировали в питательной среде LB при 37°С и 280 об/мин, выращивали до значения OD650нм 0,50 и индуцировали продуцирование фермента добавлением IPTG. Индукцию продолжали в течение 5,5 часов при 37°С, 280 об/мин. Клетки собирали центрифугированием, промывали 0,1 М цитратным буферным раствором рН 6,0 и хранили при -20°С до дальнейшего использования. При сравнении активности вариантов SHC (см. Фиг. 6) образец реакционной смеси наносили на полиакриламидный гель с SDS (SDS-PAGE) для анализа содержания SHC в реакционных смесях. Этот анализ подтвердил, что все реакционные смеси содержат идентичные количества фермента SHC.
Результаты 4а
На Фиг. 6 показаны относительные значения активности SHC дикого типа и его вариантов в стандартных условиях (рН 6,0, 55°С, 0,050% SDS, клетки до значения OD650 нм 10). Было также отмечено, что SHC дикого типа и по меньшей мере протестированные варианты SHC в соответствии с примерами настоящего изобретения толерантны к растворителю. Это означает, что в биоконверсионную реакционную смесь можно добавлять выбранные не смешиваемые с водой растворители (вплоть до почти 100%).
Результаты 4b
При использовании варианта 215G2 SHC заметного эффекта на активность этого варианта при добавлении в реакционную смесь NaCl (тестируемые концентрации от 5 до 100 мМ (только)) не наблюдали. Кроме того, при добавлении NaCl вплоть до 100 мМ или до 154 мМ (0,9% NaCl) отрицательного влияния на активность SHC для варианта 215G2 не показано. Этот результат позволяет предположить, что при проведении реакции биоконверсии в физиологическом растворе NaCl (0,9%) или подобном ему растворе и поддержании рН при соответствующем значении (например, приблизительно 5,4 (5,2-5,6)) реакцию биоконверсии можно проводить в отсутствие буфера, но в присутствии физиологического раствора NaCl или подобного ему раствора.
Обсуждение 4
На Фиг. 6 проиллюстрировано ранжирование активности отдельных вариантов и ферментов SHC дикого типа в отношении конверсии ЕЕН в (-)-амброксид.
ПРИМЕР 5
Профили активности WT SHC и производного SHC
Методы 5
Тест на активность проводили в 0,1 М цитратном буфере в объеме 5 мл при постоянном встряхивании при 900 об/мин на аппарате Heidolph Synthesis 1. Значение рН используемого буферного раствора, температура, при которой проводили реакцию, и концентрация SDS (додецилсульфата натрия) в реакционной смеси зависели от используемого варианта SHC (дикого типа или варианта). Сводные данные оптимальных условий для каждого из тестируемых вариантов приведены выше в таблице 24.
В качестве исходного материала использовали гомофарнезол чистоты 96% и субстрат гомофарнезол с соотношением EEH:EZH 87:13.
Во избежание сомнений, смесь EE:EZ представляет собой смесь изомеров ((3Е,7Е) и (3Z,7E).
Результаты 5
Используемый гомофарнезол: EEH:EZH 87:13, чистота (NMR): 96%.
Результаты проведения стандартного теста в оптимизированных условиях, показанные на Фиг. 7В (профили активности производных SHC относительно WT SHC) и на Фиг. 7А, показывают относительное повышение активности производных SHC относительно WT SHC (4 ч (начальная скорость) и выход через 22 ч).
Используемый гомофарнезол: EEH:EZH 92:08, чистота (NMR): 100%
Результаты проведения стандартного теста в оптимизированных условиях, показанные на Фиг. 8В (профили активности производных AacSHC относительно WT AacSHC) и на Фиг. 8А, показывают относительное повышение активности производных AacSHC относительно WT SHC (4 ч (начальная скорость) и выход через 22 ч).
Используемый гомофарнезол: EEH:EZH 66:33, чистота (NMR): 76%
Результаты проведения стандартного теста в оптимизированных условиях, показанные на Фиг. 9В (профили активности производных AacSHC, как показано в таблице 24, относительно WT AacSHC) и на Фиг. 9А, показывают относительное повышение активности производных AacSHC относительно WT SHC (4 ч (начальная скорость) и выход через 22 ч).
Обсуждение 5
Основной вывод состоит в том, что независимо от качества используемого субстрата гомофарнезола четыре лучших производных фермента SHC были ранжированы в следующем порядке: 215GSHC, SHC26, SHC32 и SHC3.
ПРИМЕР 6
Определение баланса массы из реакционных смесей, полностью экстрагированных растворителем
Методы 6
Все условия оставались неизменными, и для каждого варианта проводили 2 реакции. В качестве субстрата использовали гомофарнезол. После 4 часов и 22 часов инкубации продукт реакции и непрореагировавший субстрат полностью экстрагировали для каждого из вариантов отмывками в общем количестве 6 равным объемом трет-бутил-метилового эфира (MTBE/tBME). Содержание гомофарнезола и амброксида в каждой из отмывок определяли с помощью анализа GC. Общее количество образовавшегося амброксида и остаточного гомофарнезола рассчитывали по калибровочным кривым, которые строили с использованием растворов, приготовленных из аутентичного амброксида и гомофарнезола.
Результаты 6
Результаты на Фиг. 10 показали, что с используемым субстратом было подтверждено, что 3 лучших варианта проявляют приблизительно 10-кратное (215G2), 7-кратное (SHC26) и 6-кратное (SHC32) повышение активности по сравнению с ферментом SHC дикого типа.
ПРИМЕР 7
Результативность биотрансформации при 125 г/л E,E-гомофарнезола (ЕЕН)
Методы 7
Цель состояла в определении повышения волюметрической производительности с использованием варианта 215G2SHC. Для оптимизации условий тестовой реакции, включающих параметры рН, концентрацию клеток и концентрацию SDS, был создан дизайн серии экспериментальных исследований (ДЭИ). Реакционные условия были следующими: 125 г/л ЕЕН (из гомофарнезола EE:EZ 86:14), 250 г/л клеток, 1,55% SDS, при этом реакцию проводили при 35°С в 0,1 М цитратном буфере рН 5,4.
Типичную реакцию (общий объем 150 г) проводят, как описано ниже, в ферментерах Infors емкостью 0,75 л. В реакционный сосуд загружают необходимое количество гомофарнезола, соответствующее 18,75 г ЕЕН. Добавляют 2,33 г SDS из 15,5% (масс/масс.) раствора, приготовленного в 0,1 М цитратном буферном растворе рН 5,4. Суспензию клеток готовят из клеток Е. coli, которые продуцировали вариант 215G2 SHC, путем суспендирования клеток в 0,1 М цитратном буферном растворе рН 5,4. После определения сырой массы клеток этой суспензии центрифугированием в течение 10 мин при 10°С и 17210g в реакционный сосуд добавляют необходимый объем клеток с целью введения в реакционную смесь 37,5 г клеток. Объем реакционной смеси дополняют до 150 г необходимым количеством реакционного буферного раствора. Реакцию проводят при 37°С при постоянном перемешивании при 900 об/мин. Регулирование рН проводят, используя 40% водный раствор лимонной кислоты. Образцы реакционной смеси (1 мл) отбирают в различные моменты времени, экстрагируют 5 объемами MTBE/tBME (5 мл). Содержание гомофарнезола и амброксида в реакционной смеси определяли с помощью анализа методом GC после осветления фазы растворителя центрифугированием (настольная центрифуга, 13000 об/мин, 2 мин), 10-кратное разведение MTBE/tBME.
Такую же реакцию проводили с клетками Е. coli, которые продуцировали фермент SHC дикого типа. В этом случае реакцию проводили при 55°С в 0,1 М цитратном буферном растворе рН 6,0. Сводные данные реакционных условий для этого примера приведены в строке 2 таблицы 24а ниже. Реакционные условия, представленные в строке 1 таблицы 24а ниже, взяты из предыдущих примеров (например, примеров 3-5).
Результаты 7
На Фиг. 11 представлена наблюдаемая конверсия ЕЕН в амброксид 2 ферментами. После 7 часов реакции (оценка начальной скорости реакции) конверсия вариантом 215G2 SHC была в 13 раз выше по сравнению с конверсией, достигаемой SHC дикого типа. После 48 часов реакции конверсия вариантом была приблизительно в 8 раз выше, чем для фермента дикого типа.
Общие примечания 7
Концентрация клеток
Все концентрации клеток (г/л) в реакционных смесях, описанных в этом примере, указаны в виде сырой массы клеток. Концентрацию в виде сырой массы клеток (г/л) суспензии клеток определяют после центрифугирования образца этой суспензии клеток в течение 10 мин при 17210g и 4°С.
Корреляция между г/л клеток и OD650 нм
При использовании биоконверсии 125 г/л ЕЕН с 215G2 SHC или WT SHC 250 г/л клеток в этой реакции соответствует значению OD650 нм приблизительно равному 172 в данной реакции. При тестировании различных препаратов биокатализатора наблюдали изменения в отношении значения OD650 нм к количеству биокатализатора. При использовании биокатализатора при 4 г/л ЕЕН, но применяя клетки до значения OD650 нм 10,0, определили, что OD650 нм 10,0 эквивалентна 1,45 г/л клеток.
Обсуждение 7
Данные показывают, что оптимизированный и эффективный способ биоконверсии НАС был разработан с использованием относительно высоких концентраций субстрата ЕЕН (125 г/л) по сравнению с документами уровня техники, где раскрыта концентрация субстрата гомофарнезола, составляющая лишь от приблизительно 0,2 г/л (см. JP 2009060799) до приблизительно 2,36 г/л (10 мМ) (см. WO 2010/139719 A2, US 2012/0135477 A1) и Seitz et al (2012), цитируется выше).
ПРИМЕР 8
Анализ GC
Методы 8
Для количественного определения содержания ЕЕН и амброксида образцы экстрагировали соответствующим объемом трет-бутилметилового эфира (MBTE/tBME). Фракцию растворителя отделяли от водной фазы центрифугированием, после чего проводили анализ методом газовой хроматографии. 1 мкл фазы растворителя инъецировали (коэффициент деления потока 3) на колонку 30 м × 0,32 мм × 0,25 мкм Zebron ZB-5. Хроматографию на колонке проводили при постоянном потоке (4 мл/мин H2) с градиентом температуры: 100°С, 15°С/мин до 200°С, 120°С/мин до 240°С, 4 мин при 240°С, что приводило в результате к разделению амброксида, ЕЕН и EZH. Температура на входе составляла 200°С, температура детектора: 300°С.
Конверсию ЕЕН рассчитывали, исходя из площадей пиков, соответствующих амброксиду и ЕЕН, по следующей формуле:
конверсия (%) = 100 × (Площадьамброксид_пик/(Площадьамброксид_пик + ПлощадьE,E-гомофарнезол_пик))
Подлинность продукта реакции амброксида подтверждали посредством GC-MC (зарегистрированные значения и интенсивности: m/z 221 (100%), m/z 97 (40%), m/z 137 (3,3%), m/z 43 (2,6%), m/z 41 (2,5%), m/z 55 (2,4%), m/z 95 (1,9%), m/z 67 (1,8%), m/z 81 (138%), m/z 222 (1,7%)).
Обсуждение 8
Извлечение продукта проводили либо путем экстракции растворителем, либо экстракции паром. Используемые растворители представляли собой, например, МТВЕ или гексан: изопропанол (3:2). Реакционную смесь многократно экстрагировали равными объемами растворителя, и фракции растворителя подвергали анализу GC до тех пор, пока ни субстрат, ни продукт больше не обнаруживались. Как правило, было достаточно от 5 до 6 отмывок. Альтернативно, экстракцию продуктов реакции осуществляли паром.
ПРИМЕР 9
Реакция, протекающая в одном реакционном сосуде
Методы 9
Проводили ферментацию 200 мл с Е. coli BL21 (DE3), трансформированной плазмидой рЕТ28а(+) 215G2 SHC для продуцирования 215G2 SHC с N-концевой His-меткой, используя стандартный протокол выращивания и индукции, описанный выше. В конце фазы индукции аэрацию отключали, температуру устанавливали на 35°С, рН доводили до 5,5 лимонной кислотой, а скорость мешалки - до 500 об/мин. Объем культуры рассчитывали с учетом всех добавлений, проведенных в процессе выращивания культуры (подпитки и потребления основания). В соответствии с этим объемом и OD культуры в ферментер добавляли необходимое количество SDS. Добавляли ЕЕН до 4 г/л. Из реакционной смеси отбирали образцы в различные моменты времени, образцы (150-300 мкл) экстрагировали 700 мкл МТВЕ для анализа GC. Конверсия ЕЕН в амброксид происходила непосредственно в бульоне для культивирования. Реакцию проводили в общей сложности в течение 22,5 дней, в течение которых многократно добавляли ЕЕН.
Результаты 9
По достижении завершения реакции 10,6 г ЕЕН циклизовалось с получением амброксида. Продукты реакции (структуры приведены ниже) экстрагировали паром и количественно извлекали из реакционной смеси.
Примечание относительно продуктов реакции
При конверсии гомофарнезола EE:EZ 87:13 посредством SHC образуются продукты реакции: амброксид, продукты (II), (IV) и (III), как представлено на Фиг. 12, и их соотношение отражает соотношение EE:EZ исходного материала.
При использовании в качестве исходного материала ЕЕН образуются только (-)-амброксид (I) и продукт (IV).
При использовании в качестве исходного материала EZH (3Z,7E) образуются только продукты (II) и (III).
Однако при использовании смеси ЕЕН и EZH образуются амброксид (I) и продукты (II), (IV) и (III).
При 100% конверсии EE:EZ 66:34 будет получено 66%:34% ((амброксид + (IV)):((II) + (III)).
При проведении экстракции паром экстрагируются все 4 продукта амброксид и продукты (II), (IV) и (III), а в результате этапа кристаллизации образуется амброксид чистоты 99% (GC) при выходе по меньшей мере 70%.
Обсуждение 9
Эти данные демонстрируют, что получение (-)-амброксида возможно в биоконверсионной реакционной среде или в реакционной системе «реакции, протекающей в одном реакционном сосуде», и что селективное обогащение амброксидом достигается в результате экстракции паром и кристаллизации.
Если исходное вещество гомофарнезола представляет собой смесь изомеров ЕЕ и EZ (например, 86:14), из каждого из этих изомеров образуется 2 продукта (всего 4), при этом (-)-амброксид, тем не менее, является основным компонентом неочищенного продукта и преобладающим компонентом в кристаллизованном материале (чистота 99,1%). (+)-Амброксид не был обнаружен.
ПРИМЕР 10
Конверсия смесей гомофарнезола EE:EZ
Во избежание сомнений, ЕЕ соответствует (3Е,7Е); смесь EZ соответствует (3Z,7E); ZE соответствует (7Z,3E); ZZ соответствует (7Z,3Z); ЕЕН соответствует (3Е,7Е); и EZH соответствует (3Z,7E).
Методы 10
Смеси EE:EZ подвергали биоконверсии в следующих реакционных условиях: суммарное содержание гомофарнезола составляло 146 г/л при концентрации клеток 250 г/л и SDS 1,55%, и использовали следующие субстраты гомофарнезола (смеси гомофарнезола EE:EZ):
EE:EZ 86:14 (самое высокое содержание ЕЕН для данного примера),
EE:EZ 69:31 (самое низкое содержание ЕЕН для данного примера),
EE:EZ 80:20
EEH:EZH 70:30
Биоконверсия смеси гомофарнезола 7Е, 3Е/7Е, 3Z
Биоконверсию проводили с использованием следующих реакционных условий:
Реакцию (суммарный объем 150,1 г) проводили в 0,1 М буферном растворе лимонной кислоты/цитрата натрия рН 5,4 в ферментере Infors НТ емкостью 750 мл, содержащем общее количество гомофарнезола 146 г/л, используя субстрат гомофарнезол, который представлял собой смесь 7E,3E:7E,3Z 86:14, 250 г/л клеток (полученных в соответствии со способом примера 1) и 1,55% SDS. Реакцию проводили при 35°С при постоянном перемешивании (800 об/мин), регулирование рН проводили, используя
10-40% водный раствор лимонной кислоты. Из реакционной смеси отбирали образцы в различные моменты времени, образцы экстрагировали растворителем для анализа GC. Было отмечено, что конверсия гомофарнезола происходит одинаково быстро при 2 качественных вариантах гомофарнезола (EE:EZ 86:14 и EE:EZ 69:31).
Результаты 10
Конверсию обоих изомеров Е,Е- и E,Z-гомофарнезола наблюдали при проведении биоконверсии 125 г/л E,E-гомофарнезола из материала EEH:EZH 86:14 с использованием WT SHC и одного конкретного производного SHC (215G2 SHC). Таким образом, фермент SHC дикого типа из Alicyclobacillus acidocaldarius образует такие же продукты реакции (т.е. амброксид, продукты (II), (IV) и (III)) из материала EEH:EZH 86:14, как и варианты SHC из таблицы 23 из смесей EEH:EZH. На Фиг. 13 и 14 приведен анализ GC продуктов реакции для амброксида и продуктов (II), (IV) и (III).
Обсуждение 10
В результате биоконверсии гомофарнезола в амброксид в соответствии с настоящим изобретением образуется (-)-амброксид как преобладающее соединение, но могут также образоваться идентифицированные выше соединения, отличающиеся от (-)-амброксида (например, соединения (II), (IV) и (III)) которые могут придавать или не придавать благоприятные ольфакторные ноты продукту (-)-амброксиду. Как показано выше, в условиях селективной кристаллизации амброксид можно отделить от других побочных продуктов ((II), (IV) и (III)). Соответственно, в случае отрицательного влияния на сенсорный характер конечного продукта амброксида селективное отделение продуктов (II), (IV) и (III) от конечного продукта (-)-амброксида повышает его ценность в качестве аорматизирующего пордукта, или корригента, или косметического продукта, или потребительского продукта для ухода. Сенсорный анализ проводят с использованием хорошо разработанных сенсорных тестов, используемых подготовленными парфюмерами. Чистота конечного продукта (-)-амброксида может быть показателем ольфакторного качества продукта в том случае, если продукт сам по себе, в основном, определяет желаемый сенсорный профиль.
ПРИМЕР 11
Конверсия ЕЕН из смеси EE:EZ:ZE:ZZ-гомофарнезола
Методы 11
ЕЕ:EZ:ZE:ZZ-Гомофарнезол 40:26:20:14 использовали в качестве субстрата для конверсии ЕЕН с использованием 215G2 SHC. В сравнительных целях также использовали другой гомофарнезол EE:EZ 2:1 или 93:07.
Конверсию смеси ЕЕ:EZ:ZE:ZZ-гомофарнезола исследовали с вариантом 215G2 SHC, но не в оптимизированных условиях. Реакционные условия были следующими: рН 5,8 в 100 мМ цитратном буфере, 0,10% SDS, 40°С. При проведении всех реакций при постоянной концентрации 2 г/л ЕЕН (с соответственно измененными общими концентрациями гомофарнезола) наблюдали описанные ниже коэффициенты конверсии ЕЕН.
Результаты 11
Наблюдали следующие коэффициенты конверсии смеси изомеров гомофарнезола:
| EE:EZ2:150-55% | EE:EZ2:150-55% |
| EE:EZ93:778% | EE:EZ93:778% |
| EE:EZ:ZE:ZZ 40:26:20:146% | EE:EZ:ZE:ZZ 40:26:20:146% |
Обсуждение 11
Помимо наблюдаемых значений выхода, эти данные показывают, что вариант 215G2 SHC способен осуществлять конверсию ЕЕН в амброксид из комплексной смеси EE:EZ:ZE:ZZ гомофарнезола. Как и ожидали, наблюдали, что более низкий коэффициент конверсии приводил в результате к снижению выхода амброксида. Этот результат согласуется с точкой зрения, что изомеры гомофарнезола, отличающиеся от ЕЕН, могут конкурировать с ЕЕН за доступ к производным фермента SHC/HAC и, следовательно, могут действовать как конкурентные ингибиторы и/или альтернативные субстраты конверсии ЕЕН в (-)-амброксид.
ПРИМЕР 12
Сравнительные данные для цельноклеточной биоконверсии с использованием Тритона Х-100 и SDS
Методы 12
Клетки-хозяева Е. coli выращивали в соответствии с протоколом Методов 4 из Примера 4. Реакцию биоконверсии с использованием варианта 215G2SHC проводили в соответствии со стандартным тестом примера 4. В качестве наиболее подходящих реакционных условий для варианта 215G2 SHC были выбраны: концентрация гомофарнезола 4 г/л при количестве клеток до значения OD650 нм 10,0 в буферном растворе лимонной кислоты/фосфата натрия 0,1 М рН 5,4, 35°С и SDS в концентрации 0,07%.
Результаты 12
На Фиг. 15 приведено сравнение активности варианта 215G2SHC в количественном анализе цельноклеточной биоконверсии при использовании Тритона Х-100 в диапазоне концентрации от 0,005% до 0,48% и SDS в концентрации 0,07%.
Обсуждение 12
Данные показывают, что максимальная активность с использованием Тритоном Х-100 составляла лишь около 20% активности, полученной с использованием SDS.
ПРИМЕР 13
Отношение SDS/клетки
Методы 13
Реакцию биоконверсии осуществляли в соответствии с Методами 4 из Примера 4, используя концентрацию субстрата ЕЕН 4 г/л, клетки при значении OD650 нм 5,0, в результате которой получили производное фермента 215G2 SHC.
Результаты 13
Результаты, представленные на Фиг. 16, показывают процентную долю конвертированного ЕЕН для различных соотношений SDS/клетки.
На Фиг. 16 показано, что процентная доля конверсии ЕЕН в (-)-амброксид с использованием различных значений соотношения SDS/клетки зависит от соотношения SDS/клетки. Это соотношение должно быть тщательно установлено для достижения максимальной конверсии.
Например, в случае слишком низкой концентрации SDS может наблюдаться субоптимальная конверсия гомофарнезола. С другом стороны, например, при слишком высокой концентрации SDS может быть риск повреждения биокатализатора за счет разрушения интактной клетки микроорганизма и/или денатурации/инактивации фермента SHC/HAC. При проведении реакции биоконверсии в соответствии с Методами 7 из Примера 7 с использованием 125 г/л ЕЕН и 250 г/л биокатализатора наилучший протокол биоконверсии показал соотношение [SDS]/[клетки] 16:1.
Обсуждение 13
Результаты показывают, что существует некоторая степень независимости между концентрацией солюбилизирующего агента (SDS), количеством биомассы и концентрацией субстрата (ЕЕН). В качестве примера, при повышении концентрации субстрата гомофарнезола для эффективного протекания реакции биоконверсии требуются достаточные количества биокатализатора и солюбилизирующего агента (SDS).
ПРИМЕР 14
Тестирование возможных солюбилизирующих агентов для применения в реакции биоконверсии
Методы 14
В качестве возможного заменителя SDS тестировали различные солюбилизирующие агенты (представленные в таблице 26 ниже) в реакциях замыкания цикла ЕЕН ферментом 215G2 SHC, используя такие же условия, как в стандартном тесте (4 г/л ЕЕН, клетки до значения OD650 нм 10,0). С использованием стандартного теста также тестировали возможность усиления активности (кумулятивный эффект) за счет комбинирования SDS при его оптимальной концентрации (0,060-0,070%) с другими используемыми солюбилизирующими агентами, оптимальные концентрации которых определяли индивидуально на основании скрининга, проведенного с этими соединениями (см. таблицу 26 ниже). Кроме того, также тестировали «глубокие эвтектические растворители» и ионные жидкости, известные как способствующие солюбилизации нерастворимых в воде соединений.
Результаты 14
В следующей таблице 26 приведены сводные данные о солюбилизирующих агентах (например: поверхностно-активных веществах, детергентах, усилителях растворимости и т.п.), протестированных к настоящему времени в реакциях замыкания цикла ЕЕН ферментом 215G2 SHC. Ни в одном случае не наблюдали повышения активности по сравнению с контрольной реакцией, проведенной с использованием SDS в диапазоне концентрации 0,060-0,070%. Активность, наблюдаемая при использовании этих соединений по отдельности при концентрации, определенной как оптимальная, составляли лишь приблизительно 20% от полученных в контрольных реакциях с SDS. Было отмечено, что при полном отсутствии добавления солюбилизирующего агента достигалась 20% конверсия ЕЕН. При использовании SDS и добавлении дополнительного солюбилизирующего агента (при концентрации, определенной в тесте как оптимальная) синергического эффекта не наблюдали. Наблюдали, скорее, снижение процентной доли конверсии ЕЕН. На основании этого исследования был сделан вывод, что в условиях тестирования соединения вовсе не улучшают конверсию ЕЕН; скорее, было получено их нежелательное воздействие на замыкание цикла, и из исследованных солюбилизирующих агентов SDS наиболее полезен. Кроме того, при тестировании «глубоких эвтектических растворителей» и ионных жидкостей, которые, как известно, способствуют солюбилизации нерастворимых в воде соединений, также не было получено положительных результатов.
Обсуждение 14
Автором изобретения был выбран и идентифицирован SDS в качестве полезного солюбилизирующего агента из длинного перечня других солюбилизирующих агентов, которые не оказались полезными в реакции биоконверсии гомофарнезола в (-)-амброксид по настоящему изобретению.
ПРИМЕР 15
Чувствительность реакции биоконверсии к концентрации SDS
Методы 15
Применяемыми условиями являются условия стандартной биоконверсии (как описано в примере 7) при 125 г/л и 250 г/л биокатализатора и 1,55% SDS. Также были протестированы две другие концентрации SDS (1,40% и 1,70% SDS). Все концентрации SDS приведены в % масс./масс.
Условия стандартной реакции биоконверсии (как описано в примере 7) при 125 г/л и 250 г/л биокатализатора и 1,55% SDS также использовали для тестирования различных значений рН.
Контрольную реакцию проводили при рН 5,4 в 0,1 М цитратном буферном растворе. Для проведения реакций при низком рН использовали 0,1 М ацетатный буферный раствор.
Результаты 15
Данные, представленные на Фиг. 17, показывают, что реакция биоконверсии оказалась менее чувствительной к изменениям концентрации SDS, чем при тестировании активности НАС в стандартном тесте при 4 г/л ЕЕН и применяемом количестве клеток при OD650 нм 10,0.
Данные, представленные на Фиг. 18, показывают, что при применении реакции биоконверсии оказалась менее чувствительной к изменениям рН, чем при тестировании активности НАС в стандартном тесте при 4 г/л ЕЕН и применяемом количестве клеток при OD650 нм 10,0.
Обсуждение 15
Эти данные показывают робастность реакции биоконверсии при 125 г/л ЕЕН и 250 г/л клеток по отношению к тестируемым показателям - диапазону концентрации SDS и диапазону рН.
ПРИМЕР 16
Локализация идентифицированных мутаций SHC/HAC на кристаллической структуре
Положения мутаций, идентифицированных в вариантах AacSHC/HAC, отмечены на Фиг. 19 следующим образом: красным для варианта 215G2; пурпурным (винно-красным) для варианта 101А10 и зеленым для варианта 111С8. Для аминокислот, идентифицированных как ответственные за повышенную активность, боковые цепи выделены желтым цветом в сокристаллизованном аналоге субстрата. Другие мутации для идентифицированных вариантов без повышения активности отмечены синим цветом. Отмечено, что синие мутации распределены приблизительно пополам (т.е. 50:50) по 2 доменам фермента, при этом идентифицированные благоприятные мутации AacSHC локализованы, в основном (удаленно друг от друга), в домене 2. Единственное исключение составляет мутация F601Y, расположенная вблизи активного сайта. Если рассматривать только оба производных фермента SHC/HAC, представляющих собой 215G2 и 111С8, все мутации локализуются в домене 2. На Фиг. 20 та же информация представлена черным и белым цветом.
Результаты 16
Все полезные мутанты (красный/зеленый/пурпурный), соответствующие 215G2, 111С8 и 101А10, локализованы, в основном (кроме одного мутанта F601Y), в домене 2 (Wendt et at (1997) Science 277: 1811) кристаллической структуры SHC (как показано на Фиг. 19). Комбинации полезных мутаций SHC пронумерованы в соответствии с AacSHC дикого типа (SEQ ID NO: 1).
Обсуждение 16
Кристаллическая структура полезна для идентификации производных SHC/HAC с требуемым соотношением структуры/активности, особенно в отношении конверсии гомофарнезола в (-)-амброксид. Полезный этап предварительного отбора может ограничиться отбором аминокислотных остатков, локализованных в домене 2 кристаллической структуры SHC/HAC (см. Фиг. 19 и 20).
ПРИМЕР 17
Получение гомофарнезола
Методы 17
Общие условия анализов
Неполярная ЖХ/МС: 50°С/2 мин, 20°С/мин 200°С, 35°С/мин 270°С. Система ЖХ/МС Agilent 5975С MSD с системой ЖХ HP серия 7890А. Неполярная колонка: ВРХ5 производства компании SGE, 5% фенил 95% диметилполисилоксан 0,22 мм × 0,25 мм × 12 м. Газ-носитель: Гелий. Температура инжектора: 230°С. Разделение потоков 1:50. Скорость потока: 1,0 мл/мин. Линия передачи: 250°С. МС-квадруполь: 106°С. МС-источник: 230°С.
А) Получение N-метил-N-нитрозомочевины (MNU) в THF
Раствор мочевины (175 г, 2,9 моль) и метиламина гидрохлорида (198 г, 2,9 моль) в воде (400 мл) нагревают с обратным холодильником (105°С) в течение 3,5 ч при перемешивании. При 40°С добавляют раствор NaNO2 (101 г, 1,45 моль) в воде (200 мл). Через 15 мин добавляют THF (1000 мл), в результате чего получают 2-фазную прозрачную смесь. Концентрированную H2SO4 (110 г, 1,1 моль) добавляют при 0-5°С и перемешивают в течение 1,5 ч. Еще через 0,5 ч при 0-5°С разделяют две прозрачные фазы при 25°С. Органическую фазу (А) (1065 мл, теоретически 1,35 М) выдерживают в течение нескольких дней при 0-5°С или сразу переносят в реактор для циклопропанирования.
После разделения фаз водную фазу дважды экстрагируют THF (2х 1:1). В результате получают 1100 мл фазы В и 1075 фазы С. Если фаза А обеспечивает 51% конверсию концевого алкена в циклопропан при последующей реакции циклопропанирования, фаза В образует менее 0,5% циклопропана, а фаза С не дает обнаружимой конверсии. Авторы изобретения заключили, что после первого разделения фаз экстрагируется более 99% MNU. Поэтому после первого разделения фаз водную фазу обычно отбрасывают (из органической фазы А) после обработки концентрированным водным раствором КОН и уксусной кислотой.
В) Получение Е-Δ-фарнезена с использованием MNU в THF
N-метил-N-нитрозомочевину 1,35 М в THF (136 мл, 184 ммоль) добавляют по каплям при 0°С к быстро перемешиваемой смеси E-бета-фарнезена (CAS 18794-84-8) (25 г, 122 ммоль) и водного раствора KOH (50 мл, 40%) при 0-5°С. После добавления 4 мл раствора MNU добавляют Pd(acac)2 (7,4 мг, 0,024 ммоль, 0,02%), предварительно растворенный в 0,5 мл дихлорметана.
Остальной раствор MNU добавляют в течение 4 ч при 0-5°С. На этой стадии GC показала 28% не преобразованного Е-β-фарнезена, 65% желаемого моноциклопропана (показано выше) и 3% бициклопропанированного соединения 5. После 16 ч при 25°С добавляют уксусную кислоту (100 мл) при 0-5°С с последующим добавлением трет-бутил-метилового эфира (250 мл). После разделения фаз органическую фазу промывают 2 М HCl (250 мл), и водную фазу экстрагируют трет-бутил-метиловым эфиром (250 мл). Объединенные органические слои промывают водой (2× 100 мл), 10% водным раствором NaOH (2× 100 мл) и водой (2× 100 мл), высушивают над MgSO4, фильтруют и концентрируют с получением 26,9 г светло-желтой жидкости, которая содержит 9% Е-β-фарнезена, 82% желаемого соединения моноциклопропана и 6% бициклопропанированного побочного продукта.
Далее желаемое соединение можно выделить путем очистки дистилляцией. В результате добавления 1 г K2CO3 (1 г) и дистилляции на колонке из рулонной стали 30 см при 40-60 мбар получают 147 г соединения моноциклопропана (68%, скорректированный выход) при 135-145°С. Фракции объединяют с получением 92 г соединения моноциклопропана 100% чистоты.
Аналитические данные Е-Δ фарнезена:
1H-NMR (CDCl3, 400 МГц): 5.1 (2 т, 2 Н), 4.6 (2 Н), 2.2 (2 Н), 2.1 (4 Н), 2.0 (2 Н), 1.7 (s, 3 Н), 1.6 (2 s, 6 Н), 1.3 (1 Н), 0.6 (2 Н), 0.45 (2 Н) млн-1. 13C-NMR (CDCl3, 400 МГц): 150.9 (s), 135.1 (s), 131.2 (s), 124.4 (d), 124.1 (d), 106.0 (t), 39.7 (t), 35.9 (t), 26.7 (t), 25.7 (q), 17.7 (q), 16.0 (d), 6.0 (t) млн-1. ЖХ/МС: 218 (2%, M+), 203 (5%, [M - 15]+), 175 (11%), 147 (31%), 134 (15%), 133 (20%), 121 (12%), 107 (55%), 95 (16%), 93 (30%), 91 (20%), 82 (11%), 81 (33%), 79 (42%), 69 (100%), 67 (22%), 55 (20%), 53 (21%), 41 (75%). ИК (пленка): 3081 (w), 2967 (m), 2915 (m), 2854 (m), 1642 (m), 1439 (m), 1377 (m), 1107 (w), 1047 (w), 1018 (m), 875 (s), 819 (m), 629 (w). Аналитически вычислено для C16H26: С, 88,00; H, 12,00. Обнаружено: С, 87,80; Н, 12,01.
С) Получение (7Е)-4,8,12-триметилтридека-3,7,11-триен-1-ола ((7Е)-гомофарнез ола)
Смесь (Е)-(6,10-диметилундека-1,5,9-триен-2-ил)циклопропана (Е-Δ фарнезена) (1 г, 4,6 ммоль), додекана (0,2 г, 1,15 ммоль, внутренний стандарт) и L-(+)-винной кислоты (1 г, 6,9 ммоль) в трубке под давлением нагревают при перемешивании при 150°С. Через 18 ч и после полной конверсии (в соответствии с GC) смесь наливают на смесь воды (50 мл) и толуола (50 мл).
Фазы разделяют, и водную фазу экстрагируют толуолом (50 мл). Объединенные органические слои промывают концентрированным водным раствором Na2CO3 (50 мл) и концентрированным раствором NaCl (2× 50 мл), высушивают над MgSO4, фильтруют и выпаривают при пониженном давлении с получением коричневатой смолы (1,35 г), которую смешивают с 30% водным раствором KOH (4,3 мл) и перемешивают при 25°С в течение 2 ч. С помощью анализа методом GC выявлено образование 96% (7Е)-4,8,12-триметилтридека-3,7,11-триен-1-ола в соответствии с внутренним стандартом. Отношение E/Z 68:22. Данные анализа Е-изомера согласуются с данными литературы, см., например, P. Kocienski, S. Wadman J. Org. Chem. 54, 1215 (1989).
Результаты 17
Данные показывают получение гомофарнезола, приемлемого для биоконверсии в (-)-амброксид.
Обсуждение 17
Способ получения гомофарнезола также подробно описан в двух одновременно поданных заявках на патент - РСТ/ЕР2014/072882 (WO2015/059290) и РСТ/ЕР2014/072891 (WO2015/059293) - полное содержание которых включено в настоящий документ посредством ссылки.
ПРИМЕР 18
Реакция, протекающая в одном реакционном сосуде
В данном эксперименте: Проводили (i) ферментацию штаммом Е. coli, продуцирующим вариант 215G2 SHC (например, как описано в примере 1) с последующей (ii) конверсией ЕЕН непосредственно в ферментационной смеси. Поскольку 3 параметра [клетки], [ЕЕН] и [SDS] (г/л) связаны между собой, было необходимо скорректировать параметры [ЕЕН] и [SDS] в доступном объеме ферментационной смеси в зависимости от концентрации клеток (г/л), полученной в конце ферментации. Цель состояла в конверсии 125 г/л ЕЕН с использованием 250 г/л клеток при концентрации SDS 1,55%. Для обеспечения надлежащей биоконверсии клетки должны находиться в состоянии покоя в статусе истощения источника глюкозы. Аэрацию отключали.
Методы 18
Ферментация:
Для обеспечения достаточно точного определения объема ферментационного бульона в реакторе в конце ферментации регистрировали все объемы отбираемых образцов, а также объемы всех добавлений в ферментер (подпитки, основания, кислоты и т.д.).
Определение концентрации клеток в ферментационной смеси:
Для определения сырой массы клеток (г/л) отбирали образец ферментационной смеси (5-10 мл) при постоянном перемешивании и помещали в центрифужную пробирку. Регистрировали массу образца. Образец центрифугировали в течение 10 мин при 17210g и 4°С (например, 12000 об/мин, ротор SS-34, центрифуга Sorvall RC3B). Супернатант осторожно отбирали пипеткой и регистрировали массу осадка. Концентрацию клеток на основании сырой массы определяют как гклеток/лсмеси или гклеток/гсмеси.
Объем ферментационной смеси в ферментере определяли с учетом всех добавлений и отборов. В случае нахождения ферментера на весах массу ферментационной смеси определяли путем взвешивания, в ином случае 1 мл принимали за 1 г.
Определение необходимых количеств гомофарнезола и SDS:
В соответствии с определенной концентрацией клеток и объемом ферментационной смеси определяли количество E,E-гомофарнезола и SDS для добавления в реактор с целью сохранения одинакового соотношения между 3, как описано в примере биоконверсии примера 9: 125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS.
Осуществление биоконверсии:
1. Температуру устанавливали на 35°С. Аэрацию отключали.
2. В ферментационную смесь добавляли рассчитанное количество гомофарнезола.
3. Необходимое количество SDS осторожно добавляли из водного исходного 15,5% раствора SDS.
4. Реакционную смесь тщательно перемешивали в течение приблизительно 15 мин при 800 млн-1.
5. Регистрировали рН реакционной смеси (внутренний электрод для измерения РН).
6. Образец (приблизительно 1 мл) отбирали в 15 мл пробирку Falcon. Добавляли приблизительно 5 мл деионизированной воды, и после тщательного перемешивания регистрировали рН на внешнем калиброванном электроде.
7. рН в реакторе пошагово устанавливали на 5,4 (значение, измеренное на внешнем калиброванном электроде) с использованием 85% Н3РО4, при этом контролируя рН на внешнем электроде, как описано выше (6.).
8. В ходе биоконверсии регулировали рН, используя, например, 10 25% Н3РО4 и 32% NaOH.
10. Отбор образцов реакционной смеси: приблизительно 1 мл реакционной смеси помещали в пробирку Falcon емкостью 15 мл. Добавляли приблизительно 5 мл МТВЕ. Образец экстрагировали при энергичном перемешивании. Аликвоту центрифугировали в настольной центрифуге в течение 1 мин при максимальной скорости (пробирка Eppendorf). 100 л фазы растворителя добавляли в виалу для GC, содержащую 900 л МТВЕ. В течение первого дня биоконверсии образцы отбирали один раз в 1-1,5 часа. В последующие дни отбирали только 3 образца.
11. 1 л фазы растворителя анализировали на содержание амброксида и ЕЕН, как описано в примере 8.
12. Конверсию ЕЕН (%) рассчитывали как 100 × (амброксидплощадь/(амброксидплощадь + ЕЕНплощадь)).
Результаты 18
Результаты демонстрируют, что ферментацию и конверсию ЕЕН проводили в одном реакционном сосуде в реакторе KLF2000 (Bioengineering) в масштабе 1,9 литров. 251 г/л клеток обеспечивали конверсию 238 г ЕЕН (251 г/л клеток) до не менее 93% за 47 часов. При измерении через 93 ч после начала конверсия составляла 99%.
Подобный эксперимент в одном реакционном сосуде проводили в реакторе Infors НТ емкостью 0,75 л. После ферментации в соответствии со стандартным протоколом (пример 1) добавляли клетки из реактора, собранные из других экспериментов по ферментации, проведенных параллельно по такому же протоколу. Полученный в результате объем смеси составлял 479 г. Концентрация клеток была определена как 313,7 г/л, что составляло 1,25х концентрацию клеток при стандартной биоконверсии (250 г/л клеток). В реактор добавляли соответствующие количества ЕЕН и SDS. Конверсия 75,1 г ЕЕН (эквивалентно 157 г/л ЕЕН в этом примере) составляла 98% менее чем за 90 ч. Этот результат демонстрирует возможность проведения ферментации и конверсии ЕЕН в одном реакционном сосуде при концентрации не менее 125 г/л ЕЕН, если при проведении ферментации используют клетки, продуцирующие вариант 215G2 SHC, при достаточно высокой плотности клеток.
Обсуждение 18
Преимущественно была получена 99% конверсия субстрата, что весьма полезно с коммерческой точки зрения при использовании дорогостоящего исходного материала (например, ЕЕН).
ПРИМЕР 19
Повышение волюметрической продуктивности
Методы 19
Чтобы дополнительно повысить волюметрическую продуктивность, использовали 1,5х концентрированную биоконверсионную реакционную смесь, содержащую 375 г/л клеток, 188 г/л ЕЕН, 2,33% SDS. Параллельно проводили стандартную биоконверсию с использованием 125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS (пример 7). 2 реакции проводили в реакторах Infors НТ емкостью 0,750 л, все остальные параметры оставались неизменными.
Результаты 19
Результаты на Фиг. 22 демонстрируют, что процентная доля конверсии через 75 ч после начала составляла 88% при 1,5х биоконверсии по сравнению с 95% при стандартной биоконверсии. Процентная доля конверсии через 96 ч после начала составляла 93% конверсии ЕЕН при 1,5х биоконверсии по сравнению с 97% при стандартной биоконверсии. Процентная доля конверсии при 1,5х биоконверсии составляла 96% от полученной при стандартной биоконверсии, было отмечено, что со временем перемешивание при 1,5х биоконверсии становилось более затруднительным по мере исчезновения маслянистого гомофарнезола, замещаемого твердыми продуктами реакции. Этим можно объяснить несколько сниженный уровень конверсии при 1,5х биоконверсии. Использование реактора, оборудованного улучшенным перемешивающим устройством, может улучшить конверсию ЕЕН при 1,5х биоконверсии. Этот результат показывает, что можно проводить реакции биоконверсии при 188 г/л ЕЕН или более при условии достижения эффективного перемешивания, поскольку эффективность перемешивания, по-видимому, является единственным ограничением системы.
Производительность (-)-амброксида
«Производительность (-)-амброксида» относится к количеству извлекаемого (-)-амброксида в граммах на литр объема биотрансформации в час времени биоконверсии (т.е. времени после добавления субстрата). В связи с этим и со ссылкой на Фиг. 22 производительность (-)-амброксида рассчитывают, как описано ниже:
Биоконверсия 125 г/л ЕЕН (250 г/л клеток)
производительность через 1,25 ч: 10,3 грамма на литр в час
производительность через 8,25 ч: 6,3 грамма на литр в час
производительность через 21,25 ч: 4,1 грамма на литр в час
Биоконверсия 187,5 г/л ЕЕН (375 г/л клеток)
производительность через 1,25 ч: 12,2 грамма на литр в час
производительность через 8,25 ч: 8,2 грамма на литр в час
производительность через 21,25 ч: 5,5 грамма на литр в час
Можно считать, что производительность, рассчитанная через приблизительно 6-8 часов после начала, является репрезентативной для начальной скорости реакции, которая лучше всего описывает максимальный коэффициент конверсии системы.
При типичных биоконверсиях с использованием 125 г/л ЕЕН с 250 г/л клеток показана производительность амброксида от 6,3 до 8,5 граммов на литр в час через приблизительно 6 8 часов (репрезентативная для начальной скорости реакции).
ПРИМЕР 20
Замена реакционного буферного раствора раствором NaCl
Методы 20
Стандартную биоконверсию (125 г/л ЕЕН, 250 г/л клеток, 1,55% SDS) проводили, как описано в примере 7, но с заменой цитратного буферного раствора рН 5,4 на 0,5% или 0,9% NaCl, при этом все остальные параметры реакции не менялись. Параллельно в качестве контроля проводили биоконверсию в цитратном буферном растворе.
Результаты 20
Результаты на Фиг. 23 показывают, что коэффициент конверсии ЕЕН был одинаковым при проведении реакций в буферном растворе и в 0,9% растворе NaCl. Коэффициент конверсии был ниже при проведении реакции только в 0,5% NaCl. Этот результат показывает возможность проведения биоконверсии в отсутствие обеспечиваемой буфером точной регуляции рН и обеспечение достаточной ионной силы.
ПРИМЕР 21
Экстракция твердой фазы из реакционного бульона
С учетом того, что (-)-амброксид нерастворим в воде и не является жидким при температурах ниже приблизительно 75°С, эти свойства рассматривали как возможное преимущество для экстракции продукта из твердой фазы биотрансформации с использованием либо смешиваемых с водой (например, этанола), либо не смешиваемых с водой (например, толуола) растворителей.
Методы 21
200 мл реакционной смеси центрифугировали, чтобы отделить твердую фазу от жидкой (водной) (Sorvall GS3, 5000 об/мин, 10 мин, 10°С). Таким образом отделяли приблизительно 80 мл твердого осадка от приблизительно 120 мл жидкой фазы. Анализ (газовая хроматография, пример 8) водной фазы после экстракции МТВЕ показал, что она содержит не более чем приблизительно 0,3% (-)-амброксида, исходно присутствующего в 200 мл реакционной смеси. Для экстракции амброксида из твердой фазы использовали толуол и 99% этанол.
Результаты 21
Экстракция толуолом:
80 мл твердой фазы экстрагировали 6 раз 45 мл толуола (приблизительно 1А объема твердой фазы, при энергичном перемешивании в течение 30 с и центрифугировании (Sorvall GS3, 5000 об/мин, 10 мин, 10°С). Проводили анализ методом GC для определения содержания (-)-амброксида в фазе растворителя. Более 99,5% (-)-амброксида, исходно присутствующего в реакционной смеси, экстрагировали в результате 6 экстракций, при которых общий объем толуола составляет 1,3 5х исходного объема реакционной смеси (200 мл) или 3,4х объема твердой фазы. На графике на Фиг. 24 показано изменение экстракции по мере проведения отмывок толуолом в виде % от количества (-)-амброксида, первоначально присутствовавшего в 200 мл всей реакционной смеси (за счет соотношения объема реакционная смесь/толуол % в первом экстракте превышает 100%).
Экстракция этанолом:
80 мл твердой фазы экстрагировали (Infors Multifors НТ, 35°С, 1000 об/мин, 30 мин) приблизительно 160 мл (2 объема) 99% этанола с последующим центрифугированием. В ходе процедуры экстракции кристаллизация амброксида не происходила. На графике на Фиг. 25 показано, что после 4 отмывок (всего 640 мл EtOH, т.е. 3,2х начального объема всей реакционной смеси или 8х от объема твердой фазы) было извлечено приблизительно 99% (-)-амброксида, первоначально присутствующего в реакционной смеси. На первой стадии экстракции необходимо достаточное количество этанола, чтобы предотвратить кристаллизацию амброксида (растворимость в этаноле). При использовании только 1 или объема твердой фазы на первой стадии экстракции получили липкую пасту, с которой было трудно обращаться, и (-)-амброксид кристаллизовался в виде игольчатых кристаллов на осадке после центрифугирования. Температура, по-видимому, не является фактором, ответственным за эту кристаллизацию (экстракцию и центрифугирование тестировали при комнатной температуре и приблизительно при 35°С-40°С).
За образование кристаллов, по-видимому, ответственна концентрация (-)-амброксида в фазе EtOH, а также соотношение EtOH/вода в жидкой фазе (остаточное содержание влаги в твердой фазе). Тем не менее было отмечено, что объем этанола можно уменьшить до 1 объема твердой фазы.
Примечание 21
Поскольку (-)-амброксид не находится в жидкой фазе при комнатной температуре, он выделяется вместе с биомассой и может быть экстрагирован органическим растворителем (например, смешиваемым с водой растворителем (например, этанолом) или не смешиваемым с водой растворителем (например, толуолом). Стадия центрифугирования, которая отделяет (-)-амброксид в твердой фазе реакционной смеси, обладает преимуществом, поскольку позволяет уменьшить количество растворителя, необходимое для экстракции (-)-амброксида.
ПРИМЕР 22
Сенсорный анализ
Цель: проведение сенсорного анализа (-)-амброксида и побочных продуктов (соединений II, III и IV), образующихся в «неочищенном» экстракте и в «кристаллизованном» экстракте.
Результат 22(a)
Результатом преобразования ЕЕН является (-)-амброксид (соединение I) и изомер (-)-амброксида (соединение IV).
Результат 22(b)
Результатом биотрансформации EZH является макроциклический простой эфир (соединение II) и 9b-эпи-амброксид (соединение III).
Результат 22(c)
Неочищенная композиция (-)-амброксида содержит соединения I, II, III и IV, где % каждого присутствующего соединения составляет 87,1, 2,8, 2,5 и 7,6%, соответственно.
Результат 22(d)
Композиция материала после селективной кристаллизации (в лабораторном масштабе) содержит те же соединения, присутствующие в количестве 99,1, 0,1, 0,1 и 0,7%, соответственно.
Были получены следующие результаты сенсорного анализа:
(-)-Амброксид: ОТН 0,2 нг/л (ОТН представляет собой порог восприятия запаха).
Соединение IV из ЕЕН: слабый, IsoE, древесный, GC-TH 5-10 нг.
Соединение II из EZH: «без запаха» (GC-TH более 500 нг) (GC-TH представляет собой порог обнаружения).
Соединение III из EZH: GC-TH приблизительно в 10 раз выше, чем для амброксида (около 2 нг).
Вывод
Общее процентное содержание каждого из 3 побочных продуктов (соединений II, III и IV) в «неочищенном» экстракте составляет приблизительно 3%.
Общее процентное содержание каждого из 3 побочных продуктов (соединений II, III и IV) в «кристаллизованном» экстракте составляет приблизительно 1% (лабораторный масштаб).
Сенсорный анализ 3 побочных продуктов (соединений II, III и IV) показал более слабый запах по сравнению с (-)-амброксидом.
В действительности запах 9b-эпи-амброксида (соединения III) приблизительно в 10 раз слабее, чем (-)-амброксида, что позволяет предположить, что он по существу не имеет запаха.
Как показывает сенсорный анализ, удаление из (-)-амброксида одного или более соединений, представляющих собой побочные продукты, может улучшить запах остаточного соединения (т.е. (-)-амброксида) даже в том случае, когда удаляемые соединения как таковые не имеют запаха.
Таким образом, усиление запаха амброксида наблюдали в отсутствие соединений II, III и IV.
ПРИМЕР 23
Извлечение амброксида экстракцией паром
Методы 23
Полученная в результате чистота неочищенного (экстрагированного паром) и кристаллизованного (-)-амброксида
Реакционную смесь реакции биотрансформации EE:EZ 86:14 экстрагировали паром, и продукт реакции кристаллизовали, как описано ниже. Погон от дистилляции паром собирали в виде двухфазной смеси. Органическую фазу сохраняли, а водную фазу отбрасывали. Состав органической фазы анализировали методом GC, и результаты приведены в таблице 25 ниже (см. «неочищенный»). Впоследствии органическую фазу концентрировали до сухости. Затем к неочищенному высушенному продукту добавляли этанол, и смесь подогревали до растворения продукта. При комнатной температуре медленно добавляли воду, и (-)-амброксид кристаллизуется при периодическом перемешивании и охлаждении в ледяной бане.
Результаты 23
В таблице 25 ниже также показаны результаты анализа методом GC продуктов, полученных после этапа экстракции/дистилляции паром («неочищенный»), и кристаллизованного продукта ((-)-амброксида). В таблице 25 ссылки на EZH и ЕЕН относятся к (3Z,7E) гомофарнезолу и 7Е,3Е гомофарнезолу соответственно.
В таблице 25 показано, что из конкретного исходного материала (EEH:EZH 86:14) при использовании WT SHC или производного SHC образуется желаемый конечный продукт (-)-амброксид и очень специфичная смесь побочных продуктов (II, IV и III). Данные исследования селективной кристаллизации показывают значительное обогащение (-)-амброксидом (I) практически при отсутствии побочных продуктов (II), (IV) или (III), обнаруживаемых в кристаллизованном образце. Соответственно, из данной смеси EE:EZ получают ольфакторно чистый продукт (-)-амброксид, который селективно кристаллизуется относительно несложным и экономичным путем.
Обсуждение 23
Экстракция паром/фильтрация являются экологически благоприятными способами выделения амброксида, поскольку обеспечивают удобное выделение амброксида без использования растворителей с сопутствующей инактивацией биокатализатора.
Резюме 23
(-)-Амброксид, полученный при использовании реакции биоконверсии, можно экстрагировать с использованием растворителя из всей реакционной смеси (например, используя не смешиваемый с водой растворитель, или путем экстракции/дистилляции паром, или путем фильтрования) или из твердой фазы (например, используя смешиваемый с водой растворитель) способами, известными специалистам в данной области техники.
--->
SEQUENCE LISTING
<110> Givaudan SA
<120> Enzymes and Applications thereof
<130> 30578
<150> GB 1507207.7
<151> 2015-04-24
<160> 188
<170> PatentIn version 3.3
<210> 1
<211> 631
<212> PRT
<213> Alicyclobacillus acidocaldarius
<400> 1
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 2
<211> 725
<212> PRT
<213> Zymomonas mobilis
<400> 2
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 3
<211> 658
<212> PRT
<213> Zymomonas mobilis
<400> 3
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 4
<211> 684
<212> PRT
<213> Bradyrhizobium japonicum
<400> 4
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 5
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 5
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Ala Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 6
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 6
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcgc gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 7
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 7
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Val Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 8
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 8
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accgtcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 9
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 9
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Leu Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 10
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 10
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgctcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 11
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 11
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 12
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 12
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggaggtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 13
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 13
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Val
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 14
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 14
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg tgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 15
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 15
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 16
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 16
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 17
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 17
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val His Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 18
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 18
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcattac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 19
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 19
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 20
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 20
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 21
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 21
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Val
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 22
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 22
atggctgagc agttggtgga agctccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggaggtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg tgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 23
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 23
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 24
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 24
atggctgagc agttggtgga agctccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggaggtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 25
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 25
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 26
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 26
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 27
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 27
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Ala Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Val Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Leu Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 28
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 28
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcgc gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accgtcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgctcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 29
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 29
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val His Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 30
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 30
atggctgagc agttggtgga agcaccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcattac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 31
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 31
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Leu Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 32
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 32
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgctcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 33
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 33
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Leu Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 34
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 34
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgctcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 35
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 35
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Leu Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 36
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 36
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgctcacg cggaggtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 37
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 37
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 38
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 38
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggaggtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 39
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 39
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Leu Thr Arg Arg Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Thr
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Tyr Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 40
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 40
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgctcacg cggaggtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacaccccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
tacccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 41
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 41
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ala Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 42
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (387)..(387)
<223> n представляет собой a, c, g, или t
<400> 42
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggcgcntgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 43
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 43
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 44
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 44
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 45
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 45
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Leu Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 46
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (544)..(546)
<223> ntn представляет собой ttr или ctn
<400> 46
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtcntnaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 47
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 47
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 48
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (553)..(555)
<223> ngn представляет собой agr или cgn
<400> 48
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 49
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 49
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Val Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 50
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (846)..(846)
<223> n представляет собой a, c, g, или t
<400> 50
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtgtnttac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 51
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 51
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 52
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (1494)..(1494)
<223> n представляет собой a, c, g, или t
<400> 52
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 53
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 53
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 54
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 54
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 55
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 55
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 56
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 56
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 57
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 57
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Val Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 58
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (553)..(555)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (846)..(846)
<223> n представляет собой a, c, g, или t
<220>
<221> misc_feature
<222> (1494)..(1494)
<223> n представляет собой a, c, g, или t
<400> 58
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtgtnttac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 59
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 59
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 60
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (553)..(555)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1494)..(1494)
<223> n представляет собой a, c, g, или t
<400> 60
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 61
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 61
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 62
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 62
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 63
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 63
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ala Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Leu Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 64
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (387)..(387)
<223> n представляет собой a, c, g, или t
<220>
<221> misc_feature
<222> (544)..(546)
<223> ntn представляет собой ttr или ctn
<400> 64
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggcgcntgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtcntnaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 65
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 65
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 66
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 66
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 67
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 67
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Leu Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 68
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (544)..(546)
<223> ntn представляет собой ttr или ctn
<400> 68
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtcntnaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 69
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 69
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Leu Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 70
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (544)..(546)
<223> ntn представляет собой ttr или ctn
<400> 70
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtcntnaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 71
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 71
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Leu Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 72
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (544)..(546)
<223> ntn представляет собой ttr или ctn
<220>
<221> misc_feature
<222> (553)..(555)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1494)..(1494)
<223> n представляет собой a, c, g, или t
<400> 72
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtcntnaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 73
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 73
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 74
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (553)..(555)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1494)..(1494)
<223> n представляет собой a, c, g, или t
<400> 74
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 75
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 75
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Leu Thr Arg Arg Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Thr Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Tyr Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 76
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<220>
<221> misc_feature
<222> (544)..(546)
<223> ntn представляет собой ttr или ctn
<220>
<221> misc_feature
<222> (553)..(555)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1494)..(1494)
<223> n представляет собой a, c, g, или t
<400> 76
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtcntnaccc gtngntggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aacncctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg ataycccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 77
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 77
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Ala Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 78
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (255)..(255)
<223> n представляет собой a, c, g, или t
<400> 78
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcgcntggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 79
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 79
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 80
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 80
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 81
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 81
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 82
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (409)..(411)
<223> ntn представляет собой ttr или ctn
<400> 82
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 83
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 83
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Arg Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 84
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (418)..(420)
<223> ngn представляет собой agr или cgn
<400> 84
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtngn 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 85
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 85
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 86
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 86
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 87
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 87
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 88
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (1350)..(1350)
<223> n представляет собой a, c, g, или t
<400> 88
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 89
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 89
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile His Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 90
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 90
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat acaytggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 91
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 91
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 92
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 92
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 93
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 93
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Arg Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 94
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (418)..(420)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1350)..(1350)
<223> n представляет собой a, c, g, или t
<400> 94
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtngn 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 95
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 95
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Arg Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 96
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (418)..(420)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1350)..(1350)
<223> n представляет собой a, c, g, или t
<400> 96
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtngn 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 97
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 97
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 98
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 98
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 99
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 99
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Ala Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 100
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (255)..(255)
<223> n представляет собой a, c, g, или t
<220>
<221> misc_feature
<222> (409)..(411)
<223> ntn представляет собой ttr или ctn
<400> 100
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcgcntggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 101
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 101
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile His Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 102
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 102
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat acaytggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 103
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 103
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 104
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (409)..(411)
<223> ntn представляет собой ttr или ctn
<400> 104
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 105
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 105
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 106
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (409)..(411)
<223> ntn представляет собой ttr или ctn
<400> 106
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 107
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 107
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Arg Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 108
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (409)..(411)
<223> ntn представляет собой ttr или ctn
<220>
<221> misc_feature
<222> (418)..(420)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1350)..(1350)
<223> n представляет собой a, c, g, или t
<400> 108
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtngn 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 109
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 109
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Arg Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 110
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (418)..(420)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1350)..(1350)
<223> n представляет собой a, c, g, или t
<400> 110
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtngn 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 111
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 111
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Leu Thr Arg Arg Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Thr Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Tyr Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 112
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<220>
<221> misc_feature
<222> (409)..(411)
<223> ntn представляет собой ttr или ctn
<220>
<221> misc_feature
<222> (418)..(420)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1350)..(1350)
<223> n представляет собой a, c, g, или t
<400> 112
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtcnt nacacgtngn 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatacn ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggttay 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 113
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 113
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 114
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 114
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 115
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 115
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 116
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 116
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 117
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 117
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 118
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (421)..(423)
<223> ntn представляет собой ttr или ctn
<400> 118
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ntnacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 119
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 119
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Arg
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 120
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (430)..(432)
<223> ngn представляет собой agr или cgn
<400> 120
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 121
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 121
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 122
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 122
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 123
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 123
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 124
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (1377)..(1377)
<223> n представляет собой a, c, g, или t
<400> 124
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 125
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 125
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys His Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 126
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 126
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcca ytggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 127
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 127
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 128
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 128
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 129
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 129
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Arg
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 130
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (430)..(432)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1377)..(1377)
<223> n представляет собой a, c, g, или t
<400> 130
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 131
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 131
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Arg
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 132
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (430)..(432)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1377)..(1377)
<223> n представляет собой a, c, g, или t
<400> 132
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 133
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 133
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 134
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 134
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 135
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 135
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 136
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (421)..(423)
<223> ntn представляет собой ttr или ctn
<400> 136
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ntnacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 137
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 137
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys His Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 138
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 138
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcca ytggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 139
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 139
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 140
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (421)..(423)
<223> ntn представляет собой ttr или ctn
<400> 140
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ntnacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 141
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 141
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 142
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (421)..(423)
<223> ntn представляет собой ttr или ctn
<400> 142
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ntnacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 143
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 143
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Arg
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 144
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (421)..(423)
<223> ntn представляет собой ttr или ctn
<220>
<221> misc_feature
<222> (430)..(432)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1377)..(1377)
<223> n представляет собой a, c, g, или t
<400> 144
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ntnacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 145
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 145
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Arg
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 146
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (430)..(432)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1377)..(1377)
<223> n представляет собой a, c, g, или t
<400> 146
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 147
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 147
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Leu Thr Arg Arg
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Thr Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Tyr Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 148
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<220>
<221> misc_feature
<222> (421)..(423)
<223> ntn представляет собой ttr или ctn
<220>
<221> misc_feature
<222> (430)..(432)
<223> ngn представляет собой agr или cgn
<220>
<221> misc_feature
<222> (1377)..(1377)
<223> n представляет собой a, c, g, или t
<400> 148
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ntnacccgcn gntggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagacnccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg ttayccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 149
<211> 657
<212> PRT
<213> Burkholderia ambifaria
<400> 149
Met Asn Asp Leu Thr Glu Met Ala Thr Leu Ser Ala Gly Thr Val Pro
1 5 10 15
Ala Gly Leu Asp Ala Ala Val Ala Ser Ala Thr Asp Ala Leu Leu Ala
20 25 30
Ala Gln Asn Ala Asp Gly His Trp Val Tyr Glu Leu Glu Ala Asp Ser
35 40 45
Thr Ile Pro Ala Glu Tyr Val Leu Leu Val His Tyr Leu Gly Glu Thr
50 55 60
Pro Asn Leu Glu Leu Glu Gln Lys Ile Gly Arg Tyr Leu Arg Arg Val
65 70 75 80
Gln Gln Ala Asp Gly Gly Trp Pro Leu Phe Thr Asp Gly Ala Pro Asn
85 90 95
Ile Ser Ala Ser Val Lys Ala Tyr Phe Ala Leu Lys Val Ile Gly Asp
100 105 110
Asp Glu Asn Ala Glu His Met Gln Arg Ala Arg Arg Ala Ile Gln Ala
115 120 125
Met Gly Gly Ala Glu Met Ser Asn Val Phe Thr Arg Ile Gln Leu Ala
130 135 140
Leu Tyr Gly Ala Ile Pro Trp Arg Ala Val Pro Met Met Pro Val Glu
145 150 155 160
Ile Met Leu Leu Pro Gln Trp Phe Pro Phe His Leu Ser Lys Val Ser
165 170 175
Tyr Trp Ala Arg Thr Val Ile Val Pro Leu Leu Val Leu Asn Ala Lys
180 185 190
Arg Pro Ile Ala Lys Asn Pro Arg Gly Val Arg Ile Asp Glu Leu Phe
195 200 205
Val Asp Pro Pro Val Asn Ala Gly Leu Leu Pro Arg Gln Gly His Gln
210 215 220
Ser Pro Gly Trp Phe Ala Phe Phe Arg Val Val Asp His Ala Leu Arg
225 230 235 240
Ala Ala Asp Gly Leu Phe Pro Asn Tyr Thr Arg Glu Arg Ala Ile Arg
245 250 255
Gln Ala Val Ser Phe Val Asp Glu Arg Leu Asn Gly Glu Asp Gly Leu
260 265 270
Gly Ala Ile Tyr Pro Ala Met Ala Asn Ala Val Met Met Tyr Asp Val
275 280 285
Leu Gly Tyr Ala Glu Asp His Pro Asn Arg Ala Ile Ala Arg Lys Ser
290 295 300
Ile Glu Lys Leu Leu Val Val Gln Glu Asp Glu Ala Tyr Cys Gln Pro
305 310 315 320
Cys Leu Ser Pro Val Trp Asp Thr Ser Leu Ala Ala His Ala Leu Leu
325 330 335
Glu Thr Gly Asp Ala Arg Ala Glu Glu Ala Val Ile Arg Gly Leu Glu
340 345 350
Trp Leu Arg Pro Leu Gln Ile Leu Asp Val Arg Gly Asp Trp Ile Ser
355 360 365
Arg Arg Pro His Val Arg Pro Gly Gly Trp Ala Phe Gln Tyr Ala Asn
370 375 380
Pro His Tyr Pro Asp Val Asp Asp Thr Ala Val Val Ala Val Ala Met
385 390 395 400
Asp Arg Val Gln Lys Leu Lys His Asn Asp Ala Phe Arg Asp Ser Ile
405 410 415
Ala Arg Ala Arg Glu Trp Val Val Gly Met Gln Ser Ser Asp Gly Gly
420 425 430
Trp Gly Ala Phe Glu Pro Glu Asn Thr Gln Tyr Tyr Leu Asn Asn Ile
435 440 445
Pro Phe Ser Asp His Gly Ala Leu Leu Asp Pro Pro Thr Ala Asp Val
450 455 460
Ser Gly Arg Cys Leu Ser Met Leu Ala Gln Leu Gly Glu Thr Pro Leu
465 470 475 480
Asn Ser Glu Pro Ala Arg Arg Ala Leu Asp Tyr Met Leu Lys Glu Gln
485 490 495
Glu Pro Asp Gly Ser Trp Tyr Gly Arg Trp Gly Met Asn Tyr Val Tyr
500 505 510
Gly Thr Trp Thr Ala Leu Cys Ala Leu Asn Ala Ala Gly Leu Thr Pro
515 520 525
Asp Asp Pro Arg Val Lys Arg Gly Ala Gln Trp Leu Leu Ser Ile Gln
530 535 540
Asn Lys Asp Gly Gly Trp Gly Glu Asp Gly Asp Ser Tyr Lys Leu Asn
545 550 555 560
Tyr Arg Gly Phe Glu Gln Ala Pro Ser Thr Ala Ser Gln Thr Ala Trp
565 570 575
Ala Leu Leu Gly Leu Met Ala Ala Gly Glu Val Asn Asn Pro Ala Val
580 585 590
Ala Arg Gly Val Glu Tyr Leu Ile Ala Glu Gln Lys Glu His Gly Leu
595 600 605
Trp Asp Glu Thr Arg Phe Thr Ala Thr Gly Phe Pro Arg Val Phe Tyr
610 615 620
Leu Arg Tyr His Gly Tyr Arg Lys Phe Phe Pro Leu Trp Ala Leu Ala
625 630 635 640
Arg Tyr Arg Asn Leu Lys Arg Asn Asn Ala Thr Arg Val Thr Phe Gly
645 650 655
Leu
<210> 150
<400> 150
000
<210> 151
<211> 682
<212> PRT
<213> Burkholderia ambifaria
<400> 151
Met Ile Arg Arg Met Asn Lys Ser Gly Pro Ser Pro Trp Ser Ala Leu
1 5 10 15
Asp Ala Ala Ile Ala Arg Gly Arg Asp Ala Leu Met Arg Leu Gln Gln
20 25 30
Pro Asp Gly Ser Trp Cys Phe Glu Leu Glu Ser Asp Ala Thr Ile Thr
35 40 45
Ala Glu Tyr Ile Leu Met Met His Phe Met Asp Lys Ile Asp Asp Ala
50 55 60
Arg Gln Glu Lys Met Ala Arg Tyr Leu Arg Ala Ile Gln Arg Leu Asp
65 70 75 80
Thr His Gly Gly Trp Asp Leu Tyr Val Asp Gly Asp Pro Asp Val Ser
85 90 95
Cys Ser Val Lys Ala Tyr Phe Ala Leu Lys Ala Ala Gly Asp Ser Glu
100 105 110
His Ala Pro His Met Val Arg Ala Arg Asp Ala Ile Leu Glu Leu Gly
115 120 125
Gly Ala Ala Arg Ser Asn Val Phe Thr Arg Ile Leu Leu Ala Thr Phe
130 135 140
Gly Gln Val Pro Trp Arg Ala Thr Pro Phe Met Pro Ile Glu Phe Val
145 150 155 160
Leu Phe Pro Lys Trp Val Pro Ile Ser Met Tyr Lys Val Ala Tyr Trp
165 170 175
Ala Arg Thr Thr Met Val Pro Leu Leu Val Leu Cys Ser Leu Lys Ala
180 185 190
Arg Ala Arg Asn Pro Arg Asn Ile Ala Ile Pro Glu Leu Phe Val Thr
195 200 205
Pro Pro Asp Gln Glu Arg Gln Tyr Phe Pro Pro Ala Arg Gly Met Arg
210 215 220
Arg Ala Phe Leu Ala Leu Asp Arg Val Val Arg His Val Glu Pro Leu
225 230 235 240
Leu Pro Lys Arg Leu Arg Gln Arg Ala Ile Arg His Ala Gln Ala Trp
245 250 255
Cys Ala Glu Arg Met Asn Gly Glu Asp Gly Leu Gly Gly Ile Phe Pro
260 265 270
Pro Ile Val Tyr Ser Tyr Gln Met Met Asp Val Leu Gly Tyr Pro Asp
275 280 285
Asp His Pro Leu Arg Arg Asp Cys Glu Asn Ala Leu Glu Lys Leu Leu
290 295 300
Val Thr Arg Pro Asp Gly Ser Met Tyr Cys Gln Pro Cys Leu Ser Pro
305 310 315 320
Val Trp Asp Thr Ala Trp Ser Thr Met Ala Leu Glu Gln Ala Arg Gly
325 330 335
Val Ala Val Pro Glu Ala Gly Ala Pro Ala Ser Ala Leu Asp Glu Leu
340 345 350
Asp Ala Arg Ile Ala Arg Ala Tyr Asp Trp Leu Ala Glu Arg Gln Val
355 360 365
Asn Asp Leu Arg Gly Asp Trp Ile Glu Asn Ala Pro Ala Asp Thr Gln
370 375 380
Pro Gly Gly Trp Ala Phe Gln Tyr Ala Asn Pro Tyr Tyr Pro Asp Ile
385 390 395 400
Asp Asp Ser Ala Val Val Thr Ala Met Leu Asp Arg Arg Gly Arg Thr
405 410 415
His Arg Asn Ala Asp Gly Ser His Pro Tyr Ala Ala Arg Val Ala Arg
420 425 430
Ala Leu Asp Trp Met Arg Gly Leu Gln Ser Arg Asn Gly Gly Phe Ala
435 440 445
Ala Phe Asp Ala Asp Cys Asp Arg Leu Tyr Leu Asn Ala Ile Pro Phe
450 455 460
Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Glu Asp Val Ser Gly
465 470 475 480
Arg Val Leu Leu Cys Phe Gly Val Thr Lys Arg Ala Asp Asp Arg Ala
485 490 495
Ser Leu Ala Arg Ala Ile Asp Tyr Val Lys Arg Thr Gln Gln Pro Asp
500 505 510
Gly Ser Trp Trp Gly Arg Trp Gly Thr Asn Tyr Leu Tyr Gly Thr Trp
515 520 525
Ser Val Leu Ala Gly Leu Ala Leu Ala Gly Glu Asp Pro Ser Gln Pro
530 535 540
Tyr Ile Ala Arg Ala Leu Ala Trp Leu Arg Ala Arg Gln His Ala Asp
545 550 555 560
Gly Gly Trp Gly Glu Thr Asn Asp Ser Tyr Ile Asp Pro Ala Leu Ala
565 570 575
Gly Thr Asn Ala Gly Glu Ser Thr Ser Asn Cys Thr Ala Trp Ala Leu
580 585 590
Leu Ala Gln Met Ala Phe Gly Asp Gly Glu Ser Glu Ser Val Arg Arg
595 600 605
Gly Ile Ala Tyr Leu Gln Ser Val Gln Gln Asp Asp Gly Phe Trp Trp
610 615 620
His Arg Ser His Asn Ala Pro Gly Phe Pro Arg Ile Phe Tyr Leu Lys
625 630 635 640
Tyr His Gly Tyr Thr Ala Tyr Phe Pro Leu Trp Ala Leu Ala Arg Tyr
645 650 655
Arg Arg Leu Ala Gly Gly Val Ser Ala Ala Gly Ala His Ala Val Pro
660 665 670
Ala Ser Thr Gly Ala Asp Ala Ala Leu Ala
675 680
<210> 152
<400> 152
000
<210> 153
<211> 617
<212> PRT
<213> Bacillus anthracis
<400> 153
Met Leu Leu Tyr Glu Lys Ala His Glu Glu Ile Val Arg Arg Ala Thr
1 5 10 15
Ala Leu Gln Thr Met Gln Trp Gln Asp Gly Thr Trp Arg Phe Cys Phe
20 25 30
Glu Gly Ala Pro Leu Thr Asp Cys His Met Ile Phe Leu Leu Lys Leu
35 40 45
Leu Gly Arg Asp Lys Glu Ile Glu Pro Phe Val Glu Arg Val Ala Ser
50 55 60
Leu Gln Thr Asn Glu Gly Thr Trp Lys Leu His Glu Asp Glu Val Gly
65 70 75 80
Gly Asn Leu Ser Ala Thr Ile Gln Ser Tyr Ala Ala Leu Leu Ala Ser
85 90 95
Lys Lys Tyr Thr Lys Glu Asp Ala Asn Met Lys Arg Ala Glu Asn Phe
100 105 110
Ile Gln Glu Arg Gly Gly Val Ala Arg Ala His Phe Met Thr Lys Phe
115 120 125
Leu Leu Ala Ile His Gly Glu Tyr Glu Tyr Pro Ser Leu Phe His Leu
130 135 140
Pro Thr Pro Ile Met Phe Leu Gln Asn Asp Ser Pro Phe Ser Ile Phe
145 150 155 160
Glu Leu Ser Ser Ser Ala Arg Ile His Leu Ile Pro Met Met Leu Cys
165 170 175
Leu Asn Lys Arg Phe Arg Val Gly Lys Lys Leu Leu Pro Asn Leu Asn
180 185 190
His Ile Ala Gly Gly Gly Gly Glu Trp Phe Arg Glu Asp Arg Ser Pro
195 200 205
Val Phe Gln Thr Leu Leu Ser Asp Val Lys Gln Ile Ile Ser Tyr Pro
210 215 220
Leu Ser Leu His His Lys Gly Tyr Glu Glu Ile Glu Arg Phe Met Lys
225 230 235 240
Glu Arg Ile Asp Glu Asn Gly Thr Leu Tyr Ser Tyr Ala Thr Ala Ser
245 250 255
Phe Tyr Met Ile Tyr Ala Leu Leu Ala Leu Gly His Ser Leu Gln Ser
260 265 270
Ser Met Ile Gln Lys Ala Ile Ala Gly Ile Thr Ser Tyr Ile Trp Lys
275 280 285
Met Glu Arg Gly Asn His Leu Gln Asn Ser Pro Ser Thr Val Trp Asp
290 295 300
Thr Ala Leu Leu Ser Tyr Ala Leu Gln Glu Ala Gln Val Ser Lys Asp
305 310 315 320
Asn Lys Met Ile Gln Asn Ala Thr Ala Tyr Leu Leu Lys Lys Gln His
325 330 335
Thr Lys Lys Ala Asp Trp Ser Val His Ala Pro Ala Leu Thr Pro Gly
340 345 350
Gly Trp Gly Phe Ser Asp Val Asn Thr Thr Ile Pro Asp Ile Asp Asp
355 360 365
Thr Thr Ala Val Leu Arg Ala Leu Ala Arg Ser Arg Gly Asn Lys Asn
370 375 380
Ile Asp Asn Ala Trp Lys Lys Gly Gly Asn Trp Ile Lys Gly Leu Gln
385 390 395 400
Asn Asn Asp Gly Gly Trp Gly Ala Phe Glu Lys Gly Val Thr Ser Lys
405 410 415
Leu Leu Ala Lys Leu Pro Ile Glu Asn Ala Ser Asp Met Ile Thr Asp
420 425 430
Pro Ser Thr Pro Asp Ile Thr Gly Arg Val Leu Glu Phe Phe Gly Thr
435 440 445
Tyr Ala Gln Asn Glu Leu Pro Glu Lys Gln Ile Gln Arg Ala Ile Asn
450 455 460
Trp Leu Met Asn Val Gln Glu Glu Asn Gly Ser Trp Tyr Gly Lys Trp
465 470 475 480
Gly Ile Cys Tyr Leu Tyr Gly Thr Trp Ala Val Met Thr Gly Leu Arg
485 490 495
Ser Leu Gly Ile Pro Ser Ser Asn Pro Ser Leu Thr Arg Ala Ala Ser
500 505 510
Trp Leu Glu His Ile Gln His Glu Asp Gly Gly Trp Gly Glu Ser Cys
515 520 525
His Ser Ser Val Glu Lys Arg Phe Val Thr Leu Pro Phe Ser Thr Pro
530 535 540
Ser Gln Thr Ala Trp Ala Leu Asp Ala Leu Ile Ser Tyr Tyr Asp Thr
545 550 555 560
Glu Thr Pro Ala Ile Arg Lys Gly Val Ser Tyr Leu Leu Ser Asn Pro
565 570 575
Tyr Val Asn Glu Arg Tyr Pro Thr Gly Thr Gly Leu Pro Gly Ala Phe
580 585 590
Tyr Ile Arg Tyr His Ser Tyr Ala His Ile Tyr Pro Leu Leu Thr Leu
595 600 605
Ala His Tyr Ile Lys Lys Tyr Arg Lys
610 615
<210> 154
<211> 1854
<212> DNA
<213> Bacillus anthracis
<400> 154
atgttattat acgaaaaagc gcatgaagaa atagtgagaa gagcaacagc acttcaaaca 60
atgcaatggc aagatggtac gtggcgattt tgttttgaag gagctccatt aacagattgc 120
catatgattt ttttattaaa attattaggt agagataaag agatagaacc gttcgtagaa 180
agagtagcat cactccaaac aaatgaagga acatggaaat tgcacgaaga tgaagtagga 240
ggtaatttat cagctacaat tcaatcttat gccgccttac ttgcatcgaa aaaatataca 300
aaagaagatg cgaatatgaa acgagcagaa aattttattc aggaacgcgg tggtgtggcg 360
cgtgctcatt ttatgacgaa gtttttatta gcaattcatg gagaatatga atatccttca 420
ctctttcatt taccaacacc aatcatgttt ttacagaatg attccccctt tagtatattt 480
gaattaagta gctcagcacg tattcattta attccgatga tgctatgttt aaataaaaga 540
tttcgagtag ggaaaaagtt attaccaaat ttaaatcaca ttgcgggcgg aggcggagaa 600
tggtttcggg aggatcggtc tccagttttt caaacgttat taagtgatgt aaaacaaatt 660
atatcgtatc cactttcgtt acatcataaa ggatatgagg aaatagaacg ttttatgaaa 720
gagcgtattg atgaaaatgg aacgttatat agttacgcaa ctgcctcgtt ttatatgatt 780
tatgctttac ttgcgttagg gcattctctt caatcatcaa tgattcaaaa ggctatagct 840
gggataacat cttatatatg gaagatggaa agagggaatc atttgcaaaa ctctccttca 900
accgtgtggg atacagcttt attaagctat gcgttacaag aggctcaagt ttcaaaggat 960
aataagatga ttcaaaatgc aacagcgtat ttattaaaaa aacagcatac aaaaaaagct 1020
gattggagcg tacatgctcc ggcgcttact cctggcggtt ggggtttttc ggatgtgaat 1080
acgacaattc cagatataga tgatacaaca gctgtgctaa gggcattggc acgaagtaga 1140
ggaaacaaaa atatagataa tgcttggaag aaagggggca attggattaa aggattacaa 1200
aataatgatg gtggctgggg agcatttgaa aaaggtgtga cgagcaaatt attagcaaaa 1260
ttaccaatcg aaaacgcaag tgatatgatt acagatcctt ctacgccaga tattacgggg 1320
agagtgttag agtttttcgg gacgtatgca caaaacgaat tgcctgagaa acagatacaa 1380
agggcaataa attggttaat gaatgtacaa gaggaaaatg gatcatggta tgggaaatgg 1440
gggatttgtt atctatatgg tacgtgggct gttatgactg gtttacggtc actcggaatt 1500
ccgtctagca atccttcatt gacacgagca gcttcatggc ttgaacatat acagcatgaa 1560
gatggtggtt ggggagaatc atgccacagt agtgtggaga aaaggttcgt tactttacca 1620
tttagtacac catcccaaac tgcatgggcg ttagatgctc tcatttctta ctatgataca 1680
gaaacgccag ctattcgaaa aggtgtttca tatttgcttt cgaatcctta tgtgaatgaa 1740
agatatccta ctggaacagg tttaccaggt gcgttttata ttaggtatca tagctatgcc 1800
catatatatc cactacttac tttggcacat tatataaaaa aatatagaaa ataa 1854
<210> 155
<211> 720
<212> PRT
<213> Frankia alni
<400> 155
Met Pro Ala Gly Val Gly Val Leu Val Trp Leu Asp Gln Arg Leu Arg
1 5 10 15
Ala Met Gly Arg Pro Asp Leu Val Thr Thr Thr Gly Gly Ala Glu Ile
20 25 30
Pro Phe Val Leu Val Ala Ala Thr Ala Ser Thr Val Gly Val Ala Leu
35 40 45
Ala Leu Arg Arg Pro Arg His Pro Val Gly Trp Leu Phe Leu Ala Leu
50 55 60
Gly Gly Val Leu Leu Leu Ser Gly Gly Thr Gln Gly Tyr Ala Ala Tyr
65 70 75 80
Gly Ala Val Ala Arg Pro Gly Arg Leu Pro Ala Ala Asp Leu Val Ala
85 90 95
Ile Tyr Ala Asp Ala Gly Phe Ile Pro Trp Leu Val Leu Val Ala Leu
100 105 110
Ile Leu His Leu Thr Pro Thr Gly Arg Pro Leu Ser Ala Arg Trp Gly
115 120 125
Arg Ile Ala Leu Ala Thr Ala Val Ala Gly Gly Leu Trp Leu Leu Val
130 135 140
Gly Leu Val Thr Thr Glu Thr Met Gln Pro Pro Phe Gln Ser Val Thr
145 150 155 160
Asn Pro Leu Leu Ile Gly Gly Pro Leu Gly Pro Leu Leu Val Ala Arg
165 170 175
Arg Val Leu Gly Leu Ala Thr Gly Ala Gly Val Val Leu Ala Ala Val
180 185 190
Ser Leu Ile Val Arg Phe Arg Arg Ser Val Asp Val Glu Arg Arg Gln
195 200 205
Leu Leu Trp Val Ala Val Ala Ala Val Pro Leu Pro Val Leu Met Ala
210 215 220
Ala Ser Phe Ala Ala Ser Tyr Ala Gly Asn Asn Thr Ala Ala Gly Leu
225 230 235 240
Ala Ala Ala Thr Leu Ile Gly Leu Leu Ala Ile Gly Ala Gly Leu Ala
245 250 255
Ile Gly Gln Tyr His Leu Tyr Asp Val Glu Glu Ile Leu Ser Arg Ala
260 265 270
Val Thr Tyr Leu Leu Val Ser Gly Leu Leu Ala Ala Ser Tyr Ala Thr
275 280 285
Val Val Ile Val Val Gly Gln Ser Leu Ala Gly Arg Thr Gly Arg Ser
290 295 300
Gln Ile Ser Ala Val Leu Ala Thr Leu Ala Ala Val Ala Val Thr Ala
305 310 315 320
Pro Ala Tyr Arg Lys Ile Gln Glu Gly Val Asp Arg Arg Phe Ser Arg
325 330 335
Arg Arg Phe Glu Thr Leu Gln Val Ile Arg Arg Tyr Leu Arg Asp Pro
340 345 350
Asp Pro Asp Val Ala Val Glu Glu Val Leu Arg Arg Ala Leu Gly Asp
355 360 365
Pro Thr Leu Ala Val Ala Tyr Leu Val Asp Asp Arg Arg Gln Trp Val
370 375 380
Ser Ala Asp Gly Gln Pro Ala Asn Pro Gly Asn Ser Phe Met Ala Ala
385 390 395 400
Val Glu Val Tyr Arg Arg Gly Arg Pro Ile Ala Arg Val Thr Phe Asp
405 410 415
Arg Gly Arg Ala Gln Pro Gly Leu Val Arg Ala Ala Ala Thr Ala Ala
420 425 430
Thr Ala Glu Leu Asp Asn Ala Gly Leu Arg Ala Ala Val Ala Leu Gln
435 440 445
Leu Val Glu Val Arg Gln Ser Arg Thr Arg Ile Ala Ala Ala Gln Phe
450 455 460
Ala Glu Arg Arg Thr Ile Glu Arg Asn Leu His Asp Gly Ala Gln Gln
465 470 475 480
Arg Leu Leu Ala Leu Ala Leu Gln Leu Arg Ala Val Gln Leu Gly Gly
485 490 495
Asp Glu Ala Ser Leu Arg Gln Ala Ile Ser Thr Gly Ile Asp Gln Leu
500 505 510
Gln Ala Ala Val Val Glu Leu Arg Glu Leu Ala Asn Gly Leu His Pro
515 520 525
Ala Val Leu Ala Asp Gly Gly Leu Ala Ala Ala Leu Asp Asp Val Ala
530 535 540
Ala Arg Thr Pro Val Pro Ile Lys Ile Ser Ala Pro Asp Arg Arg Tyr
545 550 555 560
Pro Pro Asp Leu Glu Ala Ala Ala Trp Phe Ile Ala Cys Glu Ala Met
565 570 575
Ala Asn Ala Val Lys His Ala His Pro Thr Thr Ile Ala Val Asp Val
580 585 590
Ser Ala Pro Asp Gly Gln Leu Ile Val Glu Val Arg Asp Asp Gly Ile
595 600 605
Gly Gly Ala Gln Pro Ser Gly Pro Gly Leu Arg Gly Ile Ala Asp Arg
610 615 620
Ala Glu Ala Phe Gly Gly Ser Leu Thr Val His Thr Asp Pro Gly Thr
625 630 635 640
Gly Thr Thr Ile Arg Ala Leu Leu His Arg Arg Ser Pro Leu Ser Ser
645 650 655
Gly Arg Arg Ser Val Met Ile Glu Gly Cys Val Asp Val Val Ala Val
660 665 670
Arg Arg Phe Arg Cys Arg Ser Ser Arg Gly Ser Gly Ser Arg Arg Arg
675 680 685
Arg Ser Ser Trp Arg Cys Gly Gly Ile Cys Gly Ser Arg Cys Arg Thr
690 695 700
Gly Met Ser Arg Ser Cys Ser Arg Asn Ala Ala Ser Lys Leu Ile Thr
705 710 715 720
<210> 156
<400> 156
000
<210> 157
<211> 685
<212> PRT
<213> Rhodopseudomonas palent
<400> 157
Met Asp Ser Ile Leu Ala Pro Arg Ala Asp Ala Pro Arg Asn Ile Asp
1 5 10 15
Gly Ala Leu Arg Glu Ser Val Gln Gln Ala Ala Asp Trp Leu Val Ala
20 25 30
Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu Thr Asn Ala
35 40 45
Thr Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu
50 55 60
Asp His Pro Leu Arg Val Arg Leu Gly Arg Ala Leu Leu Asp Thr Gln
65 70 75 80
Arg Pro Asp Gly Ala Trp His Val Phe Tyr Gly Ala Pro Asn Gly Asp
85 90 95
Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly His
100 105 110
Arg Asp Asp Glu Glu Pro Leu Arg Lys Ala Arg Asp Trp Ile Leu Ser
115 120 125
Lys Gly Gly Leu Ala Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala
130 135 140
Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile Leu Pro Glu
145 150 155 160
Val Ile Trp Leu Pro Thr Trp Phe Pro Phe Ser Ile Tyr Asn Phe Ala
165 170 175
Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu Ser Ala His
180 185 190
Arg Pro Ser Arg Pro Leu Ala Pro Gln Asp Arg Leu Asp Ala Leu Phe
195 200 205
Pro Gln Gly Arg Asp Ser Phe Asn Tyr Asp Leu Pro Ala Arg Leu Gly
210 215 220
Ala Gly Val Trp Asp Val Ile Phe Arg Lys Ile Asp Thr Ile Leu His
225 230 235 240
Arg Leu Gln Asp Trp Gly Ala Arg Arg Gly Pro His Gly Ile Met Arg
245 250 255
Arg Gly Ala Ile Asp His Val Leu Gln Trp Ile Ile Arg His Gln Asp
260 265 270
Tyr Asp Gly Ser Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr Gly Leu
275 280 285
Met Ala Leu His Thr Glu Gly Tyr Ala Met Thr His Pro Val Met Ala
290 295 300
Lys Ala Leu Asp Ala Leu Asn Glu Pro Gly Trp Arg Ile Asp Ile Gly
305 310 315 320
Asp Ala Thr Phe Ile Gln Ala Thr Asn Ser Pro Val Trp Asp Thr Met
325 330 335
Leu Ser Leu Leu Ala Phe Asp Asp Ala Gly Leu Gly Glu Arg Tyr Pro
340 345 350
Glu Gln Val Glu Arg Ala Val Arg Trp Val Leu Lys Arg Gln Val Leu
355 360 365
Val Pro Gly Asp Trp Ser Val Lys Leu Pro Asp Val Lys Pro Gly Gly
370 375 380
Trp Ala Phe Glu Tyr Ala Asn Asn Phe Tyr Pro Asp Thr Asp Asp Thr
385 390 395 400
Ser Val Ala Leu Met Ala Leu Ala Pro Phe Arg His Asp Pro Lys Trp
405 410 415
Gln Ala Glu Gly Ile Glu Asp Ala Ile Gln Arg Gly Ile Asp Trp Leu
420 425 430
Val Ala Met Gln Cys Lys Glu Gly Gly Trp Gly Ala Phe Asp Lys Asp
435 440 445
Asn Asp Lys Lys Ile Leu Ala Lys Ile Pro Phe Cys Asp Phe Gly Glu
450 455 460
Ala Leu Asp Pro Pro Ser Ala Asp Val Thr Ala His Ile Ile Glu Ala
465 470 475 480
Phe Ala Lys Val Gly Leu Asp Arg Asn His Pro Ser Ile Val Arg Ala
485 490 495
Leu Asp Tyr Leu Lys Arg Glu Gln Glu Pro Glu Gly Pro Trp Phe Gly
500 505 510
Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu Pro Ala
515 520 525
Leu Ala Ala Ile Gly Glu Asp Met Arg Gln Pro Tyr Ile Ala Arg Ala
530 535 540
Cys Asp Trp Leu Ile Ala Arg Gln Gln Ala Asn Gly Gly Trp Gly Glu
545 550 555 560
Ser Cys Val Ser Tyr Met Asp Ala Lys Gln Ala Gly Glu Gly Thr Ala
565 570 575
Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Ile Ala Ala Asp
580 585 590
Arg Pro Gln Asp Arg Asp Ala Ile Glu Arg Gly Cys Leu Tyr Leu Thr
595 600 605
Glu Thr Gln Arg Asp Gly Thr Trp Gln Glu Val His Tyr Thr Gly Thr
610 615 620
Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn Asp Pro
625 630 635 640
Leu Leu Ser Lys Arg Leu Met Gln Gly Pro Glu Leu Ser Arg Ser Phe
645 650 655
Met Leu Arg Tyr Asp Leu Tyr Arg His Tyr Phe Pro Met Met Ala Ile
660 665 670
Gly Arg Val Leu Arg Gln Arg Gly Asp Arg Ser Gly His
675 680 685
<210> 158
<400> 158
000
<210> 159
<211> 679
<212> PRT
<213> Streptomyces coelicolor
<400> 159
Met Thr Ala Thr Thr Asp Gly Ser Thr Gly Ala Ser Leu Arg Pro Leu
1 5 10 15
Ala Ala Ser Ala Ser Asp Thr Asp Ile Thr Ile Pro Ala Ala Ala Ala
20 25 30
Gly Val Pro Glu Ala Ala Ala Arg Ala Thr Arg Arg Ala Thr Asp Phe
35 40 45
Leu Leu Ala Lys Gln Asp Ala Glu Gly Trp Trp Lys Gly Asp Leu Glu
50 55 60
Thr Asn Val Thr Met Asp Ala Glu Asp Leu Leu Leu Arg Gln Phe Leu
65 70 75 80
Gly Ile Gln Asp Glu Glu Thr Thr Arg Ala Ala Ala Leu Phe Ile Arg
85 90 95
Gly Glu Gln Arg Glu Asp Gly Thr Trp Ala Thr Phe Tyr Gly Gly Pro
100 105 110
Gly Glu Leu Ser Thr Thr Ile Glu Ala Tyr Val Ala Leu Arg Leu Ala
115 120 125
Gly Asp Ser Pro Glu Ala Pro His Met Ala Arg Ala Ala Glu Trp Ile
130 135 140
Arg Ser Arg Gly Gly Ile Ala Ser Ala Arg Val Phe Thr Arg Ile Trp
145 150 155 160
Leu Ala Leu Phe Gly Trp Trp Lys Trp Asp Asp Leu Pro Glu Leu Pro
165 170 175
Pro Glu Leu Ile Tyr Phe Pro Thr Trp Val Pro Leu Asn Ile Tyr Asp
180 185 190
Phe Gly Cys Trp Ala Arg Gln Thr Ile Val Pro Leu Thr Ile Val Ser
195 200 205
Ala Lys Arg Pro Val Arg Pro Ala Pro Phe Pro Leu Asp Glu Leu His
210 215 220
Thr Asp Pro Ala Arg Pro Asn Pro Pro Arg Pro Leu Ala Pro Val Ala
225 230 235 240
Ser Trp Asp Gly Ala Phe Gln Arg Ile Asp Lys Ala Leu His Ala Tyr
245 250 255
Arg Lys Val Ala Pro Arg Arg Leu Arg Arg Ala Ala Met Asn Ser Ala
260 265 270
Ala Arg Trp Ile Ile Glu Arg Gln Glu Asn Asp Gly Cys Trp Gly Gly
275 280 285
Ile Gln Pro Pro Ala Val Tyr Ser Val Ile Ala Leu Tyr Leu Leu Gly
290 295 300
Tyr Asp Leu Glu His Pro Val Met Arg Ala Gly Leu Glu Ser Leu Asp
305 310 315 320
Arg Phe Ala Val Trp Arg Glu Asp Gly Ala Arg Met Ile Glu Ala Cys
325 330 335
Gln Ser Pro Val Trp Asp Thr Cys Leu Ala Thr Ile Ala Leu Ala Asp
340 345 350
Ala Gly Val Pro Glu Asp His Pro Gln Leu Val Lys Ala Ser Asp Trp
355 360 365
Met Leu Gly Glu Gln Ile Val Arg Pro Gly Asp Trp Ser Val Lys Arg
370 375 380
Pro Gly Pro Pro Gly Gly Trp Ala Phe Glu Phe His Asn Asp Asn Tyr
385 390 395 400
Pro Asp Ile Asp Asp Thr Ala Glu Val Val Leu Ala Leu Arg Arg Val
405 410 415
Arg His His Asp Pro Glu Arg Val Glu Lys Ala Ile Gly Arg Gly Val
420 425 430
Arg Trp Asn Leu Gly Met Gln Ser Lys Asn Gly Ala Trp Gly Ala Phe
435 440 445
Asp Val Asp Asn Thr Ser Ala Phe Pro Asn Arg Leu Pro Phe Cys Asp
450 455 460
Phe Gly Glu Val Ile Asp Pro Pro Ser Ala Asp Val Thr Ala His Val
465 470 475 480
Val Glu Met Leu Ala Val Glu Gly Leu Ala His Asp Pro Arg Thr Arg
485 490 495
Arg Gly Ile Gln Trp Leu Leu Asp Ala Gln Glu Thr Asp Gly Ser Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ser Val Ile
515 520 525
Pro Ala Leu Thr Ala Ala Gly Leu Pro Thr Ser His Pro Ala Ile Arg
530 535 540
Arg Ala Val Arg Trp Leu Glu Ser Val Gln Asn Glu Asp Gly Gly Trp
545 550 555 560
Gly Glu Asp Leu Arg Ser Tyr Arg Tyr Val Arg Glu Trp Ser Gly Arg
565 570 575
Gly Ala Ser Thr Ala Ser Gln Thr Gly Trp Ala Leu Met Ala Leu Leu
580 585 590
Ala Ala Gly Glu Arg Asp Ser Lys Ala Val Glu Arg Gly Val Ala Trp
595 600 605
Leu Ala Ala Thr Gln Arg Glu Asp Gly Ser Trp Asp Glu Pro Tyr Phe
610 615 620
Thr Gly Thr Gly Phe Pro Trp Asp Phe Ser Ile Asn Tyr Asn Leu Tyr
625 630 635 640
Arg Gln Val Phe Pro Leu Thr Ala Leu Gly Arg Tyr Val His Gly Glu
645 650 655
Pro Phe Ala Lys Lys Pro Arg Ala Ala Asp Ala Pro Ala Glu Ala Ala
660 665 670
Pro Ala Glu Val Lys Gly Ser
675
<210> 160
<400> 160
000
<210> 161
<211> 725
<212> PRT
<213> Zymomonas mobilis
<400> 161
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 162
<211> 2178
<212> DNA
<213> Zymomonas mobilis
<400> 162
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 163
<211> 725
<212> PRT
<213> Zymomonas mobilis
<400> 163
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 164
<211> 2178
<212> DNA
<213> Zymomonas mobilis
<400> 164
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 165
<211> 1896
<212> DNA
<213> Alicyclobacillus acidocaldarius
<400> 165
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccatgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgtatgccg 480
ctcaacattt acgagtttgg ctcgtgggcc cgggcgaccg tcgtggcgat ctcaattgtc 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgat 600
accgacgtgc ctccgcgccg gcgcggcgcc aagggaggcg gcgggcgaat cttcgacgcg 660
ctggatcgcg ccctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccggg ccttggactg gctgctcgag cgccaggccg gagacggcag ttggggcggg 780
attcagccgc cctggtttta tacgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggttg ggagggcctc gagctgtacg gagtggacct cgactacggc 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggtcttgc cgtgctcgcg 960
ctgcgcgccg cggggcttcc ggccgatcac gaccggttgg tcaaggcggg cgagtggctt 1020
ttggaccggc agatcaccgt gccgggagac tgggcggtga agcgcccgaa cctcaaaccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tattacccgg acgtcgacga cacggccgtc 1140
gtggtctggg cgctgaacag ccttcgcttg ccggacgagc gccgcaggcg ggacgtgatg 1200
acgaaggggt tccgctggat cgtcggtatg cagagttcca acggcggctg gggcgcgtac 1260
gacgtcgaca acacgagcga tctgccaaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcggagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggc 1380
tacgacgacg cctggaaggt gatccggcgc gcggtcgagt acctcaagcg cgaacagcgc 1440
ccggatggca gttggtttgg ccgctggggc gtcaactacc tgtacggcac gggagcggtc 1500
gtgcccgcgc tgaaggccgt cgggatcgac gtgcgcgagc cgttcattca gaaggcgctc 1560
gattgggtcg agcagcatca gaacccggac ggtggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg caagggcgcg agcaccccgt cgcagacggc ttgggcgctg 1680
atggcactca tcgcgggcgg cagggcggag tcggattccg tgcgccgcgg cgtgcaatat 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccgggcg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 166
<211> 2178
<212> DNA
<213> Zymomonas mobilis
<400> 166
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtttatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 167
<211> 1977
<212> DNA
<213> Zymomonas mobilis
<400> 167
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt tttatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 168
<211> 2055
<212> DNA
<213> Bradyrhizobium japonicum
<400> 168
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc cttcatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 169
<211> 1896
<212> DNA
<213> Alicyclobacillus acidocaldarius
<400> 169
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg atttctacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 170
<211> 1896
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 170
atggctgagc agttggtgga agcgccggcc tacgcgcgga cgctggatcg cgcggtggag 60
tatctcctct cctgccaaaa ggacgaaggc tactggtggg ggccgcttct gagcaacgtc 120
acgatggaag cggagtacgt cctcttgtgc cacattctcg atcgcgtcga tcgggatcgc 180
atggagaaga tccggcggta cctgttgcac gagcagcgcg aggacggcac gtgggccctg 240
tacccgggtg ggccgccgga cctcgacacg accatcgagg cgtacgtcgc gctcaagtat 300
atcggcatgt cgcgcgacga ggagccgatg cagaaggcgc tccggttcat tcagagccag 360
ggcgggatcg agtcgtcgcg cgtgttcacg cggatgtggc tggcgctggt gggagaatat 420
ccgtgggaga aggtgcccat ggtcccgccg gagatcatgt tcctcggcaa gcgcatgccg 480
ctcaacatct acgagtttgg ctcgtgggct cgggcgaccg tcgtggcgct ctcgattgtg 540
atgagccgcc agccggtgtt cccgctgccc gagcgggcgc gcgtgcccga gctgtacgag 600
accgacgtgc ctccgcgccg gcgcggtgcc aagggagggg gtgggtggat cttcgacgcg 660
ctcgaccggg cgctgcacgg gtatcagaag ctgtcggtgc acccgttccg ccgcgcggcc 720
gagatccgcg ccttggactg gttgctcgag cgccaggccg gagacggcag ctggggcggg 780
attcagccgc cttggtttta cgcgctcatc gcgctcaaga ttctcgacat gacgcagcat 840
ccggcgttca tcaagggctg ggaaggtcta gagctgtacg gcgtggagct ggattacgga 900
ggatggatgt ttcaggcttc catctcgccg gtgtgggaca cgggcctcgc cgtgctcgcg 960
ctgcgcgctg cggggcttcc ggccgatcac gaccgcttgg tcaaggcggg cgagtggctg 1020
ttggaccggc agatcacggt tccgggcgac tgggcggtga agcgcccgaa cctcaagccg 1080
ggcgggttcg cgttccagtt cgacaacgtg tactacccgg acgtggacga cacggccgtc 1140
gtggtgtggg cgctcaacac cctgcgcttg ccggacgagc gccgcaggcg ggacgccatg 1200
acgaagggat tccgctggat tgtcggcatg cagagctcga acggcggttg gggcgcctac 1260
gacgtcgaca acacgagcga tctcccgaac cacatcccgt tctgcgactt cggcgaagtg 1320
accgatccgc cgtcagagga cgtcaccgcc cacgtgctcg agtgtttcgg cagcttcggg 1380
tacgatgacg cctggaaggt catccggcgc gcggtggaat atctcaagcg ggagcagaag 1440
ccggacggca gctggttcgg tcgttggggc gtcaattacc tctacggcac gggcgcggtg 1500
gtgtcggcgc tgaaggcggt cgggatcgac acgcgcgagc cgtacattca aaaggcgctc 1560
gactgggtcg agcagcatca gaacccggac ggcggctggg gcgaggactg ccgctcgtac 1620
gaggatccgg cgtacgcggg taagggcgcg agcaccccgt cgcagacggc ctgggcgctg 1680
atggcgctca tcgcgggcgg cagggcggag tccgaggccg cgcgccgcgg cgtgcaatac 1740
ctcgtggaga cgcagcgccc ggacggcggc tgggatgagc cgtactacac cggcacgggc 1800
ttcccagggg attggtacct cggctacacc atgtaccgcc acgtgtttcc gacgctcgcg 1860
ctcggccgct acaagcaagc catcgagcgc aggtga 1896
<210> 171
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное AacSHC
<400> 171
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Trp Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 172
<211> 2178
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 172
atgggtattg acagaatgaa tagcttaagt cgcttgttaa tgaagaagat tttcggggct 60
gaaaaaacct cgtataaacc ggcttccgat accataatcg gaacggatac cctgaaaaga 120
ccgaaccggc ggcctgaacc gacggcaaaa gtcgacaaaa cgatattcaa gactatgggg 180
aatagtctga ataataccct tgtttcagcc tgtgactggt tgatcggaca acaaaagccc 240
gatggtcatt gggtcggtgc cgtggaatcc aatgcttcga tggaagcaga atggtgtctg 300
gccttgtggt ttttgggtct ggaagatcat ccgcttcgtc caagattggg caatgctctt 360
ttggaaatgc agcgggaaga tggctcttgg ggagtctatt tcggcgctgg aaatggcgat 420
atcaatgcca cggttgaagc ctatgcggcc ttgcggtctt tggggtattc tgccgataat 480
cctgttttga aaaaagcggc agcatggatt gctgaaaaag gcggattaaa aaatatccgt 540
gtctttaccc gttattggct ggcgttgatc ggggaatggc cttgggaaaa gacccctaac 600
cttccccctg aaattatctg gttccctgat aattttgtct tttcgattta taattttgcc 660
caatgggcgc gggcaaccat ggtgccgatt gctattctgt ccgcgagacg accaagccgc 720
ccgctgcgcc ctcaagaccg attggatgaa ctgtttccag aaggccgcgc tcgctttgat 780
tatgaattgc cgaaaaaaga aggcatcgat ctttggtcgc aatttttccg aaccactgac 840
cgtggattac attgggttca gtccaatctg ttaaagcgca atagcttgcg tgaagccgct 900
atccgtcatg ttttggaatg gattatccgg catcaggatg ccgatggcgg ttggggtgga 960
attcagccac cttgggtcta tggtttgatg gcgttacatg gtgaaggcta tcagctttat 1020
catccggtga tggccaaggc tttgtcggct ttggatgatc ccggttggcg acatgacaga 1080
ggcgagtctt cttggataca ggccaccaat agtccggtat gggatacaat gttggccttg 1140
atggcgttaa aagacgccaa ggccgaggat cgttttacgc cggaaatgga taaggccgcc 1200
gattggcttt tggctcgaca ggtcaaagtc aaaggcgatt ggtcaatcaa actgcccgat 1260
gttgaacccg gtggatgggc atttgaatat gccaatgatc gctatcccga taccgatgat 1320
accgccgtcg ctttgatcgc cctttcctct tatcgtgata aggaggagtg gcaaaagaaa 1380
ggcgttgagg acgccattac ccgtggggtt aattggttga tcgccatgca aagcgaatgt 1440
ggcggttggg gagcctttga taaggataat aacagaagta tcctttccaa aattcctttt 1500
tgtgatttcg gagaatctat tgatccgcct tcagtcgatg taacggcgca tgttttagag 1560
gcctttggca ccttgggact gtcccgcgat atgccggtca tccaaaaagc gatcgactat 1620
gtccgttccg aacaggaagc cgaaggcgcg tggtttggtc gttggggcgt taattatatc 1680
tatggcaccg gtgcggttct gcctgctttg gcggcgatcg gtgaagatat gacccagcct 1740
tacatcacca aggcttgcga ttggctggtc gcacatcagc aggaagacgg cggttggggc 1800
gaaagctgct cttcctatat ggagattgat tccattggga agggcccaac cacgccgtcc 1860
cagactgctt gggctttgat ggggttgatc gcggccaatc gtcccgaaga ttatgaagcc 1920
attgccaagg gatgccatta tctgattgat cgccaagagc aggatggtag ctggaaagaa 1980
gaagaattca ccggcaccgg attccccggt tatggcgtgg gtcagacgat caagttggat 2040
gatccggctt tatcgaaacg attgcttcaa ggcgctgaac tgtcacgggc gtggatgctg 2100
cgttatgatt tttatcggca attcttcccg attatggcgt taagtcgggc agagagactg 2160
attgatttga ataattga 2178
<210> 173
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC1
<400> 173
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Ser Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Val Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Phe Thr Arg Tyr Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Gly Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Ile Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys His Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Phe Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Trp Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 174
<211> 1977
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 174
atgactgtat cgacttcctc ggcttttcat catagcccgt tgtctgatga tgttgagccg 60
attatccaaa aggccacccg tgccttgctt gagaagcagc agcaggatgg ccattgggtt 120
tttgaattgg aagccgatgc aaccattccc gctgaataca tcctgttaaa gcattatttg 180
ggtgaacccg aagatttaga aatagaggcc aagataggtc gctatttgcg tcgtattcag 240
ggcgagcatg gcggatggtc tttgttttat ggtggtgatc ttgatttgag cgccacggtc 300
aaagcctatt ttgccttgaa aatgatcgga gattctcctg atgcgcctca tatgcttcga 360
gccagaaatg aaattttggc acggggtggg gcgatgcgtg ccaatgtctt tacacgtatt 420
caattagctc tgttcggggc aatgtcatgg gagcatgtcc ctcaaatgcc cgtagagttg 480
atgttgatgc cggaatggtt tccggttcac atcaataaaa tggcctattg ggcaagaacc 540
gttttagtcc cgttattggt tttacaggcg ttaaagcctg tcgcccgtaa tcggcgcggt 600
atcttggttg atgaattatt tgtgccggat gttttaccga cccttcagga aagcggtgac 660
cctatatggc gtcgtttttt ttcggcactt gataaggtat tgcataaagt agaaccttat 720
tggccgaaaa atatgcgcgc gaaggctatt catagctgtg tccattttgt gaccgagcgt 780
ttgaatggtg aagacgggtt gggtgctatt tatccggcga ttgccaatag cgtcatgatg 840
tatgatgcct tgggatatcc cgaaaaccat ccagaaagag ccattgcccg tcgggctgtc 900
gaaaaattga tggtgttaga tggcacggaa gatcagggtg ataaagaagt ctactgtcag 960
ccttgtttat ccccgatttg ggataccgct ttggttgccc atgccatgtt ggaagtcgga 1020
ggcgatgagg ctgaaaaatc ggctatttct gccttgagct ggttaaagcc gcaacaaatt 1080
ttggatgtaa agggcgattg ggcatggcgg cggcctgatc tcagacccgg gggatgggcc 1140
tttcaatata gaaatgacta ttatcccgat gtcgatgata cggctgttgt gactatggcg 1200
atggatcgag ccgcaaaatt gtcggatctt cacgatgatt ttgaggaatc taaagcgcgt 1260
gccatggaat ggaccattgg gatgcaaagc gataatggcg gttggggcgc tttcgatgcc 1320
aataacagct atacttatct gaataatatt ccctttgctg atcatggcgc gttacttgat 1380
ccgccaacgg tcgatgtctc ggcacgctgc gtttcaatga tggcgcaagc cggtatctcg 1440
attacagatc ccaaaatgaa agcggcagtt gattatcttc tgaaagagca agaagaggat 1500
ggtagctggt tcgggcgttg gggtgtcaat tacatatatg gcacatggtc ggccttatgt 1560
gcattgaatg tggccgcttt accccatgat catttagctg ttcagaaagc tgtggcttgg 1620
ctgaaaacta ttcaaaatga agatggtggt tggggtgaaa attgcgatag ctatgccctt 1680
gattatagcg gatacgagcc gatggattcg acggcttccc aaacagcatg ggctttattg 1740
ggcttgatgg ctgttgggga agctaattcc gaggccgtga caaagggtat aaactggttg 1800
gcacaaaatc aggatgaaga aggattgtgg aaagaagatt attatagtgg cggtggtttt 1860
ccccgtgttt ggtatcttcg gtatcacggt tattccaaat attttcctct ttgggcttta 1920
gcgcgctatc gcaatttgaa aaaagccaat cagccgattg ttcattatgg gatgtaa 1977
<210> 175
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное ZmoSHC2
<400> 175
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Gly Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Val Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Phe Thr Arg Ile Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Val Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Ile Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Asn Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Phe Pro Arg Val Trp
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 176
<211> 2055
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 176
atgactgtga ccagctcggc ctccgcgcgt gcgacgcgcg acccgggaaa ttatcagact 60
gccctgcaat cgacggtgcg cgcggcggcg gattggctga tcgccaacca gaagccggac 120
ggccattggg tcggccgcgc cgagtccaat gcctgcatgg aggcgcaatg gtgcctcgcg 180
ctgtggttca tggggctcga ggaccatccg ctgcgcaagc gcctgggcca gtcgctgctc 240
gacagccagc gcccggacgg cgcctggcag gtctatttcg gcgcccccaa tggcgacatc 300
aacgcgactg tcgaggccta tgccgcgctc cgctcgctgg gcttccgcga cgacgagccg 360
gcggtgcgcc gggcgcggga atggatcgag gccaagggcg gcctgcgcaa catccgcgtc 420
ttcacccgct actggctggc actgatcggc gaatggccgt gggagaagac accgaacatc 480
ccgccggagg tgatctggtt tccgctctgg tttccgttct cgatctacaa tttcgcgcaa 540
tgggcccgcg ccaccttgat gccgatcgcc gtgctgtcgg cgcggcggcc gagccggccg 600
ctgccgccgg agaaccgcct cgatgcgctg tttccgcatg gacggaaggc gttcgactac 660
gaactgccgg tcaaggccgg cgccggcggc tgggacaggt tcttccgcgg cgccgacaag 720
gttctgcaca agctgcagaa cctcggcaac cgtctcaatc tcggcctgtt ccgcccggcg 780
gccaccagcc gcgtgctgga atggatgatc cgccatcagg atttcgacgg cgcctggggc 840
ggcatccagc cgccctggat ctacgggctg atggcgctct atgccgaagg ctatccgctc 900
aatcatcccg tgctcgcaaa gggcctcgac gcgctgaacg atcccggctg gcgcgtcgat 960
gtcggtgacg ccacctacat ccaggccacc aacagcccgg tctgggacac gatcctgacc 1020
ttgctcgcct tcgacgatgc cggcgtgctc ggcgactatc ccgaggccgt cgacaaggcg 1080
gtcgactggg tgctgcagcg gcaggtgcgc gtgcccggcg actggtcgat gaagctgccg 1140
catgtcaagc ccggcggctg ggcgttcgaa tacgccaaca actactatcc cgacacggac 1200
gacaccgcgg tcgcgctgat cgcgctggcg ccactgcgcc acgatccgaa atggaaggcc 1260
aaagggatcg acgaggctat ccagctcggt gtcgactggc tgatcggcat gcagagccag 1320
ggcggcggct ggggcgcgtt cgacaaggac aacaaccaga agatcctgac caagatcccg 1380
ttctgcgatt atggcgaggc gctcgatccg ccctcggtcg acgtcaccgc ccacatcatc 1440
gaggcgttcg gcaagctcgg catctcgcgc aaccatccgt cgatggtgca ggcgctggac 1500
tatattcgcc gtgagcagga gccgagcggt ccgtggttcg gccgctgggg cgtcaattac 1560
gtctacggca ccggcgcggt gctgccggcg ctggccgcga tcggcgagga catgacccag 1620
ccctatatcg gccgcgcctg cgactggctg gttgcccatc agcaggccga tggcggctgg 1680
ggcgagagct gcgcctccta catggatgtc agcgcggtcg gccgcggcac cacaacggcc 1740
tcgcagaccg cctgggcgct gatggcgctg ctcgccgcca atcgccccca ggacaaggac 1800
gcgatcgagc gtggctgcat gtggctggtc gagcgccagt cggccggcac ctgggacgag 1860
ccggaattca ccggcaccgg tttcccgggc tacggcgtcg gccagaccat caagctgaac 1920
gatcccgcgc tgtcgcagcg gctgatgcag ggcccggaat tgtcccgcgc ctggatgctc 1980
cgctacggca tgtaccgcca ctacttcccg ctgatggcgc tcggccgcgc cctacgcccg 2040
cagagtcata gctag 2055
<210> 177
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное BjapSHC1
<400> 177
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Ala Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Val Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Phe Thr Arg Tyr
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Val Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Ile Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Met Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Phe Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Trp Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<210> 178
<211> 631
<212> PRT
<213> Alicyclobacillus acidocaldarius
<400> 178
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Thr Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Ile Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Phe Thr Arg Met Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Ile Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Asp Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Arg Ile Phe Asp Ala Leu Asp Arg Ala
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Thr Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Asp Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Ser Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Val Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Ile
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Arg
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Pro Ala Leu Lys Ala Val Gly Ile Asp Val Arg
500 505 510
Glu Pro Phe Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Asp Ser Val Arg Arg
565 570 575
Gly Val Gln Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Phe Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 179
<211> 382
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическая область клонирования/экспрессии плазмиды pET-28a(+)
<220>
<221> CDS
<222> (109)..(285)
<400> 179
agatctcgat cccgcgaaat taatacgact cactataggg gaattgtgag cggataacaa 60
ttcccctcta gaaataattt ttgtttaact ttaagaagga gatatacc atg ggc agc 117
Met Gly Ser
1
agc cat cat cat cat cat cac agc agc ggc ctg gtg ccg cgc ggc agc 165
Ser His His His His His His Ser Ser Gly Leu Val Pro Arg Gly Ser
5 10 15
cat atg gct agc atg act ggt gga cag caa atg ggt cgc gga tcc gaa 213
His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Glu
20 25 30 35
ttc gag ctc cgt cga caa gct tgc ggc cgc act cga gca cca cca cca 261
Phe Glu Leu Arg Arg Gln Ala Cys Gly Arg Thr Arg Ala Pro Pro Pro
40 45 50
cca cca ctg aga tcc ggc tgc taa caaagcccga aaggaagctg agttggctgc 315
Pro Pro Leu Arg Ser Gly Cys
55
tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg tcttgagggg 375
ttttttg 382
<210> 180
<211> 58
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическая конструкция
<400> 180
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
20 25 30
Gly Ser Glu Phe Glu Leu Arg Arg Gln Ala Cys Gly Arg Thr Arg Ala
35 40 45
Pro Pro Pro Pro Pro Leu Arg Ser Gly Cys
50 55
<210> 181
<211> 94
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическая область клонирования/экспрессии плазмиды pET-28b(+)
<220>
<221> CDS
<222> (1)..(72)
<400> 181
ggt cgg gat ccg aat tcg agc tcc gtc gac aag ctt gcg gcc gca ctc 48
Gly Arg Asp Pro Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu
1 5 10 15
gag cac cac cac cac cac cac tga gatccggctg ctaacaaagc cc 94
Glu His His His His His His
20
<210> 182
<211> 23
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическая конструкция
<400> 182
Gly Arg Asp Pro Asn Ser Ser Ser Val Asp Lys Leu Ala Ala Ala Leu
1 5 10 15
Glu His His His His His His
20
<210> 183
<211> 93
<212> DNA
<213> Artificial sequence
<220>
<223> Синтетическая область клонирования/экспрессии плазмиды pET-28c(+)
<220>
<221> CDS
<222> (1)..(93)
<400> 183
ggt cgg atc cga att cga gct ccg tcg aca agc ttg cgg ccg cac tcg 48
Gly Arg Ile Arg Ile Arg Ala Pro Ser Thr Ser Leu Arg Pro His Ser
1 5 10 15
agc acc acc acc acc acc act gag atc cgg ctg cta aca aag ccc 93
Ser Thr Thr Thr Thr Thr Thr Glu Ile Arg Leu Leu Thr Lys Pro
20 25 30
<210> 184
<211> 31
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическая конструкция
<400> 184
Gly Arg Ile Arg Ile Arg Ala Pro Ser Thr Ser Leu Arg Pro His Ser
1 5 10 15
Ser Thr Thr Thr Thr Thr Thr Glu Ile Arg Leu Leu Thr Lys Pro
20 25 30
<210> 185
<211> 631
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное SHC
<220>
<221> VARIANT
<222> (77)..(77)
<223> T77X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y
<220>
<221> VARIANT
<222> (92)..(92)
<223> I92X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y
<220>
<221> VARIANT
<222> (129)..(129)
<223> F129X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (132)..(132)
<223> M132X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (224)..(224)
<223> A224X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (432)..(432)
<223> I432X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (579)..(579)
<223> Q579X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (601)..(601)
<223> F601X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<400> 185
Met Ala Glu Gln Leu Val Glu Ala Pro Ala Tyr Ala Arg Thr Leu Asp
1 5 10 15
Arg Ala Val Glu Tyr Leu Leu Ser Cys Gln Lys Asp Glu Gly Tyr Trp
20 25 30
Trp Gly Pro Leu Leu Ser Asn Val Thr Met Glu Ala Glu Tyr Val Leu
35 40 45
Leu Cys His Ile Leu Asp Arg Val Asp Arg Asp Arg Met Glu Lys Ile
50 55 60
Arg Arg Tyr Leu Leu His Glu Gln Arg Glu Asp Gly Xaa Trp Ala Leu
65 70 75 80
Tyr Pro Gly Gly Pro Pro Asp Leu Asp Thr Thr Xaa Glu Ala Tyr Val
85 90 95
Ala Leu Lys Tyr Ile Gly Met Ser Arg Asp Glu Glu Pro Met Gln Lys
100 105 110
Ala Leu Arg Phe Ile Gln Ser Gln Gly Gly Ile Glu Ser Ser Arg Val
115 120 125
Xaa Thr Arg Xaa Trp Leu Ala Leu Val Gly Glu Tyr Pro Trp Glu Lys
130 135 140
Val Pro Met Val Pro Pro Glu Ile Met Phe Leu Gly Lys Arg Met Pro
145 150 155 160
Leu Asn Ile Tyr Glu Phe Gly Ser Trp Ala Arg Ala Thr Val Val Ala
165 170 175
Leu Ser Ile Val Met Ser Arg Gln Pro Val Phe Pro Leu Pro Glu Arg
180 185 190
Ala Arg Val Pro Glu Leu Tyr Glu Thr Asp Val Pro Pro Arg Arg Arg
195 200 205
Gly Ala Lys Gly Gly Gly Gly Trp Ile Phe Asp Ala Leu Asp Arg Xaa
210 215 220
Leu His Gly Tyr Gln Lys Leu Ser Val His Pro Phe Arg Arg Ala Ala
225 230 235 240
Glu Ile Arg Ala Leu Asp Trp Leu Leu Glu Arg Gln Ala Gly Asp Gly
245 250 255
Ser Trp Gly Gly Ile Gln Pro Pro Trp Phe Tyr Ala Leu Ile Ala Leu
260 265 270
Lys Ile Leu Asp Met Thr Gln His Pro Ala Phe Ile Lys Gly Trp Glu
275 280 285
Gly Leu Glu Leu Tyr Gly Val Glu Leu Asp Tyr Gly Gly Trp Met Phe
290 295 300
Gln Ala Ser Ile Ser Pro Val Trp Asp Thr Gly Leu Ala Val Leu Ala
305 310 315 320
Leu Arg Ala Ala Gly Leu Pro Ala Asp His Asp Arg Leu Val Lys Ala
325 330 335
Gly Glu Trp Leu Leu Asp Arg Gln Ile Thr Val Pro Gly Asp Trp Ala
340 345 350
Val Lys Arg Pro Asn Leu Lys Pro Gly Gly Phe Ala Phe Gln Phe Asp
355 360 365
Asn Val Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Val Trp Ala
370 375 380
Leu Asn Thr Leu Arg Leu Pro Asp Glu Arg Arg Arg Arg Asp Ala Met
385 390 395 400
Thr Lys Gly Phe Arg Trp Ile Val Gly Met Gln Ser Ser Asn Gly Gly
405 410 415
Trp Gly Ala Tyr Asp Val Asp Asn Thr Ser Asp Leu Pro Asn His Xaa
420 425 430
Pro Phe Cys Asp Phe Gly Glu Val Thr Asp Pro Pro Ser Glu Asp Val
435 440 445
Thr Ala His Val Leu Glu Cys Phe Gly Ser Phe Gly Tyr Asp Asp Ala
450 455 460
Trp Lys Val Ile Arg Arg Ala Val Glu Tyr Leu Lys Arg Glu Gln Lys
465 470 475 480
Pro Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Leu Tyr Gly
485 490 495
Thr Gly Ala Val Val Ser Ala Leu Lys Ala Val Gly Ile Asp Thr Arg
500 505 510
Glu Pro Tyr Ile Gln Lys Ala Leu Asp Trp Val Glu Gln His Gln Asn
515 520 525
Pro Asp Gly Gly Trp Gly Glu Asp Cys Arg Ser Tyr Glu Asp Pro Ala
530 535 540
Tyr Ala Gly Lys Gly Ala Ser Thr Pro Ser Gln Thr Ala Trp Ala Leu
545 550 555 560
Met Ala Leu Ile Ala Gly Gly Arg Ala Glu Ser Glu Ala Ala Arg Arg
565 570 575
Gly Val Xaa Tyr Leu Val Glu Thr Gln Arg Pro Asp Gly Gly Trp Asp
580 585 590
Glu Pro Tyr Tyr Thr Gly Thr Gly Xaa Pro Gly Asp Phe Tyr Leu Gly
595 600 605
Tyr Thr Met Tyr Arg His Val Phe Pro Thr Leu Ala Leu Gly Arg Tyr
610 615 620
Lys Gln Ala Ile Glu Arg Arg
625 630
<210> 186
<211> 725
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное SHC
<220>
<221> VARIANT
<222> (129)..(129)
<223> S129X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (145)..(145)
<223> V145X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (182)..(182)
<223> F182X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (185)..(185)
<223> Y185X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (282)..(282)
<223> G282X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (498)..(498)
<223> I498X имеет X, выбранный из: A, B, C, D, E, F, G, H, I, K, L, M, N,
P, Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (646)..(646)
<223> H646X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (668)..(668)
<223> F668X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<400> 186
Met Gly Ile Asp Arg Met Asn Ser Leu Ser Arg Leu Leu Met Lys Lys
1 5 10 15
Ile Phe Gly Ala Glu Lys Thr Ser Tyr Lys Pro Ala Ser Asp Thr Ile
20 25 30
Ile Gly Thr Asp Thr Leu Lys Arg Pro Asn Arg Arg Pro Glu Pro Thr
35 40 45
Ala Lys Val Asp Lys Thr Ile Phe Lys Thr Met Gly Asn Ser Leu Asn
50 55 60
Asn Thr Leu Val Ser Ala Cys Asp Trp Leu Ile Gly Gln Gln Lys Pro
65 70 75 80
Asp Gly His Trp Val Gly Ala Val Glu Ser Asn Ala Ser Met Glu Ala
85 90 95
Glu Trp Cys Leu Ala Leu Trp Phe Leu Gly Leu Glu Asp His Pro Leu
100 105 110
Arg Pro Arg Leu Gly Asn Ala Leu Leu Glu Met Gln Arg Glu Asp Gly
115 120 125
Xaa Trp Gly Val Tyr Phe Gly Ala Gly Asn Gly Asp Ile Asn Ala Thr
130 135 140
Xaa Glu Ala Tyr Ala Ala Leu Arg Ser Leu Gly Tyr Ser Ala Asp Asn
145 150 155 160
Pro Val Leu Lys Lys Ala Ala Ala Trp Ile Ala Glu Lys Gly Gly Leu
165 170 175
Lys Asn Ile Arg Val Xaa Thr Arg Xaa Trp Leu Ala Leu Ile Gly Glu
180 185 190
Trp Pro Trp Glu Lys Thr Pro Asn Leu Pro Pro Glu Ile Ile Trp Phe
195 200 205
Pro Asp Asn Phe Val Phe Ser Ile Tyr Asn Phe Ala Gln Trp Ala Arg
210 215 220
Ala Thr Met Val Pro Ile Ala Ile Leu Ser Ala Arg Arg Pro Ser Arg
225 230 235 240
Pro Leu Arg Pro Gln Asp Arg Leu Asp Glu Leu Phe Pro Glu Gly Arg
245 250 255
Ala Arg Phe Asp Tyr Glu Leu Pro Lys Lys Glu Gly Ile Asp Leu Trp
260 265 270
Ser Gln Phe Phe Arg Thr Thr Asp Arg Xaa Leu His Trp Val Gln Ser
275 280 285
Asn Leu Leu Lys Arg Asn Ser Leu Arg Glu Ala Ala Ile Arg His Val
290 295 300
Leu Glu Trp Ile Ile Arg His Gln Asp Ala Asp Gly Gly Trp Gly Gly
305 310 315 320
Ile Gln Pro Pro Trp Val Tyr Gly Leu Met Ala Leu His Gly Glu Gly
325 330 335
Tyr Gln Leu Tyr His Pro Val Met Ala Lys Ala Leu Ser Ala Leu Asp
340 345 350
Asp Pro Gly Trp Arg His Asp Arg Gly Glu Ser Ser Trp Ile Gln Ala
355 360 365
Thr Asn Ser Pro Val Trp Asp Thr Met Leu Ala Leu Met Ala Leu Lys
370 375 380
Asp Ala Lys Ala Glu Asp Arg Phe Thr Pro Glu Met Asp Lys Ala Ala
385 390 395 400
Asp Trp Leu Leu Ala Arg Gln Val Lys Val Lys Gly Asp Trp Ser Ile
405 410 415
Lys Leu Pro Asp Val Glu Pro Gly Gly Trp Ala Phe Glu Tyr Ala Asn
420 425 430
Asp Arg Tyr Pro Asp Thr Asp Asp Thr Ala Val Ala Leu Ile Ala Leu
435 440 445
Ser Ser Tyr Arg Asp Lys Glu Glu Trp Gln Lys Lys Gly Val Glu Asp
450 455 460
Ala Ile Thr Arg Gly Val Asn Trp Leu Ile Ala Met Gln Ser Glu Cys
465 470 475 480
Gly Gly Trp Gly Ala Phe Asp Lys Asp Asn Asn Arg Ser Ile Leu Ser
485 490 495
Lys Xaa Pro Phe Cys Asp Phe Gly Glu Ser Ile Asp Pro Pro Ser Val
500 505 510
Asp Val Thr Ala His Val Leu Glu Ala Phe Gly Thr Leu Gly Leu Ser
515 520 525
Arg Asp Met Pro Val Ile Gln Lys Ala Ile Asp Tyr Val Arg Ser Glu
530 535 540
Gln Glu Ala Glu Gly Ala Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
545 550 555 560
Tyr Gly Thr Gly Ala Val Leu Pro Ala Leu Ala Ala Ile Gly Glu Asp
565 570 575
Met Thr Gln Pro Tyr Ile Thr Lys Ala Cys Asp Trp Leu Val Ala His
580 585 590
Gln Gln Glu Asp Gly Gly Trp Gly Glu Ser Cys Ser Ser Tyr Met Glu
595 600 605
Ile Asp Ser Ile Gly Lys Gly Pro Thr Thr Pro Ser Gln Thr Ala Trp
610 615 620
Ala Leu Met Gly Leu Ile Ala Ala Asn Arg Pro Glu Asp Tyr Glu Ala
625 630 635 640
Ile Ala Lys Gly Cys Xaa Tyr Leu Ile Asp Arg Gln Glu Gln Asp Gly
645 650 655
Ser Trp Lys Glu Glu Glu Phe Thr Gly Thr Gly Xaa Pro Gly Tyr Gly
660 665 670
Val Gly Gln Thr Ile Lys Leu Asp Asp Pro Ala Leu Ser Lys Arg Leu
675 680 685
Leu Gln Gly Ala Glu Leu Ser Arg Ala Phe Met Leu Arg Tyr Asp Phe
690 695 700
Tyr Arg Gln Phe Phe Pro Ile Met Ala Leu Ser Arg Ala Glu Arg Leu
705 710 715 720
Ile Asp Leu Asn Asn
725
<210> 187
<211> 658
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное SHC
<220>
<221> VARIANT
<222> (85)..(85)
<223> G85X имеет X, выбранный из: A, C, D, E, F, G, H, I, K , L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (100)..(100)
<223> V100X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (137)..(137)
<223> F137X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (140)..(140)
<223> I140X имеет X, выбранный из: A,, C, D, E, F, G, H, I, K, L, M, N,
P, Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (233)..(233)
<223> V233X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (450)..(450)
<223> I450X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (598)..(598)
<223> N598X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y
<220>
<221> VARIANT
<222> (620)..(620)
<223> F620X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<400> 187
Met Thr Val Ser Thr Ser Ser Ala Phe His His Ser Pro Leu Ser Asp
1 5 10 15
Asp Val Glu Pro Ile Ile Gln Lys Ala Thr Arg Ala Leu Leu Glu Lys
20 25 30
Gln Gln Gln Asp Gly His Trp Val Phe Glu Leu Glu Ala Asp Ala Thr
35 40 45
Ile Pro Ala Glu Tyr Ile Leu Leu Lys His Tyr Leu Gly Glu Pro Glu
50 55 60
Asp Leu Glu Ile Glu Ala Lys Ile Gly Arg Tyr Leu Arg Arg Ile Gln
65 70 75 80
Gly Glu His Gly Xaa Trp Ser Leu Phe Tyr Gly Gly Asp Leu Asp Leu
85 90 95
Ser Ala Thr Xaa Lys Ala Tyr Phe Ala Leu Lys Met Ile Gly Asp Ser
100 105 110
Pro Asp Ala Pro His Met Leu Arg Ala Arg Asn Glu Ile Leu Ala Arg
115 120 125
Gly Gly Ala Met Arg Ala Asn Val Xaa Thr Arg Xaa Gln Leu Ala Leu
130 135 140
Phe Gly Ala Met Ser Trp Glu His Val Pro Gln Met Pro Val Glu Leu
145 150 155 160
Met Leu Met Pro Glu Trp Phe Pro Val His Ile Asn Lys Met Ala Tyr
165 170 175
Trp Ala Arg Thr Val Leu Val Pro Leu Leu Val Leu Gln Ala Leu Lys
180 185 190
Pro Val Ala Arg Asn Arg Arg Gly Ile Leu Val Asp Glu Leu Phe Val
195 200 205
Pro Asp Val Leu Pro Thr Leu Gln Glu Ser Gly Asp Pro Ile Trp Arg
210 215 220
Arg Phe Phe Ser Ala Leu Asp Lys Xaa Leu His Lys Val Glu Pro Tyr
225 230 235 240
Trp Pro Lys Asn Met Arg Ala Lys Ala Ile His Ser Cys Val His Phe
245 250 255
Val Thr Glu Arg Leu Asn Gly Glu Asp Gly Leu Gly Ala Ile Tyr Pro
260 265 270
Ala Ile Ala Asn Ser Val Met Met Tyr Asp Ala Leu Gly Tyr Pro Glu
275 280 285
Asn His Pro Glu Arg Ala Ile Ala Arg Arg Ala Val Glu Lys Leu Met
290 295 300
Val Leu Asp Gly Thr Glu Asp Gln Gly Asp Lys Glu Val Tyr Cys Gln
305 310 315 320
Pro Cys Leu Ser Pro Ile Trp Asp Thr Ala Leu Val Ala His Ala Met
325 330 335
Leu Glu Val Gly Gly Asp Glu Ala Glu Lys Ser Ala Ile Ser Ala Leu
340 345 350
Ser Trp Leu Lys Pro Gln Gln Ile Leu Asp Val Lys Gly Asp Trp Ala
355 360 365
Trp Arg Arg Pro Asp Leu Arg Pro Gly Gly Trp Ala Phe Gln Tyr Arg
370 375 380
Asn Asp Tyr Tyr Pro Asp Val Asp Asp Thr Ala Val Val Thr Met Ala
385 390 395 400
Met Asp Arg Ala Ala Lys Leu Ser Asp Leu His Asp Asp Phe Glu Glu
405 410 415
Ser Lys Ala Arg Ala Met Glu Trp Thr Ile Gly Met Gln Ser Asp Asn
420 425 430
Gly Gly Trp Gly Ala Phe Asp Ala Asn Asn Ser Tyr Thr Tyr Leu Asn
435 440 445
Asn Xaa Pro Phe Ala Asp His Gly Ala Leu Leu Asp Pro Pro Thr Val
450 455 460
Asp Val Ser Ala Arg Cys Val Ser Met Met Ala Gln Ala Gly Ile Ser
465 470 475 480
Ile Thr Asp Pro Lys Met Lys Ala Ala Val Asp Tyr Leu Leu Lys Glu
485 490 495
Gln Glu Glu Asp Gly Ser Trp Phe Gly Arg Trp Gly Val Asn Tyr Ile
500 505 510
Tyr Gly Thr Trp Ser Ala Leu Cys Ala Leu Asn Val Ala Ala Leu Pro
515 520 525
His Asp His Leu Ala Val Gln Lys Ala Val Ala Trp Leu Lys Thr Ile
530 535 540
Gln Asn Glu Asp Gly Gly Trp Gly Glu Asn Cys Asp Ser Tyr Ala Leu
545 550 555 560
Asp Tyr Ser Gly Tyr Glu Pro Met Asp Ser Thr Ala Ser Gln Thr Ala
565 570 575
Trp Ala Leu Leu Gly Leu Met Ala Val Gly Glu Ala Asn Ser Glu Ala
580 585 590
Val Thr Lys Gly Ile Xaa Trp Leu Ala Gln Asn Gln Asp Glu Glu Gly
595 600 605
Leu Trp Lys Glu Asp Tyr Tyr Ser Gly Gly Gly Xaa Pro Arg Val Phe
610 615 620
Tyr Leu Arg Tyr His Gly Tyr Ser Lys Tyr Phe Pro Leu Trp Ala Leu
625 630 635 640
Ala Arg Tyr Arg Asn Leu Lys Lys Ala Asn Gln Pro Ile Val His Tyr
645 650 655
Gly Met
<210> 188
<211> 684
<212> PRT
<213> Artificial sequence
<220>
<223> Синтетическое производное SHC
<220>
<221> VARIANT
<222> (88)..(88)
<223> A88X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (104)..(104)
<223> V104X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (141)..(141)
<223> F141X, имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N,
P, Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (144)..(144)
<223> Y144X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (241)..(241)
<223> V241X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (459)..(459)
<223> I459X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (607)..(607)
<223> M607X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<220>
<221> VARIANT
<222> (628)..(628)
<223> F628X имеет X, выбранный из: A, C, D, E, F, G, H, I, K, L, M, N, P,
Q, R, S, T, V, W или Y.
<400> 188
Met Thr Val Thr Ser Ser Ala Ser Ala Arg Ala Thr Arg Asp Pro Gly
1 5 10 15
Asn Tyr Gln Thr Ala Leu Gln Ser Thr Val Arg Ala Ala Ala Asp Trp
20 25 30
Leu Ile Ala Asn Gln Lys Pro Asp Gly His Trp Val Gly Arg Ala Glu
35 40 45
Ser Asn Ala Cys Met Glu Ala Gln Trp Cys Leu Ala Leu Trp Phe Met
50 55 60
Gly Leu Glu Asp His Pro Leu Arg Lys Arg Leu Gly Gln Ser Leu Leu
65 70 75 80
Asp Ser Gln Arg Pro Asp Gly Xaa Trp Gln Val Tyr Phe Gly Ala Pro
85 90 95
Asn Gly Asp Ile Asn Ala Thr Xaa Glu Ala Tyr Ala Ala Leu Arg Ser
100 105 110
Leu Gly Phe Arg Asp Asp Glu Pro Ala Val Arg Arg Ala Arg Glu Trp
115 120 125
Ile Glu Ala Lys Gly Gly Leu Arg Asn Ile Arg Val Xaa Thr Arg Xaa
130 135 140
Trp Leu Ala Leu Ile Gly Glu Trp Pro Trp Glu Lys Thr Pro Asn Ile
145 150 155 160
Pro Pro Glu Val Ile Trp Phe Pro Leu Trp Phe Pro Phe Ser Ile Tyr
165 170 175
Asn Phe Ala Gln Trp Ala Arg Ala Thr Leu Met Pro Ile Ala Val Leu
180 185 190
Ser Ala Arg Arg Pro Ser Arg Pro Leu Pro Pro Glu Asn Arg Leu Asp
195 200 205
Ala Leu Phe Pro His Gly Arg Lys Ala Phe Asp Tyr Glu Leu Pro Val
210 215 220
Lys Ala Gly Ala Gly Gly Trp Asp Arg Phe Phe Arg Gly Ala Asp Lys
225 230 235 240
Xaa Leu His Lys Leu Gln Asn Leu Gly Asn Arg Leu Asn Leu Gly Leu
245 250 255
Phe Arg Pro Ala Ala Thr Ser Arg Val Leu Glu Trp Met Ile Arg His
260 265 270
Gln Asp Phe Asp Gly Ala Trp Gly Gly Ile Gln Pro Pro Trp Ile Tyr
275 280 285
Gly Leu Met Ala Leu Tyr Ala Glu Gly Tyr Pro Leu Asn His Pro Val
290 295 300
Leu Ala Lys Gly Leu Asp Ala Leu Asn Asp Pro Gly Trp Arg Val Asp
305 310 315 320
Val Gly Asp Ala Thr Tyr Ile Gln Ala Thr Asn Ser Pro Val Trp Asp
325 330 335
Thr Ile Leu Thr Leu Leu Ala Phe Asp Asp Ala Gly Val Leu Gly Asp
340 345 350
Tyr Pro Glu Ala Val Asp Lys Ala Val Asp Trp Val Leu Gln Arg Gln
355 360 365
Val Arg Val Pro Gly Asp Trp Ser Met Lys Leu Pro His Val Lys Pro
370 375 380
Gly Gly Trp Ala Phe Glu Tyr Ala Asn Asn Tyr Tyr Pro Asp Thr Asp
385 390 395 400
Asp Thr Ala Val Ala Leu Ile Ala Leu Ala Pro Leu Arg His Asp Pro
405 410 415
Lys Trp Lys Ala Lys Gly Ile Asp Glu Ala Ile Gln Leu Gly Val Asp
420 425 430
Trp Leu Ile Gly Met Gln Ser Gln Gly Gly Gly Trp Gly Ala Phe Asp
435 440 445
Lys Asp Asn Asn Gln Lys Ile Leu Thr Lys Xaa Pro Phe Cys Asp Tyr
450 455 460
Gly Glu Ala Leu Asp Pro Pro Ser Val Asp Val Thr Ala His Ile Ile
465 470 475 480
Glu Ala Phe Gly Lys Leu Gly Ile Ser Arg Asn His Pro Ser Met Val
485 490 495
Gln Ala Leu Asp Tyr Ile Arg Arg Glu Gln Glu Pro Ser Gly Pro Trp
500 505 510
Phe Gly Arg Trp Gly Val Asn Tyr Val Tyr Gly Thr Gly Ala Val Leu
515 520 525
Pro Ala Leu Ala Ala Ile Gly Glu Asp Met Thr Gln Pro Tyr Ile Gly
530 535 540
Arg Ala Cys Asp Trp Leu Val Ala His Gln Gln Ala Asp Gly Gly Trp
545 550 555 560
Gly Glu Ser Cys Ala Ser Tyr Met Asp Val Ser Ala Val Gly Arg Gly
565 570 575
Thr Thr Thr Ala Ser Gln Thr Ala Trp Ala Leu Met Ala Leu Leu Ala
580 585 590
Ala Asn Arg Pro Gln Asp Lys Asp Ala Ile Glu Arg Gly Cys Xaa Trp
595 600 605
Leu Val Glu Arg Gln Ser Ala Gly Thr Trp Asp Glu Pro Glu Phe Thr
610 615 620
Gly Thr Gly Xaa Pro Gly Tyr Gly Val Gly Gln Thr Ile Lys Leu Asn
625 630 635 640
Asp Pro Ala Leu Ser Gln Arg Leu Met Gln Gly Pro Glu Leu Ser Arg
645 650 655
Ala Phe Met Leu Arg Tyr Gly Met Tyr Arg His Tyr Phe Pro Leu Met
660 665 670
Ala Leu Gly Arg Ala Leu Arg Pro Gln Ser His Ser
675 680
<---
Claims (25)
1. Способ получения (3aR,5aS,9aS,9bR)-3a,6,6,9a-тетраметилдодекагидронафто[2,1-b]фурана ((-)-амброксида) или смеси изомеров, содержащей (-)-амброксид, где смесь изомеров, содержащую (3E,7E)-гомофарнезол (EEH), ферментативно конвертируют в (-)-амброксид или смесь изомеров, содержащую (-)-амброксид, где ферментативную конверсию осуществляют с использованием фермента SHC/HAC (сквален-гопен-циклаза/гомофарнезол-амброкcид-циклаза), обладающего активностью гомофарнезол-амброксид-циклазы и содержащего аминокислотную последовательность, имеющую по меньшей мере 30% идентичность c SEQ ID NO: 1, в реакционных условиях, подходящих для получения (-)-амброксида, где смесь изомеров, содержащая EEH, выбрана из по меньшей мере одной из [(3E,7E) и (3Z,7E)], [(3E,7E) и (3E,7Z)] или [(3Z,7E), (3E,7E) и (3E,7Z)], также обозначаемых как [EE:EZ], [EE:ZE] и [EE:EZ:ZE] соответственно, и где (-)-амброксид присутствует в твердой фазе в виде кристаллов или в аморфной форме.
2. Способ по п. 1, где используют рекомбинантные целые клетки, продуцирующие фермент SHC/HAC.
3. Способ по п. 2, где используют додецилсульфат натрия (SDS) с рекомбинантными клетками-хозяевами, продуцирующими фермент SHC/HAC.
4. Способ по п. 3, где соотношение SDS/клетки находится в диапазоне от 10:1 до 20:1.
5. Способ по п. 1, где конверсию гомофарнезола в (-)-амброксид проводят при температуре в диапазоне от 30 до 60°C и при pH в диапазоне от приблизительно 4 до приблизительно 8.
6. Способ по п. 5, где конверсию гомофарнезола в (-)-амброксид проводят при температуре от приблизительно 34°C до приблизительно 50°C и при pH в диапазоне от приблизительно 5 до приблизительно 6,2.
7. Способ по п. 1, где субстрат гомофарнезол содержит изомеры EE:EZ.
8. Способ по п. 1, где гомофарнезол содержит смесь изомеров EE:EZ в массовых соотношениях, выбранных из группы, состоящей из: 100:00; 99:01; 98:02; 97:03; 96:04; 95:05; 94:06; 93:07; 92:08; 91:09; 90:10; 89:11; 88:12; 87:13; 86:14; 85:15; 84:16; 83:17; 82:18; 81:19; 80:20; 79:21; 78:22; 77:23; 76:24; 75:25; 74:26; 73:27; 72:28; 71:29 70:30; 69:31; 68:32; 67:33; 66:34; 65:35; 64:36; 63:37; 62:38; 61:39 и/или 60:40.
9. Способ по п. 1, где гомофарнезол содержит смесь изомеров EE:EZ в массовом соотношении, выбранном из группы, состоящей из: EE:EZ 92:08; EE:EZ 90:10; EE:EZ 80:20; EE:EZ 86:14; EE:EZ 70:30; EE:EZ 69:31; и/или EE:EZ 66:34.
10. Способ по п. 9, где гомофарнезол содержит EE:EZ в массовом соотношении 80:20.
11. Способ по п. 1, где (-)-амброксид выделяют из смеси с использованием стадии экстракции/дистилляции органическим растворителем или паром либо фильтрования.
12. Способ по п. 11, где (-)-амброксид селективно кристаллизуют с использованием органического растворителя.
13. Способ по п. 12, где (-)-амброксид по существу не содержит побочных продуктов (II), (IV) и/или (III)
.
14. Реакционная смесь биоконверсии для получения (-)-амброксида, содержащая водную фазу, твердую фазу и масляную фазу, получаемая способом по любому из пп. 1-10, где твердая фаза содержит продукт реакции (-)-амброксид в твердой форме.
15. Выделенный продукт реакции для ароматизации, содержащий (-)-амброксид в твердой форме, получаемый способом по любому из пп. 1-13, где указанный продукт реакции содержит 80-97% (-)-амброксида.
16. Продукт реакции по п. 14 или 15, где (-)-амброксид находится в аморфной форме.
17. Продукт реакции по п. 14 или 15, где (-)-амброксид находится в кристаллической форме.
18. Реакционная смесь или продукт реакции по любому из пп. 14-17, где продукт реакции содержит 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, или 89,5%, или 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% (-)-амброксида.
19. Реакционная смесь или продукт реакции по любому из пп. 14-18, где определение (-)-амброксида производится по площади пика, измеренного с помощью газовой хроматографии.
20. Реакционная смесь или продукт реакции по любому из пп. 14-19 с практически полным отсутствием обнаружения побочных продуктов (II), (IV) или (III) в твердой (кристаллической) форме.
21. Реакционная смесь или продукт реакции по любому из пп. 14-20, где количество продукта (-)-амброксида составляет от приблизительно 20 г/л до приблизительно 200 г/л.
22. Способ получения продукта, содержащего (-)-амброксид, включающий включение продукта реакции по любому из пп. 15-21 в продукт.
23. Способ по п. 22, где продукт представляет собой ароматизирующий продукт, косметический продукт, моющий продукт или мыльный продукт.
24. Применение продукта реакции по любому из пп. 15-21 в качестве составной части ароматизирующего продукта, или косметического продукта, или потребительского продукта.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GB1507207.7 | 2015-04-24 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2017134449A Division RU2727641C2 (ru) | 2015-04-24 | 2016-04-22 | Способ получения (-)-амброксида, продукт реакции, содержащий (-)-амброксид, и его применение |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2836734C1 true RU2836734C1 (ru) | 2025-03-20 |
Family
ID=
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SU910561A1 (ru) * | 1980-08-19 | 1982-03-07 | Всесоюзный научно-исследовательский институт синтетических и натуральных душистых веществ | Способ получени смеси душистых веществ дитерпеноидного р да |
| EP0165458A2 (en) * | 1984-05-14 | 1985-12-27 | T. Hasegawa Company, Ltd. | (+)-Ambrox, process for production thereof and use thereof |
| SU1498767A1 (ru) * | 1987-06-04 | 1989-08-07 | Институт Химии Ан Мсср | Способ получени ( @ ) 3 @ ,6,6,9 @ -тетраметилпергидронафто [2,1-в]фурана |
| US5616737A (en) * | 1995-07-06 | 1997-04-01 | Basf Aktiengesellschaft | Stereoselective preparation of (-) 3a,6,6,9a-tetramethyl-perhydronaphtho[2,1-b]furan |
| JP2009060799A (ja) * | 2007-09-04 | 2009-03-26 | Kao Corp | (−)−アンブロキサンの製造方法 |
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SU910561A1 (ru) * | 1980-08-19 | 1982-03-07 | Всесоюзный научно-исследовательский институт синтетических и натуральных душистых веществ | Способ получени смеси душистых веществ дитерпеноидного р да |
| EP0165458A2 (en) * | 1984-05-14 | 1985-12-27 | T. Hasegawa Company, Ltd. | (+)-Ambrox, process for production thereof and use thereof |
| SU1498767A1 (ru) * | 1987-06-04 | 1989-08-07 | Институт Химии Ан Мсср | Способ получени ( @ ) 3 @ ,6,6,9 @ -тетраметилпергидронафто [2,1-в]фурана |
| US5616737A (en) * | 1995-07-06 | 1997-04-01 | Basf Aktiengesellschaft | Stereoselective preparation of (-) 3a,6,6,9a-tetramethyl-perhydronaphtho[2,1-b]furan |
| JP2009060799A (ja) * | 2007-09-04 | 2009-03-26 | Kao Corp | (−)−アンブロキサンの製造方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2727641C2 (ru) | Способ получения (-)-амброксида, продукт реакции, содержащий (-)-амброксид, и его применение | |
| IL297267A (en) | Enzyme-mediated process for making amberketal and amberketal homologues | |
| US20250361536A1 (en) | Squalene hopene cyclase (shc) variants | |
| EP4493685A1 (en) | Shc enzymes and enzyme variants | |
| RU2836734C1 (ru) | Ферменты и их применение | |
| RU2829857C9 (ru) | Варианты скваленгопенциклазы (shc) | |
| RU2829857C1 (ru) | Варианты скваленгопенциклазы (shc) | |
| JP2025188332A (ja) | スクアレンホペンシクラーゼ(shc)バリアント | |
| BR112017022322B1 (pt) | Processo para preparar (-)-ambrox ou uma mistura que compreende (-) -ambrox |