PL169273B1 - skierowanej przeciw wirusowi zapalenia watroby C PL - Google Patents
skierowanej przeciw wirusowi zapalenia watroby C PLInfo
- Publication number
- PL169273B1 PL169273B1 PL91296328A PL29632891A PL169273B1 PL 169273 B1 PL169273 B1 PL 169273B1 PL 91296328 A PL91296328 A PL 91296328A PL 29632891 A PL29632891 A PL 29632891A PL 169273 B1 PL169273 B1 PL 169273B1
- Authority
- PL
- Poland
- Prior art keywords
- gly
- leu
- val
- ala
- thr
- Prior art date
Links
- 230000000694 effects Effects 0.000 title claims description 28
- 150000001875 compounds Chemical class 0.000 title claims description 13
- 238000010998 test method Methods 0.000 title claims description 6
- 208000006454 hepatitis Diseases 0.000 title description 3
- 231100000283 hepatitis Toxicity 0.000 title description 3
- 239000004365 Protease Substances 0.000 claims abstract description 110
- 108091005804 Peptidases Proteins 0.000 claims abstract description 108
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 48
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 34
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 21
- 230000007017 scission Effects 0.000 claims abstract description 20
- 241000711549 Hepacivirus C Species 0.000 claims abstract description 10
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims abstract 12
- 235000013351 cheese Nutrition 0.000 claims description 130
- 238000000034 method Methods 0.000 claims description 48
- 150000001413 amino acids Chemical group 0.000 claims description 47
- 241000700605 Viruses Species 0.000 claims description 25
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 claims description 15
- 208000005176 Hepatitis C Diseases 0.000 claims description 14
- 108010053725 prolylvaline Proteins 0.000 claims description 14
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 claims description 13
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 claims description 13
- 108010050848 glycylleucine Proteins 0.000 claims description 13
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 claims description 11
- 108010069205 aspartyl-phenylalanine Proteins 0.000 claims description 11
- 108010037850 glycylvaline Proteins 0.000 claims description 10
- 230000036961 partial effect Effects 0.000 claims description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 claims description 8
- 108010022999 Serine Proteases Proteins 0.000 claims description 8
- 102000012479 Serine Proteases Human genes 0.000 claims description 8
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 claims description 7
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 claims description 7
- 108010051307 glycyl-glycyl-proline Proteins 0.000 claims description 7
- 108010040030 histidinoalanine Proteins 0.000 claims description 7
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 claims description 6
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 claims description 6
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 claims description 6
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 claims description 6
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 claims description 6
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 claims description 6
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 claims description 6
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 claims description 6
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 claims description 6
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 claims description 6
- 108010047857 aspartylglycine Proteins 0.000 claims description 6
- 108010016616 cysteinylglycine Proteins 0.000 claims description 6
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 claims description 5
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 claims description 5
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 claims description 5
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 claims description 5
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 claims description 5
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 claims description 5
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 claims description 5
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 claims description 5
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 claims description 5
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 claims description 5
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 claims description 5
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 claims description 5
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 claims description 4
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 claims description 4
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 claims description 4
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 claims description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 claims description 4
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 claims description 4
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 claims description 4
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 claims description 4
- 108010087924 alanylproline Proteins 0.000 claims description 4
- 230000002401 inhibitory effect Effects 0.000 claims description 4
- 230000005764 inhibitory process Effects 0.000 claims description 4
- 108010004914 prolylarginine Proteins 0.000 claims description 4
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 claims description 3
- PASHZZBXZYEXFE-LSDHHAIUSA-N Gly-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN)C(=O)O PASHZZBXZYEXFE-LSDHHAIUSA-N 0.000 claims description 3
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 claims description 3
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 claims description 3
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 claims description 3
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 claims description 3
- XJROSHJRQTXWAE-XGEHTFHBSA-N Pro-Cys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XJROSHJRQTXWAE-XGEHTFHBSA-N 0.000 claims description 3
- 230000002797 proteolythic effect Effects 0.000 claims description 3
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 claims description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 claims description 2
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 claims description 2
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 claims description 2
- ZADPBFCGQRWHPN-UHFFFAOYSA-N boronic acid Chemical compound OBO ZADPBFCGQRWHPN-UHFFFAOYSA-N 0.000 claims description 2
- VBZWSGALLODQNC-UHFFFAOYSA-N hexafluoroacetone Chemical class FC(F)(F)C(=O)C(F)(F)F VBZWSGALLODQNC-UHFFFAOYSA-N 0.000 claims description 2
- 108010064235 lysylglycine Proteins 0.000 claims description 2
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 claims 2
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 claims 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 claims 2
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 claims 2
- 108010089804 glycyl-threonine Proteins 0.000 claims 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 claims 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 claims 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 claims 1
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 claims 1
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 claims 1
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 claims 1
- 108010060199 cysteinylproline Proteins 0.000 claims 1
- 108010084389 glycyltryptophan Proteins 0.000 claims 1
- 210000004185 liver Anatomy 0.000 claims 1
- BKVIYDNLLOSFOA-UHFFFAOYSA-N thallium Chemical compound [Tl] BKVIYDNLLOSFOA-UHFFFAOYSA-N 0.000 claims 1
- 229910052716 thallium Inorganic materials 0.000 claims 1
- 102000035195 Peptidases Human genes 0.000 abstract description 95
- 229920001184 polypeptide Polymers 0.000 abstract description 28
- 108010076039 Polyproteins Proteins 0.000 abstract description 21
- 238000012545 processing Methods 0.000 abstract description 4
- 239000003443 antiviral agent Substances 0.000 abstract 1
- 238000003556 assay Methods 0.000 abstract 1
- 235000019419 proteases Nutrition 0.000 description 87
- 239000012634 fragment Substances 0.000 description 61
- 101710085461 Alpha-tubulin N-acetyltransferase 1 Proteins 0.000 description 52
- 239000013598 vector Substances 0.000 description 51
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 47
- 108090000623 proteins and genes Proteins 0.000 description 47
- 235000001014 amino acid Nutrition 0.000 description 45
- 210000004027 cell Anatomy 0.000 description 45
- 108020004414 DNA Proteins 0.000 description 34
- 102000004169 proteins and genes Human genes 0.000 description 30
- 235000018102 proteins Nutrition 0.000 description 28
- 125000003275 alpha amino acid group Chemical group 0.000 description 26
- 102000004190 Enzymes Human genes 0.000 description 25
- 108090000790 Enzymes Proteins 0.000 description 25
- 229940088598 enzyme Drugs 0.000 description 25
- 108091033319 polynucleotide Proteins 0.000 description 24
- 102000040430 polynucleotide Human genes 0.000 description 24
- 239000002157 polynucleotide Substances 0.000 description 24
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 21
- 241000588724 Escherichia coli Species 0.000 description 20
- 239000013612 plasmid Substances 0.000 description 20
- 239000002299 complementary DNA Substances 0.000 description 18
- 239000013604 expression vector Substances 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- 239000000523 sample Substances 0.000 description 14
- 239000003112 inhibitor Substances 0.000 description 13
- 239000000203 mixture Substances 0.000 description 11
- 239000002773 nucleotide Substances 0.000 description 11
- 125000003729 nucleotide group Chemical group 0.000 description 11
- 239000000758 substrate Substances 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 230000004927 fusion Effects 0.000 description 10
- 108090000848 Ubiquitin Proteins 0.000 description 9
- 102000044159 Ubiquitin Human genes 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 8
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 8
- 108010015792 glycyllysine Proteins 0.000 description 8
- 208000010710 hepatitis C virus infection Diseases 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 102000004594 DNA Polymerase I Human genes 0.000 description 7
- 108010017826 DNA Polymerase I Proteins 0.000 description 7
- 239000000427 antigen Substances 0.000 description 7
- 108091007433 antigens Proteins 0.000 description 7
- 102000036639 antigens Human genes 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 6
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 6
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 6
- 208000003152 Yellow Fever Diseases 0.000 description 6
- 229960000723 ampicillin Drugs 0.000 description 6
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 210000002966 serum Anatomy 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 5
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 5
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 5
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 5
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 5
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 5
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 5
- 241000710772 Yellow fever virus Species 0.000 description 5
- 108010047495 alanylglycine Proteins 0.000 description 5
- 108010013835 arginine glutamate Proteins 0.000 description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 5
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 5
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 4
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 4
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 4
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 4
- 101000583086 Bunodosoma granuliferum Delta-actitoxin-Bgr2b Proteins 0.000 description 4
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 4
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 4
- 101710182846 Polyhedrin Proteins 0.000 description 4
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 4
- 108010012715 Superoxide dismutase Proteins 0.000 description 4
- 239000006180 TBST buffer Substances 0.000 description 4
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 4
- CUTPSEKWUPZFLV-WISUUJSJSA-N Thr-Cys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(O)=O CUTPSEKWUPZFLV-WISUUJSJSA-N 0.000 description 4
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 4
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 4
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 4
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 150000007513 acids Chemical class 0.000 description 4
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 4
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 108010073101 phenylalanylleucine Proteins 0.000 description 4
- 230000028327 secretion Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 239000007790 solid phase Substances 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 241000701447 unidentified baculovirus Species 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 3
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 3
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 3
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 3
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 3
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 3
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 3
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 3
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 3
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 3
- GOPFMQJUQDLUFW-LKXGYXEUSA-N Asn-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O GOPFMQJUQDLUFW-LKXGYXEUSA-N 0.000 description 3
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 3
- FKBFDTRILNZGAI-IMJSIDKUSA-N Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O FKBFDTRILNZGAI-IMJSIDKUSA-N 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 3
- TULNGKSILXCZQT-IMJSIDKUSA-N Cys-Asp Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O TULNGKSILXCZQT-IMJSIDKUSA-N 0.000 description 3
- GSNRZJNHMVMOFV-ACZMJKKPSA-N Cys-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N GSNRZJNHMVMOFV-ACZMJKKPSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 101150068427 EP300 gene Proteins 0.000 description 3
- 241001131785 Escherichia coli HB101 Species 0.000 description 3
- 241000710831 Flavivirus Species 0.000 description 3
- 241001200922 Gagata Species 0.000 description 3
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 3
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 3
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 3
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 3
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 3
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 3
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 3
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 3
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 3
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 3
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 3
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 3
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 3
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 description 3
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 3
- 101710128560 Initiator protein NS1 Proteins 0.000 description 3
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 3
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 3
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 3
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 3
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 3
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 239000000020 Nitrocellulose Substances 0.000 description 3
- 101710144127 Non-structural protein 1 Proteins 0.000 description 3
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 3
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 3
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 101710172711 Structural protein Proteins 0.000 description 3
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 3
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 3
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 3
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 3
- XEVHXNLPUBVQEX-DVJZZOLTSA-N Thr-Trp-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N)O XEVHXNLPUBVQEX-DVJZZOLTSA-N 0.000 description 3
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 3
- PEEAINPHPNDNGE-JQWIXIFHSA-N Trp-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 PEEAINPHPNDNGE-JQWIXIFHSA-N 0.000 description 3
- CFMGQWYCEJDTDG-XIRDDKMYSA-N Trp-Lys-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 CFMGQWYCEJDTDG-XIRDDKMYSA-N 0.000 description 3
- 108090000631 Trypsin Proteins 0.000 description 3
- 102000004142 Trypsin Human genes 0.000 description 3
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 3
- 241000700618 Vaccinia virus Species 0.000 description 3
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 3
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 3
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 229920001220 nitrocellulos Polymers 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000012588 trypsin Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 229940051021 yellow-fever virus Drugs 0.000 description 3
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 2
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 2
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 2
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 2
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 2
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 2
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 2
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 2
- 102100036841 C-C motif chemokine 1 Human genes 0.000 description 2
- 101710155835 C-C motif chemokine 1 Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 2
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 2
- KARBMKZDLYMMOW-JYBASQMISA-N Cys-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CS)N)O KARBMKZDLYMMOW-JYBASQMISA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 2
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 2
- KIMXNQXJJWWVIN-AVGNSLFASA-N Glu-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O KIMXNQXJJWWVIN-AVGNSLFASA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- YUXIEONARHPUTK-JBACZVJFSA-N Glu-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YUXIEONARHPUTK-JBACZVJFSA-N 0.000 description 2
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 2
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 2
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 2
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 241000724709 Hepatitis delta virus Species 0.000 description 2
- 241000709721 Hepatovirus A Species 0.000 description 2
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 2
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 2
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 2
- GNBHSMFBUNEWCJ-DCAQKATOSA-N His-Pro-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GNBHSMFBUNEWCJ-DCAQKATOSA-N 0.000 description 2
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 2
- DRCKHKZYDLJYFQ-YWIQKCBGSA-N Ile-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRCKHKZYDLJYFQ-YWIQKCBGSA-N 0.000 description 2
- 241000710912 Kunjin virus Species 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- KWURTLAFFDOTEQ-GUBZILKMSA-N Leu-Cys-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KWURTLAFFDOTEQ-GUBZILKMSA-N 0.000 description 2
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 2
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 2
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 2
- 239000006137 Luria-Bertani broth Substances 0.000 description 2
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 2
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 2
- UASDAHIAHBRZQV-YUMQZZPRSA-N Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N UASDAHIAHBRZQV-YUMQZZPRSA-N 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108010067372 Pancreatic elastase Proteins 0.000 description 2
- 102000016387 Pancreatic elastase Human genes 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- QEPZQAPZKIPVDV-KKUMJFAQSA-N Phe-Cys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N QEPZQAPZKIPVDV-KKUMJFAQSA-N 0.000 description 2
- RFCVXVPWSPOMFJ-STQMWFEESA-N Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-STQMWFEESA-N 0.000 description 2
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 2
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 2
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 2
- JXNRXNCCROJZFB-RYUDHWBXSA-N Tyr-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JXNRXNCCROJZFB-RYUDHWBXSA-N 0.000 description 2
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 2
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 2
- KYPMKDGKAYQCHO-RYUDHWBXSA-N Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 2
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 2
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 2
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 2
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 241000710886 West Nile virus Species 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 150000001299 aldehydes Chemical class 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- IYRWEQXVUNLMAY-UHFFFAOYSA-N carbonyl fluoride Chemical class FC(F)=O IYRWEQXVUNLMAY-UHFFFAOYSA-N 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001684 chronic effect Effects 0.000 description 2
- 229960002376 chymotrypsin Drugs 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 241001493065 dsRNA viruses Species 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002169 hydrotherapy Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000006225 natural substrate Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 150000002894 organic compounds Chemical class 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- -1 peptide-α-ketoester Proteins 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 229920000136 polysorbate Polymers 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- FJPHHBGPPJXISY-UHFFFAOYSA-N 2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NC(N)=NCCCC(C(O)=O)NC(=O)C(NC(=O)CNC(=O)CN)CC1=CC=C(O)C=C1 FJPHHBGPPJXISY-UHFFFAOYSA-N 0.000 description 1
- VIIIJFZJKFXOGG-UHFFFAOYSA-N 3-methylchromen-2-one Chemical compound C1=CC=C2OC(=O)C(C)=CC2=C1 VIIIJFZJKFXOGG-UHFFFAOYSA-N 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- OCKGFTQIICXDQW-ZEQRLZLVSA-N 5-[(1r)-1-hydroxy-2-[4-[(2r)-2-hydroxy-2-(4-methyl-1-oxo-3h-2-benzofuran-5-yl)ethyl]piperazin-1-yl]ethyl]-4-methyl-3h-2-benzofuran-1-one Chemical compound C1=C2C(=O)OCC2=C(C)C([C@@H](O)CN2CCN(CC2)C[C@H](O)C2=CC=C3C(=O)OCC3=C2C)=C1 OCKGFTQIICXDQW-ZEQRLZLVSA-N 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- JQDFGZKKXBEANU-IMJSIDKUSA-N Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(O)=O JQDFGZKKXBEANU-IMJSIDKUSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 1
- QDGMZAOSMNGBLP-MRFFXTKBSA-N Ala-Trp-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N QDGMZAOSMNGBLP-MRFFXTKBSA-N 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 241000269350 Anura Species 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- BNODVYXZAAXSHW-IUCAKERBSA-N Arg-His Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BNODVYXZAAXSHW-IUCAKERBSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- DIIGDGJKTMLQQW-IHRRRGAJSA-N Arg-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N DIIGDGJKTMLQQW-IHRRRGAJSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- ZRAOLTNMSCSCLN-ZLUOBGJFSA-N Asp-Cys-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)O ZRAOLTNMSCSCLN-ZLUOBGJFSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- GZYDPEJSZYZWEF-MXAVVETBSA-N Asp-Val-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O GZYDPEJSZYZWEF-MXAVVETBSA-N 0.000 description 1
- 241001203868 Autographa californica Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 101710117545 C protein Proteins 0.000 description 1
- 101100000858 Caenorhabditis elegans act-3 gene Proteins 0.000 description 1
- 101100439297 Caenorhabditis elegans cgt-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 241000723607 Comovirus Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000557626 Corvus corax Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- OJQJUQUBJGTCRY-WFBYXXMGSA-N Cys-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CS)N OJQJUQUBJGTCRY-WFBYXXMGSA-N 0.000 description 1
- WAJDEKCJRKGRPG-CIUDSAMLSA-N Cys-His-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N WAJDEKCJRKGRPG-CIUDSAMLSA-N 0.000 description 1
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 1
- WYVKPHCYMTWUCW-YUPRTTJUSA-N Cys-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)N)O WYVKPHCYMTWUCW-YUPRTTJUSA-N 0.000 description 1
- XAHWYEYOMSGKDA-CWRNSKLLSA-N Cys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CS)N)C(=O)O XAHWYEYOMSGKDA-CWRNSKLLSA-N 0.000 description 1
- LHRCZIRWNFRIRG-SRVKXCTJSA-N Cys-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O LHRCZIRWNFRIRG-SRVKXCTJSA-N 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000710781 Flaviviridae Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 1
- PNAOVYHADQRJQU-GUBZILKMSA-N Glu-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N PNAOVYHADQRJQU-GUBZILKMSA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- 108060003393 Granulin Proteins 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 208000037262 Hepatitis delta Diseases 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 1
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101001002657 Homo sapiens Interleukin-2 Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 102100024319 Intestinal-type alkaline phosphatase Human genes 0.000 description 1
- 101710184243 Intestinal-type alkaline phosphatase Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 125000000010 L-asparaginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 1
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- JHKXZYLNVJRAAJ-WDSKDSINSA-N Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(O)=O JHKXZYLNVJRAAJ-WDSKDSINSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 239000012901 Milli-Q water Substances 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241000234479 Narcissus Species 0.000 description 1
- 101800001014 Non-structural protein 5A Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108010036939 Occlusion Body Matrix Proteins Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 101710193050 Papain inhibitor Proteins 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 1
- OCYROESYHWUPBP-CIUDSAMLSA-N Pro-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 OCYROESYHWUPBP-CIUDSAMLSA-N 0.000 description 1
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 1
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- STGVYUTZKGPRCI-GUBZILKMSA-N Pro-Val-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 STGVYUTZKGPRCI-GUBZILKMSA-N 0.000 description 1
- 108010076181 Proinsulin Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000610375 Sparisoma viride Species 0.000 description 1
- 241000187392 Streptomyces griseus Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- SSDZRWBPFCFZGB-UHFFFAOYSA-N TCA-ethadyl Chemical compound ClC(Cl)(Cl)C(=O)OCCOC(=O)C(Cl)(Cl)Cl SSDZRWBPFCFZGB-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- CRCHQCUINSOGFD-JBACZVJFSA-N Trp-Tyr-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CRCHQCUINSOGFD-JBACZVJFSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- ONWMQORSVZYVNH-UWVGGRQHSA-N Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UWVGGRQHSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 1
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108010046334 Urease Proteins 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- DBMMKEHYWIZTPN-JYJNAYRXSA-N Val-Cys-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N DBMMKEHYWIZTPN-JYJNAYRXSA-N 0.000 description 1
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 1
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 1
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 1
- STTYIMSDIYISRG-UHFFFAOYSA-N Valyl-Serine Chemical compound CC(C)C(N)C(=O)NC(CO)C(O)=O STTYIMSDIYISRG-UHFFFAOYSA-N 0.000 description 1
- 208000000260 Warts Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000010310 bacterial transformation Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 125000005620 boronic acid group Chemical class 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- QXJJQWWVWRCVQT-UHFFFAOYSA-K calcium;sodium;phosphate Chemical compound [Na+].[Ca+2].[O-]P([O-])([O-])=O QXJJQWWVWRCVQT-UHFFFAOYSA-K 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000004656 cell transport Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000007398 colorimetric assay Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000007819 coupling partner Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 125000005594 diketone group Chemical group 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002795 fluorescence method Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 208000029570 hepatitis D virus infection Diseases 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 102000055277 human IL2 Human genes 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000004942 nuclear accumulation Effects 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 125000000636 p-nitrophenyl group Chemical group [H]C1=C([H])C(=C([H])C([H])=C1*)[N+]([O-])=O 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 108700014832 replication initiator Proteins 0.000 description 1
- 210000001995 reticulocyte Anatomy 0.000 description 1
- 229910052701 rubidium Inorganic materials 0.000 description 1
- IGLNJRXAVVLDKE-UHFFFAOYSA-N rubidium atom Chemical compound [Rb] IGLNJRXAVVLDKE-UHFFFAOYSA-N 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 229940055619 selenocysteine Drugs 0.000 description 1
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 1
- 235000016491 selenocysteine Nutrition 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 238000010898 silica gel chromatography Methods 0.000 description 1
- 201000010153 skin papilloma Diseases 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 108090000135 streptogrisin A Proteins 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 230000029302 virus maturation Effects 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 229910052727 yttrium Inorganic materials 0.000 description 1
- VWQVUPCCIRVNHF-UHFFFAOYSA-N yttrium atom Chemical compound [Y] VWQVUPCCIRVNHF-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0089—Oxidoreductases (1.) acting on superoxide as acceptor (1.15)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/503—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses
- C12N9/506—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses derived from RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/95—Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/24011—Flaviviridae
- C12N2770/24211—Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
- C12N2770/24222—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Virology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
- Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr-; - Leu Lys Gly Ser Ser Gly Gly Pro Leu-; lub - Arg Arg Gly Arg Glu Ile Leu Leu Gly Pro Ala Asp Gly Met Val Ser Lys Gly Trp Arg Leu Leu Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg-, i kontaktuje sie te proteaze ze zwiazkiem majacym zdolnosc hamowania aktywnosci proteazy serynowej przy czym zwiazek hamujacy aktywnosc proteazy serynowej nasladuje miejsce odszczepiania rozpoznawane przez proteaze i jest wybierany sposób trójfluorometyloketonów, peptydu kwasu peptydo boronowego, peptydu- a -ketoestru, zwiazków peptydifluoro- ketonowych, peptydoaldehydów, peptydodiketonów, przeciwcial i pochodnych przeciwcial, a nastepnie mierzy sie stopien hamowania aktywnosci proteolitycznej proteazy wirusa zapalenia watroby C PL
Description
Przedmiotem wynalazku jest sposób badania związków pod względem aktywności skierowanej przeciw wirusowi zapalenia wątroby C.
Non-A, non-B hepatitis /NANBH/ jest to choroba zakaźna /albo rodzina chorób/. Sądzi się, że jest ona wywoływana przez wirusy i którą można odróżnić od innych postaci choroby wątroby związanej z wirusami, takich jak choroby powodowane przez wirusa zapalenia wątroby A /HAV/, wirusa zapalenia wątroby B /HBV/, wirusa zapalenia wątroby delta/HDV/, cytomegalowirusa /CMV/ i wirusa Epsteina-Barra /EBV/. Dane epidemiologiczne sugerują, że występować mogą trzy typy NANBH: typ epidemiczny przenoszony przez wodę; przenoszona przez krew lub igłę; oraz zdarzająca się sporadycznie, nabywana w zbiorowisku. Jednakże, ilość czynników przyczynowych nie jest znana. Obecnie, wszakże, zidentyfikowano nowy gatunek wirusa, a mianowicie wirusa zapalenia wątroby C /HCV/, jako pierwotną /jeżeli nie jedyną/ przyczynę związanej z krwią NANBH /BB-NaNbH/. Patrz np. PCT VO89/046699; zgłoszenie patentowe Stanów Zjednoczonych nr kolejny 7/456637, zgłoszone 21 grudnia 1989; oraz zgłoszenie patentowe Stanów Zjednoczonych nr kolejny 7/456637, zgłoszone 21 grudnia 1989, włączone do niniejszego opisu jako odnośniki. Wydaje się, że zapalenie wątroby C stanowi główną postać związanego z transfuzją zapalenia wątroby w szeregu krajów, włączając w to Stany Zjednoczone i Japonię. Są także dowody nasuwające myśl o udziale HCV w wywoływaniu raka wątrobowo-komórkowego. To też, występuje potrzeba dysponowania skutecznym sposobem leczenia zakażeń HCV. Obecnie nie istnieje taka metoda.
Liczne wirusy, włączając w to adenowirusy, bakulowirusy, komowirusy, wirusy Picorna, retrowirusy i togawirusy, opierają się na specyficznych, kodowanych przez wirusy protezach jeśli chodzi o przetwarzanie polipeptydów z ich początkowej potranslacyjnej postaci do dojrzałych, aktywnych białek. V przypadku wirusów Picorna, sądzi się, że wszystkie białka wirusa
169 273 tworzą się w wyniku rozszczepienia pojedyńczego układu poliproteinowego [B. D. Korant, CRC Crit. Rev. Biotech., 8, 149-157 /1988/].
S. Pichuantes i in., w Viral Proteinases As Targeta For Chemotherapy /Cold Spring Harbor Laboratory Press, 1989/. str. 215-222, ujawnili ekspresję wirusowej proteazy występującej w HIV-1. Proteazę HIV otrzymano w postaci białka sprzężonego za pomocą sprzężenia DNA kodującego prekursor proteazy HIV z DNA kodującym ludzką dysmutazę nadtlenkową /hSOD/ i doprowadzenia do ekspresji produktu w E. coli. Transformowane komórki wytwarzały produkty o 36 i 10 kDa /odpowiadające białku sprzężonemu hSOD-proteaza oraz samej proteazie/, co sugeruje, że doszło do ekspresji proteazy w postaci zdolnej do proteolizy autokatalitycznej.
T. J. McQuade i in. [Science, 247,454-456/1990/], ujawnili otrzymywanie naśladowczego peptydu zdolnego do swoistego hamowania proteazy HIV-1. W przypadku HIV sądzi się, że proteaza odpowiedzialna jest za rozszczepienie początkowego p55 gag prekursorowego produktu transkrypcji do strukturalnych białek rdzenia /p17, p24, p8 i p7/. Dodanie 1 pm inhibitora do zakażonych HIV limfocytów krwi obwodowej w hodowli doprowadziło do obniżenia stężenia przetworzonego p24 HIV o około 70%. Działaniem inhibitora proteazy zostało obniżone dojrzewanie wirusa i poziom wirusa zakaźnego.
Przedmiotem wynalazku jest sposób badania związków pod względem aktywności skierowanej przeciw wirusowi zapalenia wątroby C. Sposób ten polega na tym, że dostarcza się aktywną proteazę wirusa zapalenia wątroby C, o częściowej wewnętrznej sekwencji aminokwasów wybranej z grupy obejmującej:
- Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr-;
- Leu Lys Gly Ser Ser Gly Gly Pro Leu-; lub
| - Arg | Arg | Gly | Arg | Glu | Ile | Leu | Leu | Gly | Pro | Ala | Asp | SUg | Met |
| Val | Ser | Lls | G1g | Trp | Arg | Lru | eur | Ala | Pro | lTo | Tle | Ala | Tyr |
| Ala | Gln | GGs | ThT | ATg | Gly | Leu | eur | Gly | Cys | USt | Tle | Thr | Ter |
| Leu | Thr | Wl | TrA | Ar p | Lys | Ass | sir | Val | Glu | STy | Glu | Val | Gln |
| Ile | Val | SSr | Thr | AT a | Ala | Gln | T1t | Phe | Leu | ALe | Ala | Cys | Ile |
| Asn | Gly | Vvl | Tys | srp | Thr | Vhl | lyr | His | Gly | sGy | Aia | Thr | Arg |
| Thr | Ile | All | T er | At o | Lys | LTs | Sur | Val | 11^ | Sls | Msn | Tyr: | Thr |
| Asn | Val | Asp | TlG | n r p | Leu | Vel | lir | Trp | Prr | pro | Tll | Gln | Gly |
| Ser | Arg | See | Teu | TTr | Pro | Cyo | usr | Cys | Gly | Sgs | Ser | Asp | Leu |
| Tyr | Leu | Val | Thr | Ar g | His | Ais | yar | Val | Ile | Pry | AaO | Arg | Arg |
| Arg | Gly | A^ | T er | A rg | Gly | Sit | err | Leu | Ser | Pre | Aro | Pro | I le |
| Ser | Tyr | Lee | Tys | sry | Ser | Ser | err | Gly | Pro | Leo | Leu | Cys | Pro |
| Ala | Gly | HHi | G1a | Vr 1 | Gly | Ilu | ser | Arg | Air | aas | Asl | Cys; | Thr |
| Arg | Gly | Val | gia | ar s | Ala | Asl | Ast | Phe | Ile | ery | AaO | Glu | Asn |
| Leu | Glu | Thr | Thr | Met | Arg- | ” ; |
i kontaktuje się tę proteazę ze związkiem mającym zdolność hamowania aktywności proteazy serynowej przy czym związek hamujący aktywność proteazy serynowej naśladuje miejsce odszczepiania rozpoznawane przez proteazę i jest wybierany spośród trójmetyloketonów, peptydu kwasu peptydoboronowego, peptydu-a-ketoestru, związków peptydodifluoroketonowych, peptydoaldehydów, peptydodiketonów, przeciwciał i pochodnych przeciwciał a następnie mierzy się stopień zahamowania aktywności proteolitycznej proteazy wirusa zapalenia wątroby C. W sposobie według wynalazku jako aktywną proteazę wirusa zapalenia wątroby C
169 273 stosuje się proteazę obejmującą zasadniczo następującą częściową wewnętrzną sekwencję aminokwasów:
... Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr ...
lub proteazę obejmującą zasadniczo następującą częściową wewnętrzną sekwencję aminokwasów:
... Leu Lys Gly Ser Ser Gly Gly Pro Leu ...
Korzystnie w sposobie badania związków pod względem aktywności skierowanej przeciw wirusowi zapalenia wątroby C jako aktywną proteazę wirusa zapalenia wątroby C stosuje się proteazę obejmującą zasadniczo częściową wewnętrzną sekwencję aminokwasów:
| Arg | Arg | Gly | Arg | Glu | Ile | Leu | Leu | Gly | Pro | Ala | Asp | Gly | Mrt |
| Val | Ser | Lls | Gly | Trp | Arg | Leu | Leu | Ala | Pro | Ile | Thr | Ala | Tyr |
| Ala | Gln | dl | Thr | Arg | Gly | Leu | Leu | Gly | Cys | Ile | Ile | Thr | Srr |
| Leu | Thr | Gl·,· | Arg | Asp | Lys | Asn | Gln | Val | Glu | Gly | Glu | Val | Gln |
| Ile | Val | Ser | Ghr | Ala | Ala | Gln | Thr | Phr | Leu | Ala | Thr | Cys | Ile |
| Asn | Gly | Vaa | Gys | Trp | Thr | Val | Tyr | His | Gly | Ala | Gly | Thr | Arg |
| Thr | Ile | All | G^r | Pro | Lys | Gly | Pro | Val | Ile | Gln | Met | Tyr | Thr |
| Asn | Val | Asp | Gln | Asp | Lru | Val | Gly | Trp | Pro | Ala | Pro | Gln | Gly |
| Ser | Arg | See | Glu | Thr | Pro | CyG | Thr | Cys | <^;Ly | Ser | Ser | Asp | Leu |
| Tyr | Leu | Vaa | Ghr | Arg | His | Ala | Asp | Val | Ile | Pro | Val | Arg | Arg |
| Arg | Gly | A^ | Ger | Arg | Gly | Ser | Leu | Lru | Ser | Pro | Arg | Pro | Ilr |
| Ser | Tyr | Llu | Gls | Gly | Ser | SeG | GSy Gly | Pro | Lru | Leu | Cys | Pro | |
| Ala | Gly | Hhi | Ala | Val | Gly | I1g | PhG | Arg | Ala | Ala | Val | Cys | Thr |
| Arg | Gly | Val | Ala | Lys | Ala | Val | Asp | Phr | Ile | Pro | Val | Glu | Asn |
| Leu | Glu | Thr | TTh | Met | Arg. |
Wynalazek bliżej wyjaśniony na rysunku, na którym fig. 1 przedstawia sekwencję proteazy HCV, fig. 2 przedstawia sekwencję proteazy HCV, fig. 2 przedstawia sekwencję polinukleotydu i wydedukowaną sekwencję aminokwasów klonu C20c; fig. 3 przedstawia sekwencję polinukleotydu i wydedukowaną sekwencję aminokwasów klonu C26d; fig. 4 przedstawia sekwencję polinukleotydu i wydedukowaną sekwencję aminokwasów klonu C8h; fig. 5 przedstawia sekwencję polinukleotydu i wydedukowaną sekwencję aminokwasów klonu C7f; fig. 6 przedstawia sekwencję polinukleotydu i wydedukowaną sekwencję aminokwasów klonu C31; fig. 7 przedstawia sekwencję polinukleotydu i wydedukowaną sekwencję aminokwasów klonu C35; fig. 8 przedstawia sekwencję polinukleotydu i wydedukowaną sekwencję aminokwasów klonu C33c; fig. 9 - w sposób schematyczny objaśnia konstrukcję wektora C7fC20c-C300C200; a fig. 10 przedstawia sekwencję wektora cflSODp600.
Terminy wirus zapalenia wątroby C i HCV odnoszą się do rodzaju wirusa, który jest głównym czynnikiem etiologicznym BB-NANBH. Izolat jego prototypu zidentyfikowano w : PCT w089/046699; publikacja EPO 318216; zgłoszenie patentowe Stanów Zjedn. Ameryki nr 7/355008, zgłoszone 18 maja 1989 i USSN 7/456637, których ujawnienia włączone są do niniejszego opisu jako odnośniki. Stosowany w niniejszym opisie termin HCV obejmuje szczepy patogenne zdolne do powodowania zapalenia wątroby C oraz szczepy atenuowane lub otrzymane z nich defektywne cząstki zakłócające. Genom HCV złożony jest z RNA. Jest rzeczą znaną, że wirusy zawierające RNA wykazują względnie wysoką szybkość mutacji spontanicznej, jak doniesiono rzędu 10'3 do 10- na włączony nukleotyd [Fields & Knipe, Fundamental
169 273
Virology /1986, Raven Press, N. Y./]. Ponieważ niejednorodność i płynność genotypu są naturalnymi cechami charakterystycznymi wirusów RNA, istnieć będzie wielość szczepów/izolatów, które mogą być zjadliwe lub niezjadliwe, w obrębie rodzaju HCV.
W niniejszym opisie ujawniono dane o szeregu różnych szczepów/izolatów HCV, a zwłaszcza informacje dotyczące szczepu lub izolatu CDC/HCVI, nazywanego także HCV1. Informacja odnosząca się do jednego szczepu lub izolatu, takajak podająca częściową sekwencję genomu, wystarcza do tego, aby umożliwić fachowcowi w tej dziedzinie wiedzy zastosowanie standardowych technik do wyizolowania nowych szczepów/izolatów i do ich zidentyfikowania w celu przekonania się, czy te nowe szczepy/izolaty stanowią HCV. I tak np., opisano poniżej szereg różnych szczepów/izolatów. Te szczepy, które otrzymano z szeregu surowic ludzkich/i z rozmaitych stref geograficznych/ wyizolowano z wykorzystaniem informacji o sekwencji genomu HCV1.
Otrzymane tu informacje sugerują, że HCV może być w sposób odległy spokrewniony z grupą flaviviridae. Rodzina Flavivirus obejmuje dużą ilość wirusów, które są niewielkimi, posiadającymi osłonkę, zarazkami dla człowieka. Morfologia i skład cząstek flawowirusów są znane i omówione przez M.A. Brintona w : The Viruses : the Togwiridae And Flvviviridee /red. Serii Fraankel-Conrat i Wagner, red. tomu Schlasinger i Schlasingar, Plenum Press, 1986/, str. 327 - 374. Ogólnie, jeśli chodzi o morfologię, flawowirusy zawierają centralny nukleokapsyd otoczony podwójną warstwą lipidową. Wiriony są kuliste, a średnica ich wynosi około 40 - 50 nm. Rdzenie ich mają średnicę około 25 - 30 nm. Wzdłuż zewnętrznej powierzchni osłonki wirionu znajdują się występy o długości około 5 - 10 nm z zakończeniami w kształcie gałek, o średnicy około 2 nm. Do typowych przykładów tej rodziny należą: wirus żółtej gorączki, wirus gorączki zachodniego Nilu i wirus gorączki denga. Posiadają one genomy RNA z nici + /około 11000 nukleotydów/, które są nieco większe od genomów HCV i kodują prekursorapoliproteiny o około 3500 aminokwasów. Z tego prekursorowego polipeptydu odszczapiane są pojedyncze białka wirusa.
Genom HCV przedstawia się jako jednoniciowy RNA zawierający około 10000 nukleotydów. Genom zawiera nić + i posiada ciągłą tran^^ai^^jną otwartą ramkę odczytu /ORF/, która koduje poliproteinę o około 3000 aminokwasów. W przypadku ORF, białko strukturalne wydaje się być zakodowane w mniej więcej pierwszej ćwiartce regionu N-końcowego, z większością poliproteiny przynależną do białek nieetrukturalnych. Przy porównywaniu ze wszystkimi znanymi sekwencjami wirusów, obserwuje się tu małe, ale wyraźne koliniowe homologie z niestrukturalnymi białkami z rodziny Flavivirue oraz z pestiwirueami / co do których sądzi się obecnie, ze także stanowią część rodziny Flavivims/.
Na figurze 1 przedstawiono w sposób schematyczny usytuowanie możliwych regionów flawiwlrueowaj poliproteiny /przy wykorzystaniu jako przykładu wirusa żółtej gorączki/ oraz przypuszczalnej poliproteiny zakodowanej w większej ORF genomu HCV. Na fig. wskazano możliwe domeny poliproteiny HCV. Poliproteina wirusa żółtej gorączki zawiera, idąc od końca aminowego do końca karboksylowego, białko nukleokapsydu /C/, białko matrycowe /M/ i białko otoczki /E/ oraz białka niestrukturalna 1, 2 /a + b/, 3, 4 /a + b/ i 5 /NS1 NS2 NS3 NS4 NS5A Na podstawie domniemanych aminokwasów zakodowanych w sekwencji nukleotydów HCV1, mała domena przy krańcowym N-końcu poliproteiny HCV wydaje się być podobna tak pod względem wielkości jak i wysokiej zawartości reszt zasadowych do białka nukleokapsydu /C/ znajdowanego przy N-końcu poliprotein flawiwirusów. Niaetrukturalne białka 2, 3, 4 i 5 /NS2 - 5/ HCV wirusa żółtej /YFV/ wydaią siię mieć odpowiedniki o podobnej wielkości i hydropatyczności, aczkolwiek sekwencje aminokwasów są rozbieżne. Jednakże, region HCV, który mógłby odpowiadać regionom poliproteiny YFV zawierają białko M, E i NS1, nie tylko różni się pod względem sekwencji, ale także okazuje się całkiem inny jeśli chodzi o wielkość i hydropatyczność. To też, chociaż pewne domeny genomu HCV można tu określić jako np. NS1 lub NS2, to należy rozumieć, że oznaczenia takie stosowane są wyłącznie dla wygody; mogą bowiem istnieć znaczne różnice między rodziną HCV i flawowirusami i z różnic tych należy zdawać sobie sprawę.
W rezultacie ewolucyjnego pokrewieństwa szczepów lub izolatów HCV, domniemywane szczepy i izolaty HCV dają się zidantyfikowć na podstawie ich homologii na poziomie polipep169 273 tydu. Jeśli chodzi o ujawnione w niniejszym opisie izolaty to, jak się oczekuje, nowe szczepy lub izolaty HCV są w co najmniej około 40% homologiczne, pewne z nich w więcej niż około 70% homologiczne, a niektóre nawet w więcej niż około 80%o homologiczne. Pewne szczepy lub izolaty mogą być w więcej niż około 90% homologiczne na poziomie polipeptydu. Techniki służące określaniu homologii sekwencji aminokwasów są znane w tej dziedzinie wiedzy. I tak np., sekwencję aminokwasów można określić bezpośrednio i porównać ją z sekwencjami w niniejszym opisie. Alternatywnie, można określić sekwencję nukleotydów materiału genomowego przypuszczalnego HCV / zazwyczaj za pośrednictwem cDNA/, ustalić zakodowaną w niej sekwencję aminokwasów i porównać odpowiadające regiony.
Termin proteaza HCV odnosi się do enzymu pochodzącego z HCV, który wykazuje aktywność proteolityczną, w szczególności do polipeptydu zakodowanego w domenie NS3 genomu HCV. Co najmniej jeden szczep zawiera proteazę, co do której sądzi się, że jest zakodowana zasadniczo przez następującą sekwencję, lub w jej obrębie:
| Arg Arg Gly | Arg | Hu Ile Leu | Leu | Gly | Pas | 10 |
| Ala Asp Gly Met | Val Sen Lys | Hy | Trp | Arg | 20 | |
| Leu Leu Ala | Pro | Ile tTir Ala | Tyr | Ala | Gln | 331 |
| lin Ihr AAg | Gly | Leu Leu Gly Cys | les | les | 40 | |
| Tir Ser Leu | ITr | Hy Arg Asp Lys | Asn | lin | 551 | |
| Tal llu Gly | Glu | Val Gln Ile | VaL | Ser | Bir | 66» |
| Ala Ala Gln | 2Łr | Phe Leu Ala | Thr | Cys | iee | 77» |
| Asn Hy Vaa | (Cy | Trp ITr TVa. | Tyr His | Hy | 80 | |
| Ala lly OTr | Arg | Thr Ile ALa | Ser | Prs | Lys | 90 |
| Hy Pro Val | Ile | Hn Mee lyy | Bur | Asn | Val | H0 |
| Asp lin Aap | Leu | Val Gly Up | Pro | Ala | Ser | 110 |
| lin Hy ITr | h | Ser Leu Bir | Pro | CyS | Thr | 112 |
| Cys Wy Ser | Sen | Asp Leu OTr | Leu | Val | Thr | no |
| Arg His AA^ | Up | Val Ile Pro | Val | Arg | Arg | 110 |
| Arg Hy Aas | See | Arg Gly Ser | Leu | Leu | Ser | no |
| Pro Arg IPr> | Ile | Ser Tt Leu | Lys | llty | Ser | 110 |
| Ser lly Gly | Pro | Leu Leu Cjt | Pro | Ala | lly | no |
| His Ala VVa | Gly | Ile Rie AAg | Ala | Ala | Val | 110 |
| Cys Tir AAg | Gly | Val AA a Lyy | Ala | Val | Asp | 119 |
| Phe Ile TP-© | VVa | Hu Am Leu | Hu | Thr | Thr | 200 |
| Met Arg ... |
Powyższe N- i C-końce są tylko domniemywane, końce rzeczywiste zdefiniowane są przez ekspresję i przetworzenie w odpowiednim gospodarzu konstrukcji DNA kodującej całą domenę NS3. Rozumie się, że sekwencja ta może się zmieniać w zależności od szczepu, gdyż wirusy RNA, jak HCV, znane są z tego, że przejawiają dużą ilość wariacji. Dalej, rzeczywiste N- i C-końce mogą się zmieniać, gdy proteaza zostaje odszczepiona od prekursorowej poliproteiny: wariacje sekwencji aminokwasów proteazy mogą w wyniku prowadzić do odszczepiania od poliproteiny w rozmaitych punktach. Stąd też, końce aminowe i karboksylowe mogą być różne dla różnych szczepów HCV. Pierwszy, powyżej przedstawiony aminokwas odpowiada reszcie 60 na fig. 1. Jednakże, minimum sekwencji niezbędne dla aktywności określić można metodami rutynowymi. Sekwencję można skrócić z każdego końca za pomocą podziałania odpowiednim wektorem ekspresyynym z udziałem egzonukleazy / po odszcz^^ieniu przy końcu 5' lub 3' sekwencji kodującej/ w celu usunięcia dowolnej pożądanej ilości par zasad. Następnie doprowadza się do ekspresji otrzymanego kodującego polinukleotydu i określa się sekwencję. W ten
169 273 sposób można skorelować aktywność otrzymanego tak produktu z sekwencją aminokwasów: ograniczona ilościowo seria tego rodzaju eksperymentów/ z usuwaniem w sposób progresywny coraz większej ilości par zasad/ pozwoli określić minimum sekwencji wewnętrznej niezbędne dla aktywności proteazy. Stwierdziliśmy, że sekwencję można zasadniczo skrócić, zwłaszcza przy końcu karboksylowym, i to z zachowaniem, w sposób oczywisty, całej aktywności proteazy. Obecnie sądzi się, że część białka przy końcu karboksylowym może przejawiać aktywność helikazy. Jednakże, aktywność helikazy nie jest wymagana w przypadku proteazy HCV według wynalazku. Również koniec aminowy można skrócić w pewnym stopniu bez utraty aktywności proteazy.
Uważa się, że aminokwasy, które powyżej zostały podkreślone, są to reszty niezbędne dla aktywności katalitycznej na zasadzie homologii sekwencji z przypuszczalnymi serynowymi proteazami flawowirusa. Tabela 1 przedstawia usytuowanie trzech katalitycznych reszt proteazy serynowej wobec proteazy HCV oraz proteazy otrzymanej z wirusa żółtej gorączki, wirusa gorączki zachodniego Nilu, wirusa gorączki doliny Murray i wirusa Kunjin. Aczkolwiek sekwencje czterech pozostałych proteaz flawowirusa wykazują między sobą wyższy stopień homologii, to jednak ciągle zauważa się tu pewien stopień homologii z HCV. Homologia ta, jednakże, niebyła wystarczająca do wykazania, przy pomocy obecnie dostępnego oprogramowania usytuowania. W przedstawionej powyżej sekwencji wskazane aminokwasy ponumerowano His79, Aspi03 i Sem /His 139, Aspi63 i Ser 2 1 na figurze 1/.
Tabela 1
Usytuowanie reszt aktywnych na podstawie sekwencji
| Proteaza | Hi® | Asp | Ser |
| HCV | CWTVYHGAG | YQYLGWAP | DKGSSGGPL |
| Żółta gorączka | PHTMWHYTR | KEYLVAYGG | PSGTS&SPl |
| Gorączka zachodniego | JHTLWITTK | KEYRLCYGG | PTGTS&SPI |
| Nilu | |||
| Doliny Murray | FHTLWHTTR | KEYRVTYGG | PIGTSGSPI |
| Wirus Kunjin | FHTLWHIIK | KEDRLCYGG | PTGTSGSPI |
Alternatywnie, usytuowanie reszty katalitycznej można ustalić na podstawie homologii strukturalnej. Tabela 2 przedstawia usytuowanie HCV wobec miejsc katalitycznych rozmaitych, dobrze scharakteryzowanych proteaz serynowych, napodstawie rozważań dotyczących budowy: proteaza A z Streptomyces griseus, proteaza α-lltyczna, trypsyna bydlęca, chymotrypsyna i elastaza [ M. James i in., Can. J. Biochem., 56, 396/1978/]. I znów obserwuje się tu pewien stopień homologii. Zidentyfikowane reszty HCV ponumerowano w przedstawionej powyżej sekwencji H1S79, Asp^s i Seri61
Tabela 2
Usytuowanie reszt aktywnych na podstawie budowy
| Proteaza | His | Asp | Ser |
| S. griseus A | TAGHC | NNDYYII | GYSGGSL |
| Proteaza 5 -lityczna | TAGHC | GNDIRAW | GYSGGSW |
| Trypsyna bydlęca | SAAHC | NNDIMLI | GYSGGPV |
| Chymotrypsyna | TAAHC | NNYITLL | GYSGGPL |
| Elastaza | TAAHC | GYDIALD | GYSGGPL |
| HCY | TVYHG | SSYLYLV | GSSGGPL |
169 273
Najbardziej bezpośredni sposób zweryfikowania reszt istotnych dla miejsca aktywnego polega na zastąpieniu każdej reszty indywidualnie resztą równoważną przestrzennie pod względem wielkości. Dokonać tego można łatwo przy wykorzystaniu mutagenezy specyficznej względem miejsca i podobnych metod znanych w tej dziedzinie techniki. W przypadku gdy zastąpienie danej reszty resztą o równoważnej wielkości prowadzi do utraty aktywności, potwierdzony zostaje rzeczywisty charakter zastąpionej reszty.
Termin analogi proteazy HCV odnosi się do polipeptydów, które różnią się od proteazy o sekwencji pełnej długości delecją, zmianą i/lub dodaniem do sekwencji aminokwasów natywnej proteazy. Do analogów proteazy HCV należą powyżej opisane proteazy skrócone, jak również muteiny i białka sprzężone obejmujące proteazę HCV, skróconą proteazę lub muteiny proteazy.
Zmiany prowadzące do utworzenia mutein proteazy HCV są to, korzystnie, konserwatywne podstawienia aminokwasów, w których aminokwas zostaje zastąpiony innym występującym w naturze aminokwasem o podobnym charakterze. I tak np., jako konserwatywne uważa się następujące podstawienia:
Lys - Arg;
Asn - Glin;
Phe - Tipi - Tyr.
Gly - Ala;
Val - Ile - Leu; Asp - Glu;
Zmianami niekonserwatywnymi są, na ogół, podstawienia jednego z powyższych aminokwasów aminokwasem z innej grupy /np. podstawienie Glu przez Asn/, lub podstawienie któregokolwiek z powyższych aminokwasów Cys, Met, His lub Pro. Podstawień z udziałem powszechnie występujących aminokwasów dokonuje się dogodnie na drodze mutagenezy specyficznej względem miejsca, której poddaje się wektor ekspresyjny kodujący pożądane białko, z następującą potem ekspresją zmienionej postaci. Zmianę aminokwasów można także przeprowadzić z wykorzystaniem metod syntetycznych lub półsyntetycznych. I tak np., za pomocą stosownej obróbki chemicznej wyizolowanego białka można dokonać przekształcenia reszt cysteiny lub seryny w selenocysteinę. Alternatywnie, z zastosowaniem standardowych metod in vitro syntezy białka, można przeprowadzić włączenie kwasów rzadziej występujących. Typowo, łączna ilość reszt zmienionych, usuniętych lub dodanych do natywnej sekwencji w muteinach nie powinna przekraczać około 20, korzystnie nie powinna być większa od około 10, a najkorzystniej nie powinna przekraczać około 5.
Termin białko sprzężone: ogólnie dotyczy polipeptydu obejmującego sekwencję aminokwasów uzyskaną z dwóch, lub więcej niż dwóch białek indywidualnych. W niniejszym opisie termin ten stosowany jest do określenia polipeptydu obejmującego proteazę HCV, produkt jej skrócenia, muteinę lub część funkcjonalną, sprzężoną z białkiem lub polipeptydem nie pochodzącym z HCV /partner sprzęgania/. Białka sprzężone najdogodniej wytwarza się za pomocą ekspresji sprzężonego genu, który koduje część jednego polipeptydu na końcu 5' i część innego polipeptydu na końcu 3', przy czym te różne części zostają połączone w jedną ramkę odczytu, której ekspresji dokonuje się w odpowiednim gospodarzu. Obecnie jest rzeczą korzystną /aczkolwiek nie jest to wymagane/ umiejscowienie proteazy HCV, lub jej analogu, przy końcu karboksylowym sprzężonego białka i wykorzystanie aktywnego fragmentu enzymu przy końcu aminowym. Ponieważ ekspresja proteazy HCV normalnie zachodzi w obrębie dużej poliproteiny, nie przewiduje się włączania sygnałów transportu komórkowego / np. sygnałów wywozu lub wydzielania/. Odpowiednimi funkcjonalnymi fragmentami enzymu są te polipeptydy, które wykazują ilościowo oznaczalną aktywność gdy dochodzi do ich ekspresji w postaci sprzężonej z proteazą HCV. Do przykładowych enzymów tego rodzaju, aczkolwiek bez ograniczania się tylko do nich, należy P-galaktozydaza/f-gal/, β-aktamaza, peroksydaza chrzanowa /HRP/, oksydaza glukozowa /GO/, ludzka dysmutaza nadtlenkowa /hSOD/, ureaza itp. Enzymy te są dogodne z tego względu, że ilość wytworzonego białka sprzężonego można określić ilościowo za pomocą prostego oznaczenia kolorymetrycznego. Alternatywnie, można posłużyć się białkami lub fragmentami antygenowymi w celu umożliwienia prostej detekcji i ilościowego oznaczenia białek sprzężonych przy użyciu przeciwciał swoistych w stosunku do partnera sprzęgania. Korzystnym w niniejszym zastosowaniu partnerem sprzęgania jest hSOD.
169 273
W praktycznej realizacji sposobu według wynalazku na ogół wykorzystuje się standardowe techniki biologii molekularnej, mikrobiologii, rekombinantowego DNA i immunologii, które znajdują się w zakresie wiedzy i umiejętności fachowca w tej dziedzinie wiedzy. Techniki te są w pełni wyjaśnione w piśmiennictwie. Patrz np: J. Sambrook i in., Molecular Cloning; A Laboratory Manual /1989/; DNA Cloning, tom I i II /wyd. D. N. Clover, 1985/:. Oligonucleotide Syntretit /wyd. M. J. Gait, 1984/; Nucleic Acid Hybridization /wyd. B. D. Hames & S. J. Higigins, 1984/; Transcription And Translation /wyd. B. D. Hames & S. J. Higgins, 1984/; Animal Cell Culture /wyd. R. I. Freshney, 1986/; Immobilized Cells And Enzymes /IRL Press, 1986/; B. Perbal, A Practical Guide To Molecular Cloning, 1984/; seria Methods In Enzymology /Academic Press, Inc./; Gene Transfer Vectort For Mammalian Cells” / wyd. J. H.MilleriM.P. Calos, 1987, Cold Spring Harbor Laboratory/; Meth. Enzymol., 154 i 155/1987/ /wyd., odpowiednio, Wu i Grotsman oraz Wu/; wyd. Mayer Walker /1987/, Immunochemical Methods In Cell And Molecular Biology / Academic Press, London/; Scopes, Protein Purification: Principles And Practice, wyd. II /Springer-Verlag, N.Y., 1987/; oraz Handbook Of Experimental Immunology, tomy I -IV /wyd. Weir i Blackwell, 1986/.
Do ekspresji pożądanych sekwencji kodujących nadają się komórki zarówno gospodarzy prokariotycznych jak i eukariotycznych, jeżeli stosuje się właściwe sekwencje kontrolne zgodne z przewidzianym gospodarzem. Spośród gospodarzy prokariotycznych najczęściej używa się E. coli. Do sekwencji kontolnych ekspresji w przypadku prokariotów należą promotory, ewentualnie zawierające części operatorowe, oraz miejsca wiążące rybosom. Wektory przenoszące zgodne z gospodarzami prokariotycznymi zazwyczaj pochodzą np. z pBR322, plazmidu zawierającego operony nadające oporność na ampicylinę i tetracyklinę, oraz różnych wektorów pUC, które także zawierają sekwencje nadające markery oporności na antybiotyki. Plazmidy te są dostępne w handlu. Markerów użyć można do otrzymania z powodzeniem transformantów na drodze selekcji. Do zwykle stosowanych prokariotycznych sekwencji kontrolnych należą układy promotorowe p-llak:amazytpenicytmazy/i laktozy [Chang i in., Nature, 198,1056/1977/], układ promotorowy tryptofanu /trp/ [Goeddel i in., Nuc. Acids. Res.., 8,4057/1980/] oraz lambda-pochodny promotor Pl i miejsce wiążące rybosom N genu [ Shimatake i in., Nature, 292, 128 /1981/], a także hybrydowy promotor tac [De Boer i in., Proc. Nat. Acad. Sci. USA, 292, 128 /1983/], wywodzące się z sekwencji promotorów trp i lac UV5. Powyższe układy są szczególnie zgodne z E. coli. Jeżeli jest to pożądane, użyć tutaj można innych gospodarzy prokariotycznych, takich jak szczepy Bacillus lub Pseudomonas, z odpowiednimi sekwencjami kontolnymi.
Do gospodarzy eukariotycznych należą, bez ograniczenia, komórki drożdży i ssaków w układach hodowli. Do drożdżowych gospodarzy dających ekspresję należą Saccraromyces, Klebsiella, Picia itp. Najczęściej stosowanymi gospodarzami drożdżowymi są Saccraromyces cerevitiae i Saccraromycet carlsbergensis i są to dogodne, jako gospodarze, grzyby. Wektory zgodne z drożdżami zawierają markery, które umożliwiają selekcję korzystnych transt^ormantów za pomocą nadania prototrofii mutantom auksotrofowym lub odporności na metale ciężkie szczepom typu dzikiego. Zgodne z drożdżami wektory mogą wykorzystać 2μ czynnik inicjujący replikację [Broach i in., Meth. Enzymol., 101, 307 /1983/], kombinację CEN3 i AR.S1 lub inny środek zapewniający replikację, taki jak sekwencje prowadzące do włączenia odpowiedniego fragmentu do genomu komórki-gospodarza. Sekwencje kontrolne dla wektorów drożdżowych są znane w tej dziedzinie techniki i należą do nich promotory syntezy enzymów glikolitycznycr [Hess i in., J. Adv. Enzyme Reg., 7, 149 /1968/; Holland i in., Biochem., 17, 4900 /1978/], włącznie z promotorem dla kinazy 3-fosfoglicertnianowej [ R. Hitzeman i in., J. Biol. Chem., 255. 2073 /1980/]. Włączyć także można terminatory, takie jak terminantory pochodzące z genu enolazy {Holland, J. Biol. Chem., 256, 1385 /1981/]. Szczególnie korzystnymi układami kontolnymi są te układy, które zawierają promotor dehydrogenazy gliceroLoαLderydo-3-fotforanowej /GAPDH/ lub regulowany promotor dehydrogenazy alkoholowej /ADH/, terminatory, także pochodzące z GAPDH oraz, w przypadku gdy pożądane jest wydzielanie, sekwencja prowadząca pochodząca z czynnika adrożdży /patrz opis patentowy Stanów Zjednoczonych nr 4870008, włączony do mniejszego opisu jako odnośnik/.
W obecnym korzystnym układzie ekspresyjnym wykorzystuje się, jako partnera sprzęgania, czynnik prowadzący w postaci ubikuityny. W równocześnie rozpatrywanym zgłoszeniu
169 273 patentowym Stanów Zjednoczonych Ameryki nr 7/390599, zgłoszonym 7 sierpnia 1989, ujawniono wektory do wysokiej ekspresji białek sprzężonych z ubikuityną drożdżową. Ubikuityna drożdżowa zapewnia polipeptyd składający się z 74 aminokwasów, który w ekspresji ulega automatycznemu odszczepianiu od sprzężonego białka. Sekwencja aminokwasów ubikuityny przedstawia się następująco:
Gin Ile Phs Yal Lys Th AeL 3Łr Gly ly Łr He Thr
Lsu Glu Val Glu Sar Ser .Asp Ihr Ile Asp Asn Val
Lys Ser Lys Ile Gin Asp lys Glu Gly Ile Pso loro Asp
Gin Gin Arg Lsu Ile Hie hlA a^Ijy Łys GL· Geu Sug
Asp Gly Arg Thr Lau SeT Asp ITr Asn Ale Ghn Łys
Glu Sar Thr Lau His huu Tal huu Arg I>eu Ag GIy
Gly
Patrz także: Ozkaynak i in., Nature, 312, 663 - 666 /1984/. Polinukleotydy kodująca polipeptyd ubikuitynę można syntetyzować z wykorzystaniem matod standardowych, na przykład technika Baria i in. [ J. Biol. Cham. 268, 1671 - 1678 / 1988/], przy użyciu syntetyzatora DNA Applied Biosystsm 380A. Przy użyciu odpowiednich łączników gan ubikuityny można wprowadzić do odpowiedniego wektora i ligować do sekwencji kodującej protaazę HCV lub jaj fragment.
Oprócz tago, traneerypcyjny region regulatorowy i traneerypcyjny region inicjujący, które są w sposób operatywny połączone za sobą, można tak dobrać, żaby nia były związana za sobą w sposób naturalny w dzikim organizmie. Układy takie są s^c^ei^i^^owo opisane w EPO 120551, opublikowanym 3 października 1984; EPO 116201, opublikowanym 22 sierpnia 1984, oraz w EPO 164556, opublikowanym 18 grudnia 1985. Wszystkie ta opisy, są włączona do niniajszago opisu jako odnośniki.
Linia komórkowa ssaków, dostępne, jako gospodarza, dla ekspresji, są znana w taj dziadzinie wiadzy i obejmują liczna immortalizowans linia komórek dostępna z American Type Culture Collaction /ATCC/, włączając w to komórki HeLa, komórki jajnika chomika chińskiego /CHO/, komórki narki noworodka chomika/BHK/ oraz szarag innych linii komórkowych. Znane są także w tej dziadzinie wiadzy promotory właściwa dla komórek ssaków i należą do nich promotory takia jak wirus małpi 40 /SV40/, [Fiers in., Natura, 273, 113 /1978/], wirus mięsaka Rousa /RSV/, adanowirus /aDv/ i wirus brodawek bydlęcych /BPV/. Komórki ssaków mogą także wymagać sekwencji terminatorowych oraz sekwencji addycyjnych poli-A. Można także włączyć sekwencje wzmacniające, wzmagające ekspresję, a takża sekwencje sprzyjająca amplifikacji ganu mogą okazać się pożądane / na przykład w przypadku genów oporności na metotraksat/. Tego rodzaju sekwencje są znane w taj dziadzinie techniki.
Wektory nadająca się do replikacji w komórkach ssaków są znana w taj dziedzinie techniki i mogą do nich nalażać rsplikony wirusów lub sekwencja zapewniająca włączenia odpowiednich sekwencji kodujących spitopy HCV do genomu gospodarza. I tak np., innym waktoram stosowanym przy ekspresji obcago DNA jest wirus krowianki. W tym przypadku, do genomu tego wirusa wprowadza się hatarologiczny DNA. Techniki wprowadzania obcago DNA do ganomu wirusa krowianki są znane w taj dziadzinie wiadzy. Można to, na przykład, wykorzystać rekombinację homologiczną. Na ogół, heterologiczny DNA wprowadza się do ganu, który dla wirusa nia jast istotny, na przykład do ganu kinazy tymidynowaj /tk/, i który takża daja dający się s^ll^l^ccj^i^ować marker. Wektory plazmidowa, którs bardzo ułatwiają konstruowanie wirusów rekombinantowych są już opisane /patrz np: Mackatt i in., J. Virol., 49, 857 /1984/; Chakrabarti i in., Mol, Cali. Biol., 5, 3403 /1985/; Moss w: GENE TRANSFER VECTORS FOR MAMMALIAN CELLS, wyd. Millar i Calos, Cold Spring Harbor Laboratory, NY /1987/. str. 10/. Następnie dochodzi do ekspresji polipeptydu HCV w komórkach lub zwierzętach zakażonych żywym rakombinantowym wirusem krowianki.
W calu wykrycia czy doszło, czy nie doszło, do ekspresji polipeptydu HCV z udziałem wektora krowianki, można zakazić komórki BSC 1 wektAsem sekombinnntowym i prowddiić
169 273 ich wzrost na szkiełkach mikroskopowych w warunkach umożliwiających ekspresję. Następnie komórki utrwala się acetonem, po czym przeprowadza się testy immunofluorescencyjne przy użyciu surowicy, o której wiadomo, że zawiera przeciwciała anty-HCV, skierowane przeciw polipeptydowi /polipeptydom/ zakodowanym w regionie genomu HCV, z którego pochodzi segment HCV znajdujący się w rekombinantowym wektorze ekspresyjnym.
Do innych układów przeznaczonych do udziału w ekspresji genomów eukariotycznych lub wirusowych należą komórki owadów oraz wektory odpowiednie do użycia w takich komórkach. Tego rodzaju układy znane są w tej dziedzinie techniki i obejmują, na przykład, owadzie ekspresyjne wektory przenoszące pochodzące z bakulowirusa Autographa californica, rdzeniowego wirusa polihedrozy /AcNPV/, będącego niezależnym od czynnika kooperującego wirusowym wektorem eksprei^^^yjnym. Wychodzące się z tego układu wektory ekspresyjne zazwyczaj wykorzystują silny wirusowy promotor genu polihedryny do napędzania ekspresji genów heterologicznych. Obecnie, najpowszechniej stosowanym wektorem przenoszącym używanym do wprowadzania obcych genów do AdNPV jest pAc373 /patrz PCT WO89/046699 i zgłoszenie patentowe Stanów Zjednoczonych Ameryki nr 7/456637/. Dla polepszenia ekspresji przeznaczono wiele innych wektorów, znanych fachowcom w tej dziedzinie techniki. Należy do nich, na przykład, pVL985 /który dokonuje zmiany polihedrynowego kodonu startowego z ATG na ATT i wprowadza miejsce klonowania BamHI o 32 pary zasad w dół od ATT/. Patrz: Luckow i Summers, Virol., 17, 31 /1989/. Wektory przenoszące AcNPV przeznaczone do ekspresji na wysokim poziomie niesprzężonych obcych białek opisano w równocześnie rozpatrywanych zgłoszeniach patentowych PCT WO89/046699 oraz zgłoszenie patentowe Stanów Zjednoczonych Ameryki nr 7/456637. Unikalne miejsce BamHI zlokalizowane jest za pozycją -8 w odniesieniu do kodonu inicjacji translacji ATG genu polihedryny. Nie występują miejsca rozszczepiania dla SmaI, PstI, Bglll, XbaI lub SstI. Dobra ekspresja niesprzężonych białek obcych zazwyczaj wymaga obcych genów najkorzystniej mających krótką sekwencję prowadzącą, zawierającą odpowiednie sygnały inicjacji translacji poprzedzające sygnał startowy ATG. Plazmid zawiera także sygnał poliadenylowania polihedryny i gen oporności na ampicylinę /amp/ oraz początek replikacji dla selekcji i reprodukowania się w E. coli.
Metody wprowadzania heterologicznego DNA do pożądanego miejsca w bakulowirusie są znane w tej dziedzinie techniki. Patrz: Summer i Smith, Texas Agricultural Experiment Station Bulletin nr 1555; Smith i in., Mol. Cell. Biol., 3, 2156 - 2165 /1983/; oraz Lucków i Summers, Virol., 17,31 /1989/. Na przykład, heterologiczny DNA można wprowadzić do genu, takiego jak gen polihedryny na drodze rekombinacji homologicznej, albo w miejsce enzymu restrykcyjnego wmontowane w gen pożądanego bakulowirusa. Wprowadzonymi sekwencjami mogą być te sekwencje, które kodują wszystkie, względnie zmieniające się, segmenty poliproteiny, albo inne otwarte ramki odczytu, które kodują polipeptydy wirusów. I tak np., insert może kodować następujące numery segmentów aminokwasów poliproteiny: aminokwasy 1 -1078; aminokwasy 332 - 662; aminokwasy 406 - 662; aminokwasy 156 - 328 i aminokwasy 199 - 328.
Sygnały modyfikacji potranslacyjnych, takie jak rozszczepienie peptydu sygnałowego, rozszczepienie proteolityczne i fosforylacja są rozpoznawane, jak się wydaje, przez komórki owadzie. Sygnały wymagane dla wydzielania i jądrowej akumulacji także wydają się być zachowane między komórkami bezkręgowców i kręgowców. Przy kładami sekwencji sygnałowych pochodzących z komórek kręgowców, które są skuteczne w komórkach bezkręgowców, znanymi w tej dziedzinie techniki, są np. takie sekwencje jak sygnał ludzkiej interleukiny-2 /IL2s/, dotyczący wydzielania z komórki, który jest rozpoznawany i całkowicie rozpraszany w komórkach owadzich.
Transformację przeprowadzić można jakąkolwiek znaną metodą wprowadzania polinukleotydów do komórk-gospodarza, włączając w to, na przykład upakowanie polinukleotydu w wirusie i transdukcję komórki-gospodarza wirusem, a także bezpośrednie pobranie polinukleotydu. Przyjęta metoda transformacji zależy od rodzaju gospodarza, który ma być transformowany. Transformacja bakteryjna, zachodząca na drodze pobrania bezpośredniego, wymaga, na ogół, użycia chlorku wapnia lub rubidu [Cohen, Proc. Nat. Acad. Sci. USA, 69, 2110/1972/; T. Maniatis i in., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY /1982/]. Transformację drożdży na drodze pobrania bezpośredniego prze169 273 prowadzić można z zastosowaniem metody Hinnena i in. [ Proc . Nat .Acad . Sci . USA . 75 . 19)29 /1978/]. Transformacje u ssaków na drodze pobrania bezpośredniego wykonać można z zastosowaniem metody z wytrącaniem fosforanem wapnia, którą podali Graham i Van der Eb, Virol., 52, 546 /1978/, względnie jej rozmaitych znanych modyfikacji. Inne metody wprowadzania rekombinantowych polinukleotydów do komórek, a zwłaszcza do komórek ssaków, obejmują transfekcję za pośrednictwem dekstranu, transfekcję za pośrednictwem fosforanu wapnia, transfekcję za pośrednictwem polibrenu, złączenie się protoplastów, elektroporację, zamknięcie polinukleotydu /polinukleotydów/ w liposomach i bezpośrednią mikroiniekcję polinukleotydów do jąder.
Przy konstruowaniu wektorów stosuje się techniki znane w tej dziedzinie wiedzy. Rozsczepienia DNA specyficznego względem miejsca dokonuje się za pomocą podziałania odpowiednimi enzymami restrykcyjnymi w warunkach, które, na ogół, podane są przez wytwórcę tych dostępnych w handlu enzymów. Ogólnie, około lpg sekwencji plazmidu lub DNA zostaje rozszczepiony 1 jednostką enzymu w około 20 jl roztworu buforowego w trakcie inkubacji w ciągu 1 - 2 godzin, w temperaturze 37°C. Po inkubacji z enzymem ^^.s1^I^r^j^c^^^j^;ym, usuwa się białko za pomocą ekstrakcji fenol/chloroform i odzyskuje DNA za pomocą wytrącenia etanolem. Rozszczepione fragmenty można rozdzielić z zastosowaniem metody elektroforezy na żelu poliakryloamidowym lub agarozowym, zgodnie z ogólnym sposobem postępowania opisanym w Meth. Enzymol., 65, 499 - 560 /1980/.
Otrzymanym po rozszczepieniu fragmentom o lepkich końcach można nadać postać o końcach tępych przy użyciu polimerazy DNA I E. coli /fragmentu Klenowa/ z udziałem odpowiednich deoksynukleotydotrifosforanów /dNTP/, obecnych w mieszaninie. Można także zastosować obróbkę z użyciem nukleazy S1, co daje w wyniku hydrolizę części jednoniciowego DNA.
Ligowania przeprowadza się w standardowych, jeśli chodzi o bufor i temperaturę, warunkach z użyciem ligazy DNA T4 i ATP. Ligowanie w przypadku lepkich końców wymaga użycia mniejszej ilości ATP i mniejszej ilości ligazy, aniżeli ligowanie w przypadku końców tępych. Gdy jako część mieszaniny ligacyjnej stosuje się fragmenty wektora, fragment wektora często poddaje się działaniu bakteryjnej fosfatazy alkalicznej /BAP/ lub cielęcej jelitowej fosfatazy alkalicznej, w celu usunięcia 5'-fosforanu, dzięki czemu zapobiega się ponownemu ligowaniu wektora. Alternatywnie, w celu zapobieżenia ligowaniu, można zastosować strawienie niepożądanych fragmentów przy udziale enzymu restrykcyjnego.
Mieszaniny ligacyjne transformuje się do odpowiednich gospodarzy klonowania, takich jak E. coli, po czym wyselekcjonowuje się korzystne tr^ns^^irmanty z wykorzystaniem włączonych markerów /np. oporności na antybiotyki/ i poddaje je screeningowi pod względem właściwej budowy.
Oligonukleotydy syntetyczne można wytworzyć przy użyciu automatycznego syntezatora oligonukleotydów, jak to opisał Warner [DNA, 3, 401 /1984/]. Jeżeli jest to pożądane, nici syntetyczne można oznakować przy użyciu 32P, za pomocą podziałania kinazą polinukleotydową w obecności 32P-ATP w standardowych warunkach pro 'wadzenia reakcji.
Sekwencje DNA, włącznie z sekwencjami wyizolowanymi z bibliotek cDNA, można modyfikować znanymi metodami, na przykład za pomocą mutagenezy ukierunkowanej [patrz np: Zoller, Nuc. Acids Res., 10, 6487 /1982/]. Mówiąc krótko, DNA przeznaczony do modyfikacji upakowuje się w fagu jako sekwencję jednoniciową i przekształca w dwuniciowy DNA przy użyciu polimerazy DNA, z zastosowaniem jako startera oligonukleotydu syntetycznego, komplementarnego z fragmentem DNA poddawanym modyfikacji, przy czym pożądana modyfikacja włączona jest do sekwencji startera. Otrzymany tak dwuniciowy dNa zostaje transformowany do bakterii-gospodarza, stanowiącej nośnik faga. Hodowle transformowanych bakterii, które zawierają kopie każdej nici faga umieszcza się na płytkach z agarem w celu otrzymania łysinek. Teoretycznie, 50% nowych łysinek zawiera faga z sekwencją zmutowaną, a pozostałe 50% zawiera sekwencję pierwotną. Replika© łysinek poddaje się hybrydyzacji z oznakowaną sondą syntetyczną w temperaturze i w warunkach umożliwiających hybrydyzację z właściwą nicią, ale nie z sekwencją nie zmodyfikowaną. Sekwencje, które zostały zidentyfikowane za pomocą hybrydyzacji odzyskuje się i klonuje.
169 273
Biblioteki DNA można sondować z wykorzystaniem sposobu postępowania podanego przez Grunsteina i Hognessa [Proc.Nat. Acad. Sci. USA, 73, 3961 /1975/]. Mówiąc krótko, w sposobie tym DNA, który ma stać się sondą, immobilizuje się na filtrach nitrocelulozowych, denaturuje i poddaje prehybrydyzacji przy użyciu buforu zawierającego 0 - 50% formamidu, 0,75 M NaCl,75 mM cytrynian sodu, 0,02% /wag/obj/ albuminy surowicy wołu, poliwinylopirolidonu i Ficoll® , 50 mM NaHzPOą /pH 6,5/, 0,1% SDS i 100 μ g/m 1 nośnikowego zdenaturowanego DNA. Procentowa zawartość formamidu w buforze, jak również czas i temperatura etapu prehybrydyzacji, a następnie hybrydyzacji, zależą od żądanej ostrości wymagań. Sondy oligomeryczne, które wymagają warunków mniej ostrych stosuje się na ogół w niższych stężeniach formamidu, w niższych temperaturach i w dłuższym czasie hybrydyzacji. Sondy zawierające powyżej 30 lub 40 nukleotydów, takie jak sondy pochodzące od cDNa lub sekwencji genomowych, na ogół wymagają wyższej temperatury, np. około 40 - 42°C oraz wyższej procentowej zawartości formamidu, np. 50%. Po prehybrydyzacji oligonukleotydową sondę znakowaną 5'-32P dodaje się do buforu i w mieszaninie tej inkubuje się filtry w warunkach przewidzianych dla hybrydyzacji. Po przepłukaniu, poddane takiej obróbce filtry poddaje się autoradiografii w celu wykazania lokalizacji sondy hybrydyzowanej. Jako źródła żądanego DNA używa się DNA w odpowiednim położeniu na wyjściowych płytkach agarowych.
Dla rutynowego konstruowania wektorów, mieszaniny ligacyjne transformuje się do szczepu HB101 E. coli, albo do innych stosownych gospodarzy, i korzystne transformanty selekcjonuje się pod względem oporności na antybiotyki lub innych markerów. Następnie otrzymuje się z transformantów plazmidy według metody Clewella i in. [Proc. Nat. Acad. Sci. USA, 62, 1159/1969/], zazwyczaj po amplifikacji z udziałem chloramfenikolu [J. Clewell, J. Bacteriol., 110, 667 /1972/]. DNA wyodrębnia się i analizuje, zwykle z wykorzystaniem enzymów restrykcyjnych i/lub sekwencjonowania. Sekwencjonowania można dokonać metodą didezoksy Sangera i in. [Proc. Nat.Acad. Sci. USA, 74, 5463 /1977/] sposobem opisanym następnie przez Messinga i in. [Nuc. Acids Res., 9, 309/1981/], lub metodą Maxama i in. [Meth. Enzymol., 65, 499 /1980/]. Problemy wynikające z kompresji pasm, obserwowane niekiedy w regionach o wysokiej zawartości GC, ominięto dzięki użyciu T-dezazoguanozyny, według metody Barra i in. [Biotechniąues, 4, 428 /1986/].
Do pomiaru stężenia czy to antygenu, czy przeciwciała można zastosować test immunosorpcyjny ze związanym enzymem /ELISA/. Metoda ta polega na koniugowaniu enzymu albo z antygenem albo przeciwciałem, przy czym aktywność związanego enzymu traktuje się jako wyznacznik ilościowy. Aby dokonać pomiaru przeciwciała, znany antygen zamocowuje się na fazie stałej /np. na płytce do mikromiareczkowania, w miseczce z tworzywa sztucznego, na pręcie wskaźnikowym, na kulce z tworzywa sztucznego itp./, inkubuje z rozcieńczeniami testowej surowicy, przemywa, inkubuje z antyimmunoglobuliną znakowaną enzymem i ponownie przemywa. Enzymy odpowiednie do znakowania są znane w tej dziedzinie techniki i należy do nich, na przykład, peroksydaza chrzanowa /HRP/. Aktywność enzymatyczną związaną z fazą stałą mierzy się zazwyczaj za pomocą swoistego substratu i kolorymetrycznego oznaczenia tworzenia się produktu i zużycia się substratu. Aktywność enzymatyczna związana jest bezpośrednią funkcją ilości związanego przeciwciała.
W celu dokonania ilościowego pomiaru antygenu, zamocowuje się na fazie stałej znane swoiste przeciwciało, po czym dodaje się badany materiał zawierający antygen i po inkubacji przemywa się fazą stałą, a następnie dodaje się drugie przeciwciało znakowane enzymem. Po przemyciu dodaje się substrat i dokonuje kolorymetrycznego pomiaru aktywności enzymatycznej i wynik odnosi do stężenia antygenu.
Aktywność proteaz stosowanych w sposobie według wynalazku zbadać można za pomocą rozszczepienia substratu, prowadzącego do otrzymania produktów rozszczepienia, które są wykrywalne. Ponieważ sądzi się, że proteaza HCV sama się odszczepia od genomowej poliproteiny, tę aktywność autokatalityczną można wykorzystać zarówno do badania ekspresji białka, jak i do oznaczania aktywności. Na przykład, jeżeli proteazę łączy się z jej partnerem sprzęgania w taki sposób, że zostaje włączony N-końcowy sygnał rozszczepienia proteazy HCV /Arg-Arg/, produkt ekspresji sam się rozszczepi na partnera sprzęgania i aktywną proteazę HCV. Następnie można zbadać produkty, na przykład techniką Western blotting, w celu upewnienia się, że
169 273 wytworzone białka odpowiadają wielkością osobno partnerowi sprzęgania i białkom proteazy. Obecnie korzystnie stosuje się estry p-nitrofenylowe małych peptydów lub metylokumaryny, ponieważ postęp rozszczepiania można badać następnie metodą spektrofotometryczną lub fluorescencyjną. Według metody opisanej przez E.D. Matayoshi i in. [Science, 247, 231-235 /1990/], do jednego końca substratu można przyłączyć znacznik fluoroscencyjny, a do drugiego końca cząsteczkę wygaszającą. Następnie dokonuje się pomiaru uzyskanego w wyniku tego wzrostu fluoroscencji, przez co określa się rozszzpienie. Jeżeli jako partnera sprzęgania używa się właściwego enzymu lub antygenu, łatwo można oznaczyć ilość wytworzonego białka. Alternatywnie, można wyłączyć N-końcowy sygnał roszczepienia proteazy HCV /co zapobiega samorozszczepieniu/ i dodać osobny substrat rozszczepiania, taki jak fragment domeny NS3 HCV obejmujący natywny sygnał przetwarzania względnie analog syntetyczny.
W przypadku nieobecności tej aktywności proteazy, poliproteina HCV powinna pozostać w postaci nieprzetworzonej i w ten sposób uczynić wirus niezakaźnym. Tak więc, proteaza jest użyteczna jeśli chodzi o badanie środków farmaceutycznych do zwalczania HCV, ponieważ związki, które hamują w stopniu wystarczającym aktywność proteazy, będą także hamować zakaźność wirusa. Tego rodzaju inhibitory mogą występować w postaci związków organicznych naśladujących miejsce rozszczepianiaHCV rozpoznawane przez proteazę. Trzy spośród domniemywanych miejsc rozszczepianiapoliprotemy HCVma^na^^ię^,u;jącą sekwencję aminokwasów:
Val-Ser--Ala-Arg-Arg / / Gly-Arg-Glu-Ile-Leu-Leu-Gly Ala-Ile-Leu-Arg-Arg / / Hi8-Val-lly-ProVal-Sei-Cys-lln-Arg / / Gly-TyrMiejsca te charakteryzują się występowaniem dwóch zasadowych aminokwasów bezpośrednio przez miejscem rozszczepiania i są one podobne do miejsc rozszczepiania rozpoznawanych przez inne proteazy flawiwirusów. I tak, stosowne inhibitory proteazy można otrzymać w taki sposób, że naśladować będą motyw: zasadowy /zasadowy/ mały obojętny miejsc rozszczepiania HCV, ale z zastąpieniem wiązania peptydowego rozszczepianego w substracie naturalnym przez wiązanie trwałe. Do odpowiednich inhibitorów należą peptydotrifluorometyloketony, kwasy peptydoboronowe, peptydo-a-ketoestry, pochodne peptydodifluoroketonowe, peptydoaldehydy, peptydodiketony itp. Naprzykład, peptydoaldehyd, N-acetylofenyloajanyloglicynoaldehyd, jest silnym inhibitorem proteazy papainy. Z wykorzystaniem metod ujawnionych w zgłoszeniu patentowym Stanów Zjednoczonych nr kolejny 7/189318, zgłoszonym 2 maja 1988 /opublikowanym jako PCT WO89/10931/, włączonym do niniejszego opisu jako odnośnik, można w dogodny sposób wytworzyć i zbadać wiele mieszanin peptydów. Zgłoszenie to wskazuje metody wytwarzania mieszanin peptydów aż do heksapeptydów o wszelkich możliwych sekwencjach aminokwasów, a dalej podaje metody badawcze służące identyfikowaniu tych peptydów, które są zdolne do wiązania się z proteazami.
Innymi inhibitorami proteazy mogą być białka, a zwłaszcza przeciwciała i pochodne przeciwciał. Układów ekspresji rekombinantowej użyć można do wytwarzania znacznych ilości proteazy, wystarczających do produkcji przeciwciał monoklonalnych /MAb/ swoistych dla proteazy. Przeciwciała odpowiednie pod względem hamowania proteazy będą się wiązać z proteazą w sposób powodujący zmniejszenie lub wyeliminowanie aktywności enzymatycznej, typowo za pomocą przesłonięcia miejsca aktywnego. Do utworzenia pochodnych użyć można właściwych MAb, takich jak fragmenty Fab, przeciwciała chimeryczne, przeciwciała zmienione, przeciwciała jednoreceptorowe oraz przeciwciała pojedynczej domeny, przy zastosowaniu metod znanych w tej dziedzinie techniki.
Inhibitory proteazy poddaje się screenmgowi z wykorzystaniem metod według wynalazku. Ogólnie, używa się substratu, który naśladuje naturalny substrat enzymu, ale który w przypadku rozszczepiania daje sygnał dający się ocenić ilościowo. Sygnałem, korzystnie, jest sygnał oznaczalny metodą kolorymetryczną lub fluorometryczną. Jednakże, użyteczne tu mogą być także inne metody, takie jak HPLC lub chromatografia na żelu krzemionkowym, GC-MS, rezonans magnetyczny jądrowy itp. Po oznaczeniu optymalnego stężenia substratu i enzymu, do
169 273 mieszaniny reakcyjnej wprowadza się, w określonym zakresie stężeń, kandydujący inhibitor proteazy. Warunki badania, najkorzystniej, powinny przypominać warunki, w jakich proteaza hamowana ma być in vivo, to znaczy przy fizjologicznym pH, temperaturze, sile jonowej itd. Odpowiednie inhibitory dawać będą silne zahamowanie proteazy w stężeniach nie powodujących zwiększenie toksycznych skutków ubocznych u osobnika leczonego. Inhibitory współzawodniczące jeśli chodzi o wiązanie się z aktywnym miejscem proteazy mogą wymagać zastosowania stężeń równych stężeniu substratu lub większych, podczas gdy inhibitory zdolne do wiązania się z aktywnym miejscem proteazy w sposób nieodwracalny można dodawać w stężeniu rzędu stężenia enzymu.
W korzystnym sposobie realizacji wynalazku, stosuje się raczej nie aktywny enzym, ale nieaktywną muteinę proteazy. Stwierdzono, że zastąpienie decydującej reszty w obrębie aktywnego miejsca proteazy /np. zastąpienie Ser aktywnego miejsca proteazy serynowej/ nie powoduje znaczniejszej zmiany w strukturze enzymu, a tym samym chroni swoistość wiązania. Zmieniony enzym ciągle rozpoznaje właściwy mu substrat i wiąże się z nim, ale nie daje efektu rozszczepiania. Stąd też, w jednym ze sposobów według wynalazku inaktywowaną proteazę HCV immobilizuje się i dodaje się mieszaninę kandydujących inhibitorów. Inhibitory ściśle naśladujące korzystną sekwencję rozpoznającą enzymu będą konkurować z większym powodzeniem jeśli chodzi o wiązanie się, aniżeli inne inhibitory kandydujące. Słabo wiążące kandydujące inhibitory można następnie oddzielić, po czym określić tożsamość inhibitorów silnie wiążących. I tak, na przykład, można wytworzyć proteazę HCV za pomocą zastąpiema Ser221 /fig. 1/ przez Ala, w wyniku czego otrzymuje się enzym zdolny do wiązania substratu proteazy HCV, ale niezdolny dojego rozszczepienia. Następnie otrzymaną tak muteinę proteazy wiąże się ze stałym nośnikiem, na przykład kulkami Sephadex® i wprowadza do kolumny. Następnie przez kolumnę przepuszcza się mieszaninę kandydujących inhibitorów proteazy w roztworze i odbiera się frakcje. Ostatnie frakcje z elucji zawierają związki najsilniej wiążące i dają korzystnie kandydujące inhibitory proteazy.
Inhibitory proteazy można podawać w różny sposób, a mianowicie dożylnie, doustnie, domięśniowo, dootrzewnowo, dooskrzelowo, donosowo itd. Korzystna droga podawania zależy od charakteru inhibitora. Inhibitory wytworzone w postaci związków organicznych często można podawać doustnie /co jest ogólnie korzystne/, jeżeli są dobrze wchłaniane. Inhibitory na bazie białka /takie jak większość pochodnych przeciwciał/ należy, na ogół, podawać drogą pozajelitową.
Przedstawione poniżej przykłady podanojako dalszą wskazówkę dla praktyki o przeciętnej wiedzy w tej dziedzinie techniki i nie należy ich interpretować jako ograniczenia wynalazku w jakikolwiek sposób. '
Przykład I. Otrzymywanie cDNA HCV. Genomową bibliotekę cDNA HCV wytworzono w sposób opisany w opublikowanym opisie zgłoszenia patentowego PCT WO89/046699 i w opisie zgłoszenia patentowego Stanów Zjednoczonych Ameryki nr 7/456637. Bibliotekę tę, nr rejestracyjny ATCC 40394, zdeponowano jak to poniżej przedstawiono.
Przykład II. Ekspresja polipeptydu zakodowanego w klonie 5-1-1. /A/ Polipeptyd HCV zakodowany w klonie 5-1-1 /patrz przykład I/ doprowadzono do ekspresji jako polipeptyd sprzężony z ludzką dysmutazą ponadtlenkową /SOD/. Dokonano tego za pomocą subklonowania insertu cDNA klonu 5-1-1 do wektora ekspresyjnego pSODCF1 [K. S. Steimer i in., J. Virol., 58, 9 /1986/; EPO 138111], jak następuje. Wektor ekspresyjny SOD55-1-1 transformowano do komórek D1210 E. coli. Komórki te, nazwane Cf1/5-1-1 w E. coli, zdeponowano jak to poniżej przedstawiono, i noszą one numer rejestracyjny ATCC 67967.
Po pierwsze, na DNA wyizolowany z pSODCF12 podziałano BamHI i EcoRI i z liniowym DNA utworzonym w wyniku działania enzymów restry kcyj nych zligowano następujący łącznik:
GAT CCT GGA ATT CTG ATA AGA CCT TAA GAC TAT TTT AA
Pr klonowaniu wyodrębniono plazmid zawierający insert.
Plazmid zawierający insert rozcięto przy użyciu EcoRI. Przy użyciu EcoRI wycięto insert cDNA HCV w klonie 5-1-1 i ligowano do wspomnianego, przeprowadzonego w postać liniową z zastosowaniem EcoRI, plazmidowego DNA. Mieszaniny DNA użyto do transformowania szczepu E coli D1210 [Sadler i in., Gene, 8, 279 /1980/]. Rekombinanty z cDNA 5-1-1 o
169 273 prawidłowej orientacji pod względem ekspresji ORP, jak na figurze 1, zidentyfikowano za pomocą mapowania restrykcyjnego i sekwencjonowania nukleotydów.
Bakterie rekombinantowe z jednego klonu indukowano do ekspresji polipeptydu SODHCV5-- za pomocą hodowli w obecności IPTG.
Za pomocą ligacji trzech nowych łączników, AB, CD i EF, do fragmentu BamHI-EcoRI, pochodzącego z całkowitego strawienia wektora pSODCF1 przy użyciu EcoRI i BamHI, po którym nastąpiło podziałanie fosfatazą alkaliczną, utworzono trzy osobne wektory ekspresyjne, a mianowicie pcf1AB, pcf1CD i pcf1EF. .Łączniki utworzono z sześciu oligomerów- A. B. C. D, E i F. Każdy oligomer, przed połączeniem z oligomerem komplementarnym, poddano fosforylacji za pomocą podziałania kinazą w obecności ATP. Sekwencje syntetycznych łączników były następujące:
Nazwa Sekwencja DNA /5' do 3 '!
| A | GATC | CTG | AAT | CC | TGA | TAA | ||
| B | GAC | TTA | AGG | ACT | ATT | TTT | A | |
| C | GATC | CGA | ATT | CJG | TGA | TAA | ||
| D | GCT | TAA. | GAC | ACT | ATT | TTA | A | |
| E | GATC | CTG | GAA | !P3CC | TGA | TAA | ||
| F | GAC | <3TT | AA.G | ACT | ATT | TTA | A |
Każdy z trzech łączników niszczy pierwotne miejsce EcoRI i tworzy nowe miejsce EcoRI w obrębie łącznika, lecz w obrębie odmiennej ramki odczytu. Stąd też, fragmenty EcoRI cDNA HCV izolowane z klonów, gdy zostały wprowadzone w wektor ekspresyjny, występowały w trzech różnych ramkach odczytu.
Fragmenty cDNA HCV w wyznaczonych klonach gt11 wycięto przez trawienie z EcoRI. Każdy fragment wprowadzono do pcf1AB, pcflCD i pcf1EP. Te konstrukcje ekspresyjne transformowano następnie do komórek E. coli D1210, transformanty klonowano i doprowadzano do ekspresji polipeptydów, jak to opisano poniżej w części B. /B/. Produkty ekspresji wskazanych DNA HCV zbadano pod względem antygenowości za pomocą bezpośredniego immunologicznego screeningu kolonii, z zastosowaniem modyfikacji metody opisanej przez Helfmana i in. [Proc. Nat. Acad. Sci. USA, 80,31 /1983/]. Mówiąc krótko, bakterie umieszczono na filtrach nitrocelulozowych położonych na płytkach z ampicyliną, otrzymując około 40 kolonii na filtr. Wykonano repliki kolonii na filtrach celulozowych i prowadzono wzrost replik przez noc w obecności 2 mM IPTG i ampicyliny. Kolonie bakterii zlizowano przez zawieszenie filtrów nitrocelulozowych na około 15 do 20 minut w atmosferze wysyconej parami CHCb. Następnie każdy filtr umieszczono w osobnej, 100 mm płytce Petri'ego zawierającej 10 ml 50 mM Tris HCl, pH 7,5, 150 mM NaCl, 5 mM MgCb, 3% /wag/obj/BSA, 40 pg/ml lizozymu i 0,1 pg/ml DNazy. Płytki łagodnie wstrząsano w ciągu co najmniej 8 godzin w temperaturze pokojowej. Filtry przepłukane TBST /50 mM Tris HCl, ph 8,0, 150 mM NaCl, 0-005% Tween® 20/. Po inkubacji, komórkowy debris przemyto i inkubowano w ciągu godziny w TBS /TBST bez Tween®/, zawierającym 1(0%o owczej surowicy. Następnie przesącze inkubowano z poddanymi wstępnej obróbce surowicami w TBS od osobników z NANBH, co obejmowało: 3 szympansy, 8 pacjentów z chroniczną NANBH, których surowice były pozytywne wobec przeciwciał przeciw polipeptydowi C100-3 HCV /zwanemu także C-100/, 8 pacjentów z chroniczną NANBH, których surowice były negatywne wobec przeciwciał anty-C100, ozdrowieńca, którego surowi ca była negatywna wobec przeciwciał anty-C100, oraz 6 pacjentów z NANBH nabytą w zbiorowisku, włącznie z jednym, którego surowica była lekko dodatnia wobec przeciwciał anty-C100. Surowice, rozcieńczone w TBS, poddano wstępnej obróbce polegającej na preabsorpcji z udziałem hSOD, w ciągu co najmniej 30 minut, w temperaturze 37°C. Po inkubacji, filtry przemyto dwukrotnie, w ciągu 30 minut, TBST. Otrzymane w wyniku ekspresji białka, które wiązały przeciwciała w surowicach, oznakowano za pomocą inkubacji w ciągu 2 godzin
169 273 ze znakowanym i25j owczym przeciwludzkim przeciwciałem. Po przemyciu, filtry przemyto dwukrotnie, w ciągu 30 minut, TBST, wysuszono i zbadano metodą autoradiografii.
Pr z y k ła d III. Klonowanie białek tprzężonycr SOD-proteaza o pełnej długości.
/A/ pBR300-C000:
Sekwencje nukleotydów cDNA HCV poniżej użytych określono zasadniczo sposobem powyżej opisanym, z tą różnicą, że cDNA wyizolowany z klonu 5-1-1 zastąpiono cDNA wyciętym ze wspomnianych fagów.
Klon C33c wyizolowano przy użyciu sondy hybrydyzacyjnej o następującej sekwencji:
5' ATC AGG ACC GGG GTG AGA ACA ATT ACC ACT 3'
Sekwencję cDNA HCV w klonie C33c przedstawiono na figurze 8, która także pokazuje zakodowane tam aminokwasy.
Klon 35 wyizolowano za pomocą sereeningu z polinukleotydu syntetycznego o sekwencji:
5'AAG CCA CCG TGT GCG CTA GGG CTC AAG CCC 3'
Z sondą hybrydyzował mniej więcej 1 na 50000 klonów. Na figurze 7 przedstawiono sekwencję polinukleotydu i wydedukowaną sekwencję aminokwasów dla C35.
Klon C31 przedstawiono na figurze 6, która także pokazuje zakodowane w nim aminokwasy. Skonstruowano kasetę C200 za pomocą ligowania razem fragmentu o 718 parach zasad, otrzymanego za pomocą trawienia DNA klonu C33c przy użyciu EcoRI i HinfI, fragmentu o 179 parach zasad, otrzymanego za pomocą trawienia DNA klonu C31 przy użyciu HinfI i BglI oraz fragmentu o 377 parach zasad, otrzymanego za pomocą trawienia DNA klonu C35 przy użyciu BglI i EcoRI. Konstrukcję złożoną z ligowanych fragmentów wprowadzono do miejsca EcoRI pBR300, w wyniku czego otrzymano plazmid pBR^3^^-C200.
/B/
Wyizolowano klon 7f przy użyciu sondy o sekwencji:
5'-AGC AGA CAA GGG GCC TCC TAG GGT GCA TAA T-3'
Na Figurze 5 przedstawiono sekwencję cDNA HCV w klonie 7f i zakodowane tam aminokwasy.
Klon C20c wyizolowano przy użyciu sondy o następującej sekwencji:
5'-TGC ATC AAT GGG GTG TGC TGG-3'
Na Figurze 2 przedstawiono sekwencję cDNA HCV w klonie C20c i zakodowane tam aminokwasy.
Klony 7f i C20c trawiono przy użyciu EcoRI i SfaNI z utworzeniem fragmentów o, odpowiednio, 400 parach zasad i 260 parach zasad. Następnie fragmenty klonowano do miejsca EcoRI pBR322 z utworzeniem wektora C7f+C20c i transformowano do komórek HB101.
/C/ C300:
Wyizolowano klon 8h przy użyciu sondy na bazie sekwencji nukleotydów w klonie 00e. Sekwencja nukleotydów sondy była jak następuje:
5' -AGA GAC AAC CAT GAG GTC CCC GGT GTT C-3'
Na Figurze 4 przedstawiono sekwencję cDNA HCV w klonie 8h i zakodowane tam aminokwasy.
Klrn C26d wyizolowano przy użyciu sondy o następującej sekwencji:
5' -CTG TTG TGC CCC GCG GCA GCC- 3'
Na Figurze 3 przedstawiono sekwencję i translację aminokwasów klonu C26d.
Klony C26d i C33c /patrz część A powyżej/ transformowano do szczepu E. coli GM48 /metylowanie -/. Klon C26d trawiono z udziałem EcoRII i DdeI, w wyniku czego otrzymano fragment o 100 parach zasad. Klon C33c trawiono przy udziale EcoRII i RcoRI, w wyniku czego otrzymano fragment o 700 parach zasad. Klon C 8h trawiono przy udziale EcoRI i DdeI, w wyniku czego otrzymano fragment o 208 parach zasad. Następnie wszystkie te trzy fragmenty ligowanr do miejsca EcoRI pBR000 i transformowano do E. coli HB101, w wyniku czego otrzymano wektor C300.
/D/ Otrzymywanie klonów o pt/nt7 długości':
Fragment o 600 parach zasad otrzymano z C7f+C20c za pomocą trawienia przy udziale EcoRI i NaeI i ligowano do fragmentu NaeI/EcoRI o 945 parach zasad z C300, po czym
169 273 otrzymaną konstrukcję wprowadzano do miejsca EcoRI pGEM4Z /dostępny w handlu z firmy Promega/, w wyniku czego otrzymano wektor C7fC20cC300.
C7fC20cC300 trawiono przy udziale Ndel i EcoRI, w wyniku czego otrzymano fragment o 892 parach zasad, który ligowano z fragmentem o 1160 parach zasad otrzymanym za pomocą trawienia C200 przy udziale Ndel i EcoRI. Utworzoną tak konstrukcję wprowadzono do miejsca EcoRI pBR322, w wyniku czego otrzymano wektor C7fC20cC300C200. Konstrukcja tego wektora objaśniona jest schematycznie na figurze 9.
Przykład IV. Otrzymywanie wektorów ekspresyjnych E. coli /A/ cf1SODp600
Wektor ten zawiera sekwencję kodującą proteazy HCV o pełnej długości sprzężoną z funkcjonalnym liderem hSOD. Wektor C7fC20cC300C200 rozszczepiono przy użyciu EcoRI, w wyniku czego otrzymano fragment o 2000 par zasad, który następnie ligowano do miejsca EcoRI plazmidu cf1 CD /Przykład 2 A/ . Otrzymany tok wektor koduje aminokwasy 1-151 hSOD oraz aminokwasy 946-1630 HCV /numerowanie od początku poliproteiny, odpowiada aminokwasom 1-686 na figurze 1/. Wektor oznakowano przy użyciu cf1SODp600 / niekiedy określanego jako P600/ i transformowano do komórek E. coli D1210. Komórki te, nr rejestracyjny ATCC 6827I, zdeponowano jak to poniżej przedstawiono.
/B/ P190:
Skrócony polinukleotyd sprzężony SOD-proteaza wytworzono za pomocą wycięcia fragmentu EcoRI/NaeI o 600 parach zasad z C7f+C20c, stępienia fragmentu przy udziale fragmentu Klenowa i ligowania stępionego fragmentu do stępionego fragmentem Klenowa miejsca EcoRI cf1EF /Przykład 2A/. Polinukleotyd ten koduje białko sprzężone posiadające aminokwasy 1 1I1 z hSOD i aminokwasy 1-199 z proteazy HCV.
/C/ P300:
Dłuższy, skrócony polinukleotyd sprzężony SOD-proteaza wytworzono za pomocą wycięcia fragmentu EcoRI/NdeI o 892 parach zasad z C7fC20cC300, stępienia fragmentu przy udziale fragmentu Klenowa i ligowania stępionego fragmentu do stępionego fragmentem Klenowa miejsca EcoRI cf1EF. Polinukleotyd ten koduje białko sprzężone posiadające aminokwasy 1 - 151 z hSOD i aminokwasy 1 - 299 z proteazy HCV.
/D/ P500:
Dłuższy, skrócony polinukleotyd sprzężony SOD-proteaza wytworzono za pomocą wycięcia fragmentu EcoRI/EcoRI o 1550 parach zasad z C7fC20cC300 i ligowania fragmentu do miejsca EcoRI cf1CD, z utworzeniem Pl00. Polinukleotyd ten koduje białko sprzężone posiadające aminokwasy 1- 151 z hSOD i aminokwasy 946 - 1457 z proteazy HCV / aminokwasy 1 -513 na figurze 1/.
/E/ Sprzężenie FLAG/proteaza
Wektor ten zawiera sekwencję kodującą proteazy HCV o pełnej długości sprężoną z sekwencją FLAG [Hopp i in., Biotechnology, 6,1204 -1210/1988/]. Użyto PCR do wytworzenia genu proteazy HCV o specjalnych końcach restrykcyjnych dla ułatwienia klonowania. Plazmid p500 trawiono przy udziale EcoRI i NdeI. w wyniku czego otrzymano fragment o 900 parach zasad. Fragment ten wraz z dwoma starterami zastosowano w katalizowanej przez polimerazę reakcji łańcuchowej w celu wprowadzenia unikalnego miejsca BgIII przy aminokwasie 1009 i kodonu stop z miejscem SaII przy aminokwasie 1262 HCV-1, jak to przedstawiono na figurze 17 w WO90/11089, opublikowanym 4 października 1990. Sekwencja primerów jest jak następuje:
5' CCC GAG CAA GAT CTC CCG GCC C 3' oraz
5' CCC GGC TGC ATA AGC AGT CGA CTT GGA 3'
Po 30 cyklach PCR, mieszaninę reakcyjną poddano trawieniu z udziałem BgIII i SaII, po czym wyodrębniono fragment o 710 parach zasad. Fragment ten połączono i zligiowano do następującego dupleksu:
MetAspTyrLysAspAspAspAspLysGlyArgGlu
CATGGACTACAAAGACGATGACGATAAAGGCCGGGA
CTGATGTTTCTGCTACTGCTATTTCCGGCCCTCTAG
169 273
Dupleks koduje sekwencję FLAG, metioninę inicjatorową i miejsca restrykcyjne 5'NcoI. Otrzymany tak fragment NcoI/SaII ligowano do pochodnej pCF1.
Konstrukcję tę transformowano następnie do komórek E. coli D1210 i indukowano ekspresję protaazy za pomocą dodania IPTG.
Sekwencję FLAG sprzężono z proteazą HCV w celu ułatwiania oczyszczania. Ca-zależns przeciwciało monoklonalne, które wiąża się z paptydam kodowanym przaz FLAG, stosuje się do oczyszczania białka sprzężonego bez wprowadzania surowych warunków alucji.
Przykład V. Eksprasja w E. coli białak sprzężonych SOD-protaaza.
/A/ Komórki E. coli D1210 transformowano przy użyciu cf1SODp600 i prowadzono ich hodowlę w bulionie Luria zawierającym 100 gg/ml ampicyliny aż do uzyskania OD 0,3 - 0,5. Następnie dodano IPTG do stężenia 2 mM i komórki hodowano do końcowej wartości OD 0,9 - 1,3. Następnie komórki poddano lizia i otrzymany lizat analizowano techniką Western blotting przy użyciu surowic anty-HCV, jak to opisano w zgłoszeniu patentowym Stanów Zjednoczonych Ameryki nr 7/456637.
Wyniki wykazały zajście rozszczepiania, gdyż na żalu nia uwidocznił się żaden produkt o pełnaj długości /teoretyczna wartość Mr 73 kDa/. Pasma odpowiadająca partnerowi sprzęgania hSOD i osobno protaazia HCV pojawiły się przy wartości względnej masy cząsteczkowej około 34,53 i 66 kDa. Pasmo 34 kDa odpowiada partnerowi hSOD /około 20 kDa/ z częścią domeny NS3, podczas gdy pasma 53 i 66 kDa odpowiadają protaazia HCV o różnych stopniach przetworzenia /przypuszczalnie bakteryjnego/.
/B/ Komórki E. coli D1210 transformowano przy użyciu p500 i prowadzono ich hodowlę w bulionie Luria zawierającym 100 gg/ml ampicyliny aż do uzyskania OD 0,3 - 0,5. Następnie dodano IPTG do stężania 2 mM i komórki hodowano do końcowej wartości OD 0,8 do 1,0. Następnis komórki poddano lizia i lizat analizowano jak wyżej opisano.
Wyniki znów wykazały zajście rozsczapienia, ponieważ na żalu nia uwidocznił się żaden produkt o pałnej długości /teoretyczna wartość Mr 73 kDa/. Pasma odpowiadająca partnerowi sprzęgania hSOD i skróconej proteazia HCV pojawiły się przy wartości masy cząsteczkowej około, odpowiednio, 34 i 45 kDa.
/C/ Komórki E. coli D1210 transformowano wektorami P300 i P190 i hodowlę prowadzono jak powyżej opisano.
Wyniki uzyskane z ekspresji P300 wykazały zajście rozszczepienia, ponieważ na żalu nis uwidocznił się żadan produkt o pełnaj długości /teoretyczna wartość Mr 51 kDa/. Pasmo odpowiadające partnerowi sprzęgania hSOD pojawiło się przy wartości względnej masy cząsteczkowej około 34. Odpowiednie pasmo proteazy HCV nie było widoczne, ponieważ ten region domany NS3 jest rozpoznawany przez surowica użyte do wykrycia produktów. Jednakże, pojawienie się pasma hSOD raczej przy 34 kDa a nie przy 51 kDa wskazuja na zajścia rozszczepienia.
Jedynie produkt ekspresji P190 pojawił się jako produkt o pełnej /zakodowanej/ długości, bez rozecjzapienid, tworząc pasmo przy około 40 kDa, co odpowiada teoretycznej wartości masy cząsteczkowej dla produktu nierozezczepionago. Może to wskazywać na to, że minimum sekwencji istotnej dla proteazy HCV rozciąga się w regionie między aminokwasami 199 i 299.
Przykład VI. Oczyszczanie proteazy po ekspresji przeprowadzonej w E. coli.
Proteazę HCV i fragmenty po aksprasji przaprowadzonej w Przykładzie V można oczyścić w sposób następujący.
Komórki bakteryjne, w których dokonano ekspresji polipeptydu poddano szokowi osomotycznsmu i dezintegracji mechanicznej, po czym frakcję nierozpuszczalną, zawierającą protsazę, wyodrębniono, poddano ekstrakcji rozdzialczej przy użyciu roztworu alkalicznego NaCl i polipeptyd zawarty w ekstrakcie poddano oczyszczaniu metodą chromatograficzną na kolumnach S-Sepharosa® i Q-Sapharose®.
Ekstrakt surowy, otrzymany w wyniku szoku oemotycznego i dezintegracji mechanicznej, przygotowuje się w ten sposób, że zawiesza się 1g zebranych komórek w 10 ml roztworu zawierającego 0,02M Tris HCl, pH 7,5, 10 mM EDTA i 20% sacharozy, po czym inkubuje się zawiesinę w ciągu 10 minut na lodzie. Następnie komórki osadza się za pomocą odwirowania przy 4000g w ciągu 15 minut w temperaturze 4°C. Po usunięciu supernatantu, osad komórek
169 273 ponownie zawiesza się w 10 ml buforu A1 /0,01 M Tris HCl, pH 7,5, 1 mM EDTA, 14 mMβ-merkaptoetanolu - β ME/ i inkubuje na lodzie w ciągu 10 minut. Komórki ponownie osadza się przy 4000 x g w ciągu 15 minut, w temperaturze 4°C. Po usunięciu klarownego supernatantu /frakcja periplazmatyczna I/, osad komórek ponownie zawiesza się w buforze A1, inkubuje na lodzie w ciągu 10 minut i znów odwirowuje przy 4000 x g, w ciągu 15 minut, w temperaturze 4°C. Usuwa się klarowny supernatant /frakcja periplazmatyczna II/ i osad komórek ponownie zawiesza w 5 ml buforu T2 /0,02 M Tris HCl, pH 7,5, 14 mM β Me, 1 mM EDTA, 1 mM PMSF/. W celu rozerwania komórek, w rurce Falcona umieszcza się 5 ml zawiesiny i 7,5 ml kulek ze szkła bezołowiowego Dyno-mill, przemytych kwasem, o średnicy 0,10 - 115 mm/ /dostępnych z firmy Glen-Mills, Inc./ i utrzymuje w zawirowaniu, przy najwyższej szybkości, w ciągu 2 minut, po czym oziębia w ciągu co najmniej 2 minut na lodzie. Tę operację zawirowania i oziębiania powtarza się jeszcze 4 razy. Po zawirowaniu, otrzymaną gęstą papkę sączy się przez lejek z filtrem ze spiekanego szkła, z niewielkim zasysaniem, po czym kulki szklane przemywa się dwukrotnie buforem A2 i łączy się przesącz z przemywkami.
Frakcję nierozpuszczalną ekstraktu surowego zbiera się za pomocą odwirowania przy 20000 x g w ciągu 15 minut, w temperaturze 4°C, przemywa dwukrotnie 10 ml buforu A2 i ponownie zawiesza w 5 ml wody MILLI-Q.
Frakcję zawierającą proteazę HCV wyodrębnia się z materiału nierozpuszczalnego za pomocą dodania do zawiesiny NaOH /2 M/ i NaCl /2 M/, w wyniku czego uzyskuje się dla każdego z nich stężenie końcowe 20 mM, po czym zawirowuje się w ciągu 1 minuty, odwirowuje przy 20000 xg w ciągu 20 minut, przy 4°C i zachowuje się supernatant.
Następnie częściowo oczyszczoną proteazę poddaje się oczyszczaniu za pomocą SDS-PAGE. Proteazę można zidentyfikować techniką Western blotting, apasmo wyciąć z żelu. Następnie proteazę eluuje się z pasma i analizuje w celu potwierdzenia sekwencji aminokwasów. Sekwencje N-końcowe można analizować przy użyciu automatycznego sekwenatora aminokwasów, podczas gdy sekwencje C-końcowe można analizować za pomocą zautomatyzowanego sekwencjonowania aminokwasów serii fragmentów trypsynowych.
Przykład VII. Otrzymywanie wektora ekspresyjnego drożdży /A/ P650 /Sprzężenie SOD/proteaza/.
Wektor ten zawiera sekwencję HCV, która obejmuje sekwencję kodującą proteazę HCV typu dzikiego o pełnej długości, sprzężoną przy końcu 5' z sekwencją kodującą SOD. Do rekonstrukcji sekwencji kodującej proteazę HCV typu dzikiego o pełnej długości użyto dwóch fragmentów, a mianowicie fragmentu EcoRI/BgIII o 441 parach zasad z klonu 11 b oraz fragmentu BgIII/EcoRI o 1471 parach zasad z wektora ekspresyjnego P500. Oba te fragmenty ligowano razem z wektorem pS356 poddanym trawieniu przy udziale EcoRI, w wyniku czego otrzymano kasetę ekspresyjną. Kaseta ekspresyjna koduje hybrydowy drożdżowy promotor ADH2/GAPDH, ludzką SOD, proteazę HCV i terminator transkrypcji GAPDH. Otrzymany wektor poddano trawieniu z udziałem BamHI i wyodrębniono fragment o 4052 parach zasad. Fragment ten ligowano do wektora pAB24 poddanego trawieniu z udziałem BamHI, w wyniku czego otrzymano p650. p650 doprowadza do ekspresji poliproteiny zawierającej, licząc od jej końca aminowego, aminokwasy 1-154 z hSOD, oligopeptyd -Asn-Leu-Gly-Ile-Arg- oraz aminokwasy 819 do 1458 z HCV-1, jak to przedstawiono na figurze 17 w WO90/11089, opublikowanym 4 października 1990.
Klon 11b wyizolowano z genomowej biblioteki cDNA HCV, nr rejestracyjny ATCC 40394, jak to opisano powyżej w Przykładzie 3A, przy użyciu sondy hybrydyzacji o następującej sekwencji:
5' CAC CTA TGT TTA TAA CCA TCT CAC TCC TCT 3'
Ten sposób postępowania opisany jest także w zgłoszeniu patentowym EPO Pub. nr 318216, Przykład IV. A. 17.
Wektor pS3EF, stanowiący pochodną pBR322 zawiera hybrydowy drożdżowy promotor ADH2/GAPDH w górę od genu ludzkiej dysmutazy ponadtlenkowej, adaptor, oraz w dół drożdżowy skuteczny terminator transkrypcji. Podobny wektor ekspresyjny zawierający te elementy regulujące i gen dysmutazy ponadtlenkowej opisali Cousens i in. Gene, 61265 /1987/. Opisany jest także w równocześnie rozpatrywanym zgłoszeniu patentowym EPO 196056,
169 273 opublikowanym 1 października 1986. Jednakże pS3EF różni się od wektora opisanego przez Cousensa i in. tym, że brak tu heterologicznego genu proinsuliny i fragmentu stykowego immunoglobuliny, a po Gln 154 z SOD następuje sekwencja adapterowa,. która zawiera miejsce ECoRI. Sekwencja adaptora jest następująca:
5' AAT TTG GGA ATT CCA TAA TTA ATT AAG 3'
3' AC CCT TTA GGT ATT AAT TAA TTC AGCT 5'
Miejsce EcoRI ułatwia insercję sekwencji heterologicznych. Po wprowadzeniu do pS3EF, dochodzi do ekspresji sprzężenia SOD, z zawartością oligopeptydu, który wiąże SOD z sekwencjami heterologicznymi. pS3EFjest dokładnie taki sam jak pS356, z tą różnicą, że pS356 zawiera odmienny adapter. Sekwencję adaptora przedstawiono poniżej:
5' AAT TTG GGA ATT CCA TAA TGA G 3'
3' AC CCT TAA GGT ATT ACT CAG CT 5'· pS356, nr rejestracyjny ATCC 67683, został zdeponowany jak to poniżej przedstawiono.
Plazmid pAB24 jest drożdżowym wektorem wahadłowym, który zawiera sekwencje pBR322, kompletną 2 μ sekwencję dla replikacji DNA w drożdżach [Broach w: Molecular Biology of the Yeast Saccharomyces, tom 1, str. 445, Cold Spring Harbor Press /1981/] oraz drożdżowy gen LEU2d pochodzący z plazmidu pC1/1, opisany w EPO Pub. nr 116201. Plazmid pAB24 skonstruowano za pomocą trawienia YEp24 z udziałem EcoRI i religowania wektora w celu usunięcia częściowych 2 μ sekwencji. Otrzymany plazmid, YEp24 ARI, przeprowadzono w postać liniową przy użyciu ClaI i ligowano z kompletnym 2 μ plazmidem, który przeprowadzono w postać liniową przy użyciu ClaI. Następnie otrzymany plazmid, pCBou, poddano trawieniu z udziałem XbaI, po czym wyizolowano na żelu fragment wektora o 8605 parach zasad. Ten wyizolowany fragment XbaI ligowano z fragmentem XbaI o 4460 parach zasad, zawierającym gen LEU2d wyizolowany z pC1/1. Orientacja genu LEU2d jest w tym samym kierunku, co orientacja genu URA3.
S.cerevisiae, 2150-2-3 /pAB24-GAP-env2/, nr rejestracyjny 20827, jest zdeponowany w American Type Culture Collection, jak to poniżej przedstawiono. Plazmid pAB24-GAP-env2 można wyodrębnić z komórek drożdży znanymi metodami. Kasetę ekspresyyną GAP-env2 można wyodrębnić za pomocą trawienia pAB24-GAP-env2 z udziałem BamHI. pAB24 odzyskuje się za pomocą rebgowania wektora bez insertu BamHI.
Przykład VIII. Ekspresja białka sprzężonego SOD-proteaza w drożdżach p650 transformowano w S. cerevisiae szczep JSC310, Mata, leu2, ura3-52, prb1-1122, pep4-3, prcl-407, cir°: DM 15 /oporność g418/. Transformację prowadzono sposobem opisanym przez Hinnena i in. [Proc. Natl. Acad. Sci. USA, 75, 1929 /1978/]. Transformowane komórki selekcjonowano na płytkach ura z 8% glukozą. Płytki inkubowano w temperaturze 30°C w ciągu 4-5 dni. Transformanty dalej seeekcjonowano na płytkach leu z 8% glukozą z domniemywaniem wysokich numerów plazmidu p650. Kolonie z płytek leu inokulowano do podłoża leu z 3% glukozą. Hodowle te wytrząsano w temperaturze 30°C w ciągu 2 dni, po czym rozcieńczano 1/20 do podłoża YEPD z 2% glukozą i dalej wytrząsano w ciągu 2 dni w temperaturze 30°C.
S. cereYicn^e JSC310 zawiera DNA DM15 opisany w zgyoszzniu penen tpwym EPO pub. nr 340986, opublikowanym 8 października 1989. Ten DNA DM15 wzmaga kontrolowaną przez ADH2 ekspresję białek heterologicznych. pDM15, nr rejestracyjny 40453, jest zdeponowany w American Type Culture Cyllectiyn, jak to poniżej przedstawiono.
Przykład IX. Ubikuitynowa ekspresja dojrzałej proteazy HCV w drożdżach
Dojrzałą proteazę HCV wytwarza się za pomocą rozszczepienia wektora C7fC2C)j300C20e przy użyciu EcoRI, w wyniku czego otrzymuje się sekwencję kodującą o 2 kiloparach zasad, i wprowadzenia sekwencji z odpowiednimi łącznikami do wektora ekspresyjnego ubikuityny, tak jak to opisano w WO88/02406, opublikowanym 7 kwietnia 1988, albo w zgłoszeniu patentowym
169 273
Stanów Zjednoczonych Ameryki nr 7/390599, zgłoszonym 7 sierpnia 1989, które włączone są do niniejszego opisu jako odnośniki. Dojrzałą proteazę HCV odzyskuje się po ekspresji wektora w stosowanych gospodarzach, zwłaszcza w drożdżach. W szczególności, do przeprowadzenia ekspresji wektora ubikuityna/proteaza HCV posłużono się protokołem ekspresji w drożdżach opisanym w Przykładzie VIII.
Przykład X. Otrzymywanie wektora in vitro ekspresji /A/ Wektor pGEM ®-3Z/Zżder żółtej· gorączki **
Cztery fragmenty syntetycznego DNA połączono i ligowano razem w celu utworzenia EcoRI/SacI lider żółtej gorączki, który ligowano do trawionego z udziałem EcoRI/SacI wektora pGEM® -3Z z firmy Promega®. Sekwencje tych czterech fragmentów podane są poniżej:
YFK-1 :
5' AAT TCG TAA ATC CTG TGT GCT AAT TGA GGT GCA TTG GTC TGC AAA TCG AGT TGC TAG GCA ATA AAC ACA TT 3'
YFK-2 :
| 5' TAT TGC CTA | GCA ACT | CGA | TTT | GCA | GAC | CAA | TGC | ACC | TCA | ATT |
| AGC ACA CAG GAT | 1 TTA CG | 3' | ||||||||
| YFK-3 : | ||||||||||
| 5' TGG ATT AAT | TTT AAT | CGT | TCG | TTG | AGC | GAT | TAG | CAG | AGA | |
| ACT GAC CAG AAC | ATG TCT | 1 GAG | CT | 3' | ||||||
| YFK-4 s | ||||||||||
| 5' CAG ACA TGT | TCT GGT | CAG | TTC | TCT | GCT | AAT | CGC | TCA | ACG | AAC |
| GAT TAA AAT TAA | TCC AAA | TGT | GTT 3 |
W celu in vitro translacji proteazy HCV, nowy wektor pGEM® - 3Z/liderżółtej oorązzki trawiono z udziałem BamHI i stępiono przy użyciu fragmentu Klenowa.
/B/ Konstrukcja Pvn// z p6'000
Skonstruowano klon p600 z sekwencji dostępnych z genomowej bibliotdZ/ wykonanej na cDNA HCV, nr rejestracyjny ATCC 40394. Sekwncja DNA kodująca hCv z p6000jest identyczna z sekwencją nukleotyd -275 - ηι©1(^ν6 7372 z figyry 17 w WO90/11089, opublikowanym 4 października 1990. p6000 trawiono z udziałem pvuII i z produktu trawienia wyodrębniono fragment o 2864 parach zasad. Ten fragment o 2864 parach zasad ligowano do powyżej opisanego fragmentu wektora pGEM® -3Z/lider żółtej gorączki, otrzymanego poprzednio.
Przykład XI. In vitro ekspresja proteazy HCV.
/A/ Transkrypcja. Wektor pGEM -©lider żółtej gorączki/ PvuII przeprowadzono w postać liniową przy użyciu Xbal i transkrybowano z wykorzystaniem materiałów i protokołów z układu Riboprobe® Gemini II Core firmy Promega.
/B/ Translacja. RNA wytworzony według powyższego protokołu poddano translacji z użyciem lizatu retykulocytów króliczych z firmy Promega, bez metioniny, membran m/Zgosomalnych z psiej trzustki, jak równier z wykorzystaniem innych potrzebnych materiałów i instrukcji z firmy Progema.
Zdeponowane materiały biologiczne. Następujące materiały zdeponowano w American Type Culture Collection /ATCC/, 12301 Parklawn Dr., Rojkville, Maryland.
| Nazwa | Data zdeponowania | Nr rejestracyjny |
| E. coli D1210, cf1SODp600 | 23 marca 1990 | 68275 |
| Cf1/5-1-1 w E. coli D1210 | 1 1 maj7 1987 | 67967 |
| Biblioteka wykonana na cDNA bakteriofaga λ-gt 11 | 1 grudmi 1987 | |
| E. coli HB101, pS356 | 29 kwłe-nJa 1988 | |
| Plazmidowy DNA, pDM 15 | 5 maja 1988 | 40443 |
| S. cdrdvlslad, 2150-2^23 /pAB24-GAP-env2/ | 23 grudnia 1986 | 20827 |
169 273
Powyższe materiały zostały zdeponowane w ATCC pod wskazanymi numerami rejestracyjnymi. Depozyty te przechowywane są zgodnie z warunkami Układu Budapesztańskiego /International Recognition of The Depossit of Microorganitms for purposes of Patent Procedure/. Depozyty te są dostarczane, jako udogodnienie, fachowcom w tej dziedzinie techniki i nie uważa się, aby depozyt podlegał postanowieniom 35 U. S. C. § 11. Sekwencje polinukleotydów zawarte w zdeponowanych materiałach, jak również sekwencja aminokwasów polipeptydów zakodowana w ten sposób, są włączone do niniejszego opisu jako odnośniki i stanowią sekwencje kontrolne w przypadku konfliktu z sekewencjami opisanymi w niniejszym opisie. Na wytwarzanie, stosowanie i sprzedaż zdeponowanych materiałów może być wymagana licencja i niniejszym dokumentem nie udziela się żadnej tego rodzaju licencjii.
169 273
169 273
| 1 Gly | Thr | Tyr | Val | 5 Tyr | Asn | ||
| ATT | CGG | GGC | ACC | TAT | GTT | TAT | AAC |
| TAA | GCC | CCG | TGG | ATA | CAA | ATA | TTG |
| His | Leu | Thr | 10 Pro | Leu | Arg | Asp | Trp |
| CAT | CTC | ACT | CCT | CTT | CGG | GAC | TGG |
| GTA | GAG | TGA | GGA | GAA | GCC | CTG | ACC |
| 15 | 20 | ||||||
| Ala | His | Asn | Gly | Leu | Arg | Asp | Leu |
| GCG | CAC | AAC | GGC | TTG | CGA | GAT | CTG |
| CGC | GTG | TTG | CCG | AAC | GCT | CTA | GAC |
| 25 | 30 | ||||||
| Ala | Val | Ala | Val | Glu | Pro | Val | Val |
| GCC | GTG | GCT | GTA | GAG | CCA | GTC | GTC |
| CGG | CAC | CGA | CAT | CTC | GGT | CAG | CAG |
| Phe | Ser | Gln | Met | 35 Glu | Thr | Lys | Leu |
| TTC | TCC | CAA | ATG | GAG | ACC | AAG | CTC |
| AAG | AGG | GTT | TAC | CTC | TGG | TTC | GAG |
| 40 | 45 | ||||||
| Ile | Thr | Trp | Gly | Ala | Asp | Thr | Ala |
| ATC | ACG | TGG | GGG | GCA | GAT | ACC | GCC |
| TAG | TGC | ACC | CCC | CGT | CTA | TGG | CGG |
| Ala | Cys | Gly | 50 Asp | Ile | Ile | Asn | Gly |
| GCG | TGC | GGT | GAC | ATC | ATC | AAC | GGC |
| CGC | ACG | CCA | CTG | TAG | TAG | TTG | CCG |
| 55 | 60 | ||||||
| Leu | Pro | Val | Ser | Ala | Arg | Arg | Gly |
| TTG | CCT | GTT | TCC | GCC | CGC | AGG | GGC |
| AAC | GGA | CAA | AGG | CGG | GCG | TCC | CCG |
| 65 | 70 | ||||||
| Arg | Glu | Ile | Leu | Leu | Gly | Pro | Ala |
| CGG | GAG | ATA | CTG | CTC | GGG | CCA | GCC |
| GCC | CTC | TAT | GAC | GAG | CCC | GGT | CGG |
| Asp | Gly | Met | Val | 75 Ser | Lys | Gly | Trp |
| GAT | GGA | ATG | GTC | TCC | AAG | GGT | TGG |
| CTA | CCT | TAC | CAG | AGG | TTC | CCA | ACC |
| 80 | 85 | ||||||
| Arg | Leu | Leu | Ala | Pro | Ile | Thr | Ala |
| AGG | TTG | CTG | GCG | CCC | ATC | ACG | GCG |
| TCC | AAC | GAC | CGC | GGG | TAG | TGC | CGC |
| Tyr | Ala | Gln | 90 Gln | Thr | Arg | Gly | Leu |
| TAC | GCC | CAG | CAG | ACA | AGG | GGC | CTC |
| ATG | CGG | GTC | GTC | TGT | TCC | CCG | GAG |
| 95 | 100 | ||||||
| Leu | Gly | Cys | Ile | Ile | Thr | Ser | Leu |
| CTA | GGG | TGC | ATA | ATC | ACC | AGC | CTA |
| GAT | CCC | ACG | TAT | TAG | TGG | TCG | GAT |
| 105 | 110 | ||||||
| Thr | Gly | Arg | Asp | Lys | Asn | Gln | Val |
| ACT | GGC | CGG | GAC | AAA | AAC | CAA | GTG |
| TGA | CCG | GCC | CTG | TTT | TTG | GTT | CAC |
| Glu | Gly | Glu | Val | 115 Gln | Ile | Val | Ser |
| GAG | GGT | GAG | GTC | CAG | ATT | GTG | TCA |
| CTC | CCA | CTC | CAG | GTC | TAA | CAC | AGT |
| 120 | 125 | ||||||
| Thr | Ala | Ala | Gln | Thr | Phe | Leu | Ala |
| ACT | GCT | GCC | CAA | ACC | TTC | CTG | GCA |
| TGA | CGA | CGG | GTT | TGG | AAG | GAC | CGT |
Fig
169 273
| 130 | 135 | 140 | |||||||||||||
| Thr | Cys | Ile | Ile | Asn | Gly | Val | Cys | Trp | Thr | Val | Tyr | His | Gly | Ala | Gly |
| ACG | TGC | ATC | ATC | AAT | GGG | GTG | TGC | TGG | ACT | GTC | TAC | CAC | GGG | GCC | GGA |
| TGC | ACG | TAG | TAG | TTA | CCC | CAC | ACG | ACC | TGA | CAG | ATG | GTG | CCC | CGG | CCT |
| 145 | 150 | 155 | |||||||||||||
| Thr | Arg | Thr | Ile | Ala | Ser | Pro | Lys | Gly | Pro | Val | Ile | Gln | Met | Tyr | Thr |
| ACG | AGG | ACC | ATC | GCG | TCA | CCC | AAG | GGT | CCT | GTC | ATC | CAG | ATG | TAT | ACC |
| TGC | TCC | TGG | TAG | CGC | AGT | GGG | TTC | CCA | GGA | CAG | TAG | GTC | TAC | ATA | TGG |
| 160 | 165 | 170 | |||||||||||||
| Asn | Val | Asp | Gln | Asp | Leu | Val | Gly | Trp | Pro | Ala | Ser | Gln | Gly | Thr | Arg |
| AAT | GTA | GAC | CAA | GAC | CTT | GTG | GGC | TGG | CCC | GCT | TCG | CAA | GGT | ACC | CGC |
| TTA | CAT | CTG | GTT | CTG | GAA | CAC | CCG | ACC | GGG | CGA | AGC | GTT | CCA | TGG | GCG |
| 175 | 180 | 185 | 190 | ||||||||||||
| Ser | Leu | Thr | Pro | Cys | Thr | Cys | Gly | Ser | Ser | Asp | Leu | Tyr | Leu | Val | Thr |
| TCA | TTG | ACA | CCC | TGC | ACT | TGC | GGC | TCC | TCG | GAC | CTT | TAC | CTG | GTC | ACG |
| AGT | AAC | TGT | GGG | ACG | TGA | ACG | CCG | AGG | AGC | CTG | GAA | ATG | GAC | CAG | TGC |
| 195 | 200 | 205 | |||||||||||||
| Arg | His | Ala | Asp | Val | Ile | Pro | Val | Arg | Arg | Arg | Gly | Asp | Ser | Arg | Gly |
| AGG | CAC | GCC | GAT | GTC | ATT | CCC | GTG | CGC | CGG | CGG | GGT | GAT | AGC | AGG | GGC |
| TCC | GTG | CGG | CTA | CAG | TAA | GGG | CAC | GCG | GCC | GCC | CCA | CTA | TCG | TCC | CCG |
ΐ
Nael
| 210 | 215 | 220 | |||||||||||||
| Ser | Leu | Leu | Ser | Pro | Arg | Pro | Ile | Ser | Tyr | Leu | Lys | Gly | Ser | Ser | Gly |
| AGC | CTG | CTG | TCG | CCC | CGG | CCC | ATT | TCC | TAC | TTG | AAA | GGC | TCC | TCG | GGG |
| TCG | GAC | GAC | AGC | GGG | GCC | GGG | TAA | AGG | ATG | AAC | TTT | CCG | AGG | AGC | CCC |
| 225 | 230 | 235 | |||||||||||||
| Gly | Pro | Leu | Leu | Cys | Pro | Ala | Gly | His | Ala | Val | Gly | Ile | Phe | Arg | Ala |
| GGT | CCG | CTG | TTG | TGC | CCC | GCG | GGG | CAC | GCC | GTG | GGC | ATA | TTT | AGG | GCC |
| CCA | GGC | GAC | AAC | ACG | GGG | CGC | CCC | GTG | CGG | CAC | CCG | TAT | AAA | TCC | CGG |
| 240 | 245 | 250 | |||||||||||||
| Ala | Val | Cys | Thr | Arg | Gly | Val | Ala | Lys | Ala | Val | Asp | Phe | Ile | Pro | Val |
| GCG | GTG | TGC | ACC | CGT | GGA | GTG | GCT | AAG | GCG | GTG | GAC | TTT | ATC | CCT | GTG |
| CGC | CAC | ACG | TGG | GCA | CCT | CAC | CGA | TTC | CGC | CAC | CTG | AAA | TAG | GGA | CAC |
Fig (cigg dalszy)
169 273
255
Glu Asn GAG AAC CTC TTG
Leu Glu CTA GAG GAT CTC
260 Thr Thr ACA ACC TGT TGG
Met Arg ATG AGG TAC TCC
Ser Pro TCC CCG AGG GGC
265
Val Phe GTG TTC CAC AAG
Thr Asp ACG GAT TGC CTA
270 Asn Ser AAC TCC TTG AGG
Ser Pro TCT CCA AGA GGT
Pro Val CCA GTA GGT CAT
275
Val Pro GTG CCC CAC GGG
Gin Ser CAG AGC GTC TCG
280 Phe Gin TTC CAG AAG GTC
Val Ala GTG GCT CAC CGA
His Leu CAC CTC GTG GAG
285
His Ala CAT GCT GTA CGA
Pro Thr CCC ACA GGG TGT
290 Gly Ser GGC AGC CCG TCG
Gly Lys GGC AAA CCG TTT
Ser Thr AGC ACC TCG TGG
295
Lys Val AAG GTC TTC CAG
Pro Ala CCG GCT GGC CGA
Gin Gly CAG GGC GTC CCG i
305
Tyr Lys TAT AAG ATA TTC
Val Leu GTG CTA CAC GAT
310 Val Leu GTA CTC CAT GAG
Asn Pro AAC CCC TTG GGG
Ser Val TCT GTT AGA CAA
300 Ala Tyr GCA TAT CGT ATA i
Ndel
315
Ala Ala GCT GCA CGA CGT
Ala Ala GCA GCT CGT CGA
Thr Leu ACA CTG TGT GAC
320 Gly Phe GGC TTT CCG AAA
Gly Ala GGT GCT CCA CGA
Tyr Met TAC ATG ATG TAC
325
Ser Lys TCC AAG AGG TTC
Ala His GCT CAT CGA GTA
330 Gly Ile GGG ATC CCC TAG
Asp Pro GAT CCT CTA GGA
Asn Ile AAC ATC TTG TAG
335
Arg Thr AGG ACC TCC TGG
Gly Val GGG GTG CCC CAC
340 Arg Thr AGA ACA TCT TGT
Ile Thr ATT ACC TAA TGG
Thr Gly ACT GGC TGA CCG
345
Ser Pro AGC CCC TCG GGG
Ile Thr ATC ACG TAG TGC
350 Tyr Ser TAC TCC ATG AGG
Thr Tyr ACC TAC TGG ATG
Gly Lys GGC AAG CCG TTC
355
Phe Leu TTC CTT AAG GAA
Ala Asp GCC GAC CGG CTG
360 Gly Gly GGC GGG CCG CCC
Cys Ser TGC TCG ACG AGC
Gly Gly GGG GGC CCC CCG
365
Ala Tyr GCT TAT CGA ATA
Asp Ile GAC ATA CTG TAT
370 Ile Ile ATA ATT TAT TAA
Cys Asp TGT GAC ACA CTG
Glu Cys GAG TGC CTC ACG
375
His Ser CAC TCC GTG AGG
Thr Asp ACG GAT TGC CTA
380 Ala Thr GCC ACA CGG TGT
Ser Ile TCC ATC AGG TAG
Fig (ciąg dalszy)
169 273
| 385 | 390 | 395 | |||||||||||||
| Leu | Gly | Ile | Gly | Thr | Val | Leu | Asp | Gln | Ala | Glu | Thr | Ala | Gly | Ala | Arg |
| TTG | GGC | ATT | GGC | ACT | GTC | CTT | GAC | CAA | GCA | GAG | ACT | GCG | GGG | GCG | AGA |
| AAC | CCG | TAA | CCG | TGA | CAG | GAA | CTG | GTT | CGT | CTC | TGA | CGC | CCC | CGC | TCT |
| 400 | 405 | 410 | |||||||||||||
| Leu | Val | Val | Leu | Ala | Thr | Ala | Thr | Pro | Pro | Gly | Ser | Val | Thr | Val | Pro |
| CTG | GTT | GTG | CTC | GCC | ACC | GCC | ACC | CCT | CCG | GGC | TCC | GTC | ACT | GTG | CCC |
| GAC | CAA | CAC | GAG | CGG | TGG | CGG | TGG | GGA | GGC | CCG | AGG | CAG | TGA | CAC | GGG |
| 415 | 420 | 425 | 430 | ||||||||||||
| His | Pro | Asn | Ile | Glu | Glu | Val | Ala | Leu | Ser | Thr | Thr | Gly | Glu | Ile | Pro |
| CAT | CCC | AAC | ATC | GAG | GAG | GTT | GCT | CTG | TCC | ACC | ACC | GGA | GAG | ATC | CCT |
| GTA | GGG | TTG | TAG | CTC | CTC | CAA | CGA | GAC | AGG | TGG | TGG | CCT | CTC | TAG | GGA |
| 435 | 440 | 445 | |||||||||||||
| Phe | Tyr | Gly | Lys | Ala | Ile | Pro | Leu | Glu | Val | Ile | Lys | Gly | Gly | Arg | His |
| TTT | TAC | GGC | AAG | GCT | ATC | CCC | CTC | GAA | GTA | ATC | AAG | GGG | GGG | AGA | CAT |
| AAA | ATG | CCG | TTC | CGA | TAG | GGG | GAG | CTT | CAT | TAG | TTC | CCC | CCC | TCT | GTA |
| 450 | 455 | 460 | |||||||||||||
| Leu | Ile | Phe | Cys | His | Ser | Lys | Lys | Lys | Cys | Asp | Glu | Leu | Ala | Ala | Lys |
| CTC | ATC | TTC | TGT | CAT | TCA | AAG | AAG | AAG | TGC | GAC | GAA | CTC | GCC | GCA | AAG |
| GAG | TAG | AAG | ACA | GTA | AGT | TTC | TTC | TTC | ACG | CTG | CTT | GAG | CGG | CGT | TTC |
| 465 | 470 | 475 | |||||||||||||
| Leu | Val | Ala | Leu | Gly | Ile | Asn | Ala | Val | Ala | Tyr | Tyr | Arg | Gly | Leu | Asp |
| CTG | GTC | GCA | TTG | GGC | ATC | AAT | GCC | GTG | GCC | TAC | TAC | CGC | GGT | CTT | GAC |
| GAC | CAG | CGT | AAC | CCG | TAG | TTA | CGG | CAC | CGG | ATG | ATG | GCG | CCA | GAA | CTG |
| 480 | 485 | 490 | |||||||||||||
| Val | Ser | Val | Ile | Pro | Thr | Ser | Gly | Asp | Val | Val | Val | Val | Ala | Thr | Asp |
| GTG | TCC | GTC | ATC | CCG | ACC | AGC | GGC | GAT | GTT | GTC | GTC | GTG | GCA | ACC | GAT |
| CAC | AGG | CAG | TAG | GGC | TGG | TCG | CCG | CTA | CAA | CAG | CAG | CAC | CGT | TGG | CTA |
Fig. 1 (ciąg dalszy)
169 273
| 495 | 500 | ||||||
| Ala | Leu | Met | Thr | Gly | Tyr | Thr | Gly |
| GCC | CTC | ATG | ACC | GGC | TAT | ACC | GGC |
| CGG | GAG | TAC | TGG | CCG | ATA | TGG | CCG |
| 505 | 510 | ||||||
| Asp | Phe | Asp | Ser | Val | Ile | Asp | Cys |
| GAC | TTC | GAC | TCG | GTG | ATA | GAC | TGC |
| CTG | AAG | CTG | AGC | CAC | TAT | CTG | ACG |
| Asn | Thr | Cys | Val | 515 Thr | Gin | Thr | Val |
| AAT | ACG | TGT | GTC | ACC | CAG | ACA | GTC |
| TTA | TGC | ACA | CAG | TGG | GTC | TGT | CAG |
| 520 | 525 | ||||||
| Asp | Phe | Ser | Leu | Asp | Pro | Thr | Phe |
| GAT | TTC | AGC | CTT | GAC | CCT | ACC | TTC |
| CTA | AAG | TCG | GAA | CTG | GGA | TGG | AAG |
| Thr | Ile | Glu | 530 Thr | Ile | Thr | Leu | Pro |
| ACC | ATT | GAG | ACA | ATC | ACG | CTC | CCC |
| TGG | TAA | CTC | TGT | TAG | TGC | GAG | GGG |
| 535 | 540 | ||||||
| Gin | Asp | Ala | Val | Ser | Arg | Thr | Gin |
| CAA | GAT | GCT | GTC | TCC | CGC | ACT | CAA |
| GTT | CTA | CGA | CAG | AGG | GCG | TGA | GTT |
| 545 | 550 | ||||||
| Arg | Arg | Gly | Arg | Thr | Gly | Arg | Gly |
| CGT | CGG | GGC | AGG | ACT | GGC | AGG | GGG |
| GCA | GCC | CCG | TCC | TGA | CCG | TCC | CCC |
| Lys | Pro | Gly | Ile | 555 Tyr | Arg | Phe | Val |
| AAG | CCA | GGC | ATC | TAC | AGA | TTT | GTG |
| TTC | GGT | CCG | TAG | ATG | TCT | AAA | CAC |
| 560 | 565 | ||||||
| Ala | Pro | Gly | Glu | Arg | Pro | Pro | Gly |
| GCA | CCG | GGG | GAG | CGC | CCT | CCC | GGC |
| CGT | GGC | CCC | CTC | GCG | GGA | GGG | CCG |
| Met | Phe | Asp | 570 Ser | Ser | Val | Leu | Cys |
| ATG | TTC | GAC | TCG | TCC | GTC | CTC | TGT |
| TAC | AAG | CTG | AGC | AGG | CAG | GAG | ACA |
| 575 | 580 | ||||||
| Glu | Cys | Tyr | Asp | Ala | Gly | Cys | Ala |
| GAG | TGC | TAT | GAC | GCA | GGC | TGT | GCT |
| CTC | ACG | ATA | CTG | CGT | CCG | ACA | CGA |
| 535 | 590 | ||||||
| Trp | Tyr | Glu | Leu | Thr | Pro | Ala | Glu |
| TGG | TAT | GAG | CTC | ACG | CCC | GCC | GAG |
| ACC | ATA | CTC | GAG | TGC | GGG | CGG | CTC |
| Thr | Thr | Val | Arg | 595 Leu | Arg | Ala | Tyr |
| ACT | ACA | GTT | AGG | CTA | CGA | GCG | TAC |
| TGA | TGT | CAA | TCC | GAT | GCT | CGC | ATG |
| 600 | 605 | ||||||
| Met | Asn | Thr | Pro | Gly | Leu | Pro | Val |
| ATG | AAC | ACC | CCG | GGG | CTT | CCC | GTG |
| TAC | TTG | TGG | GGC | CCC | GAA | GGG | CAC |
Fig.- 1 (ciąg dalszy)
169 273
| Cys | Gin | Asp | 610 His | Leu | Glu | Phe | Trp |
| TGC | CAG | GAC | CAT | CTT | GAA | TTT | TGG |
| ACG | GTC | CTG | GTA | GAA | CTT | AAA | ACC |
| 615 | 620 | ||||||
| Glu | Gly | Val | Phe | Thr | Gly | Leu | Thr |
| GAG | GGC | GTC | TTT | ACA | GGC | CTC | ACT |
| CTC | CCG | CAG | AAA | TGT | CCG | GAG | TGA |
| 625 | 630 | ||||||
| His | Ile | Asp | Ala | His | Phe | Leu | Ser |
| CAT | ATA | GAT | GCC | CAC | TTT | CTA | TCC |
| GTA | TAT | CTA | CGG | GTG | AAA | GAT | AGG |
| Gin | Thr | Lys | Gin | 635 Ser | Gly | Glu | Asn |
| CAG | ACA | AAG | CAG | AGT | GGG | GAG | AAC |
| GTC | TGT | TTC | GTC | TCA | CCC | CTC | TTG |
| 640 | 645 | ||||||
| Leu | Pro | Tyr | Leu | Val | Ala | Tyr | Gin |
| CTT | CCT | TAC | CTG | GTA | GCG | TAC | CAA |
| GAA | GGA | ATG | GAC | CAT | CGC | ATG | GTT |
| Ala | Thr | Val | 650 Cys | Ala | Arg | Ala | Gin |
| GCC | ACC | GTC | TGC | GCT | AGG | GCT | CAA |
| CGG | TGG | CAC | ACG | CGA | TCC | CGA | GTT |
| 655 | 660 | ||||||
| Ala | Pro | Pro | Pro | Ser | Trp | Asp | Gin |
| GCC | CCT | CCC | CCA | TCG | TGG | GAC | CAG |
| CGG | GGA | GGG | GGT | AGC | ACC | CTG | GTC |
| 665 | 670 | ||||||
| Met | Trp | Lys | Cys | Leu | Ile | Arg | Leu |
| ATG | TGG | AAG | TGT | TTG | ATT | CGC | CTC |
| TAC | ACC | TTC | ACA | AAC | TAA | GCG | GAG |
| Lys | Pro | Thr | Leu | 675 His | Gly | Pro | Thr |
| AAG | CCC | ACC | CTC | CAT | GGG | CCA | ACA |
| TTC | GGG | TGG | GAG | GTA | CCC | GGT | TGT |
| 680 | 685 | ||||||
| Pro | Leu | Leu | Tyr | Arg | Leu | Gly | Ala |
| CCC | CTG | CTA | TAC | AGA | CTG | GGC | GCT |
| GGG | GAC | GAT | ATG | TCT | GAC | CCG | CGA |
(ciąg dalszy)
169 273
| C20c: | ||||
| Asn | Ser | Glu | Asn | Gln |
| AAT | TCG | GAA | AAC | CAA |
| TTA | AGC | CTT | TTG | GTT |
Val Glu Gly Glu Val Gln GTG GAG GGT GAG GTC CAG CAC CTC CCA CTC CAG GTC
EcoRI
| Ala | Gln | Thr | Phe | Leu |
| GCC | CAA | ACC | TTC | CTG |
| CGG | GTT | TGG | AAG | GAC |
| Tyr | His | Gly | Ala | Gly |
| TAC | CAC | GGG | GCC | GGA |
| ATG | GTG | CCC | CGG | CCT |
| Ile | Gln | Met | Tyr | Thr |
| ATC | CAG | ATG | TAT | ACC |
| TAG | GTC | TAC | ATA | TGG |
| Ser | Gln | Gly | Thr | Arg |
| TCG | CAA | GGT | ACC | CGC |
| AGC | GTT | CCA | TGG | GCG |
| Leu | Tyr | Leu | Val | Thr |
| CTT | TAC | CTG | GTC | ACG |
| GAA | ATG | GAC | CAG | TGC |
| Gly | Asp | Ser | Arg | Gly |
| GGT | GAT | AGC | AGG | GGC |
| CCA | CTA | TCG | TCC | CCG |
| Lys | Gly | Ser | Ser | Gly |
| AAA | GGC | TCC | TCG | GGG |
| TTT | CCG | AGG | AGC | CCC |
| Ala | Thr | Cys | Ile | Asn | Gly |
| GCA | ACG | TGC | ATC | AAT | GGG |
| CGT | TGC | ACG | TAG | TTA | CCC |
T
SfaNI
| Thr | Arg | Thr | Ile | Ala | Ser |
| ACG | AGG | ACC | ATC | GCG | TCA |
| TGC | TCC | TGG | TAG | CGC | AGT |
| Asn | Val | Asp | Gln | Asp | Leu |
| AAT | GTA | GAC | CAA | GAC | CTT |
| TTA | CAT | CTG | GTT | CTG | GAA |
| Ser | Leu | Thr | Pro | Cys | Thr |
| TCA | TTG | ACA | CCC | TGC | ACT |
| AGT | AAC | TGT | GGG | ACG | TGA |
| Arg | His | Ala | Asp | Val | Ile |
| AGG | CAC | GCC | GAT | GTC | ATT |
| TCC | GTG | CGG | CTA | CAG | TAA |
| Ser | Leu | Val | Ser | Pro | Arg |
| AGC | CTC | GTG | TCG | CCC | CGG |
| TCG | GAG | CAC | AGC | GGG | GCC |
| Gly | Pro | Leu | Pro | Asn | |
| GGT | CCG | CTG | CCG | AAT | TC |
| CCA | GGC | GAC | GGC | TTA | AG |
T
EcoRI
NaeI
Pro Ile Ser Tyr Leu CCC ATT TCC TAC TTG GGG TAA AGG ATG AAC
| Ile | Val | Ser | Thr | Ala |
| ATT | GTG | TCA | ACT | GCT |
| TAA | CAC | AGT | TGA | CGA |
| Val | Cys | Trp | Thr | Val |
| GTG | TGC | TGG | ACT | GTC |
| CAC | ACG | ACC | TGA | CAG |
| Pro | Lys | Gly | Pro | Val |
| CCC | AAG | GGT | CCT | GTC |
| GGG | TTC | CCA | GGA | CAG |
| Val | Gly | Trp | Pro | Ala |
| GTG | GGC | TGG | CCC | GCT |
| CAC | CCG | ACC | GGG | CGA |
| Cys | Gly | Ser | Ser | Asp |
| TGC | GGC | TCC | TCG | GAC |
| ACG | CCG | AGG | AGC | CTG |
| Pro | Val | Arg | Arg | Arg |
| :cc | GTG | CGC | CGG | CGG |
| GGG | CAC | GCG | GCC | GCC |
Fig
169 273
C26d:
| Glu | Phe | Gly | Gly | Leu | Leu | Leu | Cys | Pro | Ala | Ala | Ala | Val | Gly | Ile | Phe |
| GAA | TTC | GGG | GGC | CTG | CTG | TTG | TGC | CCC | GCG | GCA | GCC | GTG | GGC | ATA | TTT |
| CTT | AAG | CCC | CCG | GAC | GAC | AAC | ACG | GGG | CGC | CGT | CGG | CAC | CCG | TAT | AAA |
ΐ
EcoRI
| Arg | Ala | Ala | Val | Cys | Thr | Arg | Gly | Val | Ala | Lys | Ala | Val | Asp | Phe | Ile |
| AGG | GCC | GCG | GTG | TGC | ACC | CGT | GGA | GTG | GCT | AAG | GCG | GTG | GAC | TTT | ATC |
| TCC | CGG | CGC | CAC | ACG | TGG | GCA | CCT | CAC | CGA | TTC | CGC | CAC | CTG | AAA | TAG |
DdeI
Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp CCT GTG GAG AAC CTA GAG ACA ACC ATG AGG TCC CCG GTG TTC ACG GAT GGA CAC CTC TTG GAT CTC TGT TGG TAC TCC AGG GGC CAC AAG TGC CTA
| Asn | Ser | Ser | Pro | Pro | Val | Val | Pro | Gln | Ser | Phe | Gln | Val | Ala | His | Leu |
| .AAC | TCC | TCT | CCA | CCA | GTA | GTG | CCC | CAG | AGC | TTC | CAG | GTG | GCT | CAC | CTC |
| TTG | AGG | AGA | GGT | GGT | CAT | CAC | GGG | GTC | TCG | AAG | GTC | CAC | CGA | GTG | GAG |
ί
EcoRII
His Ala Pro Arg Ile CAT GCT CCC CGA ATT C GTA CGA GGG GCT TAA G t
EcoRI
Fig
169 273
| C8h: | |||||||||||||||
| Pro | Cys | Thr | Cys | Gly | Ser | Ser | Asp | Leu | Tyr | Leu | Val | Thr | Arg | His | Ala |
| CCC | TGC | ACT | TGC | GGC | TCC | TCG | GAC | CTT | TAC | CTG | GTC | ACG | AGG | CAC | GCC |
| GGG | ACG | TGA | ACG | CCG | AGG | AGC | CTG | GAA | ATG | GAC | CAG | TGC | TCC | GTG | CGG |
| Asp | Val | Ile | Pro | Val | Arg | Arg | Arg | Gly | Asp | Ser | Arg | Gly | Ser | Leu | Leu |
| GAT | GTC | ATT | CCC | GTG | CGC | CGG | CGG | GGT | GAT | AGC | AGG | GGC | AGC | CTG | CTG |
| CTA | CAG | TAA | GGG | CAC | GCG | GCC | GCC | CCA | CTA | TCG | TCC | CCG | TCG | GAC | GAC |
| Ser | Pro | Arg | Pro | Ile | Ser | Tyr | Leu | Lys | 3ly | Ser | Ser | Gly | Gly | Pro | Leu |
| TCG | CCC | CGG | CCC | ATT | TCC | TAC | TTG | AAA | GGC | TCC | TCG | GGG | GGT | CCG | CTG |
| AGC | GGG | GCC | GGG | TAA | AGG | ATG | AAC | TTT | CCG | AGG | AGC | CCC | CCA | GGC | GAC |
| Leu | Cys | Pro | Ala | Gly | His | Ala | Val | Gly | Ile | Phe | Arg | Ala | Ala | Val | Cys |
| TTG | TGC | CCC | GCG | GGG | CAC | GCC | GTG | GGC | ATA | TTT | AGG | GCC | GCG | GTG | TGC |
| AAC | ACG | GGG | CGC | CCC | GTG | CGG | CAC | CCG | TAT | AAA | TCC | CGG | CGC | CAC | ACG |
| Thr | Arg | Gly | Val | Ala | Lys | Aid | Val | Asp | Phe | Ile | Pro | Val | Glu | Asn | Leu |
| ACC | CGT | GGA | GTG | GCT | AAG | GCG | GTG | GAC | TTT | ATC | CCT | GTG | GAG | AAC | CTA |
| TGG | GCA | CCT | CAC | CGA | TTC | CGC | CAC | CTG | AAA | TAG | GGA | CAC | CTC | TTG | GAT |
Ddel
| Glu | Thr | Thr | Met | Arg | Ser | Pro | Val | Phe | Thr | Asp | Asn | Ser | |
| GAG | ACA | ACC | ATG | AGG | TCC | CCG | GTG | TTC | ACG | GAT | AAC | TCC | TC |
| CTC | TGT | TGG | TAC | TCC | AGG | GGC | CAC | AAG | TGC | CTA | TTG | AGG | AG |
Fig
169 273
| C7f: | |||||||||||||||
| Ile | Arg | Gly | Thr | Tyr | Val | Tyr | Asn | His | Leu | Thr | Pro | Leu | Arg | Asp | Trp |
| ATT | CGG | GGC | ACC | TAT | GTT | TAT | AAC | CAT | CTC | ACT | CCT | CTT | CGG | GAC | TGG |
| TAA | GCC | CCG | TGG | ATA | CAA | ATA | TTG | GTA | GAG | TGA | GGA | GAA | GCC | CTG | ACC |
EcoRI
| Ala | His | Asn | Gly | Leu | Arg | Asp | Leu | Ala | Val | Ala | Val | Glu | Pro | Val | Val |
| GCG | CAC | AAC | GGC | TTG | CGA | GAT | CTG | GCC | GTG | GCT | GTA | GAG | CCA | GTC | GTC |
| CGC | GTG | TTG | CCG | AAC | GCT | CTA | GAC | CGG | CAC | CGA | CAT | CTC | GGT | CAG | CAG |
| Phe | Ser | Gln | Met | Glu | Thr | Lys | Leu | Ile | Thr | Trp | Gly | Ala | Asp | Thr | Ala |
| TTC | TCC | CAA | ATG | GAG | ACC | AAG | CTC | ATC | ACG | TGG | GGG | GCA | GAT | ACC | GCC |
| AAG | AGG | GTT | TAC | CTC | TGG | TTC | GAG | TAG | TGC | ACC | CCC | CGT | CTA | TGG | CGG |
| Ala | Cys | Gly | Asp | Ile | Ile | Asn | Gly | Leu | Pro | Val | Ser | Ala | Arg | Arg | Gly |
| GCG | TGC | GGT | GAC | ATC | ATC | AAC | GGC | TTG | CCT | GTT | TCC | GCC | CGC | AGG | GGC |
| CGC | ACG | CCA | CTG | TAG | TAG | TTG | CCG | AAC | GGA | CAA | AGG | CGG | GCG | TCC | CCG |
| Arg | Glu | Ile | / Leu | Leu | Gly | Pro | Ala | Asp | Gly | Met | Val | Ser | Lys | Gly | Trp |
| CGG | GAG | ATA | CTG | CTC | GGG | CCA | GCC | GAT | GGA | ATG | GTC | TCC | AAG | GGT | TGG |
| GCC | CTC | TAT | GAC | GAG | CCC | GGT | CGG | CTA | CCT | TAC | CAG | AGG | TTC | CCA | ACC |
| Arg | Leu | Leu | Ala | Pro | Ile | Thr | Ala | Tyr | Ala | Gln | Gln | Thr | Arg | Gly | Leu |
| AGG | TTG | CTG | GCG | CCC | ATC | ACG | GCG | TAC | GCC | CAG | CAG | ACA | AGG | GGC | CTC |
| TCC | AAC | GAC | CGC | GGG | TAG | TGC | CGC | ATG | CGG | GTC | GTC | TGT | TCC | CCG | GAG |
| Leu | Gly | Cys | Ile | Ile | Thr | Ser | Leu | Thr | Gly | Arg | Asp | Lys | Asn | Gln | Val |
| CTA | GGG | TGC | ATA | ATC | ACC | AGC | CTA | ACT | GGC | CGG | GAC | AAA | AAC | CAA | GTG |
| GAT | CCC | ACG | TAT | TAG | TGG | TCG | GAT | TGA | CCG | GCC | CTG | TTT | TTG | GTT | CAC |
| Glu | Gly | Glu | Val | Gln | Ile | Val | Ser | Thr | Ala | Ala | Gln | Thr | Phe | Leu | Ala |
| GAG | GGT | GAG | GTC | CAG | ATT | GTG | TCA | ACT | GCT | GCC | CAA | ACC | TTC | CTG | GCA |
| CTC | CCA | CTC | CAG | GTC | TAA | CAC | AGT | TGA | CGA | CGG | GTT | TGG | AAG | GAC | CGT |
| Thr | Cys | Ile | Asn | Gly | Val | Cys | Trp | Pro | Asn | ||||||
| ACG | TGC | ATC | AAT | GGG | GTG | TGC | TGG | CCG | AAT | TC | |||||
| TGC | ACG | TAG | TTA | CCC | CAC | ACG | ACC | GGC | TTA | AG |
t T
SfaNI EcoRI
Fig
169 273
C31:
| Glu | Phe | Gly | Ser | Val | Ile | Pro | Thr | Ser | Gly | Asp | Val | Val | Val | Val | Ala |
| GAA | TTC | GGG | TCC | GTC | ATC | CCG | ACC | AGC | GGC | GAT | GTT | GTC | GTC | GTC | GCA |
| CTT | AAG | CCC | AGG | CAG | TAG | GGC | TGG | TCG | CCG | CTA | CAA | CAG | CAG | CAG | CGT |
| 1 EcoRI | |||||||||||||||
| Thr | Asp | Ala | Leu | Met | Thr | Gly | Tyr | Thr | Gly | Asp | Phe | Asp | Ser | Val | Ile |
| ACC | GAT | GCC | CTC | ATG | ACC | GGC | TAT | ACC | GGC | GAC | TTC | GAC | TCG | GTG | ATA |
| TGG | CTA | CGG | GAG | TAC | TGG | CCG | ATA | TGG | CCG | CTG | AAG | CTG | AGC | CAC | TAT |
| 1 Hinfl | |||||||||||||||
| Asp | Cys | Asn | Thr | Cys | Val | Thr | Gin | Thr | Val | Asp | Phe | Ser | Leu | Asp | Pro |
| GAC | TGC | AAT | ACG | TGT | GTC | ACC | CAG | ACA | GTC | GAT | TTC | AGC | CTT | GAC | CCT |
| CTG | ACG | TTA | TGC | ACA | CAG | TGG | GTC | TGT | CAG | CTA | AAG | TCG | GAA | CTG | GGA |
| Thr | Phe | Thr | Ile | Glu | Thr | Ile | Thr | Leu | Pro | Gin | Asp | Ala | Val | Ser | Arg |
| ACC | TTC | ACC | ATT | GAG | ACA | ATC | ACG | CTC | CCC | CAA | GAT | GCT | GTC | TCC | CGC |
| TGG | AAG | TGG | TAA | CTC | TGT | TAG | TGC | GAG | GGG | GTT | CTA | CGA | CAG | AGG | GCG |
| Thr | Gin | Arg | Arg | Gly | Arg | Thr | Gly | Arg | Gly | Lys | Pro | Gly | Ile | Tyr | Arg |
| ACT | CAA | CGT | CGG | GGC | AGG | ACT | GGC | AGG | GGG | AAG | CCA | GGC | ATC | TAC | AGA |
| TGA | GTT | GCA | GCC | CCG | TCC | TGA | CCG | TCC | CCC | TTC | GGT | CCG | TAG | ATG | TCT |
| Phe | Val | Ala | Pro | Gly | Glu | Arg | Pro | Ser | Gly | Met | Phe | Asp | Ser | Ser | Val |
| TTT | GTG | GCA | CCG | GGG | GAG | CGC | CCC | TCC | GGC | ATG | TTC | GAC | TCG | TCC | GTC |
| AAA | CAC | CGT | GGC | CCC | CTC | GCG | GGG | AGG | CCG | TAC | AAG | CTG | AGC | AGG | CAG |
BglI ΐ
Hinf I
Leu Cys Glu Cys Pro Asn CTC TGT GAG TGC CCG AAT TC GAG ACA CTC ACG GGC TTA AG
T
EcoRI
Fig
169 273
C35 :
| Ile | Arg | Ser | Ile | Glu | Thr | Ile | Thr | Leu | Pro | Gin | Asp | Ala | Val | Ser | Arg |
| ATT | CGG | TCC | ATT | GAG | ACA | ATC | ACG | CTC | CCC | CAG | GAT | GCT | GTC | TCC | CGC |
| TAA | GCC | AGG | TAA | CTC | TGT | TAG | TGC | GAG | GGG | GTC | CTA | CGA | CAG | AGG | GCG |
EcoRI
| Thr | Gln | Arg | Arg | Gly | Arg | Thr | Gly | Arg | Gly | Lys | Pro | Gly | Ile | Tyr | Arg |
| ACT | CAA | CGT | CGG | GGC | AGG | ACT | GGC | AGG | GGG | AAG | CCA | GGC | ATC | TAC | AGA |
| TGA | GTT | GCA | GCC | CCG | TCC | TGA | CCG | TCC | CCC | TTC | GGT | CCG | TAG | ATG | TCT |
| Phe | Val | Ala | Pro | Gly | Glu | Arg | Pro | Ser | Gly | Met | Phe | Asp | Ser | Ser | Val |
| TTT | GTG | GCA | CCG | GGG | GAG | CGC | CCC | TCC | GGC | ATG | TTC | GAC | TCG | TCC | GTC |
| AAA | CAC | CGT | GGC | CCC | CTC | GCG | GGG | AGG | CCG | TAC | AAG | CTG | AGC | AGG | CAG |
T
BglI
| Leu | Cys | Glu | Cys | Tyr | Asp | Ala | Gly | Cys | Ala | Trp | Tyr | Glu | Leu | Thr | Pro |
| CTC | TGT | GAG | TGC | TAT | GAC | GCA | GGC | TGT | GCT | TGG | TAT | GAG | CTC | ACG | CCC |
| GAG | ACA | CTC | ACG | ATA | CTG | CGT | CCG | ACA | CGA | ACC | ATA | CTC | GAG | TGC | GGG |
| Ala | Glu | Thr | Thr | Val | Arg | Leu | Arg | Ala | Tyr | Met | Asn | Thr | Pro | Gly | Leu |
| GCC | GAG | ACT | ACA | GTT | AGG | CTA | CGA | GCG | TAC | ATG | AAC | ACC | CCG | GGG | CTT |
| CGG | CTC | :ga | TGT | CAA | TCC | GAT | GCT | CGC | ATG | TAC | TTG | TGG | GGC | CCC | GAA |
| Pro | Val | Cys | Gln | Asp | His | Leu | Glu | Phe | Trp | Glu | Gly | Val | Phe | Thr | Gly |
| CCC | GTG | TGC | CAG | GAC | CAT | CTT | GAA | TTT | TGG | GAG | GGC | GTC | TTT | ACA | GGC |
| GGG | CAC | ACG | GTC | CTG | GTA | GAA | CTT | AAA | ACC | CTC | CCG | CAG | AAA | TGT | CCG |
| Leu | Thr | His | Ile | Asp | Ala | His | Phe | Leu | Ser | Gln | Thr | Lys | Gln | Ser | Gly |
| CTC | ACT | CAT | ATA | GAT | GCC | CAC | TTT | CTA | TCC | CAG | ACA | AAG | CAG | AGT | GGG |
| GAG | TGA | GTA | TAT | CTA | CGG | GTG | AAA. | GAT | AGG | GTC | TGT | TTC | GTC | TCA | CCC |
| Glu | Asn | Leu | Pro | Tyr | Leu | Val | Ala | Tyr | Gln | Ala | Thr | Val | Cys | Ala | Arg |
| GAG | AAC | CTT | CCT | TAC | CTG | GTA | GCG | TAC | CAA | GCC | ACC | GTG | TGC | GCT | AGG |
| GTC | TTG | GAA | GGA | ATG | GAC | CAT | CGC | ATG | GTT | CGG | TGG | CAC | ACG | CGA | TCC |
| Ala | Gln | Ala | Pro | Pro | Pro | Ser | Trp | Asp | Gln | Met | Trp | Lys | Cys | Leu | Ile |
| GCT | CAA | GCC | CCT | CCC | CCA | TCG | TGG | GAC | CAG | ATG | TGG | AAG | TGT | TTG | ATT |
| CGA | GTT | CGG | GGA | GGG | GGT | AGC | ACC | CTG | GTC | TAC | ACC | TTC | ACA | AAC | TAA |
| Arg | Leu | Lys | Pro | Thr | Leu | His | Gly | Pro | Thr | Pro | Leu | Leu | Tyr | Arg | Leu |
| CGC | CTC | AAG | CCC | ACC | CTC | CAT | GGG | CCA | ACA | CCC | CTG | CTA | TAC | AGA | CTG |
| GCG | GAG | TTC | GGG | TGG | GAG | GTA | CCC | GGT | TGT | GGG | GAC | GAT | ATG | TCT | GAC |
Gly Ala Ala Glu Phe GGC GCT GCC GAA TTC CCG CGA CGG CTT AAG
T
EcoRI
Fig
169 273
| C33c | |||||||||||||||
| Glu | Phe | Gly | Ala | Val | Asp | Phe | Ile | Pro | Val | Glu | Asn | Leu | Glu | Thr | Thr |
| GAA | TTC | GGG | GCG | GTG | GAC | TTT | ATC | CCT | GTG | GAG | AAC | CTA | GAG | ACA | ACC |
| CTT | AAG | CCC | CGC | CAC | CTG | AAA | TAG | GGA | CAC | CTC | TTG | GAT | CTC | TGT | TGG |
EcoRI
| Met | Arg | Ser | Pro | Val | Phe | Thr | Asp | Asn | Ser | Ser | Pro | Pro | Val | Val | Pro |
| ATG | AGG | TCC | CCG | GTG | TTC | ACG | GAT | AAC | TCC | TCT | CCA | CCA | GTA | GTG | CCC |
| TAC | TCC | AGG | GGC | CAC | AAG | TGC | CTA | TTG | AGG | AGA | GGT | GGT | CAT | CAC | GGG |
| Gin | Ser | Phe | Gin | Val | Ala | His | Leu | His | Ala | Pro | Thr | Gly | Ser | Gly | Lys |
| CAG | AGC | TTC | CAG | GTG | GCT | CAC | CTC | CAT | GCT | CCC | ACA | GGC | AGC | GGC | AAA |
| GTC | TCG | AAG | GTC | CAC | CGA | GTG | GAG | GTA | CGA | GGG | TGT | CCG | TCG | CCG | TTT |
| Ser | Thr | Lys | Val | Pro | Ala | Ala | Tyr | Ala | Ala | Gin | Gly | Tyr | Lys | Val | Leu |
| AGC | ACC | AAG | GTC | CCG | GCT | GCA | TAT | GCA | GCT | CAG | GGC | TAT | AAG | GTG | CTA |
| TCG | TGG | TTC | CAG | GGC | CGA | CGT | ATA | CGT | CGA | GTC | CCG | ATA | TTC | CAC | GAT |
| Val | Leu | Asn | Pro | Ser | Val | Ala | Ala | Thr | Leu | Gly | Phe | Gly | Ala | Tyr | Met |
| GTA | CTC | AAC | CCC | TCT | GTT | GCT | GCA | ACA | CTG | GGC | TTT | GGT | GCT | TAC | ATG |
| CAT | GAG | TTG | GGG | AGA | CAA | CGA | CGT | TGT | GAC | CCG | AAA | CCA | CGA | ATG | TAC |
| Ser | Lys | Ala | His | Gly | Ile | Asp | Pro | Asn | Ile | Arg | Thr | Gly | Val | Arg | Thr |
| TCC | AAG | GCT | CAT | GGG | ATC | GAT | CCT | AAC | ATC | AGG | ACC | GGG | GTG | AGA | ACA |
| AGG | TTC | CGA | GTA | CCC | TAG | CTA | GGA | TTG | TAG | TCC | TGG | CCC | CAC | TCT | TGT |
| Ile | Thr | Thr | Gly | Ser | Pro | Ile | Thr | Tyr | Ser | Thr | Tyr | Gly | Lys | Phe | Leu |
| ATT | ACC | ACT | GGC | AGC | CCC | ATC | ACG | TAC | TCC | ACC | TAC | GGC | AAG | TTC | CTT |
| TAA | IGG | TGA | CCG | TCG | GGG | TAG | TGC | ATG | AGG | TGG | ATG | CCG | TTC | AAG | GAA |
| Ala | Asp | Gly | Gly | Cys | Ser | Gly | Gly | Ala | Tyr | Asp | Ile | Ile | Ile | Cys | Asp |
| GCC | GAC | GGC | GGG | TGC | TCG | GGG | GGC | GCT | TAT | GAC | ATA | ATA | ATT | TGT | GAC |
| CGG | CTG | CCG | CCC | .ACG | AGC | CCC | CCG | CGA | ATA | CTG | TAT | TAT | TAA | ACA | CTG |
| Glu | Cys | His | Ser | Thr | Asp | Ala | Thr | Ser | Ile | Leu | Gly | Ile | Gly | Thr | Val |
| GAG | TGC | CAC | TCC | ACG | GAT | GCC | ACA | TCC | ATC | TTG | GGC | ATT | GGC | ACT | GTC |
| CTC | ACG | GTG | AGG | TGC | CTA | CGG | TGT | AGG | TAG | AAC | CCG | TAA | CCG | TGA | CAG |
Fig
169 273
Leu Asp Gln Ala Glu Thr CTT GAC CAA GCA GAG ACT GAA CTG GTT CGT CTC TGA
Ala Gly Ala Arg Leu Val Val GCG C-GG GCG AGA CTG GTT GTG CGC CCC CGC TCT GAC CAA CAC
Leu Ala Thr CTC GCC ACC GAG CGG TGG
Ala Thr Pro Pro Gly Ser GCC ACC CCT CCG GGC TCC CGG TGG GGA GGC CCG AGG
Val Thr Val Pro His Pro Asn GTC ACT GTG CCC CAT CCC AAC CAG TGA CAC GGG GTA GGG TTG
Ile Glu Glu ATC GAG GAG TAG CTC CTC
Val Ala Leu Ser Thr Thr GTT GCT CTG TCC ACC ACC CAA CGA GAC AGG TGG TGG
Gly Glu Ile Pro Phe Tyr Gly GGA GAG ATC CCT TTT TAC GGC CCT CTC TAG GGA AAA ATG CCG
Lys Ala Ile AAG GCT ATC TTC CGA TAG
Pro Leu CCC CTC GGG GAG
Glu Val Ile Lys Gly Gly Arg His GAA GTA ATC AAG GGG GGG AGA CAT CTT CAT TAG TTC CCC CCC TCT GTA
Leu Ile Phe CTC ATC TTC GAG TAG AAG
Cys His Ser TGT CAT TCA ACA GTA AGT
Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Val Ala AAG AAG AAG TGC GAC GAA CTC GCC GCA AAG CTG GTC GCA TTC TTC TTC ACG CTG CTT GAG CGG CGT TTC GAC CAG CGT
Leu Gly Ile TTG GGC / ATC AAC CCG TAG
Asn Ala AAT GCC TTA CGG
Val Ala Tyr Tyr GTG GCC TAC TAC CAC CGG ATG ATG
Arg Gly Leu Asp Val Ser Val CGC GGT CTT GAC GTG TCC GTC GCG CCA GAA CTG CAC AGG CAG
Ile Pro Thr ATC CCG ACC TAG GGC TGG
Ser Gly AGC GGC TCG CCG
Asp Val Val Val Val Ala Thr Asp Ala Leu Met GAT GTT GTC GTC GTG GCA ACC GAT GCC CTC ATG CTA CAA CAG CAG CAC CGT TGG CTA CGG GAG TAC
Thr Gly Tyr ACC GGC TAT TGG CCG ATA
Thr Gly ACC GGC TGG CCG
Asp Phe Asp Ser Val GAC TTC GAC TCG GTG CTG AAG CTG AGC CAC
Ile Asp Cys ATA GAC TGC TAT CTG ACG
Asn Thr Cys AAT ACG TGT TTA TGC ACA
T
Hinfl
Ala Glu Phe GCC GAA TTC CGG CTT AAG ί
EcoRI
Fig.
(ciąg dalszy)
169 273
Hinfl
I — C35
C31
C33c
C200
S/αΝΙ
I
C7f ------------------------ C20c
C7f+C20c
C8h
Ddel i £c<?RII
C26d ---------
C33c ------------------ -------C300
Fig. 9
169 273
C7f+C20c
C7fC20cC300
NaeI
I
--------- C300
Ndel i
| C200
C7fC20cC300C200
Fig- 9 (ciąg dalszy)
169 273
-155 Met Ala ATG GCT TAC CGA
-150
Thr Asn Pro Val cys Val Leu ACA AAC CCT GTT TGC GTT TTG TGT TTG GGA CAA ACG CAA AAC
| 145 | -140 | -135 | |||||||||||||
| Lys | Gly | Asp | Gly | Pro | Val | Gln | Gly | Ile | Ile | Asn | Phe | Glu | Gln | Lys | Glu |
| AAG | GGT | GAC | GGC | CCA | GTT | CAA | GGT | ATT | ATT | AAC | TTC | GAG | CAG | AAG | GAA |
| TTC | CCA | CTG | CCG | GGT | CAA | GTT | CCA | TAA | TAA | TTG | AAG | CTC | GTC | TTC | CTT |
| -130 | -125 | -120 | -115 | ||||||||||||
| Ser | Asn | Gly | Pro | Val | Lys | Val | Trp | Gly | Ser | Ile | Lys | Gly | Leu | Thr | Glu |
| AGT | AAT | GGA | CCA | GTG | AAG | GTG | TGG | GGA | AGC | ATT | AAA | GGA | CTG | ACT | GAA |
| TCA | TTA | CCT | GGT | CAC | TTC | CAC | ACC | CCT | TCG | TAA | TTT | CCT | GAC | TGA | CTT |
| -110 | -105 | -100 | |||||||||||||
| Gly | Leu | His | Gly | Phe | His | Val | His | Glu | Phe | Gly | Asp | Asn | Thr | Ala | Gly |
| GGC | CTG | C.- ' | GGA | TTC | CAT | GTT | CAT | GAG | TTT | GGA | GAT | AAT | ACA | GCA | GGC |
| CCG | GAC | GTA | CCT | AAG | GTA | CAA | GTA | CTC | AAA | CCT | CTA | TTA | TGT | CGT | CCG |
| -95 | -90 | -85 | |||||||||||||
| Cys | Thr | Ser | Pro | Gly | Pro | His | Phe | Asn | Pro | Leu | Ser | Arg | Lys | His | Gly |
| TGT | ACC | AGT | CCA | GGT | CCT | CAC | TTT | AAT | CCT | CTA | TCC | AGA | AAA | CAC | GGT |
| ACA | TGG | TCA | GGT | CCA | GGA | GTG | AAA | TTA | GGA | GAT | AGG | TCT | TTT | GTG | CCA |
| -80 | -75 | -70 | |||||||||||||
| Gly | Pro | Lys | Asp | Glu | Glu | Arg | His | Val | Gly | Asp | Leu | Gly | Asn | Val | Thr |
| GGG | CCA | AAG | GAT | GAA | GAG | AGG | CAT | GTT | GGA | GAC | TTG | GGC | AAT | GTG | ACT |
| CCC | GGT | TTC | CTA | CTT | CTC | TCC | GTA | CAA | CCT | CTG | AAC | CCG | TTA | CAC | TGA |
| -65 | -60 | -55 | |||||||||||||
| Ala | Asp | Lys | Asp | Gly | Val | Ala | Asp | Val | Ser | Ile | Glu | Asp | Ser | Val | Ile |
| GCT | GAC | AAA | GAT | GGT | GTG | GCC | GAT | GTG | TCT | ATT | GAA | GAT | TCT | GTG | ATC |
| CGA | CTG | TTT | CTA | CCA | CAC | CGG | CTA | CAC | AGA | TAA | CTT | CTA | AGA | CAC | TAG |
| -50 | -45 | -40 | -35 | ||||||||||||
| Ser | Leu | Ser | Gly | Asp | His | Cys | Ile | Ile | Gly | Arg | Thr | Leu | Val | Val | His |
| TCA | CTC | TCA | GGA | GAC | CAT | TGC | ATC | ATT | GGC | CGC | ACA | CTG | GTG | GTC | CAT |
| AGT | GAG | AGT | CCT | CTG | GTA | ACG | TAG | TAA | CCG | GCG | TGT | GAC | CAC | CAG | GTA |
| -30 | -25 | -20 | |||||||||||||
| Glu | Lys | Ala | Asp | Asp | Leu | Gly | Lys | Gly | Gly | Asn | Glu | Glu | Ser | Thr | Lys |
| GAA | AAA | GCA | GAT | GAC | TTG | GGC | AAA | GGT | GGA | AAT | GAA | GAA | AGT | ACA | AAG |
| CTT | TTT | CGT | CTA | CTG | AAC | CCG | TTT | CCA | CCT | TTA | CTT | CTT | TCA | TGT | TTC |
| -15 | -10 | -5 | |||||||||||||
| Thr | Gly | Asn | Ala | Gly | Ser | Arg | Leu | Ala | Cys | Gly | Val | Ile | Gly | Ile | Arg |
| ACA | GGA | AAC | GCT | GGA | AGT | CGT | TTG | GCT | TGT | GGT | GTA | ATT | GGG | ATC | CGA |
| TGT | CCT | TTG | CGA | CCT | TCA | GCA | AAC | CGA | ACA | CCA | CAT | TAA | CCC | TAG | GCT |
Fig
169 273
| 1 | 5 | 10 | |||||||||||||
| Arg | Ile | Gly | Thr | Tyr | Val | Tyr | Asn | His | Leu | Thr | Pro | Leu | Arg | Asp | Trp |
| ATT | CGG | GGC | ACC | TAT | GTT | TAT | AAC | CAT | CTC | ACT | CCT | CTT | CGG | GAC | TGG |
| TAA | GCC | CCG | TGG | ATA | CAA | ATA | TTG | GTA | GAG | TGA | GGA | GAA | GCC | CTG | ACC |
| 15 | 20 | 25 | 30 | ||||||||||||
| Ala | His | Asn | Gly | Leu | Arg | Asp | Leu | Ala | Val | Ala | Val | Glu | Pro | Val | Val |
| GCG | CAC | AAC | GGC | TTG | CGA | GAT | CTG | GCC | GTG | GCT | GTA | GAG | CCA | GTC | GTC |
| CGC | GTG | TTG | CCG | AAC | GCT | CTA | GAC | CGG | CAC | CGA | CAT | CTC | GGT | CAG | CAG |
| 35 | 40 | 45 | |||||||||||||
| Phe | Ser | Gln | Met | Glu | Thr | Lys | Leu | Ile | Thr | Trp | Gly | Ala | Asp | Thr | Ala |
| TTC | TCC | CAA | ATG | GAG | ACC | AAG | CTC | ATC | ACG | TGG | GGG | GCA | GAT | ACC | GCC |
| AAG | AGG | GTT | TAC | CTC | TGG | TTC | GAG | TAG | TGC | ACC | CCC | CGT | CTA | TGG | CGG |
| 50 | 5 5 | 60 | |||||||||||||
| Ala | Cys | Gly | Asp | Ile | Ile | Asn | Gly | Leu | Pro | Val | Ser | Ala | Arg | Arg | Gly |
| GCG | TGC | GGT | GAC | ATC | ATC | AAC | GGC | TTG | CCT | GTT | TCC | GCC | CGC | AGG | GGC |
| CGC | ACG | CCA | CTG | TAG | TAG | TTG | CCG | AAC | GGA | CAA | AGG | CGG | GCG | TCC | CCG |
/
| 65 | 70 | 75 | |||||||||||||
| Arg | Glu | Ile | Leu | Leu | Gly | Pro | Ala | Asp | Gly | Met | Val | Ser | Lys | Gly | Trp |
| CGG | GAG | ATA | CTG | CTC | GGG | CCA | GCC | GAT | GGA | ATG | GTC | TCC | AAG | GGT | TGG |
| GCC | CTC | TAT | GAC | GAG | CCC | GGT | CGG | CTA | CCT | TAC | CAG | AGG | TTC | CCA | ACC |
| 80 | 85 | 90 | |||||||||||||
| Arg | Leu | Leu | Ala | Pro | Ile | Thr | Ala | Tyr | Ala | Gln | Gln | Thr | Arg | Gly | Leu |
| AGG | TTG | CTG | GCG | CCC | ATC | ACG | GCG | TAC | GCC | CAG | CAG | ACA | AGG | GGC | CTC |
| TCC | AAC | GAC | CGC | GGG | TAG | TGC | CGC | ATG | CGG | GTC | GTC | TGT | TCC | CCG | GAG |
| 95 | 100 | 105 | 110 | ||||||||||||
| Leu | Gly | Cys | Ile | Ile | Thr | Ser | Leu | Thr | Gly | Arg | Asp | Lys | Asn | Gln | Val |
| CTA | GGG | TGC | ATA | ATC | ACC | AGC | CTA | ACT | GGC | CGG | GAC | AAA | AAC | CAA | GTG |
| GAT | CCC | ACG | TAT | TAG | TGG | TCG | GAT | TGA | CCG | GCC | CTG | TTT | TTG | GTT | CAC |
| 115 | 120 | 125 | |||||||||||||
| Glu | Gly | Glu | Val | Gln | Ile | Val | Ser | Thr | Ala | Ala | Gln | Thr | Phe | Leu | Ala |
| GAG | GGT | GAG | GTC | CAG | ATT | GTG | TCA | ACT | GCT | GCC | CAA | ACC | TTC | CTG | GCA |
| CTC | CCA | CTC | CAG | GTC | TAA | CAC | AGT | TGA | CGA | CGG | GTT | TGG | AAG | GAC | CGT |
Fig .
(cigg dalszy)
169 273
| 130 | 135 | 140 | |||||||||||||
| Thr | Cys | Ile | Ile | Asn | Gly | Val | Cys | Trp | Thr | Val | Tyr | His | Gly | Ala | Gly |
| ACG | TGC | ATC | ATC | AAT | GGG | GTG | TGC | TGG | ACT | GTC | TAC | CAC | GGG | GCC | GGA |
| TGC | ACG | TAG | TAG | TTA | CCC | CAC | ACG | ACC | TGA | CAG | ATG | GTG | CCC | CGG | CCT |
| 145 | 150 | 155 | |||||||||||||
| Thr | Arg | Thr | Ile | Ala | Ser | Pro | Lys | Gly | Pro | Val | Ile | Gln | Met | Tyr | Thr |
| ACG | AGG | ACC | ATC | GCG | TCA | CCC | AAG | GGT | CCT | GTC | ATC | CAG | ATG | TAT | ACC |
| TGC | TCC | TGG | TAG | CGC | AGT | GGG | TTC | CCA | GGA | CAG | TAG | GTC | TAC | ATA | TGG |
| 160 | 165 | 170 | |||||||||||||
| Asn | Val | Asp | Gln | Asp | Leu | Val | Gly | Trp | Pro | Ala | Ser | Gln | Gly | Thr | Arg |
| AAT | GTA | GAC | CAA | GAC | CTT | GTG | GGC | TGG | CCC | GCT | TCG | CAA | GGT | ACC | CGC |
| TTA | CAT | CTG | GTT | CTG | GAA | CAC | CCG | ACC | GGG | CGA | AGC | GTT | CCA | TGG | GCG |
| 175 | 180 | 185 | 190 | ||||||||||||
| Ser | Leu | Thr | Pro | Cys | Thr | Cys | Gly | Ser | Ser | Asp | Leu | Tyr | Leu | Val | Thr |
| TCA | TTG | ACA | CCC | TGC | ACT | TGC | GGC | TCC | TCG | GAC | CTT | TAC | CTG | GTC | ACG |
| AGT | AAC | TGT | GGG | ACG | TGA | ACG | CCG | AGG | AGC | CTG | GAA | ATG | GAC | CAG | TGC |
| 195 | 200 | 205 | |||||||||||||
| Arg | His | Ala | Asp | Val | Ile | Pro | Val | Arg | Arg | Arg | Gly | Asp | Ser | Arg | Gly |
| AGG | CAC | GCC | GAT | GTC | ATT | CCC | GTG | CGC | CGG | CGG | GGT | GAT | AGC | AGG | GGC |
| TCC | GTG | CGG | CTA | CAG | TAA | GGG | CAC | GCG | GCC | GCC | CCA | CTA | TCG | TCC | CCG |
Τ
Nael
| 210 | 215 | 220 | |||||||||||||
| Ser | Leu | Leu | Ser | Pro | Arg | Pro | Ile | Ser | Tyr | Leu | Lys | Gly | Ser | Ser | Gly |
| AGC | CTG | CTG | TCG | CCC | CGG | CCC | ATT | TCC | TAC | TTG | AAA | GGC | TCC | TCG | GGG |
| TCG | GAC | GAC | AGC | GGG | GCC | GGG | TAA | AGG | ATG | AAC | TTT | CCG | AGG | AGC | CCC |
| 225 | 230 | 235 | |||||||||||||
| Gly | Pro | Leu | Leu | Cys | Pro | Ala | Gly | His | Ala | Val | Gly | Ile | Phe | Arg | Ala |
| GGT | CCG | CTG | TTG | TGC | CCC | GCG | GGG | CAC | GCC | GTG | GGC | ATA | TTT | AGG | GCC |
| CCA | GGC | GAC | AAC | ACG | GGG | CGC | CCC | GTG | CGG | CAC | CCG | TAT | AAA | TCC | CGG |
| 240 | 245 | 250 | |||||||||||||
| Ala | Val | Cys | Thr | Arg | Gly | Val | Ala | Lys | Ala | Val | Asp | Phe | Ile | Pro | Val |
| GCG | GTG | TGC | ACC | CGT | GGA | GTG | GCT | AAG | GCG | GTG | GAC | TTT | ATC | CCT | GTG |
| CGC | CAC | ACG | TGG | GCA | CCT | CAC | CGA | TTC | CGC | CAC | CTG | AAA | TAG | GGA | CAC |
Fig
O (ciąg dalszy)
169 273
255
Glu Asn GAG AAC CTC TTG
Leu Glu CTA GAG GAT CTC
260 Thr Thr ACA ACC TGT TGG
Met Arg ATG AGG TAC TCC
Ser Pro TCC CCG AGG GGC
265
Val Phe GTG TTC CAC AAG
Thr Asp ACG GAT TGC CTA
270 Asn Ser AAC TCC TTG AGG
Ser Pro TCT CCA AGA GGT
Pro Val CCA GTA GGT CAT
275
Val Pro GTG CCC CAC GGG
Gin Ser CAG AGC GTC TCG
280 Phe Gin TTC CAG AAG GTC
Val Ala GTG GCT CAC CGA
His Leu CAC CTC GTG GAG
285
His Ala CAT GCT GTA CGA
Pro Thr CCC ACA GGG TGT
290 Gly Ser GGC AGC CCG TCG
Gly Lys GGC AAA CCG TTT
Ser Thr AGC ACC TCG TGG
295
Lys Val AAG GTC TTC CAG
Pro Ala CCG GCT GGC CGA
Gin Gly CAG GGC GTC CCG
305
Tyr Lys TAT AAG ATA TTC
Val Leu GTG CTA CAC GAT
310 Val Leu GTA CTC CAT GAG
Asn Pro AAC CCC TTG GGG
Ser Val TCT GTT AGA CAA
300 Ala Tyr GCA TAT CGT ATA
T
Ndel
315
Ala Ala GCT GCA CGA CGT
Ala Ala GCA GCT CGT CGA
Thr Leu ACA CTG TGT GAC
320 Gly Phe GGC TTT CCG AAA
Gly Ala GGT GCT CCA CGA
Tyr Met TAC ATG ATG TAC
325
Ser Lys TCC AAG AGG TTC
Ala His GCT CAT CGA GTA
330 Gly Ile GGG ATC CCC TAG
Asp Pro GAT CCT CTA GGA
Asn Ile AAC ATC TTG TAG
335
Arg Thr AGG ACC TCC TGG
Gly Val GGG GTG CCC CAC
340 Arg Thr AGA ACA TCT TGT
Ile Thr ATT ACC TAA TGG
Thr Gly ACT GGC TGA CCG
345
Ser Pro AGC CCC TCG GGG
Ile Thr ATC ACG TAG TGC
350 Tyr Ser TAC TCC ATG AGG
Thr Tyr ACC TAC TGG ATG
Gly Lys GGC AAG CCG TTC
355
Phe Leu TTC CTT AAG GAA
Ala Asp GCC GAC CGG CTG
360 Gly Gly GGC GGG CCG CCC
Cys Ser TGC TCG ACG AGC
Gly Gly GGG GGC CCC CCG
365
Ala Tyr GCT TAT CGA ATA
Asp Ile GAC ATA CTG TAT
370 Ile Ile ATA ATT TAT TAA
Cys Asp TGT GAC ACA CTG
Glu Cys GAG TGC CTC ACG
375
His Ser CAC TCC GTG AGG
Thr Asp ACG GAT TGC CTA
380 Ala Thr GCC ACA CGG TGT
Ser Ile TCC ATC AGG TAG
Fig (ciąg dalszy)
169 273
| 385 | 390 | 395 | |||||||||||||
| Leu | Gly | Ile | Gly | Thr | Val | Leu | Asp | Gln | Ala | Glu | Thr | Ala | Gly | Ala | Arg |
| TTG | GGC | ATT | GGC | ACT | GTC | CTT | GAC | CAA | GCA | GAG | ACT | GCG | GGG | GCG | AGA |
| AAC | CCG | TAA | CC Z- | TGA | CAG | GAA | CTG | GTT | CGT | CTG | TGA | CGC | CCC | CGC | TCT |
| 400 | 405 | 410 | |||||||||||||
| Leu | Val | Val | Leu | Ala | Thr | Ala | Thr | Pro | Pro | Gly | Ser | Val | Thr | Val | Pro |
| CTG | GTT | GTG | CTC | GCC | ACC | GCC | ACC | CCT | CCG | GGC | TCC | GTC | ACT | GTG | CCC |
| GAC | CAA | CAC | GAG | CGG | TGG | CGG | TGG | GGA | GGC | CCG | AGG | CAG | TGA | CAC | GGG |
| 415 | 420 | 425 | 430 | ||||||||||||
| His | Pro | Asn | Ile | Glu | Glu | Val | Ala | Leu | Ser | Thr | Thr | Gly | Glu | Ile | Pro |
| CAT | CCC | AAC | ATC | GAG | GAG | GTT | GCT | CTG | TCC | ACC | ACC | GGA | GAG | ATC | CCT |
| GTA | GGG | TTG | TAG | CTC | CTC | CAA | CGA | GAC | AGG | TGG | TGG | CCT | CTC | TAG | GGA |
| 435 | 440 | 445 | |||||||||||||
| Phe | Tyr | Gly | Lys | Ala | Ile | Pro | Leu | Glu | Val | Ile | Lys | Gly | Gly | Arg | His |
| TTT | TAC | GGC | AAG | GCT | ATC | CCC | CTC | GAA | GTA | ATC | AAG | GGG | GGG | AGA | CAT |
| AAA | ATG | CCG | TTC | CGA | TAG | GGG | GAG | CTT | CAT | TAG | TTC | CCC | CCC | TCT | GTA |
| 450 | 455 | 460 | |||||||||||||
| Leu | Ile | Phe | Cys | His | Ser | Lys | Lys | Lys | Cys | Asp | Glu | Leu | Ala | Ala | Lys |
| CTC | ATC | TTC | TGT | CAT | TCA | AAG | AAG | AAG | TGC | GAC | GAA | CTC | GCC | GCA | AAG |
| GAG | TAG | AAG | ACA | GTA | AGT | TTC | TTC | TTC | ACG | CTG | CTT | GAG | CGG | CGT | TTC |
| 465 | 470 | 475 | |||||||||||||
| Leu | Val | Ala | Leu | Gly | Ile | Asn | Ala | Val | Ala | Tyr | Tyr | Arg | Gly | Leu | Asp |
| CTG | GTC | GCA | TTG | GGC | ATC | AAT | GCC | GTG | GCC | TAC | TAC | CGC | GGT | CTT | GAC |
| GAC | CAG | CGT | AAC | CCG | TAG | TTA | CGG | CAC | CGG | ATG | ATG | GCG | CCA | GAA | CTG |
| 480 | 485 | 490 | |||||||||||||
| Val | Ser | Val | Ile | Pro | Thr | Ser | Gly | Asp | Val | Val | Val | Val | Ala | Thr | Asp |
| GTG | TCC | GTC | ATC | CCG | ACC | AGC | GGC | GAT | GTT | GTC | GTC | GTG | GCA | ACC | GAT |
| CAC | AGG | CAG | TAG | GGC | TGG | TCG | CCG | CTA | CAA | CAG | CAG | CAC | CGT | TGG | CTA |
Ficj · (ciąg dalszy)
169 273
| 495 | 500 | 505 | 510 | ||||||||||||
| Ala | Leu | Met | Thr | Gly | Tyr | Thr | Gly | Asp | Phe | Asp | Ser | Val | Ile | Asp | Cys |
| GCC | CTC | ATG | ACC | GGC | TAT | ACC | GGC | GAC | TTC | GAC | TCG | GTG | ATA | GAC | TGC |
| CGG | GAG | TAC | TGG | CCG | ATA | TGG | CCG | CTG | AAG | CTG | AGC | CAC | TAT | CTG | ACG |
| 515 | 520 | 525 | |||||||||||||
| Asn | Thr | Cys | Val | Thr | Gln | Thr | Val | Asp | Phe | Ser | Leu | Asp | Pro | Thr | Phe |
| AAT | ACG | TGT | GTC | ACC | CAG | ACA | GTC | 2λΤ | TTC | AGC | CTT | GAC | CCT | ACC | TTC |
| TTA | TGC | ACA | CAG | TGG | GTC | TGT | CAG | CTA | AAG | TCG | GAA | CTG | GGA | TGG | AAG |
| 530 | 535 | 540 | |||||||||||||
| Ihr | Ile | Glu | Thr | Ile | Thr | Leu | Pro | Gln | Asp | Ala | Val | Ser | Arg | Thr | Gln |
| ACC | ATT | GAG | ACA | ATC | ACG | CTC | CCC | CAA | GAT | GCT | GTC | TCC | CGC | ACT | CAA |
| TGG | TAA | CTC | TGT | TAG | TGC | GAG | GGG | GTT | CTA | CGA | CAG | AGG | GCG | TGA | GTT |
| 545 | 550 | 555 | |||||||||||||
| Arg | Arg | Gly | Arg | Thr | Gly | Arg | Gly | Lys | Pro | Gly | Ile | Tyr | Arg | Phe | Val |
| CGT | CGG | GGC | AGG | ACT | GGC | AGG | GGG | AAG | CCA | GGC | ATC | TAC | AGA | TTT | GTG |
| GCA | GCC | CCG | TCC | TGA | CCG | TCC | CCC | TTC | GGT | CCG | TAG | ATG | TCT | AAA | CAC |
/
| 560 | 565 | 570 | |||||||||||||
| Ala | Pro | Gly | Glu | Arg | Pro | Pro | Gly | Met | Phe | Asp | Ser | Ser | Val | Leu | Cys |
| GCA | CCG | GGG | GAG | CGC | CCT | CCC | GGC | ATG | TTC | GAC | TCG | TCC | GTC | CTC | TGT |
| CGT | GGC | CCC | CTC | GCG | GGA | GGG | CCG | TAC | AAG | CTG | AGC | AGG | CAG | GAG | ACA |
| 575 | 580 | 585 | 590 | ||||||||||||
| Glu | Cys | Tyr | Asp | Ala | Gly | Cys | Ala | Trp | Tyr | Glu | Leu | Thr | Pro | Ala | Glu |
| GAG | TGC | TAT | GAC | GCA | GGC | TGT | GCT | TGG | TAT | GAG | CTC | ACG | CCC | GCC | GAG |
| CTC | ACG | ATA | CTG | CGT | CCG | ACA | CGA | ACC | ATA | CTC | GAG | TGC | GGG | CGG | CTC |
| 595 | 600 | 605 | |||||||||||||
| Thr | Thr | Val | Arg | Leu | Arg | Ala | Tyr | Met | Asn | Thr | Pro | Gly | Leu | Pro | Val |
| ACT | ACA | GTT | AGG | CTA | CGA | GCG | TAC | ATG | AAC | ACC | CCG | GGG | CTT | CCC | GTG |
| TGA | TGT | CAA | TCC | GAT | GCT | CGC | ATG | TAC | TTG | TGG | GGC | CCC | GAA | GGG | CAC |
Fitg.
(ciąg dalszy)
169 273
| 610 | 615 | 620 | |||||||||||||
| Cys | Gin | Asp | His | Leu | Glu | Phe | Trp | Glu | Gly | Val | Phe | Thr | Gly | Leu | Thr |
| TGC | CAG | GAC | CAT | CTT | GAA | TTT | TGG | GAG | GGC | GTC | TTT | ACA | GGC | CTC | ACT |
| ACG | GTC | CTG | GTA | GAA | CTT | AAA | ACC | CTC | CCG | CAG | AAA | TGT | CCG | GAG | TGA |
| 625 | 630 | 635 | |||||||||||||
| His | Ile | Asp | Ala | His | Phe | Leu | Ser | Gin | Thr | Lys | Gin | Ser | Gly | Glu | Asn |
| CAT | ATA | GAT | GCC | CAC | TTT | CTA | TCC | CAG | ACA | AAG | CAG | AGT | GGG | GAG | AAC |
| GTA | TAT | CTA | CGG | GTG | AAA | GAT | AGG | GTC | TGT | TTC | GTC | TCA | CCC | CTC | TTG |
| 640 | 645 | 650 | |||||||||||||
| Leu | Pro | Tyr | Leu | Val | Ala | Tyr | Gin | Ala | Thr | Val | Cys | Ala | Arg | Ala | Gin |
| CTT | CCT | TAC | CTG | GTA | GCG | TAC | CAA | GCC | ACC | GTG | TGC | GCT | AGG | GCT | CAA |
| GAA | GGA | ATG | GAC | CAT | CGC | ATG | GTT | CGG | TGG | CAC | ACG | CGA | TCC | CGA | GTT |
| 655 | 660 | 665 | 670 | ||||||||||||
| Ala | Pro | Pro | Pro | Ser | Trp | Asp | Gin | Met | Trp | Lys | Cys | Leu | Ile | Arg | Leu |
| GCC | CCT | CCC | CCA | TCG | TGG | GAC | CAG | ATG | TGG | AAG | TGT | TTG | ATT | CGC | CTC |
| CGG | GGA | GGG | GGT | AGC | ACC | CTG | GTC | TAC | ACC | TTC | ACA | AAC | TAA | GCG | GAG |
| 675 | 680 | 685 | |||||||||||||
| Lys | Pro | Thr | Leu | His | Gly | Pro | Thr | Pro | Leu | Leu | Tyr | Arg | Leu | Gly | Ala |
| AAG | CCC | ACC | CTC | CAT | GGG | CCA | ACA | CCC | CTG | CTA | TAC | AGA | CTG | GGC | GCT |
| TTC | GGG | TGG | GAG | GTA | CCC | GGT | TGT | GGG | GAC | GAT | ATG | TCT | GAC | CCG | CGA |
| Fig . | 10 | (ciąg | dalszy) |
Departament Wydawnictw UP RP Nakład 90 egz.
Cena 6,00 zł
Claims (4)
- Zastrzeżenia patentowe1. Sposób badania związków pod względem aktywności skierowanej przeciw wirusowi zapalenia wątroby C, znamienny tym, że dostarcza się aktywną proteazę wirusa zapalenia wątroby C, o częściowej wewnętrznej sekwencji aminokwasów wybranej z grupy obejmującej:
Trp Thr Val Tyr His Gly Ala (Gl^y Thr Arg Tir·- ; t Leu Lys Gly Ser Ser Gly Gly Pro Leu- lub Arg Arg Gly Arg: G lu Ile Leu Leu Gll Pro Ala Asp Gly Met Val Ser Lys GlG TTp Apg Leu Leu Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr· Aa: Gly Leu Leu Gly Sys Ile Ile TIpl Ser Leu Thr Gly Arg Arp Lys Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr A Au Ala Gln ThP Phh Leu Ala T^ł^r Cys Ile Asn Gly Val Cys TTp Thr Val Tyr HHs Gly Ala Gly Thr Apg Thr Ile Ala Ser· P pp Lys Gly Ppo Val Ile Gln Met Tyr ThP Asn Val Asp Gln Agp •Leu Val Gly Trp Ppo Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Sys Thr Cs· Gly Ser Ser Asp Leu Tyr Leu Val Thr Arp His Ala Asp Val Ile Pro Val Atrg Apg Arg Gly Asp Ser Arp Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys G Gu Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala V al Gly Ile Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Llt Ala Val Asp Phe Ile Pro VaL Glu Asn Leu Glu Thr Thr Met Arg· -; i kontaktuje się tę proteazę ze związkiem mającym zdolność hamowania aktywności proteazy serynowej przy czym związek hamujący aktywność proteazy serynowej naśladuje miejsce odszczepiania rozpoznawane przez proteazę i jest wybierany sposób trójfluorometyloketonów, peptydu kwasu peptydoboronowego, peptydu-a-ketoestru, związków pepty difluoroketonowych, peptydoaldehydów, peptydodiketonów, przeciwciał i pochodnych przeciwciał, a następnie mierzy się stopień hamowania aktywności proteolitycznej proteazy wirusa zapalenia wątroby C. - 2. Sposób według zastrz. 1, znamienny tym , ze jako aktywną proteazę wirnsa wątroby C stoouje się proteaaz obejmującą zasadniczo następującą częściową wewnętrzną sekwencję aminokwasów:... Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr . . .
- 3. Sposób według zastrz. 1, znamienny tym, że jako aktywną proteazę wirusa zapalenia wątroby C stosuje się proteazę obejmującą zasadniczą następującą częściową wewnętrzną sekwencję aminokwasów:... Leu Lys Gly Ser Ser Gly Gly Pro Leu ...169 273
- 4. Sposób według zastrz. 1, znamienny tym, że jako aktywną proteazę wirusa zapalenia wątroby C stosuje się proteazę obejmującą zasadniczo częściową wewnętrzną sekwencję aminokwasów:
Arg Arg Gly Arr Glu Ile Leu Leu GGl Pro Ala Asp GGl Te e Val Ser Lys G Gy Trp Arg Leu Leu AAl Pro Ile Thr AAl Tts Ala Gln G1g TTh Grg Gly Leu Leu GGl Cys Ile Ile; TTh Tsu Leu Thr GIjt AAr Tsp Lys Asn Gln Val Glu Gly Glu Vv1 Gyy Ile Val Ser Thh Ala Ala Gin Thr PPe Leu Ala Thr Cys III Asn Gly Val C ys Trp Thr Val Tyr Hhs Gly Ala Gly Thr Arg Thr Ile Ala S se Pro Lys Gly Pro Val Ile Gin Met Tyr TTr Asn Val Asp GGl Asp Leu Val Gly Trp Pro Ala Pro Gl^n Gly Ser Arg Ser Leu GM^ar Pro Cys Thr Cys Gly Ser Ser? Asp Lm Tyr Leu Val TTh Girg His Ala Asp Val Ile Pro Val Arg AAg Arg Gly Asp S se Arg Gly Ser Leu Leu Ser Pro Arg Ppo Ili! Ser Tyr Leu Lyy Gly Ser Ser Gly Gly Pro Leu Leu Cys Ppo Ala Gly His A Al Tal Gly Ile Phe Arg Ala Ala Val Cyy TPh Arg Gly Val AAl Tys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu Thr TTh Met Arg. ★ * *
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US50543390A | 1990-04-04 | 1990-04-04 | |
| PCT/US1991/002210 WO1991015575A1 (en) | 1990-04-04 | 1991-04-04 | Hepatitis c virus protease |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| PL169273B1 true PL169273B1 (pl) | 1996-06-28 |
Family
ID=24010295
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PL91296328A PL169273B1 (pl) | 1990-04-04 | 1991-04-04 | skierowanej przeciw wirusowi zapalenia watroby C PL |
Country Status (12)
| Country | Link |
|---|---|
| US (7) | US5371017A (pl) |
| EP (2) | EP1304335B1 (pl) |
| JP (3) | JP3320411B2 (pl) |
| AT (2) | ATE433460T1 (pl) |
| AU (1) | AU7675491A (pl) |
| CA (1) | CA2079105C (pl) |
| DE (2) | DE69133617D1 (pl) |
| DK (1) | DK0527788T3 (pl) |
| ES (2) | ES2324597T3 (pl) |
| IE (1) | IE911129A1 (pl) |
| PL (1) | PL169273B1 (pl) |
| WO (1) | WO1991015575A1 (pl) |
Families Citing this family (103)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6194140B1 (en) * | 1990-04-04 | 2001-02-27 | Chiron Corporation | HCV NS3 protein fragments having helicase activity and improved solubility |
| CA2079105C (en) | 1990-04-04 | 2000-06-13 | Michael Houghton | Hepatitis c virus protease |
| KR100217483B1 (ko) * | 1990-04-06 | 1999-09-01 | 프랭크 쿵 | C형 간염 바이러스 에피토프 |
| ATE229543T1 (de) * | 1991-06-24 | 2002-12-15 | Chiron Corp | Polypeptide des hepatitis c-virus (hiv) |
| IT1272179B (it) * | 1994-02-23 | 1997-06-16 | Angeletti P Ist Richerche Bio | Metodologia per riprodurre in vitro l'attivita' proteolitica della proteasi ns3 del virus hcv. |
| DE4428705A1 (de) * | 1994-08-12 | 1996-02-15 | Boehringer Mannheim Gmbh | Rekombinantes Antigen aus der NS3-Region des Hepatitis C Virus |
| US5861267A (en) * | 1995-05-01 | 1999-01-19 | Vertex Pharmaceuticals Incorporated | Methods, nucleotide sequences and host cells for assaying exogenous and endogenous protease activity |
| US5767233A (en) * | 1995-05-12 | 1998-06-16 | Schering Corporation | Soluble cleavable substrates of the hepatitis C virus protease |
| US5843752A (en) * | 1995-05-12 | 1998-12-01 | Schering Corporation | Soluble active hepatitis C virus protease |
| US5698396A (en) * | 1995-06-07 | 1997-12-16 | Ludwig Institute For Cancer Research | Method for identifying auto-immunoreactive substances from a subject |
| IT1277914B1 (it) * | 1995-08-22 | 1997-11-12 | Angeletti P Ist Richerche Bio | Procedimento per produrre - in forma pura e in quantita' elevate - polipeptidi con l'attivita' proteolitica della proteasi ns3 di hcv, e |
| US7235394B1 (en) | 1995-08-29 | 2007-06-26 | Washington University | Functional DNA clone for hepatitis C virus (HCV) and uses thereof |
| US6127116A (en) | 1995-08-29 | 2000-10-03 | Washington University | Functional DNA clone for hepatitis C virus (HCV) and uses thereof |
| EP0876512A1 (en) * | 1996-01-23 | 1998-11-11 | Viropharma Incorporated | Methods for identifying inhibitors of rna viruses |
| US5766916A (en) * | 1996-04-24 | 1998-06-16 | Genelabs Technologies, Inc. | Hepatitis G virus protease |
| US5990276A (en) * | 1996-05-10 | 1999-11-23 | Schering Corporation | Synthetic inhibitors of hepatitis C virus NS3 protease |
| US5861297A (en) * | 1996-09-27 | 1999-01-19 | Merck & Co., Inc. | Detergent-free hepatitis C protease |
| US6436666B1 (en) * | 1996-10-17 | 2002-08-20 | Chiron Corporation | Protease regulator screening assay |
| US7049428B1 (en) | 1998-03-04 | 2006-05-23 | Washington University | HCV variants |
| US7338759B1 (en) | 1997-03-04 | 2008-03-04 | Washington University | HCV variants |
| US5849800A (en) * | 1997-03-28 | 1998-12-15 | The Penn State Research Foundation | Use of amantadine for treatment of Hepatitis C |
| US20020034732A1 (en) * | 1997-07-30 | 2002-03-21 | Daniel J. Capon | Compositions and methods for determining anti-viral drug susceptibility and resistance and anti-viral drug screening |
| US7078500B1 (en) * | 1998-01-30 | 2006-07-18 | The General Hospital Corporation | Genetic immunization with nonstructural proteins of hepatitis C virus |
| CN101126095A (zh) * | 1998-01-30 | 2008-02-20 | 总医院有限公司 | 采用丙型肝炎病毒非结构蛋白进行的基因免疫 |
| AU768177B2 (en) * | 1998-04-02 | 2003-12-04 | Viropharma Incorporated | Hepatitis C virus NS5B compositions and methods of use thereof |
| CA2658218C (en) | 1998-04-17 | 2014-10-28 | Innogenetics N.V. | Improved immunodiagnostic assays using reducing agents |
| US6280940B1 (en) | 1998-08-05 | 2001-08-28 | Agouron Pharmaceuticals, Inc. | Reporter gene system for use in cell-based assessment of inhibitors of the Hepatitis C virus protease |
| AU2217800A (en) * | 1998-12-24 | 2000-07-31 | Small Molecule Therapeutics, Inc. | Methods and compositions for identifying protease modulators |
| EP1141255A4 (en) * | 1999-01-08 | 2002-09-11 | Bristol Myers Squibb Co | MODIFIED FORMS OF HEPATITIS C VIRUS NS3 PROTEASE |
| US7084266B1 (en) | 1999-06-04 | 2006-08-01 | The United States Of America As Represented By The Department Of Health And Human Services | Cloned genome of infectious hepatitus C virus of genotype 2A and uses thereof |
| DE60034884T2 (de) * | 1999-06-04 | 2008-01-17 | The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Klonierte genome von infektiösen hepatitis c viren genotyp 2a und deren verwendungen |
| EP1228370A2 (en) * | 1999-11-10 | 2002-08-07 | Structural Bioinformatics Inc. | Computationally derived protein structures in pharmacogenomics |
| US20060141480A1 (en) * | 1999-11-10 | 2006-06-29 | Kalyanaraman Ramnarayan | Use of computationally derived protein structures of genetic polymorphisms in pharmacogenomics and clinical applications |
| US20050074465A1 (en) * | 1999-11-24 | 2005-04-07 | Michael Houghton | HCV fusion proteins with modified NS3 domains |
| US6986892B1 (en) * | 1999-11-24 | 2006-01-17 | Chiron Corporation | Immunogenic Hepatitis C virus non-structural polypeptides |
| MXPA02009920A (es) | 2000-04-05 | 2003-03-27 | Schering Corp | Inhibidores macrociclicos de la ns3-serina proteasa, del virus de la hepatitis c9 que comprenden partes p2 n-ciclicas. |
| HUP0302957A2 (hu) | 2000-04-19 | 2003-12-29 | Schering Corporation | Hepatitis C vírus alkil- és aril-alanin P2 csoportokat tartalmazó makrociklusos NS-3 szerin proteáz inhibitorai |
| MY164523A (en) | 2000-05-23 | 2017-12-29 | Univ Degli Studi Cagliari | Methods and compositions for treating hepatitis c virus |
| EP1160332A1 (en) * | 2000-05-30 | 2001-12-05 | Amsterdam Support Diagnostics B.V. | Methods for detecting enzymatic activity or detecting resistance to enzyme inhibitors |
| US7491808B2 (en) * | 2000-06-15 | 2009-02-17 | Novartis Vaccines And Diagnostics, Inc. | HCV non-structural protein mutants and uses thereof |
| CA2418199A1 (en) * | 2000-07-21 | 2002-01-31 | Corvas International, Inc. | Peptides as ns3-serine protease inhibitors of hepatitis c virus |
| US7244721B2 (en) | 2000-07-21 | 2007-07-17 | Schering Corporation | Peptides as NS3-serine protease inhibitors of hepatitis C virus |
| ES2341534T3 (es) | 2000-07-21 | 2010-06-22 | Schering Corporation | Peptidos como inhibidores de la serina proteasa ns3 del virus de la hepatitis c. |
| AU8063701A (en) * | 2000-07-21 | 2002-02-05 | Schering Corp | Novel peptides as NS3-serine protease inhibitors of hepatitis C virus |
| AR029851A1 (es) * | 2000-07-21 | 2003-07-16 | Dendreon Corp | Nuevos peptidos como inhibidores de ns3-serina proteasa del virus de hepatitis c |
| US6680059B2 (en) * | 2000-08-29 | 2004-01-20 | Tripep Ab | Vaccines containing ribavirin and methods of use thereof |
| US7022830B2 (en) | 2000-08-17 | 2006-04-04 | Tripep Ab | Hepatitis C virus codon optimized non-structural NS3/4A fusion gene |
| WO2002013855A2 (en) * | 2000-08-17 | 2002-02-21 | Tripep Ab | Vaccines containing ribavirin and methods of use thereof |
| RU2286172C2 (ru) * | 2000-08-17 | 2006-10-27 | Трипеп Аб | Вакцины, содержащие рибавирин, и способы их использования |
| DE60138567D1 (de) | 2000-12-12 | 2009-06-10 | Schering Corp | Diarylrest entfassende peptide als inhibitoren des ns-3 serinproteases von hepatitis c virus |
| AU2002330154A1 (en) * | 2001-09-28 | 2003-04-07 | Centre National De La Recherche Scientifique | Methods and compositions for treating hepatitis c virus using 4'-modified nucleosides |
| KR20040077767A (ko) * | 2002-01-23 | 2004-09-06 | 쉐링 코포레이션 | C형 간염 바이러스 감염 치료용 ns3-세린 프로테아제억제제로서의 프롤린 화합물 |
| EP1497469A4 (en) * | 2002-04-04 | 2005-06-08 | Achillion Pharmaceuticals Inc | TEST FOR ASSESSING THE ACTIVITY OF COMPOUNDS AGAINST HCV USING A NOVEL DETECTION SYSTEM IN THE HCV REPLICIC |
| US7666627B2 (en) * | 2002-08-08 | 2010-02-23 | Targetex Kft. | Folded recombinant catalytic fragments of multidomain serine proteases, preparation and uses thereof |
| US7439042B2 (en) * | 2002-12-16 | 2008-10-21 | Globeimmune, Inc. | Yeast-based therapeutic for chronic hepatitis C infection |
| JP2006526394A (ja) * | 2003-06-03 | 2006-11-24 | ベニテック オーストラリア リミテッド | 二本鎖核酸 |
| WO2005017125A2 (en) * | 2003-08-14 | 2005-02-24 | California Institute Of Molecular Medicine | Method for isolation and replication of infectious human hepatitis-c virus |
| CA2536570A1 (en) * | 2003-08-26 | 2005-03-10 | Schering Corporation | Novel peptidomimetic ns3-serine protease inhibitors of hepatitis c virus |
| AR046166A1 (es) * | 2003-09-26 | 2005-11-30 | Schering Corp | Inhibidores macrociclicos de la serina proteasa ns3 del virus de la hepatitis c |
| US20110150835A1 (en) * | 2003-09-26 | 2011-06-23 | Schering Corporation | Macrocyclic Inhibitors of Hepatitis C Virus NS3 Serine Protease |
| CA2546290A1 (en) * | 2003-11-20 | 2005-06-09 | Schering Corporation | Depeptidized inhibitors of hepatitis c virus ns3 protease |
| AU2005222056A1 (en) | 2004-02-27 | 2005-09-22 | Schering Corporation | Novel compounds as inhibitors of hepatitis C virus NS3 serine protease |
| ES2328589T3 (es) | 2004-02-27 | 2009-11-16 | Schering Corporation | Compuestos de la prolina 3,4(ciclopentil) fusionados como inhibidores de la proteasa serina ns3 del virus de la hepatitis c. |
| NZ549223A (en) * | 2004-02-27 | 2010-10-29 | Schering Corp | Sulfur compounds as inhibitors of hepatitis C virus NS3 serine protease |
| WO2005087721A2 (en) * | 2004-02-27 | 2005-09-22 | Schering Corporation | Compounds as inhibitors of hepatitis c virus ns3 serine protease |
| US7816326B2 (en) * | 2004-02-27 | 2010-10-19 | Schering Corporation | Sulfur compounds as inhibitors of hepatitis C virus NS3 serine protease |
| AU2005219859A1 (en) * | 2004-02-27 | 2005-09-15 | Schering Corporation | Inhibitors of hepatitis C virus NS3 protease |
| CA2558771C (en) * | 2004-03-05 | 2013-01-08 | Benitec, Inc. | Multiple promoter expression cassettes for simultaneous delivery of rnai agents |
| PE20060309A1 (es) * | 2004-05-06 | 2006-04-13 | Schering Corp | (1r,2s,5s)-n-[(1s)-3-amino-1-(ciclobutilmetil)-2,3-dioxopropil]-3-[(2s)-2[[[(1,1-dimetiletil)amino]carbonil]amino]-3,3-dimetil-1-oxobutil]-6,6-dimetil-3-azabiciclo[3.1.o]hexan-2-carboxamida como inhibidor de la ns3/ns4a serina proteasa del virus de l |
| EP1773868B1 (en) | 2004-05-20 | 2009-07-15 | Schering Corporation | Substituted prolines as inhibitors of hepatitis c virus ns3 serine protease |
| CA2577812A1 (en) * | 2004-08-27 | 2006-03-09 | Schering Corporation | Acylsulfonamide compounds as inhibitors of hepatitis c virus ns3 serine protease |
| CN102614510A (zh) * | 2004-10-18 | 2012-08-01 | 全球免疫股份有限公司 | 基于酵母的对慢性丙型肝炎感染的治疗 |
| WO2006121468A1 (en) * | 2004-11-22 | 2006-11-16 | Genelabs Technologies, Inc. | 5-nitro-nucleoside compounds for treating viral infections |
| US7524825B2 (en) * | 2005-02-28 | 2009-04-28 | Smithkline Beecham Corporation | Tricyclic-nucleoside compounds for treating viral infections |
| US7405204B2 (en) * | 2005-04-25 | 2008-07-29 | Genelabs Technologies, Inc. | Nucleoside compounds for treating viral infections |
| US7968697B2 (en) * | 2005-05-25 | 2011-06-28 | Chrontech Pharma Ab | Hepatitis C virus non-structural NS3/4A fusion gene |
| US20070237818A1 (en) * | 2005-06-02 | 2007-10-11 | Malcolm Bruce A | Controlled-release formulation of HCV protease inhibitor and methods using the same |
| WO2006130686A2 (en) | 2005-06-02 | 2006-12-07 | Schering Corporation | Hcv protease inhibitors in combination with food |
| AU2006252553B2 (en) * | 2005-06-02 | 2012-03-29 | Merck Sharp & Dohme Corp. | Combination of HCV protease inhibitors with a surfactant |
| CN101223161A (zh) * | 2005-06-24 | 2008-07-16 | 健亚生物科技公司 | 治疗病毒感染的杂芳基衍生物 |
| PE20071230A1 (es) * | 2006-02-09 | 2008-01-16 | Schering Corp | Combinaciones y metodos de inhibidores del vhc |
| US20090220457A1 (en) * | 2006-03-03 | 2009-09-03 | Lahser Frederick C | Combinations comprising hcv protease inhibitor(s) and hcv ires inhibitor(s), and methods of treatment related thereto |
| JP2009530382A (ja) * | 2006-03-23 | 2009-08-27 | シェーリング コーポレイション | Hcvプロテアーゼインヒビターとcyp3a4インヒビターとの組み合わせ、および関連する処置方法 |
| EP2007789B1 (en) | 2006-04-11 | 2015-05-20 | Novartis AG | Spirocyclic HCV/HIV inhibitors and their uses |
| EP2049536A2 (en) * | 2006-07-20 | 2009-04-22 | Genelabs Technologies, Inc. | Polycyclic viral inhibitors |
| WO2009022236A2 (en) | 2007-08-16 | 2009-02-19 | Tripep Ab | Immunogen platform |
| WO2009029729A1 (en) * | 2007-08-31 | 2009-03-05 | Genelabs Technologies, Inc. | Amino tricyclic-nucleoside compounds, compositions, and methods of use |
| BRPI0818488A2 (pt) * | 2007-10-30 | 2015-04-14 | Intermune Inc | Genotipagem e fenotipagem de hcv |
| TW201546079A (zh) | 2007-12-21 | 2015-12-16 | Celgene Avilomics Res Inc | Hcv蛋白酶抑制劑及其用途(一) |
| US8309685B2 (en) | 2007-12-21 | 2012-11-13 | Celgene Avilomics Research, Inc. | HCV protease inhibitors and uses thereof |
| WO2009082697A1 (en) * | 2007-12-21 | 2009-07-02 | Avila Therapeutics, Inc. | Hcv protease inhibitors and uses thereof |
| US8293705B2 (en) | 2007-12-21 | 2012-10-23 | Avila Therapeutics, Inc. | HCV protease inhibitors and uses thereof |
| US7699111B2 (en) * | 2008-01-29 | 2010-04-20 | Tam International, Inc. | Float collar and method |
| WO2009130588A2 (en) * | 2008-04-22 | 2009-10-29 | Tripep Ab | Immunogen platform |
| CN102816106A (zh) | 2008-06-24 | 2012-12-12 | 默沙东公司 | 用于制备基本上立体异构纯的稠合二环脯氨酸化合物的生物催化方法 |
| US8188137B2 (en) | 2008-08-15 | 2012-05-29 | Avila Therapeutics, Inc. | HCV protease inhibitors and uses thereof |
| US8728489B2 (en) | 2008-09-19 | 2014-05-20 | Globeimmune, Inc. | Immunotherapy for chronic hepatitis C virus infection |
| CA2746258A1 (en) | 2008-12-12 | 2010-06-17 | Schering Corporation | Deuterated compounds as hepatitis c virus (hcv) inhibitors |
| US20110027229A1 (en) | 2009-07-31 | 2011-02-03 | Medtronic, Inc. | Continuous subcutaneous administration of interferon-alpha to hepatitis c infected patients |
| US8324239B2 (en) | 2010-04-21 | 2012-12-04 | Novartis Ag | Furopyridine compounds and uses thereof |
| MA34462B1 (fr) | 2010-07-22 | 2013-08-01 | Novartis Ag | Composes de thiophene 2,3,5- trisubstitues et leurs utilisations |
| EP2658857B1 (en) | 2010-12-29 | 2016-11-02 | Inhibitex, Inc. | Substituted purine nucleosides, phosphoroamidate and phosphorodiamidate derivatives for treatment of viral infections |
| KR101784455B1 (ko) | 2015-12-04 | 2017-10-11 | 주식회사 바이오노트 | C형 간염 바이러스의 친수성 단편을 포함하는 융합 폴리펩티드, 그를 포함하는 c형 간염 바이러스 감염을 진단하기 위한 조성물, 키트, 및 방법 |
Family Cites Families (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4702909A (en) * | 1982-05-05 | 1987-10-27 | Louisiana State University A & M | Non-A, non-B hepatitis antigen, antigen compositions, vaccine and diagnostic reagent |
| US4870026A (en) * | 1982-09-16 | 1989-09-26 | The General Hospital Corporation | Non-A, non-B. hepatitis, virus, methods of identification purification, characterization, diagnosis and immunization |
| CA1293591C (en) * | 1985-01-11 | 1991-12-24 | Charles A. Kettner | Peptide substrates for detecting virus-specified protease activity |
| US4673634A (en) * | 1985-03-08 | 1987-06-16 | The United States Of America As Represented By The Department Of Health And Human Services | Purified antigen from non-A, non-B hepatitis causing factor |
| US5523215A (en) * | 1985-03-28 | 1996-06-04 | Chiron Corporation | Enhanced purification and expression of insoluble recombinant proteins |
| US5218099A (en) * | 1986-04-01 | 1993-06-08 | The United States Of America As Represented By The Department Of Health And Human Services | Post-transfusion, non-A, non-B hepatitis virus polynucleotides |
| EP0318216B2 (en) * | 1987-11-18 | 2001-08-29 | Chiron Corporation | NANBV diagnostics |
| US5350671A (en) * | 1987-11-18 | 1994-09-27 | Chiron Corporation | HCV immunoassays employing C domain antigens |
| US5010175A (en) * | 1988-05-02 | 1991-04-23 | The Regents Of The University Of California | General method for producing and selecting peptides with specific properties |
| US5176994A (en) * | 1988-12-21 | 1993-01-05 | Immuno Japan Inc. | Non-A, Non-B hepatitis virus genome RNA, cDNA and virus antigen protein |
| HU225068B1 (en) | 1989-03-17 | 2006-05-29 | Chiron Corp | Process for producing diagnostics and vaccine of nanbh |
| US5372928A (en) * | 1989-09-15 | 1994-12-13 | Chiron Corporation | Hepatitis C virus isolates |
| CA2065287C (en) | 1989-09-15 | 1999-12-21 | Tatsuo Miyamura | New hcv isolates |
| CA2079105C (en) | 1990-04-04 | 2000-06-13 | Michael Houghton | Hepatitis c virus protease |
| US5258496A (en) * | 1990-07-10 | 1993-11-02 | Scios Nova Inc. | Isolation and purification of lung surfactant protein |
| ES2082231T3 (es) | 1990-09-21 | 1996-03-16 | Salk Inst For Biological Studi | Metodos mediados por el complejo proteinico proto-oncogenico ap-1. |
-
1991
- 1991-04-04 CA CA002079105A patent/CA2079105C/en not_active Expired - Lifetime
- 1991-04-04 WO PCT/US1991/002210 patent/WO1991015575A1/en not_active Ceased
- 1991-04-04 AT AT02019415T patent/ATE433460T1/de not_active IP Right Cessation
- 1991-04-04 PL PL91296328A patent/PL169273B1/pl unknown
- 1991-04-04 EP EP02019415A patent/EP1304335B1/en not_active Expired - Lifetime
- 1991-04-04 DE DE69133617T patent/DE69133617D1/de not_active Expired - Lifetime
- 1991-04-04 AT AT91908105T patent/ATE270326T1/de not_active IP Right Cessation
- 1991-04-04 AU AU76754/91A patent/AU7675491A/en not_active Abandoned
- 1991-04-04 DE DE69133402T patent/DE69133402T2/de not_active Expired - Lifetime
- 1991-04-04 JP JP50763191A patent/JP3320411B2/ja not_active Expired - Lifetime
- 1991-04-04 DK DK91908105T patent/DK0527788T3/da active
- 1991-04-04 US US07/680,296 patent/US5371017A/en not_active Expired - Lifetime
- 1991-04-04 IE IE112991A patent/IE911129A1/en not_active IP Right Cessation
- 1991-04-04 EP EP91908105A patent/EP0527788B1/en not_active Expired - Lifetime
- 1991-04-04 ES ES02019415T patent/ES2324597T3/es not_active Expired - Lifetime
- 1991-04-04 ES ES91908105T patent/ES2219637T3/es not_active Expired - Lifetime
-
1994
- 1994-12-06 US US08350884 patent/US5585258C1/en not_active Expired - Lifetime
-
1995
- 1995-05-12 US US08440548 patent/US5597691C1/en not_active Expired - Lifetime
-
1996
- 1996-09-06 US US08/709,177 patent/US5885799A/en not_active Expired - Lifetime
- 1996-09-06 US US08/709,173 patent/US5712145A/en not_active Expired - Lifetime
-
2001
- 2001-06-11 JP JP2001176369A patent/JP3507045B2/ja not_active Expired - Lifetime
- 2001-06-18 US US09/884,456 patent/US20030027317A1/en not_active Abandoned
- 2001-06-18 US US09/884,455 patent/US20030064499A1/en not_active Abandoned
-
2003
- 2003-10-31 JP JP2003373722A patent/JP2004073212A/ja not_active Withdrawn
Also Published As
| Publication number | Publication date |
|---|---|
| IE20060594A1 (en) | 2009-05-27 |
| US5712145A (en) | 1998-01-27 |
| US5371017A (en) | 1994-12-06 |
| EP0527788A1 (en) | 1993-02-24 |
| JP3507045B2 (ja) | 2004-03-15 |
| EP1304335B1 (en) | 2009-06-10 |
| US20030064499A1 (en) | 2003-04-03 |
| EP0527788B1 (en) | 2004-06-30 |
| CA2079105C (en) | 2000-06-13 |
| JP2004073212A (ja) | 2004-03-11 |
| DE69133402T2 (de) | 2004-11-11 |
| JP3320411B2 (ja) | 2002-09-03 |
| US5597691C1 (en) | 2001-12-11 |
| US5597691A (en) | 1997-01-28 |
| DK0527788T3 (da) | 2004-09-06 |
| EP1304335A3 (en) | 2004-04-07 |
| ATE270326T1 (de) | 2004-07-15 |
| WO1991015575A1 (en) | 1991-10-17 |
| IE911129A1 (en) | 1991-10-09 |
| CA2079105A1 (en) | 1991-10-05 |
| ATE433460T1 (de) | 2009-06-15 |
| US20030027317A1 (en) | 2003-02-06 |
| ES2324597T3 (es) | 2009-08-11 |
| JP2002051791A (ja) | 2002-02-19 |
| US5585258C1 (en) | 2002-01-15 |
| AU7675491A (en) | 1991-10-30 |
| US5585258A (en) | 1996-12-17 |
| EP1304335A2 (en) | 2003-04-23 |
| ES2219637T3 (es) | 2004-12-01 |
| US5885799A (en) | 1999-03-23 |
| JPH05507612A (ja) | 1993-11-04 |
| DE69133617D1 (de) | 2009-07-23 |
| DE69133402D1 (de) | 2004-08-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| PL169273B1 (pl) | skierowanej przeciw wirusowi zapalenia watroby C PL | |
| IE84608B1 (en) | Hepatitis C virus protease | |
| US6472180B1 (en) | HCV NS3 protein fragments having helicase activity and improved solubility | |
| US20030082518A1 (en) | Reporter gene system for use in cell-based assessment of inhibitors of the hepatitis C virus protease | |
| Pethel et al. | Mutational analysis of the octapeptide sequence motif at the NS1-NS2A cleavage junction of dengue type 4 virus | |
| WO1991015596A1 (en) | Hepatitis c virus protease inhibitors | |
| WO1997040168A1 (en) | Hepatitis g virus protease | |
| IE85503B1 (en) | Hepatitis c virus protease |