KR20230075436A - 번역 인자를 과발현하는 숙주 세포 - Google Patents
번역 인자를 과발현하는 숙주 세포 Download PDFInfo
- Publication number
- KR20230075436A KR20230075436A KR1020237010094A KR20237010094A KR20230075436A KR 20230075436 A KR20230075436 A KR 20230075436A KR 1020237010094 A KR1020237010094 A KR 1020237010094A KR 20237010094 A KR20237010094 A KR 20237010094A KR 20230075436 A KR20230075436 A KR 20230075436A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ile
- glu
- val
- thr
- Prior art date
Links
- 238000013519 translation Methods 0.000 title description 32
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 316
- 230000014509 gene expression Effects 0.000 claims abstract description 262
- 101150055292 TIF gene Proteins 0.000 claims abstract description 85
- 101710091919 Eukaryotic translation initiation factor 4G Proteins 0.000 claims abstract description 46
- 108091060294 Messenger RNP Proteins 0.000 claims abstract description 39
- 101100232687 Drosophila melanogaster eIF4A gene Proteins 0.000 claims abstract description 37
- 230000014621 translational initiation Effects 0.000 claims abstract description 37
- 238000012239 gene modification Methods 0.000 claims abstract description 27
- 230000005017 genetic modification Effects 0.000 claims abstract description 27
- 235000013617 genetically modified food Nutrition 0.000 claims abstract description 27
- 102000005877 Peptide Initiation Factors Human genes 0.000 claims abstract description 21
- 108010044843 Peptide Initiation Factors Proteins 0.000 claims abstract description 21
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 claims abstract description 6
- 210000004027 cell Anatomy 0.000 claims description 383
- 102000004169 proteins and genes Human genes 0.000 claims description 142
- 238000000034 method Methods 0.000 claims description 98
- 102000040430 polynucleotide Human genes 0.000 claims description 91
- 108091033319 polynucleotide Proteins 0.000 claims description 91
- 239000002157 polynucleotide Substances 0.000 claims description 91
- 230000000694 effects Effects 0.000 claims description 69
- 241000235058 Komagataella pastoris Species 0.000 claims description 66
- 238000004113 cell culture Methods 0.000 claims description 49
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 43
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 42
- 230000001965 increasing effect Effects 0.000 claims description 42
- 101001082110 Acanthamoeba polyphaga mimivirus Eukaryotic translation initiation factor 4E homolog Proteins 0.000 claims description 35
- 101001082109 Danio rerio Eukaryotic translation initiation factor 4E-1B Proteins 0.000 claims description 33
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 32
- 102100020969 ATP-binding cassette sub-family E member 1 Human genes 0.000 claims description 31
- 102100026090 Polyadenylate-binding protein 1 Human genes 0.000 claims description 31
- 101000783786 Homo sapiens ATP-binding cassette sub-family E member 1 Proteins 0.000 claims description 29
- 238000013518 transcription Methods 0.000 claims description 28
- 229960005486 vaccine Drugs 0.000 claims description 22
- 238000012258 culturing Methods 0.000 claims description 21
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 21
- 229920001184 polypeptide Polymers 0.000 claims description 19
- 241000282414 Homo sapiens Species 0.000 claims description 18
- 241001099156 Komagataella phaffii Species 0.000 claims description 18
- 230000027455 binding Effects 0.000 claims description 17
- 230000001939 inductive effect Effects 0.000 claims description 16
- 230000010354 integration Effects 0.000 claims description 14
- 241000235648 Pichia Species 0.000 claims description 13
- 239000001963 growth medium Substances 0.000 claims description 13
- 102000004190 Enzymes Human genes 0.000 claims description 12
- 108090000790 Enzymes Proteins 0.000 claims description 12
- 241000196324 Embryophyta Species 0.000 claims description 10
- 241000428705 Komagataella pseudopastoris Species 0.000 claims description 9
- 230000004075 alteration Effects 0.000 claims description 9
- 239000000427 antigen Substances 0.000 claims description 9
- 238000006467 substitution reaction Methods 0.000 claims description 9
- 241000699802 Cricetulus griseus Species 0.000 claims description 8
- 241000235070 Saccharomyces Species 0.000 claims description 8
- 108091007433 antigens Proteins 0.000 claims description 8
- 102000036639 antigens Human genes 0.000 claims description 8
- 210000005253 yeast cell Anatomy 0.000 claims description 8
- 241001099157 Komagataella Species 0.000 claims description 7
- 102000037865 fusion proteins Human genes 0.000 claims description 7
- 108020001507 fusion proteins Proteins 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 6
- 241000192700 Cyanobacteria Species 0.000 claims description 6
- 241000320412 Ogataea angusta Species 0.000 claims description 6
- 241000499912 Trichoderma reesei Species 0.000 claims description 6
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 6
- 230000001225 therapeutic effect Effects 0.000 claims description 6
- 241000233866 Fungi Species 0.000 claims description 5
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 5
- 241000159512 Geotrichum Species 0.000 claims description 5
- 241000235649 Kluyveromyces Species 0.000 claims description 5
- 241000235013 Yarrowia Species 0.000 claims description 5
- 241001513093 Aspergillus awamori Species 0.000 claims description 4
- 241000283690 Bos taurus Species 0.000 claims description 4
- 241000699800 Cricetinae Species 0.000 claims description 4
- 241001112159 Ogataea Species 0.000 claims description 4
- 241001489174 Ogataea minuta Species 0.000 claims description 4
- 239000012190 activator Substances 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 230000005026 transcription initiation Effects 0.000 claims description 4
- 241000611184 Amphora Species 0.000 claims description 3
- 241000219194 Arabidopsis Species 0.000 claims description 3
- 240000002900 Arthrospira platensis Species 0.000 claims description 3
- 235000016425 Arthrospira platensis Nutrition 0.000 claims description 3
- 241001467606 Bacillariophyceae Species 0.000 claims description 3
- 101100348617 Candida albicans (strain SC5314 / ATCC MYA-2876) NIK1 gene Proteins 0.000 claims description 3
- 241000195585 Chlamydomonas Species 0.000 claims description 3
- 241000195649 Chlorella <Chlorellales> Species 0.000 claims description 3
- 102000004127 Cytokines Human genes 0.000 claims description 3
- 108090000695 Cytokines Proteins 0.000 claims description 3
- 241000195634 Dunaliella Species 0.000 claims description 3
- 244000068988 Glycine max Species 0.000 claims description 3
- 235000010469 Glycine max Nutrition 0.000 claims description 3
- 241000238631 Hexapoda Species 0.000 claims description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 3
- 240000003183 Manihot esculenta Species 0.000 claims description 3
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 claims description 3
- 240000004658 Medicago sativa Species 0.000 claims description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 3
- 241000224474 Nannochloropsis Species 0.000 claims description 3
- 244000061176 Nicotiana tabacum Species 0.000 claims description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 3
- 241000199478 Ochromonas Species 0.000 claims description 3
- 240000007594 Oryza sativa Species 0.000 claims description 3
- 235000007164 Oryza sativa Nutrition 0.000 claims description 3
- 241000195887 Physcomitrella patens Species 0.000 claims description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 claims description 3
- 241000283984 Rodentia Species 0.000 claims description 3
- 101100007329 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS1 gene Proteins 0.000 claims description 3
- 101100221606 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS7 gene Proteins 0.000 claims description 3
- 235000005775 Setaria Nutrition 0.000 claims description 3
- 241000232088 Setaria <nematode> Species 0.000 claims description 3
- 240000003768 Solanum lycopersicum Species 0.000 claims description 3
- 244000061456 Solanum tuberosum Species 0.000 claims description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 3
- 235000021307 Triticum Nutrition 0.000 claims description 3
- 240000008042 Zea mays Species 0.000 claims description 3
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 3
- 102000025171 antigen binding proteins Human genes 0.000 claims description 3
- 108091000831 antigen binding proteins Proteins 0.000 claims description 3
- 239000012502 diagnostic product Substances 0.000 claims description 3
- 102000034356 gene-regulatory proteins Human genes 0.000 claims description 3
- 108091006104 gene-regulatory proteins Proteins 0.000 claims description 3
- 229940088597 hormone Drugs 0.000 claims description 3
- 239000005556 hormone Substances 0.000 claims description 3
- 210000003292 kidney cell Anatomy 0.000 claims description 3
- 235000009973 maize Nutrition 0.000 claims description 3
- 201000000050 myeloid neoplasm Diseases 0.000 claims description 3
- 230000000174 oncolytic effect Effects 0.000 claims description 3
- 210000001672 ovary Anatomy 0.000 claims description 3
- 235000009566 rice Nutrition 0.000 claims description 3
- 229940082787 spirulina Drugs 0.000 claims description 3
- 230000003115 biocidal effect Effects 0.000 claims description 2
- 239000003102 growth factor Substances 0.000 claims description 2
- 231100000765 toxin Toxicity 0.000 claims description 2
- 239000003053 toxin Substances 0.000 claims description 2
- 101001120260 Homo sapiens Polyadenylate-binding protein 1 Proteins 0.000 claims 4
- 244000098338 Triticum aestivum Species 0.000 claims 1
- 230000002503 metabolic effect Effects 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 130
- 230000002018 overexpression Effects 0.000 description 126
- 239000002773 nucleotide Substances 0.000 description 62
- 125000003729 nucleotide group Chemical group 0.000 description 62
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 60
- 238000004519 manufacturing process Methods 0.000 description 56
- 230000014616 translation Effects 0.000 description 56
- 150000007523 nucleic acids Chemical class 0.000 description 52
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 51
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 51
- 230000028327 secretion Effects 0.000 description 43
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 38
- 102000039446 nucleic acids Human genes 0.000 description 38
- 108020004707 nucleic acids Proteins 0.000 description 38
- 102100022133 Complement C3 Human genes 0.000 description 37
- 101000901154 Homo sapiens Complement C3 Proteins 0.000 description 37
- 108091028043 Nucleic acid sequence Proteins 0.000 description 36
- 239000013598 vector Substances 0.000 description 32
- -1 YH-16 Proteins 0.000 description 31
- 108020004999 messenger RNA Proteins 0.000 description 29
- 239000013612 plasmid Substances 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 28
- 230000012010 growth Effects 0.000 description 27
- 239000000047 product Substances 0.000 description 27
- 238000012216 screening Methods 0.000 description 27
- 108010076504 Protein Sorting Signals Proteins 0.000 description 26
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 26
- 230000035897 transcription Effects 0.000 description 26
- 101710103012 Polyadenylate-binding protein, cytoplasmic and nuclear Proteins 0.000 description 25
- 230000008859 change Effects 0.000 description 23
- 102000008016 Eukaryotic Initiation Factor-3 Human genes 0.000 description 22
- 108010089790 Eukaryotic Initiation Factor-3 Proteins 0.000 description 22
- 241000894007 species Species 0.000 description 21
- 108091006905 Human Serum Albumin Proteins 0.000 description 20
- 102000008100 Human Serum Albumin Human genes 0.000 description 20
- 235000001014 amino acid Nutrition 0.000 description 20
- 150000001413 amino acids Chemical class 0.000 description 20
- 239000013604 expression vector Substances 0.000 description 19
- 108091026890 Coding region Proteins 0.000 description 16
- 101710140859 E3 ubiquitin ligase TRAF3IP2 Proteins 0.000 description 16
- 102100026620 E3 ubiquitin ligase TRAF3IP2 Human genes 0.000 description 16
- 239000002609 medium Substances 0.000 description 16
- 239000012071 phase Substances 0.000 description 16
- 230000001105 regulatory effect Effects 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 15
- 108010057821 leucylproline Proteins 0.000 description 15
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 14
- 108010038633 aspartylglutamate Proteins 0.000 description 14
- 108010009298 lysylglutamic acid Proteins 0.000 description 14
- 239000006228 supernatant Substances 0.000 description 14
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 13
- 108090001061 Insulin Proteins 0.000 description 13
- 102000004877 Insulin Human genes 0.000 description 13
- 125000003275 alpha amino acid group Chemical group 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 13
- 239000003623 enhancer Substances 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 235000011187 glycerol Nutrition 0.000 description 13
- 229940125396 insulin Drugs 0.000 description 13
- 238000005457 optimization Methods 0.000 description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 12
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 12
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 12
- 238000011529 RT qPCR Methods 0.000 description 12
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 12
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 12
- 229910052799 carbon Inorganic materials 0.000 description 12
- 238000010367 cloning Methods 0.000 description 12
- 238000000855 fermentation Methods 0.000 description 12
- 230000004151 fermentation Effects 0.000 description 12
- 229960001031 glucose Drugs 0.000 description 12
- 239000008188 pellet Substances 0.000 description 12
- 108010013835 arginine glutamate Proteins 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 108010051242 phenylalanylserine Proteins 0.000 description 11
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 10
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 10
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 10
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 10
- 210000000349 chromosome Anatomy 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 239000008103 glucose Substances 0.000 description 10
- 238000005259 measurement Methods 0.000 description 10
- 230000002103 transcriptional effect Effects 0.000 description 10
- 108010073969 valyllysine Proteins 0.000 description 10
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 9
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 9
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 9
- 101100480861 Caldanaerobacter subterraneus subsp. tengcongensis (strain DSM 15242 / JCM 11007 / NBRC 100824 / MB4) tdh gene Proteins 0.000 description 9
- 101100447466 Candida albicans (strain WO-1) TDH1 gene Proteins 0.000 description 9
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 9
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 9
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 9
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 9
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 9
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 9
- 239000012228 culture supernatant Substances 0.000 description 9
- 229940088598 enzyme Drugs 0.000 description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 9
- 108010017391 lysylvaline Proteins 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 101150088047 tdh3 gene Proteins 0.000 description 9
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 8
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 8
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 8
- 239000002028 Biomass Substances 0.000 description 8
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 8
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 8
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 8
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 8
- KTTMFLSBTNBAHL-MXAVVETBSA-N Ile-Phe-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N KTTMFLSBTNBAHL-MXAVVETBSA-N 0.000 description 8
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 8
- CENKQZWVYMLRAX-ULQDDVLXSA-N Lys-Phe-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CENKQZWVYMLRAX-ULQDDVLXSA-N 0.000 description 8
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 8
- 239000000306 component Substances 0.000 description 8
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 8
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 8
- 235000015097 nutrients Nutrition 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 239000011550 stock solution Substances 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 7
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 7
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 7
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 7
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 7
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 7
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 7
- AREBLHSMLMRICD-PYJNHQTQSA-N Ile-His-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AREBLHSMLMRICD-PYJNHQTQSA-N 0.000 description 7
- 108010050904 Interferons Proteins 0.000 description 7
- 102000014150 Interferons Human genes 0.000 description 7
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 7
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- 108010079364 N-glycylalanine Proteins 0.000 description 7
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 7
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 7
- 108010068265 aspartyltyrosine Proteins 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 7
- 108010081551 glycylphenylalanine Proteins 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 229940079322 interferon Drugs 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 238000011002 quantification Methods 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 230000003248 secreting effect Effects 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 6
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 6
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 6
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 6
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 6
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 6
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 6
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 6
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 6
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 6
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 6
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 6
- 108010065920 Insulin Lispro Proteins 0.000 description 6
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 6
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 6
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 6
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 6
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 6
- 208000001132 Osteoporosis Diseases 0.000 description 6
- 108091005804 Peptidases Proteins 0.000 description 6
- 108010079005 RDV peptide Proteins 0.000 description 6
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 6
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 229960002685 biotin Drugs 0.000 description 6
- 238000005251 capillar electrophoresis Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 6
- 108010089804 glycyl-threonine Proteins 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 102000028499 poly(A) binding Human genes 0.000 description 6
- 108091023021 poly(A) binding Proteins 0.000 description 6
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 6
- OGBMKVWORPGQRR-UMXFMPSGSA-N teriparatide Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 description 6
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 6
- 239000011573 trace mineral Substances 0.000 description 6
- 235000013619 trace mineral Nutrition 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 5
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 5
- 102100036826 Aldehyde oxidase Human genes 0.000 description 5
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 5
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 5
- 102100021277 Beta-secretase 2 Human genes 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 5
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 5
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 5
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 5
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 5
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 5
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 5
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 5
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 5
- ZVJGAXNBBKPYOE-HKUYNNGSSA-N Phe-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 ZVJGAXNBBKPYOE-HKUYNNGSSA-N 0.000 description 5
- 239000004365 Protease Substances 0.000 description 5
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 5
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 5
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 5
- RNDWCRUOGGQDKN-UBHSHLNASA-N Trp-Ser-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RNDWCRUOGGQDKN-UBHSHLNASA-N 0.000 description 5
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 5
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 5
- 108010084455 Zeocin Proteins 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 108010068380 arginylarginine Proteins 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 230000004186 co-expression Effects 0.000 description 5
- 108010079547 glutamylmethionine Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 239000002207 metabolite Substances 0.000 description 5
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 5
- 230000008092 positive effect Effects 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 230000001718 repressive effect Effects 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 230000000699 topical effect Effects 0.000 description 5
- NJIFPLAJSVUQOZ-JBDRJPRFSA-N Ala-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C)N NJIFPLAJSVUQOZ-JBDRJPRFSA-N 0.000 description 4
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 4
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 4
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 4
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 4
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 4
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 4
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 108700039887 Essential Genes Proteins 0.000 description 4
- 102100029782 Eukaryotic translation initiation factor 3 subunit I Human genes 0.000 description 4
- 101710109054 Eukaryotic translation initiation factor 3 subunit I Proteins 0.000 description 4
- 108010054218 Factor VIII Proteins 0.000 description 4
- 102000001690 Factor VIII Human genes 0.000 description 4
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 4
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 4
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 4
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 4
- YXBRCTXAEYSCHS-XVYDVKMFSA-N His-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YXBRCTXAEYSCHS-XVYDVKMFSA-N 0.000 description 4
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 4
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 4
- 101000602930 Homo sapiens Nuclear receptor coactivator 2 Proteins 0.000 description 4
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 4
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 4
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 4
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 4
- 108010047761 Interferon-alpha Proteins 0.000 description 4
- 102000006992 Interferon-alpha Human genes 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 4
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 4
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 4
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 4
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 102100037226 Nuclear receptor coactivator 2 Human genes 0.000 description 4
- 239000001888 Peptone Substances 0.000 description 4
- 108010080698 Peptones Proteins 0.000 description 4
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 4
- 108091000106 RNA cap binding Proteins 0.000 description 4
- 102000028391 RNA cap binding Human genes 0.000 description 4
- 108010025216 RVF peptide Proteins 0.000 description 4
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 4
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 4
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 4
- 108010049264 Teriparatide Proteins 0.000 description 4
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 4
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 4
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 4
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 4
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 4
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 4
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 4
- 230000003698 anagen phase Effects 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 238000010923 batch production Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 4
- 239000006143 cell culture medium Substances 0.000 description 4
- 239000006285 cell suspension Substances 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 229960000301 factor viii Drugs 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 4
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 4
- 150000004676 glycans Chemical class 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 108010040030 histidinoalanine Proteins 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 235000019319 peptone Nutrition 0.000 description 4
- 108010024607 phenylalanylalanine Proteins 0.000 description 4
- 229920001282 polysaccharide Polymers 0.000 description 4
- 239000005017 polysaccharide Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 238000001243 protein synthesis Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000000153 supplemental effect Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 108010080629 tryptophan-leucine Proteins 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 108010027345 wheylin-1 peptide Proteins 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- 239000007221 ypg medium Substances 0.000 description 4
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 3
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 3
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 3
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 3
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 3
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 3
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 3
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 3
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 3
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 3
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 3
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 3
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 3
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 3
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 3
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 3
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 3
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 3
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 3
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 3
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 3
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 3
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 3
- 101710150190 Beta-secretase 2 Proteins 0.000 description 3
- 102000055006 Calcitonin Human genes 0.000 description 3
- 108060001064 Calcitonin Proteins 0.000 description 3
- 108700022150 Designed Ankyrin Repeat Proteins Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 108010008165 Etanercept Proteins 0.000 description 3
- 102000002241 Eukaryotic Initiation Factors Human genes 0.000 description 3
- 108010014863 Eukaryotic Initiation Factors Proteins 0.000 description 3
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 3
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 3
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 3
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 3
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 3
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 3
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 3
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 3
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 3
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 3
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 3
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 3
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 3
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 3
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 3
- 102100039619 Granulocyte colony-stimulating factor Human genes 0.000 description 3
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 3
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 3
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 3
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 3
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 3
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 3
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 3
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 3
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 3
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 3
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 3
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 3
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 3
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 3
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 3
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 3
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 3
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 3
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 3
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 3
- BIWVMACFGZFIEB-VFAJRCTISA-N Lys-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N)O BIWVMACFGZFIEB-VFAJRCTISA-N 0.000 description 3
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 3
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 3
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 3
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102000003982 Parathyroid hormone Human genes 0.000 description 3
- 108090000445 Parathyroid hormone Proteins 0.000 description 3
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 3
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 3
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 3
- 102100034080 Polyadenylate-binding protein-interacting protein 1 Human genes 0.000 description 3
- 101710101680 Polyadenylate-binding protein-interacting protein 1 Proteins 0.000 description 3
- 108091036407 Polyadenylation Proteins 0.000 description 3
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 3
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 3
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 3
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 3
- 108010029485 Protein Isoforms Proteins 0.000 description 3
- 102000001708 Protein Isoforms Human genes 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 3
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 3
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 3
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 3
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 3
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 3
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 3
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 3
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 3
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 3
- DYIXEGROAOVQPK-VFAJRCTISA-N Trp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DYIXEGROAOVQPK-VFAJRCTISA-N 0.000 description 3
- YTHWAWACWGWBLE-MNSWYVGCSA-N Trp-Tyr-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 YTHWAWACWGWBLE-MNSWYVGCSA-N 0.000 description 3
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 3
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 3
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 3
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 3
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 3
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 3
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 3
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 3
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 3
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 3
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 229960000074 biopharmaceutical Drugs 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 229960004015 calcitonin Drugs 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000010924 continuous production Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 230000002538 fungal effect Effects 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 230000008826 genomic mutation Effects 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 3
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 108010053037 kyotorphin Proteins 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 239000000199 parathyroid hormone Substances 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 108010018625 phenylalanylarginine Proteins 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 238000011533 pre-incubation Methods 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 229950010131 puromycin Drugs 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000004064 recycling Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000028706 ribosome biogenesis Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 229960005460 teriparatide Drugs 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 3
- 201000008827 tuberculosis Diseases 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 238000005303 weighing Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 2
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 2
- JXBIGWQNNSJLQK-IYRMOJGWSA-N (2s)-2-amino-n-[(2s,3s,4r,5r)-5-[6-(dimethylamino)purin-9-yl]-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl]-3-(4-prop-2-ynoxyphenyl)propanamide Chemical compound C([C@H](N)C(=O)N[C@@H]1[C@@H](CO)O[C@H]([C@@H]1O)N1C=2N=CN=C(C=2N=C1)N(C)C)C1=CC=C(OCC#C)C=C1 JXBIGWQNNSJLQK-IYRMOJGWSA-N 0.000 description 2
- AZUYLZMQTIKGSC-UHFFFAOYSA-N 1-[6-[4-(5-chloro-6-methyl-1H-indazol-4-yl)-5-methyl-3-(1-methylindazol-5-yl)pyrazol-1-yl]-2-azaspiro[3.3]heptan-2-yl]prop-2-en-1-one Chemical compound ClC=1C(=C2C=NNC2=CC=1C)C=1C(=NN(C=1C)C1CC2(CN(C2)C(C=C)=O)C1)C=1C=C2C=NN(C2=CC=1)C AZUYLZMQTIKGSC-UHFFFAOYSA-N 0.000 description 2
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 2
- 102000004567 6-phosphogluconate dehydrogenase Human genes 0.000 description 2
- 108020001657 6-phosphogluconate dehydrogenase Proteins 0.000 description 2
- 101150006240 AOX2 gene Proteins 0.000 description 2
- 101710152894 ATP-binding cassette sub-family E member 1 Proteins 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 2
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 2
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 2
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 101710194180 Alcohol oxidase 1 Proteins 0.000 description 2
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 2
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 2
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 2
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 2
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 2
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 2
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 2
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 2
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 2
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 2
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 2
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 2
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 2
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 2
- LIQNMKIBMPEOOP-IHRRRGAJSA-N Asp-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)O)N LIQNMKIBMPEOOP-IHRRRGAJSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 2
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 2
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 2
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 2
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 102100029516 Basic salivary proline-rich protein 1 Human genes 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 102000017963 CDP-diacylglycerol-inositol 3-phosphatidyltransferase Human genes 0.000 description 2
- 108010066050 CDP-diacylglycerol-inositol 3-phosphatidyltransferase Proteins 0.000 description 2
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- YASYEJJMZJALEJ-UHFFFAOYSA-N Citric acid monohydrate Chemical compound O.OC(=O)CC(O)(C(O)=O)CC(O)=O YASYEJJMZJALEJ-UHFFFAOYSA-N 0.000 description 2
- NQSUTVRXXBGVDQ-LKXGYXEUSA-N Cys-Asn-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NQSUTVRXXBGVDQ-LKXGYXEUSA-N 0.000 description 2
- XVLMKWWVBNESPX-XVYDVKMFSA-N Cys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N XVLMKWWVBNESPX-XVYDVKMFSA-N 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 208000003556 Dry Eye Syndromes Diseases 0.000 description 2
- 206010013774 Dry eye Diseases 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 102100034295 Eukaryotic translation initiation factor 3 subunit A Human genes 0.000 description 2
- 101710109043 Eukaryotic translation initiation factor 3 subunit A Proteins 0.000 description 2
- 108010011459 Exenatide Proteins 0.000 description 2
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 2
- 108090000698 Formate Dehydrogenases Proteins 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 108010093031 Galactosidases Proteins 0.000 description 2
- 102000002464 Galactosidases Human genes 0.000 description 2
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 2
- ZRXBYKAOFHLTDN-GUBZILKMSA-N Gln-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N ZRXBYKAOFHLTDN-GUBZILKMSA-N 0.000 description 2
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 2
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 2
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 2
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 2
- NPMFDZGLKBNFOO-SRVKXCTJSA-N Gln-Pro-His Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NPMFDZGLKBNFOO-SRVKXCTJSA-N 0.000 description 2
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 2
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 2
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 2
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 2
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- SFKMXFWWDUGXRT-NWLDYVSISA-N Glu-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N)O SFKMXFWWDUGXRT-NWLDYVSISA-N 0.000 description 2
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 2
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 2
- DGYNAJNQMBFYIF-SZMVWBNQSA-N His-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 DGYNAJNQMBFYIF-SZMVWBNQSA-N 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101001125486 Homo sapiens Basic salivary proline-rich protein 1 Proteins 0.000 description 2
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 2
- 101001104110 Homo sapiens X-linked retinitis pigmentosa GTPase regulator-interacting protein 1 Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 2
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 2
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 2
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 2
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 2
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 2
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 2
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 2
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 2
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 2
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 108010005716 Interferon beta-1a Proteins 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- 108010059881 Lactase Proteins 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 2
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 2
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 2
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- DXYBNWJZJVSZAE-GUBZILKMSA-N Leu-Gln-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DXYBNWJZJVSZAE-GUBZILKMSA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 2
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 2
- LXGSOEPHQJONMG-PMVMPFDFSA-N Leu-Trp-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N LXGSOEPHQJONMG-PMVMPFDFSA-N 0.000 description 2
- 108010000817 Leuprolide Proteins 0.000 description 2
- 208000019693 Lung disease Diseases 0.000 description 2
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 2
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 2
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 2
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 2
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 2
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 2
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 2
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 2
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 2
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 2
- CTVJSFRHUOSCQQ-DCAQKATOSA-N Met-Arg-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTVJSFRHUOSCQQ-DCAQKATOSA-N 0.000 description 2
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 2
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 2
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 2
- CRVSHEPROQHVQT-AVGNSLFASA-N Met-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N CRVSHEPROQHVQT-AVGNSLFASA-N 0.000 description 2
- RSOMVHWMIAZNLE-HJWJTTGWSA-N Met-Phe-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSOMVHWMIAZNLE-HJWJTTGWSA-N 0.000 description 2
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 2
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 2
- RIIFMEBFDDXGCV-VEVYYDQMSA-N Met-Thr-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O RIIFMEBFDDXGCV-VEVYYDQMSA-N 0.000 description 2
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 2
- KPVLLNDCBYXKNV-CYDGBPFRSA-N Met-Val-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KPVLLNDCBYXKNV-CYDGBPFRSA-N 0.000 description 2
- 101100243377 Mus musculus Pepd gene Proteins 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 241001099341 Ogataea polymorpha Species 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 101150029183 PEP4 gene Proteins 0.000 description 2
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 2
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 2
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 2
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- BPIFSOUEUYDJRM-DCPHZVHLSA-N Phe-Trp-Ala Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(O)=O)C1=CC=CC=C1 BPIFSOUEUYDJRM-DCPHZVHLSA-N 0.000 description 2
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 2
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 2
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 2
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 2
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 2
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 2
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 2
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 2
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 2
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 2
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 2
- 108010049404 Prokaryotic Initiation Factor-3 Proteins 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108010000605 Ribosomal Proteins Proteins 0.000 description 2
- 101001034819 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Eukaryotic initiation factor 4F subunit p130 Proteins 0.000 description 2
- 101001034820 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Eukaryotic initiation factor 4F subunit p150 Proteins 0.000 description 2
- 101100340576 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TIF4632 gene Proteins 0.000 description 2
- 101710204410 Scaffold protein Proteins 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 2
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 2
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 2
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 2
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 2
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 2
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 2
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 2
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 2
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 2
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 2
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 2
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 2
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 101710114283 Translation initiation factor RLI1 Proteins 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 2
- DVIIYMVCSUQOJG-QEJZJMRPSA-N Trp-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DVIIYMVCSUQOJG-QEJZJMRPSA-N 0.000 description 2
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 2
- GRSCONMARGNYHA-PMVMPFDFSA-N Trp-Lys-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GRSCONMARGNYHA-PMVMPFDFSA-N 0.000 description 2
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 2
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 2
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 2
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 2
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 2
- JFDGVHXRCKEBAU-KKUMJFAQSA-N Tyr-Asp-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JFDGVHXRCKEBAU-KKUMJFAQSA-N 0.000 description 2
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 2
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 2
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 2
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 2
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 2
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 2
- 102000003425 Tyrosinase Human genes 0.000 description 2
- 108060008724 Tyrosinase Proteins 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 2
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 2
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 2
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 2
- OEVFFOBAXHBXKM-HSHDSVGOSA-N Val-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N)O OEVFFOBAXHBXKM-HSHDSVGOSA-N 0.000 description 2
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 102100040089 X-linked retinitis pigmentosa GTPase regulator-interacting protein 1 Human genes 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 208000006673 asthma Diseases 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 229960000106 biosimilars Drugs 0.000 description 2
- 108010064866 biozym Proteins 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 230000033077 cellular process Effects 0.000 description 2
- 229960002303 citric acid monohydrate Drugs 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000013270 controlled release Methods 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 108010042566 davunetide Proteins 0.000 description 2
- DWLTUUXCVGVRAV-XWRHUKJGSA-N davunetide Chemical compound N([C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)C(=O)[C@@H]1CCCN1C(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O DWLTUUXCVGVRAV-XWRHUKJGSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 108010067071 duramycin Proteins 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 229960000403 etanercept Drugs 0.000 description 2
- 229960001519 exenatide Drugs 0.000 description 2
- 210000001808 exosome Anatomy 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010049353 golotimod Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229960002193 histrelin Drugs 0.000 description 2
- 108700020746 histrelin Proteins 0.000 description 2
- HHXHVIJIIXKSOE-QILQGKCVSA-N histrelin Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC(N=C1)=CN1CC1=CC=CC=C1 HHXHVIJIIXKSOE-QILQGKCVSA-N 0.000 description 2
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 239000007943 implant Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 229940116108 lactase Drugs 0.000 description 2
- SFWLDKQAUHFCBS-WWXQEMPQSA-N lancovutide Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H]2C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H]3C(=O)N[C@@H](CCCCNC[C@H]4C(=O)N[C@@H](CC=5C=CC=CC=5)C(=O)NCC(=O)N5CCC[C@H]5C(=O)N[C@@H](CC=5C=CC=CC=5)C(=O)N[C@H]([C@@H](SC[C@H](NC(=O)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CSC3C)CSC2)C(=O)N4)C)C(=O)N1)C(O)=O)[C@@H](O)C(O)=O)=O)C(C)C)C1=CC=CC=C1 SFWLDKQAUHFCBS-WWXQEMPQSA-N 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- GFIJNRVAKGFPGQ-LIJARHBVSA-N leuprolide Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC1=CC=C(O)C=C1 GFIJNRVAKGFPGQ-LIJARHBVSA-N 0.000 description 2
- 229960004338 leuprorelin Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 229940124735 malaria vaccine Drugs 0.000 description 2
- 108010000594 mecasermin Proteins 0.000 description 2
- 229960001311 mecasermin Drugs 0.000 description 2
- 229940115256 melanoma vaccine Drugs 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000012269 metabolic engineering Methods 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 239000007003 mineral medium Substances 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 229960002566 papillomavirus vaccine Drugs 0.000 description 2
- 229960001319 parathyroid hormone Drugs 0.000 description 2
- 108010044644 pegfilgrastim Proteins 0.000 description 2
- 230000010412 perfusion Effects 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 239000013587 production medium Substances 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 229960004641 rituximab Drugs 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 230000037432 silent mutation Effects 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- 239000010935 stainless steel Substances 0.000 description 2
- 229910001220 stainless steel Inorganic materials 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000013268 sustained release Methods 0.000 description 2
- 239000012730 sustained-release form Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229940042129 topical gel Drugs 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- ZKKBZMXTFBAQLP-INNXVHPBSA-N z44m8u8y9a Chemical compound C([C@H](C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CCCCN)C(=O)N[C@H](C(C)C)C(=O)N[C@H](C)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CC=1C=CC=CC=1)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](C)C(=O)N[C@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](CC=1C=CC=CC=1)NC(=O)[C@@H](C)NC(=O)[C@@H](CCCCN)NC(=O)[C@@H](CC=1C=CC=CC=1)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](CC(O)=O)NC(C)=O)C1=CC=C(O)C=C1 ZKKBZMXTFBAQLP-INNXVHPBSA-N 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- SBKVPJHMSUXZTA-MEJXFZFPSA-N (2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(1H-indol-3-yl)propanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylsulfanylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 SBKVPJHMSUXZTA-MEJXFZFPSA-N 0.000 description 1
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- SFGFYNXPJMOUHK-PKAFTLKUSA-N (2r)-2-[[(2r)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]-n-[(2r)-1-[[(2r)-1-[[(2r)-1-[[(2r)-1-[[(2r)-1-[[(2r)-1-[[2-[[(2r)-1-amino-3-(4-hydroxyphenyl)-1-oxopropan-2-yl]amino]-2-oxoethyl]amino]-1-oxohexan-2-yl]amino]-1-oxohexan-2-yl]amino]-1-oxohe Chemical compound NC(N)=NCCC[C@@H](N)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCN=C(N)N)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCC)C(=O)NCC(=O)N[C@@H](C(N)=O)CC1=CC=C(O)C=C1 SFGFYNXPJMOUHK-PKAFTLKUSA-N 0.000 description 1
- RCGXNDQKCXNWLO-WLEIXIPESA-N (2r)-n-[(2s)-5-amino-1-[[(2r,3r)-1-[[(3s,6z,9s,12r,15r,18r,19s)-9-benzyl-15-[(2r)-butan-2-yl]-6-ethylidene-19-methyl-2,5,8,11,14,17-hexaoxo-3,12-di(propan-2-yl)-1-oxa-4,7,10,13,16-pentazacyclononadec-18-yl]amino]-3-methyl-1-oxopentan-2-yl]amino]-1-oxopent Chemical compound N([C@@H](CCCN)C(=O)N[C@H]([C@H](C)CC)C(=O)N[C@H]1C(N[C@@H](C(=O)N[C@@H](C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)NC(/C(=O)N[C@H](C(=O)O[C@H]1C)C(C)C)=C\C)C(C)C)[C@H](C)CC)=O)C(=O)[C@H]1CCCN1C(=O)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](NC(=O)CCCC(C)C)C(C)C)[C@@H](C)O)C(C)C)C(C)C RCGXNDQKCXNWLO-WLEIXIPESA-N 0.000 description 1
- RIWLPSIAFBLILR-WVNGMBSFSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-[[(2s)-2-[[(2s,3r)-2-[[(2r,3s)-2-[[(2s)-2-[[2-[[2-[acetyl(methyl)amino]acetyl]amino]acetyl]amino]-3-methylbutanoyl]amino]-3-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]pentanoyl]amino]-3-methylpentanoyl]amino]-5-(diaminomethy Chemical compound CC(=O)N(C)CC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@H]1C(=O)NCC RIWLPSIAFBLILR-WVNGMBSFSA-N 0.000 description 1
- CUCSSYAUKKIDJV-FAXBSAIASA-N (2s)-2-[[(2r)-2-[[(2s)-2-[[(2r)-2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1h-indol-3-yl)propanoyl]-methylamino]-3-phenylpropanoyl]amino]-3-(1h-indol-3-yl)propanoyl]amino]-n-[(2s)-1-amino-4-methylsulfanyl-1-oxobutan-2-yl]-4-methylpent Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)N(C)C(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)CCCN=C(N)N)C1=CC=CC=C1 CUCSSYAUKKIDJV-FAXBSAIASA-N 0.000 description 1
- MMHDBUJXLOFTLC-WOYTXXSLSA-N (2s)-2-[[(2r)-2-[[(2s)-2-[[(2s)-2-[[(2s)-1-acetylpyrrolidine-2-carbonyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-hydroxypropanoyl]amino]-3-sulfanylpropanoyl]amino]butanediamide Chemical compound CC(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(N)=O)CC1=CN=CN1 MMHDBUJXLOFTLC-WOYTXXSLSA-N 0.000 description 1
- LPKPGXJXCZNDJO-JYJNAYRXSA-N (2s)-2-[[(2s)-1-[(2s)-6-amino-2-[(2-aminoacetyl)-ethylamino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCCCC[C@H](N(CC)C(=O)CN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LPKPGXJXCZNDJO-JYJNAYRXSA-N 0.000 description 1
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- OSNSWKAZFASRNG-WNFIKIDCSA-N (2s,3r,4s,5s,6r)-6-(hydroxymethyl)oxane-2,3,4,5-tetrol;hydrate Chemical compound O.OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@@H]1O OSNSWKAZFASRNG-WNFIKIDCSA-N 0.000 description 1
- YQINXCSNGCDFCQ-CMOCDZPBSA-N (3s,4s,12s,13s)-3,4,12,13-tetrahydronaphtho[1,2-b]phenanthrene-3,4,12,13-tetrol Chemical compound C1([C@H](O)[C@H]2O)=CC=CC=C1C1=C2C=C2C(C=C[C@@H]([C@H]3O)O)=C3C=CC2=C1 YQINXCSNGCDFCQ-CMOCDZPBSA-N 0.000 description 1
- JDKLPDJLXHXHNV-MFVUMRCOSA-N (3s,6s,9r,12s,15s,23s)-15-[[(2s)-2-acetamidohexanoyl]amino]-9-benzyl-6-[3-(diaminomethylideneamino)propyl]-12-(1h-imidazol-5-ylmethyl)-3-(1h-indol-3-ylmethyl)-2,5,8,11,14,17-hexaoxo-1,4,7,10,13,18-hexazacyclotricosane-23-carboxamide Chemical compound C([C@@H]1C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCNC(=O)C[C@@H](C(N[C@@H](CC=2NC=NC=2)C(=O)N1)=O)NC(=O)[C@@H](NC(C)=O)CCCC)C(N)=O)C1=CC=CC=C1 JDKLPDJLXHXHNV-MFVUMRCOSA-N 0.000 description 1
- ONKCBKDTKZIWHZ-MRWFHJSOSA-N (4r)-4-[[(2r)-6-amino-2-[[(2r)-2-[[4-(aminocarbamothioylamino)benzoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]hexanoyl]amino]-5-[[(2r)-1-amino-6-[bis[2-[[4-[2-(1h-imidazol-5-yl)ethylamino]-4-oxobutanoyl]amino]acetyl]amino]-1-oxohexan-2-yl]amino]-5-oxope Chemical compound C([C@H](C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCCCN(C(=O)CNC(=O)CCC(=O)NCCC=1NC=NC=1)C(=O)CNC(=O)CCC(=O)NCCC=1NC=NC=1)C(N)=O)NC(=O)C=1C=CC(NC(=S)NN)=CC=1)C1=CC=C(O)C=C1 ONKCBKDTKZIWHZ-MRWFHJSOSA-N 0.000 description 1
- SNAJPQVDGYDQSW-DYCFWDQMSA-N (4r,7s,10r,13s,16r)-7-(4-aminobutyl)-n-[(2s,3r)-1-amino-3-hydroxy-1-oxobutan-2-yl]-16-[[(2r)-2-amino-3-phenylpropanoyl]amino]-13-[(4-hydroxyphenyl)methyl]-10-(1h-indol-3-ylmethyl)-6,9,12,15-tetraoxo-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxami Chemical compound C([C@@H](N)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC1=O)C(=O)N[C@@H]([C@H](O)C)C(N)=O)C1=CC=CC=C1 SNAJPQVDGYDQSW-DYCFWDQMSA-N 0.000 description 1
- DEQANNDTNATYII-OULOTJBUSA-N (4r,7s,10s,13r,16s,19r)-10-(4-aminobutyl)-19-[[(2r)-2-amino-3-phenylpropanoyl]amino]-16-benzyl-n-[(2r,3r)-1,3-dihydroxybutan-2-yl]-7-[(1r)-1-hydroxyethyl]-13-(1h-indol-3-ylmethyl)-6,9,12,15,18-pentaoxo-1,2-dithia-5,8,11,14,17-pentazacycloicosane-4-carboxa Chemical compound C([C@@H](N)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC=2C=CC=CC=2)NC1=O)C(=O)N[C@H](CO)[C@H](O)C)C1=CC=CC=C1 DEQANNDTNATYII-OULOTJBUSA-N 0.000 description 1
- PUDHBTGHUJUUFI-SCTWWAJVSA-N (4r,7s,10s,13r,16s,19r)-10-(4-aminobutyl)-n-[(2s,3r)-1-amino-3-hydroxy-1-oxobutan-2-yl]-19-[[(2r)-2-amino-3-naphthalen-2-ylpropanoyl]amino]-16-[(4-hydroxyphenyl)methyl]-13-(1h-indol-3-ylmethyl)-6,9,12,15,18-pentaoxo-7-propan-2-yl-1,2-dithia-5,8,11,14,17-p Chemical compound C([C@H]1C(=O)N[C@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](N)CC=1C=C2C=CC=CC2=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(N)=O)=O)C(C)C)C1=CC=C(O)C=C1 PUDHBTGHUJUUFI-SCTWWAJVSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- PHEWVCZHSBTZFX-DBCSJUPNSA-N (4s)-4-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-4-carboxybutanoyl]amino]pro Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 PHEWVCZHSBTZFX-DBCSJUPNSA-N 0.000 description 1
- HMLGSIZOMSVISS-ONJSNURVSA-N (7r)-7-[[(2z)-2-(2-amino-1,3-thiazol-4-yl)-2-(2,2-dimethylpropanoyloxymethoxyimino)acetyl]amino]-3-ethenyl-8-oxo-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylic acid Chemical compound N([C@@H]1C(N2C(=C(C=C)CSC21)C(O)=O)=O)C(=O)\C(=N/OCOC(=O)C(C)(C)C)C1=CSC(N)=N1 HMLGSIZOMSVISS-ONJSNURVSA-N 0.000 description 1
- YKGRXSLQYRREKO-DFOPOJAZSA-N 101380-54-5 Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)C1=CC=CC=C1 YKGRXSLQYRREKO-DFOPOJAZSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- XBBVURRQGJPTHH-UHFFFAOYSA-N 2-hydroxyacetic acid;2-hydroxypropanoic acid Chemical compound OCC(O)=O.CC(O)C(O)=O XBBVURRQGJPTHH-UHFFFAOYSA-N 0.000 description 1
- 101710149439 20 kDa chaperonin, chloroplastic Proteins 0.000 description 1
- BKAJNAXTPSGJCU-UHFFFAOYSA-N 4-methyl-2-oxopentanoic acid Chemical compound CC(C)CC(=O)C(O)=O BKAJNAXTPSGJCU-UHFFFAOYSA-N 0.000 description 1
- DEZJGRPRBZSAKI-KMGSDFBDSA-N 565434-85-7 Chemical compound C([C@@H](N)C(=O)N[C@H](CO)C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@H](CO)C(=O)N[C@H](CC=1C(=C(F)C(F)=C(F)C=1F)F)C(=O)N[C@H](CC1CCCCC1)C(=O)N[C@H](CCCNC(N)=N)C(=O)N[C@H](CCCNC(N)=N)C(=O)N[C@H](CCCNC(N)=N)C(=O)N[C@H](CCC(N)=O)C(=O)N[C@H](CCCNC(N)=N)C(=O)N[C@H](CCCNC(N)=N)C(O)=O)C(C=C1)=CC=C1C(=O)C1=CC=CC=C1 DEZJGRPRBZSAKI-KMGSDFBDSA-N 0.000 description 1
- 101150072315 ABCE1 gene Proteins 0.000 description 1
- 108010077593 ACE-011 Proteins 0.000 description 1
- 101150103244 ACT1 gene Proteins 0.000 description 1
- 229940023859 AIDSVAX Drugs 0.000 description 1
- 108010093583 ART123 Proteins 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- FRFDXQWNDZMREB-ACZMJKKPSA-N Ala-Cys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRFDXQWNDZMREB-ACZMJKKPSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 1
- QJABSQFUHKHTNP-SYWGBEHUSA-N Ala-Ile-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QJABSQFUHKHTNP-SYWGBEHUSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 102100039702 Alcohol dehydrogenase class-3 Human genes 0.000 description 1
- 108010025188 Alcohol oxidase Proteins 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 1
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 1
- 102100038910 Alpha-enolase Human genes 0.000 description 1
- 101710165425 Alpha-enolase Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 208000028185 Angioedema Diseases 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 108010064733 Angiotensins Proteins 0.000 description 1
- 102000015427 Angiotensins Human genes 0.000 description 1
- 102000004411 Antithrombin III Human genes 0.000 description 1
- 108090000935 Antithrombin III Proteins 0.000 description 1
- 102100038779 Arfaptin-2 Human genes 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- BJNUAWGXPSHQMJ-DCAQKATOSA-N Arg-Gln-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O BJNUAWGXPSHQMJ-DCAQKATOSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- 108010010777 Arg-Gly-Asp-Gly Proteins 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- ZRNWJUAQKFUUKV-SRVKXCTJSA-N Arg-Met-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ZRNWJUAQKFUUKV-SRVKXCTJSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 1
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 1
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- CQMQJWRCRQSBAF-BPUTZDHNSA-N Asn-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N CQMQJWRCRQSBAF-BPUTZDHNSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- QTKYFZCMSQLYHI-UBHSHLNASA-N Asn-Trp-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O QTKYFZCMSQLYHI-UBHSHLNASA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- FRSGNOZCTWDVFZ-ACZMJKKPSA-N Asp-Asp-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRSGNOZCTWDVFZ-ACZMJKKPSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- WNGZKSVJFDZICU-XIRDDKMYSA-N Asp-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N WNGZKSVJFDZICU-XIRDDKMYSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 1
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- KOWYNSKRPUWSFG-IHPCNDPISA-N Asp-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)O)N KOWYNSKRPUWSFG-IHPCNDPISA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- ZQFZEBRNAMXXJV-KKUMJFAQSA-N Asp-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O ZQFZEBRNAMXXJV-KKUMJFAQSA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- OQMGSMNZVHYDTQ-ZKWXMUAHSA-N Asp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N OQMGSMNZVHYDTQ-ZKWXMUAHSA-N 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 108010028845 BIM 23190 Proteins 0.000 description 1
- 108700001281 BIM 51077 Proteins 0.000 description 1
- 239000010755 BS 2869 Class G Substances 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 102100033949 Basic salivary proline-rich protein 3 Human genes 0.000 description 1
- 108010081589 Becaplermin Proteins 0.000 description 1
- 108010029692 Bisphosphoglycerate mutase Proteins 0.000 description 1
- 208000020084 Bone disease Diseases 0.000 description 1
- 108030001720 Bontoxilysin Proteins 0.000 description 1
- 101710117542 Botulinum neurotoxin type A Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 101800000407 Brain natriuretic peptide 32 Proteins 0.000 description 1
- YNXLOPYTAAFMTN-SBUIBGKBSA-N C([C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)C1=CC=C(O)C=C1 Chemical compound C([C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)C1=CC=C(O)C=C1 YNXLOPYTAAFMTN-SBUIBGKBSA-N 0.000 description 1
- 108091005932 CCKBR Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 108010048913 CTCE-0214 Proteins 0.000 description 1
- 108010053045 CTCE-9908 Proteins 0.000 description 1
- 108010004480 CTP37 peptide Proteins 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 101100028900 Caenorhabditis elegans pcs-1 gene Proteins 0.000 description 1
- 102100038518 Calcitonin Human genes 0.000 description 1
- 108090000932 Calcitonin Gene-Related Peptide Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 101100351264 Candida albicans (strain SC5314 / ATCC MYA-2876) PDC11 gene Proteins 0.000 description 1
- 101100166113 Candida albicans (strain SC5314 / ATCC MYA-2876) SAP9 gene Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 108010089388 Cdc25C phosphatase (211-221) Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 108010089448 Cholecystokinin B Receptor Proteins 0.000 description 1
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 1
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 1
- 101710177832 Co-chaperonin GroES Proteins 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 101000944206 Conus geographus Conantokin-G Proteins 0.000 description 1
- 101000860877 Conus geographus Contulakin-G Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- 102000008130 Cyclic AMP-Dependent Protein Kinases Human genes 0.000 description 1
- 108010049894 Cyclic AMP-Dependent Protein Kinases Proteins 0.000 description 1
- DEVDFMRWZASYOF-ZLUOBGJFSA-N Cys-Asn-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DEVDFMRWZASYOF-ZLUOBGJFSA-N 0.000 description 1
- SQJSYLDKQBZQTG-FXQIFTODSA-N Cys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N SQJSYLDKQBZQTG-FXQIFTODSA-N 0.000 description 1
- XRTISHJEPHMBJG-SRVKXCTJSA-N Cys-Asp-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XRTISHJEPHMBJG-SRVKXCTJSA-N 0.000 description 1
- RWGDABDXVXRLLH-ACZMJKKPSA-N Cys-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N RWGDABDXVXRLLH-ACZMJKKPSA-N 0.000 description 1
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 1
- ZMWOJVAXTOUHAP-ZKWXMUAHSA-N Cys-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N ZMWOJVAXTOUHAP-ZKWXMUAHSA-N 0.000 description 1
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 108010068294 CytoFab Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108010049954 DRF 7295 Proteins 0.000 description 1
- 108010013198 Daptomycin Proteins 0.000 description 1
- 108010000437 Deamino Arginine Vasopressin Proteins 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 208000008960 Diabetic foot Diseases 0.000 description 1
- 102100031245 Disks large-associated protein 2 Human genes 0.000 description 1
- 101150020562 Dlgap2 gene Proteins 0.000 description 1
- 101100172226 Drosophila melanogaster emc gene Proteins 0.000 description 1
- 102400000242 Dynorphin A(1-17) Human genes 0.000 description 1
- 108010065372 Dynorphins Proteins 0.000 description 1
- 108010003953 EP-2104R Proteins 0.000 description 1
- 108010040545 ETC 642 Proteins 0.000 description 1
- 108010016695 ETC216 Proteins 0.000 description 1
- 108010015972 Elafin Proteins 0.000 description 1
- 102100023795 Elafin Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102400001047 Endostatin Human genes 0.000 description 1
- 108010079505 Endostatins Proteins 0.000 description 1
- 101710184673 Enolase 1 Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108010057192 Eukaryotic Initiation Factor-4G Proteins 0.000 description 1
- 102000012858 Eukaryotic Initiation Factor-4G Human genes 0.000 description 1
- 101710097719 Eukaryotic initiation factor 4F subunit p130 Proteins 0.000 description 1
- 102100021699 Eukaryotic translation initiation factor 3 subunit B Human genes 0.000 description 1
- 101710109047 Eukaryotic translation initiation factor 3 subunit B Proteins 0.000 description 1
- 102100035045 Eukaryotic translation initiation factor 3 subunit C Human genes 0.000 description 1
- 101710109030 Eukaryotic translation initiation factor 3 subunit C Proteins 0.000 description 1
- 102100037115 Eukaryotic translation initiation factor 3 subunit H Human genes 0.000 description 1
- 101710109050 Eukaryotic translation initiation factor 3 subunit H Proteins 0.000 description 1
- 102100027304 Eukaryotic translation initiation factor 4E Human genes 0.000 description 1
- 101710091918 Eukaryotic translation initiation factor 4E Proteins 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 108010071289 Factor XIII Proteins 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- 238000012366 Fed-batch cultivation Methods 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 108010029961 Filgrastim Proteins 0.000 description 1
- 108010027258 GEM 21S Proteins 0.000 description 1
- 101150081655 GPM1 gene Proteins 0.000 description 1
- 108010003795 GW002 peptide Proteins 0.000 description 1
- 102000052874 Gastrin receptors Human genes 0.000 description 1
- 102100036016 Gastrin/cholecystokinin type B receptor Human genes 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 241000178290 Geotrichum fermentans Species 0.000 description 1
- 108010072051 Glatiramer Acetate Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 1
- CXFUMJQFZVCETK-FXQIFTODSA-N Gln-Cys-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O CXFUMJQFZVCETK-FXQIFTODSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- OAOOXBSVCJEIFY-QAETUUGQSA-N Gln-Leu-Leu-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O OAOOXBSVCJEIFY-QAETUUGQSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 1
- JUUNNOLZGVYCJT-JYJNAYRXSA-N Gln-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JUUNNOLZGVYCJT-JYJNAYRXSA-N 0.000 description 1
- FTTHLXOMDMLKKW-FHWLQOOXSA-N Gln-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTTHLXOMDMLKKW-FHWLQOOXSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 1
- VCUNGPMMPNJSGS-JYJNAYRXSA-N Gln-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VCUNGPMMPNJSGS-JYJNAYRXSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- JJSVALISDCNFCU-SZMVWBNQSA-N Glu-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JJSVALISDCNFCU-SZMVWBNQSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 1
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 1
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 102100031132 Glucose-6-phosphate isomerase Human genes 0.000 description 1
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- NZOAFWHVAFJERA-OALUTQOASA-N Gly-Phe-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NZOAFWHVAFJERA-OALUTQOASA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108010016306 Glycylpeptide N-tetradecanoyltransferase Proteins 0.000 description 1
- CATMPQFFVNKDEY-YPMHNXCESA-N Golotimod Chemical compound C1=CC=C2C(C[C@H](NC(=O)CC[C@@H](N)C(O)=O)C(O)=O)=CNC2=C1 CATMPQFFVNKDEY-YPMHNXCESA-N 0.000 description 1
- 108010069236 Goserelin Proteins 0.000 description 1
- BLCLNMBMMGCOAS-URPVMXJPSA-N Goserelin Chemical compound C([C@@H](C(=O)N[C@H](COC(C)(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(=O)NNC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 BLCLNMBMMGCOAS-URPVMXJPSA-N 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 108010030158 HBOC 201 Proteins 0.000 description 1
- 229940033330 HIV vaccine Drugs 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- LMMPTUVWHCFTOT-GARJFASQSA-N His-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O LMMPTUVWHCFTOT-GARJFASQSA-N 0.000 description 1
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 1
- TXLQHACKRLWYCM-DCAQKATOSA-N His-Glu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O TXLQHACKRLWYCM-DCAQKATOSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 1
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 1
- NDKSHNQINMRKHT-PEXQALLHSA-N His-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N NDKSHNQINMRKHT-PEXQALLHSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- UWNUQPZUSRFIIN-JUKXBJQTSA-N His-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N UWNUQPZUSRFIIN-JUKXBJQTSA-N 0.000 description 1
- QLBXWYXMLHAREM-PYJNHQTQSA-N His-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N QLBXWYXMLHAREM-PYJNHQTQSA-N 0.000 description 1
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000809446 Homo sapiens Arfaptin-2 Proteins 0.000 description 1
- 101001068638 Homo sapiens Basic salivary proline-rich protein 3 Proteins 0.000 description 1
- 101500025419 Homo sapiens Epidermal growth factor Proteins 0.000 description 1
- 101000746373 Homo sapiens Granulocyte-macrophage colony-stimulating factor Proteins 0.000 description 1
- 101000977692 Homo sapiens Iroquois-class homeodomain protein IRX-6 Proteins 0.000 description 1
- 101000798114 Homo sapiens Lactotransferrin Proteins 0.000 description 1
- 101000578784 Homo sapiens Melanoma antigen recognized by T-cells 1 Proteins 0.000 description 1
- 101000780028 Homo sapiens Natriuretic peptides A Proteins 0.000 description 1
- 101001135770 Homo sapiens Parathyroid hormone Proteins 0.000 description 1
- 101001135995 Homo sapiens Probable peptidyl-tRNA hydrolase Proteins 0.000 description 1
- 208000035533 House dust allergy Diseases 0.000 description 1
- 101000767631 Human papillomavirus type 16 Protein E7 Proteins 0.000 description 1
- 241000702617 Human parvovirus B19 Species 0.000 description 1
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 108010043766 IRX 2 Proteins 0.000 description 1
- 102100029199 Iduronate 2-sulfatase Human genes 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- DMHGKBGOUAJRHU-RVMXOQNASA-N Ile-Arg-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N DMHGKBGOUAJRHU-RVMXOQNASA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- QRTVJGKXFSYJGW-KBIXCLLPSA-N Ile-Glu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QRTVJGKXFSYJGW-KBIXCLLPSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 1
- JXMSHKFPDIUYGS-SIUGBPQLSA-N Ile-Glu-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N JXMSHKFPDIUYGS-SIUGBPQLSA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 1
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- WVUDHMBJNBWZBU-XUXIUFHCSA-N Ile-Lys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N WVUDHMBJNBWZBU-XUXIUFHCSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- RTSQPLLOYSGMKM-DSYPUSFNSA-N Ile-Trp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N RTSQPLLOYSGMKM-DSYPUSFNSA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 108010073961 Insulin Aspart Proteins 0.000 description 1
- 108010057186 Insulin Glargine Proteins 0.000 description 1
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 1
- 108010078049 Interferon alpha-2 Proteins 0.000 description 1
- 102100039350 Interferon alpha-7 Human genes 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000051628 Interleukin-1 receptor antagonist Human genes 0.000 description 1
- 108700021006 Interleukin-1 receptor antagonist Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 102000004388 Interleukin-4 Human genes 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102100023527 Iroquois-class homeodomain protein IRX-6 Human genes 0.000 description 1
- 108020003285 Isocitrate lyase Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 108010062867 Lenograstim Proteins 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- UFPLDOKWDNTTRP-ULQDDVLXSA-N Leu-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=C(O)C=C1 UFPLDOKWDNTTRP-ULQDDVLXSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- 108010019598 Liraglutide Proteins 0.000 description 1
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 description 1
- XVVOERDUTLJJHN-UHFFFAOYSA-N Lixisenatide Chemical compound C=1NC2=CC=CC=C2C=1CC(C(=O)NC(CC(C)C)C(=O)NC(CCCCN)C(=O)NC(CC(N)=O)C(=O)NCC(=O)NCC(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CO)C(=O)NCC(=O)NC(C)C(=O)N1C(CCC1)C(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)CC)NC(=O)C(NC(=O)C(CC(C)C)NC(=O)C(CCCNC(N)=N)NC(=O)C(NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCSC)NC(=O)C(CCC(N)=O)NC(=O)C(CCCCN)NC(=O)C(CO)NC(=O)C(CC(C)C)NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(NC(=O)C(CC=1C=CC=CC=1)NC(=O)C(NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)CNC(=O)C(N)CC=1NC=NC=1)C(C)O)C(C)O)C(C)C)CC1=CC=CC=C1 XVVOERDUTLJJHN-UHFFFAOYSA-N 0.000 description 1
- 241000219745 Lupinus Species 0.000 description 1
- 102000009151 Luteinizing Hormone Human genes 0.000 description 1
- 108010073521 Luteinizing Hormone Proteins 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- GUYHHBZCBQZLFW-GUBZILKMSA-N Lys-Gln-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N GUYHHBZCBQZLFW-GUBZILKMSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 1
- KDBDVESGGJYVEH-PMVMPFDFSA-N Lys-Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)CCCCN)C(O)=O)C1=CC=CC=C1 KDBDVESGGJYVEH-PMVMPFDFSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 108010016230 MBP-8298 Proteins 0.000 description 1
- 101150084262 MDH3 gene Proteins 0.000 description 1
- 108010074954 MP4 maleimide-polyethylene glycol-modified hemoglobin Proteins 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 108010038049 Mating Factor Proteins 0.000 description 1
- 102100022430 Melanocyte protein PMEL Human genes 0.000 description 1
- 102100028389 Melanoma antigen recognized by T-cells 1 Human genes 0.000 description 1
- 108090000301 Membrane transport proteins Proteins 0.000 description 1
- 102000003939 Membrane transport proteins Human genes 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 1
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 1
- IYXDSYWCVVXSKB-CIUDSAMLSA-N Met-Asn-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IYXDSYWCVVXSKB-CIUDSAMLSA-N 0.000 description 1
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- DJDFBVNNDAUPRW-GUBZILKMSA-N Met-Glu-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DJDFBVNNDAUPRW-GUBZILKMSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 1
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 1
- WXJXYMFUTRXRGO-UWVGGRQHSA-N Met-His-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 WXJXYMFUTRXRGO-UWVGGRQHSA-N 0.000 description 1
- TZHFJXDKXGZHEN-IHRRRGAJSA-N Met-His-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O TZHFJXDKXGZHEN-IHRRRGAJSA-N 0.000 description 1
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 1
- RVYDCISQIGHAFC-ZPFDUUQYSA-N Met-Ile-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O RVYDCISQIGHAFC-ZPFDUUQYSA-N 0.000 description 1
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- FMYLZGQFKPHXHI-GUBZILKMSA-N Met-Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O FMYLZGQFKPHXHI-GUBZILKMSA-N 0.000 description 1
- OXIWIYOJVNOKOV-SRVKXCTJSA-N Met-Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCNC(N)=N OXIWIYOJVNOKOV-SRVKXCTJSA-N 0.000 description 1
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 1
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 1
- FNYBIOGBMWFQRJ-SRVKXCTJSA-N Met-Pro-Met Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N FNYBIOGBMWFQRJ-SRVKXCTJSA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 1
- YFGBQHOOROIVKG-FKBYEOEOSA-N Met-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 YFGBQHOOROIVKG-FKBYEOEOSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 108010021062 Micafungin Proteins 0.000 description 1
- 229920001410 Microfiber Polymers 0.000 description 1
- 241000235042 Millerozyma farinosa Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010072915 NAc-Sar-Gly-Val-(d-allo-Ile)-Thr-Nva-Ile-Arg-ProNEt Proteins 0.000 description 1
- 108010083255 NBI6024 Proteins 0.000 description 1
- 229940038430 NY-ESO-1 vaccine Drugs 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 229940122467 Nerve growth factor antagonist Drugs 0.000 description 1
- 102100032139 Neuroguidin Human genes 0.000 description 1
- 101710203741 Neuroguidin Proteins 0.000 description 1
- 101100287577 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gpe-1 gene Proteins 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 108010016076 Octreotide Proteins 0.000 description 1
- 241001452677 Ogataea methanolica Species 0.000 description 1
- 108010084331 Omiganan Proteins 0.000 description 1
- 206010033078 Otitis media Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 101150050255 PDC1 gene Proteins 0.000 description 1
- 108010027220 PEGylated soluble tumor necrosis factor receptor I Proteins 0.000 description 1
- 101150054516 PRD1 gene Proteins 0.000 description 1
- 101150051118 PTM1 gene Proteins 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 108010068701 Pegloticase Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 108010088847 Peptide YY Proteins 0.000 description 1
- 102100029909 Peptide YY Human genes 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- UEXCHCYDPAIVDE-SRVKXCTJSA-N Phe-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- OMHMIXFFRPMYHB-SRVKXCTJSA-N Phe-Cys-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OMHMIXFFRPMYHB-SRVKXCTJSA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- IEOHQGFKHXUALJ-JYJNAYRXSA-N Phe-Met-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IEOHQGFKHXUALJ-JYJNAYRXSA-N 0.000 description 1
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- OLZVAVSJEUAOHI-UNQGMJICSA-N Phe-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O OLZVAVSJEUAOHI-UNQGMJICSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- AOKZOUGUMLBPSS-PMVMPFDFSA-N Phe-Trp-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O AOKZOUGUMLBPSS-PMVMPFDFSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 1
- 108091007643 Phosphate carriers Proteins 0.000 description 1
- 102000011025 Phosphoglycerate Mutase Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 241001489192 Pichia kluyveri Species 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- 102100040990 Platelet-derived growth factor subunit B Human genes 0.000 description 1
- 108010012887 Poly(A)-Binding Protein I Proteins 0.000 description 1
- 101710139643 Polyadenylate-binding protein 1 Proteins 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 1
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- QNZLIVROMORQFH-BQBZGAKWSA-N Pro-Gly-Cys Chemical compound C1C[C@H](NC1)C(=O)NCC(=O)N[C@@H](CS)C(=O)O QNZLIVROMORQFH-BQBZGAKWSA-N 0.000 description 1
- 108700019404 Pro-Gly-Pro- ACTH (4-7) Proteins 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 1
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- BGGWNVWMHNTRDU-BZSNNMDCSA-N Pro-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 BGGWNVWMHNTRDU-BZSNNMDCSA-N 0.000 description 1
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- 101100528525 Prochlorococcus marinus (strain SARG / CCMP1375 / SS120) rnc gene Proteins 0.000 description 1
- 101710180012 Protease 7 Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 101150086562 RLI1 gene Proteins 0.000 description 1
- 108090000944 RNA Helicases Proteins 0.000 description 1
- 102000004409 RNA Helicases Human genes 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- KGZHFKDNSAEOJX-WIFQYKSHSA-N Ramoplanin Chemical compound C([C@H]1C(=O)N[C@H](CCCN)C(=O)N[C@H](C(=O)N[C@@H](C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C)C(=O)N[C@H](C(=O)O[C@@H]([C@@H](C(N[C@@H](C(=O)N[C@H](CCCN)C(=O)N[C@@H](C(=O)N[C@H](C(=O)N[C@@H](C(=O)N[C@H](C(=O)N1)[C@H](C)O)C=1C=CC(O)=CC=1)C=1C=CC(O)=CC=1)[C@@H](C)O)C=1C=CC(O)=CC=1)=O)NC(=O)[C@H](CC(N)=O)NC(=O)\C=C/C=C/CC(C)C)C(N)=O)C=1C=C(Cl)C(O)=CC=1)C=1C=CC(O)=CC=1)[C@@H](C)O)C=1C=CC(O[C@@H]2[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O[C@@H]2[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)=CC=1)C1=CC=CC=C1 KGZHFKDNSAEOJX-WIFQYKSHSA-N 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 101100062430 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DAP2 gene Proteins 0.000 description 1
- 101100184165 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MKC7 gene Proteins 0.000 description 1
- 101100459905 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NCP1 gene Proteins 0.000 description 1
- 101100545005 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YSP3 gene Proteins 0.000 description 1
- 244000253724 Saccharomyces cerevisiae S288c Species 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 1
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 108010026951 Short-Acting Insulin Proteins 0.000 description 1
- 229940123958 Short-acting insulin Drugs 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 102100022831 Somatoliberin Human genes 0.000 description 1
- 101710142969 Somatoliberin Proteins 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 229940124840 Streptococcal vaccine Drugs 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 101800001271 Surface protein Proteins 0.000 description 1
- 108010028908 TP 9201 Proteins 0.000 description 1
- 239000012163 TRI reagent Substances 0.000 description 1
- 108700042805 TRU-015 Proteins 0.000 description 1
- 108010039185 Tenecteplase Proteins 0.000 description 1
- 241000011102 Thera Species 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- SOUPNXUJAJENFU-SWRJLBSHSA-N Thr-Trp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O SOUPNXUJAJENFU-SWRJLBSHSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108010078233 Thymalfasin Proteins 0.000 description 1
- 102400000800 Thymosin alpha-1 Human genes 0.000 description 1
- UGPMCIBIHRSCBV-XNBOLLIBSA-N Thymosin beta 4 Chemical compound N([C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O)C(=O)[C@@H]1CCCN1C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(C)=O UGPMCIBIHRSCBV-XNBOLLIBSA-N 0.000 description 1
- 102100035000 Thymosin beta-4 Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- NIWAGRRZHCMPOY-GMVOTWDCSA-N Trp-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NIWAGRRZHCMPOY-GMVOTWDCSA-N 0.000 description 1
- DXDMNBJJEXYMLA-UBHSHLNASA-N Trp-Asn-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 DXDMNBJJEXYMLA-UBHSHLNASA-N 0.000 description 1
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- IQXWAJUIAQLZNX-IHPCNDPISA-N Trp-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N IQXWAJUIAQLZNX-IHPCNDPISA-N 0.000 description 1
- WKCFCVBOFKEVKY-HSCHXYMDSA-N Trp-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WKCFCVBOFKEVKY-HSCHXYMDSA-N 0.000 description 1
- UEFHVUQBYNRNQC-SFJXLCSZSA-N Trp-Phe-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=CC=C1 UEFHVUQBYNRNQC-SFJXLCSZSA-N 0.000 description 1
- ABRICLFKFRFDKS-IHPCNDPISA-N Trp-Ser-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ABRICLFKFRFDKS-IHPCNDPISA-N 0.000 description 1
- UPUNWAXSLPBMRK-XTWBLICNSA-N Trp-Thr-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UPUNWAXSLPBMRK-XTWBLICNSA-N 0.000 description 1
- ZPZNQAZHMCLTOA-PXDAIIFMSA-N Trp-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 ZPZNQAZHMCLTOA-PXDAIIFMSA-N 0.000 description 1
- 101100472152 Trypanosoma brucei brucei (strain 927/4 GUTat10.1) REL1 gene Proteins 0.000 description 1
- KSVMDJJCYKIXTK-IGNZVWTISA-N Tyr-Ala-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KSVMDJJCYKIXTK-IGNZVWTISA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 1
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- RIFVTNDKUMSSMN-ULQDDVLXSA-N Tyr-His-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O RIFVTNDKUMSSMN-ULQDDVLXSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 1
- NKMFRGPKTIEXSK-ULQDDVLXSA-N Tyr-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NKMFRGPKTIEXSK-ULQDDVLXSA-N 0.000 description 1
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 1
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- XPYNXORPPVTVQK-SRVKXCTJSA-N Val-Arg-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N XPYNXORPPVTVQK-SRVKXCTJSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- AHHJARQXFFGOKF-NRPADANISA-N Val-Glu-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N AHHJARQXFFGOKF-NRPADANISA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- UXODSMTVPWXHBT-ULQDDVLXSA-N Val-Phe-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N UXODSMTVPWXHBT-ULQDDVLXSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 229940029042 WT1 peptide vaccine Drugs 0.000 description 1
- 101150008621 YPS1 gene Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 108010045610 ZT-031 Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- QBQHUKKLUVZUBC-MQWQBNKOSA-N [3,5-bis(trifluoromethyl)phenyl]-[(2r)-2-(1h-indol-3-ylmethyl)-4-[[5-(morpholin-4-ylmethyl)-2h-triazol-4-yl]methyl]piperazin-1-yl]methanone;dihydrochloride Chemical compound Cl.Cl.FC(F)(F)C1=CC(C(F)(F)F)=CC(C(=O)N2[C@@H](CN(CC=3C(=NNN=3)CN3CCOCC3)CC2)CC=2C3=CC=CC=C3NC=2)=C1 QBQHUKKLUVZUBC-MQWQBNKOSA-N 0.000 description 1
- 241000222124 [Candida] boidinii Species 0.000 description 1
- 229960003697 abatacept Drugs 0.000 description 1
- 108010079650 abobotulinumtoxinA Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- FHEAIOHRHQGZPC-KIWGSFCNSA-N acetic acid;(2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-aminopentanedioic acid;(2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound CC(O)=O.C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CCC(O)=O.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 FHEAIOHRHQGZPC-KIWGSFCNSA-N 0.000 description 1
- HPPONSCISKROOD-OYLNGHKZSA-N acetic acid;(2s)-n-[(2s)-1-[[(2s)-1-[[(2s)-1-[[(2s)-1-[[(2r)-1-[[(2s)-1-[[(2s)-1-[(2s)-2-[(2-amino-2-oxoethyl)carbamoyl]pyrrolidin-1-yl]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-(1h-indol-3-yl)-1-oxopropan-2-y Chemical compound CC(O)=O.C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 HPPONSCISKROOD-OYLNGHKZSA-N 0.000 description 1
- 108010052004 acetyl-2-naphthylalanyl-3-chlorophenylalanyl-1-oxohexadecyl-seryl-4-aminophenylalanyl(hydroorotyl)-4-aminophenylalanyl(carbamoyl)-leucyl-ILys-prolyl-alaninamide Proteins 0.000 description 1
- 108010011755 acetyl-prolyl-histidyl-seryl-cysteinyl-asparaginamide Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- YAJCHEVQCOHZDC-QMMNLEPNSA-N actrapid Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3N=CNC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@H](C)CC)[C@H](C)CC)[C@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C(N)=O)C1=CNC=N1 YAJCHEVQCOHZDC-QMMNLEPNSA-N 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 108700026906 afamelanotide Proteins 0.000 description 1
- UAHFGYDRQSXQEB-LEBBXHLNSA-N afamelanotide Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(N)=O)NC(=O)[C@H](CO)NC(C)=O)C1=CC=C(O)C=C1 UAHFGYDRQSXQEB-LEBBXHLNSA-N 0.000 description 1
- 108010049936 agalsidase alfa Proteins 0.000 description 1
- 229960001239 agalsidase alfa Drugs 0.000 description 1
- 108010056760 agalsidase beta Proteins 0.000 description 1
- 229960004470 agalsidase beta Drugs 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 108010025925 alarin Proteins 0.000 description 1
- 108010080374 albuferon Proteins 0.000 description 1
- 108700025316 aldesleukin Proteins 0.000 description 1
- 229960005310 aldesleukin Drugs 0.000 description 1
- 229960002459 alefacept Drugs 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 229960003318 alteplase Drugs 0.000 description 1
- 108010070826 amediplase Proteins 0.000 description 1
- 229950011356 amediplase Drugs 0.000 description 1
- 108010026923 aminocandin Proteins 0.000 description 1
- UMNFJRNUJIBDSK-NMVZEWDOSA-N aminocandin Chemical compound C1=CC(OCCCCCCCC)=CC=C1C1=CC=C(C(=O)N[C@@H]2C(N[C@H](C(=O)N3C[C@H](O)C[C@H]3C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N3C[C@H](C)[C@H](O)[C@H]3C(=O)NCC(C2)NCCN)[C@H](O)CC=2C=CC(O)=CC=2)[C@@H](C)O)=O)C=C1 UMNFJRNUJIBDSK-NMVZEWDOSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001195 anabolic effect Effects 0.000 description 1
- 229960004238 anakinra Drugs 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 229960005348 antithrombin iii Drugs 0.000 description 1
- RCHHVVGSTHAVPF-ZPHPLDECSA-N apidra Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3N=CNC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CNC=N1 RCHHVVGSTHAVPF-ZPHPLDECSA-N 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 108010055530 arginyl-tryptophyl-N-methylphenylalanyl-tryptophyl-leucyl-methioninamide Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- VWXRQYYUEIYXCZ-OBIMUBPZSA-N atosiban Chemical compound C1=CC(OCC)=CC=C1C[C@@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CCCN)C(=O)NCC(N)=O)CSSCCC(=O)N1 VWXRQYYUEIYXCZ-OBIMUBPZSA-N 0.000 description 1
- 229960002403 atosiban Drugs 0.000 description 1
- 108700007535 atosiban Proteins 0.000 description 1
- 229940120638 avastin Drugs 0.000 description 1
- 108010006060 aviptadil Proteins 0.000 description 1
- 229950000586 aviptadil Drugs 0.000 description 1
- 229940003504 avonex Drugs 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- HYNPZTKLUNHGPM-KKERQHFVSA-N becaplermin Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](Cc2cnc[nH]2)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(=N)N)C(=O)N3CCC[C@H]3C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@@H]4CCCN4C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]5CCCN5C(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H]6CCCN6C(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@@H]7CCCN7C(=O)[C@H](Cc8c[nH]c9c8cccc9)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)N HYNPZTKLUNHGPM-KKERQHFVSA-N 0.000 description 1
- 229960004787 becaplermin Drugs 0.000 description 1
- 229960005347 belatacept Drugs 0.000 description 1
- 238000011021 bench scale process Methods 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000003833 bile salt Substances 0.000 description 1
- OHJMTUPIZMNBFR-UHFFFAOYSA-N biuret Chemical compound NC(=O)NC(N)=O OHJMTUPIZMNBFR-UHFFFAOYSA-N 0.000 description 1
- 108010055460 bivalirudin Proteins 0.000 description 1
- 229960001500 bivalirudin Drugs 0.000 description 1
- OIRCOABEOLEUMC-GEJPAHFPSA-N bivalirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 OIRCOABEOLEUMC-GEJPAHFPSA-N 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 230000010478 bone regeneration Effects 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 229940089093 botox Drugs 0.000 description 1
- 231100001103 botulinum neurotoxin Toxicity 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000007433 bsm medium Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229940009550 c1 esterase inhibitor Drugs 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 229960003773 calcitonin (salmon synthetic) Drugs 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 238000002619 cancer immunotherapy Methods 0.000 description 1
- 229940022399 cancer vaccine Drugs 0.000 description 1
- 238000009566 cancer vaccine Methods 0.000 description 1
- 238000004850 capillary HPLC Methods 0.000 description 1
- KVLLHLWBPNCVNR-SKCUWOTOSA-N capromorelin Chemical compound C([C@@]12CN(CCC1=NN(C2=O)C)C(=O)[C@@H](COCC=1C=CC=CC=1)NC(=O)C(C)(C)N)C1=CC=CC=C1 KVLLHLWBPNCVNR-SKCUWOTOSA-N 0.000 description 1
- 229950004826 capromorelin Drugs 0.000 description 1
- 230000023852 carbohydrate metabolic process Effects 0.000 description 1
- 235000021256 carbohydrate metabolism Nutrition 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 229950008486 carperitide Drugs 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 229960000419 catumaxomab Drugs 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 229960003115 certolizumab pegol Drugs 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- RCTCWZRPYFBGLQ-KVBIMOIYSA-N chembl2105639 Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C(C)C)C1=CC=CC=C1 RCTCWZRPYFBGLQ-KVBIMOIYSA-N 0.000 description 1
- QPAKKWCQMHUHNI-GQIQPHNSSA-N chlorotoxin Chemical compound C([C@H]1C(=O)NCC(=O)N2CCC[C@H]2C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H]4CSSC[C@@H](C(N[C@@H](CCSC)C(=O)N5CCC[C@H]5C(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)CNC(=O)CNC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC2=O)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC4=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N3)=O)NC(=O)[C@@H](N)CCSC)C1=CC=C(O)C=C1 QPAKKWCQMHUHNI-GQIQPHNSSA-N 0.000 description 1
- 229940015047 chorionic gonadotropin Drugs 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- HTBKFGWATIYCSF-QGXIKSNHSA-N conantokin g Chemical compound NC(=O)C[C@@H](C(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN HTBKFGWATIYCSF-QGXIKSNHSA-N 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- KJQOYUHYAZGPIZ-PIJHVLQJSA-N conotoxin vc1.1 Chemical compound C([C@H]1C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(N[C@@H](CSSC[C@@H]2NC(=O)[C@@H](NC(=O)CN)CSSC[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CC(O)=O)C(=O)N1)C(N)=O)=O)[C@@H](C)CC)C1=CN=CN1 KJQOYUHYAZGPIZ-PIJHVLQJSA-N 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- OPQARKPSCNTWTJ-UHFFFAOYSA-L copper(ii) acetate Chemical compound [Cu+2].CC([O-])=O.CC([O-])=O OPQARKPSCNTWTJ-UHFFFAOYSA-L 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 229940108471 crofab Drugs 0.000 description 1
- VUYRSKROGTWHDC-HZGLMRDYSA-N ctce 9908 Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)CNC(=O)[C@@H](N)CCCCN)C(C)C)CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCCCC[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)CNC(=O)[C@@H](N)CCCCN)C(C)C)C(N)=O)C1=CC=C(O)C=C1 VUYRSKROGTWHDC-HZGLMRDYSA-N 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- DOAKLVKFURWEDJ-QCMAZARJSA-N daptomycin Chemical compound C([C@H]1C(=O)O[C@H](C)[C@@H](C(NCC(=O)N[C@@H](CCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@H](CO)C(=O)N[C@H](C(=O)N1)[C@H](C)CC(O)=O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](CC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CCCCCCCCC)C(=O)C1=CC=CC=C1N DOAKLVKFURWEDJ-QCMAZARJSA-N 0.000 description 1
- 229960005484 daptomycin Drugs 0.000 description 1
- 229960002272 degarelix Drugs 0.000 description 1
- MEUCPCLKGZSHTA-XYAYPHGZSA-N degarelix Chemical compound C([C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCNC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@H](C)C(N)=O)NC(=O)[C@H](CC=1C=CC(NC(=O)[C@H]2NC(=O)NC(=O)C2)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](CC=1C=NC=CC=1)NC(=O)[C@@H](CC=1C=CC(Cl)=CC=1)NC(=O)[C@@H](CC=1C=C2C=CC=CC2=CC=1)NC(C)=O)C1=CC=C(NC(N)=O)C=C1 MEUCPCLKGZSHTA-XYAYPHGZSA-N 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 108010017271 denileukin diftitox Proteins 0.000 description 1
- 229960002923 denileukin diftitox Drugs 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 108010073652 desirudin Proteins 0.000 description 1
- 229960000296 desirudin Drugs 0.000 description 1
- XYWBJDRHGNULKG-OUMQNGNKSA-N desirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 XYWBJDRHGNULKG-OUMQNGNKSA-N 0.000 description 1
- 229960004281 desmopressin Drugs 0.000 description 1
- NFLWUMRGJYTJIN-NXBWRCJVSA-N desmopressin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSCCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(N)=O)=O)CCC(=O)N)C1=CC=CC=C1 NFLWUMRGJYTJIN-NXBWRCJVSA-N 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000000032 diagnostic agent Substances 0.000 description 1
- 229940039227 diagnostic agent Drugs 0.000 description 1
- VGGRNGOEDNBLPH-YJHCMWSWSA-N diapep277 Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)CCC1 VGGRNGOEDNBLPH-YJHCMWSWSA-N 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 229940021344 digifab Drugs 0.000 description 1
- 108010034479 digoxin antibodies Fab fragments Proteins 0.000 description 1
- AIUDWMLXCFRVDR-UHFFFAOYSA-N dimethyl 2-(3-ethyl-3-methylpentyl)propanedioate Chemical class CCC(C)(CC)CCC(C(=O)OC)C(=O)OC AIUDWMLXCFRVDR-UHFFFAOYSA-N 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 108010067396 dornase alfa Proteins 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- JMNJYGMAUMANNW-FIXZTSJVSA-N dynorphin a Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 JMNJYGMAUMANNW-FIXZTSJVSA-N 0.000 description 1
- 229940098753 dysport Drugs 0.000 description 1
- 101150114135 eIF4E gene Proteins 0.000 description 1
- 230000002500 effect on skin Effects 0.000 description 1
- 229940056913 eftilagimod alfa Drugs 0.000 description 1
- QBEPNUQJQWDYKU-BMGKTWPMSA-N egrifta Chemical compound C([C@H](NC(=O)C/C=C/CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(N)=O)C1=CC=C(O)C=C1 QBEPNUQJQWDYKU-BMGKTWPMSA-N 0.000 description 1
- MDCUNMLZLNGCQA-HWOAGHQOSA-N elafin Chemical compound N([C@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H]1C(=O)N2CCC[C@H]2C(=O)N[C@H](C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H]2CSSC[C@H]3C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CSSC[C@H]4C(=O)N5CCC[C@H]5C(=O)NCC(=O)N[C@H](C(N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H]5N(CCC5)C(=O)[C@H]5N(CCC5)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)NC2=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N4)C(=O)N[C@@H](CSSC1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N3)=O)[C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)C(C)C)C(C)C)C(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N MDCUNMLZLNGCQA-HWOAGHQOSA-N 0.000 description 1
- KUBARPMUNHKBIQ-VTHUDJRQSA-N eliglustat tartrate Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O.C([C@@H](NC(=O)CCCCCCC)[C@H](O)C=1C=C2OCCOC2=CC=1)N1CCCC1.C([C@@H](NC(=O)CCCCCCC)[C@H](O)C=1C=C2OCCOC2=CC=1)N1CCCC1 KUBARPMUNHKBIQ-VTHUDJRQSA-N 0.000 description 1
- 229940073621 enbrel Drugs 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 108010002601 epoetin beta Proteins 0.000 description 1
- 229960004579 epoetin beta Drugs 0.000 description 1
- 108010067416 epoetin delta Proteins 0.000 description 1
- 229950002109 epoetin delta Drugs 0.000 description 1
- 108010090921 epoetin omega Proteins 0.000 description 1
- 229950008767 epoetin omega Drugs 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000013265 extended release Methods 0.000 description 1
- 229940012444 factor xiii Drugs 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012526 feed medium Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 229960004177 filgrastim Drugs 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 230000007849 functional defect Effects 0.000 description 1
- 108010089296 galsulfase Proteins 0.000 description 1
- 229960005390 galsulfase Drugs 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 101150073818 gap gene Proteins 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 229960003776 glatiramer acetate Drugs 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 108010049491 glucarpidase Proteins 0.000 description 1
- 229960004859 glucarpidase Drugs 0.000 description 1
- 230000004110 gluconeogenesis Effects 0.000 description 1
- 239000006481 glucose medium Substances 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010051015 glutathione-independent formaldehyde dehydrogenase Proteins 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 102000035122 glycosylated proteins Human genes 0.000 description 1
- 108091005608 glycosylated proteins Proteins 0.000 description 1
- 229960002913 goserelin Drugs 0.000 description 1
- 101150084612 gpmA gene Proteins 0.000 description 1
- 230000009643 growth defect Effects 0.000 description 1
- 208000037824 growth disorder Diseases 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 230000009036 growth inhibition Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 108010013846 hematide Proteins 0.000 description 1
- 208000010710 hepatitis C virus infection Diseases 0.000 description 1
- 201000011200 hepatorenal syndrome Diseases 0.000 description 1
- 229940022353 herceptin Drugs 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 239000012510 hollow fiber Substances 0.000 description 1
- WNRQPCUGRUFHED-DETKDSODSA-N humalog Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 WNRQPCUGRUFHED-DETKDSODSA-N 0.000 description 1
- 102000050459 human LTF Human genes 0.000 description 1
- 102000056614 human NPPA Human genes 0.000 description 1
- 102000058004 human PTH Human genes 0.000 description 1
- 229940116978 human epidermal growth factor Drugs 0.000 description 1
- 229940048921 humira Drugs 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- QURWXBZNHXJZBE-SKXRKSCCSA-N icatibant Chemical compound NC(N)=NCCC[C@@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)NCC(=O)N[C@@H](CC=2SC=CC=2)C(=O)N[C@@H](CO)C(=O)N2[C@H](CC3=CC=CC=C3C2)C(=O)N2[C@@H](C[C@@H]3CCCC[C@@H]32)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C[C@@H](O)C1 QURWXBZNHXJZBE-SKXRKSCCSA-N 0.000 description 1
- 229960001062 icatibant Drugs 0.000 description 1
- 108700023918 icatibant Proteins 0.000 description 1
- 229950006895 icrocaptide Drugs 0.000 description 1
- 229960002396 idursulfase Drugs 0.000 description 1
- 108010072166 idursulfase Proteins 0.000 description 1
- BCGWQEUPMDMJNV-UHFFFAOYSA-N imipramine Chemical compound C1CC2=CC=CC=C2N(CCCN(C)C)C2=CC=CC=C21 BCGWQEUPMDMJNV-UHFFFAOYSA-N 0.000 description 1
- 229960004801 imipramine Drugs 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 238000010569 immunofluorescence imaging Methods 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 229940032219 immunotherapy vaccine Drugs 0.000 description 1
- 239000002596 immunotoxin Substances 0.000 description 1
- 231100000608 immunotoxin Toxicity 0.000 description 1
- 229940051026 immunotoxin Drugs 0.000 description 1
- 230000002637 immunotoxin Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 229910001026 inconel Inorganic materials 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 229960000598 infliximab Drugs 0.000 description 1
- 229960003971 influenza vaccine Drugs 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960004717 insulin aspart Drugs 0.000 description 1
- 229960002869 insulin glargine Drugs 0.000 description 1
- 108700039926 insulin glulisine Proteins 0.000 description 1
- 229960000696 insulin glulisine Drugs 0.000 description 1
- 229960002068 insulin lispro Drugs 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 229960001388 interferon-beta Drugs 0.000 description 1
- 108010074108 interleukin-21 Proteins 0.000 description 1
- 229940028885 interleukin-4 Drugs 0.000 description 1
- VBUWHHLIZKOSMS-RIWXPGAOSA-N invicorp Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 VBUWHHLIZKOSMS-RIWXPGAOSA-N 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 159000000014 iron salts Chemical class 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 108010091711 kahalalide F Proteins 0.000 description 1
- KXJTWOGIBOWZDJ-LELJLAJGSA-N l-blp25 Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1N(CCC1)C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)[C@@H](C)O)C1=CNC=N1 KXJTWOGIBOWZDJ-LELJLAJGSA-N 0.000 description 1
- 108010021336 lanreotide Proteins 0.000 description 1
- 229960002437 lanreotide Drugs 0.000 description 1
- 229960002486 laronidase Drugs 0.000 description 1
- 229960002618 lenograstim Drugs 0.000 description 1
- 229960004408 lepirudin Drugs 0.000 description 1
- OTQCKZUSUGYWBD-BRHMIFOHSA-N lepirudin Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)[C@@H](C)O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)[C@@H](C)O)C1=CC=C(O)C=C1 OTQCKZUSUGYWBD-BRHMIFOHSA-N 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 108010024409 linaclotide Proteins 0.000 description 1
- 229960000812 linaclotide Drugs 0.000 description 1
- KXGCNMMJRFDFNR-WDRJZQOASA-N linaclotide Chemical compound C([C@H](NC(=O)[C@@H]1CSSC[C@H]2C(=O)N[C@H]3CSSC[C@H](N)C(=O)N[C@H](C(N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N2)=O)CSSC[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]2CCCN2C(=O)[C@H](CC(N)=O)NC3=O)C(=O)N[C@H](C(NCC(=O)N1)=O)[C@H](O)C)C(O)=O)C1=CC=C(O)C=C1 KXGCNMMJRFDFNR-WDRJZQOASA-N 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 108010033214 liprotamase lipase Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 229960002701 liraglutide Drugs 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 108010004367 lixisenatide Proteins 0.000 description 1
- 229960001093 lixisenatide Drugs 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- 229940040129 luteinizing hormone Drugs 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012533 medium component Substances 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 108010080780 melanotan-II Proteins 0.000 description 1
- IBIKHMZPHNKTHM-RDTXWAMCSA-N merck compound 25 Chemical compound C1C[C@@H](C(O)=O)[C@H](O)CN1C(C1=C(F)C=CC=C11)=NN1C(=O)C1=C(Cl)C=CC=C1C1CC1 IBIKHMZPHNKTHM-RDTXWAMCSA-N 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 229910001092 metal group alloy Inorganic materials 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 229960002159 micafungin Drugs 0.000 description 1
- PIEUQSKUWLMALL-YABMTYFHSA-N micafungin Chemical compound C1=CC(OCCCCC)=CC=C1C1=CC(C=2C=CC(=CC=2)C(=O)N[C@@H]2C(N[C@H](C(=O)N3C[C@H](O)C[C@H]3C(=O)N[C@H](C(=O)N[C@H](C(=O)N3C[C@H](C)[C@H](O)[C@H]3C(=O)N[C@H](O)[C@H](O)C2)[C@H](O)CC(N)=O)[C@H](O)[C@@H](O)C=2C=C(OS(O)(=O)=O)C(O)=CC=2)[C@@H](C)O)=O)=NO1 PIEUQSKUWLMALL-YABMTYFHSA-N 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000003658 microfiber Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 108010068982 microplasmin Proteins 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- MEFBJEMVZONFCJ-UHFFFAOYSA-N molybdate Chemical compound [O-][Mo]([O-])(=O)=O MEFBJEMVZONFCJ-UHFFFAOYSA-N 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 108010075698 monteplase Proteins 0.000 description 1
- 229950005805 monteplase Drugs 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229950010676 nartograstim Drugs 0.000 description 1
- 108010032539 nartograstim Proteins 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 229950002774 nateplase Drugs 0.000 description 1
- 230000009707 neogenesis Effects 0.000 description 1
- GVUGOAYIVIDWIO-UFWWTJHBSA-N nepidermin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CS)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C(C)C)C(C)C)C1=CC=C(O)C=C1 GVUGOAYIVIDWIO-UFWWTJHBSA-N 0.000 description 1
- 229960001267 nesiritide Drugs 0.000 description 1
- HPNRHPKXQZSDFX-OAQDCNSJSA-N nesiritide Chemical compound C([C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)CNC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CO)C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 HPNRHPKXQZSDFX-OAQDCNSJSA-N 0.000 description 1
- 229940071846 neulasta Drugs 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- VOMXSOIBEJBQNF-UTTRGDHVSA-N novorapid Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 VOMXSOIBEJBQNF-UTTRGDHVSA-N 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 229960002700 octreotide Drugs 0.000 description 1
- MVPAMLBUDIFYGK-BHDRXCTLSA-N omiganan Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(N)=O)=CNC2=C1 MVPAMLBUDIFYGK-BHDRXCTLSA-N 0.000 description 1
- 229950008583 omiganan Drugs 0.000 description 1
- 244000309459 oncolytic virus Species 0.000 description 1
- 229950010444 onercept Drugs 0.000 description 1
- 229940100629 oral lozenge Drugs 0.000 description 1
- 101150059056 pab1 gene Proteins 0.000 description 1
- 108010084846 parathyroid hormone (7-34) Proteins 0.000 description 1
- 229960005415 pasireotide Drugs 0.000 description 1
- 108700017947 pasireotide Proteins 0.000 description 1
- VMZMNAABQBOLAK-DBILLSOUSA-N pasireotide Chemical compound C([C@H]1C(=O)N2C[C@@H](C[C@H]2C(=O)N[C@H](C(=O)N[C@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@H](C(N[C@@H](CC=2C=CC(OCC=3C=CC=CC=3)=CC=2)C(=O)N1)=O)CCCCN)C=1C=CC=CC=1)OC(=O)NCCN)C1=CC=CC=C1 VMZMNAABQBOLAK-DBILLSOUSA-N 0.000 description 1
- HQQSBEDKMRHYME-UHFFFAOYSA-N pefloxacin mesylate Chemical compound [H+].CS([O-])(=O)=O.C1=C2N(CC)C=C(C(O)=O)C(=O)C2=CC(F)=C1N1CCN(C)CC1 HQQSBEDKMRHYME-UHFFFAOYSA-N 0.000 description 1
- 229960001373 pegfilgrastim Drugs 0.000 description 1
- 108010092851 peginterferon alfa-2b Proteins 0.000 description 1
- 229940106366 pegintron Drugs 0.000 description 1
- 229950000867 pegsunercept Drugs 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 229940066779 peptones Drugs 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 238000005191 phase separation Methods 0.000 description 1
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 239000003016 pheromone Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 238000011020 pilot scale process Methods 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 101150063938 ply gene Proteins 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 229960003611 pramlintide Drugs 0.000 description 1
- 108010029667 pramlintide Proteins 0.000 description 1
- NRKVKVQDUCJPIZ-MKAGXXMWSA-N pramlintide acetate Chemical compound C([C@@H](C(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 NRKVKVQDUCJPIZ-MKAGXXMWSA-N 0.000 description 1
- 239000013615 primer Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 229940030749 prostate cancer vaccine Drugs 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 238000001273 protein sequence alignment Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 238000011363 radioimmunotherapy Methods 0.000 description 1
- 108010076689 ramoplanin Proteins 0.000 description 1
- 229950003551 ramoplanin Drugs 0.000 description 1
- 229960003876 ranibizumab Drugs 0.000 description 1
- 229960000424 rasburicase Drugs 0.000 description 1
- 108010084837 rasburicase Proteins 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 229940038850 rebif Drugs 0.000 description 1
- 108010003189 recombinant human tumor necrosis factor-binding protein-1 Proteins 0.000 description 1
- 108700037321 recombinant methionyl human leptin Proteins 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 229940116176 remicade Drugs 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 108010051412 reteplase Proteins 0.000 description 1
- 229960002917 reteplase Drugs 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 210000004708 ribosome subunit Anatomy 0.000 description 1
- 229960005560 rindopepimut Drugs 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 108010054669 rotigaptide Proteins 0.000 description 1
- GFJRASPBQLDRRY-TWTQBQJDSA-N rotigaptide Chemical compound NC(=O)CNC(=O)[C@@H](C)NC(=O)CNC(=O)[C@H]1C[C@H](O)CN1C(=O)[C@@H]1N(C(=O)[C@@H](CC=2C=CC(O)=CC=2)NC(C)=O)CCC1 GFJRASPBQLDRRY-TWTQBQJDSA-N 0.000 description 1
- 229950005893 rotigaptide Drugs 0.000 description 1
- 102220058910 rs786201402 Human genes 0.000 description 1
- 108010068072 salmon calcitonin Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 108010038379 sargramostim Proteins 0.000 description 1
- 229960002530 sargramostim Drugs 0.000 description 1
- AFEHBIGDWIGTEH-AQRCPPRCSA-N semax Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CNC=N1 AFEHBIGDWIGTEH-AQRCPPRCSA-N 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- WGWPRVFKDLAUQJ-MITYVQBRSA-N sermorelin Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)C1=CC=C(O)C=C1 WGWPRVFKDLAUQJ-MITYVQBRSA-N 0.000 description 1
- 229960002758 sermorelin Drugs 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229960000714 sipuleucel-t Drugs 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 229960004532 somatropin Drugs 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- LQZAIAZUDWIVPM-SRVKXCTJSA-N taltirelin Chemical compound N1C(=O)N(C)C(=O)C[C@H]1C(=O)N[C@H](C(=O)N1[C@@H](CCC1)C(N)=O)CC1=CN=CN1 LQZAIAZUDWIVPM-SRVKXCTJSA-N 0.000 description 1
- 229950007365 taltirelin Drugs 0.000 description 1
- 235000012976 tarts Nutrition 0.000 description 1
- WRGVLTAWMNZWGT-VQSPYGJZSA-N taspoglutide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NC(C)(C)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)C(C)(C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 WRGVLTAWMNZWGT-VQSPYGJZSA-N 0.000 description 1
- 229950007151 taspoglutide Drugs 0.000 description 1
- 108010073046 teduglutide Proteins 0.000 description 1
- CILIXQOJUNDIDU-ASQIGDHWSA-N teduglutide Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O)[C@@H](C)CC)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)CC)C1=CC=CC=C1 CILIXQOJUNDIDU-ASQIGDHWSA-N 0.000 description 1
- 229960002444 teduglutide Drugs 0.000 description 1
- 229950009634 telbermin Drugs 0.000 description 1
- 229960000216 tenecteplase Drugs 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940021747 therapeutic vaccine Drugs 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229960003766 thrombin (human) Drugs 0.000 description 1
- 229940126460 thrombopoietin receptor agonist Drugs 0.000 description 1
- NZVYCXVTEHPMHE-ZSUJOUNUSA-N thymalfasin Chemical compound CC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NZVYCXVTEHPMHE-ZSUJOUNUSA-N 0.000 description 1
- 229960004231 thymalfasin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 108010079996 thymosin beta(4) Proteins 0.000 description 1
- ZRXXHPDJLAQCPC-SFJRRRFZSA-N tigapotide Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@H](CSCNC(C)=O)NC(=O)[C@@H](NC(=O)[C@H](CSCNC(C)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CSCNC(C)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)CCC(O)=O)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C1=CC=C(O)C=C1 ZRXXHPDJLAQCPC-SFJRRRFZSA-N 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- 108010075758 trebananib Proteins 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 229960000434 triptorelin acetate Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 229960002109 tuberculosis vaccine Drugs 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
- 108010084171 vanutide cridificar Proteins 0.000 description 1
- 208000019553 vascular disease Diseases 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 235000019156 vitamin B Nutrition 0.000 description 1
- 239000011720 vitamin B Substances 0.000 description 1
- 229940054953 vitrase Drugs 0.000 description 1
- BICRTLVBTLFLRD-PTWUADNWSA-N voclosporin Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C=C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O BICRTLVBTLFLRD-PTWUADNWSA-N 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 230000029663 wound healing Effects 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
- BPKIMPVREBSLAJ-QTBYCLKRSA-N ziconotide Chemical compound C([C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]2C(=O)N[C@@H]3C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CSSC2)C(N)=O)=O)CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CSSC3)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(N1)=O)CCSC)[C@@H](C)O)C1=CC=C(O)C=C1 BPKIMPVREBSLAJ-QTBYCLKRSA-N 0.000 description 1
- 229960002811 ziconotide Drugs 0.000 description 1
- WHNFPRLDDSXQCL-UAZQEYIDSA-N α-msh Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(N)=O)NC(=O)[C@H](CO)NC(C)=O)C1=CC=C(O)C=C1 WHNFPRLDDSXQCL-UAZQEYIDSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4705—Regulators; Modulating activity stimulating, promoting or activating activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
재조합 진핵 숙주 세포로서, 유전적 변형에 의해 조작되어, 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여, 메신저 리보핵단백질(mRNP)의 번역 개시 인자(TIF 유전자)를 코딩하는 2개 이상의 유전자의 발현을 증가시키는 관심 유전자(GOI)를 발현하며, 여기서 상기 TIF 유전자는 적어도 eIF4A를 코딩하는 유전자 및 eIF4G를 코딩하는 유전자를 포함하고, 상기 TIF 유전자 중 적어도 하나의 발현은 상기 GOI의 발현을 제어하는 프로모터와 상이한 프로모터의 전사 제어 하에 있는, 숙주 세포.
Description
본 발명은 하나 이상의 번역 인자의 발현을 증가시키도록 조작된 숙주 세포 및 재조합 단백질 생산의 수율을 개선하는 것에 관한 것이다.
재조합 숙주 세포 배양에서 생성된 단백질은 진단 및 치료제로서 점점 더 중요해지고 있다. 이러한 목적을 위해 세포는 비정상적으로 높은 수준의 재조합 또는 이종 관심 단백질을 생산하도록 조작 및/또는 선택된다.
관심 단백질(POI)의 성공적인 생산은 세포 배양에서 진핵 숙주 세포로 달성되었다. 진핵 숙주 세포, 특히 포유동물 숙주 세포, 효모 또는 사상성 진균 또는 박테리아는 일반적으로 대용량 화학물질 뿐만 아니라 생약학적 단백질의 생산 숙주로서 사용된다. 가장 눈에 띄는 예는 이종 단백질의 효율적인 분비로 잘 알려진 피치아 파스토리스(Pichia pastoris)와 같은 메틸로트로픽(methylotrophic) 효모이다. 2005년에 P. 파스토리스(P. pastoris)는 새로운 속인 코마가타엘라(Komagataella)로 재분류되었고, K. 파스토리스(K. pastoris), K. 파피(K. phaffii) 및 K. 슈도파스토리스(K. pseudopastoris)의 세 종으로 분리되었다. 생명공학 응용에 일반적으로 사용되는 균주는 제안된 두 종인 K. 파스토리스(K. pastoris)와 K. 파피(K. phaffii)에 속한다. 균주 GS115, X-33, CBS2612 및 CBS7435는 K. 파피(K. phaffii)인 반면, 균주 DSMZ70382는 기준 종인 K. 파스토리스(K. pastoris)로 분류되며, 이는 이용가능한 모든 P. 파스토리스(P. pastoris) 균주에 대한 참조 균주이다(Kurtzman 2009, J Ind Microbiol Biotechnol. 36(11):1435-8). 마타노비치 등(Mattanovich et al., Microbial Cell Factories 2009, 8:29 doi:10.1186/1475-2859-8-29)은 K. 파스토리스(K. pastoris)의 유형 균주 DSMZ70382의 게놈 시퀀싱을 설명하고 이의 세크레톰(secretome) 및 당 수송체를 분석했다.
리보솜은 단백질 합성을 수행하는 복잡한 리보핵단백질 집합체이다. 메신저 리보핵단백질(mRNP)은 mRNA-단백질 복합체이며, 여기서 전사체는 전사체의 수명 주기를 구성하는 동시-전사 및 전사-후 이벤트를 중재하는 변화하는 단백질 세트에 의해 결합된다. 전사체는 먼저 5' 단부 캡핑, 많은 경우 스플라이싱, 3' 절단 및 폴리아데닐화, 핵 엑소좀에 의한 mRNA 품질 제어 및 수출 인자 모집을 거친다. 그런 다음 세포질로 보내지며, 일부는 특정 세포 내 지역화를 거친다. 전사체는 결국 종종 규제된 방식으로 번역되고 품질이 저하된다.
번역 개시는 재조합 단백질 생산을 위한 중요한 경로에 있다. mRNA, 다수의 진핵 개시 인자(eIF) 및 리보솜 단백질로 이루어진 폐쇄 루프 구조의 형성이 번역 개시를 돕고 따라서 전체적인 번역 효율을 증가시키기 위해 논의되고 있다.
미드 등(Mead et al. , Biochem. J. 2015, 472:261-273)은 폐쇄 루프, eIF(eIF3a, eIF3b, eIF3c, eIF3h, eIF3i 및 eIF4G1), 폴리(A)-결합 단백질(PABP) 1 및 PABP-상호작용 단백질 1(PAIP1)의 주요 성분의 mRNA 및 단백질 수준을 모노클로날 항체(mAb)를 생성하는 30개의 재조합 CHO 세포주 패널에 걸쳐서 설명한다. 고-생산성 세포주는 폐쇄 루프 mRNA의 형성에 관여하는 번역 개시 인자의 양을 유지하여 이러한 단백질을 적절한 수준으로 유지하여 향상된 재조합 단백질 생산을 전달하는 것으로 밝혀졌다.
eIF4F 복합체는 캡-결합 단백질 eIF4E, eIF4G 및 RNA 헬리케이스 eIF4A로 이루어진다. eIF4G는 PABP(PAB1), eIF4E, eIF4A 및 (포유류에서) eIF3에 대한 결합 도메인을 보유하는 스캐폴드 단백질이다. 효모와 인간 eIF4G 모두 RNA에 결합한다. RNA-결합 활성과 함께 eIF4G에서 eIF4E 및 PABP에 대한 결합 도메인은 eIF4G가 안정적인 원형 메신저 리보핵단백질(mRNP)을 조립하기 위해 캡, 폴리(A) 꼬리 및 mRNA 본체의 서열을 통해 mRNA와 독립적인 상호작용을 조정할 수 있게 하며, 이는 "폐쇄-루프" 구조라고 한다.
폐쇄 루프 모델은 여러 번역 개시 인자를 포함하여 많은 단백질에 의해 매개되는 가교 메커니즘을 통해 mRNA의 5'- 및 3'-단부의 상호작용을 제안한다. 폐쇄 루프의 코어 브리지는 5'-캡, eIF4F(eIF4A, eIF4E 및 eIF4G로 구성), eIF3, 폴리(A)-결합 단백질(PABP)-상호작용 단백질 1(PAIP1), PABP1 및 폴리(A) 꼬리 사이에 형성된다. mRNA의 이러한 원형화는 리보솜의 향상된 재활용 및/또는 eIF4F가 mRNA에 묶인 상태로 유지되도록 함으로써 번역 속도를 향상시키고 번역 개시의 모든 라운드에 대해 유리 eIF4F 풀에서 다시 모집할 필요가 없다는 것이 대체로 받아들여지고 있다. 진핵생물에서 번역의 신장, 종료 및 재활용 단계는 문헌에서 검토되었다(Dever et al., Cold Spring Harb Perspect Biol 2012;4:a013706 및 Hinnebusch et al., Cold Spring Harb Perspect Biol 2012;4:a011544).
루볼 등(Roobol et al., Metabolic Engineering 2020, 59:98-105)은 증가된 성장 속도, 증가된 단백질 합성 용량 및 지연된 아폽토시스에 대한 포유류 세포주 HEK 및 CHO 세포주 각각에서 대형 eIF3 복합체의 eIF3i 및 eIF3v 서브유닛의 일시적이고 안정적인 과발현의 효과를 조사한다. eIF3i는 진핵 개시 인자 3(eIF3) 복합체의 성분로 12개의 상이한 서브유닛의 단일 카피를 포함하며, 그 중 a, b, c, g 및 i의 5개가 보존되어 있으며 효모에서 포유류에 이르기까지 생체 내에서 필수적이다.
아쳐 등(Archer et al., RNA Biol. 2015 Mar; 12(3): 248-254)은 효모에서 캡 구조, 폴리(A) 꼬리, eIF4E, eIF4G 및 PAB 사이의 상호작용을 통해 형성된 mRNA 폐쇄-루프를 조사했다.
챈 등(Chan et al., eLife 2018;7:e32536)은 효모에서 번역 개시를 억제하면 개별 전사체가 불안정해지고 mRNA 붕괴가 가속화된다고 설명한다. eIF4E의 5'캡- 결합 돌연변이의 과발현은 미묘한 성장 억제를 일으켰다. eIF4E 및 eIF4G를 동시에 하향조절하면 강력한 합성 성장 결함이 관찰되었다.
39S 및 57S 번역 복합체에 존재하는 번역 개시 인자 eIF4E, eIF4G1 및 eIF4G2는 PAB1과 동시-정제된다. 이러한 복합체는 폐쇄-루프 인자, eIF4E, eIF4G 및 PAB1을 함유하며 eIF4E가 mRNA 캡에 결합하고 PAB1이 폴리아데닐화된 꼬리에 결합함으로써 mRNA와 명백하게 연관된다(Denis et al. Nature Scientific Reports 2018, 8:11468).
RLI1은 리보솜 재활용에 중요하고 효율적인 정지 코돈 인식에 필요하여 번역 종료를 자극하는 것으로 알려져 있다. 그러나 RLI1은 번역 개시와 리보솜 생물발생에서 이중 기능을 가지고 있다. 야루닌 등(Yarunin et al., The EMBO Journal 2005, 24:580-588)은 pre-40S 입자 및 성숙한 40S 서브유닛과 연관된 리보솜 형성에서 기능을 가진 RLI1을 설명한다. RLI1은 특히 MFC 성분 및 40S 리보솜과 연관이 있다(Dong et al., THE JOURNAL OF BIOLOGICAL CHEMISTRY 2004, 279(40):42157-42168).
랴오 등(Liao et al., Biotechnol Lett (2020). https://doi.org/10.1007/s10529-020-02977-z)은 번역-관련 인자-과발현 균주에서 메탄올 유도 하에 eGFP의 발현 프로필을 기재하고 메탄올 유도 하에서 과발현되었을 때 eGFP 발현을 상당히 증가시킨 요인으로 리보솜 생물발생 인자인 Bcy1을 확인하였다. eIF4A 및 eIF4G 과발현자는 그러한 발현 시스템에서 유의미한 영향을 미치지 않았다. Bcy1은 사이클릭 AMP-의존성 단백질 키나제(PKA)의 조절 서브유닛으로 리보솜 단백질 유전자, 포스트디옥식(postdiauxic) 이동 유전자 및 스트레스 반응 요소 유전자를 조절하여 세포 성장 및 이종 단백질 발현을 개선한다.
WO2019173204A1은 PAB1을 과발현하는 효모를 개시하여 대규모 에탄올 생산에 사용하기 위한 아세테이트 형성을 감소시킨다. US5646009는 하나의 열린 해독틀에 eIF4E를 코딩하는 DNA 세그먼트 및 관심 단백질을 코딩하는 또 다른 DNA 세그먼트를 포함하여 진핵 숙주 세포, 특히 HEK 세포에서 단백질의 발현을 증가시키는 하이브리드 벡터를 개시한다.
CN110551750은 RLI1을 과발현함으로써 효모 mRNA 발현의 효율을 향상시키는 것을 기술한다.
EP3663319는 PAB1 및 eIF4G를 포함하는 융합 단백질을 발현하고 효모에서 관심 단백질을 발현하는 것을 개시한다.
이 요약은 하기의 상세한 설명에서 추가로 설명되는 단순화된 형태로 개념의 선택을 소개하기 위해 제공된다. 이 요약은 청구된 주제의 핵심 또는 필수 기능을 식별하기 위한 것이 아니며 청구된 주제의 범위를 제한하기 위해 사용하려는 것도 아니다. 청구된 주제의 다른 특징, 세부 사항, 유용성 및 장점은 첨부된 도면에 예시되고 첨부된 청구 범위에 정의된 측면을 포함하여 다음의 서면 상세한 설명으로부터 명백해질 것이다.
생산 숙주 세포에서 재조합 단백질 생산을 개선하는 것이 본 발명의 목적이다. 번역 효율을 증가시켜 재조합 단백질의 수율을 증가시키는 것이 구체적인 목적이다.
목적은 청구범위의 주제에 의해 해결되며 본원에서 추가로 설명된다.
본 발명은 상기 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 메신저 리보핵단백질(mRNP)의 번역 개시 인자(TIF 유전자)를 코딩하는 2개 이상의 유전자의 발현을 증가시키기 위해 유전적 변형에 의해 조작된 관심 유전자(GOI)를 발현하는 재조합 진핵 숙주 세포를 제공한다.
구체적으로, 상기 2개 이상의 TIF 유전자는 적어도 eIF4A를 코딩하는 유전자 및 eIF4G를 코딩하는 유전자를 포함하는 TIF 유전자이다.
특정 측면에 따르면, TIF 유전자는 eIF4E, PAB1 또는 RLI1을 코딩하는 유전자 중 임의의 하나 이상을 추가로 포함한다.
특정 구현양태에 따르면, 상기 TIF 유전자는 하기 TIF를 포함하거나 이로 이루어진 TIF, 특히 하기 TIF의 조합을 포함하거나 이로 이루어진 TIF를 코딩한다:
a) eIF4A 및 eIF4G;
b) eIF4A, eIF4G 및 eIF4E;
c) eIF4A, eIF4G, eIF4E 및 PAB1;
d) eIF4A, eIF4G 및 PAB1.
구체적으로, 상기 구현양태 a) 내지 d)의 TIF의 임의의 조합은 임의로 RLI1을 추가로 포함할 수 있다.
특정 측면에 따르면, 숙주 세포는 적어도
a) eIF4A 및 eIF4G를 코딩하는 유전자;
b) eIF4A, eIF4G 및 eIF4E를 코딩하는 유전자;
c) eIF4A, eIF4G, eIF4E 및 PAB1을 코딩하는 유전자;
d) eIF4A, eIF4G 및 PAB1을 코딩하는 유전자를 과발현하도록 조작된다.
구체적으로, 숙주 세포는 상기 a) 내지 d)에 언급된 임의의 유전자 조합을 과발현하도록 조작되고, 임의로 추가로 RLI1을 과발현하도록 조작되도록 조작될 수 있다. 구체적으로, 상기 TIF 유전자 중 적어도 하나의 발현은 상기 GOI의 발현을 제어하는 프로모터와 상이한 프로모터의 전사 제어 하에 있다. 구체적으로, GOI는 GOI 발현 카세트(GOIEC)에 의해 발현되고 각각의 TIF 유전자는 TIF 유전자 발현 카세트(TIFEC)에 의해 발현된다. 발현 카세트는 발현될 유전자에 작동가능하게 연결된 적어도 하나의 프로모터를 포함하거나 이로 이루어진다.
특정 측면에 따르면, GOIEC 프로모터는 임의의 하나 이상 또는 모든 TIFEC 프로모터와 상이하다.
프로모터는 TIF 유전자(들) 및 GOI를 발현하기 위해 각각의 개별 발현 카세트에 구체적으로 포함된다.
구체적으로, mRNP의 TIF는 43S 예비개시 복합체(PIC)에 결합하기 전과 같이 mRNP 복합체 또는 활성화된 mRNP에 존재하는 TIF이다. 이러한 TIF 중에는 특히 eIF4E, eIF4A, eIF4G, PAB1 및/또는 RLI1과 같은 폐쇄-루프 요소 중 하나 이상이 있으며, 이는 폐쇄 루프 구조와 연관이 있는 것으로 이해되며, 특히 eIF4E, eIF4A 또는 eIF4G와 같은 eIF4F 복합체의 하나 이상의 인자와 연관된다.
구체적으로, 상기 eIF4G는 eIF4G2(TIF4632, 진핵 개시 인자 4F 서브유닛 p130), 바람직하게는 효모, 예컨대 피치아(Pichia) 또는 사카로미세스(Saccharomyces)이다.
특정 구현양태에 따르면, 숙주 세포는 적어도 2개, 적어도 3개, 적어도 4개 또는 적어도 5개의 상기 TIF 유전자를 과발현하도록 유전적으로 조작되며, 상기 TIF 유전자는 적어도 eIF4A 및 eIF4G를 코딩하는 유전자를 포함한다.
구체적으로, 상기 TIF 중 적어도 2개는 eIF4F 복합체, 특히 eIF4A, eIF4G 및 임의로 eIF4E이다. 구체적으로, eIF4F 복합체의 2개, 3개 또는 그 이상 또는 모든 TIF 유전자, 특히 eIF4A, eIF4G 및 임의로 eIF4E가 과발현된다.
구체적으로, 상기 TIF 중 적어도 하나는 폐쇄-루프 인자, 특히 eIF4G, 및 임의로 eIF4E 또는 PAB1 중 임의의 하나 또는 둘 다일 수 있다. 구체적으로, 1개, 2개, 3개 또는 그 이상 또는 모든 폐쇄-루프 인자, 특히 eIF4G, 및 임의로 eIF4E 또는 PAB1 중 임의의 하나 또는 둘 모두가 과발현된다.
구체적으로, TIF 유전자는 자연-발생 유전자 또는 이의 인공 변이체, 특히 자연 발생 TIF(자연-발생 이소폼 포함)를 코딩하는 유전자, 또는 높은 서열 동일성 및 활성화된 mRNP에서의 TIF와 거의 동일하거나 증가된 기능 및/또는 생산 숙주 세포에서의 번역 개시를 갖는 기능적으로 활성인 변이체를 포함하는 진핵 또는 원핵 기원, 특히 효모 또는 포유동물 기원이다.
구체적으로, TIF 유전자는 하기에서 유래하는 것과 같이 본원에 추가로 기재된 임의의 숙주 세포 종으로부터 유래하는 것과 같은 진핵생물 기원이다:
a) 피치아(Pichia), 한세눌라(Hansenula), 코마가타엘라(Komagataella), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 오가테아(Ogataea), 야로위아(Yarrowia) 및 지오트리쿰(Geotrichum), 바람직하게는 피치아 파스토리스(Pichia pastoris), 코마가타엘라 파피(Komagataella phaffii), 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라 슈도파스토리스(Komagataella pseudopastoris), 사카로미세스 세레비지애(Saccharomyces cerevisiae), 오가테아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카(Yarrowia lipolytica) 또는 한세눌라 폴리모르파(Hansenula polymorpha)로 이루어진 군에서 선택되는 속의 효모 세포; 또는
b) 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 리세이(Trichoderma reesei)와 같은 사상성 진균의 세포; 또는
c) 비-인간 영장류, 인간, 설치류 또는 소 세포, 예컨대 마우스 골수종(NSO)-세포주, 차이니즈 햄스터 난소(CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3 , PC12, BHK(아기 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어 COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EB1, EB2, EB3, 종양용해성 또는 하이브리도마-세포주; 또는
d) Sf9, Mimic™ Sf9, Sf21, 하이 파이브(High Five)(BT1-TN-5B1-4) 또는 BT1-Ea88 세포와 같은 곤충 세포; 또는
e) 암포라(Amphora), 규조류(Bacillariophyceae), 두날리엘라(Dunaliella), 클로렐라(Chlorella), 클라미도모나스(Chlamydomonas), 시아노피타(Cyanophyta)(시아노박테리아), 나노클로롭시스(Nannochloropsis), 스피룰리나(Spirulina) 또는 오크로모나스(Ochromonas) 속과 같은 조류 세포; 또는
f) 식물 세포, 예컨대 단자엽 식물, 바람직하게는 옥수수, 벼, 밀 또는 세타리아, 또는 쌍자엽 식물, 바람직하게는 카사바, 감자, 대두, 토마토, 담배, 알팔파, 피스코미트렐라 파텐스(Physcomitrella patens) 또는 애기장대(Arabidopsis)로부터의 세포.
특정 측면에 따르면, TIF 유전자는 POI와 동일한 종 기원에서 기원하는 것과 같은 진핵생물 기원이다. 특히, TIF 유전자(들)는 피치아(Pichia), 또는 사카로미세스(Saccharomyces)와 같은 효모 기원; 또는 인간 또는 비-인간 동물 기원과 같은 포유류 기원일 수 있다. 특정 측면에 따르면, TIF 중 임의의 1개, 2개, 3개, 4개 또는 5개는 천연-발생 이소폼을 포함하는 효모 또는 포유동물(예를 들어 인간, 마우스, 햄스터 또는 유인원) 단백질이다.
특정 구현양태에 따르면, 효모 또는 인간 TIF 유전자(들) 중 임의의 것이 숙주 세포에서의 과발현을 위해 선택된다.
구체적으로, 본원에 제공된 목적을 위해 사용되는 TIF는 각각의 자연-발생(천연 또는 야생형이라고도 지칭) TIF의 서열, 특히 본원에 제공된 서열에 의해 확인된 TIF 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 한 것 중 적어도 임의의 하나인 아미노산 서열을 포함하거나 이로 이루어진다.
구체적인 측면에 따르면,
a) 상기 TIF 유전자는 서열번호: 1-11 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이들로 이루어진 eIF4E를 코딩하고;
b) 상기 TIF 유전자는 서열번호: 12-33 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이들로 이루어진 eIF4A를 코딩하고;
c) 상기 TIF 유전자는 서열번호: 34-44 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 구성되는 eIF4G를 코딩하고;
d) 상기 TIF 유전자는 서열번호: 45-55 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 구성되는 PAB1을 코딩하고; 그리고
e) 상기 TIF 유전자는 서열번호:56-65 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 구성되는 RLI1을 코딩한다.
구체적인 측면에 따르면,
a) eIF4E 단백질은 서열번호:1-11 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 이루어지고;
b) eIF4A 단백질은 서열번호: 12-33 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 이루어지고;
c) eIF4G 단백질은 서열번호: 34-44 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 적어도 임의의 하나를 포함하거나 이로 이루어지고;
d) PAB1 단백질은 서열번호: 45-55 중 임의의 하나와 적어도 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 임의의 하나를 포함하거나 이로 이루어지고; 그리고
e) RLI1 단백질은 서열번호: 56-65 중 임의의 하나와 적어도 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성 중 임의의 하나를 포함하거나 이로 이루어진다.
구체적으로, 본원에 제공된 목적을 위해 사용되는 TIF 유전자는 각각의 TIF를 코딩하는 뉴클레오티드 서열을 포함하거나 이로 이루어진 핵산 분자이다. TIF 유전자는 자연-발생(천연 또는 야생형이라고도 지칭) 뉴클레오티드 서열을 포함하거나 이로 구성될 수 있거나 돌연변이될 수 있고, 예를 들어 숙주 세포에서 상기 TIF 유전자를 발현하기 위해 최적화되고, 예를 들어 코돈-최적화 서열 또는 골든 게이트(Golden Gate) 최적화 서열일 수 있다.
구체적으로, 본원에 제공된 목적을 위해 사용되는 TIF 유전자는 각각의 자연-발생(천연 또는 야생형이라고도 지칭) TIF 유전자의 서열, 특히 본원에 제공된 서열에 의해 확인된 TIF 유전자 중 임의의 하나와 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 적어도 임의의 하나인 뉴클레오티드 서열을 포함하거나 이로 이루어진다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 (i) 하나 이상의 폴리뉴클레오티드 또는 이의 일부; 또는 (ii) 발현 제어 서열, 바람직하게는 프로모터, 리보솜 결합 부위, 전사 또는 번역 개시 및 정지 서열, 인핸서 및 활성자 서열로 이루어진 군으로부터 선택되는 발현 제어 서열의 녹킨(knockin), 치환, 파괴, 결실 또는 녹아웃을 포함하고, 바람직하게는 상기 하나 이상의 유전적 변형은 숙주 세포 게놈으로의 이종 폴리뉴클레오티드 또는 발현 카세트의 통합을 포함한다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은 상기 TIF 유전자(들)의 수 또는 상기 TIF 유전자(들)을 포함하는 발현 카세트의 수의 증가, 및/또는 상상기 TIF 유전자(들)의 기능 획득 변경을 포함하여서, 상기 TIF 유전자(들)의 수준 또는 활성을 증가시킨다.
특정 측면에 따르면, 상기 하나 이상의 유전적 변형은, 예를 들어 각각의 TIF 유전자(들)을 과발현함으로써, 및/또는 각각의 TIF 유전자(들) 또는 TIF mRNA의 분해를 감소시키거나 안정성을 증가시킴으로써 TIF의 수준 또는 활성을 증가시키는 각각의 TIF 유전자에서의 기능 획득 변경을 포함한다.
구체적으로, 상기 기능 획득 변경은 각각의 TIF 유전자의 녹킨을 포함한다.
구체적으로, 상기 기능 획득 변경은 상기 세포에서 각각의 TIF 유전자 발현을 상향조절한다.
구체적으로, 상기 기능 획득 변경은 상기 세포에서 각각의 TIF 유전자를 과발현하기 위한 이종 발현 카세트의 삽입을 포함한다.
기능 획득 변경은 구체적으로, 예를 들어 TIF를 코딩하는 폴리뉴클레오티드(또는 이러한 폴리뉴클레오티드를 포함하는 TIFEC)를 숙주 세포 게놈에 도입하고, 임의로 이러한 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 파괴하고, 이러한 프로모터를 더 높은 프로모터 활성을 갖는 다른 프로모터로 대체하는 것을 포함하여 TIF 유전자의 발현을 증가시키기 위한 것이다.
유전자 발현을 변형시키는 특정 방법은 폴리뉴클레오티드(유전자)의 발현을 조절(예를 들어, 활성화, 상향조절, 불활성화, 억제 또는 하향조절)하는 조절 서열을 사용하며, 예를 들어 숙주 세포를 변형시키는 CRISPR 기반 방법, 예를 들어, 프로모터, 리보솜 결합 부위, 전사 개시 또는 정지 서열, 번역 개시 또는 정지 서열, 인핸서 또는 활성자 서열, 억제자 또는 억제자 서열, 신호 또는 리더 서열, 특히 단백질의 발현 및/또는 분비를 제어하는 것들로 이루어진 군으로부터 선택된 조절 서열에 사용되는 RNA 가이드된 리보뉴클레아제에 의해 관련 서열에 표적화된 각각의 전사 조절자를 사용한다.
구체적으로, TIF 유전자의 발현을 증가시키기 위한 상기 하나 이상의 유전적 변형은 유전자 또는 유전자의 일부의 발현을 그러한 유전적 변형이 없는 각각의 숙주와 비교하여 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%, 또는 훨씬 더 유전자 또는 유전자의 일부의 발현을 증가시키는, 예를 들어, 이종 유전자의 녹킨 또는 내인성 유전자의 카피 수를 증가시키는 각각의 유전자 또는 게놈 서열의 삽입 또는 활성화를 포함하는 하나 이상의 게놈 돌연변이를 포함한다.
구체적으로, 발현을 증가시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 구성적으로 개선하거나 그렇지 않으면 증가시키는 게놈 돌연변이를 포함한다.
구체적으로, 발현을 증가시키는 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 조건부로 개선하거나 그렇지 않으면 증가시키는 하나 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건부 활성 변형은 특히 세포 배양 조건에 따라 활성 및/또는 발현되는 조절 요소 및 유전자를 표적으로 한다.
구체적으로, 관심 단백질(POI)을 생산하는 방법에 숙주 세포를 사용하는 경우 각각의 TIF를 코딩하는 폴리뉴클레오티드의 발현이 증가한다. 구체적으로, 유전자 변형 시, POI가 생성되는 동안 숙주 세포 배양 조건 하에서 각각의 TIF 유전자의 발현이 증가한다.
구체적으로, 숙주 세포는 상기 변형이 없는 숙주 세포와 비교하여, 예를 들어 하나 이상의 각각의 TIF 유전자의 녹킨에 의해 각각의 TIF(들)의 양(예를 들어, 수준, 활성 또는 농도)을 50%, 60%, 70%, 80%, 90%, 또는 95%, (mol/mol), 또는 그 이상 중 적어도 어느 하나만큼 증가시키도록 유전적으로 변형된다. 특정 구현양태에 따르면, 숙주 세포는 (하나 이상) 게놈 서열, 특히 숙주 세포 게놈에 통합된 각각의 TIF(들)을 코딩하는 게놈 서열의 하나 이상의 삽입을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 전형적으로 녹킨 균주로서 제공된다.
특정 구현양태에 따르면, 본원에 기술된 숙주 세포가 세포 배양물에서 배양되면, 숙주 세포 또는 숙주 세포 배양물에서 각각의 과발현된 TIF(들)의 총량은 그러한 유전자 변형 이전 또는 변형 없이 숙주 세포에 의해 발현되거나 생성된 기준량과 비교하여, 또는 각각의 숙주 세포 배양물에서 생산된 기준량과 비교하여, 또는 상기 변형 전 또는 변형 없는 숙주 세포와 비교하여 50%, 60%, 70%, 80%, 90% 또는 95%, (활성% 또는 mol/mol), 또는 심지어 100% 이상 중 적어도 어느 하나만큼 증가된다.
특정 측면에 따르면, 상기 TIF 유전자 중 하나 이상은 숙주 세포에 대해 내인성 또는 이종성이다. 구체적으로, 상기 TIF 유전자(들)는 각각의 TIF 발현 카세트(TIFEC)에 포함된다. 구체적으로, 상기 TIF 유전자(들)는 하나 이상의 TIFEC에서 발현된다.
구체적으로, 상기 TIF 유전자(들)는 하나 이상의 이종 발현 카세트(들)에 포함되며, 특히 TIF 유전자에 작동가능하게 연결된, 예를 들어 프로모터와 같은 하나 이상의 발현 제어 서열을 함유하는 이종 발현 구성물을 포함한다. 구체적으로, 상기 발현 구성물은 상기 숙주 세포에서 자연적으로 발생하지 않거나, 각각의 내인성 TIF 유전자 또는 발현 구성물이 자연적으로 발생하는 부위와 다른 부위에서 숙주 세포의 게놈 또는 염색체 내에 통합되거나, 에피솜 플라스미드상에 제공된다.
구체적으로, 임의의 1개, 2개, 3개, 4개 또는 5개 이상 또는 모든 TIFEC는 TIF 발현 카세트(TIFEC) 프로모터로 지칭되는 프로모터를 포함한다.
구체적으로, TIFEC 프로모터는 구성적 프로모터, 또는 유도성 또는 탈-억제성 프로모터와 같은 조절가능한 프로모터이고, 이러한 TIFEC 프로모터는 발현될 TIF 유전자에 작동가능하게 연결된다.
구체적으로, 동일한 숙주 세포 내의 TIF 발현 카세트에 사용되는 적어도 하나, 예컨대 임의의 하나 이상 또는 모든 TIFEC 프로모터는 P. 파스토리스(P. pastoris), 특히 K. 파스토리스(K. pastoris) 또는 K. 파피(K. phaffii)의 pAOX1이 아니거나 메탄올-유도성이 아니다. pAOX1 프로모터는 UniProtKB - F2QY27로 식별되는 P. 파스토리스(P. pastoris) 알코올 옥시다제 1의 알코올 옥시다제 1을 코딩하는 천연 유전자로 지칭되는 "AOX1" 유전자의 천연 프로모터로 이해된다.
특정 측면에 따르면, 숙주 세포는 숙주 세포 배양물에서 상기 GOI를 발현하기 위해 GOI 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 발현 카세트를 추가로 포함한다.
구체적으로, 상기 GOI는 TIF 발현 카세트(들)와 별개인 GOI 발현 카세트(GOIEC)에서 발현된다.
구체적으로, GOIEC는 GOI 발현 카세트(GOIEC) 프로모터로 지칭되는 프로모터를 포함한다.
구체적으로, GOIEC 프로모터는 유도성 또는 탈-억제성 프로모터와 같은 조절 가능한 프로모터, 또는 GOIEC 프로모터가 발현될 GOI에 작동가능하게 연결된 구성적 프로모터이다.
바람직하게는, 동일한 숙주 세포 내의 TIF 발현 카세트에 사용되는 적어도 하나, 예컨대 임의의 하나 이상 또는 모든 TIFEC 프로모터는 GOIEC 프로모터 이외의 임의의 것이다.
구체적으로,
a) 임의의 하나 이상 또는 모든 TIFEC 프로모터는 구성적이며, GOIEC 프로모터는 유도성 또는 (탈)억제성 프로모터이고;
b) 임의의 하나 이상 또는 모든 TIFEC 프로모터는 유도성 또는 (탈)억제성이며, GOIEC 프로모터는 구성적 프로모터이고;
c) 임의의 하나 이상 또는 모든 TIFEC 프로모터는 구성적이며, GOIEC 프로모터는 이러한 TIFEC 프로모터(들) 중 임의의 하나 이상과 상이한 유형 또는 강도의 구성적 프로모터이고;
d) 임의의 하나 이상 또는 모든 TIFEC 프로모터는 유도성이거나 (탈)억제성이고, GOIEC 프로모터는 그러한 TIFEC 프로모터 중 임의의 하나 이상과 상이한 유형 또는 강도의 유도성 또는 (탈)억제성 프로모터이다.
특정 측면에 따르면, GOIEC 프로모터는 임의의 TIFEC 프로모터와 비교하여 더 높은 프로모터 강도를 갖는다.
바람직한 구현양태에서, 각각의 TIF를 코딩하는 폴리뉴클레오티드의 발현은 구성적 프로모터에 의해 구동되고 POI를 코딩하는 폴리뉴클레오티드(유전자)의 발현은 유도성 프로모터에 의해 구동된다. 또 다른 바람직한 구현양태에서, 각각의 TIF를 코딩하는 폴리뉴클레오티드의 발현은 유도성 프로모터에 의해 구동되고 POI를 코딩하는 폴리뉴클레오티드(유전자)의 발현은 구성적 프로모터에 의해 구동된다.
한 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 구성적 GAP 프로모터에 의해 구동될 수 있고 POI를 코딩하는 폴리뉴클레오티드의 발현은 AOX1 또는 AOX2 프로모터와 같은 메탄올-유도성 프로모터에 의해 구동될 수 있다.
또 다른 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 MDH3, POR1, PDC1, FBA1-1 또는 GPM1과 같은 구성적 프로모터에 의해 구동될 수 있으며(Prielhofer et al. 2017, BMC Sys Biol. 11: 123), POI를 코딩하는 폴리뉴클레오티드의 발현은 AOX1 또는 AOX2 프로모터와 같은 메탄올-유도성 프로모터에 의해 구동될 수 있다.
또 다른 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 GAP 프로모터와 같은 구성적 프로모터에 의해 구동될 수 있고, POI를 코딩하는 폴리뉴클레오티드의 발현은 본원에서 추가로 기술된 것들과 같은 탈억제성 프로모터에 의해 구동될 수 있다.
또 다른 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 구성적 프로모터에 의해 구동될 수 있고 POI를 코딩하는 폴리뉴클레오티드의 발현은 본원에서 추가로 기술된 것과 같은 탈억제성 프로모터에 의해 구동될 수 있다.
또 다른 예로서, TIF를 코딩하는 폴리뉴클레오티드의 발현은 탈-억제성 프로모터에 의해 구동될 수 있고, POI를 코딩하는 폴리뉴클레오티드의 발현은 본원에 추가로 기술된 것과 같은 탈-억제성 프로모터에 의해 구동될 수 있다.
구체적으로, 본원에서 언급된 발현 카세트(들)은 적어도 하나의 프로모터 및 상기 프로모터의 전사 제어 하에 발현될 폴리뉴클레오티드(또는 유전자), 및 임의로 리보솜 결합 부위, 전사 개시 또는 정지 서열, 번역 개시 또는 정지 서열, 인핸서 또는 활성자 서열, 억제자 또는 억제제 서열, 신호 또는 리더 서열, 특히 단백질의 발현 및/또는 분비를 제어하는 것들로 이루어진 군으로부터 선택되는 것과 같은 추가 조절 서열을 포함한다.
구체적으로, 숙주 세포에 대해 이종성인 발현 카세트가 사용되며, 특히 여기서 발현 카세트는 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함하고, 여기서 프로모터와 폴리뉴클레오티드는 서로 이종성이며, 이들은 자연에서 이러한조합으로 발생하지 않는다는 의미이며, 예를 들어 여기서 프로모터 및 폴리뉴클레오티드 중 하나(또는 단지 하나)는 인공적이거나 다른 것 및/또는 본원에 기재된 숙주 세포에 대해 이종성이고; 프로모터는 내인성 프로모터이고 폴리뉴클레오티드는 이종 폴리뉴클레오티드이거나; 또는 프로모터는 인공 또는 이종 프로모터이고 폴리뉴클레오티드는 내인성 폴리뉴클레오티드이거나; 여기에서 프로모터 및 폴리뉴클레오티드 둘 다는 인공적이거나, 이종이거나, 본원에 기술된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)으로부터와 같이 상이한 기원으로부터 유래한다. 구체적으로, 프로모터는 본원에 기술된 숙주 세포로 사용되는 세포에서 상기 폴리뉴클레오티드와 자연적으로 연관되지 않고/않거나 작동가능하게 연결되지 않는다.
특정 측면에 따르면, 이종 발현 카세트는 자가 복제 벡터 또는 플라스미드에 포함되거나 상기 숙주 세포의 염색체 내에 통합된다.
GOI-발현 구성물은 숙주 세포에서 상기 발현 구성물로부터 상기 GOI를 발현시키기 위해 필요에 따라 GOI에 작동가능하게 연결된 프로모터와 같은 발현 제어 서열(들)을 포함하거나 이로 구성될 수 있다. GOI-발현 구성물은 별개의 발현 카세트에 포함될 수 있거나, 상기 TIF 유전자(들) 중 하나 이상을 추가로 발현하는 발현 카세트에 포함될 수 있다.
특정 측면에 따르면, 숙주 세포는 적어도 하나의 이종 GOIEC를 포함하는 재조합 숙주 세포이고, 여기서 GOIEC에 포함된 적어도 하나의 성분 또는 성분들의 조합은 숙주 세포에 대해 이종이다. 구체적으로, 특히 프로모터와 GOI가 서로 이종이고 자연에서 이러한 조합이 발생하지 않는 인공 발현 카세트가 사용되며, 예를 들어 여기서 프로모터 및 GOI 중 하나(또는 단지 하나)는 인공적이거나 다른 것 및/또는 본원에 기재된 숙주 세포에 대해 이종성이고; 프로모터는 내인성 프로모터이고 GOI는 이종 GOI이거나; 또는 프로모터는 인공 또는 이종 프로모터이고 GOI는 내인성 GOI이거나; 여기에서 프로모터 및 GOI 둘 다는 인공적이거나, 이종이거나, 본원에 기술된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)으로부터와 같이 상이한 기원으로부터 유래한다. 구체적으로, GOIEC 프로모터는 본원에 기술된 숙주 세포로 사용되는 세포에서 상기 GOI와 자연적으로 연관되지 않고/않거나 작동가능하게 연결되지 않는다.
구체적으로, 숙주 세포는 다음을 포함한다:
a) 상기 TIF 유전자(들)에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 각각 포함하는 하나 이상의 이종 TIF 발현 카세트에서 하나 이상의 상기 TIF 유전자를 발현하기 위한 발현 시스템; 및
b) GOI 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 GOI 발현 카세트;
여기서 a)의 발현 시스템 및 b)의 발현 카세트는 세포 배양물에서 숙주 세포를 배양할 때 각각의 TIF 유전자(들) 및 GOI를 발현하도록 조작된다.
특정 측면에 따르면, 숙주 세포는 하나 이상의 이종 발현 카세트에서 상기 TIF 유전자 중 1개, 2개, 3개, 4개 또는 5개 이상을 발현하기 위한 발현 시스템을 포함하며, 각각은 상기 TIF 유전자(들)에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함한다. 특정 구현양태에서, 각각의 TIF 유전자는 TIFEC 프로모터에 작동가능하게 연결된다.
세포당 GOIEC 또는 TIEFEC의 수는 일반적으로 각 발현 생성물의 양을 결정한다. 숙주 세포는 구체적으로 세포당 적어도 하나의 GOIEC 및 적어도 하나의 TIFEC 카피를 포함한다. 하나의 발현 카세트는 일반적으로 "하나의 카피"로 언급된다.
특정 측면에 따르면, 숙주 세포당 한 가지 유형의 GOIEC 또는 GOIEC 카피의 수는 적어도(또는 최대) 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 중 어느 하나, 또는 최대 20, 30, 40 또는 50의 더 높은 숫자를 사용할 수 있다.
특정 측면에 따르면, 숙주 세포당 한 가지 유형의 TIFEC 또는 TIFEC 카피의 수는 적어도(또는 최대) 1, 2, 3, 4 또는 5 중 임의의 하나이다.
특정 측면에 따르면, 숙주 세포당 이종 TIFEC의 수는 적어도(또는 최대) 1, 2, 3, 4 또는 5이다.
TIFEC는 바람직하게는 숙주 세포에 대해 이종성이지만, GOIEC는 이종성 또는 내인성일 수 있다.
특정 측면에 따르면, 숙주 세포는, 예를 들어 TIFEC 또는 GOIEC의 적어도 1, 2, 3, 4 또는 5개 카피(유전자 카피 번호, GCN)와 같은 TIF(들)을 발현하는 하나 이상의 발현 카세트(들), 및 GOI를 발현하는 발현 카세트의 하나 이상의(다중) 카피를 포함하는 하나 이상(예를 들어, 다중) 이종성 발현 카세트를 포함한다. 각각의 카피는 발현될 각각의 유전자에 작동가능하게 연결된 발현 제어 서열을 포함하여 동일하거나 상이한 서열을 포함하거나 이로 구성될 수 있다.
구체적으로, 숙주 세포에서 과발현된 각각의 TIF에 대해, 모든 과발현된 TIF의 거의 동일한 수준을 보장하기 위해, 세포당 TIF 코딩 폴리뉴클레오티드의 수는 다른 과발현된 TIF에 대해 약 (+/- 1) 동일하다.
구체적인 측면에 따르면,
a) 적어도 하나, 즉 임의의 하나 이상 또는 모든 TIF 발현 카세트는 구성적 프로모터를 포함하고; 및/또는
b) GOI 발현 카세트는 유도성, 탈-억제성 또는 달리 조절가능한 프로모터, 또는 구성적 프로모터를 포함한다.
구체적으로, GOI는 상기 TIF 유전자와 상이한 폴리뉴클레오티드 또는 유전자이다. 구체적으로, GOI는 관심 단백질(POI)을 발현하고 있다. 구체적으로, POI는 상기 TIF와 상이한 폴리펩티드 또는 단백질이다.
특정 측면에 따르면, POI는 숙주 세포 종에 대해 이종이다.
특정 측면에 따르면 POI는 치료 또는 진단 생성물이다. 바람직하게는 POI는 포유동물에서 기능하는 치료 단백질이다.
구체적으로, POI는 항원-결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물-단백질 접합체, 구조적 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소 및 대사 효소로 이루어진 군으로 부터 선택된 펩티드, 폴리펩티드 또는 단백질이다.
구체적으로, POI는 진핵 단백질, 바람직하게는 인간 단백질 또는 인간 단백질 서열을 포함하는 단백질과 같은 포유동물 유래 단백질, 또는 박테리아 단백질 또는 박테리아 유래 단백질이다. 효모 숙주 세포에서 자연적으로 발생하지 않는 임의의 그러한 포유동물, 박테리아 또는 인공 단백질은 숙주 세포에 대해 이종인 것으로 이해된다.
특정한 경우에 POI는 다량체 단백질, 특히 이량체 또는 사량체이다.
구체적으로, 항원-결합 단백질은
a) 키메라 항체, 인간화 항체, 이중특이성 항체, Fab, Fd, scFv, 디아바디, 트리아바디, Fv 사량체, 미니바디, VH, VHH, IgNAR 또는 V-NAR과 같은 단일 도메인 항체와 같은 항체 또는 항체 단편;
b) 애드넥틴, 아피바디, 아필린, 아피머, 아피틴, 알파바디, 안티칼린, 아비머, DARPin, 파이노머, 쿠니츠 도메인 펩티드, 모노바디 또는 NanoCLAMPS와 같은 항체 모방체; 또는
c) 하나 이상의 면역글로불린-접힘 도메인, 항체 도메인 또는 항체 모방체를 포함하는 융합 단백질.
특정 POI는 항체 또는 이의 단편, 특히 항원-결합 도메인을 포함하는 항체 단편과 같은 항원-결합 분자이다. 특정 POI 중에는 모노클로날 항체(mAbs), 면역글로불린(Ig) 또는 면역글로불린 클래스 G(IgG), 중쇄-항체(HcAb's) 또는 이의 단편, 예를 들어 단편-항원 결합(Fab), Fd, 단일-사슬 가변 단편(scFv), 또는 예를 들어 Fv 이량체(디아바디), Fv 삼량체(트리아바디), Fv 사량체 또는 미니바디와 같은 이의 조작된 변이체 및 VH, VHH, IgNAR 또는 V-NAR과 같은 단일-도메인 항체, 또는 면역글로불린-접힘 도메인을 포함하는 임의의 단백질과 같은 항체가 있다. 추가의 항원-결합 분자는 항체 모방체, 또는 예를 들어 조작된 쿠니츠 도메인, 애드넥틴, 아피바디, 아필린, 안티칼린, 또는 DARPin과 같은 (대체) 스캐폴드 단백질로부터 선택될 수 있다.
특정 측면에 따르면, POI는, 예를 들어 BOTOX, 미오블록, 뉴로블록, 디스포트(또는 보툴리눔 신경독소의 다른 혈청형), 알글루코시다제 알파, 답토마이신, YH-16, 융모생식샘자극호르몬 알파, 필그라스팀, 세트로렐릭스, 인터루킨-2, 알데스류킨, 테셀룰린, 데닐류킨 디프티톡스, 인터페론 알파-n3(주사), 인터페론 알파-nl, DL-8234, 인터페론, 산토리(감마-1a), 인터페론 감마, 티모신 알파 1, 타소너민, DigiFab, ViperaTAb, EchiTAb, CroFab, 네시리티드, 아바타셉트, 알레파셉트, 레비프, 엡토터미날파, 테리파라타이드(골다공증), 칼시토닌 주사성(뼈 질환), 칼시토닌(비강, 골다공증), 에타너셉트, 헤모글로빈 글루타머 250(소), 드로트레코진 알파, 콜라게나제, 카르페리티드, 재조합 인간 표피 성장 인자(국소 젤, 상처 치유), DWP401, 다베포에틴 알파, 에포에틴 오메가, 에포에틴 베타, 에포에틴 알파, 데시루딘, 레피루딘, 비발리루딘, 노나코그 알파, 모노닌, 엡타코그 알파(활성화), 재조합 인자 VIII+VWF, 리콤비네이트, 재조합 인자 VIII, 인자 VIII(재조합), 알프메이트, 옥토코그 알파, 인자 VIII, 팔리퍼민, 인디키나제, 테넥테플라제, 알테플라제, 파미테플라제, 레테플라제, 나테플라제, 몬테플라제, 폴리트로핀 알파, rFSH, hpFSH, 미카푼긴, 페그필그라스팀, 레노그라스팀, 나르토그라스팀, 세르모렐린, 글루카곤, 엑세나타이드, 프람린타이드, 이니글루세라제, 갈설파제, 류코트로핀, 몰그라모스틴, 트립토렐린 아세테이트, 히스트렐린(피하 임플란트, 하이드로론), 데스로렐린, 히스트렐린, 나파렐린, 류프로라이드 서방성 저장소(ATRIGEL), 류프로라이드 임플란트(DUROS), 고세렐린, 유트로핀, KP-102 프로그램, 소마트로핀, 메카세르민(성장 장애), 엔파비르타이드, Org-33408, 인슐린 글라진, 인슐린 글루리신, 인슐린(흡입형), 인슐린 리스프로, 인슐린 데터니르, 인슐린(협측, RapidMist), 메카세르민 린파베이트, 아나킨라, 셀몰류킨, 99 mTc-앱시타이드 주사, 골수, 베타세론, 글라티라머 아세테이트, 게폰, 사르그라모스팀, 오프렐베킨, 인간 백혈구-유래 알파 인터페론, 빌라이브, 인슐린(재조합), 재조합 인간 인슐린, 인슐린 아스파트, 메카세닌, 로페론-A, 인터페론-알파 2, 알파페론, 인터페론 알파콘-1, 인터페론 알파, 아보넥스의 재조합 인간 황체화 호르몬, 도르나제 알파, 트라페르민, 지코노타이드, 탈티렐린, 디보터미날파, 아토시반, 베카플러민, 엡티피바타이드, 제마이라, CTC-111, 샨백-B, HPV 백신(4가), 옥트레오타이드, 란레오타이드, 안세스티른, 아갈시다제 베타, 아갈시다제 알파, 라로니다제, 프레자타이드 구리 아세테이트 (국소 겔), 라스부리카제, 라니비주맙, 액티뮨, PEG-인트론, 트리코민, 재조합 집 먼지 진드기 알레르기 탈감작 주사, 재조합 인간 부갑상선 호르몬(PTH) 1-84(sc, 골다공증), 에포에틴 델타, 트랜스제닉 안티트롬빈 III, 그란디트로핀, 비트라아제, 재조합 인슐린, 인터페론-알파(경구용 로젠지), GEM-21S, 바프레오타이드, 이두설파제, 옴나파트릴라트, 재조합 혈청 알부민, 세르톨리주맙 페골, 글루카르피다제, 인간 재조합 C1 에스테라제 억제제(혈관부종), 라노트플라제, 재조합 인간 성장 호르몬, 엔푸비타이드(무바늘 주사, 바이오젝터 2000), VGV-1, 인터페론(알파), 루시나탄트, 아비프타딜(흡입형, 폐질환), 이카티반트, 에칼란티드, 오미가난, 오로그랩, 펙시가난아세테이트, ADI-PEG -20, LDI-200, 데가렐릭스, 신트레델린베수도톡스, Favld, MDX-1379, ISAtx-247, 리라글루타이드, 테리파라타이드(골다공증), 티파코긴, AA4500, T4N5 리포좀 로션, 카투막소맙, DWP413, ART-123, 크리살린, 데스모테플라제, 아메디플라제, 코리폴리트로핀알파, TH-9507, 테두글루타이드, 디아미드, DWP-412, 성장 호르몬(지속방출 주사제), 재조합 G-CSF, 인슐린(흡입형, AIR), 인슐린(흡입형, 테크노스피어), 인슐린(흡입형, AERx), RGN- 303, DiaPep277, 인터페론 베타(C형 간염 바이러스 감염(HCV)), 인터페론 알파-n3(경구), 벨라타셉트, 경피 인슐린 패치, AMG-531, MBP-8298, 제레셉트, 오페바칸, AIDSVAX, GV-1001, 림프스캔, 란피나아제, 리폭시산, 루수풀티드, MP52(베타-트리칼슘포스페이트 담체, 뼈 재생), 흑색종 백신, 시푸류셀-T, CTP-37, 인세지아, 비테스펜, 인간 트롬빈(동결, 수술 출혈), 트롬빈, TransMID, 알피메프라제, 퓨리카제, 터리프레신(정맥, 간신증후군), EUR-1008M, 재조합 FGF-I(주사용, 혈관질환), BDM-E, 로티갑티드, ETC-216, P-113, MBI-594AN, 듀라마이신(흡입형, 낭포성 섬유증), SCV-07, OPI-45, 엔도스타틴, 안지오스타틴, ABT-510, 보우만 버크 억제제 농축물, XMP-629, 99 mTc-Hynic-아넥신 V, 카할랄리드 F, CTCE -9908, 테베렐릭스(서방형), 오자렐릭스, 로니뎁신, BAY-504798, 인터루킨4, PRX-321, 펩스캔, 이복타데킨, 랄락토페린, TRU-015, IL-21, ATN-161, 실렌기타이드, 알부페론, 비파식스, IRX-2, 오메가 인터페론, PCK-3145, CAP-232, 파시레오티드, huN901-DMI, 난소암 면역치료 백신, SB-249553, 온코백스-CL, 온코백스-P, BLP-25, 서백스-16, 다중-에피토프 펩티드 흑색종 백신(MART-1, gp100, 티로시나제), 네미피타이드, rAAT(흡입), rAAT(피부과), CGRP(흡입, 천식), 페그수너셉트, 티모신베타4, 플리티뎁신, GTP-200, 라모플라닌, GRASPA, OBI-1, AC-100, 연어 칼시토닌(경구, 엘리겐), 칼시토닌(경구, 골다공증), 에그모렐린, 카프로모렐린, 카르데바, 벨라페르민, 131I-TM-601, KK-220, T-10, 유라리티드, 디펠레스타트, 헤마타이드, 크리살린(국소), rNAPc2, 재조합 인자 V111(PEG화 리포솜), bFGF, PEG화 재조합 스타필로키나제 변이체, V-10153, 소노리시스 프롤라이즈, 뉴로백스, CZEN-002, 섬 세포 신생 요법, rGLP-1, BIM-51077, LY-548806, 엑세나티드(제어 방출, 메디소브), AVE-0010, GA-GCB, 아보렐린, ACM-9604, 리나클로타이드 에아세테이트, CETi-1, 헤모스판, VAL(주사제), 속효성 인슐린(주사제, 비아델), 비강내 인슐린, 인슐린(흡입형), 인슐린(경구, 엘리젠), 재조합 메티오닐 인간 렙틴, 피트라킨라 피하 주사, 습진), 피트라킨라(흡입 건조 분말, 천식), 멀티킨, RG-1068, MM-093, NBI-6024, AT-001, PI-0824, Org-39141, Cpn10 (자가면역질환/염증), 탈락토페린(국소용), rEV-131(안과용), rEV-131(호흡기질환), 경구 재조합 인간 인슐린(당뇨병), RPI-78M, 오프렐베킨(경구용), CYT-99007 CTLA4-Ig, DTY-001, 발라테그라스트, 인터페론 알파-n3(국소용), IRX-3, RDP-58, 타우페론, 담즙염 자극 리파제, 메리스파제, 알라린 포스파타제, EP-2104R, 멜라노탄-II, 브레멜라노타이드, ATL-104, 재조합 인간 마이크로플라스민, AX-200, SEMAX, ACV-1, Xen-2174, CJC-1008, 다이노르핀 A, SI-6603, LAB GHRH, AER-002, BGC-728, 말라리아 백신(바이로솜, PeviPRO), ALTU-135, 파보바이러스 B19 백신, 인플루엔자 백신(재조합 뉴라미니다아제), 말라리아/HBV 백신, 탄저병 백신, Vacc-5q, Vacc-4x, HIV 백신(경구), HPV 백신, 타트 톡소이드, YSPSL, CHS-13340, PTH(1-34) 리포솜 크림(노바솜), 오스타볼린-C, PTH 유사체(국소, 건선), MBRI-93.02, MTB72F 백신(결핵), MVA-Ag85A 백신(결핵), FARA04, BA-210, 재조합 전염병 FIV 백신, AG-702, OxSODrol, rBetV1, Der-p1/Der-p2/Der-p7 알레르겐-표적 백신(먼지 진드기 알레르기), PR1 펩티드 항원(백혈병), 돌연변이 ras 백신, HPV-16 E7 리포펩티드 백신, 라비린틴 백신(선암종), CML 백신, WT1-펩티드 백신(암), IDD-5, CDX-110, 펜트리스, 노렐린, CytoFab, P-9808, VT-111, 이크로캅타이드, 텔베르민(피부과, 당뇨병성 족부궤양), 루핀트리비르, 레티쿨로스, rGRF, HA, 알파-갈락토시다제 A, ACE-011, ALTU-140, CGX-1160, 안지오텐신 치료 백신, D-4F, ETC-642, APP-018, rhMBL, SCV-07(경구, 결핵), DRF-7295, ABT-828, ErbB2-특이적 면역독소(항암제), DT3SSIL-3, TST-10088, PRO-1762, 콤보톡스, 콜레시스토키닌-B/가스트린-수용체 결합 펩티드, 111In-hEGF, AE-37, 트라스니주맙-DM1, 길항제 G, IL-12(재조합), PM-02734, IMP-321, rhIGF-BP3, BLX-883, CUV-1647(국소), L-19 기반 방사면역치료제(암), Re-188-P-2045, AMG-386, DC/1540/KLH 백신(암), VX-001, AVE-9633, AC-9301, NY-ESO-1 백신(펩티드), NA17.A2 펩티드, 흑색종 백신(펄스 항원 치료제), 전립선암 백신, CBP-501, 재조합 인간 락토페린(안구건조증), FX-06, AP-214, WAP-8294A(주사용), ACP-HIP, SUN-11031, 펩티드 YY[3-36](비만, 비강내), FGLL, 아타시셉트, BR3-Fc, BN-003, BA-058, 인간 부갑상선 호르몬 1-34(비강, 골다공증), F-18-CCR1, AT-1100(체강 질병/당뇨병), JPD-003, PTH(7-34) 리포좀 크림(노바솜), 듀라마이신(안과용, 안구건조증), CAB-2, CTCE-0214, 글리코페길화 에리트로포이에틴, EPO-Fc, CNTO-528, AMG-114, JR-013, XIII 인자, 아미노칸딘, PN-951, 716155, SUN-E7001, TH-0318, BAY-73-7977, 테베렐릭스(즉시 방출), EP-51216, hGH(제어 방출, 바이오스피어), OGP-I, 시푸비르타이드, TV4710, ALG-889, Org-41259, rhCC10, F-991, 티모펜틴(폐 질환), r(m)CRP, 간선택적 인슐린, 수발린, L19-IL-2 융합 단백질, 엘라핀, NMK-150, ALTU-139, EN-122004, rhTPO, 트롬보포이에틴 수용체 작용제(혈소판감소 장애), AL-108, AL-208, 신경 성장 인자 길항제(통증), SLV-317, CGX-1007, INNO-105, 경구용 테리파라타이드(엘리젠), GEM-OS1, AC-162352, PRX-302, LFn-p24 융합백신(테라포어), EP-1043, S. 뉴모니아 소아백신, 말라리아 백신, 나이세리아 뇌수막염 그룹 B 백신, 신생아 그룹 B 연쇄상구균 백신, 탄저병 백신, HCV 백신( gpE1+gpE2+MF-59), 중이염 치료제, HCV 백신(핵심항원+ISCOMATRIX), hPTH(1-34)(경피, ViaDerm), 768974, SYN-101, PGN-0052, 아비스쿠닌, BIM-23190, 결핵 백신, 다중-에피토프 티로시나제 펩티드, 암 백신, 엔카스팀, APC-8024, GI-5005, ACC-001, TTS-CD3, 혈관-표적 TNF(고형 종양), 데스모프레신(협측 제어-방출), 오너셉트 또는 TP-9201, 아달리무맙(HUMIRA), 인플릭시맙(REMICADE™), 리툭시맙(RITUXAN™/MAB THERA™), 에타너셉트(ENBREL™), 베바시주맙(AVASTIN™), 트라스투주맙(HERCEPTIN™), 페그릴그라스팀(NEULASTA™), 또는 바이오시밀러 및 바이오베터를 포함한 기타 적합한 POI이다.
구체적으로, POI는 숙주 세포 종에 대해 이종이다.
구체적으로, POI는 분비된 펩티드, 폴리펩티드 또는 단백질, 즉 숙주 세포로부터 세포 배양 상청액으로 분비된 것이다.
구체적으로, GOI는 분비 신호 서열로 발현되며, 바람직하게는 분비 신호 펩티드(또는 분비 신호 펩티드를 포함하는 리더)가 POI의 N-말단에 융합된다.
본 발명은 본원에 기재된 바와 같은 숙주 세포를 생산하는 방법을 추가로 제공한다. 구체적으로, 이러한 방법은 하나 이상의 이종 발현 카세트 내에 하나 이상의 상기 TIF 유전자 및 관심 유전자(GOI)를 포함하도록 숙주 세포를 유전적으로 조작하는 것을 포함한다.
추가의 특정 측면에 따르면, 본 발명은 하나 이상의 발현 카세트 내에 숙주 세포를 유전적으로 조작하여 2개 이상의 이종 핵산 분자 및 이종 핵산 분자에 각각에 작동가능하게 연결된 발현 제어 서열을 도입함으로써, 숙주 세포 배양물에서 관심 단백질(POI)을 생산할 수 있는 본원에 기재된 숙주 세포를 생산하는 방법을 제공하고, 여기서 핵산 분자 중 하나는 POI를 코딩하는 관심 유전자(GOI)를 포함하고, 추가로 하나 이상의 핵산 분자는 본원에 추가로 기재된 바와 같은 TIF와 같은 TIF를 코딩한다.
구체적으로, 숙주 세포는 야생형 숙주 세포의 유전적으로 조작하여 제공된다.
특정 실시예에 따르면, 숙주 세포는 상기 TIF 유전자(들)을 발현하기 위해 하나 이상의 발현 카세트를 도입하도록 먼저 변형시킴으로써 생산될 수 있다. 그런 다음 이러한 변형된 숙주 세포는 POI 생성을 위한 발현 카세트를 포함하도록 추가로 조작될 수 있다.
또 다른 구체적인 실시예에 따르면, 숙주 세포는 POI 생산을 위한 발현 카세트를 포함하도록 먼저 조작되어 생산될 수 있다. 이러한 조작된 숙주 세포는 TIF 유전자(들)을 발현하기 위해 하나 이상의 발현 카세트를 도입하도록 추가로 변형될 수 있다.
본 발명은 추가로 관심 단백질(POI)을 생산하기 위한 조건 하에서 본원에 기술된 숙주 세포를 배양함으로써 관심 유전자(GOI)에 의해 코딩되는 관심 단백질(POI)을 생산하는 방법을 제공한다.
본 발명은 다음 단계를 포함하여, 숙주 세포에서 관심 단백질(POI)을 생산하는 방법을 추가로 제공한다:
(i) 하나 이상의 이종 발현 카세트 내에 상기 본원에 기술된 TIF 유전자(들) 및 POI를 코딩하는 관심 유전자(GOI)를 포함하도록 숙주 세포를 유전적으로 조작하는 단계,
(ii) 상기 TIF 유전자(들) 및 상기 GOI를 공동-발현하는 조건 하에서 배양 배지에서 상기 숙주 세포를 배양하여 POI를 수득하는 단계; 및
(iii) 숙주 세포 또는 배양 배지로부터 POI를 회수하는 단계.
구체적으로, 본원에 기술된 방법의 단계 i)는 단계 (ii) 이전에 수행된다.
구체적인 실시예에 따르면, 야생형 숙주 세포는 본원에 기술된 방법의 단계 i)에 따라 유전적으로 변형된다.
구체적으로, 숙주 세포는 이종 발현 카세트를 발현하기 위해 야생형 숙주 세포 균주에 상기 유전적 변형을 도입하여 제공된다. 그러나 특정 구현양태에 따르면, 숙주 세포는, 예를 들어 세포의 단백질 발현 및/또는 분비 능력을 향상시키거나 또는 숙주 세포 단백질과 같은 바람직하지 않은 부산물을 감소시키기 위해, 단계 i)에 따라 유전적으로 변형되기 전에 야생형 숙주 세포의 하나 이상의 추가 유전적 변형을 겪을 수 있다.
구체적으로, 본원에 추가로 기재된 바와 같이 재조합 숙주 세포를 생산하기 위해 적합한 방법 단계가 사용된다.
구체적으로, POI는 숙주 세포를 적절한 배지에서 배양하고, 발현된 POI를 세포 배양물, 특히 세포 분리시 세포 배양 상청액 또는 배지로부터 분리하고, 발현된 생성물에 적합한 방법으로 정제함으로써, 특히 POI를 세포에서 분리하고 적절한 수단으로 정제함으로써 생산될 수 있다. 이로써 정제된 POI 제제를 제조할 수 있다.
구체적으로, 본원에 기재된 방법은 본원에 추가로 기재된 특징, 특히 본원에 추가로 기재된 바와 같은 재조합 숙주 세포 및/또는 발현 시스템에 의해 특징지어진다.
특정 측면에 따르면, 본 발명은 POI의 생성을 위한 본원에 기술된 숙주 세포의 용도를 추가로 제공한다.
구체적으로, POI는 상기 하나 이상의 TIF 유전자를 공동-발현 또는 과발현하는 조건 하에서 숙주 세포를 배양하면서 상기 GOI를 발현함으로써 생성된다. 구체적으로, 이러한 방법에 의해 상기 GOI의 발현 및 상기 POI의 생산 수율이 증가된다.
구체적으로, 숙주 세포는 하나 이상의 상기 TIF 유전자를 공동-발현하고 상기 POI를 숙주 세포 배양으로 분비하는 조건 하에서 배양 배지에서 배양되고, POI는 숙주 세포 배양으로부터 회수된다.
구체적으로, 숙주 세포는 세포 배양에서 배양된 세포주, 특히 생산 숙주 세포주이다.
특정 구현양태에 따르면, 세포주는 적합한 배치, 유가식 또는 연속 배양 조건 하에서 배양된다. 배양은 마이크로타이터 플레이트, 쉐이크-플라스크 또는 생물반응기에서 수행될 수 있으며, 임의로 첫 번째 단계로서 배치 기로 시작하여 두 번째 단계로서 유가식 기 또는 연속 배양 기가 뒤따를 수 있다.
구체적으로, 상기 세포 배양은 배치 기에서 세포를 성장시키고; 및 유가식 또는 연속 배양기, 임의로 제 1 단계로서 배치 기로 시작하고, 이어서 제 2 단계로서 유가식 기 또는 연속 배양 기에서 세포를 배양하여 상기 POI를 생성하는 것을 채용한다.
특정 측면에 따르면, 본원에 기재된 방법은 성장 기 및 생성 기를 포함한다.
특히 이 방법은
a) 성장 조건(성장하는 기 또는 "성장 기") 하에서 숙주 세포를 배양하는 단계; 그리고 추가 단계
b) 상기 POI를 생산하기 위해 GOI가 발현되는 동안 성장-제한 조건(생산 기) 하에서 숙주 세포를 배양하는 단계를 포함한다.
구체적으로, 제 2 단계 b)는 제 1 단계 a)후에 온다.
구체적으로, 숙주 세포는 상기 POI에 대한 숙주 세포의 비 생산성(시간당 μg/g 효모 건조 질량(YDM) 및/또는 상기 POI에 대한 부피 생산성(시간당 μg/L))을 증가시키는 수준에서 상기 TIF 유전자 중 하나 이상을 공동-발현하도록 변형된다.
구체적으로, 이러한 공동-발현에 의해 생산성 또는 수율은 상기 TIF를 공동-발현하도록 조작되지 않은 상기 GOI를 발현하는 유사한 숙주 세포와 비교하여 적어도 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2.0배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.5배, 4배, 5배, 5.5배, 6배, 6.5배, 7배, 7.5배, 8배, 8.5배, 9배, 9.5배, 10배, 10.5배, 11배, 11.5배 또는 12배 중 어느 하나만큼 증가된다.
상기 TIF(들)을 생성하기 위한 유전적 변형(들)의 효과에 대해 본원에 기술된 숙주 세포를 비교할 때, 이는 전형적으로 이러한 유전적 변형 전 또는 없는 유사한 숙주 세포와 비교된다. 비교는 전형적으로, 특히 상기 POI를 생성하기 위한 조건 하에서 배양될 때 POI를 생성하도록 조작된 이러한 유전적 변형 없이 동일한 숙주 세포 종 또는 유형과 이루어진다. 그러나 POI를 생성하도록 더 이상 조작되지 않은 동일한 숙주 세포 종 또는 유형과도 비교할 수 있다. 각각의 코딩 서열의 발현 시 상기 TIF(들)의 생성은 숙주 세포에 의해 생성된 상기 TIF(들)의 양(예를 들어, 수준 또는 농도)에 의해 결정될 수 있다. 구체적으로, 그 양은 웨스턴 블롯, 면역형광 이미징, 유세포 분석 또는 질량 분석법을 사용하는 것과 같은 적합한 방법에 의해 결정될 수 있으며, 여기서 특히 질량 분석법은 액체 크로마토그래피-질량 분석법(LC-MS) 또는 액체 크로마토그래피 탠덤-질량분석법(LC-MS/MS)이다.
특정 측면에 따르면, 본원에 기술된 숙주 세포는, 예를 들어 단백질 생산을 개선하기 위해 하나 이상의 추가 유전적 변형을 겪을 수 있다.
구체적으로, 숙주 세포는 프로테아제 결핍 균주, 특히 카복시펩티다제 Y 활성이 결핍된 균주를 생성하는데 사용되는 단백질분해 활성에 영향을 미치는 하나 이상의 유전자를 변형시키도록 추가로 조작될 수 있다. 특정 예는 WO1992017595A1에 기술되어 있다. 프로테아제 A 또는 프로테아제 B와 같은 공포성 프로테아제에 기능적 결함이 있는 프로테아제 결핍 피치아(Pichia) 균주의 추가 예는 US6153424A에 설명되어 있다. 추가 예는 ade2 결실 및/또는 프로테아제 유전자, PEP4 및 PRB1 중 하나 또는 둘 모두의 결실을 갖는 피치아 균주가, 예를 들어 써모피셔 사이언티픽(ThermoFisher Scientific)에 의해 제공된다.
구체적으로, 숙주 세포는 기능적 유전자 산물, 특히 WO2010099195A1에 기재된 바와 같이 PEP4, PRB1, YPS1, YPS2, YMP1, YMP2, YMP1, DAP2, GRHl, PRD1, YSP3, 및 PRB3로 이루어진 군으로부터 선택된 프로테아제를 코딩하는 적어도 하나의 핵산 서열을 변형시키도록 조작될 수 있다.
헬퍼 인자를 코딩하는 유전자의 과발현 또는 과소발현은 WO2015158800A1에 기재된 바와 같이 GOI의 발현을 향상시키기 위해 적용될 수 있다.
특정 측면에 따르면, 숙주 세포는 진핵 숙주 세포이다.
구체적으로, 숙주 세포는 다음과 같다:
a) 피치아(Pichia), 한세눌라(Hansenula), 코마가타엘라(Komagataella), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 오가테아(Ogataea), 야로위아(Yarrowia) 및 지오트리쿰(Geotrichum), 바람직하게는 피치아 파스토리스(Pichia pastoris), 코마가타엘라 파피(Komagataella phaffii), 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라 슈도파스토리스(Komagataella pseudopastoris), 사카로미세스 세레비지애(Saccharomyces cerevisiae), 오가테아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카(Yarrowia lipolytica) 또는 한세눌라 폴리모르파(Hansenula polymorpha)로 이루어진 군에서 선택되는 속의 효모 세포; 또는
b) 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 리세이(Trichoderma reesei)와 같은 사상성 진균의 세포; 또는
c) 비-인간 영장류, 인간, 설치류 또는 소 세포, 예컨대 마우스 골수종(NSO)-세포주, 차이니즈 햄스터 난소(CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3, PC12, BHK(아기 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어 COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EB1, EB2, EB3, 종양용해성 또는 하이브리도마-세포주; 또는
d) Sf9, Mimic™ Sf9, Sf21, 하이 파이브(High Five)(BT1-TN-5B1-4) 또는 BT1-Ea88 세포와 같은 곤충 세포; 또는
e) 암포라(Amphora), 규조류(Bacillariophyceae), 두날리엘라(Dunaliella), 클로렐라(Chlorella), 클라미도모나스(Chlamydomonas), 시아노피타(Cyanophyta)(시아노박테리아), 나노클로롭시스(Nannochloropsis), 스피룰리나(Spirulina) 또는 오크로모나스(Ochromonas) 속과 같은 조류 세포; 또는
f) 식물 세포, 예컨대 단자엽 식물, 바람직하게는 옥수수, 벼, 밀 또는 세타리아, 또는 쌍자엽 식물, 바람직하게는 카사바, 감자, 대두, 토마토, 담배, 알팔파, 피스코미트렐라 파텐스(Physcomitrella patens) 또는 애기장대(Arabidopsis)로부터의 세포.
특정 측면에 따르면, 숙주 세포는 임의의 효모 세포일 수 있다. 구체적으로 상기 숙주 세포는 피치아(Pichia), 한세눌라(Hansenula), 코마가타엘라(Komagataella), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 오가테아(Ogataea), 야로위아(Yarrowia) 및 지오트리쿰(Geotrichum), 구체적으로는 사카로미세스 세레비지애(Saccharomyces cerevisiae), 피치아 파스토리스(Pichia pastoris), 오가테아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카(Yarrowia lipolytica) 또는 한세눌라 폴리모르파(Hansenula polymorpha) 또는 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 리세이(Trichoderma reesei)와 같은 사상성 진균으로 이루어진 군으로부터 선택된 속의 세포이다. 바람직하게는, 숙주 세포는 메틸로트로픽 효모, 바람직하게는 피치아 파스토리스(Pichia pastoris)이다. 여기서 피치아 파스토리스(Pichia pastoris)는 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라 파피(Komagataella phaffii ) 및 코마가타엘라 슈도파스토리스(Komagataella pseudopastoris) 모두와 동의어로 사용된다.
구체적인 예로는 피치아(Pichia) 속(예를 들어, 피치아 파스토리스(Pichia pastoris), 피치아 메탄올리카(Pichia methanolica), 피치아 클루이베리(Pichia kluyveri) 및 피치아 앙구스타(Pichia angusta)), 코마가타엘라(Komagataella) 속(예를 들어, 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라슈도파스토리스(Komagataella pseudopastoris) 또는 코마가타엘라 파피(Komagataella phaffii)), 사카로미세스(Saccharomyces) 속(예를 들어, 사카로미세스 세레비지애(Saccharomyces cerevisae), 사카로미세스 클루이베리(Saccharomyces kluyveri), 사카로미세스 우바룸(Saccharomyces uvarum)), 클루이베로미세스 속(Kluyveromyces) (예를 들어, 클루이베로미세스 락티스(Kluyveromces lactis), 클루이베로미세스 마르시아누스(Kluyveromes marxianus)), 칸디다(Candida) 속(예를 들어, 칸디다 유틸리티(Candida utilis), 칸디다 카카오(Candida cacaoi), 칸디다 보이디니이(Candida boidinii)), 지오트리쿰(Geotrichum) 속(예를 들어, 지오트리쿰 페르멘타스(Geotrichum fermentans), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리포카카로미세스(Yarrowia lipoaccharomyces, 또는 스키조사카로미세스 폼베(Schizosaccharomyces pombe)의 효모 세포를 지칭한다.
피치아 파스토리스(Pichia pastoris) 종이 바람직하다. 구체적으로, 숙주 세포는 CBS704, CBS2612, CBS7435, CBS9173-9189, DSMZ 70877, X-33, GS115, KM71, KM71H 및 SMD1168로 이루어진 군으로부터 선택된 피치아 파스토리스(Pichia pastoris) 균주이다.
출처: CBS704 (=NRRL Y-1603 = DSMZ 70382), CBS2612 (=NRRL Y-7556), CBS7435 (=NRRL Y-11430), CBS9173-9189 (CBS 균주: CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelculturen, Utrecht, The Netherlands) 및 DSMZ 70877(German Collection of Microorganisms and Cell Cultures); X-33, GS115, KM71, KM71H 및 SMD1168과 같은 써모 피셔(Thermo Fisher)의 균주.
바람직한 S. 세레비지애 균주의 예는 W303, CEN.PK 및 BY-시리즈(EUROSCARF collection)를 포함한다. 상기 기재된 모든 균주는 형질전환체를 생산하고 이종 유전자를 발현하는데 성공적으로 사용되었다.
본 발명은 추가로 POI를 코딩하는 관심 유전자(GOI)를 발현하는 숙주 세포에 의해 생산될 때 세포 배양물에서 메신저 리보핵단백질(mRNP)의 하나 이상의 TIF 유전자(들)를 발현하는 하나 이상의 이종 발현 카세트를 공동-발현함으로써, 관심 단백질(POI)의 수율을 증가시키는 방법을 제공한다.
본 발명은 메신저 리보핵단백질(mRNP)의 하나 이상의 TIF 유전자(들), 예컨대 본원에 추가로 기재된 바와 같은 TIF 유전자(들)을 발현하는 하나 이상의 이종 발현 카세트를 포함하는 폴리펩티드 발현 시스템을 추가로 제공한다. 이러한 발현 카세트는 본원에서 또한 TIF-발현 구성물, 또는 TIF(TIF 유전자) 발현 카세트(TIFEC)로 지칭된다. 구체적으로, 이종 발현 카세트는 상기 TIF 유전자를 발현하기 위해 상기 TIF 유전자에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하고, 특히 상기 발현 제어 서열 중 적어도 하나, 예를 들어, 프로모터, 신호 펩티드 또는 리더는 상기 TIF 유전자에 자연적으로 작동가능하게 연결되어 있지 않다. 구체적으로, TIF 발현 카세트는 본원에 추가로 기재된 바와 같이 특성화된다.
구체적으로, 발현 시스템은 관심 단백질(POI)을 코딩하는 GOI 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 발현 카세트를 추가로 포함한다. 이러한 발현 카세트는 본원에서 GOI-발현 구성물(GOIEC) 또는 GOI 발현 카세트라고도 지칭다. 구체적으로, GOI 발현 카세트는 본원에 추가로 기재된 바와 같이 특성화된다. 구체적으로, GOI를 포함하는 발현 카세트는 TIF 유전자(들)을 발현하는 다른 발현 카세트와 분리되어 있다.
구체적으로, 본원에 기재된 발현 시스템은 본원에 추가로 기재된 바와 같은 발현 카세트 및 재조합 발현 구성물의 특징을 특징으로 한다.
구체적으로, 상기 유전적 조작에 의해 과발현된 TIF 유전자(들)는 각각 별도의 발현 카세트에 포함된다. 그러나 적어도 2개 또는 3개의 TIF 유전자(들)를 포함하고 임의로 GOI를 추가로 포함하는 발현 카세트가 사용될 수 있다.
본 발명은 추가로 본원에 기술된 발현 시스템, 특히 TIF 유전자(들)을 발현하기 위한 발현 카세트 및 GOI를 발현하기 위한 발현 카세트를 포함하는 발현 시스템을 포함하는 숙주 세포, 특히 본원에 기술된 바와 같은 숙주 세포를 제공한다.
특정 측면에 따르면, 숙주 세포는 GOI에 작동가능하게 연결된 발현 카세트 프로모터를 포함하는 적어도 하나의 이종 GOIEC를 포함하는 재조합 숙주 세포이고, 여기서 GOIEC에 포함된 적어도 하나의 성분 또는 성분들의 조합은 숙주 세포에 대해 이종이다.
구체적으로, 인공 발현 카세트가 사용되며, 여기서 특히 프로모터 및 상기 프로모터의 제어 하에 발현될 유전자는 서로 이종성이며, 자연에서 이러한 조합으로 발생하지 않으며, 예를 들어 프로모터 및 유전자 중 하나(또는 단지 하나)는 인공적이거나 다른 것 및/또는 본원에 기술된 숙주 세포에 대해 이종성이고; 프로모터는 내인성 프로모터이고 발현될 유전자는 이종 유전자이거나; 또는 프로모터는 인공 또는 이종 프로모터이고 유전자는 내인성 유전자이고; 여기서, 프로모터 및 유전자 둘 다는 인공적이거나, 이종이거나, 본원에 기재된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)으로부터와 같이 상이한 기원으로부터 유래된다.
특정 측면에 따르면, 임의의 하나 이상(또는 모두)의 이종 발현 카세트는 하나 이상의 자가 복제 벡터 또는 플라스미드에 포함되거나 상기 숙주 세포의 염색체 내에 통합된다.
발현 카세트는 숙주 세포 내로 도입될 수 있고, 예를 들어 특정 통합 부위에서 염색체내 요소로서 숙주 세포 게놈(또는 그의 염색체 중 임의의 것) 내로 통합되거나 무작위로 통합될 수 있으며, 이때 고생산성 숙주 세포주가 선택된다. 대안적으로, 발현 카세트는 플라스미드 또는 인공 염색체, 예를 들어 효모 인공 염색체(YAC)와 같은 염색체외 유전 요소 내에 통합될 수 있다. 특정 실시예에 따르면, 발현 카세트는 벡터, 특히 적합한 형질전환 또는 형질주입 기술에 의해 숙주 세포에 도입되는 발현 벡터에 의해 숙주 세포에 도입된다. 이를 위해, 발현될 이종 폴리뉴클레오티드(들)(특히 GOI)는 발현 벡터에 결찰될 수 있다.
바람직한 효모 발현 벡터(효모에서의 발현에 바람직하게 사용되는)는 pPICZ, pGAPZ, pPIC9, pPICZalfa, pGAPZalfa, pPIC9K, pGAPHis, pPUZZLE 또는 GoldenPiCS 로부터 유도된 플라스미드로 이루어진 군으로부터 선택된다.
벡터 또는 플라스미드를 도입하기 위해 숙주 세포를 형질주입시키거나 형질전환시키는 기술은 당업계에 잘 알려져 있다. 이들은 전기천공, 스페로플라스팅, 지질 소포 매개 흡수, 열충격 매개 흡수, 인산칼슘 매개 형질주입(인산칼슘/DNA 공-침전), 바이러스 감염, 특히 예를 들어 변형된 아데노바이러스, 미세주입 및 전기천공법과 같은 변형된 바이러스의 사용을 포함할 수 있다.
본원에서 사용되는 바와 같이, 효모 세포를 "형질전환시키는"이라는 용어는 동일한 것을 "형질주입시키는" 것을 포함하는 것으로 이해된다.
본원에 기술된 형질전환체는 발현 카세트, 벡터 또는 플라스미드 DNA를 숙주에 도입하고 관련 단백질 또는 선택 마커를 발현하는 형질전환체를 선택함으로써 수득할 수 있다. 숙주 세포는 전기 펄스 방법, 원형질체 방법, 리튬 아세테이트 방법 및 이들의 변형된 방법과 같은 숙주 세포의 형질전환에 통상적으로 사용되는 방법에 의해 이종 또는 외래 DNA를 도입하도록 처리될 수 있다. 미생물에 의한 재조합 DNA 단편의 흡수를 위한 바람직한 형질전환 방법은 화학적 형질전환, 전기천공 또는 원형질화에 의한 형질전환을 포함한다.
특정 측면에 따르면, 이종 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함하는 폴리뉴클레오티드의 인공 융합, 및 임의로 신호, 리더 또는 종결 서열과 같은 추가 서열을 포함하거나 이로 이루어진 발현 카세트가 사용된다.
구체적으로, TIFEC는 상기 TIF(들)을 세포내 단백질(들)로서 발현한다.
구체적으로, GOIEC는 분비 단백질로서 POI를 발현하고 생산하는데 필요한 신호 및 리더 서열을 포함한다.
특정 측면에 따르면, GOI는 분비 신호 서열, 바람직하게는 이종 분비 신호 서열을 코딩하는 뉴클레오티드 서열에 5'-단부에서 융합된다.
특정 측면에 따르면, GOIEC는 POI의 분비를 가능하게 하는 신호 펩티드를 코딩하는 뉴클레오티드 서열을 포함한다. 구체적으로, 신호 펩티드를 코딩하는 뉴클레오티드 서열은 GOI의 5'-단부에 인접하여 융합된다.
신호 서열은 천연 신호 서열일 수 있으며, 본원에서는 자연-발생 단백질과 공동-발현되거나, 융합되거나, 그렇지 않으면 연관되어 발현시 이러한 단백질을 분비하는 신호 서열로 이해된다. 예를 들어, 천연 분비 신호 서열은 일반적으로 분비될 각각의 단백질과 공동-발현, 융합 또는 그렇지 않으면 연관된 신호 서열이다. 구체적으로, 상기 POI와 상이한 분비 단백질로부터 기원하는 신호 서열과 같이, 상기 POI에 대해 이종인(또는 자연적으로 연관되지 않은) 천연 분비 신호 서열이 사용된다.
대안적으로, 인공 분비 신호 서열, 특히 자연-발생 서열과 적어도 85%, 90% 또는 95% 서열 동일성 중 어느 하나인 신호 서열이 사용될 수 있다.
구체적으로, 신호 서열은 S. 세레비지애 알파-교배 인자 프리프로-펩티드의 신호 서열, P. 파스토리스 산 포스파타제 유전자(PHO1) 및 세포외 단백질 X(EPX1)의 신호 서열로 이루어진 군에서 선택된다(Heiss, S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich & B. Gasser, Microbiology 2015;161(7):1356-68).
구체적으로, WO2014067926 A1 또는 WO2012152823 A1에 기재된 임의의 신호 및/또는 리더 서열이 사용될 수 있다.
도 1: 본원에서 언급된 서열이다.
다르게 나타내거나 정의하지 않는 한, 본원에서 사용된 모든 용어는 당업계에서 통상적인 의미를 가지며, 이는 당업자에게 명백할 것이다. 예를 들어 표준 핸드북을 참조한다(Sambrook et al, "Molecular Cloning: A Laboratory Manual" (2nd Ed.), Vols. 1 -3, Cold Spring Harbor Laboratory Press (1989); Lewin, "Genes IV", Oxford University Press, New York, (1990), and Janeway et al., "Immunobiology" (5th Ed., or more recent editions), Garland Science, New York, 2001).
본원에서 사용된 "포함하다", "함유하다", "가지다" 및 "포함하다"라는 용어는 동의어로 사용될 수 있으며 추가 부재 또는 부품 또는 요소를 허용하는 열린 정의로 이해되어야 한다. "이루어지는"은 구성하는 정의 기능의 추가 요소가 없는 가장 가까운 정의로 간주된다. 따라서 "포함하는"은 더 광범위하며 "이루어지는" 정의를 포함한다.
본원에서 사용되는 용어 "약"은 동일한 값 또는 주어진 값의 +/-10% 또는 +/-5% 만큼 다른 값을 의미한다.
명세서 전반에 걸쳐 사용되는 특정 용어는 다음과 같은 의미를 갖는다.
본원에서 사용되는 "숙주 세포"와 관련하여 "세포"라는 용어는 단일 세포, 단일 세포 클론 또는 숙주 세포의 세포주를 의미한다.
본원에서 사용되는 용어 "세포주"는 장기간에 걸쳐 증식하는 능력을 획득한 특정 세포 유형의 확립된 클론을 의미한다. 세포주는 전형적으로 내인성 또는 재조합 핵산 분자 또는 유전자, 또는 이러한 폴리펩티드에 의해 매개되는 폴리펩티드 또는 세포 대사산물을 생산하기 위한 대사 경로의 생성물을 발현시키기 위해 사용된다. "생산 숙주 세포주" 또는 "생산 세포주"는 일반적으로 POI와 같은 생산 공정의 생성물을 얻기 위해 생물반응기에서 세포 배양에 바로 사용할 수 있는 세포주로 이해된다.
본원에 기재된 특정 구현양태는 적어도 2개의 상이한 폴리뉴클레오티드(핵산 분자 또는 유전자), 본원에 기재된 바와 같은 TIF를 코딩하는 적어도 하나의 TIF 유전자, 및 POI를 코딩하는 적어도 하나의 관심 유전자(GOI), 특히 각각의 폴리뉴클레오티드를 공동-발현함으로써 POI가 높은 수율로 생성되는 관심 유전자(GOI)를 공동-발현하도록 조작된 생산 숙주 세포주를 지칭한다.
본원에 기술된 POI를 생산하는 숙주 세포는 또한 "생산 숙주 세포"로 지칭되고, 각각의 세포주는 "생산 세포주"로 지칭된다. 본원에 기재된 특정 구현양태는 상기 TIF(들)를 공동-발현하도록 조작되고 POI 생성의 높은 수율을 특징으로 하는 이러한 POI 생성 숙주 세포주를 지칭한다.
본원에서 사용되는 "숙주 세포"라는 용어는 특히 POI 또는 숙주 세포 대사산물을 생성하기 위한 재조합 목적에 적합하게 사용되는 임의의 세포에 적용된다. "숙주 세포"라는 용어는 인간을 포함하지 않는 것으로 잘 알려져 있다. 구체적으로, 본원에 기재된 바와 같은 재조합 숙주 세포는 인공 유기체 및 천연(야생형) 숙주 세포의 유도체이다. 본원에 기술된 숙주 세포, 방법 및 용도, 예를 들어 구체적으로 하나 이상의 유전적 변형, 이종 발현 카세트 또는 인공 발현 구성물, 상기 형질주입 또는 형질전환된 숙주 세포 및 재조합 단백질을 포함하는 것을 언급하는 것은 비천연 발생이고, "인공" 또는 합성이므로 "자연법칙"의 결과로 간주되지 않는다는 것이 잘 이해된다. 본원에 기재된 유전자 변형은 당업계에 공지된 도구, 방법 및 기술을 사용할 수 있다(J. Sambrook et al., Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York (2001)).
숙주 세포와 관련하여 본원에서 사용되는 용어 "세포 배양" 또는 "배양하는" 또는 "배양"은 성장, 분화 또는 지속적인 생존에 유리한 조건 하에 인공, 예를 들어 특히 당업계에 알려진 방법에 따라 제어된 생물반응기에서 세포의 활성 또는 정지 상태에서 시험관내 환경에서 세포를 유지하는 것을 의미한다.
적절한 배양 배지를 사용하여 세포 배양물을 배양할 때, 세포는 배양 용기에서 배지 또는 세포 배양에서 세포 배양을 지원하기에 적합한 조건 하에서 기질과 접촉하게 된다. 표준 세포 배양 배지 및 기술은 당업계에 잘 알려져 있다.
본원에 기술된 바와 같은 세포 배양물은 특히 본원에서 "세포 배양 상청액"으로 지칭되는 세포 배양 배지에서 POI를 수득하는 것과 같이 분비된 POI의 생성을 제공하는 기술을 사용하며, 이는 세포 바이오매스로부터 분리가능하고, 더 높은 순도의 POI를 얻기 위해 정제될 수 있다. 단백질(예를 들어, POI)이 세포 배양에서 숙주 세포에 의해 생성되고 분비될 때, 이러한 단백질은 세포 배양 상청액으로 분비되고 세포 배양 상청액을 숙주 세포 바이오매스로부터 분리하고, 및 임의로 단백질을 추가로 정제하여 정제된 단백질 제제를 생성할 수 있다.
세포 배양 배지는 제어된 인공 및 시험관내 환경에서 세포를 유지하고 성장시키는 데 필요한 영양소를 제공한다. 세포 배양 배지의 특성 및 구성은 특정 세포 요구 사항에 따라 다르다. 중요한 매개변수에는 삼투모랄농도, pH 및 영양소 배합이 포함된다. 영양분의 공급은 당업계에 공지된 방법에 따라 연속적 또는 불연속적 방식으로 수행될 수 있다.
배치 공정은 세포 배양에 필요한 모든 영양분이 초기 배양 배지에 함유되어 발효시 추가적인 영양분 공급 없이 배양하는 세포 배양 방식인 반면, 유가식 또는 연속식 공정에서 배치 단계를 거친 후, 공급에 의해 하나 이상의 영양소가 배양에 공급되는 공급 기가 발생한다. 대부분의 공정에서 공급 방식이 결정적이고 중요하지만, 본원에 기재된 숙주 세포 및 방법은 세포 배양의 특정 방식과 관련하여 제한되지 않는다.
재조합 POI는 본원에 기술된 숙주 세포 및 각각의 세포주를 사용하여 적절한 배지에서 배양하고, 발현된 생성물 또는 대사산물을 배양물로부터 분리하고, 임의로 적합한 방법으로 정제함으로써 생성될 수 있다.
본원에 기술된 바와 같이 POI의 생성을 위한 여러 상이한 접근법이 바람직하다. 관련 단백질을 코딩하는 재조합 DNA를 보유하는 발현 벡터로 숙주 세포를 형질전환 또는 형질주입시키고, 형질전환 또는 형질주입된 세포의 배양물을 제조하고, 배양물을 성장시키고, 전사 및 POI 생성을 유도하고, 및 POI 회수함으로써, POI는 발현되고 처리되고 및 임의로 분비될 수 있다.
특정 구현양태에서, 세포 배양 공정은 유가식 공정이다. 구체적으로, 원하는 재조합 POI를 코딩하는 핵산 구성물로 형질주입된 숙주 세포는 원하는 재조합 POI를 생산하기 위해 성장기에서 배양되고 생산기로 전환된다.
또 다른 구현양태에서, 본원에 기술된 숙주 세포는, 예를 들어 케모스타트를 사용하는 연속 방식으로 배양된다. 연속 발효 공정은 정의되고 일정하며 연속적인 공급 속도로 신선한 배양 배지를 생물반응기로 공급하는 것을 특징으로 하며, 동시에 배양액은 생물반응기에서 동일한 정의되고 일정하며 연속적인 제거 속도로 제거된다. 배양 배지, 공급 속도 및 제거 속도를 동일한 일정한 수준으로 유지함으로써, 생물반응기의 세포 배양 매개변수 및 조건이 일정하게 유지된다.
또 다른 구현양태에서, 본원에 기재된 숙주 세포는 관류 방식, 예를 들어 신선한 배지를 공급하고 상청액을 제거하면서 장치 내에서 세포를 배양하는 방식으로 배양된다.
본원에 기술된 안정한 세포 배양은 구체적으로 유전적 특성을 유지하는 세포 배양, 심지어 약 20세대의 배양 후에도, 바람직하게는 적어도 30세대, 보다 바람직하게는 적어도 40세대, 가장 바람직하게는 적어도 50세대 배양 후에도 특히 높은 POI 생산 수준을 유지하는 것, 예를 들어 적어도 μg 수준으로 유지하는 세포 배양을 지칭하는 것으로 이해된다. 구체적으로, 산업적 규모의 생산에 사용될 때 큰 이점으로 여겨지는 안정한 재조합 숙주 세포주가 제공된다.
본원에 기술된 세포 배양은 산업 제조 규모, 예를 들어 영양 공급에 기반한 배양 모드, 특히 유가식 또는 배치 공정 또는 연속식 또는 반-연속식 공정(예를 들어, 케모스타트)과 조합하여 부피 및 기술 시스템과 모두에 관련한 방법에서 특히 유리하게 사용된다.
본원에 기재된 숙주 세포는 전형적으로 POI 생성을 위한 GOI를 발현하는 그의 능력에 대해 테스트되고, 하기 테스트 중 임의의 것에 의해 POI 수율에 대해 테스트된다: ELISA, 활성 검정, 모세관 전기영동, HPLC, 또는 SDS-PAGE 및 웨스턴 블로팅 기술 또는 질량 분석법와 같은 다른 적합한 테스트.
하나 이상의 TIF(들)의 공동-발현의 효과, 예를 들어 POI 생성에 대한 효과를 결정하기 위해, 숙주 세포주는 마이크로타이터 플레이트, 쉐이크 플라스크 또는 생물반응기에서 유가식 또는 케모스타트 발효를 사용하여 각각의 세포에서 공동-발현을 위한 이러한 유전적 변형이 없는 균주와 비교하여 배양될 수 있다.
본원에 기술된 생산 방법은 구체적으로 파일럿 또는 산업 규모의 발효를 가능하게 한다. 산업 공정 규모는 바람직하게는 적어도 10 L, 특히 적어도 50 L, 바람직하게는 적어도 1 m3, 바람직하게는 적어도 10 m3, 가장 바람직하게는 적어도 100 m3의 부피를 사용할 것이다.
산업적 규모의 생산 조건이 바람직하며, 이는, 예를 들어 반응기 부피가 100 L 내지 10 m3 이상인 유가 배양, 수일의 일반적인 공정 시간 또는 발효기 부피가 약 50 내지 1000 L 이상, 희석율은 약 0.001 - 0.15 h-1인 연속 공정을 지칭한다.
본원에 기술된 목적을 위해 사용되는 장치, 시설 및 방법은 임의의 원하는 세포주를 배양하는 데 사용하기에 특히 적합하다. 또한, 장치, 시설 및 방법은 임의의 효모 숙주 세포 유형을 배양하는 데 적합하며, 특히 폴리펩티드 생성물품(POI), 핵산 생성물(예를 들어, DNA 또는 RNA), 또는 세포 및/또는 세포 및/또는 바이러스 치료에 사용되는 것과 같은 바이러스와 같은 약제학적 및 바이오의약품 생산을 위해 구성된 생산 작업에 특히 적합하다.
특정 구현양태에서, 세포는 재조합 치료 또는 진단 생성물과 같은 생성물을 발현하거나 생산한다. 본원에 보다 상세히 기술된 바와 같이, 세포에 의해 생성된 생성물의 예는 POI, 예를 들어 항체 분자(예를 들어, 모노클로날 항체, 이중특이성 항체), 항체 모방체(항원에 특이적으로 결합하지만, 예를 들어 DARPin, 아피바디, 애드넥틴 또는 IgNAR과 같은 항체에 구조적으로 관련되지 않는 폴라펩티드 분자), 융합 단백질(예를 들어, Fc 융합 단백질, 키메라 사이토카인), 기타 재조합 단백질(예를 들어, 글리코실화 단백질, 효소, 호르몬) 또는 바이러스 치료제(예를 들어, 항암 종양용해 바이러스, 유전자 요법 및 바이러스 면역요법용 바이러스 벡터), 세포 치료제(예를 들어, 다능성 줄기 세포, 중간엽 줄기 세포 및 성체 줄기 세포), 백신 또는 지질-캡슐화 입자(예를 들어, 엑소좀, 바이러스-유사 입자), RNA(예를 들어, siRNA) 또는 DNA(예를 들어, 플라스미드 DNA), 항생제 또는 아미노산을 포함하지만, 이에 제한되지 않는다. 구현양태에서, 장치, 시설 및 방법은 바이오시밀러 생산에 사용될 수 있다.
언급된 바와 같이, 특정 구현양태에서, 장치, 시설 및 방법은, 예를 들어 효모 세포와 같은 진핵 세포 및/또는 상기 세포의 생성물, 예를 들어 대규모 방식으로 상기 세포에 의해 합성된 단백질, 펩티드 또는 항생제, 아미노산, 핵산(예를 들어, DNA 또는 RNA)을 포함하는 POI의 생산을 가능하게 한다. 본원에서 달리 언급하지 않는 한, 장치, 시설 및 방법은 벤치-규모, 파일럿-규모 및 전체 생산 규모 용량을 포함하지만 이에 제한되지 않는 임의의 원하는 부피 또는 생산 능력을 포함할 수 있다.
또한, 본원에서 달리 언급하지 않는 한, 장치, 시설 및 방법은 교반 탱크, 에어리프트, 섬유, 마이크로섬유, 중공 섬유, 세라믹 매트릭스, 유동층, 고정층 및 /또는 분출층 생물반응기를 포함하나 이에 제한되지 않는 임의의 적합한 반응기를 포함할 수 있다. 본원에서 사용되는 "반응기"는 발효기 또는 발효 유닛, 또는 임의의 다른 반응 용기를 포함할 수 있고 용어 "반응기"는 "발효기"와 상호교환적으로 사용된다. 예를 들어, 일부 측면에서, 예시적인 생물반응기 유닛은 다음 중 하나 이상 또는 모두를 수행할 수 있다: 영양분 및/또는 탄소원의 공급, 적합한 가스(예를 들어, 산소)의 주입, 발효 또는 세포 배양 배지의 입구 및 출구 흐름, 기체 및 액체 상 분리, 온도 유지, 산소 및 CO2 수준 유지, pH 수준 유지, 흔들기(예를 들어, 교반) 및/또는 세척/살균. 발효 유닛과 같은 예시적인 반응기 유닛은 유닛 내에 다중 반응기를 포함할 수 있으며, 예를 들어 유닛은 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 100개 이상의 생물반응기를 각 유닛에 가질 수 있고/있거나 시설에서 시설 내에 단일 또는 다중 반응기를 갖는 여러 유닛을 포함할 수 있다. 다양한 구현양태에서, 생물반응기는 배치, 반유가식, 유가식, 관류 및/또는 연속 발효 공정에 적합할 수 있다. 임의의 적합한 반응기 직경을 사용할 수 있다. 실시예에서, 생물반응기는 약 100 mL와 약 50,000 L 사이의 부피를 가질 수 있다. 비-제한적인 예는 100 mL, 250 mL, 500 mL, 750 mL, 1 리터, 2 리터, 3 리터, 4 리터, 5 리터, 6 리터, 7 리터, 8 리터, 9 리터, 10 리터, 15 리터, 20 리터, 25 리터, 30 리터, 40 리터, 50 리터, 60 리터, 70 리터, 80 리터, 90 리터, 100 리터, 150 리터, 200 리터, 250 리터, 300 리터, 350 리터, 400 리터, 450 리터, 500 리터, 550 리터, 600 리터, 650 리터, 700 리터, 750 리터, 800 리터, 850 리터, 900 리터, 950 리터, 1000 리터, 1500 리터, 2000 리터, 2500 리터, 3000 리터, 3500 리터, 4000 리터, 4500 리터, 5000 리터, 6000 리터, 7000 리터, 8000 리터, 9000 리터, 10,000 리터, 15,000 리터, 20,000 리터, 및/또는 50,000 리터를 포함한다. 또한, 적합한 반응기는 다중-사용, 단일-사용, 일회용 또는 비-일회용일 수 있으며 스테인리스강(예를 들어, 316 L 또는 임의의 다른 적합한 스테인리스강)과 같은 금속 합금 및 인코넬, 플라스틱, 및/또는 유리을 포함하는 임의의 적합한 재료로 형성될 수 있다.
구현양태에서 그리고 여기에 달리 언급되지 않는 한, 본원에 설명된 장치, 시설 및 방법은 또한 그러한 생성물의 분리, 정제 및 격리를 위한 작업 및/또는 장비와 같이 달리 언급되지 않은 임의의 적절한 단위 작업 및/또는 장비를 포함할 수 있다. 전통적인 스틱-빌트 시설, 모듈식, 이동식 및 임시 시설 또는 기타 적절한 건설, 시설 및/또는 레이아웃과 같은 적절한 시설 및 환경을 사용할 수 있다. 예를 들어, 일부 구현양태에서 모듈식 무균실이 사용될 수 있다. 추가로 달리 명시되지 않는 한, 본원에 설명된 장치, 시스템 및 방법은 단일 위치 또는 시설에 수용 및/또는 수행될 수 있거나 대안적으로 별도 또는 여러 위치 및/또는 시설에 수용 및/또는 수행될 수 있다.
적합한 기술은 배치 기로 시작하여 높은 특정 성장 속도에서 짧은 지수 유가식 기, 이어서 낮은 특정 성장 속도에서 유가식 기가 뒤따르는 생물반응기에서 배양하는 것을 포함할 수 있다. 또 다른 적합한 배양 기술은 POI 생산 시간에 걸쳐 높은 성장 속도에서 낮은 성장 속도로, 또는 POI 생산 시간에 걸쳐 낮은 성장 속도에서 높은 성장 속도로 진행하는 것과 같은 특정 성장 속도의 조합 또는 임의의 적합한 특정 성장 속도에서 배치 기에 이어서 유가식 기를 포함할 수 있다. 또 다른 적합한 배양 기술은 배치 기에 이어 낮은 희석 비율로 연속 배양 단계를 포함할 수 있다.
바람직한 구현양태는 바이오매스를 제공하기 위한 배치 배양에 이어 고수율 POI 생산을 위한 유가식 배양을 포함한다.
적어도 1 g/L 세포 건조 중량, 보다 바람직하게는 적어도 10 g/L 세포 건조 중량, 바람직하게는 적어도 20 g/L 세포 건조 중량, 바람직하게는 30, 40, 50, 60, 70 또는 80 g/L 세포 건조 중량 중 적어도 어느 하나의 세포 밀도를 수득하기 위해 성장 조건 하에 생물반응기에서 본원에 기재된 바와 같은 숙주 세포를 배양하는 것이 바람직하다. 파일럿 또는 산업적 규모에서 이러한 바이오매스 생산 수율을 제공하는 것이 유리하다.
바이오매스의 축적을 허용하는 성장 배지, 특히 기초 성장 배지는 전형적으로 탄소 공급원, 질소 공급원, 황 공급원 및 인산염 공급원을 포함한다. 전형적으로, 이러한 배지는 추가로 미량 원소 및 비타민을 포함하고, 추가로 아미노산, 펩톤 또는 효모 추출물을 포함할 수 있다.
바람직한 질소 공급원은 NH4H2PO4, 또는 NH3 또는 (NH4)2SO4를 포함하고;
바람직한 황 공급원은 MgSO4, 또는 (NH4)2SO4 또는 K2SO4를 포함하고;
바람직한 인산염 공급원은 NH4H2PO4, 또는 H3PO4, 또는 NaH2PO4, KH2PO4, Na2HPO4 또는 K2HPO4를 포함하고;
추가의 일반적인 배지 성분에는 KCl, CaCl2 및 Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B와 같은 미량 원소가 포함되고;
바람직하게는 배지는 성장에 필수적인 비타민, 예를 들어 B7과 같은 B 비타민이 공급되고;
P. 파스토리스의 전형적인 성장 배지는 글리세롤, 소르비톨 또는 글루코스, NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴 및 미량 원소를 포함한다.
생산 기에서 생산 배지는 특히 제한된 양의 보충 탄소원과 함께 사용된다.
바람직하게는 숙주 세포주는 적절한 탄소 공급원이 있는 미네랄 배지에서 배양되어 분리 과정을 더욱 단순화한다. 바람직한 미네랄 배지의 예는 활용가능한 탄소 공급원(예를 들어, 글루코스, 글리세롤, 소르비톨, 메탄올, 에탄올 또는 이들의 조합), 거대 원소(칼륨, 마그네슘, 칼슘, 암모늄, 염화물, 황산염, 인산염)를 함유하는 염 및 미량 원소(구리, 요오드화물, 망간, 몰리브덴산염, 코발트, 아연 및 철염, 및 붕산), 및 임의로 영양요구성을 보완하기 위한 비타민 또는 아미노산을 함유하는 것이다.
구체적으로, 세포는 발현 시스템 및 발현된 단백질의 특성, 예를 들어 단백질이 신호 펩티드에 융합되는지 여부 및 단백질이 가용성인지 또는 막 결합인지 여부에 따라 세포 또는 배양 배지로부터 정제될 수 있는 원하는 POI의 발현을 달성하기에 적합한 조건 하에서 배양된다. 숙련된 기술자에 의해 이해되는 바와 같이, 배양 조건은 사용된 숙주 세포 및 특정 발현 벡터의 유형을 포함하는 인자에 따라 달라질 것이다.
일반적인 생산 배지는 보충 탄소 공급원과 추가로 NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴 및 미량 원소를 포함한다.
예를 들어, 발효에 첨가되는 보충 탄소 공급원의 공급물은 최대 50 wt%의 이용 가능한 당 또는 최대 100%의 이용가능한 알코올을 갖는 탄소 공급원을 포함할 수 있다.
발효는 바람직하게는 3 내지 8 범위의 pH에서 수행된다.
일반적인 발효 시간은 20℃-35℃, 바람직하게는 22-30℃ 범위의 온도에서 약 24-120시간이다.
POI는 바람직하게는 적어도 1 mg/L, 바람직하게는 적어도 10 mg/L, 바람직하게는 적어도 100 mg/L, 가장 바람직하게는 적어도 1 g/L의 수율을 생성하는 조건을 사용하여 발현된다.
용어 "발현" 또는 "발현 카세트"는 본원에서 원하는 코딩 서열(여기에서 유전자라고 지칭) 및 작동가능한 연결의 제어 서열을 함유하는 핵산 분자(여기에서 폴리뉴클레오티드라고도 지칭)를 지칭하는 것으로 이해되며, 이들 분자로 형질전환되거나 형질주입된 숙주는 각각의 서열을 포함하고 코딩된 단백질 또는 숙주 세포 대사산물을 생산할 수 있다. 본원에서 사용되는 용어 "발현"은 폴리뉴클레오티드 또는 유전자의 발현, 또는 각각의 폴리펩티드 또는 단백질의 발현을 의미한다.
하나 이상의 발현 카세트는 본원에서 "발현 시스템"으로도 이해된다. 발현 시스템은 벡터와 같은 발현 구성물에 포함될 수 있다; 그러나, 관련 DNA는 숙주 세포 염색체에 통합될 수도 있다. 발현은 폴리펩티드 또는 대사산물을 포함하는 분비 또는 비-분비 발현 생성물을 의미할 수 있다.
발현 카세트는, 예를 들어 "벡터" 또는 "플라스미드"의 형태로 발현 구성물로서 편리하게 제공되며, 이는 일반적으로 클로닝된 재조합 뉴클레오티드 서열의 전사, 즉 적합한 숙주 유기체에서 재조합 유전자의 전사 및 이들의 mRNA의 번역에 필요한 DNA 서열이다. 발현 벡터 또는 플라스미드는 일반적으로 자가 복제를 위한 기점 또는 숙주 세포에서 게놈 통합을 위한 유전자좌, 선택가능한 마커(예를 들어, 아미노산 합성 유전자 또는 제오신, 카나마이신, G418 또는 하이그로마이신, 누르세오트리신과 같은 항생제에 대한 내성을 부여하는 유전자), 다수의 제한 효소 절단 부위, 적합한 프로모터 서열 및 전사 종결자를 포함하며, 이들 성분은 함께 작동가능하게 연결된다. 본원에서 사용되는 용어 "플라스미드" 및 "벡터"는 자가 복제 뉴클레오티드 서열 뿐만 아니라 인공 염색체, 예를 들어 효모 인공 염색체(YAC)와 같은 게놈 통합 뉴클레오티드 서열을 포함한다.
발현 벡터는 클로닝 벡터, 변형된 클로닝 벡터 및 특이적으로 설계된 플라스미드를 포함할 수 있지만 이에 제한되지 않는다. 본원에 기재된 바람직한 발현 벡터는 진핵 숙주 세포에서 재조합 유전자의 발현에 적합한 발현 벡터이고 숙주 유기체에 따라 선택된다. 적절한 발현 벡터는 전형적으로 진핵 숙주 세포에서 POI를 코딩하는 DNA를 발현하기에 적합한 조절 서열을 포함한다. 조절 서열의 예는 프로모터, 오퍼레이터, 인핸서, 리보솜 결합 부위, 및 전사 및 번역 개시 및 종결을 제어하는 서열을 포함한다. 조절 서열은 전형적으로 발현될 DNA 서열에 작동가능하게 연결된다.
숙주 세포에서 재조합 뉴클레오티드 서열의 발현을 허용하기 위해, 프로모터 서열은 전형적으로 이것이 작동가능하게 연결된 다운스트림 뉴클레오티드 서열의 전사를 조절하고 개시한다. 발현 카세트 또는 벡터는 전형적으로 코딩 서열의 5' 단부에 인접한 프로모터 뉴클레오티드 서열, 예를 들어, 코딩 서열(예를 들어, 헬퍼 인자를 코딩) 또는 관심 유전자(GOI)의 업스트림 및 인접하거나, 또는 신호 또는 리더 서열이 사용되는 경우, 발현 생성물(예를 들어, TIF(들) 또는 POI)을 수득하기 위한 코딩 서열의 번역 개시 및 발현을 용이하게 하기 위해 각각 상기 신호 및 리더 서열의 업스트림 및 인접한 프로모터 뉴클레오티드 서열을 포함한다.
본원에 기술된 특정 발현 구성물은 상기 프로모터의 전사 제어 하에 TIF 또는 POI를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함한다. 구체적으로, 상기 코딩 서열과 본래 연관되지 않은 프로모터가 사용될 수 있다.
본원에 기술된 특정 발현 구성물은 리더 서열(예를 들어, 분비 신호 펩티드 서열(pre-서열) 또는 pro-서열)과 연결된 POI를 코딩하는 폴리뉴클레오티드를 포함하고, 이는 POI를 분비 경로로 수송 및/또는 숙주 세포로부터 POI의 분비를 유발한다. 재조합 발현 및 분비를 위한 POI가 자연적으로 분비되지 않아 자연적인 분비 리더 서열이 결여된 단백질이거나, 이의 뉴클레오티드 서열이 이의 자연 분비 리더 서열 없이 클로닝된 경우, 발현 벡터에서 이러한 분비 리더 서열의 존재가 통상적으로 요구된다. 일반적으로, 숙주 세포로부터 POI의 분비를 일으키는 데 효과적인 임의의 분비 리더 서열이 사용될 수 있다. 분비 리더 서열은 효모 공급원, 예를 들어 사카로마이세스 세레비지애(Saccharomyces cerevisiae)의 MFα와 같은 효모 알파-인자 또는 효모 포스파타제, 포유류 또는 식물 공급원 또는 기타로부터 기원할 수 있다.
특정 구현양태에서, 멀티클로닝 부위를 갖는 벡터인 멀티클로닝 벡터가 사용될 수 있다. 구체적으로, 원하는 이종 폴리뉴클레오티드를 멀티클로닝 부위에 통합 또는 혼입하여 발현 벡터를 제조할 수 있다. 멀티클로닝 벡터의 경우, 프로모터는 일반적으로 멀티클로닝 사이트의 업스트림에 위치한다.
본원에서 사용되는 "유전자 발현" 또는 "폴리뉴클레오티드를 발현하는" 또는 "핵산 분자를 발현하는"이라는 용어는 mRNA로의 DNA 전사, mRNA 번역 및 처리, mRNA 성숙, mRNA 수출, 단백질 폴딩 및/또는 단백질 수송으로 이루어진 군으로부터 선택된 적어도 하나의 단계를 포함하는 것을 의미한다.
본원에서 상호교환적으로 사용되는 용어 "폴리뉴클레오티드" "핵산 분자(들)" 또는 "핵산 서열(들)"은 임의의 길이의 중합체 비분지형 형태의 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 이둘의 조합인 뉴클레오티드를 지칭한다. 바람직하게는, 폴리뉴클레오티드는 임의의 길이의 중합체 비분지형 형태의 데옥시리보뉴클레오티드를 지칭한다. 여기에서 뉴클레오티드는 오탄당(데옥시리보스), 질소 염기(아데닌, 구아닌, 시토신 또는 티민) 및 인산기로 이루어진다.
본원에서 사용되는 용어 "공동-발현하다" 또는 "공동-발현"은 적어도 2개 또는 다수의 폴리뉴클레오티드(유전자와 같은 핵산 분자)를 숙주 세포, 세포주 또는 세포 배양물에서, 예를 들어 거의 동일하거나 다른 양 또는 비율로 수반되는 또는 연이은(동일한 세포 배양 또는 봉쇄에서 세포를 배양하는 동안) 또는 동시 발현을 의미한다.
본원에 기술된 바와 같이 폴리뉴클레오티드(TIF 유전자와 같은)는 폴리뉴클레오티드(GOI와 같은) 중 적어도 하나가 과발현되도록 공동-발현될 수 있다.
본원에 기술된 바와 같은 TIF 유전자(들)를 공동-발현하는 숙주 세포는 숙주 세포 배양물에서 상기 TIF 유전자(들)의 발현을 증가시키기 위해 특이적으로 유전적으로 조작되고 변형되며, 이는 본원에서 "과발현" 또는 "공동-과발현"으로도 지칭된다.
본원에서 사용되는 용어 "과발현되다" 또는 "과발현"은 숙주 세포의 유전적 변형 이전 또는 정의된 조건에서 유전적으로 변형되지 않은 유사한 숙주에서 동일한 발현 생성물의 발현보다 더 높은 수준으로 발현 생성물, 예컨대 폴리펩티드 또는 단백질의 발현을 지칭할 것이다. 숙주 세포에 대해 이종인 TIF는 그러한 숙주 세포가 그러한 TIF를 발현한다면 항상 과발현되는 것으로 이해된다. 예를 들어, 본원에 기재된 바와 같은 숙주 세포가 임의의 상기 TIF를 천연적으로 발현하지 않는 경우, 이러한 TIF 단백질을 코딩하는 이종 폴리뉴클레오티드는 발현을 위해 숙주 세포에 새로 도입되고; 그러한 경우, 이러한 TIF의 검출가능한 발현은 "과발현"이라는 용어에 포함된다.
단백질을 코딩하는 유전자(예를 들어, TIF 유전자)의 과발현은 단백질(예를 들어, TIF)의 과발현이라고도 지칭된다. 과발현은 당업자에게 공지된 임의의 방식으로 달성될 수 있다. 일반적으로 유전자의 전사/번역을 증가시켜, 예를 들어 유전자의 카피 수를 증가시키거나 유전자 발현과 관련된 조절 서열 또는 부위를 변경 또는 수정함으로써 달성할 수 있다. 유전자는 높은 발현 수준에 도달하기 위해 강력한 프로모터에 작동가능하게 연결될 수 있다. 이러한 프로모터는 내인성 프로모터 또는 이종성, 특히 재조합 프로모터일 수 있다. 유전자의 발현을 증가시키는 이종 프로모터로 프로모터를 대체할 수 있다. 유도성 프로모터를 추가로 사용하면 배양 과정에서 발현을 증가시킬 수 있다. 또한, 과발현은, 예를 들어 특정 유전자의 염색체 위치 변형, 리보솜 결합 부위 또는 전사 종결자와 같은 특정 유전자에 인접한 핵산 서열 변경, 열린 해독틀에서 프레임-이동 도입, 유전자의 전사 및/또는 유전자 생성물의 번역에 관여하는 단백질의 변형(예를 들어, 조절 단백질, 억제자, 인핸서, 전사 활성자 등), 또는 당업계에서 특정 유전자 루틴의 발현을 조절 해제하는 임의의 다른 통상적인 수단(예를 들어, 억제 단백질의 발현을 차단하거나 일반적으로 과발현하고자 하는 유전자의 발현을 억제하는 전사 인자에 대한 유전자를 결실 또는 돌연변이시키기 위한 안티센스 핵산 분자의 사용을 포함하지만 이에 제한되지 않는다)에 의해 달성될 수도 있다. mRNA의 수명 연장은 또한 발현 수준을 향상시킬 수 있다. 예를 들어 특정 종결 영역을 사용하여 mRNA의 반감기를 연장시킬 수 있다. 유전자의 여러 카피가 포함된 경우, 유전자는 가변 카피 수의 플라스미드에 위치하거나 염색체에 통합 및 증폭될 수 있다. 발현을 위해 하나 이상의 유전자 또는 게놈 서열을 숙주 세포에 도입하는 것이 가능하다.
특정 구현양태에 따르면, 각각의 TIF를 코딩하는 폴리뉴클레오티드는 세포당 단일 카피 또는 다중 카피로 존재할 수 있다. 카피는 서로 인접하거나 떨어져 있을 수 있다. 또 다른 특정 구현양태에 따르면, 각각의 TIF의 과발현은 숙주 세포의 게놈으로의 통합(즉, 녹킨)에 적합한 하나 이상의 플라스미드 상에 제공되는 TIF를 세포당 단일 카피 또는 다중 카피로 코딩하는 재조합 뉴클레오티드 서열을 사용한다. 카피는 서로 인접하거나 떨어져 있을 수 있다. 과발현은 숙주 세포당 상기 폴리뉴클레오티드의 2, 3, 4, 5, 6개 이상의 카피와 같은 폴리뉴클레오티드의 다중 카피를 발현함으로써 달성될 수 있다.
GOI 및 각각의 TIF를 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 재조합 뉴클레오티드 서열은 하나 이상의 자가 복제 플라스미드에 제공될 수 있고, 세포당 단일 카피 또는 다중 카피로 도입될 수 있다.
대안적으로, GOI 및 TIF를 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 재조합 뉴클레오티드 서열은 동일한 플라스미드 상에 존재할 수 있고, 세포당 단일 카피 또는 다중 카피로 도입될 수 있다.
각각의 TIF를 코딩하는 이종 폴리뉴클레오티드(유전자) 또는 TIF를 코딩하는 폴리뉴클레오티드(유전자)를 포함하는 이종 재조합 발현 구성물은 바람직하게는 숙주 세포의 게놈으로 통합된다.
"게놈"이라는 용어는 일반적으로 DNA(또는 RNA)에서 코딩된 유기체의 전체 유전 정보를 의미한다. 염색체에, 플라스미드 또는 벡터 또는 둘 다에 존재할 수 있다. 바람직하게는, 각각의 TIF를 코딩하는 폴리뉴클레오티드(유전자)는 상기 세포의 염색체에 통합된다.
각각의 TIF를 코딩하는 폴리뉴클레오티드(유전자)는 이의 자연 유전자좌에 통합될 수 있다. "자연 유전자좌"는 TIF를 코딩하는 폴리뉴클레오티드(유전자)가 자연-발생 야생형 세포에 위치하는 특정 염색체 상의 위치를 의미한다. 그러나, 또 다른 구현양태에서, TIF를 코딩하는 폴리뉴클레오티드(유전자)는 자연 유전자좌가 아니라 이소성으로 통합된 숙주 세포의 게놈에 존재한다. 용어 "이소성 통합(ectopic integration)"은 통상적인 염색체 유전자좌 이외의 부위에서 미생물의 게놈으로 핵산을 삽입하는 것, 즉 예정된 또는 무작위 통합을 의미한다. 또 다른 구현양태에서, TIF를 코딩하는 폴리뉴클레오티드(유전자)는 천연 유전자좌 내로 및 이소적으로 통합된다. 무작위 또는 비-표적 통합을 달성하기 위해 이종 재조합을 사용할 수 있다. 이종 재조합은 상당히 다른 서열을 가진 DNA 분자 사이의 재조합을 지칭한다.
특정 구현양태에서, 각각의 TIF 및/또는 GOI를 코딩하는 폴리뉴클레오티드(유전자)는 플라스미드 또는 벡터에 통합될 수 있다. 바람직하게는, 플라스미드는 진핵 발현 벡터, 바람직하게는 효모 발현 벡터이다. 적합한 플라스미드 또는 벡터는 본원에서 추가로 설명된다.
재조합 숙주 세포에서 내인성 또는 이종 폴리뉴클레오티드의 과발현은 발현 제어 서열을 변형함으로써 달성될 수 있다. 발현 제어 서열은 당업계에 공지되어 있고, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 제공하는 프로모터, 인핸서, 폴리아데닐화 신호, 전사 종결자, 내부 리보솜 진입 부위(IRES) 등을 포함한다. 발현 제어 서열은 전사에 관여하는 세포 단백질과 특이적으로 상호 작용한다. 예시적인 발현 제어 서열은 문헌에 기재되어 있다(Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif. (1990)).
바람직한 구현양태에서, 과발현은 폴리뉴클레오티드를 발현하기 위해 인핸서를 사용함으로써 달성된다. 전사 인핸서는 상대적으로 방향 및 위치 독립적이며, 인트론 내에서 뿐만 아니라 코딩 서열 자체 내에서 전사 단위의 5' 및 3'에서 발견되었다. 인핸서는 코딩 서열에 대해 위치 5' 또는 3'에서 발현 벡터로 스플라이싱될 수 있지만, 바람직하게는 프로모터로부터 부위 5'에 위치한다. 대부분의 효모 유전자는 단 하나의 UAS를 함유하며, 이는 일반적으로 캡 부위의 수백 염기쌍 내에 있으며 대부분의 효모 인핸서(UAS)는 프로모터의 3'에 위치할 때 기능할 수 없지만 고등 진핵생물의 인핸서는 프로모터의 5' 및 3' 모두에서 기능할 수 있다.
많은 인핸서 서열이 포유류 유전자(글로빈, RSV, SV40, EMC, 엘라스타제, 알부민, α-태아단백질 및 인슐린)에서 알려져 있다. SV40 후기 인핸서, 거대세포바이러스 초기 프로모터 인핸서, 복제 오리진의 후기 측에 있는 폴리오마 인핸서 및 아데노바이러스 인핸서와 같은 진핵 세포 바이러스로부터의 인핸서를 사용할 수도 있다.
구체적으로, 본원에 기재된 바와 같은 GOI 및/또는 TIF 코딩 폴리뉴클레오티드(유전자)는 숙주 세포에서 발현을 제공하는 전사 및 번역 조절 서열에 작동가능하게 연결된다. 본원에서 사용되는 용어 "번역 조절 서열"은 유전자 핵산 서열과 연관되고 유전자의 번역을 조절하는 뉴클레오티드 서열을 의미한다. 전사 및/또는 번역 조절 서열은 플라스미드 또는 벡터에 위치하거나 숙주 세포의 염색체에 통합될 수 있다. 전사 및/또는 번역 조절 서열은 조절하는 유전자의 동일한 핵산 분자에 위치한다.
구체적으로, 각각의 TIF의 과발현은 당업계에 공지된 방법, 예를 들어 문헌에 기재된 바와 같이 그들의 내인성 조절 영역을 유전적으로 변형함으로써 달성될 수 있으며(Marx, H., Mattanovich, D. and Sauer, M. Microb Cell Fact 7 (2008): 23), 이러한 방법은, 예를 들어 유전자의 발현을 증가시키는 재조합 프로모터의 통합을 포함한다.
예를 들어, 재조합 숙주 세포에서 내인성 또는 이종 폴리뉴클레오티드의 과발현은 이러한 발현을 제어하는 프로모터를 변형함으로써, 예를 들어 높은 발현 수준에 도달하기 위해 상기 폴리뉴클레오티드에 작동가능하게 연결된 프로모터(예를 들어, 내인성 프로모터 또는 야생형 유기체에서 상기 폴리뉴클레오티드에 천연적으로 연결된 프로모터)를 또 다른 더 강력한 프로모터로 교체함으로써 달성될 수 있다. 이러한 프로모터는 유도적이거나 구성적일 수 있다. 프로모터의 변형은 또한 당업계에 공지된 돌연변이유발 방법에 의해 수행될 수 있다.
특정 구현양태는 GOI 발현과 함께 TIF(또는 TIF 유전자)의 공동-발현을 언급한다. 본원에 기술된 일부 구현양태에서, 벡터 또는 핵산 서열은 적어도 하나의 TIF 분자 및 GOI를 공동-발현하기 위한 하나 이상의 발현 카세트를 포함할 수 있다. 벡터 또는 핵산 서열은 2개 이상의 플라스미드의 공동-형질주입, 다중 또는 양방향 프로모터의 사용, 또는 바이시스트론 또는 멀티시스트론 벡터의 생성을 포함하는 여러 기술을 사용하여 2개 이상의 폴리늄클레오티드의 공동-발현을 허용하도록 구성될 수 있다.
특정 구현양태는, 예를 들어 숙주 세포 게놈 또는 염색체 내에서 안정한 통합을 위해 각각의 발현 카세트(들)를 도입할 때 적어도 1, 2, 3, 4 또는 5개의 TIF를 안정적으로 공동-발현하기 위한 유전적 변형을 지칭한다.
본원에서 사용되는 "기능적 변이체"라고도 지칭되는 용어 "기능적 활성 변이체"는 천연 서열("천연"은 야생형 세포에서 자연적으로 발생하는 서열로 이해됨) 이외의 모든 것을 의미하며, 예를 들어 TIF 또는 TIF의 뉴클레오티드 서열 또는 아미노산 서열로부터 유도되거나 관련된다. 본원에는 부모 서열에 대한 특정 서열 동일성을 갖는 임의의 (부모) TIF 또는 각각의 TIF 유전자(서열번호: 1-65 중 어느 하나, 특히 서열번호: 1, 12, 23, 34, 45 또는 56 중 임의의 것를 포함하거나 이로 구성되는 것과 같은)의 특정 기능적 변이체가 본원에 기술되어 있다.
특정 구현양태에 따르면, 기능적 변이체는 천연 서열로부터 유래하고 그것이 유래하는 천연 서열과 비교하여 거의 동일하고/하거나 심지어 개선된 숙주 세포에서 입증된 기능을 갖는 미리결정된 서열을 포함하거나 이로 이루어진다.
특정 구현양태에 따르면, 기능적 변이체는 자연-발생 모 분자의 이소폼 또는 오솔로그이며, 이 오솔로그는 자연-발생 모 분자를 포함하는 종 이외의 종, 예를 들어 포유동물 또는 진균 종에서 자연 발생한다.
일부 구현양태에서, 폴리뉴클레오티드 또는 핵산 분자의 기능적 변이체는, 예를 들어 핵산 안정성 개선, 숙주 세포에서의 번역 효능 증가, 발현된 절단 단백질의 수 감소, 발현된 단백질의 접힘 개선 또는 잘못된 접힘 방지, 발현된 생성물의 독성 감소, 발현된 생성물에 의해 유발된 세포 사멸 감소 또는 단백질 응집 증가 및/또는 감소를 위해 서열 최적화된다. 특정 구현양태에 따르면, 모 뉴클레오티드 서열의 기능적 변이체는 숙주 세포에서 발현되는 상기 모 뉴클레오티드 서열의 코돈-최적화된 변이체이며, 이는 숙주 세포의 세포 환경에서 개선된 발현을 위한 모 뉴클레오티드 서열의 하나 이상의 유전적 변형에 의해 수득할 수 있다.
본원에 기술된 TIF의 기능적 변이체는 특히 숙주 세포에서 공동-발현될 때 POI 생산을 개선하기 위해 천연 서열과 실질적으로 동일하거나 개선된 활성을 갖는 경우 기능적으로 활성인 것으로 간주된다.
TIF의 기능적 활성 변이체는 각각의 천연(야생형) TIF 유전자를 돌연변이시켜 이의 변이체를 생성하고, 이종 POI 코딩 유전자와 수반되어 또는 동시에 숙주 세포에서 변이체를 발현하고, POI를 생성하기 위해 숙주 세포 생산성을 향상시키기 위한 변이체의활성을 평가함으로써 제조될 수 있다.
TIF의 활성은, 예를 들어 시험관내 및 생체내 접근법을 사용하여 공지된 방법에 의해 기재된 바와 같이 결정될 수 있다.
번역 활성을 분석하는 데 적합한 방법은 문헌에 요약되어 있다(Dermit et al., Mol Biosyst. 2017 Nov 21;13(12):2477-24882017).
일부 추가의 적합한 방법은 문헌(Martin R, 1998; Protein synthesis: methods and protocols. Methods in Molecular Biology, Volume 77, Totowa, N.J.: Humana Press)에 기술된 바와 같이 능동적으로 번역된 단백질의 방사성 표지(방사성 표지된 아미노산의 혼입)를 사용한다.
번역 활성을 측정하는 특정 테스트는 하기 실시예 섹션에 설명되어 있다.
모 단백질의 기능적 변이체는, 예를 들어 N- 또는 C-말단에서 뿐만 아니라 하나 이상의 내부 도메인 내에서 하나 이상의 아미노산 잔기가 추가되거나 결실된 단백질을 포함한다. 특정 기능적 활성 변이체는 N-말단 및/또는 C-말단 단부에 추가 아미노산을 포함하여, 예를 들어 100개 미만의 아미노산, 구체적으로 75개 미만의 아미노산, 더 구체적으로 50개 미만의 아미노산, 더 구체적으로 25개 미만의 아미노산, 또는 10개 미만의 아미노산만큼 모 서열을 연장한다. 추가의 특정 기능적 활성 변이체는 융합 단백질일 수 있으며, 여기서 본 발명의 서열은 또 다른 폴리펩티드 또는 단백질의 추가 아미노산 잔기에 의해 연장된다.
특정 기능 변이체는 모 단백질 또는 핵산 분자의 단편이다.
폴리뉴클레오티드 또는 핵산 분자의 단편인 기능적 변이체는 적어도 20개 뉴클레오티드, 바람직하게는 적어도 100개 뉴클레오티드, 본원에 기술된 바와 같이 TIF를 코딩하는 전장 뉴클레오티드 서열까지의 범위일 수 있다. 폴리뉴클레오티드 또는 핵산 분자의 기능적으로 활성인 단편은 각각의 뉴클레오티드 서열의 적어도 50%, 바람직하게는 적어도 60, 70, 80, 85,90% 또는 95%를 포함할 수 있다.
폴리펩티드 또는 단백질의 단편인 기능적 변이체는 적어도 10개의 아미노산, 구체적으로 적어도 25개의 아미노산, 보다 구체적으로 적어도 50개의 아미노산, 보다 구체적으로 적어도 75개의 아미노산, 또는 적어도 100개의 연속 아미노산, 또는전장 단백질에 존재하는 아미노산의 총 수까지를 포함하거나 이로 구성될 수 있다.
본원에서 사용되는 용어 "내인성"은 각각의 내인성 유전자의 발현을 감소시키고/시키거나 내인성 단백질의 생성을 감소시키기 위한 이의 변형 전에 야생형(천연) 숙주 세포에 존재하는 분자 및 서열, 특히 내인성 유전자 또는 단백질을 포함하는 것을 의미한다. 특히, 자연에서 발견되는 바와 같이 특정 숙주 세포에서 발생하는(및 그로부터 수득될 수 있는) 내인성 핵산 분자(예를 들어, 유전자) 또는 단백질은 "내인성 숙주 세포" 또는 "숙주 세포에 내인성"인 것으로 이해된다. 더욱이, 핵산 또는 단백질을 "내인성으로 발현하는" 세포는 자연에서 발견되는 것과 동일한 특정 유형의 숙주가 하는 것처럼 그 핵산 또는 단백질을 발현한다. 더욱이, 숙주 세포는 핵산, 단백질 또는 다른 화합물을 "내인성 생산"하거나 "내인성으로 생산하는" 것은 자연에서 발견되는 것과 동일한 특정 유형의 숙주 세포가 하는 것과 같이 그 핵산, 단백질 또는 화합물을 생산한다.
따라서, 단백질 코딩 유전자가 불활성화되거나 결실된 숙주 세포의 녹아웃 돌연변이에서와 같이 내인성 단백질이 숙주 세포에 의해 더 이상 생산되지 않더라도, 단백질은 본원에서 여전히 "내인성"으로 지칭된다.
뉴클레오티드 서열, 발현 카세트와 같은 구성물, 아미노산 서열 또는 단백질과 관련하여 본원에서 사용되는 용어 "이종"은 주어진 숙주 세포에 대해 이질적인 화합물, 즉, 상기 숙주 세포에서 자연적으로 발견되지 않는 것과 같은 "외인성"이거나; 또는 주어진 숙주 세포에서 자연적으로 발견되는, 예를 들어 "내인성"이지만, 이종 구성물의 맥락에서 또는 이러한 이종 구성물에 통합된, 예를 들어 내인성 핵산과 융합되거나 결합된 이종 핵산을 사용하여, 따라서 구성물을 이종으로 만드는 화합물을 지칭한다. 내인성으로 발견되는 이종 뉴클레오티드 서열은 세포에서 비자연적으로, 예를 들어 예상보다 많거나 자연적으로 발견되는 것보다 많은 양으로 생산될 수도 있다. 이종 뉴클레오티드 서열, 또는 이종 뉴클레오티드 서열을 포함하는 핵산은 아마도 내인성 뉴클레오티드 서열과 서열이 상이하지만 내인성으로 발견되는 것과 동일한 단백질을 코딩한다. 구체적으로, 이종 뉴클레오티드 서열은 자연에서 숙주 세포와 동일한 관계로 발견되지 않는 것이다. 임의의 재조합 또는 인공 뉴클레오티드 서열은 이종인 것으로 이해된다. 이종 폴리뉴클레오티드의 예는 본원에 기술된 바와 같이, 예를 들어 하이브리드 프로모터를 얻기 위해 프로모터와 자연적으로 연관되지 않거나 코딩 서열에 작동가능하게 연결되지 않은 뉴클레오티드 서열이다. 결과적으로, 하이브리드 또는 키메릭 폴리뉴클레오티드가 수득될 수 있다. 이종 화합물의 추가 예는 전사 제어 요소, 예를 들어 프로모터에 작동가능하게 연결된 POI 코딩 폴리뉴클레오티드이며, 여기에는 내인성 자연-발생 POI 코딩 서열이 정상적으로 작동가능하게 연결되지 않는다.
본원에서 사용되는 "번역 개시 인자"라는 용어는 "TIF"로 약칭하여 번역 개시 인자 단백질 또는 번역 개시 인자를 코딩하는 폴리뉴클레오티드(핵산 분자)를 지칭할 것이다.
구체적으로, 본원에 기술된 TIF 중 어느 것도 관심 단백질(POI)이 아니다. 본원에 기술된 재조합 숙주 세포는 TIF(들)을 발현하고 추가로 또 다른 폴리뉴클레오티드(상기 TIF(들) 코딩 폴리뉴클레오티드와 상이)를 발현하기 위한 발현 시스템을 포함하고, 본원에서 관심 유전자(GOI)로 지칭되는 것으로 이해된다.
본원에서 사용되는 용어 "번역 개시 인자"는 특히 mRNP에 포함된 임의의 인자를 지칭한다.
특정 TIF 코딩 뉴클레오티드 서열은 자연-발생적이거나, 재조합 숙주 세포에서 이의 발현을 개선하기 위해 뉴클레오티드 서열 최적화 알고리즘 또는 코돈-최적화 기술에 의해 서열을 최적화하여, 하나 이상, 예를 들어 최대 50, 40, 30, 20 또는 10개의 점 돌연변이에 의해 부모(자연 발생)와 상이한 변이체 뉴클레오티드 서열과 같은 이의 기능적으로 활성 변이체이다.
특정 최적화 기술은, 예를 들어 뉴클레오티드 서열 최적화 알고리즘 또는 코돈-최적화 기술에 의해 숙주 세포에서 뉴클레오티드 서열의 발현을 개선하고 있다.
골든 게이트(Golden Gate) 클로닝 또는 골든 게이트 어셈블리를 위한 최적화와 같은 특정 최적화 기술이 클로닝을 개선하고 있다.
특정 최적화된 뉴클레오티드 서열은 사용된 제한 효소(예를 들어, BsaI 및 BpiI)의 인식 부위의 존재를 피하기 위해, 예를 들어 "침묵" 돌연변이를 포함한다.
본원에 기재된 최적화된 뉴클레오티드 서열은 전형적으로 하나 이상, 예를 들어 코딩된 아미노산 서열에서 수개의 점 돌연변이, 예를 들어 최대 10, 9, 8, 7, 6, 5, 4 또는 3개의 점 돌연변이를 허용한다.
진핵 번역 개시 인자 4E로도 알려진 "eIF4E"는 폐쇄 루프 인자이자 eIF4F 캡 -결합 복합체의 일부이자 mRNP의 일부인 폐쇄 루프 mRNA의 형성에 관여하는 TIF이다. 이는 서열번호: 1-11 중 어느 하나 또는 다른 진핵생물 종의 오르토로그를 특징으로 한다. eIF4E는 eIF4E 코딩 뉴클레오티드 서열에 의해 코딩되며, 이는 자연- 발생 eIF4E 유전자 또는 자연 발생 eIF4E와 특정 서열 동일성을 갖는 eIF4E를 코딩하는 각각의 기능적 변이체일 수 있다. 예시적인 eIF4E 코딩 뉴클레오티드 서열은 서열번호: 1을 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 66 또는 이의 기능적으로 활성인 변이체에 의해 식별된다. 서열번호: 67은 골든 게이트 최적화에 의해 생성된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고, 서열번호: 66과 3개의 뉴클레오티드 치환: A276G, T354C, G492A에 의해 다르다.
진핵 번역 개시 인자 4A로도 알려진 eIF4A는 폐쇄 루프 인자이자 eIF4F 캡-결합 복합체의 일부이자 mRNP의 일부인 폐쇄 루프 mRNA의 형성에 관여하는 TIF이다. 이는 서열번호: 12-33 중 어느 하나 또는 다른 진핵 종의 오르토로그를 특징으로 한다. 용어 "eIF4A"는 TIF2a 및 Tif2b를 포함하며, TIF2b는 5' 단부에서 TIF2a의 249개 뉴클레오티드(83개 아미노산에 해당) 더 긴 변이체이다. 두 서열 모두 P. 파스토리스(P. Pastoris) 게놈에서 직접 증폭되었으며 대체 시작 위치를 갖는 eIF4A의 두 가지 변이체를 제시한다.
eIF4A는 자연-발생 eIF4A 유전자 또는 자연 발생 eIF4A에 특정 서열 동일성을 갖는 eIF4A를 코딩하는 각각의 기능적 변이체일 수 있는 eIF4A 코딩 뉴클레오티드 서열에 의해 코딩된다. 예시적인 eIF4A 코딩 뉴클레오티드 서열은 각각 서열번호: 12 및 서열번호: 23을 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 68 또는 서열번호: 70 또는 이의 기능적 활성 변이체에 의해 식별된다. 서열번호: 69는 골든 게이트 최적화에 의해 생산된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고 서열번호: 68과 하나의 뉴클레오티드 치환: C45A에 의해 다르다. 서열번호: 71은 골든 게이트 최적화에 의해 생성된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고, 서열번호: 70과 하나의 뉴클레오티드 치환: C294A에 의해 다르다.
진핵 번역 개시 인자 4G로도 알려진 eIF4G는 폐쇄 루프 인자이자 eIF4F 캡-결합 복합체의 일부이자 mRNP의 일부인 폐쇄 루프 mRNA의 형성에 관여하는 TIF이다. 이는 서열번호: 34-44 중 어느 하나 또는 다른 진핵 종의 오르토로그를 특징으로 한다. eIF4G는 자연-발생 eIF4G 유전자 또는 자연 발생 eIF4G에 특정 서열 동일성을 갖는 eIF4G를 코딩하는 각각의 기능적 변이체일 수 있는 eIF4G 코딩 뉴클레오티드 서열에 의해 코딩된다. 예시적인 eIF4G 코딩 뉴클레오티드 서열은 서열번호: 34을 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 72 또는 이의 기능적 활성 변이체에 의해 식별된다. 서열번호: 73은 골든 게이트 최적화에 의해 생산된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고 서열번호: 72와 4개의 뉴클레오티드 치환: A564G, A1923G, G2037C, T2100C에 의해 다르다.
폴리아데닐레이트-결합 단백질 1로도 알려진 PAB1은 폐쇄 루프 mRNA의 형성에 관여하는 TIF이고 mRNP의 일부이다. 이는 서열번호: 45-55 중 어느 하나 또는 다른 진핵 종의 오르토로그를 특징으로 한다. PAB1은 자연-발생 PAB1 유전자 또는 자연 발생 PAB1과 특정 서열 동일성을 갖는 PAB1을 코딩하는 각각의 기능적 변이체일 수 있는 PAB1 코딩 뉴클레오티드 서열에 의해 코딩된다. 예시적인 PAB1 코딩 뉴클레오티드 서열은 서열번호: 45를 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 74, 또는 이의 기능적으로 활성인 변이체에 의해 식별된다. 서열번호: 75는 골든 게이트 최적화에 의해 생산된 최적화된 코딩 뉴클레오티드 서열의 예를 식별하고, 3개의 뉴클레오티드 치환 C150A, T384C, C707T에 의해 서열번호: 74와 다르다.
RNase L 억제제(RLI)로도 알려진 ATP-결합 카세트 서브패밀리 E 구성원 1(ABCE1)로도 알려진 RLI1은 인간에서 ABCE1 유전자에 의해 코딩되는 ATP-결합 카세트(ABC) 단백질이다. 이것은 번역 개시 및 리보솜 생물발생 뿐만 아니라 번역 종결 및 mRNP의 일부에서 이중 역할을 하는 TIF이다. 이는 서열번호: 56-65 중 어느 하나 또는 다른 진핵 종의 오르토로그를 특징으로 한다. RLI1은 자연-발생 RLI1 유전자 또는 자연 발생 RLI1과 특정 서열 동일성을 갖는 RLI1을 코딩하는 각각의 기능적 변이체일 수 있는 RLI1 코딩 뉴클레오티드 서열에 의해 코딩된다. 예시적인 RLI1 코딩 뉴클레오티드 서열은 서열번호: 56을 코딩하는 코마가타엘라 파피(Komagataella phaffii)의 서열번호: 76, 또는 이의 기능적으로 활성인 변이체에 의해 식별된다.
본원에 제공되고 실시예 섹션에서 사용된 바와 같은 서열번호: 1, 12, 23, 34, 45 및 56으로 식별된 아미노산 서열을 포함하거나 이로 이루어진 TIF(각각의 (최적화된) 뉴클레오티드 서열 포함)는 K. 파피(K. phaffii) 기원이다. 본원에 제공된 바와 같은 서열번호: 2, 13, 24, 35, 46 및 57에 의해 식별된 아미노산 서열을 포함하거나 이로 이루어진 TIF는 K. 파스토리스(K. pastoris) 기원이다. 다른 효모 숙주 세포, 특히 본원에 기술된 바와 같이 사용될 수 있는 도 1에 제공된 것과 같은 메틸로트로픽 효모에 존재하는 상동성 서열이 있음이 잘 이해된다. 예를 들어, 피치아 파스토리스의 효모는 각각의 상동성 서열을 포함한다. 피치아 파스토리스는 코마가타엘라(Komagataella)속으로 재분류되어 K. 파스토리스(K. pastoris), K. 파피(K. phaffii) 및 K. 슈도파스토리스(K. pseudopastoris)의 3개의 종으로 나뉜다.
예를 들어, 본원에 기재된 특정 서열 동일성을 갖는 각각의 TIF의 임의의 상동성 서열, 특히 K. 파피, K. 파스토리스, 또는 K. 슈도파스토리스와 같은 특히 각각의 P. 파스토리스 TIF의 오르토로그인 이러한 임의의 단백질이 사용될 수 있다.
본원에서 사용되는 용어 "mRNP"는 결합된 단백질을 갖는 mRNA로 이루어진 입자 또는 복합체로 이해되는 메신저 RNP(메신저 리보핵단백질)를 지칭할 것이다. mRNA는 세포질에서 합성, 스플라이싱, 수출 및 번역되는 동안 다양한 단백질에 의해 결합된다.
본원에서 사용되는 용어 "작동가능하게 연결된"은 하나 이상의 뉴클레오티드 서열의 기능이 상기 핵산 분자에 존재하는 적어도 하나의 다른 뉴클레오티드 서열에 의해 영향을 받는 방식으로 단일 핵산 분자, 예를 들어 벡터 또는 발현 카세트 상의 뉴클레오티드 서열의 연관을 의미한다. 작동가능하게 연결함으로써, 핵산 서열은 동일한 핵산 분자 상의 다른 핵산 서열과 기능적 관계로 배치된다. 예를 들어, 프로모터는 재조합 유전자의 코딩 서열의 발현에 영향을 미칠 수 있을 때 재조합 유전자의 코딩 서열과 작동가능하게 연결된다. 추가의 예로서, 신호 펩티드를 코딩하는 핵산은 성숙한 단백질의 프리폼 또는 성숙한 단백질과 같은 분비된 형태의 단백질을 발현할 수 있을 때 POI를 코딩하는 핵산 서열에 작동가능하게 연결된다. 특히, 서로 작동가능하게 연결된 이러한 핵산은 즉시 연결될 수 있는데 즉, 신호 펩티드를 코딩하는 핵산과 POI를 코딩하는 핵산 서열 사이에 추가 요소 또는 핵산 서열 없이 연결될 수 있다. 대안적으로, 예를 들어 프로모터와 GOI 사이에 위치한 클로닝 부위와 같은 적합한 연결 서열이 사용될 수 있다.
프로모터가 코딩 서열의 전사를 제어한다면, "프로모터" 서열은 전형적으로 코딩 서열에 작동가능하게 연결된 것으로 이해된다. 프로모터 서열이 코딩 서열과 자연적으로 연관되지 않은 경우, 이의 전사는 천연(야생형) 세포에서 프로모터에 의해 제어되지 않거나 서열이 상이한 연속 서열과 재조합된다.
POI 코딩 DNA와 같은 단백질 코딩 폴리뉴클레오티드(DNA)의 발현을 개시, 조절, 또는 그렇지 않으면 매개 또는 제어하는 프로모터가 본원에 기술되어 있다. 프로모터 DNA와 코딩 DNA는 동일한 유전자 또는 다른 유전자에서 유래할 수 있으며 동일하거나 다른 유기체에서 유래할 수 있다.
프로모터의 강도는 구체적으로 전사 강도를 의미하며, 이는 높은 빈도 또는 낮은 빈도로 해당 프로모터에서 발생하는 전사 개시 효율로 표시된다. 전사 강도가 높을수록 해당 프로모터에서 전사가 더 자주 발생한다. 프로모터의 강도는 프로모터의 전형적인 특징인데, 이는 주어진 mRNA 서열이 얼마나 자주 전사되는지를 결정하여 일부 유전자에 다른 유전자보다 효과적으로 더 높은 전사 우선 순위를 부여하여 더 높은 전사물 농도를 유도하기 때문이다. 예를 들어, 대량으로 필요한 단백질을 코딩하는 유전자는 일반적으로 상대적으로 강력한 프로모터를 필요로 한다. RNA 중합효소는 한 번에 하나의 전사 작업만 수행할 수 있으므로 효율적이기 위해서는 작업의 우선순위를 정해야 한다. 프로모터 강도의 차이는 이러한 우선 순위를 허용하도록 선택된다.
프로모터 강도는 또한 일반적으로 전사율로 이해되는 전사 빈도를 의미하며, 예를 들어 RT-PCR 또는 노던 블로팅과 같은 적합한 검정에서 전사체의 양에 의해 결정된다. 예를 들어, 본원에 기술된 프로모터의 전사 강도는 P. 파스토리스인 숙주 세포에서 결정되고 P. 파스토리스의 천연 pGAP 프로모터와 비교된다.
관심 유전자를 발현하는 프로모터의 강도는 일반적으로 발현 강도 또는 높은 발현 수준/율을 지원하는 능력으로 이해된다. 예를 들어, 본 발명의 프로모터의 발현 및/또는 전사 강도는 P. 파스토리스인 숙주 세포에서 결정되고, P. 파스토리스의 천연 pGAP 프로모터와 비교되고, 예를 들어 완전히 유도되거나 억제되었을 때 측정된다.
특정 측면에 따르면, GOIEC 프로모터는 TIFEC 프로모터보다 더 강하다. 바람직하게는, 전사율 또는 강도가 POI를 생산하기 위한 재조합 목적을 위한 숙주 세포로 선택된 숙주 세포(예를 들어, 진핵)에서 결정된 바와 같이 천연 pGAP 프로모터와 비교하여 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 또는 그 이상, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190% 또는 200% 또는 그 이상 중 적어도 어느 하나인 프로모터가 사용된다. 예를 들어, 발현율은 eGFP와 같은 리포터 유전자의 발현량에 의해 결정될 수 있다.
천연 pGAP 프로모터는 일반적으로 대부분의 살아있는 유기체에 존재하는 구성적 프로모터인 글리세르알데하이드-3-포스페이트 탈수소효소(GAPDH)를 코딩하는 gap 유전자의 발현을 개시한다. GAPDH(EC 1.2.1.12)는 해당작용 및 포도당신생합성의 핵심 효소로 이화 및 단백동화 탄수화물 대사에서 중요한 역할을 한다.
참조 프로모터와 비교한 비교 전사 강도는, 예를 들어 전사체의 양을 측정하는 것과 같은 표준 방법에 의해 결정될 수 있으며, 재조합 세포에서 각각의 유전자 발현 생성물의 양을 측정하는 것과 같이 세포 배양에서 마이크로어레이를 사용한다. 특히, 전사율은 마이크로어레이, 노던 블롯 또는 정량적 실시간 PCR(qRT-PCR) 또는 RNA 시퀀싱(RNA-seq)에서의 전사 강도에 의해 결정될 수 있다.
본원에 기술된 바와 같이, 이종성 프로모터는 임의의 하나 이상 또는 모든 TIF를 발현하기 위해 각각의 TIFEC 및/또는 GOI를 발현하기 위해 GOIEC에서 사용될 수 있다. 이종성 프로모터는 발현될 폴리뉴클레오티드에 대해 이종성일 수 있고/있거나 인공 프로모터, 또는 야생형 숙주 세포로부터 기원하지만 이종성 발현 카세트 내의 숙주 세포 게놈에 위치하거나 야생형 숙주 세포에서 자연적으로 발생하지 않는 위치에 위치하는 프로모터일 수 있다.
본원에 기재된 바와 같이, 특정 구현양태에 따르면, 임의의 TIF 발현 카세트 또는 GOIEC는 구성적 프로모터, 예컨대 본원에 추가로 기재된 임의의 프로모터를 포함하고 사용할 수 있다.
구성적 프로모터의 특정 예는 예를 들어 pGAP(예를 들어, 서열번호: 100, 서열번호: 101) 및 이의 기능적 변이체, pCS1(예를 들어, 서열번호: 102 또는 WO2014139608에 공개된 것과 같은 이의 기능적 변이체)와 같은 임의의 구성적 프로모터, pMDH3(예를 들어, 서열번호: 103), pPOR1(예를 들어, 서열번호: 104), pRPP1B, pPDC1, pGPM1, pFBA1-1, 또는 전술한 것들 중 임의의 기능적 변이체를 포함한다.
유도성 또는 억제성 프로모터의 특정 예는, 예를 들어 천연 pAOX1 또는 pAOX2 및 이의 기능적 변이체, WO2013050551에 공개된 pG1-pG8 및 이의 단편과 같은 임의의 조절 프로모터; WO2017021541 A1에 공개된 pG1 및 pG1-x와 같은 임의의 조절 프로모터를 포함한다.
특히, 조절가능한 프로모터, 예컨대 탈억제성 또는 억제성(본원에서는 (탈)억제성으로 지칭) 또는 유도성 프로모터, 예를 들어 천연 메탄올-유도성 프로모터 pAOX1(서열번호: 81) 또는 pAOX2(서열번호: 82), 또는 P. 파스토리스의 임의의 천연 메탄올-유도성 프로모터(예를 들어, 서열번호: 83-96, published by Gasser, Steiger, & Mattanovich, Microb Cell Fact. 2015, 14: 196), 또는 임의의 다른 탄소 공급원 조절가능한 프로모터, 예를 들어 pG1-pG8(pG1: 서열번호: 97, pG3: 서열번호: 105, pG4: 서열번호: 106, pG5: 서열번호: 107, pG7: 서열번호: 108, pG8: 서열번호: 109, 및 전술한 임의의 것의 단편, 예를 들어 pG1의 단편, pG1a-pG1f: 서열번호: 110-115), 및 pG1-x, 특히 pG1-3(예를 들어, 서열번호: 98, 예를 들어 pG1-D1240으로 지칭), 또는 pG1-4(예를 들어, 서열번호: 99, 예를 들어, pG1-D1427로 지칭), WO2013050551 및 WO2017021541에 공개, 또는 길이가 적어도 300, 400 또는 500 bp(특히 3'-단부 포함)인 상기 중 임의의 것의 기능적 변이체, 또는 상기 중 임의의 것의 기능적 변이체가 사용될 수 있다.
구체적으로, 본원에 기술된 프로모터의 기능적 변이체는 전장 또는 일부에 걸쳐 적어도 300, 400 또는 500 bp의 길이를 갖는 프로모터 서열의 3'-단부에서 그것이 유래된 프로모터에 대해 80%, 85%, 90%, 95% 또는 100% 서열 동일성 중 적어도 어느 하나를 포함하고, 프로모터 활성이 그것이 유래된 프로모터와 비교하여 개선될 수 있음에도 불구하고, 특히 거의 동일한 프로모터 활성(예를 들어, +/- 50%, 40%, 30%, 20% 또는 10% 중 어느 하나)으로 발현될 폴리뉴클레오티드의 발현을 작동적으로 제어하는 기능을 한다. pG1-3 또는 pG1-4의 특정 기능적 프로모터 변이체는 도 1에 나타낸 바와 같이 적어도 2개의 주요 조절 영역, 및/또는 적어도 2개의 코어 조절 영역, 및/또는 적어도 2개의 T 모티프를 포함하는 것들이다.
적합한 프로모터 서열의 추가 예는 문헌(Prielhofer et al., BMC Syst Biol. 2017. 11(1):123 및 Mattanovich et al., Methods Mol. Biol.(2012) 824:329-58)에 기재되어 있으며, 해당 효소, 예를 들어 트리오세포스페이트 이성질화효소(TPI), 포스포글리세레이트 키나제(PGK), 글리세르알데히드-3-포스페이트 탈수소효소(GAPDH 또는 GAP) 및 이의 변이체, 락타제(LAC) 및 갈락토시다제(GAL), P. 파스토리스 글루코스-6-포스페이트 이성질화효소 프로모터(PPGI), 3-포스포글리세레이트 키나제 프로모터(pPGK), 글리세롤 알데하이드 포스페이트 탈수소효소 프로모터(pGAP), 번역 신장 인자 프로모터(PTEF), 및 P. 파스토리스 에놀라제 1 (pEN01)의 프로모터, 트리오세 포스페이트 이성질화효소(pTPI), 리보솜 서브유닛 단백질(pRPS2, pRPS7, pRPS31, pRPL1), 알코올 옥시다제 프로모터(pAOX1, pAOX2) 또는 변형된 특징을 가진 이의 변이체, 포름알데히드 탈수소효소 프로모터(pFLD), 이소시트레이트 리아제 프로모터(pICL), 알파-케토이소카프로에이트 데카복실라아제 프로모터(pTHI), 열충격 단백질 계열 구성원의 프로모터(pSSA1, pHSP90, pKAR2), 6-포스포글루코네이트 탈수소효소(pGND1), 포스포글리세레이트 뮤타제(pGPM1), 트랜스에톨라제(pTKL1), 포스파티딜이노시톨 신타아제(pPIS1), 페로-02-옥시도리덕타아제(pFET3), 고친화성 철 투과효소(pFTR1), 억제성 알칼리성 포스파타아제(pPH08), N-미리스토일 트랜스퍼라제(pNMT1), 페로몬 반응 전사 인자(pMCM1), 유비퀴틴(pUBI4), 단일-가닥 DNA 엔도뉴클레아제(pRAD2), 미토콘드리아 내막의 주요 ADP/ATP 운반체의 프로모터(pPET9)(WO2008/128701) 및 포메이트 탈수소효소(FMD) 프로모터를 포함한다.
적합한 프로모터의 추가 예는 S. 세레비지애 에놀라제(ENO1), S. 세레비지애 갈락토키나제(GAL1), S. 세레비지애 알코올 탈수소효소 및 S. 세레비지애 글리세르알데하이드-3-포스페이트 탈수소효소(ADH1, ADH2, GAP), S. 세레비지애 트리오세 포스페이트 이성질화효소(TPI), S. 세레비지애 메탈로티오네인(CUP1) 및 S. 세레비지애 3-포스포글리세레이트 키나제(PGK), 및 말타아제 유전자 프로모터(MAL)를 포함한다.
본원에서 사용되는 용어 "뉴클레오티드 서열" 또는 "핵산 서열"은 DNA 또는 RNA를 의미한다. "핵산 서열" 또는 "폴리뉴클레오티드 서열" 또는 간단히 "폴리뉴클레오티드"는 5'에서 3' 단부으로 판독되는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 또는 이중-가닥 중합체를 지칭한다. 여기에는 발현 카세트, 자가-복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 비-기능성 DNA 또는 RNA가 포함된다.
본원에서 사용되는 용어 "관심 단백질(POI)"은 숙주 세포에서 재조합 기술에 의해 생산되는 폴리펩티드 또는 단백질을 의미한다. 보다 구체적으로, 단백질은 숙주 세포에서 자연적으로 발생하지 않는 폴리펩티드, 즉 이종 단백질일 수 있거나, 그렇지 않으면 숙주 세포에 자연적일 수 있고, 즉 숙주 세포에 대한 상동 단백질일 수 있지만, 예를 들어, POI를 코딩하는 핵산 서열을 함유하는 자가-복제 벡터로 형질전환 또는 형질주입에 의해, 또는 POI를 코딩하는 핵산 서열의 하나 이상의 카피를 재조합 기술에 의해 숙주 세포의 게놈으로 통합하거나, POI를 코딩하는 유전자, 예를 들어 프로모터 서열의 발현을 제어하는 하나 이상의 조절 서열의 재조합 변형에 의해 생성된다. 일부 경우에, 본원에서 사용되는 용어 POI는 또한 재조합적으로 발현된 단백질에 의해 매개되는 숙주 세포에 의한 임의의 대사 생성물을 지칭한다.
모 뉴클레오티드 또는 아미노산 서열과 비교하여 변이체, 상동체 또는 오르토로그의 "서열 동일성"이라는 용어는 2개 이상의 서열의 동일성 정도를 나타낸다. 2개 이상의 아미노산 서열은 상응하는 위치에서 동일하거나 보존된 아미노산 잔기를 어느 정도, 최대 100% 가질 수 있다. 2개 이상의 뉴클레오티드 서열은 상응하는 위치에서 어느 정도, 최대 100%까지 동일하거나 보존된 염기쌍을 가질 수 있다.
서열 유사성 검색은 초과(예를 들어, 50% 이상) 서열 동일성을 가진 상동체를 식별하기 위한 효과적이고 신뢰할 수 있는 전략이다. 자주 사용되는 서열 유사성 검색 도구는, 예를 들어 BLAST, FASTA 및 HMMER이다.
서열 유사성 검색은 과도한 유사성 및 공통 조상을 반영하는 통계적으로 유의미한 유사성을 감지하여 이러한 상동 단백질 또는 유전자를 식별할 수 있다. 상동체는 본원에서 상이한 유기체, 예를 들어 상이한 상이한 유기체 또는 종에서의 이러한 단백질의 변이체에서 동일한 단백질로 이해되는 오르토로그를 포함할 수 있다.
본원에 기술된 아미노산 서열, 상동체 및 오르토로그에 대한 "퍼센트(%) 아미노산 서열 동일성"은 서열을 정렬하고, 필요한 경우 갭을 도입하여 최대 퍼센트 서열 동일성을 달성하고 임의의 보존적 치환을 서열 동일성의 일부로 고려하지 않은 후, 특정 폴리펩티드 서열에서 아미노산 잔기와 동일한 후보 서열에서 아미노산 잔기의 백분율로 정의된다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.
본원에 기재된 목적을 위해, 2개의 아미노산 서열 사이의 서열 동일성은 하기 예시적인 매개변수와 함께 NCBI BLAST 프로그램 버전 BLASTP 2.8.1을 사용하여 결정된다: 프로그램: blastp, 단어 크기: 6, 예상 값: 10, 히트리스트 크기: 100, 갭코스트: 11.1, 매트릭스: BLOSUM62, 필터 스트링: F, 구성 조정: 조건부 구성 점수 매트릭스 조정.
전체 길이에 따른 2개의 아미노산 서열의 쌍별 단백질 서열 정렬을 위해 EMBOSS Needle 웹서버(https://www.ebi.ac.uk/Tools/psa/emboss_needle/)를 기본 설정(Matrix: EBLOSUM62; Gap open:10; Gap extend: 0.5; End Gap Penalty: false; End Gap Open: 10; End Gap Extend: 0.5)으로 사용했다. EMBOSS Needle은 니들맨-분쉬(Needleman-Wunsch) 정렬 알고리즘을 사용하여 두 입력 서열의 최적 정렬(갭 포함)을 찾고 최적의 전체 서열 정렬을 파일에 기록한다.
예를 들어, 프로모터 또는 유전자의 뉴클레오티드 서열에 대한 "퍼센트(%) 동일성"은 서열을 정렬한 후, 필요한 경우 최대 퍼센트 서열 동일성을 달성하기 위해 갭을 도입하고, 서열 동일성의 일부로서 임의의 보존적 치환을 고려하지 않고DNA 서열에서 뉴클레오티드와 동일한 후보 DNA 서열에서 뉴클레오티드 백분율로 정의된다. 뉴클레오티드 서열 퍼센트 동일성을 결정하기 위한 목적을 위한 정렬은, 예를 들어 공개적으로 이용가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 범위 내에서 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.
본원에 기술된 목적을 위해(다르게 나타내지 않는 한), 2개의 아미노산 서열 사이의 서열 동일성은 NCBI BLAST 프로그램 버전 BLASTN 2.8.1을 사용하여 다음의 예시적인 매개변수와 함께 결정된다: 프로그램: blastn, 단어 크기: 11, 예상 임계값: 10, 히트리스트 크기: 100, 갭 코스트: 5.2, 일치/불일치 점수: 2,-3, 필터 스트링: 낮은 복잡성 영역, 조회 표 전용으로 표시.
POI와 관련하여 본원에서 사용되는 용어 "분리된" 또는 "분리"는 POI가 자연적으로 연관될 환경, 특히 세포 배양 상청액으로부터 충분히 분리되어 "정제된" 또는 "실질적으로 순수한" 형태로 존재하는 그러한 화합물을 지칭할 것이다. 그러나 "분리된"은 반드시 다른 화합물 또는 물질을 갖는 인공 또는 합성 혼합물의 배제 또는 기본 활성을 방해하지 않고, 예를 들어 불완전한 정제로 인해 존재할 수 있는 불순물의 존재의 배제를 의미하지는 않는다. 분리된 화합물은 이의 제제를 생산하기 위해 추가로 제형화될 수 있고, 여전히 실용적인 목적을 위해 분리될 수 있다 - 예를 들어, POI는 진단 또는 치료에 사용될 때 약제학적으로 허용되는 담체 또는 부형제와 혼합될 수 있다.
본원에 사용된 용어 "정제된"은 적어도 50%(mol/mol), 바람직하게는 적어도 60%, 70%, 80%, 90% 또는 95%의 화합물(예를 들어, POI)을 포함하는 제제를 의미할 것이다. 순도는 화합물에 대해 적합한 방법(예를 들어, 크로마토그래피 방법, 폴리아크릴아미드 겔 전기영동, HPLC 분석 등)에 의해 측정된다. 불순물을 감소시키기 위해 세포 배양 상청액을 정제함으로써 본원에 기술된 바와 같이 분리되고 정제된 POI를 수득할 수 있다.
재조합 폴리펩티드 또는 단백질 생성물을 얻기 위한 분리 및 정제 방법으로서, 염석 및 용매 침전과 같은 용해도 차이를 이용하는 방법, 한외여과 및 겔 전기영동과 같은 분자량 차이를 이용하는 방법, 이온-교환 크로마토그래피와 같은 전하를 이용하는 방법, 친화성 크로마토그래피와 같이 특이적 친화성을 이용하는 방법, 역상 고성능 액체 크로마토그래피와 같이 소수성 차이를 이용하는 방법, 및 등전점 포커싱과 같이 등전점의 차이를 이용하는 방법을 사용할 수 있다.
다음과 같은 표준 방법이 선호된다: 정밀여과 또는 접선 흐름 필터(Tangential Flow Filter, TFF) 또는 원심분리에 의한 세포(파편) 분리 및 세척, 침전 또는 열처리에 의한 POI 정제, 효소 다이제스트에 의한 POI 활성화, 이온 교환(IEX), 소수성 상호작용 크로마토그래피(HIC), 친화성 크로마토그래피, 크기 배제(SEC) 또는 HPLC 크로마토그래피과 같은 크로마토그래피에 의한 POI 정제, 한외여과 단계 같은 POI 침전, 농축 및 세척.
고도로 정제된 생성물은 본질적으로 오염 단백질이 없고 바람직하게는 순도가 적어도 90%, 보다 바람직하게는 적어도 95%, 또는 심지어 적어도 98%, 최대 100%이다. 정제된 생성물은 세포 배양 상청액 또는 세포 파편으로부터 정제하여 얻을 수 있다.
분리 및 정제된 POI는 웨스턴 블롯, HPLC, 활성 검정 또는 ELISA와 같은 기존 방법으로 식별할 수 있다.
본원에서 사용된 "재조합"이라는 용어는 "유전 공학에 의해 제조되거나 그 결과"를 의미한다. "재조합 세포" 또는 "재조합 숙주 세포"는 본원에서 상기 세포에 자연적이지 않은 핵산 서열을 포함하도록 유전자 조작되거나 변형된 세포 또는 숙주 세포로 이해된다. 재조합 숙주는 하나 이상의 뉴클레오티드 또는 뉴클레오티드 서열을 결실 및/또는 불활성화하도록 조작될 수 있으며, 특히 숙주에 대해 외래인 뉴클레오티드 서열을 사용하는 재조합 핵산 서열을 함유하는 발현 벡터 또는 클로닝 벡터를 구체적으로 포함할 수 있다. 재조합 단백질은 각각의 재조합 핵산을 숙주에서 발현시켜 생산된다. 본원에서 사용되는 POI와 관련하여 용어 "재조합"은 재조합 수단에 의해 제조, 발현, 생성 또는 분리된 POI, 예를 들어 POI를 발현하도록 형질전환 또는 형질주입된 숙주 세포로부터 분리된 POI를 포함한다. 본 발명에 따르면 종래의 분자 생물학, 미생물학 및 당업계의 기술 내에서 재조합 DNA 기술이 사용될 수 있다. 이러한 기술은 문헌에 충분히 설명되어 있다(Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982)).
특정 재조합 숙주 세포는 유전 공학을 사용하여, 즉 인간 개입에 의해 조작된 숙주 세포로 이해되는 "조작된" 숙주 세포이다. 숙주 세포가 주어진 유전자 또는 각각의 단백질을 발현, 공동-발현 또는 과발현하도록 조작될 때, 숙주 세포는 숙주 세포가 그러한 유전자 및 단백질을 조작 전 동일한 조건 하에서 숙주 세포, 또는 상기 유전자 또는 단백질이 발현, 공동-발현 또는 과발현되도록 조작되지 않은 숙주 세포와 비교하여 각각 더 높은 정도로 발현하는 능력을 갖도록 조작된다. 본원에 기술된 바와 같이, 관심 단백질(POI)의 수율은 동일한 배양 조건 하에서 공동-발현되거나 과발현되는 TIF(들)을 코딩하는 폴리뉴클레오티드가 없거나 TIF(들)를 코딩하는 폴리뉴클레오티드를 공동-발현하거나 과발현하도록 조작되지 않는 동일한 POI를 발현하는 동일한 세포와 비교할 때 본원에 기술된 TIF(들)를 공동-발현 또는 과발현함으로써 증가될 수 있다.
놀랍게도, eIF3의 서브유닛이 아닌 mRNP의 일부인 TIF의 과발현이 여러 재조합 POI의 생산 및 분비를 증가시키는 것으로 밝혀졌다.
본원에 기재된 특정 실시예에 따르면, TIF 과발현은 조작된 세포의 번역 능력을 향상시켰고 또한 더 높은 수준의 POI 전사체 및 내인성 전사체와 상관관계가 있었다.
POI 생산 수율이 eIF4A, eIF4G, eIF4E, PAB1 및 RLI1과 같은 단일 TIF 뿐만 아니라 다양한 배양 방식(스크리닝, 유가 배양 및 연속 배양)에서 이들의 조합의 과발현에 의해 증가되었다는 것은 훨씬 더 놀라운 일이었다.
전술한 설명은 하기 실시예를 참조하여 더욱 완전히 이해될 것이다. 그러나 이러한 예는 본 발명의 하나 이상의 구현양태를 실행하는 방법을 단지 대표할 뿐이며 본 발명의 범위를 제한하는 것으로 해석되어서는 안 된다.
실시예
실시예 1: 번역 인자(TIF) 과발현 균주의 구성
a) 숙주 균주 및 발현 벡터:
P. 파스토리스 균주 CBS7435 또는 CBS2612(CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelcultures, Utrecht, The Netherlands)를 배경 균주로 사용했다. 번역 인자 과발현의 영향을 평가하기 위해, 다양한 분비 모델 단백질을 리포터로 사용했다. 이를 위해 CBS2612_PG1-3_vHH#4(WO2020/144313A1에 기재)를 발현에 사용하였다. 추가 숙주 균주를 생성하기 위해, WO2020144313A1에 기재된 바와 같이 PG1-3_HSA에 대한 발현 카세트를 CBS2612로 형질전환시키고 PG1-3_vHH 발현 카세트를 CBS7435로 형질전환시켰다. MutS PAOX1-vHH(Zavec et al. 2020, Biotechnol Bioeng. 117(5):1394-1405)를 사용하여 메탄올 조건에서 효과를 평가했다.
b) TIF 과발현 벡터의 생성
각각의 발현 카세트를 숙주 균주로 상동 재조합하여 표적을 과발현시켰다. 이를 위한 플라스미드는 두 가지 다른 클로닝 전략을 사용하여 생성되었다. 선택한 표적 번역 인자 표 2와 7에 제시되어 있다.
pPuzzle 기반 발현에 의한
P. 파스토리스
번역 인자 과발현 균주의 구성 및 선택
AOX 종결자 서열(천연 AOX1 종결자 유전자좌에 통합용), 대장균(pUC19)의 복제 기점, 대장균 및 효모에서 선택하기 위한 항생제 저항성 카세트(카나마이신 및 G418에 대한 저항성을 부여하는 kanMX), GAP 프로모터, 다중 클로닝 부위(MCS) 및 S. 세레비지애 CYC1전사 종결자로 이루어진 관심 유전자(GOI)용 발현 카세트로 이루어진 WO2008/128701A2에 기술된 pPuzzle_ZeoR 벡터 백본의 유도체인 pPM2aK21 플라스미드를 사용하였다. 선택된 과발현 유전자는 표 8에 제시된 프라이머를 사용하여 시작부터 정지 코돈까지 PCR(Q5® 고-충실도 DNA 중합효소, New England Biolabs)로 증폭되었다. 서열은 2개의 제한 효소 SbfI 및 SfiI를 갖는 pPM2a 발현 벡터의 MCS로 클로닝되었다. 유전자 서열은 생어(Sanger) 시퀀싱으로 검증하였다.
Golden
Pi
CS 시스템을 이용한
P. 파스토리스
번역 인자 과발현 균주의 구성 및 선택
과발현을 위해 선택된 유전자는 PCR(Q5® 고-충실도 DNA 중합효소, New England Biolabs)에 의해 시작부터 정지 코돈까지 증폭되거나 2개 내지 여러 조각으로 분할되었다. GoldenPiCS 시스템(Prielhofer et al. 2017. BMC Systems Biol. 11, 123, doi: 10.1186/s12918-017-0492-3)은 일부 코딩 서열에서 침묵 돌연변이의 도입을 필요로 한다. 이는 표 3 및 9의 프라이머를 사용하여 하나의 코딩 서열에서 여러 단편을 증폭하여 수행했다. 대안적으로 gBlocks를 수득하였다(Integrated DNA Technology IDT). P. 파스토리스 균주 CBS2612의 게놈 DNA를 PCR 주형으로 사용했다. 표 3 및 표 9의 프라이머로 증폭한 후 생성된 단편을 제한 효소 BsaI을 사용하여 GoldenPiCS 시스템의 BB1에 도입하였다. GoldenPiCS 시스템은 백본 BB1, BB2 및 BB3으로 이루어진다. 각각의 코딩 서열을 운반하는 조립된 BB1은 BB2에서 프로모터 및 종결자 영역과 조합된 다음 문헌(Prielhofer et al. 2017)에 기재된 바와 같이필요한 BB3 통합 플라스미드를 생성하기 위해 추가로 처리된다. BB2 또는 BB3 백본에서 발현 카세트를 조립하는 데 사용되는 모든 프로모터 및 종결자는 문헌(Prielhofer et al. 2017)에 기재되어 있다. 사용된 BB3rN는 누르세오트리신에 대한 선택을 위한 5'-RGI1 게놈 통합 영역 및 NatMX 선택 마커 카세트를 함유한다. 모든 플라스미드는 대장균(pUC19)에 대한 복제 기점을 함유한다.
c) TIF 과발현 형질전환체의 생성
플라스미드는 전기천공 전에 AscI 제한 효소를 사용하여 P. 파스토리스로 선형화되었다(Gasser et al. 2013(Future Microbiol. 8(2):191-208)에 설명된 표준 변환 프로토콜을 사용하여). 양성 형질전환체의 선택은 500 μg mL-1의 G418 또는 100 μg mL-1의 누르세오트리신을 함유하는 YPD 플레이트(리터당: 효모 추출물 10 g, 펩톤 20 g, 글루코스 20 g, 한천 20 g)에서 수행되었다. 콜로니 PCR을 사용하여 올바른 유전자좌에서 형질전환된 플라스미드의 존재를 확인했다. 이를 위해 적절한 프라이머로 PCR에 직접 적용된 0.04 M NaOH에서 P. 파스토리스 콜로니를 쿡킹하여 게놈 DNA를 수득하였다.
d) 과발현 표적의 유전자 카피 수(GCN) 결정
발현 강도는 종종 P. 파스토리스 게놈에 통합된 발현 카세트의 수와 관련이 있다. 따라서, 각각의 과발현 표적의 유전자 카피 수를 결정하였다. 게놈 DNA는 Wizard® 게놈 DNA 정제 키트(Promega Corporation, Cat. No. A1120)를 사용하여 분리되었다. 그런 다음 정량적 실시간 PCR(qPCR)을 사용하여 유전자 카피 수를 결정했다. 이를 위해 Blue S'Green qPCR 키트(Biozym)를 사용하였다. Blue S'Green qPCR 마스터 믹스를 프라이머 및 샘플과 혼합하고 실시간 PCR 사이클러(Rotor Gene, Qiagen)에서 실시간 분석에 적용했다. 사용된 프라이머 목록은 표 1에 나와 있다. 모든 샘플은 삼중으로 분석되었다. 로터 유전자(Rotor Gen) 소프트웨어는 데이터 분석에 사용되었다. 교정기로는 ACT1 유전자를 사용하였다. GCN은 단일 과발현 구성물에 대한 PGAP 프라이머(실시예 4 참조) 및 조합된 과발현 구성물에 대한 TIF2 프라이머(실시예 5 참조)의 사용에 의해 결정되었다. 그 결과를 각각 표 10 및 표 12에 나타내었다. 선택된 과발현 표적이 P. 파스토리스의 내인성 유전자이기 때문에, 2개의 GCN은 하나의 추가 유전자 카피의 성공적인 통합을 보여주고, 유전자 중 하나는 원래 유전자이고 두 번째는 과발현 카세트이다.
표 1: GCN 결정에 사용되는 qPCR 프라이머. ACT1은 교정기로 사용되었다. PGAP는 단일 과발현 구성물에 대한 GCN, 조합된 과발현 구성물에 대한 TIF2를 결정하는 데 사용되었다.
실시예 2: TIF 과발현이 재조합 단백질 생산에 미치는 영향 분석
재조합 단백질 분비에 대한 번역 인자 과발현의 효과를 결정하기 위해, 조작된 과발현 균주를 GOI에 대해 pG-프로모터를 사용할 때 글루코스 제한 조건(Prielhofer et al. 2013. Microb Cell Fact 12, 5) 또는 메탄올-이용 경로에서 유도된 프로모터의 경우 메탄올 유도(Gasser et al. 2015. Microb. Cell Fact 14:196)과 같은 적합한 스크리닝 조건에서 배양하였다. pPuzzle-기반 또는 GoldenPiCS BB3rN-기반 TIF 발현 벡터를 P. 파스토리스 게놈에 통합함으로써 P. 파스토리스 숙주 균주의 조작을 실시예 1에 기재된 바와 같이 수행하였다. 이어서 조작된 P. 파스토리스 균주를 소규모로 배양하여(스크리닝 절차), 유가 배양을 시뮬레이션하였다. 상청액으로 분비된 재조합 단백질을 정량화하고 상이한 조작된 균주의 역가 및 수율을 모 숙주 균주와 비교하였다.
배지: 합성 스크리닝 배지 ASMv6/리터: 6.30 g (NH4)2HPO4, 0.8 g (NH4)2SO4, 0.49 MgSO4*7H2O, 2.64 g KCl, 0.0535 g CaCl2*2H2O, 22.0 g 시트르산 일수화물, 1470 μL PTM0 미량 염 스톡 용액, 20 mL NH4OH (25%), 4 mL 비오틴 (0.1 g L-1). 고체 KOH를 첨가하여 pH를 6.4 - 6.6으로 설정했다.
리터당 PTM0 미량 염 스톡 용액: 5.0 mL H2SO4 (95-98%), 65.0 g FeSO4*7H2O, 20 g ZnCl2, 6.00 g CuSO4*5H2O, 3.36 g MnSO4*H2O, 0.82 g CoCl2*6H2O, 0.20 g Na2MoO4*2H2O, 0.08 g NaI, 0.02 g H3BO3
a) pG-프로모터의 제어 하에 GOI 발현을 갖는 조작된
P. 파스토리스
균주의
스크리닝
모델 단백질 분비의 스크리닝을 위해, PCR 확인된 올바른 유전자좌로 유전자 통합을 갖는 단일 콜로니는 50 μg mL-1 제오신 및 500 μg mL-1 G418 또는 100 μg mL-1 누르세오트리신(적절한 경우) 함유하는 2 mL 액체 YPG 배지(리터당: 20 g 펩톤, 10 g 효모 추출물, 12.6 g 글리세린 100%, pH 7.4- 7.6)에서 접종되었다. 또한, 비교를 위해 각 플레이트에서 숙주 균주를 사중으로 배양하였다. 이 전배양은 280 rpm에서 24-DWP에서 25℃에서 약 24시간 동안 성장되었다. 그런 다음 전배양을 사용하여 2 mL의 합성 스크리닝 배지 ASMv6을 8의 시작-OD600로 접종했다. 배지는 탄소원으로 50 g L-1 다당류(EnPump200 다당류, Enpresso) 및 0.4%의 글루코스-방출 효소(시약 A, Enpresso)를 함유하였다. 배양 조건은 전배양 조건과 유사하였다. 48시간 후, 1 mL의 세포 현탁액을 미리 무게를 잰 1.5 mL 원심분리 튜브에 옮기고 실온에서 5분 동안 16,000 g에서 원심분리했다. 상청액을 새 바이알에 조심스럽게 옮기고 추가 사용 전까지 -20℃에서 보관했다. 펠릿을 함유하는 원심분리 튜브의 중량을 다시 측정하여 습윤 세포 중량(WCW)을 결정했다. 상청액에서 재조합 분비 단백질의 정량화는 하기 기술된 바와 같이 미세유체 모세관 전기영동에 의해 수행되었다.
b) 메탄올-유도성 프로모터의 제어 하에 GOI 발현을 갖는 조작된
P. 파스토
리스
균주의 스크리닝
50 μg mL-1 제오신 및 500 μg mL-1 G418 또는 100 μg mL-1 누르세오트리신(적절한 경우)을 함유하는 2 mL YPD 배지(리터당: 20 g 펩톤, 10 g 효모 추출물, 22 g D(+)-글루코스 일수화물, pH 7.4-7.6)를 P. 파스토리스 클론의 단일 콜로니를 접종하고 280 rpm에서 24-DWP에서 25℃에서 밤새 성장시켰다. 그런 다음 전배양물을 사용하여 2 mL의 합성 스크리닝 배지 ASMv6을 8의 시작-OD600로 접종했다. 배지는 탄소원으로 25 gL-1 다당류(EnPump200 다당류, Enpresso) 및 0.35%의 글루코스-방출 효소(시약 A, Enpresso)을 함유하였다. 이들 배양물을 280 rpm에서 24-DWP에서 25℃에서 48시간 동안 인큐베이션하였다. 처음 3시간 후 세포에 10 μL(0.5%)의 순수 메탄올을 공급했다. 그런 다음 19시간, 27시간 및 43시간 배양 시간 후에 세포에 20 μL(1%) 순수 메탄올을 다시 공급했다. 48시간 후, 1 mL의 세포 현탁액을 미리 무게를 잰 1.5 mL 원심분리 튜브에 옮기고 실온에서 5분 동안 16,000 g에서 원심분리했다. 상청액을 새 바이알에 조심스럽게 옮기고 추가 사용 전까지 -20℃에서 보관했다. 펠릿을 함유하는 원심분리 튜브의 중량을 다시 측정하여 습윤 세포 중량(WCW)을 결정했다. 상청액에서 재조합 분비 단백질의 정량화는 하기 기술된 바와 같이 미세유체 모세관 전기영동에 의해 수행되었다.
c) 미세유체 모세관 전기영동(mCE)에 의한 분비된 재조합 단백질의 정량화
'LabChip GX/GXII 시스템'(PerkinElmer)은 배양 상층액에서 분비 단백질 역가를 정량 분석하는 데 사용되었다. 소모품은 '단백질 익스프레스 랩 칩'(760499, PerkinElmer)과 '단백질 익스프레스 시약 키트'(CLS960008, PerkinElmer)를 사용하였다. 제조업체의 권장 사항에 따라 칩 및 샘플 제조를 수행했다. 절차에 대한 간략한 설명은 다음과 같다.
칩 제조: 시약이 실온에 도달한 후, 520 및 280 μL의 단백질 익스프레스 겔 매트릭스를 스핀 필터로 옮겼다. 20 μL의 단백질 익스프레스 염료 용액을 스핀 필터가 함유된 520 μL 겔 매트릭스에 첨가했다. 스핀 필터를 함유하는 염료를 역방향으로 잠시 와동시킨 후, 두 스핀 필터를 모두 9300 g에서 10분 동안 원심분리했다. 칩을 세척하기 위해 120 μL Milli-Q® 물을 모든 활성 칩 웰에 첨가하고 칩을 기기 세척 프로그램에 적용했다. Milli-Q® 물로 2번 더 헹구고, 남은 유체를 완전히 흡인하고 적절한 양의 필터링된 겔 매트릭스 용액과 단백질 익스프레스 하위 마커 용액을 적절한 칩 웰에 첨가했다.
샘플 및 래더 제조: 샘플 제조를 위해 6 μL 샘플을 96-마이크로타이터 플레이트에서 21 μL의 샘플 완충액과 혼합했다. 샘플을 100℃에서 5분 동안 변성시키고 1,200 g에서 2분 동안 원심분리하였다. 그 후 Milli-Q® 물 105 μL를 첨가했다. 샘플 용액을 피펫으로 간단히 혼합하고 측정 전에 다시 1,200 g에서 2분 동안 원심분리했다. 래더를 제조하기 위해, 단백질 익스프레스 래더(Protein Express Ladder) 12 μL를 PCR 튜브에서 100℃에서 5분 동안 변성시켰다. 이어서 Milli-Q® 물 120 μL를 첨가하고 래더 용액을 잠시 와류시킨 후 미니원심분리기에서 15초 동안 튜브를 회전시키고 측정을 시작했다.
제조업체에서 제공한 LabChip 소프트웨어를 사용하고 BSA 표준과 비교하여 정량화를 수행했다.
실시예 3:
P. 파스토리스
에서 재조합 단백질 분비에 대한 번역 개시 인자 3(eIF3) 서브유닛 과발현의 효과.
첫째, 번역 개시 인자 3의 서브유닛인 eIF3이 과발현되었다. 이 인자는 효모에서 6개의 서브유닛으로 구성되며, 자체적으로 그리고 다른 조합으로 과발현되었다. 과발현을 위해, eIF3 서브유닛을 GoldenPiCS 벡터로 클로닝하고 실시예 1에 기재된 바와 같이 숙주 균주 CBS2612 PG1-3 vHH#4로 형질전환시켰다. 그런 다음 조작된 균주를 실시예 2에 기재된 바와 같이 스크리닝하고 수율을 숙주 균주와 비교하였다.
a) eIF3의 단일 서브유닛의 과발현.
표 2에 나타낸 eIF3의 서브유닛을 표 3에 나타낸 프라이머를 사용하여 증폭하고 실시예 1에 기재된 바와 같이 숙주 균주 CBS2612 PG1-3 vHH#4로 클로닝하였다. eIF3a에 대한 과발현 벡터는 수득되지 않았다.
표 2: 선택된 과발현 표적. 주어진 모든 유전자는 효모에서 eIF3의 서브유닛인 것으로 알려져 있다.
표 3: eIF3 서브유닛의 클로닝에 사용되는 프라이머.
표 4는 eIF3 서브유닛의 단일 과발현 결과를 보여준다. 각각의 표적 유전자는 약 10배의 과발현을 달성하기 위해 상이한 프로모터로 과발현되었다. 이러한 대략적인 과발현 강도는 OE 열에 표시되어 있으며 실시예 4a에 설명된 대로 계산되었다. 스크리닝 결과는 숙주 균주와 비교하여 vHH 수율의 배수 변화로 표시된다. 표 4의 결과는 단일 eIF3 서브유닛의 과발현이 피치아 파스토리스에서 재조합 단백질 분비에 영향을 미치지 않는다는 것을 명확하게 보여준다(조작된 균주와 대조군 사이의 vHH 수율의 배수 변화는 모두 약 1이며, 이는 조작된 균주와 모 대조군 균주 사이의 단백질 생산에 차이가 없음을 의미한다). 이것은 문헌(Roobol et al., Metabolic Engineering 2020, 59:98-105)이 포유류 HEK 및 CHO 세포주에서 eIF3i 및 eIF3v 서브유닛의 일시적이고 안정적인 과발현 시 성장 속도 증가 및 단백질 합성 능력 증가를 보고했기 때문에 예상치 못한 것이다.
표 4: 균주 CBS2612 PG1-3 vHH #4에서 번역 개시 인자 eIF3 서브유닛의 단일 과발현. FC vHH 수율 열은 숙주 균주와 비교하여 vHH 수율의 배수 변화를 보여준다.
a) eIF3 서브유닛 조합의 과발현.
다음으로, 표 5에 기재된 바와 같이 과발현을 위해 eIF3 서브유닛의 상이한 조합을 선택하였다. 실시예 1에 기재된 바와 같이 클로닝 및 형질전환을 수행하였고 생성된 균주를 실시예 2에 기재된 바와 같이 스크리닝하였다. 실시예 4a에 기재된 바와 같이 네이티브 균주와 동일하게 세포 내 전사체 농도 비율을 유지하기 위해 프로모터를 선택하였다. OE 열럼은 계산된 과발현 강도를 보여준다.
표 5: 선택된 프로모터와 함께 표시되는 eIF3에 대한 선택된 조합의 과발현. OE는 문헌(Rebnegger et al. 2014. Biotech J. 9(4):511-25)으로부터 유전자 발현 데이터에 따라 모 균주와 비교하여 조작된 균주에서 TIF 전사 수준의 추정된 증가를 보여준다. CBS2612 PG1-3 vHH #4를 숙주 균주로 사용하였다.
표 6: 균주 CBS2612 PG1-3 vHH #4에서 eIF3 서브유닛의 조합된 과발현. FC 수율은 분비된 vHH 수율의 배수 변화이다.
표 6은 숙주 균주와 비교하여 vHH 수율의 배수 변화를 보여준다. eIF3의 여러 서브유닛을 과발현하는 조합조차도 스크리닝에서 vHH 생산을 증가시키지 않았다. 실시예 3a에서와 같이, 배수 변화 값은 모두 약 1이며, 이는 eIF3 서브유닛이 단독으로 또는 조합으로 과발현될 때 재조합 단백질 분비의 유의한 증가가 없음을 의미한다.
실시예 4: mRNP의 단일 TIF의 과발현이 재조합 단백질 생산에 미치는 영향
번역 개시에 작용하고 mRNP 및 폐쇄 루프 복합체의 일부인 번역 인자를 과발현 목적을 위해 선택하였다: eIF4A, eIF4E, eIF4G, PAB1 및 RLI1(표 7) 및 과발현 벡터를 하기 표 8 및 9 에 제시된 프라이머를 사용하여 실시예 1b에서와 같이 구성하였다. CBS2612_PG1-3_vHH#4(WO2020/144313A1에 기재)를 모 숙주 균주로 사용하고 실시예 1에 기재된 단일 TIF 과발현 벡터로 형질전환하였다.
표 7: 과발현을 위해 선택된 번역 개시 인자(TIF)
a) 단일 OE 벡터 생성 및 OE 강도 결정
표 8: pPuzzle 기반 발현에 의한 P. 파스토리스 번역 인자 과발현 균주의 구성에 사용되는 프라이머. 각각의 유전자의 시작 및 정지 코돈은 이탤릭체 및 굵게 표시된다.
표 9: GoldenPiCS 시스템을 갖는 P. 파스토리스 번역 인자 과발현 균주의 구성에 사용되는 프라이머. BsaI 제한 부위는 밑줄로 표시된다. 각각의 유전자의 시작 및 정지 코돈은 이탤릭체 및 굵게 표시된다. 침묵 돌연변이는 굵게 표시되고 밑줄이 그어져 있다.
기술된 모든 단일 TIF 과발현에 대해 강력하고 구성적인 pGAP 프로모터가 사용되었고 TIF 발현 카세트는 5'-RGI1 유전자좌 또는 AOX1 전사 종결자에 통합되었다. 문헌(Rebnegger et al. 2014. Biotech J. 9(4):511-25)에 기술된 유전자 발현 데이터를 기반으로, 선택된 프로모터로 예상되는 과발현 정도를 계산하였다. 모 균주와 비교하여 발현 강도의 추정된 증가는 표 10에서 "OE" 열에 제시되어 있다.
표 10은 또한 선택된 클론의 측정된 GCN과 스크리닝 절차의 결과를 보여준다. 표 10에 나타낸 모든 클론은 각각의 TIF 유전자의 하나의 추가 카피를 함유했다(GCN = 2로 표시).
b) 리포터로서 pG1-3의 제어 하에 vHH를 사용한 재조합 단백질 생산에 대한 단일 TIF 과발현의 효과
균주를 실시예 2a에 기술된 바와 같이 배양하고 분비된 vHH 역가를 mCE에 의해 배양 48시간 후에 결정하였다(실시예 2c). 각 클론에 대해 역가(mg vHH L-1), WCW(g L-1) 및 바이오매스 특이적 생성물 수율(mg vHH g-1 WCW)을 계산한 다음 하나의 인자를 과발현하는 모든 클론과 모 균주의 복제물에 대해 평균을 냈다. 동일한 24-DWP에서 배양된 모 숙주 균주의 평균과 비교하여 역가 및 수율의 배수 변화(FC)를 결정하였다.
표 10: 균주 CBS2612 PG1-3 vHH #4에서 재조합 단백질 생산에 대한 번역 개시 인자의 단일 과발현의 효과. FC vHH 수율은 분비된 vHH 수율의 배수 변화이다. 표시된 결과는 스크리닝 배양 48시간 후에 측정되었다. OE는 모 균주와 비교하여 조작된 균주에서 TIF 전사체 수준의 추정된 증가를 보여준다.
예상외로, mRNP의 선택된 TIF의 단일 과발현조차도 재조합 단백질 생산 및 분비를 분명히 증가시켰다(표 10). 가장 높은 개선은 TIF4632(eIF4G) 및 PAB1 과발현에서 볼 수 있으며, 둘 다 재조합 단백질 분비를 약 2.0배 증가시켰다.
실시예 5: 재조합 단백질 분비에 대한 mRNP의 TIF 조합의 과발현 효과.
복합체에서 여러 번역 개시 인자를 과발현시키는 효과가 있는지 분석하기 위하여, 실시예 4에서 테스트한 번역 인자의 다양한 조합을 선택하여 재조합 단백질 생산에 미치는 영향을 비교하였다. 이 조합 조작은 실시예 1b에 설명된 대로 GoldenPiCS 툴박스를 사용하여 수행되었다. 생성된 플라스미드를 숙주 균주 CBS2612 PG1-3 vHH #4로 형질전환시켰다. 이어서 조작된 P. 파스토리스 균주를 실시예 2에 기재된 바와 같이 소규모로 배양하였다. 상청액으로 분비된 단백질을 실시예 2c에서와 같이 측정하고 상이한 조작된 균주의 역가 및 수율을 모 숙주와 비교하였다.
a) 번역 개시 인자 과발현에 대한 생성된 조합.
표 11에 기재된 상이한 조합 과발현을 테스트하였다. 설명된 프로모터는 각 유전자를 약 10배 과발현하도록 선택되었다. 이것은 세포에서 상이한 표적 유전자의 전사체 농도 비율의 균형을 맞추기 위해 수행되었다. 그러나, 또한 표 10에서 볼 수 있는 바와 같이 여전히 재조합 단백질 생산의 증가를 야기하는 더 강하거나 더 약한 과발현이 선택될 수 있었다.
표 11: 선택된 프로모터와 함께 표시되는 선택된 과발현 조합. OE는 문헌(Rebnegger et al. 2014. Biotech J. 9(4):511-25)으로부터의 유전자 발현 데이터에 따라 모 균주와 비교하여 조작된 균주에서 TIF 전사 수준의 추정된 증가를 보여준다.
a) 재조합 단백질 분비에 대한 조합된 과발현의 효과.
조작된 균주를 스크리닝하고 데이터를 실시예 2에 기재된 바와 같이 분석하였다.
표 12: 균주 CBS2612 PG1-3 vHH #4에서 번역 개시 인자의 조합된 과발현. FC 수율은 분비된 vHH 수율의 배수 변화이다.
표 12는 재조합 단백질 생산에 대한 상이한 TIF 조합의 과발현 효과를 보여준다. 표 12에 제시된 모든 클론은 과발현 카세트가 한 번만 삽입된 것으로 확인되었으며, 이는 GCN이 2임을 의미한다. vHH 수율의 배수 변화는 숙주 균주 CBS2612 PG1-3 vHH #4와 비교하여 나타낸다. 모든 조합이 모체에 비해 증가된 재조합 vHH 분비를 나타내었지만, 조합 C3 및 C13은 분명히 가장 큰 효과를 보인다. C3a 및 C3b는 P. 파스토리스 게놈 서열의 다른 주석에 따라 길이가 다른 TIF2의 다른 버전을 함유한다. TIF2 버전과는 별개로, 두 조합 모두 vHH 수율을 2배 이상 증가시켰다. C3b는 vHH 수율을 2.5배 증가시켰다.
b) 상이한 배경 균주에서 재조합 단백질 분비에 대한 C3b 과발현의 비교.
상이한 배경 균주의 효과를 비교하기 위해 PG1-3_vHH 발현 카세트를 실시예 1a에 기재된 바와 같이 CBS7435로 형질전환시켰다. 이어서, 구성물 C3b를 실시예 1c에 기재된 바와 같이 생성된 CBS7435 PG1-3 vHH 생산 숙주 균주의 게놈에 통합시켰다. 이어서 C3b 과발현의 효과를 실시예 2a에 기재된 바와 같이 스크리닝하고 분비된 vHH 역가를 실시예 2c에 기재된 바와 같이 측정하였다. 비교를 위해, CBS7435 PG1-3 vHH C3b의 9개의 상이한 클론을 스크리닝하고 숙주 균주 CBS7435 PG1-3 vHH의 생물학적 사중반복과 비교하였다.
표 13: 배경 균주 비교의 스크리닝 결과. vHH 수율의 배수 변화는 숙주 균주와 비교하여 과발현 구성물에 대해 표시된다.
표 13은 숙주 균주 CBS7435 PG1-3 vHH에서 C3b 과발현의 vHH 수율의 배수 변화를 보여준다. 이들 결과는 배경 균주의 선택과 무관하게, 재조합 vHH 분비에 대한 강력한 유익한 효과가 C3b 과발현을 갖는 모든 균주에서 볼 수 있음을 보여준다.
c) 메탄올 유도성 재조합 단백질 분비에 대한 TIF 과발현의 효과.
메탄올 유도성 재조합 단백질 분비에 대한 C3B 과발현의 효과를 결정하기 위해, PAOX1-vHH 발현 카세트(Zavec et al. 2020, Biotechnol Bioeng. 117(5): 1394-1405)를 함유하는 CBS7435 MutS는 C3b 과발현에 대한 숙주 균주로 사용되었다. PAOX1 유도에 대한 메탄올 샷을 사용하여 실시 예 2b에 기술된 바와 같이 균주를 스크리닝하고, 단백질 역가를 실시예 2c에 기재된 바와 같이 측정하였다.
10개의 C3b 과발현 클론을 갖는 스크리닝은 모 균주와 비교하여 vHH 수율의 1.39 ± 0.05배 평균 증가를 나타냈다. 이것은 적용된 탄소 공급원 또는 프로모터 시스템에 관계없이 TIF 과발현으로 재조합 단백질 분비의 증가가 달성될 수 있음을 확인시켜 준다.
실시예 6: 세포 과정에 대한 번역 개시 인자 과발현의 영향의 특성.
재조합 단백질 분비에서 관찰된 차이에 추가로 번역 개시 인자 과발현시 어떤 세포 과정이 영향을 받는지 평가하기 위해, 두 가지 다른 접근법이 따랐다: 한편으로, 전사체 풍부에 대한 잠재적 영향을 결정하기 위해 유전자 전사체 수준을 측정하였다 (실시예 6a). 한편, 세포 번역 활성은 에서 푸로 마이신 기반 방법 (실시 예 6B)을 설정 한 후 직접 측정되었다.한편, 세포 번역 활성은 P. 파스토리스에서 푸로마이신 기반 방법 (실시예 6b)을 설정한 후 직접 측정되었다.
a) 전사 수준의 비교 측정을 위한 스파이크-인 방법.
먼저, 균주를 실시예 2에 기술된 바와 같이 30시간 동안 24-DWP 스크리닝 절차에서 배양하였다. 이것은 수확 시점에서 약 0.025 h-1의 성장률에 해당한다. 1 mL의 배양물을 수확하고 4℃에서 16,000 g에서 5분 동안 원심분리하였다. 상청액을 폐기하고 펠렛을 추가로 사용하기 전까지 -80℃로 저장하였다.
일반적인 하우스키핑 유전자에 대한 전사체 농도의 잠재적 변화를 측정할 수 있으려면 펠렛을 PBS에 용해시키고 WCW에 따라 각 샘플에서 동일한 양의 효모 질량을 갖도록 다시 펠릿으로 하였다. 이어서, 각각의 펠렛은 1 mL의 S. 세래비지애 S288c 현탁액(단일 쉐이크 플라스크 배양의 분취량)으로 스파이크되었다. 생성된 혼합 P. 파스토리스 - S. 세래비지애 펠렛을 RNA 분리에 사용하였다.
RNA 분리의 경우 1 mL의 TRI 시약(Sigma-Aldrich) 및 500 μL 산 세척된 유리 비드를 세포에 첨가한 다음, 속도 5.5 m/s에서 40초 동안 FastPrep-24(mpbio)에서 파괴하였다. 그 후, 200 μL의 클로로포름을 첨가하였다. 이어서, 샘플을 격렬하게 진탕하고 실온에서 5-10 분 동안 정치시켰다. 상 분리를 촉진하기위해 16,000 g 및 4℃에서 10분 동안 원심분리한 후, RNA를 함유하는 상부 무색 수성상을 신선한 튜브로 옮기고 500 μL의 이소프로판올을 첨가하여 RNA를 침전시켰다. 10분의 인큐베이션 후 샘플을 16,000 g 및 4℃에서 10분 동안 원심분리하고 상청액을 폐기하였다. RNA 펠렛을 70% 에탄올로 한 번 세척하고, 공기-건조시키고, RNase 무함유 물에서 재현탁시켰다.
잔류 DNA를 제거하기 위해, 제조업체의 매뉴얼에 따라 DNA-Free™-키트(Ambion)로 RNA 샘플을 처리하였다. 이어서, RNA 품질, 순도 및 농도는 나노드롭(Nanodrop) 2000 (Thermo Scientific)을 사용하여 겔 전기영동 및 분광광도 분석에 의해 분석되었다.
cDNA의 합성은 제조업체의 매뉴얼에 따라 Biozym cDNA 합성 키트로 수행하였다. 간략하게, 1 μg의 총 RNA를 역전사 효소, dNTP, RNase 억제제 및 합성 완충제를 함유하는 마스터 믹스에 첨가하였다. 프라이밍 올리고로서 d(T) 23 VN(NEB)이 사용되었다. 반응 혼합물의 인큐베이션을 55℃에서 45분 동안 수행하였다. 이어서, 효소의 불활성화는 99℃에서 5분 동안 반응 혼합물을 인큐베이션함으로써 달성되었다.
정량적 실시간 PCR(QPCR)에서 P. 파스토리스 ACT1, TDH3 및 vHH 특이적 프라이머가 사용되었다(표 14 참조). 정규화는 S. 세래비지애 ACT1 발현 수준과 비교하여 수행되었다(표 14 참조). 조작된 균주의 전사체 수준을 숙주 균주 전사체 수준과 비교하였다. ACT1 프라이머의 두 세트를 테스트하고 원하는 유기체의 cDNA에만 결합하도록 검증되었다. qPCR에서 1 μL의 cDNA, 물 및 프라이머를 Blue S'Green qPCR 마스터 믹스(Biozym)와 혼합하고 실시간 PCR 사이클러(Rotor-Gene, Qiagen)에서 분석하였다. 모든 샘플은 기술적 삼중으로 측정되었다. 비교 정량(QC) 방법을 사용하는 로터-유전자 소프트웨어로 데이터 분석을 수행하였다.
표 14 : 전사체 분석을 위한 정량적 실시간 PCR 프라이머
b) 전사체 풍부에 대한 TIF 과발현의 영향
표 15에 도시된 TIF 과발현 균주 및 호스트 균주, CBS2612 PG1-3 vHH #4는 3 중으로 실시예 2a에 기술된 바와 같이 30시간 동안 24-DWP 스크리닝 절차에서 배양되었다. 2개의 내인성 유전자 및 재조합 GOI의 전사체 풍부는 실시예 6a에 기술 된 바와 같이 결정되었다.
표 15는 전사체 수준 측정의 수득된 결과를 보여준다. 측정은 vHH의 전사체 수준이 TIF 과발현에 의해 크게 영향을 받음을 보여준다. 실시예 4 및 5에서 이미 더 높은 재조합 단백질 분비를 보여주는 과발현 조합에 대해 특히 높은 값을 볼 수있다. C3b를 과발현하는 균주에서 가장 높은 전사 수준이 발견되었다. 이 과발현은 vHH 전사체 수준을 5.5배 증가시켰다. 놀랍게도, TDH3의 발현은 모든 과발현 균주에서도 증가되는 것으로 보이지만, ACT1의 발현은 특히 조합된 과발현 균주에서 증가된 것으로 보인다. 하우스키핑 유전자, ACT1 및 TDH3 모두에 대한 전사 수준의 증가는 세포 내의 모든 전사체의 증가를 나타낸다. 이러한 결과는 TIF 과발현이 세포 mRNA 수준에 대한 양성 및/또는 안정화 효과를 갖는데, 이는 하나의 인자가 생산성을 증가시킬 수 있음을 나타낸다.
표 15 : 숙주 균주와 비교하여 상이한 과발현 균주의 상대적인 전사체 수준. 실시예 2a에 기술된 스크리닝 배양의 30시간 후에 측정을 수행하였다.
c) 전반적인 번역 활성 측정.
O-프로파길 표지된 퓨로마이신으로 전체 번역 활성의 측정은 효모 세포에서 사용하기 위한 절차를 최적화한 후 문헌(Nagelreiter et al. 2018. Biotechnol J 13, e1700492)과 유사하게 수행하였다. 간략하게, 실시예 6a에서와 동일한 배양으로부터의 세포를 90 μL "인큐베이션 용액"에서 0.4의 단부-OD600을 갖는 96-웰 마이크로타이터 플레이트로 피펫팅하였다. "인큐베이션 용액"은 10% DMSO 및 PBS(2 mM KH2PO4, 10 mM Na2HPO4.2H2O, 2.7 mM g KCl, 8 mM NaCl, pH 7.4) 및 1.5 g L-1 이미프라민에 용해된 0.6 mM O-프로파길 퓨로마이신(Jena Bioscience, NU-931-05)을 포함하는 ASMv6 배지(실시예 2 참조)로 구성되었다. 현탁액을 진탕기에서 25℃에서 2시간 동안 인큐베이션하고, 얼음처럼 차가운 에펜도르프 튜브로 옮기고 4℃에서 5분 동안 16,000 g에서 원심분리했다. 펠렛화된 세포를 120 μL PBS로 세척한 후, 다시 펠렛화된 세포를 1 mL의 얼음처럼 차가운 70% 에탄올로 고정시켰다. 이 고정 샘플은 4℃에서 1일에서 2주 사이에 보관되었다.
클릭 화학 반응을 위해, 고정된 샘플을 16,000 g 및 4℃에서 5분 동안 원심분리하여 수확했다. 펠릿을 96-웰 마이크로타이터 플레이트로 옮기고 100 μL "클릭 화학 완충액"(115 mM 트리스/HCl pH=8.5, 0.1% 트리톤 X-100)으로 세척했다. 그런 다음 샘플을 "클릭 화학 믹스"(101 mM Click-it Click Chemistry Buffer, 1.9 mM CuSO4, 1.9 mg/mL 아스코르브 산, 20 μM Alexa Fluor™ 488 아지드(Invitrogen))에서 실온에서 30분 동안 배양했다. 그 후, 이전과 같이 세포를 수확하고, 150 μL PBS로 세척하고 150 μL 신선한 PBS에 용해시켰다. 생성된 형광 강도를 측정하기 위해, 세포를 여기 파장 488 nm 및 방출 파장 525 nm의 유세포 분석기로 분석했다. 각 샘플에 대해 40,000개의 이벤트가 측정되었다. 데이터 분석을 위해, 각 샘플의 기하 평균을 사용하고 각 샘플에서 블랭크(O-프로파길 퓨로마이신 첨가 없이 처리된 세포)를 차감했다.
d) 전체 세포 번역에 대한 TIF 과발현의 영향
표 16은 숙주 균주 CBS2612 PG1-3 vHH #4와 비교하여, 수득된 형광 값의 배수 변화, 따라서 전체 번역 활성의 평균 배수 변화를 보여준다. 번역 활성의 측정을 위해, 표 15에 나타낸 것과 동일한 클론을 사용하였다. 실시예 6c에 기술된 바와 같이 번역 활성을 결정하였다.
표 16: 숙주 균주 CBS2612 PG1-3 vHH#4(1.0으로 설정)에 대한 TIF 과발현 균주의 번역 활성. 실시예 2a에 기술된 스크리닝 배양 30시간 후에 측정을 수행하였다.
표 16은 단일 번역 개시 인자의 과발현이 각 세포에서 향상된 번역 활성으로 이어짐을 명확하게 보여준다. 선택된 TIF 조합의 과발현은 번역 활성의 훨씬 더 강력한 증가를 보여준다. 이것은 또한 이들 균주에서 관찰된 증가된 재조합 단백질 분비에 의해 반영된다(실시예 4 및 5). 숙주 균주보다 2.3배 더 높은 가장 높은 번역 활성은 C3b를 과발현함으로써 달성될 수 있었다. 이러한 결과는 선택된 번역 개시 인자 또는 이들의 조합의 과발현이 재조합 단백질과 같은 특정 단백질의 번역 뿐만 아니라 전체 세포 번역 활성을 증가시킨다는 것을 보여준다. 놀랍게도, vHH 수율의 개선(표 10 및 12)과 상대적 번역 활성(상관 계수 R2=0.84) 사이에 명확한 상관관계가 있으며, 이는 번역 개시 동안 mRNP의 형성이 재조합 단백질 생산에 대한 속도-제한 단계임을 나타낸다.
실시예 7: 유가 배양에서 번역 인자 과발현의 효과.
스크리닝에서 이루어진 관찰을 추가로 검증하기 위해, 표준 생산 공정과 유사한 유가 배양을 선택된 과발현 표적으로 수행했다.
a) 유가 배양에서 vHH 생산에 대한 TIF 과발현의 효과:
이 실시예에서는 C3b 또는 RLI1을 과발현하는 CBS2612_PG1-3_vHH#4가 배양을 위해 선택되었다. 이들 균주는 스크리닝에서 재조합 단백질 분비에 대해 강력한 유익한 효과를 나타내었다(실시예 4, 5 및 9). 유가 배양의 경우, 동일한 배지를 사용하면서 상이한 공급 프로파일을 적용하여 각각의 샘플링 지점에서 다음과 같이 계산된 성장률을 얻었다(표 17). 배지 구성은 아래에서 확인할 수 있다.
표 17: 유가식에서 상이한 샘플링 지점에서의 성장률.
배지:
리터당 PTM0 미량 염 저장 용액:
5.0 mL H2SO4 (95-98%), 65.0 g FeSO4*7H2O, 20 g ZnCl2, 6.00 g CuSO4*5H2O, 3.0 g MnSO4*H2O, 0.5 g CoCl2*6H2O, 0.20 g Na2MoO4*2H2O, 0.08 g NaI, 0.02 g H3BO3
리터당 함유된 글리세롤 배치 배지:
2 g 시트르산 일수화물(C6H8O7*H2O), 45 g 글리세롤, 12.6 g (NH4)2HPO4, 0.5 g MgSO4*7H2O, 0.9 g KCl, 0.022 g CaCl2*2H2O, 13.2mL 비오틴 스톡 용액(0.1 g L-1) 및 4.6 mL PTM0 미량 염 스톡 용액. HCl(농축)을 첨가하여 pH를 5로 설정하였다.
리터당 함유된 글루코스 공급 배지:
495 g 글루코스 일수화물, 4.6 g MgSO4*7H2O, 8.4 g KCl, 0.28 g CaCl2*2H2O, 23.6 mL 비오틴 스톡 용액(0.1 g L-1) 및 10.1 mL PTM0 미량 염 스톡 용액.
b) 최소 성장률이 0.04 h
-1
에 이르는 선형 공급을 사용한 유가 배양
유가 배양은 1 L 벤치탑 생물반응기(SR0700ODLS; Dasgip, Germany; 반응기 실행 #A-B) 또는 1.8 L 벤치탑 생물반응기(SR1500ODLS; Dasgip, Germany; 반응기 실행 #C)에서 숙주 균주 CBS2612 PG1-3 vHH #4 및 상응하는 과발현 균주 CBS2612 PG1-3 vHH C3b #13, CBS2612 PG1-3 vHH C3b #16 및 CBS2612 PG1-3 vHH PGAP RLI1 #4로 수행되었다. 사전 배양을 위해 1 L 진탕 플라스크에 50 μg mL-1 제오신 및 100 μg mL-1 누르세오트리신(적절한 경우)이 함유된 100 mL YPG 배지를 1.0 mL 냉동스톡(cryostock)으로 접종하고 약 24시간 동안 180 rpm 및 25℃에서 인큐베이션했다. 배치 배양은 0.5 L의 작업 부피에서 작동되었고 1.5의 시작 OD600으로 접종되었다. 글리세롤 배치 배지 조성은 위에 나와 있다. 전체 공정 동안 온도는 30℃로 제어되었고 DO는 교반기 속도(400-1200 rpm 사이) 및 공기 흐름(9.5-30 sL h-1 사이)을 자동으로 조정하여 30%로 유지되었고 pH는 12.5% NH4OH를 자동으로 첨가하여 5.0으로 조절했다. 배치-종료(BE)를 나타내는 DO의 갑작스러운 스파이크 후, 빠른 초기 성장률(μ)을 초래하는 선형 증분 글루코스 공급(위에서 자세히 설명된 배지 조성)에 이어 점진적으로 감소하는 μ의 연장된 기가 적용되었다. 공급의 선형 증가는 F[mL h-1] = 0.1431*t + 2.0499 방정식을 따르도록 설정되었다. 동일한 유가 배양을 두 번 수행하여 얻은 결과를 확인했다.
효모 건조 질량(YDM) 및 분비된 재조합 단백질을 공정 전반에 걸쳐 다양한 시점에서 분석하였다(표 18에 나타냄). YDM 분석을 위해, 1 mL의 배양액을 사전 건조(적어도 24시간 동안 105℃에서)되고 사전 중량을 잰 원심분리 2 mL 튜브로 옮겼다. 16,000 g 및 4℃에서 5분 동안 원심분리한 후 상층액을 조심스럽게 새로운 바이알로 옮기고 추가 사용 전까지 -20℃에서 보관했다. 세포 펠릿을 0.1 M HCl로 두 번 세척하고 무게를 다시 측정하기 전에 최소 24시간 동안 105℃에서 건조했다.
실시예 2c에 기재된 바와 같이 미세유체 모세관 전기영동(GXII, Perkin-Elmer)에 의해 상청액을 분석하였다.
표 18: 2개의 유가 배양 실행, B289-B292 및 C037-C040의 YDM 및 역가 및 수율의 FC를 여기에서 볼 수 있다. 2개 또는 3개의 다른 시점에서 샘플을 채취했다. FC vHH 역가/수율은 동일한 시점에서 숙주 균주 역가/수율과 비교한 과발현 구성물 역가/수율의 배수 변화이다.
표 18에서 TIF의 과발현이 유가 배양에서 바이오매스 농도에 영향을 미치지 않는다는 것을 알 수 있다. 대조적으로, 전체 유가 과정 동안 모 대조군에 비해 생성물 역가 및 수율이 증가하였다. 특히 나중 시점 F20 및 F46에서 RLI1 과발현이 생성물 역가 및 수율에 미치는 분명한 긍정적인 효과를 볼 수 있으며, 발효 종료 시 모 숙주 균주를 2.2배 초과한다. C3b의 과발현은 평균적으로 2.7배 더 높은 생성물 수율 및 역가의 훨씬 더 높은 증가를 가져왔다.
c) 0.02 h
-1
의 최소 성장 속도로 일정한 공급에서 배양.
실시예 7a 및 7b에 기재된 바와 같이 숙주 균주 CBS2612 PG1-3 vHH #4 및 상응하는 과발현 균주 CBS2612 PG1-3 vHH C3 #16 및 CBS2612 PG1-3 vHH PGAP RLI1 #4로 또 다른 유가 배양을 수행하였다. 그러나 이 배양에서는 실시예 7b에 기술된 선형 증분 글루코스 공급 대신에 일정한 글루코스 공급을 적용하는 다른 공급 프로필이 선택되었다. 전체 유가 배양 동안 일정한 공급은 4 mL h-1로 유지되었다. 이것은 초기에 성장률의 더 빠른 감소와 느린 성장에서 더 긴 배양을 초래했다. 위에서 설명한대로 샘플링을 수행했다. YDM 및 상청액에 추가적으로, 1 mL의 세포 현탁액을 수집하고, 펠릿화하고, 전사체 수준 측정을 위해 -80℃에서 냉동시켰다.
표 19: 유가 배양 실행, C041-C044의 YDM 및 역가 및 수율의 FC를 여기에서 볼 수 있다. 샘플은 3개의 다른 시점에서 채취되었다. FC 역가/수율은 동일한 시점에서 숙주 균주 역가/수율과 비교한 과발현 구성물 역가/수율의 배수 변화이다.
표 19는 또한 이러한 공급 전략으로 RLI1 및 C3b 과발현 둘 모두가 동일한 양의 YDM을 생산하면서 숙주 균주에 비해 증가된 생성물 역가 및 수율을 초래하였음을 보여준다. 실시예 7b에서와 같이, C3b 과발현은 평균적으로 4배 더 높은 생산 수율 및 역가에 도달하여 재조합 단백질 생산에 매우 유익한 것으로 입증되었다.
함께, 이것은 단일 TIF 또는 이의 조합의 과발현이 적용된 공급 전략과 독립적으로 재조합 단백질 생산에 강력한 긍정적 영향을 미친다는 것을 나타낸다.
d) 유가식에서 전사체 수준에 대한 번역 인자 과발현의 효과.
실시예 6b에서 보여지는 전사체 풍부에 대한 TIF 과발현의 효과가 또한 유가식으로 세포를 배양할 때 지속되는지를 평가하기 위해, 유가식 실행 C041-C044(실시예 7b)로부터의 샘플에서 PpACT1, vHH 및 TDH3의 전사체 수준을 분석하였다. 실시예 6a에 기재된 바와 같이 절차를 수행하였다. 위에서 설명한 것처럼, 전사 수준은 S. 세레비지애 ACT1에 대해 정규화되었다. 또한 해당 샘플링 지점에서 숙주 균주, 반응기 C041로 정규화되었다. 표 20은 PpACT1, vHH 및 TDH3의 상대적 전사 수준의 배수 변화를 보여준다.
표 20: 2개의 P. 파스토리스 하우스키핑 유전자 ACT1 및 TDH3, 및 분비된 재조합 단백질 vHH의 상대적 전사 수준
RLI1의 과발현은 3개의 분석된 유전자의 전사 수준을 약간 증가시켰지만(나중 시점 F31 및 F54에서 2개의 천연 P. 파스토리스 유전자에 대해 평균 1.2), C3b 과발현은 PpACT1의 경우 최대 1.5배, vHH의 경우 최대 2.9배, TDH3의 경우 최대 2.2배(표 20)까지 증가시켰다. C3b의 vHH 전사 수준 증가는 동일한 유가식 배양에서 보이는 역가의 증가와 상관관계가 있는 것으로 보인다(표 19). 하우스키핑 유전자인 ACT1 및 TDH3 모두에 대한 전사 수준의 증가는 배양 방식과 무관하게 세포 내 모든 전사의 증가를 나타낸다.
e) 메탄올 유도성 재조합 단백질 분비로 유가식 배양.
메탄올 유도가 필요한 클론의 유가식 배양은 문헌(Zavec et al. 2020)에 기재된 바와 같이 MutS 균주에 대한 표준 과정 및 배지에 따라 수행되었다. 사전 배양을 위해, 1 L 진탕 플라스크에 50 μg mL-1 제오신 및 100 μg mL-1 누르세오트리신(적절한 경우)이 함유된 100 mL YPG 배지를 1.0 mL 냉동스톡으로 접종하고 180 rpm 및 25℃에서 약 24시간 동안 인큐베이션했다.
배치 배양은 0.4 L BSM 배지(Mellitzer et al., 2014)의 작업 부피에서 작동되었고 2.5의 시작 OD600으로 접종되었다. 온도는 제어되어 25℃로 유지되었고, DO는 교반기 속도(200-1250 rpm 사이), 공기 흐름(9.5-50sL h-1 사이) 및 산소 보충의 자동 조정에 의해 20%로 유지되었다. 25% NH4OH를 자동으로 첨가하여 pH를 5.0으로 조절했다. 배치-종료(BE)를 나타내는 DO의 갑작스러운 스파이크 후에, 글리세롤 공급에 이어 글리세롤/메탄올 공동-공급이 시작되었다. 선형으로 증가하는(y = 0.225x + 1.95) 글리세롤 공급이 있는 글리세롤 공급(60% w/w + 12 mL/L PTM1)은 8시간 동안 지속되었다. 그런 다음 60% 글리세롤과 100% 메탄올을 18시간 동안 공동-공급했다. 공동-공급에서 60% 글리세롤 공급은 선형으로 감소하고(y = 3.75 - 0.111x) 메탄올 공급은 선형으로 증가했다(y = 0.028x + 0.6). 마지막으로, 메탄올 단독 공급 기에서 선형적으로 증가하는 메탄올 공급(y = 0.028x + 1.10)이 72시간 동안 적용되었다. 샘플링, YDM 결정 및 단백질 정량화를 실시예 7b에 기재된 바와 같이 수행하였다.
표 21: 메탄올-기반 유가식 배양 실행 B365-B368의 YDM, 역가 및 수율의 FC. 샘플은 3개의 상이한 시점에서 채취되었다. 공급 시작 후 시간은 순수 글리세롤 공급 시작 후 시간에 해당한다. FC 역가/수율은 동일한 시점에서 2개의 숙주 균주 역가/수율의 평균과 비교한 과발현 구성물 역가/수율의 배수 변화이다.
표 21은 또한 메탄올-기반 재조합 단백질 생산 전략을 사용할 때, C3b 과발현이 숙주 균주와 비교하여 증가된 생성물 역가 및 수율을 가져왔으며 따라서 명확한 유익한 효과를 나타냄을 보여준다. 증가는 약 1.7배이며 순수 메탄올 공급 개시 직후부터 시작하여 배양이 끝날 때까지 계속된다.
실시예 8: 케모스타트 배양에서 TIF 과발현의 효과.
바이오의약품 생산 분야에서 연속 배양이 더욱 주목을 받고 있어서, C3b 과발현이 재조합 단백질 분비에 미치는 영향도 케모스타트 배양에서 고정 성장률에서 분석하였다. 이 방법은 생산 공정 중 연속 배양 가능성을 제공하고 성장률을 엄격하게 제어할 수 있다.
a) 케모스타트에서 고정 성장률에서 재조합 단백질 분비에 대한 C3b 과발현의 효과.
배지:
리터당 케모스타트용 미량 원소 용액:
15 g EDTA, 4.5 g ZnSO4*7H2O, 1.03 g MnCl2*4H2O, 0.3 CoClo2*6H2O, 0.3g CuSO4, 0.4 g Na2MoO4*2H2O, 4.5 g CaCl2*2H2O, 3 g FeSO4*7H2O, 1 g H3BO3, 0.1 KI
EDTA와 ZnSO4*7H2O를 H2O에 용해시키고 pH를 고체 NaOH로 6으로 설정한 다음 다른 염을 하나씩 용해시켰다. 그런 다음 고체 NaOH 및 진한 HCl을 사용하여 pH를 4로 설정했다.
리터당 케모스타트용 글루코스 배지(10 g L-1의 YDM을 달성하기 위해):
22 g 글루코스 일수화물, 10 g (NH4)2SO4, 6 g KH2PO4, 1 MgSO4*7H2O, 0.5 g Pluronic® PE 6100, 3 mL 케모스타트용 미량 원소 용액, 1.6 mL 비오틴 스톡 용액(0.1 g L-1)
고체 KOH를 첨가하여 pH를 5로 설정하였다.
케모스타트의 경우 균주 CBS2612 PG1-3 vHH #4 및 상응하는 C3b 과발현 균주인 CBS2612 PG1-3 vHH C3b #13을 1.8 L 벤치탑 생물 반응기(SR1500ODLS; Dasgip, Germany)에서 이중으로 배양했다. 사전 배양을 위해 1 L 진탕 플라스크에 50 μg mL-1 제오신 및 100 μg mL-1 누르세오트리신(적절한 경우)을 함유하는 100 mL YPG 배지를 1.0 mL 냉동스톡으로 접종하고 180 rpm 및 25℃에서 ca. 24시간동안 인큐베이션했다. 배치 배양은 0.6 L의 작업 부피에서 작동되었고 0.4의 시작 OD600으로 접종되었다. 위에서 설명한 배지는 배치 및 연속 배양에 사용되었다. 배치 배양의 경우 교반기 속도(400-1200 rpm 사이)와 공기 흐름(9.5-30sL·h-1 사이)을 자동으로 조정하여 DO를 30%로 유지했다. 연속 배양을 위해, 교반기 속도는 700 rpm으로, 공기 흐름은 30 sL h-1로 설정하였다. 전체 과정 동안, 온도를 30℃로, 12.5% NH4OH를 자동으로 첨가하여 pH를 5로 유지했다. 배치 및 연속 배양에서 YDM이 약 10 g/L의 농도에 도달하도록 배지를 설계했다. 배치-종료를 나타내는 DO의 갑작스러운 스파이크 후에, 연속 배양이 시작되었다. 선택한 공급 속도는 μ=D=0.015 h-1에 대해 9 mL h-1이었고 배양 부피는 0.6 L로 일정하게 유지되었다. 이는 수준 센서를 사용하고 부피가 0.6 L를 초과할 때마다 추가 배양액을 반응기 외부로 자동 펌핑하여 수행했다. 정상 상태 조건으로 허용되는 반응기 부피의 5 부피 변화에 해당하는 333시간 후에 샘플을 채취했다.
효모 건조 질량(YDM) 및 분비된 재조합 단백질을 실시예 7b에 기재된 바와 같이 선택된 샘플링 지점에서 분석하였다. 또한, 전사 수준 분석을 위한 샘플을 실시예 6a에 기재된 바와 같이 채취하였다. 또한, 1 mL 배양물을 16,000 g에서 5분 동안 원심분리하여 만든 세포 펠릿을 수집하고, 상청액을 버리고 펠릿을 -20℃에 보관했다. 이들은 실시예 8c에 기술된 총 단백질 측정을 위해 사용되었다.
표 22는 상술한 케모스타트의 결과를 보여준다. 이 고정되고 느린 성장률과 정상 상태 조건에서도, 역가는 TIF 과발현 시 최대 1.75배 더 높은 반면, 바이오매스 농도(YDM)는 대조군 숙주 균주와 유사했다. 비 생산성은 숙주 균주에 비해 C3b 과발현 균주에서 1.5 내지 1.8배 증가하였다. 이것은 유가 배양(실시예 7)에서 보이는 재조합 단백질 생산에 대한 TIF 과발현의 긍정적인 효과가 연속 배양에서도 달성될 수 있음을 입증한다.
표 22: 숙주 균주 CBS2612 PG1-3 vHH #4 및 C3b 과발현 균주에 대한 vHH 역가, YDM 및 vHH의 비 생산성.
b) 연속 배양에서 번역 인자 과발현이 전사 수준에 미치는 영향.
C3b 과발현의 효과를 추가로 설명하기 위해, 전사 수준을 실시예 6a에 기재된 절차로 측정하였다. 위에서 설명한 것처럼 전사 수준은 S. 세레비지애 ACT1에 대해 정규화되었다. 또한, PpACT1 및 vHH에 대한 상대 전사 수준의 배수 변화를 수신하기 위해 숙주 균주인 반응기 C050에 대해 정규화하였다.
C3b의 과발현은 vHH의 상대 전사 수준을 1.40 ± 0.04배 더 높였다. PpACT1은 1.46 ± 0.04의 유사한 배수 변화를 보였다. 이것은 스크리닝 및 유가 배양에서 얻은 결과를 확인시켜주며, 전사 수준이 일반적으로 적용된 배양 모드와 무관하게 선택된 번역 개시 인자를 과발현하는 세포에서 증가한다는 것을 보여준다.
c) 총 단백질 농도의 결정.
증가된 전사 수준의 효과가 세포의 총 단백질 농도에 영향을 미치는지 확인하기 위해 뷰레(Biuret) 방법을 사용했다.
간략하게, 실시예 8a에 기재된 수집된 세포 펠릿을 물로 3회 세척하였다. 그런 다음 물로 희석하여 각 튜브에 8 mg mL-1 YDM을 넣었다. 샘플당 세포 현탁액 240 μL를 2회 125 μL의 3M NaOH와 혼합하고 99℃에서 5분 동안 끓였다. 냉각 후, 125 μL 2.5% CuSO4를 첨가하고 샘플을 16,000 g에서 5분 동안 원심분리했다. 얻어진 상청액 중 555 nm의 파장에서 테칸 판독기(Tecan Infinite M200)에서 측정을 위해 튜브당 200 μL를 2회 사용하였다. 검량선의 경우, 소 혈청 알부민 희석액(분자 생물학의 경우 알부민 분율 V ≥ 98%)(13, 12, 10, 8, 6, 4, 2, 1 및 0 g L-1)을 샘플과과 같은 방식으로 처리했다.
숙주 균주 CBS2612 PG1-3 vHH #4가 있는 2개의 반응기는 건조 질량 mg당 0.24 ± 0.00 mg의 단백질을 생산한 반면, 과발현 균주인 CBS2612 PG1-3 vHH C3b #13이 있는 2개의 반응기는 건조 질량 mg당 0.29 ± 0.00 mg의 단백질을 생산했다. 과발현 균주에서 관찰된 총 단백질의 1.2배 증가는 전사 수준의 증가가 세포 내 총 단백질의 증가를 초래함을 나타낸다. 그러나, 재조합 POI에 대한 효과는 전체 세포 단백질(1.2배)보다 훨씬 더 강하고(1.8배), 이는 mRNP의 TIF가 재조합 단백질 생산 동안 제한적이라는 본원의 놀라운 발견을 다시 한 번 강조하고 그들의 과발현은 더 높은 생산성을 초래한다.
실시예 9: 다른 모델 단백질의 분비에 대한 TIF의 과발현 효과.
인간 혈청 알부민(HSA)은 TIF 과발현의 효과를 확인하기 위한 또 다른 모델 단백질로 선택되었다.
a) HSA 생산자 균주의 생성
실시예 1a에 기재된 바와 같이, PG1-3_HSA에 대한 발현 카세트를 CBS2612로 형질전환시켜 HSA 생산 균주를 생성하였다. 생성된 균주를 실시예 2a에 기재된 바와 같이 스크리닝하고 실시예 2c에 기재된 바와 같이 미세유체 모세관 전기영동(mCE)에 의해 역가를 결정하였다. 상이한 생산성을 갖는 2개의 HSA 생성 클론을 TIF 과발현을 위한 숙주로 선택하였다. CBS2612 PG1-3 HSA #15는 평균 생산자 숙주 균주로 선택되었고, CBS2612 PG1-3 HSA #10은 높은 생산자 숙주 균주로 선택되었다. 이들 2개의 균주를 사중으로 재스크리닝하였고 그 결과를 표 23에서 볼 수 있다. 또한, 생산성의 차이를 설명하기 위해 이들 균주의 GCN을 결정하였다. GCN 측정은 실시예 1d에 따라 수행하였다.
표 23: 후속 TIF 과발현을 위한 숙주 균주로 사용하기 위해 1차 스크리닝에서 2개의 클론을 선택하였다. 역가, WCW 및 수율은 선택된 2개의 클론의 4회 반복하여 재스크리닝에서 얻어졌다. 추가로 이들 2개의 숙주 균주에서 재조합 단백질 발현 카세트에 대해 결정된 GCN이 제시되어 있다.
표 23에 나타난 역가는 사중반복의 평균을 보여준다. 높은 생산자는 평균 생산자보다 5배 이상 더 많이 생산하며 이는 더 높은 GCN과 잘 연관된다. 두 균주 모두 선택된 번역 개시 인자 구성물의 과발현에 사용되었다.
b) TIF 과발현 균주의 생성 및 HSA 분비에 미치는 영향
조합된 과발현 C3b는 실시예 9a에 기술된 2개의 HSA 생산 균주에서 테스트하기 위해 선택되었다. 실시예 1에 기술된 바와 같이 클로닝을 수행한 후, 실시예 2a 및 2c에 기술된 바와 같이 스크리닝한 후 역가 결정을 수행하였다.
표 24: 2개의 상이한 선택된 HSA 생산자 균주에서 C3b 과발현의 스크리닝 결과. HSA 역가, WCW 및 HSA 수율 외에도 HSA 수율의 배수 변화도 표시된다. 배수 변화는 각각의 숙주 균주인 CBS2612 PG1-3 HSA #10 또는 #15와 비교하여 계산되었다. 또한 스크리닝에 사용된 클론의 수가 표시된다.
스크리닝 결과를 표 24에 나타낸다. 2개의 생산자 숙주 균주 사이의 절대 HSA 역가의 차이에도 불구하고, TIF C3b 과발현의 영향은 1.4배 증가하여 거의 동일하다. 이는 TIF 과발현이 평균 균주 뿐만 아니라 고생산 균주에서도 재조합 단백질 분비를 증가시키는 효과가 있음을 보여준다. 추가로, 표 24의 결과는 C3b 과발현이 상기 실시예에서 확인된 바와 같이 vHH뿐만 아니라 HSA에 대한 재조합 단백질 분비를 증가시켜 재조합 단백질 생산에 대한 TIF 과발현의 일반적인 긍정적 영향의 개념을 강화함을 보여준다.
c) TIF를 과발현하는 HSA 생산자 균주의 유가식 배양
다음으로, HSA 숙주 균주 및 상응하는 C3b 과발현 균주를 유가식 배양에 사용하였다. 실시예 7에 기술된 바와 같이 유가식 배양을 수행하였다. 이 경우, 선형 증분 글루코스 공급에 대해 다음 방정식을 사용하였다: F[mL h-1] = 0.01*t + 2. 이것은 샘플링 지점 F9에서 0.029h-1의 대략적인 성장률을 산출하였다.
표 25: 유가식 배양 실행, A499-A502의 YDM, 역가 및 수율의 FC를 여기에서 볼 수 있다. 샘플은 2개의 다른 시점에서 채취되었다. FC 역가/수율은 동일한 시점에서 숙주 균주 역가/수율과 비교한 과발현 구성물 역가/수율의 배수 변화이다.
다른 모델 단백질 및 균주에 대해, 표 25에서 볼 수 있는 바와 같이 C3b 과발현은 두 생산자 숙주 균주 모두에서 재조합 HSA 분비 수율을 증가시켰다. 특히, 분비 단백질의 증가는 고 생산자 균주인 CBS2612 PG1-3 HSA #10에서 1.9배 증가하면서 훨씬 더 확연하다. 이는 mRNP의 TIF가 재조합 단백질 발현 능력이 더 높은 세포에 더 강한 병목 현상을 일으키고(예를 들어, 더 높은 발현 강도를 가진 더 높은 GCN 및/또는 프로모터로 인해 더 높은 전사에 의해), 이러한 세포가 TIF 과발현에 의해 훨씬 더 많은 혜택을 받는다는 결론으로 이어진다.
SEQUENCE LISTING
<110> Lonza Ltd.
<120> HOST CELLS OVEREXPRESSING TRANSLATIONAL FACTORS
<130> LO011P
<160> 196
<170> PatentIn version 3.5
<210> 1
<211> 202
<212> PRT
<213> Komagataella phaffii
<400> 1
Met Ser Glu Thr Glu Asn Ala Pro His Glu Lys Ser Leu Leu Asp Asp
1 5 10 15
Gln Val Asp Phe Thr Val Lys His Pro Leu Asn Ser Glu Trp Thr Leu
20 25 30
Trp Tyr Thr Lys Pro Ala Val His Glu Gln Glu Ser Trp Ser Asp Leu
35 40 45
Leu Arg Pro Ile Ile Ser Phe Asn Ser Val Glu Glu Phe Trp Gly Ile
50 55 60
Phe Asn Ser Ile Pro Lys Ala Ser Asp Leu Pro Val Lys Ser Asp Tyr
65 70 75 80
His Leu Phe Arg Asp Gly Ile Lys Pro Glu Trp Glu Asp Glu Arg Asn
85 90 95
Ala Asn Gly Gly Lys Leu Thr Tyr Gln Phe Ala Tyr Arg Lys Val Asp
100 105 110
Ile Asn Glu Leu Trp Ser Arg Gly Leu Leu Ser Val Ile Gly Glu Thr
115 120 125
Ile Gln Asp Asp Asp Gly Glu Thr Glu Val Asn Gly Ile Val Leu Ser
130 135 140
Ile Arg Arg Ala Ala Leu Lys Ile Ala Leu Trp Thr Lys Ser Lys Asp
145 150 155 160
Glu Ala Val Leu Arg Pro Ile Gly Glu Arg Phe Lys Lys Val Leu Lys
165 170 175
Leu Thr Ala Arg Asp His Ile Asp Phe Gln Pro His Lys Ser Gly Ala
180 185 190
Gly Ser Lys Asn Val Pro Ser Phe Ser Ile
195 200
<210> 2
<211> 202
<212> PRT
<213> Komagatealla pastoris
<400> 2
Met Ser Glu Thr Glu Asn Ala Pro His Glu Lys Ser Leu Leu Asp Asp
1 5 10 15
Gln Val Asp Phe Thr Val Lys His Pro Leu Asn Ser Glu Trp Thr Leu
20 25 30
Trp Tyr Thr Lys Pro Ala Val His Glu Gln Glu Ser Trp Ser Asp Leu
35 40 45
Leu Arg Pro Ile Ile Ser Phe Asn Ser Val Glu Glu Phe Trp Gly Ile
50 55 60
Phe Asn Ser Ile Pro Lys Ala Ser Asp Leu Pro Val Lys Ser Asp Tyr
65 70 75 80
His Leu Phe Arg Asp Gly Ile Lys Pro Glu Trp Glu Asp Glu Arg Asn
85 90 95
Ala Asn Gly Gly Lys Leu Thr Tyr Gln Phe Ala Tyr Arg Lys Val Asp
100 105 110
Ile Asn Glu Leu Trp Ser Arg Gly Leu Leu Ser Val Ile Gly Glu Thr
115 120 125
Ile Gln Asp Asp Asp Gly Glu Thr Glu Val Asn Gly Ile Val Leu Ser
130 135 140
Ile Arg Arg Ala Ala Leu Lys Ile Ala Leu Trp Thr Lys Ser Lys Asp
145 150 155 160
Glu Ala Val Leu Arg Pro Ile Gly Glu Arg Phe Lys Lys Val Leu Lys
165 170 175
Leu Thr Ala Arg Asp His Ile Asp Phe Gln Pro His Lys Ser Gly Ala
180 185 190
Gly Ser Lys Asn Val Pro Ser Phe Ser Ile
195 200
<210> 3
<211> 217
<212> PRT
<213> Homo sapiens
<400> 3
Met Ala Thr Val Glu Pro Glu Thr Thr Pro Thr Pro Asn Pro Pro Thr
1 5 10 15
Thr Glu Glu Glu Lys Thr Glu Ser Asn Gln Glu Val Ala Asn Pro Glu
20 25 30
His Tyr Ile Lys His Pro Leu Gln Asn Arg Trp Ala Leu Trp Phe Phe
35 40 45
Lys Asn Asp Lys Ser Lys Thr Trp Gln Ala Asn Leu Arg Leu Ile Ser
50 55 60
Lys Phe Asp Thr Val Glu Asp Phe Trp Ala Leu Tyr Asn His Ile Gln
65 70 75 80
Leu Ser Ser Asn Leu Met Pro Gly Cys Asp Tyr Ser Leu Phe Lys Asp
85 90 95
Gly Ile Glu Pro Met Trp Glu Asp Glu Lys Asn Lys Arg Gly Gly Arg
100 105 110
Trp Leu Ile Thr Leu Asn Lys Gln Gln Arg Arg Ser Asp Leu Asn Arg
115 120 125
Phe Trp Leu Glu Thr Leu Leu Cys Leu Ile Gly Glu Ser Phe Asp Asp
130 135 140
Tyr Ser Asp Asp Val Cys Gly Ala Val Val Asn Val Arg Ala Lys Gly
145 150 155 160
Asp Lys Ile Ala Ile Trp Thr Thr Glu Cys Glu Asn Arg Glu Ala Val
165 170 175
Thr His Ile Gly Arg Val Tyr Lys Glu Arg Leu Gly Leu Pro Pro Lys
180 185 190
Ile Val Ile Gly Tyr Gln Ser His Ala Asp Thr Ala Thr Lys Ser Gly
195 200 205
Ser Thr Thr Lys Asn Arg Phe Val Val
210 215
<210> 4
<211> 247
<212> PRT
<213> Aspergillus niger
<400> 4
Met Ala Ala Val Ala Glu Asn Gly His Ala Pro Val Ala Asp Glu Asn
1 5 10 15
Ala Ala Pro Val Ala Ala Ala Val Glu Gln Lys Glu Gln Thr Glu Lys
20 25 30
Thr Asn Gly Asp Ser Val Thr Val Phe His Asp Pro Glu Asn Phe Asn
35 40 45
Val Lys His Pro Leu Met His Glu Trp Thr Leu Trp Phe Thr Lys Pro
50 55 60
Pro Ser Gly Lys Gly Asp Asn Trp Asn Asp Leu Leu Lys Glu Val Val
65 70 75 80
Thr Phe Asn Ser Val Glu Glu Phe Trp Gly Ile Tyr Asn Asn Ile Ser
85 90 95
Pro Thr Ser Glu Leu Gly Leu Lys Ala Asp Tyr His Leu Phe Lys Lys
100 105 110
Gly Val Arg Pro Glu Trp Glu Asp Pro Gln Asn Lys His Gly Gly Lys
115 120 125
Trp Ser Tyr Ser Phe Lys Asp Lys Arg Ser Val Pro Ile Asp Asp Leu
130 135 140
Trp Leu His Ala Gln Leu Ala Ala Ile Gly Glu Thr Leu Glu Asn Asp
145 150 155 160
Gly Asp Asn Glu Val Met Gly Val Val Val Asn Val Arg Lys Gly Phe
165 170 175
Tyr Arg Val Gly Leu Trp Thr Arg Thr Val Gly Lys Ser Ile Pro Gly
180 185 190
Asp Lys Asn Gly Arg Thr Pro Ala Gln Gly Lys Glu Ile Leu Glu Asn
195 200 205
Ile Gly Arg Arg Phe Lys Glu Val Leu Arg Leu Lys Glu Ala Asp Ala
210 215 220
Val Glu Phe Ser Gly His Thr Asp Ser Ala His Ser Gly Ser Thr Arg
225 230 235 240
Ala Lys Ala Lys Tyr Thr Val
245
<210> 5
<211> 212
<212> PRT
<213> Cricetulus griseus
<400> 5
Met Glu Thr Thr Pro Thr Thr Asn Pro Pro Pro Val Glu Glu Glu Lys
1 5 10 15
Thr Glu Ser Asn Gln Glu Val Ala Asn Pro Glu His Tyr Ile Lys His
20 25 30
Pro Leu Gln Asn Arg Trp Ala Leu Trp Phe Phe Lys Asn Asp Lys Ser
35 40 45
Lys Thr Trp Gln Ala Asn Leu Arg Leu Ile Ser Lys Phe Asp Thr Val
50 55 60
Glu Asp Phe Trp Ala Leu Tyr Asn His Ile Gln Leu Ser Ser Asn Leu
65 70 75 80
Met Pro Gly Cys Asp Tyr Ser Leu Phe Lys Asp Gly Ile Glu Pro Met
85 90 95
Trp Glu Asp Glu Lys Asn Lys Arg Gly Gly Arg Trp Leu Ile Thr Leu
100 105 110
Asn Lys Gln Gln Arg Arg Ser Asp Leu Asp Arg Phe Trp Leu Glu Thr
115 120 125
Leu Leu Cys Leu Ile Gly Glu Ser Phe Asp Asp Tyr Ser Asp Asp Val
130 135 140
Cys Gly Ala Val Val Asn Val Arg Ala Lys Gly Asp Lys Ile Ala Ile
145 150 155 160
Trp Thr Thr Glu Cys Glu Asn Arg Asp Ala Val Thr His Ile Gly Arg
165 170 175
Val Tyr Lys Glu Arg Leu Gly Leu Pro Pro Lys Ile Val Ile Gly Tyr
180 185 190
Gln Ser His Ala Asp Thr Ala Thr Lys Ser Gly Ser Thr Thr Lys Asn
195 200 205
Arg Phe Val Val
210
<210> 6
<211> 210
<212> PRT
<213> Kluyveromyces lactis
<400> 6
Met Ser Val Glu Glu Val Thr Gln Lys Thr Gln Asp Leu Thr Val Asp
1 5 10 15
Glu Ala Lys Pro Ala Thr Val Leu Ser Asp Ser Lys Glu Phe Gln Leu
20 25 30
Lys His Pro Leu Ser Ser Lys Trp Thr Leu Trp Tyr Thr Lys Pro Pro
35 40 45
Val Asp Ser Ser Glu Ser Trp Ser Asp Leu Leu Arg Pro Val Thr Ser
50 55 60
Leu Asp Thr Val Glu Glu Phe Trp Ala Ile Gln Asn Gly Ile Pro Lys
65 70 75 80
Pro Phe Asp Leu Pro Ile Lys Ser Asp Tyr His Leu Phe Arg Asn Asp
85 90 95
Ile Arg Pro Glu Trp Glu Asp Glu Ala Asn Ser Glu Gly Gly Lys Leu
100 105 110
Ser Tyr Gln Phe Lys Asn Lys Arg His Asn Ile Asp Asp Leu Trp Leu
115 120 125
Arg Thr Leu Leu Ala Val Ile Gly Glu Thr Ile Asp Glu Glu Glu Ser
130 135 140
Glu Ile Asn Gly Cys Val Leu Asn Val Arg Lys Ala Val Phe Lys Ile
145 150 155 160
Ala Leu Trp Thr Arg Thr Thr Asn Leu Asn Ala Leu Thr Asn Ile Ala
165 170 175
Thr Lys Phe Lys Gln Val Leu Gln Leu Gly Glu Gly Glu Lys Leu Glu
180 185 190
Phe Tyr Asn His Arg Thr Ser Asn Ser Gly His Ala Pro Pro Thr Ala
195 200 205
Leu Leu
210
<210> 7
<211> 211
<212> PRT
<213> Ogataea polymorpha
<400> 7
Met Ser Glu Glu Leu Asn Gln Ala Ala Lys Asp Leu Ser Leu Asp Glu
1 5 10 15
Lys Lys Asp Val Thr Val Leu Asp Ser Arg Glu Glu Phe Asn Val Lys
20 25 30
His Pro Leu Asn Ser Lys Trp Thr Leu Trp Tyr Thr Lys Pro Ala Val
35 40 45
Asp Ser Ser Glu Ser Trp Ser Asp Leu Leu Lys Pro Val Val Ala Phe
50 55 60
Asp Thr Val Glu Glu Phe Trp Gly Ile Phe Asn Ser Ile Pro Lys Ala
65 70 75 80
Asp Glu Leu Pro Leu Lys Ser Asp Tyr His Leu Phe Arg Glu Asn Ile
85 90 95
Lys Pro Glu Trp Glu Asp Pro Ala Asn Ser Lys Gly Gly Arg Phe Ser
100 105 110
Phe Gln Phe Lys Gly Lys Arg Leu Glu His Gly Ile Asn Glu Ile Trp
115 120 125
Thr Arg Ala Leu Leu Ser Val Ile Gly Glu Thr Ile Glu Asp Asp Gln
130 135 140
Asn Glu Val Asn Gly Val Val Leu Asn Val Arg Lys Val Gly Tyr Arg
145 150 155 160
Val Cys Leu Trp Thr Lys Ser Cys Asp Arg Ala Ala Leu Val Pro Ile
165 170 175
Gly Glu Arg Leu Lys Lys Ile Leu Met Leu Arg Glu Gly Glu Ser Val
180 185 190
Glu Phe Ile Ser His Lys Asp Ser Asn Asp Arg Gly Ala Lys Pro Ala
195 200 205
Phe Tyr Val
210
<210> 8
<211> 213
<212> PRT
<213> Saccharomyces cerevisiae
<400> 8
Met Ser Val Glu Glu Val Ser Lys Lys Phe Glu Glu Asn Val Ser Val
1 5 10 15
Asp Asp Thr Thr Ala Thr Pro Lys Thr Val Leu Ser Asp Ser Ala His
20 25 30
Phe Asp Val Lys His Pro Leu Asn Thr Lys Trp Thr Leu Trp Tyr Thr
35 40 45
Lys Pro Ala Val Asp Lys Ser Glu Ser Trp Ser Asp Leu Leu Arg Pro
50 55 60
Val Thr Ser Phe Gln Thr Val Glu Glu Phe Trp Ala Ile Ile Gln Asn
65 70 75 80
Ile Pro Glu Pro His Glu Leu Pro Leu Lys Ser Asp Tyr His Val Phe
85 90 95
Arg Asn Asp Val Arg Pro Glu Trp Glu Asp Glu Ala Asn Ala Lys Gly
100 105 110
Gly Lys Trp Ser Phe Gln Leu Arg Gly Lys Gly Ala Asp Ile Asp Glu
115 120 125
Leu Trp Leu Arg Thr Leu Leu Ala Val Ile Gly Glu Thr Ile Asp Glu
130 135 140
Asp Asp Ser Gln Ile Asn Gly Val Val Leu Ser Ile Arg Lys Gly Gly
145 150 155 160
Asn Lys Phe Ala Leu Trp Thr Lys Ser Glu Asp Lys Glu Pro Leu Leu
165 170 175
Arg Ile Gly Gly Lys Phe Lys Gln Val Leu Lys Leu Thr Asp Asp Gly
180 185 190
His Leu Glu Phe Phe Pro His Ser Ser Ala Asn Gly Arg His Pro Gln
195 200 205
Pro Ser Ile Thr Leu
210
<210> 9
<211> 243
<212> PRT
<213> Schizosaccharomyces pombe
<400> 9
Met Ala Asp Ala Glu Asp Ser Arg His Ser Lys Asn Glu Gly Phe Pro
1 5 10 15
Asn Thr Ser Leu Ile Thr Glu Lys Leu Asp Leu Leu Asp Leu Phe Gly
20 25 30
Ser Pro Lys Val Lys Thr Glu Arg Glu Gly Arg Pro Ala Arg Leu Leu
35 40 45
Glu Gly Leu Ser Ala Val Asn Ala Glu Thr Ala Phe Val Lys Thr His
50 55 60
Pro Leu Gln His Glu Trp Thr Leu Trp Phe Leu Lys Pro Pro Thr Gln
65 70 75 80
Gly Leu Glu Trp Ser Asp Leu Leu Lys Glu Ile Ile Ser Phe Lys Thr
85 90 95
Val Glu Glu Phe Trp Gly Ile Phe Lys Thr Ile Ser Lys Ala Ser Met
100 105 110
Leu Pro Ala Lys Ser Asp Tyr Ser Tyr Phe Leu Lys Gly Ile Arg Pro
115 120 125
Glu Trp Glu Asp Pro Gln Asn Met Asn Gly Gly Lys Trp Ala Tyr Gln
130 135 140
Ser Lys His Lys Gly Ser Asn Leu Asp Glu Leu Trp Leu Tyr Met Val
145 150 155 160
Leu Ala Ala Ile Gly Glu Thr Leu Asp Pro Thr Gly Lys Glu Val Thr
165 170 175
Gly Val Val Cys Asn Met Arg Lys Gly Phe Tyr Arg Ile Ala Val Trp
180 185 190
Thr Arg Asn Cys Asn Asp Lys Asp Val Leu Glu Lys Ile Gly Leu Arg
195 200 205
Phe Lys Glu Val Leu Gly Ile Ser Asp Lys Glu Thr Ile Glu Tyr Ser
210 215 220
Ala His Glu Asp Ser Ser Lys Ala Gly Ser Met Arg Ala Lys Thr Arg
225 230 235 240
Met Ser Leu
<210> 10
<211> 259
<212> PRT
<213> Trichoderma reesei
<400> 10
Met Ala Ser Ala Ala Val Asp Gly Ala Asn Met Asp Gln Gln Val Asp
1 5 10 15
Leu Thr Ser Ile Pro Ile Ser Pro Asn Gly Asp Glu His Ala Gly Glu
20 25 30
Thr Lys Glu Asn Lys Asp Asp Gly Lys Pro Val Thr Val Phe His Asp
35 40 45
Lys Asp Asn Phe Thr Val Lys His Pro Leu Gln Ser Lys Trp Thr Leu
50 55 60
Trp Phe Thr Lys Pro Pro Ser Gly Lys Gly Asp Asn Trp Asn Asp Leu
65 70 75 80
Leu Lys Glu Val Ile Thr Phe Asp Ser Val Glu Glu Phe Trp Gly Val
85 90 95
Tyr Asn Asn Val Ala Pro Val Ser Glu Leu Ala Leu Lys Ser Asp Tyr
100 105 110
His Leu Phe Lys Ala Gly Val Arg Pro Glu Trp Glu Asp Pro Gln Asn
115 120 125
Lys His Gly Gly Lys Trp Ser Tyr Gln Tyr Lys Asp Lys Arg Asn Val
130 135 140
Asp Val Asp Arg Leu Trp Leu Gln Val Met Met Ala Ala Ile Gly Glu
145 150 155 160
Thr Leu Glu Glu Glu Glu Asp Gly Glu Val Met Gly Val Val Val Asn
165 170 175
Val Arg Lys Gly Phe Tyr Arg Ile Gly Val Trp Thr Arg Thr Ile Gly
180 185 190
Lys Ser Ile Pro Gly Arg Gly Asp Gly Asp Val Ala Gly Gly Lys Gly
195 200 205
Arg Ser Asn Glu Lys Gly Lys Glu Ile Leu Met Asn Ile Gly Arg Arg
210 215 220
Phe Lys Glu Thr Leu Glu Leu Pro Ala Asn Glu Gln Ile Glu Phe Ser
225 230 235 240
Gly His Thr Asp Ser Ala His Ala Gly Ser Thr Arg Ala Lys Ala Lys
245 250 255
Tyr Val Val
<210> 11
<211> 278
<212> PRT
<213> Yarrowia lipolytica
<400> 11
Met Ser Thr Met Ala Ile Gln Thr Asp Val Ser Val Ile Ser Thr Asp
1 5 10 15
Ile Ala Leu Gln Leu Ser Gln Met Ala Ala Thr Thr Asp Asn Val Thr
20 25 30
Glu Ala Val Ala Asn Leu Asn Ile Lys Glu Glu Ala Pro Val Ala Ser
35 40 45
Glu Pro Ala Glu Val Thr Glu Thr Val Glu Glu Glu Val Thr Pro Ala
50 55 60
Glu Pro Phe Ser Thr Val Phe Asp Ser Lys Thr Glu Phe Ala Thr Val
65 70 75 80
His Lys Leu Thr Thr Pro Trp Thr Leu Trp Tyr Ile Lys Pro Pro Ser
85 90 95
Pro Ala Val Ala Trp His Asp Leu Ile Lys Glu Val Val Ser Phe Asp
100 105 110
Thr Val Glu Gly Phe Trp Ala Val Tyr Asn Asn Ile Pro Lys Leu Val
115 120 125
Glu Leu Pro Ile Arg Ser Asp Tyr Ala Phe Phe Arg Lys Gly Ile Arg
130 135 140
Pro Glu Trp Glu Cys Asp Ser Asn Lys Ala Gly Gly Lys Trp Phe Tyr
145 150 155 160
Gln Phe Lys Pro Lys Ser Ala Asn Glu Phe Asp Glu Ile Trp Leu His
165 170 175
Thr Val Leu Ser Val Ile Gly Glu Ser Leu Glu Thr Asp Glu Glu Ile
180 185 190
Ala Lys His Glu Gly Lys Tyr Asn Asn Val Asp Gly Ser Ala Ser Asn
195 200 205
Val Asn Gly Ile Phe Val Asn Ile Arg Lys Ala Gly Val Arg Phe Asn
210 215 220
Val Trp Thr Lys Thr Ser Glu Val Thr Asp Glu Leu Arg Gln Met Gly
225 230 235 240
Val Lys Ile Lys Gln Val Leu Arg Leu Pro Glu Lys Glu Glu Val Gln
245 250 255
Phe Gln Ser His Glu Glu Ser Ala Ser Lys Asn Val Lys Ser Gln Gly
260 265 270
Lys Thr Arg Leu Ala Val
275
<210> 12
<211> 403
<212> PRT
<213> Komagataella phaffii
<400> 12
Met Ser Glu Gly Ile Ile Glu Ile Asp Thr Asn Leu Ile Glu Thr Asn
1 5 10 15
Tyr Asp Gln Val Val Ser Thr Phe Asp Glu Leu Asn Leu Lys Glu Gln
20 25 30
Ile Leu Arg Ala Val Phe Ala Tyr Gly Tyr Glu Phe Pro Ser Ala Ile
35 40 45
Gln Ser Arg Ala Ile Leu Pro Ile Val Ala Gly Arg Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ala Ile Ser Ala
65 70 75 80
Leu Gln Arg Leu Asp Glu Lys Leu Lys Ala Ala Gln Val Leu Ile Leu
85 90 95
Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Lys Lys Val Val Leu Ala
100 105 110
Leu Gly Met His Leu Asn Ile Ser Val His Ala Cys Ile Gly Gly Val
115 120 125
Asp Pro Ala Leu Asp Val Lys Ala Phe Asn Ser Gly Val Gln Ile Val
130 135 140
Val Gly Thr Pro Gly Arg Val Gln Asp Met Ile Glu Arg Gly Ala Phe
145 150 155 160
Arg Thr Glu Asn Val Lys Met Val Ile Leu Asp Glu Ala Asp Glu Met
165 170 175
Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Thr Leu Phe Thr Leu Leu
180 185 190
Pro Ser Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Glu
195 200 205
Val Leu Glu Val Thr Thr Lys Phe Met Asn Asn Pro Ile Arg Ile Leu
210 215 220
Val Lys Lys Asp Gln Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val
225 230 235 240
Asp Val Gly Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu Tyr
245 250 255
Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg
260 265 270
Lys Val Glu Glu Leu Thr Glu Arg Leu Thr Ala Gln Lys Phe Thr Val
275 280 285
Ser Ala Ile His Ser Glu Leu Ser Gln Thr Glu Arg Asp Thr Ile Met
290 295 300
Gln Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu
305 310 315 320
Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr
325 330 335
Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly
340 345 350
Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Lys
355 360 365
Asp Val Glu Met Met Lys Glu Ile Glu Lys Phe Tyr Ser Thr Gln Ile
370 375 380
Asp Glu Leu Pro Ser Ser Ile Thr Asp Leu Phe Glu Thr Glu Glu Val
385 390 395 400
Asn Glu Ser
<210> 13
<211> 403
<212> PRT
<213> Komagataella pastoris
<400> 13
Met Ser Glu Gly Ile Ile Glu Ile Asp Thr Asn Leu Ile Glu Thr Asn
1 5 10 15
Tyr Asp Gln Val Val Ser Thr Phe Asp Glu Leu Asn Leu Lys Glu Gln
20 25 30
Ile Leu Arg Ala Val Phe Ala Tyr Gly Tyr Glu Phe Pro Ser Ala Ile
35 40 45
Gln Ser Arg Ala Ile Leu Pro Ile Val Ala Gly Arg Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ala Ile Ser Ala
65 70 75 80
Leu Gln Arg Leu Asp Glu Lys Leu Lys Ala Ala Gln Val Leu Ile Leu
85 90 95
Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Lys Lys Val Val Leu Ala
100 105 110
Leu Gly Met His Leu Asn Ile Ser Val His Ala Cys Ile Gly Gly Val
115 120 125
Asp Pro Ala Leu Asp Val Lys Ala Phe Asn Ser Gly Val Gln Ile Val
130 135 140
Val Gly Thr Pro Gly Arg Val Gln Asp Met Ile Glu Arg Gly Ala Phe
145 150 155 160
Arg Thr Glu Asn Val Lys Met Val Ile Leu Asp Glu Ala Asp Glu Met
165 170 175
Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Thr Leu Phe Thr Leu Leu
180 185 190
Pro Ser Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Glu
195 200 205
Val Leu Glu Val Thr Thr Lys Phe Met Asn Asn Pro Ile Arg Ile Leu
210 215 220
Val Lys Lys Asp Gln Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val
225 230 235 240
Asp Val Gly Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu Tyr
245 250 255
Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg
260 265 270
Lys Val Glu Glu Leu Thr Glu Arg Leu Thr Ala Gln Lys Phe Thr Val
275 280 285
Ser Ala Ile His Ser Glu Leu Ser Gln Ser Glu Arg Asp Thr Ile Met
290 295 300
Gln Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu
305 310 315 320
Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr
325 330 335
Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly
340 345 350
Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Lys
355 360 365
Asp Val Glu Met Met Lys Glu Ile Glu Lys Phe Tyr Ser Thr Gln Ile
370 375 380
Asp Glu Leu Pro Ser Ser Ile Thr Asp Leu Phe Glu Thr Glu Glu Val
385 390 395 400
Asn Glu Ser
<210> 14
<211> 413
<212> PRT
<213> Homo sapiens
<400> 14
Met Ala Thr Thr Ala Thr Met Ala Thr Ser Gly Ser Ala Arg Lys Arg
1 5 10 15
Leu Leu Lys Glu Glu Asp Met Thr Lys Val Glu Phe Glu Thr Ser Glu
20 25 30
Glu Val Asp Val Thr Pro Thr Phe Asp Thr Met Gly Leu Arg Glu Asp
35 40 45
Leu Leu Arg Gly Ile Tyr Ala Tyr Gly Phe Glu Lys Pro Ser Ala Ile
50 55 60
Gln Gln Arg Ala Ile Lys Gln Ile Ile Lys Gly Arg Asp Val Ile Ala
65 70 75 80
Gln Ser Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val
85 90 95
Leu Gln Cys Leu Asp Ile Gln Val Arg Glu Thr Gln Ala Leu Ile Leu
100 105 110
Ala Pro Thr Arg Glu Leu Ala Val Gln Ile Gln Lys Gly Leu Leu Ala
115 120 125
Leu Gly Asp Tyr Met Asn Val Gln Cys His Ala Cys Ile Gly Gly Thr
130 135 140
Asn Val Gly Glu Asp Ile Arg Lys Leu Asp Tyr Gly Gln His Val Val
145 150 155 160
Ala Gly Thr Pro Gly Arg Val Phe Asp Met Ile Arg Arg Arg Ser Leu
165 170 175
Arg Thr Arg Ala Ile Lys Met Leu Val Leu Asp Glu Ala Asp Glu Met
180 185 190
Leu Asn Lys Gly Phe Lys Glu Gln Ile Tyr Asp Val Tyr Arg Tyr Leu
195 200 205
Pro Pro Ala Thr Gln Val Val Leu Ile Ser Ala Thr Leu Pro His Glu
210 215 220
Ile Leu Glu Met Thr Asn Lys Phe Met Thr Asp Pro Ile Arg Ile Leu
225 230 235 240
Val Lys Arg Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Phe Val
245 250 255
Ala Val Glu Arg Glu Glu Trp Lys Phe Asp Thr Leu Cys Asp Leu Tyr
260 265 270
Asp Thr Leu Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Lys Arg
275 280 285
Lys Val Asp Trp Leu Thr Glu Lys Met Arg Glu Ala Asn Phe Thr Val
290 295 300
Ser Ser Met His Gly Asp Met Pro Gln Lys Glu Arg Glu Ser Ile Met
305 310 315 320
Lys Glu Phe Arg Ser Gly Ala Ser Arg Val Leu Ile Ser Thr Asp Val
325 330 335
Trp Ala Arg Gly Leu Asp Val Pro Gln Val Ser Leu Ile Ile Asn Tyr
340 345 350
Asp Leu Pro Asn Asn Arg Glu Leu Tyr Ile His Arg Ile Gly Arg Ser
355 360 365
Gly Arg Tyr Gly Arg Lys Gly Val Ala Ile Asn Phe Val Lys Asn Asp
370 375 380
Asp Ile Arg Ile Leu Arg Asp Ile Glu Gln Tyr Tyr Ser Thr Gln Ile
385 390 395 400
Asp Glu Met Pro Met Asn Val Ala Asp Leu Ile Leu Glu
405 410
<210> 15
<211> 398
<212> PRT
<213> Aspergillus niger
<400> 15
Met Ala Ser Asn Asp Lys Gly Leu Glu Glu Ile Pro Glu Gly Gln Ile
1 5 10 15
Glu Thr Asn Tyr Asp Glu Val Thr Asp Ser Phe Asp Ser Met Asp Leu
20 25 30
Lys Pro Glu Leu Leu Arg Gly Val Tyr Ala Tyr Gly Phe Glu Arg Pro
35 40 45
Ser Ala Ile Gln Gln Arg Ala Ile Lys Pro Ile Ile Ala Gly His Asp
50 55 60
Val Ile Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser
65 70 75 80
Ile Ser Ala Leu Gln Lys Ile Asp Gln Glu Leu Lys Ala Cys Gln Ala
85 90 95
Leu Ile Val Ala Pro Thr Arg Glu Leu Ala Gln Gln Ile Gln Lys Val
100 105 110
Val Val Ala Ile Gly Asp Phe Met Asn Ile Glu Cys His Ala Cys Ile
115 120 125
Gly Gly Thr Asn Val Arg Asp Asp Met Asn Ala Leu Arg Ala Gly Pro
130 135 140
Gln Val Val Val Gly Thr Pro Gly Arg Ile His Asp Met Ile Glu Arg
145 150 155 160
Arg Val Leu Lys Thr Asp Gln Met Lys Leu Phe Ile Leu Asp Glu Ala
165 170 175
Asp Glu Met Leu Ser Arg Gly Phe Thr Glu Gln Ile Tyr Asp Ile Phe
180 185 190
Gln Leu Leu Pro Gln Ser Thr Gln Val Thr Leu Leu Ser Ala Thr Met
195 200 205
Pro Gln Asp Val Leu Glu Val Thr Thr Lys Phe Met Arg Asp Pro Ile
210 215 220
Arg Ile Leu Val Lys Lys Gln Glu Leu Thr Leu Glu Gly Ile Lys Gln
225 230 235 240
Phe Tyr Ile Ala Val Glu Lys Glu Glu Trp Lys Leu Asp Thr Leu Ser
245 250 255
Asp Leu Tyr Glu Thr Val Thr Ile Thr Gln Ala Val Ile Phe Cys Asn
260 265 270
Thr Arg Arg Lys Val Asp Trp Leu Thr Asp Lys Leu Thr Ala Arg Asp
275 280 285
Phe Thr Val Ser Ala Met His Gly Asp Met Glu Gln Gly Gln Arg Asp
290 295 300
Val Ile Met Lys Glu Phe Arg Ser Gly Ser Ser Arg Val Leu Ile Ala
305 310 315 320
Thr Asp Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val
325 330 335
Ile Asn Tyr Asp Leu Pro Ala Asn Arg Glu Asn Tyr Ile His Arg Ile
340 345 350
Gly Arg Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val
355 360 365
Thr Ala Asp Asp Val Arg Met Met Arg Glu Ile Glu Gln Phe Tyr Ser
370 375 380
Thr Gln Ile Glu Glu Met Pro Met Asn Val Ala Asp Leu Ile
385 390 395
<210> 16
<211> 411
<212> PRT
<213> Cricetulus griseus
<400> 16
Met Ala Ala Ala Ala Thr Met Ala Thr Ser Gly Ser Ala Arg Lys Arg
1 5 10 15
Leu Leu Lys Glu Glu Asp Met Thr Lys Val Glu Phe Glu Thr Ser Glu
20 25 30
Glu Val Asp Val Thr Pro Thr Phe Asp Thr Met Gly Leu Arg Glu Asp
35 40 45
Leu Leu Arg Gly Ile Tyr Ala Tyr Gly Phe Glu Lys Pro Ser Ala Ile
50 55 60
Gln Gln Arg Ala Ile Lys Gln Ile Ile Lys Gly Arg Asp Val Ile Ala
65 70 75 80
Gln Ser Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val
85 90 95
Leu Gln Cys Leu Asp Ile Gln Val Arg Glu Thr Gln Ala Leu Ile Leu
100 105 110
Ala Pro Thr Arg Glu Leu Ala Val Gln Ile Gln Lys Gly Leu Leu Ala
115 120 125
Leu Gly Asp Tyr Met Asn Val Gln Cys His Ala Cys Ile Gly Gly Thr
130 135 140
Asn Val Gly Glu Asp Ile Arg Lys Leu Asp Tyr Gly Gln His Val Val
145 150 155 160
Ala Gly Thr Pro Gly Arg Val Phe Asp Met Ile Arg Arg Arg Ser Leu
165 170 175
Arg Thr Arg Ala Ile Lys Met Leu Val Leu Asp Glu Ala Asp Glu Met
180 185 190
Leu Asn Lys Gly Phe Lys Glu Gln Ile Tyr Asp Val Tyr Arg Tyr Leu
195 200 205
Pro Pro Ala Thr Gln Val Val Leu Ile Ser Ala Thr Leu Pro His Glu
210 215 220
Ile Leu Glu Met Thr Asn Lys Phe Met Thr Asp Pro Ile Arg Ile Leu
225 230 235 240
Val Lys Arg Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Phe Val
245 250 255
Ala Val Glu Arg Glu Glu Trp Lys Phe Asp Thr Leu Cys Asp Leu Tyr
260 265 270
Asp Thr Leu Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Lys Arg
275 280 285
Lys Val Asp Trp Leu Thr Glu Lys Met Arg Glu Ala Asn Phe Thr Val
290 295 300
Ser Ser Met His Gly Asp Met Pro Gln Lys Glu Arg Glu Ser Ile Met
305 310 315 320
Lys Glu Phe Arg Ser Gly Ala Ser Arg Val Leu Ile Ser Thr Asp Val
325 330 335
Trp Ala Arg Gly Leu Asp Val Pro Gln Val Ser Leu Ile Ile Asn Tyr
340 345 350
Asp Leu Pro Asn Asn Arg Glu Leu Tyr Ile His Arg Ile Gly Arg Ser
355 360 365
Gly Arg Tyr Gly Arg Lys Gly Val Ala Ile Asn Phe Val Lys Asn Asp
370 375 380
Asp Ile Arg Ile Leu Arg Asp Ile Glu Gln Tyr Tyr Ser Thr Gln Ile
385 390 395 400
Asp Glu Met Pro Met Asn Val Ala Asp Leu Ile
405 410
<210> 17
<211> 396
<212> PRT
<213> Kluyveromyces lactis
<400> 17
Met Ser Asp Gly Ile Thr Asp Ile Asp Glu Asn Gln Ile Gln Ser Thr
1 5 10 15
Tyr Asp Lys Val Val Tyr Ser Phe Asp Asp Leu Lys Leu Lys Glu Glu
20 25 30
Leu Leu Arg Gly Ile Phe Gly Tyr Gly Phe Val Glu Pro Ser Ala Ile
35 40 45
Gln Gln Arg Ala Ile Leu Pro Ile Ile Glu Gly Lys Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Gly Thr Phe Ser Ile Ala Ala
65 70 75 80
Leu Gln Asn Ile Asp Glu Lys Ile Lys Ala Pro Gln Gly Leu Ile Leu
85 90 95
Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Met Ala
100 105 110
Leu Ala Ile His Met Asp Val Lys Val His Ala Cys Ile Gly Gly Thr
115 120 125
Ser Leu Gln Glu Asp Ser Glu Ala Leu Arg Gly Gly Ala Gln Ile Ile
130 135 140
Val Gly Thr Pro Gly Arg Val Phe Asp Met Ile Asp Arg Arg Ile Phe
145 150 155 160
Lys Thr Asp Asn Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met
165 170 175
Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Asn Ile Phe Thr Met Leu
180 185 190
Pro Pro Thr Ser Gln Val Val Leu Leu Ser Ala Thr Met Pro Gly Asp
195 200 205
Val Leu Glu Val Thr Ser Lys Phe Met Lys Asp Pro Val Arg Ile Leu
210 215 220
Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Gly Gln Tyr Tyr Val
225 230 235 240
Asn Val Glu Glu Glu Gln Tyr Lys Tyr Asp Cys Leu Thr Asp Leu Tyr
245 250 255
Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg
260 265 270
Lys Val Glu Glu Leu Thr Glu Arg Leu Arg Glu Asn Asn Phe Thr Val
275 280 285
Ser Ala Ile Tyr Ser Asp Leu Gln Gln Gln Glu Arg Asp Thr Ile Met
290 295 300
Lys Glu Phe Arg Ser Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu
305 310 315 320
Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr
325 330 335
Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly
340 345 350
Gly Arg Phe Gly Arg Lys Gly Ile Ala Ile Asn Phe Val Thr Asn Lys
355 360 365
Asp Ile Gly Ala Met Arg Glu Leu Glu Arg Phe Tyr Ser Thr Gln Ile
370 375 380
Glu Glu Leu Pro Ser Ser Ile Ser Glu Leu Phe Asp
385 390 395
<210> 18
<211> 397
<212> PRT
<213> Ogataea polymorpha
<400> 18
Met Ala Ser Glu Asn Ile Gln Glu Val Asp Ser Asn Leu Ile Glu Ser
1 5 10 15
Asn Tyr Asp Asn Val Val Tyr Thr Phe Asp Glu Leu Asn Leu Lys Pro
20 25 30
Glu Ile Ile Arg Gly Ile Phe Ala Tyr Gly Tyr Glu Gln Pro Ser Ala
35 40 45
Ile Gln Gln Arg Ala Ile Leu Pro Ile Thr Glu Gly Arg Asp Val Leu
50 55 60
Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Thr Ile Ser
65 70 75 80
Ala Leu Gln Arg Ile Asp Glu Lys Leu Lys Lys Thr Gln Ala Leu Ile
85 90 95
Leu Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Leu
100 105 110
Ala Ile Gly Met His Leu Asp Leu Thr Val His Ala Ser Ile Gly Gly
115 120 125
Lys Ala Val Gln Glu Asp Met Glu Ala Leu Arg Asn Gly Ala Gln Ile
130 135 140
Val Val Gly Thr Pro Gly Arg Val Tyr Asp Met Ile Glu Arg Gly Tyr
145 150 155 160
Phe Lys Thr Asp Ala Ile Lys Met Phe Ile Met Asp Glu Ala Asp Glu
165 170 175
Met Leu Ser Ser Gly Phe Lys Glu Gln Ile Tyr Asn Val Phe Arg Phe
180 185 190
Leu Pro Thr Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln
195 200 205
Asp Val Leu Glu Val Thr Thr Lys Phe Met Arg Asn Pro Val Arg Ile
210 215 220
Leu Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr
225 230 235 240
Ile Asp Val Asp Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu
245 250 255
Tyr Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg
260 265 270
Arg Lys Val Glu Thr Leu Thr Gln Gln Leu Thr Glu Asn Asn Phe Thr
275 280 285
Val Ser Ala Ile His Ser Asp Leu Ser Gln Gln Asp Arg Asp Thr Ile
290 295 300
Met Asn Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp
305 310 315 320
Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn
325 330 335
Tyr Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg
340 345 350
Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Leu Ile Thr Arg
355 360 365
Glu Asp Thr Glu Met Leu Arg Glu Ile Glu Met Phe Tyr Ser Thr Gln
370 375 380
Ile Val Glu Met Pro Ser Ser Ile Asn Asp Leu Phe Asp
385 390 395
<210> 19
<211> 395
<212> PRT
<213> Saccharomyces cerevisiae
<400> 19
Met Ser Glu Gly Ile Thr Asp Ile Glu Glu Ser Gln Ile Gln Thr Asn
1 5 10 15
Tyr Asp Lys Val Val Tyr Lys Phe Asp Asp Met Glu Leu Asp Glu Asn
20 25 30
Leu Leu Arg Gly Val Phe Gly Tyr Gly Phe Glu Glu Pro Ser Ala Ile
35 40 45
Gln Gln Arg Ala Ile Met Pro Ile Ile Glu Gly His Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Gly Thr Phe Ser Ile Ala Ala
65 70 75 80
Leu Gln Arg Ile Asp Thr Ser Val Lys Ala Pro Gln Ala Leu Met Leu
85 90 95
Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Met Ala
100 105 110
Leu Ala Phe His Met Asp Ile Lys Val His Ala Cys Ile Gly Gly Thr
115 120 125
Ser Phe Val Glu Asp Ala Glu Gly Leu Arg Asp Ala Gln Ile Val Val
130 135 140
Gly Thr Pro Gly Arg Val Phe Asp Asn Ile Gln Arg Arg Arg Phe Arg
145 150 155 160
Thr Asp Lys Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met Leu
165 170 175
Ser Ser Gly Phe Lys Glu Gln Ile Tyr Gln Ile Phe Thr Leu Leu Pro
180 185 190
Pro Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Asn Asp Val
195 200 205
Leu Glu Val Thr Thr Lys Phe Met Arg Asn Pro Val Arg Ile Leu Val
210 215 220
Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val Asn
225 230 235 240
Val Glu Glu Glu Glu Tyr Lys Tyr Glu Cys Leu Thr Asp Leu Tyr Asp
245 250 255
Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg Lys
260 265 270
Val Glu Glu Leu Thr Thr Lys Leu Arg Asn Asp Lys Phe Thr Val Ser
275 280 285
Ala Ile Tyr Ser Asp Leu Pro Gln Gln Glu Arg Asp Thr Ile Met Lys
290 295 300
Glu Phe Arg Ser Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu Leu
305 310 315 320
Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr Asp
325 330 335
Leu Pro Ala Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly Gly
340 345 350
Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Asn Glu Asp
355 360 365
Val Gly Ala Met Arg Glu Leu Glu Lys Phe Tyr Ser Thr Gln Ile Glu
370 375 380
Glu Leu Pro Ser Asp Ile Ala Thr Leu Leu Asn
385 390 395
<210> 20
<211> 392
<212> PRT
<213> Schizosaccharomyces pombe
<400> 20
Met Val Asp Gln Leu Glu Asp Ser Val Ile Glu Thr Asn Tyr Asp Glu
1 5 10 15
Val Ile Asp Thr Phe Asp Asp Met Asn Leu Lys Pro Glu Leu Leu Arg
20 25 30
Gly Ile Tyr Ala Tyr Gly Phe Glu Arg Pro Ser Ala Ile Gln Gln Arg
35 40 45
Ala Ile Met Pro Ile Leu Gly Glu Arg Asp Val Leu Ala Gln Ala Gln
50 55 60
Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val Leu Gln Lys
65 70 75 80
Ile Asp Thr Ser Leu Lys Gln Cys Gln Ala Leu Ile Leu Ala Pro Thr
85 90 95
Arg Glu Leu Ala Gln Gln Ile Gln Lys Val Val Val Ala Leu Gly Asp
100 105 110
Leu Met Asn Val Glu Cys His Ala Cys Ile Gly Gly Thr Leu Val Arg
115 120 125
Asp Asp Met Ala Ala Leu Gln Ala Gly Val His Val Val Val Gly Thr
130 135 140
Pro Gly Arg Val His Asp Met Ile Gln Arg Arg Ala Leu Pro Thr Asp
145 150 155 160
Ala Val Gln Met Phe Val Leu Asp Glu Ala Asp Glu Met Leu Ser Arg
165 170 175
Gly Phe Lys Asp Gln Ile Tyr Asp Ile Phe Gln Leu Leu Pro Pro Thr
180 185 190
Ala Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Asp Val Leu Glu
195 200 205
Val Thr Thr Lys Phe Met Arg Asp Pro Ile Arg Ile Leu Val Lys Lys
210 215 220
Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val Ala Val Glu
225 230 235 240
Lys Glu Glu Trp Lys Leu Asp Thr Leu Cys Asp Leu Tyr Glu Thr Val
245 250 255
Thr Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg Lys Val Asp
260 265 270
Trp Leu Thr Glu Gln Leu Thr Glu Arg Asp Phe Thr Val Ser Ser Met
275 280 285
His Gly Asp Met Asp Gln Ala Gln Arg Asp Thr Leu Met His Glu Phe
290 295 300
Arg Thr Gly Ser Ser Arg Ile Leu Ile Thr Thr Asp Leu Leu Ala Arg
305 310 315 320
Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr Asp Leu Pro
325 330 335
Ala Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg Gly Gly Arg Phe
340 345 350
Gly Arg Lys Gly Val Ser Ile Asn Phe Val Thr Asn Asp Asp Val Arg
355 360 365
Met Met Arg Glu Ile Glu Gln Phe Tyr Asn Thr His Ile Glu Glu Met
370 375 380
Pro Met Asn Ile Ala Asp Leu Ile
385 390
<210> 21
<211> 396
<212> PRT
<213> Trichoderma reesei
<400> 21
Met Ala Asp Lys Gly Leu Glu Asp Val Pro Glu Gly Gln Ile Glu Ser
1 5 10 15
Asn Tyr Asp Glu Thr Val Asp Ser Phe Asp Asp Met Asn Leu Lys Ser
20 25 30
Glu Leu Leu Arg Gly Val Tyr Ala Tyr Gly Phe Glu Arg Pro Ser Ala
35 40 45
Ile Gln Gln Arg Ala Ile Met Pro Val Ile Lys Gly His Asp Val Ile
50 55 60
Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser
65 70 75 80
Val Leu Gln Lys Ile Asp Pro Ser Val Lys Gln Cys Gln Ala Leu Ile
85 90 95
Leu Ala Pro Thr Arg Glu Leu Ala Gln Gln Ile Gln Lys Val Val Val
100 105 110
Ala Ile Gly Asp Phe Met Asn Val Glu Cys His Ala Cys Ile Gly Gly
115 120 125
Thr Ser Val Arg Glu Asp Met Lys Ala Leu Gln Asp Gly Pro Gln Val
130 135 140
Val Val Gly Thr Pro Gly Arg Val His Asp Met Ile Gln Arg Arg Phe
145 150 155 160
Leu Lys Thr Asp Ala Met Lys Met Phe Val Leu Asp Glu Ala Asp Glu
165 170 175
Met Leu Ser Arg Gly Phe Thr Asp Gln Ile Tyr Asp Ile Phe Gln Leu
180 185 190
Leu Pro Gln Ser Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln
195 200 205
Asp Val Leu Glu Val Thr Thr Arg Phe Met Arg Asp Pro Val Arg Ile
210 215 220
Leu Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr
225 230 235 240
Ile Ala Val Glu Lys Glu Glu Trp Lys Leu Asp Thr Leu Ser Asp Leu
245 250 255
Tyr Glu Thr Val Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Arg
260 265 270
Arg Lys Val Asp Trp Leu Thr Asp Lys Leu Thr Ala Arg Asp Phe Thr
275 280 285
Val Ser Ala Met His Gly Asp Met Asp Gln Ala Gln Arg Asp Leu Ile
290 295 300
Met Lys Glu Phe Arg Ser Gly Ser Ser Arg Val Leu Ile Ala Thr Asp
305 310 315 320
Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn
325 330 335
Tyr Asp Leu Pro Ala Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg
340 345 350
Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ala
355 360 365
Asp Asp Val Arg Met Met Arg Glu Ile Glu Gln Phe Tyr Ser Thr Gln
370 375 380
Ile Glu Glu Met Pro Met Asn Val Ala Asp Leu Ile
385 390 395
<210> 22
<211> 395
<212> PRT
<213> Yarrowia lipolytica
<400> 22
Met Ala Asp Gly Leu Thr Asp Ile Asp Ser Ser Gln Ile Thr Thr Asn
1 5 10 15
Tyr Asp Glu Val Val Thr Ser Phe Asp Asp Leu Gly Leu Lys Asp Glu
20 25 30
Leu Leu Arg Gly Ile Tyr Gly Tyr Gly Phe Glu Asn Pro Ser Ser Ile
35 40 45
Gln Gln Arg Ala Ile Leu Pro Val Ile Lys Gly Asn Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Ala
65 70 75 80
Leu Gln Asn Ile Asp Glu Lys Ile Lys Lys Pro Gln Ala Leu Ile Ile
85 90 95
Ala Pro Thr Arg Glu Leu Ala His Gln Ile Gln Lys Val Val Leu Ala
100 105 110
Phe Gly Glu Tyr Met Lys Ile Glu Cys His Ala Cys Ile Gly Gly Thr
115 120 125
Ser Val Ala Glu Asp Ile Arg Val Ile Gln Glu Gly Val His Val Ile
130 135 140
Val Gly Thr Pro Gly Arg Ile His Asp Met Ile Glu Arg Arg Ile Leu
145 150 155 160
Lys Thr Asp Leu Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met
165 170 175
Leu Ser Arg Glu Phe Lys Asp Pro Ile Tyr Asp Ile Phe Thr Thr Leu
180 185 190
Pro Glu Thr Thr Gln Thr Val Leu Leu Ser Ala Thr Met Pro Ala Glu
195 200 205
Val Leu Asp Ile Thr Gly Lys Phe Met Arg Asp Pro Val Arg Ile Leu
210 215 220
Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Ile
225 230 235 240
Asp Val Glu Gln Glu Ser Tyr Lys Phe Glu Val Leu Cys Asp Leu Tyr
245 250 255
Glu Thr Ile Asn Val Ser Gln Ala Val Ile Phe Cys Asn Thr Arg Arg
260 265 270
Lys Val Asp Tyr Leu Thr Gln Ala Leu Thr Glu Ala Asp Phe Thr Val
275 280 285
Ser Ser Met His Gly Glu Thr Glu Gln Ser Gln Arg Asp Val Ile Met
290 295 300
Lys Ala Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Thr Thr Asp Leu
305 310 315 320
Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Phe
325 330 335
Asp Leu Pro Ser Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg Gly
340 345 350
Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Glu
355 360 365
Asp His Gly Met Leu Lys Glu Leu Glu Arg Phe Tyr Ser Thr Glu Ile
370 375 380
Val Glu Met Pro Thr Asn Ile Ala Asp Leu Ile
385 390 395
<210> 23
<211> 486
<212> PRT
<213> Komagataella phaffii
<400> 23
Met His Pro Tyr Thr Val Val Phe Ala Arg Leu Leu Leu Gly Val Phe
1 5 10 15
Ser Thr Ala Ala Pro Asn Ser Pro Pro Pro Phe Cys Thr Ser Cys His
20 25 30
Leu Gly Asp Gln Arg Leu Trp Asn Leu Ala Gln Asn Leu Ala Cys Thr
35 40 45
Leu Pro Pro Gln Lys Asn Phe Pro Cys Leu Val Ala Arg Arg Ser Lys
50 55 60
Ile Lys Ser Phe Ser Thr Thr Phe Val Pro Asn Lys Ser Pro Phe Tyr
65 70 75 80
Leu Pro Ile Met Ser Glu Gly Ile Ile Glu Ile Asp Thr Asn Leu Ile
85 90 95
Glu Thr Asn Tyr Asp Gln Val Val Ser Thr Phe Asp Glu Leu Asn Leu
100 105 110
Lys Glu Gln Ile Leu Arg Ala Val Phe Ala Tyr Gly Tyr Glu Phe Pro
115 120 125
Ser Ala Ile Gln Ser Arg Ala Ile Leu Pro Ile Val Ala Gly Arg Asp
130 135 140
Val Leu Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ala
145 150 155 160
Ile Ser Ala Leu Gln Arg Leu Asp Glu Lys Leu Lys Ala Ala Gln Val
165 170 175
Leu Ile Leu Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Lys Lys Val
180 185 190
Val Leu Ala Leu Gly Met His Leu Asn Ile Ser Val His Ala Cys Ile
195 200 205
Gly Gly Val Asp Pro Ala Leu Asp Val Lys Ala Phe Asn Ser Gly Val
210 215 220
Gln Ile Val Val Gly Thr Pro Gly Arg Val Gln Asp Met Ile Glu Arg
225 230 235 240
Gly Ala Phe Arg Thr Glu Asn Val Lys Met Val Ile Leu Asp Glu Ala
245 250 255
Asp Glu Met Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Thr Leu Phe
260 265 270
Thr Leu Leu Pro Ser Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met
275 280 285
Pro Gln Glu Val Leu Glu Val Thr Thr Lys Phe Met Asn Asn Pro Ile
290 295 300
Arg Ile Leu Val Lys Lys Asp Gln Leu Thr Leu Glu Gly Ile Lys Gln
305 310 315 320
Phe Tyr Val Asp Val Gly Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys
325 330 335
Asp Leu Tyr Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn
340 345 350
Thr Arg Arg Lys Val Glu Glu Leu Thr Glu Arg Leu Thr Ala Gln Lys
355 360 365
Phe Thr Val Ser Ala Ile His Ser Glu Leu Ser Gln Thr Glu Arg Asp
370 375 380
Thr Ile Met Gln Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser
385 390 395 400
Thr Asp Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val
405 410 415
Ile Asn Tyr Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile
420 425 430
Gly Arg Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val
435 440 445
Thr Ser Lys Asp Val Glu Met Met Lys Glu Ile Glu Lys Phe Tyr Ser
450 455 460
Thr Gln Ile Asp Glu Leu Pro Ser Ser Ile Thr Asp Leu Phe Glu Thr
465 470 475 480
Glu Glu Val Asn Glu Ser
485
<210> 24
<211> 403
<212> PRT
<213> Komagatealla pastoris
<400> 24
Met Ser Glu Gly Ile Ile Glu Ile Asp Thr Asn Leu Ile Glu Thr Asn
1 5 10 15
Tyr Asp Gln Val Val Ser Thr Phe Asp Glu Leu Asn Leu Lys Glu Gln
20 25 30
Ile Leu Arg Ala Val Phe Ala Tyr Gly Tyr Glu Phe Pro Ser Ala Ile
35 40 45
Gln Ser Arg Ala Ile Leu Pro Ile Val Ala Gly Arg Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ala Ile Ser Ala
65 70 75 80
Leu Gln Arg Leu Asp Glu Lys Leu Lys Ala Ala Gln Val Leu Ile Leu
85 90 95
Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Lys Lys Val Val Leu Ala
100 105 110
Leu Gly Met His Leu Asn Ile Ser Val His Ala Cys Ile Gly Gly Val
115 120 125
Asp Pro Ala Leu Asp Val Lys Ala Phe Asn Ser Gly Val Gln Ile Val
130 135 140
Val Gly Thr Pro Gly Arg Val Gln Asp Met Ile Glu Arg Gly Ala Phe
145 150 155 160
Arg Thr Glu Asn Val Lys Met Val Ile Leu Asp Glu Ala Asp Glu Met
165 170 175
Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Thr Leu Phe Thr Leu Leu
180 185 190
Pro Ser Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Glu
195 200 205
Val Leu Glu Val Thr Thr Lys Phe Met Asn Asn Pro Ile Arg Ile Leu
210 215 220
Val Lys Lys Asp Gln Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val
225 230 235 240
Asp Val Gly Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu Tyr
245 250 255
Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg
260 265 270
Lys Val Glu Glu Leu Thr Glu Arg Leu Thr Ala Gln Lys Phe Thr Val
275 280 285
Ser Ala Ile His Ser Glu Leu Ser Gln Ser Glu Arg Asp Thr Ile Met
290 295 300
Gln Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu
305 310 315 320
Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr
325 330 335
Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly
340 345 350
Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Lys
355 360 365
Asp Val Glu Met Met Lys Glu Ile Glu Lys Phe Tyr Ser Thr Gln Ile
370 375 380
Asp Glu Leu Pro Ser Ser Ile Thr Asp Leu Phe Glu Thr Glu Glu Val
385 390 395 400
Asn Glu Ser
<210> 25
<211> 411
<212> PRT
<213> Homo sapiens
<400> 25
Met Ala Thr Thr Ala Thr Met Ala Thr Ser Gly Ser Ala Arg Lys Arg
1 5 10 15
Leu Leu Lys Glu Glu Asp Met Thr Lys Val Glu Phe Glu Thr Ser Glu
20 25 30
Glu Val Asp Val Thr Pro Thr Phe Asp Thr Met Gly Leu Arg Glu Asp
35 40 45
Leu Leu Arg Gly Ile Tyr Ala Tyr Gly Phe Glu Lys Pro Ser Ala Ile
50 55 60
Gln Gln Arg Ala Ile Lys Gln Ile Ile Lys Gly Arg Asp Val Ile Ala
65 70 75 80
Gln Ser Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val
85 90 95
Leu Gln Cys Leu Asp Ile Gln Val Arg Glu Thr Gln Ala Leu Ile Leu
100 105 110
Ala Pro Thr Arg Glu Leu Ala Val Gln Ile Gln Lys Gly Leu Leu Ala
115 120 125
Leu Gly Asp Tyr Met Asn Val Gln Cys His Ala Cys Ile Gly Gly Thr
130 135 140
Asn Val Gly Glu Asp Ile Arg Lys Leu Asp Tyr Gly Gln His Val Val
145 150 155 160
Ala Gly Thr Pro Gly Arg Val Phe Asp Met Ile Arg Arg Arg Ser Leu
165 170 175
Arg Thr Arg Ala Ile Lys Met Leu Val Leu Asp Glu Ala Asp Glu Met
180 185 190
Leu Asn Lys Gly Phe Lys Glu Gln Ile Tyr Asp Val Tyr Arg Tyr Leu
195 200 205
Pro Ser Ala Thr Gln Val Val Leu Ile Ser Ala Thr Leu Pro His Glu
210 215 220
Ile Leu Glu Met Thr Asn Lys Phe Met Thr Asp Pro Ile Arg Ile Leu
225 230 235 240
Val Lys Arg Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Phe Val
245 250 255
Ala Val Glu Arg Glu Glu Trp Lys Phe Asp Thr Leu Cys Asp Leu Tyr
260 265 270
Asp Thr Leu Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Lys Arg
275 280 285
Lys Val Asp Trp Leu Thr Glu Lys Met Arg Glu Ala Asn Phe Thr Val
290 295 300
Ser Ser Met His Gly Asp Met Pro Gln Lys Glu Arg Glu Ser Ile Met
305 310 315 320
Lys Glu Phe Arg Ser Gly Ala Ser Arg Val Leu Ile Ser Thr Asp Val
325 330 335
Trp Ala Arg Gly Leu Asp Val Pro Gln Val Ser Leu Ile Ile Asn Tyr
340 345 350
Asp Leu Pro Asn Asn Arg Glu Leu Tyr Ile His Arg Ile Gly Arg Ser
355 360 365
Gly Gln Tyr Gly Arg Lys Gly Val Ala Ile Asn Phe Val Lys Asn Asp
370 375 380
Asp Ile Arg Ile Leu Arg Asp Ile Glu Gln Tyr Tyr Ser Thr Gln Ile
385 390 395 400
Asp Glu Met Pro Met Asn Val Ala Asp Leu Ile
405 410
<210> 26
<211> 398
<212> PRT
<213> Aspergillus niger
<400> 26
Met Ala Ser Asn Asp Lys Gly Leu Glu Glu Ile Pro Glu Gly Gln Ile
1 5 10 15
Glu Thr Asn Tyr Asp Glu Val Thr Asp Ser Phe Asp Ser Met Asp Leu
20 25 30
Lys Pro Glu Leu Leu Arg Gly Val Tyr Ala Tyr Gly Phe Glu Arg Pro
35 40 45
Ser Ala Ile Gln Gln Arg Ala Ile Lys Pro Ile Ile Ala Gly His Asp
50 55 60
Val Ile Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser
65 70 75 80
Ile Ser Ala Leu Gln Lys Ile Asp Gln Glu Leu Lys Ala Cys Gln Ala
85 90 95
Leu Ile Val Ala Pro Thr Arg Glu Leu Ala Gln Gln Ile Gln Lys Val
100 105 110
Val Val Ala Ile Gly Asp Phe Met Asn Ile Glu Cys His Ala Cys Ile
115 120 125
Gly Gly Thr Asn Val Arg Asp Asp Met Asn Ala Leu Arg Ala Gly Pro
130 135 140
Gln Val Val Val Gly Thr Pro Gly Arg Ile His Asp Met Ile Glu Arg
145 150 155 160
Arg Val Leu Lys Thr Asp Gln Met Lys Leu Phe Ile Leu Asp Glu Ala
165 170 175
Asp Glu Met Leu Ser Arg Gly Phe Thr Glu Gln Ile Tyr Asp Ile Phe
180 185 190
Gln Leu Leu Pro Gln Ser Thr Gln Val Thr Leu Leu Ser Ala Thr Met
195 200 205
Pro Gln Asp Val Leu Glu Val Thr Thr Lys Phe Met Arg Asp Pro Ile
210 215 220
Arg Ile Leu Val Lys Lys Gln Glu Leu Thr Leu Glu Gly Ile Lys Gln
225 230 235 240
Phe Tyr Ile Ala Val Glu Lys Glu Glu Trp Lys Leu Asp Thr Leu Ser
245 250 255
Asp Leu Tyr Glu Thr Val Thr Ile Thr Gln Ala Val Ile Phe Cys Asn
260 265 270
Thr Arg Arg Lys Val Asp Trp Leu Thr Asp Lys Leu Thr Ala Arg Asp
275 280 285
Phe Thr Val Ser Ala Met His Gly Asp Met Glu Gln Gly Gln Arg Asp
290 295 300
Val Ile Met Lys Glu Phe Arg Ser Gly Ser Ser Arg Val Leu Ile Ala
305 310 315 320
Thr Asp Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val
325 330 335
Ile Asn Tyr Asp Leu Pro Ala Asn Arg Glu Asn Tyr Ile His Arg Ile
340 345 350
Gly Arg Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val
355 360 365
Thr Ala Asp Asp Val Arg Met Met Arg Glu Ile Glu Gln Phe Tyr Ser
370 375 380
Thr Gln Ile Glu Glu Met Pro Met Asn Val Ala Asp Leu Ile
385 390 395
<210> 27
<211> 411
<212> PRT
<213> Cricetulus griseus
<400> 27
Met Ala Ala Ala Ala Thr Met Ala Thr Ser Gly Ser Ala Arg Lys Arg
1 5 10 15
Leu Leu Lys Glu Glu Asp Met Thr Lys Val Glu Phe Glu Thr Ser Glu
20 25 30
Glu Val Asp Val Thr Pro Thr Phe Asp Thr Met Gly Leu Arg Glu Asp
35 40 45
Leu Leu Arg Gly Ile Tyr Ala Tyr Gly Phe Glu Lys Pro Ser Ala Ile
50 55 60
Gln Gln Arg Ala Ile Lys Gln Ile Ile Lys Gly Arg Asp Val Ile Ala
65 70 75 80
Gln Ser Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val
85 90 95
Leu Gln Cys Leu Asp Ile Gln Val Arg Glu Thr Gln Ala Leu Ile Leu
100 105 110
Ala Pro Thr Arg Glu Leu Ala Val Gln Ile Gln Lys Gly Leu Leu Ala
115 120 125
Leu Gly Asp Tyr Met Asn Val Gln Cys His Ala Cys Ile Gly Gly Thr
130 135 140
Asn Val Gly Glu Asp Ile Arg Lys Leu Asp Tyr Gly Gln His Val Val
145 150 155 160
Ala Gly Thr Pro Gly Arg Val Phe Asp Met Ile Arg Arg Arg Ser Leu
165 170 175
Arg Thr Arg Ala Ile Lys Met Leu Val Leu Asp Glu Ala Asp Glu Met
180 185 190
Leu Asn Lys Gly Phe Lys Glu Gln Ile Tyr Asp Val Tyr Arg Tyr Leu
195 200 205
Pro Pro Ala Thr Gln Val Val Leu Ile Ser Ala Thr Leu Pro His Glu
210 215 220
Ile Leu Glu Met Thr Asn Lys Phe Met Thr Asp Pro Ile Arg Ile Leu
225 230 235 240
Val Lys Arg Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Phe Val
245 250 255
Ala Val Glu Arg Glu Glu Trp Lys Phe Asp Thr Leu Cys Asp Leu Tyr
260 265 270
Asp Thr Leu Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Lys Arg
275 280 285
Lys Val Asp Trp Leu Thr Glu Lys Met Arg Glu Ala Asn Phe Thr Val
290 295 300
Ser Ser Met His Gly Asp Met Pro Gln Lys Glu Arg Glu Ser Ile Met
305 310 315 320
Lys Glu Phe Arg Ser Gly Ala Ser Arg Val Leu Ile Ser Thr Asp Val
325 330 335
Trp Ala Arg Gly Leu Asp Val Pro Gln Val Ser Leu Ile Ile Asn Tyr
340 345 350
Asp Leu Pro Asn Asn Arg Glu Leu Tyr Ile His Arg Ile Gly Arg Ser
355 360 365
Gly Arg Tyr Gly Arg Lys Gly Val Ala Ile Asn Phe Val Lys Asn Asp
370 375 380
Asp Ile Arg Ile Leu Arg Asp Ile Glu Gln Tyr Tyr Ser Thr Gln Ile
385 390 395 400
Asp Glu Met Pro Met Asn Val Ala Asp Leu Ile
405 410
<210> 28
<211> 396
<212> PRT
<213> Kluyveromyces lactis
<400> 28
Met Ser Asp Gly Ile Thr Asp Ile Asp Glu Asn Gln Ile Gln Ser Thr
1 5 10 15
Tyr Asp Lys Val Val Tyr Ser Phe Asp Asp Leu Lys Leu Lys Glu Glu
20 25 30
Leu Leu Arg Gly Ile Phe Gly Tyr Gly Phe Val Glu Pro Ser Ala Ile
35 40 45
Gln Gln Arg Ala Ile Leu Pro Ile Ile Glu Gly Lys Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Gly Thr Phe Ser Ile Ala Ala
65 70 75 80
Leu Gln Asn Ile Asp Glu Lys Ile Lys Ala Pro Gln Gly Leu Ile Leu
85 90 95
Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Met Ala
100 105 110
Leu Ala Ile His Met Asp Val Lys Val His Ala Cys Ile Gly Gly Thr
115 120 125
Ser Leu Gln Glu Asp Ser Glu Ala Leu Arg Gly Gly Ala Gln Ile Ile
130 135 140
Val Gly Thr Pro Gly Arg Val Phe Asp Met Ile Asp Arg Arg Ile Phe
145 150 155 160
Lys Thr Asp Asn Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met
165 170 175
Leu Ser Thr Gly Phe Lys Glu Gln Ile Tyr Asn Ile Phe Thr Met Leu
180 185 190
Pro Pro Thr Ser Gln Val Val Leu Leu Ser Ala Thr Met Pro Gly Asp
195 200 205
Val Leu Glu Val Thr Ser Lys Phe Met Lys Asp Pro Val Arg Ile Leu
210 215 220
Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Gly Gln Tyr Tyr Val
225 230 235 240
Asn Val Glu Glu Glu Gln Tyr Lys Tyr Asp Cys Leu Thr Asp Leu Tyr
245 250 255
Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg
260 265 270
Lys Val Glu Glu Leu Thr Glu Arg Leu Arg Glu Asn Asn Phe Thr Val
275 280 285
Ser Ala Ile Tyr Ser Asp Leu Gln Gln Gln Glu Arg Asp Thr Ile Met
290 295 300
Lys Glu Phe Arg Ser Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu
305 310 315 320
Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr
325 330 335
Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly
340 345 350
Gly Arg Phe Gly Arg Lys Gly Ile Ala Ile Asn Phe Val Thr Asn Lys
355 360 365
Asp Ile Gly Ala Met Arg Glu Leu Glu Arg Phe Tyr Ser Thr Gln Ile
370 375 380
Glu Glu Leu Pro Ser Ser Ile Ser Glu Leu Phe Asp
385 390 395
<210> 29
<211> 397
<212> PRT
<213> Ogataea polymorpha
<400> 29
Met Ala Ser Glu Asn Ile Gln Glu Val Asp Ser Asn Leu Ile Glu Ser
1 5 10 15
Asn Tyr Asp Asn Val Val Tyr Thr Phe Asp Glu Leu Asn Leu Lys Pro
20 25 30
Glu Ile Ile Arg Gly Ile Phe Ala Tyr Gly Tyr Glu Gln Pro Ser Ala
35 40 45
Ile Gln Gln Arg Ala Ile Leu Pro Ile Thr Glu Gly Arg Asp Val Leu
50 55 60
Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Thr Ile Ser
65 70 75 80
Ala Leu Gln Arg Ile Asp Glu Lys Leu Lys Lys Thr Gln Ala Leu Ile
85 90 95
Leu Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Leu
100 105 110
Ala Ile Gly Met His Leu Asp Leu Thr Val His Ala Ser Ile Gly Gly
115 120 125
Lys Ala Val Gln Glu Asp Met Glu Ala Leu Arg Asn Gly Ala Gln Ile
130 135 140
Val Val Gly Thr Pro Gly Arg Val Tyr Asp Met Ile Glu Arg Gly Tyr
145 150 155 160
Phe Lys Thr Asp Ala Ile Lys Met Phe Ile Met Asp Glu Ala Asp Glu
165 170 175
Met Leu Ser Ser Gly Phe Lys Glu Gln Ile Tyr Asn Val Phe Arg Phe
180 185 190
Leu Pro Thr Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln
195 200 205
Asp Val Leu Glu Val Thr Thr Lys Phe Met Arg Asn Pro Val Arg Ile
210 215 220
Leu Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr
225 230 235 240
Ile Asp Val Asp Glu Glu Gln Tyr Lys Phe Asp Cys Leu Cys Asp Leu
245 250 255
Tyr Asp Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg
260 265 270
Arg Lys Val Glu Thr Leu Thr Gln Gln Leu Thr Glu Asn Asn Phe Thr
275 280 285
Val Ser Ala Ile His Ser Asp Leu Ser Gln Gln Asp Arg Asp Thr Ile
290 295 300
Met Asn Glu Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp
305 310 315 320
Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn
325 330 335
Tyr Asp Leu Pro Ser Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg
340 345 350
Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Leu Ile Thr Arg
355 360 365
Glu Asp Thr Glu Met Leu Arg Glu Ile Glu Met Phe Tyr Ser Thr Gln
370 375 380
Ile Val Glu Met Pro Ser Ser Ile Asn Asp Leu Phe Asp
385 390 395
<210> 30
<211> 395
<212> PRT
<213> Saccharomyces cerevisiae
<400> 30
Met Ser Glu Gly Ile Thr Asp Ile Glu Glu Ser Gln Ile Gln Thr Asn
1 5 10 15
Tyr Asp Lys Val Val Tyr Lys Phe Asp Asp Met Glu Leu Asp Glu Asn
20 25 30
Leu Leu Arg Gly Val Phe Gly Tyr Gly Phe Glu Glu Pro Ser Ala Ile
35 40 45
Gln Gln Arg Ala Ile Met Pro Ile Ile Glu Gly His Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Gly Thr Phe Ser Ile Ala Ala
65 70 75 80
Leu Gln Arg Ile Asp Thr Ser Val Lys Ala Pro Gln Ala Leu Met Leu
85 90 95
Ala Pro Thr Arg Glu Leu Ala Leu Gln Ile Gln Lys Val Val Met Ala
100 105 110
Leu Ala Phe His Met Asp Ile Lys Val His Ala Cys Ile Gly Gly Thr
115 120 125
Ser Phe Val Glu Asp Ala Glu Gly Leu Arg Asp Ala Gln Ile Val Val
130 135 140
Gly Thr Pro Gly Arg Val Phe Asp Asn Ile Gln Arg Arg Arg Phe Arg
145 150 155 160
Thr Asp Lys Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met Leu
165 170 175
Ser Ser Gly Phe Lys Glu Gln Ile Tyr Gln Ile Phe Thr Leu Leu Pro
180 185 190
Pro Thr Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Asn Asp Val
195 200 205
Leu Glu Val Thr Thr Lys Phe Met Arg Asn Pro Val Arg Ile Leu Val
210 215 220
Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val Asn
225 230 235 240
Val Glu Glu Glu Glu Tyr Lys Tyr Glu Cys Leu Thr Asp Leu Tyr Asp
245 250 255
Ser Ile Ser Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg Lys
260 265 270
Val Glu Glu Leu Thr Thr Lys Leu Arg Asn Asp Lys Phe Thr Val Ser
275 280 285
Ala Ile Tyr Ser Asp Leu Pro Gln Gln Glu Arg Asp Thr Ile Met Lys
290 295 300
Glu Phe Arg Ser Gly Ser Ser Arg Ile Leu Ile Ser Thr Asp Leu Leu
305 310 315 320
Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr Asp
325 330 335
Leu Pro Ala Asn Lys Glu Asn Tyr Ile His Arg Ile Gly Arg Gly Gly
340 345 350
Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Asn Glu Asp
355 360 365
Val Gly Ala Met Arg Glu Leu Glu Lys Phe Tyr Ser Thr Gln Ile Glu
370 375 380
Glu Leu Pro Ser Asp Ile Ala Thr Leu Leu Asn
385 390 395
<210> 31
<211> 392
<212> PRT
<213> Schizosaccharomyces pombe
<400> 31
Met Val Asp Gln Leu Glu Asp Ser Val Ile Glu Thr Asn Tyr Asp Glu
1 5 10 15
Val Ile Asp Thr Phe Asp Asp Met Asn Leu Lys Pro Glu Leu Leu Arg
20 25 30
Gly Ile Tyr Ala Tyr Gly Phe Glu Arg Pro Ser Ala Ile Gln Gln Arg
35 40 45
Ala Ile Met Pro Ile Leu Gly Glu Arg Asp Val Leu Ala Gln Ala Gln
50 55 60
Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Val Leu Gln Lys
65 70 75 80
Ile Asp Thr Ser Leu Lys Gln Cys Gln Ala Leu Ile Leu Ala Pro Thr
85 90 95
Arg Glu Leu Ala Gln Gln Ile Gln Lys Val Val Val Ala Leu Gly Asp
100 105 110
Leu Met Asn Val Glu Cys His Ala Cys Ile Gly Gly Thr Leu Val Arg
115 120 125
Asp Asp Met Ala Ala Leu Gln Ala Gly Val His Val Val Val Gly Thr
130 135 140
Pro Gly Arg Val His Asp Met Ile Gln Arg Arg Ala Leu Pro Thr Asp
145 150 155 160
Ala Val Gln Met Phe Val Leu Asp Glu Ala Asp Glu Met Leu Ser Arg
165 170 175
Gly Phe Lys Asp Gln Ile Tyr Asp Ile Phe Gln Leu Leu Pro Pro Thr
180 185 190
Ala Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln Asp Val Leu Glu
195 200 205
Val Thr Thr Lys Phe Met Arg Asp Pro Ile Arg Ile Leu Val Lys Lys
210 215 220
Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Val Ala Val Glu
225 230 235 240
Lys Glu Glu Trp Lys Leu Asp Thr Leu Cys Asp Leu Tyr Glu Thr Val
245 250 255
Thr Val Thr Gln Ala Val Ile Phe Cys Asn Thr Arg Arg Lys Val Asp
260 265 270
Trp Leu Thr Glu Gln Leu Thr Glu Arg Asp Phe Thr Val Ser Ser Met
275 280 285
His Gly Asp Met Asp Gln Ala Gln Arg Asp Thr Leu Met His Glu Phe
290 295 300
Arg Thr Gly Ser Ser Arg Ile Leu Ile Thr Thr Asp Leu Leu Ala Arg
305 310 315 320
Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Tyr Asp Leu Pro
325 330 335
Ala Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg Gly Gly Arg Phe
340 345 350
Gly Arg Lys Gly Val Ser Ile Asn Phe Val Thr Asn Asp Asp Val Arg
355 360 365
Met Met Arg Glu Ile Glu Gln Phe Tyr Asn Thr His Ile Glu Glu Met
370 375 380
Pro Met Asn Ile Ala Asp Leu Ile
385 390
<210> 32
<211> 396
<212> PRT
<213> Trichoderma reesei
<400> 32
Met Ala Asp Lys Gly Leu Glu Asp Val Pro Glu Gly Gln Ile Glu Ser
1 5 10 15
Asn Tyr Asp Glu Thr Val Asp Ser Phe Asp Asp Met Asn Leu Lys Ser
20 25 30
Glu Leu Leu Arg Gly Val Tyr Ala Tyr Gly Phe Glu Arg Pro Ser Ala
35 40 45
Ile Gln Gln Arg Ala Ile Met Pro Val Ile Lys Gly His Asp Val Ile
50 55 60
Ala Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser
65 70 75 80
Val Leu Gln Lys Ile Asp Pro Ser Val Lys Gln Cys Gln Ala Leu Ile
85 90 95
Leu Ala Pro Thr Arg Glu Leu Ala Gln Gln Ile Gln Lys Val Val Val
100 105 110
Ala Ile Gly Asp Phe Met Asn Val Glu Cys His Ala Cys Ile Gly Gly
115 120 125
Thr Ser Val Arg Glu Asp Met Lys Ala Leu Gln Asp Gly Pro Gln Val
130 135 140
Val Val Gly Thr Pro Gly Arg Val His Asp Met Ile Gln Arg Arg Phe
145 150 155 160
Leu Lys Thr Asp Ala Met Lys Met Phe Val Leu Asp Glu Ala Asp Glu
165 170 175
Met Leu Ser Arg Gly Phe Thr Asp Gln Ile Tyr Asp Ile Phe Gln Leu
180 185 190
Leu Pro Gln Ser Thr Gln Val Val Leu Leu Ser Ala Thr Met Pro Gln
195 200 205
Asp Val Leu Glu Val Thr Thr Arg Phe Met Arg Asp Pro Val Arg Ile
210 215 220
Leu Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr
225 230 235 240
Ile Ala Val Glu Lys Glu Glu Trp Lys Leu Asp Thr Leu Ser Asp Leu
245 250 255
Tyr Glu Thr Val Thr Ile Thr Gln Ala Val Ile Phe Cys Asn Thr Arg
260 265 270
Arg Lys Val Asp Trp Leu Thr Asp Lys Leu Thr Ala Arg Asp Phe Thr
275 280 285
Val Ser Ala Met His Gly Asp Met Asp Gln Ala Gln Arg Asp Leu Ile
290 295 300
Met Lys Glu Phe Arg Ser Gly Ser Ser Arg Val Leu Ile Ala Thr Asp
305 310 315 320
Leu Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn
325 330 335
Tyr Asp Leu Pro Ala Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg
340 345 350
Gly Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ala
355 360 365
Asp Asp Val Arg Met Met Arg Glu Ile Glu Gln Phe Tyr Ser Thr Gln
370 375 380
Ile Glu Glu Met Pro Met Asn Val Ala Asp Leu Ile
385 390 395
<210> 33
<211> 395
<212> PRT
<213> Yarrowia lipolytica
<400> 33
Met Ala Asp Gly Leu Thr Asp Ile Asp Ser Ser Gln Ile Thr Thr Asn
1 5 10 15
Tyr Asp Glu Val Val Thr Ser Phe Asp Asp Leu Gly Leu Lys Asp Glu
20 25 30
Leu Leu Arg Gly Ile Tyr Gly Tyr Gly Phe Glu Asn Pro Ser Ser Ile
35 40 45
Gln Gln Arg Ala Ile Leu Pro Val Ile Lys Gly Asn Asp Val Leu Ala
50 55 60
Gln Ala Gln Ser Gly Thr Gly Lys Thr Ala Thr Phe Ser Ile Ser Ala
65 70 75 80
Leu Gln Asn Ile Asp Glu Lys Ile Lys Lys Pro Gln Ala Leu Ile Ile
85 90 95
Ala Pro Thr Arg Glu Leu Ala His Gln Ile Gln Lys Val Val Leu Ala
100 105 110
Phe Gly Glu Tyr Met Lys Ile Glu Cys His Ala Cys Ile Gly Gly Thr
115 120 125
Ser Val Ala Glu Asp Ile Arg Val Ile Gln Glu Gly Val His Val Ile
130 135 140
Val Gly Thr Pro Gly Arg Ile His Asp Met Ile Glu Arg Arg Ile Leu
145 150 155 160
Lys Thr Asp Leu Ile Lys Met Phe Ile Leu Asp Glu Ala Asp Glu Met
165 170 175
Leu Ser Arg Glu Phe Lys Asp Pro Ile Tyr Asp Ile Phe Thr Thr Leu
180 185 190
Pro Glu Thr Thr Gln Thr Val Leu Leu Ser Ala Thr Met Pro Ala Glu
195 200 205
Val Leu Asp Ile Thr Gly Lys Phe Met Arg Asp Pro Val Arg Ile Leu
210 215 220
Val Lys Lys Asp Glu Leu Thr Leu Glu Gly Ile Lys Gln Phe Tyr Ile
225 230 235 240
Asp Val Glu Gln Glu Ser Tyr Lys Phe Glu Val Leu Cys Asp Leu Tyr
245 250 255
Glu Thr Ile Asn Val Ser Gln Ala Val Ile Phe Cys Asn Thr Arg Arg
260 265 270
Lys Val Asp Tyr Leu Thr Gln Ala Leu Thr Glu Ala Asp Phe Thr Val
275 280 285
Ser Ser Met His Gly Glu Thr Glu Gln Ser Gln Arg Asp Val Ile Met
290 295 300
Lys Ala Phe Arg Thr Gly Ser Ser Arg Ile Leu Ile Thr Thr Asp Leu
305 310 315 320
Leu Ala Arg Gly Ile Asp Val Gln Gln Val Ser Leu Val Ile Asn Phe
325 330 335
Asp Leu Pro Ser Asn Arg Glu Asn Tyr Ile His Arg Ile Gly Arg Gly
340 345 350
Gly Arg Phe Gly Arg Lys Gly Val Ala Ile Asn Phe Val Thr Ser Glu
355 360 365
Asp His Gly Met Leu Lys Glu Leu Glu Arg Phe Tyr Ser Thr Glu Ile
370 375 380
Val Glu Met Pro Thr Asn Ile Ala Asp Leu Ile
385 390 395
<210> 34
<211> 1098
<212> PRT
<213> Komagataella phaffii
<400> 34
Met Ser Asn Lys Asn Val Asp Thr Ala Pro Asp Asn Gly Ser Gly Gly
1 5 10 15
Ser Asn Ser Pro Ala Ser Val Pro His Tyr Pro Gln Gln His Arg Ala
20 25 30
Asn Tyr Asn Pro His Lys Asn His Thr Asn His Gly Gly Asn Asn Gly
35 40 45
Gly Ala Gln Gly Tyr Met Gln His Gln Gln Gln Gln Gln Met Tyr Tyr
50 55 60
Asn Gln Met Gly Tyr Pro Met Pro Tyr Pro Asn Ala Gly Gly Asn Phe
65 70 75 80
Asn Gln Asn Val Tyr Leu Val Pro Tyr Asn Thr Met Val Pro Gly Thr
85 90 95
Pro Tyr Gly Ala Gly Ala Pro Gly Val Pro Pro Ser Tyr Pro Val Ser
100 105 110
Pro Ser Pro Ala Phe Ala Ser Pro Gln Lys Thr His Val Pro Val Ser
115 120 125
Leu Arg Thr Pro Ser Gly Glu Pro Ile Asn Leu Val Pro Ala Gly Gln
130 135 140
Thr Ser Ser Ser Ser Ser Asn Ala Ser Pro His Val Lys Ser Thr Ser
145 150 155 160
Ile Pro Pro Ser Ala Val Thr Ser Pro Ala Ala Ser Ile Ala Pro Thr
165 170 175
Val Ala Ser Pro Thr Lys Ala Ala Ala Gly Ser Glu Asp Ala Gly Lys
180 185 190
Thr Arg Asp Ala Phe Lys Gln Met Val Gln Ala Leu Ala Ala Lys Lys
195 200 205
Lys Ala Ala Ala Ala Ala Lys Ala Glu Gly Lys Thr Asp Asp Lys Lys
210 215 220
Glu Ser Val Glu Ser Lys Pro Lys Ser Ala Val Gln Pro Glu Thr Lys
225 230 235 240
Pro Lys Val Glu Val Lys Leu Glu Pro Lys Pro Lys Val Glu Val Lys
245 250 255
Leu Glu Pro Lys Pro Lys Val Glu Ile Lys Leu Glu Pro Lys Pro Val
260 265 270
Ser Glu Ala Lys Pro Glu Thr Lys Thr Val Pro Glu Val Glu Glu Pro
275 280 285
Ser Thr Val Ala Thr Ile Lys Ser Glu Ser Thr Pro Ile Glu Glu Leu
290 295 300
Lys Pro Lys Val Glu Val Thr Pro Glu Val Ala Ser Lys Pro Glu Gln
305 310 315 320
Val Glu Ser Ala Gln Glu Pro Ala Asn Asp Val Lys Pro Ser Glu Val
325 330 335
Ser Ala Lys Glu Val Gln Glu Ser Lys Glu Glu Ser Leu Lys Gln Pro
340 345 350
Lys Glu Ala Leu Asn Asp Ile Lys Ser Thr Glu Glu Ser Asn Lys Lys
355 360 365
Phe Ser Leu Pro Glu Glu Glu Ser Asn Asp His Gln Thr Leu Ser Gln
370 375 380
Ile Gln Gly Val Lys Asp Thr Glu Gln Ser Gln Glu Phe Glu Glu Pro
385 390 395 400
Gln Gly Thr Gln Glu Thr Gln Glu Thr Gln Glu Thr Gln Glu Thr Ala
405 410 415
Lys Pro Leu Glu Ala Gln Ala Pro Gln Glu Ile Gln Glu Thr Gln Glu
420 425 430
Pro Glu Glu Val Gln Glu Gln Thr Pro Glu Thr Ser Glu Thr Val Ser
435 440 445
Ser Val Thr Glu Glu Val Ser Pro Ala Pro Ala Pro Gly Leu Pro Leu
450 455 460
Ser Lys Phe Leu Asp Arg Ile Arg Lys Ala Pro Ala Ile Ser Asn Pro
465 470 475 480
Phe Lys His Glu Tyr Ser Gly Asp Phe His Gly Pro Asp Glu Ser Leu
485 490 495
Ser Gly Leu Lys Thr Ile Lys Tyr Asp Pro Gly Phe Leu Ile Gln Phe
500 505 510
Ala Thr Phe Asn Phe His Ile Asp Glu Asp Phe Ile Asn Asp Val Gly
515 520 525
Ser Lys Val Val Ile Pro Val Asn Thr Arg Arg Asp Asn Phe Ser Lys
530 535 540
Ser Met Ser Thr Ser Asn Phe Lys Gly Ser Gly Arg Asn Met Gly Ser
545 550 555 560
Asn Phe Arg Asn Asp Phe Gly Ser Arg Asn Asn Ser Lys Gln Gly Ser
565 570 575
Lys Lys Lys Asn Lys Ser Gln Lys Ser Gln Ser Arg Arg Gly Pro Lys
580 585 590
Tyr Ser Asn Glu Glu Glu Pro Ala Glu Pro Ala Val Pro Ala Glu Leu
595 600 605
Pro Asn Arg Ala Ala Ser Lys Trp Val Pro Arg Ser Leu Arg Asn Lys
610 615 620
Glu Ala Glu Val Lys Thr Ala Pro Asp Gly Ser Ile Ile Val Ser Glu
625 630 635 640
Glu Asp Ile Lys Arg Lys Thr Lys Ser Leu Leu Asn Lys Leu Thr Leu
645 650 655
Glu Phe Phe Asp Asp Ile Ser Asn Asp Ile Ile Ala Leu Thr Lys Gln
660 665 670
Ala Gln Trp Glu Asp Asp Val Lys Thr Leu Lys Gln Val Ile Glu Ser
675 680 685
Ile Phe Ala Lys Ala Cys Asp Glu Pro Tyr Trp Ser Ser Met Tyr Ala
690 695 700
Lys Leu Cys Ala Lys Met Cys Lys Asp Thr Pro Pro Glu Ile Lys Glu
705 710 715 720
Thr Asn Glu Lys Gly Asn Thr Phe Thr Gly Gly Asp Leu Val Arg Arg
725 730 735
Val Leu Ile Asn Arg Cys Gln Thr Glu Tyr Gln Lys Gly Trp Ile Asp
740 745 750
Gln Leu Pro Thr Asn Glu Asp Gly Ser Pro Leu Glu Pro Glu Leu Met
755 760 765
Ser Asp Glu Tyr Tyr Lys Gln Ala Ala Ala Lys Arg Arg Gly Leu Gly
770 775 780
Leu Val Lys Phe Ile Gly Gln Leu Tyr Gln Leu Asn Leu Leu Ser Asp
785 790 795 800
Asn Val Ile Phe His Cys Val Leu Gly Gln Ser Lys Glu Thr Asp Asn
805 810 815
Pro Ser Glu Asp Thr Met Glu Asn Leu Val Gln Leu Leu Glu Ala Val
820 825 830
Gly Tyr Arg Met Glu Met Ser Ser Glu Pro Lys Ile Arg Arg Val Leu
835 840 845
Asp Leu Ala Phe Ala Asn Ile Lys Ala Ile Val Asp Ala Asn Lys Ile
850 855 860
Pro Ser Arg Ile Arg Phe Met Leu Met Asp Leu Met Asp Leu Arg Arg
865 870 875 880
Asn Gly Trp Ala Thr Thr Glu Glu Asn Ala Gly Pro Lys Thr Ile Gln
885 890 895
Glu Ile His Leu Glu Ala Glu Ile Lys Arg Ser Glu Glu Glu Arg Glu
900 905 910
Lys Glu Arg Asp Arg His Ser Arg Arg Gly Arg Tyr Asn Asp Ser Lys
915 920 925
Pro Asn Ser Arg Gln Lys Ser Ser Trp Gly Ser Ser Val Val Ser Pro
930 935 940
Asn Asp Ile Arg Asn Ala Gly Tyr Val Arg Asn Ser Asp Lys Ser Leu
945 950 955 960
Gly Pro Val Asn Ser Phe Ser Arg Gly Lys Ser Ser Arg Gln Ala Ser
965 970 975
Lys Gln Ser Asn Ser Asp Phe Thr Ser Val Pro Ile Thr Ser Ser Gly
980 985 990
Ser Arg Thr Ala Leu Asn His Ser Gly Asp Ser Ser Thr Ser Leu Asn
995 1000 1005
Glu Pro Gln Ser Arg Glu Tyr Ser Lys Lys Ser Glu Ser Arg Pro
1010 1015 1020
Ala Pro Ser Asn Ile Phe Ala Ala Leu Glu Asp His Asp His Asp
1025 1030 1035
His Glu His Gly His Glu Gln Glu Glu Asn Lys His Ser Lys Asp
1040 1045 1050
Leu Gln Asn Gly Glu Ala Glu Ala Pro Glu Asp Asp Asn Val Gly
1055 1060 1065
Glu Ile Ala Gln Ala Asp Glu Asn Val Gln Gly Gln Glu Gln Glu
1070 1075 1080
Glu Glu Arg Glu Glu Glu Arg Glu Gln Glu Glu Glu Gln Glu Val
1085 1090 1095
<210> 35
<211> 1101
<212> PRT
<213> Komagataella pastoris
<400> 35
Met Ser Asn Lys Asn Val Asp Thr Ala Pro Asp Asn Gly Ser Gly Gly
1 5 10 15
Ser Asn Ser Pro Ala Ser Val Pro His Tyr Pro Gln Gln His Arg Ser
20 25 30
Asn Tyr Asn Pro His Lys Asn His Thr Asn His Gly Gly Asn Asn Gly
35 40 45
Gly Ala Gln Gly Tyr Met Gln His Gln Gln Gln Gln Gln Met Tyr Tyr
50 55 60
Asn Gln Met Gly Tyr Pro Met Pro Tyr Pro Asn Ala Gly Gly Asn Phe
65 70 75 80
Asn Gln Asn Val Tyr Leu Val Pro Tyr Asn Thr Met Val Pro Gly Thr
85 90 95
Pro Tyr Gly Ala Gly Ala Pro Gly Val Pro Pro Ser Tyr Pro Val Ser
100 105 110
Pro Thr Pro Ala Phe Ala Ser Pro Gln Lys Thr His Val Pro Val Ser
115 120 125
Leu Arg Thr Pro Ser Gly Glu Pro Ile Asn Leu Val Pro Ala Gly Gln
130 135 140
Thr Ser Ser Ser Ser Ser Asn Ala Ser Pro His Val Lys Ser Thr Ser
145 150 155 160
Ile Pro Ala Ser Ala Val Thr Ser Pro Ala Ala Ser Ile Ala Pro Thr
165 170 175
Val Ala Ser Pro Ala Lys Pro Ala Ala Gly Ser Glu Asp Ala Gly Lys
180 185 190
Thr Arg Asp Ala Phe Lys Gln Met Val Gln Ala Leu Ala Ala Lys Lys
195 200 205
Lys Ala Ala Ala Ala Lys Ala Glu Gly Lys Thr Asp Asp Lys Lys Glu
210 215 220
Ser Val Glu Ser Lys Pro Lys Ala Ala Val Gln Pro Glu Ala Lys Pro
225 230 235 240
Lys Val Glu Val Lys Leu Glu Pro Lys Pro Lys Val Glu Val Lys Leu
245 250 255
Glu Pro Lys Pro Lys Val Glu Ile Lys Leu Glu Pro Lys Pro Val Ser
260 265 270
Glu Ala Lys Leu Glu Thr Lys Thr Ala Pro Glu Val Glu Glu Pro Ser
275 280 285
Thr Val Ala Thr Ile Lys Ser Glu Thr Lys Pro Ile Glu Glu Leu Lys
290 295 300
Pro Thr Val Glu Val Ser Leu Gln Val Glu Ala Glu Pro Lys Gln Phe
305 310 315 320
Glu Ser Ala Gln Glu Pro Ala Ala Asp Leu Asn Ser Ser Glu Val Ser
325 330 335
Ala Lys Glu Val Lys Glu Thr Lys Glu Glu Ala Leu Asn Gln Pro Lys
340 345 350
Glu Ala Leu Asn Asp Ile Lys Ser Ala Glu Glu Leu Asn Glu Lys Ser
355 360 365
Thr Pro Gln Glu Glu Glu Ser Asn Asp Gln Gln Thr Leu Ser Gln Ser
370 375 380
Gln Glu Ala Lys Glu Thr Glu Gln Ser Gln Gly Ser Glu Glu Pro Gln
385 390 395 400
Glu Thr Gln Glu Ala Gln Glu Val Gln Val Thr Gln Thr Thr Pro Glu
405 410 415
Gly Gln Glu Gly Lys Glu Thr Gln Glu Pro Gln Glu Ala Gln Glu Ala
420 425 430
Gln Glu Val Gln Glu Gln Thr Pro Glu Thr Ser Glu Thr Val Ser Ser
435 440 445
Val Thr Glu Glu Val Ser Pro Ala Pro Ala Pro Gly Leu Pro Leu Ser
450 455 460
Thr Phe Leu Asp Arg Ile Arg Lys Ser Pro Ala Ile Ser Asn Pro Phe
465 470 475 480
Lys His Gln Tyr Ser Gly Asp Phe His Gly Pro Asp Glu Ser Leu Ser
485 490 495
Gly Leu Lys Thr Ile Lys Tyr Asp Pro Gly Phe Leu Ile Gln Phe Ala
500 505 510
Ser Phe Asn Phe His Ile Asp Glu Asp Phe Ile Asn Asp Val Gly Ser
515 520 525
Lys Val Val Ile Pro Val Asn Thr Arg Arg Asp Asn Phe Ser Lys Ser
530 535 540
Met Ser Thr Ser Asn Phe Lys Gly Ser Gly Arg Asn Met Gly Ser Asn
545 550 555 560
Phe Arg Asn Asp Phe Gly Ser Arg Asn Asn Ser Lys Gln Gly Ser Lys
565 570 575
Lys Lys Asn Lys Ser Gln Lys Ser Gln Ser Arg Arg Gly Pro Lys Tyr
580 585 590
Ser Asn Glu Glu Glu Pro Ala Glu Pro Ala Val Pro Ala Glu Leu Pro
595 600 605
Asn Arg Ala Ala Ser Lys Trp Val Pro Arg Ser Leu Arg Asn Lys Glu
610 615 620
Ala Glu Val Lys Thr Ala Pro Asp Gly Ser Val Ile Val Ser Glu Glu
625 630 635 640
Asp Ile Lys Arg Lys Thr Lys Ser Leu Leu Asn Lys Leu Thr Leu Glu
645 650 655
Phe Phe Asp Asp Ile Ser Asn Asp Ile Ile Ala Leu Thr Lys Gln Ala
660 665 670
Gln Trp Glu Asp Asp Val Lys Thr Leu Lys Gln Val Ile Glu Ser Ile
675 680 685
Phe Ala Lys Ala Cys Asp Glu Pro Tyr Trp Ser Ser Met Tyr Ala Lys
690 695 700
Leu Cys Ala Lys Met Cys Lys Asp Thr Pro Pro Glu Ile Lys Glu Thr
705 710 715 720
Asn Glu Lys Gly Asn Thr Phe Thr Gly Gly Asp Leu Val Arg Arg Val
725 730 735
Leu Ile Asn Arg Cys Gln Thr Glu Tyr Gln Lys Gly Trp Ile Asp Gln
740 745 750
Leu Pro Thr Asn Glu Asp Gly Ser Pro Leu Glu Pro Glu Leu Met Ser
755 760 765
Asp Glu Tyr Tyr Lys Gln Ala Ala Ala Lys Arg Arg Gly Leu Gly Leu
770 775 780
Val Lys Phe Ile Gly Gln Leu Tyr Gln Leu Asn Leu Leu Ser Asp Asn
785 790 795 800
Val Ile Phe His Cys Val Leu Gly Gln Ser Lys Glu Thr Asp Asn Pro
805 810 815
Ser Glu Asp Thr Met Glu Asn Leu Val Gln Leu Leu Glu Ala Val Gly
820 825 830
Tyr Arg Met Glu Met Ser Ser Glu Pro Lys Ile Arg Arg Val Leu Asp
835 840 845
Leu Ala Phe Ala Asn Ile Lys Ala Ile Val Asp Ala Asn Lys Ile Pro
850 855 860
Ser Arg Ile Arg Phe Met Leu Met Asp Leu Met Asp Leu Arg Arg Asn
865 870 875 880
Gly Trp Ala Thr Thr Glu Glu Asn Ala Gly Pro Lys Thr Ile Gln Glu
885 890 895
Ile His Leu Glu Ala Glu Ile Lys Arg Ser Glu Glu Glu Arg Glu Lys
900 905 910
Glu Arg Asp Arg His Ser Arg Arg Gly Arg Tyr Asn Asp Ser Lys Pro
915 920 925
Asn Ser Arg Gln Lys Ser Ser Trp Gly Ser Ser Val Val Ser Pro Asn
930 935 940
Asp Ile Arg Asn Ala Gly Tyr Val Arg Asn Ser Asp Lys Ser Leu Gly
945 950 955 960
Pro Val Asn Ser Phe Ser Arg Gly Lys Ser Ser Arg Gln Ala Ser Lys
965 970 975
Gln Ser Asn Ser Asp Phe Thr Ser Val Pro Ile Thr Ser Ser Gly Ser
980 985 990
Arg Thr Ala Leu Asn His Ser Gly Asp Ser Ser Thr Ser Leu Asn Glu
995 1000 1005
Pro Gln Ser Arg Glu Tyr Ser Lys Lys Ser Glu Ser Arg Pro Ala
1010 1015 1020
Pro Ser Asn Ile Phe Ala Ala Leu Glu Asp His Asp His Asp His
1025 1030 1035
Glu His Gly His Glu Gln Glu Glu Asn Lys His Ser Lys Asp Leu
1040 1045 1050
Gln Asn Gly Glu Ala Glu Thr Pro Glu Asn Val Asn Val Glu Glu
1055 1060 1065
Ile Ala Gln Ala Asp Glu Asn Val Gln Gly Gln Glu Gln Asp Glu
1070 1075 1080
Glu Gln Asp Glu Glu Gln Asp Glu Glu Arg Glu Gln Glu Glu Glu
1085 1090 1095
Gln Glu Val
1100
<210> 36
<211> 1780
<212> PRT
<213> Homo sapiens
<400> 36
Val Lys Lys Ile His Arg His Arg Leu Ser Pro Ala Thr Glu Lys Gly
1 5 10 15
Ala Ala Ser Ser Gly Glu Gly Asp Lys Asp Pro Pro Pro Pro Ala His
20 25 30
Glu Asp Ile Ala Val Lys Gly Thr Ala Thr Ala Ala Gly Thr Gly Pro
35 40 45
Gly Thr Gly Ala Ala Ala Ala Ala Ala Ala Ala Val Pro Pro Pro His
50 55 60
Pro Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
65 70 75 80
Ala Val Pro Pro Pro His Pro Asn Ile Arg Ala Leu Gln Thr Gln Ala
85 90 95
Pro Gln Gln Ile Pro Arg Gly Pro Val Gln Gln Pro Leu Glu Asp Arg
100 105 110
Ile Phe Thr Pro Ala Val Ser Ala Val Tyr Ser Thr Val Thr Gln Val
115 120 125
Ala Arg Gln Pro Gly Thr Pro Thr Pro Ser Pro Tyr Ser Ala His Glu
130 135 140
Ile Asn Lys Gly His Pro Asn Leu Ala Ala Thr Pro Pro Gly His Ala
145 150 155 160
Ser Ser Pro Gly Leu Ser Gln Thr Pro Tyr Pro Ser Gly Gln Asn Ala
165 170 175
Gly Pro Thr Thr Leu Val Tyr Pro Gln Thr Pro Gln Thr Met Asn Ser
180 185 190
Gln Pro Gln Thr Arg Ser Pro Gly Gly Phe Arg Pro Ile Gln Phe Phe
195 200 205
Gln Arg Pro Gln Ile Gln Pro Pro Arg Ala Thr Ile Pro Asn Ser Ser
210 215 220
Pro Ser Ile Arg Pro Gly Ala Gln Thr Pro Thr Ala Val Tyr Gln Ala
225 230 235 240
Asn Gln His Ile Met Met Val Asn His Leu Pro Met Pro Tyr Pro Val
245 250 255
Pro Gln Gly Pro Gln Tyr Cys Ile Pro Gln Tyr Arg His Ser Gly Pro
260 265 270
Pro Tyr Val Gly Pro Pro Gln Gln Tyr Pro Val Gln Pro Pro Gly Pro
275 280 285
Gly Pro Phe Tyr Pro Gly Pro Gly Pro Gly Asp Phe Pro Asn Ala Tyr
290 295 300
Gly Thr Pro Phe Tyr Pro Ser Gln Pro Val Tyr Gln Ser Ala Pro Ile
305 310 315 320
Ile Val Pro Thr Gln Gln Gln Pro Pro Pro Ala Lys Arg Glu Lys Lys
325 330 335
Thr Ile Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile Thr Glu
340 345 350
Glu Ile Met Ser Gly Gly Gly Ser Arg Asn Pro Thr Pro Pro Ile Gly
355 360 365
Arg Pro Thr Ser Thr Pro Thr Pro Pro Gln Leu Pro Ser Gln Val Pro
370 375 380
Glu His Ser Pro Val Val Tyr Gly Thr Val Glu Ser Ala His Leu Ala
385 390 395 400
Ala Ser Thr Pro Val Thr Ala Ala Ser Asp Gln Lys Gln Glu Glu Lys
405 410 415
Pro Lys Pro Asp Pro Val Leu Lys Ser Pro Ser Pro Val Leu Arg Leu
420 425 430
Val Leu Ser Gly Glu Lys Lys Glu Gln Glu Gly Gln Thr Ser Glu Thr
435 440 445
Thr Ala Ile Val Ser Ile Ala Glu Leu Pro Leu Pro Pro Ser Pro Thr
450 455 460
Thr Val Ser Ser Val Ala Arg Ser Thr Ile Ala Ala Pro Thr Ser Ser
465 470 475 480
Ala Leu Ser Ser Gln Pro Ile Phe Thr Thr Ala Ile Asp Asp Arg Cys
485 490 495
Glu Leu Ser Ser Pro Arg Glu Asp Thr Ile Pro Ile Pro Ser Leu Thr
500 505 510
Ser Cys Thr Glu Thr Ser Asp Pro Leu Pro Thr Asn Glu Asn Asp Asp
515 520 525
Asp Ile Cys Lys Lys Pro Cys Ser Val Ala Pro Asn Asp Ile Pro Leu
530 535 540
Val Ser Ser Thr Asn Leu Ile Asn Glu Ile Asn Gly Val Ser Glu Lys
545 550 555 560
Leu Ser Ala Thr Glu Ser Ile Val Glu Ile Val Lys Gln Glu Val Leu
565 570 575
Pro Leu Thr Leu Glu Leu Glu Ile Leu Glu Asn Pro Pro Glu Glu Met
580 585 590
Lys Leu Glu Cys Ile Pro Ala Pro Ile Thr Pro Ser Thr Val Pro Ser
595 600 605
Phe Pro Pro Thr Pro Pro Thr Pro Pro Ala Ser Pro Pro His Thr Pro
610 615 620
Val Ile Val Pro Ala Ala Ala Thr Thr Val Ser Ser Pro Ser Ala Ala
625 630 635 640
Ile Thr Val Gln Arg Val Leu Glu Glu Asp Glu Ser Ile Arg Thr Cys
645 650 655
Leu Ser Glu Asp Ala Lys Glu Ile Gln Asn Lys Ile Glu Val Glu Ala
660 665 670
Asp Gly Gln Thr Glu Glu Ile Leu Asp Ser Gln Asn Leu Asn Ser Arg
675 680 685
Arg Ser Pro Val Pro Ala Gln Ile Ala Ile Thr Val Pro Lys Thr Trp
690 695 700
Lys Lys Pro Lys Asp Arg Thr Arg Thr Thr Glu Glu Met Leu Glu Ala
705 710 715 720
Glu Leu Glu Leu Lys Ala Glu Glu Glu Leu Ser Ile Asp Lys Val Leu
725 730 735
Glu Ser Glu Gln Asp Lys Met Ser Gln Gly Phe His Pro Glu Arg Asp
740 745 750
Pro Ser Asp Leu Lys Lys Val Lys Ala Val Glu Glu Asn Gly Glu Glu
755 760 765
Ala Glu Pro Val Arg Asn Gly Ala Glu Ser Val Ser Glu Gly Glu Gly
770 775 780
Ile Asp Ala Asn Ser Gly Ser Thr Asp Ser Ser Gly Asp Gly Val Thr
785 790 795 800
Phe Pro Phe Lys Pro Glu Ser Trp Lys Pro Thr Asp Thr Glu Gly Lys
805 810 815
Lys Gln Tyr Asp Arg Glu Phe Leu Leu Asp Phe Gln Phe Met Pro Ala
820 825 830
Cys Ile Gln Lys Pro Glu Gly Leu Pro Pro Ile Ser Asp Val Val Leu
835 840 845
Asp Lys Ile Asn Gln Pro Lys Leu Pro Met Arg Thr Leu Asp Pro Arg
850 855 860
Ile Leu Pro Arg Gly Pro Asp Phe Thr Pro Ala Phe Ala Asp Phe Gly
865 870 875 880
Arg Gln Thr Pro Gly Gly Arg Gly Val Pro Leu Leu Asn Val Gly Ser
885 890 895
Arg Arg Ser Gln Pro Gly Gln Arg Arg Glu Pro Arg Lys Ile Ile Thr
900 905 910
Val Ser Val Lys Glu Asp Val His Leu Lys Lys Ala Glu Asn Ala Trp
915 920 925
Lys Pro Ser Gln Lys Arg Asp Ser Gln Ala Asp Asp Pro Glu Asn Ile
930 935 940
Lys Thr Gln Glu Leu Phe Arg Lys Val Arg Ser Ile Leu Asn Lys Leu
945 950 955 960
Thr Pro Gln Met Phe Asn Gln Leu Met Lys Gln Val Ser Gly Leu Thr
965 970 975
Val Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp Leu Val Phe Glu
980 985 990
Lys Ala Ile Asp Glu Pro Ser Phe Ser Val Ala Tyr Ala Asn Met Cys
995 1000 1005
Arg Cys Leu Val Thr Leu Lys Val Pro Met Ala Asp Lys Pro Gly
1010 1015 1020
Asn Thr Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys Gln Lys
1025 1030 1035
Glu Phe Glu Lys Asp Lys Ala Asp Asp Asp Val Phe Glu Lys Lys
1040 1045 1050
Gln Lys Glu Leu Glu Ala Ala Ser Ala Pro Glu Glu Arg Thr Arg
1055 1060 1065
Leu His Asp Glu Leu Glu Glu Ala Lys Asp Lys Ala Arg Arg Arg
1070 1075 1080
Ser Ile Gly Asn Ile Lys Phe Ile Gly Glu Leu Phe Lys Leu Lys
1085 1090 1095
Met Leu Thr Glu Ala Ile Met His Asp Cys Val Val Lys Leu Leu
1100 1105 1110
Lys Asn His Asp Glu Glu Ser Leu Glu Cys Leu Cys Arg Leu Leu
1115 1120 1125
Thr Thr Ile Gly Lys Asp Leu Asp Phe Glu Lys Ala Lys Pro Arg
1130 1135 1140
Met Asp Gln Tyr Phe Asn Gln Met Glu Lys Ile Val Lys Glu Arg
1145 1150 1155
Lys Thr Ser Ser Arg Ile Arg Phe Met Leu Gln Asp Val Ile Asp
1160 1165 1170
Leu Arg Leu Cys Asn Trp Val Ser Arg Arg Ala Asp Gln Gly Pro
1175 1180 1185
Lys Thr Ile Glu Gln Ile His Lys Glu Ala Lys Ile Glu Glu Gln
1190 1195 1200
Glu Glu Gln Arg Lys Val Gln Gln Leu Met Thr Lys Glu Lys Arg
1205 1210 1215
Arg Pro Gly Val Gln Arg Val Asp Glu Gly Gly Trp Asn Thr Val
1220 1225 1230
Gln Gly Ala Lys Asn Ser Arg Val Leu Asp Pro Ser Lys Phe Leu
1235 1240 1245
Lys Ile Thr Lys Pro Thr Ile Asp Glu Lys Ile Gln Leu Val Pro
1250 1255 1260
Lys Ala Gln Leu Gly Ser Trp Gly Lys Gly Ser Ser Gly Gly Ala
1265 1270 1275
Lys Ala Ser Glu Thr Asp Ala Leu Arg Ser Ser Ala Ser Ser Leu
1280 1285 1290
Asn Arg Phe Ser Ala Leu Gln Pro Pro Ala Pro Ser Gly Ser Thr
1295 1300 1305
Pro Ser Thr Pro Val Glu Phe Asp Ser Arg Arg Thr Leu Thr Ser
1310 1315 1320
Arg Gly Ser Met Gly Arg Glu Lys Asn Asp Lys Pro Leu Pro Ser
1325 1330 1335
Ala Thr Ala Arg Pro Asn Thr Phe Met Arg Gly Gly Ser Ser Lys
1340 1345 1350
Asp Leu Leu Asp Asn Gln Ser Gln Glu Glu Gln Arg Arg Glu Met
1355 1360 1365
Leu Glu Thr Val Lys Gln Leu Thr Gly Gly Val Asp Val Glu Arg
1370 1375 1380
Asn Ser Thr Glu Ala Glu Arg Asn Lys Thr Arg Glu Ser Ala Lys
1385 1390 1395
Pro Glu Ile Ser Ala Met Ser Ala His Asp Lys Ala Ala Leu Ser
1400 1405 1410
Glu Glu Glu Leu Glu Arg Lys Ser Lys Ser Ile Ile Asp Glu Phe
1415 1420 1425
Leu His Ile Asn Asp Phe Lys Glu Ala Met Gln Cys Val Glu Glu
1430 1435 1440
Leu Asn Ala Gln Gly Leu Leu His Val Phe Val Arg Val Gly Val
1445 1450 1455
Glu Ser Thr Leu Glu Arg Ser Gln Ile Thr Arg Asp His Met Gly
1460 1465 1470
Gln Leu Leu Tyr Gln Leu Val Gln Ser Glu Lys Leu Ser Lys Gln
1475 1480 1485
Asp Phe Phe Lys Gly Phe Ser Glu Thr Leu Glu Leu Ala Asp Asp
1490 1495 1500
Met Ala Ile Asp Ile Pro His Ile Trp Leu Tyr Leu Ala Glu Leu
1505 1510 1515
Val Thr Pro Met Leu Lys Glu Gly Gly Ile Ser Met Arg Glu Leu
1520 1525 1530
Thr Ile Glu Phe Ser Lys Pro Leu Leu Pro Val Gly Arg Ala Gly
1535 1540 1545
Val Leu Leu Ser Glu Ile Leu His Leu Leu Cys Lys Gln Met Ser
1550 1555 1560
His Lys Lys Val Gly Ala Leu Trp Arg Glu Ala Asp Leu Ser Trp
1565 1570 1575
Lys Asp Phe Leu Pro Glu Gly Glu Asp Val His Asn Phe Leu Leu
1580 1585 1590
Glu Gln Lys Leu Asp Phe Ile Glu Ser Asp Ser Pro Cys Ser Ser
1595 1600 1605
Glu Ala Leu Ser Lys Lys Glu Leu Ser Ala Glu Glu Leu Tyr Lys
1610 1615 1620
Arg Leu Glu Lys Leu Ile Ile Glu Asp Lys Ala Asn Asp Glu Gln
1625 1630 1635
Ile Phe Asp Trp Val Glu Ala Asn Leu Asp Glu Ile Gln Met Ser
1640 1645 1650
Ser Pro Thr Phe Leu Arg Ala Leu Met Thr Ala Val Cys Lys Ala
1655 1660 1665
Ala Ile Ile Ala Asp Ser Ser Thr Phe Arg Val Asp Thr Ala Val
1670 1675 1680
Ile Lys Gln Arg Val Pro Ile Leu Leu Lys Tyr Leu Asp Ser Asp
1685 1690 1695
Thr Glu Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Ser Ile
1700 1705 1710
Val Lys Leu Asp Gln Pro Ala Asn Leu Leu Arg Met Phe Phe Asp
1715 1720 1725
Cys Leu Tyr Asp Glu Glu Val Ile Ser Glu Asp Ala Phe Tyr Lys
1730 1735 1740
Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln Asn Gly Lys Gly Val
1745 1750 1755
Ala Leu Lys Ser Val Thr Ala Phe Phe Thr Trp Leu Arg Glu Ala
1760 1765 1770
Glu Glu Glu Ser Glu Asp Asn
1775 1780
<210> 37
<211> 1536
<212> PRT
<213> Aspergillus niger
<400> 37
Met Ser Ser Ile Pro Pro Lys Ser Gly Leu Gln Pro Gln Gly Gln Ser
1 5 10 15
Thr Ser Thr Gln Ala Ala Ser Ser Ala His Thr Ser Ser Pro Ser Val
20 25 30
Gly Gly Lys Ser Pro Thr Pro Ser Ser Thr Ser Thr Thr Ala Pro Arg
35 40 45
Ser Tyr Ala Asn Ala Thr Lys Lys Ser Ala Thr Asp Ser Thr Ala Ala
50 55 60
Pro Val Thr Val Gly Gly Pro Ser Gln His Gly Lys Ser Thr Thr Ala
65 70 75 80
Ser Pro Val Ser Gly Lys Pro Met Gln Gln Ser Gln Thr Pro Gly Val
85 90 95
Thr Ile Val Asn Gly Ala Pro Ala Pro Ala Ser Gln Gly Asp His Thr
100 105 110
Arg Lys Pro Ser Val Thr Ile Thr Ser Ala Gly Thr Ser Gly Phe Ile
115 120 125
Pro Asn Gly Gly Gln Thr Gly Arg Pro Asn Ser Leu Gln Phe Gly Phe
130 135 140
Ala Ala Asn Gln Gln Ser Ser Pro Asn Met Gly Asn Pro Ala Val Leu
145 150 155 160
Ala Asn Gln Pro Gln Ser Gly Leu Gly Val Thr Pro Pro Met Asn Pro
165 170 175
Arg Val Thr Ser Pro Gln Thr Ser Pro Ser Pro Ile Pro Gln Pro Ala
180 185 190
Ser Ser Gly Gly Arg Pro Pro Pro Ser Ser Tyr Gln Ser Gln Gly Asn
195 200 205
Val Pro Asn Phe Gly Ser Phe Gly Asp Ala Gly Asp Asn Met Arg Pro
210 215 220
Ala Pro Gln Ala Pro Leu Gly Pro Gly Ala Gln Ser Thr His Leu Arg
225 230 235 240
Arg Glu Ser Ser Gln Ser Thr His Ser Asp Met Ser Asn His Met Gly
245 250 255
Gly Gly Pro Gly Gly Arg Gly Gly Tyr His His Gln Gly Gly Arg Gly
260 265 270
Arg Gly Phe Ser Gln Ser Ser Tyr Gln Gly Gln Met Pro Tyr Ser Pro
275 280 285
Asn Ala Ser Phe Arg Ser Thr Pro Asn Gln Pro Arg Gly Gly Pro Asn
290 295 300
Met Ala Pro Gln Phe Pro Asn Gln Pro Arg Pro Met Pro Phe Pro Asn
305 310 315 320
Ser Pro His Gln Ala Ser Arg Ser Pro Ala Leu Ala Asn Ala His Pro
325 330 335
Ala Thr Pro Gln Met Asn Gln Val Pro Met Ala His Pro Gln Met Ala
340 345 350
Pro Gln Pro Tyr Tyr Gly Gln Pro Met Pro Pro Gln Pro Val Arg Pro
355 360 365
His Pro Leu Gln Lys Pro Ala Arg Arg Gly Gly Ala Leu Asn Arg Lys
370 375 380
Lys Gly Pro Ser Arg Thr Pro Ile Thr Pro Arg Ser Ser Val Thr Pro
385 390 395 400
Asn Pro His Ile Thr Leu Pro Pro Asn Leu Ala Pro Glu Ser Gly His
405 410 415
Phe Glu Arg Tyr Leu Thr Met Met Lys Ser Lys Gln Gly Tyr Pro Thr
420 425 430
Phe Asp Pro Ala Tyr Gly Phe Tyr Pro Asn Tyr Asn Met Gly Gly Val
435 440 445
Pro Tyr Met Pro Pro Ser Pro Gln Pro Arg Pro Gly Ile Pro Tyr Asn
450 455 460
Ala Gln Ala Pro Tyr Met Gln Asn Gln Tyr Pro Val Gln Pro Ala Ala
465 470 475 480
Gln Ala Thr Ala Leu Ser Arg Ser Pro Ser His Ser Asn Asp Arg Pro
485 490 495
Gly Ser Ser Leu Gly Gln Gly Gln Pro Pro Ala Gly Ala Pro Gly Pro
500 505 510
Ala His Ala His Asn Ala Ser Arg Ser Ser Asn Ser Pro Ala Pro Gln
515 520 525
Lys Ser Ser Phe Val Ile Pro Thr Ala Lys Lys Asn Ala Val Val Ile
530 535 540
Lys Asp Pro Gly Ser Gly Ala Val Lys Thr Phe Glu Lys Ala Pro Ala
545 550 555 560
Ser Pro Ala Arg Val Thr Pro Ser Pro Val Lys Ile Ala Thr Pro Thr
565 570 575
Ser Thr Pro Pro Pro Arg Thr Gly Ser Ser Ala Asp His Thr Arg Thr
580 585 590
Asp Ser Lys Ser Thr Lys Thr Asp Glu Glu Lys Lys Lys Glu Leu Arg
595 600 605
Asp Ala Val His Gln Lys Ile Glu Gln Asp Arg Ile Glu Lys Glu Glu
610 615 620
Ala Glu Arg Arg Lys Ala Glu Glu Glu Ala Ala Gln Lys Lys Lys Glu
625 630 635 640
Glu Glu Glu Glu Ala Ala Arg Lys Lys Ala Glu Glu Asp Ala Ala Gln
645 650 655
Lys Lys Lys Glu Glu Glu Glu Ala Ala Gln Lys Lys Ala Ala Asp Glu
660 665 670
Glu Ala Ala Arg Lys Gly Leu Glu Asp Leu Ser Leu Lys Asp Lys Pro
675 680 685
Ala Glu Thr Lys Ala Glu Glu Pro Ser Lys Pro Ala Ala Ala Pro Ala
690 695 700
Pro Ala Asp Asp Asp Asp Asp Ile Asp Tyr Asp Ala Ile Glu Arg Glu
705 710 715 720
Met Ala Glu Ile Glu Ala Lys Glu Arg Ala Ala Glu Glu Ala Tyr Tyr
725 730 735
Ala Arg Lys Lys Ala Glu Lys Glu Glu Lys Glu Arg Lys Glu Lys Glu
740 745 750
Glu Arg Glu Ala Tyr Glu Ala Asn Met Lys Asn Ala Glu Arg Glu Ala
755 760 765
Glu Ala Leu Glu Glu Ala Arg Ala Lys Lys Arg Glu Ala Gly Val Glu
770 775 780
Glu Glu Ser Lys Asp Lys Asp Leu Phe Ala Ser Leu Lys Lys Gly Gly
785 790 795 800
Phe Pro Ala Thr Glu Ala Ser Thr Pro Gly Asp Ser Gly Ala Ala Thr
805 810 815
Pro Ala Ser Asp Met Ser Met Gly Pro Pro Ser Lys Pro Ala Ser Ala
820 825 830
Asn Lys Arg Glu Lys Pro Ala Ala Leu Lys Leu Glu Thr Thr Lys Ala
835 840 845
Val Glu Pro Pro Gln Pro Ser Ala Ala Met Lys Ala Leu His Ser Ala
850 855 860
Arg Phe Val Asp Asp Leu Ser Lys Ile Thr Tyr Pro Ala Ser Ile Val
865 870 875 880
Ser Pro Asn Pro Ala Leu Asn Ala Ser Ala Pro Ala Asp Arg Lys Phe
885 890 895
His Tyr Asn Lys Glu Phe Leu Leu Gln Phe Gln Ser Val Phe Lys Glu
900 905 910
Lys Pro Ser Ile Asp Trp Asp Ala Arg Val Arg Glu Thr Val Gly Asp
915 920 925
Ser Asp Ser Ser Arg Pro Gln Ser Ala Arg Thr Pro Met Met Gly Gly
930 935 940
Arg Asn Ser Ser Arg Pro Gly Ala Ala Pro Phe Gln Met Gly Asn Phe
945 950 955 960
Gly Gln Thr Pro Ser Arg Ala Ser Asn Leu Pro Pro Gly Thr Thr Ser
965 970 975
Ala Glu Arg Phe Ala Met Ser Asn Ala Ala Arg Thr Ala Ser Met Gly
980 985 990
Asn Pro Phe Gly Asn Phe Gly Arg Pro Gly Leu Gly Ile Gly Ala Pro
995 1000 1005
Gly Ile Ser Arg Thr Asn Ser Ala Ser Ala Met His Pro Gly Met
1010 1015 1020
Pro Ser Ser Pro Arg Val Gly Ser Ser Asn Arg Ser Gly Thr Arg
1025 1030 1035
Thr Gly Ser Lys Arg Asp Lys Gln Asn Ala Lys Lys Glu Glu Glu
1040 1045 1050
Met Ala Lys Ser Met Pro Leu Thr Ala Gly Met Glu Val Lys Ala
1055 1060 1065
Leu Gln Val Ser Ser Thr Gly Trp Lys Pro Arg Ser Ile Gly Gln
1070 1075 1080
Ala Pro Ala Ala Ala Ala Gly Pro Thr Pro Gly Gly Ala Thr His
1085 1090 1095
Met Pro Pro Asp Met Val Gln Arg Lys Val Lys Ala Ala Leu Asn
1100 1105 1110
Lys Met Thr Pro Glu Asn Phe Asp Arg Ile Ala Gly Gln Leu Leu
1115 1120 1125
Glu Ile Val Ser Gln Ser Lys Asp Glu Thr Asp Gly Arg Thr Leu
1130 1135 1140
Arg Gln Val Ile Gln Leu Thr Phe Glu Lys Ala Thr Asp Glu Ala
1145 1150 1155
His Trp Ala Ser Ile Tyr Ala Lys Phe Cys Lys Arg Met Leu Glu
1160 1165 1170
Ser Met Ser Ala Glu Ile Lys Asp Glu Asn Ile His Asp Lys Asn
1175 1180 1185
Gly Asn Val Val Ala Gly Gly Ser Leu Phe Arg Lys Tyr Leu Leu
1190 1195 1200
Asn Arg Cys Gln Glu Glu Phe Glu Arg Gly Trp Lys Val Asn Leu
1205 1210 1215
Pro Pro Lys Pro Glu Gly Glu Thr Glu Glu Ala Ala Met Met Ser
1220 1225 1230
Asp Glu Tyr Tyr Lys Ala Ala Ala Ala Lys Arg Arg Gly Leu Gly
1235 1240 1245
Leu Val Lys Phe Ile Gly Glu Leu Tyr Lys Leu Gly Met Leu Thr
1250 1255 1260
Glu Arg Ile Met His Glu Cys Val Lys Lys Leu Val Asp Tyr Glu
1265 1270 1275
Gly Met Pro Asp Glu Ala Glu Val Glu Ser Leu Thr Ser Leu Leu
1280 1285 1290
Arg Thr Ile Gly Ala Ser Leu Asp Val Ser Glu Lys Gly His Ala
1295 1300 1305
Phe Met Asn Ala Tyr Phe His Arg Ile Gly Leu Met Ile Gln Thr
1310 1315 1320
Pro Gly Leu Pro Ser Arg Leu Arg Phe Met Leu Met Asp Ile Val
1325 1330 1335
Asp Leu Arg Ala Ala Arg Trp Gln Ser Lys Asp Ala Asp Lys Gly
1340 1345 1350
Pro Lys Thr Ile Gln Gln Ile Arg Glu Glu Ala Ala Arg Ala Gln
1355 1360 1365
Gln Glu Ala Glu Met Glu Arg Leu Arg Gln Gln Ala Asn Arg Gly
1370 1375 1380
Ser Arg Pro Gly Leu Gly Arg Gly Asp Ala Arg Ser Tyr Ser Gly
1385 1390 1395
Tyr Gly Asn Gln Ala Pro Pro Gln Asp Phe Ala Ser Ser Lys Val
1400 1405 1410
Gly Ser Asp Asp Leu Arg Arg Leu Arg Thr Ser Arg Gln Thr Asn
1415 1420 1425
Gln Pro Met Ser Phe Gly Pro Ser Ser Met Leu Gly Ser Arg Ser
1430 1435 1440
Asn Ser Gly Arg Lys Asn Leu Gly Pro Gly Gly Asn Leu Val Arg
1445 1450 1455
Gly Ser Asp Asp Ser Ala Ala Ser Ser Arg Thr Gly Thr Pro Thr
1460 1465 1470
Gly Lys Lys Glu Asp Lys Glu Ala Ala Ser Ser Ile Asn Ala Phe
1475 1480 1485
Ser Ala Leu Ala Ser Leu Glu Asp Arg Asp Asn Met Ala Thr Ser
1490 1495 1500
Pro Pro Ser Asn Pro Thr Ser Pro Leu Leu Thr Lys Ser Gln Pro
1505 1510 1515
Ala Val Glu Arg Arg Pro Ser Lys Thr Pro Ser Lys Asp Gly Glu
1520 1525 1530
Glu Ala Ser
1535
<210> 38
<211> 1725
<212> PRT
<213> Cricetulus griseus
<400> 38
Met Gly Arg Pro Gln Gly Phe Arg Ile Pro Arg Gly Pro Val Gln Gln
1 5 10 15
Pro Leu Glu Asp Arg Ile Phe Pro Pro Thr Val Ser Ala Val Tyr Ser
20 25 30
Thr Val Thr Gln Val Ala Arg Gln Pro Gly Pro Pro Thr Pro Ser Pro
35 40 45
Tyr Ser Ala His Glu Ile Asn Lys Gly His Pro Asn Leu Ala Ala Thr
50 55 60
Pro Pro Gly His Ala Ser Ser Pro Gly Leu Ser Gln Thr Pro Tyr Pro
65 70 75 80
Ser Gly Gln Asn Ala Gly Pro Thr Thr Leu Val Tyr Pro Gln Ala Pro
85 90 95
Gln Thr Met Asn Ser Gln Pro Gln Thr Arg Ser Pro Pro Ser Arg Thr
100 105 110
Val Pro Ile His Cys Thr Asp Asn Trp Lys Arg Arg Lys Val Leu Glu
115 120 125
Gln Thr Pro Val Tyr Arg Ser Leu Ala Gly Arg Gly Trp Ile Lys Tyr
130 135 140
Cys Ile Phe Ala Ala Gly Pro Arg Pro Ala His His Gln Phe Phe Gln
145 150 155 160
Arg Pro Gln Ile Gln Pro Pro Arg Ala Thr Ile Pro Asn Ser Ser Pro
165 170 175
Ser Ile Arg Pro Gly Ala Gln Thr Pro Thr Ala Val Tyr Gln Ala Asn
180 185 190
Gln His Ile Met Met Val Asn His Leu Pro Met Pro Tyr Pro Val Pro
195 200 205
Gln Gly Pro Gln Tyr Cys Ile Pro Gln Tyr Arg His Ser Gly Pro Pro
210 215 220
Tyr Val Gly Pro Pro Gln Gln Tyr Pro Val Gln Pro Pro Gly Pro Gly
225 230 235 240
Pro Phe Tyr Pro Gly Pro Gly Pro Gly Asp Phe Ala Asn Ala Tyr Gly
245 250 255
Thr Pro Phe Tyr Pro Ser Gln Pro Val Tyr Gln Ser Ala Pro Ile Ile
260 265 270
Val Pro Thr Gln Gln Gln Pro Pro Pro Ala Lys Arg Glu Lys Lys Thr
275 280 285
Ile Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile Thr Glu Glu
290 295 300
Ile Met Ser Gly Gly Gly Ser Arg Asn Pro Thr Pro Pro Ile Gly Arg
305 310 315 320
Pro Thr Ser Thr Pro Thr Pro Pro Gln Gln Leu Pro Ser Gln Val Pro
325 330 335
Glu His Ser Pro Val Val Tyr Gly Thr Val Glu Ser Ala His Leu Ala
340 345 350
Ala Ser Thr Pro Val Thr Ala Ala Ser Asp Gln Lys Gln Glu Glu Lys
355 360 365
Pro Lys Pro Asp Pro Val Phe Gln Ser Pro Ser Thr Val Leu Arg Leu
370 375 380
Val Leu Ser Gly Glu Lys Lys Glu Gln Ala Ser Pro Val Pro Glu Thr
385 390 395 400
Pro Ala Gly Glu Pro Thr Pro Glu Leu Pro Arg Thr Ser Ser Pro Thr
405 410 415
Thr Leu Ala Pro Leu Ala Arg Ser Ser Val Pro Ser Pro Thr Cys Ala
420 425 430
Ala Leu Ser Ser Gln Pro Leu Phe Thr Thr Ala Leu Glu Asp Lys Arg
435 440 445
Asp Leu Ser Ser Ser Gln Glu Asp Ala Leu Pro Val Pro Ser Pro Thr
450 455 460
Ser Cys Thr Val Thr Ser Asp Pro Ser Leu Thr Asp Asp Lys Asn Ile
465 470 475 480
Cys Lys Lys Pro Cys Ser Val Ala Pro His Asp Ile Gln Leu Ile Ser
485 490 495
Thr Pro Asn Leu Met Asn Glu Met Asn Gly Val Gly Glu Lys Leu Pro
500 505 510
Ala Gln Glu Ser Ile Val Asp Met Ala Lys Gln Glu Thr Leu Pro Leu
515 520 525
Thr Leu Glu Leu Glu Ile Leu Glu His Ala Gln Glu Glu Met Lys Val
530 535 540
Glu Cys Thr Pro Thr Ala Ile Thr Pro Ser Met Leu Thr Ser Phe Ser
545 550 555 560
Pro Ala Pro Leu Thr Pro Pro Ser Ser Pro Cys Ala Pro Val Ile Ser
565 570 575
Ala Thr Thr Ala Arg Ser Pro Val Ala Ala Thr Val Val Gln Arg Val
580 585 590
Ala Glu Glu Gly Glu Ser Ile Arg Thr Cys Leu Ser Glu Asp Ala Asn
595 600 605
Glu Thr Gln Tyr Lys Thr Glu Ala Glu Ala Asp Gly Gln Thr Glu Glu
610 615 620
Ile Val Asp Ser Gln Asn Leu Asn Ser Arg Arg Ser Pro Gly Pro Val
625 630 635 640
Gln Thr Ala Ile Ile Ala Pro Lys Thr Trp Lys Lys Ala Lys Asp Arg
645 650 655
Ser Arg Thr Pro Asp Glu Val Leu Glu Ala Glu Ala Glu Pro Lys Ala
660 665 670
Asp Glu Glu Leu Pro Asp Asp Arg Val Leu Glu Pro Glu Thr Asp Lys
675 680 685
Met Ser Gln Gly Phe His Phe Glu Arg Asp Ser Ser Ala Leu Lys Arg
690 695 700
Val Lys Ala Gly Glu Glu Asn Gly Glu Glu Val Glu Pro Leu Arg Asn
705 710 715 720
Gly Ala Glu Ser Pro Ser Glu Gly Glu Gly Gly Asp Ala Asn Ser Gly
725 730 735
Ser Thr Asp Ser Ser Gly Asp Gly Ile Pro Phe Pro Phe Lys Ala Glu
740 745 750
Ser Trp Lys Pro Ala Asp Thr Glu Gly Lys Lys Gln Tyr Asp Arg Glu
755 760 765
Phe Leu Leu Asp Ile Gln Phe Met Pro Ala Cys Ile Gln Lys Pro Glu
770 775 780
Gly Leu Pro Pro Ile Ser Asp Val Val Leu Asp Lys Ile Asn Gln Pro
785 790 795 800
Arg Leu Pro Met Arg Thr Leu Asp Pro Arg Ile Leu Pro Arg Gly Pro
805 810 815
Asp Phe Thr Pro Ala Phe Ala Asp Phe Gly Arg Gln Thr Pro Gly Gly
820 825 830
Arg Gly Val Pro Leu Leu Asn Val Gly Pro Arg Arg Ser Gln Pro Gly
835 840 845
Gln Arg Arg Glu Pro Arg Lys Ile Ile Thr Val Ser Val Lys Glu Asp
850 855 860
Val His Leu Arg Lys Ala Glu Asn Ala Trp Lys Pro Ser Gln Lys Arg
865 870 875 880
Asp Ser His Ala Asp Asp Pro Glu Ser Ile Lys Thr Gln Glu Leu Phe
885 890 895
Arg Lys Val Arg Ser Ile Leu Asn Lys Leu Thr Pro Gln Met Phe Asn
900 905 910
Gln Leu Met Lys Gln Val Ser Gly Leu Thr Val Asp Thr Glu Glu Arg
915 920 925
Leu Lys Gly Val Ile Asp Leu Val Phe Glu Lys Ala Ile Asp Glu Pro
930 935 940
Ser Phe Ser Val Ala Tyr Ala Asn Met Cys Arg Cys Leu Val Thr Leu
945 950 955 960
Lys Val Pro Met Ala Glu Lys Pro Gly Asn Thr Val Asn Phe Arg Lys
965 970 975
Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu Lys Asp Lys Ala Asp
980 985 990
Asp Asp Val Phe Glu Lys Lys Gln Lys Glu Leu Glu Ala Ala Ser Ala
995 1000 1005
Pro Glu Glu Arg Thr Arg Leu His Asp Glu Leu Glu Glu Ala Lys
1010 1015 1020
Asp Lys Ala Arg Arg Arg Ser Ile Gly Asn Ile Lys Phe Ile Gly
1025 1030 1035
Glu Leu Phe Lys Leu Lys Met Leu Thr Glu Ala Ile Met His Asp
1040 1045 1050
Cys Val Val Lys Leu Leu Lys Asn His Asp Glu Glu Ser Leu Glu
1055 1060 1065
Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp Phe
1070 1075 1080
Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe Asn Gln Met Glu
1085 1090 1095
Lys Ile Val Lys Glu Arg Lys Thr Ser Ser Arg Ile Arg Phe Met
1100 1105 1110
Leu Gln Asp Val Ile Asp Leu Arg Leu Cys Asn Trp Val Ser Arg
1115 1120 1125
Arg Ala Asp Gln Gly Pro Lys Thr Ile Glu Gln Ile His Lys Glu
1130 1135 1140
Ala Lys Ile Glu Glu Gln Glu Glu Gln Arg Lys Val Gln Gln Leu
1145 1150 1155
Met Thr Lys Glu Lys Arg Arg Pro Gly Val Gln Arg Val Asp Glu
1160 1165 1170
Gly Gly Trp Asn Thr Val Gln Gly Ala Lys Asn Ser Arg Val Leu
1175 1180 1185
Asp Pro Ser Lys Phe Leu Lys Ile Thr Lys Pro Thr Ile Asp Glu
1190 1195 1200
Lys Ile Gln Leu Val Pro Lys Ala Gln Leu Gly Ser Trp Gly Lys
1205 1210 1215
Gly Ser Ser Gly Gly Ala Lys Ala Ser Glu Thr Asp Ala Leu Arg
1220 1225 1230
Ser Ser Ala Ser Ser Leu Asn Arg Phe Ser Pro Leu Gln Pro Pro
1235 1240 1245
Ala Pro Ser Gly Ser Pro Ser Thr Thr Pro Leu Glu Phe Asp Ser
1250 1255 1260
Arg Arg Ala Leu Thr Ser Arg Gly Ser Met Gly Arg Glu Lys Ser
1265 1270 1275
Asp Lys Pro Leu Pro Thr Gly Ala Ala Arg Pro Asn Thr Phe Leu
1280 1285 1290
Arg Gly Ser Ser Lys Asp Leu Leu Asp Asn Gln Ser Gln Glu Glu
1295 1300 1305
Gln Arg Arg Glu Met Leu Glu Thr Val Lys Gln Leu Thr Gly Gly
1310 1315 1320
Val Asp Thr Glu Arg Ala Ser Ser Glu Ala Asp Arg Ser Lys Thr
1325 1330 1335
Arg Glu Leu Val Lys Ser Glu Met Cys Ala Val Ser Pro Pro Asp
1340 1345 1350
Lys Pro Ala Leu Ser Glu Glu Glu Val Glu Arg Lys Ser Lys Ser
1355 1360 1365
Ile Ile Asp Glu Phe Leu His Ile Asn Asp Phe Lys Glu Ala Thr
1370 1375 1380
Gln Cys Ile Glu Glu Leu Ser Ala Gln Gly Pro Leu His Val Phe
1385 1390 1395
Val Lys Val Gly Val Glu Phe Thr Leu Glu Arg Ser Gln Ile Thr
1400 1405 1410
Arg Asp His Met Gly His Leu Leu Tyr Gln Leu Val Gln Ser Glu
1415 1420 1425
Lys Leu Ser Lys Gln Asp Phe Phe Lys Gly Phe Ser Glu Thr Leu
1430 1435 1440
Glu Leu Ala Asp Asp Met Ala Ile Asp Ile Pro His Ile Trp Leu
1445 1450 1455
Tyr Leu Ala Glu Leu Val Thr Pro Met Leu Lys Glu Gly Gly Ile
1460 1465 1470
Ser Met Arg Glu Leu Ile Val Glu Phe Ser Lys Pro Leu Leu Pro
1475 1480 1485
Val Gly Arg Ala Gly Val Leu Leu Ser Glu Ile Leu Arg Leu Leu
1490 1495 1500
Cys Lys Gln Met Ser His Lys Lys Val Gly Ala Leu Trp Arg Glu
1505 1510 1515
Ala Asp Leu Ser Trp Lys Asp Phe Leu Pro Glu Gly Glu Asp Val
1520 1525 1530
His His Phe Leu Leu Glu Gln Lys Leu Asp Phe Ile Glu Thr Glu
1535 1540 1545
Ser Ser Cys Ser Ser Glu Ala Leu Ser Lys Arg Glu Leu Ser Ala
1550 1555 1560
Glu Glu Leu Ser Gln Arg Leu Glu Lys Leu Ile Met Glu Asp Lys
1565 1570 1575
Ala Asp Asp Glu Arg Ile Phe Asp Trp Val Glu Ala Asn Leu Asp
1580 1585 1590
Glu Ser Gln Met Ser Ser Pro Thr Phe Leu Arg Ala Leu Met Thr
1595 1600 1605
Ala Val Cys Lys Ala Ala Ile Ile Ala Asp Cys Pro Thr Phe Arg
1610 1615 1620
Val Asp Thr Ala Val Ile Lys Gln Arg Val Pro Ile Leu Leu Lys
1625 1630 1635
Tyr Leu Asp Ser Asp Thr Glu Lys Glu Leu Gln Ala Leu Tyr Ala
1640 1645 1650
Leu Gln Ala Ser Ile Val Lys Leu Asp Gln Pro Ala Asn Leu Leu
1655 1660 1665
Arg Met Phe Phe Asp Cys Leu Tyr Asp Glu Glu Val Ile Ser Glu
1670 1675 1680
Asp Ala Phe Tyr Lys Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln
1685 1690 1695
Asn Gly Lys Gly Val Ala Leu Lys Ser Val Thr Ala Phe Phe Thr
1700 1705 1710
Trp Leu Arg Glu Ala Glu Glu Glu Ser Glu Asp Asn
1715 1720 1725
<210> 39
<211> 1017
<212> PRT
<213> Kluyveromyces lactis
<400> 39
Met Gly Glu Pro Thr Ser Glu Gln Gln Pro Ala Val Glu Ala Pro Val
1 5 10 15
Val Gln Glu Glu Thr Ile Ser Ser Pro Gln Lys Asn Ser Gly Tyr Val
20 25 30
Lys Asn Thr Ala Gly Ser Gly Ala Pro Arg Asn Gly Lys Tyr Asp Gly
35 40 45
Asn Arg Lys Asn Ser Arg Pro Tyr Asn Gln Arg Gly Asn Asn Asn Asn
50 55 60
Asn Asn Asn Gly Ser Ser Ser Asn Lys His Tyr Gln Lys Tyr Asn Gln
65 70 75 80
Pro Ala Tyr Gly Val Pro Ala Gly Tyr Ile Pro Asn Tyr Ala Val Ser
85 90 95
Ala Glu Tyr Asn Pro Leu Tyr Tyr Asn Gln Tyr Gln Gln Gln Gln Gln
100 105 110
Leu Tyr Ala Ala Ala Tyr Gln Thr Pro Met Ser Gly Gln Gly Tyr Val
115 120 125
Ala Pro Val Val Ser Pro Ala Ala Val Ser Ala Lys Pro Ala Lys Val
130 135 140
Glu Ile Thr Asn Lys Ser Gly Glu His Ile Asp Ile Ala Ser Ile Ala
145 150 155 160
His Pro His Thr His Ser His Ser Gln Ser His Ser Arg Ala Val Pro
165 170 175
Val Val Ser Pro Pro Ala Asn Ala Ala Val Thr Ala Ala Ala Ser Ser
180 185 190
Ser Val Ser Pro Ser Ala Ser Pro Ala Val Lys Val Gln Ser Pro Ala
195 200 205
Ala Asn Asp Lys Glu Gln Ser Pro Ala Lys Pro Glu Glu Pro Lys Lys
210 215 220
Asp Thr Leu Ile Val Asn Asp Phe Leu Glu Gln Val Lys Arg Arg Lys
225 230 235 240
Ala Ala Leu Ala Ala Lys Lys Ala Val Glu Glu Arg Gly Ser Glu Glu
245 250 255
Gln Lys Glu Pro Val Val Gly Ala Asp Thr Asp Ala Asn Val Asp Ala
260 265 270
Lys Thr Gly Ser Thr Ala Ala Asp Ser Thr Lys Ser Glu Glu Ala Gln
275 280 285
Ser Glu Ser Gln Glu Lys Thr Lys Glu Glu Ala Pro Ala Glu Pro Lys
290 295 300
Pro Leu Thr Leu Ala Glu Lys Leu Arg Leu Lys Arg Met Glu Ala Ala
305 310 315 320
Lys Gln Ala Ser Ala Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys
325 330 335
Pro Glu Glu Leu Lys Thr Glu Glu Pro Lys Ala Glu Glu Pro Lys Ala
340 345 350
Glu Glu Pro Lys Leu Glu Glu Pro Lys Pro Glu Glu Pro Lys Thr Glu
355 360 365
Glu Pro Lys Thr Glu Glu Pro Lys Thr Glu Glu Pro Lys Ser Glu Glu
370 375 380
Pro Lys Ser Glu Glu Pro Lys Ser Asp Glu Pro Lys Ser Asp Glu Pro
385 390 395 400
Lys Ala Glu Glu Pro Lys Thr Glu Glu Leu Lys Thr Glu Glu Pro Lys
405 410 415
Thr Glu Glu Leu Lys Thr Glu Glu Pro Lys Thr Glu Glu Thr Lys Pro
420 425 430
Glu Glu Pro Lys Thr Glu Glu Ser Ala Thr Glu Ala Asn Ala Lys Glu
435 440 445
Gly Glu Pro Ala Pro Ala Gly Ser Val Glu Thr Pro Ala Asp Val Glu
450 455 460
Thr Lys Pro Gln Glu Glu Thr Glu Val Glu Asp Asp Gly Lys Ile Thr
465 470 475 480
Met Thr Asp Phe Leu Gln Lys Leu Lys Glu Val Ser Pro Val Asp Asp
485 490 495
Ile Tyr Ser Phe Gln Tyr Pro Ser Asp Ile Thr Pro Pro Asn Asp Arg
500 505 510
Tyr Lys Lys Thr Ser Ile Lys Tyr Ala Tyr Gly Pro Asp Phe Leu Tyr
515 520 525
Gln Phe Lys Asp Lys Val Asp Val Lys Tyr Asp Pro Ala Trp Met Ala
530 535 540
Glu Met Thr Ser Lys Ile Val Ile Pro Pro Lys Lys Pro Gly Ser Ser
545 550 555 560
Gly Arg Gly Glu Asp Arg Phe Ser Lys Gly Lys Val Gly Ser Leu Arg
565 570 575
Ser Glu Gly Arg Ser Gly Ser Arg Ser Asn Ser Lys Lys Lys Ser Lys
580 585 590
Arg Asp Asp Arg Lys Ser Asn Arg Ser Tyr Thr Ser Arg Lys Asp Arg
595 600 605
Glu Arg Phe Arg Glu Glu Glu Val Glu Glu Pro Lys Val Glu Val Ala
610 615 620
Pro Leu Val Pro Ser Ala Asn Arg Trp Val Pro Lys Ser Lys Met Lys
625 630 635 640
Lys Thr Glu Val Lys Leu Ala Pro Asp Gly Thr Glu Leu Tyr Asp Ala
645 650 655
Glu Glu Ala Ser Arg Lys Met Lys Ser Leu Leu Asn Lys Leu Thr Leu
660 665 670
Glu Met Phe Glu Pro Ile Ser Asp Asp Ile Met Lys Ile Ala Asn Gln
675 680 685
Ser Lys Trp Glu Glu Lys Gly Glu Thr Leu Lys Ile Val Ile Gln Gln
690 695 700
Ile Phe Asn Lys Ala Cys Asp Glu Pro His Trp Ser Ser Met Tyr Ala
705 710 715 720
Gln Leu Cys Gly Lys Val Val Lys Asp Leu Asp Asp Ser Ile Lys Asp
725 730 735
Ser Glu Thr Pro Asp Lys Thr Gly Ser His Leu Val Leu His Tyr Leu
740 745 750
Val Gln Arg Cys Gln Thr Glu Phe Gln Thr Gly Trp Thr Asp Gln Leu
755 760 765
Pro Thr Asn Glu Asp Gly Thr Pro Leu Gln Pro Glu Met Met Ser Asp
770 775 780
Glu Tyr Tyr Lys Met Ala Ala Ala Lys Arg Arg Gly Leu Gly Leu Val
785 790 795 800
Arg Phe Ile Gly Phe Leu Tyr Arg Ser Asn Leu Leu Thr Ser Arg Met
805 810 815
Val Phe Phe Cys Phe Lys Arg Leu Met Lys Asp Ile Gln Asn Ser Pro
820 825 830
Thr Glu Asp Thr Leu Glu Ser Val Cys Glu Leu Leu Glu Thr Ile Gly
835 840 845
Glu Gln Phe Glu Gly Ala Arg Ile Gln Val Thr Ala Glu Ala Val Ile
850 855 860
Glu Gly Ser Ser Leu Leu Asp Thr Leu Phe Asp Gln Ile Lys Asn Val
865 870 875 880
Ile Glu Asn Gly Asp Ile Ser Ser Arg Ile Lys Phe Lys Leu Ile Asp
885 890 895
Ile Val Glu Leu Arg Glu Lys Arg Asn Trp Asn Ser Lys Asn Lys Asn
900 905 910
Asp Gly Pro Lys Thr Ile Ala Gln Ile His Glu Glu Glu Ala Leu Lys
915 920 925
Arg Ala Leu Glu Glu Arg Glu Arg Glu Arg Asp Arg His Gly Ser Arg
930 935 940
Gly Gly Ser Arg Arg Met Asn Ser Glu Arg Asn Ser Ser Arg Arg Asp
945 950 955 960
Phe Ser Ser His Ser His Ser His Asn Gln Asn Arg Asp Gly Phe Thr
965 970 975
Thr Thr Arg Ser Ser Ser Val Arg Tyr Ser Glu Pro Lys Lys Glu Glu
980 985 990
Gln Ala Pro Thr Pro Thr Lys Ser Ser Ala Gly Ala Ala Asn Met Phe
995 1000 1005
Asp Ala Leu Met Asp Ala Glu Asp Asp
1010 1015
<210> 40
<211> 1013
<212> PRT
<213> Ogataea polymorpha
<400> 40
Met Ser Asn Pro Asn Ser Val Pro Pro Thr Gly Asn Ala His His His
1 5 10 15
Tyr Asn Ser Asn Tyr His Lys Asn Arg Arg Asn Asn Gly Ser Tyr Ser
20 25 30
Asn Tyr Ser Gln Ser His Pro Gln Pro Pro Tyr Tyr Gln Gln Gln Gly
35 40 45
Trp Thr Gly Tyr Met Thr Gln Pro Tyr Gln Ala Ala Ala Pro Gly Tyr
50 55 60
Ala Tyr Ser Tyr Tyr Ala Pro Ser Pro Gln Gly Val Ser Gly Gly Ala
65 70 75 80
Tyr Tyr Ala Pro Pro Pro Pro Gly Ala Ile Ala Ile Ser Pro Thr Leu
85 90 95
Pro Asn Ser Ala Thr His Thr Pro Val Thr Lys Pro Val Asn Leu Ser
100 105 110
Ile Lys Asn Lys Asn Gly Glu Ala Val Gln Phe Asn Lys Gly His Ser
115 120 125
Lys Thr Ala Ser Leu Ser Ser Ser Ser Ser Ser Ser Thr Pro Val Leu
130 135 140
Ser Lys Val Asn Ala Ser Leu Pro Ala Val Pro Pro Ser Thr Ser Ser
145 150 155 160
Thr Ala Ser Val Pro Met Ser Pro Ser Lys Lys Asp Ser Ser Pro Ala
165 170 175
Lys Pro Ala Gln Pro Glu Val Lys Lys Ala Asn Glu Glu Phe Lys Ala
180 185 190
Lys Phe Leu Glu Gln Leu Arg Leu Lys Asn Ser Lys Ala Thr Ser Glu
195 200 205
Lys Lys Glu Glu Lys Ser Gln Pro Thr Lys Glu Val Glu Lys Glu Ser
210 215 220
Lys Pro Asp Ala Ser Ser Lys Lys Ser Glu Pro Pro Lys Glu Leu Pro
225 230 235 240
Gln Glu Ile Ser Lys Glu Ala Pro Lys Pro Ala Glu Lys Pro Glu Thr
245 250 255
Ser Lys Glu Glu Pro Lys Glu Pro Ala Glu Ser Ala Lys Pro Ala Lys
260 265 270
Pro Ala Val Pro Ser Ala Ser Ile Glu Gln Gln Lys Glu Glu Thr Lys
275 280 285
Glu Ile Glu Lys Thr Gln Pro Asn Ser Lys Gln Ala Glu Lys Pro Glu
290 295 300
Glu Leu Gln Ala Val Pro Glu Ser Pro Val Glu Ser Ile Gln Pro Lys
305 310 315 320
Pro Val Ala Ala Ser Ala Pro Ser Val Asp Glu Val Lys Glu Glu Ala
325 330 335
Gln Pro Thr Pro Val Lys Glu Glu Pro Ile Asn Ala Asp Ser Glu Gln
340 345 350
Thr Glu Gly Pro Lys Ser Ser Pro Val Ala Asp Ser Gln Glu Asp Thr
355 360 365
Lys Asp Glu Thr Ala Glu Pro Leu Glu Ala Ala Ser Pro Gly Ile Asp
370 375 380
Lys Thr Phe Asp Met Thr Arg Phe Phe Ala Gln Ile Ser Lys Ala Thr
385 390 395 400
Pro Ile Lys Asp Ile Tyr Ala Phe Pro Tyr Lys Glu Gly Gln Glu Lys
405 410 415
Pro Asp Leu Arg Leu Gln Asn Ser Pro Lys Asn Lys Tyr Ser Pro Pro
420 425 430
Phe Leu Leu Gln Phe Gln Pro Val Cys Gln Phe Pro Val Asp Asp Glu
435 440 445
Trp Asp Ala Lys Val Arg Ser Ile Ile Asp Leu Val Gly Ala Lys Lys
450 455 460
Glu Ser Arg Asp Arg Gly Phe Ser Arg Ser Gly Ser Gln Phe Gly Arg
465 470 475 480
Gly Gly Ala Gly Ser Ser Asn Ala Met Pro Arg Ser Ala Thr Leu Arg
485 490 495
Gly Glu Phe Gly Ser Arg Asn Gly Ser Arg Gly Gly Ser Lys Lys Lys
500 505 510
Met Gly Leu Gly Ser Arg Glu Lys Ser Gln Arg Gln Gly Ser Lys Lys
515 520 525
Pro Arg Arg Leu Asp Asp Glu Lys Asp Asn Lys Asp Glu Glu Thr Glu
530 535 540
Ala Pro Lys Gln Val Val Glu Val Lys Pro Leu Glu Lys Ser Ala Asn
545 550 555 560
Arg Trp Val Pro Arg Ser Gln Arg Asn Lys Glu Lys Glu Val Arg Tyr
565 570 575
Ala Pro Asp Gly Val Thr Val Ile Leu Glu Glu Asp Asp Val Glu Ala
580 585 590
Lys Val Lys Ser His Leu Asn Lys Leu Thr Leu Asp Asn Phe Asp Thr
595 600 605
Ile Ser Ala Glu Ile Ile Gln Ile Ala Asn Gln Ala Arg Trp Glu Asp
610 615 620
Asp Val Lys Thr Leu Lys Gln Val Ile Glu Leu Thr Phe Ala Lys Ala
625 630 635 640
Cys Asp Glu His Leu Trp Ser Ser Val Tyr Ala Lys Leu Cys Leu Thr
645 650 655
Leu Cys Thr Asp Ile Ser Glu Asp Val Glu Asp Lys Ser Gln Pro Arg
660 665 670
Pro Glu Gln Val Pro Lys Arg Val Tyr Ser Ser Gly Leu Val Arg Lys
675 680 685
Leu Leu Leu Ser Arg Cys Gln Ala Glu Tyr Glu Lys Gly Trp Ser Asp
690 695 700
Lys Leu Pro Thr Asn Glu Asp Gly Thr Pro Leu Glu Pro Glu Met Met
705 710 715 720
Ser Asp Glu Tyr Tyr Lys Leu Ala Ala Ala Lys Arg Arg Gly Leu Gly
725 730 735
Leu Val Arg Phe Ile Gly Glu Leu Tyr Tyr Leu Asn Leu Leu Ser Glu
740 745 750
Lys Ile Ile Ile Lys Cys Leu Val Asp Gln Leu Ser Asp Ser Asp Ser
755 760 765
Pro Ser Glu Asp Thr Leu Glu Thr Leu Thr Gln Leu Leu Thr Thr Thr
770 775 780
Gly Ala Lys Leu Asp Ser Ser Asn Arg Gly Pro Leu Asp Phe Ala Phe
785 790 795 800
Glu Lys Ile Asn His Ile Ile Asn Asn Cys Gln Leu Ser Ser Arg Ile
805 810 815
Lys Phe Lys Leu Met Asp Leu Cys Asp Leu Arg Ala Asn Arg Trp Ala
820 825 830
Asp Ala Lys Ile Asn Ala Gly Pro Lys Thr Ile Ala Glu Ile His Gln
835 840 845
Glu Ala Glu Ala Lys Arg Leu Gln Glu Glu Arg Asp Ala Ile Arg Arg
850 855 860
Arg Lys Ala Asp Pro Arg Ser Gly Ser Ser Arg Ser Asn Ser Ser Arg
865 870 875 880
Ser Asn Ser Lys Trp Gly Asn Ser Asn Gln Ile Ser Ser Asn Asp Ile
885 890 895
Ser Lys Val Gly Val Val Arg Asn Ser Ser Glu Arg Ser Leu Gly Pro
900 905 910
Phe Asn Lys Gln Lys Ser Lys Leu Ser Ser Ser Lys Leu Ser Gln Gln
915 920 925
Gln Phe Thr Thr Val Pro Ser Ala Gly Ser Ala Asn Ser Ser Gly Ala
930 935 940
Ser Ser Gly Gln Lys Arg Ala Gly Thr Pro Pro Asp Glu Pro Arg Glu
945 950 955 960
Ala Ser Arg Asn Ile Phe Ala Ala Leu Gly Asp His Glu Asp Glu Asp
965 970 975
Ser Asp Arg Glu Ala Glu His His Glu Pro Glu Pro Glu His Glu Gly
980 985 990
Ala Asp Ile Ser Ser Ala His His Glu Gly Val Ser Ala Val Ala Asp
995 1000 1005
Ser Glu Ser Gln Ala
1010
<210> 41
<211> 952
<212> PRT
<213> Saccharomyces cerevisiae
<400> 41
Met Thr Asp Glu Thr Ala His Pro Thr Gln Ser Ala Ser Lys Gln Glu
1 5 10 15
Ser Ala Ala Leu Lys Gln Thr Gly Asp Asp Gln Gln Glu Ser Gln Gln
20 25 30
Gln Arg Gly Tyr Thr Asn Tyr Asn Asn Gly Ser Asn Tyr Thr Gln Lys
35 40 45
Lys Pro Tyr Asn Ser Asn Arg Pro His Gln Gln Arg Gly Gly Lys Phe
50 55 60
Gly Pro Asn Arg Tyr Asn Asn Arg Gly Asn Tyr Asn Gly Gly Gly Ser
65 70 75 80
Phe Arg Gly Gly His Met Gly Ala Asn Ser Ser Asn Val Pro Trp Thr
85 90 95
Gly Tyr Tyr Asn Asn Tyr Pro Val Tyr Tyr Gln Pro Gln Gln Met Ala
100 105 110
Ala Ala Gly Ser Ala Pro Ala Asn Pro Ile Pro Val Glu Glu Lys Ser
115 120 125
Pro Val Pro Thr Lys Ile Glu Ile Thr Thr Lys Ser Gly Glu His Leu
130 135 140
Asp Leu Lys Glu Gln His Lys Ala Lys Leu Gln Ser Gln Glu Arg Ser
145 150 155 160
Thr Val Ser Pro Gln Pro Glu Ser Lys Leu Lys Glu Thr Ser Asp Ser
165 170 175
Thr Ser Thr Ser Thr Pro Thr Pro Thr Pro Ser Thr Asn Asp Ser Lys
180 185 190
Ala Ser Ser Glu Glu Asn Ile Ser Glu Ala Glu Lys Thr Arg Arg Asn
195 200 205
Phe Ile Glu Gln Val Lys Leu Arg Lys Ala Ala Leu Glu Lys Lys Arg
210 215 220
Lys Glu Gln Leu Glu Gly Ser Ser Gly Asn Asn Asn Ile Pro Met Lys
225 230 235 240
Thr Thr Pro Glu Asn Val Glu Glu Lys Gly Ser Asp Lys Pro Glu Val
245 250 255
Thr Glu Lys Thr Lys Pro Ala Glu Glu Lys Ser Ala Glu Pro Glu Val
260 265 270
Lys Gln Glu Thr Pro Ala Glu Glu Gly Glu Gln Gly Glu Lys Gly Gln
275 280 285
Ile Lys Glu Glu Ser Thr Pro Lys Val Leu Thr Phe Ala Glu Arg Leu
290 295 300
Lys Leu Lys Lys Gln Gln Lys Glu Arg Glu Glu Lys Thr Glu Gly Lys
305 310 315 320
Glu Asn Lys Glu Val Pro Val Gln Glu Glu Thr Lys Ser Ala Ile Glu
325 330 335
Ser Ala Pro Val Pro Pro Ser Glu Gln Val Lys Glu Glu Thr Glu Val
340 345 350
Ala Glu Thr Glu Gln Ser Asn Ile Asp Glu Ser Ala Thr Thr Pro Ala
355 360 365
Ile Pro Thr Lys Ser Asp Glu Ala Glu Ala Glu Val Glu Ala Glu Ala
370 375 380
Gly Asp Ala Gly Thr Lys Ile Gly Leu Glu Ala Glu Ile Glu Thr Thr
385 390 395 400
Thr Asp Glu Thr Asp Asp Gly Thr Asn Thr Val Ser His Ile Leu Asn
405 410 415
Val Leu Lys Asp Ala Thr Pro Ile Glu Asp Val Phe Ser Phe Asn Tyr
420 425 430
Pro Glu Gly Ile Glu Gly Pro Asp Ile Lys Tyr Lys Lys Glu His Val
435 440 445
Lys Tyr Thr Tyr Gly Pro Thr Phe Leu Leu Gln Phe Lys Asp Lys Leu
450 455 460
Asn Val Lys Ala Asp Ala Glu Trp Val Gln Ser Thr Ala Ser Lys Ile
465 470 475 480
Val Ile Pro Pro Gly Met Gly Arg Gly Asn Arg Ser Arg Asp Ser Gly
485 490 495
Arg Phe Gly Asn Asn Ser Ser Arg Gly His Asp Phe Arg Asn Thr Ser
500 505 510
Val Arg Asn Met Asp Asp Arg Ala Asn Ser Arg Thr Ser Ser Lys Arg
515 520 525
Arg Ser Lys Arg Met Asn Asp Asp Arg Arg Ser Asn Arg Ser Tyr Thr
530 535 540
Ser Arg Arg Asp Arg Glu Arg Gly Ser Tyr Arg Asn Glu Glu Lys Arg
545 550 555 560
Glu Asp Asp Lys Pro Lys Glu Glu Val Ala Pro Leu Val Pro Ser Ala
565 570 575
Asn Arg Trp Val Pro Lys Phe Lys Ser Lys Lys Thr Glu Lys Lys Leu
580 585 590
Ala Pro Asp Gly Lys Thr Glu Leu Leu Asp Lys Asp Glu Val Glu Arg
595 600 605
Lys Met Lys Ser Leu Leu Asn Lys Leu Thr Leu Glu Met Phe Asp Ala
610 615 620
Ile Ser Ser Glu Ile Leu Ala Ile Ala Asn Ile Ser Val Trp Glu Thr
625 630 635 640
Asn Gly Glu Thr Leu Lys Ala Val Ile Glu Gln Ile Phe Leu Lys Ala
645 650 655
Cys Asp Glu Pro His Trp Ser Ser Met Tyr Ala Gln Leu Cys Gly Lys
660 665 670
Val Val Lys Glu Leu Asn Pro Asp Ile Thr Asp Glu Thr Asn Glu Gly
675 680 685
Lys Thr Gly Pro Lys Leu Val Leu His Tyr Leu Val Ala Arg Cys His
690 695 700
Ala Glu Phe Asp Lys Gly Trp Thr Asp Lys Leu Pro Thr Asn Glu Asp
705 710 715 720
Gly Thr Pro Leu Glu Pro Glu Met Met Ser Glu Glu Tyr Tyr Ala Ala
725 730 735
Ala Ser Ala Lys Arg Arg Gly Leu Gly Leu Val Arg Phe Ile Gly Phe
740 745 750
Leu Tyr Arg Leu Asn Leu Leu Thr Gly Lys Met Met Phe Glu Cys Phe
755 760 765
Arg Arg Leu Met Lys Asp Leu Thr Asp Ser Pro Ser Glu Glu Thr Leu
770 775 780
Glu Ser Val Val Glu Leu Leu Asn Thr Val Gly Glu Gln Phe Glu Thr
785 790 795 800
Asp Ser Phe Arg Thr Gly Gln Ala Thr Leu Glu Gly Ser Gln Leu Leu
805 810 815
Asp Ser Leu Phe Gly Ile Leu Asp Asn Ile Ile Gln Thr Ala Lys Ile
820 825 830
Ser Ser Arg Ile Lys Phe Lys Leu Ile Asp Ile Lys Glu Leu Arg His
835 840 845
Asp Lys Asn Trp Asn Ser Asp Lys Lys Asp Asn Gly Pro Lys Thr Ile
850 855 860
Gln Gln Ile His Glu Glu Glu Glu Arg Gln Arg Gln Leu Lys Asn Asn
865 870 875 880
Ser Arg Ser Asn Ser Arg Arg Thr Asn Asn Ser Ser Asn Arg His Ser
885 890 895
Phe Arg Arg Asp Ala Pro Pro Ala Ser Lys Asp Ser Phe Ile Thr Thr
900 905 910
Arg Thr Tyr Ser Gln Arg Asn Ser Gln Arg Ala Pro Pro Pro Lys Glu
915 920 925
Glu Pro Ala Ala Pro Thr Ser Thr Ala Thr Asn Met Phe Ser Ala Leu
930 935 940
Met Gly Glu Ser Asp Asp Glu Glu
945 950
<210> 42
<211> 1403
<212> PRT
<213> Schizosaccharomyces pombe
<400> 42
Met Ser Ser Lys Pro Pro Ser Asn Thr Pro Lys Phe Ser Tyr Ala Arg
1 5 10 15
Ala Leu Ala Ser Ser Gln Ser Asn Lys Ser Asn Ser Thr Lys Ala Ser
20 25 30
Glu Asn Asn Thr Ala Thr Ala Glu Lys Gln Ala Val Lys Pro Ser Gly
35 40 45
Val Glu Pro Thr Asn Thr Ser Arg Ala Asn Ala Gln Lys Lys Thr Glu
50 55 60
Ser Thr Gly Lys Ile Thr Ser Glu Ala Asp Thr Glu Lys Tyr Asn Ser
65 70 75 80
Ser Lys Ser Pro Val Asn Lys Glu Gly Ser Val Glu Lys Lys Ser Ser
85 90 95
Glu Lys Ser Ser Thr Asn Asn Lys Pro Trp Arg Gly Asp Asn Thr Ser
100 105 110
Lys Pro Ser Ala Asn Ser Ser Ala Glu Arg Thr Ser Ser Gln His Gln
115 120 125
Lys Pro Glu Thr Ser Ser Gln Ile Gly Lys Asp Asn Ala Ala Pro Val
130 135 140
Glu Asn Val Asn Glu Lys Ser Thr Ser Gln Glu Thr Ala Pro Pro Val
145 150 155 160
Ser Thr Val Pro Ile Gln Phe Gly Ser Ile Thr Arg Asn Ala Ala Ile
165 170 175
Pro Ser Lys Pro Lys Val Ser Gly Asn Met Gln Asn Lys Ser Gly Val
180 185 190
Ser Ser Tyr Ser Ser Lys Ser Gln Ser Val Asn Ser Ser Val Thr Ser
195 200 205
Asn Pro Pro His Thr Glu Glu Pro Val Ala Ala Lys Pro Glu Ala Ser
210 215 220
Ser Thr Ala Thr Lys Gly Pro Arg Pro Thr Thr Ser Ala Ser Asn Thr
225 230 235 240
Asn Thr Ser Pro Ala Asn Gly Ala Pro Thr Asn Lys Pro Ser Thr Asp
245 250 255
Ile Asn Thr Thr Asp Pro Ala Thr Gln Thr Thr Gln Val Ser Ala Ser
260 265 270
Asn Ser Pro Ala Leu Ser Gly Ser Ser Thr Pro Ser Asn Thr Ser Ser
275 280 285
Arg Ser Asn Arg Gln Asn His Gly Asn Phe Ser Glu Lys Arg His Tyr
290 295 300
Asp Arg Tyr Gly Asn Ser His Pro Ser Tyr Asn Lys Tyr Ser His Tyr
305 310 315 320
Gln His Gly Phe Asn Tyr Asn Asn Ser Gly Asn Asn Arg Asn Glu Ser
325 330 335
Gly His Pro Arg Phe Arg Asn Ser Arg Arg Asn Tyr Asn Asn Gln Gly
340 345 350
Ala Tyr Pro Thr Tyr Met Ser Asn Gly Arg Ser Ala Asn Gln Ser Pro
355 360 365
Arg Asn Asn Pro Gln Asn Val Asn Asn Gly Ser Thr Pro Ile Gln Ile
370 375 380
Pro Val Ser Leu Gln Thr Pro Tyr Gly Gln Val Tyr Gly Gln Pro Gln
385 390 395 400
Tyr Ile Val Asp Pro Asn Met Val Gln Tyr Gly Pro Ile Leu Gln Pro
405 410 415
Gly Tyr Val Pro Gln Tyr Tyr Pro Val Tyr His Gln Thr Pro Tyr Thr
420 425 430
Gln Asn Phe Pro Asn Met Ser Arg Ser Gly Ser Gln Val Ser Asp Gln
435 440 445
Val Val Glu Ser Pro Asn Ser Ser Thr Leu Ser Pro Arg Asn Gly Phe
450 455 460
Ala Pro Ile Val Lys Gln Gln Lys Lys Ser Ser Ala Leu Lys Ile Val
465 470 475 480
Asn Pro Val Thr His Thr Glu Val Val Val Pro Gln Lys Asn Ala Ser
485 490 495
Ser Pro Asn Pro Ser Glu Thr Asn Ser Arg Ala Glu Thr Pro Thr Ala
500 505 510
Ala Pro Pro Gln Ile Ser Glu Glu Glu Ala Ser Gln Arg Lys Asp Ala
515 520 525
Ile Lys Leu Ala Ile Gln Gln Arg Ile Gln Glu Lys Ala Glu Ala Glu
530 535 540
Ala Lys Arg Lys Ala Glu Glu Lys Ala Arg Leu Glu Ala Glu Glu Asn
545 550 555 560
Ala Lys Arg Glu Ala Glu Glu Gln Ala Lys Arg Glu Ala Glu Glu Lys
565 570 575
Ala Lys Arg Glu Ala Glu Glu Lys Ala Lys Arg Glu Ala Glu Glu Lys
580 585 590
Ala Lys Arg Glu Ala Glu Glu Asn Ala Lys Arg Glu Ala Glu Glu Lys
595 600 605
Ala Lys Arg Glu Ala Glu Glu Lys Ala Lys Arg Glu Ala Glu Glu Lys
610 615 620
Ala Lys Arg Glu Ala Glu Glu Lys Ala Lys Arg Glu Ala Glu Glu Lys
625 630 635 640
Ala Lys Arg Glu Ala Glu Glu Lys Ala Lys Arg Glu Ala Glu Glu Lys
645 650 655
Ala Lys Arg Glu Ala Glu Glu Asn Ala Lys Arg Glu Ala Glu Glu Lys
660 665 670
Ala Lys Arg Glu Ala Glu Glu Asn Ala Lys Arg Glu Ala Glu Glu Lys
675 680 685
Val Lys Arg Glu Thr Glu Glu Asn Ala Lys Arg Lys Ala Glu Glu Glu
690 695 700
Gly Lys Arg Glu Ala Asp Lys Asn Pro Glu Ile Lys Ser Ser Ala Pro
705 710 715 720
Leu Ala Ser Ser Glu Ala Asn Val Asp Thr Ser Lys Gln Thr Asn Ala
725 730 735
Thr Glu Pro Glu Val Val Asp Lys Thr Lys Val Glu Lys Leu Lys Ala
740 745 750
Ser Glu Gly Lys Ser Thr Ser Ser Leu Ser Ser Pro Ser His Ser Thr
755 760 765
Ser Ser Lys Arg Asp Leu Leu Ser Gly Leu Glu Ser Leu Ser Leu Lys
770 775 780
Thr Asn Pro Lys Ser Glu Gln Cys Leu Glu Ser Leu Leu Asn Ser Gln
785 790 795 800
Phe Ile Thr Asp Phe Ser Ala Leu Val Tyr Pro Ser Thr Ile Lys Pro
805 810 815
Pro Ser Thr Glu Glu Ala Leu Lys Ala Gly Lys Tyr Glu Tyr Asp Val
820 825 830
Pro Phe Leu Leu Gln Phe Gln Ser Val Tyr Thr Asp Lys Pro Met Lys
835 840 845
Gly Trp Asp Glu Arg Met Lys Glu Thr Val Ala Ser Ala Phe Ser Asp
850 855 860
Lys Ser Ser Arg Gly Met Tyr Ser Ser Ser Arg Gln Ser Ser Arg Ser
865 870 875 880
Gly Ser Asn Thr His Ser His Ala Gly Pro Gly Phe Gly Gly Pro Ser
885 890 895
Glu Arg Lys Gly Ile Ser Arg Leu Gly Ile Asp Arg Gly Phe Ser Ser
900 905 910
Ser Gly Ala Gly Phe Gly Ser Gly Ser Asn Tyr Lys Ser Ala Pro Ser
915 920 925
Arg Gly Val Ser His His Gly His Gly Gly Met Ser Gly Ser His Arg
930 935 940
Gly Ser Gln Arg Gly Ser Arg Arg Gly Gly Gly Glu Arg Asp Lys Pro
945 950 955 960
Asp Pro Ser Ser Leu Thr Ile Pro Val Asp Gln Val Ala Pro Leu Gln
965 970 975
Leu Ser Ala Asn Arg Trp Gln Pro Lys Lys Leu Thr Glu Lys Pro Ala
980 985 990
Glu Thr Lys Gly Glu Asp Glu Glu Ala Leu Leu Pro Pro Glu Val Val
995 1000 1005
Gln Arg Lys Val Lys Gly Ser Leu Asn Lys Met Thr Leu Glu Lys
1010 1015 1020
Phe Asp Lys Ile Ser Asp Gln Ile Leu Glu Ile Ala Met Gln Ser
1025 1030 1035
Arg Lys Glu Asn Asp Gly Arg Thr Leu Lys Gln Val Ile Gln Leu
1040 1045 1050
Thr Phe Glu Lys Ala Thr Asp Glu Pro Asn Phe Ser Asn Met Tyr
1055 1060 1065
Ala Arg Phe Ala Arg Lys Met Met Asp Ser Ile Asp Asp Ser Ile
1070 1075 1080
Arg Asp Glu Gly Val Leu Asp Lys Asn Asn Gln Pro Val Arg Gly
1085 1090 1095
Gly Leu Leu Phe Arg Lys Tyr Leu Leu Ser Arg Cys Gln Glu Asp
1100 1105 1110
Phe Glu Arg Gly Trp Lys Ala Asn Leu Pro Ser Gly Lys Ala Gly
1115 1120 1125
Glu Ala Glu Ile Met Ser Asp Glu Tyr Tyr Val Ala Ala Ala Ile
1130 1135 1140
Lys Arg Arg Gly Leu Gly Leu Val Arg Phe Ile Gly Glu Leu Phe
1145 1150 1155
Lys Leu Ser Met Leu Ser Glu Lys Ile Met His Glu Cys Ile Lys
1160 1165 1170
Arg Leu Leu Gly Asn Val Thr Asp Pro Glu Glu Glu Glu Ile Glu
1175 1180 1185
Ser Leu Cys Arg Leu Leu Met Thr Val Gly Val Asn Ile Asp Ala
1190 1195 1200
Thr Glu Lys Gly His Ala Ala Met Asp Val Tyr Val Leu Arg Met
1205 1210 1215
Glu Thr Ile Thr Lys Ile Pro Asn Leu Pro Ser Arg Ile Lys Phe
1220 1225 1230
Met Leu Met Asp Val Met Asp Ser Arg Lys Asn Gly Trp Ala Val
1235 1240 1245
Lys Asn Glu Val Glu Lys Gly Pro Lys Thr Ile Ala Glu Ile His
1250 1255 1260
Glu Glu Ala Glu Arg Lys Lys Ala Leu Ala Glu Ser Gln Arg Pro
1265 1270 1275
Ser Ser Gly Arg Met His Gly Arg Asp Met Asn Arg Gly Asp Ser
1280 1285 1290
Arg Met Gly Gly Arg Gly Ser Asn Pro Pro Phe Ser Ser Ser Asp
1295 1300 1305
Trp Ser Asn Asn Lys Asp Gly Tyr Ala Arg Leu Gly Gln Gly Ile
1310 1315 1320
Arg Gly Leu Lys Ser Gly Thr Gln Gly Ser His Gly Pro Thr Ser
1325 1330 1335
Leu Ser Ser Met Leu Lys Gly Gly Ser Val Ser Arg Thr Pro Ser
1340 1345 1350
Arg Gln Asn Ser Ala Leu Arg Arg Glu Gln Ser Val Arg Ala Pro
1355 1360 1365
Pro Ser Asn Val Ala Val Thr Ser Ala Asn Ser Phe Glu Leu Leu
1370 1375 1380
Glu Glu His Asp His Asp Asn Asp Gly Gly Gln Lys Asp Ser Asn
1385 1390 1395
Ser Lys Thr Ser Ser
1400
<210> 43
<211> 1603
<212> PRT
<213> Trichoderma reesei
<400> 43
Met Thr Ser Pro Ala Asn Gln Gln Thr Pro Ile Pro Ala Thr Thr Thr
1 5 10 15
Asn Ala Pro Thr Ala Pro Ser Tyr Ala Ser Ala Ala Gly Ala Pro Lys
20 25 30
Lys Pro Ala Gln Ala Pro Val Val Ala Ser Gly Ser Asn Ala Pro Leu
35 40 45
Val Val Gly Ser Ser Ala Pro Thr Ala Ser Ala Gln Asn Ala Lys Ala
50 55 60
Ala Ser Ser Pro Ser Pro Val Asn Gly Lys Gln Pro Val Pro Pro Ala
65 70 75 80
Val Pro Thr Val Ala Arg Ser Ser Phe Asn Gly Ser Gly Pro Asp His
85 90 95
Phe Arg Lys Gly Ser Val Thr Met Ala Ala Asn Gly Pro Ser Gly Phe
100 105 110
Val Pro Asn Gly Gly Ser Ile Ala Gly Ala Lys Ser Gly Ile Gln Phe
115 120 125
Gly Tyr Asp Ser Pro Ala Met Gly His Ser Thr Pro His Val Gly His
130 135 140
Ser Ala Pro Ile Pro Val Pro Asp Ala Asn Asn His His Arg Val Pro
145 150 155 160
Ser Pro Ala His Ser Pro Ala Pro Ile Pro Gln Pro Ser Ala Ser Gly
165 170 175
Gly Arg Pro Pro Ser Ser Leu Gln Gln Pro Thr Asn Gln Met Thr Phe
180 185 190
Gly Ser Leu Gly Ser Asp Gly Asp Arg His Met Arg Gln Gly Ser Val
195 200 205
Pro Pro Asn Pro Asn Leu Ala Asn Gln Ser Gly Ala His Phe Arg Arg
210 215 220
Glu Ser Ser His Ser Val Gln Ser Asp Ser Ser Arg Gly Asn Phe Gly
225 230 235 240
Pro Gln Asn Asn Arg Asn Arg Asn Ser Phe Asn Pro His Ala Thr Gln
245 250 255
Phe Asn Asn Gln Met Gly Phe Pro Pro Gln Asn Gln Phe Arg Thr Pro
260 265 270
Gly Gln Asn Arg Gly Met Pro Pro Ser Phe Gln Pro Asn Pro Arg Gly
275 280 285
Tyr Pro Asn Ser Pro Gln Pro Ala Arg Ser Pro Ala Leu Ala Asn Leu
290 295 300
Val Pro Ser Leu Pro Gly Thr Pro Asn Met Pro Pro Ala Thr Met Gln
305 310 315 320
Pro Asn Met Ala Met Pro Asn Ala Pro Ala Tyr His Tyr Pro Pro Pro
325 330 335
Ile Pro Ala Ser His Gln Gln Gln Val Gln Tyr Pro Phe Pro Ala Val
340 345 350
Ala Ala Lys Met His Ser Lys Pro Ser Tyr Lys Lys Ser Lys Ser Arg
355 360 365
Arg Glu Tyr Asp Arg His Phe Ser Gln Gly Ser Pro Leu Asp Thr Ala
370 375 380
His Asp Ala Pro Thr Ser Ala Ala Trp Pro Gln Gln Gln Gln Gln Gln
385 390 395 400
Gln His His Gln Arg Arg Phe Gly Ser Gln Gly Gln Arg Ala Asp Thr
405 410 415
Gln Trp Arg Ala His Asp Lys Asn Asn Met Arg Pro Ile Ser Ser Gly
420 425 430
Ile Gln Lys Asp Gly Pro Ser Ser Pro Ser Leu Pro Leu Val Asp Ala
435 440 445
Pro Leu Ser His Pro Asn Ser Leu Asp Leu Ser Pro Glu Asn Gly Gly
450 455 460
Phe Glu Leu Trp Leu Thr Trp Lys Asn Gln Thr Tyr Gly Phe Pro Pro
465 470 475 480
Gln Gln Met Asn Gln Tyr Gly Gln Pro Met Thr Val Pro Tyr Tyr Gly
485 490 495
Gly Ala Met Pro Tyr Met Gly Pro Pro Gln Pro Gly Ala Gln Ala Tyr
500 505 510
Asn Gln Gln Phe Ala Pro Pro Thr Phe His Gln Gln Ser His Ser Met
515 520 525
Ser Arg Thr Pro Ser Gln Pro Glu Arg Pro Ala Ser Ala Ser Gln Pro
530 535 540
Ser Gln Pro Ala Ile Val Ser Ser Asn Pro Lys Ala Leu Asn Ala Gln
545 550 555 560
Ala Asn Pro Asn Ser Phe Val Lys Pro Arg Lys Ser Ala Ala Val Gln
565 570 575
Ile Lys Asn Leu Ala Gly Glu Val Val Asp Thr Ser Thr Phe Lys Gln
580 585 590
Pro Ala Ser Pro Val Pro Ala Gln Thr Arg Thr Pro Pro Val Ile Ala
595 600 605
Ala Ser Thr Pro Pro Gln Gln Lys Leu Asp Ala Pro Ser His Ala Arg
610 615 620
Thr Asp Ser Gln Ser Pro Ser Lys Thr Ala Lys Glu Ile Gln Glu Glu
625 630 635 640
Leu Lys Ala Lys Ile Gln Ala Glu Ile Arg Ala Ala Ser Glu Lys Ala
645 650 655
Ala Lys Gln Glu Ala Gly Ala Lys Ala Gly Ala Ala Glu Asp Ala Ser
660 665 670
Ala Lys Lys Ala Glu Ala Ala Glu Ala Lys Val Glu Glu Lys Thr Glu
675 680 685
Ala Lys Ala Glu Ala Gln Pro Glu Val Lys Ala Gln Pro Glu Ala Thr
690 695 700
Pro Asp Val Lys Pro Glu Glu Pro Lys Ala Glu Pro Ala Glu Thr Lys
705 710 715 720
Ala Glu Ala Lys Ala Glu Pro Gln Pro Glu Ala Ala Ala Lys Ala Glu
725 730 735
Ala Pro Ala Pro Glu Lys Ala Ala Glu Lys Pro Ala Glu Glu Pro Ala
740 745 750
Glu Lys Ala Thr Glu Lys Ala Ala Glu Lys Pro Ala Glu Thr Pro Ala
755 760 765
Glu Ala Pro Lys Ala Glu Glu Pro Pro Ala Lys Ser Glu Glu Pro Ala
770 775 780
Lys Ser Asp Glu Pro Glu Glu Asp Glu Leu Glu Arg Ile Ile Arg Glu
785 790 795 800
Met Glu Glu Ala Glu Ala Lys Arg Glu Ala Gln Glu Glu Glu His Arg
805 810 815
Lys Lys Arg Glu Ala Glu Lys Ala Ala Gln Lys Ala Ala Glu Glu Ala
820 825 830
Asn Gln Lys Lys Asn Ala Glu Glu Ala Asp Arg Lys Leu Arg Glu Gln
835 840 845
Glu Arg Glu Met Glu Arg Leu Glu Glu Glu Lys Glu Arg Arg Arg Glu
850 855 860
Ala Ala Glu Ser Ser Gly Lys Thr Leu Ser Val Ala Glu Ala Leu Ala
865 870 875 880
Gln Met Arg Ser Gly Asn Ala Pro Asp Lys Lys Asp Glu Pro Ala Ser
885 890 895
Val Glu Ala Val Ala Asp Lys Leu Ala Asp Phe Ser Ile Ala Gly Asp
900 905 910
Lys Ser Gly Asp Ala Ala Gly Gln Lys Glu Lys Arg Val Ala Lys Pro
915 920 925
Ala Ala Leu Asn Leu Ala Pro Ile Lys Thr Ser Ala Val Glu Pro Pro
930 935 940
Gln Pro Ser Ala Ala Leu Gln Ser Leu Lys Ser Ala Arg Phe Leu Gln
945 950 955 960
Val Met Asp Gln Asp Ile Tyr Pro Glu Gly Ile Lys Ser Pro Asn Pro
965 970 975
Ala Leu Asn Ala Ala Val Ala Lys Lys Gly Lys Thr Phe Lys Tyr Asp
980 985 990
Ala Ala Phe Leu Leu Gln Phe Gln Lys Val Phe Thr Glu Gln Pro Ser
995 1000 1005
Leu Gln Phe His Gln Gln Ile Lys Gln Leu Ile Gly Asp Gly Asp
1010 1015 1020
Gly Asn Arg Ser Ala Ser Arg Gly Gln Thr Pro Ser Ser Ala Arg
1025 1030 1035
Gln Gly Ser Arg Gly Gly Gly Gly Phe Pro Gly Gly Ser Phe Gly
1040 1045 1050
Val Pro Gly Gly Arg Thr Leu Pro Pro Gly Thr Thr Ser Ala Asp
1055 1060 1065
Arg Met Ala Ile Ala Ser Gly Ala Leu Pro Arg Pro Gln Val Asn
1070 1075 1080
Pro Met Ala Ser Phe Gln Arg Pro Gly Ala Ala Phe Pro Ala Ser
1085 1090 1095
Ser Ser Met Ser Arg Thr Ser Ser Gln Asn Met Arg Asn Asn Leu
1100 1105 1110
Pro Asn Ser Pro Arg Gln Ser Ser Arg Ser Thr Arg Gly Ser Arg
1115 1120 1125
Arg Asn Asp Met Ala Ala Lys Glu Ala Gln Ala Ala Lys Thr Met
1130 1135 1140
Pro Leu Thr Ala Gly Gln Glu Val Lys Pro Ile Thr Val Ser Ala
1145 1150 1155
Ser Gly Trp Lys Ala Ser Ser Leu Gly Lys Ala Pro Ser Ala Ala
1160 1165 1170
Thr Pro Gln Pro Gly Gln Leu Met Asp Pro Glu Met Val Gln Arg
1175 1180 1185
Lys Val Lys Ala Ala Leu Asn Lys Met Thr Pro Glu Asn Phe Glu
1190 1195 1200
Arg Ile Ser Glu Gln Ile Leu Ala Ile Ala Ser Gln Ser Lys Asp
1205 1210 1215
Glu Thr Asp Gly Arg Thr Leu Arg Gln Val Ile Gln Leu Thr Phe
1220 1225 1230
Glu Lys Ala Thr Asp Glu Ala His Trp Ala Ser Met Tyr Ala Lys
1235 1240 1245
Phe Cys Lys Arg Met Leu Glu Thr Met Ser Pro Asp Ile Arg Asp
1250 1255 1260
Glu Asn Ile Lys Asp Lys Asn Gly Asn Val Val Ser Gly Gly Asn
1265 1270 1275
Leu Phe Arg Lys Tyr Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu
1280 1285 1290
Arg Gly Trp Thr Thr Asn Leu Pro Glu Ala Pro Lys Asp Thr Glu
1295 1300 1305
Glu Gly Glu Lys Lys Thr Gly Glu Ala Ala Met Leu Ser Asp Glu
1310 1315 1320
Tyr Tyr Ala Ala Ala Ala Ala Lys Arg Arg Gly Leu Gly Leu Val
1325 1330 1335
Gln Phe Ile Gly Glu Leu Phe Lys Leu Gly Met Leu Thr Glu Arg
1340 1345 1350
Ile Met His Glu Cys Val Thr Lys Leu Val Asp Tyr Lys Gly Met
1355 1360 1365
Pro Asp Glu Ala Glu Ile Glu Ser Leu Cys Lys Leu Leu Arg Thr
1370 1375 1380
Ile Gly Ala Asn Leu Asp Glu Thr Asp Lys Gly Arg Pro Leu Met
1385 1390 1395
Asp Ile Tyr Phe Gln Arg Ile Gln Gly Met Ala Asp Leu Pro Glu
1400 1405 1410
Leu Gln Ser Arg Met Arg Phe Met Leu Met Asp Val Ile Asp Leu
1415 1420 1425
Arg Lys Ala Arg Trp Val Ser Lys Glu Gly Asn Lys Gly Pro Lys
1430 1435 1440
Thr Leu Glu Glu Val Arg Ala Glu Ala Glu Ala Gln Ser Ala Ala
1445 1450 1455
Lys Ala Gln Glu Ala Ala Arg Thr Ser Gln Arg Gly Gly Pro Gly
1460 1465 1470
Gly Gly Arg Pro Pro Ala Gly Arg Gly Asp Ala Arg Gly Phe Ser
1475 1480 1485
Gly Ser Phe Asn Gln Pro Ser Asn Gln Val Gly Met Asp Asp Leu
1490 1495 1500
Arg Arg Leu Lys Gly Ser Ser Val Asn Arg Thr Ser Ser Ser Asn
1505 1510 1515
Val Thr Leu Gly Pro Thr Ser Met Leu Ser Ser Arg Ser Asn Ser
1520 1525 1530
Gly Arg Arg Phe Gly Pro Gly Gly Ala Leu Gly Arg Gly Gly Asp
1535 1540 1545
Asp Ser Asn Ser Ser Ser Arg Ala Gly Thr Pro Gly Pro Thr Ser
1550 1555 1560
Ser Asn Ala Phe Ser Leu Leu Ala Thr Met Asp Asp Gly His Pro
1565 1570 1575
Ala Ser Pro Pro Ser Ala Gly Pro Ser Pro Leu Met Ala Lys Ala
1580 1585 1590
Val Pro Ala Thr Asp Lys Lys Asp Asn Glu
1595 1600
<210> 44
<211> 904
<212> PRT
<213> Yarrowia lipolytica
<400> 44
Met Ser Tyr Thr Tyr Asn Asn Gly Ala Tyr Ser Pro Arg Asn Asn Gln
1 5 10 15
Pro Gly Thr Pro Asn Gln Gly Gln Gln His Met Ala Tyr Ser Pro Ala
20 25 30
Ala Met Tyr Asn Gly Gly Tyr Gly Tyr Val Asp Met Thr Gln Met Gln
35 40 45
Gly Gln Tyr Tyr Pro Pro Gln Glu Gly Met Ser Pro Gly Ala Gln Tyr
50 55 60
Ala Gln Pro Tyr Gly Ser Pro His His Thr His Ser Pro Leu Thr Ile
65 70 75 80
Met Asp Pro Val Thr His Arg Pro Ile Val Thr Pro Gly Ser Asn Thr
85 90 95
Gly Thr Pro Thr Gly Pro Asn Ala Thr Leu Ala Ser Pro Lys Pro Asn
100 105 110
Ser Pro Arg Val Ala His Arg Arg Thr Asp Ser Ser Asn Pro Ala Gly
115 120 125
Asp Ser Ile Lys Ala Asn Phe Met Ala Gln Val Leu Ala Ala Lys Ala
130 135 140
Lys Lys Glu Ala Ala Glu Lys Gly Thr Glu Lys Lys Glu Glu Val Lys
145 150 155 160
Glu Glu Lys Lys Glu Glu Pro Lys Pro Glu Thr Lys Pro Glu Glu Glu
165 170 175
Val Lys Lys Glu Glu Pro Lys Lys Glu Glu Pro Lys Glu Asp Gln Lys
180 185 190
Glu Glu Val Lys Glu Glu Leu Lys Glu Thr Pro Lys Glu Asp Ala Lys
195 200 205
Pro Val Glu Ala Glu Lys Pro Lys Glu Asp Val Lys Glu Glu Ala Lys
210 215 220
Pro Val Glu Ala Glu Lys Pro Ala Glu Thr Lys Leu Glu Glu Glu Ser
225 230 235 240
Ser Ala Pro Ala Gln Glu Glu Lys Val Glu Lys Lys Val Glu Ile Val
245 250 255
Glu Pro Pro Lys Glu Pro Ser Ala Glu Gly Glu Pro Thr Glu Asp Ala
260 265 270
Ser Glu Ser Thr Pro Asn Pro Val Glu Lys Ile Ala Glu Thr Met Arg
275 280 285
Leu Lys Lys Arg Phe Ala His Ser Trp Asn Asn Ala Thr Pro Leu Thr
290 295 300
Ala Glu Glu Ile Thr Thr Lys Val Thr Tyr Pro Glu Ser Val Thr Lys
305 310 315 320
Ser Leu Met Glu Val Ser Pro Ala Pro Thr Phe Arg Tyr Ser Leu Asp
325 330 335
Phe Leu Leu Gln Phe Gln Pro Leu Val Thr Glu Gln Pro Pro Ser Gly
340 345 350
Leu Glu Gly Ala Lys Ala Ile Thr Glu Asp Cys Lys Gly Ser Lys Ala
355 360 365
Pro Arg Ala Ser Ser Arg Gly Ser Gly Gly Gly Pro Asn Gln Gln Met
370 375 380
Gly Ser Phe Ser Asn Phe Gly Arg Gly Gly Pro Gly Gly Pro Ser Gly
385 390 395 400
Arg Gly Met Pro Arg Met Gly Ser Ser Ser Asn Met Arg Gly Asp His
405 410 415
Gly Gly His His Gln Ser His Arg Gly Gly Asp Arg Gly Asp Arg Glu
420 425 430
Gly Gly Gly Arg Ser Thr Arg Asn Asn Ser Ser Arg Asn Arg Arg Asn
435 440 445
Pro Ser Asn Arg Glu Arg Tyr Pro Pro Gln Gly Ala Asn Gln Glu Ile
450 455 460
Ile Glu Tyr Val Pro Pro Pro Pro Lys Ser Glu Asn Ser Trp Ala Ala
465 470 475 480
Lys Arg Leu Ala Ala Lys Lys Glu Thr Ser Thr Pro Pro Pro Ala Glu
485 490 495
Ser Glu Pro Ala Glu Glu Glu Thr Pro Arg Ile Pro Pro Asp Val Val
500 505 510
Gln Lys Lys Val Asn Ser Met Leu Asn Lys Met Thr Leu Glu Lys Phe
515 520 525
Asp Lys Ile Ser Asp Gln Ile Leu Glu Ile Ala Ser Gln Ser Lys His
530 535 540
Glu His Asp Gly Arg Thr Leu Arg Gln Val Leu Glu Leu Thr Phe Ala
545 550 555 560
Lys Ala Thr Asp Glu Ala His Trp Ala Ser Met Tyr Ala Arg Phe Cys
565 570 575
Lys Lys Thr Met Val Thr Val Asp Pro Asp Ile Tyr Asp Asp Asp Val
580 585 590
Lys Asp Lys Asn Gly Glu Tyr Val Arg Gly Gly Ala Leu Tyr Arg Lys
595 600 605
Tyr Leu Leu Asn Arg Cys Gln Asp Glu Phe Glu Lys Gly Trp Glu Asp
610 615 620
Lys Leu Pro Thr Asn Glu Asp Gly Ser Pro Met Asp Pro Asp Asn Ala
625 630 635 640
Thr Pro Glu Tyr Asp Lys Ala Val Val Ala Lys Arg Arg Gly Leu Gly
645 650 655
Leu Met Val Phe Ile Gly Glu Leu Phe Met Leu Asn Met Leu Ser Glu
660 665 670
Asn Ile Met Arg Ser Cys Leu Thr Arg Leu Ile Ser Pro Lys Asp Gly
675 680 685
Ala Ser Glu Glu Thr Ile Glu Ser Leu Cys Lys Leu Thr Ser Thr Val
690 695 700
Gly Leu Arg Met Asp Gln Ser Pro Asn Ser Lys Glu Phe Met Asp Met
705 710 715 720
Phe Phe Gln Arg Leu Thr Asp Thr Lys Asn Ser Gly Thr Leu Pro Ser
725 730 735
Arg Leu Lys Phe Lys Ile Leu Asp Leu Leu Glu Met Arg Ala Gly Gly
740 745 750
Trp Lys Gln Ser Asn Asp Gln Gly Pro Lys Thr Ile Ser Glu Ile Gln
755 760 765
Asp Glu Ala Ala Ala Ala Lys Glu Lys Gln Gln Gln Gln Gln Asp Arg
770 775 780
Asp Arg Ser His Arg Gly Gly Asn Arg Arg Ser Gly His Pro Met Gly
785 790 795 800
Gly Arg Ser Glu Ser Tyr Arg Gly Gly Asn Glu Arg Asp Arg Asn Thr
805 810 815
Asn Ser Leu Asn Thr Gly Asp Leu Lys Gln Phe Gly Lys Ile Arg Ser
820 825 830
Asp Ser Ser Asn Thr Phe Gly Pro Pro Ser Ser Met Met Gly Arg Gly
835 840 845
Gly Ser Asn Ala Ser Arg Asn Ser Ser Gln Thr Ser Leu Gln Gln Gln
850 855 860
Gly Arg Gln Asn Ser Ser Ser Pro Gly Ile Pro Leu Ser Lys Asp Ser
865 870 875 880
Ser Arg Ala Ser Ser Lys Arg Gly Asn Ile Phe Glu His Leu Met Gly
885 890 895
Asp Gly Glu Gly Glu Glu Glu Asn
900
<210> 45
<211> 626
<212> PRT
<213> Komagataella phaffii
<400> 45
Met Ser Val Asp Thr Lys Glu Val Gln Glu Ser Leu Asp Gln Leu Asn
1 5 10 15
Ile Ser Glu Ser Pro Ala Thr Ala Val Thr Glu Glu Thr Pro Ala Thr
20 25 30
Ser Thr Glu Ala Ala Glu Glu Ser Asn Glu Ser Ser Thr Gln Ala Ser
35 40 45
Glu Thr Leu Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Thr Val Thr
50 55 60
Glu Ser Asp Leu Tyr Glu Phe Phe Ser Pro Ile Gly Ser Val Asn Ser
65 70 75 80
Ile Arg Val Cys Arg Asp Ala Val Thr Lys Arg Ser Leu Gly Tyr Gly
85 90 95
Tyr Val Asn Phe His Ser Gln Ala Ala Gly Glu Arg Ala Leu Glu Glu
100 105 110
Leu Asn Tyr Ala Glu Ile Lys Gly Val Arg Cys Arg Leu Met Trp Ser
115 120 125
Gln Arg Asp Pro Ser Leu Arg Arg Ser Gly Ser Gly Asn Ile Phe Ile
130 135 140
Lys Asn Leu Asp Pro Ala Ile Glu Asn Lys Thr Leu His Asp Thr Phe
145 150 155 160
Ser Ser Phe Gly Lys Val Leu Ser Cys Lys Val Ala Thr Asp Glu Asn
165 170 175
Gly Asn Ser Lys Gly Phe Gly Phe Val His Tyr Glu Ser Asp Glu Ala
180 185 190
Ala Gln Ala Ala Ile Glu Asn Ile Asn Gly Met Leu Leu Asn Gly Arg
195 200 205
Glu Ile Tyr Val Gly Pro His Leu Ala Lys Lys Asp Arg Glu Ser Arg
210 215 220
Phe Gln Glu Met Ile Lys Asn Tyr Thr Asn Val Phe Val Lys Asn Phe
225 230 235 240
Asp Thr Glu Ser Thr Glu Asp Glu Leu Arg Glu Leu Phe Glu Ser Tyr
245 250 255
Gly Pro Ile Thr Ser Ile His Leu Gln Val Asp Ser Glu Gly His Asn
260 265 270
Lys Gly Phe Gly Phe Val Asn Phe Ala Glu His Asp Asp Ala Val Lys
275 280 285
Ala Val Glu Ala Leu Asn Asp Lys Glu Tyr Lys Gly Lys Pro Leu Tyr
290 295 300
Val Gly Arg Ala Gln Lys Lys Asn Glu Arg Val His Glu Leu Thr Lys
305 310 315 320
Lys Tyr Glu Ala Asp Arg Leu Glu Lys Leu Gln Lys Tyr Gln Ser Val
325 330 335
Asn Leu Phe Ile Lys Asn Leu Asp Glu Ser Ile Asp Asp Ala Arg Leu
340 345 350
Glu Glu Glu Phe Lys Pro Phe Gly Thr Ile Thr Ser Ala Lys Val Met
355 360 365
Leu Asp Glu Asn Gly Lys Ser Arg Gly Phe Gly Phe Val Cys Leu Ser
370 375 380
Thr Pro Glu Glu Ala Thr Lys Ala Ile Ser Glu Met Asn Gln Arg Met
385 390 395 400
Val Ala Asn Lys Pro Leu Tyr Val Ala Leu Ala Gln Pro Lys Ala Ile
405 410 415
Arg Arg Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Met Arg
420 425 430
Met Gln Gln Gln Ala Gly Pro Gly Ile Pro Asn Gln Phe Val Gln Pro
435 440 445
Ile Phe Tyr Gly Gln Gln Pro Gly Met Leu Pro Pro Gly Ala Arg Val
450 455 460
Pro Pro Met Gly Asn Gln Ile Pro Gln Phe Ala Gly Met Pro Arg Pro
465 470 475 480
Gly Pro Phe Pro Gln Gly Gln Phe Pro Arg Met Ala Pro Asn Gly Gln
485 490 495
Pro Met Pro Val Tyr Gly Gln Pro Val Phe Asn Gly Asn Gly Pro Gln
500 505 510
Gln Arg Gly Tyr Tyr Pro Asn Asn Arg Gln Asn Lys Asn Arg Asn Gln
515 520 525
Lys Glu Glu Gly Asn Ser Leu Ala Ala Ile Leu Pro Gln Leu Pro Leu
530 535 540
Glu Gln Gln Lys Arg Val Leu Gly Glu Glu Leu Tyr Pro Lys Val Val
545 550 555 560
Ala Thr Asn Lys Thr Gln Asp Pro Glu Ala Ala Gly Lys Ile Thr Gly
565 570 575
Met Ile Leu Asp Leu Asp Asn Gln Glu Ile Leu Gln Leu Leu Glu Asp
580 585 590
Glu Glu Leu Phe Asn Thr His Phe Asn Glu Ala Leu Gln Ala Tyr Glu
595 600 605
Glu Tyr Lys Ser Lys Thr Val Glu Gln Gln Gln Gln Ala Asp Ala Gln
610 615 620
Ala Asn
625
<210> 46
<211> 626
<212> PRT
<213> Komagataella pastoris
<400> 46
Met Ser Val Asp Thr Lys Glu Val Gln Glu Ser Leu Asp Gln Leu Asn
1 5 10 15
Ile Ser Glu Ser Pro Ala Thr Ala Val Thr Glu Glu Thr Pro Ala Thr
20 25 30
Ser Thr Glu Ala Ala Glu Glu Ser Asn Glu Ser Ser Thr Gln Ala Ser
35 40 45
Glu Thr Leu Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Thr Val Thr
50 55 60
Glu Ser Asp Leu Tyr Glu Phe Phe Ser Pro Ile Gly Ser Val Asn Ser
65 70 75 80
Ile Arg Val Cys Arg Asp Ala Val Thr Lys Arg Ser Leu Gly Tyr Gly
85 90 95
Tyr Val Asn Phe His Ser Gln Ala Ala Gly Glu Arg Ala Leu Glu Glu
100 105 110
Leu Asn Tyr Ala Glu Ile Lys Gly Val Arg Cys Arg Leu Met Trp Ser
115 120 125
Gln Arg Asp Pro Ser Leu Arg Arg Ser Gly Ser Gly Asn Ile Phe Ile
130 135 140
Lys Asn Leu Asp Pro Ala Ile Glu Asn Lys Thr Leu His Asp Thr Phe
145 150 155 160
Ser Ser Phe Gly Lys Val Leu Ser Cys Lys Val Ala Thr Asp Glu Asn
165 170 175
Gly Asn Ser Lys Gly Phe Gly Phe Val His Tyr Glu Ser Asp Glu Ala
180 185 190
Ala Gln Ala Ala Ile Glu Asn Ile Asn Gly Met Leu Leu Asn Gly Arg
195 200 205
Glu Ile Tyr Val Gly Pro His Leu Ala Lys Lys Asp Arg Glu Ser Arg
210 215 220
Phe Gln Glu Met Ile Lys Asn Tyr Thr Asn Val Phe Val Lys Asn Phe
225 230 235 240
Asp Thr Glu Ser Thr Glu Asp Glu Leu Arg Glu Leu Phe Glu Ser Tyr
245 250 255
Gly Pro Ile Thr Ser Ile His Leu Gln Val Asp Ser Glu Gly His Asn
260 265 270
Lys Gly Phe Gly Phe Val Asn Phe Ala Glu His Asp Asp Ala Val Lys
275 280 285
Ala Val Glu Ala Leu Asn Asp Lys Glu Phe Lys Gly Lys Pro Leu Tyr
290 295 300
Val Gly Arg Ala Gln Lys Lys Asn Glu Arg Val His Glu Leu Thr Lys
305 310 315 320
Lys Tyr Glu Ala Asp Arg Leu Glu Lys Leu Gln Lys Tyr Gln Ser Val
325 330 335
Asn Leu Phe Ile Lys Asn Leu Asp Glu Ser Ile Asp Asp Thr Arg Leu
340 345 350
Glu Glu Glu Phe Lys Pro Phe Gly Thr Ile Thr Ser Ala Lys Val Met
355 360 365
Leu Asp Glu Asn Gly Lys Ser Arg Gly Phe Gly Phe Val Cys Leu Ser
370 375 380
Thr Pro Glu Glu Ala Thr Lys Ala Ile Ser Glu Met Asn Gln Arg Met
385 390 395 400
Val Ala Asn Lys Pro Leu Tyr Val Ala Leu Ala Gln Pro Lys Ala Ile
405 410 415
Arg Arg Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Met Arg
420 425 430
Met Gln Gln Gln Ala Gly Pro Gly Ile Pro Asn Gln Phe Val Gln Pro
435 440 445
Ile Phe Tyr Gly Gln Gln Pro Gly Met Leu Pro Pro Gly Ala Arg Val
450 455 460
Pro Pro Met Gly Asn Gln Ile Pro Gln Phe Ala Gly Met Pro Arg Pro
465 470 475 480
Gly Pro Phe Pro Gln Gly Gln Phe Pro Arg Met Ala Pro Asn Gly Gln
485 490 495
Pro Met Pro Val Tyr Gly Gln Pro Val Phe Asn Gly Asn Gly Pro Gln
500 505 510
Gln Arg Gly Tyr Tyr Pro Asn Asn Arg Gln Asn Lys Asn Arg Asn Gln
515 520 525
Lys Glu Glu Gly Asn Ser Leu Ala Ala Ile Leu Pro Gln Leu Pro Ile
530 535 540
Glu Gln Gln Lys Arg Val Leu Gly Glu Glu Leu Tyr Pro Lys Val Val
545 550 555 560
Ala Thr Asn Lys Ala Gln Asp Pro Glu Ala Ala Gly Lys Ile Thr Gly
565 570 575
Met Ile Leu Asp Leu Asp Asn Gln Glu Ile Leu Gln Leu Leu Glu Asp
580 585 590
Glu Glu Leu Phe Asn Thr His Phe Asn Glu Ala Leu Gln Ala Tyr Glu
595 600 605
Glu Tyr Lys Ser Lys Thr Val Glu Gln Gln Gln Gln Ala Asp Ala Gln
610 615 620
Ala Asn
625
<210> 47
<211> 636
<212> PRT
<213> Homo sapiens
<400> 47
Met Asn Pro Ser Ala Pro Ser Tyr Pro Met Ala Ser Leu Tyr Val Gly
1 5 10 15
Asp Leu His Pro Asp Val Thr Glu Ala Met Leu Tyr Glu Lys Phe Ser
20 25 30
Pro Ala Gly Pro Ile Leu Ser Ile Arg Val Cys Arg Asp Met Ile Thr
35 40 45
Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Phe Gln Gln Pro Ala Asp
50 55 60
Ala Glu Arg Ala Leu Asp Thr Met Asn Phe Asp Val Ile Lys Gly Lys
65 70 75 80
Pro Val Arg Ile Met Trp Ser Gln Arg Asp Pro Ser Leu Arg Lys Ser
85 90 95
Gly Val Gly Asn Ile Phe Ile Lys Asn Leu Asp Lys Ser Ile Asp Asn
100 105 110
Lys Ala Leu Tyr Asp Thr Phe Ser Ala Phe Gly Asn Ile Leu Ser Cys
115 120 125
Lys Val Val Cys Asp Glu Asn Gly Ser Lys Gly Tyr Gly Phe Val His
130 135 140
Phe Glu Thr Gln Glu Ala Ala Glu Arg Ala Ile Glu Lys Met Asn Gly
145 150 155 160
Met Leu Leu Asn Asp Arg Lys Val Phe Val Gly Arg Phe Lys Ser Arg
165 170 175
Lys Glu Arg Glu Ala Glu Leu Gly Ala Arg Ala Lys Glu Phe Thr Asn
180 185 190
Val Tyr Ile Lys Asn Phe Gly Glu Asp Met Asp Asp Glu Arg Leu Lys
195 200 205
Asp Leu Phe Gly Lys Phe Gly Pro Ala Leu Ser Val Lys Val Met Thr
210 215 220
Asp Glu Ser Gly Lys Ser Lys Gly Phe Gly Phe Val Ser Phe Glu Arg
225 230 235 240
His Glu Asp Ala Gln Lys Ala Val Asp Glu Met Asn Gly Lys Glu Leu
245 250 255
Asn Gly Lys Gln Ile Tyr Val Gly Arg Ala Gln Lys Lys Val Glu Arg
260 265 270
Gln Thr Glu Leu Lys Arg Lys Phe Glu Gln Met Lys Gln Asp Arg Ile
275 280 285
Thr Arg Tyr Gln Gly Val Asn Leu Tyr Val Lys Asn Leu Asp Asp Gly
290 295 300
Ile Asp Asp Glu Arg Leu Arg Lys Glu Phe Ser Pro Phe Gly Thr Ile
305 310 315 320
Thr Ser Ala Lys Val Met Met Glu Gly Gly Arg Ser Lys Gly Phe Gly
325 330 335
Phe Val Cys Phe Ser Ser Pro Glu Glu Ala Thr Lys Ala Val Thr Glu
340 345 350
Met Asn Gly Arg Ile Val Ala Thr Lys Pro Leu Tyr Val Ala Leu Ala
355 360 365
Gln Arg Lys Glu Glu Arg Gln Ala His Leu Thr Asn Gln Tyr Met Gln
370 375 380
Arg Met Ala Ser Val Arg Ala Val Pro Asn Pro Val Ile Asn Pro Tyr
385 390 395 400
Gln Pro Ala Pro Pro Ser Gly Tyr Phe Met Ala Ala Ile Pro Gln Thr
405 410 415
Gln Asn Arg Ala Ala Tyr Tyr Pro Pro Ser Gln Ile Ala Gln Leu Arg
420 425 430
Pro Ser Pro Arg Trp Thr Ala Gln Gly Ala Arg Pro His Pro Phe Gln
435 440 445
Asn Met Pro Gly Ala Ile Arg Pro Ala Ala Pro Arg Pro Pro Phe Ser
450 455 460
Thr Met Arg Pro Ala Ser Ser Gln Val Pro Arg Val Met Ser Thr Gln
465 470 475 480
Arg Val Ala Asn Thr Ser Thr Gln Thr Met Gly Pro Arg Pro Ala Ala
485 490 495
Ala Ala Ala Ala Ala Thr Pro Ala Val Arg Thr Val Pro Gln Tyr Lys
500 505 510
Tyr Ala Ala Gly Val Arg Asn Pro Gln Gln His Leu Asn Ala Gln Pro
515 520 525
Gln Val Thr Met Gln Gln Pro Ala Val His Val Gln Gly Gln Glu Pro
530 535 540
Leu Thr Ala Ser Met Leu Ala Ser Ala Pro Pro Gln Glu Gln Lys Gln
545 550 555 560
Met Leu Gly Glu Arg Leu Phe Pro Leu Ile Gln Ala Met His Pro Thr
565 570 575
Leu Ala Gly Lys Ile Thr Gly Met Leu Leu Glu Ile Asp Asn Ser Glu
580 585 590
Leu Leu His Met Leu Glu Ser Pro Glu Ser Leu Arg Ser Lys Val Asp
595 600 605
Glu Ala Val Ala Val Leu Gln Ala His Gln Ala Lys Glu Ala Ala Gln
610 615 620
Lys Ala Val Asn Ser Ala Thr Gly Val Pro Thr Val
625 630 635
<210> 48
<211> 764
<212> PRT
<213> Aspergillus niger
<400> 48
Met Ser Ala Asp Val Ser Thr Thr Pro Ala Ala Glu Asn Val Asn Gly
1 5 10 15
Ala Ala Glu Ala Ser Pro Ala Ala Ala Ala Pro Ser Ala Thr Thr Pro
20 25 30
Glu Val Thr Ala Val Glu Asn Ser Thr Pro Ala Pro Ala Ala Asn Gln
35 40 45
Pro His Ser Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Ser Val Thr
50 55 60
Glu Ala Met Leu Tyr Glu Leu Phe Ser Ser Ile Gly Gln Val Ala Ser
65 70 75 80
Ile Arg Val Cys Arg Asp Ala Val Thr Arg Arg Ser Leu Gly Tyr Ala
85 90 95
Tyr Val Asn Tyr Asn Asn Thr Ala Asp Gly Glu Arg Ala Leu Glu Asp
100 105 110
Leu Asn Tyr Thr Leu Ile Lys Gly Lys Pro Cys Arg Ile Met Trp Ser
115 120 125
Gln Arg Asp Pro Ala Leu Arg Lys Thr Gly Gln Gly Asn Val Phe Ile
130 135 140
Lys Asn Leu Asp Ser Ala Ile Asp Asn Lys Ala Leu His Asp Thr Phe
145 150 155 160
Ala Ala Phe Gly Asn Ile Leu Ser Cys Lys Val Ala Gln Asp Glu Phe
165 170 175
Gly Asn Ser Lys Gly Tyr Gly Phe Val His Tyr Glu Thr Ala Glu Ala
180 185 190
Ala Asn Asn Ala Ile Lys His Val Asn Gly Met Leu Leu Asn Asp Lys
195 200 205
Lys Val Phe Val Gly His His Ile Ser Lys Lys Asp Arg Gln Ser Lys
210 215 220
Phe Glu Glu Met Lys Ala Asn Phe Thr Asn Val Tyr Ile Lys Asn Leu
225 230 235 240
Asp Ser Glu Ile Asp Asp Asp Glu Phe Arg Lys Met Phe Glu Lys Phe
245 250 255
Gly Glu Ile Thr Ser Ala Thr Leu Ser Arg Asp Gln Glu Gly Lys Ser
260 265 270
Arg Gly Phe Gly Phe Val Asn Phe Ser Thr His Glu Ser Ala Gln Ala
275 280 285
Ala Val Glu Glu Met Asn Asp Lys Glu Ile Arg Ser Gln Lys Leu Tyr
290 295 300
Val Gly Arg Ala Gln Lys Lys His Glu Arg Glu Glu Glu Leu Arg Lys
305 310 315 320
Gln Tyr Glu Ala Ala Arg Leu Glu Lys Ala Ser Lys Tyr Gln Gly Val
325 330 335
Asn Leu Tyr Val Lys Asn Leu Thr Asp Asp Ile Asp Asp Glu Lys Leu
340 345 350
Arg Glu Leu Phe Gly Pro Tyr Gly Thr Ile Thr Ser Ala Lys Val Met
355 360 365
Arg Asp Thr Asn Val Glu Arg Glu Ser Ser Pro Glu Ser Ala Gly Lys
370 375 380
Glu Lys Glu Ala Asn Lys Glu Asn Asp Lys Glu Ala Thr Pro Glu Ala
385 390 395 400
Glu Lys Ala Glu Glu Lys Ala Glu Glu Lys Pro Ala Glu Ser Ser Glu
405 410 415
Glu Lys Asp Lys Glu Ala Lys Lys Ser Asp Lys Lys Pro Phe Gly Lys
420 425 430
Ser Lys Gly Phe Gly Phe Val Cys Phe Ser Ser Pro Asp Glu Ala Ser
435 440 445
Lys Ala Val Thr Glu Met Asn Gln Arg Met Val Asn Gly Lys Pro Leu
450 455 460
Tyr Val Ala Leu Ala Gln Arg Lys Asp Val Arg Arg Ser Gln Leu Glu
465 470 475 480
Ala Ser Ile Gln Ala Arg Asn Thr Ile Arg Gln Gln Gln Ala Ala Ala
485 490 495
Ala Ala Gly Met Pro Gln Pro Tyr Met Gln Pro Ala Val Phe Tyr Gly
500 505 510
Pro Gly Gln Gln Gly Phe Ile Pro Gly Gly Gln Arg Gly Met Ala Phe
515 520 525
Pro Pro Gln Pro Gly Met Val Met Gly Ile Pro Gly Gly Arg Pro Gly
530 535 540
Gln Tyr Pro Gly Pro Phe Pro Gly Gln Gln Gly Gly Arg Gly Met Gly
545 550 555 560
Pro Asn Gln Gln Ile Pro Pro Asn Phe Ala Gln Gly Ile Pro Met Gly
565 570 575
Met Gln Gly Pro Gly Ala Ile Pro Asn Gly Met Gly Tyr Pro Gln Met
580 585 590
Ala Gln Val Gln Phe Gly Arg Gly Ala Gly Gly Arg Gly Gln Val Pro
595 600 605
Gly Met Pro Met Gly Gln Gly Met Arg Gly Gly Pro Gly Tyr Gly Gln
610 615 620
Gly Arg Gly Gly Val Pro Val Gln Gln Gly Gln Ile Arg Pro Gly Gln
625 630 635 640
Gly Gly Arg Gly Gln Asn Ala Ala Ala Pro Ala Gly Pro Gln Glu Gly
645 650 655
Ala Ala Gly Gly Val Asn Ala Gln Thr Leu Gly Ala Ala Pro Pro Ala
660 665 670
Gln Gln Lys Gln Met Leu Gly Glu Ala Leu Tyr Pro Lys Ile Gln Ala
675 680 685
Gln Gln Pro Glu Leu Ala Gly Lys Ile Thr Gly Met Leu Leu Glu Met
690 695 700
Asp Asn Thr Glu Leu Leu Ser Leu Leu Glu Asp Glu Glu Ala Leu Arg
705 710 715 720
Ala Lys Val Asp Glu Ala Leu Ser Val Tyr Asp Glu Tyr Met Lys Asn
725 730 735
Lys Gly Thr Glu Ser Glu Ala Pro Ala Ala Glu Ala Ala Lys Pro Glu
740 745 750
Ala Glu Lys Glu Ala Ser Thr Glu Glu Asn Lys Ala
755 760
<210> 49
<211> 636
<212> PRT
<213> Cricetulus griseus
<400> 49
Met Asn Pro Ser Ala Pro Ser Tyr Pro Met Ala Ser Leu Tyr Val Gly
1 5 10 15
Asp Leu His Pro Asp Val Thr Glu Ala Met Leu Tyr Glu Lys Phe Ser
20 25 30
Pro Ala Gly Pro Ile Leu Ser Ile Arg Val Cys Arg Asp Met Ile Thr
35 40 45
Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Phe Gln Gln Pro Ala Asp
50 55 60
Ala Glu Arg Ala Leu Asp Thr Met Asn Phe Asp Val Ile Lys Gly Lys
65 70 75 80
Pro Val Arg Ile Met Trp Ser Gln Arg Asp Pro Ser Leu Arg Lys Ser
85 90 95
Gly Val Gly Asn Ile Phe Ile Lys Asn Leu Asp Lys Ser Ile Asp Asn
100 105 110
Lys Ala Leu Tyr Asp Thr Phe Ser Ala Phe Gly Asn Ile Leu Ser Cys
115 120 125
Lys Val Val Cys Asp Glu Asn Gly Ser Lys Gly Tyr Gly Phe Val His
130 135 140
Phe Glu Thr Gln Glu Ala Ala Glu Arg Ala Ile Glu Lys Met Asn Gly
145 150 155 160
Met Leu Leu Asn Asp Arg Lys Val Phe Val Gly Arg Phe Lys Ser Arg
165 170 175
Lys Glu Arg Glu Ala Glu Leu Gly Ala Arg Ala Lys Glu Phe Thr Asn
180 185 190
Val Tyr Ile Lys Asn Phe Gly Glu Asp Met Asp Asp Glu Arg Leu Lys
195 200 205
Asp Leu Phe Gly Lys Phe Gly Pro Ala Leu Ser Val Lys Val Met Thr
210 215 220
Asp Glu Ser Gly Lys Ser Lys Gly Phe Gly Phe Val Ser Phe Glu Arg
225 230 235 240
His Glu Asp Ala Gln Lys Ala Val Asp Glu Met Asn Gly Lys Glu Leu
245 250 255
Asn Gly Lys Gln Ile Tyr Val Gly Arg Ala Gln Lys Lys Val Glu Arg
260 265 270
Gln Thr Glu Leu Lys Arg Lys Phe Glu Gln Met Lys Gln Asp Arg Ile
275 280 285
Thr Arg Tyr Gln Gly Val Asn Leu Tyr Val Lys Asn Leu Asp Asp Gly
290 295 300
Ile Asp Asp Glu Arg Leu Arg Lys Glu Phe Ser Pro Phe Gly Thr Ile
305 310 315 320
Thr Ser Ala Lys Val Met Met Glu Gly Gly Arg Ser Lys Gly Phe Gly
325 330 335
Phe Val Cys Phe Ser Ser Pro Glu Glu Ala Thr Lys Ala Val Thr Glu
340 345 350
Met Asn Gly Arg Ile Val Ala Thr Lys Pro Leu Tyr Val Ala Leu Ala
355 360 365
Gln Arg Lys Glu Glu Arg Gln Ala His Leu Thr Asn Gln Tyr Met Gln
370 375 380
Arg Met Ala Ser Val Arg Ala Val Pro Asn Pro Val Ile Asn Pro Tyr
385 390 395 400
Gln Pro Ala Pro Pro Ser Gly Tyr Phe Met Ala Ala Ile Pro Gln Thr
405 410 415
Gln Asn Arg Ala Ala Tyr Tyr Pro Pro Ser Gln Ile Ala Gln Leu Arg
420 425 430
Pro Ser Pro Arg Trp Thr Ala Gln Gly Ala Arg Pro His Pro Phe Gln
435 440 445
Asn Met Pro Gly Ala Ile Arg Pro Ala Ala Pro Arg Pro Pro Phe Ser
450 455 460
Thr Met Arg Pro Ala Ser Ser Gln Val Pro Arg Val Met Ser Thr Gln
465 470 475 480
Arg Val Ala Asn Thr Ser Thr Gln Thr Met Gly Pro Arg Pro Ala Ala
485 490 495
Ala Ala Ala Ala Ala Thr Pro Ala Val Arg Thr Val Pro Gln Tyr Lys
500 505 510
Tyr Ala Ala Gly Val Arg Asn Pro Gln Gln His Leu Asn Ala Gln Pro
515 520 525
Gln Val Thr Met Gln Gln Pro Ala Val His Val Gln Gly Gln Glu Pro
530 535 540
Leu Thr Ala Ser Met Leu Ala Ser Ala Pro Pro Gln Glu Gln Lys Gln
545 550 555 560
Met Leu Gly Glu Arg Leu Phe Pro Leu Ile Gln Ala Met His Pro Thr
565 570 575
Leu Ala Gly Lys Ile Thr Gly Met Leu Leu Glu Ile Asp Asn Ser Glu
580 585 590
Leu Leu His Met Leu Glu Ser Pro Glu Ser Leu Arg Ser Lys Val Asp
595 600 605
Glu Ala Val Ala Val Leu Gln Ala His Gln Ala Lys Glu Ala Ala Gln
610 615 620
Lys Ala Val Asn Ser Ala Ala Gly Val Pro Ser Val
625 630 635
<210> 50
<211> 592
<212> PRT
<213> Kluyveromyces lactis
<400> 50
Met Ser Asp Ile Thr Glu Lys Thr Ala Glu Gln Leu Glu Asn Leu Gln
1 5 10 15
Ile Asn Asp Asp Gln Gln Pro Ala Gln Ser Ala Ser Ala Pro Ser Thr
20 25 30
Ser Ala Ser Glu Ser Glu Ala Ser Ser Val Ser Lys Val Glu Asn Asn
35 40 45
Asn Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Asn Ile Thr Glu Ala
50 55 60
Leu Leu Tyr Asp Val Phe Ser Pro Leu Gly Pro Ile Ser Ser Ile Arg
65 70 75 80
Val Cys Arg Asp Ala Val Thr Lys Ala Ser Leu Gly Tyr Ala Tyr Val
85 90 95
Asn Tyr Thr Asp Tyr Glu Ala Gly Lys Lys Ala Ile Gln Glu Leu Asn
100 105 110
Tyr Ala Glu Ile Asn Gly Arg Pro Cys Arg Ile Met Trp Ser Glu Arg
115 120 125
Asp Pro Ala Ile Arg Lys Lys Gly Ser Gly Asn Ile Phe Ile Lys Asn
130 135 140
Leu His Pro Ala Ile Asp Asn Lys Ala Leu His Glu Thr Phe Ser Thr
145 150 155 160
Phe Gly Glu Val Leu Ser Cys Lys Val Ala Leu Asp Glu Asn Gly Asn
165 170 175
Ser Arg Gly Phe Gly Phe Val His Phe Lys Glu Glu Ser Asp Ala Lys
180 185 190
Asp Ala Ile Glu Ala Val Asn Gly Met Leu Met Asn Gly Leu Glu Val
195 200 205
Tyr Val Ala Met His Val Pro Lys Lys Asp Arg Ile Ser Lys Leu Glu
210 215 220
Glu Ala Lys Ala Asn Phe Thr Asn Ile Tyr Val Lys Asn Ile Asp Val
225 230 235 240
Glu Thr Thr Asp Glu Glu Phe Glu Gln Leu Phe Ser Gln Tyr Gly Glu
245 250 255
Ile Val Ser Ala Ala Leu Glu Lys Asp Ala Glu Gly Lys Pro Lys Gly
260 265 270
Phe Gly Phe Val Asn Phe Val Asp His Asn Ala Ala Ala Lys Ala Val
275 280 285
Glu Glu Leu Asn Gly Lys Glu Phe Lys Ser Gln Ala Leu Tyr Val Gly
290 295 300
Arg Ala Gln Lys Lys Tyr Glu Arg Ala Glu Glu Leu Lys Lys Gln Tyr
305 310 315 320
Glu Gln Tyr Arg Leu Glu Lys Leu Ala Lys Phe Gln Gly Val Asn Leu
325 330 335
Phe Ile Lys Asn Leu Asp Asp Ser Ile Asp Asp Glu Lys Leu Lys Glu
340 345 350
Glu Phe Ala Pro Tyr Gly Thr Ile Thr Ser Ala Arg Val Met Arg Asp
355 360 365
Gln Glu Gly Asn Ser Lys Gly Phe Gly Phe Val Cys Phe Ser Ser Pro
370 375 380
Glu Glu Ala Thr Lys Ala Met Thr Glu Lys Asn Gln Gln Ile Val Ala
385 390 395 400
Gly Lys Pro Leu Tyr Val Ala Ile Ala Gln Arg Lys Asp Val Arg Arg
405 410 415
Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Ile Arg Phe Gln
420 425 430
Gln Gln Gln Gln Gln Gln Ala Ala Ala Ala Ala Ala Gly Met Pro Gly
435 440 445
Gln Tyr Met Pro Gln Met Phe Tyr Gly Val Met Ala Pro Arg Gly Phe
450 455 460
Pro Gly Pro Asn Pro Gly Met Asn Gly Pro Met Gly Ala Gly Ile Pro
465 470 475 480
Lys Asn Gly Met Val Pro Pro Pro Gln Gln Phe Ala Gly Arg Pro Asn
485 490 495
Gly Pro Met Tyr Gln Gly Met Pro Pro Gln Asn Gln Phe Pro Arg His
500 505 510
Gln Gln Gln His Tyr Ile Gln Gln Gln Lys Gln Arg Gln Ala Leu Gly
515 520 525
Glu Gln Leu Tyr Lys Lys Val Ser Ala Lys Ile Asp Asp Glu Asn Ala
530 535 540
Ala Gly Lys Ile Thr Gly Met Ile Leu Asp Leu Pro Pro Gln Gln Val
545 550 555 560
Ile Gln Leu Leu Asp Asn Asp Glu Gln Phe Glu Gln Gln Phe Gln Glu
565 570 575
Ala Leu Ala Ala Tyr Glu Asn Phe Lys Lys Glu Gln Glu Ala Gln Ala
580 585 590
<210> 51
<211> 629
<212> PRT
<213> Ogataea polymorpha
<400> 51
Met Ser Ser Ala Glu Ile Asn Gln Ile Thr Glu Gln Ala Glu Lys Leu
1 5 10 15
Ser Val Ala Asp Pro Ala Ala Ala Glu Thr Pro Ala Thr Thr Ala Glu
20 25 30
Glu Ser Ser Thr Ala Glu Ser Thr Gln Asn Ser Glu Thr Leu Ala Ser
35 40 45
Leu Tyr Val Gly Glu Leu Asp Pro Ser Val Thr Glu Ser Asp Leu Phe
50 55 60
Glu Val Phe Ser Pro Ile Gly Gln Val Ser Thr Ile Arg Val Cys Arg
65 70 75 80
Asp Ala Val Ser Lys Gln Ser Leu Gly Tyr Ala Tyr Val Asn Phe Gln
85 90 95
Ser His Ala Asp Gly Glu Lys Ala Leu Glu Glu Leu Asn Tyr Thr Pro
100 105 110
Ile Lys Gly Lys Ala Cys Arg Ile Met Trp Ser Gln Arg Asp Pro Ser
115 120 125
Leu Arg Arg Asn Gly Ser Gly Asn Ile Phe Ile Lys Asn Leu His Pro
130 135 140
Ala Ile Asp Asn Lys Thr Leu His Asp Thr Phe Ser Ala Phe Gly Lys
145 150 155 160
Ile Leu Ser Cys Lys Ile Ala Thr Asp Glu Asn Gly Asn Ser Lys Gly
165 170 175
Phe Gly Phe Val His Tyr Glu Asp Ser Glu Ser Ala Lys Ala Ala Ile
180 185 190
Glu Asn Val Asn Gly Met Leu Leu Asn Asp His Glu Val Tyr Val Gly
195 200 205
Pro His Leu Ala Lys Lys Asp Arg Gln Ser Lys Met Arg Glu Leu Ile
210 215 220
Ala Asn Phe Thr Asn Val Tyr Val Lys Asn Ile Asn Leu Asn Trp Asp
225 230 235 240
Glu Asp Lys Leu Arg Glu Thr Phe Ser Pro Phe Gly Ala Ile Ser Ser
245 250 255
Ile Phe Leu Ser Lys Asp Glu Ser Gly Lys Ser Arg Gly Phe Gly Phe
260 265 270
Val Asn Phe Glu Lys His Glu Asp Ala Val Lys Ala Val Glu Glu Leu
275 280 285
Asn Asn Lys Glu Ile Asp Gly Gln Lys Leu Tyr Val Gly Arg Ala Gln
290 295 300
Lys Lys Ser Glu Arg Met Glu Ser Leu Lys His Gln Tyr Glu Ala Ala
305 310 315 320
Arg Gln Glu Gln Leu Asn Lys Tyr Gln Gly Tyr Asn Leu Phe Val Lys
325 330 335
Asn Leu Asp Asp Ser Ile Asp Asp Ala Lys Leu Glu Glu Glu Phe Lys
340 345 350
Pro Tyr Gly Thr Ile Thr Ser Ala Lys Val Met Leu Asp Asp Ala Gly
355 360 365
Lys Ser Lys Gly Phe Gly Phe Val Cys Tyr Ser Ser Pro Glu Glu Ala
370 375 380
Thr Lys Ala Ile Thr Glu Met His Gln Arg Met Val Ala Gly Lys Pro
385 390 395 400
Leu Tyr Val Ala Leu Ala Gln Arg Lys Glu Val Arg Arg Ser Gln Leu
405 410 415
Ser Gln Gln Ile Gln Ala Arg Asn Gln Met Arg Met Gln Gln Ala Ala
420 425 430
Ala Gln Gly Gly Met Gly Gln Phe Val Ala Pro Met Phe Tyr Gly Gln
435 440 445
Asn Pro Gly Phe Leu Pro Pro Gly Ala Arg Gly Ala Pro Phe Ala Ala
450 455 460
Pro Gly Gln Gln Met Met Met Gln Gln Gly Ile Pro Arg Pro Gly Gln
465 470 475 480
Gly Val Pro Val Ser Pro Gly Gln Phe Arg Val Gly Pro Asn Gly Gln
485 490 495
Pro Val Pro Met Tyr Met Gln Pro Val Phe Asn Glu Tyr Pro Gln Asn
500 505 510
Gly Arg Met Pro Gln Gln Arg Tyr Tyr Gln Gly Gly Arg Pro Gly Gln
515 520 525
Gln Pro Pro Gln Ala Gly Pro Arg Gly Lys Ser Glu Asp Gly Ala Val
530 535 540
Pro Ser Leu Ala Gln Val Leu Pro Gln Phe Pro Pro Glu Gln Gln Lys
545 550 555 560
Arg Met Leu Gly Glu Glu Leu Tyr Pro Leu Ile Val Ala Thr Gly Lys
565 570 575
Ala Gln Asp Pro Glu Ala Ala Gly Lys Ile Thr Gly Met Met Leu Glu
580 585 590
Met Asp Asn Gln Gln Ile Leu Ala Leu Leu Glu Asp Arg Asp Leu Phe
595 600 605
Asn Ser Gln Phe Glu Glu Ala Leu Ser Ala Tyr Glu Glu Tyr Lys Asn
610 615 620
Lys Glu Ala Ser Ala
625
<210> 52
<211> 581
<212> PRT
<213> Saccharomyces cerevisiae
<400> 52
Gly Pro Asp Ser Met Ala Asp Ile Thr Asp Lys Thr Ala Glu Gln Leu
1 5 10 15
Glu Asn Leu Asn Ile Gln Asp Asp Gln Lys Gln Ala Ala Thr Gly Ser
20 25 30
Glu Ser Gln Ser Val Glu Asn Ser Ser Ala Ser Leu Tyr Val Gly Asp
35 40 45
Leu Glu Pro Ser Val Ser Glu Ala His Leu Tyr Asp Ile Phe Ser Pro
50 55 60
Ile Gly Ser Val Ser Ser Ile Arg Val Cys Arg Asp Ala Ile Thr Lys
65 70 75 80
Thr Ser Leu Gly Tyr Ala Tyr Val Asn Phe Asn Asp His Glu Ala Gly
85 90 95
Arg Lys Ala Ile Glu Gln Leu Asn Tyr Thr Pro Ile Lys Gly Arg Leu
100 105 110
Cys Arg Ile Met Trp Ser Gln Arg Asp Pro Ser Leu Arg Lys Lys Gly
115 120 125
Ser Gly Asn Ile Phe Ile Lys Asn Leu His Pro Asp Ile Asp Asn Lys
130 135 140
Ala Leu Tyr Asp Thr Phe Ser Val Phe Gly Asp Ile Leu Ser Ser Lys
145 150 155 160
Ile Ala Thr Asp Glu Asn Gly Lys Ser Lys Gly Phe Gly Phe Val His
165 170 175
Phe Glu Glu Glu Gly Ala Ala Lys Glu Ala Ile Asp Ala Leu Asn Gly
180 185 190
Met Leu Leu Asn Gly Gln Glu Ile Tyr Val Ala Pro His Leu Ser Arg
195 200 205
Lys Glu Arg Asp Ser Gln Leu Glu Glu Thr Lys Ala His Tyr Thr Asn
210 215 220
Leu Tyr Val Lys Asn Ile Asn Ser Glu Thr Thr Asp Glu Gln Phe Gln
225 230 235 240
Glu Leu Phe Ala Lys Phe Gly Pro Ile Val Ser Ala Ser Leu Glu Lys
245 250 255
Asp Ala Asp Gly Lys Leu Lys Gly Phe Gly Phe Val Asn Tyr Glu Lys
260 265 270
His Glu Asp Ala Val Lys Ala Val Glu Ala Leu Asn Asp Ser Glu Leu
275 280 285
Asn Gly Glu Lys Leu Tyr Val Gly Arg Ala Gln Lys Lys Asn Glu Arg
290 295 300
Met His Val Leu Lys Lys Gln Tyr Glu Ala Tyr Arg Leu Glu Lys Met
305 310 315 320
Ala Lys Tyr Gln Gly Val Asn Leu Phe Val Lys Asn Leu Asp Asp Ser
325 330 335
Val Asp Asp Glu Lys Leu Glu Glu Glu Phe Ala Pro Tyr Gly Thr Ile
340 345 350
Thr Ser Ala Lys Val Met Arg Thr Glu Asn Gly Lys Ser Lys Gly Phe
355 360 365
Gly Phe Val Cys Phe Ser Thr Pro Glu Glu Ala Thr Lys Ala Ile Thr
370 375 380
Glu Lys Asn Gln Gln Ile Val Ala Gly Lys Pro Leu Tyr Val Ala Ile
385 390 395 400
Ala Gln Arg Lys Asp Val Arg Arg Ser Gln Leu Ala Gln Gln Ile Gln
405 410 415
Ala Arg Asn Gln Met Arg Tyr Gln Gln Ala Thr Ala Ala Ala Ala Ala
420 425 430
Ala Ala Ala Gly Met Pro Gly Gln Phe Met Pro Pro Met Phe Tyr Gly
435 440 445
Val Met Pro Pro Arg Gly Val Pro Phe Asn Gly Pro Asn Pro Gln Gln
450 455 460
Met Asn Pro Met Gly Gly Met Pro Lys Asn Gly Met Pro Pro Gln Phe
465 470 475 480
Arg Asn Gly Pro Val Tyr Gly Val Pro Pro Gln Gly Gly Phe Pro Arg
485 490 495
Asn Ala Asn Asp Asn Asn Gln Phe Tyr Gln Gln Lys Gln Arg Gln Ala
500 505 510
Leu Gly Glu Gln Leu Tyr Lys Lys Val Ser Ala Lys Thr Ser Asn Glu
515 520 525
Glu Ala Ala Gly Lys Ile Thr Gly Met Ile Leu Asp Leu Pro Pro Gln
530 535 540
Glu Val Phe Pro Leu Leu Glu Ser Asp Glu Leu Phe Glu Gln His Tyr
545 550 555 560
Lys Glu Ala Ser Ala Ala Tyr Glu Ser Phe Lys Lys Glu Gln Glu Gln
565 570 575
Gln Thr Glu Gln Ala
580
<210> 53
<211> 653
<212> PRT
<213> Schizosaccharomyces pombe
<400> 53
Met Pro Ser Thr Asp Leu Lys Lys Gln Ala Asp Ala Ala Val Glu Ser
1 5 10 15
Asp Val Asn Thr Asn Asn Glu Ala Val Glu Ser Ser Thr Lys Glu Glu
20 25 30
Ser Ser Asn Thr Pro Ser Thr Glu Thr Gln Pro Glu Lys Lys Ala Glu
35 40 45
Glu Pro Glu Ala Ala Ala Glu Pro Ser Glu Ser Thr Ser Thr Pro Thr
50 55 60
Asn Ala Ser Ser Val Ala Thr Pro Ser Gly Thr Ala Pro Thr Ser Ala
65 70 75 80
Ser Leu Tyr Val Gly Glu Leu Asp Pro Ser Val Thr Glu Ala Met Leu
85 90 95
Phe Glu Leu Phe Asn Ser Ile Gly Pro Val Ala Ser Ile Arg Val Cys
100 105 110
Arg Asp Ala Val Thr Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Phe
115 120 125
His Asn Met Glu Asp Gly Glu Lys Ala Leu Asp Glu Leu Asn Tyr Thr
130 135 140
Leu Ile Lys Gly Arg Pro Cys Arg Ile Met Trp Ser Gln Arg Asp Pro
145 150 155 160
Ser Leu Arg Lys Met Gly Thr Gly Asn Val Phe Ile Lys Asn Leu Asp
165 170 175
Pro Ala Ile Asp Asn Lys Ala Leu His Asp Thr Phe Ser Ala Phe Gly
180 185 190
Lys Ile Leu Ser Cys Lys Val Ala Val Asp Glu Leu Gly Asn Ala Lys
195 200 205
Gly Tyr Gly Phe Val His Phe Asp Ser Val Glu Ser Ala Asn Ala Ala
210 215 220
Ile Glu His Val Asn Gly Met Leu Leu Asn Asp Lys Lys Val Tyr Val
225 230 235 240
Gly His His Val Ser Arg Arg Glu Arg Gln Ser Lys Val Glu Ala Leu
245 250 255
Lys Ala Asn Phe Thr Asn Val Tyr Ile Lys Asn Leu Asp Thr Glu Ile
260 265 270
Thr Glu Gln Glu Phe Ser Asp Leu Phe Gly Gln Phe Gly Glu Ile Thr
275 280 285
Ser Leu Ser Leu Val Lys Asp Gln Asn Asp Lys Pro Arg Gly Phe Gly
290 295 300
Phe Val Asn Tyr Ala Asn His Glu Cys Ala Gln Lys Ala Val Asp Glu
305 310 315 320
Leu Asn Asp Lys Glu Tyr Lys Gly Lys Lys Leu Tyr Val Gly Arg Ala
325 330 335
Gln Lys Lys His Glu Arg Glu Glu Glu Leu Arg Lys Arg Tyr Glu Gln
340 345 350
Met Lys Leu Glu Lys Met Asn Lys Tyr Gln Gly Val Asn Leu Phe Ile
355 360 365
Lys Asn Leu Gln Asp Glu Val Asp Asp Glu Arg Leu Lys Ala Glu Phe
370 375 380
Ser Ala Phe Gly Thr Ile Thr Ser Ala Lys Ile Met Thr Asp Glu Gln
385 390 395 400
Gly Lys Ser Lys Gly Phe Gly Phe Val Cys Tyr Thr Thr Pro Glu Glu
405 410 415
Ala Asn Lys Ala Val Thr Glu Met Asn Gln Arg Met Leu Ala Gly Lys
420 425 430
Pro Leu Tyr Val Ala Leu Ala Gln Arg Lys Glu Val Arg Arg Ser Gln
435 440 445
Leu Glu Ala Gln Ile Gln Ala Arg Asn Gln Phe Arg Leu Gln Gln Gln
450 455 460
Val Ala Ala Ala Ala Gly Ile Pro Ala Val Gln Tyr Gly Ala Thr Gly
465 470 475 480
Pro Leu Ile Tyr Gly Pro Gly Gly Tyr Pro Ile Pro Ala Ala Val Asn
485 490 495
Gly Arg Gly Met Pro Met Val Pro Gly His Asn Gly Pro Met Pro Met
500 505 510
Tyr Pro Gly Met Pro Thr Gln Phe Pro Ala Gly Gly Pro Ala Pro Gly
515 520 525
Tyr Pro Gly Met Asn Ala Arg Gly Pro Val Pro Ala Gln Gly Arg Pro
530 535 540
Met Met Met Pro Gly Ser Val Pro Ser Ala Gly Pro Ala Glu Ala Glu
545 550 555 560
Ala Val Pro Ala Val Pro Gly Met Pro Glu Arg Phe Thr Ala Ala Asp
565 570 575
Leu Ala Ala Val Pro Glu Glu Ser Arg Lys Gln Val Leu Gly Glu Leu
580 585 590
Leu Tyr Pro Lys Val Phe Val Arg Glu Glu Lys Leu Ser Gly Lys Ile
595 600 605
Thr Gly Met Leu Leu Glu Met Pro Asn Ser Glu Leu Leu Glu Leu Leu
610 615 620
Glu Asp Asp Ser Ala Leu Asn Glu Arg Val Asn Glu Ala Ile Gly Val
625 630 635 640
Leu Gln Glu Phe Val Asp Gln Glu Pro Gly Phe Thr Glu
645 650
<210> 54
<211> 745
<212> PRT
<213> Trichoderma reesei
<400> 54
Met Ala Ala Asn Thr Thr Ser Ala Ala Val Asp Gln Leu Ala Ser Asp
1 5 10 15
Leu Asn Asn Thr Ser Leu Asn Gly Ser Gly Asp Val Lys Ala Pro Ala
20 25 30
Ile Asp Thr Ser Val Ser Ala Gly Ala Glu Asp Ala Ser Ala Pro Thr
35 40 45
Pro Thr Ala Ala Pro His Pro Gln Asn Ser Ala Ser Leu Tyr Val Gly
50 55 60
Glu Leu Asp Pro Ser Val Thr Glu Ala Met Leu Phe Glu Leu Phe Ser
65 70 75 80
Gln Ile Gly Ala Val Ala Ser Ile Arg Val Cys Arg Asp Ala Val Thr
85 90 95
Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Tyr Asn Ser Thr Pro Asp
100 105 110
Gly Glu Lys Ala Leu Glu Glu Leu Asn Tyr Thr Leu Ile Lys Gly Arg
115 120 125
Pro Cys Arg Ile Met Trp Ser Gln Arg Asp Pro Ala Leu Arg Lys Thr
130 135 140
Gly Gln Gly Asn Val Phe Ile Lys Asn Leu Asp Val Ala Ile Asp Asn
145 150 155 160
Lys Ala Leu His Asp Thr Phe Ala Ala Phe Gly Asn Ile Leu Ser Cys
165 170 175
Lys Val Ala Gln Asp Glu Asn Gly Asn Ser Lys Gly Tyr Gly Phe Val
180 185 190
His Tyr Glu Thr Asp Glu Ala Ala Ala Gln Ala Ile Lys His Val Asn
195 200 205
Gly Met Leu Leu Asn Glu Lys Lys Val Tyr Val Gly Tyr His Ile Pro
210 215 220
Lys Lys Asp Arg Gln Ser Lys Phe Glu Glu Met Lys Ala Asn Phe Thr
225 230 235 240
Asn Val Tyr Val Lys Asn Ile Ala Pro Asp Val Thr Asp Glu Asp Phe
245 250 255
Arg Gln Leu Phe Glu Lys Phe Gly Asp Val Thr Ser Ser Ser Leu Ala
260 265 270
Arg Asp Gln Glu Gly Lys Thr Arg Gly Phe Gly Phe Val Asn Phe Thr
275 280 285
Thr His Glu Ala Ala Phe Lys Ala Val Glu Glu Leu Asn Gly Lys Asp
290 295 300
Phe Arg Gly Gln Asp Leu Tyr Val Gly Arg Ala Gln Lys Lys His Glu
305 310 315 320
Arg Glu Glu Glu Leu Arg Lys Ser Tyr Glu Ala Ala Arg Leu Glu Lys
325 330 335
Ala Asn Lys Tyr Gln Gly Val Asn Leu Tyr Ile Lys Asn Leu Asp Asp
340 345 350
Asp Val Asp Asp Glu Lys Leu Arg Gln Met Phe Ala Glu Phe Gly Pro
355 360 365
Ile Thr Ser Ala Lys Val Met Arg Asp Val Pro Gln Glu Gly Glu Glu
370 375 380
Glu Ala Lys Asp Gln Glu Lys Asp Lys Glu Asn Gln Lys Glu Gly Glu
385 390 395 400
Lys Glu Gly Glu Ser Ala Glu Gly Ala Glu Lys Lys Thr Glu Lys Lys
405 410 415
Ser Asp Lys Lys Leu Gly Lys Ser Lys Gly Phe Gly Phe Val Cys Phe
420 425 430
Ser Asn Pro Asp Asp Ala Thr Lys Ala Val Ala Glu Met Asn Gln Arg
435 440 445
Met Ile Asn Asn Lys Pro Leu Tyr Val Ala Leu Ala Gln Arg Lys Asp
450 455 460
Val Arg Lys Ser Gln Leu Glu Ala Ser Ile Gln Ala Arg Asn Gln Leu
465 470 475 480
Arg Met Gln Gln Ala Ala Ala Ala Ala Gly Met Pro Gln Gln Tyr Met
485 490 495
Gln Pro Pro Val Phe Tyr Ala Pro Gly Gln Gln Pro Gly Phe Ile Pro
500 505 510
Gln Gly Gly Arg Gly Ile Pro Phe Pro Gln Pro Gly Met Pro Met Pro
515 520 525
Asn Val Gln Gly Gly Arg Pro Gly Gln Phe Pro Gly Tyr Pro Gln Gln
530 535 540
Gly Gly Arg Asn Met Pro Gln Gly Leu Pro Pro Asn Met Tyr Ser Ile
545 550 555 560
Pro Gly Gln Phe Pro Pro Gln Phe Gly Gln Pro Gly Thr Pro Gln Phe
565 570 575
Met Ala Ala Met Gln Gln Ala Gln Gln Ala Ala Ala Leu Ala Gly Gly
580 585 590
Arg Gly Gly Ala Pro Gln Gly Gly Arg Gly Ala Met Ala Gly Met Pro
595 600 605
Pro Asn Val Gln Gly Gly Met Pro Gly Tyr Pro Pro Asn Asn Arg Gln
610 615 620
Met Gly Arg Asn Asn Asn Gly Gly Asn Gly Asn Asn Ala Gly Arg Asn
625 630 635 640
Gly Asn Phe Pro Asn Gln Ala Pro Arg Asp Ser Asn Thr Ala Ser Met
645 650 655
Leu Gln Asn Gln Leu Ala Ala Ala Gln Pro Ala Gln Gln Lys Gln Ile
660 665 670
Leu Gly Glu Leu Ile Phe Pro Lys Ile Gln Ala Ile Asn Ser Glu Leu
675 680 685
Ala Gly Lys Ile Thr Gly Met Leu Leu Glu Met Asp Asn Ser Glu Leu
690 695 700
Val Asn Leu Ile Glu Asp Glu Ala Ala Leu Lys Ala Lys Val Asp Glu
705 710 715 720
Ala Leu Ala Val Tyr Asp Glu Tyr Val Lys Ser Gln Ala Thr Gly Ser
725 730 735
Glu Lys Lys Glu Glu Glu Thr Lys Ala
740 745
<210> 55
<211> 645
<212> PRT
<213> Yarrowia lipolytica
<400> 55
Met Ser Ala Asp Ala Ser Leu Val Ala Ala Glu Lys Ala Leu Glu Lys
1 5 10 15
Met Thr Leu Glu Asn Lys Ala Glu Ala Ser Pro Ala Thr Lys Glu Glu
20 25 30
Thr Thr Thr Glu Ala Ala Pro Ala Glu Gly Glu Ala Lys Thr Glu Ser
35 40 45
Ser Glu Glu Lys Gly Ser Lys Glu Asp Gln Gly Asp Asn Ala Ser Leu
50 55 60
Tyr Val Gly Glu Leu Asp Pro Ser Val Thr Glu Ala Met Leu Phe Glu
65 70 75 80
Ile Phe Asn Pro Ile Gly Pro Val Thr Ser Val Arg Val Cys Arg Asp
85 90 95
Ala Ile Thr Arg Arg Ser Leu Gly Tyr Ala Tyr Val Asn Phe His Asn
100 105 110
Gln Ala Asp Gly Ile Arg Ala Leu Glu Glu Leu Asn Tyr Ser Pro Ile
115 120 125
Lys Glu Arg Pro Cys Arg Ile Met Trp Ser Gln Arg Asp Pro Ala Leu
130 135 140
Arg Lys Thr Gly Ala Gly Asn Ile Tyr Ile Lys Asn Leu Asp Pro Ala
145 150 155 160
Ile Asp Asn Lys Ala Leu His Asp Thr Phe Ser Ala Phe Gly Gln Ile
165 170 175
Leu Ser Cys Lys Ile Ala Thr Asp Glu Phe Gly Asn Ser Arg Gly Phe
180 185 190
Gly Phe Val His Tyr Glu Ser Ala Glu Ser Ala Glu Ser Ala Ile Gln
195 200 205
His Val Asn Gly Met Leu Leu Asn Asp Lys Lys Val Phe Val Gly Pro
210 215 220
His Val Pro Lys Ser Asp Arg Met Gln Ser Phe Glu Glu Gln Lys Asn
225 230 235 240
Ser Phe Thr Asn Val Phe Ile Lys Asn Leu Gly Thr Glu Ile Thr Glu
245 250 255
Ala Glu Phe Glu Glu Leu Val Asn Lys Phe Gly Glu Thr Ser Ser Val
260 265 270
His Leu Ser Thr Asn Asp Glu Gly Lys Pro Thr Gly Phe Gly Phe Val
275 280 285
Asp Tyr Lys Glu His Asp Val Ala Val Lys Ala Ile Asp Gly Leu Ser
290 295 300
Glu Thr Glu Phe Lys Gly Asn Lys Leu Phe Ala Gly Arg Ala Lys Lys
305 310 315 320
Lys Tyr Glu Arg Ala Asp Glu Leu Arg Lys Gln Tyr Glu Ala Ser Arg
325 330 335
Leu Glu Lys Leu Asn Lys Tyr Gln Gly Val Asn Leu Tyr Ile Lys Asn
340 345 350
Leu Asp Asp Thr Ile Asp Asp Asp Lys Leu Arg Ala Glu Phe Ala Pro
355 360 365
His Gly Thr Ile Thr Ser Ala Lys Val Met Val Asp Glu Ala Gly Lys
370 375 380
Ser Lys Gly Phe Gly Phe Val Cys Tyr Ser Ser Pro Glu Glu Ala Thr
385 390 395 400
Lys Ala Val Thr Glu Met Asn His Arg Leu Val Ala Gly Lys Pro Leu
405 410 415
Tyr Val Val Leu Ala Gln Arg Lys Asp Val Arg Arg Ser Gln Leu Gln
420 425 430
Gln Gln Ile Gln Ala Lys Asn Gln Met Arg Leu Gln Gln Gln Ala Ala
435 440 445
Ala Gly Gly Leu Pro Gly Gln Tyr Met Gly Asn Pro Gly Val Phe Tyr
450 455 460
Pro Gly Gln Pro Gly Phe Met Pro Pro Gly Arg Gly Gly Met Pro Phe
465 470 475 480
Gly Ala Asn Pro Gln Met Met Met Arg Pro Pro Met Pro Pro Gln Asn
485 490 495
Gln Phe Pro Pro Arg Gly Val Pro Gly Gly Pro Asn Met Tyr Gly Ala
500 505 510
Pro Pro Gln Gly Tyr Gln Gln Gly Gly Phe Pro Pro Gln Gly Pro Met
515 520 525
Arg Gly Gly Gln Pro Pro Arg Ser Gly Gln Pro Gly Pro Gln Gly Gln
530 535 540
Phe Arg Gly Ala Pro Arg Arg Lys Asp Gly Glu Ser Arg Val Ala Asp
545 550 555 560
Ser Ile Ser Asn Ala Leu Glu Asn Ala Pro Glu Glu Gln His Lys Gln
565 570 575
Leu Val Gly Glu Ala Leu Tyr Pro Lys Val Leu Ala Glu Lys Ala Ile
580 585 590
Asp Gly Asn Ala Glu Phe Ala Gly Lys Ile Thr Gly Met Leu Leu Glu
595 600 605
Met Pro Ile Lys Glu Ile Leu Glu Val Ile Asp Asp Glu Glu Gly Leu
610 615 620
Gln Ala Gln Ile Asn Asp Ala Ile Thr Ala Tyr Asn Glu Tyr Leu Asn
625 630 635 640
Ser Gln Lys Glu Glu
645
<210> 56
<211> 606
<212> PRT
<213> Komagataella phaffii
<400> 56
Met Ser Glu Lys Asn Thr Arg Ile Ala Ile Val Ser Asp Asp Arg Cys
1 5 10 15
Lys Pro Lys Lys Cys Arg Gln Glu Cys Arg Lys Ser Cys Pro Val Val
20 25 30
Lys Thr Gly Lys Leu Cys Ile Glu Val Glu Ala Tyr Ser Lys Ile Ala
35 40 45
Phe Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys
50 55 60
Cys Pro Phe Gly Ala Ile Asn Ile Ile Asn Leu Pro Thr Asn Leu Glu
65 70 75 80
Lys Glu Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg
85 90 95
Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn
100 105 110
Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys
115 120 125
Pro Asn Leu Gly Arg Tyr Asp Ala Pro Pro Asp Trp Glu Glu Ile Leu
130 135 140
Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Val Leu
145 150 155 160
Glu Asp Asn Ile Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Asn Leu
165 170 175
Pro Arg Ala Ile Lys Gly Pro Val Asn Lys Val Gly Glu Leu Leu Lys
180 185 190
Ala Lys Leu Glu Arg Lys Glu Glu Gly Lys His Ile Ile Gln Val Leu
195 200 205
Glu Leu Lys His Val Leu Asn Arg Glu Val Ala Lys Leu Ser Gly Gly
210 215 220
Glu Leu Gln Arg Phe Ala Ile Gly Met Thr Cys Val Gln Asp Ala Asn
225 230 235 240
Val Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg
245 250 255
Leu Asn Ala Ala Gln Ile Ile Arg Ser Leu Leu His Ala Thr Cys Tyr
260 265 270
Val Ile Val Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp
275 280 285
Phe Val Cys Ile Leu Tyr Gly Val Pro Ser Val Tyr Gly Val Val Thr
290 295 300
Leu Pro Ala Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly His
305 310 315 320
Ile Pro Thr Glu Asn Leu Arg Phe Arg Thr Glu Ser Leu Lys Phe Lys
325 330 335
Leu Thr Asp Ala Ser Asp Ser Val Leu Ile Glu Gln Ser Arg Ala Phe
340 345 350
Glu Tyr Pro Lys Met Val Lys Thr Gln Gly Asp Phe Lys Leu Thr Val
355 360 365
Asn Ala Gly Asp Phe Ser Asp Ser Glu Ile Ile Val Met Met Gly Glu
370 375 380
Asn Gly Thr Gly Lys Thr Thr Leu Cys Lys Leu Leu Ala Gly Ala Ile
385 390 395 400
Glu Gly Asp Glu Gly Thr Lys Val Pro Lys Leu Asn Val Ser Met Lys
405 410 415
Pro Gln Lys Ile Ala Pro Lys Phe Thr Gly Thr Val Arg Gln Leu Phe
420 425 430
Leu Lys Lys Ile Arg Ser Ser Phe Leu His Pro Gln Phe Asn Thr Asp
435 440 445
Val Met Lys Pro Leu Lys Val Asp Asp Val Ile Asp Gln Glu Val Gln
450 455 460
His Leu Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ala Leu
465 470 475 480
Gly Lys Glu Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu
485 490 495
Asp Ser Glu Gln Arg Ile Ile Cys Ser Lys Val Ile Arg Arg Phe Ile
500 505 510
Leu His Ser Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe Ile Met
515 520 525
Ala Thr Tyr Leu Ala Asp Lys Val Met Val Phe Glu Gly Gln Pro Ser
530 535 540
Lys Asn Ala Val Ala Asn Arg Pro Glu Thr Leu Leu Thr Gly Cys Asn
545 550 555 560
Arg Phe Leu Lys Asn Leu Asn Val Thr Phe Arg Arg Asp Pro Asn Ser
565 570 575
Phe Arg Pro Arg Ile Asn Lys Leu Asp Ser Gln Met Asp Arg Glu Gln
580 585 590
Lys Leu Ser Gly Asn Tyr Phe Phe Leu Glu Asn Thr Glu Leu
595 600 605
<210> 57
<211> 606
<212> PRT
<213> Komagataella pastoris
<400> 57
Met Ser Glu Lys Asn Thr Arg Ile Ala Ile Val Ser Asp Asp Arg Cys
1 5 10 15
Lys Pro Lys Lys Cys Arg Gln Glu Cys Arg Lys Ser Cys Pro Val Val
20 25 30
Lys Thr Gly Lys Leu Cys Ile Glu Val Glu Ala Tyr Ser Lys Ile Ala
35 40 45
Phe Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys
50 55 60
Cys Pro Phe Gly Ala Ile Asn Ile Ile Asn Leu Pro Thr Asn Leu Glu
65 70 75 80
Lys Glu Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg
85 90 95
Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn
100 105 110
Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys
115 120 125
Pro Asn Leu Gly Arg Tyr Asp Ala Pro Pro Asp Trp Glu Glu Ile Leu
130 135 140
Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Val Leu
145 150 155 160
Glu Asp Asn Ile Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Asn Leu
165 170 175
Pro Arg Ala Ile Lys Gly Pro Val Asn Lys Val Gly Glu Leu Leu Lys
180 185 190
Ala Lys Leu Glu Arg Lys Glu Glu Gly Lys His Ile Ile Gln Val Leu
195 200 205
Glu Leu Lys His Val Leu Asn Arg Glu Val Ala Lys Leu Ser Gly Gly
210 215 220
Glu Leu Gln Arg Phe Ala Ile Gly Met Thr Cys Val Gln Asp Ala Asn
225 230 235 240
Val Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg
245 250 255
Leu Asn Ala Ala Gln Ile Ile Arg Ser Leu Leu His Ala Thr Cys Tyr
260 265 270
Val Ile Val Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp
275 280 285
Phe Val Cys Ile Leu Tyr Gly Val Pro Ser Val Tyr Gly Val Val Thr
290 295 300
Leu Pro Ala Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly His
305 310 315 320
Ile Pro Thr Glu Asn Leu Arg Phe Arg Thr Glu Ser Leu Lys Phe Lys
325 330 335
Leu Thr Asp Ala Ser Asp Ser Val Leu Ile Glu Gln Ser Arg Ala Phe
340 345 350
Glu Tyr Pro Lys Met Val Lys Thr Gln Gly Asp Phe Lys Leu Thr Val
355 360 365
Asn Ala Gly Asp Phe Ser Asp Ser Glu Ile Ile Val Met Met Gly Glu
370 375 380
Asn Gly Thr Gly Lys Thr Thr Leu Cys Lys Leu Leu Ala Gly Ala Ile
385 390 395 400
Glu Gly Asp Glu Gly Thr Lys Val Pro Lys Leu Asn Val Ser Met Lys
405 410 415
Pro Gln Lys Ile Ala Pro Lys Phe Thr Gly Thr Val Arg Gln Leu Phe
420 425 430
Leu Lys Lys Ile Arg Ser Ser Phe Leu His Pro Gln Phe Asn Thr Asp
435 440 445
Val Met Lys Pro Leu Lys Val Asp Asp Val Ile Asp Gln Glu Val Gln
450 455 460
His Leu Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ala Leu
465 470 475 480
Gly Lys Glu Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu
485 490 495
Asp Ser Glu Gln Arg Ile Ile Cys Ser Lys Val Ile Arg Arg Phe Ile
500 505 510
Leu His Ser Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe Ile Met
515 520 525
Ala Thr Tyr Leu Ala Asp Lys Val Met Val Phe Glu Gly Gln Pro Ser
530 535 540
Lys Asn Ala Val Ala Asn Arg Pro Glu Thr Leu Leu Thr Gly Cys Asn
545 550 555 560
Arg Phe Leu Lys Asn Leu Asn Val Thr Phe Arg Arg Asp Pro Asn Ser
565 570 575
Phe Arg Pro Arg Ile Asn Lys Leu Asp Ser Gln Met Asp Arg Glu Gln
580 585 590
Lys Leu Ser Gly Asn Tyr Phe Phe Leu Glu Asn Thr Glu Leu
595 600 605
<210> 58
<211> 599
<212> PRT
<213> Homo sapiens
<400> 58
Met Ala Asp Lys Leu Thr Arg Ile Ala Ile Val Asn His Asp Lys Cys
1 5 10 15
Lys Pro Lys Lys Cys Arg Gln Glu Cys Lys Lys Ser Cys Pro Val Val
20 25 30
Arg Met Gly Lys Leu Cys Ile Glu Val Thr Pro Gln Ser Lys Ile Ala
35 40 45
Trp Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Ile Lys Lys
50 55 60
Cys Pro Phe Gly Ala Leu Ser Ile Val Asn Leu Pro Ser Asn Leu Glu
65 70 75 80
Lys Glu Thr Thr His Arg Tyr Cys Ala Asn Ala Phe Lys Leu His Arg
85 90 95
Leu Pro Ile Pro Arg Pro Gly Glu Val Leu Gly Leu Val Gly Thr Asn
100 105 110
Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys
115 120 125
Pro Asn Leu Gly Lys Tyr Asp Asp Pro Pro Asp Trp Gln Glu Ile Leu
130 135 140
Thr Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Ile Leu
145 150 155 160
Glu Asp Asp Leu Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Gln Ile
165 170 175
Pro Lys Ala Ala Lys Gly Thr Val Gly Ser Ile Leu Asp Arg Lys Asp
180 185 190
Glu Thr Lys Thr Gln Ala Ile Val Cys Gln Gln Leu Asp Leu Thr His
195 200 205
Leu Lys Glu Arg Asn Val Glu Asp Leu Ser Gly Gly Glu Leu Gln Arg
210 215 220
Phe Ala Cys Ala Val Val Cys Ile Gln Lys Ala Asp Ile Phe Met Phe
225 230 235 240
Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg Leu Lys Ala Ala
245 250 255
Ile Thr Ile Arg Ser Leu Ile Asn Pro Asp Arg Tyr Ile Ile Val Val
260 265 270
Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe Ile Cys Cys
275 280 285
Leu Tyr Gly Val Pro Ser Ala Tyr Gly Val Val Thr Met Pro Phe Ser
290 295 300
Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly Tyr Val Pro Thr Glu
305 310 315 320
Asn Leu Arg Phe Arg Asp Ala Ser Leu Val Phe Lys Val Ala Glu Thr
325 330 335
Ala Asn Glu Glu Glu Val Lys Lys Met Cys Met Tyr Lys Tyr Pro Gly
340 345 350
Met Lys Lys Lys Met Gly Glu Phe Glu Leu Ala Ile Val Ala Gly Glu
355 360 365
Phe Thr Asp Ser Glu Ile Met Val Met Leu Gly Glu Asn Gly Thr Gly
370 375 380
Lys Thr Thr Phe Ile Arg Met Leu Ala Gly Arg Leu Lys Pro Asp Glu
385 390 395 400
Gly Gly Glu Val Pro Val Leu Asn Val Ser Tyr Lys Pro Gln Lys Ile
405 410 415
Ser Pro Lys Ser Thr Gly Ser Val Arg Gln Leu Leu His Glu Lys Ile
420 425 430
Arg Asp Ala Tyr Thr His Pro Gln Phe Val Thr Asp Val Met Lys Pro
435 440 445
Leu Gln Ile Glu Asn Ile Ile Asp Gln Glu Val Gln Thr Leu Ser Gly
450 455 460
Gly Glu Leu Gln Arg Val Ala Leu Ala Leu Cys Leu Gly Lys Pro Ala
465 470 475 480
Asp Val Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln
485 490 495
Arg Leu Met Ala Ala Arg Val Val Lys Arg Phe Ile Leu His Ala Lys
500 505 510
Lys Thr Ala Phe Val Val Glu His Asp Phe Ile Met Ala Thr Tyr Leu
515 520 525
Ala Asp Arg Val Ile Val Phe Asp Gly Val Pro Ser Lys Asn Thr Val
530 535 540
Ala Asn Ser Pro Gln Thr Leu Leu Ala Gly Met Asn Lys Phe Leu Ser
545 550 555 560
Gln Leu Glu Ile Thr Phe Arg Arg Asp Pro Asn Asn Tyr Arg Pro Arg
565 570 575
Ile Asn Lys Leu Asn Ser Ile Lys Asp Val Glu Gln Lys Lys Ser Gly
580 585 590
Asn Tyr Phe Phe Leu Asp Asp
595
<210> 59
<211> 587
<212> PRT
<213> Aspergillus niger
<400> 59
Met Lys Lys Cys Arg Gln Glu Cys Lys Lys Ser Cys Pro Val Val Arg
1 5 10 15
Thr Gly Lys Leu Cys Ile Glu Val Thr Pro Glu Ser Lys Ile Ala Phe
20 25 30
Ile Ser Glu Arg Leu Cys Ile Gly Cys Gly Ile Cys Pro Lys Lys Cys
35 40 45
Pro Phe Gly Ala Ile His Ile Ile Asn Leu Pro Thr Asn Leu Glu Thr
50 55 60
Gln Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg Leu
65 70 75 80
Pro Met Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn Gly
85 90 95
Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ser Gly Lys Leu Lys Pro
100 105 110
Asn Leu Gly Arg Phe Asp Asn Pro Pro Asp Trp Glu Glu Ile Leu Lys
115 120 125
Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Val Leu Glu
130 135 140
Asp Asp Leu Lys Ala Val Val Lys Pro Gln Tyr Val Asp Gln Ile Pro
145 150 155 160
Arg Ala Val Lys Gly Pro Val Gln Asn Val Gly Ala Leu Ile Lys Ala
165 170 175
Arg Ala Gln Leu Asp Asn Leu Asp His Ile Leu Asp Thr Leu Glu Leu
180 185 190
Arg Gln Val Gln Asp Arg Asp Ile Gly His Leu Ser Gly Gly Glu Leu
195 200 205
Gln Arg Phe Ala Ile Gly Leu Val Cys Val Gln Lys Ala Asp Val Tyr
210 215 220
Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg Leu Ala
225 230 235 240
Ala Ala Arg Ser Ile Arg Glu Leu Leu Arg Pro Asp Asp Tyr Val Ile
245 250 255
Val Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe Val
260 265 270
Cys Val Leu Tyr Gly Arg Pro Ala Leu Tyr Gly Val Val Thr Leu Pro
275 280 285
Ala Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly His Ile Pro
290 295 300
Thr Glu Asn Leu Arg Phe Arg Glu Glu Ser Leu Thr Phe Arg Leu Ala
305 310 315 320
Glu Ala Gly Asp Asp Phe Met Val Asp Arg Ala Arg Ala Phe Ala Tyr
325 330 335
Pro Ser Met Glu Lys Thr Leu Gly Asn Phe His Leu Lys Ile Asp Ala
340 345 350
Gly Ser Phe Thr Asp Ser Glu Ile Ile Val Met Met Gly Glu Asn Gly
355 360 365
Thr Gly Lys Thr Thr Phe Cys Lys Met Leu Ala Gly Ala Glu Lys Pro
370 375 380
Asp Gly Gly Lys Ser Val Pro Arg Leu Asn Ile Ser Met Lys Pro Gln
385 390 395 400
Lys Ile Thr Pro Lys Phe Gln Gly Thr Val Arg Gln Leu Phe Phe Lys
405 410 415
Arg Ile Lys Ala Ala Phe Leu Ser Pro Gln Phe Gln Thr Asp Val Tyr
420 425 430
Lys Pro Leu Lys Ile Asp Asp Phe Ile Asp Gln Glu Val Gln Asn Leu
435 440 445
Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ala Leu Gly Ile
450 455 460
Pro Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser
465 470 475 480
Glu Gln Arg Ile Val Ala Ser Arg Val Ile Lys Arg Phe Ile Met His
485 490 495
Thr Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe Ile Met Ala Thr
500 505 510
Tyr Leu Ala Asp Arg Val Ile Val Phe Asp Gly Gln Pro Ser Val Asp
515 520 525
Ala His Ala Asn Ala Pro Glu Ser Leu Val Thr Gly Cys Asn Thr Phe
530 535 540
Leu Lys Asn Leu Asp Val Thr Phe Arg Arg Asp Pro Asn Ser Tyr Arg
545 550 555 560
Pro Arg Ile Asn Lys Tyr Gln Ser Gln Met Asp Gln Glu Gln Lys Leu
565 570 575
Ala Gly Asn Tyr Phe Phe Leu Glu Glu Glu Lys
580 585
<210> 60
<211> 599
<212> PRT
<213> Cricetulus griseus
<400> 60
Met Ala Asp Lys Leu Thr Arg Ile Ala Ile Val Asn His Asp Lys Cys
1 5 10 15
Lys Pro Lys Lys Cys Arg Gln Glu Cys Lys Lys Ser Cys Pro Val Val
20 25 30
Arg Met Gly Lys Leu Cys Ile Glu Val Thr Pro Gln Ser Lys Ile Ala
35 40 45
Trp Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Ile Lys Lys
50 55 60
Cys Pro Phe Gly Ala Leu Ser Ile Val Asn Leu Pro Ser Asn Leu Glu
65 70 75 80
Lys Glu Thr Thr His Arg Tyr Cys Ala Asn Ala Phe Lys Leu His Arg
85 90 95
Leu Pro Ile Pro Arg Pro Gly Glu Val Leu Gly Leu Val Gly Thr Asn
100 105 110
Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys
115 120 125
Pro Asn Leu Gly Lys Tyr Asp Asp Pro Pro Asp Trp Gln Glu Ile Leu
130 135 140
Thr Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Ile Leu
145 150 155 160
Glu Asp Asp Leu Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Gln Ile
165 170 175
Pro Lys Ala Ala Lys Gly Thr Val Gly Ser Ile Leu Asp Arg Lys Asp
180 185 190
Glu Thr Lys Thr Gln Ala Ile Val Cys Gln Gln Leu Asp Leu Thr His
195 200 205
Leu Lys Glu Arg Asn Val Glu Asp Leu Ser Gly Gly Glu Leu Gln Arg
210 215 220
Phe Ala Cys Ala Val Val Cys Ile Gln Lys Ala Asp Ile Phe Met Phe
225 230 235 240
Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg Leu Lys Ala Ala
245 250 255
Ile Thr Ile Arg Ser Leu Ile Asn Pro Asp Arg Tyr Ile Ile Val Val
260 265 270
Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe Ile Cys Cys
275 280 285
Leu Tyr Gly Val Pro Ser Ala Tyr Gly Val Val Thr Met Pro Phe Ser
290 295 300
Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly Tyr Val Pro Thr Glu
305 310 315 320
Asn Leu Arg Phe Arg Asp Ala Ser Leu Val Phe Lys Val Ala Glu Thr
325 330 335
Ala Asn Glu Glu Glu Val Lys Lys Met Cys Met Tyr Lys Tyr Pro Glu
340 345 350
Met Lys Lys Lys Met Gly Glu Phe Glu Leu Ala Ile Val Ala Gly Glu
355 360 365
Phe Thr Asp Ser Glu Ile Met Val Met Leu Gly Glu Asn Gly Thr Gly
370 375 380
Lys Thr Thr Phe Ile Arg Met Leu Ala Gly Arg Leu Lys Pro Asp Glu
385 390 395 400
Gly Gly Ala Val Pro Ile Leu Asn Val Ser Tyr Lys Pro Gln Lys Ile
405 410 415
Ser Pro Lys Ser Thr Gly Ser Val Arg Gln Leu Leu His Glu Lys Ile
420 425 430
Arg Asp Ala Tyr Thr His Pro Gln Phe Val Thr Asp Val Met Lys Pro
435 440 445
Leu Gln Ile Glu Asn Ile Ile Asp Gln Glu Val Gln Thr Leu Ser Gly
450 455 460
Gly Glu Leu Gln Arg Val Ala Leu Ala Leu Cys Leu Gly Lys Pro Ala
465 470 475 480
Asp Val Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln
485 490 495
Arg Leu Met Ala Ala Arg Val Val Lys Arg Phe Ile Leu His Ala Lys
500 505 510
Lys Thr Ala Phe Val Val Glu His Asp Phe Ile Met Ala Thr Tyr Leu
515 520 525
Ala Asp Arg Val Ile Val Phe Asp Gly Val Pro Ser Lys Asn Thr Val
530 535 540
Ala Asn Ser Pro Gln Thr Leu Leu Ala Gly Met Asn Lys Phe Leu Ser
545 550 555 560
Gln Leu Glu Ile Thr Phe Arg Arg Asp Pro Asn Asn Tyr Arg Pro Arg
565 570 575
Ile Asn Lys Leu Asn Ser Ile Lys Asp Val Glu Gln Lys Lys Ser Gly
580 585 590
Asn Tyr Phe Phe Leu Asp Asp
595
<210> 61
<211> 607
<212> PRT
<213> Kluyveromyces lactis
<400> 61
Met Ser Ser Lys Asn Thr Arg Ile Ala Ile Val Ser Glu Asp Lys Cys
1 5 10 15
Lys Pro Lys Lys Cys Arg Gln Glu Cys Lys Arg Ser Cys Pro Val Val
20 25 30
Lys Thr Gly Lys Leu Cys Ile Glu Val Met Pro Thr Ser Lys Ile Ala
35 40 45
Phe Ile Ser Glu Asn Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys
50 55 60
Cys Pro Phe Asp Ala Ile Gln Ile Ile Asn Leu Pro Thr Asn Leu Asp
65 70 75 80
Ser Gln Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg
85 90 95
Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn
100 105 110
Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys
115 120 125
Pro Asn Leu Gly Arg Phe Glu Asp Pro Pro Glu Trp Gln Glu Ile Ile
130 135 140
Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Met Leu
145 150 155 160
Glu Asp Asp Ile Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Asn Ile
165 170 175
Pro Arg Ala Ile Lys Gly Pro Val Gln Lys Val Gly Glu Leu Leu Lys
180 185 190
Leu Arg Leu Glu Lys Ser Lys Asp Asp Ala Lys Asn Tyr Ile Asp Ile
195 200 205
Leu Gln Leu Lys Asn Val Leu Asn Arg Glu Val Ser Ala Leu Ser Gly
210 215 220
Gly Glu Leu Gln Arg Phe Ala Ile Gly Met Ser Cys Val Gln Glu Ala
225 230 235 240
Asp Val Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln
245 250 255
Arg Leu Asn Ala Ala Leu Ile Ile Arg Ser Leu Leu Lys Pro Thr Thr
260 265 270
Tyr Val Ile Cys Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser
275 280 285
Asp Phe Val Cys Ile Ile Tyr Gly Val Pro Ser Val Tyr Gly Val Val
290 295 300
Thr Leu Pro Ser Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly
305 310 315 320
His Ile Pro Ser Glu Asn Leu Arg Phe Arg Thr Glu Ala Leu Gln Phe
325 330 335
Arg Met Ala Asp Ala Gly Asp Glu Leu Glu Ala Asp Ala Ser Arg Ala
340 345 350
Phe Thr Tyr Pro Asp Met Lys Arg Thr Gln Gly Asp Phe Ser Leu Thr
355 360 365
Val Glu Ala Gly Glu Phe Ser Asp Ser Gln Ile Leu Val Met Met Gly
370 375 380
Glu Asn Gly Thr Gly Lys Thr Thr Leu Ile Lys Leu Leu Ala Gly Ala
385 390 395 400
Ile Pro Ala Asp Asp Gly Gln Asp Ile Pro Lys Leu Asn Val Ser Met
405 410 415
Lys Pro Gln Lys Ile Ala Pro Lys Phe Thr Gly Thr Val Arg Gln Leu
420 425 430
Phe Phe Lys Arg Ile Arg Ala Gln Phe Leu Asn Pro Gln Phe Gln Thr
435 440 445
Asp Val Val Lys Pro Leu Lys Ile Asp Asp Ile Ile Asp Gln Glu Val
450 455 460
Gln His Leu Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ser
465 470 475 480
Leu Gly Met Asn Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr
485 490 495
Leu Asp Ser Glu Gln Arg Ile Ile Cys Ser Lys Val Ile Arg Arg Phe
500 505 510
Ile Leu His Asn Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe Ile
515 520 525
Met Ala Thr Tyr Leu Ala Asp Lys Val Ile Val Phe Asp Gly Thr Pro
530 535 540
Ser Lys Gln Ala Phe Ala Arg Ala Pro Glu Ser Leu Leu Thr Gly Cys
545 550 555 560
Asn Lys Phe Leu Lys Asn Leu Asn Val Thr Phe Arg Arg Asp Pro Thr
565 570 575
Ser Phe Arg Pro Arg Ile Asn Lys Leu Asp Ser Gln Met Asp Lys Glu
580 585 590
Gln Lys Ser Ser Gly Asn Tyr Phe Phe Leu Asp His Asn Gly Val
595 600 605
<210> 62
<211> 608
<212> PRT
<213> Saccharomyces cerevisiae
<400> 62
Met Ser Asp Lys Asn Ser Arg Ile Ala Ile Val Ser Ala Asp Lys Cys
1 5 10 15
Lys Pro Lys Lys Cys Arg Gln Glu Cys Lys Arg Ser Cys Pro Val Val
20 25 30
Lys Thr Gly Lys Leu Cys Ile Glu Val Thr Pro Thr Ser Lys Ile Ala
35 40 45
Phe Ile Ser Glu Ile Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys
50 55 60
Cys Pro Phe Asp Ala Ile Gln Ile Ile Asn Leu Pro Thr Asn Leu Glu
65 70 75 80
Ala His Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg
85 90 95
Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn
100 105 110
Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys
115 120 125
Pro Asn Leu Gly Arg Phe Asp Asp Pro Pro Glu Trp Gln Glu Ile Ile
130 135 140
Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Tyr Phe Thr Lys Met Leu
145 150 155 160
Glu Asp Asp Ile Lys Ala Ile Ile Lys Pro Gln Tyr Val Asp Asn Ile
165 170 175
Pro Arg Ala Ile Lys Gly Pro Val Gln Lys Val Gly Glu Leu Leu Lys
180 185 190
Leu Arg Met Glu Lys Ser Pro Glu Asp Val Lys Arg Tyr Ile Lys Ile
195 200 205
Leu Gln Leu Glu Asn Val Leu Lys Arg Asp Ile Glu Lys Leu Ser Gly
210 215 220
Gly Glu Leu Gln Arg Phe Ala Ile Gly Met Ser Cys Val Gln Glu Ala
225 230 235 240
Asp Val Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Val Lys Gln
245 250 255
Arg Leu Asn Ala Ala Gln Ile Ile Arg Ser Leu Leu Ala Pro Thr Lys
260 265 270
Tyr Val Ile Cys Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser
275 280 285
Asp Phe Val Cys Ile Ile Tyr Gly Val Pro Ser Val Tyr Gly Val Val
290 295 300
Thr Leu Pro Ala Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly
305 310 315 320
His Ile Pro Ala Glu Asn Leu Arg Phe Arg Thr Glu Ala Leu Gln Phe
325 330 335
Arg Ile Ala Asp Ala Thr Glu Asp Leu Gln Asn Asp Ser Ala Ser Arg
340 345 350
Ala Phe Ser Tyr Pro Ser Leu Lys Lys Thr Gln Gly Asp Phe Val Leu
355 360 365
Asn Val Glu Glu Gly Glu Phe Ser Asp Ser Glu Ile Leu Val Met Met
370 375 380
Gly Glu Asn Gly Thr Gly Lys Thr Thr Leu Ile Lys Leu Leu Ala Gly
385 390 395 400
Ala Leu Lys Pro Asp Glu Gly Gln Asp Ile Pro Lys Leu Asn Val Ser
405 410 415
Met Lys Pro Gln Lys Ile Ala Pro Lys Phe Pro Gly Thr Val Arg Gln
420 425 430
Leu Phe Phe Lys Lys Ile Arg Gly Gln Phe Leu Asn Pro Gln Phe Gln
435 440 445
Thr Asp Val Val Lys Pro Leu Arg Ile Asp Asp Ile Ile Asp Gln Glu
450 455 460
Val Gln His Leu Ser Gly Gly Glu Leu Gln Arg Val Ala Ile Val Leu
465 470 475 480
Ala Leu Gly Ile Pro Ala Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala
485 490 495
Tyr Leu Asp Ser Glu Gln Arg Ile Ile Cys Ser Lys Val Ile Arg Arg
500 505 510
Phe Ile Leu His Asn Lys Lys Thr Ala Phe Ile Val Glu His Asp Phe
515 520 525
Ile Met Ala Thr Tyr Leu Ala Asp Lys Val Ile Val Phe Glu Gly Ile
530 535 540
Pro Ser Lys Asn Ala His Ala Arg Ala Pro Glu Ser Leu Leu Thr Gly
545 550 555 560
Cys Asn Arg Phe Leu Lys Asn Leu Asn Val Thr Phe Arg Arg Asp Pro
565 570 575
Asn Ser Phe Arg Pro Arg Ile Asn Lys Leu Asp Ser Gln Met Asp Lys
580 585 590
Glu Gln Lys Ser Ser Gly Asn Tyr Phe Phe Leu Asp Asn Thr Gly Ile
595 600 605
<210> 63
<211> 593
<212> PRT
<213> Schizosaccharomyces pombe
<400> 63
Met Ser Glu Ser Leu Thr Arg Ile Ala Ile Val Ser Glu Asp Lys Cys
1 5 10 15
Arg Pro Lys Lys Cys Arg Gln Glu Cys Arg Arg Ser Cys Pro Val Val
20 25 30
Arg Thr Gly Lys Leu Cys Ile Glu Val Asn Pro Thr Asp Arg Ile Ala
35 40 45
Phe Ile Ser Glu Thr Leu Cys Ile Gly Cys Gly Ile Cys Val Lys Lys
50 55 60
Cys Pro Phe Gly Ala Ile Asn Ile Ile Asn Leu Pro Thr Asn Leu Glu
65 70 75 80
Ser Glu Val Thr His Arg Tyr Ser Ala Asn Ser Phe Lys Leu His Arg
85 90 95
Leu Pro Thr Pro Arg Pro Gly Gln Val Leu Gly Leu Val Gly Thr Asn
100 105 110
Gly Ile Gly Lys Ser Thr Ala Leu Lys Ile Leu Ser Gly Lys Met Lys
115 120 125
Pro Asn Leu Gly Arg Tyr Asp Asn Pro Pro Asp Trp Ala Glu Val Val
130 135 140
Lys Tyr Phe Arg Gly Ser Glu Leu Gln Asn Phe Phe Thr Lys Val Val
145 150 155 160
Glu Asp Asn Ile Lys Ala Leu Ile Lys Pro Gln Tyr Val Asp His Ile
165 170 175
Pro Arg Ala Ile Lys Thr Gly Asp Lys Thr Val Ser Gly Leu Ile Lys
180 185 190
Ala Arg Ala Asn Asn Asn Asn Phe Glu Glu Val Met Asp His Thr Asp
195 200 205
Leu Gln Asn Leu Leu Asn Arg Glu Val Gly His Leu Ser Gly Gly Glu
210 215 220
Leu Gln Arg Phe Ala Ile Ala Ala Val Ala Thr Gln Lys Ala Asp Val
225 230 235 240
Tyr Met Phe Asp Glu Pro Ser Ser Tyr Leu Asp Ile Lys Gln Arg Leu
245 250 255
Lys Ala Gly Arg Val Ile Arg Ser Leu Leu Ala Thr Thr Asn Tyr Val
260 265 270
Ile Val Val Glu His Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe
275 280 285
Val Cys Val Leu Tyr Gly Val Pro Ser Met Tyr Gly Val Val Thr Leu
290 295 300
Pro Tyr Ser Val Arg Glu Gly Ile Asn Ile Phe Leu Asp Gly His Ile
305 310 315 320
Pro Thr Glu Asn Leu Arg Phe Arg Ser Glu Ala Leu Thr Phe Arg Leu
325 330 335
Ala Asp Ala Ser Asp Glu Ile Thr Ala Asp Arg Thr Ala Glu Tyr Asn
340 345 350
Tyr Pro Asp His Val Ile Glu Gln Gly Asp Phe Lys Leu Thr Ile Lys
355 360 365
Ser Gly Gly Phe Ser Asp Ala Glu Ile Ile Val Leu Leu Gly Glu Asn
370 375 380
Gly Thr Gly Lys Thr Thr Phe Cys Lys Trp Met Ala Lys Asn Ser Asp
385 390 395 400
Leu Lys Ile Ser Met Lys Pro Gln Thr Ile Ala Pro Lys Phe Gln Gly
405 410 415
Thr Val Arg Met Leu Phe Leu Lys Lys Ile Arg Ala Ala Phe Leu Asn
420 425 430
Gly Lys Phe Gln Ser Glu Val Cys Lys Pro Leu Ser Ile Asp Asn Ile
435 440 445
Ile Asp Gln Glu Val Leu Asn Leu Ser Gly Gly Glu Leu Gln Arg Val
450 455 460
Ala Ile Cys Leu Ala Leu Gly Met Pro Ala Asp Val Tyr Leu Ile Asp
465 470 475 480
Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln Arg Ile Ile Ala Ser Lys
485 490 495
Val Ile Arg Arg Phe Ile Val Asn Ser Arg Lys Thr Ala Phe Ile Val
500 505 510
Glu His Asp Phe Ile Met Ala Thr Tyr Leu Ala Asp Arg Val Ile Leu
515 520 525
Phe Glu Gly Gln Pro Ser Arg Asp Ala Arg Cys Asn Pro Pro Gln Ser
530 535 540
Leu Leu Thr Gly Met Asn Thr Phe Leu Lys Asn Leu Asp Val Thr Phe
545 550 555 560
Arg Arg Asp Pro Asn Thr Leu Arg Pro Arg Ile Asn Lys Phe Asp Ser
565 570 575
Gln Met Asp Gln Glu Gln Lys Asn Ala Gly Asn Tyr Phe Phe Leu Glu
580 585 590
Asn
<210> 64
<211> 253
<212> PRT
<213> Trichoderma reesei
<400> 64
Met Glu Lys Thr Leu Gly Asn Phe Arg Leu Arg Ile Asp Ala Gly Glu
1 5 10 15
Phe Thr Asp Ser Glu Ile Ile Val Met Met Gly Glu Asn Gly Thr Gly
20 25 30
Lys Thr Thr Phe Cys Arg Leu Leu Ala Gly Ala Leu Lys Pro Asp Ser
35 40 45
Lys Arg Ser Val Pro Asp Met Lys Ile Ser Met Lys Pro Gln Thr Ile
50 55 60
Thr Pro Lys Phe Glu Gly Thr Val Arg Gln Leu Phe Phe Lys Lys Ile
65 70 75 80
Lys Ala Ala Phe Leu Ser Pro Gln Phe Gln Thr Asp Val Val Lys Pro
85 90 95
Leu Lys Leu Asp Asp Phe Ile Asp Gln Glu Val Lys Asn Leu Ser Gly
100 105 110
Gly Glu Leu Gln Arg Val Ala Ile Val Leu Ala Leu Gly Met Pro Ala
115 120 125
Asp Ile Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln
130 135 140
Arg Ile Ile Ala Ser Arg Val Ile Lys Arg Phe Ile Met His Ser Lys
145 150 155 160
Lys Thr Ala Phe Val Val Glu His Asp Phe Ile Met Ala Thr Tyr Leu
165 170 175
Ala Asp Arg Val Ile Val Phe Asp Gly Lys Pro Gly Ile Asp Ala His
180 185 190
Ala Asn Arg Pro Glu Ser Leu Leu Thr Gly Cys Asn Thr Phe Leu Lys
195 200 205
Asn Leu Asp Val Thr Phe Arg Arg Asp Pro Thr Asn Tyr Arg Pro Arg
210 215 220
Ile Asn Lys Leu Gly Ser Gln Leu Asp Gln Glu Gln Lys Leu Ser Gly
225 230 235 240
Asn Phe Phe Phe Leu Glu Glu Lys Pro Glu Glu Thr Ala
245 250
<210> 65
<211> 616
<212> PRT
<213> Yarrowia lipolytica
<400> 65
Met Pro Pro Lys Asn Lys Asn Glu Val Lys Asp Gly Asp Lys Asn Thr
1 5 10 15
Arg Ile Ala Ile Val Asn Val Asp Lys Cys Lys Pro Lys Lys Cys Arg
20 25 30
Gln Glu Cys Lys Lys Ser Cys Pro Val Val Arg Thr Gly Lys Leu Cys
35 40 45
Ile Glu Val Thr Pro Asp Ser Lys Ile Ala Phe Ile Ser Glu Thr Leu
50 55 60
Cys Ile Gly Cys Gly Ile Cys Pro Lys Lys Cys Pro Phe Gly Ala Leu
65 70 75 80
Gln Ile Ile Asn Leu Pro Thr Asn Leu Asp Ser Glu Val Thr His Arg
85 90 95
Tyr Ser Ala Asn Ser Phe Lys Leu His Arg Leu Pro Thr Pro Arg Pro
100 105 110
Gly Gln Val Leu Gly Leu Val Gly Thr Asn Gly Ile Gly Lys Ser Thr
115 120 125
Ala Leu Lys Ile Leu Ala Gly Lys Gln Lys Pro Asn Leu Gly Arg Tyr
130 135 140
Glu Asp Pro Pro Thr Trp Gln Glu Ile Leu Thr His Phe Arg Gly Ser
145 150 155 160
Glu Leu Gln Asn Tyr Phe Thr Arg Val Leu Glu Asp Asn Leu Lys Ala
165 170 175
Ile Ile Lys Pro Gln Tyr Val Asp Asn Leu Pro Arg Ala Ile Lys Gly
180 185 190
Pro Leu Gln Lys Val Gly Glu Leu Leu Lys Ala Lys Leu Glu Arg Lys
195 200 205
Asp Asp Phe Glu Asn Ile Val Asn Thr Leu Glu Leu Lys Gly Val Trp
210 215 220
Lys Arg Glu Val Ser Leu Leu Ser Gly Gly Glu Leu Gln Arg Phe Ala
225 230 235 240
Ile Gly Met Ser Cys Val Gln Leu Ala Gln Val Tyr Met Phe Asp Glu
245 250 255
Pro Ser Ser Tyr Leu Asp Val Lys Gln Arg Leu His Ala Ala Ala Met
260 265 270
Ile Arg Ser Leu Ile Asp Ser Thr Gly Tyr Ile Ile Val Val Glu His
275 280 285
Asp Leu Ser Val Leu Asp Tyr Leu Ser Asp Phe Val Cys Ile Leu Tyr
290 295 300
Gly Val Pro Ser Val Tyr Gly Val Val Thr Leu Pro Ser Ser Val Arg
305 310 315 320
Glu Gly Ile Asn Ile Phe Leu Asp Gly His Ile Pro Thr Glu Asn Leu
325 330 335
Arg Phe Arg Thr Glu Ser Leu Gln Phe Arg Leu Ala Asp Ala Thr Glu
340 345 350
Ile Ile Pro Leu Asp Gln Ser Arg Ser Phe Lys Tyr Pro Thr Met Ser
355 360 365
Arg Thr Gln Gly Asp Phe Lys Leu Asn Val Glu Ser Gly Glu Phe Thr
370 375 380
Asp Ser Glu Ile Ile Val Met Met Gly Glu Asn Gly Thr Gly Lys Thr
385 390 395 400
Thr Leu Cys Arg Leu Leu Ala Gly Ala Val Ala Pro Asp Glu Gly Gln
405 410 415
Lys Ala Pro Lys Leu Asn Val Ser Met Lys Pro Gln Lys Ile Ala Pro
420 425 430
Lys Phe Thr Gly Thr Val Arg Gln Leu Phe Leu Lys Lys Ile Arg Ser
435 440 445
Ser Met His His Pro Gln Phe Gln Thr Asp Val Tyr Lys Pro Leu Arg
450 455 460
Ile Asp Asp Ile Ile Asp Gln Glu Val Gln Asn Leu Ser Gly Gly Glu
465 470 475 480
Leu Gln Arg Val Ala Ile Val Leu Ala Leu Gly Gln Pro Ala Asp Ile
485 490 495
Tyr Leu Ile Asp Glu Pro Ser Ala Tyr Leu Asp Ser Glu Gln Arg Ile
500 505 510
Ile Cys Ala Lys Val Ile Arg Arg Phe Ile Leu His Ser Lys Lys Thr
515 520 525
Ala Phe Ile Val Glu His Asp Phe Ile Met Ala Thr Tyr Leu Ala Asp
530 535 540
Arg Val Ile Val Phe Asp Gly Gln Pro Ser Val Glu Ala Phe Ala Arg
545 550 555 560
Arg Pro Glu Ser Leu Leu Thr Gly Cys Asn Arg Phe Leu Lys Ser Leu
565 570 575
Asn Val Thr Phe Arg Arg Asp Pro Thr Ser Phe Arg Pro Arg Ile Asn
580 585 590
Lys Lys Asp Ser Gln Met Asp Lys Glu Gln Lys Ala His Gly Asn Tyr
595 600 605
Phe Phe Leu Asp Thr Ala Glu Ala
610 615
<210> 66
<211> 609
<212> DNA
<213> Komagataella phaffii
<400> 66
atgtcagaga ctgaaaacgc tcctcacgaa aagtcactgc ttgacgacca agttgatttc 60
actgttaagc atccgctcaa ctctgagtgg acactatggt atacgaagcc agccgttcat 120
gaacaagaaa gttggtcaga tttgctacgt cctatcattt cattcaactc ggtagaggag 180
ttctggggaa tcttcaactc cattccaaag gcctccgatt tgccagtcaa gtcggactat 240
catcttttta gagatggaat caaacctgaa tgggaagacg agcgcaatgc taacggagga 300
aaactgacat accagtttgc ctacagaaag gttgatatca atgaattgtg gtctcgcggt 360
ctgttgagtg tgattggtga aacgattcag gatgatgacg gagaaactga ggtgaacggt 420
attgttctga gcattcgtcg tgccgctttg aagattgccc tctggaccaa gtccaaggat 480
gaggcagttt tgagaccaat tggcgagaga ttcaagaaag ttttgaagtt gacagcccgt 540
gatcatattg actttcaacc tcataagagt ggtgctggta gcaagaacgt accttctttc 600
agcatttag 609
<210> 67
<211> 609
<212> DNA
<213> artificial
<220>
<223> eIF4E gene mutant
<400> 67
atgtcagaga ctgaaaacgc tcctcacgaa aagtcactgc ttgacgacca agttgatttc 60
actgttaagc atccgctcaa ctctgagtgg acactatggt atacgaagcc agccgttcat 120
gaacaagaaa gttggtcaga tttgctacgt cctatcattt cattcaactc ggtagaggag 180
ttctggggaa tcttcaactc cattccaaag gcctccgatt tgccagtcaa gtcggactat 240
catcttttta gagatggaat caaacctgaa tgggaggacg agcgcaatgc taacggagga 300
aaactgacat accagtttgc ctacagaaag gttgatatca atgaattgtg gtcccgcggt 360
ctgttgagtg tgattggtga aacgattcag gatgatgacg gagaaactga ggtgaacggt 420
attgttctga gcattcgtcg tgccgctttg aagattgccc tctggaccaa gtccaaggat 480
gaggcagttt taagaccaat tggcgagaga ttcaagaaag ttttgaagtt gacagcccgt 540
gatcatattg actttcaacc tcataagagt ggtgctggta gcaagaacgt accttctttc 600
agcatttag 609
<210> 68
<211> 1212
<212> DNA
<213> Komagataella phaffii
<400> 68
atgtctgaag gtattattga aatcgacact aacttaatcg agaccaacta cgaccaggtt 60
gtcagcacct tcgatgagct gaacctgaag gagcaaatcc tgagagccgt ttttgcttac 120
ggttacgagt tcccatctgc cattcaatct cgtgccattt tgccaattgt tgctggtcgt 180
gatgtcttgg cccaagccca gtccggtacc ggtaagactg ctacctttgc catctccgct 240
ttgcagagat tggatgagaa gctgaaggct gcccaagttt tgatcttggc cccaaccaga 300
gagttggccc tgcagatcaa gaaggttgtt ttggccctcg gtatgcactt gaacatctct 360
gtccatgcct gtatcggtgg tgttgaccca gctttggatg tcaaggcctt caactccggt 420
gttcaaatcg tcgttggtac cccaggtaga gtccaagaca tgatcgaacg tggagctttc 480
agaactgaga acgtcaagat ggtcattttg gatgaggccg atgagatgtt gtccactgga 540
ttcaaggagc aaatctacac cttgttcaca ttgttaccat ccactacaca ggttgttctt 600
ctatccgcca ccatgcctca agaggtgttg gaggttacca ccaagttcat gaacaaccct 660
attcgtatct tggtcaagaa ggaccaattg accttggaag gtattaagca attctacgtc 720
gacgtcggtg aagaacaata caagttcgac tgtctgtgtg atctgtacga ctccatctcc 780
gtcacccagg ccgttatctt ctgtaacacc agacgaaagg tcgaggagtt gactgagcgt 840
ttgaccgccc agaagttcac cgtctctgct atccactctg agctgtcaca aaccgagaga 900
gacaccatca tgcaagagtt cagaaccggt tcttccagaa tcttaatctc caccgacttg 960
ctggccagag gtatcgatgt ccaacaagtc tcattggtta tcaactacga cttaccatct 1020
aacaaggaaa actacatcca cagaatcggt agaggtggtc gtttcggtag aaagggtgtt 1080
gctatcaact tcgtcaccag caaggacgtt gagatgatga aggagatcga gaagttctac 1140
tctacccaaa tcgacgagtt gccatcttcc atcactgact tgtttgagac tgaggaagtt 1200
aatgagtctt ag 1212
<210> 69
<211> 1212
<212> DNA
<213> artificial
<220>
<223> eIF4A gene mutant
<400> 69
atgtctgaag gtattattga aatcgacact aacttaatcg agacaaacta cgaccaggtt 60
gtcagcacct tcgatgagct gaacctgaag gagcaaatcc tgagagccgt ttttgcttac 120
ggttacgagt tcccatctgc cattcaatct cgtgccattt tgccaattgt tgctggtcgt 180
gatgtcttgg cccaagccca gtccggtacc ggtaagactg ctacctttgc catctccgct 240
ttgcagagat tggatgagaa gctgaaggct gcccaagttt tgatcttggc cccaaccaga 300
gagttggccc tgcagatcaa gaaggttgtt ttggccctcg gtatgcactt gaacatctct 360
gtccatgcct gtatcggtgg tgttgaccca gctttggatg tcaaggcctt caactccggt 420
gttcaaatcg tcgttggtac cccaggtaga gtccaagaca tgatcgaacg tggagctttc 480
agaactgaga acgtcaagat ggtcattttg gatgaggccg atgagatgtt gtccactgga 540
ttcaaggagc aaatctacac cttgttcaca ttgttaccat ccactacaca ggttgttctt 600
ctatccgcca ccatgcctca agaggtgttg gaggttacca ccaagttcat gaacaaccct 660
attcgtatct tggtcaagaa ggaccaattg accttggaag gtattaagca attctacgtc 720
gacgtcggtg aagaacaata caagttcgac tgtctgtgtg atctgtacga ctccatctcc 780
gtcacccagg ccgttatctt ctgtaacacc agacgaaagg tcgaggagtt gactgagcgt 840
ttgaccgccc agaagttcac cgtctctgct atccactctg agctgtcaca aaccgagaga 900
gacaccatca tgcaagagtt cagaaccggt tcttccagaa tcttaatctc caccgacttg 960
ctggccagag gtatcgatgt ccaacaagtc tcattggtta tcaactacga cttaccatct 1020
aacaaggaaa actacatcca cagaatcggt agaggtggtc gtttcggtag aaagggtgtt 1080
gctatcaact tcgtcaccag caaggacgtt gagatgatga aggagatcga gaagttctac 1140
tctacccaaa tcgacgagtt gccatcttcc atcactgact tgtttgagac tgaggaagtt 1200
aatgagtctt ag 1212
<210> 70
<211> 1461
<212> DNA
<213> Komagataella phaffii
<400> 70
atgcatccat acaccgtagt atttgcgcgc ctcctcctgg gtgttttctc aactgccgcc 60
cccaactcgc cccccccctt ttgcacttct tgccaccttg gagatcagag attgtggaac 120
cttgctcaaa atctggcatg cacactacct cctcaaaaaa attttccttg ccttgttgca 180
aggcgctcaa aaatcaaaag tttttctaca acttttgttc ccaacaaatc acctttttac 240
ttacccatta tgtctgaagg tattattgaa atcgacacta acttaatcga gaccaactac 300
gaccaggttg tcagcacctt cgatgagctg aacctgaagg agcaaatcct gagagccgtt 360
tttgcttacg gttacgagtt cccatctgcc attcaatctc gtgccatttt gccaattgtt 420
gctggtcgtg atgtcttggc ccaagcccag tccggtaccg gtaagactgc tacctttgcc 480
atctccgctt tgcagagatt ggatgagaag ctgaaggctg cccaagtttt gatcttggcc 540
ccaaccagag agttggccct gcagatcaag aaggttgttt tggccctcgg tatgcacttg 600
aacatctctg tccatgcctg tatcggtggt gttgacccag ctttggatgt caaggccttc 660
aactccggtg ttcaaatcgt cgttggtacc ccaggtagag tccaagacat gatcgaacgt 720
ggagctttca gaactgagaa cgtcaagatg gtcattttgg atgaggccga tgagatgttg 780
tccactggat tcaaggagca aatctacacc ttgttcacat tgttaccatc cactacacag 840
gttgttcttc tatccgccac catgcctcaa gaggtgttgg aggttaccac caagttcatg 900
aacaacccta ttcgtatctt ggtcaagaag gaccaattga ccttggaagg tattaagcaa 960
ttctacgtcg acgtcggtga agaacaatac aagttcgact gtctgtgtga tctgtacgac 1020
tccatctccg tcacccaggc cgttatcttc tgtaacacca gacgaaaggt cgaggagttg 1080
actgagcgtt tgaccgccca gaagttcacc gtctctgcta tccactctga gctgtcacaa 1140
accgagagag acaccatcat gcaagagttc agaaccggtt cttccagaat cttaatctcc 1200
accgacttgc tggccagagg tatcgatgtc caacaagtct cattggttat caactacgac 1260
ttaccatcta acaaggaaaa ctacatccac agaatcggta gaggtggtcg tttcggtaga 1320
aagggtgttg ctatcaactt cgtcaccagc aaggacgttg agatgatgaa ggagatcgag 1380
aagttctact ctacccaaat cgacgagttg ccatcttcca tcactgactt gtttgagact 1440
gaggaagtta atgagtctta g 1461
<210> 71
<211> 1461
<212> DNA
<213> Artificial Sequence
<220>
<223> eIF4A gene mutant
<400> 71
atgcatccat acaccgtagt atttgcgcgc ctcctcctgg gtgttttctc aactgccgcc 60
cccaactcgc cccccccctt ttgcacttct tgccaccttg gagatcagag attgtggaac 120
cttgctcaaa atctggcatg cacactacct cctcaaaaaa attttccttg ccttgttgca 180
aggcgctcaa aaatcaaaag tttttctaca acttttgttc ccaacaaatc acctttttac 240
ttacccatta tgtctgaagg tattattgaa atcgacacta acttaatcga gacaaactac 300
gaccaggttg tcagcacctt cgatgagctg aacctgaagg agcaaatcct gagagccgtt 360
tttgcttacg gttacgagtt cccatctgcc attcaatctc gtgccatttt gccaattgtt 420
gctggtcgtg atgtcttggc ccaagcccag tccggtaccg gtaagactgc tacctttgcc 480
atctccgctt tgcagagatt ggatgagaag ctgaaggctg cccaagtttt gatcttggcc 540
ccaaccagag agttggccct gcagatcaag aaggttgttt tggccctcgg tatgcacttg 600
aacatctctg tccatgcctg tatcggtggt gttgacccag ctttggatgt caaggccttc 660
aactccggtg ttcaaatcgt cgttggtacc ccaggtagag tccaagacat gatcgaacgt 720
ggagctttca gaactgagaa cgtcaagatg gtcattttgg atgaggccga tgagatgttg 780
tccactggat tcaaggagca aatctacacc ttgttcacat tgttaccatc cactacacag 840
gttgttcttc tatccgccac catgcctcaa gaggtgttgg aggttaccac caagttcatg 900
aacaacccta ttcgtatctt ggtcaagaag gaccaattga ccttggaagg tattaagcaa 960
ttctacgtcg acgtcggtga agaacaatac aagttcgact gtctgtgtga tctgtacgac 1020
tccatctccg tcacccaggc cgttatcttc tgtaacacca gacgaaaggt cgaggagttg 1080
actgagcgtt tgaccgccca gaagttcacc gtctctgcta tccactctga gctgtcacaa 1140
accgagagag acaccatcat gcaagagttc agaaccggtt cttccagaat cttaatctcc 1200
accgacttgc tggccagagg tatcgatgtc caacaagtct cattggttat caactacgac 1260
ttaccatcta acaaggaaaa ctacatccac agaatcggta gaggtggtcg tttcggtaga 1320
aagggtgttg ctatcaactt cgtcaccagc aaggacgttg agatgatgaa ggagatcgag 1380
aagttctact ctacccaaat cgacgagttg ccatcttcca tcactgactt gtttgagact 1440
gaggaagtta atgagtctta g 1461
<210> 72
<211> 3297
<212> DNA
<213> Komagataella phaffii
<400> 72
atgtccaata agaacgtgga tacagctcca gataatggtt ctggtggctc caattcccca 60
gcttctgtgc cgcattatcc acagcaacac cgtgctaatt ataatcctca taagaatcat 120
actaatcatg ggggcaataa tggaggcgcc cagggttaca tgcagcatca gcaacagcaa 180
caaatgtatt acaatcagat gggctaccct atgccgtatc cgaatgctgg tggcaatttc 240
aaccagaatg tatacttggt tccttataat actatggttc caggtactcc atatggtgca 300
ggtgccccgg gcgtgcctcc aagctaccca gtgtctcctt ctccagcatt cgcctctcca 360
caaaagactc atgtgccagt aagtctgcgt accccttctg gagaacctat aaatttggtt 420
cctgctgggc aaacgagttc cagttcatcc aatgcctctc ctcatgttaa gtctacctct 480
attcctcctt ctgctgtcac tagtcctgct gcttccattg ctccaactgt tgcatcaccg 540
actaaggccg cggctggatc tgaagacgct ggcaagacta gagatgcatt caagcagatg 600
gttcaggctt tagctgctaa aaagaaggct gcagctgctg ccaaggctga aggtaaaaca 660
gatgataaaa aggagtctgt ggagtctaag cctaagtctg ctgtacagcc cgagacaaag 720
ccaaaagttg aggttaagtt agagccaaaa ccaaaagttg aggtcaaatt agagccaaag 780
ccaaaggttg agattaaact agagcccaaa ccagtatcgg aggctaaacc agagacaaaa 840
acagtacctg aggttgaaga accttcaaca gttgcaacga tcaaatcaga atccacacca 900
attgaggagc tcaaacccaa agttgaggta accccagaag ttgcatccaa gcctgaacag 960
gttgagtctg cacaggagcc ggctaacgat gtaaaaccat ctgaagtctc agctaaagag 1020
gttcaagaat ccaaggagga gtctttgaaa caacctaagg aagctttgaa tgacattaaa 1080
tccaccgagg agtcaaataa aaagttttct cttccagaag aggagtctaa cgatcaccag 1140
acactttccc aaattcaagg agttaaagat acagaacaat cgcaagaatt tgaagaacct 1200
caaggaaccc aggaaactca ggaaactcag gaaacgcagg aaaccgcaaa gcctttggaa 1260
gctcaagcac ctcaagaaat tcaagaaacc caagaacctg aggaagttca ggaacaaact 1320
cctgaaacat ctgagactgt ttcttctgtc acagaagaag tgtctccagc tccagcacct 1380
ggattgcccc tttcaaagtt cttggacaga atcagaaagg ctcccgccat ttcaaaccca 1440
ttcaagcatg agtactcagg tgatttccat ggtccagacg aaagtttaag tggtctgaaa 1500
accatcaaat atgatccggg tttcttgatc caattcgcca ccttcaactt ccatattgat 1560
gaagatttca tcaacgatgt cggttctaag gttgtgatcc ctgtcaacac cagaagagac 1620
aatttttcca agagcatgtc taccagcaat ttcaaaggtt ctggtagaaa tatgggttct 1680
aatttcagaa atgattttgg atctagaaac aactccaagc aaggttccaa gaaaaagaat 1740
aaatctcaaa agagccaatc taggaggggt ccaaagtact ccaatgaaga agaacctgct 1800
gaaccagccg tgcctgctga attgcctaat agagctgcaa gcaagtgggt acctcgttcg 1860
ttaagaaata aggaggctga agtcaagact gctccagacg gatctataat agtatcagaa 1920
gaagacatca aaaggaaaac taaatccctt ttgaataagt tgacgttgga attctttgat 1980
gatatctcaa acgatataat tgctttgacc aagcaagctc aatgggaaga tgacgtgaag 2040
actttgaaac aagttattga gtctatattt gcaaaggctt gtgacgaacc ctactggtct 2100
tctatgtacg ctaaattatg cgccaaaatg tgcaaggaca ccccacctga gatcaaggaa 2160
actaatgaga agggaaatac tttcaccggt ggtgatttgg tgagaagagt gttgattaat 2220
agatgtcaaa ccgaatatca gaaaggatgg attgaccagc taccaaccaa cgaggatggt 2280
tcacctctag agccagaact gatgtctgac gaatattaca aacaagctgc tgctaaacgt 2340
agaggtcttg gtctggttaa gttcattggt caattgtacc agttgaactt attatcagac 2400
aatgtcattt tccactgtgt ccttggtcag tccaaagaaa cagacaatcc atcagaagat 2460
actatggaga acctggttca attattggaa gctgtaggtt atagaatgga gatgtccagt 2520
gaacctaaga ttagaagggt tcttgatctc gcctttgcca acatcaaggc cattgttgac 2580
gctaacaaga ttccttcaag aataagattt atgctcatgg atttgatgga tctaagaaga 2640
aatggctggg ctacaacaga agagaacgct ggtccaaaga ccattcaaga gattcactta 2700
gaggctgaga tcaagagatc agaggaggag agagaaaaag aaagagacag gcattctcgt 2760
agaggacgtt acaacgactc caaacctaac tctcgtcaaa agtcatcttg gggaagttca 2820
gtggtttcac ctaatgatat tagaaatgca ggctatgtta gaaactctga caaatctctg 2880
gggcctgtca acagtttttc caggggcaag tcatcccgtc aagcttcaaa gcaatcaaac 2940
agtgatttta ccagtgttcc tatcacttcc agtggtagta gaactgctct aaaccactct 3000
ggcgacagct caacgtctct gaacgaacct caatcaagag aatattcaaa aaaatctgaa 3060
tctaggcccg ctccttccaa catttttgct gcattagagg atcacgatca tgatcatgaa 3120
catggccacg aacaagaaga aaacaagcat tccaaggatc tccaaaacgg agaggccgaa 3180
gcacctgagg acgacaatgt gggagaaata gcccaagctg acgaaaatgt gcaagggcaa 3240
gagcaagagg aagaacgaga ggaagagcga gagcaagaag aggaacagga agtttaa 3297
<210> 73
<211> 3297
<212> DNA
<213> Artificial Sequence
<220>
<223> eIF4G gene mutant
<400> 73
atgtccaata agaacgtgga tacagctcca gataatggtt ctggtggctc caattcccca 60
gcttctgtgc cgcattatcc acagcaacac cgtgctaatt ataatcctca taagaatcat 120
actaatcatg ggggcaataa tggaggcgcc cagggttaca tgcagcatca gcaacagcaa 180
caaatgtatt acaatcagat gggctaccct atgccgtatc cgaatgctgg tggcaatttc 240
aaccagaatg tatacttggt tccttataat actatggttc caggtactcc atatggtgca 300
ggtgccccgg gcgtgcctcc aagctaccca gtgtctcctt ctccagcatt cgcctctcca 360
caaaagactc atgtgccagt aagtctgcgt accccttctg gagaacctat aaatttggtt 420
cctgctgggc aaacgagttc cagttcatcc aatgcctctc ctcatgttaa gtctacctct 480
attcctcctt ctgctgtcac tagtcctgct gcttccattg ctccaactgt tgcatcaccg 540
actaaggccg cggctggatc tgaggacgct ggcaagacta gagatgcatt caagcagatg 600
gttcaggctt tagctgctaa aaagaaggct gcagctgctg ccaaggctga aggtaaaaca 660
gatgataaaa aggagtctgt ggagtctaag cctaagtctg ctgtacagcc cgagacaaag 720
ccaaaagttg aggttaagtt agagccaaaa ccaaaagttg aggtcaaatt agagccaaag 780
ccaaaggttg agattaaact agagcccaaa ccagtatcgg aggctaaacc agagacaaaa 840
acagtacctg aggttgaaga accttcaaca gttgcaacga tcaaatcaga atccacacca 900
attgaggagc tcaaacccaa agttgaggta accccagaag ttgcatccaa gcctgaacag 960
gttgagtctg cacaggagcc ggctaacgat gtaaaaccat ctgaagtctc agctaaagag 1020
gttcaagaat ccaaggagga gtctttgaaa caacctaagg aagctttgaa tgacattaaa 1080
tccaccgagg agtcaaataa aaagttttct cttccagaag aggagtctaa cgatcaccag 1140
acactttccc aaattcaagg agttaaagat acagaacaat cgcaagaatt tgaagaacct 1200
caaggaaccc aggaaactca ggaaactcag gaaacgcagg aaaccgcaaa gcctttggaa 1260
gctcaagcac ctcaagaaat tcaagaaacc caagaacctg aggaagttca ggaacaaact 1320
cctgaaacat ctgagactgt ttcttctgtc acagaagaag tgtctccagc tccagcacct 1380
ggattgcccc tttcaaagtt cttggacaga atcagaaagg ctcccgccat ttcaaaccca 1440
ttcaagcatg agtactcagg tgatttccat ggtccagacg aaagtttaag tggtctgaaa 1500
accatcaaat atgatccggg tttcttgatc caattcgcca ccttcaactt ccatattgat 1560
gaagatttca tcaacgatgt cggttctaag gttgtgatcc ctgtcaacac cagaagagac 1620
aatttttcca agagcatgtc taccagcaat ttcaaaggtt ctggtagaaa tatgggttct 1680
aatttcagaa atgattttgg atctagaaac aactccaagc aaggttccaa gaaaaagaat 1740
aaatctcaaa agagccaatc taggaggggt ccaaagtact ccaatgaaga agaacctgct 1800
gaaccagccg tgcctgctga attgcctaat agagctgcaa gcaagtgggt acctcgttcg 1860
ttaagaaata aggaggctga agtcaagact gctccagacg gatctataat agtatcagaa 1920
gaggacatca aaaggaaaac taaatccctt ttgaataagt tgacgttgga attctttgat 1980
gatatctcaa acgatataat tgctttgacc aagcaagctc aatgggaaga tgacgtcaag 2040
actttgaaac aagttattga gtctatattt gcaaaggctt gtgacgaacc ctactggtcc 2100
tctatgtacg ctaaattatg cgccaaaatg tgcaaggaca ccccacctga gatcaaggaa 2160
actaatgaga agggaaatac tttcaccggt ggtgatttgg tgagaagagt gttgattaat 2220
agatgtcaaa ccgaatatca gaaaggatgg attgaccagc taccaaccaa cgaggatggt 2280
tcacctctag agccagaact gatgtctgac gaatattaca aacaagctgc tgctaaacgt 2340
agaggtcttg gtctggttaa gttcattggt caattgtacc agttgaactt attatcagac 2400
aatgtcattt tccactgtgt ccttggtcag tccaaagaaa cagacaatcc atcagaagat 2460
actatggaga acctggttca attattggaa gctgtaggtt atagaatgga gatgtccagt 2520
gaacctaaga ttagaagggt tcttgatctc gcctttgcca acatcaaggc cattgttgac 2580
gctaacaaga ttccttcaag aataagattt atgctcatgg atttgatgga tctaagaaga 2640
aatggctggg ctacaacaga agagaacgct ggtccaaaga ccattcaaga gattcactta 2700
gaggctgaga tcaagagatc agaggaggag agagaaaaag aaagagacag gcattctcgt 2760
agaggacgtt acaacgactc caaacctaac tctcgtcaaa agtcatcttg gggaagttca 2820
gtggtttcac ctaatgatat tagaaatgca ggctatgtta gaaactctga caaatctctg 2880
gggcctgtca acagtttttc caggggcaag tcatcccgtc aagcttcaaa gcaatcaaac 2940
agtgatttta ccagtgttcc tatcacttcc agtggtagta gaactgctct aaaccactct 3000
ggcgacagct caacgtctct gaacgaacct caatcaagag aatattcaaa aaaatctgaa 3060
tctaggcccg ctccttccaa catttttgct gcattagagg atcacgatca tgatcatgaa 3120
catggccacg aacaagaaga aaacaagcat tccaaggatc tccaaaacgg agaggccgaa 3180
gcacctgagg acgacaatgt gggagaaata gcccaagctg acgaaaatgt gcaagggcaa 3240
gagcaagagg aagaacgaga ggaagagcga gagcaagaag aggaacagga agtttaa 3297
<210> 74
<211> 1881
<212> DNA
<213> Komagataella phaffii
<400> 74
atgtctgtcg ataccaagga agttcaagaa tcccttgatc aacttaacat ttcagaatca 60
ccagctactg ctgtgactga agagactcca gctacctcta ccgaggccgc tgaagagtcc 120
aacgagtcat cgactcaagc ttccgagacc ttggcttcat tgtatgttgg tgagctggac 180
cctaccgtta ctgagagtga cttgtatgag ttcttctctc caatcggtag tgttaattcc 240
atccgtgtgt gtcgtgatgc agtcaccaag cgttcgttgg gttatggata cgttaacttt 300
cacagccaag ctgccggcga gcgtgccttg gaggagctga actacgctga gatcaaaggt 360
gtccgttgta gattgatgtg gtctcaacgt gacccttcct tgcgtcgtag tggttccggt 420
aacatcttca tcaagaactt agaccctgct attgagaaca agactttgca cgatactttc 480
tcctcttttg gaaaagtttt gtcctgtaag gttgccactg atgagaatgg aaactcaaag 540
ggattcggat tcgttcatta cgaaagcgat gaagcagctc aagctgccat tgagaacatc 600
aacggtatgc tgttgaatgg tcgtgaaatc tacgttggac ctcacttggc caagaaggac 660
cgtgaatcta gattccagga gatgatcaag aactacacca atgtcttcgt caagaacttt 720
gacactgagt ccactgagga tgaactgaga gagctgtttg agtcatacgg tccaatcact 780
tcgatccact tgcaagttga ttctgagggt cacaacaagg gttttggttt cgtcaacttt 840
gctgaacacg acgatgctgt taaggccgtt gaagccttga acgacaagga gtacaagggc 900
aagccattgt acgttggacg tgctcagaag aaaaacgaga gagtccacga acttaccaag 960
aagtacgagg ctgatcgtct tgaaaaattg caaaagtatc aatcagttaa cttgttcatc 1020
aagaacttgg atgagtccat tgatgatgcc cgtcttgagg aagagttcaa accatttgga 1080
accatcacct ctgccaaggt catgttggac gaaaatggaa aatctagagg tttcggtttc 1140
gtttgtctct ctactccaga ggaagccact aaggctatca gtgagatgaa ccaacgtatg 1200
gttgccaaca agccattata cgttgctttg gctcaaccaa aagccatcag acgctctcaa 1260
ttggctcagc agatccaagc tagaaaccaa atgagaatgc aacaacaagc tggtccaggt 1320
ataccaaacc agttcgttca acctatcttt tacgggcaac agccaggtat gttgccacca 1380
ggtgctagag tcccaccaat gggtaaccag attcctcaat ttgctggtat gccaagacca 1440
ggcccatttc cccaaggcca attccctaga atggctccta acggtcagcc aatgcctgtg 1500
tatggccaac ctgtattcaa cggtaacggt cctcagcagc gtggctacta cccaaacaac 1560
agacagaaca agaacaggaa tcaaaaggag gaaggaaact ctttggctgc aatcttgcct 1620
cagttgccat tagagcaaca aaagagagta ctgggtgagg agctttatcc aaaggttgtt 1680
gctactaaca agacccaaga tccagaagct gcaggtaaaa tcactggtat gatcttggat 1740
ttggacaacc aagaaatttt gcaactgttg gaagatgaag aacttttcaa cactcatttc 1800
aacgaagctc tccaagctta cgaggagtac aagagtaaga ctgttgaaca gcaacagcaa 1860
gcggatgcac aagcaaacta g 1881
<210> 75
<211> 1881
<212> DNA
<213> Artificial Sequence
<220>
<223> PAB1 gene mutant
<400> 75
atgtctgtcg ataccaagga agttcaagaa tcccttgatc aacttaacat ttcagaatca 60
ccagctactg ctgtgactga agagactcca gctacctcta ccgaggccgc tgaagagtcc 120
aacgagtcat cgactcaagc ttccgagaca ttggcttcat tgtatgttgg tgagctggac 180
cctaccgtta ctgagagtga cttgtatgag ttcttctctc caatcggtag tgttaattcc 240
atccgtgtgt gtcgtgatgc agtcaccaag cgttcgttgg gttatggata cgttaacttt 300
cacagccaag ctgccggcga gcgtgccttg gaggagctga actacgctga gatcaaaggt 360
gtccgttgta gattgatgtg gtcccaacgt gacccttcct tgcgtcgtag tggttccggt 420
aacatcttca tcaagaactt agaccctgct attgagaaca agactttgca cgatactttc 480
tcctcttttg gaaaagtttt gtcctgtaag gttgccactg atgagaatgg aaactcaaag 540
ggattcggat tcgttcatta cgaaagcgat gaagcagctc aagctgccat tgagaacatc 600
aacggtatgc tgttgaatgg tcgtgaaatc tacgttggac ctcacttggc caagaaggac 660
cgtgaatcta gattccagga gatgatcaag aactacacca atgtctttgt caagaacttt 720
gacactgagt ccactgagga tgaactgaga gagctgtttg agtcatacgg tccaatcact 780
tcgatccact tgcaagttga ttctgagggt cacaacaagg gttttggttt cgtcaacttt 840
gctgaacacg acgatgctgt taaggccgtt gaagccttga acgacaagga gtacaagggc 900
aagccattgt acgttggacg tgctcagaag aaaaacgaga gagtccacga acttaccaag 960
aagtacgagg ctgatcgtct tgaaaaattg caaaagtatc aatcagttaa cttgttcatc 1020
aagaacttgg atgagtccat tgatgatgcc cgtcttgagg aagagttcaa accatttgga 1080
accatcacct ctgccaaggt catgttggac gaaaatggaa aatctagagg tttcggtttc 1140
gtttgtctct ctactccaga ggaagccact aaggctatca gtgagatgaa ccaacgtatg 1200
gttgccaaca agccattata cgttgctttg gctcaaccaa aagccatcag acgctctcaa 1260
ttggctcagc agatccaagc tagaaaccaa atgagaatgc aacaacaagc tggtccaggt 1320
ataccaaacc agttcgttca acctatcttt tacgggcaac agccaggtat gttgccacca 1380
ggtgctagag tcccaccaat gggtaaccag attcctcaat ttgctggtat gccaagacca 1440
ggcccatttc cccaaggcca attccctaga atggctccta acggtcagcc aatgcctgtg 1500
tatggccaac ctgtattcaa cggtaacggt cctcagcagc gtggctacta cccaaacaac 1560
agacagaaca agaacaggaa tcaaaaggag gaaggaaact ctttggctgc aatcttgcct 1620
cagttgccat tagagcaaca aaagagagta ctgggtgagg agctttatcc aaaggttgtt 1680
gctactaaca agacccaaga tccagaagct gcaggtaaaa tcactggtat gatcttggat 1740
ttggacaacc aagaaatttt gcaactgttg gaagatgaag aacttttcaa cactcatttc 1800
aacgaagctc tccaagctta cgaggagtac aagagtaaga ctgttgaaca gcaacagcaa 1860
gcggatgcac aagcaaacta g 1881
<210> 76
<211> 1821
<212> DNA
<213> Komagataella phaffii
<400> 76
atgagtgaga aaaacacacg tattgccatt gtttcagacg atagatgcaa acctaagaaa 60
tgtcgtcagg aatgcagaaa atcctgtcct gttgttaaga caggaaagct ttgtattgaa 120
gttgaagcat actccaaaat tgccttcatc agtgagactc tgtgtatagg ttgtggtatt 180
tgtgtgaaaa agtgtccatt tggagcaatt aacattatca atctgcccac taacttggag 240
aaggaggtca cccacagata cagtgccaac tcattcaaat tgcacagatt gccaacacct 300
aggccaggtc aagtcctagg tcttgttgga accaatggta ttgggaaatc caccgcattg 360
aaaattcttg caggtaagca gaaaccaaat ttaggtagat acgacgcgcc acctgactgg 420
gaagaaattt tgaaatactt cagaggaagt gaattgcaaa attattttac caaagttttg 480
gaggacaata ttaaagcaat tattaagcct caatatgttg acaaccttcc aagggcaatc 540
aaaggtcctg ttaataaggt tggtgagctt ttgaaagcca aactggaaag aaaggaagag 600
ggaaagcata tcatccaagt tttggaattg aaacacgtat tgaacagaga agtcgctaag 660
ctttctggtg gtgagcttca aagatttgca attggtatga cttgtgtcca agatgctaat 720
gtgtacatgt ttgatgaacc ttcatcctat ttggatgtta agcaacgttt gaatgctgct 780
cagattatta gatctttgtt gcatgccacc tgttatgtta ttgttgttga gcacgatctg 840
tctgttttgg attatctttc tgattttgtt tgtattttgt atggtgtacc atcggtttac 900
ggtgttgtca ctttgccagc ctctgtcaga gaaggtatca atattttcct tgatggtcat 960
atccctaccg agaatttgag gttcagaact gagtctttaa aattcaaact tacagatgct 1020
tcggactctg tattaattga acaaagtaga gcttttgaat accccaaaat ggttaagact 1080
caaggtgatt tcaagttaac cgtcaacgct ggtgacttct cagactcgga aattattgtg 1140
atgatgggtg aaaatggtac cggtaagacc actttatgta agctgttagc tggtgccatt 1200
gaaggtgatg aaggcaccaa ggtacccaaa ttgaatgttt ctatgaagcc ccaaaagatt 1260
gctccaaaat tcacaggaac agttagacaa ctgttcttga aaaagattag atcatctttc 1320
ttacatccac aattcaacac cgatgtgatg aaacctttaa aagttgacga tgtcattgat 1380
caagaagtcc agcatttgtc tggtggtgaa ttgcaaagag ttgccatcgt cttagcttta 1440
ggaaaagagg cagacatcta cttgattgac gagccatctg cttacttgga ctctgaacag 1500
cgtattatct gttcgaaggt tattagaaga ttcatcctgc attccaagaa aactgctttc 1560
attgtggaac acgatttcat catggccaca tacttagccg ataaagtgat ggtatttgaa 1620
ggtcagcctt ccaagaatgc tgttgctaac cgcccagaaa cccttttgac tggttgtaac 1680
aggttcttga aaaacctgaa cgtcactttc agaagagatc caaactcttt tagacccaga 1740
atcaacaaac tggactccca gatggataga gagcaaaaac tgagtggtaa ttacttcttc 1800
cttgagaaca ctgagttata a 1821
<210> 77
<211> 362
<212> PRT
<213> Artificial Sequence
<220>
<223> vHH expression construct
<400> 77
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu
85 90 95
Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
100 105 110
Thr Phe Thr Ser Phe Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys
115 120 125
Glu Arg Glu Phe Val Ala Ser Ile Ser Arg Ser Gly Thr Leu Thr Arg
130 135 140
Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Val Asp Asn Ala
145 150 155 160
Lys Asn Thr Val Ser Leu Gln Met Asp Asn Leu Asn Pro Asp Asp Thr
165 170 175
Ala Val Tyr Tyr Cys Ala Ala Asp Leu His Arg Pro Tyr Gly Pro Gly
180 185 190
Thr Gln Arg Ser Asp Glu Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val
195 200 205
Thr Val Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
210 215 220
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Glu
225 230 235 240
Val Gln Leu Val Glu Ser Gly Gly Ala Leu Val Gln Pro Gly Gly Ser
245 250 255
Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Pro Val Asn Arg Tyr Ser
260 265 270
Met Arg Trp Tyr Arg Gln Ala Pro Gly Lys Glu Arg Glu Trp Val Ala
275 280 285
Gly Met Ser Ser Ala Gly Asp Arg Ser Ser Tyr Glu Asp Ser Val Lys
290 295 300
Gly Arg Phe Thr Ile Ser Arg Asp Asp Ala Arg Asn Thr Val Tyr Leu
305 310 315 320
Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn
325 330 335
Val Asn Val Gly Phe Glu Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
340 345 350
Ser Ser Gly Gly His His His His His His
355 360
<210> 78
<211> 1092
<212> DNA
<213> Artificial Sequence
<220>
<223> vHH Nucleotide Sequence
<400> 78
atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60
cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120
tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180
aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240
tctctcgaga agagacaggt tcagctgcag gagtccggtg gtggtctggt tcaagccggt 300
ggttcattaa gattgtcctg tgctgcctct ggtagaactt tcacttcttt cgcaatgggt 360
tggtttagac aagcacctgg aaaagagaga gagtttgttg cttctatctc cagatccggt 420
actttaacta gatacgctga ctctgccaag ggtagattca ctatttctgt tgacaacgcc 480
aagaacactg tttctttgca aatggacaac cttaacccag atgacaccgc agtctattac 540
tgtgccgctg acttgcacag accatacggt ccaggaaccc aaagatccga tgagtacgat 600
tcttggggtc agggaactca agtcactgtc tcttcaggtg gtggatctgg tggtggaggt 660
tcaggtggtg gaggatccgg tggtggtggt tctggtggtg gtggatctgg tggaggtgaa 720
gttcaacttg tcgaatccgg tggtgcactt gtccaacctg gtggatctct tagactttct 780
tgtgccgcct ccggttttcc tgttaaccgt tactctatgc gttggtacag acaagcccct 840
ggaaaagaac gtgaatgggt tgccggaatg tcctcagctg gtgacagatc ctcctacgaa 900
gattctgtga agggacgttt caccatctcc agagatgacg cccgtaacac cgtttacctt 960
caaatgaact cccttaagcc tgaggatact gccgtctact attgtaacgt gaatgtcgga 1020
tttgaatact ggggacaggg aacccaagtt actgtctctt ccggtggaca tcaccaccac 1080
catcactaat ag 1092
<210> 79
<211> 609
<212> PRT
<213> Artificial Sequence
<220>
<223> Human serum albumin expression construct
<400> 79
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala
20 25 30
His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu
35 40 45
Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val
50 55 60
Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp
65 70 75 80
Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp
85 90 95
Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala
100 105 110
Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln
115 120 125
His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val
130 135 140
Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys
145 150 155 160
Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro
165 170 175
Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys
180 185 190
Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu
195 200 205
Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys
210 215 220
Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val
225 230 235 240
Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser
245 250 255
Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly
260 265 270
Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile
275 280 285
Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu
290 295 300
Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp
305 310 315 320
Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser
325 330 335
Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly
340 345 350
Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val
355 360 365
Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys
370 375 380
Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu
385 390 395 400
Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys
405 410 415
Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu
420 425 430
Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val
435 440 445
Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His
450 455 460
Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val
465 470 475 480
Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg
485 490 495
Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe
500 505 510
Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala
515 520 525
Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu
530 535 540
Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys
545 550 555 560
Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala
565 570 575
Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe
580 585 590
Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly
595 600 605
Leu
<210> 80
<211> 1830
<212> DNA
<213> Artificial Sequence
<220>
<223> Human serum albumin expression construct
<400> 80
atgaagtggg ttactttcat ctccttgttg ttcttgttct cctcagctta ctccagaggt 60
gttttcagaa gagatgctca caagtccgag gttgctcaca gattcaagga cttgggtgaa 120
gagaacttca aggctttggt tttgatcgct ttcgctcagt acttgcagca gtgtccattc 180
gaggaccacg ttaagttggt taacgaggtt actgagttcg ctaagacttg tgttgctgac 240
gaatccgctg agaactgtga taagtccttg cacactttgt tcggtgacaa gttgtgtact 300
gttgctactt tgagagaaac ttacggtgag atggctgact gttgtgctaa gcaagagcct 360
gagagaaacg agtgtttctt gcaacacaag gacgacaacc caaacttgcc aagattggtt 420
agaccagagg ttgacgttat gtgtactgct ttccacgaca acgaagagac tttcttgaag 480
aagtacttgt acgagatcgc tagaagacac ccatacttct acgctccaga gttgttgttc 540
ttcgctaaga gatacaaggc tgctttcact gagtgttgtc aggctgctga taaggctgct 600
tgtttgttgc caaagttgga cgagttgaga gatgagggta aggcttcttc cgctaagcag 660
agattgaagt gtgcttcctt gcagaagttc ggagagagag cttttaaggc ttgggctgtt 720
gctagattgt cccagagatt cccaaaggct gagttcgctg aggtttccaa gttggttact 780
gacttgacta aggttcacac agagtgttgt cacggtgact tgttggaatg tgctgatgac 840
agagctgact tggctaagta catctgtgag aaccaggatt ccatctcctc caagttgaaa 900
gaatgttgtg agaagccttt gttggagaag tcccactgta tcgctgaggt tgaaaacgac 960
gaaatgccag ctgacttgcc atctttggct gctgacttcg ttgaatccaa ggacgtctgc 1020
aagaactacg ctgaggctaa ggacgttttc ttgggtatgt tcttgtatga gtacgctaga 1080
agacatccag actactccgt tgttttgttg ttgagattgg ctaagactta cgagactact 1140
ttggagaagt gttgtgctgc tgctgaccca catgagtgtt acgctaaggt tttcgacgag 1200
ttcaagccat tggttgagga accacagaac ttgatcaagc agaactgtga gttgttcgag 1260
cagttgggtg agtacaagtt ccagaacgct ttgttggtta gatacactaa gaaggttcca 1320
caggtttcca ctccaacttt ggttgaggtt tccagaaact tgggtaaggt tggttccaag 1380
tgttgtaagc acccagaggc taagagaatg ccatgtgctg aggactactt gtctgttgtt 1440
ttgaaccagt tgtgtgtctt gcacgaaaag acaccagttt ccgacagagt tactaagtgt 1500
tgtactgaat ccttggttaa cagaagacct tgtttctccg ctttggaggt tgacgagact 1560
tacgttccaa aagagttcaa cgctgagact ttcactttcc acgctgacat ctgtactttg 1620
tccgagaaag agagacagat caagaagcag actgctttgg ttgagttggt taagcacaag 1680
ccaaaggcta caaaagagca gttgaaggct gttatggacg acttcgctgc tttcgttgag 1740
aaatgttgta aggctgacga caaagagact tgtttcgctg aagagggtaa gaagttggtt 1800
gctgcttccc aagctgcttt gggtctgtaa 1830
<210> 81
<211> 1001
<212> DNA
<213> Komagataella phaffii
<400> 81
catgttggta ttgtgaaata gacgcagatc gggaacactg aaaaataaca gttattattc 60
gagatctaac atccaaagac gaaaggttga atgaaacctt tttgccatcc gacatccaca 120
ggtccattct cacacataag tgccaaacgc aacaggaggg gatacactag cagcagaccg 180
ttgcaaacgc aggacctcca ctcctcttct cctcaacacc cacttttgcc atcgaaaaac 240
cagcccagtt attgggcttg attggagctc gctcattcca attccttcta ttaggctact 300
aacaccatga ctttattagc ctgtctatcc tggcccccct ggcgaggttc atgtttgttt 360
atttccgaat gcaacaagct ccgcattaca cccgaacatc actccagatg agggctttct 420
gagtgtgggg tcaaatagtt tcatgttccc caaatggccc aaaactgaca gtttaaacgc 480
tgtcttggaa cctaatatga caaaagcgtg atctcatcca agatgaacta agtttggttc 540
gttgaaatgc taacggccag ttggtcaaaa agaaacttcc aaaagtcggc ataccgtttg 600
tcttgtttgg tattgattga cgaatgctca aaaataatct cattaatgct tagcgcagtc 660
tctctatcgc ttctgaaccc cggtgcacct gtgccgaaac gcaaatgggg aaacacccgc 720
tttttggatg attatgcatt gtctccacat tgtatgcttc caagattctg gtgggaatac 780
tgctgatagc ctaacgttca tgatcaaaat ttaactgttc taacccctac ttgacagcaa 840
tatataaaca gaaggaagct gccctgtctt aaaccttttt ttttatcatc attattagct 900
tactttcata attgcgactg gttccaattg acaagctttt gattttaacg acttttaacg 960
acaacttgag aagatcaaaa aacaactaat tattcgaaac g 1001
<210> 82
<211> 1000
<212> DNA
<213> Komagataella phaffii
<400> 82
gcttaaagga ctccatttcc taaaatttca agcagtcctc tcaactaaat ttttttccat 60
tcctctgcac ccagccctct tcatcaaccg tccagccttc tcaaaagtcc aatgtaagta 120
gcctgcaaat tcaggttaca acccctcaat tttccatcca agggcgatcc ttacaaagtt 180
aatatcgaac agcagagact aagcgagtca tcatcaccac ccaacgatgg tgaaaaactt 240
taagcataga ttgatggagg gtgtatggca cttggcggct gcattagagt ttgaaactat 300
ggggtaatac atcacatccg gaactgatcc gactccgaga tcatatgcaa agcacgtgat 360
gtaccccgta aactgctcgg attatcgttg caattcatcg tcttaaacag tacaagaaac 420
tttattcatg ggtcattgga ctctgatgag gggcacattt ccccaatgat tttttgggaa 480
agaaagccgt aagaggacag ttaagcgaaa gagacaagac aacgaacagc aaaagtgaca 540
gctgtcagct acctagtgga cagttgggag tttccaattg gttggttttg aatttttacc 600
catgttgagt tgtccttgct tctccttgca aacaatgcaa gttgataaga catcaccttc 660
caagataggc tatttttgtc gcataaattt ttgtctcgga gtgaaaaccc cttttatgtg 720
aacagattac agaagcgtcc tacccttcac cggttgagat ggggagaaaa ttaagcgatg 780
aggagacgat tattggtata aaagaagcaa ccaaaatccc ttattgtcct tttctgatca 840
gcatcaaaga atattgtctt aaaacgggct tttaactaca ttgttcttac acattgcaaa 900
cctcttcctt ctatttcgga tcaactgtat tgactacatt gatctttttt aacgaagttt 960
acgacttact aaatccccac aaacaaatca actgagaaaa 1000
<210> 83
<211> 991
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 83
gcaaggcaac tgagaaattg aatagtggtt tcaagcccgc tgactttttg tattatctca 60
atgtcggtgt ttcacagtcc ccagaagggg gctttgcctt caagggagac ggaagagaca 120
tcgtcaaccc tggggagaag tatttcaaat ggcgcaagtt cgctaatttt tacgattaag 180
cagtgctgta tggggtagtt aataaatcgg gaatatcctt ctgacgtgac tgtaacaaat 240
ctctttttac gtggtgcgca tactggacag aggcagagtc tcaatttctt cttttgagac 300
aggctactac agcctgtgat tcctcttggt acttggattt gcttttatct ggctccgttg 360
ggaactgtgc ctgggttttg aagtatcttg tggatgtgtt tctaacactt tttcaatctt 420
cttggagtga gaatgcagga ctttgaacat cgtctagctc gttggtaggt gaaccgtttt 480
accttgcatg tggttaggag ttttctggag taaccaagac cgtcttatca tcgccgtaaa 540
atcgctctta ctgtcgctaa taatcccgct ggaagagaag ttcgaacaga agtagcacgc 600
aaagctcttg tcaaatgaga attgttaatc gtttgacagg tcacactcgt gggctatgta 660
cgatcaactt gccggctgtt gctggagaga tgacaccagt tgtggcatgg ccaattggta 720
ttcagccgta ccactgtatg gaaaatgaga ttatcttgtt cttgatctag tttcttgcca 780
ttttagagtt gccacattcg taggtttcag taccaataat ggtaacttcc aaacttccaa 840
cgcagatacc agagatctgc cgatccttcc ccaacaatag gagcttacta cgccatacat 900
atagcctatc tattttcact ttcgcgtggg tgcttctata taaacggttc cccatcttcc 960
gtttcatact acttgaattt taagcactaa a 991
<210> 84
<211> 864
<212> DNA
<213> Artificial Sequence
<220>
<223> promter
<400> 84
cttttctttg ggcaaggaaa aatcaagaaa aagcagaggt taaagttttc aggggaatgg 60
caattgcttt atatatggga gaaagttaac tacgtcggtg ctgtaggcgt agagagcgac 120
tggagaatgc gtgatgaggt cgtctctttt cgccccccct tggcggggta aaaattgcac 180
tactgcagaa ttactacacc cctattccga ggagacggag tgcgacaaaa atggtaaagt 240
tcaccctagt ctgcgacttt taattgacgg acaccggcgt ttacatgcga aaaaaactaa 300
agtgcgcgca tttcacggcc gaggggggtc ccacttggga ctgagagggg gtgggatctg 360
aaatcgagga ggtatcaaga ccccccgttt ctcaactccc taatcaaaaa ttacgaagtc 420
ctcgttggaa aggagttaaa ataattaagc ggggtcggac gccataccga ggttatcttg 480
caggcatttt actaatattg gaattcggag ctcaacttgc aaccaggcag ggtttagcta 540
tgtaatcaat gtaatcaata taataaagca ctaccacatc gaaggtttgg gagggaggcc 600
aatagtgtcc cccacagggt gctgatatcg cgattcttgg gtgaggagac acatatttca 660
ctcctctcac caaccaacca agcggctcct cgcaagatga tttatccgat tatccggaca 720
ctatactccc atccagtttg atgccgattt catcgattgt cctaaataat ccttaaatat 780
gtatagaacg gtaccctggg gttacataat ccttatttaa taatccctcc cccaccgctt 840
ttcttttttt ttcttcttat tgtc 864
<210> 85
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 85
aaatggcaga aggatcagcc tggacgaagc aaccagttcc aactgctaag taaagaagat 60
gctagacgaa ggagacttca gaggtgaaaa gtttgcaaga agagagctgc gggaaataaa 120
ttttcaattt aaggacttga gtgcgtccat attcgtgtac gtgtccaact gttttccatt 180
acctaagaaa aacataaaga ttaaaaagat aaacccaatc gggaaacttt agcgtgccgt 240
ttcggattcc gaaaaacttt tggagcgcca gatgactatg gaaagaggag tgtaccaaaa 300
tggcaagtcg ggggctactc accggatagc caatacattc tctaggaacc agggatgaat 360
ccaggttttt gttgtcacgg taggtcaagc attcacttct taggaatatc tcgttgaaag 420
ctacttgaaa tcccattggg tgcggaacca gcttctaatt aaatagttcg atgatgttct 480
ctaagtggga ctctacggct caaacttcta cacagcatca tcttagtagt cccttcccaa 540
aacaccattc taggtttcgg aacgtaacga aacaatgttc ctctcttcac attgggccgt 600
tactctagcc ttccgaagaa ccaataaaag ggaccggctg aaacgggtgt ggaaactcct 660
gtccagttta tggcaaaggc tacagaaatc ccaatcttgt cgggatgttg ctcctcccaa 720
acgccatatt gtactgcagt tggtgcgcat tttagggaaa atttacccca gatgtcctga 780
ttttcgaggg ctacccccaa ctccctgtgc ttatacttag tctaattcta ttcagtgtgc 840
tgacctacac gtaatgatgt cgtaacccag ttaaatggcc gaaaaactat ttaagtaagt 900
ttatttctcc tccagatgag actctccttc ttttctccgc tagttatcaa actataaacc 960
tattttacct caaatacctc caacatcacc cacttaaaca 1000
<210> 86
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 86
aatgatataa acaacaattg agtgacaggt ctactttgtt ctcaaaaggc cataaccatc 60
tgtttgcatc tcttatcacc acaccatcct cctcatctgg ccttcaattg tggggaacaa 120
ctagcatccc aacaccagac taactccacc cagatgaaac cagttgtcgc ttaccagtca 180
atgaatgttg agctaacgtt ccttgaaact cgaatgatcc cagccttgct gcgtatcatc 240
cctccgctat tccgccgctt gctccaacca tgtttccgcc tttttcgaac aagttcaaat 300
acctatcttt ggcaggactt ttcctcctgc cttttttagc ctcaggtctc ggttagcctc 360
taggcaaatt ctggtcttca tacctatatc aacttttcat cagatagcct ttgggttcaa 420
aaaagaacta aagcaggatg cctgatatat aaatcccaga tgatctgctt ttgaaactat 480
tttcagtatc ttgattcgtt tacttacaaa caactattgt tgattttatc tggagaataa 540
tcgaacaaa 549
<210> 87
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 87
attactgttt tgggcaatcc tgttgataag acgcattcta gagttgtttc atgaaagggt 60
tacgggtgtt gattggtttg agatatgcca gaggacagat caatctgtgg tttgctaaac 120
tggaagtctg gtaaggactc tagcaagtcc gttactcaaa aagtcatacc aagtaagatt 180
acgtaacacc tgggcatgac tttctaagtt agcaagtcac caagagggtc ctatttaacg 240
tttggcggta tctgaaacac aagacttgcc tatcccatag tacatcatat tacctgtcaa 300
gctatgctac cccacagaaa taccccaaaa gttgaagtga aaaaatgaaa attactggta 360
acttcacccc ataacaaact taataatttc tgtagccaat gaaagtaaac cccattcaat 420
gttccgagat ttagtatact tgcccctata agaaacgaag gatttcagct tccttacccc 480
atgaacagaa atcttccatt taccccccac tggagagatc cgcccaaacg aacagataat 540
agaaaaaaga aattcggaca aatagaacac tttctcagcc aattaaagtc attccatgca 600
ctccctttag ctgccgttcc atccctttgt tgagcaacac catcgttagc cagtacgaaa 660
gaggaaactt aaccgatacc ttggagaaat ctaaggcgcg aatgagttta gcctagatat 720
ccttagtgaa gggttgttcc gatacttctc cacattcagt catagatggg cagctttgtt 780
atcatgaaga gacggaaacg ggcattaagg gttaaccgcc aaattatata aagacaacat 840
gtccccagtt taaagttttt ctttcctatt cttgtatcct gagtgaccgt tgtgtttaat 900
ataacaagtt cgttttaact taagaccaaa accagttaca acaaattata acccctctaa 960
acactaaagt tcactcttat caaactatca aacatcaaaa 1000
<210> 88
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 88
gtcaactgcg tactcttttg tcgaatggac tactgaatct gcctcgatag ccactatagg 60
aaggtccata gaggccagtt tttcaactag tcttggtgga aagaaaccga caaagccttt 120
catggagtca ccgatactga aaggttcaaa caaagaatgc ttgggtagtc tcttaatacc 180
catggcaacg aaaaaggggt cttcattgtt caacatgaat tcgtatccac ctttaatgta 240
gtcataaagc tgctgaagtt ccgaatcagt gatggaactg tctacagtga caatatagga 300
gttctcaatc accttatatc cagtcgaata tatctggata gggtcgggtc tcactgtgga 360
agattcaaat gggttagatc cctgtaattt cagcgatgga gactcagtat gatggggcaa 420
ggaaaacggc aattggatat tcaattggtc aagagatggt atcaaaagcg agtgtgccag 480
ggtagccacg gtagccactg atgctaatct gataattttc atttctggag tgtcaaaaca 540
gtagtgataa aaggctatga aggaggttgt ctaggggctc gcggaggaaa gtgattcaaa 600
cagacctgcc aaaaagagaa aaaagaggga atccctgttc tttccaatgg aaatgacgta 660
actttaactt gaaaaatacc ccaaccagaa gggttcaaac tcaacaagga ttgcgtaatt 720
cctacaagta gcttagagct gggggagaga caactgaagg cagcttaacg ataacgcggg 780
gggattggtg cacgactcga aaggaggtat cttagtcttg taacctcttt tttccagagg 840
ctattcaaga ttcataggcg atatcgatgt ggagaagggt gaacaatata aaaggctgga 900
gagatgtcaa tgaagcagct ggatagattt caaattttct agatttcaga gtaatcgcac 960
aaaacgaagg aatcccacca agcaaaaaaa aaaatctaag 1000
<210> 89
<211> 704
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 89
aaattaatcc ataagataag gcaaatgtgc ttaagtaatt gaaaacagtg ttgtgattat 60
ataagcatgg tatttgaata gaactactgg ggttaactta tctagtagga tggaagttga 120
gggagatcaa gatgcttaaa gaaaaggatt ggccaatatg aaagccataa ttagcaatac 180
ttatttaatc agataattgt ggggcattgt gacttgactt ttaccaggac ttcaaacctc 240
aaccatttaa acagttatag aagacgtacc gtcacttttg cttttaatgt gatctaaatg 300
tgatcacatg aactcaaact aaaatgatat cttttactgg acaaaaatgt tatcctgcaa 360
acagaaagct ttcttctatt ctaagaagaa catttacatt ggtgggaaac ctgaaaacag 420
aaaataaata ctccccagtg accctatgag caggattttt gcatccctat tgtaggcctt 480
tcaaactcac acctaatatt tcccgccact cacactatca atgatcactt cccagttctc 540
ttcttcccct attcgtacca tgcaaccctt acacgccttt tccatttcgg ttcggatgcg 600
acttccagtc tgtggggtac gtagcctatt ctcttagccg gtatttaaac atacaaattc 660
acccaaattc taccttgata aggtaattga ttaatttcat aaat 704
<210> 90
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 90
agctcagatt ggaaatgatt tttgatccta ccaagaagcc tttgatttcc agaatctccg 60
ctaagtaagt aacccccgca aacgcatgca tccatgcaaa caaaatacta acaattttag 120
ccccgttgtt gagaaaccca gaaaattgaa tgttcaacca atccagacga tcaataagaa 180
aaaaggccca aaggctactt ccaaacctgc tgccgccaaa cctgctcctt caaaagccgg 240
tcccaaggga ggtaagaagg tgagaaagcc aaagaagaca gttgaagaat tggatcagga 300
aatggctgac tactttgaaa ataagaatta gcccaacaaa atatgtacaa gtattatata 360
aatgaatcta catggtgtgt tttatttaga tcctccaaac caaggaaaga aactaaactt 420
atctccggac ttacgagtca aataactatc cgcagttcct tggaactcag actttcttcc 480
ataagcggtc atatcatctt tggactgtgg gaatcctgga cgaatctttg aaatgtcata 540
atcttgctct ctatctccaa gcacagcgtc cggtaaatgc tggttcttct ttctcagatg 600
aatcttggat ttaacaaata aagccgtgcc tatggctaat gtactcaaaa acaaagtctg 660
cttccagaat ttcgcaaacg atggaatgcc atttcctgta aatgtactca ttgaacctat 720
gtttgattaa agttggtgtg aagtcatcaa acgagagtaa aatcagatac tcgtgcaccg 780
gccaaaattg actgagctaa tctctgcagg cttgacatcc gaacacaaca aataggcgac 840
aaatcttaac tatctaatcg taggctatgg tagaactttg tgggggtaga ggaagactac 900
aacagcaaga caaaacaaaa gagtcatagt ttgactctct gcttttttct tctttctctt 960
ctttttcttc ctccatattc gttatttatt tcgaactgga 1000
<210> 91
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 91
cagccattaa tctcacctca gtttttgaat cagtagaatt tttaatgaaa caaacggttg 60
gtatattatt tgatagagtt gccaaatttc caaagataaa tttttcatca ggtaatatcc 120
tgaataccgt aacatagtga ctattggaag acactgctat catattatat ttcggataaa 180
aatccaaacc ccagaccgac ctcttgagtc tcaactccaa gtcagccgca actttaatta 240
tccgtggatt gggagctagt ttggacaacg catcagtata atataacttt acggttccat 300
tatcagacgc tattgcaaga acttcctttc cattgatctc gccaatgcgg cagtaattga 360
tatcgtaggg taggtctgga aagacgctgg cgcttgtgtc ccattctgca ggaatctctg 420
gcacggtgct aatggtagtt atccaacgga gctgaggtag tcgatatatc tggatatgcc 480
gcctatagga taaaaacagg agagggtgaa ccttgcttat ggctactaga ttgttcttgt 540
actctgaatt ctcattatgg gaaactaaac taatctcatc tgtgtgttgc agtactattg 600
aatcgttgta gtatctacct ggagggcatt ccatgaatta gtgagataac agagttgggt 660
aactagagag aataatagac gtatgcatga ttactacaca acggatgtcg cactctttcc 720
ttagttaaaa ctatcatcca atcacaagat gcgggctgga aagacttgct cccgaaggat 780
aatcttctgc ttctatctcc cttcctcata tggtttcgca gggctcatgc cccttcttcc 840
ttcgaactgc ccgatgagga agtccttagc ctatcaaaga attcgggacc atcatcgatt 900
tttagagcct tacctgatcg caatcaggat ttcactactc atataaatac atcgctcaaa 960
gctccaactt tgcttgttca tacaattctt gatattcaca 1000
<210> 92
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 92
tggttccctc tcggtccaat accaaaaata ttatcaccat acaggtctcc cttcgatacc 60
agtgcaaagt tgaaccgtgg gattaccttg gaatctacaa aaatagtgtc actcacaagt 120
ttgtcatcaa ccacgctgcc gcttgcaaag gagaactgaa catgaaggtt gttagggttt 180
gttatattgg aataagtggt ggatttgttg aaggcgaacg caccaaagct acatccgtcc 240
tgagcacact gtgaatttgt cacggaattg accaagaggt cagacgatcc tgtatcccat 300
tgagccgtta tgctttgtgg gggaaaccct atttctatcg tactaagaaa accaatggtg 360
aactcatatt cggtatcaat ggcgacgatt ccagcatagc ctgtagacag taacaacact 420
agggcaacag caactaacat atcttcattg atgaaacgtt gtgatcggtg tgacttttat 480
agtaaaagct acaactgttt gaaataccaa gatatcattg tgaatggctc aaaagggtaa 540
tacatctgaa aaacctgaag tgtggaaaat tccgatggag ccaactcatg ataacgcaga 600
agtcccattt tgccatcttc tcttggtatg aaacggtaga aaatgatccg agtatgccaa 660
ttgatactct tgattcatgc cctatagttt gcgtagggtt taattgatct cctggtctat 720
cgatctggga cgcaatgtag accccattag tggaaacact gaaagggatc caacactcta 780
ggcggacccg ctcacagtca tttcaggaca atcaccacag gaatcaacta cttctcccag 840
tcttccttgc gtgaagcttc aagcctacaa cataacactt cttacttaat ctttgattct 900
cgaattgttt acccaatctt gacaacttag cctaagcaat actctggggt tatatatagc 960
aattgctctt cctcgctgta gcgttcattc catctttcta 1000
<210> 93
<211> 1001
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 93
gatatcgatc tacacttaat agtagatgac gaggcatctc tccaataggt accatatctg 60
gtgtttcttg taatttaaga atctgttggt ctatgaatgt agatttgtca tgaacaatga 120
tatatgggtc aggaggacaa gatggtttct ctgagttggg ttgttgaggt gcctggcaag 180
acttcggagc gttgatatcc ccaagacttg tagtgaccga tagttgaagc gtgtgtttgc 240
aggaacggca catcaatgca actttcgtaa ctttggaatt gagagttgat gcactgatga 300
cgatacccga aattttgacg attttaccaa tatgacttga agacaagtct ctcattgaaa 360
ccttattatc gttactaagc aaaacgagct gacaagaagg gaaggtggtc ggtatttcct 420
cgttgttcaa atatatgatt ctcctggcaa tatctgtgat ggcctgttca aaaagtggaa 480
tcatttctgc aggatcatct accaactttt tattgagctc ctcattgaat acgattaagt 540
ggtcattttg aatcgtcagt aagtacttgt ttacaagtaa attctgtctg agttgttctc 600
tgtagatgta ctgattttcc atacgaaact ccaaaatgaa cgaacggaat gccttaatga 660
cctcactgaa ctggtcatcg ttctgttctc cgggaaggac acttgtgtta aagactgatg 720
ctctatcaaa ggacattgca acaaagtata aacggttgtg agcgggaaaa agatgtgtag 780
gtaattgtcg tagatgagac tgattcagta gaaaacgcgt cctgcactat ttttttcttt 840
cttcattaca tttcctaatc gggacaaaat gaatctaaag acgtggttat gtagtacacg 900
catcgatagg ctatccccat accaaaacac tattttaccc catccttgac aggttataaa 960
tatgcgatag tatgagtatc ttcaaattca gctgaaatat c 1001
<210> 94
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 94
aataaaaaaa cgttatagaa agaaattgga ctacgatatg ctccaatcca aattgtcaaa 60
attgaccacc gaaaaagaac aattggaatt tgacaagagg aacaactcac tagattctca 120
aacggagcgt cacctagagt cagtttccaa gtcaattaca gaaagtttgg aaacagaaga 180
ggagtatcta caattgaatt ccaaacttaa agtcgagctg tccgaattca tgtcgctaag 240
gctttcttac ttggacccca tttttgaaag tttcattaaa gttcagtcaa aaattttcat 300
ggacatttat gacacattaa agagcggact accttatgtt gattctctat ccaaagagga 360
ttatcagtcc aagatcttgg actctagaat agataacatt ctgtcgaaaa tggaagcgct 420
gaaccttcaa gcttacattg atgattagag caatgatata aacaacaatt gagtgacagg 480
tctactttgt tctcaaaagg ccataaccat ctgtttgcat ctcttatcac cacaccatcc 540
tcctcatctg gccttcaatt gtggggaaca actagcatcc caacaccaga ctaactccac 600
ccagatgaaa ccagttgtcg cttaccagtc aatgaatgtt gagctaacgt tccttgaaac 660
tcgaatgatc ccagccttgc tgcgtatcat ccctccgcta ttccgccgct tgctccaacc 720
atgtttccgc ctttttcgaa caagttcaaa tacctatctt tggcaggact tttcctcctg 780
ccttttttag cctcaggtct cggttagcct ctaggcaaat tctggtcttc atacctatat 840
caacttttca tcagatagcc tttgggttca aaaaagaact aaagcaggat gcctgatata 900
taaatcccag atgatctgct tttgaaacta ttttcagtat cttgattcgt ttacttacaa 960
acaactattg ttgattttat ctggagaata atcgaacaaa 1000
<210> 95
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 95
attgttgtga atactctcct tcatttggat ttcttggact tcggactctc ttgatctctc 60
ttcgaaagtt ttaactctgt tcatgtataa ttttacccgc tgtaggtcgc tcataatacc 120
atgagtatgc acatctttta ctccattaac tttcaggtat gcaaaataca atgaagatag 180
tatatagctc aaagaattta gcattttgca ttgatctaat tgtgacattt tctctatgat 240
atcatctagc ttcttaaact cgagaatctc gtccaacgag gcagaaacat tgtccagtct 300
tacgtcaaga ttattcacga gtttctggac cgtatcaacg ttttccatct taagattaca 360
gtaagtatcg tccttttgaa ctgcaaaggt agaaaagtta atttttgatt tggtagtaca 420
ctatgaaact tgctcacccc aatctttcct cctgacaggt tgatctttat ccctctacta 480
aattgcccca agtgtatcaa gtagactaga tctcgcgaaa gaacagccta ataaactccg 540
aagcatgatg gcctctatcc ggaaaacgtt aagagatgtg gcaacaggag ggcacataga 600
atttttaaag acgctgaaga atgctatcat agtccgtaaa aatgtgatag tactttgttt 660
agtgcgtacg ccacttattc ggggccaata gctaaaccca ggtttgctgg cagcaaattc 720
aactgtagat tgaatctctc taacaataat ggtgttcaat cccctggctg gtcacgggga 780
ggactatctt gcgtgatccg cttggaaaat gttgtgtatc cctttctcaa ttgcggaaag 840
catctgctac ttcccatagg caccagttac ccaattgata tttccaaaaa agattaccat 900
atgttcatct agaagtataa atacaagtgg acattcaatg aatatttcat tcaattagtc 960
attgacactt tcatcaactt actacgtctt attcaacaat 1000
<210> 96
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 96
tatacggtct atccactttg gaaacgatgt agttgaaacg gggaagtaat agtggttccc 60
aaacgacatg aagaggttat ataagtttgc aagagggtga caccatttta gttgtggttc 120
ccgggtattt ttttaatctt tttagtctaa gatagcctcc ccagatatta ccgagttggg 180
ccatttgggg cggtatcggt ggtatctgat ggtagcgcgt ttttacatgc ctgtgcattg 240
aactggcaaa gagtatacta tcgtggggcc ctgaaggagg cagcaaatgg accgtcaatt 300
ggttgatcag ggactcaaga caggtattga gcttttcaaa caaaaagagt ataggcgctg 360
ctacaaggca tttacttcta ctatcaattt cattgagaat gatcccgagt tggccgccag 420
ctgtgtatct caactgatat ctctgttaga ttgtagggca gcctgtttgg aaaagctaga 480
tcaattgaat atggccttga aagatggtct taaaatgatc aagagagagt gccacaactg 540
caagggttat ttgagaactt gcaaaatttt agacctacaa gggaagatca gtgaggcttt 600
gtctacagca agagaaggga tctccataat agaaactaga agagatcagg ataatcaatt 660
tagatattcc aaggttcttt tggaacaatt aaaggaactg aaaaatgcac tgaaaatcaa 720
attggacaag aaaaatcagc tacacttcaa agttttaaag tttgacgcac cagtgccttg 780
tacaaagaaa ctaagattag tcactccaag aacaatagat ccttccattt ttttgccgat 840
agagctagtg aagctgatct ttcgcctgtt gaatttctca gacatgtatg cctgtttatt 900
ggtctcaaca aaatggaact caattatatc ctcatcaccg gaactgtttc gaaaacttca 960
gttgaaatcc caactgtcca acaaggcgtt aaacaattgt 1000
<210> 97
<211> 951
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1 promoter
<220>
<221> misc_feature
<222> (578)..(578)
<223> n...(T)x wherein x is 14-16
<400> 97
caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60
taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120
ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180
aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240
tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300
ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360
gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420
ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcaga 480
tagacttcaa gatctcaggg attcccacta tttggtattc tgatatgttt ttcctgatat 540
gcatcaaaac tctaatctaa aacctgaatc tccgctanga tgaccccgtt ttcgtgacaa 600
attaatttcc aacggggtct tgtccggata agagaatttt gtttgattat ccgttcggat 660
aaatggacgc ctgctccata tttttccggt tattacccca cctggaagtg cccagaattt 720
tccggggatt acggataata cggtggtctg gattaattaa tacgccaagt cttacatttt 780
gttgcagtct cgtgcgagta tgtgcaataa taaacaagat gagccaattt attggattag 840
ttgcagcttg accccgccat agctaggcat agccaagtgc tatgggtgtt agatgatgca 900
cttggatgca gtgagttttg gagtataaaa gatccttaaa attccaccct t 951
<210> 98
<211> 1238
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1-3 promoter
<400> 98
caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60
taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120
ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180
aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240
tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300
ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360
gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420
ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcagc 480
tcagggattc ccactatttg gtattctgat atgtttttcc tgatatgcat caaaactcta 540
atctaaaacc tgaatctccg ctattttttt tttttttgat gaccccgttt tcgtgacaaa 600
ttaatttcca acggggtctt gtccggataa gagaattttg tttgattatc cgttcggata 660
aatggacgcc tgctccatat ttttccggtt attaccccac ctggaagtgc ccagaatttt 720
ccggggatta cggataatac ggtggtctgg attaattaat acgagatctc agggattccc 780
actatttggt attctgatat gtttttcctg atatgcatca aaactctaat ctaaaacctg 840
aatctccgct attttttttt tttttgatga ccccgttttc gtgacaaatt aatttccaac 900
ggggtcttgt ccggataaga gaattttgtt tgattatccg ttcggataaa tggacgcctg 960
ctccatattt ttccggttat taccccacct ggaagtgccc agaattttcc ggggattacg 1020
gataatacgg tggtctggat taattaatac gccaagtctt acattttgtt gcagtctcgt 1080
gcgagtatgt gcaataataa acaagatgag ccaatttatt ggattagttg cagcttgacc 1140
ccgccatagc taggcatagc caagtgctat gggtgttaga tgatgcactt ggatgcagtg 1200
agttttggag tataaaagat ccttaaaatt ccaccctt 1238
<210> 99
<211> 1425
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1-4 promoter
<400> 99
caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60
taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120
ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180
aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240
tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300
ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360
gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420
ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcagc 480
tcagggattc ccactatttg gtattctgat atgtttttcc tgatatgcat caaaactcta 540
atctaaaacc tgaatctccg ctattttttt tttttttgat gaccccgttt tcgtgacaaa 600
ttaatttcca acggggtctt gtccggataa gagaattttg tttgattatc cgttcggata 660
aatggacgcc tgctccatat ttttccggtt attaccccac ctggaagtgc ccagaatttt 720
ccggggatta cggataatac ggtggtctgg attaattaat acgccaagtc ttacattttg 780
ttgcagtctc gtgcgagtat gtgcaataat aaacaagatg agccaattta ttggattagt 840
tgcagcttga ccccgccata gctaggcata gccaagtgct atgggtgtta gatgatgcac 900
ttggatgcag tgagttttgg agtataaaag atccttaaaa ttccaccctt agatctcagg 960
gattcccact atttggtatt ctgatatgtt tttcctgata tgcatcaaaa ctctaatcta 1020
aaacctgaat ctccgctatt tttttttttt ttgatgaccc cgttttcgtg acaaattaat 1080
ttccaacggg gtcttgtccg gataagagaa ttttgtttga ttatccgttc ggataaatgg 1140
acgcctgctc catatttttc cggttattac cccacctgga agtgcccaga attttccggg 1200
gattacggat aatacggtgg tctggattaa ttaatacgcc aagtcttaca ttttgttgca 1260
gtctcgtgcg agtatgtgca ataataaaca agatgagcca atttattgga ttagttgcag 1320
cttgaccccg ccatagctag gcatagccaa gtgctatggg tgttagatga tgcacttgga 1380
tgcagtgagt tttggagtat aaaagatcct taaaattcca ccctt 1425
<210> 100
<211> 491
<212> DNA
<213> Komagataella phaffii
<400> 100
cttttttgta gaaatgtctt ggtgtcctcg tccaatcagg tagccatctc tgaaatatct 60
ggctccgttg caactccgaa cgacctgctg gcaacgtaaa attctccggg gtaaaactta 120
aatgtggagt aatggaacca gaaacgtctc ttcccttctc tctccttcca ccgcccgtta 180
ccgtccctag gaaattttac tctgctggag agcttcttct acggccccct tgcagcaatg 240
ctcttcccag cattacgttg cgggtaaaac ggaggtcgtg tacccgacct agcagcccag 300
ggatggaaaa gtcccggccg tcgctggcaa taatagcggg cggacgcatg tcatgagatt 360
attggaaacc accagaatcg aatataaaag gcgaacacct ttcccaattt tggtttctcc 420
tgacccaaag actttaaatt taatttattt gtccctattt caatcaattg aacaactatc 480
acctgcaggc c 491
<210> 101
<211> 488
<212> DNA
<213> Komagataella phaffii
<400> 101
cttttttgta gaaatgtctt ggtgtcctcg tccaatcagg tagccatctc tgaaatatct 60
ggctccgttg caactccgaa cgacctgctg gcaacgtaaa attctccggg gtaaaactta 120
aatgtggagt aatggaacca gaaacgtctc ttcccttctc tctccttcca ccgcccgtta 180
ccgtccctag gaaattttac tctgctggag agcttcttct acggccccct tgcagcaatg 240
ctcttcccag cattacgttg cgggtaaaac ggaggtcgtg tacccgacct agcagcccag 300
ggatggaaaa gtcccggccg tcgctggcaa taatagcggg cggacgcatg tcatgagatt 360
attggaaacc accagaatcg aatataaaag gcgaacacct ttcccaattt tggtttctcc 420
tgacccaaag actttaaatt taatttattt gtccctattt caatcaattg aacaactatc 480
aaaacaca 488
<210> 102
<211> 985
<212> DNA
<213> Komagataella phaffii
<400> 102
agggcatcat tgaggtttcc acaaaaggaa gaaacatgga tccagagaca tcaacagaga 60
ggaaagcggg tagtgaagcc gaagccacaa cacagcccga tttggaaggg agttcacaat 120
caaggtgagt ccagccattt tttttctttt tttttttttt attcaggtga acccacctaa 180
ctatttttaa ctgggatcca gtgagctcgc tgggtgaaag ccaaccatct tttgtttcgg 240
ggaaccgtgc tcgccccgta aagttaattt ttttttcccg cgcagcttta atctttcggc 300
agagaaggcg ttttcatcgt agcgtgggaa cagaataatc agttcatgtg ctatacaggc 360
acatggcagc agtcactatt ttgcttttta accttaaagt cgttcatcaa tcattaactg 420
accaatcaga ttttttgcat ttgccactta tctaaaaata cttttgtatc tcgcagatac 480
gttcagtggt ttccaggaca acacccaaaa aaaggtatca atgccactag gcagtcggtt 540
ttatttttgg tcacccacgc aaagaagcac ccacctcttt taggttttaa gttgtgggaa 600
cagtaacacc gcctagagct tcaggaaaaa ccagtacctg tgaccgcaat tcaccatgat 660
gcagaatgtt aatttaaacg agtgccaaat caagatttca acagacaaat caatcgatcc 720
atagttaccc attccagcct tttcgtcgtc gagcctgctt cattcctgcc tcaggtgcat 780
aactttgcat gaaaagtcca gattagggca gattttgagt ttaaaatagg aaatataaac 840
aaatataccg cgaaaaaggt ttgtttatag cttttcgcct ggtgccgtac ggtataaata 900
catactctcc tcccccccct ggttctcttt ttcttttgtt acttacattt taccgttccg 960
tcactcgctt cactcaacaa caaaa 985
<210> 103
<211> 975
<212> DNA
<213> Komagataella phaffii
<400> 103
gtagcttggg taggacttga caagtacggc ttccgtggtc ataccaaacg cctttgttac 60
cgttggctat acctaatgac caaggcattt gtggattata acggtatcgt agttgaaaaa 120
tatgacgtaa ccactggtac tagcccccac aaggttgatg ctgaatacgg gaatcaaggt 180
gccgatttta aaggagtagc cactgaaggg tttggctggg tcaatgcctc ttttattttg 240
ggattaacct acttagatgt ccaaggcatc cgtgcgatag gcgccgttac gtcccctgat 300
gtatttttca ggaagctcaa accttgggaa cgcgcaagtt atggcctaag gccatgtaac 360
gagatagtca agtcaaacta gaagtatacg gtttccccgc agaaatagca gaaataggcg 420
acaaatacat acaacatttt cattgtgata gggggcggcg gttcctagga gggacaaccc 480
ccagaaacct tgtagactac gttttcacga cgatgggtta ttactgtaaa ggaagaatat 540
actacccacc agttgaatgt ttgaacggat caaaggtcga agggagtaca cggcccaacc 600
aacgtagcta ccggagaaag caagactttc ccaaaccaaa tagctccggg tttcttctcc 660
ggcaacccgt cagtttttgt gtggccggac aaaaattcgc accctcagtc taattgaaag 720
gtcgggctcc gagctctagg cgtttgcgca tgtaatattg catcccctcc catagataat 780
actgcgcgaa cacagggtgc aaattatgat gaccacacat gccagtgacc aaaacagttt 840
tttagtcttt aaaaaccctc ggaacttctg agtatataaa ggcttctcat ttcctacaag 900
caaacaaaga agaaacttcc actttctaac tttttatcta tagactttag agttacaacc 960
aacgaacaat aacaa 975
<210> 104
<211> 699
<212> DNA
<213> Komagataella phaffii
<400> 104
cgcattattt gggtcggcta ctgtcattgg ttatgatggc cttaccgagc acgaaggtgg 60
ttggatagac cacaactgga aacagttgta caaacagatt gcattcattt ttgcttgtat 120
tggatactcg atggccatca ccgctcttat ctgtttcatc ctcaaccgta ttccattttt 180
gcaactgcga gcttcagaag aggctgagga gaaaggtatg gatgaggatc agattggaga 240
gttcgcttat gactacgtgg aagtacgtcg tgattttttg gcttggggat caggcccaaa 300
caatggcttc aaggagccgg aagttctgga tcaggtagtt ccggttaatg atttcagcag 360
tgaccagaat gtgactaatc agaccaacga atctgagaag cagtagagta aatatagaga 420
tgatatttag tgtattctaa tgcttatgta atgtattaag caaaaagttg tgtttatgag 480
ttagcatttg tcttagcaaa cataaaatta tgtcgacatt tgcaacccgc atgtctagtg 540
tttttagatc gatcttcgat gtgtagaata atgcctccac gtgatgcccc gcgattttgt 600
tgggtcgcaa tgcctccaac ataaacccat cacgtataaa aagccctctt aaccctcccc 660
cctgtttcgt ttgcttcatc acttaacctg aactatcaa 699
<210> 105
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> pG3 promoter
<400> 105
gtaaatagcg gcagcaatcc agtaaccttt tctgaatagc agagccttaa ctaaaataat 60
ggccagggta aaaaattcga aatttgacac caaaaataaa gacttgtcgt tataagtctt 120
aacaaagtcc gcaattttgg agctaacggt ggcggttgct gggatattca ataatggtag 180
aatgttgctg cgggtatatg acagagcgtg aaacacactg aacaaggtaa atggaacaac 240
agcaattgca atatggggga ggatagtcaa gaacaaagca gcaatggcaa agtactgaat 300
attctccaaa gccaaaaggt ccagtggttt caacgacaaa gtcttgttgg tatagctttg 360
gaacaaaagg acaccgaaag actcgacagc gcccacaaat acagcgttgt agaagaacga 420
attgattgct ccagagcttc taatagtcag aagatacccc aaacctccga gcaacgttag 480
cacatgacct aagaaccagg cgaagtgaag agtctggaat aacgacaccc agtcagtttt 540
tcctgagctc ctggtgggat tggtagaagc atttgatttg cttggagtgg ttttatttga 600
agatggtgtt gaagccattg ttgctaaaga gtcggagttt tgcttttagg gtttgttaag 660
caaaggagga aaaactgcgc cgtttgaagt cccaggtagt ttcgcgtgtg aggccagcca 720
gggaaagctt ccttcggtac ttttttttct tttgcaggtt ccggacggat taagcttcgg 780
gttatgaggg gggcggtagc caattccgga cacaatattg cgtcgcagct agtcaccccg 840
ccataaatat acgcaggatt gaggtaataa catcgatagt cttagtaatt aatacaattc 900
agtggcgaat ttggcaacat gacgtaaggc ccactgttgt ctataaaagg ggatgaattt 960
tcatgttttt gaggcctccc ggacaattta ttgaactcaa 1000
<210> 106
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> pG4 promoter
<400> 106
tggactgttc aatttgaagt cgatgctgac gatgtcaaga gagatgctca attatatttg 60
tcatttgctg gttacactgg aaacgctact tttgttggcg gaaactctac cagtttggcc 120
gtccatgtaa acgatgtcgt tctgggccgt gaccgtttca acacgaacat aaccaatgac 180
aaatccactt acaggtctag ttcatatgga ggcaattggt accttacttc tttggatgtc 240
ccaagtgggg ctttaacgtc tggtactaac aatgtctcgt ttgtcactac aaactccgag 300
gtaaataaag gattcttgtg ggattctctc aagtttgttt ggaagttgta acaggtttat 360
aagcatatcg tgcgcttgtc cacaattgaa tcatttattg ttgcgagata catgaacaaa 420
gtgtgaactg ggacccatta ctacaattcc cacgcaaccg ttgtttcaaa gcccatattt 480
tttgacaatt gtttcgttac acccccagtt tgatgtacat cgcttgcaat gatgtgtgtc 540
ccggagtatt ttccatattc agcttgaatt cgtatactca accaatatct gggggtatac 600
ttttatgtaa cctatacaaa tcaactatac tatttcacct ttcgaccaat catctcccat 660
cttgttaagt tttgcttcct atatccctga ccctgacatc acccatgatt ccgctcaacg 720
gttctcctct acatcgtccc tcttttggag agggtgttca gtttgacatt caaattaccc 780
cccgccatca cgcgcaaccg agaccgcacc cccgaatttt cacaaattac cccacaccct 840
atactccacc actatgaggg ttattagaac tgatcacgta taaataccac cgcaagttcc 900
caagggatcg tgttcttctt ctccaattgc aatcatattt ctgactcttt ctagttcaga 960
ttaattcctt tacacttgct tttttccctt acctttatcc 1000
<210> 107
<211> 1001
<212> DNA
<213> Artificial Sequence
<220>
<223> pG5 promoter
<400> 107
agaccagcag tttaactacg caaatccaca ggaatttcta catcacaata ccaatggtaa 60
taccacgacg tcaaggaatg gaaacgacga cttggaggaa gacttcgtca acctcttgcg 120
gagtacccga ggctaagaca ataagaagaa aaaaaaaaga aaagcggtgg gggagggatt 180
attaaataag gattatgtaa ccccagggta ccgttctata catatttaag gattatttag 240
gacaatcgat gaaatcggca tcaaactgga tgggagtata gtgtccggat aatcggataa 300
atcatcttgc gaggagccgc ttggttggtt ggtgagagga gtgaaatatg tgtctcctca 360
cccaagaatc gcgatatcag caccctgtgg gggacactat tggcctccct cccaaacctt 420
cgatgtggta gtgctttatt atattgatta cattgattac atagctaaac cctgcctggt 480
tgcaagttga gctccgaatt ccaatattag taaaatgcct gcaagataac ctcggtatgg 540
cgtccgaccc cgcttaatta ttttaactcc tttccaacga ggacttcgta atttttgatt 600
agggagttga gaaacggggg gtcttgatac ctcctcgatt tcagatccca ccccctctca 660
gtcccaagtg ggacccccct cggccgtgaa atgcgcgcac tttagttttt ttcgcatgta 720
aacgccggtg tccgtcaatt aaaagtcgca gactagggtg aactttacca tttttgtcgc 780
actccgtctc ctcggaatag gggtgtagta attctgcagt agtgcaattt ttaccccgcc 840
aagggggggc gaaaagagac gacctcatca cgcattctcc agtcgctctc tacgcctaca 900
gcaccgacgt agttaacttt ctcccatata taaagcaatt gccattcccc tgaaaacttt 960
aacctctgct ttttcttgat ttttccttgc ccaaagaaaa g 1001
<210> 108
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> pG7 promoter
<400> 108
aattgattaa gttcagtgaa atttcaaacc gctatacaca acaggacaac tttgagttta 60
gaaaaatccg atgtagtgta acggctagca cggtccgctt tcaccgggca gacccgggtt 120
cgactcccgg catcggagtt tatttttcca tttcgttctt tagagtattc tcctcagcat 180
gcccccctga atttttcctt ttttccatgt gtcccatttt tccacttttt ttacagtttt 240
cctcgtgatg ttaattggct acacaaaagc tgccacacga aaccttaatc acgaaaaact 300
atacagcctt cactaatccg tagccccata atatgttgtc cacgtgctgt tgggtactac 360
ctgtagactc tcatacccca ctccgtcttt ctccaacaat taacgcagta ccgagattta 420
tcagcagact caaattgggc aaactctgta tttttccttg cccgcataat ttatgggtct 480
caggcctcca cgtttcctgt ttacttgaag aatattggct gcggaaaaag tggtaaggac 540
aacccccttt taattggatc cagtttttcc gaaatgttcc gatccgtacg tcatctccga 600
agccgtacat tttcactcaa tctacgtagc tttggactca gcgctcctgg aattgccagg 660
acagtttact tgagttgata ttcccttgta gattgtgtgc ttctttttcc aaaatttgag 720
gcttcgtttg aaaagtggaa tctggtcgct agatcacttc atgcctattt ttcacggaaa 780
aataagtggt actatgcacc ccttaaacct aaagaaaaac ggaaaaatta ccccaaaacc 840
tggtgatgtt tttcgcccct ttctttttat ccgagttttt cttttttctt gtctgccaaa 900
ttcctctcct gaccttagcg tccccggaaa aaattaacta cttaaggacc gaatgagccc 960
cagcttttcc ccttctcttc attattcccc ataatataat 1000
<210> 109
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> pG8 promoter
<400> 109
ctgcacaacc attgccagta aggacgaaga gaaggcccca ctacccaaaa ttcaggataa 60
cgtcttcata ccatgcagcg acgcctacaa gacgctgtca agacatgcca acttcaacga 120
agtgaacttt aacacattga tcgggaaatt gaccaccaag ggaatgctgg ttgaggctgg 180
aagcgttgcc agtgtcctga gggaactgga ccgaaagttt agtaatgcat aagaggatat 240
atataggaat gcagtaataa tattagtacc cattaagtgg gctaagccat tggaaggccg 300
tctgactgat ggtggtgttc ttctcattta gatagtgcat ttgcaactac cgtctgagat 360
tgagtttgat gtgaagctcc agcgccaaaa cagtataaga accttatctc cgcattattg 420
ttcttgcgta aaagtttgtg tgaagaaaca ggggtagttg cgcagattag ttgtaatatg 480
cgcataggat gggtcattga cttctttcct cgaaagagcc acaccgttag ctaaaaaagg 540
acgcgcatct accccaaaat agaatgtggg gaaataggac gcgcaacttc ctctcaatca 600
ctggacgtca gaaaaacaaa tgcgcaatcg agtcaccctc cgtgataccc tccgtgatac 660
cccctctccg tctattctga cagcgtctcc ccatgacgtt tcaatctact tagaaaagat 720
ttcgtttttt tttccttcaa ttacacgatc tcatcttctg caagggtctg gaggacatca 780
ccaatctgcg actccataac ttagtcctga gtttatattt acgcttcatc tgatgagtag 840
gaagaaaaag tttcacgaaa ttcccccgcc aacttgccct tcggaataag cagccactct 900
ccttctgccc atagtaagct tgcgcgaggc cccaacttgg ccagaaactt taaatatgcc 960
aaacaatctc ccccaatcta agttctccct cttctaaaaa 1000
<210> 110
<211> 859
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1a promoter
<400> 110
ggaatctgta ttgttagaaa gaacgagagt tttttacggc gccgccatat tgggccgtgt 60
gaaaacagct tgaaacccca ctactttcaa aggttctgtt gctatacacg aaccatgttt 120
aaccaacctc gcttttgact tgactgaagt catcggttaa caatcaagta ccctagtctg 180
tctgaatgct cctttccata ttcagtaggt gtttcttgca cttttgcatg cactgcggaa 240
gaattagcca atagcgcgtt tcatatgcgc ttttaccccc tcttttgtca agcgcaaaat 300
gcctgtaaga tttggtgggg gtgtgagccg ttagctgaag tacaacaggc taattccctg 360
aaaaaactgc agatagactt caagatctca gggattccca ctatttggta ttctgatatg 420
tttttcctga tatgcatcaa aactctaatc taaaacctga atctccgcta tttttttttt 480
ttttttgatg accccgtttt cgtgacaaat taatttccaa cggggtcttg tccggataag 540
agaattttgt ttgattatcc gttcggataa atggacgcct gctccatatt tttccggtta 600
ttaccccacc tggaagtgcc cagaattttc cggggattac ggataatacg gtggtctgga 660
ttaattaata cgccaagtct tacattttgt tgcagtctcg tgcgagtatg tgcaataata 720
aacaagatga gccaatttat tggattagtt gcagcttgac cccgccatag ctaggcatag 780
ccaagtgcta tgggtgttag atgatgcact tggatgcagt gagttttgga gtataaaaga 840
tccttaaaat tccaccctt 859
<210> 111
<211> 664
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1b promoter
<400> 111
ccatattcag taggtgtttc ttgcactttt gcatgcactg cggaagaatt agccaatagc 60
gcgtttcata tgcgctttta ccccctcttt tgtcaagcgc aaaatgcctg taagatttgg 120
tgggggtgtg agccgttagc tgaagtacaa caggctaatt ccctgaaaaa actgcagata 180
gacttcaaga tctcagggat tcccactatt tggtattctg atatgttttt cctgatatgc 240
atcaaaactc taatctaaaa cctgaatctc cgctattttt tttttttttt tgatgacccc 300
gttttcgtga caaattaatt tccaacgggg tcttgtccgg ataagagaat tttgtttgat 360
tatccgttcg gataaatgga cgcctgctcc atatttttcc ggttattacc ccacctggaa 420
gtgcccagaa ttttccgggg attacggata atacggtggt ctggattaat taatacgcca 480
agtcttacat tttgttgcag tctcgtgcga gtatgtgcaa taataaacaa gatgagccaa 540
tttattggat tagttgcagc ttgaccccgc catagctagg catagccaag tgctatgggt 600
gttagatgat gcacttggat gcagtgagtt ttggagtata aaagatcctt aaaattccac 660
cctt 664
<210> 112
<211> 493
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1c promoter
<400> 112
ctgcagatag acttcaagat ctcagggatt cccactattt ggtattctga tatgtttttc 60
ctgatatgca tcaaaactct aatctaaaac ctgaatctcc gctatttttt tttttttttt 120
gatgaccccg ttttcgtgac aaattaattt ccaacggggt cttgtccgga taagagaatt 180
ttgtttgatt atccgttcgg ataaatggac gcctgctcca tatttttccg gttattaccc 240
cacctggaag tgcccagaat tttccgggga ttacggataa tacggtggtc tggattaatt 300
aatacgccaa gtcttacatt ttgttgcagt ctcgtgcgag tatgtgcaat aataaacaag 360
atgagccaat ttattggatt agttgcagct tgaccccgcc atagctaggc atagccaagt 420
gctatgggtg ttagatgatg cacttggatg cagtgagttt tggagtataa aagatcctta 480
aaattccacc ctt 493
<210> 113
<211> 370
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1d promoter
<400> 113
gaccccgttt tcgtgacaaa ttaatttcca acggggtctt gtccggataa gagaattttg 60
tttgattatc cgttcggata aatggacgcc tgctccatat ttttccggtt attaccccac 120
ctggaagtgc ccagaatttt ccggggatta cggataatac ggtggtctgg attaattaat 180
acgccaagtc ttacattttg ttgcagtctc gtgcgagtat gtgcaataat aaacaagatg 240
agccaattta ttggattagt tgcagcttga ccccgccata gctaggcata gccaagtgct 300
atgggtgtta gatgatgcac ttggatgcag tgagttttgg agtataaaag atccttaaaa 360
ttccaccctt 370
<210> 114
<211> 328
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1e promoter
<400> 114
ccggataaga gaattttgtt tgattatccg ttcggataaa tggacgcctg ctccatattt 60
ttccggttat taccccacct ggaagtgccc agaattttcc ggggattacg gataatacgg 120
tggtctggat taattaatac gccaagtctt acattttgtt gcagtctcgt gcgagtatgt 180
gcaataataa acaagatgag ccaatttatt ggattagttg cagcttgacc ccgccatagc 240
taggcatagc caagtgctat gggtgttaga tgatgcactt ggatgcagtg agttttggag 300
tataaaagat ccttaaaatt ccaccctt 328
<210> 115
<211> 283
<212> DNA
<213> Artificial Sequence
<220>
<223> pG1f promoter
<400> 115
gcctgctcca tatttttccg gttattaccc cacctggaag tgcccagaat tttccgggga 60
ttacggataa tacggtggtc tggattaatt aatacgccaa gtcttacatt ttgttgcagt 120
ctcgtgcgag tatgtgcaat aataaacaag atgagccaat ttattggatt agttgcagct 180
tgaccccgcc atagctaggc atagccaagt gctatgggtg ttagatgatg cacttggatg 240
cagtgagttt tggagtataa aagatcctta aaattccacc ctt 283
<210> 116
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 116
cctgaggctt tgttccaccc atct 24
<210> 117
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 117
ggaacatagt agtaccaccg gacataacga 30
<210> 118
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 118
taaaattctc cggggtaaaa c 21
<210> 119
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 119
ctctccagca gagtaaaatt tc 22
<210> 120
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 120
cacagaatcg gtagaggtg 19
<210> 121
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 121
cagtgatgga agatggc 17
<210> 122
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 122
agactttcac tttccacgct 20
<210> 123
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 123
caacgaaagc agcgaagtc 19
<210> 124
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 124
gatcggtctc acatgtcttg ggacgacg 28
<210> 125
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 125
gatcggtctc agtcctgctt tgtctctag 29
<210> 126
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 126
gatcggtctc tggactatgt gaacctcc 28
<210> 127
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 127
gatcggtctc aaagcctaca tgaaatcgtc atcacc 36
<210> 128
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 128
gatcggtctc acatgacaaa cgaaccagaa 30
<210> 129
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 129
gatgggtctc agaccggttt ggaaatcc 28
<210> 130
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 130
gatcggtctc aggtctgcct tgtagaac 28
<210> 131
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 131
gatcggtctc agagcctgca ttcaaagttg 30
<210> 132
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 132
gatcggtctc agctctggtg accttg 26
<210> 133
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 133
gatcggtctc aaagcctaat ccacaatttc ttctttctc 39
<210> 134
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 134
gatgggtctc acatgtcccg tttctttgcg tcag 34
<210> 135
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 135
gatcggtctc taagcttatt tactatagat cttcttttgg tctttgacat tggaggactg 60
<210> 136
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 136
gatcggtctc acatggctcc aaactacaac 30
<210> 137
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 137
gatcggtctc agtgaagaat tcgtagattg tctc 34
<210> 138
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 138
gatcggtctc atcacctcca aaagggttag 30
<210> 139
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 139
gatcggtctc agttatgtgt ctcgacctta c 31
<210> 140
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 140
gatcggtctc ataacaggct aaagagaatg g 31
<210> 141
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 141
gatcggtctc taagcttata ttcttccttg acgctttag 39
<210> 142
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 142
gatcggtctc acatgaggcc aattttactg aag 33
<210> 143
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 143
gaagggtctc attggacacc gaaaatagc 29
<210> 144
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 144
gatcggtctc tccaaggatt cggtagc 27
<210> 145
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 145
gatcggtctc aaagcctaag aggcagtctg taaag 35
<210> 146
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 146
gatcggtctc acatggcaac agcagtag 28
<210> 147
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 147
gatcggtctc accttgacac aatctacaca cc 32
<210> 148
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 148
gatcggtctc aaaggagatc atttcactac c 31
<210> 149
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 149
gaagggtctc actccgagtc cagagc 26
<210> 150
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 150
gatcggtctc aggaggctct ggaagctc 28
<210> 151
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 151
atcggtctct aagcctacac cttaggcttt ggcttg 36
<210> 152
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> ACGCCCTGCAGGATGTCTGAAGGTATTATTGAAATCGACACTAACTTAATCG
<400> 152
acgccctgca ggatgtctga aggtattatt gaaatcgaca ctaacttaat cg 52
<210> 153
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 153
gactggccga ggcggcccta agactcatta acttcctcag tctcaaacaa gtc 53
<210> 154
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 154
gtctcctgca ggatgtccaa taagaacgtg gatacagctc ca 42
<210> 155
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 155
gactggccga ggcggcctta aacttcctgt tcctcttctt gctctc 46
<210> 156
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 156
gaggcctgca ggatgtctgt cgataccaag gaagttcaag 40
<210> 157
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 157
gagcggccga ggcggcccta gtttgcttgt gcatccgctt 40
<210> 158
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 158
gatcggtctc ccatgtcaga gactgaaaac g 31
<210> 159
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 159
gatcggtctc tattcaggtt tgattccatc tc 32
<210> 160
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 160
gatcggtctc agaatgggag gacgag 26
<210> 161
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 161
gatcggtctc acgcgggacc ac 22
<210> 162
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 162
gatcggtctc tcgcggtctg ttgag 25
<210> 163
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 163
gatcggtctc acatccttgg acttggtc 28
<210> 164
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 164
gatcggtctc agatgaggca gttttaagac c 31
<210> 165
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 165
gatcggtctc aaagcctaaa tgctgaaaga aggtacg 37
<210> 166
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 166
gatcggtctc acatgtctga aggtattatt gaaatcgaca ctaacttaat cgagacaaac 60
tac 63
<210> 167
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 167
gatcggtctc aaagcctaag actcattaac ttcctcagtc tcaaacaagt cagtg 55
<210> 168
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 168
gactggtctc acatgcatcc atacaccg 28
<210> 169
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 169
gatcggtctc aggtcgtagt ttgtctcg 28
<210> 170
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 170
gatcggtctc agaccaggtt gtcagc 26
<210> 171
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 171
gatcggtctc aaagcctaag actcattaac ttcctcag 38
<210> 172
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 172
gatcggtctc acatgtccaa taagaacgtg g 31
<210> 173
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 173
gatcggtctc accagcgtcc tcagat 26
<210> 174
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 174
gatcggtctc actggcaaga ctagagatg 29
<210> 175
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 175
gactggtctc acttaacgaa cgaggtacc 29
<210> 176
<211> 393
<212> DNA
<213> Artificial Sequence
<220>
<223> gBlock
<400> 176
ccattgggtc tcataagaaa taaggaggct gaagtcaaga ctgctccaga cggatctata 60
atagtatcag aagaggacat caaaaggaaa actaaatccc ttttgaataa gttgacgttg 120
gaattctttg atgatatctc aaacgatata attgctttga ccaagcaagc tcaatgggaa 180
gatgacgtca agactttgaa acaagttatt gagtctatat ttgcaaaggc ttgtgacgaa 240
ccctactggt cctctatgta cgctaaatta tgcgccaaaa tgtgcaagga caccccacct 300
gagatcaagg aaactaatga gaagggaaat actttcaccg gtggtgattt ggtgagaaga 360
gtgttgatta atagatgtca tgagaccgat tcg 393
<210> 177
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 177
agctggtctc agtcaaaccg aatatcagaa ag 32
<210> 178
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 178
gatcggtctc aaagcttaaa cttcctgttc ctcttc 36
<210> 179
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 179
gtacggtctc acatgtctgt cgataccaag 30
<210> 180
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 180
gatcggtctc agaagccaat gtctcgg 27
<210> 181
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 181
gatcggtctc tcttcattgt atgttggtga g 31
<210> 182
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 182
gatcggtctc acacgttggg accac 25
<210> 183
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 183
gatcggtctc acgtgaccct tccttg 26
<210> 184
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 184
gatcggtctc agttcttgac aaagacattg g 31
<210> 185
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 185
gatcggtctc tgaactttga cactgagtcc 30
<210> 186
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 186
gatcggtctc taagcctagt ttgcttgtgc atcc 34
<210> 187
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 187
gatcggtctc gcatgagtga gaaaaacaca cg 32
<210> 188
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 188
gatcggtctc aaagcttata actcagtgtt ctcaagg 37
<210> 189
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 189
agcggtgatt tccttttgca ttctttcg 28
<210> 190
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 190
tttgggtttg gaatctgccg gta 23
<210> 191
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 191
cctgaggctt tgttccaccc atct 24
<210> 192
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 192
ggaacatagt agtaccaccg gacataacga 30
<210> 193
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 193
cgagagatcc tccatcttcg acgc 24
<210> 194
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 194
gtgttgcaac aagtcgacga ctctg 25
<210> 195
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 195
tgtaacgtga atgtcggatt tg 22
<210> 196
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 196
tagtgatggt ggtggtgatg 20
Claims (21)
- 재조합 진핵 숙주 세포로서, 하나 이상의 유전적 변형 이전의 숙주 세포와 비교하여 메신저 리보핵단백질(mRNP)의 번역 개시 인자(TIF 유전자)를 코딩하는 2개 이상의 유전자의 발현을 증가시키도록 상기 유전적 변형에 의해 조작된 관심 유전자(GOI)를 발현하며, 여기서 상기 TIF 유전자는 적어도 eIF4A를 코딩하는 유전자 및 eIF4G를 코딩하는 유전자를 포함하고, 상기 TIF 유전자 중 적어도 하나의 발현은 상기 GOI의 발현을 제어하는 프로모터와 상이한 프로모터의 전사 제어 하에 있는, 숙주 세포.
- 제 1항에 있어서,
a) 상기 eIF4A는 서열번호: 12-33 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하고;
b) 상기 eIF4G는 서열번호: 34-44 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하는, 숙주 세포. - 제 1항 또는 제 2항에 있어서, 상기 TIF 유전자는
a) eIF4E를 코딩하는 유전자;
b) PAB1을 코딩하는 유전자; 또는
c) RLI1을 코딩하는 유전자
중 임의의 하나 이상을 추가로 포함하는, 숙주 세포. - 제 3항에 있어서,
a) 상기 eIF4E는 서열번호: 1-11 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하고;
b) 상기 PAB1은 서열번호: 45-55 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하고;
c) 상기 RLI1은 서열번호: 56-65 중 임의의 하나와 적어도 60%의 서열 동일성을 포함하는, 숙주 세포. - 제 1항 내지 제 4항 중 어느 한 항에 있어서, 상기 TIF 유전자 중 하나 이상이 숙주 세포에서 상기 TIF 유전자(들)를 발현시키기 위해 최적화된, 숙주 세포.
- 제 1항 내지 제 5항 중 어느 한 항에 있어서, 적어도
a) eIF4A 및 eIF4G를 코딩하는 유전자;
b) eIF4A, eIF4G 및 eIF4E를 코딩하는 유전자;
c) eIF4A, eIF4G, eIF4E 및 PAB1을 코딩하는 유전자;
d) eIF4A, eIF4G 및 PAB1을 코딩하는 유전자
를 과발현하는, 숙주 세포. - 제 6항에 있어서, 상기 숙주 세포가 RLI1을 코딩하는 유전자를 과발현하도록 추가로 조작된, 숙주 세포.
- 제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 유전적 변형이 (i) 하나 이상의 폴리뉴클레오티드 또는 이의 일부; 또는 (ii) 발현 제어 서열, 바람직하게는 프로모터, 리보솜 결합 부위, 전사 또는 번역 개시 및 정지 서열, 인핸서 및 활성자 서열로 이루어진 군으로부터 선택되는 발현 제어 서열의 녹킨, 치환, 파괴, 결실 또는 녹아웃을 포함하며; 바람직하게는 상기 하나 이상의 유전적 변형은 숙주 세포 게놈으로의 이종 폴리뉴클레오티드 또는 발현 카세트의 통합을 포함하는, 숙주 세포.
- 제 1항 내지 제 8항 중 어느 한 항에 있어서, 상기 유전적 변형이 상기 TIF 유전자(들)의 수 또는 상기 TIF 유전자(들)를 포함하는 발현 카세트의 수의 증가, 및/또는 상기 TIF 유전자(들)의 기능 획득 변경을 포함하여서, 상기 TIF 유전자(들)의 수준 또는 활성 증가를 초래하는, 숙주 세포.
- 제 1항 내지 제 9항 중 어느 한 항에 있어서, 상기 TIF 유전자가 숙주 세포에 대해 내인성 또는 이종성인, 숙주 세포.
- 제 1항 내지 제 10항 중 어느 한 항에 있어서,
a) 상기 TIF 유전자(들)에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 각각 포함하는, 하나 이상의 이종 TIF 발현 카세트에서 하나 이상의 상기 TIF 유전자를 발현하기 위한 발현 시스템; 및
b) GOI 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 GOI 발현 카세트를 포함하며;
여기서 a)의 발현 시스템 및 b)의 발현 카세트는 세포 배양물에서 숙주 세포를 배양할 때 각각의 TIF 유전자(들) 및 GOI를 발현하도록 조작되는, 숙주 세포. - 제 11항에 있어서,
a) 상기 TIF 발현 카세트 중 적어도 하나는 구성적 프로모터를 포함하고/하거나;
b) 상기 GOI 발현 카세트는 유도성, 탈-억제성 또는 달리 조절가능한 프로모터, 또는 구성적 프로모터를 포함하는, 숙주 세포. - 제 1항 내지 제 12항 중 어느 한 항에 있어서,
a) 피치아(Pichia), 한세눌라(Hansenula), 코마가타엘라(Komagataella), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 오가테아(Ogataea), 야로위아(Yarrowia) 및 지오트리쿰(Geotrichum), 바람직하게는 피치아 파스토리스(Pichia pastoris), 코마가타엘라 파피(Komagataella phaffii), 코마가타엘라 파스토리스(Komagataella pastoris), 코마가타엘라 슈도파스토리스(Komagataella pseudopastoris), 사카로미세스 세레비지애(Saccharomyces cerevisiae), 오가테아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카(Yarrowia lipolytica) 또는 한세눌라 폴리모르파(Hansenula polymorpha)로 이루어진 군에서 선택되는 속의 효모 세포;
b) 사상성 진균의 세포, 예컨대 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 리세이(Trichoderma reesei);
c) 비-인간 영장류, 인간, 설치류 또는 소 세포, 예컨대 마우스 골수종(NSO)-세포주, 차이니즈 햄스터 난소(CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3, PC12, BHK(아기 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어 COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EB1, EB2, EB3, 종양용해성 또는 하이브리도마-세포주;
d) 곤충 세포, 예컨대 Sf9, Mimic™ Sf9, Sf21, 하이 파이브(High Five)(BT1-TN-5B1-4) 또는 BT1-Ea88 세포;
e) 조류 세포, 예컨대 암포라(Amphora), 규조류(Bacillariophyceae), 두날리엘라(Dunaliella), 클로렐라(Chlorella), 클라미도모나스(Chlamydomonas), 시아노피타(Cyanophyta)(시아노박테리아), 나노클로롭시스(Nannochloropsis), 스피룰리나(Spirulina) 또는 오크로모나스(Ochromonas) 속; 또는
f) 식물 세포, 예컨대 단자엽 식물, 바람직하게는 옥수수, 벼, 밀 또는 세타리아, 또는 쌍자엽 식물, 바람직하게는 카사바, 감자, 대두, 토마토, 담배, 알팔파, 피스코미트렐라 파텐스(Physcomitrella patens) 또는 애기장대(Arabidopsis)로부터의 세포인, 숙주 세포. - 제 1항 내지 제 13항 중 어느 한 항의 숙주 세포를 생산하는 방법으로서, 하나 이상의 이종 발현 카세트 내에 하나 이상의 상기 TIF 유전자 및 관심 유전자(GOI)를 포함하도록 숙주 세포를 유전적으로 조작하는 것을 포함하는, 방법.
- 제 14항의 숙주 세포를 관심 단백질(POI)을 생산하는 조건 하에서 배양함으로써 관심 유전자(GOI)에 의해 코딩되는 상기 POI를 생산하는 방법.
- 제 15항에 있어서, 상기 숙주 세포는 하나 이상의 상기 TIF 유전자를 공동-발현하고 상기 POI를 숙주 세포 배양물로 분비하는 조건 하에 배양 배지에서 배양되고, 상기 POI는 숙주 세포 배양물로부터 회수되는, 방법.
- 제 15항 또는 제 16항에 있어서, 상기 숙주 세포가 상기 POI에 대한 숙주 세포의 비 생산성(시간당 μg/g 효모 건조 질량(YDM) 및/또는 상기 POI에 대한 부피 생산성(시간당 μg/L)을 증가시키는 수준에서 상기 TIF 유전자 중 하나 이상을 공동-발현하도록 변형되는, 방법.
- 제 15항 내지 제 17항 중 어느 한 항에 있어서, 상기 POI가 치료 또는 진단 생성물, 바람직하게는 항원-결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물-단백질 접합체, 구조 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소 및 대사 효소로 이루어진 군으로부터 선택된 펩티드, 폴리펩티드 또는 단백질인, 방법.
- 세포 배양물에서 메신저 리보핵단백질(mRNP)의 하나 이상의 TIF 유전자(들)를 발현하는 하나 이상의 이종 발현 카세트를 공동-발현함으로써, 관심 단백질(POI)을 코딩하는 관심 유전자(GOI)를 발현하는 숙주 세포에 의해 생산될 때 상기 POI의 수율을 증가시키는 방법.
- 메신저 리보핵단백질(mRNP)의 하나 이상의 TIF 유전자(들)를 발현하는 하나 이상의 이종 발현 카세트를 포함하는 폴리펩티드 발현 시스템.
- 제 20항에 있어서, 관심 단백질(POI)을 코딩하는 관심 유전자(GOI) 및 상기 GOI에 작동가능하게 연결된 하나 이상의 발현 제어 서열을 포함하는 발현 카세트를 포함하는, 발현 시스템.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20199354 | 2020-09-30 | ||
EP20199354.0 | 2020-09-30 | ||
PCT/EP2021/076910 WO2022069613A1 (en) | 2020-09-30 | 2021-09-30 | Host cells overexpressing translational factors |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230075436A true KR20230075436A (ko) | 2023-05-31 |
Family
ID=72709158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237010094A KR20230075436A (ko) | 2020-09-30 | 2021-09-30 | 번역 인자를 과발현하는 숙주 세포 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230348545A1 (ko) |
EP (1) | EP4222266A1 (ko) |
JP (1) | JP2023543604A (ko) |
KR (1) | KR20230075436A (ko) |
CN (1) | CN116490517A (ko) |
CA (1) | CA3193155A1 (ko) |
IL (1) | IL301312A (ko) |
WO (1) | WO2022069613A1 (ko) |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5646009A (en) | 1990-09-10 | 1997-07-08 | The University Of Kentucky Research Foundation | Hybrid vector and method resulting in protein overproduction by eukaryotic cells |
CA2105064A1 (en) | 1991-04-01 | 1992-10-02 | Martin Anthony Gleeson | Genes which influence pichia proteolytic activity, and uses therefor |
US6153424A (en) | 1995-11-09 | 2000-11-28 | Zymogenetics, Inc. | Protease-deficient strains of Pichia methanolica |
JP2010524440A (ja) | 2007-04-20 | 2010-07-22 | ポリマン サイエンティフィック イミューンバイオロジッシュ フォーシュング ゲゼルシャフト ミット ベシュレンクテル ファフツング | 発現系 |
EP2401357B1 (en) | 2009-02-26 | 2015-03-25 | GlaxoSmithKline LLC | Host cells and methods of use |
EP3590950A1 (en) | 2011-05-09 | 2020-01-08 | Ablynx NV | Method for the production of immunoglobulin single varible domains |
IN2014DN03419A (ko) | 2011-10-07 | 2015-05-22 | Lonza Ag | |
IN2015DN02771A (ko) | 2012-10-29 | 2015-09-04 | Lonza Ag | |
AU2013382370B2 (en) | 2013-03-15 | 2020-01-23 | Lonza Ltd | Constitutive promoter |
WO2015158800A1 (en) | 2014-04-17 | 2015-10-22 | Boehringer Ingelheim Rcv Gmbh & Co Kg | Recombinant host cell for expressing proteins of interest |
TW201718859A (zh) | 2015-08-05 | 2017-06-01 | 隆查有限公司 | 啟動子變體 |
CN108690139B (zh) | 2017-07-31 | 2019-03-15 | 康码(上海)生物科技有限公司 | 新型融合蛋白的制备及其在提高蛋白质合成的应用 |
US11725086B2 (en) * | 2018-03-05 | 2023-08-15 | Berry Global, Inc. | Shrink films and methods for making the same |
DK3762499T3 (da) | 2018-03-06 | 2024-03-11 | Danisco Us Inc | Reduktion i acetatproduktion ved hjælp af gær, der overudtrykker pab1 |
CN110551750A (zh) | 2018-05-31 | 2019-12-10 | 齐鲁工业大学 | 一种提高酵母mRNA表达效率的方法 |
CN113423836B (zh) | 2019-01-11 | 2023-07-11 | 龙沙有限公司 | 重组宿主细胞中碳源调节的蛋白的产生 |
-
2021
- 2021-09-30 CN CN202180067445.XA patent/CN116490517A/zh active Pending
- 2021-09-30 KR KR1020237010094A patent/KR20230075436A/ko unknown
- 2021-09-30 IL IL301312A patent/IL301312A/en unknown
- 2021-09-30 CA CA3193155A patent/CA3193155A1/en active Pending
- 2021-09-30 JP JP2023519837A patent/JP2023543604A/ja active Pending
- 2021-09-30 EP EP21786825.6A patent/EP4222266A1/en active Pending
- 2021-09-30 WO PCT/EP2021/076910 patent/WO2022069613A1/en active Application Filing
- 2021-09-30 US US18/245,687 patent/US20230348545A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2023543604A (ja) | 2023-10-17 |
CA3193155A1 (en) | 2022-04-07 |
WO2022069613A1 (en) | 2022-04-07 |
IL301312A (en) | 2023-05-01 |
CN116490517A (zh) | 2023-07-25 |
EP4222266A1 (en) | 2023-08-09 |
US20230348545A1 (en) | 2023-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102495283B1 (ko) | 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 | |
JP2023156329A (ja) | 目的タンパク質を産生するための宿主細胞 | |
US20230126246A1 (en) | Helper factors for expressing proteins in yeast | |
KR20230075436A (ko) | 번역 인자를 과발현하는 숙주 세포 | |
EP3947695B1 (en) | Mut- methylotrophic yeast | |
WO2020200415A1 (en) | Mut- methylotrophic yeast | |
WO2020200414A1 (en) | Protein production in mut-methylotrophic yeast |