KR20210114401A - 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 - Google Patents
재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 Download PDFInfo
- Publication number
- KR20210114401A KR20210114401A KR1020217020068A KR20217020068A KR20210114401A KR 20210114401 A KR20210114401 A KR 20210114401A KR 1020217020068 A KR1020217020068 A KR 1020217020068A KR 20217020068 A KR20217020068 A KR 20217020068A KR 20210114401 A KR20210114401 A KR 20210114401A
- Authority
- KR
- South Korea
- Prior art keywords
- gln
- pro
- ser
- asn
- ala
- Prior art date
Links
- 229910052799 carbon Inorganic materials 0.000 title claims description 130
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims description 129
- 230000014616 translation Effects 0.000 title description 20
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 284
- 230000014509 gene expression Effects 0.000 claims abstract description 204
- 101150006710 FLO8 gene Proteins 0.000 claims abstract description 197
- 101100066910 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FLO1 gene Proteins 0.000 claims abstract description 194
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 128
- QOTAEASRCGCJDN-UHFFFAOYSA-N [C].CO Chemical compound [C].CO QOTAEASRCGCJDN-UHFFFAOYSA-N 0.000 claims abstract description 43
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 24
- 230000004048 modification Effects 0.000 claims abstract description 19
- 238000012986 modification Methods 0.000 claims abstract description 19
- 210000004027 cell Anatomy 0.000 claims description 422
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims description 144
- 238000000034 method Methods 0.000 claims description 116
- 238000004519 manufacturing process Methods 0.000 claims description 90
- 238000004113 cell culture Methods 0.000 claims description 64
- 239000002773 nucleotide Substances 0.000 claims description 54
- 125000003729 nucleotide group Chemical group 0.000 claims description 54
- 230000012010 growth Effects 0.000 claims description 46
- 230000002103 transcriptional effect Effects 0.000 claims description 40
- 238000012258 culturing Methods 0.000 claims description 39
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 35
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 32
- 238000012239 gene modification Methods 0.000 claims description 32
- 230000005017 genetic modification Effects 0.000 claims description 32
- 235000013617 genetically modified food Nutrition 0.000 claims description 32
- 102000040430 polynucleotide Human genes 0.000 claims description 32
- 108091033319 polynucleotide Proteins 0.000 claims description 32
- 239000002157 polynucleotide Substances 0.000 claims description 32
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 29
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 29
- 238000012217 deletion Methods 0.000 claims description 28
- 230000037430 deletion Effects 0.000 claims description 28
- 241000235058 Komagataella pastoris Species 0.000 claims description 24
- 230000001965 increasing effect Effects 0.000 claims description 24
- 230000001939 inductive effect Effects 0.000 claims description 24
- 239000000203 mixture Substances 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 23
- 102000004190 Enzymes Human genes 0.000 claims description 21
- 108090000790 Enzymes Proteins 0.000 claims description 21
- 229960005486 vaccine Drugs 0.000 claims description 21
- 230000027455 binding Effects 0.000 claims description 18
- 241000235648 Pichia Species 0.000 claims description 16
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 14
- 230000028327 secretion Effects 0.000 claims description 13
- 238000006467 substitution reaction Methods 0.000 claims description 13
- 241000235070 Saccharomyces Species 0.000 claims description 12
- 239000000427 antigen Substances 0.000 claims description 11
- 241000233866 Fungi Species 0.000 claims description 10
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 10
- 108091007433 antigens Proteins 0.000 claims description 10
- 102000036639 antigens Human genes 0.000 claims description 10
- 150000001720 carbohydrates Chemical class 0.000 claims description 9
- 241000320412 Ogataea angusta Species 0.000 claims description 8
- 241000223259 Trichoderma Species 0.000 claims description 8
- 102000037865 fusion proteins Human genes 0.000 claims description 8
- 108020001507 fusion proteins Proteins 0.000 claims description 8
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 6
- 239000012190 activator Substances 0.000 claims description 6
- 210000005253 yeast cell Anatomy 0.000 claims description 6
- 241001513093 Aspergillus awamori Species 0.000 claims description 5
- 102000025171 antigen binding proteins Human genes 0.000 claims description 5
- 108091000831 antigen binding proteins Proteins 0.000 claims description 5
- 229920005862 polyol Polymers 0.000 claims description 5
- 150000003077 polyols Chemical class 0.000 claims description 5
- 230000001225 therapeutic effect Effects 0.000 claims description 5
- 102000004127 Cytokines Human genes 0.000 claims description 4
- 108090000695 Cytokines Proteins 0.000 claims description 4
- 229940088597 hormone Drugs 0.000 claims description 4
- 239000005556 hormone Substances 0.000 claims description 4
- 230000002503 metabolic effect Effects 0.000 claims description 4
- 241001489174 Ogataea minuta Species 0.000 claims description 3
- 101710172711 Structural protein Proteins 0.000 claims description 3
- 230000003115 biocidal effect Effects 0.000 claims description 3
- 102000034356 gene-regulatory proteins Human genes 0.000 claims description 3
- 108091006104 gene-regulatory proteins Proteins 0.000 claims description 3
- 239000003053 toxin Substances 0.000 claims description 3
- 231100000765 toxin Toxicity 0.000 claims description 3
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical group C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 claims description 2
- 240000000073 Achillea millefolium Species 0.000 claims 1
- 235000007754 Achillea millefolium Nutrition 0.000 claims 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 113
- 230000001105 regulatory effect Effects 0.000 description 87
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 84
- 108020004414 DNA Proteins 0.000 description 59
- -1 glucose or glycerol Chemical compound 0.000 description 46
- 230000000694 effects Effects 0.000 description 44
- 229960001031 glucose Drugs 0.000 description 44
- 238000013518 transcription Methods 0.000 description 44
- 239000008103 glucose Substances 0.000 description 42
- 230000035897 transcription Effects 0.000 description 42
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 41
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 40
- 239000000047 product Substances 0.000 description 37
- 239000002609 medium Substances 0.000 description 36
- 108091028043 Nucleic acid sequence Proteins 0.000 description 32
- 150000007523 nucleic acids Chemical group 0.000 description 32
- 210000004369 blood Anatomy 0.000 description 31
- 239000008280 blood Substances 0.000 description 31
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 29
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 28
- 230000000153 supplemental effect Effects 0.000 description 27
- 102000039446 nucleic acids Human genes 0.000 description 24
- 108020004707 nucleic acids Proteins 0.000 description 24
- 239000012071 phase Substances 0.000 description 24
- 238000000855 fermentation Methods 0.000 description 23
- 230000004151 fermentation Effects 0.000 description 23
- 230000006698 induction Effects 0.000 description 23
- 108010078144 glutaminyl-glycine Proteins 0.000 description 22
- 230000002829 reductive effect Effects 0.000 description 22
- 108010044940 alanylglutamine Proteins 0.000 description 20
- 241000894007 species Species 0.000 description 20
- 239000006143 cell culture medium Substances 0.000 description 19
- 102000004196 processed proteins & peptides Human genes 0.000 description 19
- 229940088598 enzyme Drugs 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 18
- 239000013598 vector Substances 0.000 description 18
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 17
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 16
- 108010026333 seryl-proline Proteins 0.000 description 16
- 102100040618 Eosinophil cationic protein Human genes 0.000 description 15
- 101710191360 Eosinophil cationic protein Proteins 0.000 description 15
- 239000001963 growth medium Substances 0.000 description 15
- 108020004999 messenger RNA Proteins 0.000 description 15
- 108090001061 Insulin Proteins 0.000 description 14
- 102000004877 Insulin Human genes 0.000 description 14
- 239000012228 culture supernatant Substances 0.000 description 14
- 229940125396 insulin Drugs 0.000 description 14
- 230000035772 mutation Effects 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 14
- 238000012216 screening Methods 0.000 description 14
- 210000003527 eukaryotic cell Anatomy 0.000 description 13
- 239000013604 expression vector Substances 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 239000000243 solution Substances 0.000 description 13
- 108091023040 Transcription factor Proteins 0.000 description 12
- 102000040945 Transcription factor Human genes 0.000 description 12
- 239000012526 feed medium Substances 0.000 description 12
- 235000015097 nutrients Nutrition 0.000 description 12
- 150000003839 salts Chemical class 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 239000002028 Biomass Substances 0.000 description 11
- 108091026890 Coding region Proteins 0.000 description 11
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 238000003197 gene knockdown Methods 0.000 description 11
- 238000011534 incubation Methods 0.000 description 11
- 125000006850 spacer group Chemical group 0.000 description 11
- 239000000758 substrate Substances 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 10
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 10
- 238000013459 approach Methods 0.000 description 10
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 10
- 238000010923 batch production Methods 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 230000000670 limiting effect Effects 0.000 description 10
- 239000003550 marker Substances 0.000 description 10
- 108010029020 prolylglycine Proteins 0.000 description 10
- 230000009467 reduction Effects 0.000 description 10
- 239000011550 stock solution Substances 0.000 description 10
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 9
- 230000003698 anagen phase Effects 0.000 description 9
- 108010077245 asparaginyl-proline Proteins 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 9
- 230000003750 conditioning effect Effects 0.000 description 9
- 238000003209 gene knockout Methods 0.000 description 9
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 9
- 239000003112 inhibitor Substances 0.000 description 9
- 230000005764 inhibitory process Effects 0.000 description 9
- 238000002703 mutagenesis Methods 0.000 description 9
- 231100000350 mutagenesis Toxicity 0.000 description 9
- 108010031719 prolyl-serine Proteins 0.000 description 9
- 239000006228 supernatant Substances 0.000 description 9
- 108010061238 threonyl-glycine Proteins 0.000 description 9
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 8
- 108010050904 Interferons Proteins 0.000 description 8
- 102000014150 Interferons Human genes 0.000 description 8
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 8
- 108010084455 Zeocin Proteins 0.000 description 8
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 8
- 235000020958 biotin Nutrition 0.000 description 8
- 239000011616 biotin Substances 0.000 description 8
- 229960002685 biotin Drugs 0.000 description 8
- 230000006378 damage Effects 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 229940079322 interferon Drugs 0.000 description 8
- 108010054155 lysyllysine Proteins 0.000 description 8
- 229910052760 oxygen Inorganic materials 0.000 description 8
- 239000001301 oxygen Substances 0.000 description 8
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 8
- 230000014621 translational initiation Effects 0.000 description 8
- 230000009452 underexpressoin Effects 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 7
- 241000228245 Aspergillus niger Species 0.000 description 7
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 7
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 7
- 241000282414 Homo sapiens Species 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- 108010079364 N-glycylalanine Proteins 0.000 description 7
- 108091005804 Peptidases Proteins 0.000 description 7
- 238000011529 RT qPCR Methods 0.000 description 7
- 235000001014 amino acid Nutrition 0.000 description 7
- 239000011324 bead Substances 0.000 description 7
- 230000007423 decrease Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000002538 fungal effect Effects 0.000 description 7
- 108010018006 histidylserine Proteins 0.000 description 7
- 230000002401 inhibitory effect Effects 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- 239000002207 metabolite Substances 0.000 description 7
- 108010051242 phenylalanylserine Proteins 0.000 description 7
- 210000001236 prokaryotic cell Anatomy 0.000 description 7
- 229920001817 Agar Polymers 0.000 description 6
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 6
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 6
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 6
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 6
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 6
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 6
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 6
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 6
- 208000001132 Osteoporosis Diseases 0.000 description 6
- 239000004365 Protease Substances 0.000 description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 6
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 6
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 6
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 108010087924 alanylproline Proteins 0.000 description 6
- 150000001413 amino acids Chemical class 0.000 description 6
- 108010008355 arginyl-glutamine Proteins 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 6
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 6
- 238000002347 injection Methods 0.000 description 6
- 239000007924 injection Substances 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 238000002493 microarray Methods 0.000 description 6
- 230000036961 partial effect Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 108010077112 prolyl-proline Proteins 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 230000003248 secreting effect Effects 0.000 description 6
- 108010071207 serylmethionine Proteins 0.000 description 6
- 239000004055 small Interfering RNA Substances 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 5
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 5
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 5
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 5
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- 241001099341 Ogataea polymorpha Species 0.000 description 5
- 239000001888 Peptone Substances 0.000 description 5
- 108010080698 Peptones Proteins 0.000 description 5
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 5
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 5
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 5
- 108020004459 Small interfering RNA Proteins 0.000 description 5
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 5
- 239000008272 agar Substances 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 5
- 238000012226 gene silencing method Methods 0.000 description 5
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 108010005942 methionylglycine Proteins 0.000 description 5
- 239000008188 pellet Substances 0.000 description 5
- 235000019319 peptone Nutrition 0.000 description 5
- 108010079317 prolyl-tyrosine Proteins 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- OGBMKVWORPGQRR-UMXFMPSGSA-N teriparatide Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000000699 topical effect Effects 0.000 description 5
- 239000011573 trace mineral Substances 0.000 description 5
- 235000013619 trace mineral Nutrition 0.000 description 5
- 239000012138 yeast extract Substances 0.000 description 5
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 4
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 4
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 4
- 102100036826 Aldehyde oxidase Human genes 0.000 description 4
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 241000193830 Bacillus <bacterium> Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 4
- 108700022150 Designed Ankyrin Repeat Proteins Proteins 0.000 description 4
- 108010054218 Factor VIII Proteins 0.000 description 4
- 102000001690 Factor VIII Human genes 0.000 description 4
- 229930091371 Fructose Natural products 0.000 description 4
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 4
- 239000005715 Fructose Substances 0.000 description 4
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 4
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 4
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 4
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- 241000235649 Kluyveromyces Species 0.000 description 4
- 241001099157 Komagataella Species 0.000 description 4
- 241001099156 Komagataella phaffii Species 0.000 description 4
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 4
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 108010065395 Neuropep-1 Proteins 0.000 description 4
- 101100099277 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) rgt-1 gene Proteins 0.000 description 4
- 108091005461 Nucleic proteins Proteins 0.000 description 4
- 241001112159 Ogataea Species 0.000 description 4
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 4
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 4
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 4
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 4
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 4
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 4
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 4
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 4
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 4
- 241000235013 Yarrowia Species 0.000 description 4
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 235000014633 carbohydrates Nutrition 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 230000010261 cell growth Effects 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 235000013681 dietary sucrose Nutrition 0.000 description 4
- 150000002016 disaccharides Chemical class 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 229960000301 factor viii Drugs 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 229930182830 galactose Natural products 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- 230000030279 gene silencing Effects 0.000 description 4
- 230000004077 genetic alteration Effects 0.000 description 4
- 231100000118 genetic alteration Toxicity 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 230000008826 genomic mutation Effects 0.000 description 4
- 150000004676 glycans Chemical class 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 150000002402 hexoses Chemical class 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 108010085203 methionylmethionine Proteins 0.000 description 4
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 4
- 229920001282 polysaccharide Polymers 0.000 description 4
- 239000005017 polysaccharide Substances 0.000 description 4
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 4
- 230000001718 repressive effect Effects 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 229960004793 sucrose Drugs 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 229910052725 zinc Inorganic materials 0.000 description 4
- 239000011701 zinc Substances 0.000 description 4
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 3
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 3
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 3
- 102100021266 Alpha-(1,6)-fucosyltransferase Human genes 0.000 description 3
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Natural products CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 3
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 3
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 3
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 3
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 3
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 3
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 3
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 3
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 3
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 3
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 3
- 102000055006 Calcitonin Human genes 0.000 description 3
- 108060001064 Calcitonin Proteins 0.000 description 3
- YASYEJJMZJALEJ-UHFFFAOYSA-N Citric acid monohydrate Chemical compound O.OC(=O)CC(O)(C(O)=O)CC(O)=O YASYEJJMZJALEJ-UHFFFAOYSA-N 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 3
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 3
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 3
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 3
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 3
- XAXJIUAWAFVADB-VJBMBRPKSA-N Glu-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XAXJIUAWAFVADB-VJBMBRPKSA-N 0.000 description 3
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 3
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 3
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 3
- 102100039619 Granulocyte colony-stimulating factor Human genes 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- PFOUFRJYHWZJKW-NKIYYHGXSA-N His-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O PFOUFRJYHWZJKW-NKIYYHGXSA-N 0.000 description 3
- 101000819490 Homo sapiens Alpha-(1,6)-fucosyltransferase Proteins 0.000 description 3
- 101001064282 Homo sapiens Platelet-activating factor acetylhydrolase IB subunit beta Proteins 0.000 description 3
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 3
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 3
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- 108010047761 Interferon-alpha Proteins 0.000 description 3
- 102000006992 Interferon-alpha Human genes 0.000 description 3
- 241001138401 Kluyveromyces lactis Species 0.000 description 3
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 3
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 3
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 3
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 3
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 3
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 3
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102000003982 Parathyroid hormone Human genes 0.000 description 3
- 108090000445 Parathyroid hormone Proteins 0.000 description 3
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 3
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 3
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 3
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 3
- CMOIIANLNNYUTP-SRVKXCTJSA-N Pro-Gln-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CMOIIANLNNYUTP-SRVKXCTJSA-N 0.000 description 3
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 3
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 3
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 3
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 3
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 3
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 3
- 238000003559 RNA-seq method Methods 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 3
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 3
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 3
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 3
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 3
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 3
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 3
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 3
- 108010049264 Teriparatide Proteins 0.000 description 3
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 3
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 3
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 3
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 3
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 3
- 241000499912 Trichoderma reesei Species 0.000 description 3
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 229960000074 biopharmaceutical Drugs 0.000 description 3
- 229960004015 calcitonin Drugs 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 229960002303 citric acid monohydrate Drugs 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 238000013270 controlled release Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 3
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 239000013028 medium composition Substances 0.000 description 3
- 229940115256 melanoma vaccine Drugs 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 239000000199 parathyroid hormone Substances 0.000 description 3
- 108010073101 phenylalanylleucine Proteins 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000008092 positive effect Effects 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000012289 standard assay Methods 0.000 description 3
- 238000013268 sustained release Methods 0.000 description 3
- 239000012730 sustained-release form Substances 0.000 description 3
- 229960005460 teriparatide Drugs 0.000 description 3
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 3
- 238000011222 transcriptome analysis Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000012384 transportation and delivery Methods 0.000 description 3
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 3
- 108010029599 tyrosyl-glutamyl-tryptophan Proteins 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 2
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 2
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 2
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 2
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 2
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 2
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- HIMXTOIXVXWHTB-DCAQKATOSA-N Arg-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HIMXTOIXVXWHTB-DCAQKATOSA-N 0.000 description 2
- JKRPBTQDPJSQIT-RCWTZXSCSA-N Arg-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O JKRPBTQDPJSQIT-RCWTZXSCSA-N 0.000 description 2
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 2
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 2
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 2
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 2
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 2
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 2
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 2
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 2
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 2
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 2
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 2
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 2
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 2
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 2
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 2
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 2
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 2
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102100029516 Basic salivary proline-rich protein 1 Human genes 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- YNXLOPYTAAFMTN-SBUIBGKBSA-N C([C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)C1=CC=C(O)C=C1 Chemical compound C([C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)C1=CC=C(O)C=C1 YNXLOPYTAAFMTN-SBUIBGKBSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 241000192700 Cyanobacteria Species 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 208000003556 Dry Eye Syndromes Diseases 0.000 description 2
- 206010013774 Dry eye Diseases 0.000 description 2
- 108010008165 Etanercept Proteins 0.000 description 2
- 108010011459 Exenatide Proteins 0.000 description 2
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 2
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 2
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 2
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 2
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 2
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 2
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 2
- GJLXZITZLUUXMJ-NHCYSSNCSA-N Gln-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GJLXZITZLUUXMJ-NHCYSSNCSA-N 0.000 description 2
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 2
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 2
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 2
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 2
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 2
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 2
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 2
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 2
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 2
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- QIVPRLJQQVXCIY-HGNGGELXSA-N His-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIVPRLJQQVXCIY-HGNGGELXSA-N 0.000 description 2
- ZNNNYCXPCKACHX-DCAQKATOSA-N His-Gln-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNNNYCXPCKACHX-DCAQKATOSA-N 0.000 description 2
- FMRKUXFLLPKVPG-JYJNAYRXSA-N His-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O FMRKUXFLLPKVPG-JYJNAYRXSA-N 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- 101001125486 Homo sapiens Basic salivary proline-rich protein 1 Proteins 0.000 description 2
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 2
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 2
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 2
- 108010078049 Interferon alpha-2 Proteins 0.000 description 2
- 108010005716 Interferon beta-1a Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241000428705 Komagataella pseudopastoris Species 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- MAXILRZVORNXBE-PMVMPFDFSA-N Leu-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MAXILRZVORNXBE-PMVMPFDFSA-N 0.000 description 2
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- 108010000817 Leuprolide Proteins 0.000 description 2
- 208000019693 Lung disease Diseases 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- YFGWNAROEYWGNL-GUBZILKMSA-N Lys-Gln-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YFGWNAROEYWGNL-GUBZILKMSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 2
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- NSGXXVIHCIAISP-CIUDSAMLSA-N Met-Asn-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NSGXXVIHCIAISP-CIUDSAMLSA-N 0.000 description 2
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 2
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 2
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 2
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 2
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 2
- ZDJICAUBMUKVEJ-CIUDSAMLSA-N Met-Ser-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O ZDJICAUBMUKVEJ-CIUDSAMLSA-N 0.000 description 2
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 2
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 2
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 2
- 241000237852 Mollusca Species 0.000 description 2
- 101100243377 Mus musculus Pepd gene Proteins 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 241000244206 Nematoda Species 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 101150029183 PEP4 gene Proteins 0.000 description 2
- 108010068701 Pegloticase Proteins 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 2
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 2
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- JLDZQPPLTJTJLE-IHPCNDPISA-N Phe-Trp-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JLDZQPPLTJTJLE-IHPCNDPISA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 102100030655 Platelet-activating factor acetylhydrolase IB subunit beta Human genes 0.000 description 2
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- QBFONMUYNSNKIX-AVGNSLFASA-N Pro-Arg-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QBFONMUYNSNKIX-AVGNSLFASA-N 0.000 description 2
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 2
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 2
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 2
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 2
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 2
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- NTXFLJULRHQMDC-GUBZILKMSA-N Pro-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 NTXFLJULRHQMDC-GUBZILKMSA-N 0.000 description 2
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- 241000169446 Promethis Species 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 108091030071 RNAI Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 241000235060 Scheffersomyces stipitis Species 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 2
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 2
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 2
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 2
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 2
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 2
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 2
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 2
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 2
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241001085826 Sporotrichum Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 239000012163 TRI reagent Substances 0.000 description 2
- 241001313536 Thermothelomyces thermophila Species 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 2
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 2
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 2
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 2
- WVAKXMOGMWLWHK-VJBMBRPKSA-N Trp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N WVAKXMOGMWLWHK-VJBMBRPKSA-N 0.000 description 2
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 2
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 2
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 2
- 102100039094 Tyrosinase Human genes 0.000 description 2
- 108060008724 Tyrosinase Proteins 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 2
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 2
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 2
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 2
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 2
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 241000222124 [Candida] boidinii Species 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 230000001093 anti-cancer Effects 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 208000006673 asthma Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 229960000106 biosimilars Drugs 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- AHMIRVCNZZUANP-LPBAWZRYSA-N chrysalin Chemical compound CC(O)=O.CC(O)=O.C([C@@H](C(=O)N[C@@H](C(C)C)C(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](C)N)C1=CC=CC=C1.C([C@@H](C(=O)N[C@@H](C(C)C)C(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](C)N)C1=CC=CC=C1.C([C@@H](C(=O)N[C@@H](C(C)C)C(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](C)N)C1=CC=CC=C1 AHMIRVCNZZUANP-LPBAWZRYSA-N 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000010924 continuous production Methods 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- 238000009295 crossflow filtration Methods 0.000 description 2
- 108010042566 davunetide Proteins 0.000 description 2
- DWLTUUXCVGVRAV-XWRHUKJGSA-N davunetide Chemical compound N([C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)C(=O)[C@@H]1CCCN1C(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O DWLTUUXCVGVRAV-XWRHUKJGSA-N 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 108010054812 diprotin A Proteins 0.000 description 2
- 229960000403 etanercept Drugs 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 229960001519 exenatide Drugs 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 210000005256 gram-negative cell Anatomy 0.000 description 2
- 210000005255 gram-positive cell Anatomy 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- HHXHVIJIIXKSOE-QILQGKCVSA-N histrelin Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC(N=C1)=CN1CC1=CC=CC=C1 HHXHVIJIIXKSOE-QILQGKCVSA-N 0.000 description 2
- 229960002193 histrelin Drugs 0.000 description 2
- 108700020746 histrelin Proteins 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 238000002513 implantation Methods 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- GFIJNRVAKGFPGQ-LIJARHBVSA-N leuprolide Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC1=CC=C(O)C=C1 GFIJNRVAKGFPGQ-LIJARHBVSA-N 0.000 description 2
- 229960004338 leuprorelin Drugs 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 229940124735 malaria vaccine Drugs 0.000 description 2
- 229910052748 manganese Inorganic materials 0.000 description 2
- 239000011572 manganese Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229960002566 papillomavirus vaccine Drugs 0.000 description 2
- 229960001319 parathyroid hormone Drugs 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000005191 phase separation Methods 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 238000011533 pre-incubation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000013587 production medium Substances 0.000 description 2
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 108010018091 rusalatide acetate Proteins 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- 239000010935 stainless steel Substances 0.000 description 2
- 229910001220 stainless steel Inorganic materials 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- IHBMMJGTJFPEQY-UHFFFAOYSA-N sulfanylidene(sulfanylidenestibanylsulfanyl)stibane Chemical compound S=[Sb]S[Sb]=S IHBMMJGTJFPEQY-UHFFFAOYSA-N 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- ZKKBZMXTFBAQLP-INNXVHPBSA-N z44m8u8y9a Chemical compound C([C@H](C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CCCCN)C(=O)N[C@H](C(C)C)C(=O)N[C@H](C)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CC=1C=CC=CC=1)C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](C)C(=O)N[C@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](CC=1C=CC=CC=1)NC(=O)[C@@H](C)NC(=O)[C@@H](CCCCN)NC(=O)[C@@H](CC=1C=CC=CC=1)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](CC(O)=O)NC(C)=O)C1=CC=C(O)C=C1 ZKKBZMXTFBAQLP-INNXVHPBSA-N 0.000 description 2
- JNTMAZFVYNDPLB-PEDHHIEDSA-N (2S,3S)-2-[[[(2S)-1-[(2S,3S)-2-amino-3-methyl-1-oxopentyl]-2-pyrrolidinyl]-oxomethyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNTMAZFVYNDPLB-PEDHHIEDSA-N 0.000 description 1
- SFGFYNXPJMOUHK-PKAFTLKUSA-N (2r)-2-[[(2r)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]-n-[(2r)-1-[[(2r)-1-[[(2r)-1-[[(2r)-1-[[(2r)-1-[[(2r)-1-[[2-[[(2r)-1-amino-3-(4-hydroxyphenyl)-1-oxopropan-2-yl]amino]-2-oxoethyl]amino]-1-oxohexan-2-yl]amino]-1-oxohexan-2-yl]amino]-1-oxohe Chemical compound NC(N)=NCCC[C@@H](N)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCN=C(N)N)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCC)C(=O)N[C@H](CCCC)C(=O)NCC(=O)N[C@@H](C(N)=O)CC1=CC=C(O)C=C1 SFGFYNXPJMOUHK-PKAFTLKUSA-N 0.000 description 1
- NOENHWMKHNSHGX-IZOOSHNJSA-N (2s)-1-[(2s)-2-[[(2s)-2-[[(2r)-2-[[(2r)-2-[[(2s)-2-[[(2r)-2-[[(2s)-2-[[(2r)-2-acetamido-3-naphthalen-2-ylpropanoyl]amino]-3-(4-chlorophenyl)propanoyl]amino]-3-pyridin-3-ylpropanoyl]amino]-3-hydroxypropanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-6-(ca Chemical compound C([C@H](C(=O)N[C@H](CCCCNC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCNC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@H](C)C(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](CC=1C=NC=CC=1)NC(=O)[C@H](CC=1C=CC(Cl)=CC=1)NC(=O)[C@@H](CC=1C=C2C=CC=CC2=CC=1)NC(C)=O)C1=CC=C(O)C=C1 NOENHWMKHNSHGX-IZOOSHNJSA-N 0.000 description 1
- KATZUZNTRINHDT-HALMFYTRSA-N (2s)-1-[(2s)-2-[[(2s)-2-[[(2r)-2-[[(2s)-2-[[(2s)-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-acetamido-3-naphthalen-2-ylpropanoyl]amino]-3-(4-chlorophenyl)propanoyl]amino]-3-pyridin-3-ylpropanoyl]amino]-3-hydroxypropanoyl]-methylamino]-3-(4-hydroxyphenyl)propanoyl]amino Chemical compound C([C@@H](C(=O)N[C@H](CCCCNC(N)=O)C(=O)N[C@@H](CCCC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@H](C)C(N)=O)N(C)C(=O)[C@H](CO)NC(=O)[C@@H](CC=1C=NC=CC=1)NC(=O)[C@@H](CC=1C=CC(Cl)=CC=1)NC(=O)[C@@H](CC=1C=C2C=CC=CC2=CC=1)NC(C)=O)C1=CC=C(O)C=C1 KATZUZNTRINHDT-HALMFYTRSA-N 0.000 description 1
- RIWLPSIAFBLILR-WVNGMBSFSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-[[(2s)-2-[[(2s,3r)-2-[[(2r,3s)-2-[[(2s)-2-[[2-[[2-[acetyl(methyl)amino]acetyl]amino]acetyl]amino]-3-methylbutanoyl]amino]-3-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]pentanoyl]amino]-3-methylpentanoyl]amino]-5-(diaminomethy Chemical compound CC(=O)N(C)CC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@H]1C(=O)NCC RIWLPSIAFBLILR-WVNGMBSFSA-N 0.000 description 1
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- CUCSSYAUKKIDJV-FAXBSAIASA-N (2s)-2-[[(2r)-2-[[(2s)-2-[[(2r)-2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1h-indol-3-yl)propanoyl]-methylamino]-3-phenylpropanoyl]amino]-3-(1h-indol-3-yl)propanoyl]amino]-n-[(2s)-1-amino-4-methylsulfanyl-1-oxobutan-2-yl]-4-methylpent Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)N(C)C(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)CCCN=C(N)N)C1=CC=CC=C1 CUCSSYAUKKIDJV-FAXBSAIASA-N 0.000 description 1
- MMHDBUJXLOFTLC-WOYTXXSLSA-N (2s)-2-[[(2r)-2-[[(2s)-2-[[(2s)-2-[[(2s)-1-acetylpyrrolidine-2-carbonyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-hydroxypropanoyl]amino]-3-sulfanylpropanoyl]amino]butanediamide Chemical compound CC(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(N)=O)CC1=CN=CN1 MMHDBUJXLOFTLC-WOYTXXSLSA-N 0.000 description 1
- LPKPGXJXCZNDJO-JYJNAYRXSA-N (2s)-2-[[(2s)-1-[(2s)-6-amino-2-[(2-aminoacetyl)-ethylamino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCCCC[C@H](N(CC)C(=O)CN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LPKPGXJXCZNDJO-JYJNAYRXSA-N 0.000 description 1
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- HZWWPUTXBJEENE-YFNVTMOMSA-N (2s)-5-amino-2-[[(2s)-1-[(2s)-5-amino-2-[[(2s)-1-[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoic acid Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 HZWWPUTXBJEENE-YFNVTMOMSA-N 0.000 description 1
- RVWNMGKSNGWLOL-GIIHNPQRSA-N (2s)-6-amino-2-[[(2r)-2-[[(2s)-2-[[(2s)-2-[[(2r)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(2-methyl-1h-indol-3-yl)propanoyl]amino]propanoyl]amino]-3-(1h-indol-3-yl)propanoyl]amino]-3-phenylpropanoyl]amino]hexanamide Chemical compound C([C@H](N)C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CN=CN1 RVWNMGKSNGWLOL-GIIHNPQRSA-N 0.000 description 1
- WZJRQXZSYQYFJV-QAXVQDKQSA-N (2s)-6-amino-2-[[(2s)-1-[(2s,3s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s,3r)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-1-[(2s)-2-[[(2s)-2-[[(2s)-2-amino-4-carboxybutanoyl]amino]propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-car Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O)[C@@H](C)O)C1=CC=CC=C1 WZJRQXZSYQYFJV-QAXVQDKQSA-N 0.000 description 1
- YQINXCSNGCDFCQ-CMOCDZPBSA-N (3s,4s,12s,13s)-3,4,12,13-tetrahydronaphtho[1,2-b]phenanthrene-3,4,12,13-tetrol Chemical compound C1([C@H](O)[C@H]2O)=CC=CC=C1C1=C2C=C2C(C=C[C@@H]([C@H]3O)O)=C3C=CC2=C1 YQINXCSNGCDFCQ-CMOCDZPBSA-N 0.000 description 1
- JDKLPDJLXHXHNV-MFVUMRCOSA-N (3s,6s,9r,12s,15s,23s)-15-[[(2s)-2-acetamidohexanoyl]amino]-9-benzyl-6-[3-(diaminomethylideneamino)propyl]-12-(1h-imidazol-5-ylmethyl)-3-(1h-indol-3-ylmethyl)-2,5,8,11,14,17-hexaoxo-1,4,7,10,13,18-hexazacyclotricosane-23-carboxamide Chemical compound C([C@@H]1C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCNC(=O)C[C@@H](C(N[C@@H](CC=2NC=NC=2)C(=O)N1)=O)NC(=O)[C@@H](NC(C)=O)CCCC)C(N)=O)C1=CC=CC=C1 JDKLPDJLXHXHNV-MFVUMRCOSA-N 0.000 description 1
- ONKCBKDTKZIWHZ-MRWFHJSOSA-N (4r)-4-[[(2r)-6-amino-2-[[(2r)-2-[[4-(aminocarbamothioylamino)benzoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]hexanoyl]amino]-5-[[(2r)-1-amino-6-[bis[2-[[4-[2-(1h-imidazol-5-yl)ethylamino]-4-oxobutanoyl]amino]acetyl]amino]-1-oxohexan-2-yl]amino]-5-oxope Chemical compound C([C@H](C(=O)N[C@H](CCCCN)C(=O)N[C@H](CCC(O)=O)C(=O)N[C@H](CCCCN(C(=O)CNC(=O)CCC(=O)NCCC=1NC=NC=1)C(=O)CNC(=O)CCC(=O)NCCC=1NC=NC=1)C(N)=O)NC(=O)C=1C=CC(NC(=S)NN)=CC=1)C1=CC=C(O)C=C1 ONKCBKDTKZIWHZ-MRWFHJSOSA-N 0.000 description 1
- SNAJPQVDGYDQSW-DYCFWDQMSA-N (4r,7s,10r,13s,16r)-7-(4-aminobutyl)-n-[(2s,3r)-1-amino-3-hydroxy-1-oxobutan-2-yl]-16-[[(2r)-2-amino-3-phenylpropanoyl]amino]-13-[(4-hydroxyphenyl)methyl]-10-(1h-indol-3-ylmethyl)-6,9,12,15-tetraoxo-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxami Chemical compound C([C@@H](N)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC1=O)C(=O)N[C@@H]([C@H](O)C)C(N)=O)C1=CC=CC=C1 SNAJPQVDGYDQSW-DYCFWDQMSA-N 0.000 description 1
- DEQANNDTNATYII-OULOTJBUSA-N (4r,7s,10s,13r,16s,19r)-10-(4-aminobutyl)-19-[[(2r)-2-amino-3-phenylpropanoyl]amino]-16-benzyl-n-[(2r,3r)-1,3-dihydroxybutan-2-yl]-7-[(1r)-1-hydroxyethyl]-13-(1h-indol-3-ylmethyl)-6,9,12,15,18-pentaoxo-1,2-dithia-5,8,11,14,17-pentazacycloicosane-4-carboxa Chemical compound C([C@@H](N)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC=2C=CC=CC=2)NC1=O)C(=O)N[C@H](CO)[C@H](O)C)C1=CC=CC=C1 DEQANNDTNATYII-OULOTJBUSA-N 0.000 description 1
- SWXOGPJRIDTIRL-DOUNNPEJSA-N (4r,7s,10s,13r,16s,19r)-10-(4-aminobutyl)-n-[(2s)-1-amino-3-(1h-indol-3-yl)-1-oxopropan-2-yl]-19-[[(2r)-2-amino-3-phenylpropanoyl]amino]-16-[(4-hydroxyphenyl)methyl]-13-(1h-indol-3-ylmethyl)-6,9,12,15,18-pentaoxo-7-propan-2-yl-1,2-dithia-5,8,11,14,17-pent Chemical compound C([C@H]1C(=O)N[C@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](N)CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(N)=O)=O)C(C)C)C1=CC=C(O)C=C1 SWXOGPJRIDTIRL-DOUNNPEJSA-N 0.000 description 1
- PUDHBTGHUJUUFI-SCTWWAJVSA-N (4r,7s,10s,13r,16s,19r)-10-(4-aminobutyl)-n-[(2s,3r)-1-amino-3-hydroxy-1-oxobutan-2-yl]-19-[[(2r)-2-amino-3-naphthalen-2-ylpropanoyl]amino]-16-[(4-hydroxyphenyl)methyl]-13-(1h-indol-3-ylmethyl)-6,9,12,15,18-pentaoxo-7-propan-2-yl-1,2-dithia-5,8,11,14,17-p Chemical compound C([C@H]1C(=O)N[C@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](N)CC=1C=C2C=CC=CC2=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(N)=O)=O)C(C)C)C1=CC=C(O)C=C1 PUDHBTGHUJUUFI-SCTWWAJVSA-N 0.000 description 1
- PHEWVCZHSBTZFX-DBCSJUPNSA-N (4s)-4-[[2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-4-carboxybutanoyl]amino]pro Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 PHEWVCZHSBTZFX-DBCSJUPNSA-N 0.000 description 1
- HMLGSIZOMSVISS-ONJSNURVSA-N (7r)-7-[[(2z)-2-(2-amino-1,3-thiazol-4-yl)-2-(2,2-dimethylpropanoyloxymethoxyimino)acetyl]amino]-3-ethenyl-8-oxo-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylic acid Chemical compound N([C@@H]1C(N2C(=C(C=C)CSC21)C(O)=O)=O)C(=O)\C(=N/OCOC(=O)C(C)(C)C)C1=CSC(N)=N1 HMLGSIZOMSVISS-ONJSNURVSA-N 0.000 description 1
- YKGRXSLQYRREKO-DFOPOJAZSA-N 101380-54-5 Chemical compound C([C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)C1=CC=CC=C1 YKGRXSLQYRREKO-DFOPOJAZSA-N 0.000 description 1
- VZVNFRFMDNFPOM-VWLOTQADSA-N 2-(diethylamino)ethyl (2s)-2-[(2-chloro-6-methylbenzoyl)amino]-3-[4-[(2,6-dichlorobenzoyl)amino]phenyl]propanoate Chemical compound C([C@@H](C(=O)OCCN(CC)CC)NC(=O)C=1C(=CC=CC=1C)Cl)C(C=C1)=CC=C1NC(=O)C1=C(Cl)C=CC=C1Cl VZVNFRFMDNFPOM-VWLOTQADSA-N 0.000 description 1
- XBBVURRQGJPTHH-UHFFFAOYSA-N 2-hydroxyacetic acid;2-hydroxypropanoic acid Chemical compound OCC(O)=O.CC(O)C(O)=O XBBVURRQGJPTHH-UHFFFAOYSA-N 0.000 description 1
- 101710149439 20 kDa chaperonin, chloroplastic Proteins 0.000 description 1
- XZKIHKMTEMTJQX-UHFFFAOYSA-N 4-Nitrophenyl Phosphate Chemical compound OP(O)(=O)OC1=CC=C([N+]([O-])=O)C=C1 XZKIHKMTEMTJQX-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- DEZJGRPRBZSAKI-KMGSDFBDSA-N 565434-85-7 Chemical compound C([C@@H](N)C(=O)N[C@H](CO)C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@H](CO)C(=O)N[C@H](CC=1C(=C(F)C(F)=C(F)C=1F)F)C(=O)N[C@H](CC1CCCCC1)C(=O)N[C@H](CCCNC(N)=N)C(=O)N[C@H](CCCNC(N)=N)C(=O)N[C@H](CCCNC(N)=N)C(=O)N[C@H](CCC(N)=O)C(=O)N[C@H](CCCNC(N)=N)C(=O)N[C@H](CCCNC(N)=N)C(O)=O)C(C=C1)=CC=C1C(=O)C1=CC=CC=C1 DEZJGRPRBZSAKI-KMGSDFBDSA-N 0.000 description 1
- 108010077593 ACE-011 Proteins 0.000 description 1
- 229940023859 AIDSVAX Drugs 0.000 description 1
- 108010093583 ART123 Proteins 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 241000259810 Acremonium thermophilum Species 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 1
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- VEAPAYQQLSEKEM-GUBZILKMSA-N Ala-Met-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VEAPAYQQLSEKEM-GUBZILKMSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- HIIJOGIBQXHFKE-HHKYUTTNSA-N Ala-Thr-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O HIIJOGIBQXHFKE-HHKYUTTNSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 1
- 240000001592 Amaranthus caudatus Species 0.000 description 1
- 235000009328 Amaranthus caudatus Nutrition 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 241000611184 Amphora Species 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 208000028185 Angioedema Diseases 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 108010064733 Angiotensins Proteins 0.000 description 1
- 102000015427 Angiotensins Human genes 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- VYSRNGOMGHOJCK-GUBZILKMSA-N Arg-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N VYSRNGOMGHOJCK-GUBZILKMSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- XTGGTAWGUFXJSV-NAKRPEOUSA-N Arg-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N XTGGTAWGUFXJSV-NAKRPEOUSA-N 0.000 description 1
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- 240000002900 Arthrospira platensis Species 0.000 description 1
- 235000016425 Arthrospira platensis Nutrition 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 1
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 1
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- CUQUEHYSSFETRD-ACZMJKKPSA-N Asn-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N CUQUEHYSSFETRD-ACZMJKKPSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- KWQPAXYXVMHJJR-AVGNSLFASA-N Asn-Gln-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KWQPAXYXVMHJJR-AVGNSLFASA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 1
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- SXNJBDYEBOUYOJ-DCAQKATOSA-N Asn-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N SXNJBDYEBOUYOJ-DCAQKATOSA-N 0.000 description 1
- KMCRKVOLRCOMBG-DJFWLOJKSA-N Asn-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KMCRKVOLRCOMBG-DJFWLOJKSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- QDXQWFBLUVTOFL-FXQIFTODSA-N Asn-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)N)N QDXQWFBLUVTOFL-FXQIFTODSA-N 0.000 description 1
- KSGAFDTYQPKUAP-GMOBBJLQSA-N Asn-Met-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KSGAFDTYQPKUAP-GMOBBJLQSA-N 0.000 description 1
- NNDSLVWAQAUPPP-GUBZILKMSA-N Asn-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N NNDSLVWAQAUPPP-GUBZILKMSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- ZVUMKOMKQCANOM-AVGNSLFASA-N Asn-Phe-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVUMKOMKQCANOM-AVGNSLFASA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- FHCRKXCTKSHNOE-QEJZJMRPSA-N Asn-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FHCRKXCTKSHNOE-QEJZJMRPSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 1
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 1
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- AMRANMVXQWXNAH-ZLUOBGJFSA-N Asp-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O AMRANMVXQWXNAH-ZLUOBGJFSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 1
- SPKRHJOVRVDJGG-CIUDSAMLSA-N Asp-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SPKRHJOVRVDJGG-CIUDSAMLSA-N 0.000 description 1
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 1
- SAKCBXNPWDRWPE-BQBZGAKWSA-N Asp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N SAKCBXNPWDRWPE-BQBZGAKWSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- LGGHQRZIJSYRHA-GUBZILKMSA-N Asp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N LGGHQRZIJSYRHA-GUBZILKMSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- OFYVKOXTTDCUIL-FXQIFTODSA-N Asp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OFYVKOXTTDCUIL-FXQIFTODSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- RMFITHMDQGFSDC-UBHSHLNASA-N Asp-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RMFITHMDQGFSDC-UBHSHLNASA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 108010028845 BIM 23190 Proteins 0.000 description 1
- 108700001281 BIM 51077 Proteins 0.000 description 1
- 239000010755 BS 2869 Class G Substances 0.000 description 1
- 241001467606 Bacillariophyceae Species 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 241000276408 Bacillus subtilis subsp. subtilis str. 168 Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 102100033949 Basic salivary proline-rich protein 3 Human genes 0.000 description 1
- 108010081589 Becaplermin Proteins 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 102100035687 Bile salt-activated lipase Human genes 0.000 description 1
- 208000020084 Bone disease Diseases 0.000 description 1
- 101710117542 Botulinum neurotoxin type A Proteins 0.000 description 1
- 101800000407 Brain natriuretic peptide 32 Proteins 0.000 description 1
- 108091005932 CCKBR Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 108010048913 CTCE-0214 Proteins 0.000 description 1
- 108010053045 CTCE-9908 Proteins 0.000 description 1
- 108010004480 CTP37 peptide Proteins 0.000 description 1
- 101100283604 Caenorhabditis elegans pigk-1 gene Proteins 0.000 description 1
- 102100038518 Calcitonin Human genes 0.000 description 1
- 108090000932 Calcitonin Gene-Related Peptide Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 101100348617 Candida albicans (strain SC5314 / ATCC MYA-2876) NIK1 gene Proteins 0.000 description 1
- 101100166113 Candida albicans (strain SC5314 / ATCC MYA-2876) SAP9 gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 108010089388 Cdc25C phosphatase (211-221) Proteins 0.000 description 1
- 241000221955 Chaetomium Species 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 108010089448 Cholecystokinin B Receptor Proteins 0.000 description 1
- 101710177832 Co-chaperonin GroES Proteins 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 241001429695 Colletotrichum graminicola Species 0.000 description 1
- 206010010071 Coma Diseases 0.000 description 1
- 101000944206 Conus geographus Conantokin-G Proteins 0.000 description 1
- 108700033646 Conus geographus contulakin-G Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000190633 Cordyceps Species 0.000 description 1
- 241001264174 Cordyceps militaris Species 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241001503016 Ctenomyces Species 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 1
- KIQKJXYVGSYDFS-ZLUOBGJFSA-N Cys-Asn-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KIQKJXYVGSYDFS-ZLUOBGJFSA-N 0.000 description 1
- GSNRZJNHMVMOFV-ACZMJKKPSA-N Cys-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N GSNRZJNHMVMOFV-ACZMJKKPSA-N 0.000 description 1
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 1
- LHMSYHSAAJOEBL-CIUDSAMLSA-N Cys-Lys-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O LHMSYHSAAJOEBL-CIUDSAMLSA-N 0.000 description 1
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 1
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- JIVJQYNNAYFXDG-LKXGYXEUSA-N Cys-Thr-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JIVJQYNNAYFXDG-LKXGYXEUSA-N 0.000 description 1
- LLUXQOVDMQZMPJ-KKUMJFAQSA-N Cys-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CS)CC1=CC=C(O)C=C1 LLUXQOVDMQZMPJ-KKUMJFAQSA-N 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 108010068294 CytoFab Proteins 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010049954 DRF 7295 Proteins 0.000 description 1
- 108010013198 Daptomycin Proteins 0.000 description 1
- 108010019673 Darbepoetin alfa Proteins 0.000 description 1
- 108010000437 Deamino Arginine Vasopressin Proteins 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- GJKXGJCSJWBJEZ-XRSSZCMZSA-N Deslorelin Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1NC(=O)CC1)CC1=CNC2=CC=CC=C12 GJKXGJCSJWBJEZ-XRSSZCMZSA-N 0.000 description 1
- 108010057987 Desmodus rotundus salivary plasminogen activator alpha 1 Proteins 0.000 description 1
- 208000008960 Diabetic foot Diseases 0.000 description 1
- 102100031245 Disks large-associated protein 2 Human genes 0.000 description 1
- 101150020562 Dlgap2 gene Proteins 0.000 description 1
- 241000195634 Dunaliella Species 0.000 description 1
- 101710140859 E3 ubiquitin ligase TRAF3IP2 Proteins 0.000 description 1
- 102100026620 E3 ubiquitin ligase TRAF3IP2 Human genes 0.000 description 1
- 108010003953 EP-2104R Proteins 0.000 description 1
- 108010040545 ETC 642 Proteins 0.000 description 1
- 108010016695 ETC216 Proteins 0.000 description 1
- 108010015972 Elafin Proteins 0.000 description 1
- 102100023795 Elafin Human genes 0.000 description 1
- 102400001047 Endostatin Human genes 0.000 description 1
- 108010079505 Endostatins Proteins 0.000 description 1
- 108010032976 Enfuvirtide Proteins 0.000 description 1
- 108010074604 Epoetin Alfa Proteins 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 108010071289 Factor XIII Proteins 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- 238000012366 Fed-batch cultivation Methods 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 240000008168 Ficus benjamina Species 0.000 description 1
- 108010029961 Filgrastim Proteins 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 108010027258 GEM 21S Proteins 0.000 description 1
- 108010003795 GW002 peptide Proteins 0.000 description 1
- 102000052874 Gastrin receptors Human genes 0.000 description 1
- 102100036016 Gastrin/cholecystokinin type B receptor Human genes 0.000 description 1
- 241000206672 Gelidium Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000159512 Geotrichum Species 0.000 description 1
- 241000178290 Geotrichum fermentans Species 0.000 description 1
- 108010072051 Glatiramer Acetate Proteins 0.000 description 1
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- DLOHWQXXGMEZDW-CIUDSAMLSA-N Gln-Arg-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DLOHWQXXGMEZDW-CIUDSAMLSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- QQAPDATZKKTBIY-YUMQZZPRSA-N Gln-Gly-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O QQAPDATZKKTBIY-YUMQZZPRSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 1
- DWDBJWAXPXXYLP-SRVKXCTJSA-N Gln-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DWDBJWAXPXXYLP-SRVKXCTJSA-N 0.000 description 1
- NROSLUJMIQGFKS-IUCAKERBSA-N Gln-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N NROSLUJMIQGFKS-IUCAKERBSA-N 0.000 description 1
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- ICDIMQAMJGDHSE-GUBZILKMSA-N Gln-His-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O ICDIMQAMJGDHSE-GUBZILKMSA-N 0.000 description 1
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- KHNJVFYHIKLUPD-SRVKXCTJSA-N Gln-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHNJVFYHIKLUPD-SRVKXCTJSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 1
- MSHXWFKYXJTLEZ-CIUDSAMLSA-N Gln-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MSHXWFKYXJTLEZ-CIUDSAMLSA-N 0.000 description 1
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 1
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 1
- YGNPTRVNRUKVLA-DCAQKATOSA-N Gln-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N YGNPTRVNRUKVLA-DCAQKATOSA-N 0.000 description 1
- LVRKAFPPFJRIOF-GARJFASQSA-N Gln-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N LVRKAFPPFJRIOF-GARJFASQSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- HPBKQFJXDUVNQV-FHWLQOOXSA-N Gln-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O HPBKQFJXDUVNQV-FHWLQOOXSA-N 0.000 description 1
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- 241001620302 Glomerella <beetle> Species 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 1
- CJWANNXUTOATSJ-DCAQKATOSA-N Glu-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N CJWANNXUTOATSJ-DCAQKATOSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- XOIATPHFYVWFEU-DCAQKATOSA-N Glu-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOIATPHFYVWFEU-DCAQKATOSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 1
- UMHRCVCZUPBBQW-GARJFASQSA-N Glu-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UMHRCVCZUPBBQW-GARJFASQSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- GTFYQOVVVJASOA-ACZMJKKPSA-N Glu-Ser-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N GTFYQOVVVJASOA-ACZMJKKPSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108091052347 Glucose transporter family Proteins 0.000 description 1
- 102000042092 Glucose transporter family Human genes 0.000 description 1
- 102100037473 Glutathione S-transferase A1 Human genes 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- 108010050006 Gly-Asp-Gly-Arg Proteins 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- YZPVGIVFMZLQMM-YUMQZZPRSA-N Gly-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN YZPVGIVFMZLQMM-YUMQZZPRSA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- UUWOBINZFGTFMS-UWVGGRQHSA-N Gly-His-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O UUWOBINZFGTFMS-UWVGGRQHSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- IFHJOBKVXBESRE-YUMQZZPRSA-N Gly-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN IFHJOBKVXBESRE-YUMQZZPRSA-N 0.000 description 1
- RUDRIZRGOLQSMX-IUCAKERBSA-N Gly-Met-Met Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O RUDRIZRGOLQSMX-IUCAKERBSA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 1
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- CATMPQFFVNKDEY-YPMHNXCESA-N Golotimod Chemical compound C1=CC=C2C(C[C@H](NC(=O)CC[C@@H](N)C(O)=O)C(O)=O)=CNC2=C1 CATMPQFFVNKDEY-YPMHNXCESA-N 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 102000018997 Growth Hormone Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 108010030158 HBOC 201 Proteins 0.000 description 1
- 229940033330 HIV vaccine Drugs 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- CIWILNZNBPIHEU-DCAQKATOSA-N His-Arg-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O CIWILNZNBPIHEU-DCAQKATOSA-N 0.000 description 1
- CJGDTAHEMXLRMB-ULQDDVLXSA-N His-Arg-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CJGDTAHEMXLRMB-ULQDDVLXSA-N 0.000 description 1
- FPNWKONEZAVQJF-GUBZILKMSA-N His-Asn-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FPNWKONEZAVQJF-GUBZILKMSA-N 0.000 description 1
- VOKCBYNCZVSILJ-KKUMJFAQSA-N His-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O VOKCBYNCZVSILJ-KKUMJFAQSA-N 0.000 description 1
- WCNXUTNLSRWWQN-DCAQKATOSA-N His-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WCNXUTNLSRWWQN-DCAQKATOSA-N 0.000 description 1
- LBHOVGUGOBINDL-KKUMJFAQSA-N His-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O LBHOVGUGOBINDL-KKUMJFAQSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- FLYSHWAAHYNKRT-JYJNAYRXSA-N His-Gln-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLYSHWAAHYNKRT-JYJNAYRXSA-N 0.000 description 1
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 1
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 1
- YXASFUBDSDAXQD-UWVGGRQHSA-N His-Met-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O YXASFUBDSDAXQD-UWVGGRQHSA-N 0.000 description 1
- KQJBFMJFUXAYPK-AVGNSLFASA-N His-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KQJBFMJFUXAYPK-AVGNSLFASA-N 0.000 description 1
- RLAOTFTXBFQJDV-KKUMJFAQSA-N His-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CN=CN1 RLAOTFTXBFQJDV-KKUMJFAQSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 1
- WSXNWASHQNSMRX-GVXVVHGQSA-N His-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSXNWASHQNSMRX-GVXVVHGQSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001068638 Homo sapiens Basic salivary proline-rich protein 3 Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101500025419 Homo sapiens Epidermal growth factor Proteins 0.000 description 1
- 101001026125 Homo sapiens Glutathione S-transferase A1 Proteins 0.000 description 1
- 101000977692 Homo sapiens Iroquois-class homeodomain protein IRX-6 Proteins 0.000 description 1
- 101000798114 Homo sapiens Lactotransferrin Proteins 0.000 description 1
- 101001063991 Homo sapiens Leptin Proteins 0.000 description 1
- 101000578784 Homo sapiens Melanoma antigen recognized by T-cells 1 Proteins 0.000 description 1
- 101000589316 Homo sapiens N-cym protein Proteins 0.000 description 1
- 101001135770 Homo sapiens Parathyroid hormone Proteins 0.000 description 1
- 101001135995 Homo sapiens Probable peptidyl-tRNA hydrolase Proteins 0.000 description 1
- 101000797990 Homo sapiens Putative activator of 90 kDa heat shock protein ATPase homolog 2 Proteins 0.000 description 1
- 208000035533 House dust allergy Diseases 0.000 description 1
- 241000702617 Human parvovirus B19 Species 0.000 description 1
- RKUNBYITZUJHSG-UHFFFAOYSA-N Hyosciamin-hydrochlorid Natural products CN1C(C2)CCC1CC2OC(=O)C(CO)C1=CC=CC=C1 RKUNBYITZUJHSG-UHFFFAOYSA-N 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 108010043766 IRX 2 Proteins 0.000 description 1
- 102100029199 Iduronate 2-sulfatase Human genes 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- JQLFYZMEXFNRFS-DJFWLOJKSA-N Ile-Asp-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N JQLFYZMEXFNRFS-DJFWLOJKSA-N 0.000 description 1
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 1
- LWWILHPVAKKLQS-QXEWZRGKSA-N Ile-Gly-Met Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N LWWILHPVAKKLQS-QXEWZRGKSA-N 0.000 description 1
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 1
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- KLJKJVXDHVUMMZ-KKPKCPPISA-N Ile-Phe-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N KLJKJVXDHVUMMZ-KKPKCPPISA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- CZWANIQKACCEKW-CYDGBPFRSA-N Ile-Pro-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N CZWANIQKACCEKW-CYDGBPFRSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 108010073961 Insulin Aspart Proteins 0.000 description 1
- 108010057186 Insulin Glargine Proteins 0.000 description 1
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 102100039350 Interferon alpha-7 Human genes 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 102000051628 Interleukin-1 receptor antagonist Human genes 0.000 description 1
- 108700021006 Interleukin-1 receptor antagonist Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 102000004388 Interleukin-4 Human genes 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 102100023527 Iroquois-class homeodomain protein IRX-6 Human genes 0.000 description 1
- 102100037691 Kinesin-like protein KIF20B Human genes 0.000 description 1
- 108050007394 Kinesin-like protein KIF20B Proteins 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 108010063045 Lactoferrin Proteins 0.000 description 1
- 102100032241 Lactotransferrin Human genes 0.000 description 1
- 108010062867 Lenograstim Proteins 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- POMXSEDNUXYPGK-IHRRRGAJSA-N Leu-Met-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N POMXSEDNUXYPGK-IHRRRGAJSA-N 0.000 description 1
- FZMNAYBEFGZEIF-AVGNSLFASA-N Leu-Met-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N FZMNAYBEFGZEIF-AVGNSLFASA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- XVVOERDUTLJJHN-UHFFFAOYSA-N Lixisenatide Chemical compound C=1NC2=CC=CC=C2C=1CC(C(=O)NC(CC(C)C)C(=O)NC(CCCCN)C(=O)NC(CC(N)=O)C(=O)NCC(=O)NCC(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CO)C(=O)NCC(=O)NC(C)C(=O)N1C(CCC1)C(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)CC)NC(=O)C(NC(=O)C(CC(C)C)NC(=O)C(CCCNC(N)=N)NC(=O)C(NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCSC)NC(=O)C(CCC(N)=O)NC(=O)C(CCCCN)NC(=O)C(CO)NC(=O)C(CC(C)C)NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(NC(=O)C(CC=1C=CC=CC=1)NC(=O)C(NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)CNC(=O)C(N)CC=1NC=NC=1)C(C)O)C(C)O)C(C)C)CC1=CC=CC=C1 XVVOERDUTLJJHN-UHFFFAOYSA-N 0.000 description 1
- 108010073521 Luteinizing Hormone Proteins 0.000 description 1
- 102000009151 Luteinizing Hormone Human genes 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- RDIILCRAWOSDOQ-CIUDSAMLSA-N Lys-Cys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RDIILCRAWOSDOQ-CIUDSAMLSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- CKSBRMUOQDNPKZ-SRVKXCTJSA-N Lys-Gln-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CKSBRMUOQDNPKZ-SRVKXCTJSA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- KFSALEZVQJYHCE-AVGNSLFASA-N Lys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N KFSALEZVQJYHCE-AVGNSLFASA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 108010016230 MBP-8298 Proteins 0.000 description 1
- 108010074954 MP4 maleimide-polyethylene glycol-modified hemoglobin Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241001330975 Magnaporthe oryzae Species 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 102100022430 Melanocyte protein PMEL Human genes 0.000 description 1
- 102100028389 Melanoma antigen recognized by T-cells 1 Human genes 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 1
- WDTLNWHPIPCMMP-AVGNSLFASA-N Met-Arg-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O WDTLNWHPIPCMMP-AVGNSLFASA-N 0.000 description 1
- RJEFZSIVBHGRQJ-SRVKXCTJSA-N Met-Arg-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RJEFZSIVBHGRQJ-SRVKXCTJSA-N 0.000 description 1
- DCHHUGLTVLJYKA-FXQIFTODSA-N Met-Asn-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DCHHUGLTVLJYKA-FXQIFTODSA-N 0.000 description 1
- BXNZDLVLGYYFIB-FXQIFTODSA-N Met-Asn-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BXNZDLVLGYYFIB-FXQIFTODSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- DBOMZJOESVYERT-GUBZILKMSA-N Met-Asn-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N DBOMZJOESVYERT-GUBZILKMSA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- FBQMBZLJHOQAIH-GUBZILKMSA-N Met-Asp-Met Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O FBQMBZLJHOQAIH-GUBZILKMSA-N 0.000 description 1
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 1
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 1
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 1
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 1
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 1
- OBCRZLRPJFNLAN-DCAQKATOSA-N Met-His-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OBCRZLRPJFNLAN-DCAQKATOSA-N 0.000 description 1
- DYTWOWJWJCBFLE-IHRRRGAJSA-N Met-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CNC=N1 DYTWOWJWJCBFLE-IHRRRGAJSA-N 0.000 description 1
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 1
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- FMYLZGQFKPHXHI-GUBZILKMSA-N Met-Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O FMYLZGQFKPHXHI-GUBZILKMSA-N 0.000 description 1
- NTYQUVLERIHPMU-HRCADAONSA-N Met-Phe-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N NTYQUVLERIHPMU-HRCADAONSA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 1
- FNYBIOGBMWFQRJ-SRVKXCTJSA-N Met-Pro-Met Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N FNYBIOGBMWFQRJ-SRVKXCTJSA-N 0.000 description 1
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- YFGBQHOOROIVKG-FKBYEOEOSA-N Met-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 YFGBQHOOROIVKG-FKBYEOEOSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 229920001410 Microfiber Polymers 0.000 description 1
- 241000235042 Millerozyma farinosa Species 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 108010056902 Mononine Proteins 0.000 description 1
- 101100268906 Mus musculus Acox1 gene Proteins 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 102100032847 N-cym protein Human genes 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010072915 NAc-Sar-Gly-Val-(d-allo-Ile)-Thr-Nva-Ile-Arg-ProNEt Proteins 0.000 description 1
- 108010083255 NBI6024 Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 229940038430 NY-ESO-1 vaccine Drugs 0.000 description 1
- 241000224474 Nannochloropsis Species 0.000 description 1
- 241001226034 Nectria <echinoderm> Species 0.000 description 1
- 229940122467 Nerve growth factor antagonist Drugs 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100287577 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gpe-1 gene Proteins 0.000 description 1
- 101710138657 Neurotoxin Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 241000199478 Ochromonas Species 0.000 description 1
- 108010016076 Octreotide Proteins 0.000 description 1
- 241001452677 Ogataea methanolica Species 0.000 description 1
- 108010084331 Omiganan Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 206010033078 Otitis media Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 108010027220 PEGylated soluble tumor necrosis factor receptor I Proteins 0.000 description 1
- 101150054516 PRD1 gene Proteins 0.000 description 1
- 101150051118 PTM1 gene Proteins 0.000 description 1
- 108010088847 Peptide YY Proteins 0.000 description 1
- 102100029909 Peptide YY Human genes 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- VLZGUAUYZGQKPM-DRZSPHRISA-N Phe-Gln-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VLZGUAUYZGQKPM-DRZSPHRISA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 1
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- YMTMNYNEZDAGMW-RNXOBYDBSA-N Phe-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YMTMNYNEZDAGMW-RNXOBYDBSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- 108091007643 Phosphate carriers Proteins 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 241000195887 Physcomitrella patens Species 0.000 description 1
- 241001489192 Pichia kluyveri Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 102100040990 Platelet-derived growth factor subunit B Human genes 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- LUGOKRWYNMDGTD-FXQIFTODSA-N Pro-Cys-Asn Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O LUGOKRWYNMDGTD-FXQIFTODSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 1
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 1
- 108700019404 Pro-Gly-Pro- ACTH (4-7) Proteins 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 1
- KLOQCCRTPHPIFN-DCAQKATOSA-N Pro-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 KLOQCCRTPHPIFN-DCAQKATOSA-N 0.000 description 1
- MZNUJZBYRWXWLQ-AVGNSLFASA-N Pro-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 MZNUJZBYRWXWLQ-AVGNSLFASA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 1
- QAAYIXYLEMRULP-SRVKXCTJSA-N Pro-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 QAAYIXYLEMRULP-SRVKXCTJSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 1
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- 101100528525 Prochlorococcus marinus (strain SARG / CCMP1375 / SS120) rnc gene Proteins 0.000 description 1
- 101710180012 Protease 7 Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 229920001218 Pullulan Polymers 0.000 description 1
- 102100032319 Putative activator of 90 kDa heat shock protein ATPase homolog 2 Human genes 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- KGZHFKDNSAEOJX-WIFQYKSHSA-N Ramoplanin Chemical compound C([C@H]1C(=O)N[C@H](CCCN)C(=O)N[C@H](C(=O)N[C@@H](C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C)C(=O)N[C@H](C(=O)O[C@@H]([C@@H](C(N[C@@H](C(=O)N[C@H](CCCN)C(=O)N[C@@H](C(=O)N[C@H](C(=O)N[C@@H](C(=O)N[C@H](C(=O)N1)[C@H](C)O)C=1C=CC(O)=CC=1)C=1C=CC(O)=CC=1)[C@@H](C)O)C=1C=CC(O)=CC=1)=O)NC(=O)[C@H](CC(N)=O)NC(=O)\C=C/C=C/CC(C)C)C(N)=O)C=1C=C(Cl)C(O)=CC=1)C=1C=CC(O)=CC=1)[C@@H](C)O)C=1C=CC(O[C@@H]2[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O[C@@H]2[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)=CC=1)C1=CC=CC=C1 KGZHFKDNSAEOJX-WIFQYKSHSA-N 0.000 description 1
- 229940123452 Rapid-acting insulin Drugs 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101100007329 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS1 gene Proteins 0.000 description 1
- 101100221606 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS7 gene Proteins 0.000 description 1
- 101100062430 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DAP2 gene Proteins 0.000 description 1
- 101100184165 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MKC7 gene Proteins 0.000 description 1
- 101100459905 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NCP1 gene Proteins 0.000 description 1
- 101100420794 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SCJ1 gene Proteins 0.000 description 1
- 101100545005 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YSP3 gene Proteins 0.000 description 1
- 244000253911 Saccharomyces fragilis Species 0.000 description 1
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- UQGAAZXSCGWMFU-UBHSHLNASA-N Ser-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N UQGAAZXSCGWMFU-UBHSHLNASA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- SYCFMSYTIFXWAJ-DCAQKATOSA-N Ser-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N SYCFMSYTIFXWAJ-DCAQKATOSA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010026951 Short-Acting Insulin Proteins 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 102100022831 Somatoliberin Human genes 0.000 description 1
- 101710142969 Somatoliberin Proteins 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 101710145796 Staphylokinase Proteins 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 229940124840 Streptococcal vaccine Drugs 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 101800001271 Surface protein Proteins 0.000 description 1
- 108010028908 TP 9201 Proteins 0.000 description 1
- 108700042805 TRU-015 Proteins 0.000 description 1
- 108010039185 Tenecteplase Proteins 0.000 description 1
- 108010010056 Terlipressin Proteins 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000005764 Theobroma cacao ssp. cacao Nutrition 0.000 description 1
- 235000005767 Theobroma cacao ssp. sphaerocarpum Nutrition 0.000 description 1
- 241001100181 Thermothelomyces heterothallica Species 0.000 description 1
- 241001494489 Thielavia Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- LHNNQVXITHUCAB-QTKMDUPCSA-N Thr-Met-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O LHNNQVXITHUCAB-QTKMDUPCSA-N 0.000 description 1
- UXUAZXWKIGPUCH-RCWTZXSCSA-N Thr-Met-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O UXUAZXWKIGPUCH-RCWTZXSCSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108010078233 Thymalfasin Proteins 0.000 description 1
- 101800001703 Thymopentin Proteins 0.000 description 1
- 102400000160 Thymopentin Human genes 0.000 description 1
- 102400000800 Thymosin alpha-1 Human genes 0.000 description 1
- UGPMCIBIHRSCBV-XNBOLLIBSA-N Thymosin beta 4 Chemical compound N([C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O)C(=O)[C@@H]1CCCN1C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(C)=O UGPMCIBIHRSCBV-XNBOLLIBSA-N 0.000 description 1
- 102100035000 Thymosin beta-4 Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 108010048999 Transcription Factor 3 Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 1
- XSTXAVWGXDQKEL-UHFFFAOYSA-N Trichloroethylene Chemical compound ClC=C(Cl)Cl XSTXAVWGXDQKEL-UHFFFAOYSA-N 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- XNRJFXBORWMIPY-DCPHZVHLSA-N Trp-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XNRJFXBORWMIPY-DCPHZVHLSA-N 0.000 description 1
- DVAAUUVLDFKTAQ-VHWLVUOQSA-N Trp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DVAAUUVLDFKTAQ-VHWLVUOQSA-N 0.000 description 1
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 1
- WCTYCXZYBNKEIV-SXNHZJKMSA-N Trp-Glu-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)=CNC2=C1 WCTYCXZYBNKEIV-SXNHZJKMSA-N 0.000 description 1
- WKQNLTQSCYXKQK-VFAJRCTISA-N Trp-Lys-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WKQNLTQSCYXKQK-VFAJRCTISA-N 0.000 description 1
- JEYRCNVVYHTZMY-SZMVWBNQSA-N Trp-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JEYRCNVVYHTZMY-SZMVWBNQSA-N 0.000 description 1
- CUHBVKUVJIXRFK-DVXDUOKCSA-N Trp-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC=3C4=CC=CC=C4NC=3)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CUHBVKUVJIXRFK-DVXDUOKCSA-N 0.000 description 1
- 101100472152 Trypanosoma brucei brucei (strain 927/4 GUTat10.1) REL1 gene Proteins 0.000 description 1
- CDRYEAWHKJSGAF-BPNCWPANSA-N Tyr-Ala-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O CDRYEAWHKJSGAF-BPNCWPANSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 1
- DXUVJJRTVACXSO-KKUMJFAQSA-N Tyr-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DXUVJJRTVACXSO-KKUMJFAQSA-N 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 1
- XOVDRAVPGHTYLP-JYJNAYRXSA-N Tyr-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O XOVDRAVPGHTYLP-JYJNAYRXSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 1
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 1
- 108010001957 Ularitide Proteins 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- IWZYXFRGWKEKBJ-GVXVVHGQSA-N Val-Gln-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IWZYXFRGWKEKBJ-GVXVVHGQSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- HLBHFAWNMAQGNO-AVGNSLFASA-N Val-His-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N HLBHFAWNMAQGNO-AVGNSLFASA-N 0.000 description 1
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 1
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 1
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 1
- 241001123668 Verticillium dahliae Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 229930003270 Vitamin B Natural products 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 229940029042 WT1 peptide vaccine Drugs 0.000 description 1
- 101150008621 YPS1 gene Proteins 0.000 description 1
- 108010045610 ZT-031 Proteins 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 241000235033 Zygosaccharomyces rouxii Species 0.000 description 1
- QBQHUKKLUVZUBC-MQWQBNKOSA-N [3,5-bis(trifluoromethyl)phenyl]-[(2r)-2-(1h-indol-3-ylmethyl)-4-[[5-(morpholin-4-ylmethyl)-2h-triazol-4-yl]methyl]piperazin-1-yl]methanone;dihydrochloride Chemical compound Cl.Cl.FC(F)(F)C1=CC(C(F)(F)F)=CC(C(=O)N2[C@@H](CN(CC=3C(=NNN=3)CN3CCOCC3)CC2)CC=2C3=CC=CC=C3NC=2)=C1 QBQHUKKLUVZUBC-MQWQBNKOSA-N 0.000 description 1
- 241001231403 [Nectria] haematococca Species 0.000 description 1
- 229960003697 abatacept Drugs 0.000 description 1
- 108010079650 abobotulinumtoxinA Proteins 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- FHEAIOHRHQGZPC-KIWGSFCNSA-N acetic acid;(2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-aminopentanedioic acid;(2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound CC(O)=O.C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CCC(O)=O.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 FHEAIOHRHQGZPC-KIWGSFCNSA-N 0.000 description 1
- 108010052004 acetyl-2-naphthylalanyl-3-chlorophenylalanyl-1-oxohexadecyl-seryl-4-aminophenylalanyl(hydroorotyl)-4-aminophenylalanyl(carbamoyl)-leucyl-ILys-prolyl-alaninamide Proteins 0.000 description 1
- 108010011755 acetyl-prolyl-histidyl-seryl-cysteinyl-asparaginamide Proteins 0.000 description 1
- 229940099550 actimmune Drugs 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- YAJCHEVQCOHZDC-QMMNLEPNSA-N actrapid Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3N=CNC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@H](C)CC)[C@H](C)CC)[C@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C(N)=O)C1=CNC=N1 YAJCHEVQCOHZDC-QMMNLEPNSA-N 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 108700026906 afamelanotide Proteins 0.000 description 1
- UAHFGYDRQSXQEB-LEBBXHLNSA-N afamelanotide Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(N)=O)NC(=O)[C@H](CO)NC(C)=O)C1=CC=C(O)C=C1 UAHFGYDRQSXQEB-LEBBXHLNSA-N 0.000 description 1
- 108091008108 affimer Proteins 0.000 description 1
- 229960004470 agalsidase beta Drugs 0.000 description 1
- 108010056760 agalsidase beta Proteins 0.000 description 1
- 235000010419 agar Nutrition 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 108010080374 albuferon Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 108700025316 aldesleukin Proteins 0.000 description 1
- 229960005310 aldesleukin Drugs 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 229960003318 alteplase Drugs 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 108010070826 amediplase Proteins 0.000 description 1
- 229950011356 amediplase Drugs 0.000 description 1
- UMNFJRNUJIBDSK-NMVZEWDOSA-N aminocandin Chemical compound C1=CC(OCCCCCCCC)=CC=C1C1=CC=C(C(=O)N[C@@H]2C(N[C@H](C(=O)N3C[C@H](O)C[C@H]3C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N3C[C@H](C)[C@H](O)[C@H]3C(=O)NCC(C2)NCCN)[C@H](O)CC=2C=CC(O)=CC=2)[C@@H](C)O)=O)C=C1 UMNFJRNUJIBDSK-NMVZEWDOSA-N 0.000 description 1
- 108010026923 aminocandin Proteins 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 230000001195 anabolic effect Effects 0.000 description 1
- 229960004238 anakinra Drugs 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 108010070670 antarelix Proteins 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010055530 arginyl-tryptophyl-N-methylphenylalanyl-tryptophyl-leucyl-methioninamide Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- VWXRQYYUEIYXCZ-OBIMUBPZSA-N atosiban Chemical compound C1=CC(OCC)=CC=C1C[C@@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CCCN)C(=O)NCC(N)=O)CSSCCC(=O)N1 VWXRQYYUEIYXCZ-OBIMUBPZSA-N 0.000 description 1
- 229960002403 atosiban Drugs 0.000 description 1
- 108700007535 atosiban Proteins 0.000 description 1
- 229940003504 avonex Drugs 0.000 description 1
- 239000007640 basal medium Substances 0.000 description 1
- HYNPZTKLUNHGPM-KKERQHFVSA-N becaplermin Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](Cc2cnc[nH]2)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(=N)N)C(=O)N3CCC[C@H]3C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@@H]4CCCN4C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]5CCCN5C(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H]6CCCN6C(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@@H]7CCCN7C(=O)[C@H](Cc8c[nH]c9c8cccc9)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCNC(=N)N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)N HYNPZTKLUNHGPM-KKERQHFVSA-N 0.000 description 1
- 229960004787 becaplermin Drugs 0.000 description 1
- 229960005347 belatacept Drugs 0.000 description 1
- 238000011021 bench scale process Methods 0.000 description 1
- 235000021028 berry Nutrition 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 108010087173 bile salt-stimulated lipase Proteins 0.000 description 1
- 108010064866 biozym Proteins 0.000 description 1
- 108010055460 bivalirudin Proteins 0.000 description 1
- 229960001500 bivalirudin Drugs 0.000 description 1
- OIRCOABEOLEUMC-GEJPAHFPSA-N bivalirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 OIRCOABEOLEUMC-GEJPAHFPSA-N 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000010478 bone regeneration Effects 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 229940089093 botox Drugs 0.000 description 1
- 108010072543 bremelanotide Proteins 0.000 description 1
- FFHBJDQSGDNCIV-MFVUMRCOSA-N bremelanotide Chemical compound C([C@@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCNC(=O)C[C@@H](C(N[C@@H](CC=2NC=NC=2)C(=O)N1)=O)NC(=O)[C@@H](NC(C)=O)CCCC)C(O)=O)C1=CC=CC=C1 FFHBJDQSGDNCIV-MFVUMRCOSA-N 0.000 description 1
- 229950000740 bremelanotide Drugs 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229940009550 c1 esterase inhibitor Drugs 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 235000001046 cacaotero Nutrition 0.000 description 1
- 229960003773 calcitonin (salmon synthetic) Drugs 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000002619 cancer immunotherapy Methods 0.000 description 1
- 229940022399 cancer vaccine Drugs 0.000 description 1
- 238000009566 cancer vaccine Methods 0.000 description 1
- KVLLHLWBPNCVNR-SKCUWOTOSA-N capromorelin Chemical compound C([C@@]12CN(CCC1=NN(C2=O)C)C(=O)[C@@H](COCC=1C=CC=CC=1)NC(=O)C(C)(C)N)C1=CC=CC=C1 KVLLHLWBPNCVNR-SKCUWOTOSA-N 0.000 description 1
- 229950004826 capromorelin Drugs 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 230000023852 carbohydrate metabolic process Effects 0.000 description 1
- 235000021256 carbohydrate metabolism Nutrition 0.000 description 1
- 229940077731 carbohydrate nutrients Drugs 0.000 description 1
- 150000001721 carbon Chemical class 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 229960000419 catumaxomab Drugs 0.000 description 1
- 238000012832 cell culture technique Methods 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 108700008462 cetrorelix Proteins 0.000 description 1
- SBNPWPIBESPSIF-MHWMIDJBSA-N cetrorelix Chemical compound C([C@@H](C(=O)N[C@H](CCCNC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@H](C)C(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](CC=1C=NC=CC=1)NC(=O)[C@@H](CC=1C=CC(Cl)=CC=1)NC(=O)[C@@H](CC=1C=C2C=CC=CC2=CC=1)NC(C)=O)C1=CC=C(O)C=C1 SBNPWPIBESPSIF-MHWMIDJBSA-N 0.000 description 1
- 229960003230 cetrorelix Drugs 0.000 description 1
- RCTCWZRPYFBGLQ-KVBIMOIYSA-N chembl2105639 Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C(C)C)C1=CC=CC=C1 RCTCWZRPYFBGLQ-KVBIMOIYSA-N 0.000 description 1
- XMLNCADGRIEXPK-KUMOIWDRSA-M chembl2146143 Chemical compound [Br-].O([C@H]1C[C@H]2CC[C@@H](C1)[N+]2(C)C)C(=O)C(CO)C1=CC=CC=C1 XMLNCADGRIEXPK-KUMOIWDRSA-M 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- QPAKKWCQMHUHNI-GQIQPHNSSA-N chlorotoxin Chemical compound C([C@H]1C(=O)NCC(=O)N2CCC[C@H]2C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H]4CSSC[C@@H](C(N[C@@H](CCSC)C(=O)N5CCC[C@H]5C(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)CNC(=O)CNC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC2=O)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC4=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N3)=O)NC(=O)[C@@H](N)CCSC)C1=CC=C(O)C=C1 QPAKKWCQMHUHNI-GQIQPHNSSA-N 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 229950009003 cilengitide Drugs 0.000 description 1
- AMLYAMJWYAIXIA-VWNVYAMZSA-N cilengitide Chemical compound N1C(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N(C)C(=O)[C@H]1CC1=CC=CC=C1 AMLYAMJWYAIXIA-VWNVYAMZSA-N 0.000 description 1
- 229960004106 citric acid Drugs 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- HTBKFGWATIYCSF-QGXIKSNHSA-N conantokin g Chemical compound NC(=O)C[C@@H](C(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CC(C(O)=O)C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN HTBKFGWATIYCSF-QGXIKSNHSA-N 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- KJQOYUHYAZGPIZ-PIJHVLQJSA-N conotoxin vc1.1 Chemical compound C([C@H]1C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(N[C@@H](CSSC[C@@H]2NC(=O)[C@@H](NC(=O)CN)CSSC[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CC(O)=O)C(=O)N1)C(N)=O)=O)[C@@H](C)CC)C1=CN=CN1 KJQOYUHYAZGPIZ-PIJHVLQJSA-N 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- LUNQZVCDZKODKF-PFVVTREHSA-L copper acetic acid (2S)-6-amino-2-[[(2S)-2-[(2-aminoacetyl)amino]-3-(1H-imidazol-5-yl)propanoyl]amino]hexanoate (2S)-6-amino-2-[[(2S)-2-[(2-amino-1-oxidoethylidene)amino]-3-(1H-imidazol-5-yl)propanoyl]amino]hexanoate hydron Chemical compound [Cu+2].CC(O)=O.CC(O)=O.NCCCC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1.NCCCC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 LUNQZVCDZKODKF-PFVVTREHSA-L 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 229940108471 crofab Drugs 0.000 description 1
- VUYRSKROGTWHDC-HZGLMRDYSA-N ctce 9908 Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)CNC(=O)[C@@H](N)CCCCN)C(C)C)CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCCCC[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)CNC(=O)[C@@H](N)CCCCN)C(C)C)C(N)=O)C1=CC=C(O)C=C1 VUYRSKROGTWHDC-HZGLMRDYSA-N 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- DOAKLVKFURWEDJ-QCMAZARJSA-N daptomycin Chemical compound C([C@H]1C(=O)O[C@H](C)[C@@H](C(NCC(=O)N[C@@H](CCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@H](CO)C(=O)N[C@H](C(=O)N1)[C@H](C)CC(O)=O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](CC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CCCCCCCCC)C(=O)C1=CC=CC=C1N DOAKLVKFURWEDJ-QCMAZARJSA-N 0.000 description 1
- 229960005484 daptomycin Drugs 0.000 description 1
- 229960005029 darbepoetin alfa Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 229960002272 degarelix Drugs 0.000 description 1
- MEUCPCLKGZSHTA-XYAYPHGZSA-N degarelix Chemical compound C([C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCNC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@H](C)C(N)=O)NC(=O)[C@H](CC=1C=CC(NC(=O)[C@H]2NC(=O)NC(=O)C2)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](CC=1C=NC=CC=1)NC(=O)[C@@H](CC=1C=CC(Cl)=CC=1)NC(=O)[C@@H](CC=1C=C2C=CC=CC2=CC=1)NC(C)=O)C1=CC=C(NC(N)=O)C=C1 MEUCPCLKGZSHTA-XYAYPHGZSA-N 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 108010017271 denileukin diftitox Proteins 0.000 description 1
- 229960002923 denileukin diftitox Drugs 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 108010073652 desirudin Proteins 0.000 description 1
- XYWBJDRHGNULKG-OUMQNGNKSA-N desirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 XYWBJDRHGNULKG-OUMQNGNKSA-N 0.000 description 1
- 229960000296 desirudin Drugs 0.000 description 1
- 229960005408 deslorelin Drugs 0.000 description 1
- 108700025485 deslorelin Proteins 0.000 description 1
- 229960004281 desmopressin Drugs 0.000 description 1
- NFLWUMRGJYTJIN-NXBWRCJVSA-N desmopressin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSCCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(N)=O)=O)CCC(=O)N)C1=CC=CC=C1 NFLWUMRGJYTJIN-NXBWRCJVSA-N 0.000 description 1
- 229950001282 desmoteplase Drugs 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 229940039227 diagnostic agent Drugs 0.000 description 1
- 239000000032 diagnostic agent Substances 0.000 description 1
- 239000012502 diagnostic product Substances 0.000 description 1
- VGGRNGOEDNBLPH-YJHCMWSWSA-N diapep277 Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)CCC1 VGGRNGOEDNBLPH-YJHCMWSWSA-N 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 229940021344 digifab Drugs 0.000 description 1
- 108010034479 digoxin antibodies Fab fragments Proteins 0.000 description 1
- AIUDWMLXCFRVDR-UHFFFAOYSA-N dimethyl 2-(3-ethyl-3-methylpentyl)propanedioate Chemical class CCC(C)(CC)CCC(C(=O)OC)C(=O)OC AIUDWMLXCFRVDR-UHFFFAOYSA-N 0.000 description 1
- 150000002009 diols Chemical class 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 108010067396 dornase alfa Proteins 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 229940098753 dysport Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 229940056913 eftilagimod alfa Drugs 0.000 description 1
- QBEPNUQJQWDYKU-BMGKTWPMSA-N egrifta Chemical compound C([C@H](NC(=O)C/C=C/CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(N)=O)C1=CC=C(O)C=C1 QBEPNUQJQWDYKU-BMGKTWPMSA-N 0.000 description 1
- MDCUNMLZLNGCQA-HWOAGHQOSA-N elafin Chemical compound N([C@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H]1C(=O)N2CCC[C@H]2C(=O)N[C@H](C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H]2CSSC[C@H]3C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CSSC[C@H]4C(=O)N5CCC[C@H]5C(=O)NCC(=O)N[C@H](C(N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H]5N(CCC5)C(=O)[C@H]5N(CCC5)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)NC2=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N4)C(=O)N[C@@H](CSSC1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N3)=O)[C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)C(C)C)C(C)C)C(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N MDCUNMLZLNGCQA-HWOAGHQOSA-N 0.000 description 1
- KUBARPMUNHKBIQ-VTHUDJRQSA-N eliglustat tartrate Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O.C([C@@H](NC(=O)CCCCCCC)[C@H](O)C=1C=C2OCCOC2=CC=1)N1CCCC1.C([C@@H](NC(=O)CCCCCCC)[C@H](O)C=1C=C2OCCOC2=CC=1)N1CCCC1 KUBARPMUNHKBIQ-VTHUDJRQSA-N 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 229940096118 ella Drugs 0.000 description 1
- 229960002062 enfuvirtide Drugs 0.000 description 1
- PEASPLKKXBYDKL-FXEVSJAOSA-N enfuvirtide Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(C)=O)[C@@H](C)O)[C@@H](C)CC)C1=CN=CN1 PEASPLKKXBYDKL-FXEVSJAOSA-N 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 230000029578 entry into host Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 229960003388 epoetin alfa Drugs 0.000 description 1
- 108010002601 epoetin beta Proteins 0.000 description 1
- 229960004579 epoetin beta Drugs 0.000 description 1
- 108010067416 epoetin delta Proteins 0.000 description 1
- 229950002109 epoetin delta Drugs 0.000 description 1
- 108010090921 epoetin omega Proteins 0.000 description 1
- 229950008767 epoetin omega Drugs 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 229950001583 examorelin Drugs 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000013265 extended release Methods 0.000 description 1
- 229940012444 factor xiii Drugs 0.000 description 1
- 206010016165 failure to thrive Diseases 0.000 description 1
- 230000009567 fermentative growth Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 229960004177 filgrastim Drugs 0.000 description 1
- 239000000834 fixative Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 108010006578 follitropin alfa Proteins 0.000 description 1
- 229960005210 follitropin alfa Drugs 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 108010089296 galsulfase Proteins 0.000 description 1
- 229960005390 galsulfase Drugs 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 101150073818 gap gene Proteins 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 229960003776 glatiramer acetate Drugs 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 108010049491 glucarpidase Proteins 0.000 description 1
- 229960004859 glucarpidase Drugs 0.000 description 1
- 230000004110 gluconeogenesis Effects 0.000 description 1
- 230000007967 glucose restriction Effects 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 102000035122 glycosylated proteins Human genes 0.000 description 1
- 108091005608 glycosylated proteins Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010085109 glycyl-histidyl-arginyl-proline Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 108010049353 golotimod Proteins 0.000 description 1
- 101150067301 grh-1 gene Proteins 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 108010013846 hematide Proteins 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 201000011200 hepatorenal syndrome Diseases 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 239000012510 hollow fiber Substances 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 102000049953 human LEP Human genes 0.000 description 1
- 102000050459 human LTF Human genes 0.000 description 1
- 102000058004 human PTH Human genes 0.000 description 1
- 229940116978 human epidermal growth factor Drugs 0.000 description 1
- 229940048921 humira Drugs 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- GPRLSGONYQIRFK-UHFFFAOYSA-N hydron Chemical compound [H+] GPRLSGONYQIRFK-UHFFFAOYSA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 229950006895 icrocaptide Drugs 0.000 description 1
- 229960002396 idursulfase Drugs 0.000 description 1
- 108010072166 idursulfase Proteins 0.000 description 1
- 239000012729 immediate-release (IR) formulation Substances 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 238000010569 immunofluorescence imaging Methods 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 229940032219 immunotherapy vaccine Drugs 0.000 description 1
- 239000002596 immunotoxin Substances 0.000 description 1
- 230000002637 immunotoxin Effects 0.000 description 1
- 231100000608 immunotoxin Toxicity 0.000 description 1
- 229940051026 immunotoxin Drugs 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000012606 in vitro cell culture Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 229910001026 inconel Inorganic materials 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 229960000598 infliximab Drugs 0.000 description 1
- 229960003971 influenza vaccine Drugs 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 229960004717 insulin aspart Drugs 0.000 description 1
- 229960002869 insulin glargine Drugs 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 108010042414 interferon gamma-1b Proteins 0.000 description 1
- 229960001388 interferon-beta Drugs 0.000 description 1
- 108010074108 interleukin-21 Proteins 0.000 description 1
- 229940028885 interleukin-4 Drugs 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 159000000014 iron salts Chemical class 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 1
- KXJTWOGIBOWZDJ-LELJLAJGSA-N l-blp25 Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1N(CCC1)C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)[C@@H](C)O)C1=CNC=N1 KXJTWOGIBOWZDJ-LELJLAJGSA-N 0.000 description 1
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 229940078795 lactoferrin Drugs 0.000 description 1
- 235000021242 lactoferrin Nutrition 0.000 description 1
- 108010051044 lanoteplase Proteins 0.000 description 1
- 229950010645 lanoteplase Drugs 0.000 description 1
- 108010021336 lanreotide Proteins 0.000 description 1
- 229960002437 lanreotide Drugs 0.000 description 1
- 229960002486 laronidase Drugs 0.000 description 1
- 229960002618 lenograstim Drugs 0.000 description 1
- OTQCKZUSUGYWBD-BRHMIFOHSA-N lepirudin Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)[C@@H](C)O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)[C@@H](C)O)C1=CC=C(O)C=C1 OTQCKZUSUGYWBD-BRHMIFOHSA-N 0.000 description 1
- 229960004408 lepirudin Drugs 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 108010024409 linaclotide Proteins 0.000 description 1
- KXGCNMMJRFDFNR-WDRJZQOASA-N linaclotide Chemical compound C([C@H](NC(=O)[C@@H]1CSSC[C@H]2C(=O)N[C@H]3CSSC[C@H](N)C(=O)N[C@H](C(N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N2)=O)CSSC[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]2CCCN2C(=O)[C@H](CC(N)=O)NC3=O)C(=O)N[C@H](C(NCC(=O)N1)=O)[C@H](O)C)C(O)=O)C1=CC=C(O)C=C1 KXGCNMMJRFDFNR-WDRJZQOASA-N 0.000 description 1
- 229960000812 linaclotide Drugs 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 108010033214 liprotamase lipase Proteins 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 108010004367 lixisenatide Proteins 0.000 description 1
- 229960001093 lixisenatide Drugs 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- 108010015964 lucinactant Proteins 0.000 description 1
- 229940040129 luteinizing hormone Drugs 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 108010080780 melanotan-II Proteins 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229940035102 meningococcal group b vaccine Drugs 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910001092 metal group alloy Inorganic materials 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 239000003658 microfiber Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 108010068982 microplasmin Proteins 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 239000007003 mineral medium Substances 0.000 description 1
- MEFBJEMVZONFCJ-UHFFFAOYSA-N molybdate Chemical compound [O-][Mo]([O-])(=O)=O MEFBJEMVZONFCJ-UHFFFAOYSA-N 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 229940090053 mononine Drugs 0.000 description 1
- 108010075698 monteplase Proteins 0.000 description 1
- 229950005805 monteplase Drugs 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 229940112646 myobloc Drugs 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 229950010676 nartograstim Drugs 0.000 description 1
- 108010032539 nartograstim Proteins 0.000 description 1
- 229950002774 nateplase Drugs 0.000 description 1
- GVUGOAYIVIDWIO-UFWWTJHBSA-N nepidermin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CS)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C(C)C)C(C)C)C1=CC=C(O)C=C1 GVUGOAYIVIDWIO-UFWWTJHBSA-N 0.000 description 1
- 229960001267 nesiritide Drugs 0.000 description 1
- HPNRHPKXQZSDFX-OAQDCNSJSA-N nesiritide Chemical compound C([C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)CNC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CO)C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 HPNRHPKXQZSDFX-OAQDCNSJSA-N 0.000 description 1
- 239000002581 neurotoxin Substances 0.000 description 1
- 231100000618 neurotoxin Toxicity 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- VIKNJXKGJWUCNN-XGXHKTLJSA-N norethisterone Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 VIKNJXKGJWUCNN-XGXHKTLJSA-N 0.000 description 1
- VOMXSOIBEJBQNF-UTTRGDHVSA-N novorapid Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 VOMXSOIBEJBQNF-UTTRGDHVSA-N 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 229960002700 octreotide Drugs 0.000 description 1
- 238000002966 oligonucleotide array Methods 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- MVPAMLBUDIFYGK-BHDRXCTLSA-N omiganan Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@@H]3CCCN3C(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(N)=O)=CNC2=C1 MVPAMLBUDIFYGK-BHDRXCTLSA-N 0.000 description 1
- 229950008583 omiganan Drugs 0.000 description 1
- 230000000174 oncolytic effect Effects 0.000 description 1
- 244000309459 oncolytic virus Species 0.000 description 1
- 229950010444 onercept Drugs 0.000 description 1
- 229950001933 opebacan Drugs 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229940100629 oral lozenge Drugs 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 108010011957 ozarelix Proteins 0.000 description 1
- 229950008505 ozarelix Drugs 0.000 description 1
- 108010084846 parathyroid hormone (7-34) Proteins 0.000 description 1
- 235000014594 pastries Nutrition 0.000 description 1
- HQQSBEDKMRHYME-UHFFFAOYSA-N pefloxacin mesylate Chemical compound [H+].CS([O-])(=O)=O.C1=C2N(CC)C=C(C(O)=O)C(=O)C2=CC(F)=C1N1CCN(C)CC1 HQQSBEDKMRHYME-UHFFFAOYSA-N 0.000 description 1
- 229960001373 pegfilgrastim Drugs 0.000 description 1
- 108010044644 pegfilgrastim Proteins 0.000 description 1
- 108010092851 peginterferon alfa-2b Proteins 0.000 description 1
- 229940106366 pegintron Drugs 0.000 description 1
- 229950000867 pegsunercept Drugs 0.000 description 1
- 229940066779 peptones Drugs 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 238000011020 pilot scale process Methods 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229950008499 plitidepsin Drugs 0.000 description 1
- 108010049948 plitidepsin Proteins 0.000 description 1
- UUSZLLQJYRSZIS-LXNNNBEUSA-N plitidepsin Chemical compound CN([C@H](CC(C)C)C(=O)N[C@@H]1C(=O)N[C@@H]([C@H](CC(=O)O[C@H](C(=O)[C@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N2CCC[C@H]2C(=O)N(C)[C@@H](CC=2C=CC(OC)=CC=2)C(=O)O[C@@H]1C)C(C)C)O)[C@@H](C)CC)C(=O)[C@@H]1CCCN1C(=O)C(C)=O UUSZLLQJYRSZIS-LXNNNBEUSA-N 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920002338 polyhydroxyethylmethacrylate Polymers 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 229960003611 pramlintide Drugs 0.000 description 1
- 108010029667 pramlintide Proteins 0.000 description 1
- NRKVKVQDUCJPIZ-MKAGXXMWSA-N pramlintide acetate Chemical compound C([C@@H](C(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 NRKVKVQDUCJPIZ-MKAGXXMWSA-N 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 229960003848 prezatide copper acetate Drugs 0.000 description 1
- 239000013615 primer Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 1
- 229940030749 prostate cancer vaccine Drugs 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 235000019423 pullulan Nutrition 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011363 radioimmunotherapy Methods 0.000 description 1
- 108010076689 ramoplanin Proteins 0.000 description 1
- 229950003551 ramoplanin Drugs 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 229960003876 ranibizumab Drugs 0.000 description 1
- 229960000424 rasburicase Drugs 0.000 description 1
- 108010084837 rasburicase Proteins 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 229940038850 rebif Drugs 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 108010003189 recombinant human tumor necrosis factor-binding protein-1 Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 229940047431 recombinate Drugs 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000024155 regulation of cell adhesion Effects 0.000 description 1
- 230000000754 repressing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 108010051412 reteplase Proteins 0.000 description 1
- 229960002917 reteplase Drugs 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 108010091078 rigin Proteins 0.000 description 1
- 108010074523 rimabotulinumtoxinB Proteins 0.000 description 1
- 229960005560 rindopepimut Drugs 0.000 description 1
- 229960004641 rituximab Drugs 0.000 description 1
- 108010054669 rotigaptide Proteins 0.000 description 1
- GFJRASPBQLDRRY-TWTQBQJDSA-N rotigaptide Chemical compound NC(=O)CNC(=O)[C@@H](C)NC(=O)CNC(=O)[C@H]1C[C@H](O)CN1C(=O)[C@@H]1N(C(=O)[C@@H](CC=2C=CC(O)=CC=2)NC(C)=O)CCC1 GFJRASPBQLDRRY-TWTQBQJDSA-N 0.000 description 1
- 229950005893 rotigaptide Drugs 0.000 description 1
- 108010068072 salmon calcitonin Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 108010038379 sargramostim Proteins 0.000 description 1
- 229960002530 sargramostim Drugs 0.000 description 1
- 238000011218 seed culture Methods 0.000 description 1
- AFEHBIGDWIGTEH-AQRCPPRCSA-N semax Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CNC=N1 AFEHBIGDWIGTEH-AQRCPPRCSA-N 0.000 description 1
- WGWPRVFKDLAUQJ-MITYVQBRSA-N sermorelin Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)C1=CC=C(O)C=C1 WGWPRVFKDLAUQJ-MITYVQBRSA-N 0.000 description 1
- 229960002758 sermorelin Drugs 0.000 description 1
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 229960004532 somatropin Drugs 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 229940082787 spirulina Drugs 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013595 supernatant sample Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- LQZAIAZUDWIVPM-SRVKXCTJSA-N taltirelin Chemical compound N1C(=O)N(C)C(=O)C[C@H]1C(=O)N[C@H](C(=O)N1[C@@H](CCC1)C(N)=O)CC1=CN=CN1 LQZAIAZUDWIVPM-SRVKXCTJSA-N 0.000 description 1
- 229950007365 taltirelin Drugs 0.000 description 1
- WRGVLTAWMNZWGT-VQSPYGJZSA-N taspoglutide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NC(C)(C)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)C(C)(C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 WRGVLTAWMNZWGT-VQSPYGJZSA-N 0.000 description 1
- 229950007151 taspoglutide Drugs 0.000 description 1
- 108010023586 technetium Tc 99m P280 Proteins 0.000 description 1
- 108010073046 teduglutide Proteins 0.000 description 1
- CILIXQOJUNDIDU-ASQIGDHWSA-N teduglutide Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O)[C@@H](C)CC)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)CC)C1=CC=CC=C1 CILIXQOJUNDIDU-ASQIGDHWSA-N 0.000 description 1
- 229960002444 teduglutide Drugs 0.000 description 1
- 229950009634 telbermin Drugs 0.000 description 1
- 229960000216 tenecteplase Drugs 0.000 description 1
- 229960003813 terlipressin Drugs 0.000 description 1
- BENFXAYNYRLAIU-QSVFAHTRSA-N terlipressin Chemical compound NCCCC[C@@H](C(=O)NCC(N)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)CN)CSSC1 BENFXAYNYRLAIU-QSVFAHTRSA-N 0.000 description 1
- 229950011372 teverelix Drugs 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940021747 therapeutic vaccine Drugs 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229960003766 thrombin (human) Drugs 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 229940126460 thrombopoietin receptor agonist Drugs 0.000 description 1
- NZVYCXVTEHPMHE-ZSUJOUNUSA-N thymalfasin Chemical compound CC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NZVYCXVTEHPMHE-ZSUJOUNUSA-N 0.000 description 1
- 229960004231 thymalfasin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229960004517 thymopentin Drugs 0.000 description 1
- PSWFFKRAVBDQEG-YGQNSOCVSA-N thymopentin Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PSWFFKRAVBDQEG-YGQNSOCVSA-N 0.000 description 1
- 108010079996 thymosin beta(4) Proteins 0.000 description 1
- ZRXXHPDJLAQCPC-SFJRRRFZSA-N tigapotide Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@H](CSCNC(C)=O)NC(=O)[C@@H](NC(=O)[C@H](CSCNC(C)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CSCNC(C)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)CCC(O)=O)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C1=CC=C(O)C=C1 ZRXXHPDJLAQCPC-SFJRRRFZSA-N 0.000 description 1
- 229940042129 topical gel Drugs 0.000 description 1
- 108010078749 trafermin Proteins 0.000 description 1
- 229950009227 trafermin Drugs 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- 108010075758 trebananib Proteins 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- VXKHXGOKWPXYNA-PGBVPBMZSA-N triptorelin Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 VXKHXGOKWPXYNA-PGBVPBMZSA-N 0.000 description 1
- 229960004824 triptorelin Drugs 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 229960002109 tuberculosis vaccine Drugs 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- IUCCYQIEZNQWRS-DWWHXVEHSA-N ularitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 IUCCYQIEZNQWRS-DWWHXVEHSA-N 0.000 description 1
- 229950009436 ularitide Drugs 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
- 229950002962 valategrast Drugs 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 108010084171 vanutide cridificar Proteins 0.000 description 1
- 229960002730 vapreotide Drugs 0.000 description 1
- 108700029852 vapreotide Proteins 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 208000019553 vascular disease Diseases 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 235000019156 vitamin B Nutrition 0.000 description 1
- 239000011720 vitamin B Substances 0.000 description 1
- 229940054953 vitrase Drugs 0.000 description 1
- BICRTLVBTLFLRD-PTWUADNWSA-N voclosporin Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C=C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O BICRTLVBTLFLRD-PTWUADNWSA-N 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 239000002918 waste heat Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 230000029663 wound healing Effects 0.000 description 1
- 239000007221 ypg medium Substances 0.000 description 1
- 229940032528 zemaira Drugs 0.000 description 1
- BPKIMPVREBSLAJ-QTBYCLKRSA-N ziconotide Chemical compound C([C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]2C(=O)N[C@@H]3C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CSSC2)C(N)=O)=O)CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CSSC3)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(N1)=O)CCSC)[C@@H](C)O)C1=CC=C(O)C=C1 BPKIMPVREBSLAJ-QTBYCLKRSA-N 0.000 description 1
- 229960002811 ziconotide Drugs 0.000 description 1
- WHNFPRLDDSXQCL-UAZQEYIDSA-N α-msh Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(N)=O)NC(=O)[C@H](CO)NC(C)=O)C1=CC=C(O)C=C1 WHNFPRLDDSXQCL-UAZQEYIDSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43595—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/38—Chemical stimulation of growth or activity by addition of chemical compounds which are not essential growth factors; Stimulation of growth by removal of a chemical compound
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/65—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/005—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination repressible enhancer/promoter combination, e.g. KRAB
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/84—Pichia
Abstract
서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자를 포함하며, 하나 이상의 유전적 변형 전의 숙주 세포와 비교하여 상기 유전자의 발현을 감소시키기 위해 상기 하나 이상의 유전적 변형에 의해 조작되고, 비-메탄올 탄소 공급원에 의해 억제가능한 발현 카세트 프로모터(ECP)의 제어 하에 관심 유전자(GOI)를 포함하는 이종 발현 카세트를 포함하는 재조합 숙주 세포, 및 상기 재조합 숙주 세포를 사용하여 관심 단백질을 생산하는 방법.
Description
본 발명은 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)를 발현하기 위해 이종 발현 카세트를 포함하는 재조합 숙주 세포에서 POI를 생산하는 것에 관한 것이며, 숙주 세포는 FLO8 단백질의 발현을 감소시키도록 조작된다.
재조합 숙주 세포 배양에서 생산된 단백질은 진단제 및 치료제로 점차 중요해지고 있다. 이 목적을 위해, 세포는 비정상적으로 높은 수준의 재조합 또는 이종 관심 단백질을 생산하도록 조작되고/되거나 선택된다. 세포 배양 조건의 최적화는 재조합 또는 이종 단백질의 성공적인 상업적 생산에 중요하다.
관심 단백질(POI)의 성공적 생산은 세포 배양물에서 원핵 및 진핵 숙주 세포 둘 다로 달성되었다. 진핵 숙주 세포, 특히 포유류 숙주 세포, 효모 또는 사상성 진균, 또는 박테리아는 통상적으로 생물약제학적 단백질 뿐만 아니라 벌크 화학물질에 대한 생산 숙주로서 사용된다. 가장 우세한 예는 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 피키아 파스토리스(Pichia pastoris) 또는 한세눌라 폴리모르파(Hansenula polymorpha)와 같은 효모, 아스페르길루스 아와모리(Aspergillus awamori) 또는 트리코더마 레세이(Trichoderma reesei)와 같은 사상성 진균, 또는 CHO 세포와 같은 포유류 세포이다. 피키아 파스토리스와 같은 메탄올자화(Methylotrophic) 효모는 이종 단백질의 효율적인 분비로 널리 평판이 나 있다. 피. 파스토리스(P. pastoris)는 새로운 속 코마가타엘라(Komagataella)로 재분류되었고, 케이. 파스토리스(K. pastoris), 케이. 파피이(K. phaffii), 및 케이. 슈도파스토리스(K. pseudopatoris)의 3 종으로 나뉘었다. 생물공학적 적용에 통상적으로 사용되는 균주는 케이. 파스토리스 및 케이. 파피이의 제안된 2 종에 속한다. 균주 GS115, X-33, CBS2612, 및 CBS7435는 케이. 파피이이지만, 프로테아제 결핍 균주의 SMD 시리즈(예를 들어, SMD1168)는 모든 이용가능한 피. 파스토리스 균주에 대한 참조 균주인 케이. 파스토리스 유형 종으로 분류된다(Kurtzman 2009, J Ind Microbiol Biotechnol. 36(11):1435-8). Mattanovich et al.(Microbial Cell Factories 2009, 8:29 doi:10.1186/1475-2859-8-29)은 케이. 파스토리스의 유형 균주 DSMZ 70382의 게놈 서열분석을 기재하고, 이의 분비단백질(secretome) 및 당 수송체를 분석하였다.
WO2015/158808A2는 헬퍼 단백질을 과발현하도록 조작된 재조합 숙주 세포를 개시한다.
WO2015/158800A1은 숙주 세포에 내인성이고 과발현될 때 단백질 생산 수율을 감소시키는 것으로 입증된 특정 단백질(KO 단백질이라고 명명됨)을 과소발현하도록 조작함으로써 POI를 발현하고/하거나 분비하는 숙주 세포의 능력을 개선하는 것을 개시한다. 따라서 이러한 KO 단백질은 수율을 개선하기 위한 녹아웃(knock-out) 표적으로 선택되었다. 결국, 피. 파스토리스 숙주 세포주에서 KO 단백질을 과소발현하면 모델 단백질의 수율이 1.2 내지 2.4 배까지 증가하는 것으로 밝혀졌다. 유도성(pAOX1) 또는 구성적(pGAP) 프로모터가 사용되었다. KO 단백질은 에스. 세레비지애(S. cerevisiae) FLO8 단백질의 피. 파스토리스 상동체, 에스. 세레비지애 HCH1 단백질의 피. 파스토리스 상동체, 및 에스. 세레비지애 SCJ1 단백질의 피. 파스토리스 상동체인 KO3으로 식별되었다.
Rebnegger et al.(Applied and Environmental Microbiology 2016, 82(15):4570-4583)은 필터 막힘을 방지하기 위해 피. 파스토리스 flo8 결실 돌연변이체의 글루코스 제한된 케모스태트(chemostat) 배양을 기재한다.
재조합 숙주 세포에서 단백질 생산에 사용되는 프로모터는 조절되거나(예를 들어, 메탄올을 배지에 첨가할 때 유도됨, 메탄올-제어), 또는 지속적으로 활성적(구성적)이다. 메탄올-제어 프로모터는 반응기에서의 폐열, 또는 산소 공급과 같은 기술적 한계를 초래한다.
WO20137050551A1은 피. 파스토리스의 일련의 탄소 공급원 조절가능한 프로모터(pG1-pG8로 지정됨), 및 세포 배양물에서 탄소 공급원 제한 시 단백질 생산의 유도를 개시한다.
WO2017021541A1은 메탄올 이외의 탄소 공급원에 의해 조절되며, 즉 메탄올 조절되지 않고, 예를 들어 성장 단계 동안 탄소 공급원의 존재 하에 억제되고, 생산 단계에서 탄소 공급원을 제한함으로써 유도되는 피. 파스토리스의 탄소 공급원 조절가능한 프로모터(pG1로 지정됨)의 변이체를 개시한다.
Prielhofer et al.(Microbial Cell Factories 2013; 12(5):1-10)은 메탄올 없이 조절가능하고 유도되는 피. 파스토리스 프로모터를 기재한다.
Prielhofer et al.(Biotechnology and Bioengineering. 2018;115:2479-2488)은 글루코스-조절 PGTH1 프로모터 및 야생형 프로모터와 비교하여 유도 특성이 크게 향상된 조작된 변이체를 기재한다.
EP2669375A1은 MPP1 상동체의 고수준 발현에 의해 개선된 단백질 발현을 갖는 효모를 개시한다.
Hye Young Kim et al.(Biochemical and Biophysical Research Communications 2014, 449:202-207)은 표적 유전자 세트의 전사 활성화에서 Flo8 활성인자의 2 개 도메인의 역할, 및 Mss11 활성인자와의 상호작용에 의한 Flo8 작용의 방식을 기재한다.
EP2952584A1은 특정 폴리뉴클레오티드의 과발현에 의해 개선된 단백질 생산을 개시한다.
EP2258855A1은 피. 파스토리스의 특정 리더 및 분비 신호 서열을 개시한다.
WO2010099195A1은 유전적으로 변형된 피. 파스토리스 균주 및 이종 단백질 및 샤폐론 단백질의 공발현을 개시한다.
목적은 재조합 숙주 세포에서 단백질 생산을 개선하고 단백질 생산 수율을 증가시키는 것이다. 본 발명의 또 다른 목적은 숙주 세포에서 재조합 또는 이종 단백질을 생산하는 방법을 제공하는 것이며, 여기서 생산 공정 동안 숙주 세포의 형태 변화 위험은 감소된다.
목적은 청구된 바와 같은 주제에 의해 해결된다.
본 발명에 따르면, 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자를 포함하며, 하나 이상의 유전적 변형 전의 숙주 세포와 비교하여 상기 폴리뉴클레오티드의 발현을 감소(또는 폐지)시키기 위해 상기 하나 이상의 유전적 변형에 의해 조작되고, 발현 카세트 프로모터(ECP)의 제어 하에 이러한 관심 유전자(GOI)를 발현하기 위해 이러한 GOI를 포함하는 이종 발현 카세트를 포함하는, 재조합 숙주 세포가 제공된다.
구체적으로, ECP는 비-메탄올 탄소 공급원에 의해 조절가능하다.
구체적으로, ECP는 비-메탄올 탄소 공급원에 의해 억제가능하다.
구체적으로, ECP는 억제 탄소 공급원, 예를 들어 글루코스 또는 글리세롤과 같은 메탄올이 아닌 억제 탄소 공급원에 의해 억제가능하고, 억제 탄소 공급원의 양을 감소시킴으로써 유도가능(탈억제가능)하다.
구체적으로, ECP는 메탄올에 의해 유도가능하지 않다.
구체적으로, 비-메탄올 탄소 공급원은 숙주 세포 배양에 적합하게 사용되는 메탄올 이외의 임의의 탄소 공급원이다. 구체적으로, 비-메탄올 탄소 공급원은 메탄올이 아니다.
구체적으로, 비-메탄올 탄소 공급원은 메탄올 이외의 탄소 공급원이다. 특히, ECP는 메탄올-제어되지 않는다. 세포 배양물 또는 세포 배양 배지는 메탄올을 포함할 수 있거나 또는 포함하지 않을 수 있지만, 본원에 사용된 바와 같은 ECP는 임의의 양의 메탄올에 의해 조절되지 않으며, 특히 메탄올에 의해 유도가능하지 않아서 메탄올-제어되지 않는다. 구체적으로, ECP는 메탄올이 없는 세포 배양물 또는 세포 배양 배지에서 완전히 유도될 수 있다.
본원에 기재된 목적을 위해, 용어 "FLO8 단백질"은 서열번호:1로 식별된 아미노산 서열을 포함하는 단백질, 또는 서열번호:1에 대해 특정 상동성을 갖는 아미노산 서열을 모두 지칭할 것이다. 그러나, 상동 서열은 또한 FLO8 상동체로 지칭된다.
구체적으로, FLO8 상동체는 서열번호:1에 대해 25%, 30%, 또는 35% 서열 동일성 중 적어도 임의의 하나 예를 들어, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖거나, 또는 서열번호:1과 100% 동일하다. 구체적으로, 서열 동일성은 예를 들어 전장 서열을 비교할 때 본원에 추가로 개시된 바와 같이 결정된다.
구체적으로, FLO8 단백질 또는 각각의 상동체는 서열번호:50에 대해 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 포함하거나, 또는 서열번호:50과 100% 동일한 LisH 도메인을 포함한다.
구체적 측면에 따르면, FLO8 단백질의 LisH 도메인은 진핵 유기체의 FLO8 단백질, 또는 각각의 FLO8 이종상동체(orthologue)의 자연 발생 LisH 도메인 중 임의의 것에 대해 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 포함하거나, 또는 이러한 자연 발생 LisH 도메인, 구체적으로 효모 또는 진균, 특히 사상성 진균의 LisH 도메인, 예컨대 다음 중 임의의 하나를 포함하거나 또는 이로 이루어진 LisH 도메인과 100% 동일하다:
a) 서열번호:50, 케이. 파피이의 FLO8 단백질의 LisH 도메인(서열번호:50);
b) 서열번호:51, 케이. 파스토리스의 FLO8 단백질의 LisH 도메인(BLASTp: 서열번호:50에 대해 96% 동일성(23/24 aa));
c) 에스. 세레비지애 균주의 FLO8 이종상동체의 LisH 도메인인, 서열번호:52(BLASTp: 서열번호 :50에 대해 54% 동일성(13/24 aa));
d) 또 다른 에스. 세레비지애 균주의 FLO8 이종상동체의 LisH 도메인인, 서열번호:53(BLASTp: 서열번호 :50에 대해 54% 동일성(13/24 aa));
e) 야로위아 리폴리티카(Yarrowia lipolytica) 균주의 FLO8 이종상동체의 LisH 도메인인, 서열번호:54(BLASTp: 서열번호 :50에 대해 71% 동일성(12/17 aa));
f) 오가타에아 폴리모르파(Ogataea polymorpha)의 FLO8 이종상동체의 LisH 도메인인, 서열번호:55(BLASTp: 서열번호 :50에 대해 62% 동일성(8/13 aa)); 또는
g) 아스페르길루스 니게르(Aspergillus niger) 균주의 FLO8 이종상동체의 LisH 도메인인, 서열번호:56(BLASTp: 서열번호 :50에 대해 73% 동일성(8/11 aa)).
전형적으로, FLO8 단백질의 LisH 도메인은 데이터베이스 Pfam, ID 번호 PF08513 및 각각의 서열에 기재된 바와 같이, 25-27 개의 아미노산 길이 및 인간 단백질 LIS1에 대한 특정 서열 동일성을 갖는다. 분자 생물학에서, LisH 도메인은 광범위한 기능을 갖는 다수의 진핵 단백질에서 발견되는 단백질 도메인이다. LIS1의 N-말단 영역에서 LisH 도메인의 구조는 이량체화 모티프로 묘사되었다(The dimerization mechanism of LIS1 and its implication for proteins containing the LisH motif. Mateja A, Cierpicki T, Paduch M, Derewenda ZS, Otlewski J. 2006. J Mol Biol. 357(2):621-31).
FLO8 상동체는 특히 본원에 추가로 기재된 바와 같이 POI를 생산하는 재조합 숙주 세포로서 사용되는 숙주 세포에 내인성인 것으로 이해된다. 특히, FLO8 단백질은 숙주 세포 종의 종에 내인성인 이종상동체이다.
구체적으로, FLO8 단백질은 숙주 세포가 피. 파스토리스, 특히 각각 케이. 파스토리스 및 케이. 파피이인 경우, 피. 파스토리스, 특히 케이. 파스토리스 또는 케이. 파피이 기원의 것이다. 대안적으로, FLO8 단백질은 또 다른 기원 또는 종의 것인 경우, 피. 파스토리스, 특히 케이. 파스토리스 또는 케이. 파피이 기원에서의 이러한 FLO8 단백질의 상동(또는 이종상동) 서열을 포함하며, 상동(또는 이종상동) 서열은 야생형 숙주 세포에 내인성이다. 예를 들어, 숙주 세포가 케이. 파피이인 경우, 내인성 FLO8 단백질은 서열번호:1로 식별된 아미노산 서열을 포함하거나 또는 이로 이루어진다. 또 다른 예에 따르면, 숙주 세포가 케이. 파스토리스인 경우, 내인성 FLO8 단백질은 서열번호:1과 91% 동일한 서열번호:3으로 식별된 아미노산 서열을 포함하거나 또는 이루어진다. 그러나, 숙주 세포가 상이한 종(케이. 파스토리스 및/또는 케이. 파피이 이외)의 것인 경우, 숙주 세포에 내인성인 FLO8 단백질 서열은 서열번호:1에 대한 상동체이고 숙주 세포에서 이러한 상동체(서열번호:1의 이종상동 서열)의 발현은 본원에 기재된 목적을 위해 감소된다.
구체적으로, 임의의 또는 각각의 상동 서열은 예를 들어, 전사 인자, 특히 세포 부착, 응집, 침습적 성장, 또는 전분 이화작용의 조절에 수반되는 DNA 결합 전사 활성인자로서 피. 파스토리스, 특히 케이. 파스토리스 또는 케이. 파피이에서와 같이 각각의 야생형 숙주 세포에서 FLO8 단백질의 동일한 정성적 기능을 특징으로 하지만, 야생형 케이. 파스토리스 또는 케이. 파피이에서 FLO8 단백질과 비교할 때 정량적 활성은 상이할 수 있다.
구체적으로, 각각의 상동 서열은 피. 파스토리스, 특히 케이. 파스토리스 또는 케이. 파피이 이외의 종, 예를 들어, 또 다른 효모 또는 사상성 진균 세포, 바람직하게는 코마가타엘라 또는 피키아(Pichia) 속, 또는 사카로마이세스(Saccharomyces) 속의 효모 또는 임의의 메탄올자화 효모의 것이다. 그러나, 숙주 세포는 동물 세포, 척추동물 세포, 포유류 세포, 인간 세포, 식물 세포, 박테리아 세포, 선충 세포, 곤충 세포 또는 연체동물 세포와 같은 무척추동물 세포, 또는 줄기 세포일 수 있고, 본원에 기재된 각각의 FLO8 단백질 및 이의 상동체는 각각의 숙주 세포에 내인성이지만, 이의 발현은 본원에 기재된 바와 같이 감소되거나 또는 폐지된다.
구체적으로, FLO8 단백질 상동체는 피키아 종에 내인성이거나 또는 이로부터 유래하거나 또는 임의의 다른 효모, 진균, 또는 박테리아에 내인성이거나 또는 이로부터 유래하고, 서열번호: 1 또는 서열번호:2에 대해 25% 서열 동일성, 특이적 경우에 35%, 40%, 45%, 50%, 55%, 60, 65%, 70%, 75%, 80%, 85%, 90%, 95% 중 적어도 임의의 하나를 갖거나, 또는 서열번호: 1 또는 서열번호:2와 100% 동일하다. 구체적으로, 외인성 FLO8 단백질은 외인성 FLO8 단백질(또는 외인성 FLO8 단백질을 암호화하는 유전자)이 피키아(파스토리스) 또는 사카로마이세스(세레비지애) 균주의 flo8 녹아웃(knockout) 균주의 배양물에 첨가될 때 기능적인 경우, FLO8 단백질 상동체인 것으로 결정되며, 녹아웃 균주는 외인성 FLO8 단백질의 기원과 상이하여 결실된 내인성 FLO8 단백질의 기능적 대체를 입증한다.
구체적으로, FLO8 단백질은 특히 숙주 세포에 내인성인 유전자에 의해 암호화된 피. 파스토리스 기원의 것이며, 여기서 숙주 세포는 피. 파스토리스이다.
구체적으로, 서열번호:1을 포함하거나 또는 이로 이루어진 FLO8 단백질은 코마가타엘라 파피이(Komagataella phaffii) 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 코마가타엘라 파피이이다. 구체적으로, FLO8 단백질은 서열번호:2로 식별된 뉴클레오티드 서열에 의해 암호화된다.
구체적으로, 서열번호:1에 대해 적어도 90% 또는 91% 서열 동일성을 포함하는 FLO8 단백질은 코마가타엘라 기원의 것이다. 구체적으로, 서열번호:3을 포함하거나 또는 이로 이루어진 FLO8 단백질은 코마가타엘라 파스토리스 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 코마가타엘라 파스토리스다.
구체적으로, 서열번호:1에 대해 적어도 35% 서열 동일성을 포함하는 FLO8 단백질은 사카로마이세스 기원의 것이다. 구체적으로, 서열번호:5 또는 서열번호:6을 포함하거나 또는 이로 이루어진 FLO8 단백질은 에스. 세레비지애 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 에스. 세레비지애이다.
구체적으로, 서열번호:1에 대해 적어도 40% 또는 44% 서열 동일성을 포함하는 FLO8 단백질은 야로위아 기원의 것이다. 구체적으로, 서열번호:7을 포함하거나 또는 이로 이루어진 FLO8 단백질은 야로위아 리폴리티카 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 야로위아 리폴리티카이다.
구체적으로, 서열번호:1에 대해 적어도 30% 또는 34% 서열 동일성을 포함하는 FLO8 단백질은 오가타에아 기원의 것이다. 구체적으로, 서열번호:8을 포함하거나 또는 이로 이루어진 FLO8 단백질은 오가타에아 폴리모르파 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 오가타에아 폴리모르파이다.
구체적으로, 서열번호:1에 대해 적어도 25% 또는 26% 서열 동일성을 포함하는 FLO8 단백질은 아스페르길루스 기원의 것이다. 구체적으로, 서열번호:9를 포함하거나 또는 이로 이루어진 FLO8 단백질은 아스페르길루스 니게르 기원의 것이다. 구체적으로, 이러한 FLO8 단백질은 숙주 세포에 내인성인 유전자에 의해 암호화되며, 여기서 숙주 세포는 아스페르길루스 니게르이다.
구체적으로, 숙주 세포는 상기 FLO8 단백질을 암호화하는 상기 폴리뉴클레오티드의 전사 및/또는 번역을 감소시키고/시키거나, 달리 각각 상기 폴리뉴클레오티드의 발현을 감소시키고 상기 FLO8 단백질의 생산을 감소시키는 게놈 돌연변이(들)를 포함하는 하나 이상의 유전적 변형에 의해 유전적으로 변형된다.
구체적으로, 상기 하나 이상의 유전적 변형은 (i) 하나 이상의 내인성 폴리뉴클레오티드, 또는 이의 일부의 파괴, 치환, 결실 또는 녹아웃; 또는 (ii) 발현 제어 서열을 포함한다.
구체적 측면에 따르면, 상기 하나 이상의 유전적 변형은 예를 들어, 숙주 세포 종, 유형 또는 균주에서 자연 발생하는 FLO8 단백질, 특히 야생형(비변형 또는 천연) 단백질을 암호화하는 상기 폴리뉴클레오티드(또는 유전자)를 포함하는 코딩 폴리뉴클레오티드와 같은 본원에 기재된 숙주 세포의 하나 이상의 내인성 폴리뉴클레오티드의 변형이다.
구체적 측면에 따르면, 상기 하나 이상의 유전적 변형은 예를 들어, 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 중지 서열을 포함한 발현 제어 서열의 변형, 또는 인핸서 또는 활성인자 서열의 변형이다.
예를 들어, FLO8 단백질을 암호화하는 폴리뉴클레오티드의 파괴, 이러한 폴리뉴클레오티드에 작동가능하게 연결된 프로모터의 파괴, 이러한 프로모터를 더 낮은 프로모터 활성을 갖는 또 다른 프로모터로의 대체, 숙주 세포를 변형시키는 CRISPR 기반 방법에 사용되는 RNA 유도 리보뉴클레아제에 의해 관련 서열에 표적화된 각각의 전사 조절인자를 사용하는 것과 같이 이러한 폴리뉴클레오티드의 발현을 조절하는 조절 서열, 예를 들어, 프로모터, 리보솜 결합 부위, 전사 시작 또는 중지 서열, 번역 시작 또는 중지 서열, 인핸서 또는 활성인자 서열, 저해인자 또는 억제인자 서열, 신호 또는 리더 서열, 특히 단백질의 발현 및/또는 분비를 제어하는 것들로 이루어진 군으로부터 선택된 조절 서열의 변형 또는 조정(예를 들어, 활성화, 상향 조절, 불활성화, 억제, 또는 하향 조절)을 포함하는 숙주 세포를 조작하는 다양한 방법을 이용하여 내인성 폴리뉴클레오티드의 발현을 감소시킬 수 있다.
구체적으로, 상기 하나 이상의 유전적 변형은 이러한 유전적 변형이 없는 각각의 숙주와 비교하여, 예를 들어 유전자의 녹아웃에 의해 유전자 또는 유전자의 일부의 발현을 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%, 또는 이의 발현을 심지어 완전히 폐지함으로써 감소시키는 유전자 또는 게놈 서열의 결실 또는 불활성화는 포함하는 하나 이상의 게놈 돌연변이를 포함한다.
구체적으로, 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 구성적으로 손상시키거나 또는 달리 감소시키는 게놈 돌연변이를 포함한다.
구체적으로, 하나 이상의 유전적 변형은 하나 이상의 내인성 폴리뉴클레오티드의 발현을 조건부로 손상시키거나 또는 달리 감소시키는 하나 이상의 유도성 또는 억제성 조절 서열을 도입하는 게놈 돌연변이를 포함한다. 이러한 조건부 활성 변형은 특히 세포 배양 조건에 따라 활성이고/이거나 발현되는 조절 요소 및 유전자를 표적으로 한다.
구체적으로, 상기 하나 이상의 내인성 폴리뉴클레오티드의 발현이 감소되어 POI를 생산할 때 FLO8 단백질을 암호화하는 폴리뉴클레오티드의 발현을 감소시킨다. 구체적으로, 유전적 변형 시, 상기 FLO8 단백질의 발현은 POI가 생산되는 동안 숙주 세포 배양 조건 하에 감소된다.
구체적으로, 숙주 세포는 예를 들어, 유전자의 녹아웃에 의해 상기 FLO8 단백질의 양(예를 들어, 수준 또는 농도)을 상기 변형이 없는 숙주 세포와 비교하여 50%, 60%, 70%, 80%, 90%, 또는 95%, (mol/mol) 중 적어도 임의의 하나, 또는 심지어 100%, 예를 들어 검출불가능한 양으로 감소시켜 FLO8 단백질의 생산을 완전시 폐지하도록 유전적으로 변형된다. 구체적 구현예에 따르면, 숙주 세포는 (하나 이상의) 게놈 서열, 특히 FLO8 단백질 또는 이의 각각의 상동체를 암호화하는 게놈 서열의 하나 이상의 결실을 포함하도록 유전적으로 변형된다. 이러한 숙주 세포는 전형적으로 결실 또는 녹아웃 균주로 제공된다.
구체적 구현예에 따르면, 본원에 기재된 숙주 세포가 세포 배양물에서 배양되면, 숙주 세포 또는 숙주 세포 배양물에서 총 FLO8 단백질의 양은 이러한 유전적 변형이 없거나 또는 이전의 숙주 세포에 의해 발현되거나 또는 생산된 참조 양과 비교하여, 또는 각각의 숙주 세포 배양물에서 생산된 참조 양과 비교하여, 또는 상기 변형이 없거나 또는 이전의 숙주 세포와 비교하여 50%, 60%, 70%, 80%, 90%, 또는 95%, (mol/mol) 중 적어도 임의의 하나, 또는 심지어 100%, 예를 들어 검출불가능한 양으로 감소된다.
상기 FLO8 단백질의 생산을 감소시키는 상기 유전적 변형의 효과에 대해 본원에 기재된 숙주 세포를 비교할 때, 전형적으로 이러한 유전적 변형이 없거나 또는 이전의 비슷한 숙주 세포와 비교된다. 비교는 전형적으로 재조합 또는 이종 POI를 생산하도록 조작된 이러한 유전적 변형 없이, 특히 상기 POI를 생산하는 조건 하에 배양 될 때 동일한 숙주 세포 종 또는 유형으로 이루어진다. 그러나, 비교는 또한 재조합 또는 이종 POI를 생산하도록 추가로 조작되지 않은 동일한 숙주 세포 종 또는 유형으로 이루어질 수 있다.
구체적 측면에 따르면, 상기 FLO8 단백질 또는 이의 각각의 상동체의 감소는 세포에서 상기 FLO8 단백질의 양(예를 들어, 수준 또는 농도)의 감소에 의해 결정된다. 구체적으로, 상기 FLO8 단백질 또는 이의 각각의 상동체의 양은 웨스턴 블롯, 면역형광 이미징, 유세포 분석 또는 질량 분광법을 이용하는 것과 같은 적합한 방법에 의해 결정되며, 특히 여기서 질량 분광법은 예를 들어, Doneanu et al.(MAbs. 2012; 4(1): 24-44)에 의해 기재된 바와 같은 액체 크로마토그래피-질량 분광법(LC-MS), 또는 액체 크로마토그래피 탠덤-질량 분광법(LC-MS/MS)이다.
구체적 측면에 따르면, 재조합 숙주 세포는 단지 하나 또는 다수의 이종 발현 카세트, 예를 들어 상기 발현 카세트의 다수의 카피, 예컨대 적어도 2, 3, 4, 또는 5 개의 카피(유전자 카피 수, GCN)를 포함한다. 예를 들어, 재조합 숙주 세포는 최대 2, 3, 4, 또는 5 개의 카피를 포함한다. 각각의 카피는 동일하거나 또는 상이한 서열을 포함하거나 또는 이로 이루어질 수 있지만, GOI에 작동가능하게 연결된 ECP를 포함한다.
구체적 측면에 따르면, 이종 발현 카세트는 GOI에 작동가능하게 연결된 ECP를 포함하는 폴리뉴클레오티드의 인공 융합, 및 임의적으로 신호, 리더, 또는 종결인자 서열과 같은 추가 서열을 포함하거나 또는 이로 이루어진다. 구체적으로, 숙주 세포에 이종이거나 또는 인공인 발현 카세트가 사용되며, 특히 여기서 발현 카세트는 프로모터(ECP) 및 GOI를 포함하며, 여기서 프로모터 및 GOI는 서로 이종이고, 예를 들어 자연에서 이러한 조합으로 발생하지 않으며, 여기서 프로모터 및 GOI 중 하나(또는 단지 하나)는 다른 하나 및/또는 본원에 기재된 숙주 세포에 인공 또는 이종이며; 프로모터는 내인성 프로모터이고 GOI는 이종 GOI이거나; 또는 프로모터는 인공 또는 이종 프로모터이고 GOI는 내인성 GOI이며; 여기서 프로모터 및 GOI는 모두 인공이거나, 이종이거나 또는 상이한 기원, 예컨대 본원에 기재된 숙주 세포와 비교하여 세포의 상이한 종 또는 유형(균주)으로부터 유래한다. 구체적으로, ECP는 본원에 기재된 숙주 세포로 사용되는 세포에서 상기 GOI와 자연적으로 연관되지 않고/않거나 이에 작동가능하게 연결되지 않는다.
구체적 측면에 따르면, ECP는 성장-제한량의 비-메탄올 탄소 공급원의 존재 하에, 바람직하게는 메탄올의 부재 하에 유도가능하고; 성장-제한량보다 높은 과량의 비-메탄올 탄소 공급원의 존재 하에 억제가능하다. 구체적으로, 이종 발현 카세트에 의한 GOI 발현은 유도성 ECP에 의해 유도가능하다.
바람직하게는, ECP는 세포 배양 배지 또는 상청액에서 1, 1.5, 2, 2.5, 또는 3 g/L의 탄소 공급원 중 임의의 하나보다 높은 양의 존재 하에 억제되고(본원에서 프로모터-억제량으로 언급됨), 검출가능한 탄소 공급원이 없거나 또는 세포 배양 배지 또는 상청액에서 최대 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 또는 1.0 g/L 탄소 공급원 중 임의의 하나의 양의 존재 하에 유도되거나 또는 탈억제되는(본원에서 프로모터-유도량으로 언급됨) 것과 같이 조절가능한 탄소 공급원이다. 세포 배양 배지 또는 상청액에서 이러한 양은 특히 숙주 세포의 공급 및 숙주 세포에 의한 소비 시 검출가능할 수 있는 양으로 이해된다. 전형적으로, 성장-제한 조건 하에 POI를 생산할 때, 세포 배양물은 보충 탄소 공급원을 POI 생산 동안 세포에 의해 즉시 소비되는 양으로 첨가함으로써 공급되어, 이에 따라 세포 배양 배지 또는 상청액에 잔여량이 없거나 또는 적은 양, 예를 들어 최대 1.0 g/L의 양만이 남아있다.
구체적으로, ECP를 조절하는 탄소 공급원은 메탄올 이외의 임의의 것이며, 본원에서 비-메탄올 탄소 공급원으로 언급된다.
구체적으로, 비-메탄올 탄소 공급원은 탄수화물이다.
구체적으로, 비-메탄올 탄소 공급원은 사카라이드, 폴리올, 알코올, 또는 전술한 것 중 임의의 하나 이상의 혼합물로부터 선택된다.
구체적으로, 사카라이드는 헥소스, 예를 들어 글루코스, 프룩토스, 갈락토스 또는 만노스와 같은 모노사카라이드, 또는 사카로즈와 같은 디사카라이드; 또는 알코올 또는 폴리올 예를 들어, 에탄올, 또는 임의의 디올, 또는 트리올, 예를 들어, 글리세롤, 또는 전술한 것 중 임의의 것의 혼합물 중 임의의 하나 이상일 수 있다. 구체적으로, 임의의 이러한 비-메탄올 탄소 공급원은 ECP의 제어 하에 상기 POI를 생산하는 양으로 세포 배양에 사용될 수 있다.
구체적 측면에 따르면, ECP는 적어도 하나의 제1 및 적어도 하나의 제2 코어 조절 영역을 포함한다. 구체적으로, ECP는 상기 제1 및/또는 제2 코어 조절 영역 중 적어도 2 개를 포함한다. 구체적으로, ECP는 제한된 수의 상기 제1 및 제2 코어 조절 영역을 포함하며, 여기서 상기 제1 코어 조절 영역의 수는 단지 1, 2 또는 3 개이고, 상기 제2 코어 조절 영역의 수는 단지 1, 2 또는 3 개이다. 구체적으로, ECP는 예를 들어 동일한 수의 상기 제1 및 제2 코어 조절 영역을 포함하며, 여기서 상기 제1 코어 조절 영역의 수는 1 개이고, 상기 제2 코어 조절 영역의 수는 1 개이며; 여기서 상기 제1 코어 조절 영역의 수는 2 개이고, 상기 제2 코어 조절 영역의 수는 2 개이거나, 또는 여기서 상기 제1 코어 조절 영역의 수는 3 개이고, 상기 제2 코어 조절 영역의 수는 3 개이다.
구체적으로, 제1 코어 조절 영역은 서열번호:17에 대해 적어도 75% 서열 동일성, 예컨대 적어도 80%, 또는 적어도 90% 서열 동일성 중 적어도 임의의 하나를 갖고/갖거나, 제2 코어 조절 영역은 서열번호:18에 대해 적어도 75% 서열 동일성, 예컨대 적어도 80%, 또는 적어도 90% 서열 동일성 중 적어도 임의의 하나를 갖는다.
구체적으로, 제1 및 제2 코어 조절 영역 각각은 8-16 nt의 길이를 갖는다.
구체적으로, 제1 코어 조절 영역은 8 내지 10 nt, 특히 9 nt의 길이를 갖는다. 구체적으로, 제1 코어 조절 영역은 서열번호:17, 또는 서열번호:17로 식별된 뉴클레오티드 서열의 변형을 포함하거나 또는 이로 이루어지며, 여기서 변형은 최대 1 또는 2 개의 점 돌연변이이며, 특히 여기서 1 개의 점 돌연변이는 하나의 뉴클레오티드의 치환, 삽입, 또는 결실 중 임의의 하나이다.
구체적으로, 제2 코어 조절 영역은 14 내지 16 nt, 특히 15 nt의 길이를 갖는다. 구체적으로, 제2 코어 조절 영역은 서열번호:18, 또는 서열번호:18로 식별된 뉴클레오티드 서열의 변형을 포함하거나 또는 이로 이루어지며, 여기서 변형은 최대 1, 2 또는 3 개의 점 돌연변이이며, 특히 여기서 1 개의 점 돌연변이는 하나의 뉴클레오티드의 치환, 삽입, 또는 결실 중 임의의 하나이다.
구체적으로, ECP는 적어도 하나의 제1 및 적어도 하나의 제2 코어 조절 영역을 임의의 순서로, 바람직하게는 서로 아주 근접하여, 예를 들어 가장 가까운 제1 및 제2 코어 조절 영역 사이의 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 또는 10 nt 중 임의의 하나까지 포함한다.
구체적으로, ECP는 스페이서를 통해 연결되며, 특히 5, 6, 7, 8, 9, 10 nt 중 적어도 임의의 하나, 및/또는 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 또는 10 중 임의의 하나까지의 길이를 갖는 뉴클레오티드 서열(본원에서 "스페이서 코어 영역"으로 언급됨)에 의해 분리되는 하나의 제1 및 하나의 제2 코어 조절 영역을 포함한다. 특히, 스페이서 코어 영역은 서열번호:36에 대해 적어도 75% 서열 동일성, 예컨대 적어도 80%, 또는 적어도 90% 서열 동일성 중 적어도 임의의 하나를 갖고/갖거나, 서열번호:36, 또는 서열번호:36으로 식별된 뉴클레오티드 서열의 변형을 포함하거나 또는 이로 이루어지며, 여기서 변형은 4 개의 점 돌연변이 중 최대 1, 2, 3 개이며, 특히 여기서 1 개의 점 돌연변이는 하나의 뉴클레오티드의 치환, 삽입, 또는 결실 중 임의의 하나이다. 구체적으로, 스페이서 코어 영역은 뉴클레오티드 서열을 포함하거나 또는 이로 이루어지며 여기서 대부분의 뉴클레오티드(적어도 50% 또는 적어도 60%)는 G, C, 또는 T로부터 선택된다.
구체적으로, ECP는 5'-단부에서 3'단부까지 다음 3 개의 인접한 요소, (i) 제1 코어 조절 영역, (ii) 스페이서 코어 영역, 및 (iii) 제2 코어 조절 영역으로 이루어진 뉴클레오티드 서열로 이루어진 적어도 하나의 영역을 포함하며, 이는 본원에서 "주 조절 영역"으로 언급된다.
구체적으로, ECP는 적어도 하나의 또는 2 개, 또는 단지 1 또는 2 개의 주 조절 영역을 포함하며, 각각은 서열번호:35에 대해 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖는 뉴클레오티드 서열을 포함하거나 또는 이로 이루어진다. 이러한 주 조절 영역은 바람직하게는 제1 코어 조절 영역, 스페이서 코어 영역 및 제2 코어 조절 영역으로 이루어진다.
구체적으로, ECP는 서열번호:35에 대해 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖는 적어도 하나의 폴리뉴클레오티드 서열을 포함한다.
구체적으로, ECP는 본원에 기재된 바와 같이 단지 1, 2 또는 3 개의 주 조절 영역을 포함하며, 특히 여기서 주 조절 영역의 수는 2 또는 3 개이며, 여기서 상기 2 또는 3 개의 조절 영역은 서로 동일하거나 또는 상이할 수 있다. 구체적으로, ECP는 단지 2 개의 주 조절 영역을 포함하며, 이는 50, 60, 70, 80, 90, 100 nt 중 적어도 임의의 하나, 및/또는 500, 450, 400, 350, 또는 300 nt 중 임의의 하나까지, 특히 100 내지 300 nt 범위의 길이를 갖는 뉴클레오티드 서열(본원에서 "스페이서 주 영역"으로 언급됨)에 의해 분리된다. 구체적으로, 스페이서 주 영역은 서열번호:37에 대해 적어도 60% 서열 동일성, 예컨대 적어도 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖고/갖거나 서열번호:37, 또는 서열번호:37로 식별된 뉴클레오티드 서열의 변형을 포함하거나 또는 이로 이루어진 50, 60, 70, 80, 90, 100 nt 길이 중 적어도 임의의 하나의 뉴클레오티드 서열을 포함하며, 여기서 변형은 하나 이상, 최대 30, 25, 20, 15, 또는 10 개의 점 돌연변이 중 임의의 하나인 점 돌연변이의 수이며, 특히 여기서 1 개의 점 돌연변이는 하나의 뉴클레오티드의 치환, 삽입, 또는 결실 중 임의의 하나이다.
구체적 측면에 따르면, ECP는 뉴클레오티드 서열로 이루어진 적어도 하나의 T 모티프를 포함하며 여기서 대다수의 뉴클레오티드는 티민(T)이며, 예를 들어 바람직하게는 50%, 60%, 70%, 80%, 90% 또는 100% 중 적어도 임의의 하나는 T이며, 임의적으로 상기 T 모티프의 5' 또는 3' 단부 중 어느 하나에서 하나 이상의 추가(또는 인접한) 티민에 의한 상기 T 모티프의 연장 없이, 서열번호:19-34 중 임의의 하나를 포함하거나 또는 이로 이루어진다.
구체적으로, ECP는 상기 T 모티프 중 단지 1 또는 2 개, 또는 상기 T 모티프의 적어도 2 개, 최대 4 개, 또는 3 개의 T 모티프를 포함하며, 여기서 상기 T 모티프는 서로 동일하거나 또는 상이하다.
구체적으로, ECP는 주 조절 영역의 상류 또는 하류에 있는 T 모티프 중 적어도 하나, 예를 들어, 주 조절 영역의 상류에 있는 1 개(또는 1 또는 2 개)의 T 모티프 및 하류에 있는 1 개(또는 1 또는 2 개)의 T 모티프를 포함한다. 그러나, 구체적 구현예에 따르면, ECP는 상기 T 모티프 중 적어도 하나, 특히 스페이서 주 영역 내에 단지 1 또는 2 개의 T 모티프를 포함한다.
구체적으로, ECP는 예를 들어, 350, 400, 450, 500, 550, 600, 650, 700, 850, 900, 950, 또는 1000 bp 중 적어도 임의의 하나, 최대 2000 bp, 또는 최대 1500 bp의 길이를 갖는다.
구체적으로, ECP는 예를 들어 번역 개시 부위의 적어도 일부를 포함하는 3'-말단을 포함하여 최대 50, 40, 30, 20, 10, 9, 8, 7, 6, 또는 5 nt 길이의 3'-말단 뉴클레오티드 서열, 예를 들어 서열번호:38, 서열번호:39, 또는 서열번호:40 중 임의의 하나와 60%, 70%, 80%, 85% 또는 적어도 90% 중 적어도 임의의 하나와 동일한 서열을 포함한다. 번역 개시 부위는 진핵생물에서 Kozak 공통 서열 및 유전자 발현을 지지하기에 적합한 프로모터 서열일 수 있다.
구체적 측면에 따르면, ECP는 특히 전장이 1000 nt 미만인 경우, 전술한 뉴클레오티드 서열 중 임의의 것의 전장까지 서열 서열번호:10, 서열번호:11, 서열번호:12, 서열번호:13, 서열번호:14, 서열번호:15, 또는 서열번호:16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나의 전사 인자 결합 부위(TFBS)를 포함하는 영역 내, 및/또는 3' 단부를 포함하는 3' 말단 서열 내에서, 예를 들어, 적어도 300(연속적) nt, 특히 300, 350, 400, 450, 500, 550, 600, 650, 700, 850, 900, 950, 또는 1000 nt 중 적어도 임의의 하나에 대해 60%, 65%, 70%, 75%, 또는 80% 서열 동일성 중 적어도 임의의 하나, 특히 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 포함하거나, 또는 100% 동일하다.
구체적 측면에 따르면, ECP는 전장 서열 서열번호:10, 서열번호:11, 서열번호:12, 서열번호:13, 서열번호:14, 서열번호:15, 또는 서열번호:16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나에 대해 60%, 65%, 70%, 75%, 또는 80% 서열 동일성 중 임의의 하나, 특히 85%, 90%, 또는 95% 서열 동일성 중 임의의 하나를 포함하거나, 또는 100% 동일하다.
구체적 구현예는 서열번호:10 또는 서열번호:11을 포함하거나 또는 이로 이루어지거나 또는 각각 서열번호:10, 서열번호:11, 서열번호:12, 서열번호:13, 서열번호:14, 서열번호:15, 또는 서열번호:16의 전장 서열 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나에 대해 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 서열 동일성 중 적어도 임의의 하나를 갖거나, 또는 100% 동일한 뉴클레오티드 서열을 포함하거나 또는 이로 이루어진 ECP를 지칭한다.
구체적으로, ECP 프로모터는 300, 400, 500, 600, 700, 800, 900 또는 1000 bp 중 적어도 임의의 하나의 길이를 갖는 서열번호:10 또는 서열번호:11의 적어도 일부 또는 단편을 포함하거나 또는 이로 이루어지며, 특히 이는 TFBS 및/또는 3' 말단을 포함한다.
구체적으로, ECP의 제1 및 제2 코어 조절 영역, 또는 ECP의 주 조절 영역 중 임의의 것은 하나 이상의 TFBS를 함유한다. 구체적으로, ECP의 상기 제1 및 제2 코어 조절 영역 각각, 또는 상기 제1 및 제2 코어 조절 영역 모두 함께, 또는 상기 주 조절 영역 각각은 기능적으로 간주되고 각각의 전사 인자에 의해 인식되는 TFBS 또는 적어도 이의 일부를 포함한다.
구체적으로, TFBS는 Rgt1(예를 들어, 서열번호:47을 포함하거나 또는 이로 이루어짐), Cat8-1(예를 들어, 서열번호:48을 포함하거나 또는 이로 이루어짐) 및 Cat8-2(예를 들어, 서열번호:49를 포함하거나 또는 이로 이루어짐)로 이루어진 군으로부터 선택된 전사 인자 중 임의의 하나 이상에 의해 인식된다.
TFBS는 특정 공통 서열을 특징으로 하며, 이는 동일한 인자에 대해 달라질 수 있다. 특이적 전사 인자는 다음과 같이 식별된다:
Rgt1은 글루코스-반응성 전사 활성인자 및 저해인자이며 이는 여러 글루코스 수송체(HXT) 유전자의 발현을 조절한다. 피. 파스토리스의 Rgt1은 아미노산 서열 서열번호:47을 포함한다.
Cat8-1 및 Cat8-2는 비발효성 성장 조건 하에 다양한 유전자의 탈억제에 필요한 탄소 공급원 반응 요소에 결합하는 아연 클러스터 전사 활성인자이다. 피. 파스토리스의 Cat8-1 및 Cat8-2는 각각 아미노산 서열 서열번호:48 및 서열번호:49를 포함한다.
구체적 측면에 따르면, ECP는 적어도 2, 3, 4, 5, 6, 7 또는 8 개의 TFBS를 포함하며, 여기서 각각의 TFBS는 Rgt1, Cat8-1 또는 Cat8-2 중 임의의 것에 의해 개별적으로 인식된다.
구체적으로, ECP는 참조 프로모터와 비교하여 증가된 프로모터 강도를 특징으로 하며, 여기서
- 프로모터 강도는 참조 프로모터의 프로모터 강도와 동일하거나 또는 더 높으며, 특히 유도된 상태에 있을 때 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 2.1-배, 2.2-배, 2.3-배, 2.4-배, 2.5-배, 2.6-배, 2.7-배, 2.8-배, 2.9-배, 3-배, 3.3-배, 3.5-배, 3.8-배, 4-배, 4.5-배, 5-배, 5.5-배, 또는 적어도 6-배 중 적어도 임의의 하나로 증가된다.
특히, 숙주 세포의 천연 pGAP 프로모터, 구체적으로 재조합 POI 생산에 사용되는 숙주 세포에 내인성이고 자연 발생하는 pGAP 프로모터, 예를 들어, 서열번호:46을 포함하거나 또는 이로 이루어진 피. 파스토리스에서 GAPDH의 발현을 제어하는 데 사용되는 바와 같은 피. 파스토리스의 천연 pGAP 프로모터는 개선된 ECP 프로모터 강도를 결정하기 위해 피. 파스토리스 숙주 세포에서 참조로서 역할을 할 수 있다. 이러한 참조 프로모터는 동일한 숙주 세포 및 발현 시스템을 사용하는 동시 실험에 사용되거나, 또는 동일한 숙주 세포 배양물 내에서 내부 대조군으로 사용될 수 있다. 참조 프로모터와 비교하여 프로모터 기능을 한정하는 이러한 대조 실험은 바람직하게는 피. 파스토리스 숙주 세포 배양물, 특히 GFP 또는 eGFP와 같은 모델 단백질을 발현하는 재조합 피. 파스토리스에서 수행된다. 참조 프로모터 강도와 비교하여 프로모터 강도는 다음 표준 검정에 의해 결정될 수 있다: 시험될 프로모터의 제어 하에 eGFP를 발현하는 피. 파스토리스 균주를 웰 당 2 mL 배양물과 함께 280 rpm으로 진탕하면서 25℃에서 24-깊은 웰 플레이트에서 스크리닝한다. 글루코스 공급 비드(6mm, Kuhner, 스위스 소재)를 사용하여 글루코스-제한 성장 조건을 생성한다. 세포를 유도된 상태(YP + 1 공급 비드, 20-28 시간 동안)에서 eGFP 발현에 대해 분석한다.
구체적 측면에 따르면, 본원에 기재된 ECP의 상대적 프로모터 또는 전사 강도 또는 속도는 POI를 생산하기 위해 숙주로 사용되는 동일한 종 또는 균주의 세포의 천연 pGAP 프로모터와 비교된다.
구체적으로, 참조 프로모터는 숙주 세포의 천연 pGAP 프로모터이다. 예를 들어, 피. 파스토리스(GS115)에서 GAPDH의 발현을 제어하는 데 사용될 때, 예를 들어 서열번호:46으로 식별된 서열을 포함하거나 또는 이로 이루어진 피. 파스토리스에서 비변형된 내인성 프로모터 서열인 피. 파스토리스의 천연 pGAP 프로모터가 피. 파스토리스에서 참조 프로모터로서 사용될 수 있다. 피. 파스토리스가 본원에 기재된 바와 같이 POI를 생산하기 위한 재조합 숙주 세포로서 사용되는 경우, 본원에 기재된 ECP의 전사 강도 또는 속도는 피. 파스토리스의 이러한 천연 pGAP 프로모터와 편리하게 비교된다.
피. 파스토리스(GS115)의 예시적인 천연 pGAP 프로모터 서열(서열번호:46)
또 다른 예에 따르면, 에스. 세레비지애의 천연 pGAP 프로모터는 에스. 세레비지애에서 GAPDH의 발현을 제어하는 데 사용될 때, 에스. 세레비지애에서 비변형된 내인성 프로모터 서열인 참조 프로모터로서 사용될 수 있다. 에스. 세레비지애가 본원에 기재된 바와 같이 POI를 생산하기 위한 재조합 숙주 세포로서 사용되는 경우, 본원에 기재된 ECP의 전사 강도 또는 속도는 에스. 세레비지애의 이러한 천연 pGAP 프로모터와 편리하게 비교된다.
구체적으로, 프로모터 강도는 참조 프로모터와 비교하여 모델 단백질(예를 들어, 녹색 형광 단백질, 예를 들어, 향상된 GFP를 포함한 GFP, eGFP, Gene Bank 수탁 번호 U57607)과 같은 POI의 발현 수준, 및/또는 전사 강도에 의해 결정된다. 바람직하게는, 전사 분석은 정량적 또는 반정량적이며, 바람직하게는 qRT-PCR, DNA 마이크로어레이, RNA 서열분석 및 전사체 분석을 이용한다.
구체적으로, ECP는 추가로 억제된 상태에서의 낮은 수준과 비교하여, 완전히 유도된 상태에서의 높은 강도를 특징으로 하는 프로모터 유도비를 특징으로 한다.
프로모터 유도비는 구체적으로 전사의 유도를 지칭하며, 구체적으로 상기 POI의 추가 번역 및 임의적 발현을 포함한다. 전사는 전형적으로 프로모터 강도의 측정으로 결정되며 구체적으로 상기 프로모터를 완전히 유도할 때 수득된 전사체의 양을 지칭한다. 상기 전사체 풍부도는 완전히 유도된 상태에서의 전사 강도에 의해 결정될 수 있으며, 이는 예를 들어, 글루코스-제한된 케모스태트 배양 조건 하에 수득되고 참조 프로모터의 전사 속도와 관련하여 발현된다.
유도비는 ECP의 탄소 공급원 조절을 결정하는 주요 매개변수이며, 유도된 상태에서 프로모터 활성 또는 강도를 억제된 상태에서 프로모터 활성 또는 강도와 비교하여 설정한다. 예를 들어, 리포터 단백질(예를 들어, GFP 또는 eGFP)의 발현 수준 및/또는 억제된 상태에서 전사 수준은 과잉 글리세롤에 의해 억제될 때 결정되고, 모델 단백질의 발현 수준 및/또는 전사 수준은 글루코스 공급을 제한함으로써 유도될 때 유도된 상태에서 결정된다.
ECP 프로모터는 배양 조건이 거의 최대 유도, 예를 들어 0.4 g/L 미만, 바람직하게는 0.04 g/L 미만, 구체적으로 0.02 g/L 미만의 글루코스 농도에서 제공되는 경우 탈억제되고 완전히 유도되는 것으로 간주된다. 완전히 유도된 프로모터는 천연 pGAP 프로모터와 비교하여 바람직하게는 적어도 20%, 보다 바람직하게는 적어도 30%, 40%, 50%, 60%, 70%, 80%, 90% 및 적어도 100%의 전사 수준/강도 또는 적어도 150% 또는 적어도 200%의 훨씬 더 높은 전사 수준/강도를 나타낸다. 전사 수준/강도는 예를 들어 액체 배양물에서 클론을 배양할 때 eGFP와 같은 리포터 유전자의 전사 양에 의해 결정될 수 있다. 대안적으로, 전사 속도는 마이크로어레이 상에서 고유하게 제어된 유전자의 전사 강도에 의해 결정될 수 있으며, 여기서 마이크로어레이 데이터는 억제 및 탈억제 상태 사이의 발현 수준 차이 및 대조군과 비교하여 완전히 유도된 상태에서 높은 신호 강도를 나타낸다.
구체적으로, 유도비는 유도된 상태 대 억제된 상태에서 발현 수준의 (예를 들어 GFP 또는 eGFP와 같은 모델 단백질의) 비율에 의해 결정될 수 있다. 참조 프로모터와 비교하여 유도비는 다음 표준 검정에 의해 결정될 수 있다: 테스트될 프로모터의 제어 하에 eGFP를 발현하는 피. 파스토리스 균주를 웰 당 2 mL 배양물과 함께 280 rpm으로 진탕하면서 25℃에서 24-깊은 웰 플레이트에서 스크리닝한다. 글루코스 공급 비드(6mm, Kuhner, 스위스 소재)를 사용하여 글루코스-제한 성장 조건을 생성한다. 세포를 억제(YP + 1% 글리세롤, 대수증식기) 및 유도(YP + 1 공급 비드, 20-28 시간 동안) 동안 eGFP 발현에 대해 분석한다.
구체적으로, ECP 프로모터는 탈억제된(유도된) 상태에서 프로모터 활성 또는 강도(예를 들어, 전사 활성 또는 전사 강도)를 가지며, 이는 억제된 상태에서보다 1.5, 2.0, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 또는 10 배 중 적어도 임의의 하나로 더 높다. 따라서, 각각의 유도 속도는 1.5, 2.0, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 또는 10 중 적어도 임의의 하나일 수 있다.
놀랍게도 flo8 유전자좌를 포함하고 FLO8 단백질을 생산하는 야생형 균주와 비교하여 flo8 녹아웃 균주에서 본원에 기재된 ECP의 전사 활성(또는 전사 강도)(완전히 유도된 경우, 예를 들어 글루코스-제한 유도 조건 하에)은 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 또는 10-배 이상 중 적어도 임의의 하나와 같이 훨씬 더 높은 것으로 밝혀졌다. 본원에 기재된 숙주 세포에서 전사 강도는 상당히 증가하여 flo8 결실 돌연변이체에서 ECP의 제어 하에 GOI의 높은 발현 수준을 허용하는 것으로 밝혀졌다. 대조적으로, pGAP 또는 pAOX로부터의 전사는 flo8 결실 돌연변이체에서 증가하지 않는다(비교예에서 결정된 바와 같음).
구체적 측면에 따르면, 이종 발현 카세트는 자율 복제 벡터 또는 플라스미드에 포함되거나, 또는 상기 숙주 세포의 염색체 내에서 통합된다.
발현 카세트는 숙주 세포에 도입되고 예를 들어 특정 통합 부위에서 또는 무작위로 통합된 염색체내 요소로서 숙주 세포 게놈(또는 이의 염색체 중 임의의 것)에 통합될 수 있으며, 그 결과 높은 생산자 숙주 세포주가 선택된다. 대안적으로, 발현 카세트는 플라스미드 또는 인공 염색체 예를 들어, 효모 인공 염색체(YAC)와 같은 염색체외 유전적 요소 내에서 통합될 수 있다. 구체적 예에 따르면, 발현 카세트는 적합한 형질전환 기술에 의해 숙주 세포에 도입되는 벡터, 특히 발현 벡터에 의해 숙주 세포에 도입된다. 이 목적을 위해, GOI는 발현 벡터로 결찰될 수 있다.
바람직한 효모 발현 벡터(효모에서 발현을 위해 바람직하게 사용되는 것)는 pPICZ, pGAPZ, pPIC9, pPICZ알파, pGAPZ알파, pPIC9K, pGAPHis, pPUZZLE 또는 GoldenPiCS로부터 유래된 플라스미드로 이루어진 군으로부터 선택된다.
벡터 또는 플라스미드를 도입하기 위해 숙주 세포를 형질감염 또는 형질전환시키는 기술은 당업계에 잘 알려져 있다. 이들은 전기천공법, 세포벽불완전제거(spheroplasting), 지질 소포 매개 흡수, 열 충격 매개 흡수, 칼슘 포스페이트 매개 형질감염(칼슘 포스페이트/DNA 공침전), 바이러스 감염, 및 특히, 예를 들어, 변형된 아데노바이러스, 미세주사 및 전기천공법과 같은 변형된 바이러스를 사용하는 것을 포함할 수 있다.
본원에 기재된 바와 같은 형질전환체는 발현 카세트, 벡터 또는 플라스미드 DNA를 숙주 세포에 도입하고 관련 단백질 또는 선택 마커를 발현하는 형질전환체를 선택함으로써 수득될 수 있다. 숙주 세포는 전기 펄스 방법, 원형질체 방법, 리튬 아세테이트 방법, 및 이의 변형된 방법과 같은 숙주 세포의 형질전환에 통상적으로 사용되는 방법에 의해 이종 또는 외래 DNA를 도입하도록 처리될 수 있다. 피. 파스토리스는 바람직하게는 전기천공법에 의해 형질전환된다. 미생물에 의한 재조합 DNA 단편의 흡수를 위한 바람직한 형질전환 방법은 화학적 형질전환, 전기천공법 또는 원형질체 형성에 의한 형질전환을 포함한다.
구체적으로, 발현 카세트는 POI를 암호화하는 GOI에 작동가능하게 연결된 ECP를 포함하며, 임의적으로 분비된 단백질로서 POI를 발현 및 생산하는 데 필요한 신호 및 리더 서열을 추가로 포함한다.
구체적 측면에 따르면, 발현 카세트는 바람직하게는 POI의 분비를 가능하게 하는 신호 펩티드를 암호화하는 뉴클레오티드 서열을 추가로 포함하며 여기서 신호 펩티드를 암호화하는 뉴클레오티드 서열은 GOI의 5'-단부에 인접하게, 또는 직접적으로 융합된다.
구체적으로, 신호 펩티드는 피. 파스토리스 산 포스파타제 유전자(PHO1) 및 세포외 단백질 X(EPX1)로부터의 신호 펩티드인 에스. 세레비지애 알파-결합 인자 전전구 펩티드로부터의 신호 서열로 이루어진 군으로부터 선택된다(Heiss, S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich & B. Gasser, Microbiology 2015;161(7):1356-68).
구체적으로, WO2014067926 A1에 기재된 바와 같은 신호 및/또는 리더 서열 중 임의의 것, 특히 서열번호:59 또는 서열번호:60이 사용될 수 있다.
구체적으로, WO2012152823 A1에 기재된 바와 같은 신호 서열, 특히 서열번호:61로 식별된 에스. 세레비지애의 천연 알파 결합 인자, 또는 이의 돌연변이체의 신호 서열이 사용될 수 있다.
구체적 측면에 따르면, 본원에 기재된 숙주 세포는 예를 들어 단백질 생산을 개선하기 위해 하나 이상의 추가의 유전적 변형을 겪을 수 있다.
구체적으로, 숙주 세포는 프로테아제 결핍 균주, 특히 카복시펩티다제 Y 활성이 결핍된 균주를 생성하는 데 사용되는 단백질 가수분해 활성에 영향을 미치는 하나 이상의 유전자를 변형시키도록 추가로 조작된다. 특정 예는 WO1992017595A1에 기재되어 있다. 프로테아제 A 또는 프로테아제 B와 같은 배큘로 프로테아제의 기능적 결핍이 있는 프로테아제 결핍 피키아 균주의 추가 예는 US6153424A에 기재되어 있다. 추가 예는 ade2 결실을 갖는 피키아 균주이고/이거나, 프로테아제 유전자인 PEP4 및 PRB1 중 하나 또는 둘 다의 결실은 예를 들어, ThermoFisher Scientific에 의해 제공된다.
구체적으로, 숙주 세포는 WO2010099195A1에 개시된 바와 같이, PEP4, PRB1, YPS1, YPS2, YMP1, YMP2, YMP1, DAP2, GRHl, PRD1, YSP3, 및 PRB3으로 이루어진 군으로부터 선택된 기능적 유전자 산물, 특히 프로테아제를 암호화하는 적어도 하나의 핵산 서열울 변형하도록 조작된다.
헬퍼 인자를 암호화하는 유전자의 과발현 또는 과소발현은 구체적으로 예를 들어 WO2015158800A1에 기재된 바와 같이 GOI의 발현을 향상시키기 위해 적용된다.
다음 유전자의 과발현은 피. 파스토리스에서 POI 분비를 증가시키는 것으로 나타났다: PP7435_Chr3-0607, PP7435_Chr3-0933, PP7435_Chr2-0220, PP7435_Chr3-0639, PP7435_Chr4-0108, PP7435_Chr1-1232, PP7435_Chr1-1225, PP7435_Chr1-0667, 및 PP7435_Chr4-0448.
다음 유전자의 과소발현은 피. 파스토리스에서 POI 분비를 증가시키는 것으로 나타났다: PP7435_Chr1-0176, PP7435_Chr3-1062, 및 PP7435_Chr4-0252.
특히, 숙주 세포는 헬퍼 인자 중 임의의 하나 이상을 과발현하고 서열번호:62-71 중 임의의 하나에 의해 식별된 각각의 단백질의 생산을 증가시키도록 조작되어, POI 수율을 추가로 증가시킬 수 있다. POI는 진핵, 원핵 또는 합성 펩티드, 폴리펩티드, 단백질, 또는 숙주 세포의 대사산물 중 임의의 하나일 수 있다.
구체적으로, POI는 숙주 세포 종에 이종이다.
구체적으로, POI는 분비된 펩티드, 폴리펩티드, 또는 단백질이며, 즉 숙주 세포에서 세포 배양 상청액으로 분비된다.
구체적으로, POI는 진핵 단백질, 바람직하게는 인간 단백질 또는 인간 단백질 서열을 포함하는 단백질과 같은 포유류 유래 또는 관련 단백질, 또는 박테리아 단백질 또는 박테리아 유래 단백질이다.
바람직하게는, POI는 포유동물에서 기능하는 치료 단백질이다.
구체적 경우에, POI는 다량체 단백질, 구체적으로 이량체 또는 사량체이다.
구체적 측면에 따르면, POI는 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물 - 단백질 접합체, 구조적 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소, 및 대사 효소로 이루어진 군으로부터 선택된 펩티드 또는 단백질이다.
구체적으로, 항원 결합 단백질은 하기로 이루어진 군으로부터 선택된다:
a) 항체 또는 항체 단편, 예컨대 키메라 항체, 인간화 항체, 이중특이적 항체, Fab, Fd, scFv, 디아바디(diabody), 트리아바디(triabody), Fv 사량체, 미니바디(minibody), VH, VHH, IgNAR, 또는 V-NAR과 같은 단일-도메인 항체 중 임의의 것;
b) 항체 모방체, 예컨대 아드넥틴(Adnectin), 아피바디(Affibody), 아필린(Affilin), 아피머(Affimer), 아피틴(Affitin), 알파바디(Alphabody), 안티칼린(Anticalin), 아비머(Avimer), DARPin, 피노머(Fynomer), 쿠니츠(Kunitz) 도메인 펩티드, 모노바디(Monobody), 또는 NanoCLAMPS; 또는
c) 하나 이상의 면역글로불린-폴드 도메인, 항체 도메인 또는 항체 모방체를 포함하는 융합 단백질.
특이적 POI는 항체, 또는 이의 단편, 특히 항원 결합 도메인을 포함하는 항체 단편과 같은 항원 결합 분자이다. 특이적 POI 중에는 모노클로날 항체(mAb), 면역글로불린(Ig) 또는 면역글로불린 클래스 G(IgG), 중쇄 항체(HcAb's)와 같은 항체, 또는 단편-항원 결합(Fab), Fd, 단일-쇄 가변 단편(scFv)과 같은 이의 단편, 또는 예를 들어 Fv 이량체(디아바디), Fv 삼량체(트리아바디), Fv 사량체, 또는 미니바디 및 VH, VHH, IgNAR, 또는 V-NAR과 같은 단일-도메인 항체와 같은 이의 조작된 변이체, 또는 면역글로불린-폴드 도메인을 포함하는 임의의 단백질이 있다. 추가의 항원 결합 분자는 예를 들어, 조작된 쿠니츠 도메인, 아드넥틴, 아피바디, 아필린, 안티칼린, 또는 DARPin과 같은 항체 모방체, 또는 (대체) 스캐폴드 단백질로부터 선택될 수 있다.
구체적 측면에 따르면, POI는 예를 들어 다음과 같다: 보톡스(BOTOX), 마이오블록(Myobloc), 뉴로블록(Neurobloc), 디스포트(Dysport)(또는 모툴리눔 신경독소의 다른 혈청형), 알글루코시다제 알파, 답토마이신, YH-16, 코리오고나도트로핀 알파, 필그라스팀, 세트로렐릭스, 인터류킨-2, 알데스류킨, 테셀류린, 데닐류킨 디프티톡스, 인터페론 알파-n3(주사), 인터페론 알파-nl, DL-8234, 인터페론, 선토리(Suntory)(감마-1a), 인터페론 감마, 티모신 알파 1, 타소네르민, DigiFab, ViperaTAb, EchiTAb, CroFab, 네시리티드, 아바타셉트, 알레파셉트, 레비프(Rebif), 엡토테르민알파, 테리파라티드(골다공증), 칼시토닌 주사용(골 질환), 칼시토닌(비강, 골다공증), 에타네르셉트, 헤모글로빈 글루타머 250(소), 드로트레코긴 알파, 콜라게나제, 카르페리티드, 재조합 인간 상피 성장 인자(국소 겔, 상처 치유), DWP401, 다르베포에틴 알파, 에포에틴 오메가, 에포에틴 베타, 에포에틴 알파, 데시루딘, 레피루딘, 비발리루딘, 노나코그 알파, 모노닌(Mononine), 엡타코그 알파(활성화), 재조합 인자 VIII+VWF, 레콤비네이트(Recombinate), 재조합 인자 VIII, 인자 VIII(재조합), 알픈메이트(Alphnmate), 옥토코그 알파, 인자 VIII, 팔리페르민, 인디키나제, 테넥테플라제, 알테플라제, 파미테플라제, 레테플라제, 나테플라제, 몬테플라제, 폴리트로핀 알파, rFSH, hpFSH, 미카푼긴, 페그필그라스팀, 레노그라스팀, 나르토그라스팀, 세르모렐린, 글루카곤, 엑세나티드, 프람린티드, 이니글루세라제, 갈술파제, 류코트로핀(Leucotropin), 몰그라모스티른, 트립토렐린 아세테이트, 히스트렐린(피하 이식, Hydron), 데슬로렐린, 히스트렐린, 나파렐린, 류프롤리드 지속 방출 데포(ATRIGEL), 류프롤리드 이식(DUROS), 고세렐린, 유트로핀(Eutropin), KP-102 프로그램, 소마트로핀, 메카세르민(성장 부전), 엔파비르티드, Org-33408, 인슐린 글라르긴, 인슐린 글룰리신, 인슐린(흡입), 인슐린 리스포, 인슐린 데테르니르, 인슐린(협측, RapidMist), 메카세르민 린파베이트, 아나킨라, 셀몰류킨, 99 mTc-아프시티드 주사, 마이어로피드, 베타세론, 글라티라머 아세테이트, 게폰(Gepon), 사르그라모스팀, 오프렐베킨, 인간 백혈구 유래 알파 인터페론, 빌리브(Bilive), 인슐린(재조합), 재조합 인간 인슐린, 인슐린 아스파르트, 메카세닌, 로페론(Roferon)-A, 인터페론-알파 2, 알파페론(Alfaferone), 인터페론 알파콘-1, 인터페론 알파, 아노벡스(Avonex)의 재조합 인간 황체형성 호르몬, 도르나제 알파, 트라페르민, 지코노티드, 탈티렐린, 디보테르민알파, 아토시반, 베카플레르민, 엡티피바티드, 제마이라(Zemaira), CTC-111, Shanvac-B, HPV 백신(4가), 옥트레오티드, 란레오티드, 안세스티른, 아갈시다제 베타, 아갈시다제 알파, 라로니다제, 프레자티드 구리 아세테이트(국소 겔), 라스부리카제, 라니비주맙, 악티뮨(Actimmune), PEG-인트론, 트리코민(Tricomin), 재조합 집먼지 진드기 알레르기 둔감화 주사, 재조합 인간 부갑상선 호르몬(PTH) 1-84(sc, 골다공증), 에포에틴 델타, 유전자이식 항트로빈 III, 그란디트로핀(Granditropin), 비트라제(Vitrase), 재조합 인슐린, 인터페론-알파(경구 로젠지), GEM-21S, 바프레오티드, 이두르술파제, 옴나파트리라트, 재조합 혈청 알부민, 세르톨리누맙 페골, 글루카르피다제, 인간 재조합 C1 에스테라제 억제제(혈관부종), 라노테플라제, 재조합 인간 성장 호르몬, 엔푸비르티드(무바늘 주사, Biojector 2000), VGV-1, 인터페론(알파), 루시낙탄트, 아비프타딜(흡입, 폐 질환), 이카티반트, 에칼란티드, 오미가난, 아우로그랍(Aurograb), 펙시가난아세테이트, ADI-PEG-20, LDI-200, 데가렐릭스, 신트레델린베수도톡스, Favld, MDX-1379, ISAtx-247, 리가글루티드, 테리파라티드(골다공증), 티파코긴, AA4500, T4N5 리포솜 로션, 카투막소맙, DWP413, ART-123, 크리살린(Chrysalin), 데스모테플라제, 아메디플라제, 코리폴리트로핀알파, TH-9507, 테두글루티드, Diamyd, DWP-412, 성장 호르몬(지속 방출 주사), 재조합 G-CSF, 인슐린(흡입, AIR), 인슐린(흡입, Technosphere), 인슐린(흡입, AERx), RGN-303, DiaPep277, 인터페론 베타(C형 간염 바이러스 감염(HCV)), 인터페론 알파-n3(경구), 벨라타셉트, 경피성 인슐린 패치, AMG-531, MBP-8298, 세레셉트(Xerecept), 오페바칸, AIDSVAX, GV-1001, 림포스캔(LymphoScan), 란피르나제, 리폭시산(Lipoxysan), 루수풀티드, MP52(베타-트리칼슘포스페이트 캐리어, 골 재생), 흑색종 백신, 시플류셀-T, CTP-37, 인세기아(Insegia), 비테스펜, 인간 트롬빈(동결, 외과적 출혈), 트롬빈, TransMID, 알피메프라제, 푸리카제(Puricase), 테를리프레신(정맥내, 간신 증후군), EUR-1008M, 재조합 FGF-I(주사가능, 혈관 질환), BDM-E, 로티갑티드, ETC-216, P-113, MBI-594AN, 듀라마니신(흡입, 낭포성 섬유증), SCV-07, OPI-45, 엔도스타틴(Endostatin), 안지오스타틴(Angiostatin), ABT-510, 바우만 버트 억제제 농축액(Bowman Birk Inhibitor Concentrate), XMP-629, 99 mTc-Hynic-Annexin V, 카할라리드 F, CTCE-9908, 테베렐릭스(연장 방출), 오자렐릭스, 로르니뎁신, BAY-504798, 인터류킨4, PRX-321, 펩스캔(Pepscan), 이복타데킨, 락토페린, TRU-015, IL-21, ATN-161, 실렌기티드, 알부페론(Albuferon), 비파식스(Biphasix), IRX-2, 오메가 인터페론, PCK-3145, CAP-232, 파시레오티드, huN901-DMI, 난소암 면역요법 백신, SB-249553, Oncovax-CL, OncoVax-P, BLP-25, CerVax-16, 다중 에피토프 펩티드 흑색종 백신(MART-1, gp100, 티로시나제), 네미피티드, rAAT(흡입), rAAT(피부과용), CGRP(흡입, 천식), 페그수네르셉트, 티모신베타4, 플리티뎁신, GTP-200, 라모플라닌, GRASPA, OBI-1, AC-100, 살몬 칼시토닌(경구, 엘리겐), 칼시토닌(경구, 골다공증), 엑사모렐린, 카프로모렐린, 카르데바(Cardeva), 벨라페르민, 131I-TM-601, KK-220, T-10, 울라리티드, 데펠레스태트, 헤마티드, 크리살린(국소), rNAPc2, 재조합 인자 V111(페길화 리포솜), bFGF, 페길화 재조합 스타필로키나제 변이체, V-10153, 솔로라이시스 프롤리제(SonoLysis Prolyse), 뉴로백스(NeuroVax), CZEN-002, 섬 세포 신생 요법, rGLP-1, BIM-51077, LY-548806, 엑세나티드(제어 방출, Medisorb), AVE-0010, GA-GCB, 아보렐린, ACM-9604, 리나클로티드 에아세테이트, CETi-1, 헤모스팬(Hemospan), VAL(주사가능), 급속 작용 인슐린(주사가능, Viadel), 비강내 인슐린, 인슐린(흡입), 인슐린(경구, 엘리겐), 재조합 메틸오닐 인간 렙틴, 피트라킨라 피하 주사, 습진), 피트라킨라(흡입 건조 분말, 천식), 멀티킨(Multikine), RG-1068, MM-093, NBI-6024, AT-001, PI-0824, Org-39141, Cpn10(자가면역 질환/염증), 탈락토페린(국소), rEV-131(안과용), rEV-131(호흡기 질환), 경구 재조합 인간 인슐린(당뇨병), RPI-78M, 오프렐베킨(경구), CYT-99007 CTLA4-Ig, DTY-001, 발라테그래스트, 인터페론 알파-n3(국소), IRX-3, RDP-58, 타우페론(Tauferon), 담즙 염 자극 리파제, 메리스파제(Merispase), 알랄린 포스파타제, EP-2104R, 멜라노탄(Melanotan)-II, 브레멜라노티드, ATL-104, 재조합 인간 마이크로플라스민, AX-200, SEMAX, ACV-1, Xen-2174, CJC-1008, 디노르핀 A, SI-6603, LAB GHRH, AER-002, BGC-728, 말라리아 백신(비로좀, PeviPRO), ALTU-135, 파보바이러스 B19 백신, 인플루엔자 백신(재조합 뉴라미니다제), 말라리아/HBV 백신, 탄저병 백신, Vacc-5q, Vacc-4x, HIV 백신(경구), HPV 백신, 태트 톡소이드(Tat Toxoid), YSPSL, CHS-13340, PTH(1-34) 리포솜 크림(Novasome), 오스타볼린(Ostabolin)-C, PTH 유사체(국소, 건선), MBRI-93.02, MTB72F 백신(결핵), MVA-Ag85A 백신(결핵), FARA04, BA-210, 재조합 플래그 FIV 백신, AG-702, OxSODrol, rBetV1, Der-p1/Der-p2/Der-p7 알레르겐-표적화 백신(먼지 진드기 알레르기), PR1 펩티드 항원(백혈병), 돌연변이체 ras 백신, HPV-16 E7 리포펩티드 백신, 미로 백신(선암종), CML 백신, WT1-펩티드 백신(암), IDD-5, CDX-110, 펜트리스(Pentrys), 노렐린(Norelin), CytoFab, P-9808, VT-111, 이크로캅티드, 텔베르민(피부과용, 당뇨병성 족부 궤양), 루핀트리비르, 레티쿨로제, rGRF, HA, 알파-갈락토시다제 A, ACE-011, ALTU-140, CGX-1160, 안지오텐신 치료 백신, D-4F, ETC-642, APP-018, rhMBL, SCV-07(경구, 결핵), DRF-7295, ABT-828, ErbB2-특이적 면역독소(항암), DT3SSIL-3, TST-10088, PRO-1762, 콤보톡스(Combotox), 콜레시스토키닌-B/가스트린-수용체 결합 펩티드, 111In-hEGF, AE-37, 트라스니주맙-DM1, 길항제 G, IL-12(재조합), PM-02734, IMP-321, rhIGF-BP3, BLX-883, CUV-1647(국소), L-19 기반 방사선면역요법제(암), Re-188-P-2045, AMG-386, DC/1540/KLH 백신(암), VX-001, AVE-9633, AC-9301, NY-ESO-1 백신(펩티드), NA17.A2 펩티드, 흑색종 백신(펄스 항원 치료제), 전립선암 백신, CBP-501, 재조합 인간 락토페린(안구 건조), FX-06, AP-214, WAP-8294A(주사가능), ACP-HIP, SUN-11031, 펩티드 YY [3-36](비만, 비강내), FGLL, 아타시셉트, BR3-Fc, BN-003, BA-058, 인간 부갑상선 호르몬 1-34(비강, 골다공증), F-18-CCR1, AT-1100(셀리악병/당뇨병), JPD-003, PTH(7-34) 리포솜 크림(Novasome), 듀라마니신(안과용, 안구 건조), CAB-2, CTCE-0214, 글리코페길화 에리트로포이에틴, EPO-Fc, CNTO-528, AMG-114, JR-013, 인자 XIII, 아미노칸딘, PN-951, 716155, SUN-E7001, TH-0318, BAY-73-7977, 테베렐릭스(즉시 방출), EP-51216, hGH(제어 방출, Biosphere), OGP-I, 시푸비르티드, TV4710, ALG-889, Org-41259, rhCC10, F-991, 티모펜틴(폐 질환), r(m)CRP, 간선택적 인슐린, 수발린, L19-IL-2 융합 단백질, 엘라핀, NMK-150, ALTU-139, EN-122004, rhTPO, 트롬보포이에틴 수용체 작용제(혈소판감소증), AL-108, AL-208, 신경 성장 인자 길항제(통증), SLV-317, CGX-1007, INNO-105, 경구 테리파라티드(엘리겐), GEM-OS1, AC-162352, PRX-302, LFn-p24 융합 백신(Therapore), EP-1043, S 뉴모니애 소아 백신, 말라리아 백신, 수막염균 그룹 B 백신, 신생아 그룹 B 연쇄상구균 백신, 탄저병 백신, HCV 백신(gpE1+gpE2+MF-59), 중이염 요법, HCV 백신(코어 항원+ISCOMATRIX), hPTH(1-34)(경피성, ViaDerm), 768974, SYN-101, PGN-0052, 아비스쿰닌, BIM-23190, 결핵 백신, 다중 에피토프 티로시나제 펩티드, 암 백신, 엔카스팀, APC-8024, GI-5005, ACC-001, TTS-CD3, 혈관 표적 TNF(고형 종양), 데스모프레신(협측 제어 방출), 오네르셉트, 또는 TP-9201, 아달리무맙(HUMIRA), 인플릭시맙(REMICADE™), 리툭시맙(RITUXAN™/MAB THERA™), 에타네르셉트(ENBREL™), 베바시주맙(AVASTIN™), 트라스투주맙(HERCEPTIN™), 페그릴그라스팀(NEULASTA™), 또는 바이오시밀러 및 바이오베터를 포함한 임의의 다른 적합한 POI.
구체적 측면에 따르면, 숙주 세포는 임의의 동물 세포, 척추동물 세포, 포유류 세포, 인간 세포, 식물 세포, 선충 세포, 곤충 세포 또는 연체동물 세포와 같은 무척추동물 세포, 전술한 것 중 임의의 것으로부터 유래된 줄기 세포, 또는 진균 세포 또는 효모 세포일 수 있다. 구체적으로 숙주 세포는 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스(Kluyveromyces), 칸디다(Candida), 오가타에아, 야로위아, 및 지오트리쿰(Geotrichum), 구체적으로 사카로마이세스 세레비지애, 피키아 파스토리스, 오가타에아 미누타(Ogataea minuta), 클루이베롬세스 락티스(Kluyveromces lactis), 클루이베로메스 마르시아누스(Kluyveromes marxianus), 야로위아 리폴리티카 또는 한세눌라 폴리모르파로 이루어진 군으로부터 선택된 속, 또는 아스페르길루스 아와모리 또는 트리코더마 레세이와 같은 사상성 진균의 세포이다. 바람직하게는, 숙주 세포는 메탄올자화 효모, 바람직하게는 피키아 파스토리스이다. 본원에서 피키아 파스토리스는 코마가타엘라 파스토리스, 코마가타엘라 파피이 및 코마가타엘라 슈도파스토리스 모두에 대해 동의어로 사용된다.
구체적 측면에 따르면, 숙주 세포는 다음과 같다:
a) 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스, 칸디다, 오가타에아, 야로위아, 및 지오트리쿰으로 이루어진 군으로부터 선택된 속, 예컨대 피키아 속(예를 들어 피키아 파스토리스, 피키아 메타놀리카(Pichia methanolica), 피키아 클루이베리(Pichia kluyveri), 및 피키아 안구스타(Pichia angusta)), 코마가타엘라 속(예를 들어, 코마가타엘라 파스토리스, 코마가타엘라 슈도파스토리스 또는 코마가타엘라 파피이), 사카로마이세스 속(예를 들어 사카로마이에스 세레비재(Saccharomyces cerevisae), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 우바룸(Saccharomyces uvarum)), 클루이베로마이세스 속(예를 들어 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus)), 칸디다 속(예를 들어 칸디다 우틸리스(Candida utilis), 칸디다 카카오이(Candida cacaoi), 칸디다 보이디니이(Candida boidinii),), 지오트리쿰 속(예를 들어 지오트리쿰 퍼멘탄스(Geotrichum fermentans)), 한세눌라 폴리모르파, 야로위아 리폴리티카, 또는 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)의 효모 세포; 또는
b) 아스페르길루스 아와모리 또는 트리코더마 레세이와 같은 사상성 진균의 세포.
종 피키아 파스토리스가 바람직하다. 구체적으로, 숙주 세포는 CBS 704, CBS 2612, CBS 7435, CBS 9173-9189, DSMZ 70877, X-33, GS115, KM71, KM71H 및 SMD1168로 이루어진 군으로부터 선택된 피키아 파스토리스 균주이다.
공급원: CBS 704(=NRRL Y-1603 = DSMZ 70382), CBS 2612(=NRRL Y-7556), CBS 7435(=NRRL Y-11430), CBS 9173-9189(CBS 균주: CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelculturen, 네덜란드 위트레흐트 소재), 및 DSMZ 70877(German Collection of Microorganisms and Cell Cultures); X-33, GS115, KM71, KM71H 및 SMD1168과 같은 Invitrogen으로부터의 균주.
바람직한 에스. 세레비지애 균주의 예는 W303, CEN.PK 및 BY-시리즈(EUROSCARF 콜렉션)를 포함한다. 상기 기재된 모든 균주는 형질전환체를 생산하고 이종 유전자를 발현하는 데 성공적으로 사용되었다.
구체적 측면에 따르면, 진핵 숙주 세포는 진균 세포(예를 들어, 아스페르길루스(예컨대 에이. 니게르(A. niger), 에이. 푸미가투스(A. fumigatus), 에이. 오리재(A. oryzae), 에이. 니둘란스(A. nidulans)), 아크레모니움(Acremonium)(예컨대 에이. 써모필룸(A. thermophilum)), 카에토미움(Chaetomium)(예컨대 씨. 써모필룸(C. thermophilum)), 크리소스포리움(예컨대 씨. 써모필레(C. thermophile)), 코르디셉스(Cordyceps)(예컨대 씨. 밀리타리스(C. militaris)), 코리나스쿠스, 크테노마이세스(Ctenomyces), 푸사리움(Fusarium)(예컨대 에프. 옥시스포룸(F. oxysporum)), 글로메렐라(Glomerella)(예컨대 지. 그라미니콜라(G. graminicola)), 하이포크레아(Hypocrea)(예컨대 에이치. 예코리나(H. jecorina)), 마그나포르테(Magnaporthe)(예컨대 엠. 오리재(M. oryzae)), 마이셀리오프토라(Myceliophthora)(예컨대 엠. 써모필레(M. thermophile)), 네크트리아(Nectria)(예컨대 엔. 해마토코카(N. haematococca)), 뉴로스포라(Neurospora)(예컨대 엔. 크라싸(N. crassa)), 페니실리움(Penicillium), 스포로트리쿰(Sporotrichum)(예컨대 에스. 써모필레(S. thermophile)), 티엘라비아(Thielavia)(예컨대 티. 테레스트리스(T. terrestris), 티. 헤테로탈리카(T. heterothallica)), 트리코더마(Trichoderma)(예컨대 티. 레세이(T. reesei)), 또는 버티실리움(Verticillium)(예컨대 브이. 달리아(V. dahlia)))일 수 있다.
구체적 측면에 따르면, 포유류 세포는 인간 또는 설치류 또는 소 세포, 세포주 또는 세포 균주이다. 본원에 기재된 숙주 세포로서 적합한 특이적 포유류 세포의 예는 마우스 골수종(NSO)-세포주, 차이니즈 햄스터 난소(CHO)-세포주, HT1080, H9, HepG2, MCF7, MDBK Jurkat, MDCK, NIH3T3, PC12, BHK(새끼 햄스터 신장 세포), VERO, SP2/0, YB2/0, Y0, C127, L 세포, COS, 예를 들어, COS1 및 COS7, QC1-3, HEK-293, VERO, PER.C6, HeLA, EBl, EB2, EB3, 종양용해성 또는 하이브리도마-세포주이다. 바람직하게는 포유류 세포는 CHO-세포주이다. 일 구현예에서, 세포는 CHO 세포이다. 일 구현예에서, 세포는 CHO-K1 세포, CHO-K1 SV 세포, DG44 CHO 세포, DUXB11 CHO 세포, DUKX CHO 세포, CHO-S, CHO FUT8 녹아웃 CHO GS 녹아웃 세포, CHO FUT8 GS 녹아웃 세포, CHOZN, 또는 CHO-유래 세포이다. CHO GS 녹아웃 세포(예를 들어, GSKO 세포)는 예를 들어, CHO-K1 SV GS 녹아웃 세포이다. CHO FUT8 녹아웃 세포는 예를 들어, Potelligent® CHOK1 SV(Lonza Biologics, Inc.)이다. 진핵 세포는 또한 예를 들어, EBx® 세포, EB14, EB24, EB26, EB66, 또는 EBvl3과 같은 새의 세포, 세포주 또는 세포 균주를 포함한다.
또 다른 구체적 측면에 따르면, 진핵 세포는 곤충 세포(예를 들어, Sf9, Mimic™ Sf9, Sf21, High FiveTM(BT1-TN-5B1-4), 또는 BT1-Ea88 세포), 조류 세포(예를 들어, 속 암포라(Amphora), 규조류(Bacillariophyceae), 두나리엘라(Dunaliella), 클로렐라(Chlorella), 클라미도모나스(Chlamydomonas), 시아노피타(Cyanophyta)(시아노박테리아), 난노클로롭시스(Nannochloropsis), 스피룰리나(Spirulina), 또는 오크로모나스(Ochromonas)의 것), 또는 식물 세포(예를 들어, 외떡잎 식물(예를 들어, 옥수수, 벼, 밀, 또는 강아지풀), 또는 쌍떡잎 식물(예를 들어, 카사바, 감자, 대두, 토마토, 담배, 알파파, 피지코미트렐라 파텐스(Physcomitrella patens) 또는 애기장대)로부터의 세포이다.
구체적 측면에 따르면, 숙주 세포는 원핵 세포 예를 들어 박테리아 세포이다. 구체적으로, 숙주 세포는 바실루스(Bacillus), 스트렙토마이세스 스트렙토코쿠스(Streptomyces Streptococcus), 스타필로코쿠스(Staphylococcus) 또는 락토바실루스(Lactobacillus)와 같은 그람-양성 세포이다. 사용될 수 있는 바실루스는 예를 들어 비.서브틸리스(B.subtilis), 비.아밀로리케파시엔스(B.amyloliquefaciens), 비.리케니포르미스(B.licheniformis), 비.나토(B.natto), 또는 비.메가테리움(B.megaterium)이다. 구현예에서, 세포는 비.서브틸리스 3NA 및 비.서브틸리스 168과 같은 비.서브틸리스이다. 바실루스는 예를 들어, 43210-1214 오하이오주 콜럼버스 웨스트 12번가 484 바이오로지칼 사이언시스 556 소재의 바실루스 유전 스톡 센터(Bacillus Genetic Stock Center)에서 수득가능하다.
일 구현예에서, 원핵 세포는 살모넬라 종(Salmonella spp.) 또는 예를 들어, TG1, TG2, W3110, DH1, DHB4, DH5a, HMS 174, HMS174(DE3), NM533, C600, HB101, JM109, MC4100, XL1-Blue 및 오리가미(Origami)와 같은 에스케리키아 콜라이(Escherichia coli), 뿐만 아니라 예를 들어 BL-21 또는 BL21(DE3)과 같은 이.콜라이(E.coli) B-균주로부터 유래된 것들과 같은 그람-음성 세포이며, 이들 모두는 상업적으로 이용가능하다.
구체적 구현예에 따르면, 원핵 세포는 이.콜라이, 비. 서브틸리스, 및 슈도모나스(Pseudomonas)로 이루어진 군으로부터 선택된다.
적합한 숙주 세포는 예를 들어, DSMZ(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH, 독일 브라운슈바이크 소재) 또는 어메리칸 타입 컬쳐 콜렉션(ATCC)과 같은 배양 콜렉션으로부터 상업적으로 이용가능하다.
구체적 측면에 따르면, 본 발명은 숙주 세포에서 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 유전자, 특히 상기 숙주 세포에 내인성인 상기 FLO8 단백질을 암호화하는 유전자의 발현을 감소시킴으로써, 비-메탄올 탄소 공급원(특히, 본원에 기재된 ECP)에 의해 조절가능하거나 또는 억제가능한 프로모터의 제어 하에 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)를 발현하는 숙주 세포에 의해 생산된 상기 POI의 수율을 증가시키는 방법을 제공한다.
구체적으로, 수율은 다음과 같은 상기 GOI를 발현하는 비슷한 숙주 세포와 비교하여, 1.2 배, 1.3 배, 1.4 배, 1.5 배, 1. 6 배, 1.7 배, 1.8 배, 1.9 배, 2.0 배, 2.1 배, 2.2 배, 2.3 배, 2.4 배, 2.5 배, 2.6 배, 2.7 배, 2.8 배, 2.9 배, 3 배, 3.5 배, 4 배, 5 배, 5.5 배, 6 배, 6.5 배, 7 배, 7.5 배, 8 배, 8.5 배, 9 배, 9.5 배, 10 배, 10.5 배, 11 배, 11.5 배, 또는 12 배 중 적어도 임의의 하나만큼 증가된다:
a) 내인성 FLO8 단백질를 암호화하는 상기 유전자의 발현을 감소시키도록 조작되지 않았거나, 또는 여기서 내인성 FLO8 단백질을 암호화하는 상기 유전자의 발현이 변형되지 않고; 임의적으로
b) 여기서 상기 GOI의 발현을 제어하는 프로모터는 구성적 프로모터, 특히 GAP 프로모터, 또는 메탄올-유도성 프로모터, 특히 AOX1 프로모터임.
구체적으로, 본원에 기재된 POI 생산 수율을 증가시키는 방법은 본원에 추가로 기재된 바와 같은 재조합 숙주 세포를 이용한다.
추가의 구체적 측면에 따르면, 본 발명은 관심 단백질(POI)을 생산하는 조건 하에 본원에 추가로 기재된 바와 같은 재조합 숙주 세포를 배양함으로써 관심 유전자(GOI)에 의해 암호화된 상기 POI를 생산하는 방법을 제공한다.
추가의 구체적 구현예에 따르면, 본 발명은 POI의 생산을 위한 본원에 기재된 숙주 세포의 용도를 제공한다.
구체적으로, 숙주 세포는 세포 배양물에서 배양된 세포주, 특히 생산 숙주 세포주이다.
구체적 구현예에 따르면, 세포주는 회분(batch), 유가(fed-batch) 또는 연속 배양 조건 하에 배양된다. 배양은 마이크로타이터 플레이트, 진탕 플라스크, 또는 생물반응기에서 수행될 수 있고, 임의적으로 제1 단계로서 회분 단계로 시작하여, 제2 단계로 유가 단계 또는 연속 배양 단계가 이어진다.
구체적으로, 방법은 다음 단계를 포함한다:
a) 성장 조건 하에 숙주 세포를 배양하는 단계; 및 추가 단계
b) 최대 1 g/L의 제2 비-메탄올 탄소 공급원의 존재 하에 성장-제한 조건 하에 숙주 세포를 배양하여, 상기 GOI를 발현시켜 상기 POI를 생산하는 단계.
구체적으로, 제2 단계 b)는 제1 단계 a)를 따른다.
구체적으로, 제1 탄소 공급원은 본원에서 기저 탄소 공급원으로 지칭되는 비-메탄올 탄소 공급원이다.
구체적으로, 숙주 세포는 제1 단계에서 예를 들어 세포 배양물에서 숙주 세포의 성장을 가능하게 하기에 충분한 양으로 제1 탄소 공급원을 포함하는 세포 배양 배지에서 성장 조건 하에, 임의적으로 탄소 공급원의 양이 소모될 때까지 배양되며, 추가 배양은 성장-제한 조건 하에 수행될 수 있다.
구체적으로, 제2 탄소 공급원은 본원에서 보충 탄소 공급원으로 지칭되는 비-메탄올 탄소 공급원이다.
구체적으로, 상기 제1 및/또는 제2 탄소 공급원은 본원에 추가로 기재된 바와 같은 사카라이드, 폴리올, 알코올, 또는 전술한 것 중 임의의 하나 이상의 혼합물로부터 선택된다.
구체적 구현예에 따르면, 기저 탄소 공급원은 보충 탄소 공급원과 상이하며, 예를 들어 정량적으로 및/또는 정성적으로 상이하다. 정량적 차이는 전형적으로 프로모터 활성을 억제 또는 탈억제하는 상이한 조건을 제공한다.
추가의 구체적 구현예에 따르면 기저 및 보충 탄소 공급원은 동일한 유형의 분자 또는 탄수화물을 바람직하게는 상이한 농도로 포함한다. 추가의 구체적 구현예에 따르면, 탄소 공급원은 2 개 이상의 상이한 탄소 공급원의 혼합물이다.
임의의 유형의 유기 탄소 공급원, 특히 숙주 세포 배양, 특히 진핵 숙주 세포 배양에 전형적으로 사용되는 것들이 사용될 수 있다. 구체적 구현예에 따르면, 탄소 공급원은 글루코스, 프룩토스, 갈락토스 또는 만노스와 같은 헥소스, 사카로즈와 같은 디사카라이드, 글리세롤 또는 에탄올과 같은 알코올, 또는 이의 혼합물이다.
구체적으로 바람직한 구현예에 따르면, 기저 탄소 공급원은 글루코스, 글리세롤, 에탄올, 또는 이의 혼합물로 이루어진 군으로부터 선택된다. 바람직한 구현예에 따르면, 기저 탄소 공급원은 글리세롤이다.
추가의 구체적 구현예에 따르면, 보충 탄소 공급원은 글루코스, 프룩토스, 갈락토스 및 만노스와 같은 헥소스, 사카로즈와 같은 디사카라이드, 글리세롤 또는 에탄올과 같은 알코올, 또는 이의 혼합물이다. 바람직한 구현예에 따르면, 보충 탄소 공급원은 글루코스이다.
구체적으로,
a) 기저 탄소 공급원은 글루코스, 글리세롤, 에탄올, 이의 혼합물로 이루어진 군으로부터 선택되고;
b) 보충 탄소 공급원은 글루코스, 프룩토스, 갈락토스 또는 만노스와 같은 헥소스, 사카로즈와 같은 디사카라이드, 글리세롤 또는 에탄올과 같은 알코올, 또는 전술한 것 중 임의의 것의 혼합물이다.
상기 배양 단계는 모두 구체적으로 상기 탄소 공급원의 존재 하에 세포주를 배양하는 것을 포함한다. 예를 들어, 상기 성장 조건 하에 숙주 세포를 배양하는 단계(단계 a)는 기저 탄소 공급원을 사용하여 수행되며; 성장-제한 조건 하에 상기 숙주 세포를 배양하는 단계(단계 b)는 세포 배양 배지가 배양 단계(단계 b) 동안 세포 배양 배지 또는 상청액에 최대 1 g/L의 보충 탄소 공급원을 포함하거나 또는 심지어 검출가능한 양의 보충 탄소 공급원이 없도록 제한된 양으로 보충 탄소 공급원을 사용하여 수행된다.
탈억제(또는 유도) 조건은 적절하게 특이적 수단에 의해 달성될 수 있다. 제2 단계 b)는 임의적으로 세포 배양 배지 또는 상청액에서 보충 탄소 공급원을 제한된 양으로 제공하거나 또는 제공하지 않는 공급 배지를 이용한다. 구체적으로, 공급 배지는 화학적으로 정의되고 메탄올이 없다.
구체적으로, 제2 단계 b)는 0.0001 h-1 내지 0.2 h-1, 바람직하게는 0.005 h-1 내지 0.15 h-1 범위 내에서 특이적 성장 속도를 유지하기 위해 성장 제한량으로 보충 탄소 공급원을 제공하는 공급 배지를 이용한다.
공급 배지는 액체 형태 또는 달리 고체와 같은 대체 형태, 예를 들어 정제 또는 다른 지속 방출 수단, 또는 가스로 배양 배지에 첨가될 수 있다. 그러나, 바람직한 구현예에 따르면 세포 배양 배지에 첨가되는 보충 탄소 공급원의 제한된 양은 심지어 0일 수 있다. 바람직하게는, 제한된 탄소 기질의 조건 하에, 배양 배지에서 보충 탄소 공급원의 검출가능한 농도는 0-1 g/L, 바람직하게는 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1 g/L 중 임의의 하나 미만, 바람직하게는 90, 80, 70, 60, 50, 40, 30, 20, 또는 10 mg/L 중 임의의 하나 미만, 또는 심지어 9, 8, 7, 6, 5, 4, 3, 2, 또는 1 mg/L 미만, 또는 구체적으로 1-50 mg/L, 또는 1-10 mg/L, 구체적으로 바람직하게는 1 mg/L 또는 심지어 미만, 예컨대 적합한 표준 검정으로 측정된, 예를 들어 성장 세포 배양에 의해 소비될 때 배양 배지에서 잔류 농도로 결정된 검출 한계 미만이다.
바람직한 방법에서, 제한된 양의 보충 공급원은 생산 단계의 끝에서 또는 발효 공정의 결과에서, 바람직하게는 발효 생성물을 수확할 때 발효 브로쓰에서 결정된 바와 같은 검출 한계 미만인 세포 배양물의 잔류량을 제공한다.
구체적으로, 상기 단계 a) 배양은 회분 단계에서 수행되고; 상기 단계 b) 배양은 유가 또는 연속 배양 단계에서 수행된다.
구체적으로, 숙주 세포는 특히 생산 단계에서 세포 배양을 유지할 때 완전히 소비되는 탄소 공급원의 양만을 포함하는 정의된 최소 배지를 공급함으로써, 탄소 공급원을 제한하면서 고성장 속도 단계 동안(성장 조건 하에), 단계 a)(예를 들어 적어도 50%, 또는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 최대 성장 속도까지) 기저 탄소 공급원을 포함하고 저성장 속도 단계 동안(성장-제한 조건 하에), 단계 b)(예를 들어 최대 성장 속도의 90% 미만, 바람직하게는 80% 미만, 70% 미만, 60% 미만, 50% 미만, 또는 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 또는 0.2% 미만) POI를 생산하는 탄소 공급원 풍부 배지에서 성장된다.
구체적으로, POI는 예를 들어 세포주를 최대 성장 속도 미만의 성장 속도, 전형적으로 세포의 최대 성장 속도의 90% 미만, 바람직하게는 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.4% 미만, 0.3% 미만, 또는 0.2% 미만으로 배양함으로써 상기 성장-제한 조건 하에 발현된다. 전형적으로 최대 성장 속도는 각 유형의 숙주 세포에 대해 개별적으로 결정된다.
구체적으로, 회분 단계는 세포 배양물에 초기에 첨가된 기저 탄소 공급원이 세포주에 의해 소비될 때까지 수행된다. 용존 산조(DO) 스파이크 방법을 사용하여 회분 단계 동안 기저 탄소 공급원 소비를 결정할 수 있다.
구체적 구현예에 따르면, 회분 단계는 산소 분압(pO2) 신호의 연속적인 감소를 특징으로 하며 여기서 회분 단계의 끝은 pO2의 증가를 특징으로 한다. 전형적으로, 회분 단계 동안 기저 탄소 공급원을 소비하고 회분 단계에서 전형적인 추가 탄소 공급원을 첨가하지 않으면서, 산소 분압(pO2) 신호는 예를 들어 30%와 같이 예를 들어 65% 미만까지 연속적으로 감소될 것이다. 기저 탄소 공급원을 소비할 때, pO2는 예를 들어 65% 초과와 같이 예를 들어 30% 초과까지 증가할 수 있거나, 또는 탄소 공급원 제한 조건 하에 추가 탄소 공급원을 첨가하기 위해 공급 배지를 사용하는 유가 시스템으로 전환하는 적절한 시점을 추가로 나타낸다.
구체적으로, pO2는 회분 단계 동안 65% 미만 또는 그 이하의 포화 상태로 감소된 다음 회분의 끝에 65% 초과 또는 그 이상의 포화 상태로 증가한다. 구체적으로, 회분 단계는 산소 분압(pO2) 신호가 65% 초과 포화 상태, 구체적으로 70%, 75%, 80%, 또는 85% 중 임의의 것의 초과로 증가할 때까지 수행된다.
구체적으로, 회분 단계는 약 10 내지 36 시간 동안 수행된다.
배양 시간과 관련하여 용어 "약"은 +/-5% 또는 +/-10%를 의미할 것이다.
예를 들어, 약 10 내지 36 시간의 구체적 회분 수행 시간은 18 내지 39.6 시간, 구체적으로 19 내지 37.8 시간일 수 있다.
구체적 구현예에 따르면, 회분 단계는 회분 배지에서 기저 탄소 공급원으로 40 내지 50 g/L 글리세롤, 구체적으로 45 g/L 글리세롤을 사용하여 수행되며, 배양은 약 27 내지 30 시간 동안 25℃, 또는 약 23 내지 36 시간 동안 30℃, 또는 23 내지 36 시간의 배양 시간 동안 25℃ 내지 30℃의 임의의 온도에서 수행된다. 회분 배지에서 글리세롤 농도가 낮아지면 회분 단계의 길이가 감소할 수 있는 반면, 회분 배지에서 글리세롤이 증가하면 심지어 회분 단계를 연장할 것이다. 글리세롤에 대한 대안으로, 글루코스가 예를 들어 거의 동일한 양으로 사용될 수 있다.
회분 단계 뒤에 유가 단계가 이어지는 세포 배양 및 POI 발현의 전형적인 시스템에서, 구체적으로, 유가 단계에서의 배양은 약 15 내지 80 시간, 약 15 내지 70 시간, 약 15 내지 60 시간, 약 15 내지 50 시간, 약 15 내지 45 시간, 약 15 내지 40 시간, 약 15 내지 35 시간, 약 15 내지 30 시간, 약 15 내지 35 시간, 약 15 내지 25 시간, 또는 약 15 내지 20 시간 중 임의의 하나; 바람직하게는 약 20 내지 40 시간 동안 수행된다. 구체적으로, 유가 단계에서의 배양은 약 80 시간, 약 70 시간, 약 60 시간, 약 55 시간, 약 50 시간, 약 45 시간, 약 40 시간, 약 35 시간, 약 33 시간, 약 30 시간, 약 25 시간, 약 20 시간, 또는 약 15 시간 중 임의의 하나 동안 수행된다.
성공적인 POI 생산을 초래하여 고수율을 수득하는 120 시간 미만 또는 100 시간 미만 또는 최대 80 시간의 임의의 유가 배양은 본원에서 "속도 발효"라고 언급된다. 구체적으로, 부피 특이적 생성물 형성 속도(rP)는 단위 부피(L) 및 단위 시간(h) 당 형성된 생성물의 양(mg)이다(mg(L h)-1). 부피 특이적 생성물 형성 속도가 또한 공간 시간 수율(STY) 또는 부피 생산성으로 명명된다.
구체적으로, 본원에 기재된 방법 중 유가 배양은 약 30 mg(L h)-1(30 mg(L h)-1 +/-5% 또는 +/-10% 의미)의 공간 시간 수율이 되도록 수행된다. 구체적으로 약 30 mg(L h)-1의 공간 시간 수율은 약 30 시간 유가 내에서 달성되며, 구체적으로 33 시간, 32 시간, 31 시간, 30 시간, 29 시간, 28 시간, 27 시간, 26 시간, 또는 25 시간의 유가 시간 중 임의의 하나 미만 내에서 27, 28, 29, 30, 31, 32, 또는 33 mg(L h)-1 중 적어도 임의의 것이 달성될 수 있다.
구체적으로, 회분 단계는 제1 단계 a)에서 수행되고, 유가 단계는 제2 단계 b)에서 수행된다.
구체적으로, 제2 단계 b)는 0.0001 h-1 내지 0.2 h-1 , 바람직하게는 0.2, 0.15, 0.1 h-1 또는 0.15 h-1 중 임의의 것 미만의 범위 내에서 특이적 성장 속도를 유지하기 위해 성장 제한량으로 보충 탄소 공급원을 제공하는 유가 단계에서 공급 배지를 이용한다.
구체적으로, 회분 및 유가 배양 단계를 모두 포함하는 배양 방법은 특히 효모 숙주 세포, 예를 들어 사카로마이세스 속 또는 피키아 속 또는 코마가타엘라 속 중 임의의 것의 효모, 또는 케이. 락티스(K. lactis), 제트. 룩시이(Z. rouxii), 피. 스티피티스(P. stipitis), 에이치. 폴리모르파(H. polymorpha), 또는 와이. 리폴리티카(Y. lipolytica)와 같은 피키아 이외의 속으로부터의 효모, 바람직하게는 피키아 파스토리스 또는 코마가타엘라 파스토리스를 이용할 수 있다.
추가의 구체적 측면에 따르면, 본 발명은 다음 단계를 포함하는, 숙주 세포에서 관심 단백질(POI)을 생산하는 방법을 제공한다:
a) 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자의 발현을 감소시키도록 숙주 세포를 유전적으로 조작하는 단계;
b) 관심 유전자(GOI)에 작동가능하게 연결된, 비-메탄올 탄소 공급원에 의해 조절가능하거나 또는 억제가능한 발현 카세트 프로모터(ECP)의 제어 하에 상기 POI를 암호화 또는 발현하는 GOI를 포함하는 이종 발현 카세트를 숙주 세포에 도입하는 단계;
c) 상기 POI를 생산하기 위한 조건 하에 상기 숙주 세포를 배양하는 단계;
d) 임의적으로 세포 배양물로부터 상기 POI를 단리하는 단계; 및
e) 임의적으로 상기 POI를 정제하는 단계.
구체적으로, 본원에 기재된 방법의 단계 a)는 단계 b) 전에, 또는 이후에, 또는 동시에 수행된다.
구체적 측면에 따르면, 숙주 세포는 POI를 생산하도록 조작되기 전에 먼저 상기 FLO8 단백질 또는 이의 각각의 상동체의 발현을 감소시키도록 유전적으로 변형된다. 구체적 예에 따르면, 야생형 숙주 세포는 본원에 기재된 방법의 단계 a)에 따라 유전적으로 변형된다. 구체적으로, 숙주 세포는 상기 FLO8 단백질 또는 이의 각각의 상동체의 감소를 위해 상기 하나 이상의 유전적 변형을 야생형 숙주 세포 균주에 도입할 때 제공된다.
추가의 측면에 따르면, 숙주 세포는 상기 FLO8 단백질 또는 이의 각각의 상동체를 감소시키도록 추가로 유전적으로 변형되기 전에, 먼저 이종 또는 재조합 POI를 생산하기 위해 조작된다. 구체적 예에 따르면, 야생형 숙주 세포는 먼저 POI 생산을 위한 발현 카세트를 포함하도록 조작될 수 있다. 그런 다음 이러한 조작된 숙주 세포는 본원에 기재된 바와 같은 상기 FLO8 단백질 또는 이의 각각의 상동체를 감소시키도록 추가로 변형될 수 있다.
추가의 측면에 따르면, 숙주 세포는 하나의 방법 단계에서, 예를 들어, 하나 이상의 반응 혼합물에서 각각의 발현 카세트, 시약 및 도구를 이용하여 POI 생산을 위한 조작 및 상기 FLO8 단백질 또는 이의 각각의 상동체의 감소를 위한 유전적 변형을 모두 겪고 있다.
구체적으로, 방법은 본원에 추가로 기재된 바와 같이 재조합 숙주 세포를 생산하기 위한 방법 단계를 이용한다.
구체적으로, 이종 발현 카세트는 본원에 추가로 기재된 바와 같이 ECP를 포함한다.
구체적으로, POI는 적절한 배지에서 숙주 세포를 배양하고, 세포를 분리할 때 세포 배양물, 특히 세포 배양 상청액 또는 배지로부터 발현된 PPI를 단리하고, 특히 세포로부터 POI를 분리하고 적합한 수단에 의해 정제할 때 이를 발현된 생성물에 대해 적절한 방법에 의해 정제함으로써 생산될 수 있다. 이에 의해, 정제된 POI 제제가 생산될 수 있다.
도 1: 본원에 언급된 서열
명세서 전반에 걸쳐 사용된 바와 같은 특이적 용어는 하기 의미를 갖는다.
본원에 사용된 바와 같은 "탄소 기질"로도 지칭되는 용어 "탄소 공급원"은 숙주 유기체 또는 생산 세포주에 의해 대사될 수 있는 것들과 같은 미생물에 대한 에너지 공급원, 특히 정제된 형태로, 최소 배지로 또는 복합 영양 물질과 같은 원료로 제공되는 모노사카라이드, 올리고사카라이드, 폴리사카라이드, 글리세롤을 포함한 알코올로 이루어진 군으로부터 선택된 공급원으로 적합한 전형적으로 공급원 탄수화물인 발효가능한 탄소 기질을 의미할 것이다. 탄소 공급원은 단일 탄소 공급원으로 또는 상이한 탄소 공급원의 혼합물로 본원에 기재된 바와 같이 사용될 수 있다.
비-메탄올 탄소 공급원은 메탄올 이외의 임의의 탄소 공급원, 특히 메탄올이 없는 탄소 공급원의 양으로 본원에서 이해된다.
본원에 기재된 바와 같이 사용된 것과 같은 "기저 탄소 공급원"은 전형적으로 숙주 세포, 특히 진핵 세포에 대한 영양소와 같은 세포 성장에 적합한 탄소 공급원이다. 기저 탄소 공급원은 기저 배지 또는 복합 배지와 같은 배지, 뿐만 아니라 정제된 탄소 공급원을 함유하는 화학적으로 정의된 배지에 제공될 수 있다. 기저 탄소 공급원은 전형적으로 세포 성장, 특히 배양 공정 중 성장 단계 동안 세포 성장을 제공하기 위한, 예를 들어 표준 하위 배양 단계 동안 90% 초과, 바람직하게는 95% 초과의 생존력을 나타내는, 예를 들어 적어도 5 g/L 세포 건조 질량, 바람직하게는 적어도 10 g/L 세포 건조 질량, 또는 적어도 15 g/L 세포 건조 질량의 세포 밀도를 수득하기 위한 양으로 제공된다.
기저 탄소 공급원은 전형적으로 과량 또는 잉여량으로 사용되며, 예를 들어 회분 또는 유가 배양 공정에서 세포주의 성장 단계 동안과 같이 높은 특이적 성장 속도로 세포주를 배양하는 동안 바이오매스를 증가시키기 위해 에너지를 과량으로 제공하는 것으로 이해된다. 이러한 잉여량은 특히 측정가능한 발효 브로쓰에서 잔류 농도를 달성하기 위해 보충 탄소 공급원(성장-제한 조건 하에 사용될 때)의 제한된 양을 초과하며 보충 탄소 공급원의 제한된 양을 공급하는 동안 전형적으로 적어도 10 배, 바람직하게는 적어도 50 배 또는 적어도 100 배 더 높다.
본원에 기재된 바와 같은 "보충 탄소 공급원"은 전형적으로 특히 배양 공정의 생산 단계에서 생산 세포주에 의한 발효 생성물의 생산을 용이하게 하는 보충 기질이다. 생산 단계는 구체적으로 예를 들어 회분, 유가 및 연속 배양 공정에서 성장 단계를 따른다. 보충 탄소 공급원은 구체적으로 유가 공정의 공급물에 함유될 수 있다. 보충 탄소 공급원은 전형적으로 탄소 기질 제한된 조건 하에, 즉 탄소 공급원을 제한된 양으로 사용하는 세포 배양물에 이용된다.
탄소 공급원의 "제한된 양" 또는 "제한된 탄소 공급원"은 본원에서 특히 최대 성장 속도 보다 낮은 제어된 성장 속도의 배양 공정에서 생산 세포주에 의한 발효 생성물의 생산을 용이하게 하는 탄소 기질의 유형 및 양을 구체적으로 지칭하는 것으로 이해된다. 생산 단계는 구체적으로 예를 들어 회분, 유가 및 연속 배양 공정에서 성장 단계를 따른다. 세포 배양 공정은 회분 배양, 연속 배양, 및 유가 배양을 이용할 수 있다. 회분 배양은 소량의 시드 배양 용액을 배지에 첨가하여 배양 동안 추가 배지를 첨가하거나 또는 배양 용액을 버리지 않고 세포를 성장시키는 배양 공정이다. 연속 배양은 배지를 배양 동안 연속으로 첨가하고 버리는 배양 공정이다. 연속 배양은 또한 관류 배양을 포함한다. 회분 배양 및 연속 배양 사이의 중간이고 또한 반회분 배양으로 언급되는 유가 배양은 배지를 배양 동안 연속적으로 또는 순차적으로 첨가하지만, 연속 배양과는 달리, 배양 용액을 연속적으로 버리지 않는 배양 공정이다.
구체적으로 성장 제한 영양 기질을 배양물에 공급하는 것을 기반으로 하는 유가 공정이 바람직하다. 단일 유가 또는 반복 유가 발효를 포함하는 유가 전략은 전형적으로 생물반응기에서 높은 세포 밀도에 도달하기 위해 생물 산업 공정에 사용된다. 탄소 기질의 제어된 첨가는 배양물의 성장 속도에 직접적으로 영향을 미치고 범람성 대사 또는 원치않은 대사 부산물 형성을 피하는 데 도움을 준다. 탄소 공급원 제한 조건 하에, 탄소 공급원은 구체적으로 유가 공정의 공급물에 함유될 수 있다. 이에 의해, 탄소 기질이 제한된 양으로 제공된다.
또한 본원에 기재된 바와 같은 케모스태트 또는 연속 배양에서, 성장 속도는 엄격하게 제어될 수 있다.
탄소 공급원의 제한된 양은 본원에서 특히 예를 들어 생산 단계 또는 생산 방식에서 성장-제한 조건 하에 생산 세포주를 유지하는 데 필요한 탄소 공급원의 양으로 이해된다. 이러한 제한된 양은 유가 공정에 이용될 수 있으며, 여기서 탄소 공급원은 공급 배지에 함유되고 낮은 특이적 성장 속도로 바이오매스를 유지하면서, 예를 들어 POI를 생산하기 위해 지속적인 에너지 전달을 위한 낮은 공급 속도로 배양물에 공급된다. 공급 배지는 전형적으로 세포 배양물의 생산 단계 동안 발효 브로쓰에 첨가된다.
탄소 공급원의 제한된 양은 예를 들어, 세포 배양 브로쓰에서 탄소 공급원의 잔류량에 의해 결정될 수 있으며, 이는 표준(탄수화물) 검정에서 측정된 바와 같이 미리 결정된 역치 미만 또는 심지어 검출 한계 미만이다. 잔류량은 전형적으로 발효 제품을 수확할 때 발효 브로쓰에서 결정될 것이다.
탄소 공급원의 제한된 양은 또한 발효기에 대한 탄소 공급원의 평균 공급 속도를 정의함으로써, 예를 들어 시간 당 계산된 평균량을 결정하기 위해 배양 시간 당 전체 배양 공정, 예를 들어 유가 단계에 걸쳐 첨가된 양을 결정함으로써 결정될 수 있다. 이 평균 공급 속도는 세포 배양에 의한 보충 탄소 공급원의 완전한 사용을 보장하기 위해 낮게, 예를 들어 0.6 g L-1 h-1(L 초기 발효 부피 및 h 시간 당 g 탄소 공급원) 내지 25 g L-1 h-1, 바람직하게는 1.6 g L-1 h-1 내지 20 g L-1 h-1로 유지된다.
탄소 공급원의 제한된 양은 또한 특이적 성장 속도를 측정함으로써 결정될 수 있으며, 특이적 성장 속도는 생산 단계 동안 낮게, 예를 들어 최대 특이적 성장 속도보다 낮게, 예를 들어 0.001 h-1 내지 0.20 h-1, 또는 0.005 h-1 내지 0.20 h-1, 바람직하게는 0.01 h-1 내지 0.15 h-1의 범위에서와 같이 미리 결정된 범위 내에서 유지된다.
구체적으로, 화학적으로 정의되고 메탄올이 없는 공급 배지가 사용된다.
유가 공정에서 최소 배지 또는 공급 배지와 같이 세포 배양 배지와 관련하여 용어 "화학적으로 정의된"은 생산 세포주의 시험관내 세포 배양에 적합한 배양 배지를 의미할 것이며, 여기서 모든 화학적 구성요소 및 (폴리)펩티드가 알려져 있다. 전형적으로, 화학적으로 정의된 배지는 동물 유래 구성요소가 완전히 없고 순수하고 일관된 세포 배양 환경을 나타낸다.
본원에 사용된 바와 같은 "숙주 세포"는 단일 세포, 단일 세포 클론, 또는 숙주 세포의 세포주를 지칭할 것이다.
본원에 사용된 바와 같은 용어 "세포주"는 장기간에 걸쳐 증식하는 능력을 획득한 특정 세포 유형의 확립된 클론을 지칭한다. 세포주는 전형적으로 내인성 또는 재조합 유전자, 또는 폴리펩티드 또는 이러한 폴리펩티드에 의해 매개되는 세포 대사산물을 생산하기 위한 대사 경로의 생성물을 발현하기 위해 사용된다. "생산 숙주 세포주" 또는 "생산 세포주"는 통상적으로 POI와 같은 생산 공정의 생성물을 수득하기 위해 생물반응기에서 세포 배양에 사용될 준비가 된 세포주인 것으로 이해된다.
본원에 기재된 바와 같은 POI를 생산하는 숙주 세포는 또한 "생산 숙주 세포"로 지칭되고, 각각의 세포주는 "생산 세포주"로 지칭된다.
본원에 기재된 구체적 구현예는 FLO8 단백질을 암호화하는 내인성 유전자를 과소발현하도록 조작되고/되거나, 이러한 유전자의 발현이 감소되고, 탄소 공급원 조절가능한 프로모터(예컨대 본원에 기재된 ECP), 특히 세포 배양물에 메탄올을 첨가할 필요 없이 유도될 수 있는 프로모터의 제어 하에 고수율의 POI 생산을 특징으로 하는 생산 숙주 세포주를 지칭한다. 이러한 숙주 세포는 형태를 유의하게 변화시키기 않으면서 POI를 안정되게 발현하는 것으로 밝혀졌다.
용어 "숙주 세포"는 특히 임의의 진핵 또는 원핵 세포 또는 유기체에 적용될 것이며, 이는 POI 또는 숙주 세포 대사산물을 생산하기 위해 재조합 목적에 적합하게 사용된다. 용어 "숙주 세포"는 인간을 포함하지 않음이 잘 이해된다. 구체적으로, 본원에 기재된 바와 같은 숙주 세포는 인공 유기체 및 천연(야생형) 숙주 세포의 유도체이다. 예를 들어, 하나 이상의 유전적 변형, 상기 이종 발현 카세트 또는 작제물, 상기 형질감염 또는 형질전환된 숙주 세포 및 재조합 단백질을 포함하는 것들을 구체적으로 언급하는 본원에 기재된 숙주 세포, 방법 및 용도는 비-자연 발생, "인공(man-made)" 또는 합성이고, 따라서 "자연 법칙"의 결과로 간주되지 않음이 잘 이해된다.
숙주 세포와 관련하여 본원에 사용된 바와 같은 용어 "세포 배양" 또는 "배양하는" 또는 "배양"은 세포의 성장, 분화 또는 지속적인 생존력을 선호하는 조건 하에 인공으로 예를 들어 생체내 환경에서, 활성 또는 중지 상태에서, 구체적으로 산업계에 알려진 방법에 따라 제어된 생물 반응기에서 세포를 유지하는 것을 지칭한다.
적절한 배양 배지를 사용하여 세포 배양물을 배양할 때, 세포는 세포 배양물에서 세포 배양을 지지하기에 적합한 조건 하에 배양 용기 내 배지 또는 기질과 접촉하게 된다. 본원에 기재된 바와 같이, 숙주 세포 예를 들어, 진핵 세포, 구체적으로 효모 또는 사상성 진균의 성장에 사용될 수 있는 배양 배지가 제공된다. 표준 세포 배양 기술은 당업계에 잘 알려져 있다.
본원에 기재된 바와 같은 세포 배양은 특히 세포 바이오매스로부터 분리가능하고, 본원에서 "세포 배양 상청액"으로 지칭되는 세포 배양 배지에서 POI를 수득하는 것과 같이 분비된 POI의 생산을 제공하는 기술을 이용하며, 더 높은 순도의 POI를 수득하기 위해 정제될 수 있다. 단백질(예컨대 예를 들어, POI)이 세포 배양물에서 숙주 세포에 의해 생산 및 분비될 때, 이러한 단백질이 세포 배양 상청액에 분비되고, 숙주 세포 바이오매스로부터 세포 배양 상청액을 분리함으로써 수득될 수 있고, 임의적으로 단백질을 추가로 정제하여 정제된 단백질 제제를 생산함이 본원에서 이해된다.
세포 배양 배지는 제어된 인공 및 시험관내 환경에서 세포를 유지하고 성장시키는 데 필요한 영양소를 제공한다. 세포 배양 배지의 특징 및 조성은 특정 세포 요건에 따라 달라진다. 중요한 매개변수는 삼투압, pH, 및 영양소 제형을 포함한다. 영양소 공급은 당업계에 알려진 방법에 따라 연속 또는 불연속 방식으로 수행될 수 있다.
회분 공정은 세포를 배양하는 데 필요한 모든 영양소가 발효 동안 추가 영양소의 추가 공급 없이 초기 배양 배지에 함유되는 세포 배양 방식인 반면, 유가 공정에서는, 회분 단계 후, 하나 이상의 영양소를 공급에 의해 배양물에 공급하는 공급 단계가 발생한다. 대부분의 공정에서 공급 방식은 핵심이고 중요하지만, 본원에 기재된 숙주 세포 및 방법은 세포 배양의 핵심 방식과 관련하여 제한되지 않는다.
재조합 POI는 적절한 배지에서 배양하고, 배양물로부터 발현된 생성물 또는 대사산물을 단리하고, 임의적으로 적합한 방법에 의해 정제함으로써 본원에 기재된 숙주 세포 및 각각의 세포주를 사용하여 생산될 수 있다.
본원에 기재된 바와 같은 POI의 생산을 위한 여러 상이한 접근법이 바람직하다. POI는 숙주 세포를 관련 단백질을 암호화하는 재조합 DNA를 함유하는 발현 벡터로 형질감염 또는 형질전환하고, 형질감염 또는 형질전환된 세포의 배양물을 제조하고, 배양물을 성장시키고, 전사 및 POI 생산을 유도하고, POI를 회복함으로써 발현되고, 처리되고 임의적으로 분비될 수 있다.
특정 구현예에서, 세포 배양 공정은 유가 공정이다. 구체적으로, 원하는 재조합 POI를 암호화하는 핵산 작제물로 형질전환된 숙주 세포는 성장 단계에서 배양되고 원하는 재조합 POI를 생산하기 위해 생산 단계로 전이된다.
또 다른 구현예에서, 본원에 기재된 숙주 세포는 예를 들어 케모스태트를 이용하여 연속 방식으로 배양된다. 연속 발효 공정은 신선한 배양 배지를 정의되고 일정하고 연속적인 속도로 생물반응기에 공급하는 것을 특징으로 하며, 이에 의해 배양 브로쓰가 동일한 정의되고 일정하고 연속적인 제거 속도로 생물반응기로부터 동시에 제거된다. 배양 배지, 공급 속도 및 제거 속도를 동일한 일정한 수준으로 유지함으로써, 생물반응기에서 세포 배양 매개변수 및 조건이 일정하게 유지된다.
본원에 기재된 바와 같은 안정된 세포 배양은 구체적으로 유전적 특성을 유지하며, 구체적으로 심지어 약 20 세대 배양, 바람직하게는 적어도 30 세대, 보다 바람직하게는 적어도 40 세대, 가장 바람직하게는 적어도 50 세대 후에도 POI 생산을 높은 수준, 예를 들어 적어도 μg 수준으로 유지하는 세포 배양을 지칭하는 것으로 이해된다. 구체적으로, 산업 규모 생산에 사용될 때 큰 이점으로 간주되는 안정된 재조합 숙주 세포주가 제공된다.
본원에 기재된 세포 배양은 특히 산업 제조 규모에 대한 방법, 예를 들어 부피 및 기술 시스템과 관련하여 영양소 공급을 기반으로 하는 배양 방식 , 특히 유가 또는 회분 공정, 또는 연속 또는 반연속 공정(예를 들어 케모스태트)과 조합하여 특히 유리하다.
본원에 기재된 숙주 세포는 전형적으로 POI 생산을 위해 GOI를 발현하는 능력에 대해 테스트되고, 다음 테스트 중 임의의 것에 의해 POI 수율을 테스트한다: ELISA, 활성 검정, HPLC, 또는 SDS-PAGE 및 웨스턴 블롯팅 기술과 같은 다른 적합한 테스트, 또는 질량 분광법.
각각의 세포 배양물에서 FLO8 단백질 또는 이의 상동체를 암호화하는 유전자의 과소발현 또는 감소에 대한 유전적 변형의 효과 및 예를 들어, POI 생산에 대한 이의 효과를 결정하기 위해, 숙주 세포주는 마이크로타이터 플레이트, 진탕 플라스크, 또는 각각의 세포에서 이러한 유전적 변형이 없는 균주와 비교하여 유가 또는 케모스태트 발효를 사용하는 생물 반응기에서 배양될 수 있다.
본원에 기재된 생산 방법은 구체적으로 파일럿 또는 산업 규모로 발효를 허용한다. 산업 공정 규모는 바람직하게는 적어도 10 L, 구체적으로 적어도 50 L, 바람직하게는 적어도 1 m3, 바람직하게는 적어도 10 m3, 가장 바람직하게는 적어도 100 m3의 부피를 이용할 것이다.
산업 규모의 생산 조건이 바람직하며, 이는 예를 들어, 수 일 동안 전형적인 공정 시간을 이용하는 100 L 내지 10 m3 또는 그 이상의 반응기 부피에서 유가 배양, 또는 대략 0.02 - 0.15 h-1의 희석 속도로 대략 50 - 1000 L 또는 그 이상의 발효기 부피에서 연속 공정을 지칭한다.
본원에 기재된 목적을 위해 사용되는 장치, 시설 및 방법은 구체적으로 원핵 및/또는 진핵 세포주를 포함한 임의의 원하는 세포주에서 사용하고 배양하는 데 적합하다. 또한, 구현예에서, 장치, 시설 및 방법은 현탁 세포 또는 흡착-의존(부착) 세포를 포함한 임의의 세포 유형을 배양하는 데 적합하고 폴리펩티드 생성물(POI), 핵산 생성물(예를 들어 DNA 또는 RNA)과 같은 약제학적 및 생물약제학적 생성물, 또는 세포 및/또는 바이러스 요법에 사용되는 것들과 같은 세포 및/또는 바이러스의 생산을 위해 구성된 생산 작동에 적합하다.
특정 구현예에서, 세포는 재조합 치료제 또는 진단 제품과 같은 생성물을 발현하거나 또는 생산한다. 본원에 보다 상세하게 기재된 바와 같이, 세포에 의해 생산된 생성물의 예는 항체 분자(예를 들어, 모노클로날 항체, 이중특이적 항체), 항체 모방체(항원에 특이적으로 결합하나 예를 들어 DARPin, 아피바디, 아드넥틴, 또는 IgNAR와 같은 항체에 구조적으로 관련되지 않은 폴리펩티드 분자), 융합 단백질(예를 들어, Fc 융합 단백질, 키메라 사이토카인), 다른 재조합 단백질(예를 들어, 글리코실화 단백질, 효소, 호르몬), 또는 바이러스 치료제(예를 들어, 항암 종양용해성 바이러스, 유전자 요법 및 바이러스 면역요법을 위한 바이러스 벡터), 세포 치료제(예를 들어, 다능성 줄기 세포, 간엽성 줄기 세포 및 성체 줄기 세포), 백신 또는 지질-캡슐화 입자(예를 들어, 엑소좀, 바이러스-유사 입자), RNA(예컨대 예를 들어 siRNA) 또는 DNA(예컨대 예를 들어 플라스미드 DNA), 항생제 또는 아미노산을 포함하는 본원에 예시된 바와 같은 POI를 포함하나 이에 제한되지 않는다. 구현예에서, 장치, 시설 및 방법은 바이오시밀러를 생산하는 데 사용될 수 있다.
언급된 바와 같이, 특정 구현예에서, 장치, 시설 및 방법은 진핵 세포, 예를 들어, 포유류 세포 또는 예를 들어 효모 세포 또는 사상성 진균 세포과 같은 저급 진핵 세포, 또는 그람-양성 또는 그람-음성 세포와 같은 원핵 세포 및/또는 진핵 또는 원핵 세포의 생성물, 예를 들어, 대규모 방식으로 상기 세포에 의해 합성된 단백질, 펩티드, 또는 항생제, 아미노산, 핵산(예컨대 DNA 또는 RNA)을 포함하는 POI의 생산을 허용한다. 본원에 달리 언급되지 않는 한, 장치, 시설, 및 방법은 벤치 규모, 파일럿 규모, 및 전체 생산 규모 용량을 포함하나 이에 제한되지 않는 임의의 원하는 부피 또는 생산 용량을 포함할 수 있다.
더욱이, 본원에 달리 언급되지 않는 한, 장치, 시설, 및 방법은 교반 탱크, 에어리프트, 섬유, 마이크로섬유, 중공 섬유, 세라믹 매트릭스, 유동층, 고정층, 및/또는 분출층 생물반응기를 포함하나 이에 제한되지 않는 임의의 적합한 반응기(들)를 포함할 수 있다. 본원에 사용된 바와 같이, "반응기"는 발효기 또는 발효 유닛, 또는 임의의 다른 반응 용기를 포함할 수 있고 용어 "반응기"는 "발효기"와 상호교환가능하게 사용된다. 예를 들어, 일부 측면에서, 예시적인 생물반응기 유닛은 다음 중 하나 이상, 또는 전부를 수행할 수 있다: 영양소 및/또는 탄소 공급원 공급, 적합한 가스(예를 들어, 산소) 주입, 발효 또는 세포 배양 배지의 유입 및 유출 흐름, 가스 및 액체 상 분리, 온도 유지, 산소 및 CO2 수준 유지, pH 수준 유지, 휘저음(예를 들어, 교반), 및/또는 세정/멸균. 발효 유닛과 같은 예시적인 반응기 유닛은 유닛 내에 다중 반응기를 함유할 수 있으며, 예를 들어 유닛은 각각의 유닛에서 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 또는 100 개, 또는 그 이상의 생물반응기를 가질 수 있고/있거나 시설은 시설 내에 단일 또는 다중 반응기를 갖는 다중 유닛을 함유할 수 있다. 다양한 구현예에서, 생물반응기는 회분, 반 유가, 유가, 관류, 및/또는 연속 발효 공정에 적합할 수 있다. 임의의 적합한 반응기 직경이 사용될 수 있다. 구현예에서, 생물반응기는 약 100 mL 내지 약 50,000 L의 부피를 가질 수 있다. 비제한적인 예는 100 mL, 250 mL, 500 mL, 750 mL, 1 리터, 2 리터, 3 리터, 4 리터, 5 리터, 6 리터, 7 리터, 8 리터, 9 리터, 10 리터, 15 리터, 20 리터, 25 리터, 30 리터, 40 리터, 50 리터, 60 리터, 70 리터, 80 리터, 90 리터, 100 리터, 150 리터, 200 리터, 250 리터, 300 리터, 350 리터, 400 리터, 450 리터, 500 리터, 550 리터, 600 리터, 650 리터, 700 리터, 750 리터, 800 리터, 850 리터, 900 리터, 950 리터, 1000 리터, 1500 리터, 2000 리터, 2500 리터, 3000 리터, 3500 리터, 4000 리터, 4500 리터, 5000 리터, 6000 리터, 7000 리터, 8000 리터, 9000 리터, 10,000 리터, 15,000 리터, 20,000 리터, 및/또는 50,000 리터의 부피를 포함한다. 추가로, 적합한 반응기는 다중 사용, 단일 사용, 일회용, 또는 비-일회용일 수 있고 스테인리스 강(예를 들어, 316L 또는 임의의 다른 적합한 스테인리스 강) 및 인코넬과 같은 금속 합금, 플라스틱, 및/또는 유리를 포함한 임의의 적합한 물질로 형성될 수 있다.
구현예에서 및 본원에서 달리 언급되지 않는 한, 본원에 기재된 장치, 시설, 및 방법은 또한 이러한 생성물의 분리, 정제, 및 단리를 위한 작동 및/또는 장비와 같이 달리 언급되지 않은 임의의 적합한 유닛 작동 및/또는 장비를 포함할 수 있다. 전통적인 스틱 조립 시설, 모듈식, 이동식 및 임시 시설, 또는 임의의 다른 적합한 구조, 시설, 및/또는 레이아웃 같은 임의의 적합한 시설 및 환경이 사용될 수 있다. 예를 들어, 일부 구현예에서 모듈식 클린 룸이 사용될 수 있다. 추가로, 달리 언급되지 않는 한, 본원에 기재된 장치, 시스템, 및 방법은 단일 위치 또는 시설에서 수용 및/또는 수행될 수 있거나 또는 대안적으로 별도 또는 다중 위치 및/또는 시설에서 수용 및/또는 수행될 수 있다.
적합한 기술은 회분 단계로 시작한 다음, 높은 특이적 성장 속도로 짧은 지수 유가 단계 다음에, 추가로 낮은 특이적 성장 속도로 유가 단계가 이어지는 생물반응기에서 배양하는 것을 포함할 수 있다. 또 다른 적합한 배양 기술은 임의의 적합한 특이적 성장 속도 또는 POI 생산 시간에 걸쳐 높은 성장 속도에서 낮은 성장 속도로, 또는 POI 생산 시간에 걸쳐 낮은 성장 속도에서 높은 성장 속도로 진행하는 것과 같은 특이적 성장 속도의 조합으로 회분 단계 다음에 유가 단계를 포함할 수 있다. 또 다른 적합한 배양 기술은 낮은 희석 속도로 회분 단계 다음에 연속 배양 단계를 포함할 수 있다.
바람직한 구현예는 바이오매스를 제공하기 위한 회분 배양 다음에 고 수율 POI 생산을 위한 유가 배양을 포함한다.
적어도 1 g/L 세포 건조 중량, 보다 바람직하게는 적어도 10 g/L 세포 건조 중량, 바람직하게는 적어도 20 g/L 세포 건조 중량, 바람직하게는 30, 40, 50, 60, 70, 또는 80 g/L 세포 건조 중량 중 적어도 임의의 하나의 세포 밀도를 수득하기 위한 성장 조건 하에 생물반응기에서 본원에 기재된 바와 같은 숙주 세포를 배양하는 것이 바람직하다. 이러한 바이오매스 생산 수율을 파일럿 또는 산업 규모로 제공하는 것이 유리하다.
바이오매스의 축적을 허용하는 성장 배지, 구체적으로 기저 성장 배지는 전형적으로 탄소 공급원, 질소 공급원, 황의 공급원 및 포스페이트의 공급원을 포함한다. 전형적으로, 이러한 배지는 추가의 미량 원소 및 비타민을 포함하고, 아미노산, 펩톤 또는 효모 추출물을 추가로 포함할 수 있다.
바람직한 질소 공급원은 NH4H2PO4, 또는 NH3 또는 (NH4)2SO4를 포함한다.
바람직한 황 공급원은 MgSO4, 또는 (NH4)2SO4 또는 K2SO4를 포함한다.
바람직한 포스페이트 공급원은 NH4H2PO4, 또는 H3PO4, 또는 NaH2PO4, KH2PO4, Na2HPO4 또는 K2HPO4를 포함한다.
추가의 전형적인 배지 성분은 KCl, CaCl2, 및 Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B와 같은 미량 원소를 포함한다.
바람직하게는 배지는 비타민 B7이 보충된다.
피. 파스토리스에 대한 전형적인 성장 배지는 글리세롤, 소르비톨 또는 글루코스, NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴, 및 미량 원소를 포함한다.
생산 단계에서 생산 배지는 구체적으로 단지 제한된 양의 보충 탄소 공급원과 함께 사용된다.
바람직하게는 숙주 세포주는 적합한 탄소 공급원과 함께 미네랄 배지에서 배양되어, 추가로 단리 공정을 상당히 단순화한다. 바람직한 미네랄 배지의 예는 활용가능한 탄소 공급원(예를 들어, 글루코스, 글리세롤, 또는 소르비톨), 거대 원소(칼륨, 마그네슘, 칼슘, 암모늄, 클로라이드, 술페이트, 포스페이트) 및 미량 원소(구리, 요오드, 망간, 몰리브데이트, 코발트, 아연, 및 철 염, 및 붕산)를 함유하는 염, 및 예를 들어 영양요구성을 보완하기 위해 임의적으로 비타민 또는 아미노산을 함유하는 것이다.
구체적으로, 세포는 원하는 POI의 발현을 시행하기에 적합한 조건 하에 배양되며, 이는 발현 시스템 및 발현된 단백질의 속성, 예를 들어, 단백질이 신호 펩티드에 융합되는지 및 단백질이 가용성이거나 또는 막-결합된 것인지에 따라, 세포 또는 배양 배지로부터 정제될 수 있다. 당업자에 의해 이해되는 바와 같이, 배양 조건은 이용되는 숙주 세포 유형 및 특정 발현 벡터를 포함하는 인자에 따라 달라질 것이다.
전형적인 생산 배지는 보충 탄소 공급원, 및 추가로 NH4H2PO4, MgSO4, KCl, CaCl2, 비오틴, 및 미량 원소를 포함한다.
예를 들어 첨가된 보충 탄소 공급원을 발효에 공급하는 것은 최대 50 wt %의 활용가능한 당과 함께 탄소 공급원을 포함할 수 있다.
발효는 바람직하게는 3 내지 8 범위의 pH에서 수행된다.
전형적인 발효 시간은 약 24 내지 120 시간이며 온도는 20℃ 내지 35℃, 바람직하게는 22-30℃ 범위이다.
POI는 바람직하게는 적어도 1 mg/L, 바람직하게는 적어도 10 mg/L, 바람직하게는 적어도 100 mg/L, 가장 바람직하게는 적어도 1 g/L의 수율을 생산하는 조건을 이용하여 발현된다.
본원에 사용된 바와 같은 용어 "발현" 또는 "발현 카세트"는 작동가능한 연결로 원하는 코딩 서열 및 제어 서열을 함유하여, 이러한 서열로 형질전환 또는 형질감염된 숙주가 암호화된 단백질 또는 숙주 세포 대사산물을 생산할 수 있도록 하는 핵산 분자를 지칭한다. 형질전환을 시행하기 위해, 발현 시스템이 벡터에 포함될 수 있지만; 그러나, 관련 DNA가 또한 숙주 세포 염색체에 통합될 수 있다. 발현은 폴리펩티드 또는 대사산물을 포함하는 분비 또는 비분비된 발현 산물을 지칭할 수 있다.
발현 카세트는 예를 들어, "벡터" 또는 "플라스미드"의 형태의 발현 작제물로 편리하게 제공되며, 이는 전형적으로 클로닝된 재조합 뉴클레오티드 서열, 즉 재조합 유전자의 전사 및 적합한 숙주 유기체에서 mRNA의 번역에 필요한 DNA 서열이다. 발현 벡터 또는 플라스미드는 일반적으로 숙주 세포에서 게놈 통합을 위한 자율 복제 기원 또는 유전자좌, 선택가능한 마커(예를 들어, 아미노산 합성 유전자 또는 제오신, 카나마이신, G418 또는 하이드로마이신, 노르세오트리신과 같은 항생제에 내성을 부여하는 유전자), 다수의 제한 효소 절단 부위, 적합한 프로모터 서열 및 전사 종결인자를 포함하며, 이 구성요소는 함께 작동가능하게 연결된다. 본원에 사용된 바와 같은 용어 "플라스미드" 및 "벡터"는 자율 복제 뉴클레오티드 서열 뿐만 아니라 인공 염색체, 예를 들어, 효모 인공 염색체(YAC)와 같은 게놈 통합 뉴클레오티드 서열을 포함한다.
발현 벡터는 클로닝 벡터, 변형된 클로닝 벡터 및 특이적으로 설계된 플라스미드를 포함할 수 있으나 이에 제한되지 않는다. 본원에 기재된 바람직한 발현 벡터는 진핵 숙주 세포에서 재조합 유전자의 발현에 적합한 벡터이며 숙주 유기체에 따라 선택된다. 적절한 발현 벡터는 전형적으로 진핵 숙주 세포에서 POI를 암호화하는 DNA를 발현하는 데 적합한 조절 서열을 포함한다. 조절 서열의 예는 프로모터, 오퍼레이터, 인핸서, 리보솜 결합 부위, 및 전사 및 번역 개시 및 종결을 제어하는 서열을 포함한다. 조절 서열은 전형적으로 발현될 DNA 서열에 작동가능하게 연결된다.
숙주 세포에서 재조합 뉴클레오티드 서열의 발현을 허용하기 위해, 본원에 기재된 발현 카세트 또는 벡터는 ECP를 포함하며, 전형적으로 프로모터 뉴클레오티드 서열은 POI의 발현 및 분비를 용이하게 하기 위해 각각 코딩 서열의 5' 단부에 인접한, 예를 들어, 관심 유전자(GOI)로부터 상류에 있고 이에 인접하거나, 또는 신호 또는 리더 서열이 사용되는 경우, 상기 신호 및 리더 서열로부터 상류에 있고 이에 인접하다. 프로모터 서열은 전형적으로 작동가능하게 연결된, 특히 GOI를 포함하는 하류 뉴클레오티드 서열의 전사를 조절하고 개시한다.
본원에 기재된 특이적 발현 작제물은 프로모터의 전사 제어 하에 POI를 암호화하는 뉴클레오티드에 작동가능하게 연결된 상기 프로모터를 포함한다. 구체적으로, 프로모터는 POI의 코딩 서열과 고유하게 연관되지 않는다.
본원에 기재된 특이적 발현 작제물은 숙주 세포로부터 POI의 분비를 야기하는 리더 서열과 연결된 POI를 암호화하는 폴리뉴클레오티드를 포함한다. 발현 벡터에서 이러한 분비 리더 서열의 존재는 전형적으로 재조합 발현 및 분비를 위해 의도된 POI가 자연적으로 분비되지 않고 따라서 자연 분비 리더 서열이 결여된 단백질이거나, 또는 이의 뉴클레오티드 서열이 자연 분비 리더 서열 없이 클로닝된 경우 필요하다. 일반적으로, 숙주 세포로부터 POI의 분비를 야기하는 데 효과적인 임의의 분비 리더 서열이 사용될 수 있다. 분비 리더 서열은 효모 공급원, 예를 들어 사카로마이세스 세레비지애의 MFa와 같은 효모 α-인자, 또는 포유류 또는 식물 공급원으로부터의 효모 포스파타제, 또는 다른 것들로부터 유래할 수 있다.
구체적 구현예에서, 다중클로닝 부위를 갖는 벡터인 다중클로닝 벡터가 사용될 수 있다. 구체적으로, 원하는 이종 유전자는 다중클로닝 부위에서 통합 또는 혼입되어 발현 벡터를 제조할 수 있다. 다중클로닝 벡터의 경우, 프로모터는 전형적으로 다중클로닝 부위의 상류에 위치한다.
본원에 기재된 재조합 숙주 세포는 특히 각각의 코딩 유전자 서열의 발현을 낮추어 유전자를 과소발현함으로써, 숙주 세포의 내인성 FLO8 단백질 또는 숙주 세포에서 각각의 상동체 또는 이종상동체의 양을 감소시키도록 특이적으로 조작된다.
본원에 사용된 바와 같은 용어 "유전자 발현", 또는 "폴리뉴클레오티드를 발현하는"은 mRNA로의 DNA 전사, mRNA 처리, mRNA 성숙, mRNA 방출, 번역, 단백질 폴딩 및/또는 단백질 수송으로 이루어진 군으로부터 선택된 적어도 하나의 단계를 포함하는 것을 의미한다.
용어 "발현 감소"는 전형적으로 "과소발현"을 지칭하고 일반적으로 특정 폴리뉴클레오티드의 발현을 감소시키기 위한 조작 이전의 숙주 세포이거나, 또는 달리 상기 폴리뉴클레오티드의 발현을 낮추도록 조작되지 않은 동일한 유형 또는 종의 숙주 세포에서 발현되는 참조 표준에 의해 나타낸 발현 수준보다 적은 임의의 양을 지칭한다. 본원에 기재된 바와 같은 발현 감소는 구체적으로 정의된 FLO8 단백질을 암호화하는 폴리뉴클레오티드 또는 유전자, 특히 조작 전의 숙주 세포에 내인성인 유전자를 지칭한다. 특히, 각각의 유전자 산물은 본원에 기재된 바와 같이 정의된 FLO8 단백질이다. 상기 유전자의 발현을 감소시키기 위한 유전적 변형에 의해 숙주 세포를 조작할 때 유전자 산물 또는 폴리펩티드의 발현은 숙주 세포의 유전적 변형 전 또는 유전적으로 변형되지 않은 비슷한 숙주에서 동일한 유전자 산물 또는 폴리펩티드의 발현보다 적은 수준으로 있다. "보다 적은"은 예를 들어, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80, 90% 또는 그 이상을 포함한다. 유전자 산물 또는 폴리펩티드의 발현 없음이 또한 용어 "발현 감소" 또는 "과소발현"에 포함된다.
본원에 기재된 구체적 구현예에 따르면, 숙주 세포는 FLO8 단백질을 암호화하는 내인성 숙주 세포 유전자(본원에 정의된 바와 같음, 예를 들어 각각의 상동체 또는 이종상동체 포함), 또는 상기 FLO8 단백질을 발현하거나 또는 생산하는 숙주 세포의 능력을 부여하는 다른 (코딩 또는 비코딩) 뉴클레오티드 서열을 (유전자 또는 이의 일부의 불활성화 또는 결실을 위해) 녹다운(knock-down) 또는 녹아웃하도록 조작된다.
구체적으로, 뉴클레오티드 서열이 파괴된 결실 균주가 제공된다.
본원에 사용된 바와 같은 용어 "파괴"는 녹다운 또는 녹아웃에 의해서와 같이, 숙주 세포에서 하나 이상의 내인성 단백질 발현의 완전한 제거를 위한 상당한 감소를 지칭한다. 이는 질량 분광법에 의해서와 같이, 숙주 세포의 세포 배양물 또는 배양 배지에서 이러한 하나 이상의 내인성 단백질의 존재로서 측정될 수 있으며, 여기서 내인성 단백질의 총 함량은 역치 미만이거나 또는 검출불가능할 수 있다.
용어 "파괴된"은 구체적으로 유전자 침묵, 유전자 녹다운, 유전자 녹아웃, 우성 음성 작제물의 전달, 조건부 유전자 녹아웃으로 이루어진 군으로부터 선택된 적어도 하나의 단계, 및/또는 특이적 유전자에 대한 유전자 변경에 의한 유전적 조작의 결과를 지칭한다.
본원에 사용된 바와 같은 유전자 발현의 맥락에서 용어 "녹다운", "감소" 또는 "고갈"은 대조군 세포에서의 발현과 비교하여 주어진 유전자의 발현 감소를 야기하는 실험적 접근법을 지칭한다. 유전자의 녹다운은 핵산 분자를 세포에 도입하여 유전자의 mRNA의 일부와 혼성화하여 이의 분해(예를 들어, shRNA, RNAi, miRNA)를 야기하거나 또는 전사 감소, mRNA 안정성 감소 또는 mRNA 번역 저하를 야기하는 방식으로 유전자의 서열을 변경하는 것과 같은 다양한 실험적 수단에 의해 달성될 수 있다.
주어진 유전자의 발현을 완전히 억제하는 것은 "녹아웃"이라고 언급된다. 유전자의 녹아웃은 기능적 전사체가 상기 유전자로부터 합성되지 않아서 이 유전자에 의해 정상적으로 제공되는 기능의 상실을 야기하는 것을 의미한다. 유전자 녹아웃은 DNA 서열을 변경시켜 유전자 또는 이의 조절 서열, 또는 이러한 유전자 또는 조절 서열의 일부를 파괴 또는 결실시킴으로써 달성된다. 녹아웃 기술은 중요한 부분 또는 전체 유전자 서열을 대체, 중단 또는 결실시키기 위한 상동 재조합 기술의 사용 또는 예를 들어 Gaj et al.(Trends Biotechnol. 2013;31(7):397-405)에 의해 기재된 표적 유전자의 DNA에 이중 가닥 파괴를 도입하기 위한 아연 핑거 또는 메가 뉴클레아제와 같은 DNA-변형 효소의 사용을 포함한다.
구체적 구현예는 숙주 세포로 형질전환 또는 형질감염된 하나 이상의 녹아웃 플라스미드 또는 카세트를 이동한다. 상동 재조합에 의해 숙주 세포 내 표적 유전자가 파괴될 수 있다. 이 절차는 전형적으로 표적 유전자의 모든 대립유전자가 안정하게 제거될 때까지 반복된다.
본원에 기재된 바와 같은 특이적 유전자를 녹아웃시키는 한 가지 구체적 방법은 예를 들어, Weninger et al.(J. Biotechnol. 2016, 235:139-49)에 기재된 바와 같은 CRISPR-Cas9 방법이다. 또 다른 방법은 예를 들어 Heiss et al. 2013(Appl Microbiol Biotechnol. 97(3):1241-9.)에 기재된 바와 같은 분열 마커 접근법을 포함한다.
또 다른 구현예는 작은 간섭 RNA(siRNA)를 사용하여 숙주 세포를 형질감염시키고 상기 숙주 세포에 의해 내인성으로 발현된 표적 단백질을 암호화하는 mRNA를 표적화함으로써 mRNA 분해를 표적화하는 것을 지칭한다.
유전자의 발현은 예를 들어, 특이적 프로모터-관련 저해인자의 사용, 주어진 프로모터의 부위 특이적 돌연변이 생성, 프로모터 변화, 또는 번역의 억제 또는 감소, 예를 들어, RNAi 또는 비-코딩 RNA 유도된 전사후 유전자 침묵에 의한 DNA 전사의 억제 또는 감소를 포함하지만 이에 제한되지 않는 유전자 발현을 직접적으로 방해하는 방법에 의해 억제되거나 또는 감소될 수 있다. 활성이 감소된 기능장애, 또는 불활성 유전자 산물의 발현은 예를 들어 코딩 유전자 내에서 부위 특이적 또는 무작위 돌연변이 생성, 삽입 또는 결실에 의해 달성될 수 있다.
유전자 산물의 활성의 억제 또는 감소는 예를 들어 단백질 발현 이전에 또는 동시에 각각의 효소에 억제제의 투여, 또는 배양에 의해 달성될 수 있다. 이러한 억제제에 대한 예는 억제 펩티드, 항체, 앱타머, 융합 단백질 또는 상기 효소에 대한 항체 모방체, 또는 이의 리간드 또는 수용체, 또는 억제 펩티드 또는 핵산, 또는 유사한 결합 활성이 있는 소분자를 포함하나 이에 제한되지 않는다.
유전자 침묵, 유전자 녹다운 및 유전자 녹아웃은 유전적 변형을 통해 또는 mRNA 전사 또는 유전자에 상보적인 서열을 갖는 올리고뉴클레오티드로 처리하여 유전자의 발현이 감소되는 기술을 지칭한다. DNA의 유전적 변형이 수행되면, 결과는 녹다운 또는 녹아웃 유기체이다. 유전자 발현의 변화가 mRNA에 결합하거나 또는 유전자에 일시적으로 결합하는 올리고뉴클레오티드에 의해 야기되면, 이는 염색체 DNA의 변형 없이 유전자 발현의 일시적 변화를 초래하고 일시적 녹다운으로 언급된다.
또한 상기 용어에 의해 포함되는 일시적 녹다운에서, 이 올리고뉴클레오티드가 활성 유전자 또는 이의 전사체에 결합하는 것은 전사 차단(유전자-결합의 경우), mRNA 전사체 분해(예를 들어, 작은 간섭 RNA(siRNA) 또는 안티센스 RNA에 의해) 또는 mRNA 번역 차단을 통해 발현 감소를 야기한다.
유전자 침묵, 녹다운 또는 녹아웃을 수행하는 다른 접근법은 각각의 문헌으로부터 당업자에게 알려져 있으며, 본 발명의 맥락에서 이들의 적용은 일상적인 것으로 간주된다. 유전자 녹아웃은 유전자의 발현이 완전히 차단되는 기술, 즉 각각의 유전자가 작동하지 않거나, 또는 심지어 제거되는 기술을 지칭한다. 이 목표를 달성하기 위한 방법론적 접근법은 여러가지이며 당업자에게 알려져 있다. 예는 주어진 유전자에 대해 우세하게 음성인 돌연변이체의 생산이다. 이러한 돌연변이체는 부위 지정 돌연변이 생성(예를 들어, 결실, 부분 결실, 삽입 또는 핵산 치환), 적합한 트랜스포존의 사용, 또는 각각의 문헌으로부터 당업자에게 알려져 있는 다른 접근법에 의해 생산될 수 있으며, 따라서 본 발명의 맥락에서 이의 적용은 일상적인 것으로 간주된다. 한 가지 예는 표적화된 징크 핑거 뉴클레아제를 사용한 녹아웃이다. 각각의 키트는 "CompoZR knockout ZFN"으로 Sigma Aldrich에 의해 제공된다. 또 다른 접근법은 전사 활성인자-유사 이펙터 뉴클레아제(TALEN)의 사용을 포함한다.
우성 음성 작제물의 전달은 예를 들어, 형질감염에 의해 기능장애 유전자 발현 산물을 코딩하는 서열의 도입을 수반한다. 상기 코딩 서열은 기능장애 효소의 유전자 발현이 유전자 발현 산물의 자연 발현을 파기하여, 결국 상기 유전자 발현 산물의 각각의 활성의 효과적인 생리학적 결함을 초래하는 방식으로 강한 프로모터에 기능적으로 결합된다.
조건부 유전자 녹아웃은 조직- 또는 시간-특이적 방식으로 유전자 발현을 차단시킨다. 이는 예를 들어, 관심 유전자 주위에 loxP 부위라 불리는 짧은 서열을 도입함으로써 수행된다. 다시 말해서, 다른 접근법은 각각의 문헌으로부터 당업자에게 알려져 있으며, 본 발명의 맥락에서 이들의 적용은 일상적인 것으로 간주된다.
한 가지 다른 접근법은 기능장애 유전자 산물 또는 활성이 감소된 유전자 산물을 초래할 수 있는 유전자 변경이다. 이 접근법은 프레임 시프트 돌연변이, 넌센스 돌연변이(즉, 조기 정지 코돈의 도입) 또는 전체 유전자 산물을 기능장애로 만들거나, 감소된 활성을 야기하는 아미노산 치환을 초래하는 돌연변이의 도입을 수반한다. 이러한 유전자 변경은 예를 들어 돌연변이 생성(예를 들어, 결실, 부분 결실, 삽입 또는 핵산 치환), 비특이적(무작위) 돌연변이 생성 또는 부위 지정 돌연변이 생성에 의해 생산될 수 있다. 유전자 침묵, 유전자 녹다운, 유전자 녹아웃, 우성 음성 작제물의 전달, 조건부 유전자 녹아웃, 및/또는 유전자 변경의 실제 적용을 기재하는 프로토콜은 통상적으로 당업자가 이용가능하며, 일상에 속한다. 따라서 본원에 제공된 기술적 교시는 유전자 산물의 유전자 발현의 억제 또는 감소, 또는 기능장애, 또는 불활성 유전자 산물의 발현, 또는 활성 감소로 이어지는 모든 생각할 수 있는 방법과 관련하여 완전히 가능하다.
본원에 기재된 유전적 변형은 J. Sambrook et al., Molecular Cloning: A Laboratory Manual(3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York(2001)에 기재된 바와 같이 당업계에 알려진 도구, 방법 및 기술을 이용할 수 있다.
본원에 사용된 바와 같은 용어 "내인성"은 각각의 내인성 유전자의 발현을 감소시키고/시키거나 내인성 단백질의 생산을 감소시키는 변형 전에, 야생형(천연) 숙주 세포에 존재하는 그러한 분자 및 서열, 특히 내인성 유전자 또는 단백질을 포함하는 것을 의미한다. 특히, 자연에서 발견되는 특정 숙주 세포에서 발생하는(그리고 그로부터 수득될 수 있는) 내인성 핵산 분자(예를 들어, 유전자) 또는 단백질은 "숙주 세포 내인성" 또는 "숙주 세포에 내인성"인 것으로 이해된다. 더욱이, 핵산 또는 단백질을 "내인성으로 발현하는" 세포는 핵산 또는 단백질을 자연에서 발견되는 것과 동일한 특정 유형의 숙주가 하는 것처럼 발현한다. 더욱이, 핵산, 단백질, 또는 다른 화합물을 "내인성으로 생산하는" 또는 "내인성으로 생산한" 숙주 세포는 핵산, 단백질, 또는 화합물을 자연에서 발견되는 것과 동일한 특정 유형의 숙주 세포가 하는 것처럼 생산한다.
따라서, 내인성 단백질이 단백질 암호화 유전자가 불활성화이거나 또는 결실된 숙주 세포의 녹아웃 돌연변이체에서과 같은 숙주 세포에 의해 더이상 생산되지 않더라도, 단백질은 본원에서 여전히 "내인성"으로 언급된다.
뉴클레오티드 서열, 발현 카세트와 같은 작제물, 아미노산 서열 또는 단백질과 관련하여 본원에 사용된 바와 같은 용어 "이종"은 주어진 숙주 세포에 대해 외래인, 즉 상기 숙주 세포에서 자연에서 발견되지 않는 것과 같은 "외인성"이거나; 또는 주어진 숙주 세포에서 자연적으로 발견되는, 예를 들어, "내인성"이지만, 이종 작제물의 맥락에서 또는 이러한 이종 작제물에 통합된, 예를 들어, 내인성 핵산과 융합되거나 또는 결합된 이종 핵산을 이용하여, 작제물을 이종으로 만드는 화합물을 지칭한다. 내인성으로 발견되는 이종 뉴클레오티드 서열은 또한 예를 들어, 세포에서 예상된 것보다 많거나 또는 자연적으로 발견되는 것보다 많은 양으로 비자연에서 생산될 수 있다. 이종 뉴클레오티드 서열, 또는 이종 뉴클레오티드 서열을 포함하는 핵산은 아마도 내인성 뉴클레오티드 서열과 상이한 서열이지만 내인성으로 발견되는 것과 동일한 단백질을 암호화한다. 구체적으로, 이종 뉴클레오티드 서열은 자연에서 숙주 세포와 동일한 관계에서 발견되지 않는 것들이다. 임의의 재조합 또는 인공 뉴클레오티드 서열은 이종인 것으로 이해된다. 이종 폴리뉴클레오티드의 예는 예를 들어, 본원에 기재된 바와 같이 하이브리드 프로모터를 수득하기 위해 프로모터와 천연적으로 회합하지 않거나, 또는 코딩 서열에 작동가능하게 연결된 뉴클레오티드 서열이다. 결과적으로, 하이브리드 또는 키메라 폴리뉴클레오티드가 수득될 수 있다. 이종 화합물의 추가 예는 내인성 자연 발생 POI 코딩 서열이 정상적으로 작동가능하게 연결되지 않은 전사 제어 요소, 예를 들어, 프로모터에 작동가능하게 연결된 POI 암호화 폴리뉴클레오티드이다.
본원에 사용된 바와 같이 용어 "작동가능하게 연결된"은 하나 이상의 뉴클레오티드 서열의 기능이 상기 핵산 분자 상에 존재하는 적어도 하나의 다른 뉴클레오티드 서열에 의해 영향을 받는 방식으로 단일 핵산 분자, 예를 들어, 벡터, 또는 발현 카세트 상에서 뉴클레오티드 서열의 회합을 지칭한다. 작동가능하게 연결함으로써, 핵산 서열은 동일한 핵산 분자 상에서 또다른 핵산 서열과 기능적 관계로 배치된다. 예를 들어, 프로모터는 코딩 서열의 발현에 영향을 미칠 수 있는 경우, 재조합 유전자의 코딩 서열과 작동가능하게 연결된다. 추가 예로서, 신호 펩티드를 암호화하는 핵산은 성숙 단백질의 예비형태 또는 성숙 단백질과 같은 분비된 형태로 단백질을 발현할 수 있는 경우, POI를 암호화하는 핵산 서열에 작동가능하게 연결된다. 구체적으로, 서로 작동가능하게 연결된 이러한 핵산은 즉시 연결될 수 있으며, 즉 신호 펩티드를 암호화하는 핵산 및 POI를 암호화하는 핵산 서열 사이에 추가 요소 또는 핵산 서열이 없다.
프로모터가 코딩 서열의 전사를 제어하는 경우, "프로모터" 서열은 전형적으로 코딩 서열에 작동가능하게 연결된 것으로 이해된다. 프로모터 서열이 코딩 서열과 천연적으로 회합하지 않는 경우, 이의 전사는 천연(야생형) 세포에서 프로모터에 의해 제어되지 않거나 또는 서열은 상이한 연속 서열과 재조합된다.
비-메탄올 탄소 공급원에 의해 조절가능하고 특히 억제가능하고 본원에 기재된 목적을 위해 사용되는 프로모터는 본원에서 "ECP"로 지칭된다. 따라서, "ECP"에 관한 본 개시내용은 또한 "비-메탄올 탄소 공급원에 의해 조절가능한(또는 억제가능한) 프로모터"를 지칭할 수 있으며, 그 반대의 경우도 마찬가지이다.
본원에 기재된 바와 같은 ECP는 특히 POI 코딩 DNA의 발현을 개시하거나, 조절하거나, 또는 달리 매개하거나 또는 제어한다. 프로모터 DNA 및 코딩 DNA는 동일한 유전자 또는 상이한 유전자로부터 유래할 수 있고, 동일하거나 또는 상이한 유기체로부터 유래할 수 있다.
본원에 기재된 바와 같은 ECP는 조절가능한 프로모터, 특히 억제된 상태 및 유도된 상태에서 상이한 프로모터 강도를 갖는 탄소 공급원 조절가능한 프로모터, 특히 비-메탄올 탄소 공급원에 의해 억제가능하고, 특히 메탄올에 의해 유도가능하지 않는 ECP와 같은 비-메탄올 탄소 공급원 조절가능한 프로모터로서 구체적으로 이해된다. 구체적으로, 메탄올의 부재 하에 전사 활성을 갖는 ECP를 사용함으로써, ECP의 전사 제어 하에 POI 생산을 위한 숙주 세포 배양물에 메탄올을 첨가할 필요가 없다.
ECP의 강도는 구체적으로 높은 빈도 또는 낮은 빈도를 갖는 해당 프로모터에서 발생하는 전사 개시의 효율성에 의해 나타낸 전사 강도를 지칭한다. 전사 강도가 높을수록, 해당 프로모터에서 더 빈번하게 전사가 발생할 것이다. 프로모터 강도는 프로모터의 전형적인 특징인데, 이는 주어진 mRNA 서열이 얼마나 자주 전사되는지를 결정하고, 다른 유전자보다 일부 유전자에 전사에 대해 더 높은 우선순위를 효과적으로 부여하여, 더 높은 농도의 전사체를 초래하기 때문이다. 예를 들어 대량으로 필요한 단백질을 암호화하는 유전자는 전형적으로 상대적으로 강한 프로모터를 갖는다. RNA 폴리머라제는 한번에 하나의 전사 업무만을 수행할 수 있어서 효율성을 높이려면 작업의 우선순위를 정해야 한다. 프로모터 강도의 차이는 이 우선순위를 허용하기 위해 선택된다.
본원에 사용되는 ECP는 완전히 유도된 상태에서 상대적으로 강하며, 전형적으로 거의 최대 활성 상태로 이해된다. 상대적 강도는 통상적으로 숙주 세포로 사용되는 바와 같은 세포의 각각의 pGAP 프로모터와 같은 표준 프로모터일 수 있는 본원에서 참조 프로모터로 언급되는 비슷한 프로모터에 대해 결정된다.
전사 빈도는 통상적으로 예를 들어 적합한 검정, 예를 들어 RT-PCR 또는 노던 블롯팅으로 전사체의 양에 의해 결정된 바와 같은 전사 속도로 이해된다. 예를 들어, 본 발명에 따른 프로모터의 전사 강도는 피. 파스토리스인 숙주 세포에서 결정되고 피. 파스토리스의 천연 pGAP 프로모터와 비교된다.
관심 유전자를 발현하는 프로모터의 강도는 통상적으로 발현 강도 또는 높은 발현 수준/속도를 지지하는 능력으로 이해된다. 예를 들어, 본 발명의 프로모터의 발현 및/또는 전사 강도는 피. 파스토리스인 숙주 세포에서 결정되고 피. 파스토리스의 천연 pGAP 프로모터와 비교된다.
참조 프로모터와 비교된 비교 전사 강도는 전사체의 양을 측정하는 것과 같은 표준 방법에 의해, 예를 들어 마이크로 어레이를 이용하거나, 또는 달리 재조합 세포에서 각각의 유전자 발현 산물의 양을 측정하는 것과 같이 세포 배양물에서 결정될 수 있다. 특히, 전사 속도는 마이크로어레이, 노던 블롯 또는 정량적 실시간 PCR(qRT-PCR) 또는 RNA 서열분석(RNA-seq)의 전사 강도에 의해 결정될 수 있으며 여기서 데이터는 높은 성장 속도를 갖는 조건 및 낮은 성장 속도를 갖는 조건, 또는 상이한 배지 조성을 이용하는 조건 사이의 발현 수준 차이, 및 참조 프로모터에 비해 높은 신호 강도를 나타낸다.
발현 속도는 예를 들어 eGFP와 같은 리포터 유전자의 발현량에 의해 결정될 수 있다.
본원에 기재된 바와 같은 ECP는 예를 들어 "상동 pGAP 프로모터"로도 불리는 숙주 세포에서의 천연 pGAP 프로모터와 비교하여 적어도 15%의 전사 속도 또는 전사 강도에 의해 반영된 상대적으로 높은 전사 강도를 발휘한다. 바람직하게는 전사 속도 또는 강도는 POI를 생산하는 재조합 목적을 위한 숙주 세포로서 선택된 (예를 들어 진핵) 숙주 세포에서 결정된 바와 같이 천연 pGAP 프로모터와 비교하여 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%, 또는 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 또는 200% 중 적어도 임의의 하나와 같이 심지어 그 이상 중 적어도 임의의 하나이다.
천연 pGAP 프로모터는 전형적으로 대부분의 살아있는 유기체에 존재하는 구성적 프로모터인 글리세르알데히드-3-포스페이트 데하이드로게나제(GAPDH)를 암호화하는 gap 유전자의 발현을 개시한다. 당분해 및 당신생의 주요 효소인 GAPDH(EC 1\2\1\12)는 이화작용 및 동화작용 탄수화물 대사에서 중요한 역할을 한다.
천연 pGAP 프로모터는 구체적으로 비변형(비-재조합) 또는 재조합 진핵 세포를 포함하는 동일한 종 또는 균주의 천연 진핵 세포에서와 유사한 방식으로 재조합 진핵 세포에서 활성이다. 이러한 천연 pGAP 프로모터는 통상적으로 내인성 프로모터인 것으로 이해되며, 따라서 세포에 상동성이며, 비교 목적을 위한 표준 또는 참조 프로모터로서 제공될 수 있다. 본원에 기재된 바와 같은 프로모터의 상대적 발현 또는 전사 강도는 일반적으로 POI를 생산하기 위한 숙주로서 사용되는 동일한 종 또는 균주의 세포의 천연 pGAP 프로모터와 비교된다.
본원에 기재된 프로모터와 같이 유도성 또는 억제성 조절 요소와 관련하여 용어 "조절가능한"은 유가 전략에 따라, 숙주 세포에서 과량의 물질(예컨대 세포 배양 배지에서의 영양소)의 존재 하에 예를 들어, 회분 배양의 성장 단계에서 억제되고, 예를 들어 생산 단계(예컨대 영양소의 양을 감소시킬 때, 또는 보충 기질을 공급할 때)에서 강한 활성을 유도하기 위해 탈억제되는 요소를 지칭할 것이다. 조절 요소는 또한 조절가능한 것으로 설계될 수 있어서, 요소가 세포 배양 첨가제의 첨가 없이 불활성이고, 이러한 첨가제의 존재 하에 활성이도록 한다. 따라서, 이러한 조절 요소의 제어 하에 POI의 발현은 이러한 첨가제의 첨가 시 유도될 수 있다.
본원에 기재된 바와 같은 ECP는 전형적으로 세포 성장 조건(성장 단계) 하에 침묵 또는 억제되고, 생산 조건(생산 단계) 하에 활성화 또는 탈억제되어, 탄소 공급원을 제한함으로써 생산 세포주에서 POI 생산을 유도하는 데 적합한 상대적으로 강한 조절가능한 프로모터이다.
구체적으로, 본원에 기재된 바와 같은 프로모터는 글루코스의 존재 및 글루코스 제한 하에 강도를 비교하는 테스트에서 결정된 바와 같은 차등 프로모터 강도로 조절가능한 탄소 공급원이며, 이는 상대적으로 높은 글루코스 농도, 바람직하게는 적어도 10 g/L, 바람직하게는 적어도 20 g/L의 농도에서 여전히 억제됨을 나타낸다. 구체적으로 본원에 기재된 프로모터는 프로모터를 완전히 유도하는 글루코스 역치 농도를 고려하여 제한된 글루코스 농도에서 완전히 유도되며, 역치는 전형적으로 20 g/L 미만, 바람직하게는 10 g/L 미만, 1 g/L 미만 또는 최대 1 g/L, 심지어 0.1 g/L 미만 또는 50 mg/L 미만이며, 바람직하게는 완전 전사 강도는 40 mg/L 미만의 글루코스 농도에서 천연 상동 pGAP 프로모터의 적어도 50%이다.
예를 들어, 본원에 기재된 탄소 공급원 조절가능한 프로모터를 특징으로 하기 위해 본원의 개시내용의 맥락 내에서 본원에 사용된 바와 같은 용어 "억제," 또는 "억제된"은 억제가능한 것으로 이해되는 프로모터의 전사 제어 하에 있어서, 세포(들)에 의해 관심 단백질의 발현을 감소시키는 관심 유전자(관심 단백질을 암호화)의 전사 간섭을 지칭한다.
본원에 기재된 ECP의 억제는 구체적으로 억제제가 세포 배양 배지에 있을 때 발생한다. 억제제는 특정 탄소 공급원 또는 억제량 예를 들어 특정 역치량을 초과하는 탄소 공급원일 수 있다. 관심 유전자 또는 관심 단백질의 발현은 억제제가 배지에서 제거되거나, 또는 더 이상 억제하지 않는 역치량 미만으로 감소될 때 "탈억제된" 것이이라고 한다. 탈억제 시, ECP는 완전히 유도된 것으로 이해되고, 관심 단백질의 발현은 전형적으로 프로모터-억제 조건 하에 세포(들)에 의한 기저 발현 수준보다 적어도 1.5-배 높다.
구체적으로, 본원에 기재된 ECP의 제어 하에 관심 유전자의 전사는 ECP를 탈억제 또는 완전 유도할 때 상기 유전자의 전사와 비교하여 30, 40, 50, 60, 70, 80, 85%, 90%, 또는 95% 중 적어도 임의의 하나만큼 억제되거나, 또는 완전히 억제(100% 억제)될 수 있다.
억제 및 탈억제 조건 하에 프로모터 강도를 비교하는 차등 프로모터 강도는 프로모터의 조절가능한 특성 및 각각의 유도비를 결정한다. 특정 구현예에 따르면, 유도비는 미리 결정된 탄소 공급원 역치 미만의 유도 조건으로 전환할 때 POI 생산 개시에 의해 결정되고, 억제된 상태에서 강도와 비교되는 차등 프로모터 강도로서 이해된다. 전사 강도는 통상적으로 완전히 유도된 상태에서의 강도로 이해되며, 즉 탈억제 조건 하에 거의 최대 활성을 나타낸다. 차등 프로모터 강도는 예를 들어 억제 조건과 비교하여 탈억제 조건 하에 재조합 숙주 세포주에서 POI 생산의 효율 또는 수율에 따라, 또는 달리 전사체의 양에 의해 결정된다. 본원에 기재된 바와 같은 조절가능한 프로모터는 바람직한 차등 프로모터 강도(유도비)를 가지며, 억제된 상태와 비교하여 탈억제된(완전히 유도된) 상태에서 적어도 1.5 배 또는 적어도 2 배, 보다 바람직하게는 적어도 5 배, 보다 더 바람직하게는 적어도 10 배, 보다 바람직하게는 적어도 20 배, 보다 바람직하게는 적어도 30, 40, 50, 또는 100 배이며, 또한 배수 유도로도 이해된다.
본원에 사용된 바와 같은 용어 "돌연변이 생성"은 비-코딩 또는 코딩 영역에서 적어도 하나의 변화가 있는 이의 변이체를 수득하기 위해 예를 들어 하나 이상의 뉴클레오티드의 삽입, 결실 및/또는 치환을 통해 뉴클레오티드 서열의 돌연변이체를 제공하는 방법을 지칭할 것이다. 돌연변이 생성은 무작위, 반무작위 또는 부위 지정 돌연변이를 통해서일 수 있다. 본원에 기재된 특이적 ECP 및 각각의 뉴클레오티드 서열을 사용하여 변이체를 생산할 수 있으며, 이는 마찬가지로 본원에 기재된 바와 같은 목적을 위해 사용될 수 있는 조절가능한 프로모터이다. 이러한 변이체는 모체 서열로서 본원에 제공된 ECP 뉴클레오티드 서열을 사용하는 적합한 돌연변이 생성 방법에 의해 생산될 수 있다. 이러한 돌연변이 생성 방법은 각각의 모체 프로모터 서열 정보를 주형으로 사용하여 핵산을 조작하거나 또는 뉴클레오티드 서열을 새로 합성하는 방법을 포함한다. 구체적 돌연변이 생성 방법은 합리적인 프로모터 조작을 적용한다.
본원에 기재된 예시적인 ECP는 예를 들어 변경된 발현 수준 및 조절 특성을 갖는 프로모터 변이체를 생성하기 위해 변형될 수 있다. 예를 들어, 프로모터 라이브러리는 선택된 프로모터 서열의 돌연변이 생성에 의해 제조될 수 있으며, 이는 예를 들어 상이한 발효 전략 하에 발현에 대해 변이체를 분석하고 적합한 변이체를 선택함으로써 진핵 세포에서 유전자 발현을 미세 조정하기 위해 모체 분자로서 사용될 수 있다. 변이체의 합성 라이브러리는 예를 들어 선택된 POI를 생산하기 위한 요건과 일치하는 프로모터를 선택하기 위해 사용될 수 있다. 이러한 변이체는 (예를 들어, 진핵) 숙주 세포에서 증가된 발현 효율 및 탄소 공급원이 풍부하고 제한적인 조건 하에 차등 발현을 가질 수 있다. 전형적으로 큰 무작위화된 유전자 라이브러리는 높은 유전자 다양성으로 생산되며, 구체적으로 원하는 유전자형 또는 표현형에 따라 선택될 수 있다.
특정 ECP 변이체는 본원에 제공된 ECP 뉴클레오티드 서열의 크기 변이체일 수 있고/있거나 코어 조절 영역, 주 조절 영역, 또는 T 모티프와 같은 본원에 기재된 프로모터의 요소 또는 영역 중 하나 초과를 포함하고/하거나, ECP 뉴클레오티드 서열의 하나 이상의 (동일하거나 또는 상이한) 단편을 포함한다.
구체적 돌연변이 생성 방법은 프로모터의 뉴클레오티드 서열 내에서 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 심지어 그 이상의 연속 뉴클레오티드의 변화와 같은 서열에서 하나 이상의 뉴클레오티드의 점 돌연변이, 특히 탠덤 점 돌연변이를 제공한다. 점 돌연변이는 전형적으로 하나 이상의 뉴클레오티드의 결실, 삽입, 및/또는 치환 중 적어도 하나이다. 프로모터 서열은 원위 단부, 특히 전장 프로모터 서열의 최대 50%에 이르는 5'-영역 내에서 돌연변이될 수 있으며, 5'-영역은 프로모터 활성을 실질적으로 상실하지 않고 매우 가변적일 수 있다. 프로모터 서열은 주 조절 영역 내에서 특이적으로 돌연변이될 수 있지만, 예시적인 주 조절 영역 및 특히 예시적인 코어 조절 영역에 대한 서열 동일성은 예를 들어 80%, 85%, 90%, 또는 95% 중 적어도 임의의 하나와 같이 높은 것이 바람직할 수 있다. 코어 또는 주 조절 영역 중 임의의 것 외에, 서열의 가변성이 더 높을 수 있고 ECP는 여전히 기능적이며 예를 들어, 80% 미만 또는 85% 미만의 서열 동일성을 갖는다.
코어 또는 주 조절 영역 내에서 임의의 돌연변이는 전형적으로 보존적이며, 즉 예컨대 특정 전사 인자에 의한 인식을 유지한다(또는 심지어 개선시킨다).
구체적으로, 본원에 기재된 ECP는 예를 들어 본원에 기재된 코어 또는 주 조절 영역 및 또한 상이한 프로모터, 예를 들어 임의의 구성적 또는 조절가능한(또는 달리 유도가능한) 프로모터의 3'-말단(예를 들어, 최대 20, 25, 또는 30 nt)을 포함하는 적어도 10 또는 15 개의 3'-말단 뉴클레오티드 서열을 포함하는 3'-영역(특이적으로 3'-단부에서 번역 개시 부위와 같은 하나 이상의 영역 또는 대체(천연 또는 인공) 프로모터 서열을 포함하여, ECP 프로모터의 번역 개시 부위를 대체하는 하이브리드 뉴클레오티드 서열을 포함할 수 있다.
본원에 사용된 바와 같은 용어 "뉴클레오티드 서열" 또는 "핵산 서열"은 DNA 또는 RNA를 지칭한다. "핵산 서열" 또는 "폴리뉴클레오티드 서열" 또는 간단히 "폴리뉴클레오티드"는 5'에서 3' 단부까지 판독되는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 또는 이중-가닥 중합체를 지칭한다. 이는 발현 카세트, 자기 복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 및 비기능적 DNA 또는 RNA를 포함한다.
본원에 기재된 바와 같은 용어 "관심 단백질(POI)"은 숙주 세포에서 재조합 기술에 의해 생산되는 폴리펩티드 또는 단백질을 지칭한다. 보다 구체적으로, 단백질은 숙주 세포에서 자연 발생하지 않는 폴리펩티드, 즉 이종 단백질일 수 있거나, 또는 달리 숙주 세포에 고유할 수 있으며, 즉 숙주 세포에 대해 상동 단백질일 수 있지만, 예를 들어, POI를 암호화하는 핵산 서열을 함유하는 자기 복제 벡터로의 형질전환, 또는 POI를 암호화하는 핵산 서열의 하나 이상의 카피의 재조합 기술을 숙주 세포의 게놈에 통합할 때, 또는 POI를 암호화하는 유전자의 발현을 제어하는 하나 이상의 조절 서열, 예를 들어, 프로모터 서열의 재조합 변형에 의해 생산된다. 일부 경우에 본원에 사용된 바와 같은 용어 POI는 또한 재조합으로 발현된 단백질에 의해 매개된 바와 같은 숙주 세포에 의한 임의의 대사 산물을 지칭한다.
본원에 사용된 바와 같은 용어 "스캐폴드"는 항원 결합 분자의 생성을 위한 시작점으로서 제공되는 크기, 구조, 및 기원이 상이한 조밀하고 안정되게 폴딩된 단백질의 다면적인 그룹을 기재한다. 항체(면역글로불린)의 구조-기능 관계에 의해 영감을 받아, 이러한 대체 단백질 스캐폴드는 주어진 (생체)분자 표적의 조밀하고 특이적인 인식을 위해 재형성될 수 있는 상호작용 부위를 지지하는 견고하고 보존된 구조적 프레임워크를 제공한다.
모체 뉴클레오티드 또는 아미노산 서열과 비교하여 변이체, 상동체 또는 이종상동체의 "서열 동일성"이라는 용어는 2 개 이상의 서열의 동일성 정도를 나타낸다. 2 개 이상의 아미노산 서열은 어느 정도로, 최대 100%까지 상응하는 위치에서 동일하거나 또는 보존된 아미노산 잔기를 가질 수 있다. 2 개 이상의 뉴클레오티드 서열은 어느 정도로, 최대 100%까지 상응하는 위치에서 동일하거나 또는 보존된 염기쌍을 가질 수 있다.
서열 유사성 검색은 과도한 (예를 들어, 적어도 50%) 서열 동일성을 갖는 상동체를 식별하기 위한 효과적이고 신뢰할 수 있는 전략이다. 빈번하게 사용되는 서열 유사성 검색 도구는 예를 들어, BLAST, FASTA, 및 HMMER이다.
서열 유사성 검색은 과도한 유사성, 및 공통 조상을 반영하는 통계적으로 유의한 유사성을 검출함으로써 이러한 상동 단백질 또는 유전자를 식별할 수 있다. 상동체는 본원에서 상이한 유기체의 동일한 단백질, 예를 들어, 상이한 상이한 유기체 또는 종에서 이러한 단백질의 변이체로 이해되는 이종상동체를 포함할 수 있다.
상이한 유기체 또는 종에서 동일한 단백질의 이종상동 서열은 전형적으로 특이적으로 동일한 속에서 유래하는 이종상동체의 단백질 서열에 상동이다. 전형적으로, 이종상동체는 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 또는 95% 동일성 중 적어도 약 임의의 하나, 최대 100% 서열 동일성을 갖는다. 구체적으로, 이종상동체는 FLO8 단백질 또는 내인성 FLO8 단백질을 녹아웃하도록 변형된 숙주 세포에서 이종상동 서열에 의해 FLO8 단백질을 암호화하는 유전자의 대체 시 결정될 수 있다. 예를 들어, 추정되는 FLO8 단백질이 각각 피. 파스토리스 및 에스. 세레비지애 숙주 세포에서 기능하여 각각 이러한 피. 파스토리스 또는 에스. 세레비지애 숙주 세포에서 녹아웃된 유전자에 의해 암호화된 내인성 FLO8 단백질을 대체하는 경우, 이러한 추정되는 FLO8 단백질은 본원에 기재된 목적을 위해 FLO8 단백질 상동체로 간주될 수 있다.
서열번호:1로 식별된 아미노산 서열을 포함하거나 또는 이로 이루어진 FLO8 단백질은 케이. 파피이 기원의 것이다. 다른 진핵 또는 원핵 숙주 세포에 존재하는 상동 서열이 있음이 잘 이해된다. 예를 들어, 효모 세포는 특히 피키아 파스토리스의 효모에서 각각의 상동 서열을 포함하며, 이는 새로운 속인 코마가타엘라로 재분류되었고, 3 개의 종인 케이. 파스토리스, 케이. 파피이, 및 케이. 슈도파스토리스로 분열되었다. 특이적 상동 서열은 예를 들어 케이. 파스토리스(예를 들어, 서열번호:3, 예컨대 서열번호:4를 포함하거나 또는 이로 이루어진 뉴클레오티드 서열에 의해 암호화됨), 사카로마이세스 세레비지애(예를 들어, 서열번호:5 또는 서열번호:6), 야로위아 리폴리티카(예를 들어, 서열번호:7), 오가타에아 폴리모르파(예를 들어, 서열번호:8), 또는 아스페르길루스 니게르(예를 들어, 서열번호:9)에서 발견된다.
본원에 기재된 특정 서열 동일성을 갖는 FLO8 단백질, 특히 피. 파스토리스 FLO8 단백질의 이종상동체인 임의의 FLO8 단백질의 임의의 상동 서열은 본원에 기재된 FLO8 단백질의 정의에 포함된다.
본원에 기재된 아미노산 서열, 상동체 및 이종상동체와 관련하여 "퍼센트(%) 아미노산 서열 동일성"은 특이적 폴리펩티드 서열에서 아미노산 잔기와 동일한 후보 서열에서 아미노산 잔기의 백분율로 정의되며, 필요한 경우, 서열 정렬 및 갭 도입 후, 최대 퍼센트 서열 동일성을 달성하고, 임의의 보존적 치환을 서열 동일성의 일부로 간주하지 않는다. 당업자는 비교되는 서열의 전장에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여, 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.
본원에 기재된 목적을 위해, 2 개의 아미노산 서열 사이의 서열 동일성은 NCBI BLAST 프로그램 버전 BLASTP 2.8.1을 사용하여 다음 예시적인 매개변수로 결정된다: 프로그램: blastp, 글자 크기: 6, 예상값: 10, 히트리스트 크기: 100, 갭비용: 11.1, 매트릭스: BLOSUM62, 문자 열: F, 구성 조정: 조건부 구성 점수 매트릭스 조정.
예를 들어 프로모터 또는 유전자의 뉴클레오티드 서열과 관련하여 "퍼센트(%) 동일성"은 DNA 서열에서 뉴클레오티드와 동일한 후보 DNA 서열에서 뉴클레오티드의 백분율로 정의되며, 필요한 경우, 서열 정렬 및 갭 도입 후, 최대 퍼센트 서열 동일성을 달성하고, 임의의 보존적 치환을 서열 동일성의 일부로 고려하지 않는다. 퍼센트 뉴클레오티드 서열 동일성을 결정하는 목적을 위한 정렬은 예를 들어, 공개적으로 이용가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전장에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다.
POI와 관련하여 본원에 사용된 바와 같은 용어 "단리된" 또는 "단리"는 "정제된" 또는 "실질적으로 순수한" 형태로 존재하기 위해 자연적으로 회합될 환경, 특히 세포 배양 상청액으로부터 충분히 분리된 이러한 화합물을 지칭할 것이다. 그러나, "단리된"은 다른 화합물 또는 물질과의 인공 또는 합성 혼합물의 배제, 또는 기본 활성을 방해하지 않고 예를 들어 불완전한 정제로 인해 존재할 수 있는 불순물의 존재를 반드시 의미하지는 않는다. 단리된 화합물은 이의 제제를 생산하기 위해 추가로 제형화될 수 있고, 여전히 실용적 목적을 위해 단리될 수 있으며, 예를 들어 POI는 진단 또는 요법에 사용될 때 약제학적으로 허용되는 담체 또는 부형제와 혼합될 수 있다.
본원에 사용된 바와 같은 용어 "정제된"은 적어도 50%(mol/mol), 바람직하게는 적어도 60%, 70%, 80%, 90% 또는 95%의 화합물(예를 들어, POI)을 포함하는 제제를 지칭할 것이다. 순도는 화합물에 적절한 방법(예를 들어, 크로마토그래픽 방법, 폴리아크릴아미드 겔 전기영동, HPLC 분석 등)에 의해 측정된다. 본원에 기재된 바와 같이 단리되고 정제된 POI는 세포 배양 상청액을 정제하여 불순물을 감소시킴으로써 수득될 수 있다.
재조합 폴리펩티드 또는 단백질 산물을 수득하기 위한 단리 및 정제 방법으로서, 염석 및 용매 침전과 같이 용해도 차이를 활용하는 방법, 한외여과 및 겔 전기영동과 같이 분자량 차이를 활용하는 방법, 이온 교환 크로마토그래피와 같이 전하 차이를 활용하는 방법, 친화성 크로마토그래피와 같이 특이적 친화성을 활용하는 방법, 역상 고성능 액체 크로마토그래피와 같이 소수성 차이를 활용하는 방법, 및 등전위 초점과 같이 등전점 차이를 활용하는 방법과 같은 방법이 사용될 수 있다.
다음 표준 방법이 바람직하다: 미세여과 또는 접선 유동 여과(TFF) 또는 원심분리에 의한 세포(파편) 분리 및 세척, 침전 또는 열 처리에 의한 POI 정제, 효소적 소화에 의한 POI 활성화, 이온 교환(IEX), 소수성 상호작용 크로마토그래피(HIC), 친화성 크로마토그래피, 크기 배제(SEC) 또는 HPLC 크로마토그래피와 같은 크로마토그래피에 의한 POI 정제, POI 농도 침전 및 한외여과 단계에 의한 세척.
고도로 정제된 생성물은 본질적으로 오염 단백질이 없고, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 또는 심지어 적어도 98%, 최대 100%의 순도를 갖는다. 정제된 생성물은 세포 배양 상청액의 정제 또는 또는 달리 세포 파편으로부터 수득될 수 있다.
단리되고 정제된 POI는 웨스턴 블롯, HPLC, 활성 검정, 또는 ELISA와 같은 통상적인 방법에 의해 식별될 수 있다.
본원에 사용된 바와 같은 용어 "재조합"은 유전적 조작에 의해 제조되는 것 또는 결과를 의미한다. 재조합 숙주는 하나 이상의 뉴클레오티드 또는 뉴클레오티드 서열을 결실 및/또는 불활성화하도록 조작될 수 있고, 특히 숙주에 외래인 뉴클레오티드 서열을 이용하여 구체적으로 재조합 핵산 서열을 함유하는 발현 벡터 또는 클로닝 벡터를 포함할 수 있다. 재조합 단백질은 숙주에서 각각의 재조합 핵산을 발현함으로써 생산된다. 본원에 사용된 바와 같은 POI와 관련하여 용어 "재조합"은 POI를 발현하도록 형질전환된 숙주 세포로부터 단리된 POI와 같은 재조합 수단에 의해 제조, 발현, 생성 또는 단리된 POI를 포함한다. 본 발명에 따르면 당업계의 기술 내의 통상적인 분자 생물학, 미생물학, 및 재조합 DNA 기술이 이용될 수 있다. 이러한 기술은 문헌에 자세히 설명되어 있다. 예를 들어, Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982) 참조.
특정 재조합 숙주 세포는 유전적 조작을 사용하여, 즉 인간 개입에 의해 조작된 숙주 세포로서 이해되는 "조작된" 숙주 세포이다. 숙주 세포가 주어진 유전자 또는 각각의 단백질의 발현을 감소시키거나 또는 과소발현하도록 조작된 경우, 숙주 세포는 숙주 세포가 조작 전의 동일한 조건 하에 숙주 세포와 비교하거나, 또는 상기 유전자 또는 단백질이 과소발현되도록 조작되지 않은 숙주 세포와 비교하여, 각각 이러한 유전자 및 단백질을 발현하는 능력이 더 이상 없도록 조작된다.
구체적 예에 따르면, 놀랍게도 숙주 세포에서 FLO8 암호화 유전자 발현의 감소, 특히 이러한 유전자의 결실은 비-메탄올 제어된 유도성 프로모터(ECP)에 의해 제어된 유전자의 발현 수준에 긍정적인 영향을 미쳐서, 탄소 공급원 프로모터 조절을 상실하지 않으면서 더 높은 발현 수준을 허용함을 밝혀내었다. 따라서, FLO8 단백질을 암호화하는 각각의 내인성 유전자(flo8 유전자)가 결실되거나 또는 결실되지 않은 세포를 생성하고 ECP의 제어 하에 유전자의 강도 및 조절을 테스트하였다. 세포내 또는 분비된 모델 단백질인 여러 예시적인 POI의 경우, 발현은 증가된 전사체 수준으로 추적가능한 각각의 flo8 유전자의 결실이 있는 세포에서 증가된 것으로 나타났다. 증가된 발현은 소규모 스크리닝 배양 및 생물반응기의 제어된 생산 공정에서 모두 나타날 수 있다. 따라서, 이전의 기존 발현 시스템과 비교하여 메탄올이 없는 배지에서, 예를 들어 피키아와 같은 효모에서 훨씬 더 많은 생성물 형성을 허용하는 새로운 발현 시스템이 개발되었다.
구체적 예에 따르면, 비-메탄올 탄소 공급원 조절된 프로모터 pG1, pG3, pG4, pG6(이는 메탄올 이외의 탄소 공급원에 의해 조절됨)의 발현 강도에 대한 FLO8 파괴의 효과를 구성적 프로모터 pGAP 또는 메탄올-유도 프로모터 pAOX1과 비교하였다. 모든 비-메탄올 탄소 공급원 조절된 프로모터는 dFLO8 균주에서 통계적으로 유의한 더 높은 전사를 갖는 것으로 밝혀졌으며, 이는 놀라운 일이며 이러한 프로모터의 제어 하에 증가된 발현을 나타낸다. 대조적으로, 메탄올-유도성 pAOX1은 야생형과 비교하여 dFLO8 돌연변이체에서 유의하게 증가된 전사 강도를 나타내지 않았고, 또한 pGAP의 전사 강도에 대한 유의한 효과가 없었다. 따라서, pGAP 또는 pAOX1 프로모터 활성은 FLO8의 과소발현에 의해 영향받지 않는다는 결론을 내렸다.
놀랍게도 세포 배양물에서 관심 단백질을 생산하기 위한 관심 이종 유전자의 발현은 메탄올에 의해 유도가능하지 않는 탄소 공급원 억제성 프로모터를 사용할 때, 표준 pGAP 프로모터와 비교하여 FLO8의 녹아웃 또는 파괴 시 효과적으로 증가되었음을 밝혀내었다. 예를 들어, 프로모터 pG1, pG1-3, pG3, pG4, pG6, pG7, 및 pG8 각각에 대한 eGFP 형광의 증가는 dFLO8 균주에서 밝혀졌으며, 야생형 숙주 세포(FLO8 파괴 없음)에서의 발현과 비교하여 1.2 내지 3.9 배 범위로 증가하였다.
다음 항목은 본원에 기재된 구현예이다:
1. 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자를 포함하며, 하나 이상의 유전적 변형 전의 숙주 세포와 비교하여 상기 유전자의 발현을 감소시키기 위해 상기 하나 이상의 유전적 변형에 의해 조작되고, 비-메탄올 탄소 공급원에 의해 조절가능한 발현 카세트 프로모터(ECP)의 제어 하에 관심 유전자(GOI)를 포함하는 이종 발현 카세트를 포함하는, 재조합 숙주 세포.
2. 항목 1에 있어서, 상기 상동체가 서열번호:1에 대해 적어도 25% 서열 동일성을 갖는, 숙주 세포.
3. 항목 1 내지 2 중 어느 한 항목에 있어서, 상기 하나 이상의 유전적 변형이 (i) 하나 이상의 내인성 폴리뉴클레오티드, 또는 이의 일부의 파괴, 치환, 결실 또는 녹아웃; 또는 (ii) 발현 제어 서열을 포함하는, 숙주 세포.
4. 항목 3에 있어서, 상기 내인성 폴리뉴클레오티드가 상기 FLO8 단백질 또는 상기 상동체를 암호화하는 유전자인, 숙주 세포.
5. 항목 4에 있어서, 상기 발현 제어 서열이 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 중지 서열, 또는 인핸서 또는 활성인자 서열 중 임의의 하나를 포함하는, 숙주 세포.
6. 항목 1 내지 4 중 어느 한 항목에 있어서, 상기 ECP가 성장-제한량의 비-메탄올 탄소 공급원의 존재 하에, 바람직하게는 메탄올의 부재 하에 유도가능하고; 성장-제한량보다 높은 과량의 비-메탄올 탄소 공급원의 존재 하에 억제가능한, 숙주 세포.
7. 항목 6에 있어서, 상기 비-메탄올 탄소 공급원의 성장-제한량이 최대 1 g/L 세포 배양 배지인, 숙주 세포.
8. 항목 1 내지 7 중 어느 한 항목에 있어서, 상기 ECP가 적어도 하나의 제1 및 적어도 하나의 제2 코어 조절 영역을 포함하며, 여기서 제1 코어 조절 영역은 서열번호:17에 대해 적어도 75% 서열 동일성을 갖고, 제2 코어 조절 영역은 서열번호:18에 대해 적어도 75% 서열 동일성을 갖는, 숙주 세포.
9. 항목 1 내지 8 중 어느 한 항목에 있어서, 상기 ECP가 서열번호:35에 대해 적어도 85% 서열 동일성을 갖는 적어도 하나의 조절 영역을 포함하는, 숙주 세포.
10. 항목 8 또는 9에 있어서, 상기 ECP가 상기 제1 및/또는 제2 코어 조절 영역 중 적어도 2 개를 포함하는, 숙주 세포.
11. 항목 1 내지 10 중 어느 한 항목에 있어서, 상기 ECP가 서열번호:19-34 중 임의의 하나로 이루어진 적어도 하나의 T 모티프를 포함하며, 임의적으로 상기 T 모티프의 5' 또는 3' 단부 중 어느 하나에서 하나 이상의 티민에 의한 상기 T 모티프의 연장이 없는, 숙주 세포.
12. 항목 11에 있어서, 상기 ECP가 상기 T 모티프 중 적어도 2 개를 포함하는, 숙주 세포.
13. 항목 1 내지 7 중 어느 한 항목에 있어서, 상기 ECP가 서열 서열번호:10-16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나의 적어도 300 nt에 대해 적어도 60% 서열 동일성을 포함하는, 숙주 세포.
14. 항목 13에 있어서, 상기 ECP가 전장 서열 서열번호:10-16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나에 대해 적어도 60% 서열 동일성을 포함하는, 숙주 세포.
15. 항목 13 또는 14에 있어서, 상기 ECP가 서열번호:10 또는 서열번호:11을 포함하거나 또는 이로 이루어지는, 숙주 세포.
16. 항목 1 내지 15 중 어느 한 항목에 있어서, 상기 발현 카세트가 자율 복제 벡터 또는 플라스미드, 또는 상기 숙주 세포의 염색체 내에 포함되는, 숙주 세포.
17. 항목 1 내지 16 중 어느 한 항목에 있어서, 상기 발현 카세트가 GOI에 의해 암호화된 관심 단백질(POI)의 분비를 가능하게 하는 신호 펩티드를 암호화하는 뉴클레오티드 서열을 추가로 포함하며, 바람직하게는 여기서 상기 신호 펩티드를 암호화하는 뉴클레오티드 서열은 GOI의 5'-단부에 인접하게 융합되는, 숙주 세포.
18. 항목 1 내지 17 중 어느 한 항목에 있어서, 상기 GOI가 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물 - 단백질 접합체, 구조적 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소, 및 대사 효소로 이루어진 군으로부터 선택된 펩티드 또는 단백질인 관심 단백질(POI)을 암호화하는, 숙주 세포.
19. 항목 1 내지 18 중 어느 한 항목에 있어서, 상기 항원 결합 단백질이 다음으로 이루어진 군으로부터 선택되는, 숙주 세포:
a) 항체 또는 항체 단편, 예컨대 키메라 항체, 인간화 항체, 이중특이적 항체, Fab, Fd, scFv, 디아바디, 트리아바디, Fv 사량체, 미니바디, VH, VHH, IgNAR, 또는 V-NAR과 같은 단일-도메인 항체 중 임의의 것;
b) 항체 모방체, 예컨대 아드넥틴, 아피바디, 아필린, 아피머, 아피틴, 알파바디, 안티칼린, 아비머, DARPin, 피노머, 쿠니츠 도메인 펩티드, 모노바디, 또는 NanoCLAMPS; 또는
c) 하나 이상의 면역글로불린-폴드 도메인, 항체 도메인 또는 항체 모방체를 포함하는 융합 단백질.
20. 항목 1 내지 19 중 어느 한 항목에 있어서,
a) 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스, 칸디다, 오가타에아, 야로위아, 및 지오트리쿰, 예컨대 피키아 파스토리스, 코마가타엘라 파피이, 코마가타엘라 파스토리스, 코마가타엘라 슈도파스토리스, 사카로마이세스 세레비지애, 오가타에아 미누타, 클루이베롬세스 락티스, 클루이베로메스 마르시아누스, 야로위아 리폴리티카 또는 한세눌라 폴리모르파로 이루어진 군으로부터 선택된 속의 효모 세포; 또는
b) 사상성 진균, 예컨대 아스페르길루스 아와모리 또는 트리코더마 레세이의 세포인, 숙주 세포.
21. 숙주 세포에서 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 유전자의 발현을 감소시킴으로써, 비-메탄올 탄소 공급원에 의해 조절가능하거나 또는 억제가능한 프로모터의 제어 하에 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)를 발현하는 상기 숙주 세포에 의해 생산된 상기 POI의 수율을 증가시키는 방법.
22. 관심 단백질(POI)을 생산하기 위한 조건 하에 항목 1 내지 20 중 어느 한 항목의 숙주 세포를 배양함으로써 관심 유전자(GOI)에 의해 암호화된 상기 POI를 생산하는 방법.
23. 항목 21 또는 22에 있어서, 하기 단계를 포함하는, 방법:
a) 성장 조건 하에 숙주 세포를 배양하는 단계; 및 추가 단계
b) 최대 1 g/L의 제2 비-메탄올 탄소 공급원의 존재 하에 성장-제한 조건 하에 숙주 세포를 배양하여, 상기 GOI를 발현시켜 상기 POI를 생산하는 단계.
24. 항목 23에 있어서, 상기 제1 또는 제2 탄소 공급원이 사카라이드, 폴리올, 알코올, 또는 전술한 것 중 임의의 하나 이상의 혼합물로부터 선택되는, 방법.
25. 항목 23 또는 24에 있어서, 상기 단계 a) 배양이 회분 단계에서 수행되고; 상기 단계 b) 배양이 유가 또는 연속 배양 단계에서 수행되는, 방법.
26. 하기 단계를 포함하는, 숙주 세포에서 관심 단백질(POI)을 생산하는 방법:
a) 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자의 발현을 감소시키기 위해 숙주 세포를 유전적으로 조작하는 단계;
b) 상기 POI를 암호화하는 관심 유전자(GOI)에 작동가능하게 연결된 비-메탄올 탄소 공급원 조절가능한 프로모터(특히 본원에 기재된 ECP)를 포함하는 이종 발현 카세트를 숙주 세포에 도입하는 단계;
c) 상기 POI를 생산하기 위한 조건 하에 상기 숙주 세포를 배양하는 단계;
d) 임의적으로 세포 배양물로부터 상기 POI를 단리하는 단계; 및
e) 임의적으로 상기 POI를 정제하는 단계.
전술한 설명은 하기 실시예를 참조하여 더 완전히 이해될 것이다. 그러나, 이러한 실시예는 단지 본 발명의 하나 이상의 구현예를 실시하는 방법을 대표하는 것이며 본 발명의 범위를 제한하는 것으로 해석되어서는 안 된다.
실시예
하기 실시예는 전사 조절인자 FLO8의 파괴가 pG1, pG3, pG4, pG6, 및 pG8과 같은 탄소 조절된 프로모터, 및 이의 조작된 변이체의 더 높은 전사 활성을 초래하여 탄소 제한된 배양 조건 하에 재조합 단백질의 생산성을 증가시킬 수 있음을 입증할 것이다.
실시예 1: 피. 파스토리스 d
FLO8
균주의 구축
피. 파스토리스 야생형 균주 CBS7435 또는 CBS2612(CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelcultures, 네덜란드 위트레흐트 소재)를 숙주 균주로 사용하였다.
dFLO8 돌연변이체 균주를 생성하기 위해 유전자 PP7435_Chr4-0252(FLO8)를 피. 파스토리스에 대해 적합하고(Gasser et al., 2013) WO2015158800A1에 기재된 바와 가튼 분열 마커 카세트 방법으로 파괴하였다. 간단히 말해서, ORF의 번역 시작의 대략 200 bp 상류 및 하류에 위치한 2 개의 1.5 kb 영역을 각각 프라이머 A_fw 및 A_bw 뿐만 아니라 D_fw 및 D_bw를 사용하여 증폭시켰다(표 1). 생성된 단편 A 및 B를 사용하여 내성 마커 카세트의 각각의 부분 B 및 C의 5' 및 3' 단부에 상동성인 프라이머 A_bw 및 D_fw의 돌출부를 사용하여, 융합 PCR에 의해 KanMX 마커 카세트(프라이머 B_fw, B_bw, C_fw 및 C_bw)의 2 개의 약 1 kb 길이 및 중첩 부분(435 bp)을 플랭킹하였다. 2 개의 융합된 단편 AB 및 CD를 동시에 (Gasser et al., 2013)에 기재된 바와 같은 전기적격 피. 파스토리스 세포로 형질전환하였다. 성공적인 통합은 KanMX 카세트에 의해 PP7435_Chr4-0252의 5' 단부에 있는 0.4 kb 단편 및 이의 프로모터를 교체하는 3 가지 상이한 재조합 이벤트가 필요하다.
양성 형질전환체의 선택은 500 μg mL-1 제네티신(Geneticin)을 함유하는 선택적 YPD-한천 플레이트(리터 당: 10 g 효모 추출물, 20 g 펩톤, 20 g 글루코스, 20 g 한천-한천)에서 수행하였다. 정확한 결실 돌연변이체는 분열 마커 카세트(Det_fw 및 Det_bw, 표 1)의 외부에 위치한 프라이머를 사용한 PCR 및 겔 전기영동에 의해 검증하였다.
표 1: 분열 마커 카세트 구축을 위한 프라이머
실시예 2: pG1 및 pG1-3
구동된 세포내 eGFP 생산성에 대한
FLO8
파괴의 효과
a) 피. 파스토리스 d
FLO8
균주의 구축
피. 파스토리스 CBS2612_pG1_eGFP #8(WO2013050551A1에 기재됨) 및 CBS2612_pG1-3_eGFP#1(WO2017021541A1 및 Prielhofer et al., 2018에 CBS2612_pGTH1-D1240으로 기재됨)을 숙주 균주로 사용하였다. 이들 균주는 글루코스-조절 프로모터 pG1(서열번호:12) 또는 이의 조작된 변이체(pG1-3, 서열번호:10), GOI 및 에스. 세레비지애 CYC1 전사 종결인자로 구성된 eGFP 발현 카세트와 함께 제오신(Zeocin) 내성 카세트의 단일 카피를 통합한 것으로 입증되었다. 상응하는 dFLO8 돌연변이체 균주를 실시예 1에 기재된 바와 같이 구축하였다.
b) eGFP 생산성 스크리닝
발현 스크리닝을 위해, dFLO8 균주 뿐만 아니라 각각의 모체 균주 및 비-생산 야생형 균주의 단일 콜로니를 25 μg mL-1 제오신 및 500 μg mL-1 제네티신(적절한 경우)을 함유하는 2 mL 액체 YP 배지(리터 당: 20 g 펩톤, 10 g 효모 추출물)에 접종하였다. 사전 배양물을 24-DWP에서 25℃ 및 280 rpm에서 약 24 시간 동안 성장시킨 후 50 g L-1 폴리사카라이드 및 1.5 %의 글루코스-방출 효소(약 0.8 mg mL-1 h-1의 글루코스 방출 속도를 가능하게 함; m2p 배지 발색 키트)를 함유하는 2 mL의 합성 스크리닝 배지 ASMv6(배지 조성은 하기 제공됨)을 5의 시작-OD600(유도 조건)으로 접종하는 데 사용하였다. 억제 조건을 위해, 2% 글리세롤을 함유하는 ASMv6을 사용하였다. 그런 다음 주 배양물을 25℃ 및 280 rpm에서 추가 48 시간 동안 배양하였다. eGFP-발현을 측정하기 위해, 세포를 포스페이트-완충 염수(PBS)에서 0.1의 OD600으로 희석하고 Stadlmayr et al., 2010에 기재된 바와 같이 유세포 분석에 의해 분석하였다. 각각의 샘플에 대해 15 000 개의 세포를 분석하였다. 피. 파스토리스의 자동 형광을 피. 파스토리스 야생형 세포를 사용하여 측정하고 신호로부터 차감하였다. 정규화된 eGFP 발현 수준(세포 크기와 관련한 형광 강도)은 pGAP-제어된 발현의 백분율로 주어진다(표 2).
리터 당 함유된 합성 스크리닝 배지 ASMv6: 22.0 g 시트르산 일수화물, 6.30 g (NH4)2HPO4, 0.49 g MgSO4*7H2O, 2.64 g KCl, 0.0535 g CaCl2*2H2O, 1.470 mL PTM0 미량 염 스톡 용액, 0.4 mg 비오틴; pH는 KOH(고체)를 사용하여 6.5로 설정하였다.
리터 당 함유된 PTM0 미량 염 스톡 용액:
6.0 g CuSO4*5H2O, 0.08 g NaI, 3.36 g MnSO4*H2O, 0.2 g Na2MoO4*2H2O, 0.02 g H3BO3, 0.82 g CoCl2*6H2O, 20.0 g ZnCl2, 65.0 g FeSO4*7H2O 및 5.0 ml H2SO4(95 %-98 %).
표 2: pG1 또는 pG1-3의 제어 하에 eGFP의 발현에 대한 d FLO8 의 영향. 2% 글리세롤(억제) 또는 제한-글루코스(유도)에서 48 시간 배양 후 pGAP에 대한 eGFP 발현 수준 뿐만 아니라 야생형에서 pG1 또는 pG1-3과 비교한 유도 조건 하에 dFLO8 균주의 eGFP 형광의 증가가 제시된다.
FLO8의 결실은 pG1-구동된 발현에 긍정적인 영향을 미쳐, 유도(글루코스-제한) 조건에서 거의 4-배 더 높은 eGFP 수준으로 이어졌다(표 2). 따라서, FLO8을 파괴하는 효과를 또한 그 자체가 더 높은 고유한 발현을 갖는 프로모터 변이체 pG1-3에 대해 연구하였다. 또한 프로모터 변이체에 대해서도 긍정적인 영향을 나타냈으며, 다시 말해서 야생형 배경에서 동일한 프로모터로부터의 발현과 비교하여 dFLO8 균주에서 2.5 내지 3-배 더 높은 eGFP 수준을 가능하게 하였다(표 2).
실시예 3: 분비된 재조합 단백질의 P
G1-3
구동된 생산성에 대한
FLO8
파괴의 효과
다음으로, 분비 모델 단백질의 pG1-3 구동된 발현에 대한 dFLO8 돌연변이의 영향을 평가하였다. 이 목적을 위해 vHH 또는 scR에 대한 발현 카세트를 CBS2612 및 CBS2612_dFLO8로 형질전환하였다.
a) 피. 파스토리스
d
FLO8
균주의 구축 및 선택 마커 재활용
피. 파스토리스 야생형 균주 CBS2612(CBS-KNAW Fungal Biodiversity Centre, Centraalbureau voor Schimmelcultures, 네덜란드 위트레흐트 소재)를 숙주 균주로 사용하였다.
CBS2612_KanR_dFLO8 #2를 실시예 1에 기재된 바와 같이 구축하였다. Cre-loxP 재조합에 기초한 게놈으로부터 KanMX 선택 마커 카세트를 잘라내기 위해, CBS2612_KanR_dFLO8 #2를 Gasser et al., 2013에 기재된 바와 같은 전기천공법에 의해 플라스미드 pTAC_Cre_hphMX4로 일시적으로 형질전환하였다. pTAC_Cre_hphMX4는 플라스미드 pYX022(R&D Systems)의 유도체이며 이. 콜라이에 대한 복제 기점, Cre-리콤비나제 유전자에 대한 발현 카세트, 하이그로마이신 내성 카세트 뿐만 아니라 ARS/CEN 요소로 구성된다. 이의 구축을 위해 pTAC_Cre_kanMX(Marx et al., 2008)를 EcoR91I로 분해하여 카나마이신 내성 카세트를 제거하였다. 플라스미드 pGA26_hphMX4를 동일한 효소로 분해하여 하이그로마이신 내성 카세트를 잘라내고 적절한 단편을 결찰에 의해 융합시켰다.
양성 형질전환체의 선택을 100 μg mL-1 하이그로마이신을 함유하는 YPD-한천에서 수행하였다. 이후에 하이그로마이신 내성 클론을 YPD-한천(pKTAC-CRE_hygR의 손실을 촉진하기 위해 하이그로마이신 없음) 뿐만 아니라 500 μg mL-1 제네티신을 함유하는 YPD-한천에서 동시에 다시 스트리킹하였다. 제네티신에 대한 내성을 상실한 균주를 프라이머 Det_bw 및 Det_fw(표 1)를 이용하는 PCR 및 겔 전기영동에 의해 추가로 확인하여 게놈으로부터 KanMX 내성 카세트의 절제를 확인하였다. 상응하는 균주로부터, 추가 사용을 위해 CBS2612_L_dFLO8 #2_4를 선택하였다.
b) P
G1-3
의 전사 제어 하에 항체 단편 scFv(scR) 및 vHH를 분비하는 피. 파스토리스
균주의 구축
발현 플라스미드 pPM2d_pAOX_scR 및 pPM2d_pAOX_vHH는 pPUZZLE 플라스미드 백본의 유도체이다(Stadlmayr et al. 2010). 이들은 이. 콜라이의 복제 기원(pUC19), 제오신 내성 카세트, 에스. 세레비지애 알파-결합 인자 전-전구 리더, 관심 유전자(vHH 또는 scR) 및 에스. 세레비지애 CYC1 전사 종결인자, 뿐만 아니라 피. 파스토리스 게놈으로의 통합을 위한 유전자좌(3´AOX1 영역)로 구성된다. 이의 구축을 위해 scFv(scR) 및 vHH를 암호화하는 유전자를 DNA2.0에 의해 코돈-최적화하고 합성 DNA(하기 나타낸 서열)로 수득하였다. 검출을 위해 His6-태그를 유전자에 C-말단으로 융합시켰다. XhoI 및 BamHI(scR의 경우) 또는 EcoRV(vHH의 경우)로의 제한 분해 후, 각 유전자를 XhoI 및 BamHI 또는 EcoRV로 분해된 pPM2d_pAOX에 결찰시켰다. 이들 플라스미드 뿐만 아니라 발현 플라스미드 pPM1aZ10_pG1-3_eGFP(또한 WO2017021541A1에 기재된 pPUZZLE 유도체)를 AlwNI 및 SbfI로 제한 분해하고 적절한 플라스미드 단편을 융합시켜 PAOX1의 PG1-3으로의 대체를 수행하였다. pPM1aZ10_pG1-3_eGFP로부터 유도된 단편은 또한 이 유전자좌에 대한 표적화된 통합을 가능하게 하는 AOX-종결인자에 대한 서열을 함유하였다.
생성된 발현 플라스미드 pPM1aZ30_pG1-3_scR 및 pPM1aZ30_pG1-3_vHH를 AscI로 선형화하고 Gasser et al., 2013에 기재된 바와 같은 표준 프로토콜을 사용하여 전기천공법에 의해 CBS2612(약칭 wt), CBS2612_KanR_dFLO8 #2(약칭 dFLO8) 또는 CBS2612_L_dFLO8 #2_4(약칭 dFLO8L)로 형질전환하였다.
50 μg mL-1의 제오신 및 500 μg mL-1 제네티신(적절한 경우)을 함유하는 선택적 YPD-한천에서 양성 형질전환체의 선택을 수행하였다.
c) 항체 단편 생산성의 스크리닝
발현 스크리닝을 위해, 각각의 형질전환체의 단일 콜로니를 25 μg mL-1 제오신 및 500 μg mL-1 제네티신(적절한 경우)을 함유하는 2 mL 액체 YP 배지(리터 당: 20 g 펩톤, 10 g 효모 추출물)에 접종하고 280 rpm으로 24-DWP에서 25℃에서 약 24 시간 동안 성장시켰다. 이들 배양물을 사용하여 50 g L-1 폴리사카라이드 및 1.5 %의 글루코스-방출 효소(약 0.8 mg h- 1 mL-1의 글루코스 방출 속도를 가능하게 함; m2p 배지 발색 키트)를 함유하는 2 mL의 합성 스크리닝 배지 ASMv6(조성의 경우 실시예 2 참조)에 8의 시작-OD600으로 접종하였다. 배양 조건은 사전 배양 조건과 유사하였다. 48 시간 후, 1 mL의 세포 현탁액을 미리 칭량된 1.5 mL 원심분리 튜브로 옮기고 실온에서 5 분 동안 16100 g로 원심분리하였다. 상청액을 조심스럽게 새로운 바이알로 옮기고 추가 사용까지 -20℃에서 저장하였다. 펠릿을 함유하는 원심분리 튜브를 다시 칭량하여 습윤 세포 중량(WCW)을 결정하였다. 상청액 중 재조합 분비된 단백질의 정량화를 하기 기재된 바와 같은 미세유체 모세관 전기영동에 의해 수행하였다.
d) 미세유체 모세관 전기영동(mCE)에 의한 정량화
'LabChip GX/GXII System'(PerkinElmer)을 배양 상청액 내 분비된 단백질 역가의 정량적 분석을 위해 사용하였다. 소모품 'Protein Express Lab Chip'(760499, PerkinElmer) 및 'Protein Express Reagent Kit'(CLS960008, PerkinElmer)를 사용하였다. 칩 및 샘플 제조는 제조업체의 권장사항에 따라 수행하였다. 절차의 간단한 설명이 하기 주어진다.
칩 제조: 시약이 실온으로 된 후 520 및 280 μL의 Protein Express Gel Matrix를 스핀 필터로 옮겼다. 20 μL의 Protein Express Dye 용액을 스핀 필터를 함유하는 520 μL Gel Matrix에 첨가하였다. 스핀 필터를 함유하는 염료를 잠시 반대 방향으로 볼텍싱한 후, 두 스핀 필터를 9300 g로 10 분 동안 원심분리하였다. 칩을 세척하기 위해, 120 μL Milli-Q® 물을 모든 활성 칩 웰에 첨가하고 칩을 기기 세척 프로그램에 적용하였다. Milli-Q® 물을 사용하여 2 번의 추가 헹굼 단계 후, 남아있는 유체를 완전히 흡인하고 적절한 양의 여과된 Gel Matrix 용액 뿐만 아니라 Protein Express Lower Marker 용액을 적절한 칩 웰에 첨가하였다.
샘플 및 래더 제조: 샘플 제조를 위해 6 μL 샘플을 96-마이크로타이터 플레이트에서 21 μL의 샘플 완충액과 혼합하였다. 샘플을 100℃에서 5 분 동안 변성시키고 1200 g로 2 분 동안 원심분리하였다. 이후에, 105 μL의 Milli-Q® 물을 첨가하였다. 샘플 용액을 피펫팅에 의해 잠시 혼합하고 측정 전에 1200 g로 2 분 동안 다시 원심분리하였다. 래더를 제조하기 위해 12 μL의 Protein Express Ladder를 PCR 튜브에서 100℃에서 5 분 동안 변성시켰다. 이후에, 120 μL의 Milli-Q® 물을 첨가하고 미니원심분리기에서 15 초 동안 튜브를 회전시키기 전에 래더 용액을 잠시 볼텍싱하였다.
정량화는 제조업체에서 제공한 LabChip 소프트웨어를 이용하고 BSA 표준과 비교하여 수행하였다.
표 3은 평균 scR-역가가 야생형과 비교하여 dFLO8 균주의 상청액에서 1.8-배 더 높지만, 바이오매스 농도는 상이하지 않아서 dFLO8 균주의 상청액에서 scR 수율이 1.86-배 더 높음을 나타낸다. 또한 vHH-발현 균주의 경우에 dFLO8 돌연변이 시 평균 역가 및 vHH 수율(1.7-배)의 유사한 증가를 관찰하였다(표 4).
표 3: pPM1aZ30_pG1-3_scR로 형질전환된 CBS2612 및 CB2612_L_dFLO8 #2_4의 24-DWP 스크리닝의 평균 WCW, 생산 역가 및 수율. 작제물 당 20 개의 클론을 스크리닝하였다.
표 4: pPM1aZ30_pG1-3_vHH로 형질전환된 CBS2612 및 CB2612_KanR_dFLO8 #2의 24-DWP 스크리닝의 평균 WCW, 생산 역가 및 수율. 작제물 당 20 개의 클론을 스크리닝하였다.
다음으로, FLO8을 실시예 1에 기재된 바와 같은 분열 마커 카세트 접근법을 사용함으로써 상기 스크리닝으로부터 선택된 4 개의 상이한 vHH-발현 클론(CBS2612_pG1-3_vHH #4, #5, #13 및 #15)에서 파괴하였다. 이후에, dFLO8 돌연변이체 클론 뿐만 아니라 상응하는 FLO8 모체 클론을 24-DWP-스크리닝 법에 적용하여 이들의 생산성에 대해 스크리닝하였다. 표 5는 vHH 역가 및 생산 수율이 dFLO8 클론에서 2- 내지 3-배 더 높았음을 나타낸다. 증가된 생산 수준이 더 높은 전사 발현에 기초하였음을 검증하기 위해, vHH 전사체 수준을 상이한 시점에서 qPCR에 의해 정량화하였다. 평균 2-배 더 높은 vHH 발현 수준이 dFLO8 클론에서 관찰되었으며, 이는 개선된 vHH 역가가 실제로 pG1-3의 더 높은 전사 활성에 기초함을 나타낸다(실시예 4 참조).
표 5: 4 개의 상이한 vHH-발현 균주 뿐만 아니라 이의 상응하는 dFLO8 균주의 평균 WCW 및 역가. 각 모체 균주의 4 개의 복제물 뿐만 아니라 6 개의 상응하는 dFLO8 균주를 스크리닝하였다. (FC: 배수 변화).
실시예 4: pG1-3 제어된 vHH-전사에 대한
FLO8
파괴의 효과
FLO8의 파괴가 pG1-3의 제어 하에 유전자의 증가된 전사 활성을 야기하는지를 테스트하기 위해, CBS2612_pG1-3_vHH #4 및 #13의 6 개의 기술적 복제물 뿐만 아니라 상응하는 dFLO8 돌연변이체 균주 CBS2612_pG1-3_vHH #4_dFLO8_1 및 #13_dFLO8_2(표 5; 실시예 3)를 실시예 3에 기재된 바와 같은 24-DWP 형식으로 배양하였다. 2, 19 및 26 시간 후, 2 개의 복제물로부터 1 mL의 배양물을 수확하고 16100 g 및 4℃에서 1 분 동안 원심분리하여 상청액을 버렸다. 이후에, 세포 펠릿을 1 mL TRI 시약(Sigma-Aldrich)에 재현탁하고 추가 처리까지 -80℃에서 저장하였다.
RNA 단리를 실시예 6에 기재된 바와 같이 수행하였다. 잔류 DNA를 제거하기 위해, RNA 샘플을 제조업체의 매뉴얼에 따라 DNA-free™-키트(Ambion)로 처리하였다. 이후에, RNA 품질, 순도 및 농도를 겔 전기영동 뿐만 아니라 NanoDrop 2000(Thermo Scientific)을 사용한 분광 광도 분석에 의해 분석하였다.
cDNA의 합성을 제조업체의 매뉴얼에 따라 Biozym cDNA Synthesis Kit로 수행하였다. 간단히 말해서, 500 ng의 총 RNA를 역 전사효소, dNTP, RNase 억제제 및 합성 완충액을 함유하는 마스터 믹스에 첨가하였다. 프라이밍을 위해 올리고 d(T)23 VN(NEB)을 사용하였다. 반응 믹스의 배양을 55℃에서 60 분 동안 수행하였다. 이후에, 반응 믹스를 99℃에서 5 분 동안 배양하여 효소의 불활성화를 달성하였다.
정량적 실시간 PCR(qPCR)을 위해 vHH-특이적 프라이머를 사용하였다(표 6). ACT1 발현 수준을 비교하여 정규화를 수행하였다(표 6). 분석을 위해 1 μL의 cDNA, 물 및 프라이머를 SensiMix SYBR 2x Master Mix(Bioline)로 혼합하고 실시간 PCR 사이클러(Rotor-Gene, Qiagen)에서 분석하였다.
표 6: vHH-전사체 분석을 위한 정량적 실시간 PCR 프라이머
모든 샘플을 기술적으로 삼중으로 측정하였다. 데이터 분석은 비교 정량(QC) 방법을 이용하여 Rotor-Gene 소프트웨어로 수행하였다.
표 7은 dFLO8 균주에서 평균 vHH-전사체 수준이 모든 분석된 배양 시점에 걸쳐 증가하였음을 나타낸다.
표 7: 상이한 스크리닝-배양 시점에서 평균 상대적 vHH-전사체 수준
실시예 5: 실험실 규모 생물반응기 유가 배양에서 pG1-3-구동된 분비된 항체 단편 생산성에 대한
FLO8
파괴의 영향
유가 배양을 수행하기 전에, 제네티신 내성 마커 카세트를 실시예 3에 기재된 바와 같은 Cre-매개 재조합에 의해 균주 CBS2612_ pG1-3_vHH #4_dFLO8_4(약칭 dFLO8_pG1-3_vHH #4_4)(표 5, 실시예 3)의 게놈으로부터 잘라내었다. 생성된 균주 CBS2612_pG1-3_vHH #4_ dFLO8_4 #L1(약칭 L_dFLO8 _pG1-3_vHH #4_4_1)의 3 개의 복제물의 생산성을 실시예 3에 기재된 바와 같은 24-DPW 스크리닝 형식에서 모체 균주의 3 개의 복제물의 생산 수준과 비교하였다(표 8). CBS2612_pG1-3_vHH #4_dFLO8_4 #L1의 평균 생산성은 모체 균주와 유사하게 유지되었다(p-값 0.096).
표 8: 24-DWP 스크리닝에서 CBS2612_dFLO8_pG1-3_vHH #4_4 및 CBS2612_L_dFLO8_pG1-3_vHH #4_4_1의 WCW 및 역가.
유가 배양을 1 L 벤치탑 생물반응기(SR0700ODLS; Dasgip, 독일 소재)에서 균주 CBS2612_ pG1-3_vHH #4 및 상응하는 loxed dFLO8 돌연변이체 CBS2612_L_dFLO8_pG1-3_vHH #4_4_1로 수행하였다. 사전 배양을 위해 1 L 진탕 플라스크에서 50 μg mL 제오신을 함유하는 100 mL YPG 배지를 1.0 mL 저온저장물로 접종하고 180 rpm 및 25℃에서 약 24 시간 동안 배양하였다. 회분 배양을 0.25 L의 작업 부피에서 작동시키고 1.5의 시작 OD600으로 접종하였다. 글리세롤 회분 배지 조성은 하기에 주어진다. 전체 공정 동안 온도를 30℃로 제어하고, DO를 교반기 속도(400 내지 1200 rpm) 및 공기 흐름(9.5 내지 30 sL h-1)의 자동 조정에 의해 30%로 유지하고 pH를 12.5 % NH4OH의 자동 첨가에 의해 5.0으로 조절하였다. 회분-종료를 나타내는 DO에서 갑작스런 스파이크 후, 빠른 초기 성장 속도를 초래하는 선형 증분 글루코스 공급(배지 조성은 하기에 상세히 설명됨) 이어서 PG1-3-기반 qP 에서 μ 동역학에 대해 특이적으로 최적화된 점진적으로 감소하는 μ의 확장 단계를 적용하였다(Prielhofer et al., 2018).
리터 당 함유된 글리세롤 회분 배지:
2 g 시트르산 일수화물(C6H8O7*H2O), 45 g 글리세롤, 12.6 g (NH4)2HPO4, 0.5 g MgSO4*7H2O, 0.9 g KCl, 0.022 g CaCl2*2H2O, 6.6 mL 비오틴 스톡 용액(0.2 g L-1) 및 4.6 mL PTM0 미량 염 스톡 용액(실시예 2에 기재됨). HCl(conc.)을 첨가하여 pH 5로 설정하였다.
리터 당 함유된 글루코스 공급 배지:
495 g 글루코스 일수화물, 5.2 g MgSO4*7H2O, 8.4 g KCl, 0.28 g CaCl2*2H2O, 11.8 mL 비오틴 스톡 용액(0.2 g L-1) 및 10.1 mL PTM0 미량 염 스톡 용액(실시예 2에 기재됨).
YDM 및 분비된 재조합 단백질을 공정 전반에 걸쳐 다양한 시점에서 분석하였다(표 9). YDM 분석을 위해 1 mL의 배양 브로쓰를 2 mL의 미리 건조되고(105℃에서 적어도 24 시간 동안) 미리 칭량된 원심분리 튜브로 옮겼다. 16100 g로 5 분 동안 원심분리 후 상청액을 조심스럽게 새 바이알로 옮기고 추가 사용까지 -20℃에서 저장하였다. 세포 펠릿을 이온수로 2 회 세척하고 다시 중량을 측정하기 전에 105 ℃에서 적어도 24 시간 동안 건조시켰다.
상청액을 실시예 3에 기재된 바와 같이 미세유체 모세관 전기영동(GXII, Perkin-Elmer)에 의해 분석하였다.
표 9: CBS2612 _pG1-3_vHH #4 및 L_CBS2612_dFLO8_pG1-3_vHH #4_4_1의 생물반응기 유가 배양 동안 YDM 및 vHH-역가
표 9로부터 공정 전반에 걸쳐 dFLO8 균주에 대한 생산 역가가 wt-배경 균주에 대한 것보다 지속적으로 더 높았음을 알 수 있다. 공정 종료 시 생산성에서 5.7-배 증가를 관찰하였다. 또한 유가 배양에서, 전체 시간 과정에 걸쳐 dFLO8 균주에서 vHH 전사 수준 증가를 관찰하였다.
실시예 6: 비-메탄올 탄소 조절된 프로모터의 발현 강도 및 조절 거동에 대한
FLO8
파괴의 효과
다음 단계에서, 유도 조건에서 다른 탄소 조절된 프로모터(WO2013050551A1 및 Prielhofer et al. 2013에 기재됨)의 전사 강도에 대한 FLO8 파괴의 영향을 연구하였다. 글루코스-제한 조건 하에 전사체 분석을 위해, CBS7435 야생형 및 CBS7436_KanR_dFLO8 #2를 사용하였다. 24-딥-웰-플레이트(24-DWP)에서 사전 및 주 배양물을 배양하였다. 첫번째 사전 배양을 위해 500 μg mL-1 제네티신(적절한 경우)을 함유하는 2 mL YPD(리터 당: 10 g 효모 추출물, 20 g 펩톤, 20 g 글루코스)를 각각 CBS7435 및 CBS7435_KanR_dFLO8 #2의 단일 콜로니에 접종하고, 25℃ 및 280 rpm에서 약 24 시간 동안 성장시켰다. 두번째 사전 배양을 위해 4의 시작 OD600으로 접종된 2 mL M2(D) 배지(조성은 하기 기재됨)를 사용하였다. 디스크 당 1.63 t0.74 mg(t = 시간 [h])의 비선형 속도로 글루코스를 유리하는 글루코스-방출 중합체 비드(12 mm 공급 비드, Kuhner, 스위스 소재)를 첨가하고 배양물을 25℃ 및 280 rpm에서 약 24 시간 동안 배양하였다. 주 배양을 위해 2 mL의 M2 배지(글루코스 없는 M2(D))를 사용하였다. 배양물을 280 rpm 및 25℃에서 진탕하였다. 글루코스의 느린 방출은 글루코스 제한 성장을 보장하였다. 샘플을 주 배양 3 시간 후에 취하고(추정된 특이적 성장 속도: 0.1 h-1), 사전 냉각된 고정 용액(에탄올 [절대] 중 5% [vol/vol] 페놀)과 2:1 비율로 즉시 혼합하고, 밀봉된 튜브로 분취하고 16100 g로 1 분 동안 원심분리하였다. 펠릿을 추가 사용까지 -80℃에서 저장하였다.
리터 당 함유된 M2(D): 22.0 g 글루코스 일수화물, 22.0 g 시트르산 일수화물, 3.15 g (NH4)2HPO4, 0.49 g MgSO4*7H2O, 0.80 g KCl, 0.0268 g CaCl2*2H2O, 1.47 mL의 PTM0 미량 염 스톡 용액(실시예 1에 기재됨) 및 0.4 mg 비오틴; pH를 KOH(고체)를 사용하여 5로 설정하였다.
RNA 단리를 위해 1 mL의 TRI 시약(Sigma-Aldrich) 및 500 μL 산 세척된 유리 비드를 첨가하고 세포를 FastPrep-24(mpbio)에서 5.5 m/s의 속도로 40 초 동안 파괴하였다. 그후에, 200 μL의 클로로포름을 첨가하였다. 이후에, 샘플을 격렬하게 진탕시킨 다음 실온에서 5 - 10 분 동안 방치시켰다. 상 분리를 촉진하기 위해 16100 g 및 4℃에서 10 분 동안 원심분리한 후, RNA를 함유하는 상단의 무색 수성 상을 새로운 튜브로 옮기고 500 μL의 이소프로판올을 첨가하여 RNA를 침전시켰다. 10 분 배양 후 샘플을 16100 g 및 4℃에서 10 분 동안 원심분리하고 상청액을 버렸다. RNA 펠릿을 70% 에탄올로 1 회 세척하고, 공기 건조하고 RNAse가 없는 물에 재현탁하였다.
전사체 분석을 위해, 자체 설계된 피. 파스토리스-특이적 올리고뉴클레오티드 어레이(AMAD-ID 034821, 8 Х 15K 맞춤형 어레이; Agilent, 미국 소재)를 사용하였다(Graf et al.; BMC Genomics. 2008;9:390.). cRNA의 합성, 혼성화, 뿐만 아니라 스캐닝을 2-색 발현 어레이에 대한 Agilent 프로토콜에 따라 수행하였다. 샘플을 Cy3 및 Cy5로 삼중으로 표지하고 다양한 배양 조건 하에 성장된 세포로부터 생성된 참조 풀에 대해 혼성화하였다. 모든 샘플에 대해, 염료 교환 실험을 수행하였다.
마이크로어레이 데이터의 정규화 단계 및 통계적 분석은 국지적 가중 MA-산점도 평활(LOESS)을 사용한 색상 편향 제거, 이어서 그 사이에 "Aquantile" 방법을 사용한 어레이 정규화를 포함하였다. 차등으로 발현된 유전자를 식별하고 p-값을 계산하기 위해 eBayes 보정으로 맞춘 선형 모델을 사용하였다. P-값은 Benjamini & Yekutieli, 2001에 의한 오발견 방법(FDR)을 사용하여 다중 테스트를 위해 조정되었다. 조정된 p-값이 0.05 미만인 유전자는 통계적으로 유의한 차등 발현을 갖는 것으로 간주된다. 차등으로 발현된 유전자를 식별하기 위해, 추가로 최소 0.58 > log2 FC < -0.58의 배수 변화 컷오프를 적용하였다.
모든 단계를 R 소프트웨어(Robinson MD, McCarthy DJ, Smyth GK. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. 2010. Bioinformatics. 26:139-40.) 및 limma 패키지를 사용하여 수행하였다. 탄소-조절된 유전자(탄소 공급원 조절된 프로모터의 제어 하의 유전자)의 선택을 위한 배수 변화는 표 10에 제시되어 있다. 천연 FLO8 유전자의 발현은 야생형과 비교하여 dFLO8 돌연변이체에서 명확하고 유의하게 감소된다. 모든 탄소 공급원 조절된 유전자에 대해, dFLO8 돌연변이체에서 증가된 전사체 수준을 볼 수 있으며, 이는 유도 조건에서 3.7 내지 11.4-배 더 높은 전사 강도에 도달한다. 모든 이들 유전자는 dFLO8 돌연변이체 균주에서 통계적으로 유의한 더 높은 전사(조정된 p-값 <0.05)를 갖는다. 이는 Prielhofer et al. 2013 및 Prielhofer et al. 2018에 기재된 바와 같은 모든 비-메탄올 탄소 조절된 프로모터의 생산 잠재력이 FLO8의 파괴에 의해 향상됨을 강하게 나타낸다. 대조적으로, GAP 프로모터의 발현 강도는 FLO8의 파괴에 의해 영향을 받지 않는다.
표 10: 글루코스-제한 유도 조건에서 FLO8 유전자 및 탄소-조절된 프로모터 하에 제어된 유전자의 전사 강도에 대한 dFLO8 돌연변이체의 효과. 야생형 균주와 비교하여 dFLO8 돌연변이체 균주 사이의 배수 변화(FC)가 제시된다. 조정된 p-값이 0.05 미만인 발현 변화는 통계적으로 유의한 차이를 나타낸다.
실시예 7: 메탄올 조절된 프로모터 pAOX1의 전사 강도에 대한
FLO8
파괴의 효과
또한 전사 강도에 대한 FLO8 파괴의 영향을 메탄올-유도 조건 하에 pAOX1 및 pGAP와 같은 피. 파스토리스 표준 프로모터에 대해 결정하였다. 따라서 pAOX1의 제어 하에 재조합 Fab 단편을 발현하는 균주 CBS7435 및 각각의 dFLO8 돌연변이체 균주 dFLO8#2를 메탄올-기반 유가 배양으로 배양하였다.
유가 배양을 1.0 L의 최대 작업 부피로 1.4 L DASGIP 반응기(Eppendorf, 독일 소재)에서 수행하였다. 배양 온도를 25℃로 제어하고, pH를 25% 수산화암모늄을 첨가하여 5.0으로 제어하고 용존 산조 농도를 교반 속도 400 내지 1200 rpm, 및 공기 흐름 24 내지 72 sL/h로 제어함으로써 20% 초과의 포화 상태로 유지하였다.
유가 배양을 위한 접종물을 20 g/L 글리세롤 및 50 μg/mL 제오신을 함유하는 100 mL의 YP 배지를 함유하는 진탕 플라스크에서 배양하고, 28℃ 및 180 rpm에서 대략 24 시간 동안 배양하였다. 배양물을 사용하여 생물반응기에서 0.4 L의 시작 부피를 1.0의 시작 광학 밀도(600 nm)로 접종하였다. 회분 배양을 대략 24 시간 후에 완료하였고 첫번째 (10 mL) 염 샷(salt shot)을 제공하였다.
그런 다음 글리세롤 유가 용액을 5 시간 동안 5 mL/h의 일정한 속도로 공급하였다. 이어서, 메탄올 펄스(2 g) 및 염 샷(10 mL)을 배양물에 제공하였다. 메탄올 펄스 소비가 배양물에서 용존 산소 농도의 증가에 의해 나타난 후, 1.0 g/h의 공급 속도로 메탄올 유가 용액의 일정한 공급을 시작하였다. ~43 g 메탄올 공급 배지에 상응하는 새로 형성된 바이오매스 10 g 마다 염 샷 10 mL가 제공된다. 바이오매스 농도가 증가함에 따라, 단시간 동안 메탄올 공급을 차단할 때 배양물에서 용존 산소의 갑작스런 증가로 인해 메탄올 축적이 배제될 수 있을 때 메탄올 공급 속도가 적절하게 증가하였다. 최종 메탄올 공급 속도는 2.5 g/h였다.
샘플을 빈번하게 취하였다. 배양물은 세포 밀도가 100 g/L 세포 건조 중량 초과에 도달했을 때 대략 100 시간 후에 수확하였다.
배지는 다음과 같았다:
함유된 회분 배지(리터 당): 2.0 g 시트르산, 12.4 g (NH4)2HPO4, 0.022 g CaCl2·2H2O, 0.9 g KCl, 0.5 g MgSO4·7H2O, 40 g 글리세롤, 4.6 mL PTM1 미량 염 스톡 용액. pH는 25% HCl을 사용하여 5.0으로 설정하였다.
함유된 글리세롤 유가 용액(리터 당): 623 g 글리세롤, 12 mL PTM0 미량 염 스톡 용액 및 40 mg 비오틴. PTM0 조성은 실시예 2에 제시되어 있다.
함유된 순수 메탄올의 메탄올 유가 용액(리터 당): 12 mL PTM0 미량 염 스톡 용액 및 40 mg 비오틴.
함유된 염 샷 용액(리터 당): 20.8 g MgSO4·7H2O, 41.6 KCl, 1.04 g CaCl2·2H2O.
ELISA에 의한 온전한 Fab의 정량화를 항-인간 IgG 항체(ab7497, Abcam)를 코팅 항체로 사용하고 염소 항-인간 IgG(Fab 특이적) - 알칼리성 포스파타제 접합된 항체(Sigma A8542)를 검출 항체로 사용하여 수행하였다. 인간 Fab/카파, IgG 단편(Bethyl P80-115)을 시작 농도가 100 ng/mL인 표준으로 사용하였고, 상청액 샘플을 이에 따라 희석하였다. 검출은 pNPP(Sigma S0942)로 수행하였다. 코팅-, 희석- 및 세척 완충액은 PBS(2 mM KH2PO4, 10 mM Na2HPO4.2 H2O, 2.7 mM g KCl, 8 mM NaCl, pH 7.4)를 기반으로 하고 이에 따라 BSA(1%(w/v)) 및/또는 ween20(0.1%(v/v))으로 완료하였다.
생산 역가와 관련하여, dFLO8 돌연변이체에서 pAOX1의 제어 하에 Fab 생산 증가는 메탄올 유가 배양의 종료 시 최대 1.45-배였지만(119 시간 후, WO2015/158800A1에 기재된 바와 같음), 바이오매스 형성은 약간 감소하였다(10-14%).
마이크로어레이 샘플을 53.5 시간(25 시간 메탄올 공급) 후에 취하고 실시예 6에 기재된 바와 같은 처리하였다. 야생형 균주와 비교하여 dFLO8 돌연변이체 균주 사이의 유전자 선택을 위한 배수 변화는 표 11에 제시되어 있다. 다시 말해서, FLO8 전사체 수준은 야생형과 비교하여 dFLO8 돌연변이체에서 유의하게 낮다. 표 10에 제시된 비-메탄올 탄소 조절된 유전자 및 프로모터와 달리, 메탄올-유도성 pAOX1은 완전히 유도된 조건에서(조정된 p-값이 0.05보다 클 때) 야생형과 비교하여 dFLO8 돌연변이체에서 유의하게 증가된 전사 강도를 나타내지 않는다. 또한 메탄올-성장된 세포에서 pGAP에 대한 유의한 효과도 없다. 따라서, 피. 파스토리스에서 이들 표준 프로모터의 전사는 FLO8의 과소발현에 의해 영향받지 않는다.
표 11: 메탄올 유도 유가 조건에서 FLO8 유전자 및 메탄올-유도성 AOX1 프로모터 하에 제어된 유전자의 전사 강도에 대한 dFLO8 돌연변이체의 효과. 야생형 균주와 비교하여 dFLO8 돌연변이체 균주 사이의 배수 변화(FC)가 제시되어 있다. 조정된 p-값이 0.05 미만인 발현 변화는 통계적으로 유의한 차이를 나타낸다.
실시예 8: 비-메탄올 탄소 조절된 프로모터에 의해 구동된 세포내 eGFP 발현에 대한
FLO8
파괴의 효과
대부분의 비-메탄올 탄소 조절된 프로모터에 의해 구동된 천연 유전자 발현(WO2013050551A1; Prielhofer et al. 2013)은 dFLO8 균주에서 유도 조건 하에 유의하게 상향조절되었으므로(실시예 6 참조) FLO8의 파괴를 또한 WO2013050551A1 및 Prielhofer et al(2013)에 기재된 각각의 eGFP-리포터 균주에서 테스트하였다. 각각의 비-메탄올 유도성 프로모터에 대해 pPM1aZ10_pG#_eGFP 발현 벡터를 보유하는 하나의 균주(CBS2612_pG3_eGFP #1; CBS2612_pG4_eGFP #6; CBS2612_pG6_eGFP #53; X33_pG7_eGFP #1; CBS2612_pG8_eGFP #8)를 선택하고 실시예 1에 기재된 분열 마커 카세트 방법을 이용하여 FLO8을 파괴하였다. 유도(글루코스-제한) 조건 하에 스크리닝-배양은 폴리사카라이드 및 글루코스-방출 효소를 상이한 공급처(EnPump 200, Enpresso)로부터 수득한 것을 제외하고는 실시예 2에 기재된 바와 같이 수행하였다. 새로운 글루코스-방출 효소의 특성은 상이하므로, 농도는 약 0.6 mg mL-1 h-1의 일정한 글루코스-방출 속도에 상응하는 0.4%로 조정하였다. 각 경우에 각각의 모체의 2 개의 복제물 뿐만 아니라 적어도 7 개의 상응하는 dFLO8 균주를 스크리닝하였다. eGFP-생산성은 값을 세포 크기에 대해 정규화하지 않은 것을 제외하고는 실시예 2에 기재된 바와 같이 결정하였다. 표 12는 FLO8의 파괴가 각 프로모터에 대한 eGFP 형광 증가로 이어져 각각 pG3 및 pG8의 경우1.7- 내지 1.2-배, 뿐만 아니라 pG4 및 pG7의 경우 2.3-배 및 pG6의 경우 2.2-배에 도달함을 나타낸다. 이는 추가로 pG1 및 pG1 유도체 이외에 다른 비-메탄올 탄소 조절된 프로모터의 향상을 위한 FLO8 파괴의 잠재력을 강조한다.
이들 결과는 야생형 숙주 세포에서 이러한 발현과 비교하여 dFLO8 숙주 세포에서 pG1 또는 pG1 유도체(pG1-3)의 제어 하에 증가된 eGFP 발현을 입증한다. 표 2는 FLO8의 파괴가 eGFP 형광의 증가로 이어져 각각 pG1 및 pG1-3의 경우 3.8(또는 3.9) 및 2.8(또는 2.9)-배임을 나타낸다.
표 12: 비-메탄올 탄소 조절된 프로모터의 제어 하에 eGFP의 발현에 대한 d FLO8 의 영향. 제한-글루코스(유도) 조건에서 48 시간 배양 후 모체 야생형 균주와 비교하여 각각의 dFLO8_pG#_eGFP 균주의 배수 변화 뿐만 아니라 pGAP 발현의 백분율로서 eGFP 발현 수준이 제시되어 있다.
참고문헌:
SEQUENCE LISTING
<110> Lonza Ltd
<120> CARBON-SOURCE REGULATED PROTEIN PRODUCTION IN A RECOMBINANT HOST
CELL
<130> IPA210802-AT
<160> 86
<170> PatentIn version 3.5
<210> 1
<211> 806
<212> PRT
<213> Komagataella phaffii
<400> 1
Met Asn Lys Pro Asn Gly Ser Glu Gln Gln Pro Pro Ser Arg Gly Met
1 5 10 15
Lys Gln Glu Ser Gly Gly Pro Val Thr Ser Ser Thr Thr Pro Gly Thr
20 25 30
Asn Thr Gly Leu Glu Asn Ser His Ser Met Gly Ala Asp Met Glu Pro
35 40 45
Asp Val Gly Ala Thr Ser Pro Arg His Leu Leu Asn Gly Tyr Ile Tyr
50 55 60
Asp Tyr Leu Val Lys Ser Asn Met Gln Asn Leu Ala Asp Gln Phe Ala
65 70 75 80
Gln Glu Thr Glu Leu Leu Glu Thr Asp Leu Thr Val Pro Met Asp Thr
85 90 95
Pro Ser Gly Tyr Leu Leu Glu Trp Trp Met Val Phe Trp Asp Leu Phe
100 105 110
Asn Ala Arg Leu Lys Gln Arg Gly Ser Gln Lys Ala His Gln Tyr Ile
115 120 125
Gln Leu Asn Met Leu Arg Gln Gln Gln Gln Arg Thr Met Arg Asn Thr
130 135 140
Ala Arg Val Gln Lys Val Pro Leu Arg Pro His Thr Gln Ser Ser Pro
145 150 155 160
Ser Met Ser Gln Thr Phe Ile Pro Gln Gln Pro Gln Gln Gln Ala Gln
165 170 175
Gly Gln Gln His Ala Gln Ala Gln Ala Gln Val Gln Ala His Gln Gln
180 185 190
Ala Gln His His Ala Gln Ala Gln Val Pro Val Gln Pro Gln Gln His
195 200 205
Gln Leu Gly Gly Gln Thr Gln Gln Gln Gln Ser Ile Asn Thr Gly Ser
210 215 220
Pro Ala Gly Pro Asn Ala Ile Asn Ser Arg Val Gln His Leu Ala Gln
225 230 235 240
Gln Gln Met Asn His Leu Arg Gln Gln Ala Thr Ala Thr Thr Gln Gln
245 250 255
Pro Ile Pro Gln Gln Asn Ile Pro Ser Asn Gln Gln Gly Pro Thr Gly
260 265 270
Pro Tyr Pro Thr Ser Pro Ser Arg Arg Pro Arg Leu Leu Ser Asn Glu
275 280 285
Ser Gly Ala Ser Ala Pro Ser Val Met Thr Lys Ser Gln Leu Gln Gly
290 295 300
Val Pro Pro Ser Gln Gln Pro His Gln Gln Gln Gly Gln Gln Val Gly
305 310 315 320
Pro Pro Asn Gln His Gln Gly Gln Ser Ser Ser Phe Tyr Ser Gly Met
325 330 335
Pro Pro Gln Gly Val Val Val Pro His Gln Phe Asn Pro Gln Gln Tyr
340 345 350
Ala Asn Met Leu Ala Arg Gln Gln His Val Gln Ala Gln Gln Gln Val
355 360 365
Gln Leu Gln Gln Val Gln His Val Gln Gln Arg Gln Gln Gln Asp Gln
370 375 380
Gln Gln His Arg Leu Ser Ala Gly Ser Pro Gly His Pro Ser Phe Gly
385 390 395 400
Val Phe Gln Gln Pro Pro Pro Met Ser Asn His Asn Gln Val Met Ile
405 410 415
Asn Gln Gln Gly Glu Thr Phe Phe Asp Pro His Ser Pro Tyr Ala Gln
420 425 430
Pro Asn Gly Tyr Pro Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Gln
435 440 445
Gln Gln Gln Gln Gln Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Gln
450 455 460
Gln Lys Gln Gln Pro Pro Pro Pro Pro Arg Gln Pro Gln Arg Gln Gln
465 470 475 480
Ala Met Ala Met Ala Pro Leu Pro His Ser Thr Ser Ala Ala Gly Thr
485 490 495
Pro His Ser Ser Thr Thr Pro Arg Phe Ser Gln Pro Gly Pro Val Tyr
500 505 510
Gln Gln Pro Leu Pro Ala Ser Gln Pro Gln His Ser Pro Pro Ser Ser
515 520 525
Ile Gln Gln Pro Glu Leu Val Pro Thr Pro Gly Ser Gln His Gln Gln
530 535 540
Ile Ala Gln Pro Gln Ser Gln Ser Gln His Gln Gln Ser Gln Gln Ser
545 550 555 560
Gln Ser Ser Ala Ser Lys Ile Val Gly Ile Gln Glu Tyr Gln Lys Glu
565 570 575
Leu Met Met Leu Glu Lys Gln Asn Lys Gln Arg His Asp Met Ala Cys
580 585 590
Lys Lys Gly Ser Gly His Phe Ser Asn Phe Asp Pro Ile Pro Glu His
595 600 605
Thr Pro Pro Glu Pro Lys Phe Asn Val Asn Val Met Leu Pro Pro Gln
610 615 620
Asn Ser Ala Val Val Thr Lys Asn Thr Pro Gly Thr Ser Pro Gly Thr
625 630 635 640
Gln Thr Gln Asn Thr Ala His Ser Thr Gly Asn Thr Ser Ala Gly Ser
645 650 655
Thr Pro Asn Asn Val Ala Pro Val Arg Lys Lys Lys Glu Pro Ala Lys
660 665 670
Lys Lys Ala Lys Lys Ala Thr Glu Pro Pro Thr Pro Thr Thr Pro Gln
675 680 685
Thr Pro Ile Ala Ala Arg Thr His Gln Asn Ser Thr Gly Gly Ile Pro
690 695 700
Gly Asn Asn Ala Ala Thr Lys Arg Arg Lys Arg Glu Pro Leu Val Asp
705 710 715 720
Gln Thr Val Ser Pro Asn Leu Asn Glu Ala Ser Lys Ser Thr Lys Thr
725 730 735
Gly Lys Ile Ser Ser Gln Thr Asp Phe Thr Gly Ser Asp Asn Gly Phe
740 745 750
Leu Gln Asp Phe Gly Asp Gly Thr Gly Pro Pro Thr Gly Thr Asp Asp
755 760 765
Met Glu Phe Asp Phe Asn Ser Phe Leu Asn Asn Glu Thr Gly Glu Pro
770 775 780
Asn Ser Ser Thr Ile His Phe Asp Asn Val Phe Asn Trp Gly Glu Gly
785 790 795 800
Thr Glu Ala Gly Asp Leu
805
<210> 2
<211> 2421
<212> DNA
<213> Komagataella phaffii
<400> 2
atgaacaagc caaacgggtc tgaacaacaa ccaccgtcac gcggaatgaa gcaagagtca 60
ggaggcccag ttacttcatc tacgacgccg ggtaccaata ctggcctaga aaactctcat 120
tccatggggg cggatatgga gcctgatgtt ggtgctacct ctcctcgcca tcttcttaat 180
gggtacattt acgattattt agtcaaatct aacatgcaaa atttggctga tcaatttgcc 240
caagagacgg agctcttaga aacagacttg acagtaccaa tggatacgcc ttcaggctat 300
cttctagaat ggtggatggt attctgggac cttttcaatg cccgcctaaa gcaacggggt 360
tcacagaagg cccaccagta tattcagttg aacatgctac gacaacagca acagaggacc 420
atgcgaaata cagcccgtgt tcaaaaagtc ccgttgaggc cacacaccca atcatctcct 480
tcaatgtcac agacttttat tccacagcag cctcaacagc aagcacaggg acaacagcac 540
gcccaggctc aagcccaagt gcaagcacat cagcaagccc aacaccacgc gcaggcacaa 600
gtgccagtgc aaccgcaaca gcaccagcta ggaggccaaa ctcaacagca gcaatccatt 660
aacactgggt ctcctgcggg tccaaatgct atcaactcgc gtgttcaaca cttagcacaa 720
caacagatga atcaccttcg ccagcaggcg actgccacta cgcaacaacc tatcccgcaa 780
cagaatatcc catcaaacca acagggtcct acaggccctt atcctacttc cccttcaaga 840
agaccgagat tactgtctaa cgaatcgggt gcaagtgcac cctctgtaat gacaaagtca 900
cagctccaag gagtccctcc ctcacaacaa ccacaccagc agcaaggtca gcaggtaggc 960
ccccctaatc aacatcaagg tcaatcttct tccttttatt cgggcatgcc tcctcaaggg 1020
gtcgtggttc ctcatcagtt caatcctcag cagtatgcca atatgctagc aagacaacag 1080
catgtacaag ctcaacaaca ggttcagtta caacaggtcc aacatgtaca acagagacaa 1140
cagcaagacc aacaacaaca ccgcctgtcc gccggttcac cggggcaccc ttcatttggc 1200
gtttttcaac aacctcctcc gatgtcaaac cataatcagg tcatgatcaa tcagcaggga 1260
gaaacttttt ttgatccaca ttctccatat gctcaaccta acgggtaccc ccagccacag 1320
caacaacaac aacaacagca acaacaacaa caacagcagc aaccgcaaca gcagcagcag 1380
cagcagcagc aacagaagca gcaaccacca ccaccaccac gacagcctca gcgccaacaa 1440
gcgatggcca tggctcctct gcctcactct acttctgccg ccggtactcc tcactcgtcc 1500
accacaccta gattctcgca acctggtcct gtttatcagc agcctttacc tgcatctcaa 1560
ccgcaacatt ctccgccttc ttctattcag cagccggagc tagttccaac tccagggtca 1620
caacatcagc aaatagcaca accacaatca cagagccaac accagcaatc gcaacagtct 1680
caatcaagtg cttctaaaat tgtaggtata caggagtatc agaaagagct aatgatgctt 1740
gagaaacaga acaaacagcg tcatgacatg gcatgtaaga agggaagcgg gcatttttct 1800
aactttgatc caattccaga gcacacaccg cccgaaccaa aatttaatgt gaatgtaatg 1860
ctccctcccc agaactctgc agtggtcacg aagaatactc ccggaacttc acctggtaca 1920
caaactcaaa acactgcaca tagtactggt aacacttctg cggggtctac accaaataat 1980
gtcgcacctg tacgaaagaa aaaggagcca gctaaaaaga aggcaaagaa agctactgag 2040
cccccgactc ccactactcc acagactcca attgcagcta ggacacatca aaactctaca 2100
ggcggcattc ctggtaataa tgctgctact aagcgacgaa aacgggagcc gctggttgat 2160
caaactgttt cacctaacct taacgaagct tccaagtcaa caaagaccgg aaaaatttca 2220
tctcaaactg actttacagg ttctgacaat ggattcttac aggattttgg cgatggaact 2280
ggtcctccca ctggaaccga tgatatggaa tttgatttta acagttttct taataacgaa 2340
actggcgaac ctaatagttc aaccattcat tttgacaatg tattcaattg gggagaaggt 2400
accgaagccg gagatttata g 2421
<210> 3
<211> 804
<212> PRT
<213> Komagataella pastoris
<400> 3
Met Asn Lys Pro Asn Gly Ser Gly Gln Gln Pro Pro Ser Arg Gly Met
1 5 10 15
Lys Gln Asp Pro Gly Gly Pro Val Thr Ser Ser Thr Thr Pro Gly Thr
20 25 30
Asn Thr Gly Phe Glu Asn Ser His Ser Met Gly Ala Asp Val Glu Pro
35 40 45
Asp Val Gly Ala Ala Ser Pro Arg His Ile Leu Asn Gly Tyr Ile His
50 55 60
Asp Tyr Leu Val Lys Ser Asn Met Gln Asn Leu Ala Asp Gln Phe Ala
65 70 75 80
Gln Glu Ser Asp Leu Leu Glu Thr Asp Leu Thr Val Pro Met Asp Thr
85 90 95
Pro Thr Gly Tyr Leu Leu Glu Trp Trp Met Val Phe Trp Asp Leu Phe
100 105 110
Asn Ala Arg Leu Lys Gln Arg Gly Ser Gln Lys Ala His Gln Tyr Ile
115 120 125
Gln Leu Asn Met Leu Arg Gln Gln Gln Gln Arg Thr Met Arg Asn Thr
130 135 140
Ala Arg Val Gln Lys Val Pro Leu Arg Pro His Thr Gln Ser Ser Pro
145 150 155 160
Ser Met Ser Gln Thr Phe Ile Pro Gln Gln Pro Gln Gln Gln Ala Gln
165 170 175
Ala Gln Ala Gln Gln His Ala Gln Ala Gln Ala Gln Val Gln Ala His
180 185 190
Gln Gln Ala Gln His His Ala Gln Ala Gln Val Pro Met Gln Ser Gln
195 200 205
Pro His Gln Gln Gly Gly Gln Thr Gln Gln Gln Gln Pro Ile Asn Thr
210 215 220
Gly Ser Pro Ala Gly Pro Asn Ala Ile Asn Ser Arg Val Gln His Leu
225 230 235 240
Ala Gln Gln Gln Met Asn His Leu Arg Gln Gln Ala Thr Ala Thr Thr
245 250 255
Gln Gln Pro Ile Pro Gln Gln Asn Ile Pro Ser Asn Gln Gln Gly Pro
260 265 270
Ala Gly Pro Tyr Pro Thr Ser Pro Ser Arg Arg Pro Arg Leu Leu Ser
275 280 285
Asn Glu Ser Gly Ala Ser Ala Pro Ser Val Met Thr Lys Ser Gln Leu
290 295 300
Gln Gly Gly Pro Pro Ser Gln Gln Pro His Gln Gln Gln Ala Gln Gln
305 310 315 320
Val Gly Pro Pro Asn Gln His Gln Gly Gln Ser Ser Ser Phe Tyr Ser
325 330 335
Gly Met Pro Pro Gln Gly Val Val Val Pro His Gln Phe Asn Pro Gln
340 345 350
Gln Tyr Ala Asn Met Leu Ala Arg Gln Gln His Val Gln Ala Gln Gln
355 360 365
Gln Val Gln Leu Gln Gln Val Pro His Val Gln Gln Arg Gln Gln Gln
370 375 380
Asp Gln Gln Gln His Arg Leu Ser Ala Gly Ser Pro Gly His Pro Ser
385 390 395 400
Phe Gly Val Phe Gln Gln Pro Pro Pro Met Ser Asn His Asn Gln Val
405 410 415
Met Ile Asn Gln Gln Gly Glu Thr Phe Phe Asp Pro His Ser Pro Tyr
420 425 430
Ala Gln Pro Asn Gly Tyr Pro Gln Pro Gln Gln Gln Gln Gln Gln Gln
435 440 445
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
450 455 460
Lys Gln Gln Gln Pro Pro Pro Arg Gln Pro Gln Arg Gln Gln Ala Met
465 470 475 480
Ala Thr Ala Pro Leu Pro His Ser Thr Ser Ala Ser Gly Thr Pro His
485 490 495
Thr Ala Thr Thr Pro Arg Phe Ser Gln Pro Gly Pro Val Tyr Gln Gln
500 505 510
Pro Leu Pro Ala Ser Gln Pro Gln His Ser Pro Pro Thr Ser Ile Gln
515 520 525
Gln Gln Glu Pro Ile Pro Thr Pro Gly Ser Gln His Gln Gln Ile Ala
530 535 540
Gln Pro Gln Ser Gln Asn Gln His Gln Gln Pro Gln Gln Pro Gln Ala
545 550 555 560
Ser Ala Ser Lys Met Val Gly Ile Gln Glu Tyr Gln Lys Glu Leu Met
565 570 575
Met Leu Glu Lys Gln Asn Lys Gln Arg His Asp Met Ala Ile Lys Lys
580 585 590
Gly Ser Gly His Phe Ser Asn Phe Asp Pro Ile Pro Glu His Thr Gln
595 600 605
Thr Glu Pro Lys Phe Asn Val Asn Val Met Leu Pro Pro Gln Asn Ser
610 615 620
Ala Val Ala Thr Lys Asn Thr Pro Gly Thr Ser Pro Gly Thr Gln Thr
625 630 635 640
Gln Asn Thr Ala His Ser Thr Gly Asn Thr Ser Ala Gly Ser Thr Pro
645 650 655
Asn Asn Val Val Pro Val Arg Lys Lys Lys Glu Pro Ser Lys Lys Lys
660 665 670
Ser Lys Lys Ala Thr Glu Pro Pro Thr Pro Thr Thr Pro Gln Thr Pro
675 680 685
Ile Ala Ala Arg Ala His Gln Asn Ser Thr Gly Gly Ile Ser Gly Asn
690 695 700
Asn Ala Ala Thr Lys Arg Arg Lys Arg Glu Pro Leu Val Asp Gln Thr
705 710 715 720
Val Ser Pro Asn Leu Asn Glu Ala Ser Lys Ser Thr Lys Pro Gly Lys
725 730 735
Ile Ser Ser Gln Asn Asp Phe Thr Gly Ser Asp Asn Gly Phe Leu Gln
740 745 750
Asp Phe Gly Asp Gly Thr Gly Pro Pro Thr Gly Thr Asp Asp Met Glu
755 760 765
Phe Asp Phe Asn Ser Phe Leu Asn Asn Glu Thr Gly Glu Pro Asn Ser
770 775 780
Ser Thr Ile His Phe Asp Asn Val Phe Asn Trp Gly Glu Gly Thr Glu
785 790 795 800
Ala Gly Asp Leu
<210> 4
<211> 2415
<212> DNA
<213> Komagataella pastoris
<400> 4
atgaacaagc caaacgggtc tggacaacaa ccaccgtcac gcggaatgaa gcaagaccca 60
ggaggcccag ttacctcatc tacgacaccc ggtaccaata ctggctttga aaactctcat 120
tccatgggag cggatgtgga gcctgatgtt ggtgccgcct ctcctcgcca tattcttaat 180
gggtacattc atgattactt agtcaaatct aatatgcaaa atttggccga tcaatttgct 240
caagagtcgg atctcttaga aacagaccta acggtaccaa tggatacacc tacaggctat 300
cttttagagt ggtggatggt attttgggac cttttcaatg cccgcctaaa gcaacgaggt 360
tcacagaagg ctcatcagta tattcagttg aacatgctac gacaacaaca gcagaggact 420
atgcgaaata cagcccgtgt tcagaaagtc ccgttgagac cacacaccca atcatctcct 480
tcaatgtcac agacctttat tccacagcag cctcaacagc aagcacaggc acaggcacag 540
cagcacgccc aagctcaagc gcaagtccag gctcatcagc aagcacagca tcatgcgcag 600
gctcaagtgc caatgcaatc gcaaccacat cagcaaggag gccaaactca acaacagcaa 660
cccattaaca ctgggtctcc tgcggggcca aatgctatca actctcgtgt gcaacactta 720
gcgcaacaac agatgaatca tcttcgccag caggcaactg ccactaccca gcaacctatc 780
ccgcaacaga atattccatc aaaccagcag ggccctgcgg gcccttatcc tacatcgcct 840
tcaagaagac cgagattact gtctaacgaa tcgggtgcaa gtgcaccctc tgtaatgacg 900
aagtcacagc tccaaggagg tcctccatca caacaaccac accaacagca agctcagcag 960
gtaggacccc ccaatcaaca tcaaggccag tcctcttcct tttattcggg catgcctcct 1020
caaggagttg tggttcctca tcagttcaat cctcagcagt atgccaatat gctagcaaga 1080
caacagcatg tgcaagctca acaacaggtt cagttacagc aggttccaca tgtgcaacaa 1140
agacaacagc aagaccaaca acaacaccgc ttgtcagccg gttcaccagg gcatccttca 1200
tttggcgttt ttcaacaacc tcctccgatg tcaaaccata atcaggtcat gatcaaccag 1260
cagggagaaa ccttttttga tcctcattca ccatatgctc aacctaatgg gtacccccag 1320
ccacagcaac aacaacaaca gcagcaacaa caacaacaac aacaacaaca gcagcagcag 1380
cagcaacaac agaagcagca acagccacca ccaagacagc ctcagcgcca acaagcgatg 1440
gctacggctc ctttgcctca ttctacttct gcctcgggta ctcctcacac ggccaccaca 1500
cctagattct cccagcctgg tcctgtttat cagcagcctt tacctgcatc tcaaccgcaa 1560
cattctccgc ctacttctat tcagcaacag gaaccaattc caactcctgg gtcacaacat 1620
cagcaaatag cacaaccgca atcacagaat caacaccagc aaccgcagca acctcaagca 1680
agtgcttcta aaatggtggg tatacaggag taccagaaag agttaatgat gcttgagaag 1740
cagaacaaac aacgtcatga catggcaatt aagaagggaa gcggacattt ctctaatttt 1800
gatccaattc cagagcacac acagactgaa ccaaaattca atgtgaacgt aatgctccct 1860
ccccagaact ctgcagtggc cacgaagaat actcctggaa cttctcctgg tacgcaaact 1920
caaaacactg cacacagtac tggcaacact tctgctgggt ctacaccgaa taatgttgta 1980
ccagttcgaa aaaagaagga gccatctaaa aagaaatcaa agaaggctac cgaacctcca 2040
actcctacta ctccacagac accaattgca gctagggcac atcaaaactc tacgggcggc 2100
atttcaggta ataatgctgc tactaagcga cgaaaaaggg agccgctggt cgaccaaaca 2160
gtttcaccta accttaacga agcttcgaaa tcaacaaagc ctgggaaaat ctcatctcaa 2220
aatgacttta caggttctga caatggattt ttacaggatt ttggcgatgg aacaggtccc 2280
cccactggaa ctgacgatat ggagtttgat tttaacagtt ttctcaacaa cgaaactggt 2340
gaacctaata gttcaaccat tcattttgac aatgtattta attgggggga gggtactgaa 2400
gccggggatc tatag 2415
<210> 5
<211> 799
<212> PRT
<213> Saccharomyces cerevisiae
<400> 5
Met Ser Tyr Lys Val Asn Ser Ser Tyr Pro Asp Ser Ile Pro Pro Thr
1 5 10 15
Glu Gln Pro Tyr Met Ala Ser Gln Tyr Lys Gln Asp Leu Gln Ser Asn
20 25 30
Ile Ala Met Ala Thr Asn Ser Glu Gln Gln Arg Gln Gln Gln Gln Gln
35 40 45
Gln Gln Gln Gln Gln Gln Gln Trp Ile Asn Gln Pro Thr Ala Glu Asn
50 55 60
Ser Asp Leu Lys Glu Lys Met Asn Cys Lys Asn Thr Leu Asn Glu Tyr
65 70 75 80
Ile Phe Asp Phe Leu Thr Lys Ser Ser Leu Lys Asn Thr Ala Ala Ala
85 90 95
Phe Ala Gln Asp Ala His Leu Asp Arg Asp Lys Gly Gln Asn Pro Val
100 105 110
Asp Gly Pro Lys Ser Lys Glu Asn Asn Gly Asn Gln Asn Thr Phe Ser
115 120 125
Lys Val Val Asp Thr Pro Gln Gly Phe Leu Tyr Glu Trp Trp Gln Ile
130 135 140
Phe Trp Asp Ile Phe Asn Thr Ser Ser Ser Arg Gly Gly Ser Glu Phe
145 150 155 160
Ala Gln Gln Tyr Tyr Gln Leu Val Leu Gln Glu Gln Arg Gln Glu Gln
165 170 175
Ile Tyr Arg Ser Leu Ala Val His Ala Ala Arg Leu Gln His Asp Ala
180 185 190
Glu Arg Arg Gly Glu Tyr Ser Asn Glu Asp Ile Asp Pro Met His Leu
195 200 205
Ala Ala Met Met Leu Gly Asn Pro Met Ala Pro Ala Val Gln Met Arg
210 215 220
Asn Val Asn Met Asn Pro Ile Pro Ile Pro Met Val Gly Asn Pro Ile
225 230 235 240
Val Asn Asn Phe Ser Ile Pro Pro Tyr Asn Asn Ala Asn Pro Thr Thr
245 250 255
Gly Ala Thr Ala Val Ala Pro Thr Ala Pro Pro Ser Gly Asp Phe Thr
260 265 270
Asn Val Gly Pro Thr Gln Asn Arg Ser Gln Asn Val Thr Gly Trp Pro
275 280 285
Val Tyr Asn Tyr Pro Met Gln Pro Thr Thr Glu Asn Pro Val Gly Asn
290 295 300
Pro Cys Asn Asn Asn Thr Thr Asn Asn Thr Thr Asn Asn Lys Ser Pro
305 310 315 320
Val Asn Gln Pro Lys Ser Leu Lys Thr Met His Ser Thr Asp Lys Pro
325 330 335
Asn Asn Val Pro Thr Ser Lys Ser Thr Arg Ser Arg Ser Ala Thr Ser
340 345 350
Lys Ala Lys Gly Lys Val Lys Ala Gly Leu Val Ala Lys Arg Arg Arg
355 360 365
Lys Asn Asn Thr Ala Thr Val Ser Ala Gly Ser Thr Asn Ala Cys Ser
370 375 380
Pro Asn Ile Thr Thr Pro Gly Ser Thr Thr Ser Glu Pro Ala Met Val
385 390 395 400
Gly Ser Arg Val Asn Lys Thr Pro Arg Ser Asp Ile Ala Thr Asn Phe
405 410 415
Arg Asn Gln Ala Ile Ile Phe Gly Glu Glu Asp Ile Tyr Ser Asn Ser
420 425 430
Lys Ser Ser Pro Ser Leu Asp Gly Ala Ser Pro Ser Ala Leu Ala Ser
435 440 445
Lys Gln Pro Thr Lys Val Arg Lys Asn Thr Lys Lys Ala Ser Thr Ser
450 455 460
Ala Phe Pro Val Glu Ser Thr Asn Lys Leu Gly Gly Asn Ser Val Val
465 470 475 480
Thr Gly Lys Lys Arg Ser Pro Pro Asn Thr Arg Val Ser Arg Arg Lys
485 490 495
Ser Thr Pro Ser Val Ile Leu Asn Ala Asp Ala Thr Lys Asp Glu Asn
500 505 510
Asn Met Leu Arg Thr Phe Ser Asn Thr Ile Ala Pro Asn Ile His Ser
515 520 525
Ala Pro Pro Thr Lys Thr Ala Asn Ser Leu Pro Phe Pro Gly Ile Asn
530 535 540
Leu Gly Ser Phe Asn Lys Pro Ala Val Ser Ser Pro Leu Ser Ser Val
545 550 555 560
Thr Glu Ser Cys Phe Asp Pro Glu Ser Gly Lys Ile Ala Gly Lys Asn
565 570 575
Gly Pro Lys Arg Ala Val Asn Ser Lys Val Ser Ala Ser Ser Pro Leu
580 585 590
Ser Ile Ala Thr Pro Arg Ser Gly Asp Ala Gln Lys Gln Arg Ser Ser
595 600 605
Lys Val Pro Gly Asn Val Val Ile Lys Pro Pro His Gly Phe Ser Thr
610 615 620
Thr Asn Leu Asn Ile Thr Leu Lys Asn Ser Lys Ile Ile Thr Ser Gln
625 630 635 640
Asn Asn Thr Val Ser Gln Glu Leu Pro Asn Gly Gly Asn Ile Leu Glu
645 650 655
Ala Gln Val Gly Asn Asp Ser Arg Ser Ser Lys Gly Asn Arg Asn Thr
660 665 670
Leu Ser Thr Pro Glu Glu Lys Lys Pro Ser Ser Asn Asn Gln Gly Tyr
675 680 685
Asp Phe Asp Ala Leu Lys Asn Ser Ser Ser Leu Leu Phe Pro Asn Gln
690 695 700
Ala Tyr Ala Ser Asn Asn Arg Thr Pro Asn Glu Asn Ser Asn Val Ala
705 710 715 720
Asp Glu Thr Ser Ala Ser Thr Asn Ser Gly Asp Asn Asp Asn Thr Leu
725 730 735
Ile Gln Pro Ser Ser Asn Val Gly Thr Thr Leu Gly Pro Gln Gln Thr
740 745 750
Ser Thr Asn Glu Asn Gln Asn Val His Ser Gln Asn Leu Lys Phe Gly
755 760 765
Asn Ile Gly Met Val Glu Asp Gln Gly Pro Asp Tyr Asp Leu Asn Leu
770 775 780
Leu Asp Thr Asn Glu Asn Asp Phe Asn Phe Ile Asn Trp Glu Gly
785 790 795
<210> 6
<211> 791
<212> PRT
<213> Saccharomyces cerevisiae
<400> 6
Met Ser Tyr Lys Val Asn Ser Ser Tyr Pro Asp Ser Ile Pro Pro Thr
1 5 10 15
Glu Gln Pro Tyr Met Ala Ser Gln Tyr Lys Gln Asp Leu Gln Ser Asn
20 25 30
Ile Ala Met Ala Thr Asn Ser Glu Gln Gln Arg Gln Gln Gln Gln Trp
35 40 45
Ile Asn Gln Pro Thr Ala Glu Asn Ser Asp Leu Lys Glu Lys Met Asn
50 55 60
Cys Lys Asn Thr Leu Asn Glu Tyr Ile Phe Asp Phe Leu Thr Lys Ser
65 70 75 80
Ser Leu Lys Asn Thr Ala Ala Ala Phe Ala Gln Asp Ala His Leu Asp
85 90 95
Arg Asp Lys Gly Gln Asn Pro Ile Asp Gly Pro Lys Ser Lys Glu Asn
100 105 110
Asn Gly Asn Gln Asn Thr Phe Ser Lys Val Val Asp Thr Pro Gln Gly
115 120 125
Phe Leu Tyr Glu Trp Trp Gln Ile Phe Trp Asp Ile Phe Asn Thr Ser
130 135 140
Ser Ser Arg Gly Gly Ser Glu Phe Ala Gln Gln Tyr Tyr Gln Leu Val
145 150 155 160
Leu Gln Glu Gln Arg Gln Glu Gln Ile Tyr Arg Ser Leu Ala Ala His
165 170 175
Ala Ala Arg Leu Gln His Asp Ala Glu Arg Arg Gly Glu Tyr Ser Asn
180 185 190
Glu Asp Ile Asp Pro Met His Leu Ala Ala Met Met Leu Gly Asn Pro
195 200 205
Met Ala Pro Ala Val Gln Met Arg Asn Val Asn Met Asn Pro Ile Pro
210 215 220
Ile Pro Met Val Gly Asn Pro Ile Val Asn Asn Phe Ser Ile Pro Pro
225 230 235 240
Tyr Asn Asn Ala Asn Pro Thr Thr Gly Ala Thr Ala Val Ala Pro Thr
245 250 255
Ala Pro Pro Ser Gly Asp Phe Ala Asn Val Gly Pro Thr Gln Asn Arg
260 265 270
Ser Gln Asn Val Thr Gly Trp Pro Val Tyr Asn Tyr Pro Met Gln Pro
275 280 285
Thr Thr Glu Asn Pro Val Gly Asn Pro Cys Asn Asn Asn Thr Thr Asn
290 295 300
Asn Thr Thr Asn Asn Lys Ser Pro Val Asn Gln Pro Lys Ser Leu Lys
305 310 315 320
Thr Met His Ser Thr Asp Lys Pro Asn Asn Val Pro Thr Ser Lys Ser
325 330 335
Thr Arg Ser Arg Ser Ala Thr Ser Lys Ala Lys Gly Lys Val Lys Ala
340 345 350
Gly Leu Val Ala Lys Arg Arg Arg Lys Asn Asn Thr Ala Thr Val Ser
355 360 365
Ala Gly Ser Thr Asn Ala Gly Ser Pro Asn Ile Thr Thr Pro Gly Ser
370 375 380
Thr Thr Ser Glu Pro Ala Met Val Gly Ser Arg Val Asn Lys Thr Pro
385 390 395 400
Arg Ser Asp Ile Ala Thr Asn Phe Arg Asn Gln Ala Ile Ile Phe Gly
405 410 415
Glu Glu Asp Ile Tyr Ser Asn Ser Lys Ser Ser Pro Ser Leu Asp Gly
420 425 430
Ala Ser Pro Ser Ala Leu Val Ser Lys Gln Pro Thr Lys Val Arg Lys
435 440 445
Asn Thr Lys Lys Ala Ser Thr Ser Ala Phe Pro Val Glu Ser Ala Asn
450 455 460
Lys Leu Gly Gly Asn Ser Val Val Thr Gly Lys Lys Arg Ser Pro Pro
465 470 475 480
Asn Thr Arg Val Leu Arg Arg Lys Ser Thr Pro Ser Val Ile Leu Asn
485 490 495
Ala Asp Ala Thr Lys Asp Glu Asn Asn Met Leu Arg Thr Phe Ser Asn
500 505 510
Thr Thr Ala Pro Asn Ile His Ser Ala Pro Pro Thr Lys Thr Ala Asn
515 520 525
Ser Leu Pro Phe Pro Gly Ile Asn Leu Gly Ser Phe Asn Lys Pro Ala
530 535 540
Val Ser Ser Pro Leu Ser Ser Val Thr Glu Ser Cys Phe Asp Pro Glu
545 550 555 560
Ser Gly Lys Ile Ala Gly Lys Asn Gly Pro Lys Arg Ala Val Asn Ser
565 570 575
Lys Val Ser Ala Ser Ser Pro Leu Ser Ile Ala Thr Pro Pro Ser Gly
580 585 590
Asp Ala Gln Glu Gln Arg Ser Ser Asn Val Pro Gly Asn Val Val Ile
595 600 605
Lys Pro Pro His Gly Phe Ser Thr Thr Asn Leu Asn Ile Thr Leu Lys
610 615 620
Ser Ser Lys Ile Ile Thr Ser Gln Asn Asn Thr Ala Phe Gln Glu Leu
625 630 635 640
Pro Asn Gly Gly Asn Ile Leu Glu Ala Gln Val Gly Asn Asp Ser Arg
645 650 655
Ser Ser Lys Gly Asn Arg Asp Thr Leu Ser Thr Pro Glu Glu Lys Lys
660 665 670
Pro Ser Ser Asn Asn Gln Gly Tyr Asp Phe Asp Ala Leu Lys Asn Ser
675 680 685
Ser Ser Leu Leu Phe Pro Asn Gln Ala Tyr Ala Ser Asn Asn Arg Thr
690 695 700
Pro Asn Glu Asn Ser Asn Val Ala Asp Glu Thr Ser Ala Ser Thr Asn
705 710 715 720
Asn Gly Asp Asn Asp Asn Thr Leu Ile Gln Pro Ser Ser Asn Val Gly
725 730 735
Thr Thr Leu Gly Pro Gln Gln Thr Ser Thr Asn Glu Asn Gln Asn Val
740 745 750
His Ser Gln Asn Leu Lys Phe Gly Asn Ile Gly Met Val Glu Asp Gln
755 760 765
Gly Pro Asp Tyr Asp Leu Asn Leu Leu Asp Thr Asn Glu Asn Asp Phe
770 775 780
Asn Phe Ile Asn Trp Glu Gly
785 790
<210> 7
<211> 768
<212> PRT
<213> Yarrowia lipolytica
<400> 7
Met Pro Ala Lys Ser Asp Lys Glu Leu Leu Asn Ala Tyr Ile Tyr Asp
1 5 10 15
Tyr Leu Leu Lys His Asn Met His Asp Ser Ala Arg Thr Phe Gly Ala
20 25 30
Glu Ala Lys Val Val Pro Asn Val Lys Lys Glu Asp Asp Lys Asp Leu
35 40 45
Pro Lys Pro Leu Ile Pro Ile Asp Ala Pro Gln Gly Phe Leu Tyr Glu
50 55 60
Trp Trp Ala Leu Phe Trp Asp Ile Tyr Ser Ala Arg Gly Ser Lys Gly
65 70 75 80
Gly Gly Ser Val Pro Ala Gln Gln Tyr Val Gln Gly Thr Met Arg Leu
85 90 95
Arg Gln Glu His Ala Ala Arg Ala Gln Leu Gln Gln Gln His Gln Ala
100 105 110
Gln Gln His Ala Gln Ala Gln Ala Ala Ala Gln Val Gln Gly Gln Ala
115 120 125
Gln Gly Gln Gly Gln Gly Gln Asn Pro Thr Gln Gly Pro Gln Pro Gln
130 135 140
Gly His Met Gly Met Pro Gly Gln Gly Pro His Gln Pro Gly Gly Pro
145 150 155 160
Phe Met Asn Gly Asn Met Met Phe Pro Pro Gly Gln Met Arg Met Gly
165 170 175
Gln Leu Pro Gln His Leu Gln Gln Gln Gly Thr Gly Val Ala Gly Ala
180 185 190
Asn Pro Ser Asp Asp Ser Ser Ser Pro Gly Gly Thr Ser Pro Ala Lys
195 200 205
Arg Gln Arg Leu Ser Pro Asp Met Gly Gly Gln Ser His Pro Glu Gln
210 215 220
Gln Gly Gln His Met Met Gly Thr Pro Asn Pro Asn Asn Pro Val Phe
225 230 235 240
Asn Ser Gln Val Met Gln Gln Leu Lys Ala Ser Gln Gly Gln Met Pro
245 250 255
Asn Leu Gln Gln Gln Gln Gln Ala Gln Leu Gln Gln Tyr Ser Asn Thr
260 265 270
Leu Ser Leu Ala Gln Gln Arg Ala Met Met Asn Ala Lys Gly Gly Pro
275 280 285
Asn Gly Gln Pro Gly Gln Pro Gly Gln Pro Gly Gln Pro Gly Gln Pro
290 295 300
Gly Gln Pro Gly Gln Pro Gly Gln Pro Gly Gln Pro Leu Pro Met Gly
305 310 315 320
Tyr Glu Gly Met Glu Pro Gly Phe Met Gly Gly Asn Gly Leu Ile Leu
325 330 335
Asn Ala Gln Gln Met Arg Gln Gln Gln Ala Gly Ser Gly Gly Ala Ala
340 345 350
Gly Ser Gly Gln Leu Asn Gly Asn Ser Asn Ala Leu His Asp Tyr Gln
355 360 365
Met Gln Leu Met Leu Leu Glu Gln Gln Asn Lys Lys Arg Leu Met Val
370 375 380
Ala Arg Gln Glu Gln Gln Glu Gly Gln Pro Arg Ala Glu Gly Gln Ala
385 390 395 400
Ala Ala Ala Gly Ala Asn Pro Gly Ala Arg Met Ser Gly Gln Phe Lys
405 410 415
Arg Pro Gly Ser Ser Pro Val Val Gly Asn Ile Gly Asp Gly Arg Arg
420 425 430
Val Thr Pro Lys Leu Pro Asn Gln Pro Ser Pro Leu Ile Asp Ala Asn
435 440 445
Arg Ala Ser Pro Leu Gln Ser Asn Phe Asn Gly Gln Gly Asp Phe Asn
450 455 460
Val Val Val Gly Pro Ser Gly Gln Met Met Arg Met Gln Gln Pro Gln
465 470 475 480
Gln Gln Gly Gly Pro Pro Gln Gln Gln Gly Gln Gln Gln Gly Gly Pro
485 490 495
Gly Gln Gln Gln Gly Gly Pro Gly Gln Gln Pro Gln Gln Gly Gln Gln
500 505 510
Gln Gly Gln Gln Gly Gly Pro Gln Gly Gly Gln His Arg Phe Asp Asp
515 520 525
Pro Gln Gln Leu Pro Gln Ser Gln Asn Gly Gly Pro Gln Pro Gly Ser
530 535 540
Ala Pro Gly Gln Leu Pro Gln Thr Gln Gly Gly Pro Gln Arg Pro Pro
545 550 555 560
Ser Arg Val Ser Gln Met Pro Pro Pro Gly Val Gln Gly Gly Gln Arg
565 570 575
Thr Gln Pro Ser Ser Pro Gly Gln Ala Ser Asn Pro Gly Ser Gly Gly
580 585 590
Ser Ser Gly Ser Ala Pro Gly Gly Thr Thr Pro Thr Gln Ala Asn Lys
595 600 605
Gln Leu Lys Gly Lys Lys Ala Glu Pro Lys Lys Arg Ala Lys Lys Gly
610 615 620
Asn Gln Pro Val Thr Pro Lys Ala Val Ser Glu Ser Pro Thr Pro Thr
625 630 635 640
Thr Pro Ala Thr Pro Ser Ala Ala Ser Asn Gln Ser Leu Leu Ser Lys
645 650 655
Ala Thr Asn Phe Ala Ala Asn Asn Lys Gln Ala Gln Ala Ala Ala His
660 665 670
Ala Gln Ala Gln Ala Gln Ala Ala Ala Gln Ala Gln Ser Gln Met His
675 680 685
Met Gly Gly Met Gly Gly Ser Ser Ser Gly Leu Glu Leu Asp Val Asn
690 695 700
Gly Gly Met Gly Leu Asp Asn Asp Ser Ser Ser Phe Leu Asn Asp Phe
705 710 715 720
Ser Thr Gly Asn Glu Gly Asp Val Gly Asp Met Asp Phe Asp Phe Asn
725 730 735
Ser Phe Leu Asn Thr Asp Asp Asn Ala Ala Gly Ala Leu Lys Phe Asp
740 745 750
Ser Gly Ser Ala Phe Gly Trp Gly Glu Gly Val Glu Ala Met Asn Glu
755 760 765
<210> 8
<211> 598
<212> PRT
<213> Ogataea polymorpha
<400> 8
Met Ser Gln Asn Ala Thr Pro Gln Thr Thr Glu Gly His Met Ser Met
1 5 10 15
Asn Asp Gln Gln Ser Asn Ser Ser Ser Gly Thr Asn Asn Thr Glu His
20 25 30
Pro Ser Ser Ser Ser Val Ser Ser Val Pro Thr Val Ser Asp Ser Thr
35 40 45
Ala Val Asn Ser Arg Glu Leu Leu Asn Ala Tyr Val Tyr Asp Phe Ile
50 55 60
Leu Lys Ser Gly Phe Thr Ala Thr Ala Ser Ala Phe Phe Lys Glu Ala
65 70 75 80
Asn Ile Pro Val Ile His Ser Glu Lys Arg Pro Thr Asn Ser Pro Ser
85 90 95
Ser Ser Ala Thr Gly Thr Ser Asp Leu Pro Ala Ser Phe Met Thr Met
100 105 110
Asp Ala Pro Gln Gly Phe Leu Tyr Glu Trp Trp Gln Ile Phe Trp Asp
115 120 125
Val Phe Asn Ala Arg Thr Gln Arg Gly Gly Thr Thr Asn Ala Thr Gln
130 135 140
Tyr Tyr His Tyr Val Asn Leu Lys Gln Lys Gln Asp His Leu Met Ser
145 150 155 160
Gln Gln Ala Ala Ala Val Ala Ala Ala Ser Thr Val Met Asn Gly Asn
165 170 175
Asn Thr Ser Met Ser Gly Ala Pro Val Thr Ser Ala Ala Gln Asp Ile
180 185 190
Gly Val Leu Met Pro Gln Gln Gln Gln Gln Gln Gln Gln Ala Gln Met
195 200 205
Ala His Pro Pro Gln Gln Val Pro Met Ala Gln Gln Gln Arg Val Asn
210 215 220
Ala Arg Met Gln Gln Pro Gln Gln Gln Gln Ser Gln Ser Met Pro Met
225 230 235 240
His Pro Gln Ala Ala Ala Gln Ala Gln Met Asn Thr Leu Arg Gln Gln
245 250 255
Gln Ile Ala Gln Gln Ala Gln Ala Ala Gln Val Ala Ala Gln Ala Val
260 265 270
Ser Gln Arg Gly Ser Pro Ser Lys Arg Gln Arg Met Asp Ala Ala Gly
275 280 285
Asn Gly Ser Ala Thr Glu Ile Asn Gln Thr Ser Ser Pro Asn Ile Ala
290 295 300
Met Asn Ser Gln Gln Gln Gln Gln Gln Gln Gln His Pro Pro Met Pro
305 310 315 320
Met Pro Gln Gly Met Met Ile Pro Asn Gln Phe Gly Val Pro Gln Gln
325 330 335
Tyr Ala Met Phe Ala Ala Ala Gln Ala Ala Gln Gln Gly Gln Ser Gln
340 345 350
Gln Lys Phe Asn Gln Tyr Met Ile Pro Asn Phe Gln Asn Gln Pro Gln
355 360 365
Gln Pro Gln Gln Gln Met Leu Met His Gln Gln Met His Gln Gln Ser
370 375 380
Val His Met Gln His Asp Gln Gln His Pro Pro Pro Pro Pro Pro Asn
385 390 395 400
Val Pro Gln His Ser Gln Thr Phe Ser Asn Pro Asn Asp Phe Phe His
405 410 415
Glu Met Pro Lys Gln Asn Asn Pro Gly Thr Ala Arg Val Asn Asp Thr
420 425 430
Ala Ile Lys Asp Tyr Glu Lys Gln Leu Arg Leu Met Glu Ser Gln Asn
435 440 445
Arg Arg Arg Leu Asp Val His Arg Asn Val Ser Asp Ser Lys Asp Pro
450 455 460
Asn Ser Pro Gly Ser Ala Gln Phe Thr Glu Tyr Ser Ala Met Leu Asn
465 470 475 480
Gln Met Pro Pro Gln His Ala Ala Ala Ser Ile Met Gln Gln Arg Ala
485 490 495
Ser Pro Ala Thr Lys Ala Ser Pro Thr Thr Lys Ser Pro Ala Asn Gly
500 505 510
Ala Pro Pro Ala Asn Gly Lys Gln Lys Lys Ala Pro Arg Lys Ala Arg
515 520 525
Lys Asn Ser Ser Ser Val Pro Ala Thr Pro Leu Thr Pro Ala Asn Asn
530 535 540
Gln Pro Thr Pro Gln Thr Asn Ile Pro Pro Thr Pro Gln Asn Thr Thr
545 550 555 560
Pro Gln Gln Thr Pro Gln Ser Ser Ala Ala Ala Ala Ser Gln Val Met
565 570 575
Ala Gly Lys Lys Gly Ile Lys Arg Lys Asn Arg Gly Arg Ala Ile Tyr
580 585 590
Pro Ile Glu Tyr Ser Arg
595
<210> 9
<211> 771
<212> PRT
<213> Aspergillus niger
<400> 9
Met Asn Gln Met Asn Gln Met Asn Met Ala Gly Met Asn Pro Gly Ala
1 5 10 15
Gly Gly Pro Val Gly Gly Val Pro Met Ile Asn Asn Gly Ser Ala Ala
20 25 30
Pro Arg Asn Glu Gln Asn Ile Asn Asn Ile Pro Glu Asn Met Ile Asn
35 40 45
Asn Leu Asn Thr Tyr Ile Tyr Asp Tyr Phe Leu Lys Arg Gly Tyr His
50 55 60
Asp Cys Ala Arg Ala Leu Val Lys Asp Glu Ser Ile Lys Leu Asn Thr
65 70 75 80
Glu Pro Pro Ile Lys Thr Ser Pro Gly His Arg Arg Asp Ala Asp Val
85 90 95
Asn Gly Val Asp Gly Asp Thr Met Met Thr Asp Gly Lys Asp Gly Asp
100 105 110
Lys Leu Lys Ile Pro Asp Asp Leu Pro Arg Pro Asn Leu Pro Ser Glu
115 120 125
Gly Gln Gln Ser Ser Phe Leu Leu Asp Trp Phe Ser Leu Phe Trp Asp
130 135 140
Phe Phe Trp Ala Gln Arg Lys Lys Gly Asn Ser Asn Asp Val Arg Ser
145 150 155 160
Tyr Leu Thr His Thr Gln Asn Met Met Arg Leu Arg Glu Gln His Gln
165 170 175
Asn Gln Leu Leu Arg Gln Gln Pro Leu Met Asn Gly Gln Met Gly Gln
180 185 190
Met Asn Ile Arg Arg Asn Gly Met Val Pro Pro Asn Leu Gln Lys Thr
195 200 205
Val Leu Gln Asn Asn Thr Thr Gly Leu Ser Gln Gln Gln Leu Ala Gln
210 215 220
Met His Lys Asn Gln Gln Val Gln Met Met Gln Gln Met Gln Arg Glu
225 230 235 240
His Ser Asp Met Asp Met Asn Gly His Arg Pro Gln Ser Pro Ala Ser
245 250 255
Ala Glu Asn Ala Pro Ser Pro Ser Lys Arg Pro Arg Leu Glu Gly Gly
260 265 270
Pro Met Asn Gly Gln Gln Leu Ala Pro Asn Gly Arg Gly Gln Ala Gln
275 280 285
Gly Ile Pro Gly Gln Pro Thr Pro Gln Ala Leu Leu Met Gln Asn Gly
290 295 300
Leu Asn Arg Ala Met Asn Pro Asn Gln Phe Gln Ala Phe Gln Gln Ser
305 310 315 320
Gly Pro Ala Ala Gln Gln Lys Gln Met Gln Gly Met Pro Asn Gly Met
325 330 335
Met Asn Pro Ala Asn Val Met Ala Asn Pro Gln Thr Glu Met Val Ser
340 345 350
Ile Pro Glu Gly Gln Val Tyr Pro Ile Asn Gly Asp Tyr Tyr Gly Ala
355 360 365
Asn Gly Gln Met Ala Gln Val Arg Thr Gly Met Gln Thr Pro Gly Gly
370 375 380
Gln His Gly Asn His Ala Leu Gln Asp Tyr Gln Met Gln Leu Met Leu
385 390 395 400
Leu Glu Gln Gln Asn Lys Arg Arg Leu Met Met Ala Arg Gln Glu Gln
405 410 415
Asp Ser Met Ala Arg Pro Asp Gly Gln Pro Gln Met Pro Gly Gln Gln
420 425 430
Leu Pro Pro Gly Thr Ser Pro Gln Gly Ser Arg Ala Gly Thr Ser Pro
435 440 445
Asn Pro Asn Asp Gln Met Lys Arg Gly Thr Pro Lys Met Pro Gln Thr
450 455 460
Gly Leu Pro Gly Ser Pro Ser Ala Ala Asp Ala Met Ala Gln Gly Arg
465 470 475 480
Gly Ser Pro Ala Ser Met Asn Phe Pro Gly Gly Gln Met Pro Pro Glu
485 490 495
Met Ala Gly Pro Gln Phe Phe Val Lys Asn Met Ala Asp Gly Met Ala
500 505 510
Ala Pro Asn Gly Met Arg Pro Pro Ser Ser Asn Pro Ala Phe Ser Thr
515 520 525
Pro Gln Met Gly Gln Pro Ile Gln Ala Gly Ala Asn Arg Met Pro Asn
530 535 540
Gly Gly Trp Gln Pro Gln Gln Gly Ala Gln Gly Gln Pro Met Ala Pro
545 550 555 560
Gln Gln Ser Pro Ala Thr Gln Pro Gln Ser Thr Gly Thr Pro Gln Glu
565 570 575
Arg Asn Ala Met Pro Pro Pro Gln Ala Pro Pro Ala Pro Gly Ala Asn
580 585 590
Val Gly Arg Thr Gln Pro Pro Ser Pro Gln Thr Ala Ala Pro Pro Thr
595 600 605
Pro Gln Gln Gly Asn Lys Pro Ala Pro Lys Lys Lys Glu Thr Lys Asp
610 615 620
Ser Arg Lys Arg Pro Lys Lys Gly Ala Ala Ala Ala Ala Ala Ala Ala
625 630 635 640
Gln Ala Asn Thr Ala Ala Thr Pro Ser Ser Glu Ala Glu His Pro Pro
645 650 655
Thr Pro Thr Pro Ser Thr Pro Ile Thr Pro Gln His Pro Asn Ser Phe
660 665 670
Asn Lys Thr Gly Ala Asn Ala Thr Thr Ser Ala Pro Gln Gln Pro Thr
675 680 685
Ser Ala Pro Ala Pro Pro Pro Leu Val Gln Gln Pro Pro Asp Gln Thr
690 695 700
Gln Gln Pro Phe Asn Glu Leu Ser Ile Pro Asp Ala Ser Ala Phe Asn
705 710 715 720
Leu Asp Phe Ser Ala Leu Glu Asn Pro Asp Ile Leu Glu Asn Phe Asp
725 730 735
Phe Asp Thr Phe Leu Asn Thr Asp Ala Asp Thr Ala Gly Phe Gly Phe
740 745 750
Asp Pro Asn Thr Ser Tyr Pro Thr Asp Gly Val Glu Thr Gly Ala Gly
755 760 765
Asp Gly Leu
770
<210> 10
<211> 1240
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 10
caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60
taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120
ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180
aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240
tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300
ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360
gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420
ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcagc 480
tcagggattc ccactatttg gtattctgat atgtttttcc tgatatgcat caaaactcta 540
atctaaaacc tgaatctccg ctattttttt ttttttttga tgaccccgtt ttcgtgacaa 600
attaatttcc aacggggtct tgtccggata agagaatttt gtttgattat ccgttcggat 660
aaatggacgc ctgctccata tttttccggt tattacccca cctggaagtg cccagaattt 720
tccggggatt acggataata cggtggtctg gattaattaa tacgagatct cagggattcc 780
cactatttgg tattctgata tgtttttcct gatatgcatc aaaactctaa tctaaaacct 840
gaatctccgc tatttttttt tttttttgat gaccccgttt tcgtgacaaa ttaatttcca 900
acggggtctt gtccggataa gagaattttg tttgattatc cgttcggata aatggacgcc 960
tgctccatat ttttccggtt attaccccac ctggaagtgc ccagaatttt ccggggatta 1020
cggataatac ggtggtctgg attaattaat acgccaagtc ttacattttg ttgcagtctc 1080
gtgcgagtat gtgcaataat aaacaagatg agccaattta ttggattagt tgcagcttga 1140
ccccgccata gctaggcata gccaagtgct atgggtgtta gatgatgcac ttggatgcag 1200
tgagttttgg agtataaaag atccttaaaa ttccaccctt 1240
<210> 11
<211> 1425
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 11
caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60
taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120
ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180
aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240
tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300
ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360
gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420
ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcagc 480
tcagggattc ccactatttg gtattctgat atgtttttcc tgatatgcat caaaactcta 540
atctaaaacc tgaatctccg ctattttttt tttttttgat gaccccgttt tcgtgacaaa 600
ttaatttcca acggggtctt gtccggataa gagaattttg tttgattatc cgttcggata 660
aatggacgcc tgctccatat ttttccggtt attaccccac ctggaagtgc ccagaatttt 720
ccggggatta cggataatac ggtggtctgg attaattaat acgccaagtc ttacattttg 780
ttgcagtctc gtgcgagtat gtgcaataat aaacaagatg agccaattta ttggattagt 840
tgcagcttga ccccgccata gctaggcata gccaagtgct atgggtgtta gatgatgcac 900
ttggatgcag tgagttttgg agtataaaag atccttaaaa ttccaccctt agatctcagg 960
gattcccact atttggtatt ctgatatgtt tttcctgata tgcatcaaaa ctctaatcta 1020
aaacctgaat ctccgctatt tttttttttt ttgatgaccc cgttttcgtg acaaattaat 1080
ttccaacggg gtcttgtccg gataagagaa ttttgtttga ttatccgttc ggataaatgg 1140
acgcctgctc catatttttc cggttattac cccacctgga agtgcccaga attttccggg 1200
gattacggat aatacggtgg tctggattaa ttaatacgcc aagtcttaca ttttgttgca 1260
gtctcgtgcg agtatgtgca ataataaaca agatgagcca atttattgga ttagttgcag 1320
cttgaccccg ccatagctag gcatagccaa gtgctatggg tgttagatga tgcacttgga 1380
tgcagtgagt tttggagtat aaaagatcct taaaattcca ccctt 1425
<210> 12
<211> 966
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<220>
<221> misc_feature
<222> (592)..(593)
<223> n is T or absent
<400> 12
caaacatttg ctccccctag tctccaggga aatgtaaaat atactgctaa tagaaaacag 60
taagacgctc agttgtcagg ataattacgt tcgactgtag taaaacagga atctgtattg 120
ttagaaagaa cgagagtttt ttacggcgcc gccatattgg gccgtgtgaa aacagcttga 180
aaccccacta ctttcaaagg ttctgttgct atacacgaac catgtttaac caacctcgct 240
tttgacttga ctgaagtcat cggttaacaa tcaagtaccc tagtctgtct gaatgctcct 300
ttccatattc agtaggtgtt tcttgcactt ttgcatgcac tgcggaagaa ttagccaata 360
gcgcgtttca tatgcgcttt taccccctct tttgtcaagc gcaaaatgcc tgtaagattt 420
ggtgggggtg tgagccgtta gctgaagtac aacaggctaa ttccctgaaa aaactgcaga 480
tagacttcaa gatctcaggg attcccacta tttggtattc tgatatgttt ttcctgatat 540
gcatcaaaac tctaatctaa aacctgaatc tccgctattt tttttttttt tnngatgacc 600
ccgttttcgt gacaaattaa tttccaacgg ggtcttgtcc ggataagaga attttgtttg 660
attatccgtt cggataaatg gacgcctgct ccatattttt ccggttatta ccccacctgg 720
aagtgcccag aattttccgg ggattacgga taatacggtg gtctggatta attaatacgc 780
caagtcttac attttgttgc agtctcgtgc gagtatgtgc aataataaac aagatgagcc 840
aatttattgg attagttgca gcttgacccc gccatagcta ggcatagcca agtgctatgg 900
gtgttagatg atgcacttgg atgcagtgag ttttggagta taaaagatcc ttaaaattcc 960
accctt 966
<210> 13
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 13
gtaaatagcg gcagcaatcc agtaaccttt tctgaatagc agagccttaa ctaaaataat 60
ggccagggta aaaaattcga aatttgacac caaaaataaa gacttgtcgt tataagtctt 120
aacaaagtcc gcaattttgg agctaacggt ggcggttgct gggatattca ataatggtag 180
aatgttgctg cgggtatatg acagagcgtg aaacacactg aacaaggtaa atggaacaac 240
agcaattgca atatggggga ggatagtcaa gaacaaagca gcaatggcaa agtactgaat 300
attctccaaa gccaaaaggt ccagtggttt caacgacaaa gtcttgttgg tatagctttg 360
gaacaaaagg acaccgaaag actcgacagc gcccacaaat acagcgttgt agaagaacga 420
attgattgct ccagagcttc taatagtcag aagatacccc aaacctccga gcaacgttag 480
cacatgacct aagaaccagg cgaagtgaag agtctggaat aacgacaccc agtcagtttt 540
tcctgagctc ctggtgggat tggtagaagc atttgatttg cttggagtgg ttttatttga 600
agatggtgtt gaagccattg ttgctaaaga gtcggagttt tgcttttagg gtttgttaag 660
caaaggagga aaaactgcgc cgtttgaagt cccaggtagt ttcgcgtgtg aggccagcca 720
gggaaagctt ccttcggtac ttttttttct tttgcaggtt ccggacggat taagcttcgg 780
gttatgaggg gggcggtagc caattccgga cacaatattg cgtcgcagct agtcaccccg 840
ccataaatat acgcaggatt gaggtaataa catcgatagt cttagtaatt aatacaattc 900
agtggcgaat ttggcaacat gacgtaaggc ccactgttgt ctataaaagg ggatgaattt 960
tcatgttttt gaggcctccc ggacaattta ttgaactcaa 1000
<210> 14
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 14
tggactgttc aatttgaagt cgatgctgac gatgtcaaga gagatgctca attatatttg 60
tcatttgctg gttacactgg aaacgctact tttgttggcg gaaactctac cagtttggcc 120
gtccatgtaa acgatgtcgt tctgggccgt gaccgtttca acacgaacat aaccaatgac 180
aaatccactt acaggtctag ttcatatgga ggcaattggt accttacttc tttggatgtc 240
ccaagtgggg ctttaacgtc tggtactaac aatgtctcgt ttgtcactac aaactccgag 300
gtaaataaag gattcttgtg ggattctctc aagtttgttt ggaagttgta acaggtttat 360
aagcatatcg tgcgcttgtc cacaattgaa tcatttattg ttgcgagata catgaacaaa 420
gtgtgaactg ggacccatta ctacaattcc cacgcaaccg ttgtttcaaa gcccatattt 480
tttgacaatt gtttcgttac acccccagtt tgatgtacat cgcttgcaat gatgtgtgtc 540
ccggagtatt ttccatattc agcttgaatt cgtatactca accaatatct gggggtatac 600
ttttatgtaa cctatacaaa tcaactatac tatttcacct ttcgaccaat catctcccat 660
cttgttaagt tttgcttcct atatccctga ccctgacatc acccatgatt ccgctcaacg 720
gttctcctct acatcgtccc tcttttggag agggtgttca gtttgacatt caaattaccc 780
cccgccatca cgcgcaaccg agaccgcacc cccgaatttt cacaaattac cccacaccct 840
atactccacc actatgaggg ttattagaac tgatcacgta taaataccac cgcaagttcc 900
caagggatcg tgttcttctt ctccaattgc aatcatattt ctgactcttt ctagttcaga 960
ttaattcctt tacacttgct tttttccctt acctttatcc 1000
<210> 15
<211> 1001
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 15
agaccagcag tttaactacg caaatccaca ggaatttcta catcacaata ccaatggtaa 60
taccacgacg tcaaggaatg gaaacgacga cttggaggaa gacttcgtca acctcttgcg 120
gagtacccga ggctaagaca ataagaagaa aaaaaaaaga aaagcggtgg gggagggatt 180
attaaataag gattatgtaa ccccagggta ccgttctata catatttaag gattatttag 240
gacaatcgat gaaatcggca tcaaactgga tgggagtata gtgtccggat aatcggataa 300
atcatcttgc gaggagccgc ttggttggtt ggtgagagga gtgaaatatg tgtctcctca 360
cccaagaatc gcgatatcag caccctgtgg gggacactat tggcctccct cccaaacctt 420
cgatgtggta gtgctttatt atattgatta cattgattac atagctaaac cctgcctggt 480
tgcaagttga gctccgaatt ccaatattag taaaatgcct gcaagataac ctcggtatgg 540
cgtccgaccc cgcttaatta ttttaactcc tttccaacga ggacttcgta atttttgatt 600
agggagttga gaaacggggg gtcttgatac ctcctcgatt tcagatccca ccccctctca 660
gtcccaagtg ggacccccct cggccgtgaa atgcgcgcac tttagttttt ttcgcatgta 720
aacgccggtg tccgtcaatt aaaagtcgca gactagggtg aactttacca tttttgtcgc 780
actccgtctc ctcggaatag gggtgtagta attctgcagt agtgcaattt ttaccccgcc 840
aagggggggc gaaaagagac gacctcatca cgcattctcc agtcgctctc tacgcctaca 900
gcaccgacgt agttaacttt ctcccatata taaagcaatt gccattcccc tgaaaacttt 960
aacctctgct ttttcttgat ttttccttgc ccaaagaaaa g 1001
<210> 16
<211> 1000
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 16
ctgcacaacc attgccagta aggacgaaga gaaggcccca ctacccaaaa ttcaggataa 60
cgtcttcata ccatgcagcg acgcctacaa gacgctgtca agacatgcca acttcaacga 120
agtgaacttt aacacattga tcgggaaatt gaccaccaag ggaatgctgg ttgaggctgg 180
aagcgttgcc agtgtcctga gggaactgga ccgaaagttt agtaatgcat aagaggatat 240
atataggaat gcagtaataa tattagtacc cattaagtgg gctaagccat tggaaggccg 300
tctgactgat ggtggtgttc ttctcattta gatagtgcat ttgcaactac cgtctgagat 360
tgagtttgat gtgaagctcc agcgccaaaa cagtataaga accttatctc cgcattattg 420
ttcttgcgta aaagtttgtg tgaagaaaca ggggtagttg cgcagattag ttgtaatatg 480
cgcataggat gggtcattga cttctttcct cgaaagagcc acaccgttag ctaaaaaagg 540
acgcgcatct accccaaaat agaatgtggg gaaataggac gcgcaacttc ctctcaatca 600
ctggacgtca gaaaaacaaa tgcgcaatcg agtcaccctc cgtgataccc tccgtgatac 660
cccctctccg tctattctga cagcgtctcc ccatgacgtt tcaatctact tagaaaagat 720
ttcgtttttt tttccttcaa ttacacgatc tcatcttctg caagggtctg gaggacatca 780
ccaatctgcg actccataac ttagtcctga gtttatattt acgcttcatc tgatgagtag 840
gaagaaaaag tttcacgaaa ttcccccgcc aacttgccct tcggaataag cagccactct 900
ccttctgccc atagtaagct tgcgcgaggc cccaacttgg ccagaaactt taaatatgcc 960
aaacaatctc ccccaatcta agttctccct cttctaaaaa 1000
<210> 17
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> regulatory region
<400> 17
ataaatgga 9
<210> 18
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> regulatory region
<400> 18
catatttttc cggtt 15
<210> 19
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 19
tatttttttt ttttt 15
<210> 20
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 20
tttttttttt ttttt 15
<210> 21
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 21
tatttttttt tttttt 16
<210> 22
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 22
tttttttttt tttttt 16
<210> 23
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 23
tatttttttt ttttttt 17
<210> 24
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 24
tttttttttt ttttttt 17
<210> 25
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 25
tatttttttt tttttttt 18
<210> 26
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 26
tttttttttt tttttttt 18
<210> 27
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 27
tatttttttt ttttttttt 19
<210> 28
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 28
tttttttttt ttttttttt 19
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 29
tatttttttt tttttttttt 20
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 30
tttttttttt tttttttttt 20
<210> 31
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 31
tatttttttt tttttttttt t 21
<210> 32
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 32
tttttttttt tttttttttt t 21
<210> 33
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 33
tatttttttt tttttttttt tt 22
<210> 34
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> motif
<400> 34
tttttttttt tttttttttt tt 22
<210> 35
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> main regulatory region
<400> 35
ataaatggac gcctgctcca tatttttccg gtt 33
<210> 36
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer core region
<400> 36
cgcctgctc 9
<210> 37
<211> 255
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer main region
<400> 37
attaccccac ctggaagtgc ccagaatttt ccggggatta cggataatac ggtggtctgg 60
attaattaat acgagatctc agggattccc actatttggt attctgatat gtttttcctg 120
atatgcatca aaactctaat ctaaaacctg aatctccgct tttttttttt tttttgatga 180
ccccgttttc gtgacaaatt aatttccaac ggggtcttgt ccggataaga gaattttgtt 240
tgattatccg ttcgg 255
<210> 38
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> translation initiation site
<400> 38
ttccaccctt 10
<210> 39
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> translation initiation site
<400> 39
ttcgaaacg 9
<210> 40
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> translation initiation site
<220>
<221> misc_feature
<222> (7)..(7)
<223> R at position 7 is A or G, preferably A
<400> 40
gccgccrcc 9
<210> 41
<211> 859
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 41
ggaatctgta ttgttagaaa gaacgagagt tttttacggc gccgccatat tgggccgtgt 60
gaaaacagct tgaaacccca ctactttcaa aggttctgtt gctatacacg aaccatgttt 120
aaccaacctc gcttttgact tgactgaagt catcggttaa caatcaagta ccctagtctg 180
tctgaatgct cctttccata ttcagtaggt gtttcttgca cttttgcatg cactgcggaa 240
gaattagcca atagcgcgtt tcatatgcgc ttttaccccc tcttttgtca agcgcaaaat 300
gcctgtaaga tttggtgggg gtgtgagccg ttagctgaag tacaacaggc taattccctg 360
aaaaaactgc agatagactt caagatctca gggattccca ctatttggta ttctgatatg 420
tttttcctga tatgcatcaa aactctaatc taaaacctga atctccgcta tttttttttt 480
ttttttgatg accccgtttt cgtgacaaat taatttccaa cggggtcttg tccggataag 540
agaattttgt ttgattatcc gttcggataa atggacgcct gctccatatt tttccggtta 600
ttaccccacc tggaagtgcc cagaattttc cggggattac ggataatacg gtggtctgga 660
ttaattaata cgccaagtct tacattttgt tgcagtctcg tgcgagtatg tgcaataata 720
aacaagatga gccaatttat tggattagtt gcagcttgac cccgccatag ctaggcatag 780
ccaagtgcta tgggtgttag atgatgcact tggatgcagt gagttttgga gtataaaaga 840
tccttaaaat tccaccctt 859
<210> 42
<211> 664
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 42
ccatattcag taggtgtttc ttgcactttt gcatgcactg cggaagaatt agccaatagc 60
gcgtttcata tgcgctttta ccccctcttt tgtcaagcgc aaaatgcctg taagatttgg 120
tgggggtgtg agccgttagc tgaagtacaa caggctaatt ccctgaaaaa actgcagata 180
gacttcaaga tctcagggat tcccactatt tggtattctg atatgttttt cctgatatgc 240
atcaaaactc taatctaaaa cctgaatctc cgctattttt tttttttttt tgatgacccc 300
gttttcgtga caaattaatt tccaacgggg tcttgtccgg ataagagaat tttgtttgat 360
tatccgttcg gataaatgga cgcctgctcc atatttttcc ggttattacc ccacctggaa 420
gtgcccagaa ttttccgggg attacggata atacggtggt ctggattaat taatacgcca 480
agtcttacat tttgttgcag tctcgtgcga gtatgtgcaa taataaacaa gatgagccaa 540
tttattggat tagttgcagc ttgaccccgc catagctagg catagccaag tgctatgggt 600
gttagatgat gcacttggat gcagtgagtt ttggagtata aaagatcctt aaaattccac 660
cctt 664
<210> 43
<211> 493
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 43
ctgcagatag acttcaagat ctcagggatt cccactattt ggtattctga tatgtttttc 60
ctgatatgca tcaaaactct aatctaaaac ctgaatctcc gctatttttt tttttttttt 120
gatgaccccg ttttcgtgac aaattaattt ccaacggggt cttgtccgga taagagaatt 180
ttgtttgatt atccgttcgg ataaatggac gcctgctcca tatttttccg gttattaccc 240
cacctggaag tgcccagaat tttccgggga ttacggataa tacggtggtc tggattaatt 300
aatacgccaa gtcttacatt ttgttgcagt ctcgtgcgag tatgtgcaat aataaacaag 360
atgagccaat ttattggatt agttgcagct tgaccccgcc atagctaggc atagccaagt 420
gctatgggtg ttagatgatg cacttggatg cagtgagttt tggagtataa aagatcctta 480
aaattccacc ctt 493
<210> 44
<211> 370
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 44
gaccccgttt tcgtgacaaa ttaatttcca acggggtctt gtccggataa gagaattttg 60
tttgattatc cgttcggata aatggacgcc tgctccatat ttttccggtt attaccccac 120
ctggaagtgc ccagaatttt ccggggatta cggataatac ggtggtctgg attaattaat 180
acgccaagtc ttacattttg ttgcagtctc gtgcgagtat gtgcaataat aaacaagatg 240
agccaattta ttggattagt tgcagcttga ccccgccata gctaggcata gccaagtgct 300
atgggtgtta gatgatgcac ttggatgcag tgagttttgg agtataaaag atccttaaaa 360
ttccaccctt 370
<210> 45
<211> 328
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 45
ccggataaga gaattttgtt tgattatccg ttcggataaa tggacgcctg ctccatattt 60
ttccggttat taccccacct ggaagtgccc agaattttcc ggggattacg gataatacgg 120
tggtctggat taattaatac gccaagtctt acattttgtt gcagtctcgt gcgagtatgt 180
gcaataataa acaagatgag ccaatttatt ggattagttg cagcttgacc ccgccatagc 240
taggcatagc caagtgctat gggtgttaga tgatgcactt ggatgcagtg agttttggag 300
tataaaagat ccttaaaatt ccaccctt 328
<210> 46
<211> 1000
<212> DNA
<213> Pichia pastoris
<400> 46
ctgctactct ggtcccaagt gaaccacctt ttggacccta ttgaccggac cttaacttgc 60
caaacctaaa cgcttaatgc ctcagacgtt ttaatgcctc tcaacacctc caaggttgct 120
ttcttgagca tgcctactag gaactttaac gaactgtggg gttgcagaca gtttcaggcg 180
tgtcccgacc aatatggcct actagactct ctgaaaaatc acagttttcc agtagttccg 240
atcaaattac catcgaaatg gtcccataaa cggacatttg acatccgttc ctgaattata 300
gtcttccacc gtggatcatg gtgttccttt ttttcccaaa gaatatcagc atcccttaac 360
tacgttaggt cagtgatgac aatggaccaa attgttgcaa ggtttttctt tttctttcat 420
cggcacattt cagcctcaca tgcgactatt atcgatcaat gaaatccatc aagattgaaa 480
tcttaaaatt gcccctttca cttgacagga tccttttttg tagaaatgtc ttggtgtcct 540
cgtccaatca ggtagccatc tctgaaatat ctggctccgt tgcaactccg aacgacctgc 600
tggcaacgta aaattctccg gggtaaaact taaatgtgga gtaatggaac cagaaacgtc 660
tcttcccttc tctctccttc caccgcccgt taccgtccct aggaaatttt actctgctgg 720
agagcttctt ctacggcccc cttgcagcaa tgctcttccc agcattacgt tgcgggtaaa 780
acggaggtcg tgtacccgac ctagcagccc agggatggaa aagtcccggc cgtcgctggc 840
aataatagcg ggcggacgca tgtcatgaga ttattggaaa ccaccagaat cgaatataaa 900
aggcgaacac ctttcccaat tttggtttct cctgacccaa agactttaaa tttaatttat 960
ttgtccctat ttcaatcaat tgaacaacta tcaaaacaca 1000
<210> 47
<211> 756
<212> PRT
<213> Pichia pastoris
<400> 47
Met Ile Pro Thr Ile Asp Pro Lys Asp Pro Glu Leu Val Ser Glu Asp
1 5 10 15
Thr Ala Gln Ser Ala Ser Ala Arg Lys Arg Ser Lys Val Ser Arg Ala
20 25 30
Cys Asp Glu Cys Arg Arg Lys Lys Ile Lys Cys Asp Ala Thr Phe Leu
35 40 45
Ala Asn Ser Asn Thr Leu Leu Lys Pro Cys Thr Asn Cys Tyr Lys Tyr
50 55 60
Asn Cys Ser Cys Ser Phe Thr Arg Val Pro Leu Lys Arg Gly Pro Ser
65 70 75 80
Lys Gly Phe Ala Arg Asp Gly Ser Gly Tyr Glu Arg Arg Arg Ser Ser
85 90 95
Ser Val His Ser Val Ser Ser Ser Gln Ser Val Thr Ser Pro Val Pro
100 105 110
Ser His Ala Ser Leu Pro Ile Pro Pro Ala Asn Pro Val Ser Leu Pro
115 120 125
Arg Leu Asn Val Pro Gly Asp Gly Leu Leu Ser Pro Lys Ala Val Pro
130 135 140
Pro Thr Asn Leu Phe Trp Lys Val Pro Tyr Glu Leu Pro Ser Phe Ser
145 150 155 160
Asp Arg Arg Ser Ser Val Ala Ser Ala Asp Ser Phe Arg Arg Pro Ser
165 170 175
Ile Tyr Gln Ser Asp Ser Glu Asp Asp Phe Tyr Ser Ala Thr Gly Ser
180 185 190
Gln Arg Asn Ser Ile Ser Gln Ala Pro Arg Gln Arg Asn Leu Ser Pro
195 200 205
Ala Leu Ser Val Ser Ser Thr Ser Ser Leu Asn Asn Arg Ile Lys Ser
210 215 220
Leu Asn Met Val Ala Ser Thr Leu Glu Ser Asn Ile His Asn Tyr Tyr
225 230 235 240
Ser Gln Gly Phe Asn Ser Ser Leu Pro Ile Leu Pro Leu Asp Glu Arg
245 250 255
Ile Leu Ser Thr Leu Leu Ser Asn Val Ser Asn Gly Ser Ser Ser Ala
260 265 270
Ser Trp Asp Ala Ile Arg Ser Pro Ile Leu Glu Leu Phe Asp Lys Ser
275 280 285
Ile Leu Met Leu Leu Arg Ser Tyr Glu Ser Gln Phe Asn Phe Asn Asp
290 295 300
Leu Leu Asp His Val Thr Glu Met Gln Ser Ile Tyr Pro Arg Ile Arg
305 310 315 320
Ser His Leu Leu Ser Asp Glu Leu Leu Lys Leu Ile Phe Leu Met Ser
325 330 335
Gly Val Leu Thr Asp Tyr Ala Leu Ile Leu Thr Gly Gln Pro Tyr Ser
340 345 350
Thr Gly Leu Ser Ile Thr Val Ser Val Phe Asn Asp Trp Lys Thr Tyr
355 360 365
Glu Asn Val Gln Arg Val Leu Val Ile Asn Arg Ala Gly Ser Leu Asp
370 375 380
Leu Asp Tyr Asp Ser Leu Pro Phe Leu Phe Ala Arg Cys Tyr Leu Ser
385 390 395 400
Leu Ala Thr Leu Asp Leu Ile Tyr Ser Leu Ser Phe Ser Ser Pro Arg
405 410 415
Leu Ile Ser Ser Phe Ala Asn Leu Pro Ile Leu Asp Ile Val Gln Lys
420 425 430
Cys Gly Ile Thr Lys Asp Ala Lys Leu Asp Glu Thr Pro Leu Pro Val
435 440 445
Leu Asp Gln Phe Leu Asn Cys Phe Leu Pro Gly Asp Thr Tyr Pro Thr
450 455 460
Ala Leu Asn Thr Leu Lys Thr Gly Leu Val Leu Leu Asp Phe Thr Asn
465 470 475 480
Asn Arg Ser Thr Thr Leu Arg Phe Pro Phe Ile Asn Ile His Asp Asp
485 490 495
Asn His Met Thr Gly Leu Ser His Leu Leu Ser Asn Val Ser Asp Phe
500 505 510
Met Ser Gln Phe Thr Glu Val His Ser Asp Ser Lys Asp Ser Gln Leu
515 520 525
Leu Phe Leu Arg Cys Ile Trp Ala Phe Trp Glu Ile Gly Ser Val Leu
530 535 540
Ser Glu Leu Ile Asp His Phe Ile Ser Ser Ser Ala Asn Ser Gln Val
545 550 555 560
Gly Asp Lys Asp Ala Ser Phe Phe Tyr Glu His Gln Leu Lys Val Thr
565 570 575
Thr Leu Leu Gly Thr Phe Ser Asn Ile Ala Ser Ala Phe Leu Thr Ser
580 585 590
Ser Thr Thr Ala Ala Ser His Pro Pro Pro Ser Ile Ser Pro Phe His
595 600 605
Ile Ile Ser Met Val Glu Ser Phe Lys Met Val Gln Phe Leu Asn Lys
610 615 620
Leu Ile Ala Ser Phe Ile Ser Leu Asn Glu Lys Leu Glu Lys Arg Glu
625 630 635 640
Leu Glu Asp Glu Leu Ser Lys Cys Lys Glu Glu Leu Asn Asn Leu Asn
645 650 655
Glu Arg Phe Gln Ala Val Ser Ser Val Gln Thr Leu Pro Val Val His
660 665 670
Val Leu Phe Arg Asp Leu Val Phe Ser Ser Asn Arg Leu Asp Thr Gln
675 680 685
Arg Asp Arg Ala Ser Ser Val Val Ser Ala Thr Thr Thr Thr Ser Thr
690 695 700
Ala Thr Thr Thr Ala Thr Thr Lys Lys Ser Ser Phe Gly Asn Leu Leu
705 710 715 720
His Ser Asp Glu Glu Asn Ile Leu Pro Thr Val Ile Asp Trp Cys Lys
725 730 735
Glu Gln Lys His Ser Ala Glu Met Phe Leu Asn Lys Asn Asp Leu Asn
740 745 750
Gly Trp Leu Tyr
755
<210> 48
<211> 1036
<212> PRT
<213> Pichia pastoris
<400> 48
Met Met Pro Glu Glu Gln Val Thr Ser Pro Gln Arg Lys His Gln Lys
1 5 10 15
Ser Lys Ala Lys Thr Ile Arg Ala Pro Gly Ser Ser Ile Glu Arg Val
20 25 30
Ala Gln Ala Cys Asp Arg Cys Arg Ser Lys Lys Thr Arg Cys Asp Gly
35 40 45
Lys Arg Pro Gln Cys Ser Gln Cys Ala Ala Val Gly Phe Glu Cys Lys
50 55 60
Ile Ser Asp Lys Leu Ser Arg Arg Ala Phe Pro Arg Gly Tyr Thr Glu
65 70 75 80
Thr Leu Glu Glu Arg Ile Arg Glu Leu Glu Phe Glu Asn Lys Lys Leu
85 90 95
His Lys Leu Ile Asp Leu Lys Asn Glu Gln Val Glu Ile Lys Asn Arg
100 105 110
Ile Asp Gln Glu Ser Thr Leu Thr Asn Glu Asn Leu Thr Leu Leu Asn
115 120 125
Lys Glu Gln Glu Val Ser His Ser Gly Asn Ile His His His Ala Asp
130 135 140
Gly Glu Pro Cys Asn Cys Ala Asn Ser Val Ser Ala Arg Pro Val Ser
145 150 155 160
Ile Ala Gly Ser Val Asp Ile Asp Thr Thr Asp Leu Ser Asp Glu Asp
165 170 175
Asp Ser Leu Tyr Ser Ala Ala Ser Tyr Asn Ala Lys Tyr His Gln Thr
180 185 190
Gly Thr Ser Gly Pro Glu Met Val Arg Leu Ser Gln Arg Tyr Ser Ser
195 200 205
Gly Asn Phe Asn Asp Pro Leu Ser Phe Glu Gln Ser Asn Ala Pro Gly
210 215 220
Ala Ala Ala Ala Ile Ser Ile Gln Asn Lys Met Arg Thr Gln Thr Phe
225 230 235 240
Val Asn Leu Ala Asn Leu Val Ala Met Ser Ile Pro Arg Thr Thr Glu
245 250 255
Glu Thr Leu Phe Ile Ala Ser Leu Leu Ala Lys Ile Cys Asn Val His
260 265 270
Gly Phe Gln Ser Lys Ala Pro Ile Leu Thr Ala Lys Ser Ile Ala Leu
275 280 285
Leu Lys Asp Lys Tyr Asn Tyr Gly Asn Asp Glu Val Phe Ala Asn Ile
290 295 300
Thr Leu Lys Asn Val Asn Phe Asn Lys Leu Thr Ser Gln Gln Ser Gln
305 310 315 320
Gln Phe Phe Gln Ser Leu Asn Leu Pro Asn Gln Val Asn Leu Asp Leu
325 330 335
Phe Ile Thr Thr Phe Phe Asn Thr Trp Asn Asn Phe Ile Pro Ile Ile
340 345 350
Asn Arg His Ile Phe Met Ser Ser Tyr Ile Lys Phe Asn Lys Ser Arg
355 360 365
Glu Thr Met Phe Thr Asp Asn Ser Met Phe Gly Asn Glu Lys Phe Gly
370 375 380
Glu Ile Leu Leu Leu Ile Thr Thr Met Val Met Leu Ser Gln Glu Arg
385 390 395 400
Asn Asn Asn Arg Glu Ala Val Pro Ser Ser Ser Tyr Lys Lys Asp Ser
405 410 415
Thr Pro His Pro His Arg Pro Asp Ala Ser Ser Gln Ser Asn Val Glu
420 425 430
Ile Leu Gln Tyr Tyr Asp His Leu Ile His Glu Phe Ile Lys Ser Asn
435 440 445
Ile Ser Asp Asp Cys Ser Leu Pro Thr Leu Glu Ser Leu Ser Leu Gln
450 455 460
Leu Leu Tyr Cys Leu Ala Ile Gly Asp Leu Thr Thr Ser Tyr Glu Leu
465 470 475 480
Arg Gly Lys Ile Ile Thr Met Gly Gln Gln Leu Arg Leu His Arg Cys
485 490 495
Pro Ser Ala Val Leu Gly Thr Asn Gly Ser Lys Val Ser Gln Met Gln
500 505 510
Gln Gly Glu Arg Arg Ile Leu Phe Trp Cys Ile Tyr Ile Leu Asp Thr
515 520 525
Phe Ser Ala Leu Ile Leu Gly Val Pro Arg Leu Leu Lys Asp Tyr Glu
530 535 540
Ile Glu Cys Ala Leu Pro Phe Ser Asn Glu Ser Asn Asn Ala Asn Val
545 550 555 560
Lys Gly Ser Ile Glu Asn Thr Thr Asn Thr Val Ile Ile Asn Asn Ile
565 570 575
Lys Leu Ser Leu Ala Gly Lys Val Ser Asp Cys Ala Leu Ala Val Met
580 585 590
Arg Tyr Ser Lys Val Leu Gly Asn Ile Leu Asp Ser Ile Phe Gln Arg
595 600 605
Ser Ser Ile Asn Asn Pro Ser Val Val Ser Lys Ser Thr Asn Ile Thr
610 615 620
Glu Glu Thr Cys Leu Leu His Glu His Ala Leu Asp Leu Trp Arg Arg
625 630 635 640
Glu Leu Ser Pro His Ile Asn Val Asp Leu Asp Lys Ser Pro Gly Gly
645 650 655
Val Glu Tyr Glu Arg Leu Ser Asp Asn Gln Leu Thr Ile Leu Phe Leu
660 665 670
Tyr Tyr His Ala Lys Ile Leu Ile Tyr Leu Pro Leu Met Ala Asn Glu
675 680 685
Ser Ser Gln Ser Arg Ser Ser Ala Ser Tyr Ile Asn Ile Gln Gln Ser
690 695 700
Thr Thr Ser Ile Leu Ala Ile Ala Asn Thr Leu Ala Thr Lys Glu Arg
705 710 715 720
Asn Phe Tyr Phe Leu Pro Leu Pro Val Asn Leu Ser Arg Glu Lys Val
725 730 735
Arg Leu Ala Phe Leu Ser Ala Lys Gly Ser Leu Glu Tyr Ala Arg Gly
740 745 750
Gly Ala Leu Phe Gln Glu Ser Lys Ile Leu Leu Ala Ser Val Ile Asn
755 760 765
Glu Leu Lys Ile Glu Thr Ser Ile Gly Met Leu Gly Cys Leu Ser Val
770 775 780
Pro Cys Met Glu Ala Val Asp Asn Ala Met Glu Gln Ile Met Ala Leu
785 790 795 800
Pro Gly Lys Val Ser Ser Val Asn Gly Ser Asn Ser Glu Met Lys Arg
805 810 815
Ser Ser Ser Lys Arg Lys Ser Ser Pro Leu Arg Gln Asp Ile Ser Gly
820 825 830
Asp Glu Arg Lys Ser His Asn Ile Glu Val Ser Asp Ser Arg Thr Pro
835 840 845
Ser Val Gln Ser Ser Leu Tyr Pro Gln Pro Asn Gln Met His His Pro
850 855 860
Asn Ile Ile Lys Ser Glu Asn Asn Glu Gln Met Ile Pro Glu Asn Asp
865 870 875 880
Thr Pro Gly Ala Ile Asn Asp Ile Phe Thr Ser His Ser Pro Pro Gly
885 890 895
Thr Val Thr Ser Met Lys Glu Glu Asp Leu Pro Ile Lys Val Pro Ile
900 905 910
Leu Leu Gln Thr Gln Gln Arg Gln Ile Tyr Asn Asn Asn Pro Asn His
915 920 925
Ser Leu Phe Ser Gln Gln Pro Gly Thr Gln Val Leu Ser Gly Gln Gln
930 935 940
Met Pro Gly Pro Ser Ser Thr Asp Gln Gln Phe Lys Arg Ile Thr Thr
945 950 955 960
Pro Asp Gly Leu Asp Ser Leu Met Met Gln Asp Phe Gly Val Asp Ala
965 970 975
Ser Leu Gly Leu Pro Met Leu Asp Phe Asp Phe Asn Phe Asp Phe Glu
980 985 990
Asn Val Gln Asn Asn Tyr Ser Gln Ser Asn Val Ser Pro Pro Asn Ser
995 1000 1005
Glu Ser Val Pro Ser Ser Ile Gln Gly Thr His Ser Asn Asp Pro
1010 1015 1020
Lys Asp Ser Gln Val Ser Ala Gly Ser Leu Phe Gly Leu
1025 1030 1035
<210> 49
<211> 887
<212> PRT
<213> Pichia pastoris
<400> 49
Met Lys Glu Asn Gln Ala Ser Asn Lys Phe Asn Leu Ile Lys Asn Pro
1 5 10 15
Ile Thr Gly Lys Pro Arg Ile Ser Gln Ala Cys Asp Arg Cys Arg Ile
20 25 30
Lys Lys Ile Lys Cys Asp Gly Thr Leu Pro Ser Cys Thr Asn Cys Ser
35 40 45
Lys Ile Gly Phe Val Cys Lys Ile Ser Asp Arg Leu Thr Arg Ser Ser
50 55 60
Phe Pro Lys Gly Tyr Thr Lys Asn Leu Glu Gln Lys Leu Ile Asp Met
65 70 75 80
Glu Leu Asp Arg Asn Arg Leu Met Leu Glu Leu Asn Arg Ile Lys Lys
85 90 95
Glu Gly Phe Asp Gly Thr Asn Asn Asn Ile Ala Met Ala Ser Ser Val
100 105 110
Ser Ser Ser Glu Asn Leu Lys Ser Asp Asp Ser Ser Glu Cys Gln Ser
115 120 125
Val Thr Val Ser Leu Ser Ser Thr Ser Gly Pro Ser Leu Ser Pro Glu
130 135 140
Pro Lys Gln Asp Asp Phe Arg Phe Arg Val Gly Met Asp Gly Ser Phe
145 150 155 160
Val Leu Asn Gln Phe Leu Gln Ser Pro Leu Met Asp Tyr Ile Lys Ser
165 170 175
Leu Asn Val Leu Gln Phe Asn Gly Cys Ala Asn Phe Asp Gln Ser Phe
180 185 190
Asn Asp Asp Pro Leu Val Leu Asn Lys Tyr His Met Asn Leu Asn Arg
195 200 205
Phe Leu Asn Leu Ile Phe Tyr Lys Leu Leu Leu Pro Leu Ile His Arg
210 215 220
Asn Ser Asn Thr Leu Asn Glu Lys Phe Ala Glu Asp Asn Asn Ser Leu
225 230 235 240
Asp Ser Leu Ile Trp Lys Phe Phe Thr Asn Tyr Asn Lys Leu Ile Pro
245 250 255
Ile Leu Glu Phe Asp Ser Phe Tyr Lys Asp Tyr Leu Gln Phe Ile His
260 265 270
Lys Tyr Tyr Ser Asn Asn Gln Val Phe Val Asp Gly Phe Arg Lys Tyr
275 280 285
Phe Glu Phe Ser Glu Phe Glu Gln Cys Phe Ile Val Lys Leu Ile Leu
290 295 300
Ile Leu Lys Phe Thr Leu Pro Val Ile His Asp Thr Ser Val Pro Ser
305 310 315 320
Glu Ile Tyr Arg Leu Ile Ser Met Asp Ser Leu Gln Arg Leu Phe Gly
325 330 335
Asn Ile Asp Phe Leu Lys Pro Ser Thr Asp Lys Val Ser Ile Leu Leu
340 345 350
Leu Val Leu His Tyr Met Val Leu Tyr Glu Ser Pro Lys Ser Leu Leu
355 360 365
Asp Thr Gln Asp Glu Ala Gln Lys Tyr Asp Glu Phe Ile Gly Asn Leu
370 375 380
Leu Ser Thr Ala Val His His Ile Thr Ser Leu Arg Leu His Ile Asp
385 390 395 400
Pro Arg Lys Leu Gln Phe Pro Arg Pro Leu Pro Ser Asn Gly Asn Arg
405 410 415
Leu Arg Ile Lys Leu Ser Trp Cys Tyr Lys Leu Ile Ser Lys Leu Phe
420 425 430
Arg Val Ile Tyr Asn Ile Asp Asn Asp Ser Leu Tyr Ser Leu Asp Asp
435 440 445
Ser His Leu Pro Glu Leu Gln Ser Ile Ser Ile Leu His Glu Glu Leu
450 455 460
Asp Val Thr Ile Gln Phe Asn Asn Leu Leu Asn Leu Ile Pro Asn Asn
465 470 475 480
Phe His Ser Leu Arg Asp Lys Gln Ser Leu Ser Lys Ile Lys Thr Gln
485 490 495
Leu Leu Glu Trp His Lys Asn Phe Asn Thr Glu Phe Val Glu His Phe
500 505 510
Asn Leu Asn Asp Thr Asp Ser Asp Glu Leu Ser Ala Glu Lys Ile Asn
515 520 525
Val Leu Arg Ser Lys Leu Ile Ser Leu Asn Arg Leu Asn Cys Tyr Asn
530 535 540
Ser Tyr Phe Gln Leu Val Ile Glu Leu Gln Leu Lys Glu Asn Leu Asp
545 550 555 560
Ser Val Val Ser Gly Ile Phe Gly Leu Ser Asn Glu Met Leu Ile Asp
565 570 575
Asn Lys Ser Ser Thr Glu Leu Leu Asn Thr Leu Gln Gln Thr Pro Ile
580 585 590
Ile His Gln Ser Ser Ile Leu Val Ser Leu Cys Tyr Arg Ile Gln Thr
595 600 605
Gly Asn Leu Gln Asp Glu Ile Cys Ser Ile Leu Val Asn Asn Tyr Glu
610 615 620
Lys Leu Leu Gln Cys Asn Asp Ala Gly Leu Pro Ile Lys Ile Leu Pro
625 630 635 640
Gln Leu Val His Tyr Phe Lys Gly Lys Ile Ser Thr Asn Leu Ser Asn
645 650 655
Ser Ala Ala His Glu Asp Leu Met Asn Met Phe Thr Leu Asn Asp Asn
660 665 670
Leu Ser Thr Thr Thr Thr Asp Leu Asp Ser Phe Ile Ile Pro Pro Lys
675 680 685
Arg Lys Gln Asp Gln Thr Leu Pro Ile Gly Thr Lys Arg Ser Lys Ser
690 695 700
Ala Ser Thr Ser Ser Val Ile Ser Ser Asp Asp Cys Ser Leu Phe Ser
705 710 715 720
Asn Ser Leu Ser Val Pro Thr Thr Phe Ser Gly Ser Ser Ile Ser Val
725 730 735
Gly Met Asp Asn Pro Pro Ser Ser Leu Phe Gly Ser Tyr Lys Arg Pro
740 745 750
Ser Ser Ile Val Lys Gln Glu Pro Thr Ile Asn Pro Arg Ser Asn Gly
755 760 765
Thr Asn Thr Asp Ser Asn Leu Phe Asp Thr Phe Asn Asp Ser Ile Lys
770 775 780
Gly Ser Leu Asn Asn Gly Leu Lys Lys Leu Lys Asp Ile Arg Cys Asn
785 790 795 800
Ser Val Val Glu Arg Ser His Ser Ser Gln Arg Asn Asp Phe Leu Met
805 810 815
Asp Gln Glu Asp Ser Ile Thr Lys Glu Thr Ile Asn Phe Ser Glu Leu
820 825 830
Phe Thr Cys Gly Thr Pro Thr Ala Ser Gln Ser Ile Asp Arg Ser Pro
835 840 845
Lys Ser Leu Leu Leu Asn Asp Leu Ala Ile Ala Pro Asp Thr Leu Val
850 855 860
Ile Lys Pro Asp Ala Glu Asp Leu Asp Arg Leu Lys Asn Lys Ile Arg
865 870 875 880
Ser Val Lys Ser Thr Val His
885
<210> 50
<211> 26
<212> PRT
<213> Komagataella phaffii
<400> 50
Leu Leu Asn Gly Tyr Ile Tyr Asp Tyr Leu Val Lys Ser Asn Met Gln
1 5 10 15
Asn Leu Ala Asp Gln Phe Ala Gln Glu Thr
20 25
<210> 51
<211> 25
<212> PRT
<213> Komagatella pastoris
<400> 51
Leu Asn Gly Tyr Ile His Asp Tyr Leu Val Lys Ser Asn Met Gln Asn
1 5 10 15
Leu Ala Asp Gln Phe Ala Gln Glu Ser
20 25
<210> 52
<211> 25
<212> PRT
<213> Saccharomyces cerevisiae
<400> 52
Leu Asn Glu Tyr Ile Phe Asp Phe Leu Thr Lys Ser Ser Leu Lys Asn
1 5 10 15
Thr Ala Ala Ala Phe Ala Gln Asp Ala
20 25
<210> 53
<211> 25
<212> PRT
<213> Saccharomyces cerevisiae
<400> 53
Leu Asn Glu Tyr Ile Phe Asp Phe Leu Thr Lys Ser Ser Leu Lys Asn
1 5 10 15
Thr Ala Ala Ala Phe Ala Gln Asp Ala
20 25
<210> 54
<211> 27
<212> PRT
<213> Yarrowia lipolytica
<400> 54
Glu Leu Leu Asn Ala Tyr Ile Tyr Asp Tyr Leu Leu Lys His Asn Met
1 5 10 15
His Asp Ser Ala Arg Thr Phe Gly Ala Glu Ala
20 25
<210> 55
<211> 27
<212> PRT
<213> Ogataea polymorpha
<400> 55
Glu Leu Leu Asn Ala Tyr Val Tyr Asp Phe Ile Leu Lys Ser Gly Phe
1 5 10 15
Thr Ala Thr Ala Ser Ala Phe Phe Lys Glu Ala
20 25
<210> 56
<211> 26
<212> PRT
<213> Aspergillus niger
<400> 56
Asn Asn Leu Asn Thr Tyr Ile Tyr Asp Tyr Phe Leu Lys Arg Gly Tyr
1 5 10 15
His Asp Cys Ala Arg Ala Leu Val Lys Asp
20 25
<210> 57
<211> 774
<212> DNA
<213> Artificial Sequence
<220>
<223> scR sequence
<400> 57
caggaacaac taatggagtc tgggggtggt ttggttaccc tgggtggttc tcttaagctt 60
tcatgtaagg cctctggtat tgatttttcg cactacggta tctcctgggt tagacaagct 120
cctggaaaag gtctggaatg gatcgcttac atttacccaa attacggttc tgttgactat 180
gcctcctggg tcaatggtag gttcactatt tcccttgaca acgctcagaa cacggtattc 240
ctacagatga tctccctaac cgctgctgat actgcaacct acttctgtgc tcgtgacaga 300
ggttactact ctggctctcg tggaactaga cttgacttat ggggacaagg tactctcgtt 360
accatctcta gtggtggagg tggttctgga ggaggaggtt ccggcggagg tggtagcgag 420
ctggtcatga ctcaaacccc tccatcccta tctgcatcag tcggtgaaac cgttagaatt 480
agatgccttg catctgagtt cttgttcaac ggtgtgtcct ggtatcaaca aaagcctggt 540
aagcctccaa agtttctcat ttctggtgcc tcaaacctcg aatctggagt gccaccaaga 600
ttttccggat ctggctctgg tactgactac actctgacaa ttggtggtgt tcaagctgag 660
gatgttgcta cctactattg tctcggtggt tactcaggat cttccggcct aactttcggt 720
gccggtacaa acgtcgagat caaaggtgga catcaccacc accatcacta atag 774
<210> 58
<211> 837
<212> DNA
<213> Artificial Sequence
<220>
<223> vHH sequence
<400> 58
caggttcagc tgcaggagtc cggtggtggt ctggttcaag ccggtggttc attaagattg 60
tcctgtgctg cctctggtag aactttcact tctttcgcaa tgggttggtt tagacaagca 120
cctggaaaag agagagagtt tgttgcttct atctccagat ccggtacttt aactagatac 180
gctgactctg ccaagggtag attcactatt tctgttgaca acgccaagaa cactgtttct 240
ttgcaaatgg acaaccttaa cccagatgac accgcagtct attactgtgc cgctgacttg 300
cacagaccat acggtccagg aacccaaaga tccgatgagt acgattcttg gggtcaggga 360
actcaagtca ctgtctcttc aggtggtgga tctggtggtg gaggttcagg tggtggagga 420
tccggtggtg gtggttctgg tggtggtgga tctggtggag gtgaagttca acttgtcgaa 480
tccggtggtg cacttgtcca acctggtgga tctcttagac tttcttgtgc cgcctccggt 540
tttcctgtta accgttactc tatgcgttgg tacagacaag cccctggaaa agaacgtgaa 600
tgggttgccg gaatgtcctc agctggtgac agatcctcct acgaagattc tgtgaaggga 660
cgtttcacca tctccagaga tgacgcccgt aacaccgttt accttcaaat gaactccctt 720
aagcctgagg atactgccgt ctactattgt aacgtgaatg tcggatttga atactgggga 780
cagggaaccc aagttactgt ctcttccggt ggacatcacc accaccatca ctaatag 837
<210> 59
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> signal sequence
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> X at position 3 is either F or L
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> X at position 16 is either A or T
<400> 59
Met Lys Xaa Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Xaa
1 5 10 15
Val Val Ser Ala
20
<210> 60
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> leader sequence
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> X at position 3 is either F or L
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> X at position 16 is either A or T
<400> 60
Met Lys Xaa Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Xaa
1 5 10 15
Val Val Ser Ala Ala Pro Val Ala Pro Ala Glu Glu Ala Ala Asn His
20 25 30
Leu His Lys Arg
35
<210> 61
<211> 85
<212> PRT
<213> Saccharomyces cerevisiae
<400> 61
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg
85
<210> 62
<211> 274
<212> PRT
<213> Komagataella pastoris
<400> 62
Met Ser Ser Asp Ala Val Glu Gln Leu Glu Asn Phe Gln Leu Ile Lys
1 5 10 15
Phe Asp Arg Phe Asp Pro Ser Thr Gln Ser Thr Ile Arg Ile Ala Arg
20 25 30
Ser Pro Lys Pro Ile Pro Val Lys Val Val Ile Val Gly Asp Gly Gly
35 40 45
Cys Gly Lys Thr Cys Leu Leu Asn Val Phe Ala Thr Gly Thr Phe Pro
50 55 60
Glu Ala Tyr Val Pro Thr Ile Ile Glu Asn Val Val Ile Thr Leu Val
65 70 75 80
Thr Pro Thr Gly Gln Ile Ala Ala Val Thr Leu Trp Asp Thr Ala Gly
85 90 95
Gln Glu Glu Tyr Asp Arg Leu Arg Pro Leu Ser Tyr Ser Asp Val Asp
100 105 110
Val Val Leu Leu Cys Tyr Ser Ile Asp Asn Leu Ser Thr Phe His Asn
115 120 125
Val Ala Asp Lys Trp Tyr Pro Glu Val Ala His Phe Cys Pro Asn Thr
130 135 140
Pro Ile Ile Leu Val Gly Thr Lys Ser Asp Met Arg Arg His Gln Lys
145 150 155 160
Ser Gln Pro His Phe Val Ser Pro Gln Asp Ser Ser Gln Leu Ala Arg
165 170 175
Gln Met Gly Ala Val Met Asn Ile Glu Cys Ser Ala Lys Glu Val Ser
180 185 190
Asn Val Asn Ile Val Phe Asp Ala Ala Val Ser Tyr Cys Leu Ser Asn
195 200 205
Ser Arg Pro Lys Thr Arg Gly Asp Asn Asp Asn Asn Arg Ser Asn Arg
210 215 220
Arg Leu Ser Arg Ala Lys Arg Ala Ser Met Phe Ile Arg Gly Lys Asp
225 230 235 240
Val Ser Ser Thr Ser Gly Asn Ser Arg Glu Glu Leu Val Glu Tyr Asp
245 250 255
Gln Asp Gly Leu Ala Ile Ile Pro Asp Arg Lys Lys Arg Lys Cys Ser
260 265 270
Ile Ile
<210> 63
<211> 95
<212> PRT
<213> Komagataella pastoris
<400> 63
Met Leu Asn Lys Leu Phe Ile Ala Ile Leu Ile Val Ile Thr Ala Val
1 5 10 15
Ile Gly Glu Thr Thr Thr Ser Ser Thr Thr Ala Ser Leu Ser Glu Ser
20 25 30
Pro Thr Leu Val Trp Val Thr Gly Thr Asp Ala Ser Gly Arg Leu Ala
35 40 45
Thr Thr Gln Ser Ala Tyr Thr Gln Gln Phe Ser Gln Leu Tyr Ser Ser
50 55 60
Ile Ala Ser Pro Ser Ser Gly Ser Ile Gly Leu Gly Thr Ile Gln Gly
65 70 75 80
Thr Val Gly Ile Val Arg Thr Tyr Glu Thr Ile Thr Leu Ala Ser
85 90 95
<210> 64
<211> 86
<212> PRT
<213> Komagataella pastoris
<400> 64
Met Ser Thr Ala Ile Pro Gly Gly Gln Arg Thr Leu Ala Lys Arg Arg
1 5 10 15
Ala Ala Asn Leu Asp Lys Lys Gln Asp Glu Pro Thr Ser Ala Arg Ser
20 25 30
Ala Gly Ala Gly Gly Ser Ser Ser Thr Met Leu Lys Leu Tyr Thr Asp
35 40 45
Glu Ala Gln Gly Leu Lys Val Asp Pro Leu Ile Val Leu Val Leu Ala
50 55 60
Val Gly Phe Ile Phe Ser Val Ile Gly Leu His Val Val Ala Lys Leu
65 70 75 80
Thr Gly Lys Leu Ile Asn
85
<210> 65
<211> 361
<212> PRT
<213> Komagataella pastoris
<400> 65
Met Thr Pro Arg Ser His Ile Phe Phe Asp Ile Ser Ile Asn Asn Gln
1 5 10 15
Pro Ala Gly Arg Ile Ile Phe Glu Leu Phe Asn Asp Ile Val Pro Lys
20 25 30
Thr Ala Glu Asn Phe Arg Ala Leu Ser Thr Gly Glu Lys Gly Ile Gly
35 40 45
Lys Ser Gly Lys Pro Leu His Tyr Lys Gly Ser Thr Phe His Arg Ile
50 55 60
Ile Lys Asp Phe Met Val Gln Gly Gly Asp Phe Thr Asn Gly Asn Gly
65 70 75 80
Thr Gly Gly Glu Ser Ile Tyr Gly Glu Lys Phe Glu Asp Glu Asn Phe
85 90 95
Gln Leu Thr His Asp Lys Pro Phe Leu Leu Ser Met Ala Asn Ala Gly
100 105 110
Pro Gly Thr Asn Gly Ser Gln Phe Phe Ile Thr Thr Val Pro Thr Pro
115 120 125
His Leu Asp Asn Lys His Val Val Phe Gly Lys Val Ile Ala Gly Lys
130 135 140
Ala Thr Val Arg Lys Ile Glu Arg Asn Ser Glu Gly Glu Ala Pro Ile
145 150 155 160
Glu Pro Val Val Ile Glu Asp Cys Gly Glu Leu Pro Glu Asp Ala Asp
165 170 175
Leu Thr Ile Ser Asp Glu Thr Gly Asp Lys Tyr Glu Glu Val Leu Lys
180 185 190
Asp Asn Glu Asn Ile Asp Ile Asp Asp Phe Glu Gln Val Tyr Gln Ala
195 200 205
Ile Thr Glu Ile Lys Glu Leu Gly Thr Lys Tyr Phe Lys Asn Gly Asp
210 215 220
Thr Lys Ile Ala Phe Glu Lys Tyr Gln Lys Ala Ala Asn Tyr Leu Leu
225 230 235 240
Glu Tyr Ile Pro Ser Asp Leu Ser Glu Glu Gln Ser Ser Lys Leu Glu
245 250 255
Leu Leu Lys Thr Ser Val Phe Ser Asn Val Ala Leu Ala Gly Leu Lys
260 265 270
Val Ser Lys Phe Lys Asp Thr Ile Lys Tyr Ala Thr Leu Val Ile Glu
275 280 285
Asp Glu Ser Ala Asp Ala Lys Ala Lys Ser Lys Gly Tyr Tyr Arg Arg
290 295 300
Gly Ser Ala Tyr Ser Ser Leu Lys Asp Glu Asp Ser Ala Ile Ser Asp
305 310 315 320
Phe Gln Lys Ala Leu Glu Leu Ser Pro Gly Asp Pro Ala Ile Ser Gln
325 330 335
Ser Leu Gln Arg Thr Thr Lys Ala Arg Lys Asp Arg Leu Ala Lys Glu
340 345 350
Lys Ala Ala Leu Ser Lys Phe Phe Glu
355 360
<210> 66
<211> 127
<212> PRT
<213> Komagataella pastoris
<400> 66
Met Thr Asn Trp Lys Ala Ile Leu Thr Pro Ala Gln Tyr Gln Val Leu
1 5 10 15
Arg Leu Gly Gly Thr Glu Arg Pro Tyr Thr Gly Gln Tyr Val Asn Phe
20 25 30
Lys Lys Asn Gly Thr Tyr Leu Cys Ser Gly Cys Gln Thr Pro Leu Tyr
35 40 45
Lys Ser Gly Thr Lys Phe Asp Ser Ser Cys Gly Trp Pro Ala Phe Tyr
50 55 60
Glu Ala Leu Pro Gly Ala Val Lys Arg Ile Glu Asp Asn Ser Leu Gly
65 70 75 80
Met Arg Arg Ile Glu Ile Arg Cys Ser Lys Cys Asp Gly His Leu Gly
85 90 95
His Val Phe Glu Gly Glu Gly Phe Asp Thr Pro Thr Asp Ser Arg His
100 105 110
Cys Val Asn Ser Ile Ser Leu Lys Phe Gln Gly Glu Glu Glu Asn
115 120 125
<210> 67
<211> 546
<212> PRT
<213> Komagataella pastoris
<400> 67
Met Ser His Leu Leu Leu Arg Asp Ser Phe Trp Gly Arg Thr Ile Tyr
1 5 10 15
His Leu Ser Lys His Arg Tyr Phe Ser Phe Pro Glu Glu Lys Asp Gly
20 25 30
Phe Ile Ala Pro Glu Lys Tyr Tyr Leu Asn Met Asp Gln Val Ser Ile
35 40 45
His Ala Glu Ser Glu Lys Asn Ile Val Glu Gly Leu Val Asp Thr Ser
50 55 60
Asn Ser Ser Leu Glu Glu Val Lys Thr Thr Arg Val Ile Val Asp Trp
65 70 75 80
Asp Glu Tyr Asp Gln Lys Glu Asn Pro Gln Asn Trp Ser Ser Leu Leu
85 90 95
Lys Cys Phe Val Val Phe Glu Val Gly Ile Leu Thr Val Ala Val Tyr
100 105 110
Met Gly Ser Ala Ile Tyr Thr Pro Gly Ile Glu Asp Ile Met Arg Asp
115 120 125
Leu Asn Val Ser Arg Thr Val Ala Thr Leu Pro Leu Thr Leu Phe Val
130 135 140
Ile Gly Tyr Ala Val Gly Pro Met Ile Phe Ser Pro Met Ser Glu His
145 150 155 160
Pro Ala Ile Gly Arg Thr Thr Ile Tyr Val Trp Thr Leu Phe Ile Phe
165 170 175
Ala Ile Leu Gln Ile Pro Thr Ala Leu Thr Thr Asn Ile Ala Gly Phe
180 185 190
Cys Ile Leu Arg Phe Ile Gly Gly Phe Phe Ala Ser Pro Ala Leu Ala
195 200 205
Thr Gly Pro Ala Ser Val Gly Asp Val Ile Ala Ile Pro His Leu Pro
210 215 220
Val Gly Leu Gly Leu Trp Ser Ile Cys Ala Val Cys Gly Pro Ser Leu
225 230 235 240
Gly Pro Leu Phe Gly Ala Ile Phe Ser Gln Leu Val Ser Trp Arg Trp
245 250 255
Cys Phe Trp Phe Leu Leu Ile Thr Ser Gly Thr Leu Phe Ile Val Leu
260 265 270
Gly Phe Thr Leu Pro Glu Thr Tyr Val Pro Thr Leu Leu Tyr Arg Lys
275 280 285
Ala Arg Arg Leu Arg Ala Leu Thr Lys Asn Glu Leu Ile Ile Ser Lys
290 295 300
Gly Glu Leu Asp Ile Gln Asp Arg Thr Ala Lys Glu Val Leu Ile Glu
305 310 315 320
Cys Leu Trp Arg Pro Val Asp Ile Ser Phe Arg Asp Pro Val Val Leu
325 330 335
Met Ile Asn Leu Tyr Ile Ser Met Val Tyr Ser Ile Trp Tyr Ile Trp
340 345 350
Phe Glu Ala Phe Pro Ile Val Phe Leu Glu Ile Tyr Gly Phe Ser Leu
355 360 365
Ile Gly Met Gly Ala Ser Phe Ala Gly Ile Leu Ile Gly Val Leu Ile
370 375 380
Cys Ser Ala Cys Tyr Cys Tyr Ala Cys His Val Thr Phe Ala Arg Arg
385 390 395 400
Ile Ile Ala Asn Glu Thr Ile His Pro Glu Phe Phe Val Pro Gly Ala
405 410 415
Ile Ile Gly Gly Cys Ile Met Pro Thr Gly Ile Phe Ile Leu Gly Trp
420 425 430
Thr Ala Thr Lys Ser Val His Trp Ile Val Pro Ile Ile Gly Ser Gly
435 440 445
Leu Phe Ala Ala Gly Gly Tyr Leu Ile Phe Gln Thr Leu Phe Asn Tyr
450 455 460
Leu Ala Met Ser Phe Pro Arg Tyr Met Ala Ser Ala Phe Ala Gly Asn
465 470 475 480
Asp Leu Phe Arg Ser Phe Ser Ala Ser Val Phe Pro Leu Phe Gly His
485 490 495
Ala Leu Tyr Ala Asn Leu Gly Ser Glu Lys Phe Pro Val Gly Trp Gly
500 505 510
Ser Ser Val Leu Gly Phe Ile Thr Val Ala Met Ile Ala Ile Pro Val
515 520 525
Thr Phe Met Arg Tyr Gly Pro Arg Leu Arg Ala Asn Ser Arg Tyr Ala
530 535 540
Gly Pro
545
<210> 68
<211> 355
<212> PRT
<213> Komagataella pastoris
<400> 68
Met Thr Asp Tyr Val Thr Ser Lys Arg Pro Asp Asn Val Leu Asn Trp
1 5 10 15
Thr Ser Ile His Val Ser Ser Trp Ile Gly Glu Thr Ile Pro Glu Ile
20 25 30
Asp Pro Ser Leu Leu Gln Asn Phe Leu Glu His Asp Ile Ala Gly Asp
35 40 45
Val Leu Pro Tyr Leu Lys Ser Glu Asp Leu Lys Glu Ile Gly Ile Asn
50 55 60
Glu Leu Lys His Arg Ile Ser Ile Lys Lys Asn Ile His Glu Leu Leu
65 70 75 80
Val Ser Asn Glu Lys His Ile Asp Thr Ser Ile Leu Ser Asp Thr Ala
85 90 95
Thr Glu Leu Gly Thr Leu Ile Leu Thr Asn Lys Phe Ile Thr Gln Met
100 105 110
Ala Asn Arg Lys Asn Val Val Asp Asp Ser Thr His His Ser Asn Asn
115 120 125
Arg Arg Leu Thr Glu Gln Phe Asn Lys Leu Arg Lys Asp Leu Leu Pro
130 135 140
Ile Phe Lys Trp Ile Lys Glu Thr Gln Pro Leu Pro Thr Pro Glu Asn
145 150 155 160
Thr His Phe Ala Asn Met Gly Ser Val Pro Ala Ser Pro Val Glu His
165 170 175
Thr Ser Gly Glu Ser Thr Leu Ser Asn Pro Ser Leu Ser Thr Ile Asn
180 185 190
Ala Gly Glu Gly Val Asn Ser Ala Val Ala Gly Gln Ser Leu Gly Arg
195 200 205
Lys Pro Thr Leu Ser Ser Arg Arg Gln Ser His Ala Leu Ser Pro Thr
210 215 220
Gly Glu His Leu Asn Val Ser Ser Ser Ser Pro Ser Thr Gly Asn Phe
225 230 235 240
Glu Thr Leu Asn Gly Glu Arg Pro Asn Leu Arg Ser Ala Ser Ser Gly
245 250 255
Ser Gln Glu His Thr Glu Asn Glu Leu Leu Lys Pro Leu Arg Val Lys
260 265 270
Ala Asp Glu Pro Cys Tyr Lys Val Ile Gln Asn Ala Met Lys Arg His
275 280 285
Gly Leu Ser Val Asp Asp Trp Arg Lys Tyr Ala Leu Val Ile Cys Tyr
290 295 300
Gly Asp Glu Glu Arg Val Leu Gly Leu His Glu Lys Pro Gly Ser Ile
305 310 315 320
Phe Lys Glu Leu Lys Asp Gln Lys Gln Asn Pro Ala Ile Met Leu Arg
325 330 335
Gln Ile Asp Thr Asn Asn Asp Asp Gln Asn His Ile Glu Thr Pro Gly
340 345 350
Gly Arg Leu
355
<210> 69
<211> 1027
<212> PRT
<213> Komagataella pastoris
<400> 69
Met Thr Thr Asn Gly Gln Lys Arg Gln Lys Thr Arg Lys Pro Leu Leu
1 5 10 15
Ile Asn Ala Phe Val Met Gly Cys Ala Gly Leu Gln Asn Pro Gly Leu
20 25 30
Trp Lys His Pro Lys Asp Ser Ser His Arg Phe Asn Gln Ile Asp His
35 40 45
Trp Thr Tyr Leu Ala Lys Leu Ala Glu Lys Gly Lys Phe Asn Ala Leu
50 55 60
Phe Ile Ala Asp Val Leu Gly Gly Tyr Asp Val Tyr Lys Gly Pro Glu
65 70 75 80
Asn Leu Ala Thr Pro Ala Val Ala Gly Ala Gln Trp Pro Val Thr Glu
85 90 95
Pro Ser Ala Val Val Ser Ala Met Ala Ala Val Thr Thr Asn Leu Ala
100 105 110
Phe Gly Val Thr Phe Ser Thr Ile Ser Glu Ala Pro Tyr His Phe Ala
115 120 125
Arg Arg Leu Ser Thr Leu Asp His Leu Thr Lys Gly Arg Ile Gly Trp
130 135 140
Asn Val Val Ser Ser Tyr Leu Glu Ser Ala Ala Arg Asn Leu Leu Asn
145 150 155 160
Gly Glu Lys Leu Asp Glu His Asp Gln Arg Tyr Leu Lys Ala Glu Glu
165 170 175
Tyr Ile Gln Ile Val Tyr Glu Leu Leu Leu Ser Ser Trp Arg Asp Asp
180 185 190
Ala Val Val Leu Asp Lys Lys Ala Gly Val Tyr Thr Asp Pro Thr Arg
195 200 205
Phe Arg Lys Ile Asn Phe Glu Gly Lys Phe Phe Lys Val Pro Gly Pro
210 215 220
His Ile Val Asp Pro Thr Pro Gln Arg Leu Pro Val Ile Leu Gln Ala
225 230 235 240
Gly Thr Ser Lys Val Gly Lys Glu Phe Ala Ala Lys His Ala Glu Ile
245 250 255
Val Phe Val Ile Ser Phe Ser Pro Asp Asp Leu Lys Pro Lys Ile Ala
260 265 270
Glu Val Arg Gln Leu Ala Lys Glu Lys Phe Gly Arg Asn His Asp Asp
275 280 285
Ile Lys Phe Val Ala Leu Ala Thr Pro Val Ile Gly Ala Thr His Glu
290 295 300
Leu Ala Glu Glu Lys Tyr Gln Glu Leu Leu Ser Tyr Gly Asp Ile Glu
305 310 315 320
Gly Ala Gln Ala Leu Phe Gly Gly Trp Thr Gly Ile Asp Leu Ser Gln
325 330 335
Tyr Gly Glu Asp Glu Glu Leu Gly Asn Val Ser Ser Asn Ala Met Arg
340 345 350
Gly Ala Val Gln Asn Trp Thr Lys Ala Ile Pro Asn Glu Lys Arg Trp
355 360 365
Thr Arg Lys Val Ile Ala Lys Gln Ile Thr Val Gly Gly Leu Gly Pro
370 375 380
Ala Phe Val Gly Thr Pro Glu Glu Ile Ala Asp Glu Leu Glu His Trp
385 390 395 400
Ser Asp His Ala Gly Leu Asp Gly Phe Asn Phe Thr Tyr Ala Val Asn
405 410 415
Pro Leu Ser Phe Glu Glu Ile Val Glu Asp Leu Ile Pro Val Leu Gln
420 425 430
Arg Arg Gly Leu Ala Gln Lys Glu Tyr Pro Asn Pro Glu Thr Gly Ser
435 440 445
Thr Phe Arg Lys Asn Leu Phe Gly Thr Asp Phe Val Pro Ser Thr His
450 455 460
Pro Ala Tyr Asn Leu Arg Trp Arg Ala Gly Val Ser Lys Glu Glu Phe
465 470 475 480
Glu Lys Ser Leu Asn Ala Thr Thr Asn Trp Tyr Ser Ser Phe Ala Arg
485 490 495
Ser Gly Ala Leu Gly Glu Leu His Asn Thr Cys Arg Ile Leu Tyr Leu
500 505 510
Gln Ile Val Lys Tyr Lys Tyr Arg Leu Arg Val Arg Ser Glu Gly Asn
515 520 525
Ser Ile Pro Phe Ala Lys Met Thr Lys Glu Asn Glu Ala Lys Arg Gln
530 535 540
Lys Thr Ser Gln Pro Lys Ala Lys Lys Gln Leu Ile Ile Asn Ala Phe
545 550 555 560
Met Ser Gly Ser Ser Gly Asn Gln Ser Pro Gly Leu Trp Ser Tyr Pro
565 570 575
Gly Asp Lys Ser Thr Glu Tyr Thr Thr Leu Asp Tyr Trp Val Glu Leu
580 585 590
Ala Gln Lys Leu Glu Lys Ala Lys Phe His Ser Ile Phe Ile Ala Asp
595 600 605
Val Leu Gly Gly Tyr Asp Val Tyr Asn Gly Pro Gly Asn Tyr Ser Ala
610 615 620
Ala Ala Lys Ser Gly Ala Gln Phe Pro Met Ile Glu Pro Ser Ala Ala
625 630 635 640
Val Thr Ala Met Ala Ala Ala Thr Lys Ser Ile Thr Phe Gly Val Thr
645 650 655
Phe Ser Thr Ile Ser Glu Ala Pro Tyr His Phe Ala Arg Arg Leu Gly
660 665 670
Thr Leu Asp Leu Leu Thr Asn Gly Arg Val Gly Trp Asn Ile Val Ser
675 680 685
Ser Tyr Leu Asp Ser Ala Ala Arg Asn Leu Leu Asn Gly Glu Pro Leu
690 695 700
Pro Leu His Ala Asp Arg Tyr Lys Arg Ala Glu Glu Phe Leu Gln Val
705 710 715 720
Val Tyr Arg Leu Phe Leu Ser Ser Trp Arg Asp Asp Ala Tyr Lys Leu
725 730 735
Asp Lys Lys Thr Arg Thr Phe Ala Asp Pro Lys Leu Ile Arg Thr Ile
740 745 750
Asp His Val Gly Glu Phe Phe Asn Val Pro Gly Pro Gln Phe Leu Pro
755 760 765
Pro Thr Pro Gln Arg Leu Pro Leu Ile Leu Gln Ala Gly Thr Ser Lys
770 775 780
Val Gly Met Asp Tyr Ala Ala Lys His Ala Glu Val Val Phe Leu Ala
785 790 795 800
Ser Phe Asp Pro Glu Ser Leu Gln Glu Lys Ile Lys Thr Val Arg Asp
805 810 815
Ile Ala Glu Thr Lys Tyr Asn Arg Pro Arg Asp Ser Ile Lys Phe Leu
820 825 830
Ile Leu Ile Thr Val Val Ile Ala Asp Thr His Glu Asp Ala Val Lys
835 840 845
Arg Tyr Glu Asp Leu Ala Ser Tyr Ala Asp Leu Glu Gly Ala Gln Ala
850 855 860
Leu Phe Ser Gly Trp Thr Gly Ile Asp Ile Gly Lys Tyr Gly Glu Asp
865 870 875 880
Glu Pro Leu Glu His Val Glu Ser Asn Ala Ile Lys Ser His Val Lys
885 890 895
Asn Trp Thr Lys Phe Lys Asp Asn Lys Pro Arg Ala Arg Lys Asp Ile
900 905 910
Ala Lys Gln Ile Gly Val Gly Gly Ser Gly Pro Leu Leu Val Gly Ser
915 920 925
Val Gln Glu Ile Ala Asp Glu Leu Glu Arg Trp Ala Glu Val Ser Asp
930 935 940
Leu Asp Gly Phe Asn Phe Ala Tyr Ala Asp Tyr Pro Gln Thr Phe Asp
945 950 955 960
Asp Ile Ile Glu Lys Leu Leu Pro Glu Leu Asn Lys Arg Gly Val Phe
965 970 975
Trp Asp Asp Tyr Lys Ile Pro Gly Gly Thr Phe Arg Glu Ser Val Phe
980 985 990
Gly Arg Lys Phe Val Asp Lys Asp His Pro Ala Tyr Asp Leu Arg Trp
995 1000 1005
Arg Ser Asp Gln Thr Arg Glu Glu Phe Glu Lys Lys Leu Ala Glu
1010 1015 1020
Leu Glu Lys Lys
1025
<210> 70
<211> 194
<212> PRT
<213> Komagataella pastoris
<400> 70
Met Arg Phe Ser Asn Val Val Leu Thr Ala Ile Ala Ala Ala Gly Val
1 5 10 15
Gln Ala Asp Glu Ala Leu Tyr Thr Val Phe Tyr Asn Asp Val Thr Glu
20 25 30
Asn Ala Gln Glu Tyr Leu Ser Tyr Ile Gln Ala Asn Thr Ala Ala Gly
35 40 45
Phe Thr Asp Leu Leu Ser Leu Tyr Thr Glu Leu Ala Thr Tyr Thr Asp
50 55 60
Asp Ser Tyr Thr Ser Ile Phe Thr Glu Glu Asp Phe Pro Ala Ser Glu
65 70 75 80
Leu Ser Ser Phe Val Val Asn Leu Pro Trp Tyr Ser Ser Arg Ile Glu
85 90 95
Pro Gln Val Ala Ala Ala Glu Thr Gly Glu Ser Glu Glu Glu Ser Glu
100 105 110
Thr Gly Glu Ser Glu Glu Glu Ser Glu Thr Gly Glu Glu Thr Glu Thr
115 120 125
Glu Thr Gly Ser Glu Ser Glu Ser Glu Ser Glu Ser Glu Thr Ser Ala
130 135 140
Thr Gly Thr Gly Thr Gly Thr Ser Ala Ser Glu Ser Ala Glu Thr Glu
145 150 155 160
Thr Ser Thr Asp Ala Ala Val Ser Ile Asp His Pro Lys Ser Thr Leu
165 170 175
Leu Met Gly Leu Thr Ala Ala Val Val Ser Ile Thr Phe Gly Val Phe
180 185 190
Ala Leu
<210> 71
<211> 478
<212> PRT
<213> Komagataella pastoris
<400> 71
Met Ser Ser Phe Arg Val Leu Asp Leu Val Lys Pro Phe Thr Pro Phe
1 5 10 15
Leu Pro Glu Val Ile Ser Pro Glu Arg Lys Val Pro Phe Gln Gln Lys
20 25 30
Leu Met Trp Thr Gly Val Thr Leu Leu Ile Phe Leu Val Met Ser Glu
35 40 45
Ile Pro Leu Tyr Gly Ile Thr Ser Ser Asp Ser Ser Asp Pro Leu Phe
50 55 60
Trp Leu Arg Met Met Leu Ala Ser Asn Arg Gly Thr Leu Met Glu Leu
65 70 75 80
Gly Ile Ser Pro Ile Val Thr Ser Gly Met Val Phe Gln Leu Leu Gln
85 90 95
Gly Ile Gln Ile Leu Asp Val Asn Met Glu Asn Lys Ala Asp Arg Glu
100 105 110
Leu Phe Gln Thr Ala Gln Lys Val Phe Ala Ile Leu Leu Ser Ile Gly
115 120 125
Gln Ala Thr Val Tyr Val Leu Thr Gly Met Tyr Gly Pro Pro Gly Glu
130 135 140
Leu Gly Val Gly Val Cys Leu Leu Leu Val Leu Gln Leu Val Phe Ala
145 150 155 160
Gly Ile Val Val Ile Leu Leu Asp Glu Leu Leu Gln Lys Gly Tyr Gly
165 170 175
Leu Gly Ser Gly Ile Ser Leu Phe Met Ala Thr Asn Ile Cys Glu Gln
180 185 190
Ile Phe Trp Lys Thr Phe Ala Pro Thr Thr Val Asn Arg Gly Arg Gly
195 200 205
Lys Glu Phe Glu Gly Ala Phe Ile Ser Phe Phe His Leu Ile Leu Thr
210 215 220
Lys Lys Asp Lys Lys Arg Ala Leu Leu Glu Ser Phe Tyr Arg Asp Asn
225 230 235 240
Ala Pro Asn Met Phe Gln Val Ile Ala Thr Leu Val Val Phe Phe Thr
245 250 255
Val Val Tyr Leu Gln Gly Phe Arg Leu Glu Ile Pro Val Lys Ser Thr
260 265 270
Arg Gln Arg Gly Pro Tyr Gly Thr Tyr Pro Ile Arg Leu Phe Tyr Thr
275 280 285
Ser Asn Met Pro Ile Met Leu Gln Ser Ala Leu Thr Ser Asn Ile Phe
290 295 300
Ile Ile Ser Gln Met Leu Tyr Ser His Phe Pro Asp Asn Ala Phe Val
305 310 315 320
Lys Leu Ile Gly Thr Trp Glu Ala Gln Pro Gly Ser Ala Gln Leu Phe
325 330 335
Ala Ala Ser Gly Leu Ala Tyr Tyr Met Gln Pro Pro Met Ser Leu Ser
340 345 350
Gln Ala Leu Leu Asp Pro Ile Lys Thr Val Val Tyr Val Val Phe Val
355 360 365
Leu Thr Thr Cys Ala Ile Phe Ser Lys Thr Trp Ile Glu Ile Ser Gly
370 375 380
Ser Ser Pro Arg Asp Val Ala Lys Gln Phe Lys Asp Gln Gly Leu Val
385 390 395 400
Ile Ala Gly His Arg Asp Ala Thr Val Tyr Lys Glu Leu Lys Lys Ile
405 410 415
Ile Pro Thr Ala Ala Ala Phe Gly Gly Ala Thr Ile Gly Ala Leu Ser
420 425 430
Val Val Ser Asp Leu Leu Gly Thr Leu Gly Ser Gly Thr Ser Ile Leu
435 440 445
Leu Ala Val Thr Thr Ile Tyr Gly Tyr Tyr Glu Leu Ala Val Lys Glu
450 455 460
Gly Gly Phe Ser Lys Gly Gly Pro Ser Gly Phe Val Asp Leu
465 470 475
<210> 72
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 72
cgaacatcca tcaccaaaac ac 22
<210> 73
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 73
gttgtcgacc tgcagcgtac ggtgttgccg cgaaatg 37
<210> 74
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 74
taggtgatat cagatccact gatcaatttg cccaagagac g 41
<210> 75
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 75
gactgttgcg attgctggtg 20
<210> 76
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 76
catttcgcgg caacaccgta cgctgcaggt cgacaac 37
<210> 77
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 77
cggtgagaat ggcaaaagct tat 23
<210> 78
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 78
aagcccgatg cgccagagtt g 21
<210> 79
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 79
cgtctcttgg gcaaattgat cagtggatct gatatcacct a 41
<210> 80
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 80
atccaggaca cgctcatcaa g 21
<210> 81
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 81
tgtaacgtga atgtcggatt tg 22
<210> 82
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 82
tagtgatggt ggtggtgatg 20
<210> 83
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 83
cctgaggctt tgttccaccc act 23
<210> 84
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 84
ggaacatagt agcaccggca taacga 26
<210> 85
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> translation initiation site
<400> 85
cctgcaggcc 10
<210> 86
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> translation initiation site
<220>
<221> misc_feature
<222> (1)..(6)
<223> n at positions 1-6 is any nucleic acid, preferably A
<220>
<221> misc_feature
<222> (8)..(9)
<223> n at positions 8-9 is any nucleic acid, preferably A
<400> 86
nnnnnnann 9
Claims (15)
- 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자를 포함하며, 하나 이상의 유전적 변형 전의 숙주 세포와 비교하여 상기 유전자의 발현을 감소시키기 위해 상기 하나 이상의 유전적 변형에 의해 조작되고, 비-메탄올 탄소 공급원에 의해 억제가능한 발현 카세트 프로모터(ECP)의 제어 하에 관심 유전자(GOI)를 포함하는 이종 발현 카세트를 포함하는, 재조합 숙주 세포.
- 상기 내인성 폴리뉴클레오티드가 상기 FLO8 단백질을 암호화하는 유전자이고, 상기 하나 이상의 유전적 변형이 (i) 하나 이상의 내인성 폴리뉴클레오티드, 또는 이의 일부의 파괴, 치환, 결실 또는 녹아웃; 또는 (ii) 발현 제어 서열을 포함하며, 바람직하게는 상기 발현 제어 서열이 프로모터, 리보솜 결합 부위, 전사 또는 번역 시작 및 중지 서열, 인핸서 및 활성인자 서열로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제1항 또는 제2항에 있어서, 상기 FLO8 단백질 또는 상기 상동체를 암호화하는 상기 내인성 유전자가 상기 하나 이상의 유전적 변형에 의해 녹아웃되는, 숙주 세포.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 ECP가 성장-제한량의 비-메탄올 탄소 공급원의 존재 하에, 바람직하게는 메탄올의 부재 하에 유도가능하고; 성장-제한량보다 높은 과량의 비-메탄올 탄소 공급원의 존재 하에 억제가능한, 숙주 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 ECP가 서열 서열번호:10-16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나의 적어도 300 nt에 대해 적어도 60% 서열 동일성을 포함하는, 숙주 세포.
- 제5항에 있어서, 상기 ECP가 서열번호:10 또는 서열번호:11을 포함하거나 또는 이로 이루어지는, 숙주 세포.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 발현 카세트가 GOI에 의해 암호화된 관심 단백질(POI)의 분비를 가능하게 하는 신호 펩티드를 암호화하는 뉴클레오티드 서열을 추가로 포함하며, 바람직하게는 여기서 신호 펩티드를 암호화하는 뉴클레오티드 서열은 GOI의 5'-단부에 인접하게 융합되는, 숙주 세포.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 GOI가 항원 결합 단백질, 치료 단백질, 효소, 펩티드, 단백질 항생제, 독소 융합 단백질, 탄수화물 - 단백질 접합체, 구조적 단백질, 조절 단백질, 백신 항원, 성장 인자, 호르몬, 사이토카인, 공정 효소, 및 대사 효소로 이루어진 군으로부터 선택된 펩티드 또는 단백질인 관심 단백질(POI)을 암호화하는, 숙주 세포.
- 제1항 내지 제8항 중 어느 한 항에 있어서,
a) 피키아, 한세눌라, 코마가타엘라, 사카로마이세스, 클루이베로마이세스, 칸디다, 오가타에아, 야로위아, 및 지오트리쿰, 예컨대 피키아 파스토리스, 코마가타엘라 파피이, 코마가타엘라 파스토리스, 코마가타엘라 슈도파스토리스, 사카로마이세스 세레비지애, 오가타에아 미누타, 클루이베롬세스 락티스, 클루이베로메스 마르시아누스, 야로위아 리폴리티카 또는 한세눌라 폴리모르파로 이루어진 군으로부터 선택된 속의 효모 세포; 또는
b) 사상성 진균, 예컨대 아스페르길루스 아와모리 또는 트리코더마 레세이의 세포인, 숙주 세포. - 상기 숙주 세포에서 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 유전자의 발현을 감소시킴으로써, 비-메탄올 탄소 공급원에 의해 억제가능한 프로모터의 제어 하에 관심 단백질(POI)을 암호화하는 관심 유전자(GOI)를 발현하는 숙주 세포에 의해 생산된 상기 POI의 수율을 증가시키는 방법.
- 관심 단백질(POI)을 생산하는 조건 하에 제1항 내지 제9항 중 어느 한 항의 숙주 세포를 배양함으로써 관심 유전자(GOI)에 의해 암호화된 상기 POI를 생산하는 방법.
- 제10항 또는 제11항에 있어서, 하기 단계를 포함하는, 방법:
a) 성장 조건 하에 숙주 세포를 배양하는 단계; 및
b) 최대 1 g/L의 제2 비-메탄올 탄소 공급원의 존재 하에 성장-제한 조건 하에 숙주 세포를 배양하여, 상기 GOI의 발현을 초래하여 상기 POI를 생산하는 단계로, 여기서 바람직하게는 상기 단계 a) 배양은 회분 단계에서 수행되고; 상기 단계 b) 배양은 유가 또는 연속 배양 단계. - 제12항에 있어서, 상기 제1 또는 제2 탄소 공급원이 사카라이드, 폴리올, 알코올, 또는 전술한 것 중 임의의 하나 이상의 혼합물로부터 선택되는, 방법.
- 하기 단계를 포함하는, 숙주 세포에서 관심 단백질(POI)을 생산하는 방법:
a) 서열번호:1로 식별된 아미노산 서열을 포함하는 FLO8 단백질 또는 이의 상동체를 암호화하는 내인성 유전자의 발현을 감소시키도록 숙주 세포를 유전적으로 조작하는 단계;
b) 관심 유전자(GOI)에 작동가능하게 연결된, 비-메탄올 탄소 공급원에 의해 억제가능한 발현 카세트 프로모터(ECP)의 제어 하에 상기 POI를 발현하는 상기 GOI를 포함하는 이종 발현 카세트를 숙주 세포에 도입하는 단계;
c) 상기 POI를 생산하기 위한 조건 하에 상기 숙주 세포를 배양하는 단계;
d) 임의적으로 세포 배양물로부터 상기 POI를 단리하는 단계; 및
e) 임의적으로 상기 POI를 정제하는 단계. - 제14항에 있어서, 상기 ECP가 서열 서열번호:10-16 중 임의의 하나, 또는 서열번호:41-45 중 임의의 하나의 적어도 300 nt에 대해 적어도 60% 서열 동일성을 포함하는, 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020237003485A KR20230022260A (ko) | 2019-01-11 | 2020-01-10 | 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19151376.1 | 2019-01-11 | ||
EP19151376 | 2019-01-11 | ||
PCT/EP2020/050517 WO2020144313A1 (en) | 2019-01-11 | 2020-01-10 | Carbon-source regulated protein production in a recombinant host cell |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237003485A Division KR20230022260A (ko) | 2019-01-11 | 2020-01-10 | 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210114401A true KR20210114401A (ko) | 2021-09-23 |
KR102495283B1 KR102495283B1 (ko) | 2023-02-06 |
Family
ID=65268724
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237003485A KR20230022260A (ko) | 2019-01-11 | 2020-01-10 | 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 |
KR1020217020068A KR102495283B1 (ko) | 2019-01-11 | 2020-01-10 | 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237003485A KR20230022260A (ko) | 2019-01-11 | 2020-01-10 | 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 |
Country Status (11)
Country | Link |
---|---|
US (2) | US11773424B2 (ko) |
EP (1) | EP3874047B1 (ko) |
JP (1) | JP7061234B2 (ko) |
KR (2) | KR20230022260A (ko) |
CN (2) | CN116904331A (ko) |
CA (1) | CA3125217C (ko) |
DK (1) | DK3874047T3 (ko) |
ES (1) | ES2921137T3 (ko) |
SG (1) | SG11202105667RA (ko) |
TW (1) | TW202031898A (ko) |
WO (1) | WO2020144313A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022069613A1 (en) | 2020-09-30 | 2022-04-07 | Lonza Ltd | Host cells overexpressing translational factors |
CN113764034B (zh) * | 2021-08-03 | 2023-09-22 | 腾讯科技(深圳)有限公司 | 基因组序列中潜在bgc的预测方法、装置、设备及介质 |
CN114657190B (zh) * | 2022-04-06 | 2023-08-29 | 暨南大学 | Msn2p作为负调控因子在提高宿主细胞中蛋白表达中的应用 |
CN115386009B (zh) * | 2022-04-26 | 2023-12-01 | 江苏靶标生物医药研究所有限公司 | 一种膜联蛋白v与血管生成抑制剂融合蛋白的构建方法和应用 |
CN115716868B (zh) * | 2022-08-01 | 2024-01-26 | 华中农业大学 | 转录因子MrPigB突变体及其应用 |
CN116041426B (zh) * | 2022-08-18 | 2023-11-03 | 齐齐哈尔大学 | 玉米蛋白源抗粘附肽及其制备方法和应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015158800A1 (en) * | 2014-04-17 | 2015-10-22 | Boehringer Ingelheim Rcv Gmbh & Co Kg | Recombinant host cell for expressing proteins of interest |
WO2015158808A2 (en) * | 2014-04-17 | 2015-10-22 | Boehringer Ingelheim Rcv Gmbh & Co Kg | Recombinant host cell engineered to overexpress helper proteins |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2105064A1 (en) | 1991-04-01 | 1992-10-02 | Martin Anthony Gleeson | Genes which influence pichia proteolytic activity, and uses therefor |
US6153424A (en) | 1995-11-09 | 2000-11-28 | Zymogenetics, Inc. | Protease-deficient strains of Pichia methanolica |
EA017803B1 (ru) | 2007-04-20 | 2013-03-29 | Полимун Сайнтифик Иммунбиологише Форшунг Гмбх | Система экспрессии |
ES2539378T3 (es) | 2009-02-26 | 2015-06-30 | Glaxosmithkline Llc | Células huésped y procedimientos de uso |
EP2258855A1 (en) | 2009-05-28 | 2010-12-08 | Universität für Bodenkultur Wien | Expression sequences |
JP6073138B2 (ja) | 2011-01-27 | 2017-02-01 | 株式会社カネカ | 形質転換用酵母およびタンパク質の製造方法 |
WO2012152823A1 (en) | 2011-05-09 | 2012-11-15 | Ablynx Nv | Method for the production of immunoglobulin single variable domains |
SG10201602673PA (en) | 2011-10-07 | 2016-05-30 | Lonza Ag | Regulatable promoter |
EP3130598B1 (en) | 2012-10-29 | 2020-02-12 | Lonza Ltd | Expression sequences |
EP2952584A1 (en) | 2014-06-04 | 2015-12-09 | Boehringer Ingelheim RCV GmbH & Co KG | Improved protein production |
KR102253479B1 (ko) * | 2015-08-05 | 2021-05-21 | 론자 리미티드 | 프로모터 변이체 |
-
2020
- 2020-01-10 CN CN202310749149.9A patent/CN116904331A/zh active Pending
- 2020-01-10 KR KR1020237003485A patent/KR20230022260A/ko not_active Application Discontinuation
- 2020-01-10 TW TW109100866A patent/TW202031898A/zh unknown
- 2020-01-10 CA CA3125217A patent/CA3125217C/en active Active
- 2020-01-10 US US17/421,619 patent/US11773424B2/en active Active
- 2020-01-10 CN CN202080008585.5A patent/CN113423836B/zh active Active
- 2020-01-10 DK DK20700131.4T patent/DK3874047T3/da active
- 2020-01-10 SG SG11202105667RA patent/SG11202105667RA/en unknown
- 2020-01-10 JP JP2021539943A patent/JP7061234B2/ja active Active
- 2020-01-10 EP EP20700131.4A patent/EP3874047B1/en active Active
- 2020-01-10 ES ES20700131T patent/ES2921137T3/es active Active
- 2020-01-10 WO PCT/EP2020/050517 patent/WO2020144313A1/en unknown
- 2020-01-10 KR KR1020217020068A patent/KR102495283B1/ko active IP Right Grant
-
2023
- 2023-08-24 US US18/454,930 patent/US20240018563A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015158800A1 (en) * | 2014-04-17 | 2015-10-22 | Boehringer Ingelheim Rcv Gmbh & Co Kg | Recombinant host cell for expressing proteins of interest |
WO2015158808A2 (en) * | 2014-04-17 | 2015-10-22 | Boehringer Ingelheim Rcv Gmbh & Co Kg | Recombinant host cell engineered to overexpress helper proteins |
KR20170002453A (ko) * | 2014-04-17 | 2017-01-06 | 베링거 인겔하임 에르체파우 게엠베하 운트 코 카게 | 보조 단백질을 과발현하도록 조작된 재조합 숙주세포 |
KR20170002456A (ko) * | 2014-04-17 | 2017-01-06 | 베링거 인겔하임 에르체파우 게엠베하 운트 코 카게 | 목적 단백질의 발현을 위한 재조합 숙주세포 |
Also Published As
Publication number | Publication date |
---|---|
CN113423836A (zh) | 2021-09-21 |
CA3125217C (en) | 2023-01-17 |
SG11202105667RA (en) | 2021-07-29 |
US11773424B2 (en) | 2023-10-03 |
TW202031898A (zh) | 2020-09-01 |
DK3874047T3 (da) | 2022-06-20 |
ES2921137T3 (es) | 2022-08-18 |
CN116904331A (zh) | 2023-10-20 |
JP7061234B2 (ja) | 2022-04-27 |
CA3125217A1 (en) | 2020-07-16 |
US20240018563A1 (en) | 2024-01-18 |
US20220042064A1 (en) | 2022-02-10 |
JP2022508470A (ja) | 2022-01-19 |
EP3874047A1 (en) | 2021-09-08 |
KR102495283B1 (ko) | 2023-02-06 |
CN113423836B (zh) | 2023-07-11 |
EP3874047B1 (en) | 2022-04-06 |
WO2020144313A1 (en) | 2020-07-16 |
KR20230022260A (ko) | 2023-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102495283B1 (ko) | 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산 | |
JP2023156329A (ja) | 目的タンパク質を産生するための宿主細胞 | |
US20230126246A1 (en) | Helper factors for expressing proteins in yeast | |
AU2020252241B2 (en) | Mut- methylotrophic yeast | |
US20230348545A1 (en) | Host cells overexpressing translational factors | |
WO2020200415A1 (en) | Mut- methylotrophic yeast | |
WO2020200414A1 (en) | Protein production in mut-methylotrophic yeast |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |