CN1918179A - 在异核体真菌或真菌宿主细胞中产生单克隆抗体 - Google Patents
在异核体真菌或真菌宿主细胞中产生单克隆抗体 Download PDFInfo
- Publication number
- CN1918179A CN1918179A CNA2005800050052A CN200580005005A CN1918179A CN 1918179 A CN1918179 A CN 1918179A CN A2005800050052 A CNA2005800050052 A CN A2005800050052A CN 200580005005 A CN200580005005 A CN 200580005005A CN 1918179 A CN1918179 A CN 1918179A
- Authority
- CN
- China
- Prior art keywords
- ser
- nucleotide sequence
- nucleic acid
- val
- acid construct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000233866 Fungi Species 0.000 title claims abstract description 141
- 230000002538 fungal effect Effects 0.000 title claims abstract description 45
- 238000004519 manufacturing process Methods 0.000 title claims 3
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 155
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 137
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 137
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 102
- 238000000034 method Methods 0.000 claims abstract description 49
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 36
- 239000001913 cellulose Substances 0.000 claims abstract description 28
- 229920002678 cellulose Polymers 0.000 claims abstract description 28
- 239000002773 nucleotide Substances 0.000 claims description 216
- 125000003729 nucleotide group Chemical group 0.000 claims description 216
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 86
- 240000006439 Aspergillus oryzae Species 0.000 claims description 85
- 235000002247 Aspergillus oryzae Nutrition 0.000 claims description 84
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 63
- 229920001184 polypeptide Polymers 0.000 claims description 56
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 55
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 24
- 230000028327 secretion Effects 0.000 claims description 21
- 101710098554 Lipase B Proteins 0.000 claims description 20
- 230000001939 inductive effect Effects 0.000 claims description 15
- 238000011144 upstream manufacturing Methods 0.000 claims description 13
- 108090001060 Lipase Proteins 0.000 claims description 5
- 108090000637 alpha-Amylases Proteins 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000011534 incubation Methods 0.000 claims 2
- 210000004027 cell Anatomy 0.000 description 100
- 108090000623 proteins and genes Proteins 0.000 description 86
- 108020004414 DNA Proteins 0.000 description 77
- 239000012634 fragment Substances 0.000 description 70
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 67
- 230000001580 bacterial effect Effects 0.000 description 39
- 241000228212 Aspergillus Species 0.000 description 36
- 230000004927 fusion Effects 0.000 description 34
- 101150054232 pyrG gene Proteins 0.000 description 34
- 102000004169 proteins and genes Human genes 0.000 description 33
- 235000018102 proteins Nutrition 0.000 description 32
- 239000006052 feed supplement Substances 0.000 description 30
- 239000000047 product Substances 0.000 description 29
- 150000001413 amino acids Chemical group 0.000 description 26
- 238000012408 PCR amplification Methods 0.000 description 25
- 239000013613 expression plasmid Substances 0.000 description 23
- 241000880493 Leptailurus serval Species 0.000 description 22
- 108090000790 Enzymes Proteins 0.000 description 21
- 241000222684 Grifola Species 0.000 description 21
- 102000004190 Enzymes Human genes 0.000 description 20
- 229940088598 enzyme Drugs 0.000 description 20
- 230000002441 reversible effect Effects 0.000 description 20
- 238000010367 cloning Methods 0.000 description 18
- 108091008146 restriction endonucleases Proteins 0.000 description 18
- 230000000875 corresponding effect Effects 0.000 description 17
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 16
- 241000228245 Aspergillus niger Species 0.000 description 15
- 229940027941 immunoglobulin g Drugs 0.000 description 15
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 14
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 13
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 13
- 241000235058 Komagataella pastoris Species 0.000 description 13
- 230000029087 digestion Effects 0.000 description 13
- 239000003292 glue Substances 0.000 description 13
- 230000008859 change Effects 0.000 description 12
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 12
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 12
- 230000012010 growth Effects 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 239000000203 mixture Substances 0.000 description 12
- 206010053567 Coagulopathies Diseases 0.000 description 11
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 11
- 230000035602 clotting Effects 0.000 description 11
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 10
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 10
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 10
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 10
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 9
- 241000223218 Fusarium Species 0.000 description 9
- 108091005804 Peptidases Proteins 0.000 description 9
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 9
- 108091081024 Start codon Proteins 0.000 description 9
- 230000000890 antigenic effect Effects 0.000 description 9
- 210000004408 hybridoma Anatomy 0.000 description 9
- 230000008488 polyadenylation Effects 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 229940045145 uridine Drugs 0.000 description 9
- ZGXJTSGNIOSYLO-UHFFFAOYSA-N 88755TAZ87 Chemical compound NCC(=O)CCC(O)=O ZGXJTSGNIOSYLO-UHFFFAOYSA-N 0.000 description 8
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 8
- 102100039702 Alcohol dehydrogenase class-3 Human genes 0.000 description 8
- 108010025188 Alcohol oxidase Proteins 0.000 description 8
- 241000351920 Aspergillus nidulans Species 0.000 description 8
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 8
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 8
- SVGAWGVHFIYAEE-JSGCOSHPSA-N Trp-Gly-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 SVGAWGVHFIYAEE-JSGCOSHPSA-N 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 229910052799 carbon Inorganic materials 0.000 description 8
- 108010051015 glutathione-independent formaldehyde dehydrogenase Proteins 0.000 description 8
- LXJXRIRHZLFYRP-UHFFFAOYSA-N glyceraldehyde 3-phosphate Chemical compound O=CC(O)COP(O)(O)=O LXJXRIRHZLFYRP-UHFFFAOYSA-N 0.000 description 8
- 101150112623 hemA gene Proteins 0.000 description 8
- 239000012528 membrane Substances 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- 230000005030 transcription termination Effects 0.000 description 8
- 230000014621 translational initiation Effects 0.000 description 8
- 108010073969 valyllysine Proteins 0.000 description 8
- 108091005658 Basic proteases Proteins 0.000 description 7
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 7
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 7
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- 241000228143 Penicillium Species 0.000 description 7
- 102000035195 Peptidases Human genes 0.000 description 7
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 7
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 7
- 229930006000 Sucrose Natural products 0.000 description 7
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 7
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- 229940024606 amino acid Drugs 0.000 description 7
- 235000001014 amino acid Nutrition 0.000 description 7
- 108010068265 aspartyltyrosine Proteins 0.000 description 7
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 7
- 229940041514 candida albicans extract Drugs 0.000 description 7
- 230000002950 deficient Effects 0.000 description 7
- 238000000855 fermentation Methods 0.000 description 7
- 230000004151 fermentation Effects 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 108010017391 lysylvaline Proteins 0.000 description 7
- 235000016709 nutrition Nutrition 0.000 description 7
- 230000035764 nutrition Effects 0.000 description 7
- 238000003756 stirring Methods 0.000 description 7
- 239000005720 sucrose Substances 0.000 description 7
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 7
- 239000012138 yeast extract Substances 0.000 description 7
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 6
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 6
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 6
- 241000283707 Capra Species 0.000 description 6
- PORWNQWEEIOIRH-XHNCKOQMSA-N Cys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)C(=O)O PORWNQWEEIOIRH-XHNCKOQMSA-N 0.000 description 6
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 6
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 6
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 6
- 238000002965 ELISA Methods 0.000 description 6
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 6
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 6
- 108060003951 Immunoglobulin Proteins 0.000 description 6
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 6
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 6
- 108010066427 N-valyltryptophan Proteins 0.000 description 6
- 239000001888 Peptone Substances 0.000 description 6
- 108010080698 Peptones Proteins 0.000 description 6
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 6
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 6
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 6
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 6
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 6
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 6
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 6
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 6
- 239000013611 chromosomal DNA Substances 0.000 description 6
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 6
- 102000018358 immunoglobulin Human genes 0.000 description 6
- 235000019319 peptone Nutrition 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 108010029020 prolylglycine Proteins 0.000 description 6
- VWDWKYIASSYTQR-UHFFFAOYSA-N sodium nitrate Chemical compound [Na+].[O-][N+]([O-])=O VWDWKYIASSYTQR-UHFFFAOYSA-N 0.000 description 6
- 230000009182 swimming Effects 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- MEIRRNXMZYDVDW-MQQKCMAXSA-N (2E,4E)-2,4-hexadien-1-ol Chemical compound C\C=C\C=C\CO MEIRRNXMZYDVDW-MQQKCMAXSA-N 0.000 description 5
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 5
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 5
- 108010065511 Amylases Proteins 0.000 description 5
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 5
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 5
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 5
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 5
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 5
- 108091000080 Phosphotransferase Proteins 0.000 description 5
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 5
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 5
- 108010081404 acein-2 Proteins 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 108010013835 arginine glutamate Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 5
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 5
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 5
- 108010070643 prolylglutamic acid Proteins 0.000 description 5
- 239000012474 protein marker Substances 0.000 description 5
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 5
- 239000013595 supernatant sample Substances 0.000 description 5
- 239000000725 suspension Substances 0.000 description 5
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 5
- 108010051110 tyrosyl-lysine Proteins 0.000 description 5
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 4
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 4
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 4
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 4
- 239000004382 Amylase Substances 0.000 description 4
- 102000013142 Amylases Human genes 0.000 description 4
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 4
- 241000235349 Ascomycota Species 0.000 description 4
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 4
- 241001513093 Aspergillus awamori Species 0.000 description 4
- 108010089921 CTCGAG-specific type II deoxyribonucleases Proteins 0.000 description 4
- 101150015836 ENO1 gene Proteins 0.000 description 4
- 101150108358 GLAA gene Proteins 0.000 description 4
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 4
- MIWJDJAMMKHUAR-ZVZYQTTQSA-N Glu-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N MIWJDJAMMKHUAR-ZVZYQTTQSA-N 0.000 description 4
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 4
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 4
- 101000801742 Homo sapiens Triosephosphate isomerase Proteins 0.000 description 4
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 4
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 4
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 4
- 241000235649 Kluyveromyces Species 0.000 description 4
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 4
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 4
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 4
- 241000233654 Oomycetes Species 0.000 description 4
- JDMKQHSHKJHAHR-UHFFFAOYSA-N Phe-Phe-Leu-Tyr Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)CC1=CC=CC=C1 JDMKQHSHKJHAHR-UHFFFAOYSA-N 0.000 description 4
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 4
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 4
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 4
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 4
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 4
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 4
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 4
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 4
- 101900147151 Saccharomyces cerevisiae Mating factor alpha-1 Proteins 0.000 description 4
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 4
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 4
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 4
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 4
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 4
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 4
- 241000223259 Trichoderma Species 0.000 description 4
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 4
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 4
- ANHVRCNNGJMJNG-BZSNNMDCSA-N Tyr-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CS)C(=O)O)N)O ANHVRCNNGJMJNG-BZSNNMDCSA-N 0.000 description 4
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- 235000019418 amylase Nutrition 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 4
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 4
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 238000013016 damping Methods 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003203 everyday effect Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 230000034659 glycolysis Effects 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 4
- 230000012447 hatching Effects 0.000 description 4
- 239000012160 loading buffer Substances 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 235000013372 meat Nutrition 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 239000002417 nutraceutical Substances 0.000 description 4
- 235000021436 nutraceutical agent Nutrition 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 4
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 235000014347 soups Nutrition 0.000 description 4
- 238000010186 staining Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 4
- 108010080629 tryptophan-leucine Proteins 0.000 description 4
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 4
- 108010027345 wheylin-1 peptide Proteins 0.000 description 4
- 108020005065 3' Flanking Region Proteins 0.000 description 3
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 3
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 3
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 3
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 3
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 3
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 3
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 3
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 3
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 3
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 3
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 3
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 3
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 3
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 3
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 3
- 241001480052 Aspergillus japonicus Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000221198 Basidiomycota Species 0.000 description 3
- 241000233652 Chytridiomycota Species 0.000 description 3
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 3
- 241000228138 Emericella Species 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical group OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- 241001136487 Eurotium Species 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- 241000223195 Fusarium graminearum Species 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 3
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 3
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 3
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 3
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 3
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 3
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 3
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 3
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 3
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 3
- BIRKKBCSAIHDDF-WDSKDSINSA-N Gly-Glu-Cys Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BIRKKBCSAIHDDF-WDSKDSINSA-N 0.000 description 3
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 3
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 3
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 3
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 3
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 3
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 3
- 241000223198 Humicola Species 0.000 description 3
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 3
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 3
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 3
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 3
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 3
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 3
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 3
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 3
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 3
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 3
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 3
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 3
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 3
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 3
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 3
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 3
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 3
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 3
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 3
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 3
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 3
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 3
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 3
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 3
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 3
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 3
- 241000235395 Mucor Species 0.000 description 3
- 241000221960 Neurospora Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 3
- 241000235648 Pichia Species 0.000 description 3
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 3
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 3
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 3
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 3
- 241000235403 Rhizomucor miehei Species 0.000 description 3
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 3
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 3
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 3
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 3
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 3
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 3
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 3
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 3
- 241000223258 Thermomyces lanuginosus Species 0.000 description 3
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 3
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 3
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 3
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 3
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 3
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 3
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 3
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 3
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 3
- 241000499912 Trichoderma reesei Species 0.000 description 3
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 3
- NLWCSMOXNKBRLC-WDSOQIARSA-N Trp-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLWCSMOXNKBRLC-WDSOQIARSA-N 0.000 description 3
- YCEHCFIOIYNQTR-NYVOZVTQSA-N Trp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CO)C(=O)O)N YCEHCFIOIYNQTR-NYVOZVTQSA-N 0.000 description 3
- QJBWZNTWJSZUOY-UWJYBYFXSA-N Tyr-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QJBWZNTWJSZUOY-UWJYBYFXSA-N 0.000 description 3
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 3
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 3
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 3
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 3
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 3
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 3
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 3
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 3
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 3
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 3
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 3
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 3
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 3
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 3
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 3
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 3
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 3
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 210000001367 artery Anatomy 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 230000001461 cytolytic effect Effects 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000004744 fabric Substances 0.000 description 3
- ODKNJVUHOIMIIZ-RRKCRQDMSA-N floxuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 ODKNJVUHOIMIIZ-RRKCRQDMSA-N 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- -1 kantlex Chemical compound 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 230000013011 mating Effects 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 101150095344 niaD gene Proteins 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 239000004317 sodium nitrate Substances 0.000 description 3
- 229940001516 sodium nitrate Drugs 0.000 description 3
- 235000010344 sodium nitrate Nutrition 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 3
- 210000001541 thymus gland Anatomy 0.000 description 3
- 108010044292 tryptophyltyrosine Proteins 0.000 description 3
- 210000003462 vein Anatomy 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 2
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 2
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 2
- 241001136561 Allomyces Species 0.000 description 2
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 2
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 2
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 2
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 2
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 2
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 2
- SXLCDCZHNCLFGZ-BPUTZDHNSA-N Asp-Pro-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SXLCDCZHNCLFGZ-BPUTZDHNSA-N 0.000 description 2
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 2
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 241001279801 Coelomomyces Species 0.000 description 2
- 241000490729 Cryptococcaceae Species 0.000 description 2
- 241000221199 Cryptococcus <basidiomycete yeast> Species 0.000 description 2
- NDUSUIGBMZCOIL-ZKWXMUAHSA-N Cys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N NDUSUIGBMZCOIL-ZKWXMUAHSA-N 0.000 description 2
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 2
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 2
- BCFXQBXXDSEHRS-FXQIFTODSA-N Cys-Ser-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BCFXQBXXDSEHRS-FXQIFTODSA-N 0.000 description 2
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 2
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 2
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 2
- 101100149960 Escherichia phage P2 lysB gene Proteins 0.000 description 2
- 101150065330 Fancc gene Proteins 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 241000223221 Fusarium oxysporum Species 0.000 description 2
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 2
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- MSHXWFKYXJTLEZ-CIUDSAMLSA-N Gln-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MSHXWFKYXJTLEZ-CIUDSAMLSA-N 0.000 description 2
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 2
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 2
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 2
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 2
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 2
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 2
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 2
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 2
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 2
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 2
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- RVGMVLVBDRQVKB-UWVGGRQHSA-N Gly-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN RVGMVLVBDRQVKB-UWVGGRQHSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 2
- ALPXXNRQBMRCPZ-MEYUZBJRSA-N His-Thr-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ALPXXNRQBMRCPZ-MEYUZBJRSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 2
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 2
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 2
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 2
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 2
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 2
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 2
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 2
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 2
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 2
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 2
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 2
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 2
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 2
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 2
- 101710140452 Mating factor alpha-1 Proteins 0.000 description 2
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 241000221961 Neurospora crassa Species 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 2
- UEXCHCYDPAIVDE-SRVKXCTJSA-N Phe-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 2
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 2
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- 241000223252 Rhodotorula Species 0.000 description 2
- UEJYSALTSUZXFV-SRVKXCTJSA-N Rigin Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UEJYSALTSUZXFV-SRVKXCTJSA-N 0.000 description 2
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000235344 Saccharomycetaceae Species 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 2
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 2
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 2
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 2
- 241000222068 Sporobolomyces <Sporidiobolaceae> Species 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 101150033985 TPI gene Proteins 0.000 description 2
- 101150032817 TPI1 gene Proteins 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 241001494489 Thielavia Species 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 2
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 2
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 2
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 2
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 2
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 2
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 2
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 2
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 2
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 2
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 2
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 2
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 2
- QOIKZODVIPOPDD-AVGNSLFASA-N Tyr-Cys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOIKZODVIPOPDD-AVGNSLFASA-N 0.000 description 2
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 2
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 2
- QFHRUCJIRVILCK-YJRXYDGGSA-N Tyr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O QFHRUCJIRVILCK-YJRXYDGGSA-N 0.000 description 2
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 2
- MWUYSCVVPVITMW-IGNZVWTISA-N Tyr-Tyr-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 MWUYSCVVPVITMW-IGNZVWTISA-N 0.000 description 2
- 241000221566 Ustilago Species 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 2
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- SBJCTAZFSZXWSR-AVGNSLFASA-N Val-Met-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SBJCTAZFSZXWSR-AVGNSLFASA-N 0.000 description 2
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 2
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 2
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 2
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 101150069003 amdS gene Proteins 0.000 description 2
- 229940064734 aminobenzoate Drugs 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 230000003570 biosynthesizing effect Effects 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000005859 cell recognition Effects 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 101150046260 cphA gene Proteins 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 239000013530 defoamer Substances 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 229940099472 immunoglobulin a Drugs 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 201000000050 myeloid neoplasm Diseases 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 238000002515 oligonucleotide synthesis Methods 0.000 description 2
- 230000003534 oscillatory effect Effects 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 210000004180 plasmocyte Anatomy 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 239000012064 sodium phosphate buffer Substances 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 230000028070 sporulation Effects 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- 101150080369 tpiA gene Proteins 0.000 description 2
- 101150054879 tpiA1 gene Proteins 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001810 trypsinlike Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- SBKVPJHMSUXZTA-MEJXFZFPSA-N (2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(1H-indol-3-yl)propanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylsulfanylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 SBKVPJHMSUXZTA-MEJXFZFPSA-N 0.000 description 1
- IESDGNYHXIOKRW-YXMSTPNBSA-N (2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IESDGNYHXIOKRW-YXMSTPNBSA-N 0.000 description 1
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- WBLZUCOIBUDNBV-UHFFFAOYSA-N 3-nitropropanoic acid Chemical compound OC(=O)CC[N+]([O-])=O WBLZUCOIBUDNBV-UHFFFAOYSA-N 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 101100230376 Acetivibrio thermocellus (strain ATCC 27405 / DSM 1237 / JCM 9322 / NBRC 103400 / NCIMB 10682 / NRRL B-4536 / VPI 7372) celI gene Proteins 0.000 description 1
- 241001578974 Achlya <moth> Species 0.000 description 1
- 241000228431 Acremonium chrysogenum Species 0.000 description 1
- 102000005869 Activating Transcription Factors Human genes 0.000 description 1
- 108010005254 Activating Transcription Factors Proteins 0.000 description 1
- 229930195730 Aflatoxin Natural products 0.000 description 1
- XWIYFDMXXLINPU-UHFFFAOYSA-N Aflatoxin G Chemical compound O=C1OCCC2=C1C(=O)OC1=C2C(OC)=CC2=C1C1C=COC1O2 XWIYFDMXXLINPU-UHFFFAOYSA-N 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 1
- 241000220433 Albizia Species 0.000 description 1
- 241000223600 Alternaria Species 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- 241000228215 Aspergillus aculeatus Species 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241000228251 Aspergillus phoenicis Species 0.000 description 1
- 108090000145 Bacillolysin Proteins 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241000235432 Blastocladiella Species 0.000 description 1
- 241000235172 Bullera Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 1
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 1
- CNZIQHGDUXRUJS-UHFFFAOYSA-N Cyclopiazonic acid Natural products CC(=C/1C(=O)C2C3C(Cc4cccc5[nH]cc3c45)C(C)(C)N2C1=O)O CNZIQHGDUXRUJS-UHFFFAOYSA-N 0.000 description 1
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 1
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 1
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 1
- BUAUGQJXGNRTQE-AAEUAGOBSA-N Cys-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N BUAUGQJXGNRTQE-AAEUAGOBSA-N 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241001063191 Elops affinis Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 235000002756 Erythrina berteroana Nutrition 0.000 description 1
- 241000221207 Filobasidium Species 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- ROHVCXBMIAAASL-HJGDQZAQSA-N Gln-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)N)N)O ROHVCXBMIAAASL-HJGDQZAQSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- BETSEXMYBWCDAE-SZMVWBNQSA-N Gln-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BETSEXMYBWCDAE-SZMVWBNQSA-N 0.000 description 1
- WPJDPEOQUIXXOY-AVGNSLFASA-N Gln-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WPJDPEOQUIXXOY-AVGNSLFASA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- VUUOMYFPWDYETE-WDSKDSINSA-N Gly-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VUUOMYFPWDYETE-WDSKDSINSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- HZWWOGWOBQBETJ-CUJWVEQBSA-N His-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O HZWWOGWOBQBETJ-CUJWVEQBSA-N 0.000 description 1
- ZNTSGDNUITWTRA-WDSOQIARSA-N His-Trp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O ZNTSGDNUITWTRA-WDSOQIARSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- 101150062179 II gene Proteins 0.000 description 1
- WNQKUUQIVDDAFA-ZPFDUUQYSA-N Ile-Gln-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N WNQKUUQIVDDAFA-ZPFDUUQYSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- QQFSKBMCAKWHLG-UHFFFAOYSA-N Ile-Phe-Pro-Pro Chemical compound C1CCC(C(=O)N2C(CCC2)C(O)=O)N1C(=O)C(NC(=O)C(N)C(C)CC)CC1=CC=CC=C1 QQFSKBMCAKWHLG-UHFFFAOYSA-N 0.000 description 1
- RKQAYOWLSFLJEE-SVSWQMSJSA-N Ile-Thr-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N RKQAYOWLSFLJEE-SVSWQMSJSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- 108010029541 Laccase Proteins 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- 241000221479 Leucosporidium Species 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241000123318 Meripilus giganteus Species 0.000 description 1
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000205003 Methanothrix thermoacetophila Species 0.000 description 1
- 101710169105 Minor spike protein Proteins 0.000 description 1
- 101710081079 Minor spike protein H Proteins 0.000 description 1
- 241001661345 Moesziomyces antarcticus Species 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 101100189356 Mus musculus Papolb gene Proteins 0.000 description 1
- 231100000678 Mycotoxin Toxicity 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 101100070530 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) het-6 gene Proteins 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 1
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 1
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 1
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 1
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 1
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 1
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000554265 Sphaerias Species 0.000 description 1
- 241000228389 Sporidiobolus Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 241001136494 Talaromyces funiculosus Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- NRUPKQSXTJNQGD-XGEHTFHBSA-N Thr-Cys-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NRUPKQSXTJNQGD-XGEHTFHBSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 1
- YOPQYBJJNSIQGZ-JNPHEJMOSA-N Thr-Tyr-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 YOPQYBJJNSIQGZ-JNPHEJMOSA-N 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241000223260 Trichoderma harzianum Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- PKZIWSHDJYIPRH-JBACZVJFSA-N Trp-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKZIWSHDJYIPRH-JBACZVJFSA-N 0.000 description 1
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 1
- SMLCYZYQFRTLCO-UWJYBYFXSA-N Tyr-Cys-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O SMLCYZYQFRTLCO-UWJYBYFXSA-N 0.000 description 1
- OLWFDNLLBWQWCP-STQMWFEESA-N Tyr-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OLWFDNLLBWQWCP-STQMWFEESA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241001672648 Vieira Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000005409 aflatoxin Substances 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- CNZIQHGDUXRUJS-DQYPLSBCSA-N alpha-cyclopiazonic acid Natural products CC(O)=C1C(=O)[C@@H]2[C@@H]3[C@@H](Cc4cccc5[nH]cc3c45)C(C)(C)N2C1=O CNZIQHGDUXRUJS-DQYPLSBCSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960004050 aminobenzoic acid Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- 244000062766 autotrophic organism Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 1
- ZKSIPEYIAHUPNM-ZEQRLZLVSA-N butobendine Chemical compound C([C@H](CC)N(C)CCN(C)[C@@H](CC)COC(=O)C=1C=C(OC)C(OC)=C(OC)C=1)OC(=O)C1=CC(OC)=C(OC)C(OC)=C1 ZKSIPEYIAHUPNM-ZEQRLZLVSA-N 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 231100000481 chemical toxicant Toxicity 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000024835 cytogamy Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- FYGDTMLNYKFZSV-MRCIVHHJSA-N dextrin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)OC1O[C@@H]1[C@@H](CO)OC(O[C@@H]2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-MRCIVHHJSA-N 0.000 description 1
- 230000002478 diastatic effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 210000003783 haploid cell Anatomy 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- YQYJSBFKSSDGFO-FWAVGLHBSA-N hygromycin A Chemical compound O[C@H]1[C@H](O)[C@H](C(=O)C)O[C@@H]1Oc1ccc(\C=C(/C)C(=O)N[C@@H]2[C@@H]([C@H]3OCO[C@H]3[C@@H](O)[C@@H]2O)O)cc1O YQYJSBFKSSDGFO-FWAVGLHBSA-N 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 230000036737 immune function Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- BEJNERDRQOWKJM-UHFFFAOYSA-N kojic acid Chemical compound OCC1=CC(=O)C(O)=CO1 BEJNERDRQOWKJM-UHFFFAOYSA-N 0.000 description 1
- 229960004705 kojic acid Drugs 0.000 description 1
- WZNJWVWKTVETCG-UHFFFAOYSA-N kojic acid Natural products OC(=O)C(N)CN1C=CC(=O)C(O)=C1 WZNJWVWKTVETCG-UHFFFAOYSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 239000002636 mycotoxin Substances 0.000 description 1
- 235000006180 nutrition needs Nutrition 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- KYOBSHFOBAOFBF-XVFCMESISA-N orotidine 5'-phosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1C(O)=O KYOBSHFOBAOFBF-XVFCMESISA-N 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 101150115781 prtT gene Proteins 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 108010091078 rigin Proteins 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 235000000053 special nutrition Nutrition 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 229910021654 trace metal Inorganic materials 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Landscapes
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及在异核体真菌或真菌宿主细胞中产生单克隆抗体的方法。另外,还涉及包含编码抗体轻链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的核酸构建体、含有编码抗体重链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的核酸构建体、含有编码抗体轻链的第一核酸序列和编码纤维素结合结构域的第二核酸序列的核酸构建体,以及含有编码抗体重链的第一核酸序列和编码纤维素结合结构域的第二核酸序列的核酸构建体。
Description
技术领域
本发明涉及在异核体真菌或在真菌宿主细胞中产生单克隆抗体的方法。
背景技术
单克隆抗体传统上在哺乳动物细胞、转基因动物或植物中表达。然而,与广泛用于工业规模产生不同多肽的例如细菌或真菌细胞相比,这些体系不太适合用于工业规模产生。
US 5,643,745公开了能够产生含有至少两个亚基的异源二聚体的异形核丝状真菌宿主。
US 6,331,415公开了产生至少含有免疫球蛋白重链和轻链可变区的免疫球蛋白或有免疫功能的免疫球蛋白片段的方法。
WO 03/089614公开了在丝状真菌宿主细胞中产生单克隆抗体的方法。
发明概述
本发明提供了产生单克隆抗体的方法,其包括:
a)提供包含第一细胞核和第二细胞核的异核体真菌,其中所述第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且其中所述第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体,且其中至少一个所述核酸构建体还包含编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列;
b)在适于表达抗体轻链和重链的条件下培养异核体真菌。
本发明还涉及产生单克隆抗体的方法,其包括:
a)提供包含第一细胞核和第二细胞核的异核体真菌,其中所述第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且其中所述第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体,且其中至少一个所述核酸构建体还包含编码与第一核酸序列异源的信号肽的第三核酸序列;
b)在适于表达抗体轻链和重链的条件下培养异核体真菌。
另外,本发明还涉及包含编码抗体轻链或重链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的核酸构建体。
本发明还涉及包含编码抗体轻链或重链的第一核酸序列和编码纤维素结合结构域的第二核酸序列的核酸构建体。
另外,本发明还涉及异核体真菌宿主细胞。
附图简述
图1显示在杂交瘤细胞(Hy)和米曲霉(Aspergillus oryzae)异核体(As)中表达的轻链、重链和轻链+重链的三个Western印迹结果。第一块凝胶显示轻链在杂交瘤细胞和米曲霉异核体中的表达(实施例13),第二块凝胶显示重链在杂交瘤细胞和米曲霉异核体中的表达(实施例12),第三块凝胶显示轻链和重链两者在杂交瘤细胞和米曲霉异核体中的表达(实施例14)。每块胶的第一泳道为用于评估Hy和As泳道中存在的蛋白质大小的标准蛋白质标记物。转化体(As)观察到的条带鉴定为重链(50、53和55kD,可能为乙二醇形式不同)和轻链(25kD)。
图2显示米曲霉异核体(实施例14中描述)表达的IgG1抗体量的时间函数。抗体量通过对抗原的结合测量并以相对于米曲霉异核体培养168小时后的表达量显示。
图3显示米曲霉异核体(As)表达的轻链、重链和轻链+重链的三个Western印迹结果。从左至右第一块凝胶显示米曲霉异核体表达的重链(实施例23),第二块凝胶显示米曲霉异核体表达的重链和轻链(实施例23)且第三块凝胶显示米曲霉异核体表达的轻链(实施例23)。每块胶的第一泳道为用于评估蛋白质大小的标准蛋白质标记物,第二泳道为发酵液,第三泳道显示用MepHyperCel纯化后的发酵液且第四泳道显示在A蛋白柱上纯化过的发酵液。
定义
本发明上下文中的术语“异源的”应理解为来自不同起源,即来自遗传上不同的细胞。因此术语“异源表达”是指在宿主细胞中表达多肽,其中所述多肽并非由宿主细胞天然表达。术语“与第一核酸序列异源的第三核酸序列”应理解为第三和第一核酸序列来自不同的来源,其中“来源”可指基因或细胞。因此例如第三和第一核酸序列可来自同一细胞的不同基因或其可来自遗传上不同的细胞/物种的类似基因。
本发明上下文中的术语“同源的”应理解为来自相同来源,即来自遗传上相同的细胞。因此术语“同源表达”是指多肽在宿主细胞中的表达,其中所述多肽天然由宿主细胞表达。
本发明上下文中的术语“二硫键”应理解为多肽中两个半胱氨酸残基硫原子间的共价键。
本发明上下文中的术语“纤维素结合结构域”(CBD)应理解为优先与多或寡糖(碳水化合物)结合,时常但不必须专一与其水溶性形式(包括晶体)结合的多肽。
CBD通常来自纤维素分解酶,即能够水解纤维素的酶。已发现CBD为一个完整的多肽部分,如果其为纤维素分解酶则还包含含有底物水解活性位点的催化结构域。这样的酶可包含多于一个催化结构域以及一个、两个或三个CBD,并任选地还包含一个或多个连接CBD和催化结构域的多肽氨基酸序列区域,后一类型的区域通常被称为“连接子”。CBD可位于多肽的N或C末端或内部位置。构成CBD的多肽部分本质上通常由多于大约30个且少于大约250个氨基酸残基组成。具体而言,本发明CBD可是带有SEQ ID NO:50所示氨基酸序列或与SEQ ID NO:50氨基酸序列有至少60%(例如至少70或80%)同源性的氨基酸序列的CBD。
就本发明而言,使用可用于蛋白质和DNA比对的全Smith-Waterman比对法进行序列比对和计算同源性分值。蛋白质和DNA比对分别使用默认评分矩阵BLOSUM50和同一性矩阵。缺口中第一个残基的罚分对蛋白质为12,DNA为16,而缺口中其他残基的罚分对蛋白质为2,DNA为4。使用FASTA软件包v20u6版本(W R.Pearson和D.J.Lipman(1988),″Improved Tools for Biological Sequence Analysis″,PNAS 85:2444-2448和W.R.Pearson(1990)″Rapid and Sensitive Sequence Comparison withFASTP and FASTA″,Methods in Enzymology,183:63-98)进行比对。蛋白质序列的多重比对可使用“ClustalW”(Thompson、J.D.,Higgins、D.G和Gibson、T.J.(1994)CLUSTAL W:improving the sensitivity of progressivemultiple sequence alignment through sequence weighting,positions-specificgap penalties and weight matrix choice.Nucleic Acids Research,22:4673-4680)。DNA序列的多重比对可使用蛋白质比对作为模板进行,用相应的来自DNA序列的密码子代替氨基酸。
当在本发明上下文中与核酸序列或氨基酸序列相关使用时,术语“上游”应理解为物理地分别位于核酸或氨基酸序列任何给定点的按照5’->3’或N端->C端方向近端的一个或多个核苷酸或一个或多个氨基酸。
当在本发明上下文中与核酸序列或氨基酸序列相关使用时,术语“下游”应理解为物理地分别位于核酸或氨基酸序列任何给定点的按照5’->3’或N端->C端方向远端的一个或多个核苷酸或一个或多个氨基酸。
术语“蛋白质”或“多肽”在本发明中可互换使用。
发明详述
单克隆抗体
本发明涉及用于在异核体真菌中或真菌宿主细胞中产生单克隆抗体的方法。
生理学抗体是B细胞(浆细胞)暴露于抗原后产生的蛋白质,并且其具有在体外和体内与引起它们产生的抗原决定簇或表位或与同源抗原密切相关的抗原决定簇特异及选择性地反应的能力。
抗体的基本结构由两个不同的多肽链组成:轻链(大约25kDa)和重链(大约50-70kDa)。每个抗体由总共四条多肽链组成:两条轻链和两条重链。在任何一个抗体中,两条重链和两条轻链是相同的,且两条重链彼此通过二硫键连接且每条重链通过二硫键与一条轻链连接,这产生了抗体的特征性“Y”形状。一般性术语“免疫球蛋白”用于所有这样的蛋白质。已经识别五类不同的重链,即μ、δ、γ、α和ε链,这些链还定义抗体的类别,即分别为免疫球蛋白M(IgM)、免疫球蛋白D(IgD)、免疫球蛋白G(IgG)、免疫球蛋白A(IgA)和免疫球蛋白E(IgE)。另外,这五类里还存在亚类,例如在人中识别了γ型的四种不同亚类,即γ1、γ2、γ3和γ4,其产生IgG1、IgG2、IgG3和IgG4。对于轻链,识别了两种不同型的链;λ和κ链。
重链和轻链都被分成不同的结构域。M链从N末端起包含可变区(VH)、第一、第二、第三和第四恒定区(CH1、2、3、4),δ链从N末端起包含可变区(VH)、第一恒定区(CH1)、铰链区、第二和第三恒定区(CH2、3)、γ重链从N末端起包含可变区(VH)、第一恒定区(CH1)、铰链区、第二和第三恒定区(CH2、3),α链从N末端起包含可变区(VH)、铰链区、第二和第三恒定区(CH2、3),ε链从N末端起包含可变区(VH)、第一、第二、第三和第四恒定区(CH1、2、3、4)。
轻链包含可变区(VL)和恒定区(CL)。不同类的重链主要差别在于恒定区的数量、铰链区的存在或不存在和糖基化的类型和/或数量。然而,所有不同类的重链均包含可变区,其为能够结合或识别抗原的区域。
通常抗体分为两组;多克隆和单克隆抗体。多克隆抗体是能够结合相同抗原的不同(关于重链和/或轻链的类和/或亚类,和/或关于抗原决定簇结合序列不同)抗体。单克隆抗体是相同(关于重链和轻链的类和亚类,和关于抗原决定簇结合序列相同)的抗体。在本文中术语“不同”和“相同”是指氨基酸序列。生理学的单克隆抗体由B淋巴细胞或浆细胞单克隆合成。产生的抗体分子的相同拷贝只包含一类重链和一型轻链。为了获得抗体同质群体,已开发了用于产生单克隆抗体的方法。例如Kohler和Millstein在1970年代中期通过将产抗体B淋巴细胞与突变的不分泌抗体的骨髓瘤细胞融合发展了B淋巴细胞杂交瘤。另外,抗体(如Fab片段或单链)可使用展示系统如噬菌体展示产生和改善(Rodi,D.等,2002.Quantitativeassessment of peptide sequence diversity in M13 combinatorial peptidephage display libraries.J Mol Biol 322,1039-1052)。
存在不同截短形式的抗体,其先前主要通过蛋白酶消化产生,但是目前其还可通过重组DNA技术产生。例如蛋白酶木瓜蛋白酶在铰链区二硫键N端侧切开IgG分子产生三个片段:两个Fab片段(抗体臂)和Fc片段,每Fab个片段由通过二硫键结合在轻链上的重链的可变区和第一恒定区组成,Fc片段由通过铰链区二硫键彼此结合的两条重链的第二和第三恒定区组成。
另一蛋白酶胃蛋白酶在铰链区二硫键C端侧切开IgG分子产生F(ab’)2片段和大量小段Fc片段。F(ab’)2片段由来自同一分子通过铰链区二硫键结合在一起的两个Fab片段组成。
另一抗体形式是所谓的单链抗体,其为由一个轻链和一个重链组成的抗体。
抗体分子的相似片段和其他片段可通过重组DNA技术产生。关于抗体的更多信息可见于例如Janeway CA和Travers P的《ImmunoBiology》,Current Biology Ltd./Garland Publishing Inc.,1994或《Cellular andMolecular Immunology》,Abbas AK,Lichtman AH,Pober JS,W.B.Saunders Publishing,2003。
核酸构建体
本发明的抗体由包含第一和第二核酸构建体的异核体真菌或真菌宿主细胞重组表达,所述第一和第二核酸构建分别含有编码抗体轻和重链的第一核酸序列,其中至少一个所述核酸构建体还包含编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列,和/或至少一个所述核酸构建体还包含编码与第一核酸序列异源的信号肽的第三核酸序列。
在本发明特定的实施方案中,第一核酸构建体包含编码轻链的第一核酸序列。在另一特定的实施方案中,第一核酸构建体可包含编码轻链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列。在另一特定的实施方案中,第一核酸构建体可包含编码轻链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列。在另一特定的实施方案中,第一核酸构建体可包含编码轻链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列。特别地,第一核酸构建体可进一步包含诱导型启动子,即第一和/或第二核酸序列的表达可位于诱导型启动子控制下。下文给出合适的启动子实例。特别地,启动子可从编码黑曲霉(Aspergillus niger)α-淀粉酶(I或II)的基因获得。
在本发明特定的实施方案中,第二核酸构建体包含编码重链的第一核酸序列。在另一特定的实施方案中,第二核酸构建体可包含编码重链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列。在另一特定的实施方案中,第二核酸构建体可包含编码重链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列。在另一特定的实施方案中,第二核酸构建体可包含编码重链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列。特别地,第二核酸构建体可进一步包含诱导型启动子,即第一和/或第二核酸序列的表达可位于诱导型启动子控制下。下文给出合适的启动子实例。特别地,启动子可从编码黑曲霉α-淀粉酶(I或II)的基因获得。
优选的第一、第二和第三核酸序列实例在下文描述且可预见它们的任何组合。
本发明还涉及包含编码轻链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的核酸构建体。在特定的实施方案中,所述信号肽可以是来自黑曲霉α-淀粉酶的信号肽(TAKA信号肽),即SEQ ID NO:26中描述的信号肽,或其可以是来自南极假丝酵母(Candida Antarctica)脂酶B基因信号肽,即SEQ ID NO:27中描述的信号肽,或来自酿酒酵母(Saccharomyces cerevisiae)交配因子α-1基因的信号肽,即SEQ ID NO:53中描述的信号肽。特别地,如果核酸构建体包含SEQ ID NO:27的信号肽,其还可包含来自南极假丝酵母的脂酶B基因前序列(SEQ ID NO:28)。在具体的实施方案中,核酸构建体还可包含编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列,例如纤维素结合结构域(CBD),具体可为SEQID NO:50所示的CBD或与SEQ ID NO:50 CBD序列有至少60%(例如70%或80%)同源性的CBD。
本发明还涉及包含编码重链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的核酸构建体。在具体的实施方案中,所述信号肽可以是来自黑曲霉TAKA淀粉酶基因的信号肽,即SEQ ID NO:26中描述的信号肽,或其可以是来自南极假丝酵母脂酶B基因信号肽,即SEQID NO:27中描述的信号肽,或来自酿酒酵母交配因子α-1基因的信号肽,即SEQ ID NO:53中描述的信号肽。特别地,如果核酸构建体包含SEQ IDNO:27的信号肽,其还可包括来自南极假丝酵母的脂酶B基因前序列(SEQID NO:28)。在具体的实施方案中,核酸构建体还可包含编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列,例如纤维素结合结构域,具体的其可为SEQ ID NO:50所示的CBD或与SEQ ID NO:50 CBD序列有至少60%(例如70%或80%)同源性的CBD。
本发明还涉及包含编码轻链的第一核酸序列和编码纤维素结合结构域的第二核酸序列的核酸构建体,纤维素结合结构域具体可为SEQ ID NO:50所示的CBD或与SEQ ID NO:50 CBD序列有至少60%(例如70%或80%)同源性的CBD。
本发明还涉及包含编码重链的第一核酸序列和编码纤维素结合结构域的第二核酸序列的核酸构建体,纤维素结合结构域具体可为SEQ ID NO:50所示的CBD或与SEQ ID NO:50 CBD序列有至少60%(例如70%或80%)同源性的CBD。
在下文中术语“核酸构建体”旨在包括第一和第二核酸构建体。
涉及核酸序列的术语“第一”、“第二”和“第三”无意限制所述序列的顺序。具体地,核酸构建体包含第一和第三核酸序列时,从5’端起的序列顺序可以是:5’-第三核酸序列、第一核酸序列。核酸构建体包含第一和第二核酸序列时,从5’端起的序列顺序可以是:5’-第二核酸序列、第一核酸序列或其可以是5’-第一核酸序列、第二核酸序列,即第二核酸序列可位于第一核酸序列上游。核酸构建体包含第一、第二和第三核酸序列时,从5’端起的序列顺序可以是:5’-第三核酸序列、第二核酸序列、第一核酸序列或其可以是5’-第三核酸序列、第一核酸序列、第二核酸序列。
核酸构建体还可包含其他核酸序列,其与第一核酸序列编码的轻链或重链表达相关,和/或与由第二核酸序列编码的通常由真菌分泌的多肽或其功能性部分的表达相关。具体地,核酸构建体还可包含第一和/或第二核酸序列转录或所述转录物的翻译或稳定性或其他后续加工(例如第一或第二核酸序列编码的多肽分泌或激活)所必须或相关的核酸序列。这样的其他核酸序列实例包括但不仅限于启动子、前导序列、转录起始位点、转录终止位点、多腺苷酸化序列、前肽序列或信号序列(如果核酸构建体不包含第三核酸序列,即编码可与第一核酸序列同源或异源的信号肽的核酸序列)。这些其他核酸序列应具体地与第一和/或第二核酸序列“有效连接”,其中术语“有效连接”是指排列另外的核酸序列使其按照它们计划的目的作用,例如转录由启动子起始并沿着编码多肽的第一和/或第二核酸序列进行。通常另外的核酸序列可具体最少包含启动子、转录和翻译终止信号。
启动子
启动子可以是在选择的异核体真菌或真菌宿主细胞中显示转录活性并可来自编码与所述异核体或宿主细胞同源或异源的蛋白质的基因的任何核苷酸序列。
在具体的实施方案中,启动子可以是所谓的诱导型启动子,即其功能由刺激物的存在或不存在(例如外界化合物的存在或不存在)决定的启动子。诱导型启动子的实例为本领域技术人员熟知。
适合用于异核体丝状真菌或丝状真菌宿主细胞的启动子实例包括但不局限于从编码米曲霉TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶(I或II)、黑曲霉酸性稳定α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米赫根毛霉脂酶、米曲霉碱性蛋白酶、米曲霉磷酸甘油醛异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶、尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶及其杂种的基因获得的启动子。
适合用于酵母异核体或酵母宿主细胞的启动子实例包括但不仅限于来自酵母糖酵解基因(Hitzeman等,J.Biol.Chem.255(1980),12073-12080页;Alber和Kawasaki,J.Mol.Appl.Gen.1(1982),419-434页)或醇脱氢酶基因(Young等,《Genetic Engineering of Microorganisms for Chemicals》(Hollaender等编辑),Plenum Press,New York,1982)的启动子或TPI1(US4,599,311)或ADH2-4c(Russell等,Nature 304(1983),652-654页)启动子。
其他在酵母中有用的启动子可从酿酒酵母烯醇化酶(ENO-1)基因、酿酒酵母半乳糖激酶基因(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶基因(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶基因中获得。其他在酵母中有用的启动子由Romanos等,1992,Yeast 8:423-488页描述。
其他在酵母中有用的启动子可从巴斯德毕赤酵母(Pichia pastoris)醇氧化酶(AOX1)基因、巴斯德毕赤酵母3-磷酸甘油醛脱氢酶(GAP)基因和巴斯德毕赤酵母谷胱甘肽依赖的甲醛脱氢酶(FLD1)基因中获得(Cereghino等,FEMS Microbiology Reviews 24(2000),45-46页)。
转录终止位点
转录终止子序列是被细胞识别以终止转录的序列。终止子序列有效连接在编码待表达多肽的核酸序列(本发明情况下为第一和/或第二核酸序列)下游。
具体在丝状真菌(异核体和/或宿主细胞)中使用的合适的转录终止位点实例包括但不仅限于编码黑曲霉中性α-淀粉酶、米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉氨基苯甲酸盐合酶、黑曲霉α糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶的基因的转录终止位点。
具体在酵母(异核体和/或宿主细胞)中使用的合适的转录终止位点实例包括但不仅限于从酵母糖酵解基因(Hitzeman等,J.Biol.Chem.255(1980),12073-12080页;Alber和Kawasaki,J.Mol.Appl.Gen.1(1982),419-434页)或醇脱氢酶基因(Young等,《Genetic Engineering ofMicroorganisms for Chemicals》(Hollaender等编),Plenum Press,NewYork,1982)或TPI1(US 4,599,311)或ADH2-4c(Russell等,Nature 304(1983),652-654页)基因获得的那些。
其他有用的转录终止位点包括可从酿酒酵母烯醇化酶(ENO-1)基因、酿酒酵母半乳糖激酶基因(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶基因(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶基因中获得的那些。
其他有用的转录终止位点可包括但不仅限于从巴斯德毕赤酵母醇氧化酶(AOX1)基因、巴斯德毕赤酵母3-磷酸甘油醛脱氢酶(GAP)基因和巴斯德毕赤酵母谷胱甘肽依赖的甲醛脱氢酶(FLD1)基因中获得的那些(Cereghino等,FEMS Microbiology Reviews 24(2000),45-46页)。
前导序列
前导序列是mRNA的非翻译区,其对细胞翻译是重要的。前导序列有效连接在编码待表达多肽的核酸序列(本发明情况下为第一和/或第二核酸序列)上游。
具体在丝状真菌(异核体和/或宿主细胞)中使用的合适的前导序列实例包括但不仅限于编码米曲霉TAKA淀粉酶和米曲霉磷酸甘油醛异构酶(TPI)的基因的前导序列及其组合。
具体在酵母(异核体和/或宿主细胞)中使用的合适的前导序列实例包括从酵母糖酵解基因(Hitzeman等,J.Biol.Chem.255(1980),12073-12080页;Alber和Kawasaki,J.Mol.Appl.Gen.1(1982),419-434页)或醇脱氢酶基因(Young等,《Genetic Engineering of Microorganisms for Chemicals》(Hollaender等编辑),Plenum Press,New York,1982)或TPI1(US4,599,311)或ADH2-4c(Russell等,Nature 304(1983),652-654页)基因获得的那些。
其他具体在酵母(异核体和/或宿主细胞)中有用的前导序列可从酿酒酵母烯醇化酶(ENO-1)基因、酿酒酵母半乳糖激酶基因(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶基因(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶基因中获得。
其他具体在酵母(异核体和/或宿主细胞)中有用的前导序列可以是从巴斯德毕赤酵母醇氧化酶(AOX1)基因、巴斯德毕赤酵母3-磷酸甘油醛脱氢酶(GAP)基因和巴斯德毕赤酵母谷胱甘肽依赖的甲醛脱氢酶(FLD1)基因中获得的那些(Cereghino等,FEMS Microbiology Reviews 24(2000),45-46页)。
多腺苷酸化序列
多腺苷酸化序列是转录后被细胞识别为向转录的mRNA添加多聚腺苷信号的序列。多腺苷酸化序列有效连接在编码待表达多肽的核酸序列(本发明情况下为第一和/或第二核酸序列)上游。
具体在丝状真菌(异核体和/或宿主细胞)中使用的合适的多腺苷酸化序列实例包括但不仅限于编码米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉氨基苯甲酸盐合酶和黑曲霉α-糖苷酶的基因的多腺苷酸化序列。
具体在酵母(异核体和/或宿主细胞)中使用的合适的多腺苷酸化序列实例包括但不仅限于从酵母糖酵解基因(Hitzeman等,J.Biol.Chem.255(1980),12073-12080页;Alber和Kawasaki,J.Mol.Appl.Gen.1(1982),419-434页)或醇脱氢酶基因(Young等,Genetic Engineering ofMicroorganisms for Chemicals(Hollaender等编辑),Plenum Press,NewYork,1982)或TPI1(US 4,599,311)或ADH2-4c(Russell等,Nature 304(1983),652-654页)基因中获得的那些。
其他具体在酵母(异核体和/或宿主细胞)中有用的多腺苷酸化序列可以是从酿酒酵母烯醇化酶(ENO-1)基因、酿酒酵母半乳糖激酶基因(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶基因(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶基因中获得的那些。
其他具体在酵母(异核体和/或宿主细胞)中有用的多腺苷酸化序列包括但不仅限于从巴斯德毕赤酵母醇氧化酶(AOX1)基因、巴斯德毕赤酵母3-磷酸甘油醛脱氢酶(GAP)基因和巴斯德毕赤酵母谷胱甘肽依赖的甲醛脱氢酶(FLD1)基因中获得的那些(Cereghino等,FEMS MicrobiologyReviews 24(2000),45-46页)。
前肽序列
前肽序列(前肽编码序列)是编码位于多肽氨基端氨基酸序列(例如在本发明中由第一和/或第二核酸序列编码的多肽)的核酸序列。产生的多肽称为前酶或前多肽(或一些情况下称酶原)。前多肽通常是无活性的,并可通过催化或自身催化从前多肽中切除前肽而转化为成熟的活性多肽。
合适的前肽序列实例包括但不仅限于编码枯草杆菌(Bacillus subtilis)碱性蛋白酶(aprE)、枯草杆菌中性蛋白酶(nprT)、酿酒酵母交配因子α-1(SEQ ID NO:54)、南极假丝酵母脂酶B(SEQ ID NO:28)、疏棉状嗜热丝孢菌(Thermomyces lanuginosus)脂酶或Myceliophthorathermophilum漆酶(WO 95/33836)的基因。具体地,如果核酸构建体包含编码来自南极假丝酵母脂酶B(SEQ ID NO:27)的信号肽,所述构建体还可包含来自相同基因的前序列(SEQ ID NO:28)。
第一和/或第二核酸构建体还可包含可选择性标记物,例如其产物弥补宿主细胞缺陷的基因,或编码对例如抗生素(氨苄青霉素、卡那霉素、氯霉素、红霉素、四环素、壮观霉素、新霉素、潮霉素、氨甲喋呤)有抗性或对重金属、病毒或除草剂有抗性的基因,或产生原养型或营养缺陷型的基因。合适的用于丝状真菌(异核体和/或宿主细胞)的选择性标记物可选自包括但不局限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、trpC(氨基苯甲酸合酶)和glufosinate抗性标记物,以及来自其他物种的等价物。具体地,amdS用于曲霉细胞(异核体和/或宿主细胞),pyrG标记物用于构巢曲霉或米曲霉,bar标记物用于吸水链霉菌(Streptomyceshygroscopicus)。另外,如WO 91/17243中所述,选择可通过共转化实现,其中选择性标记物位于独立的载体上。
适用于酵母(异核体和/或宿主细胞)中的选择性标记物实例包括但不仅限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。
如下所述,在特定的实施方案中,异核体真菌通过将至少两个不同的真菌菌株融合获得,其中每个菌株的基因组具有使得该菌株的存活依赖于另一菌株基因组存在的特性。因此异核体真菌的第一和/或第二核酸构建体可包含如上所述的选择性标记物。如上所述,也可通过用包含选择性标记物的另一核酸构建体共转化菌株之一或二者来获得所述特性。
信号肽(由也称为前导序列、前序列的信号序列编码)的目的是指导多肽的表达进入表达多肽的细胞的分泌途径。信号序列应按照正确的读码框与第一和/或第二核酸序列连接。信号序列通常位于编码多肽的核酸序列5’端。
用于产生核酸构建体的技术,例如包括作为核酸构建体一部分的不同核酸序列的连接、用限制性酶酶切、扩增等为本领域技术人员熟知,并可见于例如《Molecular cloning:A laboratory manual》,Sambrook等(1989),Cold Spring Harbor lab.,Cold Spring Harbor,NY;Ausubel,F.M.等编;《Current protocols in Molecular Biology》,John Wiley and Sons,(1995);Harwood,C.R.和Cutting,S.M.编;《Molecular Biological Methods forBacillus》,John Wiley and Sons,(1990);《DNA Cloning:A PracticalApproach,Volumes I and II》,D.N.Glover编(1985);《OligonucleotideSynthesis》,M.J.Gait编(1984);《Nucleic Acid Hybridization》,B.D.Hames& S.J.Higgins编(1985);《Transcription And Translation》,B.D.Hames &S.J.Higgins编(1984);《Animal Cell Culture》,R.I.Freshney编(1986);《Immobilized Cells And Enzymes》,IRL Press,(1986);《A PracticalGuide To Molecular Cloning》,B.Perbal,(1984).中。
本发明的异核体真菌和/或真菌宿主细胞可包含多于一个拷贝的本发明第一和/或第二核酸构建体以扩大第一核酸序列和一些实施方案中第二核酸序列的表达。特别地,第一和/或第二核酸构建体可被整合进异核体真菌或真菌宿主细胞基因组中。用于整合的方法为使用本领域熟知方法的本领域技术人员熟知。本发明核酸构建体还可包含编码一个或多个因子的一个或多个核酸序列,这些因子例如激活子(例如反式作用因子)、陪伴分子或加工蛋白酶,它们有利于轻和/或重链和/或通常由真菌表达的分泌多肽或其功能性片段的表达。任何在选择的异核体真菌或真菌宿主细胞中有功能的因子都可用于本发明。编码一个或多个这些因子的核酸序列可与第一和/或第二核酸序列串联。
第一核酸序列
第一核酸序列编码抗体的轻链或重链。包含在本发明具体异核体真菌或真菌宿主细胞中的第一核酸序列应编码能够结合和/或识别同一抗原的轻链和重链。
轻链可以是κ或λ链。轻链具体可以是κ链。重链可以是μ、δ、γ、α、或ε链,其具体可以是γ链。具体地,轻链可以是κ链且重链为γ链。
第一核酸序列可来自任何脊椎动物,具体可来自人细胞。
编码轻链的第一核酸序列和编码重链的第一核酸序列可来自不同的生物或细胞,或它们可来自相同的生物或细胞。具体地,编码轻链的第一核酸序列和编码重链的第一核酸序列可来自人细胞。
在特定的实施方案中,第一核酸序列可编码结合涉及病理学疾病或与之相关的抗原的轻链和重链。
第二核酸序列
本发明的第二核酸序列编码通常由真菌分泌的多肽或其功能性部分。许多蛋白质的三维结构可通常被分为不同的结构域,即蛋白质的空间区域。不同的结构域一般具有不同的功能,例如酶可具有与酶促反应自身相关的结构域和其他能够与其他蛋白质相互作用的结构域。通常可以重组表达结构域的氨基酸序列,以使该结构域的功能保留或仅轻微改变。因此,在本发明上下文中,术语“其功能性部分”应理解为通常由真菌分泌的多肽的氨基酸序列的一部分,当其为所述多肽的部分时具有相同的功能。在上下文中,术语“相同”是指功能被保留,例如当其是多肽一部分的时候与相同化合物结合,但是例如结合动力学可被改变。例如如果功能性部分是能够结合纤维素的结构域,除多肽剩余部分外该结构域自身的表达可产生能够结合纤维素的结构域,但是与该结构域作为多肽一部分时相比,例如涉及所述结合的动力学可被改变。
具体地,本发明的第二核酸序列可编码纤维素结合结构域。具体可为来自大型亚灰树花菌(Meripilus giganteus)的内切葡聚糖酶II的CBD,即SEQ ID NO:50所示序列,或可以是与SEQ ID NO:50所示序列有至少60%(例如70%或80%)同源性的CBD。
第三核酸序列
本发明的第三核酸序列编码与本发明第一核酸序列异源的信号肽。在本发明上下文中,信号肽应理解为通常出现在分泌蛋白和膜蛋白新合成形式N末端并与指导蛋白质进入真核细胞内质网(ER)相关的氨基酸序列。信号序列旨在理解为编码信号肽的核酸序列。蛋白质易位进入ER后,信号肽通常从蛋白质上切除。因此在本发明上下文中信号肽应理解为具有所述引导蛋白质或多肽进入ER功能的氨基酸序列。
在具体的实施方案中,第三核酸序列可来自丝状真菌例如曲霉例如米曲霉、泡盛曲霉、构巢曲霉、日本曲霉(A.japonicus)、海藻曲霉(A.phoenicis)或臭曲霉(A.foetidus)、镰孢例如F.wenenatum、尖镰孢(F.oxysporium)或禾本科镰孢(F.graminearum)、腐质霉(Humicola)如(H.insulens)或H.lanuginosa,青霉(Penicillium)、假丝酵母如南极假丝酵母、亚灰树花菌例如大型亚灰树花菌,或木霉(Trichoderma)如里氏木霉(T.reesei)或哈茨木霉(T.harzianum)。
第三核酸序列具体可以是SEQ ID NO:26描述的序列,即来自米曲霉α-淀粉酶的TAKA信号肽。
在另一具体的实施方案中,第三核酸序列可以是SEQ ID NO:27中描述的序列,即来自南极假丝酵母脂酶B的信号肽。
另一第三核酸序列的实例为来自酿酒酵母交配因子α-1的信号肽,即SEQ ID NO:53描述的信号肽。
异核体真菌
在本发明的一个实施方案中,单克隆抗体在异核体真菌中表达。在本发明的上下文中,“异核体”应理解为具有至少两个遗传上差异的细胞核的细胞。异核体来自两个或多个遗传上差异细胞的融合,其中所述细胞的细胞核不融合,产生包含两个或更多遗传上差异细胞核的细胞。
具体的异核体真菌可以是丝状异核体真菌或其可以是酵母异核体。异核体真菌可在两个或更多真菌间天然形成或可人工制造。当两个或更多遗传上差异的真菌融合时,每个独立细胞的细胞核在共同的细胞质中共存。选择异核体的一种方法是融合两个或更多遗传上差异的细胞,其每个细胞包含的基因组具有使每个细胞生存依赖于存在另一细胞的细胞核的特征。例如如果两个遗传上差异的细胞融合,其中每个细胞类型的生存依赖于特别的营养物且同时不依赖于另一细胞所依赖的营养物,则两种营养物的缺乏能够选择这样的细胞,其融合了来自每个可互相弥补的细胞的细胞核。
本发明的异核体丝状真菌可以具体包含对所有异核体相容性等位基因(当存在tol基因时除交配型等位基因外)纯合的细胞的细胞核。至少已经鉴定了十个染色体位点的异核体不相容性:het-c、het-d、het-e、het-i、het-5、het-6、het-7、het-8、het-9和het-10,并可能存在更多(见例如Perkins等,“Chromosomal Loci of Neurospora crassa”,Microbiological Reviews(1982)46:462-570,478页)。
异核体丝状真菌的形成可具体地通过菌丝或原生质体融合进行。
具体地,本发明的异核体丝状真菌可通过来自丝状真菌两个不同菌株的菌丝融合产生,其中菌株之一的第一细胞核包含的基因组的特征使真菌在用于融合形成异核体的条件下的存活依赖于存在另一真菌的第二细胞核,且反之亦然。因此丝状真菌的每个菌株的细胞核给予除非来自另一丝状真菌的细胞核也存在,否则含有该核的真菌在培养条件下不能存活的特性。可用于使丝状真菌菌株互相依赖的特性实例包括但不仅限于:营养需求、对毒性化合物的抗性和对极端环境条件的抗性。例如如果要求特定营养物存在的一个菌株在缺乏所述营养物的培养基上与其存活不要求所述营养物的另一菌株共同培养,另一菌株的细胞核将给予两个菌株融合物在甚至没有特定营养物时存活的能力(这种情况下第二菌株和第一和第二菌株间的融合物将存活)。另外,如果第二个菌株类似地需要与第一个菌株所需要的营养物不同的特定营养物,则只有包含来自每个菌株细胞核的融合物能在缺乏两种所述营养物的培养基上存活。
用于形成异核体丝状真菌的方法描述于US 5,643,745和本发明实施例中。
可融合形成异核体丝状真菌的丝状真菌实例包括下文描述为丝状真菌宿主细胞的那些。具体而言,曲霉如米曲霉或黑曲霉、镰孢酶或木霉的不同菌株可用于形成异核体丝状真菌。通常多于两个的丝状真菌不同菌株可用于形成异核体,例如3或4或5或6或7或8或9或10个不同的菌株。具体的本发明异核体丝状真菌通过融合两个不同丝状真菌菌株形成。
使得每个(融合以形成异核体丝状真菌的)真菌菌株在用于融合的条件下存活依赖于另一真菌细胞核存在的特性的实例包括上述的选择性标记物。具体的所述特性可以是使得真菌为自养生物的特性。用于真菌不同菌株融合以形成异核体丝状真菌的培养基可以是不弥补真菌特定性质的任何培养基。由于常被用于选择重组体真菌,这样的培养基的实例为本领域技术人员所熟知。然而,不同真菌融合的情况下至少使用两个不同的特征/标记物进行选择。可使用的特征或标记物的实例包括上述可用于核酸构建体的选择性标记物。可以使真菌自养的基因实例包括但不仅限于:pyrG、hemA、niaD、tpi、facC、gala、biA、lysB、sC、methG和phenA。因此如果真菌对这些基因中至少一个是阴性的,则所述基因可用作选择性标记物。
构巢曲霉中由cphA基因编码的称为含富含半胱氨酸和组氨酸结构域的蛋白质(CHPA)已显示对构巢曲霉二倍期保持起重要作用。在本发明的一个实施方案中,cphA基因或其同源物可在第一或第二细胞核或两个细胞核中被修饰,从而不能表达功能性CHPA蛋白质。修饰可以是功能缺失突变,例如无效突变、无义或错义突变。
在另一实施方案中,异核体真菌为酵母异核体。在酵母中,异核体的形成描述为两个(或更多)单倍体细胞接合时核配(细胞核融合)缺陷的结果(Olson BL和Siliciano PG,2003,Yeast,20,893-903页)。待融合细胞之一kar1基因的突变描述为足够阻断交配中的核融合(Olson BL和Siliciano PG,Yeast,2003,20,893-903页)。因此在本发明具体的实施方案中,至少一个与本发明酵母异核体形成有关的细胞包含kar1基因的突变,例如功能缺失突变,如无效突变、无义或错义突变,从而所述细胞的细胞核在交配中不能与来自另一细胞的核融合。酵母中kar1基因的克隆描述于Rose MD和Fink GR,Cell,1987,48,1047-1060页。
本发明核酸构建体可具体在所述真菌融合成为异核体真菌前引入每个真菌。因此通过这种方法,异核体真菌将至少包含含有第一核酸构建体的第一细胞核和含有第二核酸构建体的第二细胞核。另外,如上所述第一和第二细胞核各自包含使真菌依赖于两个细胞核的特征。例如第一和/或第二细胞核可对至少一个选自包含但不仅限于pyrG、hemA、niaD、tpi、facC、gala、biA、lysB、sC、methG和phenA的基因是阴性的。具体的第一细胞核可以是pyrG阴性的而第二细胞核可以是hemA阴性的或反之亦然。然而可预见两个核的其他特征组合。
真菌转化的方法是众所周知的并且对于真菌宿主细胞可按如下所述进行。培养异核体真菌的条件与培养该异核体来源的真菌条件是相似的。然而如上所述异核体真菌必须在选择至少两个不同特征的培养基上培养。培养真菌的方法为本领域技术人员熟知并具体地可如下所进一步描述的进行。
本发明还涉及包含本发明核酸构建体的异核体真菌宿主细胞。
另外,本发明还涉及包含第一核和第二核的异核体真菌宿主细胞,其中所述第一核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且其中所述第二核包含含有编码抗体重链的第一核酸序列的第二核酸构建体,且其中至少一个所述核酸构建体还包含编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列。
另外,本发明还涉及包含第一细胞核和第二细胞核的异核体真菌宿主细胞,其中所述第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且其中所述第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体,且其中至少一个所述核酸构建体还包含编码与第一核酸序列异源的信号肽的第三核酸序列。第一核酸构建体、第二核酸构建体、第一核酸序列、第二核酸序列和第三核酸序列的优选的实施方案可如上所述。不同的组合可以预见,其中一些在下文描述。然而,本发明不仅限于这些组合。
具体地,第一细胞核包含含有编码抗体轻链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列的第一核酸构建体,且第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体。在另一实施方案中,第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且第二细胞核包含含有编码抗体重链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列的第二核酸构建体。还在另一实施方案中,第一细胞核包含含有编码抗体轻链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列的第一核酸构建体,且第二细胞核包含含有编码抗体重链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列的第二核酸构建体。具体的第二核酸序列可编码纤维素结合结构域。其具体可以是来自大型亚灰树花菌的内切葡聚糖酶II的CBD,即SEQ ID NO:50所述的序列,或其可以是与SEQ ID NO:50所示序列有至少60%(例如70%或80%)同源性的CBD。
在另一实施方案中,第一细胞核包含含有编码抗体轻链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的第一核酸构建体,且第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体。在另一实施方案中,第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且第二细胞核包含含有编码抗体重链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的第二核酸构建体。还在另一实施方案重,第一细胞核包含含有编码抗体轻链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的第一核酸构建体,且第二细胞核包含含有编码抗体重链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列的第二核酸构建体。还在另一实施方案中,第一细胞核包含含有编码抗体轻链的第一核酸序列和编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列的第一核酸构建体,且第二细胞核包含含有编码抗体重链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的第二核酸构建体。还在另一实施方案中,第一细胞核包含含有编码抗体轻链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的第一核酸构建体,且第二细胞核包含含有编码抗体重链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的第二核酸构建体。具体的第三核酸序列可以是SEQ IDNO:26中描述的序列,即来自米曲霉α-淀粉酶的TAKA信号肽,或SEQ IDNO:27中描述的序列,即来自南极假丝酵母脂酶B的信号肽,或来自酿酒酵母的交配因子α-1,即SEQ ID NO:53中描述的信号肽。第二核酸序列可具体编码纤维素结合结构域。其可以具体是来自大型亚灰树花菌的内切葡聚糖酶II的CBD,即SEQ ID NO:50所述的序列,或其可以是与SEQ ID NO:50所示序列有至少60%(例如70%或80%)同源性的CBD。
真菌
本发明的第二核酸序列来自真菌。此外,真菌可用作宿主细胞或用于产生异核体,其中后者在本发明中也用作宿主细胞。
因此下文中提到“真菌”旨在包括第二核酸序列可来自其中的真菌、本发明的真菌宿主细胞和可用于产生本发明异核体的真菌的实例。文中使用“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth等在《Ainsworth and Bisby’s Dictionary of The Fungi》第八版,1995,CABInternational,University Press,Cambridge,UK,中定义)以及卵菌门(Oomycota)(如在Hawksworth等,1995,《Ainsworth and Bisby’s Dictionaryof The Fungi》第八版,1995,CAB International,University Press,Cambridge,UK,171页中定义)和所有的有丝分裂孢子真菌(Hawksworth等,1995,同上)。代表性的子囊菌门包括例如脉孢霉属(Neurospora)、正青霉(Eupenicillium)(=青霉Penicillium),翘孢霉属(Emericella)(=曲霉)、散囊菌属(Eurotium)(=曲霉)和下文所列的真酵母。担子菌门的实例包括蘑菇、锈菌和黑粉菌。代表性的Chytridiomycota包括例如异水霉属(Allomyces)、Blastocladiella、雕蚀菌属(Coelomomyces)和水生真菌。代表性的卵菌门包括例如Saprolegniomycetous水生真菌(水霉菌)例如绵霉(Achlya)。有丝分裂孢子真菌的实例包括曲霉、青霉、假丝酵母和链格孢(Alternaria)属。代表性的接合菌包括例如根霉(Rhizopus)和毛霉(Mucor)。
在另一实施方案中,本发明的真菌为酵母细胞。文中使用“酵母”包括产子囊酵母(Endomycetales)、basidiosporogenous酵母和属于不完全真菌(Blastomycetes)的酵母。产子囊酵母可分为蚀精霉科(Spermophthoraceae)和酵母菌科(Saccharomycetaceae)。后者由四个亚科组成:裂殖酵母亚科(Schizosaccharomycoideae)(例如裂殖酵母属Schizosaccharomyces)、Nadsonioideae、Lipomycoidea和Saccharomycoideae(例如毕赤氏酵母属(Pichia)、克鲁维酵母属(kluyveromyces)和酵母属(saccharomyces))。Basidiosporogenous酵母包括白冬孢酵母属(Leucosporidim)、红冬孢酵母属(Rhodosporidium)、Sporidiobolus、Filobasidium和线黑粉菌属(Filobasidiella)。属于不完全真菌的酵母分为两科:掷孢酵母科(Sporobolomycetaceae)(例如掷孢酵母属(Sporobolomyces)和布勒弹孢酵母属(Bullera))和隐球酵母科(Cryptococcaceae)(例如假丝酵母属),由于酵母分类将来可能变化,就本发明而言,酵母应如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.和Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeries No.9,1980)中所述定义。酵母生物学和酵母遗传学的操作为本领域熟知(见例如《Biochemistry and Genetics of Yeast》,Bacil,M.,Horecker,B.J.和Stopani,A.O.M.编,第二版,1987;《The Yeasts》,Rose,A.H.和Harrison,J.S.编,第二版,1987;和《The Molecular Biology of the YeastSaccharomyces》,Strathern等编辑,1981).
在更具体的实施方案中,酵母可以是假丝酵母、克鲁维酵母(Kluyveromyces)、酵母、裂殖酵母、毕赤酵母或Yarrowia种的细胞。在最具体的实施方案中,酵母可以是卡尔酵母(saccharomycescarlsbergensis)、酿酒酵母、糖化酵母(saccharomyces diastaticus)、Saccharomyces douglasii、克鲁弗酵母(saccharomyces kluyveri)、诺地酵母(saccharomyces norbensis)或卵形酵母(saccharomyces oviformis)细胞。在另一实施方案中,酵母可以是乳酸克鲁维酵母(kluyveromyceslactis)细胞。在另一实施方案中,酵母可以是解脂亚罗酵母(Yarrowialipolytica)细胞。
在另一具体的实施方案中,真菌为丝状真菌。丝状真菌的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的营养菌丝体。营养生长通过菌丝伸长且需氧碳分解代谢。
丝状真菌由下面子囊菌门之一代表:脉孢菌属、正青霉(=青霉)、Emericella、散囊菌属(=曲霉)。
在具体的实施方案中,丝状真菌可属于真菌门和卵菌门(如Hawksworth等在《Ainsworth and Bisby’s Dictionary of The Fungi》第八版,1995,CAB International,University Press,Cambridge,UK,中定义)亚门的丝状体形式之一。在更具体的实施方案中,丝状真菌可以是枝顶孢属(Acremonium)如A.chrysogenum,或曲霉如泡盛曲霉、臭曲霉、日本曲霉、A.aculeatus、黑曲霉或米曲霉,或镰孢霉如section Discolor(也已知为section Fusarium)的镰孢霉,如杆孢状镰孢(F.bactridioides)、F.cerealis、F.crookwellense、大刀镰孢(F.culmorum)、禾本科镰孢(F.graminearum)(最佳命名为Gibberella zeae,先前为Sphaeria,与Gibberella roseum和Gibberella roseum f.sp.ceralis同物异名)、禾赤镰孢(F.graminum)、异孢镰孢(F.heterosporum)、合欢木镰孢(F.negundi)、多枝镰孢(F.reticulatum)、粉红镰孢(F.roseum)、接骨木镰孢(F.sambucinum)、肤色镰孢(F.sarcochroum)、硫色镰孢(F.sulphureum)、F.trichothecioides或者F.venenatum或section Elegans的镰孢霉菌株如尖镰孢,或腐质霉属(Humicola)如H.Insolens或H.lanuginose,或毛霉属如米黑毛霉(M.miehei),或毁丝霉属(Myceliophthora)如嗜热毁丝霉(M.thermophila),或脉孢霉属(Neurospora)如粗糙脉孢霉(N.crassa),或青霉属(Penicillium)如产紫青霉(P.purpurogenum)、P.chrysogenum或P.funiculosum(WO 00/68401),或梭孢壳属(Thielavia)如T.terrestris,或褶孢黑粉菌属(Tolypocladium)和木霉属如哈茨木霉、康宁木霉(T.koningii)、T.longibrachiatum、里氏木霉或绿色木霉(T.viride),或其有性型或同物异名细胞。
在本发明的另一具体的实施方案中,丝状真菌可以是蛋白酶缺陷或蛋白酶阴性的菌株。这可以是例如缺失碱性蛋白酶基因“alp”的蛋白酶缺陷菌株米曲霉JaL 125。该菌株描述于WO 97/35956(Novozymes)或EP专利no.429,490或TPAP免费宿主细胞中,具体是WO 96/14404中公开的黑曲霉菌株。此外,本发明特别考虑如WO 01/68864中描述的转录激活因子(prtT)产生减少的丝状真菌细胞,特别是黑曲霉或米曲霉。该丝状真菌也可以是不含毒素和/或真菌毒素的,例如不含环并偶氮酸、曲酸、3-硝基丙酸和/或黄曲霉毒素。这类菌株的实例在WO 00/39322(来自Novozymes A/S)中公开。
本发明还考虑到含有如下DNA构建体的丝状真菌(如WO 98/01470中所述),该构建体包含编码在调节丝状真菌α-淀粉酶启动子表达时显示活性的转录因子的DNA序列。
另一适当的丝状真菌实例为PA 2003 00169实施例1中描述的JaL355细胞。
通过涉及形成原生质体、转化原生质体和重建细胞壁的方法以本身已知的方式转化丝状真菌。适用于转化曲霉宿主细胞的方法在EP 238 023、EP 184,438和Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474页中描述。适用于转化镰孢霉物种的方法由Malardier等,1989,Gene 78:147-156页或在共同未决的US Serial No.08/269,449中描述。
培养真菌
培养适合在其中表达蛋白质的真菌的条件为本领域技术人员所熟知;见例如Spohr等(1998),Journal of fermentation and bioengineering,86,(1),49-56页。
为了重组表达蛋白质,编码所述蛋白质的核酸序列可特别位于诱导型启动子控制下。具体而言,如果所述蛋白质的表达位于诱导型启动子控制下,真菌的培养可分两步进行;首先i)在启动子不被诱导的条件下(非诱导条件)培养真菌,且随后ii)在启动子被诱导的条件下(诱导条件)培养真菌。在这样的两步中培养真菌的优点在于在第一步中(i)能量源主要用于真菌的生长,而在第二步中(ii)能量源主要用于重组体蛋白质的产生。第一步(非诱导条件)也称为批量阶段(batch phase)而第二步(诱导条件)也称为补料阶段(feed phase)。在补料阶段中,称为补料的培养基通常连续地加入培养物中。可使用不同的参数确定批量阶段的结束和补料阶段的开始,例如pH的改变或在实施例中所述的通过搅拌速度。通常随着真菌生长,发酵培养基中溶解的氧张力降低,并且为了对此补偿(例如使其再次提高),经常提高搅拌的速度。因此搅拌速度可用作真菌生长的间接参数并由此作为何时从批量阶段转化为补料阶段的参数。
具体地,用于诱导启动子的化合物也可以是酵母用作碳源的化合物,例如实施例中描述的麦芽糖。然而,其他启动子诱导体系是熟知的并可用于本发明。例如,如果用作诱导剂的化合物不被真菌代谢,诱导剂的数量和补料速率应该最佳化至不互相依赖。
本发明的发明者发现在补料阶段缓慢并持续降低温度提高了由异核体丝状真菌表达的抗体量。因此,在本发明优选的实施方案中,培养本发明异核体真菌和/或真菌宿主细胞可如上所述以两步进行:非诱导阶段(批量阶段)跟着是诱导阶段(补料阶段),其中温度在诱导阶段降低。
一般的,批量阶段的温度在28-45℃之间,例如28-40℃之间,或28-38℃之间,或28-36℃之间,或28-34℃之间,或28-32℃之间,或30-40℃之间,或30-38℃之间,或30-36℃之间,或30-34℃之间,或30-32℃之间。
补料阶段中,温度具体的可降低至16-30℃之间,例如16-28℃之间,或18-28℃之间,或20-28℃之间,或22-28℃之间,或24-28℃之间,或24-26℃之间,例如大约24、24、26、27或28℃。在优选的实施方案中,补料阶段的温度缓慢降低,例如温度可在对应于至少补料阶段1/10,例如1/5或1/4或1/3或1/2或3/4补料阶段时间段内缓慢降低,或温度可在整个补料阶段内降低。在所述时间段内,温度可持续或分段降低。
具体的如果真菌是丝状真菌,批量阶段通常可持续10-30小时之间,例如12-24小时之间,或12-20小时之间,或12-18小时之间,或12-16小时或14-24小时之间,或14-20小时之间,或14-18小时之间,或14-16小时。补料阶段通常持续大于50小时,例如大于100小时,例如50-500小时之间,或50-250小时之间,或50-200小时之间,或50-150小时之间,或100-250小时之间,或100-200小时。
然而,这依赖于发酵培养基的内容和/或丝状真菌的类型。
此外,在补料阶段添加到培养物的诱导剂的量和/或补料速率也可变化。
在真菌宿主细胞中产生单克隆抗体的方法
在另一实施方案中,本发明涉及产生单克隆抗体的方法,包括:
a)提供包含含有编码抗体轻链的第一核酸序列的第一核酸构建体和含有编码抗体重链的第一核酸序列的第二核酸构建体的真菌宿主细胞,其中所述核酸构建体之一还包含编码通常由真菌表达的分泌的多肽或其功能性部分的第二核酸序列;
b)在适于表达抗体轻链和重链的条件下培养真菌宿主细胞。
具体的真菌宿主细胞可以是丝状真菌宿主细胞或酵母宿主细胞,例如上述那些之一。
此外,至少一个所述核酸构建体还可以包含编码信号肽的第三核酸序列,其中所述信号肽与所述核酸构建体的第一核酸序列异源。具体的信号肽可以是上述的那些之一,例如其可以来自米曲霉α-淀粉酶基因(SEQ IDNO:26)或来自南极假丝酵母脂酶基因(SEQ ID NO:27)或来自酿酒酵母交配因子α-1基因,即SEQ ID NO:53中描述的信号肽。
具体而言,如果核酸构建体包含SEQ ID NO:27的信号肽,其还可包含南极假丝酵母脂酶B基因的前序列(SEQ ID NO:28)。
此外,本发明还涉及包括包括如下步骤的产生单克隆抗体的方法:
a)提供包含含有编码抗体轻链的核酸序列的第一核酸构建体和含有编码抗体重链的核酸序列的第二核酸构建体的真菌宿主细胞,其中至少一个所述核酸构建体还包含编码与第一核酸序列异源的信号肽的第三核酸序列;
b)在适于表达抗体轻链和重链的条件下培养异真菌宿主细胞。
具体的真菌宿主细胞可以是丝状真菌宿主细胞或酵母宿主细胞,例如上述那些之一。
第一核酸构建体、第二核酸构建体、第一核酸序列、第二核酸序列和第三核酸序列优选的实施方案可如上所述。
本发明还涉及包含本发明核酸构建体的真菌宿主细胞。
本发明还涉及包含含有编码抗体轻链的第一核酸序列的第一核酸构建体和含有编码抗体重链的第一核酸序列的第二核酸构建体的真菌宿主细胞,其中所述核酸构建体之一还包含编码通常由真菌表达的分泌的多肽或其功能性部分的第二核酸序列。
此外,本发明还涉及包含含有编码抗体轻链的第一核酸序列的第一核酸构建体和含有编码抗体重链的第一核酸序列的第二核酸构建体的真菌宿主细胞,其中至少一个所述核酸构建体还包含编码与第一核酸序列异源的信号肽的第三核酸序列。第一和第二核酸构建体,第一、第二和第三核酸序列的优选的实施方案可如上所述。
材料和方法
材料
菌株
米曲霉IFO4177:可得自发酵研究所,Osaka;17-25Juso Hammachi2-Chome Yodogawa-Ku,Osaka,Japan。
BECh2描述于WO 00/39322实施例1,其还指WO 98/12300,实施例1中描述的JaL228。
JaL355在实施例10中描述。
ICA133在实施例10中描述。
ToC1512在实施例11中描述。
基因
pyrG:该基因编码乳清苷-5’-磷酸脱羧酶——尿嘧啶核苷生物合成相关的酶。
HemA:该基因编码δ-氨基酮戊酸合酶——血红素生物合成相关的酶。
质粒
pUC19:该构建体在Vieira等,1982,Gene 19:259-268中描述。
pIC19R:在Alting-Mees MA和Short JM,1989,Nucleic Acids Res,17:
9494中描述。
pTAKA-17在EP0238023中描述。
pMT1303在Uppenberg等,1994.Structure 2:293-308中描述。
pA2C315该质粒以no.DSM971保藏在DSM中。该质粒包含来自大型亚灰树花菌编码内切葡聚糖酶II基因的cDNA克隆。
pJaL676在WO 03/008575,实施例5中描述。
pJaL721在WO 03/008575,实施例17中描述。
pJaL790在实施例1中描述。
pJaL173在专利WO 98/12300,实施例1中描述。
pJaL335在专利WO 98/12300,实施例1中描述。
pDV8在专利WO 01/68864,实施例8中描述。
pJaL554在专利WO 01/68864,实施例8中描述。
pToC381在实施例11中描述。
pToC465在实施例11中描述。
pToC466在实施例11中描述。
pICA128在实施例10中描述。
引物
引物H-N(SEQ ID NO:3)
引物H-C(SEQ ID NO:4)
引物L-N(SEQ ID NO:5)
引物L-C(SEQ ID NO:6)
引物C315-N(SEQ ID NO:7)
引物C315-H-1(SEQ ID NO:8)
引物C315-H-2(SEQ ID NO:9)
引物C315-L-3(SEQ ID NO:11)
引物C315-L-4(SEQ ID NO:12)
引物CalipB-N(SEQ ID NO:14)
引物CalipB-H-1(SEQ ID NO:15)
引物CalipB-L-1(SEQ ID NO:17)
引物CalipB-L-2(SEQ ID NO:18)
引物TAKA-17-N(SEQ ID NO:20)
引物TAKA-H(SEQ ID NO:21)
引物TAKA-L-1(SEQ ID NO:23)
引物TAKA-L-2(SEQ ID NO:24)
引物B6577F12(SEQ ID NO:29)
引物B6575F12(SEQ ID NO:30)
引物104025(SEQ ID NO:31)
引物104026(SEQ ID NO:32)
引物104027(SEQ ID NO:33)
引物104028(SEQ ID NO:34)
引物108089(SEQ ID NO:35)
引物108091(SEQ ID NO:36)
引物135944(SEQ ID NO:38)
引物B2340E06(SEQ ID NO:39)
引物B2340E07(SEQ ID NO:40)
引物B2340E08(SEQ ID NO:41)
引物B2340E09(SEQ ID NO:42)
引物101687(SEQ ID NO:44)
引物101688(SEQ ID NO:45)
引物101689(SEQ ID NO:46)
引物101690(SEQ ID NO:47)
引物101691(SEQ ID NO:48)
引物101692(SEQ ID NO:49)
引物K1796F02(SEQ ID NO:63)
引物K1796F03(SEQ ID NO:64)
引物K1796F04(SEQ ID NO:65)
引物K1796F05(SEQ ID NO:66)
引物K1795F08(SEQ ID NO:67)
引物K1796F06(SEQ ID NO:68)
引物K1796F07(SEQ ID NO:69)
引物K1796F08(SEQ ID NO:70)
引物K1796F09(SEQ ID NO:71)
引物K1795F09(SEQ ID NO:72)
方法
用于核苷酸PCR、克隆、连接等的一般方法为本领域技术人员熟知并可见于《Molecular cloning:A laboratory manual》,Sambrook等(1989),Cold Spring Harbor lab.,Cold Spring Harbor,NY;Ausubel,F.M.等编;《Current protocols in Molecular Biology》,John Wiley and Sons,(1995);Harwood,C.R.,and Cutting,S.M.编;《DNA Cloning:A PracticalApproach,Volumes I and II》,D.N.Glover编(1985);《OligonucleotideSynthesis》,M.J.Gait编(1984);《Nucleic Acid Hybridization》,B.D.Hames& S.J.Higgins编(1985);《A Practical Guide To Molecular Cloning》,B.Perbal,(1984)。
DNA杂交
简言之,所有的DNA杂交在65℃下标准杂交缓冲液(10x Denhart’s溶液、5x SSC、0.02M EDTA、1%SDS、0.15mg/ml聚腺苷酸RNA和0.05mg/ml酵母tRNA)中进行16小时。杂交后将滤膜在65℃、2x SSC、0.1%SDS中洗涤两次并暴光X光片。
PCR扩增
所有的PCR扩增在50mM KCl、10mM Tris-HCl pH8.0、1.5mMMgCl2的反应缓冲液中含有2.5单位Taq聚合酶、100ng pSO2、250nM各种dNTP和10pmol两种上述引物的100μl体积内进行。
扩增在Perkin-Elmer Cetus DNA Termal 480中进行,并由一个循环的94℃3分钟,随后25个循环的94℃1分钟、55℃30秒和72℃1分钟组成。
用于测定完整人IgG的ELISA
完整IgG用使用以山羊抗人IgG(Fc特异的)作为捕获抗体和缀合碱性磷酸酶的山羊抗人κ链作为检测抗体的ELISA测定。使用从人血浆中纯化的人骨髓瘤IgG1,κ作为标准。ELISA操作为标准流程。
实施例1
曲霉表达质粒pJaL790的构建
用如下方法构建曲霉表达质粒pJaL790:
通过用HindIII酶切去除载体pUC19中的单一HindIII限制性内切核酸酶位点,并用Klenow聚合酶和四种脱氧核糖核酸处理补平游离的突出末端并连接,产生pJaL720质粒。来自pJaL721的1140bp EcoRI-BamHI片段克隆进pJaL720中相应的位点,产生pJaL723。使用pJaL676作为模板和引物B6577F12(SEQ ID NO:29)和B6575F12(SEQ ID NO:30)通过PCR扩增537bp片段。将其用EcoRI消化,用Klenow聚合酶和四种脱氧核糖核酸处理补平游离的突出末端并将获得的524bp片段克隆进pJaL723的平末端HindIII位点,得到质粒pJaL728。通过用HindIII酶切去除载体pUC19中的单一HindIII限制性内切核酸酶位点,并用Klenow聚合酶和四种脱氧核糖核酸处理补平游离的突出末端并连接,产生pJaL784质粒。将来自pJaL784的1671bp EcoRI-BamHI片段连接进来自pJaL721的5735bp EcoRI-BamHI片段,产生pJaL790。
实施例2
天然IgG1重链曲霉表达质粒的构建
使用SEQ ID NO:1作为模板和正向引物H-N(SEQ ID NO:3)和反向引物H-C(SEQ ID NO:4),通过PCR扩增人IgG重链编码序列。引物H-N和HL-C向翻译起始密码子上游和翻译终止信号后分别引入BamHI和XhoI限制性位点用于克隆的目的。纯化1431bp的PCR产物并用限制性内切核酸酶BamHI和XhoI酶切。将产生的1419bp片段克隆进pJaL790中相应的位点以产生pNZ-3。测序来自克隆pNZ-3的DNA以验正其为正确的序列。
实施例3
天然κ轻链曲霉表达质粒的构建
使用SEQ ID NO:2作为模板和正向引物L-N(SEQ ID NO:5)和反向引物L-C(SEQ ID NO:6),通过PCR扩增人κ轻链编码序列。引物L-N和L-C向翻译起始密码子上游和翻译终止信号后分别引入BamHI和XhoI限制性位点用于克隆的目的。纯化732bp的PCR产物并用限制性内切核酸酶BamHI和XhoI酶切。产生的720bp片段克隆进pJaL790中相应的位点以产生pNZ-4。测序来自克隆pNZ-4的DNA以验正其为正确的序列。
实施例4
IgG1重链CBD融合物曲霉表达载体的构建
实施例2中使用的人IgG1重链和来自大型亚灰树花菌的内切葡聚糖酶II的纤维素结合结构域之间的融合通过使用序列重叠延伸(SOE)交换编码重链自身信号肽的DNA序列和编码具有其自身信号肽和以氨基酸KR结束的连接子的大型亚灰树花菌纤维素结合结构域(CBD)的DNA序列来构建。使用pA2C315作为模板和下面的引物对:正向引物C315-N(SEQ IDNO:7)和反向引物C315-H-1(SEQ ID NO:8),通过PCR扩增CBD。纯化产生的260bp PCR产物。引物C315-N向翻译起始密码子上游引入BamHI限制性位点用于克隆的目的。
使用pNZ-3作为模板和下面的引物对:正向引物C315-H-2(SEQ IDNO:9)和反向引物H-N(SEQ ID NO:3),通过PCR扩增重链。纯化产生的1379bp PCR产物。
混合上述两个PCR产物并使用下面的产生1602bp扩增片段的C315-N(SEQ ID NO:7)和H-N(SEQ ID NO:3)引物对进行标准SOEPCR。纯化1602bp片段并用BamHI和XhoI酶切。将产生的1590bp片段克隆进相应的pJaL790的限制性内切酶位点,产生称为pNZ-5的曲霉表达质粒。与重链融合的CBD的完整氨基酸序列在SEQ ID NO:10中给出。
实施例5
κ轻链CBD融合物曲霉表达载体的构建
实施例3中使用的人κ轻链和来自大型亚灰树花菌的内切葡聚糖酶II的纤维素结合结构域之间的融合通过使用序列重叠延伸(SOE)交换编码轻链自身信号肽的DNA序列和编码具有其自身信号肽和以氨基酸KR结束的连接子的大型亚灰树花菌纤维素结合结构域(CBD)的DNA序列来构建。
使用下列引物对:正向引物C315-N(SEQ ID NO:7)和反向引物C315-L-3(SEQ ID NO:11)在pA2C315上通过PCR扩增CBD。纯化产生的258bp PCR产物。引物C315-N向翻译起始密码子上游引入BamHI限制性位点用于克隆的目的。
使用下面引物对:C315-L-4(SEQ ID NO:12)和反向引物L-N(SEQID NO:5)从pNZ-4中通过PCR扩增轻链。纯化产生的671bp PCR产物。
混合上述两个PCR产物并使用下面的产生894bp扩增片段的C315-N和L-N引物对进行标准SOE PCR。纯化894bp片段并用BamHI和XhoI酶切。将产生的797bp片段克隆进相应的pJaL790的限制性内切酶位点,产生称为pNZ-6的曲霉表达质粒。与轻链融合的CBD的完整氨基酸序列在SEQ ID NO:13中给出。
实施例6
天然信号肽被来自南极假丝酵母脂酶B的前原(prepro)序列取代的IgG1重链曲霉表达质粒的构建
实施例2中使用的人IgG1重链信号肽序列通过序列重叠延伸(SOE)被来自南极假丝酵母脂酶B的前原序列取代。使用pMT1303作为模板和正向引物CalipB-N(SEQ ID NO:14)及反向引物CalipB-H-1(SEQ ID NO:15),通过PCR扩增前原区域。用BamHI和PvuII限制性内切核酸酶消化产生的105bp PCR产物并纯化92bp的片段。引物CalipB-N向翻译起始密码子上游引入BamHI限制性位点用于克隆的目的。用限制性酶PvuII和XhoI消化pNZ3并纯化编码重链的1345bp片段。
将上述92bp和1435bp的两个片段克隆进用限制性内切核酸酶BamHI和XhoI消化的pJaL790内,产生称为pNZ-7的曲霉表达质粒。与重链融合的异源信号的完整氨基酸序列在SEQ ID NO:16中给出。
实施例7
用假丝酵母脂酶B前原序列代替其天然信号的κ轻链曲霉表达质粒的构建
实施例3中使用的人κ轻链信号肽序列通过序列重叠延伸(SOE)与来自南极假丝酵母脂酶B的前原序列交换。使用pMT1303作为模板和正向引物CalipB-N(SEQ ID NO:14)和反向引物CalipB-L-1(SEQ ID NO:17),通过PCR扩增前原区域。纯化产生的105bp PCR产物。使用pNZ-4作为模板和正向引物CalipB-L-2(SEQ ID NO:18)及反向引物L-N(SEQ ID NO:5),通过PCR扩增轻链。纯化产生的671bp PCR产物。引物CalipB-N向翻译起始密码子上游引入BamHI限制性位点用于克隆的目的。
混合上述两个PCR产物并使用如下产生741bp扩增片段的CalipB-N(SEQ ID NO:14)和L-N(SEQ ID NO:5)引物对进行标准SOE PCR。纯化741bp片段并用BamHI和XhoI酶切。将产生的729bp片段克隆进相应的pJaL790的限制性内切酶位点,产生称为pNZ-8的曲霉表达质粒。与轻链融合的异源信号完整氨基酸序列在SEQ ID NO:19中给出。
实施例8
用TAKA信号替换其天然信号的IgG1重链曲霉表达质粒的构建
实施例2中使用的人IgG1重链信号肽序列通过序列重叠延伸(SOE)与来自米曲霉α-淀粉酶(TAKA)的信号肽序列交换。使用正向引物TAKA-17-N(SEQ ID NO:20)及反向引物TAKA-H(SEQ ID NO:21)在pTAKA17上通过PCR扩增TAKA信号。引物TAKA-17-N向翻译起始密码子上游引入BamHI限制性位点用于克隆的目的。用BamHI和PvuII限制性消化产生的90bp PCR产物并纯化产生的80bp片段。用PvuII和XhoI限制性消化pNZ3并纯化编码重链的1345bp片段。
将上述80bp处和1435bp的两个片段克隆进用限制性内切核酸酶BamHI和XhoI消化的pJaL790内,产生称为pNZ-9的曲霉表达质粒。与重链融合的异源信号的完整氨基酸序列在SEQ ID NO:22中给出。
实施例9
用TAKA信号替换其中天然信号κ轻链曲霉表达质粒的构建
实施例3中使用的人κ轻链信号肽序列通过序列重叠延伸(SOE)与来自米曲霉α-淀粉酶(TAKA)的信号肽序列交换。使用pTAKA17作为模板和正向引物TAKA-17-N(SEQ ID NO:20)及反向引物TAKA-L-1(SEQID NO:23),通过PCR扩增TAKA信号。引物TAKA-17-N向翻译起始密码子上游引入BamHI限制性位点用于克隆的目的。纯化产生的90bp PCR产物。用PvuII和XhoI限制性消化pNZ3并纯化编码重链的1345bp片段。使用正向引物TAKA-L-2(SEQ ID NO:24)和反向引物L-C(SEQ ID NO:6)在pNZ-4上通过PCR扩增轻链。纯化产生的671bp PCR产物。
混合上述两个PCR产物并使用如下产生729bp扩增片段的TAKA-17-N(SEQ ID NO:20)和L-C(SEQ ID NO:6)引物对进行标准SOEPCR。纯化729bp片段并用BamHI和XhoI酶切。将产生的717bp片段克隆进相应的pJaL790的限制性内切酶位点,产生称为pNZ-10的曲霉表达质粒。与轻链融合的异源信号完整氨基酸序列在SEQ ID NO:25中给出。
实施例10
hemA-米曲霉菌株ICA133的构建
为了除去米曲霉属菌株Bech2中位于碱性蛋白酶基因内的缺陷的pyrG基因,进行下面的操作:
A.分离pyrG-米曲霉菌株——ToC1418
在补充有1.0M作为碳源的蔗糖、10mM作为氮源的硝酸钠和0.5mg/ml FOA的基础平板上(Cove D.J.1966.Biochem.Biophys.Acta.113:51-56)筛查米曲霉属菌株Bech2对5-氟乳清酸(FOA)的抗性,以鉴定自发的pyrG突变体。一个菌株(ToC1418)被鉴定为pyrG。ToC1418是尿嘧啶核苷依赖的,因此可以用野生型pyrG基因转化并且可以通过在缺乏尿嘧啶核苷条件下的生长能力选择转化体。
B.构建pyrG+的米曲霉菌株——JaL352:
通过测序确定位于碱性蛋白酶基因内的缺陷pyrG基因中的突变。制备米曲霉属菌株Bech2的染色体DNA并使用引物104025(SEQ ID NO:31)和104026(SEQ ID NO:32)通过PCR扩增含有缺陷pyrG基因编码区的933bp片段。纯化933bp片段并用下列引物进行测序:104025、104026、104027(SEQ ID NO:33)、104028(SEQ ID NO:34)、108089(SEQ ID NO:35)和108091(SEQ ID NO:36)。测序表明一个额外的碱基G插入到pyrG编码区的第514位(从pyrG基因起始密码子的A开始算起),以此产生了移码突变。
为了使位于碱性蛋白酶中的缺陷pyrG基因变成野生型pyrG基因,使用标准的操作,用150皮摩尔5’端被磷酸化的寡核苷酸(SEQ ID NO:37)转化米曲霉pyrG-菌株ToC1418。寡核苷酸恢复了pyrG的阅读框,但是同时引入了一个沉默突变,因此产生了StuI限制性内切酶位点。然后通过缺乏尿嘧啶核苷时在补充有1.0M作为碳源的蔗糖和10mM作为氮源的硝酸钠的基础平板上(Cove D.J.1966.Biochem.Biophys.Acta.113:51-56)生长的能力选择转化体。在重新分离之后,制备了8个转化体的染色体DNA。为了证实其变化,通过使用引物135944(SEQ ID NO:38)和108089(SEQID NO:35)的PCR扩增了785bp的片段,该片段覆盖了目的区域。纯化785bp的片段并用引物108089(SEQ ID NO:35)和135944(SEQ ID NO:38)进行测序。将具有预期改变的一个菌株命名为JaL352。
C.分离pyrG-的米曲霉菌株——JaL355:
为了除去位于碱性蛋白酶基因内的pyrG基因,用pJaL173的5.6kb的BamHI片段通过标准操作转化JaL352,所述片段携带米曲霉碱性蛋白酶基因的5’和3’侧翼序列。在非选择平板上再生原生质体,并收集孢子。为了鉴定pyrG突变体,筛查了大约109个孢子对FOA的抗性。重新分离后,从14个FOA抗性转化体中制备染色体DNA。用Bal I消化染色体DNA,并用使用1kb32P标记的pJaL173Bal I DNA片段作为探针进行DNA印迹分析,该标记的片段含有米曲霉碱性蛋白酶基因的部分5’和3’侧翼。通过4.8kb Bal I带的消失和1kb Bal I带的出现来鉴定目的菌株。用来源于pJaL335、含有米曲霉pyrG基因的3.5kb32P标记的DNA Hind III片段对同一张滤膜进行探测,导致4.8kb BalI带在目的菌株消失。将来源于这些转化体的一个菌株命名为JaL355。
D.hemA-菌株ICA133的构建
根据US 6,033,892(Genbank:AF152374)中给出的米曲霉hemA基因序列,设计引物以扩增5’侧翼和3’侧翼序列。用于5’侧翼部分的引物B2340E06(SEQ ID NO:39)和B2340E07(SEQ ID NO:40)尾部分别有BspLU11I和Xho I位点。3’侧翼部分的引物B2340E08(SEQ ID NO.41)和B2340E09(SEQ ID NO:42)尾部分别有Xho I和Not I位点。
用BspLU11I-Xho I和Xho I-Not I分别消化1068bp和1153bp的扩增片段,分别产生1049bp片段和1132bp片段。然后将这些片段克隆进BspLU11I-Not I消化的pDV8(用于正负选择的载体)中。最后,以pJaL554的2346bp Sal I片段分离两测为正向重复的米曲霉pyrG基因并插入5’和3’侧翼片段间形成的Xho I位点。形成的质粒称为pICA128。
用Not I线性化pICA128并用于转化米曲霉JaL355,且在如WO01/68864所述的添加有250mM 5’-氨基乙酰丙酸(5-ALA)和0.6mM 5-氟-2’-脱氧尿嘧啶核苷(FdU)的基础培养基平板上选择转化体。重分离大量转化体并涂布在不含5-ALA的Cove平板上。两个在补充有5-ALA的Cove上生长良好,但在不含有5-ALA的Cove上不生长的转化体(#2和#7)被选择用于Southern印迹分析。用Bgl II消化染色体DNA并用Southern印迹分析,使用1049bp32P标记的pICA128 BspLU11I-Xho DNA片段作为探针进行Southern印迹分析,该标记的片段含有米曲霉碱性蛋白酶基因的部分5’侧翼。通过1.8kb Bal II带的消失和7.5kb Bal II带的出现来鉴定目的菌株。剥离滤膜并用476bp 32P标记的米曲霉hemA编码部分SalI-Pst I内部片段DNA重新探查。如果pICA128通过同源双交换整合,则预计没有杂交信号。两个转化体都未观察到杂交信号。转化体之一命名为ICA133。
实施例11
pyrG米曲霉菌株ToC1512的构建
A.glaA-米曲霉菌株ToC1510的构建
根据米曲霉IFO 4177淀粉糖化酶基因A(glaA)基因序列(SEQ ID NO:43)设计引物以扩增5’侧翼和3’侧翼序列。用于5’侧翼部分的引物101687(SEQ ID NO:44)和101688(SEQ ID NO:45)尾部分别有Bgl II和Hind III位点。3’侧翼部分的引物101689(SEQ ID NO:46)和101690(SEQ ID NO:47)尾部分别有Hind III和Sal I位点。
用Bgl II-Hind III和Hind III-Sal I分别消化1073bp和1049bp的扩增片段,并分别产生1061bp片段和1037bp片段。然后将这两个片段克隆进Bgl II-Sal I消化的pUC19R中,产生质粒pToC381。来自pToC381的2104bp BamHI-Bgl II片段用Klenow和四种脱氧核糖核苷酸处理以补平末端并克隆进用Hind III消化并用Klenow和四种脱氧核糖核苷酸处理将末端补平的pDV8中,产生质粒pToC465。最后,侧翼具有正向重复的米曲霉pyrG基因作为pJaL554的2545bp Hind III片段被分离并插入5’和3’侧翼片段间形成的Hind III位点。形成的质粒命名为pToC466。
用Not I线性化pToC466并用它转化米曲霉JaL355,并如WO 0168864所述在0.6mM 5-氟-2’-尿嘧啶核苷(FdU)基础培养基上选择转化体。两次重分离大量转化体并制备基因组DNA。来自各个转化体的染色体DNA用Pvu I消化并用Southern印迹分析,使用1061bp 32P标记的pToC381 HindIII-Bgl II DNA片段作为探针进行Southern印迹分析,该标记的片段含有米曲霉glaA基因的5’侧翼。通过1.6kb Pvu I带的消失和7.3kb Pvu I带的出现来鉴定目的菌株。剥离滤膜并用1020bp 32P标记的从米曲霉基因组DNA中使用引物101691(SEQ ID NO:48)和101692(SEQ ID NO:49)扩增的PCR片段DNA重新探查。如果pToC466通过同源双交换整合,则预计没有杂交信号,而在JaL355中有1.6kb带。具有上述特征的一个转化体命名为ToC1510。
B.分离pyrG-米曲霉菌株ToC1512
在补充有1.0M作为碳源的蔗糖、10mM作为氮源的硝酸钠和0.5mg/ml FOA的基础平板上(Cove D.J.1966.Biochem.Biophys.Acta.113:51-56)筛选米曲霉属菌株ToC1510对5-氟乳清酸(FOA)的抗性,以鉴定自发的pyrG突变体。一个菌株(ToC1512)被鉴定为pyrG。ToC1512是尿嘧啶核苷依赖的,因此可以用野生型pyrG基因转化并且可以通过在缺乏尿嘧啶核苷条件下的生长能力选择转化体。
实施例12
在米曲霉中表达IgG1重链
如Christensen等;Biotechnology 1988 6 1419-1422页中所述,用表达质粒pNZ-3、-5、-7和-9中的任何一种转化菌株ICA133。简言之,米曲霉菌丝体在富含营养的肉汤中成长。通过过滤将菌丝体从肉汤中分离。向稳定渗透压的缓冲液(例如用磷酸钠缓冲至pH5.0的1.2M MgSO4缓冲液)中的菌丝体内加入Novozyme(Novozymes)酶制品。悬液在37℃搅拌下孵育60分钟。用Mira织物过滤原生质体以除去菌丝体碎片。收集原生质体并用STC(1.2M山梨醇、10mM CaCl2,10mM Tris-HCl pH7.5)洗涤两次。最终用200-1000μl STC再次重悬原生质体。
为了转化,向100μl原生质体悬液中加入5μg DNA并随后加入200μlPEG溶液(60%PEG 4000、10mM CaCl2、10mM Tris-HCl pH7.5)并将混合物在室温孵育20分钟。收集原生质体并用1.2M山梨醇洗涤两次。最终收集原生质体并用200μ1 1.2M山梨醇重悬。在含有1.0M作为碳源的蔗糖、10mM作为氮源的乙酰胺、15mM抑制背景生长的CsCl和250mM5-ALA的基础平板上选择(Cove D.J.1966.Biochem.Biophys.Acta.113:51-56)含有amdS基因的转化体。在37℃生长4-5天后,稳定的转化体显示为有力生长和孢子形成菌落。通过分生孢子纯化转化体两次。
向含有10ml YPM培养基(2g/l酵母膏、2g/l蛋白胨和2%麦芽糖)的摇瓶中加入来自转化体的孢子,并在30℃,200rpm孵育4天。上清液样品(20μl)与适当体积的2x样品上样缓冲液混合并根据制造商说明(Novex NuPAGE 10%Bis-Tris Electrophoresis System from InvitrogenCorporation)进行十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)。凝胶用考马斯亮蓝染色蛋白质或将蛋白质通过Western印迹转移至滤膜上(Towbin等,1979,Proc.Natl.Acad.Sci.USA 76:4350-4354)。用标准蛋白质标记物和来自与米曲霉细胞表达相同人重链的杂交瘤细胞的上清液进行凝胶电泳。人重链用Western印迹检测,根据制造商说明通过用缀合碱性磷酸酶(AP)的山羊抗人IgG(γ链特异)(Sigma A3187)处理,然后通过与磷酸4-硝基苯酚(Sigma N7653)孵育使AP显色。重链的Western印迹在图1第二块凝胶中显示。
通过与来自未转化亲本菌株上清液相比55-60kD额外条带的出现鉴定产生重链的转化体。
实施例13
在米曲霉中表达κ轻链
除用20mM尿嘧啶核苷替换250mM 5-ALA外,如实施例12中关于重链的描述,用表达质粒pNZ-4、-6、-8和-10中的任何一种转化菌株ToC1512。
向含有10ml YPM培养基(2g/l酵母膏、2g/l蛋白胨和2%麦芽糖)的摇瓶中加入来自转化体的孢子,并在30℃,200rpm孵育4天。上清液样品(20μl)与适当体积的2x样品上样缓冲液混合并根据制造商说明(Novex NuPAGE 10% Bis-Tris Electrophoresis System from InvitrogenCorporation)进行十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)。凝胶用考马斯亮蓝染色蛋白质或将蛋白质通过Western印迹转移至滤膜上(Towbin等,1979,Proc.Natl.Acad.Sci.USA 76:4350-4354)。用标准蛋白质标记物和来自与米曲霉细胞表达相同κ轻链的杂交瘤细胞的上清液进行凝胶电泳。人κ轻链用Western印迹检测,根据制造商说明通过用缀合碱性磷酸酶(AP)的山羊抗人κ轻链抗体(Sigma A3813)处理,然后通过与磷酸4-硝基苯酚(Sigma N7653)孵育使AP显色。轻链的Western印迹在图1第一块凝胶中显示。
通过与来自未转化亲本菌株上清液相比25kD额外条带的出现鉴定产生轻链的转化体。轻链条带的身份通过Edman降解法确定N末端进一步确认。这些数据显示全部4个表达构建体均获得对应人分离的抗体类似物单一显性序列DIQMTQS(SEQ ID NO:51)。
实施例14
在米曲霉异核体中表达完整IgG1抗体
混合了编码κ轻链和IgG1重链的细胞核的米曲霉异核体细胞的构建如下完成:在20ml NUNC万能容器(NUNC 364228)中添加有0.02mM尿嘧啶核苷酸和25mM 5’-ALA的15ml COVE培养基(Cove D.J.1966.Biochem.Biophys.Acta.113:51-56)中混和大约105个表达实施例12重链转化体的孢子(hemA阴性)和大约105个表达实施例13轻链的转化体孢子(pyrG阴性)。将其在30℃非振荡孵育2天。表面菌丝体团每天用无菌水洗涤两次,转化至COVE平板并在37℃孵育3天。1.0cm2琼脂填料移至新COVE平板并在37℃孵育3天。所有后续的异核体操作均在选择异核体的培养基上/中进行。
向含有10ml YPM培养基(2g/l酵母膏、2g/l蛋白胨和2%麦芽糖)的摇瓶中加入来自异核体的孢子,并在30℃,200rpm孵育4天。通过SDS-page和Western分析法分析上清液重链和轻链样品的表达。用标准蛋白质标记物和与米曲霉异核体表达相同人κ轻链和重链的杂交瘤细胞上清液进行凝胶电泳。
通过对重链具有特异性的A蛋白层析(Goudswaard等,1978,Scand JImmunol,8:21-28)从含有(来自实施例12的)天然重链和(来自实施例13的)CBD轻链融合物的一个异核体得到了与轻链联系的重链。图1第三块凝胶显示了使用实施例12和实施例13中描述的重链和轻链特异性抗体的Western印迹结果。转化体观察到的条带鉴定为重链(50、53和55kD,可能是乙二醇形式不同)和轻链(25kD)。轻链与重链共纯化说明抗体已经装配。
条带的N末端鉴定确定了3条重链条带具有相同的序列即EGQLVQSG(SEQ ID NO:52),并且轻链具有DIQMTQS(SEQ ID NO:51)序列,对重链和轻链而言均对应于由杂交瘤细胞产生的抗体序列。
此外,米曲霉异核体表达的功能性抗体量在3升罐中测量并在图2中和下面的表1中作为异核体被培养小时数的函数显示。产量相对于168小时后的产生量给出,并通过抗体对抗原的结合测定。
表1
小时 | 相对产量 |
24 | 1 |
48 | 15 |
72 | 29 |
96 | 42 |
120 | 61 |
144 | 75 |
168 | 100 |
实施例15
不同的培养条件对抗体表达量的影响
本实施例使用来自实施例14的米曲霉测试不同的培养条件对异核体表达的抗体量的影响。用10mL孢子悬液接种含有200mL G2Gly培养基(18g/L酵母膏和24g/L甘油)的500mL摇瓶。在振荡培养箱中30℃培养24-48小时后,将其转移至3LApplicon生物反应器中。J3培养的培养基和发酵参数如下:
生物反应器中的发酵培养基:60g蔗糖、12g(NH4)2SO4、8g MgSO4·7H2O、8g KH2PO4、1.0mL Tracemetal溶液,每2L 3.4mL Pluronic(消泡剂)、将其在121℃灭菌60分钟并调节pH为6.5。
大约14-18小时的培养(批量阶段)后,持续加入所谓的补料培养基以对培养物补料。总体积2.0L的补料培养基在此处由3.5g柠檬酸、20mLpluronic(消泡剂)和2L Nutriose(麦芽糖)、BRIX40(这使得补料培养基中有40%浓度由折射率确定的麦芽糖糖浆)组成,并且在使用前在121℃灭菌30分钟。
对照参数如下:
pH:根据设定点表 | 药量:根据设定点表 |
温度:根据设定点表 | 基质:10%(w/w)NH4OH(大约0.5L) |
搅拌:最小800rpm和最大1100rpm | 通气量:2.0L/min |
溶解的氧张力由搅拌控制在最小量30% | 当rpm(最大)-rpm=100时开始给药 |
设定点表:
pH | 补料速率(g/min/L) | 温度 | |||
时间 | 设定点 | 时间 | 设定点 | 时间 | 设定点 |
0 | 6.5 | 开始补料 | 0.25 | 0 | 34 |
开始补料 | 7.0 | 开始补料+12hrs | 0.15 | 开始补料 | 34 |
开始补料+500hrs | 7.0 | 开始补料+24hrs | 0.05 | 开始补料+150hrs | 26 |
时间=0是发酵的起始点,即培养物在此从振荡培养箱中转移至3LApplicon生物反应器中。
时间=开始补料是添加补料培养基的起始点,其如上所述当rpm(最大)-rpm=100时开始(开始给药)。
两个设定点间参数值对时间成线性变化。
每天两次取上清液样品并确定重量、pH和葡萄糖量。此外,每天取样并将上清液冻存以待抗体定量。
B2、C3、E2和G1发酵实验类似地进行,表2中指出例外/变化。表达的完整的人IgG量通过“方法”小节中描述的ELISA测量且结果显示在表2中。
表2
发酵号 | 温度谱 | 麦芽糖谱(g/min/L) | 蔗糖(g/L) | 表达的抗体量(与B2相比) |
B2 | 34℃ | 0.05 | 25 | 1 |
C3 | 发酵期间34℃,从开始补料将温度在4小时内降低至26℃。 | 0.06 | 30 | 1.19 |
E2 | 发酵期间34℃,从开始补料将温度在12小时内降低至26℃。 | 根据氧张力变化 | 30 | 1.07 |
J3 | 发酵期间34℃,从开始补料150小时内将温度降低至26℃。 | 12小时内0.25,12和24小时间0.15,24小时至结束0.05 | 30 | 4.44 |
在整个发酵中最先使用34℃的温度,主要由于曲霉在该温度下生长的更好(B2)。通过开始补料后4小时内将温度改变为26℃获得抗体浓度的轻微增长(C3)。在E2发酵中,补料由发酵罐中溶解的氧张力控制,这引起更高的生物量浓度,但并不促进最终的抗体浓度。
当从补料阶段开始将温度在150小时内从34℃线性变化至26℃时,抗体浓度提高大于4倍(J3)。控制补料速率以模仿E2发酵中的补料速率,但使用使它操作上更容易控制的预先设定值。
因此表2中的结果指出在补料阶段降低温度会提高产生的抗体量。
实施例16
在来自不同重链和轻链构建体组合的米曲霉异核体中表达完整的人IgG
实施例14显示包含野生型重链(对应实施例2中pNZ-3)和CBD轻链融合蛋白质(对应实施例5中pNZ-6)构建体的米曲霉异核体对人抗体的表达。
包含不同重链和轻链构建体组合的米曲霉异核体如实施例14中所述形成。
由米曲霉异核体表达的完整人IgG数量通过如上在“方法”小节中所述的ELISA测量且结果显示在表3中。数量标准化为由含有野生型重链构建体和野生型轻链构建体(分别对应于实施例2和3中的pNZ-3和pNZ-4)的米曲霉异核体表达量。
表3
构建体 | ||
重链 | 轻链 | 相对产量 |
野生型(pNZ-3) | 野生型(pNZ-4) | 1 |
野生型(pNZ-3) | CBD-融合物(pNZ-6) | 3.13 |
CBD-融合物(pNZ-5) | 野生型(pNZ-4) | 0.62 |
CBD-融合物 | CBD-融合物 | 2.2 |
(pNZ-5) | (pNZ-6) | |
野生型(pNZ-3) | TAKA-信号肽(pNZ10) | 3.34 |
CBD-融合物(pNZ-5) | TAKA-信号肽(pNZ10) | 3.67 |
来自脂酶B的前原(pNZ-7) | CBD-融合物(pNZ-6) | 3.17 |
来自脂酶B的前原(pNZ-7) | TAKA-信号肽(pNZ10) | 3.13 |
结果指出使用重链和轻链不同构建体及其不同组合的米曲霉异核体能够表达完整人IgG。
实施例17
IgG2重链CBD融合物曲霉表达载体构建
人IgG2重链(SEQ ID NO:55)和来自大型亚灰树花菌内切葡聚糖酶II的纤维素结合结构域之间的融合通过使用序列重叠延伸(SOE)交换编码重链自身信号肽的DNA序列和编码具有其自身信号肽和以氨基酸KR结束的连接子的大型亚灰树花菌纤维素结合结构域(CBD)的DNA序列来构建。使用pA2C315作为模板和下列引物对通过PCR扩增CBD:正向引物C315-N(SEQ ID NO:7)和反向引物K1796F02(SEQ ID NO:63)。纯化产生的260bp PCR产物。
使用SEQ ID NO:55作为模板和下面的引物对通过PCR扩增重链:正向引物K1796F03(SEQ ID NO:64)和反向引物K1795F08(SEQ ID NO:67)。纯化产生的1376bp PCR产物。
混合上述两个PCR产物并使用下面的产生1596bp扩增片段的C315-N(SEQ ID NO:7)和K1795F08(SEQ ID NO:67)引物对进行标准SOE PCR。纯化1596bp片段并用BamHI和XhoI酶切。产生的1584bp片段克隆进相应的pJaL790的限制性内切酶位点,产生称为pNZa-1的曲霉表达质粒。与重链融合的CBD的完整序列在SEQ ID NO:57中给出。
实施例18
κ轻链CBD融合物曲霉表达载体的构建
人κ轻链(SEQ ID NO:56)和来自大型亚灰树花菌的内切葡聚糖酶II的纤维素结合结构域之间的融合通过使用序列重叠延伸(SOE)交换编码轻链自身信号肽的DNA序列和编码具有其自身信号肽和以氨基酸KR结束的连接子的大型亚灰树花菌纤维素结合结构域(CBD)的DNA序列来构建。
使用下列引物对在pA2C315上通过PCR扩增CBD:正向引物C315-N(SEQ ID NO:7)和反向引物K1796F02(SEQ ID NO:63)。纯化产生的260bp PCR产物。
使用正向引物K1796F07(SEQ ID NO:69)和反向引物K1795F09(SEQ ID NO:72)从SEQ ID NO:56中通过PCR扩增轻链。纯化产生的677bp PCR产物。
混合上述两个PCR产物并使用下面的产生897bp扩增片段的C315-N和K1795F08引物对进行标准SOE PCR。纯化897bp片段并用BamHI和XhoI酶切。将产生的885bp片段克隆进pJaL790的相应限制性内切酶位点,产生称为pNZa-2的曲霉表达质粒。与轻链融合的CBD的完整序列在SEQ ID NO:59中给出。
实施例19
带有TAKA信号肽的IgG2重链曲霉表达质粒的构建
通过序列重叠延伸(SOE)交换来自米曲霉α-淀粉酶(TAKA)的信号肽序列和实施例17中使用的人IgG2重链固有的信号肽。使用如下引物对在pTAKA17上通过PCR扩增TAKA信号:正向引物TAKA-17-N(SEQ IDNO:20)和反向引物K1796F04(SEQ ID NO:65)。纯化产生的95bp PCR产物。
使用SEQ ID NO:55作为模板和下面的引物对通过PCR扩增重链:正向引物K1796F05(SEQ ID NO:66)和反向引物K1795F08(SEQ ID NO:67)。纯化产生的1375bp PCR产物。
混合上述两个PCR产物并使用下面的产生1431bp扩增片段的TAKA-17-N(SEQ ID NO:20)和K1795F08(SEQ ID NO:67)引物对进行标准SOE PCR。纯化1431bp片段并用BamHI和XhoI酶切。将产生的1419bp片段克隆进pJaL790的相应限制性内切酶位点,产生称为pNZa-3的曲霉表达质粒。与重链融合的TAKA信号肽完整序列在SEQ ID NO:61中给出。
实施例20
带有TAKA信号肽的κ轻链曲霉表达载体的构建
通过序列重叠延伸(SOE)交换实施例18中使用的人κ轻链信号肽序列和来自米曲霉α-淀粉酶(TAKA)的信号肽序列。
使用pTAKA17作为模板和正向引物TAKA-17-N(SEQ ID NO:20)及反向引物K1796F08(SEQ ID NO:70),通过PCR扩增TAKA信号。纯化产生的95bp PCR产物。
使用正向引物K1796F09(SEQ ID NO:71)和反向引物K1795F09(SEQ ID NO:72)从SEQ ID NO:56中通过PCR扩增轻链。纯化产生的576bp PCR产物。
混合上述两个PCR产物并使用下面的产生732bp扩增片段的TAKA-17-N(SEQ ID NO:20)和K1795F09(SEQ ID NO:72)引物对进行标准SOE PCR。纯化732bp片段并用BamHI和XhoI限制性消化。将产生的720bp片段克隆进pJaL790的相应限制性内切酶位点,产生称为pNZa-4的曲霉表达质粒。与轻链融合的异源信号完整序列在SEQ ID NO:62中给出。
实施例21
在米曲霉中表达IgG2重链
如Christensen等;Biotechnology 1988 6 1419-1422所述,用表达质粒pNZa-1和-3之一转化菌株ICA133(实施例10)。简言之,米曲霉菌丝体在富含营养的肉汤中成长。通过过滤将菌丝体从肉汤中分离。向稳定渗透压的缓冲液(例如用磷酸钠缓冲至pH5.0的1.2M MgSO4缓冲液)中的菌丝体内加入Novozyme(Novozymes)酶制品。悬液在37℃搅拌下孵育60分钟。用Mira织物过滤原生质体以除去菌丝体碎片。收集原生质体并用STC(1.2M山梨醇、10mM CaCl2、10mM Tris-HCl pH7.5)洗涤两次。
最终用200-1000μl STC再次重悬原生质体。
为了转化,向100μl原生质体悬液中加入5μg DNA并随后加入200μlPEG溶液(60%PEG 4000、10mM CaCl2、10mM Tris-HCl pH7.5)并将混合物在室温孵育20分钟。收集原生质体并用1.2M山梨醇洗涤两次。最终收集原生质体并用200μl 1.2M山梨醇重悬。含有amdS基因的转化体在含有1.0M作为碳源的蔗糖、10mM作为氮源的乙酰胺、15mM抑制背景生长的CsCl和250mM 5-ALA的基础平板上选择(Cove D.J.1966.Biochem.Biophys.Acta.113:51-56)。在37℃生长4-5天后,稳定的转化体显示为有力生长和孢子形成菌落。通过分生孢子纯化转化体两次。
向含有10ml YPM培养基(2g/l酵母膏、2g/l蛋白胨和2%麦芽糖)的摇瓶中加入来自转化体的孢子,并在30℃,200rpm孵育4天。上清液样品(20μl)与适当体积的2x样品上样缓冲液混合并根据制造商说明(Novex NuPAGE 10%Bis-Tris Electrophoresis System from InvitrogenCorporation)进行十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)。凝胶用考马斯亮蓝染色蛋白质或将蛋白质通过Western印迹转移至滤膜上(Towbin等,1979,Proc.Natl.Acad.Sci.USA 76:4350-4354)。人重链用Western印迹检测,根据制造商说明通过用缀合碱性磷酸酶(AP)的山羊抗人IgG(γ链特异)(Sigma A3187)处理,然后通过与磷酸4-硝基苯酚(Sigma N7653)孵育使AP显色。重链的Western印迹在图3第一块凝胶中显示。
通过与来自未转化亲本菌株上清液相比55-60kD额外条带的出现鉴定产生重链的转化体。
实施例22
在米曲霉中表达κ轻链
除用20mM尿嘧啶核苷替换250mM 5-ALA外,如实施例21中关于重链的描述,用表达质粒pNZa-2和-4之一转化菌株ToC1512(实施例11)。
向含有10ml YPM培养基(2g/l酵母膏、2g/l蛋白胨和2%麦芽糖)的摇瓶中加入来自转化体的孢子,并在30℃,200rpm孵育4天。将上清液样品(20μl)与适当体积的2x样品上样缓冲液混合并根据制造商说明(Novex NuPAGE 10%Bis-Tris Electrophoresis System from InvitrogenCorporation)进行十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)。凝胶用考马斯亮蓝染色蛋白质或将蛋白质通过Western印迹转移至滤膜上(Towbin等,1979,Proc.Natl.Acad.Sci.USA 76:4350-4354)。人κ轻链用Western印迹检测,根据制造商说明通过用缀合碱性磷酸酶(AP)的山羊抗人κ轻链抗体(Sigma A3813)处理,然后通过与磷酸4-硝基苯酚(SigmaN7653)孵育使AP显色。轻链的Western印迹在图3第三块凝胶中显示。
通过与来自未转化亲本菌株上清液相比25kD额外条带的出现鉴定产生轻链的转化体。轻链条带的身份通过Edman降解法确定N末端进一步确认。这些数据显示全部4个表达构建体均获得对应人分离的抗体类似物的单一显性序列EIVLTQS(SEQ ID NO:73)。
实施例23
在米曲霉异核体中表达完整IgG2抗体
混合了编码κ轻链和IgG2重链的细胞核的米曲霉异核体细胞的构建如下完成:在20ml NUNC万能容器(NUNC 364228)中添加有0.02mM尿嘧啶核苷酸和25mM 5’-ALA的15ml COVE培养基(Cove D.J.1966.Biochem.Biophys.Acta.113:51-56)中混和大约105个表达实施例21重链转化体的孢子(hemA阴性)和大约105个表达实施例22轻链的转化体孢子(pyrG阴性)。将其在30℃不非振荡孵育2天。表面菌丝体团每天用无菌水洗涤两次,转移至COVE平板并在37℃孵育3天。将1.0cm2琼脂填料转移至新COVE平板并在37℃孵育3天。所有后续的异核体操作均在选择异核体的培养基上/中进行。
向含有10ml YPM培养基(2g/l酵母膏、2g/l蛋白胨和2%麦芽糖)的摇瓶中加入来自异核体的孢子,并在30℃,200rpm孵育4天。通过SDS-page和Western分析法分析上清液中重链和轻链样品的表达。
通过对重链具有特异性的A蛋白层析(Goudswaard等,1978,Scand JImmunol,8:21-28)从含有(来自实施例21的)TAKA信号肽重链和(来自实施例22的)TAKA信号肽轻链融合物的一个异核体得到了与轻链联系的重链。图3凝胶显示了使用实施例21和实施例22中描述的重链和轻链特异性抗体的Western印迹结果。转化体观察到的条带鉴定为重链(50、53和55kD,可能是乙二醇形式不同)和轻链(25kD)。轻链与重链共纯化说明抗体已经装配。
条带的N末端鉴定确定了2条重链条带具有相同的序列即EVQLLQSG(SEQ ID NO:74),并且轻链具有EIVLTQS(SEQ ID NO:73)序列,对重链和轻链而言均对应于由CHO细胞产生的抗体序列。
实施例24
在来自不同重链和轻链构建体组合的米曲霉异核体中表达完整人IgG
包含重链构建体和轻链CBD融合物蛋白质(实施例17和18)构建体或TAKA信号肽及重链构建体和轻链(实施例19和20)构建体的米曲霉异核体如实施例23中所述形成。
由米曲霉异核体表达的完整人IgG2数量通过如上在“方法”小节中所述的ELISA测量并显示重链和轻链均包含TAKA信号肽的异核体与包含CBD重链和轻链融合物的相比完整抗体表达大约为2.6倍。
序列表
序列表
<110>诺和酶股份有限公司
<120>在异核体真菌或真菌宿主细胞中产生单克隆抗体
<130>10453
<160>74
<170>PatentIn版本3.2
<210>1
<211>1410
<212>DNA
<213>人
<220>
<221>sig_peptide
<222>(1)..(57)
<400>1
atggagtttg tgctgagctg ggttttcctt gttgctatat taaaaggtgt ccagtgtgag 60
ggtcagctgg tgcaatctgg gggaggcttg gtacatcctg gggggtccct gagactctcc 120
tgtgcaggct ctggattcac cttcagtagc tatggtatgc actgggttcg ccaggctcca 180
ggaaaaggtc tggagtgggt atcaggtatt ggtactggtg gtggcacata ctctacagac 240
tccgtgaagg gccgattcac catctccaga gacaatgcca agaactcctt gtatcttcaa 300
atgaacagcc tgagagccga ggacatggct gtgtattact gtgcaagagg agattactat 360
ggttcgggga gtttctttga ctgctggggc cagggaaccc tggtcaccgt ctcctcagcc 420
tccaccaagg gcccatcggt cttccccctg gcaccctcct ccaagagcac ctctgggggc 480
acagcggccc tgggctgcct ggtcaaggac tacttccccg aaccggtgac ggtgtcgtgg 540
aactcaggcg ccctgaccag cggcgtgcac accttcccgg ctgtcctaca gtcctcagga 600
ctctactccc tcagcagcgt ggtgaccgtg ccctccagca gcttgggcac ccagacctac 660
atctgcaacg tgaatcacaa gcccagcaac accaaggtgg acaagagagt tgagcccaaa 720
tcttgtgaca aaactcacac atgcccaccg tgcccagcac ctgaactcct ggggggaccg 780
tcagtcttcc tcttcccccc aaaacccaag gacaccctca tgatctcccg gacccctgag 840
gtcacatgcg tggtggtgga cgtgagccac gaagaccctg aggtcaagtt caactggtac 900
gtggacggcg tggaggtgca taatgccaag acaaagccgc gggaggagca gtacaacagc 960
acgtaccgtg tggtcagcgt cctcaccgtc ctgcaccagg actggctgaa tggcaaggag 1020
tacaagtgca aggtctccaa caaagccctc ccagccccca tcgagaaaac catctccaaa 1080
gccaaagggc agccccgaga accacaggtg tacaccctgc ccccatcccg ggaggagatg 1140
accaagaacc aggtcagcct gacctgcctg gtcaaaggct tctatcccag cgacatcgcc 1200
gtggagtggg agagcaatgg gcagccggag aacaactaca agaccacgcc tcccgtgctg 1260
gactccgacg gctccttctt cctctatagc aagctcaccg tggacaagag caggtggcag 1320
caggggaacg tcttctcatg ctccgtgatg catgaggctc tgcacaacca ctacacgcag 1380
aagagcctct ccctgtcccc gggtaaatga 1410
<210>2
<211>711
<212>DNA
<213>人
<220>
<221>sig_peptide
<222>(1)..(66)
<400>2
atggacatga gggtcctcgc tcagctcctg gggctcctgc tgctctgttt cccaggtgcc 60
agatgtgaca tccagatgac ccagtctcca tcctcactgt ctgcatctgt aggagacaga 120
gtcaccatca cttgtcgggc gagtcagggt attagcagct ggttagcctg gtatcagcag 180
aaaccagaga aagcccctaa gtccctgatc tatgctgcat ccagtttgca aagtggggtc 240
ccatcaaggt tcagcggcag tggatctggg acagatttca ctctcaccat cagcagcctg 300
cagcctgaag attttgcaac ttattactgc caacagtata atagttaccc tcccactttt 360
ggccagggga ccaagctgga gatcaaacga actgtggctg caccatctgt cttcatcttc 420
ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct gctgaataac 480
ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca atcgggtaac 540
tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct cagcagcacc 600
ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga agtcacccat 660
cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta g 711
<210>3
<211>27
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>3
gacggatcca ccatggagtt tgtgctg 27
<210>4
<211>27
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>4
gacctcgagt catttacccg gggacag 27
<210>5
<211>28
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>5
gacggatcca ccatggacat gagggtcc 28
<210>6
<211>28
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>6
gacctcgagc taacactctc ccctgttg 28
<210>7
<211>29
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>7
gacggatcca ccatgaaggc gatcctctc 29
<210>8
<211>37
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>8
gattgcacca gctgaccctc acgcttcacc aaagggc 37
<210>9
<211>37
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>9
gccctttggt gaagcgtgag ggtcagctgg tgcaatc 37
<210>10
<211>526
<212>PRT
<213>人工的
<220>
<223>包含来自大型亚灰树花菌的CBD结构域和来自人IgG1重链的融合蛋白
<400>10
Met Lys Ala Ile Leu Ser Leu Ala Ala Ala Leu Leu Ser Ala Ala Pro
1 5 10 15
Ala Phe Ser Thr Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe Ser
20 25 30
Gly Asp Thr Thr Cys Thr Ala Ser Thr Cys Val Lys Val Asn Asp Tyr
35 40 45
Tyr Ser Gln Cys Gln Pro Gly Ala Ser Ala Pro Thr Ser Thr Ala Ser
50 55 60
Ala Pro Gly Pro Ser Ala Cys Pro Leu Val Lys Arg Glu Gly Gln Leu
65 70 75 80
Val Gln Ser Gly Gly Gly Leu Val His Pro Gly Gly Ser Leu Arg Leu
85 90 95
Ser Cys Ala Gly Ser Gly Phe Thr Phe Ser Ser Tyr Gly Met His Trp
100 105 110
Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Gly Ile Gly
115 120 125
Thr Gly Gly Gly Thr Tyr Ser Thr Asp Ser Val Lys Gly Arg Phe Thr
130 135 140
Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser
145 150 155 160
Leu Arg Ala Glu Asp Met Ala Val Tyr Tyr Cys Ala Arg Gly Asp Tyr
165 170 175
Tyr Gly Ser Gly Ser Phe Phe Asp Cys Trp Gly Gln Gly Thr Leu Val
180 185 190
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
195 200 205
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
210 215 220
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
225 230 235 240
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
245 250 255
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
260 265 270
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
275 280 285
Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
290 295 300
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
305 310 315 320
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
325 330 335
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
340 345 350
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
355 360 365
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
370 375 380
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
385 390 395 400
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
405 410 415
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
420 425 430
Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
435 440 445
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
450 455 460
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
465 470 475 480
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
485 490 495
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
500 505 510
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
515 520 525
<210>11
<211>35
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>11
ctgggtcatc tggatgtcac gcttcaccaa agggc 35
<210>12
<211>35
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>12
gccctttggt gaagcgtgac atccagatga cccag 35
<210>13
<211>290
<212>PRT
<213>人工的
<220>
<223>包含来自大型亚灰树花菌的CBD结构域和来自人κ轻链的融合蛋白
<400>13
Met Lys Ala Ile Leu Ser Leu Ala Ala Ala Leu Leu Ser Ala Ala Pro
1 5 10 15
Ala Phe Ser Thr Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe Ser
20 25 30
Gly Asp Thr Thr Cys Thr Ala Ser Thr Cys Val Lys Val Asn Asp Tyr
35 40 45
Tyr Ser Gln Cys Gln Pro Gly Ala Ser Ala Pro Thr Ser Thr Ala Ser
50 55 60
Ala Pro Gly Pro Ser Ala Cys Pro Leu Val Lys Arg Asp Ile Gln Met
65 70 75 80
Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr
85 90 95
Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Ser Trp Leu Ala Trp Tyr
100 105 110
Gln Gln Lys Pro Glu Lys Ala Pro Lys Ser Leu Ile Tyr Ala Ala Ser
115 120 125
Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly
130 135 140
Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala
145 150 155 160
Thr Tyr Tyr Cys Gln Gln Tyr Asn Ser Tyr Pro Pro Thr Phe Gly Gln
165 170 175
Gly Thr Lys Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe
180 185 190
Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val
195 200 205
Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp
210 215 220
Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr
225 230 235 240
Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr
245 250 255
Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val
260 265 270
Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly
275 280 285
Glu Cys
290
<210>14
<211>26
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>14
gacggatcca ccatgaagct actctc 26
<210>15
<211>32
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>15
caccagctga ccctcacgct tcaccaaagg ag 32
<210>16
<211>475
<212>PRT
<213>人工的
<220>
<223>南极假丝酵母脂酶B前原序列与人IgG1重链的融合蛋白,其中去除了重链的天然信
号肽。
<400>16
Met Lys Leu Leu Ser Leu Thr Gly Val Ala Gly Val Leu Ala Thr Cys
1 5 10 15
Val Ala Ala Thr Pro Leu Val Lys Arg Glu Gly Gln Leu Val Gln Ser
20 25 30
Gly Gly Gly Leu Val His Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala
35 40 45
Gly Ser Gly Phe Thr Phe Ser Ser Tyr Gly Met His Trp Val Arg Gln
50 55 60
Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Gly Ile Gly Thr Gly Gly
65 70 75 80
Gly Thr Tyr Ser Thr Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
85 90 95
Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala
100 105 110
Glu Asp Met Ala Val Tyr Tyr Cys Ala Arg Gly Asp Tyr Tyr Gly Ser
115 120 125
Gly Ser Phe Phe Asp Cys Trp Gly Gln Gly Thr Leu Val Thr Val Ser
130 135 140
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser
145 150 155 160
Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp
165 170 175
Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr
180 185 190
Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr
195 200 205
Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln
210 215 220
Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp
225 230 235 240
Lys Arg Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
245 250 255
Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
260 265 270
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
275 280 285
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
290 295 300
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
305 310 315 320
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
325 330 335
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
340 345 350
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
355 360 365
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
370 375 380
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
385 390 395 400
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
405 410 415
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
420 425 430
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
435 440 445
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
450 455 460
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
465 470 475
<210>17
<211>35
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>17
ctgggtcatc tggatgtcac gcttcaccaa aggag 35
<210>18
<211>35
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>18
ctcctttggt gaagcgtgac atccagatga cccag 35
<210>19
<211>239
<212>PRT
<213>人工的
<220>
<223>南极假丝酵母脂酶B前原序列与不带天然信号肽的人κ轻链的融合蛋白。
<400>19
Met Lys Leu Leu Ser Leu Thr Gly Val Ala Gly Val Leu Ala Thr Cys
1 5 10 15
Val Ala Ala Thr Pro Leu Val Lys Arg Asp Ile Gln Met Thr Gln Ser
20 25 30
Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys
35 40 45
Arg Ala Ser Gln Gly Ile Ser Ser Trp Leu Ala Trp Tyr Gln Gln Lys
50 55 60
Pro Glu Lys Ala Pro Lys Ser Leu Ile Tyr Ala Ala Ser Ser Leu Gln
65 70 75 80
Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
85 90 95
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr
100 105 110
Cys Gln Gln Tyr Asn Ser Tyr Pro Pro Thr Phe Gly Gln Gly Thr Lys
115 120 125
Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
130 135 140
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
145 150 155 160
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp
165 170 175
Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp
180 185 190
Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys
195 200 205
Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
210 215 220
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230 235
<210>20
<211>27
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>20
gacggatcca ccatggtcgc gtggtgg 27
<210>21
<211>32
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>21
caccagctga ccctcggcca aagcaggtgc tg 32
<210>22
<211>470
<212>PRT
<213>人工的
<220>
<223>米曲霉α淀粉酶TAKA信号肽与人IgG1重链的融合蛋白。
<400>22
Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala Ala
1 5 10 15
Pro Ala Leu Ala Glu Gly Gln Leu Val Gln Ser Gly Gly Gly Leu Val
20 25 30
His Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Gly Ser Gly Phe Thr
35 40 45
Phe Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly
50 55 60
Leu Glu Trp Val Ser Gly Ile Gly Thr Gly Gly Gly Thr Tyr Ser Thr
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Met Ala Val
100 105 110
Tyr Tyr Cys Ala Arg Gly Asp Tyr Tyr Gly Ser Gly Ser Phe Phe Asp
115 120 125
Cys Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys
465 470
<210>23
<211>35
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>23
ctgggtcatc tggatgtcgg ccaaagcagg tgctg 35
<210>24
<211>35
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>24
cagcacctgc tttggccgac atccagatga cccag 35
<210>25
<211>234
<212>PRT
<213>人工的
<220>
<223>米曲霉α淀粉酶TAKA信号肽与不带天然信号肽的人κ轻链的融合蛋白。
<400>25
Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala Ala
1 5 10 15
Pro Ala Leu Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser
20 25 30
Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly
35 40 45
Ile Ser Ser Trp Leu Ala Trp Tyr Gln Gln Lys Pro Glu Lys Ala Pro
50 55 60
Lys Ser Leu Ile Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser
65 70 75 80
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser
85 90 95
Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Asn
100 105 110
Ser Tyr Pro Pro Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys Arg
115 120 125
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
130 135 140
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
145 150 155 160
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
165 170 175
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
180 185 190
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
195 200 205
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
210 215 220
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230
<210>26
<211>20
<212>PRT
<213>米曲霉
<400>26
Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala Ala
1 5 10 15
Pro Ala Leu Ala
20
<210>27
<211>18
<212>PRT
<213>南极假丝酵母
<400>27
Met Lys Leu Leu Ser Leu Thr Gly Val Ala Gly Val Leu Ala Thr Cys
1 5 10 15
Val Ala
<210>28
<211>7
<212>PRT
<213>南极假丝酵母
<400>28
Ala Thr Pro Leu Val Lys Arg
1 5
<210>29
<211>37
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>29
gacgacgaat tcaagcttat ggtgttttga tcatttt 37
<210>30
<211>30
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>30
gacgacgaat tcctccaagc atggcatccc 30
<210>31
<211>35
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>31
cctgaattca cgcgcgccaa catgtcttcc aagtc 35
<210>32
<211>31
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>32
gttctcgagc tacttattgc gcaccaacac g 31
<210>33
<211>18
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>33
accatggcgg cactctgc 18
<210>34
<211>18
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>34
gagccgtagg ggaagtcc 18
<210>35
<211>19
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>35
cttcagactg aacctcgcc 19
<210>36
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>36
gactcggtcc gtacattgcc 20
<210>37
<211>38
<212>DNA
<213>人工的
<220>
<223>用于将错误的pyrG基因校正成功能性pyrG基因的寡核苷酸。
<400>37
cctacggctc cgagagaggc cttttgatcc ttgcggag 38
<210>38
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>38
gagttagtag ttggacatcc 20
<210>39
<211>33
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>39
ctggatgaca tgtatcatga aggtatgtga atc 33
<210>40
<211>32
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>40
tgttgtctcg agggagaggg agaaggagag gg 32
<210>41
<211>32
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>41
cccgcactcg agctgaaatc gacgtggaat tc 32
<210>42
<211>37
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>42
gttattttgc ggccgcccta tccaacgttg gacgatc 37
<210>43
<211>3374
<212>DNA
<213>米曲霉
<400>43
gaattctgta gctgctctat ttctattact gtgtattttc cttcctctct taggttgtgg 60
aggttgagat agaggttact cttctagata cgggtccagg tccccggtaa ataaacgttt 120
cgagggacac aggttagcta gtagaatggg aacatctcga tagtatctca gcatgcaagg 180
gagagaagtt gtacaaaccg cggggcaata agttggcact ctaagaatgg tgtttctctc 240
tcttttgggg tcgatttacc gggcgtcgga aacagtgtcg agtgtaaatg catacatata 300
acactagaat ggtagaatgt ctaggtatcc tgactattat agcttcagat attgccaagt 360
aagaccggaa gcgtgacttt atatcgcctg acgaaggata gaagagccta cgctaaagca 420
aagttgttct ctcaagtagc cctaggtggg aattgctttc gatcgcaaat caatttgaga 480
aatgccacca ccaccaaatg taggtcttca aaactgaaaa tcgatcttga ttaagcctcg 540
atggatgttc agacttatat atcgttgtag tttgcgtggg atgtacaacc aggtatctac 600
gtcgtggatt ctgtagggaa agtagtaatg tcttgaggcg actggtaatg tgagtatgca 660
aggagattgc gagaccggac cacaattact atatcatggt ctacccatga tctagcctcc 720
gcccagctca ctatagatgt tcttcagaca ggggacggcg aattcacggg cgaaatcaat 780
ttgtggctgc atcctcatgt cttgaaacaa gcagtgtgat tggaagtggt ggcgtcttgg 840
ctccagccag ctgcatgact atgagaaaat agtccaacta gtcttggctt gcagaatgac 900
ttccggaaat ttaacctggt ggctgctctc agtattggct gacgctccgc acctctaatt 960
gtgcttcagg tcagtcaaag atgttttgaa ccaccaacga gccgaaccct tccgccgcta 1020
caatactcgg gttattataa aacgcatcgt ggttcatcgt cccagctata ggattatttt 1080
cacatcagca aacgaagtcg aagcaagatg gtgtctttct cctcttgtct ccgggcctta 1140
gccctcggat cctcagttct cgcggtccaa cctgtcctta gacaggcgac tggtctagat 1200
acctggctga gcacagaagc aaatttttcc cgccaggcaa tcttgaataa tatcggcgca 1260
gatggccagt cggcgcaggg cgcaagtcca ggggtggtga ttgccagccc tagcaaaagt 1320
gacccagatt gtacgtgctc tggccttttg caatccttca tttgacttac tggccgtaga 1380
tttctatacc tggacccgtg actcgggtct cgtcatgaaa accctggtcg atctgttcag 1440
aggcggagat gccgatcttc tccctatcat cgaggagttc attagctccc aggctcggat 1500
ccaaggcatc tcaaaccctt ctggtgctct ttccagtggg ggtctgggcg agcctaagtt 1560
caatgtcgac gagacagcat ttaccggcgc atggggtcgg ccgcagegtg acggaccagc 1620
tttgcgcgcg accgctatga tctcgtttgg agaatggcta gttgtaagtt ccatccgtct 1680
ttcagaatgg gcgtagttac cttataggaa aatagtcata caagcatagc gacggacctg 1740
gtatggcctg ttgttaggaa tgatctatcc tatgtagctc agtattggag ccaatccggg 1800
ttcggtgagc ttctagagaa atggcccgca gctatgcagt agctaacttc cacagatctc 1860
tgggaggaag tccaaggcac atcattcttt actgttgcag tttctcatcg cgctttggta 1920
gaaggtagca gcttcgcaaa gactgtcggt tcctcgtgcc cctattgtga ctcgcaagcg 1980
ccccaagtcc gatgttattt acaatccttc tggaccggga gttacatcca ggccaatttc 2040
ggtggcgggc gatcgggcaa agacatcaac actgtcctgg gtagtatcca cacgttcgat 2100
cctcaagcga cgtgtgatga tgctaccttc cagccctgtt cggcgcgagc attggccaac 2160
cataaggtag taacggactc gttccgatca atctatgcca tcaactccgg tcgtgctgag 2220
aatcaagctg ttgctgttgg ccgctacccc gaagacagct attacaacgg gaatccttgg 2280
ttcctgacca ccctggccgc cgcagagcag ttgtatgacg cgttgtacca gtgggataaa 2340
attggatcat tggccatcac ggacgtttct ttgccattct tcaaagctct ttacagttct 2400
gccgcgacag ggacctacgc atcgtccacg acggtgtata aggatattgt ctcagccgtc 2460
aaggcctatg cagacggata cgtgcagatc gtcgtacgtc aagttccctc ttcactctcg 2520
ttaatggtta gggttgctaa tgaccgcagc aaacctacgc tgcatccacc ggctccatgg 2580
ccgagcaata taccaagacg gacgggagtc agacctccgc ccgggatctt acctggtcgt 2640
acgctgcact tctcacggcc aacaaccgac gaaacgcggt cgttcctgca ccatggggcg 2700
agaccgctgc caccagcatt ccgtcagctt gctctacgac ttccgcctcg ggcacctaca 2760
gcagcgtggt tatcacatcc tggccgacca ttagcggata cccaggcgcg ccagacagcc 2820
cctgccaggt gccgacgact gtgtcggtga ccttcgcggt gaaagctact acggtctacg 2880
gtgagtctat caagatcgtc gggtcgatct ctcagctcgg gagctggaat cctagcagcg 2940
cgaccgcatt gaacgcggac agctacacta ctgacaaccc cttgtggacg ggaacaataa 3000
acttgcctgc tggacagtcg ttcgagtata agtttattcg cgttcagaac ggggcggtta 3060
cgtgggagag tgaccccaac cggaaatata ccgttccttc gacttgcggg gtgaaaagtg 3120
ctgtgcagag cgatgtttgg cggtgatcat catgtcccga tgaagaggag gaattggtac 3180
gtggtattgg tgatgtggcg ctgtcatatt cagtatatat gttcgattct gtgaaatccg 3240
aaggcagaga gaccaagaga gggcccacct attcgtgtgt aatagacaag ataatgttag 3300
tgtcctatga aatcccatga tataaatttc gagaagcagg acctacacag atgtatccga 3360
ttatccttgg atcc 3374
<210>44
<211>29
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>44
ggaagatctg ctgctctatt tctattact 29
<210>45
<211>30
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>45
cccaagcttc tgggacgatg aaccacgatg 30
<210>46
<211>30
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>46
cccaagcttg gatcattggc catcacggac 30
<210>47
<211>29
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>47
cgcgtcgacg gatccaagga taatcggat 29
<210>48
<211>21
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>48
gttggccaat gctcgcgccg a 21
<210>49
<211>21
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>49
gccctcggat cctcagttct c 21
<210>50
<211>37
<212>PRT
<213>大型亚灰树花菌
<400>50
Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe Ser Gly Asp Thr Thr
1 5 10 15
Cys Thr Ala Ser Thr Cys Val Lys Val Asn Asp Tyr Tyr Ser Gln Cys
20 25 30
Gln Pro Gly Ala Ser
35
<210>51
<211>7
<212>PRT
<213>人工的
<220>
<223>部分的ex.3人κ轻链。
<400>51
Asp Ile Gln Met Thr Gln Ser
1 5
<210>52
<211>8
<212>PRT
<213>人工的
<220>
<223>部分的ex.2人γ重链。
<400>52
Glu Gly Gln Leu Val Gln Ser Gly
1 5
<210>53
<211>19
<212>PRT
<213>酿酒酵母
<220>
<221>SIGNAL
<222>(1)..(19)
<400>53
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala
<210>54
<211>70
<212>PRT
<213>酿酒酵母
<220>
<221>PROPEP
<222>(1)..(70)
<400>54
Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile Pro Ala
1 5 10 15
Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe Asp Val Ala
20 25 30
Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe Ile Asn
35 40 45
Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val Ser Leu Asp
50 55 60
Lys Arg Glu Ala Glu Ala
65 70
<210>55
<211>1344
<212>DNA
<213>人
<400>55
gaggtccagc tgttggagtc tggcggaggc ttggtccagc ctggggggtc cctgaggctc 60
tcctgtgccg cctctggttt cacctttagc agctatgcca tgagctgggt ccgccaggct 120
cctggcaagg gcctggaatg ggtctccggt attactggca gcggtggtag cacctactac 180
gccgactccg ttaagggccg cttcaccatc tccagggaca attccaagaa cacgctgtat 240
ctgcagatga acagcctgag ggccgaggac accgccgtct attactgcgc gaaagatccc 300
ggtactacgg ttatcatgag ctggttcgac ccctggggcc agggaaccct ggtcaccgtc 360
tcctccgcct ccaccaaggg cccttcggtc ttccccctgg cgccctgctc caggagcacc 420
tccgagagca ccgcggccct gggctgcctg gtcaaggact acttccccga acccgttacg 480
gtctcgtgga actccggcgc tctgaccagc ggcgtgcaca ccttccccgc tgtcctccag 540
tcctccggac tctactccct cagcagcgtc gttaccgtgc cctccagcaa cttcggcacc 600
cagacctaca cctgcaacgt cgatcacaag cccagcaaca ccaaggttga caagacagtt 660
gagcgcaagt gttgcgtcga gtgccctccg tgccccgctc cccctgttgc tggaccctcc 720
gtcttcctct tcccccctaa gcccaaggac accctcatga tctccaggac ccctgaggtc 780
acctgcgtcg tggttgacgt cagccacgaa gaccccgagg tccagttcaa ctggtatgtc 840
gacggcgtgg aggtgcataa cgccaagaca aagccccgtg aggagcagtt caacagcacg 900
ttccgtgttg tctccgtcct caccgttgtg caccaagact ggttgaacgg caaggagtac 960
aagtgcaagg tctccaacaa gggcctcccc gcccccatcg agaagaccat ctccaaaacc 1020
aaaggccaac cccgcgaacc ccaagtctac accctgcccc cttcccgtga ggagatgacc 1080
aagaaccaag tcagcctgac ctgcctggtc aagggcttct accccagcga catcgccgtt 1140
gagtgggaga gcaatggtca gccggagaac aactacaaga ccacccctcc catgctggac 1200
tccgacggct ccttcttcct ctactccaaa ctcaccgtcg acaagagcag gtggcagcag 1260
ggcaacgtct tctcctgctc cgtcatgcat gaggctctgc acaaccacta cacgcaaaag 1320
agcctctccc tgtctccggg caag 1344
<210>56
<211>645
<212>DNA
<213>人
<400>56
gagatcgtct tgacgcagtc tcccggcacc ctgtctttgt ctcctggcga gagggccacc 60
ctctcttgca gggccagcca gagcgttcgc ggccgctact tggcctggta ccagcagaag 120
cctggccagg ctcccaggct cctcatctat ggtgcctcca gcagggccac tggcatccct 180
gacaggttca gcggcagcgg ttctggcacc gacttcactc tcaccatcag caggctggag 240
cctgaggatt ttgctgtctt ttactgccag caatatggca gctcgcctcg gacgttcggc 300
cagggcacca aggtggaaat caagcgcact gtggctgctc cctctgtctt catcttcccg 360
ccctctgatg agcagttgaa gtctggcact gcctctgttg tctgcctgct gaacaacttc 420
tatcccaggg aggccaaggt ccagtggaag gtcgataacg ccctccagtc gggcaactcc 480
caggagagcg tcactgagca ggacagcaag gacagcacct acagcctcag cagcaccctg 540
acgctgagca aggctgacta cgagaagcac aaggtctacg cctgcgaagt cacccatcag 600
ggcctgagct cgcccgtcac caagagcttc aacaggggcg agtgc 645
<210>57
<211>1572
<212>DNA
<213>人工的
<220>
<223>大型亚灰树花菌的CBD结构域和人IgG2重链的融合蛋白
<220>
<221>sig_peptide
<222>(1)..(20)
<220>
<221>CDS
<222>(1)..(1572)
<400>57
atg aag gcg atc ctc tct ctc gct gcc gcg ctc ttg agc gcc gcg ccc 48
Met Lys Ala Ile Leu Ser Leu Ala Ala Ala Leu Leu Ser Ala Ala Pro
1 5 10 15
gcg ttc tcg acc gca gtc tgg ggc cag tgc ggt ggc atc ggc ttc tcc 96
Ala Phe Ser Thr Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe Ser
20 25 30
ggc gac acc acg tgc acc gct tcc acc tgc gtg aag gtc aac gac tac 144
Gly Asp Thr Thr Cys Thr Ala Ser Thr Cys Val Lys Val Asn Asp Tyr
35 40 45
tac tcg cag tgc cag cct ggc gcg tcc gca ccc acg tca acc gcc tcc 192
Tyr Ser Gln Cys Gln Pro Gly Ala Ser Ala Pro Thr Ser Thr Ala Ser
50 55 60
gcg ccc ggc ccg tcc gcg tgc cct ttg gtg aag cgt gag gtc cag ctg 240
Ala Pro Gly Pro Ser Ala Cys Pro Leu Val Lys Arg Glu Val Gln Leu
65 70 75 80
ttg gag tct ggc gga ggc ttg gtc cag cct ggg ggg tcc ctg agg ctc 288
Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu
85 90 95
tcc tgt gcc gcc tct ggt ttc acc ttt agc agc tat gcc atg agc tgg 336
Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr Ala Met Ser Trp
100 105 110
gtc cgc cag gct cct ggc aag ggc ctg gaa tgg gtc tcc ggt att act 384
Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Gly Ile Thr
115 120 125
ggc agc ggt ggt agc acc tac tac gcc gac tcc gtt aag ggc cgc ttc 432
Gly Ser Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe
130 135 140
acc atc tcc agg gac aat tcc aag aac acg ctg tat ctg cag atg aac 480
Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn
145 150 155 160
agc ctg agg gcc gag gac acc gcc gtc tat tac tgc gcg aaa gat ccc 528
Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Asp Pro
165 170 175
ggt act acg gtt atc atg agc tgg ttc gac ccc tgg ggc cag gga acc 576
Gly Thr Thr Val Ile Met Ser Trp Phe Asp Pro Trp Gly Gln Gly Thr
180 185 190
ctg gtc acc gtc tcc tcc gcc tcc acc aag ggc cct tcg gtc ttc ccc 624
Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
195 200 205
ctg gcg ccc tgc tcc agg agc acc tcc gag agc acc gcg gcc ctg ggc 672
Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly
210 215 220
tgc ctg gtc aag gac tac ttc ccc gaa ccc gtt acg gtc tcg tgg aac 720
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
225 230 235 240
tcc ggc gct ctg acc agc ggc gtg cac acc ttc ccc gct gtc ctc cag 768
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
245 250 255
tcc tcc gga ctc tac tcc ctc agc agc gtc gtt acc gtg ccc tcc agc 816
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
260 265 270
aac ttc ggc acc cag acc tac acc tgc aac gtc gat cac aag ccc agc 864
Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro Ser
275 280 285
aac acc aag gtt gac aag aca gtt gag cgc aag tgt tgc gtc gag tgc 912
Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys Val Glu Cys
290 295 300
cct ccg tgc ccc gct ccc cct gtt gct gga ccc tcc gtc ttc ctc ttc 960
Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe
305 310 315 320
ccc cct aag ccc aag gac acc ctc atg atc tcc agg acc cct gag gtc 1008
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
325 330 335
acc tgc gtc gtg gtt gac gtc agc cac gaa gac ccc gag gtc cag ttc 1056
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln Phe
340 345 350
aac tgg tat gtc gac ggc gtg gag gtg cat aac gcc aag aca aag ccc 1104
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
355 360 365
cgt gag gag cag ttc aac agc acg ttc cgt gtt gtc tcc gtc ctc acc 1152
Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser Val Leu Thr
370 375 380
gtt gtg cac caa gac tgg ttg aac ggc aag gag tac aag tgc aag gtc 1200
Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
385 390 395 400
tcc aac aag ggc ctc ccc gcc ccc atc gag aag acc atc tcc aaa acc 1248
Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr
405 410 415
aaa ggc caa ccc cgc gaa ccc caa gtc tac acc ctg ccc cct tcc cgt 1296
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
420 425 430
gag gag atg acc aag aac caa gtc agc ctg acc tgc ctg gtc aag ggc 1344
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
435 440 445
ttc tac ccc agc gac atc gcc gtt gag tgg gag agc aat ggt cag ccg 1392
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
450 455 460
gag aac aac tac aag acc acc cct ccc atg ctg gac tcc gac ggc tcc 1440
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser Asp Gly Ser
465 470 475 480
ttc ttc ctc tac tcc aaa ctc acc gtc gac aag agc agg tgg cag cag 1488
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
485 490 495
ggc aac gtc ttc tcc tgc tcc gtc atg cat gag gct ctg cac aac cac 1536
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
500 505 510
tac acg caa aag agc ctc tcc ctg tct ccg ggc aag 1572
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
515 520
<210>58
<211>524
<212>PRT
<213>人工的
<220>
<223>大型亚灰树花菌的CBD结构域和人IgG2重链的融合蛋白
<400>58
Met Lys Ala Ile Leu Ser Leu Ala Ala Ala Leu Leu Ser Ala Ala Pro
1 5 10 15
Ala Phe Ser Thr Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe Ser
20 25 30
Gly Asp Thr Thr Cys Thr Ala Ser Thr Cys Val Lys Val Asn Asp Tyr
35 40 45
Tyr Ser Gln Cys Gln Pro Gly Ala Ser Ala Pro Thr Ser Thr Ala Ser
50 55 60
Ala Pro Gly Pro Ser Ala Cys Pro Leu Val Lys Arg Glu Val Gln Leu
65 70 75 80
Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu
85 90 95
Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr Ala Met Ser Trp
100 105 110
Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Gly Ile Thr
115 120 125
Gly Ser Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe
130 135 140
Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn
145 150 155 160
Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Asp Pro
165 170 175
Gly Thr Thr Val Ile Met Ser Trp Phe Asp Pro Trp Gly Gln Gly Thr
180 185 190
Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
195 200 205
Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly
210 215 220
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
225 230 235 240
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
245 250 255
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
260 265 270
Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro Ser
275 280 285
Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys Val Glu Cys
290 295 300
Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu Phe
305 310 315 320
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
325 330 335
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln Phe
340 345 350
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
355 360 365
Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser Val Leu Thr
370 375 380
Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
385 390 395 400
Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr
405 410 415
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
420 425 430
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
435 440 445
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
450 455 460
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser Asp Gly Ser
465 470 475 480
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
485 490 495
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
500 505 510
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
515 520
<210>59
<211>873
<212>DNA
<213>人工的
<220>
<223>大型亚灰树花菌的CBD结构域和人κ轻链的融合蛋白
<220>
<221>sig_peptide
<222>(1)..(20)
<220>
<221>CDS
<222>(1)..(873)
<400>59
atg aag gcg atc ctc tct ctc gct gcc gcg ctc ttg agc gcc gcg ccc 48
Met Lys Ala Ile Leu Ser Leu Ala Ala Ala Leu Leu Ser Ala Ala Pro
1 5 10 15
gcg ttc tcg acc gca gtc tgg ggc cag tgc ggt ggc atc ggc ttc tcc 96
Ala Phe Ser Thr Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe Ser
20 25 30
ggc gac acc acg tgc acc gct tcc acc tgc gtg aag gtc aac gac tac 144
Gly Asp Thr Thr Cys Thr Ala Ser Thr Cys Val Lys Val Asn Asp Tyr
35 40 45
tac tcg cag tgc cag cct ggc gcg tcc gca ccc acg tca acc gcc tcc 192
Tyr Ser Gln Cys Gln Pro Gly Ala Ser Ala Pro Thr Ser Thr Ala Ser
50 55 60
gcg ccc ggc ccg tcc gcg tgc cct ttg gtg aag cgt gag atc gtc ttg 240
Ala Pro Gly Pro Ser Ala Cys Pro Leu Val Lys Arg Glu Ile Val Leu
65 70 75 80
acg cag tct ccc ggc acc ctg tct ttg tct cct ggc gag agg gcc acc 288
Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr
85 90 95
ctc tct tgc agg gcc agc cag agc gtt cgc ggc cgc tac ttg gcc tgg 336
Leu Ser Cys Arg Ala Ser Gln Ser Val Arg Gly Arg Tyr Leu Ala Trp
100 105 110
tac cag cag aag cct ggc cag gct ccc agg ctc ctc atc tat ggt gcc 384
Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala
115 120 125
tcc agc agg gcc act ggc atc cct gac agg ttc agc ggc agc ggt tct 432
Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser
130 135 140
ggc acc gac ttc act ctc acc atc agc agg ctg gag cct gag gat ttt 480
Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe
145 150 155 160
gct gtc ttt tac tgc cag caa tat ggc agc tcg cct cgg acg ttc ggc 528
Ala Val Phe Tyr Cys Gln Gln Tyr Gly Ser Ser Pro Arg Thr Phe Gly
165 170 175
cag ggc acc aag gtg gaa atc aag cgc act gtg gct gct ccc tct gtc 576
Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val
180 185 190
ttc atc ttc ccg ccc tct gat gag cag ttg aag tct ggc act gcc tct 624
Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser
195 200 205
gtt gtc tgc ctg ctg aac aac ttc tat ccc agg gag gcc aag gtc cag 672
Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln
210 215 220
tgg aag gtc gat aac gcc ctc cag tcg ggc aac tcc cag gag agc gtc 720
Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val
225 230 235 240
act gag cag gac agc aag gac agc acc tac agc ctc agc agc acc ctg 768
Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu
245 250 255
acg ctg agc aag get gac tac gag aag cac aag gtc tac gcc tgc gaa 816
Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu
260 265 270
gtc acc cat cag ggc ctg agc tcg ccc gtc acc aag agc ttc aac agg 864
Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg
275 280 285
ggc gag tgc 873
Gly Glu Cys
290
<210>60
<211>291
<212>PRT
<213>人工的
<220>
<223>大型亚灰树花菌的CBD结构域和人κ轻链的融合蛋白
<400>60
Met Lys Ala Ile Leu Ser Leu Ala Ala Ala Leu Leu Ser Ala Ala Pro
1 5 10 15
Ala Phe Ser Thr Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe Ser
20 25 30
Gly Asp Thr Thr Cys Thr Ala Ser Thr Cys Val Lys Val Asn Asp Tyr
35 40 45
Tyr Ser Gln Cys Gln Pro Gly Ala Ser Ala Pro Thr Ser Thr Ala Ser
50 55 60
Ala Pro Gly Pro Ser Ala Cys Pro Leu Val Lys Arg Glu Ile Val Leu
65 70 75 80
Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr
85 90 95
Leu Ser Cys Arg Ala Ser Gln Ser Val Arg Gly Arg Tyr Leu Ala Trp
100 105 110
Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala
115 120 125
Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser
130 135 140
Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe
145 150 155 160
Ala Val Phe Tyr Cys Gln Gln Tyr Gly Ser Ser Pro Arg Thr Phe Gly
165 170 175
Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val
180 185 190
Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser
195 200 205
Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln
210 215 220
Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val
225 230 235 240
Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu
245 250 255
Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu
260 265 270
Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg
275 280 285
Gly Glu Cys
290
<210>61
<211>1404
<212>DNA
<213>人工的
<220>
<223>TAKA信号肽与人IgG2重链的融合蛋白
<220>
<221>sig_peptide
<222>(1)..(20)
<400>61
atggtcgcgt ggtggtctct atttctgtac ggtcttcagg tcgcagcacc tgctttggcc 60
gaggtccagc tgttggagtc tggcggaggc ttggtccagc ctggggggtc cctgaggctc 120
tcctgtgccg cctctggttt cacctttagc agctatgcca tgagctgggt ccgccaggct 180
cctggcaagg gcctggaatg ggtctccggt attactggca gcggtggtag cacctactac 240
gccgactccg ttaagggccg cttcaccatc tccagggaca attccaagaa cacgctgtat 300
ctgcagatga acagcctgag ggccgaggac accgccgtct attactgcgc gaaagatccc 360
ggtactacgg ttatcatgag ctggttcgac ccctggggcc agggaaccct ggtcaccgtc 420
tcctccgcct ccaccaaggg cccttcggtc ttccccctgg cgccctgctc caggagcacc 480
tccgagagca ccgcggccct gggctgcctg gtcaaggact acttccccga acccgttacg 540
gtctcgtgga actccggcgc tctgaccagc ggcgtgcaca ccttccccgc tgtcctccag 600
tcctccggac tctactccct cagcagcgtc gttaccgtgc cctccagcaa cttcggcacc 660
cagacctaca cctgcaacgt cgatcacaag cccagcaaca ccaaggttga caagacagtt 720
gagcgcaagt gttgcgtcga gtgccctccg tgccccgctc cccctgttgc tggaccctcc 780
gtcttcctct tcccccctaa gcccaaggac accctcatga tctccaggac ccctgaggtc 840
acctgcgtcg tggttgacgt cagccacgaa gaccccgagg tccagttcaa ctggtatgtc 900
gacggcgtgg aggtgcataa cgccaagaca aagccccgtg aggagcagtt caacagcacg 960
ttccgtgttg tctccgtcct caccgttgtg caccaagact ggttgaacgg caaggagtac 1020
aagtgcaagg tctccaacaa gggcctcccc gcccccatcg agaagaccat ctccaaaacc 1080
aaaggccaac cccgcgaacc ccaagtctac accctgcccc cttcccgtga ggagatgacc 1140
aagaaccaag tcagcctgac ctgcctggtc aagggcttct accccagcga catcgccgtt 1200
gagtgggaga gcaatggtca gccggagaac aactacaaga ccacccctcc catgctggac 1260
tccgacggct ccttcttcct ctactccaaa ctcaccgtcg acaagagcag gtggcagcag 1320
ggcaacgtct tctcctgctc cgtcatgcat gaggctctgc acaaccacta cacgcaaaag 1380
agcctctccc tgtctccggg caag 1404
<210>62
<211>705
<212>DNA
<213>人工的
<220>
<223>TAKA信号肽与人IgG2轻(κ)链的融合蛋白
<220>
<221>sig_peptide
<222>(1)..(20)
<400>62
atggtcgcgt ggtggtctct atttctgtac ggtcttcagg tcgcagcacc tgctttggcc 60
gagatcgtct tgacgcagtc tcccggcacc ctgtctttgt ctcctggcga gagggccacc 120
ctctcttgca gggccagcca gagcgttcgc ggccgctact tggcctggta ccagcagaag 180
cctggccagg ctcccaggct cctcatctat ggtgcctcca gcagggccac tggcatccct 240
gacaggttca gcggcagcgg ttctggcacc gacttcactc tcaccatcag caggctggag 300
cctgaggatt ttgctgtctt ttactgccag caatatggca gctcgcctcg gacgttcggc 360
cagggcacca aggtggaaat caagcgcact gtggctgctc cctctgtctt catcttcccg 420
ccctctgatg agcagttgaa gtctggcact gcctctgttg tctgcctgct gaacaacttc 480
tatcccaggg aggccaaggt ccagtggaag gtcgataacg ccctccagtc gggcaactcc 540
caggagagcg tcactgagca ggacagcaag gacagcacct acagcctcag cagcaccctg 600
acgctgagca aggctgacta cgagaagcac aaggtctacg cctgcgaagt cacccatcag 660
ggcctgagct cgcccgtcac caagagcttc aacaggggcg agtgc 705
<210>63
<211>40
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>63
gactccaaca gctggacctc acgcttcacc aaagggcacg 40
<210>64
<211>40
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>64
cgtgcccttt ggtgaagcgt gaggtccagc tgttggagtc 40
<210>65
<211>39
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>65
gactccaaca gctggacctc ggccaaagca ggtgctgcg 39
<210>66
<211>39
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>66
cgcagcacct gctttggccg aggtccagct gttggagtc 39
<210>67
<211>27
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>67
gacctcgagt tacttgcccg gagacag 27
<210>68
<211>40
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>68
gactgcgtca agacgatctc acgcttcacc aaagggcacg 40
<210>69
<211>40
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>69
cgtgcccttt ggtgaagcgt gagatcgtct tgacgcagtc 40
<210>70
<211>39
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>70
gactgcgtca agacgatctc ggccaaagca ggtgctgcg 39
<210>71
<211>39
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>71
cgcagcacct gctttggccg agatcgtctt gacgcagtc 39
<210>72
<211>28
<212>DNA
<213>人工的
<220>
<223>引物序列
<400>72
gacctcgagt tagcactcgc ccctgttg 28
<210>73
<211>7
<212>PRT
<213>人工的
<220>
<223>IgG2轻(κ)链的N末端序列
<400>73
Glu Ile Val Leu Thr Gln Ser
1 5
<210>74
<211>8
<212>PRT
<213>人工的
<220>
<223>IgG2重链的N末端序列
<400>74
Glu Val Gln Leu Leu Gln Ser Gly
1 5
Claims (27)
1、生产单克隆抗体的方法,其包括:
a)提供包含第一细胞核和第二细胞核的异核体真菌,其中所述第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且其中所述第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体,且其中至少一个所述核酸构建体还包含编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列;
b)在适于表达抗体轻链和重链的条件下培养异核体真菌。
2、根据权利要求1的方法,其中异核体为丝状异核体真菌。
3、根据权利要求1的方法,其中异核体为酵母异核体。
4、根据前述任一项权利要求的方法,其中第二核酸序列位于第一核酸序列上游。
5、根据前述任一项权利要求的方法,其中第二核酸序列编码纤维素结合结构域。
6、根据前述任一项权利要求的方法,其中至少一个所述核酸构建体还包含编码信号肽的第三核酸序列,其中所述信号肽与所述核酸构建体的第一核酸序列异源。
7、根据权利要求6的方法,其中信号肽来自米曲霉α-淀粉酶基因(SEQID NO:26)。
8、根据权利要求6的方法,其中信号肽来自南极假丝酵母脂酶基因(SEQ ID NO:27)。
9、根据权利要求8的方法,其中至少一个所述核酸构建体还包含编码南极假丝酵母脂酶B基因前序列(SEQ ID NO:28)的核酸序列。
10、根据权利要求1-9中任一项的方法,其中第一核酸构建体的轻链表达或第二核酸构建体的重链表达或两者都位于诱导型启动子控制下,且其中步骤b)中的培养通过首先在启动子不被诱导的条件下和随后在启动子被诱导的条件下培养异核体真菌进行,且其中温度在启动子被诱导的条件下培养期间降低。
11、生产单克隆抗体的方法,其包括
a)提供包含第一细胞核和第二细胞核的异核体真菌,其中所述第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且其中所述第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体,且其中至少一个所述核酸构建体还包含编码与第一核酸序列异源的信号肽的第三核酸序列;
b)在适于表达抗体轻链和重链的条件下培养异核体真菌。
12、根据权利要求11的方法,其中异核体为丝状异核体真菌。
13、根据权利要求11的方法,其中异核体为酵母异核体。
14、根据权利要求11-13任一项的方法,其中信号肽来自米曲霉α-淀粉酶基因(SEQ ID NO:26)。
15、根据权利要求11-13任一项的方法,其中信号肽来自南极假丝酵母脂酶基因(SEQ ID NO:27)。
16、根据权利要求15的方法,其中至少一个所述核酸构建体还包含编码南极假丝酵母脂酶B基因前序列(SEQ ID NO:28)的核酸序列。
17、根据权利要求11-16中任一项的方法,其中第一核酸构建体的轻链表达或第二核酸构建体的重链表达或两者都位于诱导型启动子控制下,且其中步骤b)中的培养通过首先在启动子不被诱导的条件下和随后在启动子被诱导的条件下培养异核体真菌进行,且其中温度在启动子被诱导的条件下培养期间降低。
18、包含编码抗体轻链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的核酸构建体。
19、包含编码抗体重链的第一核酸序列和编码与第一核酸序列异源的信号肽的第三核酸序列的核酸构建体。
20、根据权利要求18-19任一项的方法,其中信号肽来自米曲霉α-淀粉酶基因(SEQ ID NO:26)或来自南极假丝酵母脂酶基因(SEQ ID NO:27)。
21、根据权利要求20的核酸构建体,其中所述核酸构建体还包含编码来自南极假丝酵母脂酶B基因的前序列(SEQ ID NO:28)的核酸序列。
22、根据权利要求18-21中任一项的核酸构建体,其中所述构建体还包含编码通常由真菌表达的分泌型多肽或其功能性部分的第二核酸序列。
23、根据权利要求22的核酸构建体,其中所述第二核酸序列编码纤维素结合结构域。
24、核酸构建体,其包含编码抗体轻链的第一核酸序列和编码纤维素结合结构域的第二核酸序列。
25、核酸构建体,其包含编码抗体重链的第一核酸序列和编码纤维素结合结构域的第二核酸序列。
26、包含第一细胞核和第二细胞核的异核体真菌宿主细胞,其中所述第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且其中所述第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体,且其中至少一个所述核酸构建体还包含编码通常由真菌分泌的多肽或其功能性部分的第二核酸序列。
27、包含第一细胞核和第二细胞核的异核体真菌宿主细胞,其中所述第一细胞核包含含有编码抗体轻链的第一核酸序列的第一核酸构建体,且其中所述第二细胞核包含含有编码抗体重链的第一核酸序列的第二核酸构建体,且其中至少一个所述核酸构建体还包含编码与第一核酸序列异源的信号肽的第三核酸序列。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DKPA200400077 | 2004-01-21 | ||
DKPA200400077 | 2004-01-21 | ||
DKPA200400174 | 2004-02-05 | ||
DKPA200400761 | 2004-05-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1918179A true CN1918179A (zh) | 2007-02-21 |
Family
ID=37738657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800050052A Pending CN1918179A (zh) | 2004-01-21 | 2005-01-20 | 在异核体真菌或真菌宿主细胞中产生单克隆抗体 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1918179A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106459185A (zh) * | 2014-04-02 | 2017-02-22 | 普雷斯蒂奇生物制药私人有限公司 | 通过调节抗体的含糖量制备抗体的方法 |
CN114426581A (zh) * | 2022-01-07 | 2022-05-03 | 陕西脉元生物科技有限公司 | 一种烯醇化酶单克隆抗体及其制备方法和应用 |
-
2005
- 2005-01-20 CN CNA2005800050052A patent/CN1918179A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106459185A (zh) * | 2014-04-02 | 2017-02-22 | 普雷斯蒂奇生物制药私人有限公司 | 通过调节抗体的含糖量制备抗体的方法 |
CN114426581A (zh) * | 2022-01-07 | 2022-05-03 | 陕西脉元生物科技有限公司 | 一种烯醇化酶单克隆抗体及其制备方法和应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1871359A (zh) | 使用单倍体交配策略在酵母中合成异聚多亚基多肽的方法 | |
TW200540185A (en) | Production of a monoclonal antibody in a heterokaryon fungus or in a fungal host cell | |
CN1271205C (zh) | 重新构建的人抗hm1.24抗体 | |
CN101292024A (zh) | 用于表达抗体的真菌突变体的用途 | |
CN1250570C (zh) | 衍生自免疫球蛋白的不触发补体介导的裂解的结合分子 | |
CN1656122A (zh) | 人源抗白细胞介素5单克隆抗体及其制备方法和包含这些抗体的组合物 | |
CN1241944C (zh) | 抗人白介素-5受体α链的抗体 | |
CN1105728C (zh) | 用于治疗il4介导疾病的重组il4抗体 | |
CN1186517A (zh) | 具有更长半衰期的变异多肽 | |
CN1906213A (zh) | 白细胞介素-10抗体 | |
CN1547590A (zh) | 人源化抗-LT-β-R抗体 | |
CN1203603A (zh) | 由抗-Fc受体抗体组成的治疗化合物 | |
CN1268645C (zh) | 含有抗-fc受体结合剂的治疗化合物 | |
CN101058609A (zh) | 人源抗体及其表达 | |
CN1200737A (zh) | 用于人治疗的重组抗cd4抗体 | |
CN1802388A (zh) | Cd20特异抗体及使用它们的方法 | |
US20100062491A1 (en) | Overexpression of the Chaperone BIP in a Heterokaryon | |
CN1246154A (zh) | Ob融合蛋白组合物及方法 | |
CN1575303A (zh) | 人cdr-移植抗体及其抗体片段 | |
CN1439022A (zh) | 抗协同刺激信号转导分子ailim的人单克隆抗体及其药物用途 | |
CN1171815A (zh) | 来自曲霉属融合产物中经加工的重组乳铁蛋白和乳铁蛋白多肽片断的表达 | |
CN1898267A (zh) | 修饰的抗cd52抗体 | |
CN1639192A (zh) | 抗人腱生蛋白单克隆抗体 | |
CN1272345C (zh) | 沉默型抗cd-28抗体及其应用 | |
CN1283662C (zh) | 拮抗性抗hFAS配基人类抗体及其片段 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20070221 |