KR101930961B1 - 피키아 파스토리스에서 생산된 치료 당단백질 상의 n-글리코실화 부위 점유를 증가시키는 방법 - Google Patents
피키아 파스토리스에서 생산된 치료 당단백질 상의 n-글리코실화 부위 점유를 증가시키는 방법 Download PDFInfo
- Publication number
- KR101930961B1 KR101930961B1 KR1020127022052A KR20127022052A KR101930961B1 KR 101930961 B1 KR101930961 B1 KR 101930961B1 KR 1020127022052 A KR1020127022052 A KR 1020127022052A KR 20127022052 A KR20127022052 A KR 20127022052A KR 101930961 B1 KR101930961 B1 KR 101930961B1
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- antibody
- glcnac
- glycoprotein
- host cell
- Prior art date
Links
- 102000003886 Glycoproteins Human genes 0.000 title claims abstract description 308
- 108090000288 Glycoproteins Proteins 0.000 title claims abstract description 308
- 230000004988 N-glycosylation Effects 0.000 title claims abstract description 117
- 238000000034 method Methods 0.000 title claims abstract description 100
- 241000235058 Komagataella pastoris Species 0.000 title claims description 207
- 230000001965 increasing effect Effects 0.000 title abstract description 16
- 230000001225 therapeutic effect Effects 0.000 title abstract description 15
- 210000004027 cell Anatomy 0.000 claims abstract description 452
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 256
- 108010089072 Dolichyl-diphosphooligosaccharide-protein glycotransferase Proteins 0.000 claims abstract description 209
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 175
- 241000222732 Leishmania major Species 0.000 claims abstract description 5
- 108020004707 nucleic acids Proteins 0.000 claims description 235
- 102000039446 nucleic acids Human genes 0.000 claims description 235
- 150000007523 nucleic acids Chemical class 0.000 claims description 235
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 claims description 167
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 claims description 151
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 claims description 151
- 241000282414 Homo sapiens Species 0.000 claims description 106
- 239000000203 mixture Substances 0.000 claims description 106
- 230000000694 effects Effects 0.000 claims description 52
- 102000037865 fusion proteins Human genes 0.000 claims description 33
- 108020001507 fusion proteins Proteins 0.000 claims description 33
- 238000012258 culturing Methods 0.000 claims description 15
- 102000005962 receptors Human genes 0.000 claims description 13
- 108020003175 receptors Proteins 0.000 claims description 13
- 102000003951 Erythropoietin Human genes 0.000 claims description 10
- 108090000394 Erythropoietin Proteins 0.000 claims description 10
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 claims description 10
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 claims description 10
- 102100040247 Tumor necrosis factor Human genes 0.000 claims description 10
- 229940105423 erythropoietin Drugs 0.000 claims description 10
- 230000004927 fusion Effects 0.000 claims description 10
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 claims description 10
- 108010039209 Blood Coagulation Factors Proteins 0.000 claims description 9
- 102000015081 Blood Coagulation Factors Human genes 0.000 claims description 9
- 239000003114 blood coagulation factor Substances 0.000 claims description 9
- 108091006020 Fc-tagged proteins Proteins 0.000 claims description 8
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims description 8
- 239000000427 antigen Substances 0.000 claims description 8
- 108091007433 antigens Proteins 0.000 claims description 7
- 102000036639 antigens Human genes 0.000 claims description 7
- 230000012010 growth Effects 0.000 claims description 7
- 102000004547 Glucosylceramidase Human genes 0.000 claims description 6
- 108010017544 Glucosylceramidase Proteins 0.000 claims description 6
- 241000124008 Mammalia Species 0.000 claims description 6
- 241000700605 Viruses Species 0.000 claims description 6
- 108010079709 Angiostatins Proteins 0.000 claims description 5
- 102000004411 Antithrombin III Human genes 0.000 claims description 5
- 108090000935 Antithrombin III Proteins 0.000 claims description 5
- 101001107784 Caenorhabditis elegans Deoxyribonuclease-2 Proteins 0.000 claims description 5
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 claims description 5
- 102000001493 Cyclophilins Human genes 0.000 claims description 5
- 108010068682 Cyclophilins Proteins 0.000 claims description 5
- 102000004127 Cytokines Human genes 0.000 claims description 5
- 108090000695 Cytokines Proteins 0.000 claims description 5
- 102400001368 Epidermal growth factor Human genes 0.000 claims description 5
- 101800003838 Epidermal growth factor Proteins 0.000 claims description 5
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 claims description 5
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 claims description 5
- 101000605403 Homo sapiens Plasminogen Proteins 0.000 claims description 5
- 101500025568 Homo sapiens Saposin-D Proteins 0.000 claims description 5
- 102000009438 IgE Receptors Human genes 0.000 claims description 5
- 108010073816 IgE Receptors Proteins 0.000 claims description 5
- 102000006992 Interferon-alpha Human genes 0.000 claims description 5
- 108010047761 Interferon-alpha Proteins 0.000 claims description 5
- 108090000467 Interferon-beta Proteins 0.000 claims description 5
- 102000003996 Interferon-beta Human genes 0.000 claims description 5
- 108010074328 Interferon-gamma Proteins 0.000 claims description 5
- 102000008070 Interferon-gamma Human genes 0.000 claims description 5
- 102000014150 Interferons Human genes 0.000 claims description 5
- 108010050904 Interferons Proteins 0.000 claims description 5
- 102000015696 Interleukins Human genes 0.000 claims description 5
- 108010063738 Interleukins Proteins 0.000 claims description 5
- 108010035042 Osteoprotegerin Proteins 0.000 claims description 5
- 102000008108 Osteoprotegerin Human genes 0.000 claims description 5
- 108090000190 Thrombin Proteins 0.000 claims description 5
- 101710162629 Trypsin inhibitor Proteins 0.000 claims description 5
- 229940122618 Trypsin inhibitor Drugs 0.000 claims description 5
- 239000012190 activator Substances 0.000 claims description 5
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 claims description 5
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 claims description 5
- 229940024142 alpha 1-antitrypsin Drugs 0.000 claims description 5
- 102000013529 alpha-Fetoproteins Human genes 0.000 claims description 5
- 108010026331 alpha-Fetoproteins Proteins 0.000 claims description 5
- 229960005348 antithrombin iii Drugs 0.000 claims description 5
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 claims description 5
- 229910052791 calcium Inorganic materials 0.000 claims description 5
- 239000011575 calcium Substances 0.000 claims description 5
- 239000004202 carbamide Substances 0.000 claims description 5
- 230000003511 endothelial effect Effects 0.000 claims description 5
- 229940116977 epidermal growth factor Drugs 0.000 claims description 5
- 229960004222 factor ix Drugs 0.000 claims description 5
- 229960000301 factor viii Drugs 0.000 claims description 5
- 229940028334 follicle stimulating hormone Drugs 0.000 claims description 5
- 229940100689 human protein c Drugs 0.000 claims description 5
- 102000028416 insulin-like growth factor binding Human genes 0.000 claims description 5
- 108091022911 insulin-like growth factor binding Proteins 0.000 claims description 5
- 229940079322 interferon Drugs 0.000 claims description 5
- 229960003130 interferon gamma Drugs 0.000 claims description 5
- 229960001388 interferon-beta Drugs 0.000 claims description 5
- 239000003446 ligand Substances 0.000 claims description 5
- 210000003643 myeloid progenitor cell Anatomy 0.000 claims description 5
- XXUPLYBCNPLTIW-UHFFFAOYSA-N octadec-7-ynoic acid Chemical compound CCCCCCCCCCC#CCCCCCC(O)=O XXUPLYBCNPLTIW-UHFFFAOYSA-N 0.000 claims description 5
- 229960004072 thrombin Drugs 0.000 claims description 5
- 239000002753 trypsin inhibitor Substances 0.000 claims description 5
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 claims description 5
- 230000002792 vascular Effects 0.000 claims description 5
- 108010038453 Interleukin-2 Receptors Proteins 0.000 claims description 4
- 102000010789 Interleukin-2 Receptors Human genes 0.000 claims description 4
- 241000725643 Respiratory syncytial virus Species 0.000 claims description 4
- 108010039255 alpha 1,6-mannosyltransferase Proteins 0.000 claims description 4
- 239000000018 receptor agonist Substances 0.000 claims description 4
- 229940044601 receptor agonist Drugs 0.000 claims description 4
- 102100024539 Chymase Human genes 0.000 claims description 3
- 108090000227 Chymases Proteins 0.000 claims description 3
- 108700012920 TNF Proteins 0.000 claims description 3
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 claims description 3
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 claims description 3
- 230000007910 cell fusion Effects 0.000 claims description 3
- 230000000241 respiratory effect Effects 0.000 claims description 3
- 229960005356 urokinase Drugs 0.000 claims description 3
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 claims description 2
- 102000012936 Angiostatins Human genes 0.000 claims 2
- 101001057504 Homo sapiens Interferon-stimulated gene 20 kDa protein Proteins 0.000 claims 2
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 claims 2
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 claims 2
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 claims 2
- 210000003714 granulocyte Anatomy 0.000 claims 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 abstract description 188
- 230000014509 gene expression Effects 0.000 abstract description 175
- 241000233866 Fungi Species 0.000 abstract description 21
- 241000238631 Hexapoda Species 0.000 abstract description 14
- 210000003527 eukaryotic cell Anatomy 0.000 abstract description 11
- 210000004962 mammalian cell Anatomy 0.000 abstract description 8
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 186
- 235000018102 proteins Nutrition 0.000 description 164
- 239000013612 plasmid Substances 0.000 description 127
- 241000235648 Pichia Species 0.000 description 88
- 238000006206 glycosylation reaction Methods 0.000 description 75
- 230000013595 glycosylation Effects 0.000 description 72
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 64
- 108700026244 Open Reading Frames Proteins 0.000 description 62
- 239000002773 nucleotide Substances 0.000 description 61
- 125000003729 nucleotide group Chemical group 0.000 description 61
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 60
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 58
- 101150099625 STT3 gene Proteins 0.000 description 52
- 101150044776 URA5 gene Proteins 0.000 description 46
- 230000005030 transcription termination Effects 0.000 description 45
- 230000003197 catalytic effect Effects 0.000 description 43
- 230000008685 targeting Effects 0.000 description 41
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 40
- 108010076504 Protein Sorting Signals Proteins 0.000 description 36
- 101150066555 lacZ gene Proteins 0.000 description 35
- 230000035897 transcription Effects 0.000 description 33
- 238000013518 transcription Methods 0.000 description 33
- 239000013598 vector Substances 0.000 description 33
- 108090000992 Transferases Proteins 0.000 description 32
- 102000004190 Enzymes Human genes 0.000 description 31
- 108090000790 Enzymes Proteins 0.000 description 31
- 229940088598 enzyme Drugs 0.000 description 31
- 241000894006 Bacteria Species 0.000 description 30
- 102000004357 Transferases Human genes 0.000 description 30
- 238000004519 manufacturing process Methods 0.000 description 30
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 26
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 26
- 230000002829 reductive effect Effects 0.000 description 26
- 230000002538 fungal effect Effects 0.000 description 25
- 231100000518 lethal Toxicity 0.000 description 25
- 230000001665 lethal effect Effects 0.000 description 25
- 241000894007 species Species 0.000 description 25
- 241000228245 Aspergillus niger Species 0.000 description 24
- 101150101848 PMA1 gene Proteins 0.000 description 23
- 230000035772 mutation Effects 0.000 description 23
- 108060003951 Immunoglobulin Proteins 0.000 description 22
- 150000001720 carbohydrates Chemical class 0.000 description 22
- 150000004676 glycans Chemical class 0.000 description 22
- 102000018358 immunoglobulin Human genes 0.000 description 22
- 241000196324 Embryophyta Species 0.000 description 21
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 21
- 241000223218 Fusarium Species 0.000 description 19
- 230000001939 inductive effect Effects 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 18
- 102100038002 Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit STT3A Human genes 0.000 description 18
- 102100037443 Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit STT3B Human genes 0.000 description 18
- 101000661592 Homo sapiens Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit STT3A Proteins 0.000 description 18
- 101000879240 Homo sapiens Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit STT3B Proteins 0.000 description 18
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 18
- 101150001810 TEAD1 gene Proteins 0.000 description 18
- 101150074253 TEF1 gene Proteins 0.000 description 18
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 18
- 101150061302 och1 gene Proteins 0.000 description 18
- 241000228212 Aspergillus Species 0.000 description 17
- WYUKJASPBYYQRJ-VSJOFRJTSA-N beta-D-GlcpNAc-(1->2)-alpha-D-Manp-(1->3)-[beta-D-GlcpNAc-(1->2)-alpha-D-Manp-(1->6)]-beta-D-Manp-(1->4)-beta-GlcpNAc-(1->4)-beta-D-GlcpNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)NC(C)=O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)NC(C)=O)O2)O)[C@@H](CO)O1 WYUKJASPBYYQRJ-VSJOFRJTSA-N 0.000 description 17
- 238000012217 deletion Methods 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 239000003937 drug carrier Substances 0.000 description 17
- LKKMLIBUAXYLOY-UHFFFAOYSA-N 3-Amino-1-methyl-5H-pyrido[4,3-b]indole Chemical compound N1C2=CC=CC=C2C2=C1C=C(N)N=C2C LKKMLIBUAXYLOY-UHFFFAOYSA-N 0.000 description 16
- 102100031413 L-dopachrome tautomerase Human genes 0.000 description 16
- 101710093778 L-dopachrome tautomerase Proteins 0.000 description 16
- 108010054377 Mannosidases Proteins 0.000 description 16
- 102000001696 Mannosidases Human genes 0.000 description 16
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 16
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 15
- 150000002482 oligosaccharides Chemical class 0.000 description 15
- 235000000346 sugar Nutrition 0.000 description 15
- 102100039104 Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit DAD1 Human genes 0.000 description 14
- 101150082479 GAL gene Proteins 0.000 description 14
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 14
- 101001130785 Homo sapiens Dolichyl-diphosphooligosaccharide-protein glycosyltransferase 48 kDa subunit Proteins 0.000 description 14
- 101000884921 Homo sapiens Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit DAD1 Proteins 0.000 description 14
- 101000649993 Homo sapiens WW domain-binding protein 1 Proteins 0.000 description 14
- 241000699666 Mus <mouse, genus> Species 0.000 description 14
- SQVRNKJHWKZAKO-PFQGKNLYSA-N N-acetyl-beta-neuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-PFQGKNLYSA-N 0.000 description 14
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 14
- 102100028279 WW domain-binding protein 1 Human genes 0.000 description 14
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 14
- 102100034583 Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit 1 Human genes 0.000 description 13
- 102100039216 Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit 2 Human genes 0.000 description 13
- 241000206602 Eukaryota Species 0.000 description 13
- 101000848781 Homo sapiens Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit 1 Proteins 0.000 description 13
- 101000670093 Homo sapiens Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit 2 Proteins 0.000 description 13
- 102000005431 Molecular Chaperones Human genes 0.000 description 13
- 108010006519 Molecular Chaperones Proteins 0.000 description 13
- 241000499912 Trichoderma reesei Species 0.000 description 13
- 230000001413 cellular effect Effects 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 230000006801 homologous recombination Effects 0.000 description 13
- 238000002744 homologous recombination Methods 0.000 description 13
- 230000010354 integration Effects 0.000 description 13
- 229920001542 oligosaccharide Polymers 0.000 description 13
- 230000037361 pathway Effects 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 13
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 12
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 229930182830 galactose Natural products 0.000 description 12
- 108010083819 mannosyl-oligosaccharide 1,3 - 1,6-alpha-mannosidase Proteins 0.000 description 12
- 108010078791 Carrier Proteins Proteins 0.000 description 11
- 102100039059 Dol-P-Man:Man(5)GlcNAc(2)-PP-Dol alpha-1,3-mannosyltransferase Human genes 0.000 description 11
- 101000958975 Homo sapiens Dol-P-Man:Man(5)GlcNAc(2)-PP-Dol alpha-1,3-mannosyltransferase Proteins 0.000 description 11
- 101150088826 arg1 gene Proteins 0.000 description 11
- 229940072221 immunoglobulins Drugs 0.000 description 11
- 241000235070 Saccharomyces Species 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- GRHWEVYJIHXESA-HBHDJDHDSA-N beta-D-Galp-(1->4)-beta-D-GlcpNAc-(1->2)-alpha-D-Manp-(1->3)-[beta-D-Galp-(1->4)-beta-D-GlcpNAc-(1->2)-alpha-D-Manp-(1->6)]-beta-D-Manp-(1->4)-beta-D-GlcpNAc-(1->4)-beta-D-GlcpNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@H]3[C@@H]([C@@H](O)[C@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@@H](CO)O3)NC(C)=O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@H]3[C@@H]([C@@H](O)[C@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@@H](CO)O3)NC(C)=O)O2)O)[C@@H](CO)O1 GRHWEVYJIHXESA-HBHDJDHDSA-N 0.000 description 10
- 238000005251 capillar electrophoresis Methods 0.000 description 10
- 239000003112 inhibitor Substances 0.000 description 10
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 10
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- 230000004989 O-glycosylation Effects 0.000 description 9
- 241001452677 Ogataea methanolica Species 0.000 description 9
- 108090000141 Sialyltransferases Proteins 0.000 description 9
- 102000003838 Sialyltransferases Human genes 0.000 description 9
- 108010086873 UDP-N-acetylglucosamine transporter Proteins 0.000 description 9
- 108010009689 mannosyl-oligosaccharide 1,2-alpha-mannosidase Proteins 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-M Aminoacetate Chemical compound NCC([O-])=O DHMQDGOQFOQNFH-UHFFFAOYSA-M 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- 102100021771 Endoplasmic reticulum mannosyl-oligosaccharide 1,2-alpha-mannosidase Human genes 0.000 description 8
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 8
- 241001489174 Ogataea minuta Species 0.000 description 8
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 8
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 8
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 8
- 230000006378 damage Effects 0.000 description 8
- 230000002401 inhibitory effect Effects 0.000 description 8
- -1 mannose sugars Chemical class 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 239000002904 solvent Substances 0.000 description 8
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 8
- 229940045145 uridine Drugs 0.000 description 8
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 7
- 241000351920 Aspergillus nidulans Species 0.000 description 7
- 101150103529 BMT1 gene Proteins 0.000 description 7
- 101150048748 BMT4 gene Proteins 0.000 description 7
- 108060003306 Galactosyltransferase Proteins 0.000 description 7
- 102000030902 Galactosyltransferase Human genes 0.000 description 7
- 101150003690 HIS1 gene Proteins 0.000 description 7
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 7
- 206010026749 Mania Diseases 0.000 description 7
- 241000807025 Nilus Species 0.000 description 7
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 7
- 229950006780 n-acetylglucosamine Drugs 0.000 description 7
- 235000016709 nutrition Nutrition 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- RYXGNICFFBWCJA-LRRROBGASA-N (2S,4S,5R,6R)-5-acetamido-4-hydroxy-2-[(2R,3S,4S,5R)-2,4,5,6-tetrahydroxy-1-oxohexan-3-yl]oxy-6-[(1R,2R)-1,2,3-trihydroxypropyl]oxane-2-carboxylic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O[C@H]([C@@H](O)C=O)[C@@H](O)[C@H](O)CO)(O[C@H]1[C@H](O)[C@H](O)CO)C(O)=O RYXGNICFFBWCJA-LRRROBGASA-N 0.000 description 6
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- 240000006439 Aspergillus oryzae Species 0.000 description 6
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 101150105487 BMT3 gene Proteins 0.000 description 6
- 101100184475 Candida albicans (strain SC5314 / ATCC MYA-2876) MNN24 gene Proteins 0.000 description 6
- 241000123346 Chrysosporium Species 0.000 description 6
- 108010019236 Fucosyltransferases Proteins 0.000 description 6
- 102000006471 Fucosyltransferases Human genes 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- 101000997654 Homo sapiens N-acetylmannosamine kinase Proteins 0.000 description 6
- 101100488151 Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) YEA4 gene Proteins 0.000 description 6
- 101150093457 MNN2 gene Proteins 0.000 description 6
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical group CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 6
- 241000826199 Ogataea wickerhamii Species 0.000 description 6
- 101001009270 Pasteurella multocida N-acetylgalactosaminyl-proteoglycan 3-beta-glucuronosyltransferase Proteins 0.000 description 6
- 102100032491 Serine protease 1 Human genes 0.000 description 6
- 102100033782 UDP-galactose translocator Human genes 0.000 description 6
- 108010075920 UDP-galactose translocator Proteins 0.000 description 6
- 229940024606 amino acid Drugs 0.000 description 6
- 235000001014 amino acid Nutrition 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 210000002288 golgi apparatus Anatomy 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 125000001736 nosyl group Chemical group S(=O)(=O)(C1=CC=C([N+](=O)[O-])C=C1)* 0.000 description 6
- 230000002018 overexpression Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 229940035893 uracil Drugs 0.000 description 6
- 239000003643 water by type Substances 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- 239000004475 Arginine Substances 0.000 description 5
- 101150046676 BMT2 gene Proteins 0.000 description 5
- 101150089473 CWP1 gene Proteins 0.000 description 5
- 101100130886 Candida albicans (strain SC5314 / ATCC MYA-2876) MNT1 gene Proteins 0.000 description 5
- 102100032339 Dol-P-Man:Man(7)GlcNAc(2)-PP-Dol alpha-1,6-mannosyltransferase Human genes 0.000 description 5
- 101000797862 Homo sapiens Dol-P-Man:Man(7)GlcNAc(2)-PP-Dol alpha-1,6-mannosyltransferase Proteins 0.000 description 5
- 101000611655 Homo sapiens Prolactin regulatory element-binding protein Proteins 0.000 description 5
- 101000655308 Homo sapiens S-adenosylmethionine sensor upstream of mTORC1 Proteins 0.000 description 5
- 101000626080 Homo sapiens Thyrotroph embryonic factor Proteins 0.000 description 5
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 5
- 102000003505 Myosin Human genes 0.000 description 5
- 108060008487 Myosin Proteins 0.000 description 5
- 102000000447 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Human genes 0.000 description 5
- 108010055817 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Proteins 0.000 description 5
- 102100040658 Prolactin regulatory element-binding protein Human genes 0.000 description 5
- 102100032896 S-adenosylmethionine sensor upstream of mTORC1 Human genes 0.000 description 5
- 101100454113 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KRE2 gene Proteins 0.000 description 5
- 101150118153 URA6 gene Proteins 0.000 description 5
- 229960000643 adenine Drugs 0.000 description 5
- 108010070113 alpha-1,3-mannosyl-glycoprotein beta-1,2-N-acetylglucosaminyltransferase I Proteins 0.000 description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 5
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 5
- 102000035122 glycosylated proteins Human genes 0.000 description 5
- 108091005608 glycosylated proteins Proteins 0.000 description 5
- 229940022353 herceptin Drugs 0.000 description 5
- 230000016784 immunoglobulin production Effects 0.000 description 5
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 5
- 235000015097 nutrients Nutrition 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 230000003248 secreting effect Effects 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 150000008163 sugars Chemical class 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 101150052453 ADE1 gene Proteins 0.000 description 4
- 101000918297 Caenorhabditis elegans Exostosin-2 homolog Proteins 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- 101150054496 DAP2 gene Proteins 0.000 description 4
- 241000255601 Drosophila melanogaster Species 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N Formic acid Chemical compound OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- 102100030483 Histatin-1 Human genes 0.000 description 4
- 101001082500 Homo sapiens Histatin-1 Proteins 0.000 description 4
- 101001021281 Homo sapiens Protein HEXIM1 Proteins 0.000 description 4
- 241001138401 Kluyveromyces lactis Species 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- 101150102717 MNN4 gene Proteins 0.000 description 4
- 108010087568 Mannosyltransferases Proteins 0.000 description 4
- 102000006722 Mannosyltransferases Human genes 0.000 description 4
- 102000018697 Membrane Proteins Human genes 0.000 description 4
- 108010052285 Membrane Proteins Proteins 0.000 description 4
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 4
- 101150035718 Pno1 gene Proteins 0.000 description 4
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 4
- 102100037294 RNA-binding protein PNO1 Human genes 0.000 description 4
- 101150040428 SEC4 gene Proteins 0.000 description 4
- 101150028158 STE13 gene Proteins 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- LFTYTUAZOPRMMI-CFRASDGPSA-N UDP-N-acetyl-alpha-D-glucosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-CFRASDGPSA-N 0.000 description 4
- LFTYTUAZOPRMMI-UHFFFAOYSA-N UNPD164450 Natural products O1C(CO)C(O)C(O)C(NC(=O)C)C1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-UHFFFAOYSA-N 0.000 description 4
- 108010084455 Zeocin Proteins 0.000 description 4
- 210000004102 animal cell Anatomy 0.000 description 4
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 238000010828 elution Methods 0.000 description 4
- 238000011067 equilibration Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 230000004151 fermentation Effects 0.000 description 4
- 235000019253 formic acid Nutrition 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 231100000225 lethality Toxicity 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 4
- 239000013600 plasmid vector Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 102100021546 60S ribosomal protein L10 Human genes 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 102400000068 Angiostatin Human genes 0.000 description 3
- 101500018099 Apis mellifera ARMGFHGMR-amide Proteins 0.000 description 3
- 102100021723 Arginase-1 Human genes 0.000 description 3
- 102100026440 Arrestin-C Human genes 0.000 description 3
- 102100027321 Beta-1,4-galactosyltransferase 7 Human genes 0.000 description 3
- 102100022361 CAAX prenyl protease 1 homolog Human genes 0.000 description 3
- 101710150575 CMP-sialic acid transporter Proteins 0.000 description 3
- 102100033787 CMP-sialic acid transporter Human genes 0.000 description 3
- 102000008203 CTLA-4 Antigen Human genes 0.000 description 3
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 3
- 241000222122 Candida albicans Species 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 102100022641 Coagulation factor IX Human genes 0.000 description 3
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 3
- 102100031245 Disks large-associated protein 2 Human genes 0.000 description 3
- 101150020562 Dlgap2 gene Proteins 0.000 description 3
- 241000588722 Escherichia Species 0.000 description 3
- 108010076282 Factor IX Proteins 0.000 description 3
- 108010054218 Factor VIII Proteins 0.000 description 3
- 102000001690 Factor VIII Human genes 0.000 description 3
- 241000567178 Fusarium venenatum Species 0.000 description 3
- 101710203794 GDP-fucose transporter Proteins 0.000 description 3
- 108010056771 Glucosidases Proteins 0.000 description 3
- 102000004366 Glucosidases Human genes 0.000 description 3
- 102000038461 Growth Hormone-Releasing Hormone Human genes 0.000 description 3
- 239000000095 Growth Hormone-Releasing Hormone Substances 0.000 description 3
- 101001108634 Homo sapiens 60S ribosomal protein L10 Proteins 0.000 description 3
- 101001117935 Homo sapiens 60S ribosomal protein L15 Proteins 0.000 description 3
- 101000752037 Homo sapiens Arginase-1 Proteins 0.000 description 3
- 101000785755 Homo sapiens Arrestin-C Proteins 0.000 description 3
- 101000824531 Homo sapiens CAAX prenyl protease 1 homolog Proteins 0.000 description 3
- 101000746373 Homo sapiens Granulocyte-macrophage colony-stimulating factor Proteins 0.000 description 3
- 101001003584 Homo sapiens Prelamin-A/C Proteins 0.000 description 3
- 101000739046 Homo sapiens RNA-binding protein PNO1 Proteins 0.000 description 3
- 101000800287 Homo sapiens Tubulointerstitial nephritis antigen-like Proteins 0.000 description 3
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 3
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- 108010038049 Mating Factor Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- 101000640778 Mus musculus CMP-sialic acid transporter Proteins 0.000 description 3
- 102100033341 N-acetylmannosamine kinase Human genes 0.000 description 3
- 108010081778 N-acylneuraminate cytidylyltransferase Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 101710141454 Nucleoprotein Proteins 0.000 description 3
- 241000320412 Ogataea angusta Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102100038551 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidase Human genes 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 101100062430 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DAP2 gene Proteins 0.000 description 3
- 101710142969 Somatoliberin Proteins 0.000 description 3
- 101150061195 TRP2 gene Proteins 0.000 description 3
- 101150024785 TRP5 gene Proteins 0.000 description 3
- 102000003621 TRPC5 Human genes 0.000 description 3
- 241000223997 Toxoplasma gondii Species 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108010008393 UDP-N-acetylglucosamine N-acetyl-D-glucosaminyl-1-6-(N-acetylglucosaminyl-1-2)mannopyranosyl-1-R(N-acetylglucosamine to mannose)-1,4N-acetylglucosaminyltransferase VI Proteins 0.000 description 3
- 108010063641 Xylosylprotein 4-beta-galactosyltransferase Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 229940095731 candida albicans Drugs 0.000 description 3
- 108020001778 catalytic domains Proteins 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 239000000306 component Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 230000033581 fucosylation Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 102000046157 human CSF2 Human genes 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- SKEFKEOTNIPLCQ-LWIQTABASA-N mating hormone Chemical compound C([C@@H](C(=O)NC(CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCS(C)=O)C(=O)NC(CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CN=CN1 SKEFKEOTNIPLCQ-LWIQTABASA-N 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000003607 modifier Substances 0.000 description 3
- 108040002068 peptide-N4-(N-acetyl-beta-glucosaminyl)asparagine amidase activity proteins Proteins 0.000 description 3
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000012827 research and development Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000000600 sorbitol Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- PXBFMLJZNCDSMP-UHFFFAOYSA-N 2-Aminobenzamide Chemical compound NC(=O)C1=CC=CC=C1N PXBFMLJZNCDSMP-UHFFFAOYSA-N 0.000 description 2
- 125000005975 2-phenylethyloxy group Chemical group 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- CERZMXAJYMMUDR-QBTAGHCHSA-N 5-amino-3,5-dideoxy-D-glycero-D-galacto-non-2-ulopyranosonic acid Chemical compound N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO CERZMXAJYMMUDR-QBTAGHCHSA-N 0.000 description 2
- SGIZECXZFLAGBW-UHFFFAOYSA-N 5-benzylidene-1,3-thiazolidine-2,4-dione Chemical class S1C(=O)NC(=O)C1=CC1=CC=CC=C1 SGIZECXZFLAGBW-UHFFFAOYSA-N 0.000 description 2
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 2
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- TXCIAUNLDRJGJZ-UHFFFAOYSA-N CMP-N-acetyl neuraminic acid Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-UHFFFAOYSA-N 0.000 description 2
- TXCIAUNLDRJGJZ-BILDWYJOSA-N CMP-N-acetyl-beta-neuraminic acid Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@]1(C(O)=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-BILDWYJOSA-N 0.000 description 2
- 101100244387 Candida albicans (strain SC5314 / ATCC MYA-2876) PMT6 gene Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000699802 Cricetulus griseus Species 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 2
- 102100032086 Dolichyl pyrophosphate Man9GlcNAc2 alpha-1,3-glucosyltransferase Human genes 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- 101100223032 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) dapB gene Proteins 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 108010093031 Galactosidases Proteins 0.000 description 2
- 102000002464 Galactosidases Human genes 0.000 description 2
- 108010001496 Galectin 2 Proteins 0.000 description 2
- 102100021735 Galectin-2 Human genes 0.000 description 2
- 241000224466 Giardia Species 0.000 description 2
- 102100031132 Glucose-6-phosphate isomerase Human genes 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- 102000051366 Glycosyltransferases Human genes 0.000 description 2
- 108700023372 Glycosyltransferases Proteins 0.000 description 2
- 101150009006 HIS3 gene Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000776319 Homo sapiens Dolichyl pyrophosphate Man9GlcNAc2 alpha-1,3-glucosyltransferase Proteins 0.000 description 2
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 241000222712 Kinetoplastida Species 0.000 description 2
- 241000222722 Leishmania <genus> Species 0.000 description 2
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- DINOPBPYOCMGGD-VEDJBHDQSA-N Man(a1-2)Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-6)]Man(a1-6)]Man(b1-4)GlcNAc(b1-4)GlcNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)O3)O)O2)O)[C@@H](CO)O1 DINOPBPYOCMGGD-VEDJBHDQSA-N 0.000 description 2
- MVQGZYIOMXAFQG-GUBZILKMSA-N Met-Ala-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MVQGZYIOMXAFQG-GUBZILKMSA-N 0.000 description 2
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 2
- 102100021969 Nucleotide pyrophosphatase Human genes 0.000 description 2
- 241000489470 Ogataea trehalophila Species 0.000 description 2
- 108090000854 Oxidoreductases Proteins 0.000 description 2
- 102000004316 Oxidoreductases Human genes 0.000 description 2
- 101150036326 PMT2 gene Proteins 0.000 description 2
- 101150024216 PMT3 gene Proteins 0.000 description 2
- 101150086142 PMT4 gene Proteins 0.000 description 2
- 101150061205 PRO1 gene Proteins 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- 241000195888 Physcomitrella Species 0.000 description 2
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 2
- 101800001295 Putative ATP-dependent helicase Proteins 0.000 description 2
- 101800001006 Putative helicase Proteins 0.000 description 2
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 2
- 101100184479 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MNN4 gene Proteins 0.000 description 2
- 101100241858 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OAC1 gene Proteins 0.000 description 2
- 101100043665 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) STE13 gene Proteins 0.000 description 2
- 101100043108 Schizosaccharomyces pombe (strain 972 / ATCC 24843) spb1 gene Proteins 0.000 description 2
- 241000223105 Trypanosoma brucei Species 0.000 description 2
- 108010090473 UDP-N-acetylglucosamine-peptide beta-N-acetylglucosaminyltransferase Proteins 0.000 description 2
- 108010075202 UDP-glucose 4-epimerase Proteins 0.000 description 2
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 2
- 230000010056 antibody-dependent cellular cytotoxicity Effects 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000004540 complement-dependent cytotoxicity Effects 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 229910001873 dinitrogen Inorganic materials 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 108010001671 galactoside 3-fucosyltransferase Proteins 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 210000004408 hybridoma Anatomy 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 210000002752 melanocyte Anatomy 0.000 description 2
- CERZMXAJYMMUDR-UHFFFAOYSA-N neuraminic acid Natural products NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO CERZMXAJYMMUDR-UHFFFAOYSA-N 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 108010067588 nucleotide pyrophosphatase Proteins 0.000 description 2
- 230000000050 nutritive effect Effects 0.000 description 2
- 229960000470 omalizumab Drugs 0.000 description 2
- PXQPEWDEAKTCGB-UHFFFAOYSA-N orotic acid Chemical compound OC(=O)C1=CC(=O)NC(=O)N1 PXQPEWDEAKTCGB-UHFFFAOYSA-N 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 229960000402 palivizumab Drugs 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 239000008194 pharmaceutical composition Substances 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 101150053681 pmt gene Proteins 0.000 description 2
- 101150092906 pmt1 gene Proteins 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000012809 post-inoculation Methods 0.000 description 2
- 125000005629 sialic acid group Chemical group 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 239000007222 ypd medium Substances 0.000 description 2
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- 125000005976 1-phenylethyloxy group Chemical group 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 108010083651 3-galactosyl-N-acetylglucosaminide 4-alpha-L-fucosyltransferase Proteins 0.000 description 1
- LONUXNSVCIXRQJ-MEVVYUPBSA-N 3-oxo-N-[(3R,4R,5S,6R)-2,4,5-trihydroxy-6-(hydroxymethyl)oxan-3-yl]butanamide Chemical group C(CC(=O)C)(=O)N[C@H]1C(O)O[C@@H]([C@H]([C@@H]1O)O)CO LONUXNSVCIXRQJ-MEVVYUPBSA-N 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- 101150096316 5 gene Proteins 0.000 description 1
- PBCCYRAQIGGRLD-UHFFFAOYSA-N 5-[[3,4-bis(phenylmethoxy)phenyl]methylidene]-4-oxo-2-sulfanylidene-1,3-thiazolidine-3-carboxylic acid Chemical compound C1(=CC=CC=C1)COC=1C=C(C=CC=1OCC1=CC=CC=C1)C=C1C(N(C(S1)=S)C(=O)O)=O PBCCYRAQIGGRLD-UHFFFAOYSA-N 0.000 description 1
- 101150005709 ARG4 gene Proteins 0.000 description 1
- 101150099190 ARR3 gene Proteins 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- MAEQBGQTDWDSJQ-LSJOCFKGSA-N Ala-Met-His Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MAEQBGQTDWDSJQ-LSJOCFKGSA-N 0.000 description 1
- XIWKVCDQMCNKOZ-UVBJJODRSA-N Ala-Met-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N XIWKVCDQMCNKOZ-UVBJJODRSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 108010025188 Alcohol oxidase Proteins 0.000 description 1
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 1
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 1
- 244000303258 Annona diversifolia Species 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 108010032595 Antibody Binding Sites Proteins 0.000 description 1
- 241000224482 Apicomplexa Species 0.000 description 1
- 101100179978 Arabidopsis thaliana IRX10 gene Proteins 0.000 description 1
- 101100233722 Arabidopsis thaliana IRX10L gene Proteins 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- OCDJOVKIUJVUMO-SRVKXCTJSA-N Arg-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N OCDJOVKIUJVUMO-SRVKXCTJSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- FXGMURPOWCKNAZ-JYJNAYRXSA-N Arg-Val-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FXGMURPOWCKNAZ-JYJNAYRXSA-N 0.000 description 1
- 102000004452 Arginase Human genes 0.000 description 1
- 108700024123 Arginases Proteins 0.000 description 1
- 241001606187 Ascia Species 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- QEQVUHQQYDZUEN-GUBZILKMSA-N Asn-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N QEQVUHQQYDZUEN-GUBZILKMSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 1
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000151861 Barnettozyma salicaria Species 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 101000713368 Bovine immunodeficiency virus (strain R29) Protein Tat Proteins 0.000 description 1
- 101150115826 CYM gene Proteins 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 241000195898 Ceratodon Species 0.000 description 1
- 241000283153 Cetacea Species 0.000 description 1
- 241001552485 Chrysis elegans elegans Species 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241000223782 Ciliophora Species 0.000 description 1
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 1
- 241000557626 Corvus corax Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 1
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 241000224460 Diplomonadida Species 0.000 description 1
- 102100039486 Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit 4 Human genes 0.000 description 1
- 102100039371 ER lumen protein-retaining receptor 1 Human genes 0.000 description 1
- 241000224431 Entamoeba Species 0.000 description 1
- 101710088235 Envelope glycoprotein C homolog Proteins 0.000 description 1
- 241001465328 Eremothecium gossypii Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 241001148462 Funaria <moss> Species 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 108010062427 GDP-mannose 4,6-dehydratase Proteins 0.000 description 1
- 102000002312 GDPmannose 4,6-dehydratase Human genes 0.000 description 1
- 101150115938 GUT1 gene Proteins 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 1
- XKPOCESCRTVRPL-KBIXCLLPSA-N Glu-Cys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XKPOCESCRTVRPL-KBIXCLLPSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 1
- QEJKKJNDDDPSMU-KKUMJFAQSA-N Glu-Tyr-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O QEJKKJNDDDPSMU-KKUMJFAQSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- AEMRFAOFKBGASW-UHFFFAOYSA-M Glycolate Chemical compound OCC([O-])=O AEMRFAOFKBGASW-UHFFFAOYSA-M 0.000 description 1
- 101150069554 HIS4 gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000063327 Haludaria fasciata Species 0.000 description 1
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- WSAILOWUJZEAGC-DCAQKATOSA-N His-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSAILOWUJZEAGC-DCAQKATOSA-N 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000609775 Homo sapiens Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit 4 Proteins 0.000 description 1
- 101000812437 Homo sapiens ER lumen protein-retaining receptor 1 Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101000863858 Homo sapiens Sialic acid synthase Proteins 0.000 description 1
- 101000868422 Homo sapiens Sushi, nidogen and EGF-like domain-containing protein 1 Proteins 0.000 description 1
- 101001046426 Homo sapiens cGMP-dependent protein kinase 1 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- HHZQLQREDATOBM-CODXZCKSSA-M Hydrocortisone Sodium Succinate Chemical compound [Na+].O=C1CC[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)COC(=O)CCC([O-])=O)[C@@H]4[C@@H]3CCC2=C1 HHZQLQREDATOBM-CODXZCKSSA-M 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 1
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- 102000009786 Immunoglobulin Constant Regions Human genes 0.000 description 1
- 108010009817 Immunoglobulin Constant Regions Proteins 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 101100502336 Komagataella pastoris FLD1 gene Proteins 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 1
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010090665 Mannosyl-Glycoprotein Endo-beta-N-Acetylglucosaminidase Proteins 0.000 description 1
- 241000196322 Marchantia Species 0.000 description 1
- 108010008364 Melanocortins Proteins 0.000 description 1
- 241001599018 Melanogaster Species 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 1
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 1
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 1
- JACAKCWAOHKQBV-UWVGGRQHSA-N Met-Gly-Lys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN JACAKCWAOHKQBV-UWVGGRQHSA-N 0.000 description 1
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 241001531264 Mus musculus musculus Species 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- OSKIPPQETUTOMW-YHLOVPAPSA-N N-[(2R,3R,4R,5S,6R)-5-[(2S,3R,4R,5S,6R)-3-Acetamido-5-[(2R,3S,4S,5R,6R)-4-[(2R,3S,4S,5S,6R)-3-[(2S,3S,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2R,3S,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-6-[[(2S,3S,4S,5R,6R)-6-[[(2S,3S,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2R,3S,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxymethyl]-3,5-dihydroxy-4-[(2R,3S,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxymethyl]-3,5-dihydroxyoxan-2-yl]oxy-4-hydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-2,4-dihydroxy-6-(hydroxymethyl)oxan-3-yl]acetamide Chemical compound O[C@@H]1[C@@H](NC(=O)C)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)O3)O)O2)O)[C@@H](CO)O1 OSKIPPQETUTOMW-YHLOVPAPSA-N 0.000 description 1
- SQVRNKJHWKZAKO-LUWBGTNYSA-N N-acetylneuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-LUWBGTNYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108091006036 N-glycosylated proteins Proteins 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101100409482 Neosartorya fumigata mcsA gene Proteins 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 101150024689 OST3 gene Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100458357 Oryza sativa subsp. japonica MST6 gene Proteins 0.000 description 1
- 101150012394 PHO5 gene Proteins 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 241000228153 Penicillium citrinum Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 241000530350 Phaffomyces opuntiae Species 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- CKJACGQPCPMWIT-UFYCRDLUSA-N Phe-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CKJACGQPCPMWIT-UFYCRDLUSA-N 0.000 description 1
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000235062 Pichia membranifaciens Species 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 1
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 1
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 1
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 108010025216 RVF peptide Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 108010039491 Ricin Proteins 0.000 description 1
- 108091006161 SLC17A5 Proteins 0.000 description 1
- 101100188881 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OST6 gene Proteins 0.000 description 1
- 101100421128 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SEI1 gene Proteins 0.000 description 1
- 101001000154 Schistosoma mansoni Phosphoglycerate kinase Proteins 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 101100029611 Schizosaccharomyces pombe (strain 972 / ATCC 24843) phf1 gene Proteins 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- XSYJDGIDKRNWFX-SRVKXCTJSA-N Ser-Cys-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XSYJDGIDKRNWFX-SRVKXCTJSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 241001504313 Sphaerocarpos Species 0.000 description 1
- 241000736285 Sphagnum Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187310 Streptomyces noursei Species 0.000 description 1
- 102100032853 Sushi, nidogen and EGF-like domain-containing protein 1 Human genes 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 1
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 1
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- LTLBNCDNXQCOLB-UBHSHLNASA-N Trp-Asp-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 LTLBNCDNXQCOLB-UBHSHLNASA-N 0.000 description 1
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 1
- LFMLXCJYCFZBKE-IHPCNDPISA-N Trp-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N LFMLXCJYCFZBKE-IHPCNDPISA-N 0.000 description 1
- ACGIVBXINJFALS-HKUYNNGSSA-N Trp-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ACGIVBXINJFALS-HKUYNNGSSA-N 0.000 description 1
- ICPRIGUXAFULPH-ILWGZMRPSA-N Trp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O ICPRIGUXAFULPH-ILWGZMRPSA-N 0.000 description 1
- 241000223109 Trypanosoma cruzi Species 0.000 description 1
- 241001655264 Trypanosoma cruzi cruzi Species 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- TYGHOWWWMTWVKM-HJOGWXRNSA-N Tyr-Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 TYGHOWWWMTWVKM-HJOGWXRNSA-N 0.000 description 1
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 1
- 108010065282 UDP xylose-protein xylosyltransferase Proteins 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- XKVXSCHXGJOQND-ZOBUZTSGSA-N Val-Asp-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N XKVXSCHXGJOQND-ZOBUZTSGSA-N 0.000 description 1
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 1
- YLHLNFUXDBOAGX-DCAQKATOSA-N Val-Cys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YLHLNFUXDBOAGX-DCAQKATOSA-N 0.000 description 1
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- UEXPMFIAZZHEAD-HSHDSVGOSA-N Val-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N)O UEXPMFIAZZHEAD-HSHDSVGOSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- 108010059993 Vancomycin Proteins 0.000 description 1
- 101100004044 Vigna radiata var. radiata AUX22B gene Proteins 0.000 description 1
- 241000370136 Wickerhamomyces pijperi Species 0.000 description 1
- 102000010199 Xylosyltransferases Human genes 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- GBXZONVFWYCRPT-KVTDHHQDSA-N [(2s,3s,4r,5r)-3,4,5,6-tetrahydroxy-1-oxohexan-2-yl] dihydrogen phosphate Chemical group OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](C=O)OP(O)(O)=O GBXZONVFWYCRPT-KVTDHHQDSA-N 0.000 description 1
- 229960000446 abciximab Drugs 0.000 description 1
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 101150001038 ade gene Proteins 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 229960000548 alemtuzumab Drugs 0.000 description 1
- 108010012864 alpha-Mannosidase Proteins 0.000 description 1
- 102000019199 alpha-Mannosidase Human genes 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 229960004669 basiliximab Drugs 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010073219 beta-1,3-galactosyl-0-glycosyl-glycoprotein beta-1,3-N-acetylglucosaminyltransferase Proteins 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000012503 blood component Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 101150091051 cit-1 gene Proteins 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 229960002806 daclizumab Drugs 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 150000002031 dolichols Chemical class 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 229960000284 efalizumab Drugs 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000019441 ethanol Nutrition 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000009454 functional inhibition Effects 0.000 description 1
- 239000005350 fused silica glass Substances 0.000 description 1
- 229960003297 gemtuzumab ozogamicin Drugs 0.000 description 1
- 238000003197 gene knockdown Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 108010026195 glycanase Proteins 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 229960001743 golimumab Drugs 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 229960000598 infliximab Drugs 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940029329 intrinsic factor Drugs 0.000 description 1
- 150000004694 iodide salts Chemical class 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229910052746 lanthanum Inorganic materials 0.000 description 1
- FZLIPJUXYLNCLC-UHFFFAOYSA-N lanthanum atom Chemical compound [La] FZLIPJUXYLNCLC-UHFFFAOYSA-N 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 206010025135 lupus erythematosus Diseases 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 101150073445 mca gene Proteins 0.000 description 1
- 239000002865 melanocortin Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 229960003816 muromonab-cd3 Drugs 0.000 description 1
- 229940060155 neuac Drugs 0.000 description 1
- 125000002868 norbornyl group Chemical group C12(CCC(CC1)C2)* 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229960005010 orotic acid Drugs 0.000 description 1
- 101150015442 ost-1 gene Proteins 0.000 description 1
- 101150026679 ost5 gene Proteins 0.000 description 1
- 229940043515 other immunoglobulins in atc Drugs 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 101150084046 pep gene Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 210000004560 pineal gland Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229960004641 rituximab Drugs 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000009962 secretion pathway Effects 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229940036185 synagis Drugs 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229960005267 tositumomab Drugs 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 108010029599 tyrosyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010002837 tyrosyl-isoleucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- MYPYJXKWCTUITO-LYRMYLQWSA-N vancomycin Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=C2C=C3C=C1OC1=CC=C(C=C1Cl)[C@@H](O)[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@H]3C(=O)N[C@H]1C(=O)N[C@H](C(N[C@@H](C3=CC(O)=CC(O)=C3C=3C(O)=CC=C1C=3)C(O)=O)=O)[C@H](O)C1=CC=C(C(=C1)Cl)O2)=O)NC(=O)[C@@H](CC(C)C)NC)[C@H]1C[C@](C)(N)[C@H](O)[C@H](C)O1 MYPYJXKWCTUITO-LYRMYLQWSA-N 0.000 description 1
- 229960003165 vancomycin Drugs 0.000 description 1
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 125000000969 xylosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)CO1)* 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/44—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from protozoa
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/08—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
- C07K16/10—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
- C07K16/1027—Paramyxoviridae, e.g. respiratory syncytial virus
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
- C07K16/2863—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against receptors for growth factors, growth regulators
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/32—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against translation products of oncogenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/005—Glycopeptides, glycoproteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
- C07K2317/14—Specific host cells or culture conditions, e.g. components, pH or temperature
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/21—Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/40—Immunoglobulins specific features characterized by post-translational modification
- C07K2317/41—Glycosylation, sialylation, or fucosylation
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Virology (AREA)
- Mycology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oncology (AREA)
- General Chemical & Material Sciences (AREA)
- Pulmonology (AREA)
- Toxicology (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Communicable Diseases (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본원에 기술된 바와 같이 변형되지 않은 재조합 숙주 세포에서 생산된 치료 당단백질의 N-글리코실화 부위 점유와 비교하여, 본원에 기술된 바와 같이 변형되고 치료 당단백질을 발현하도록 유전자 조작된 재조합 숙주 세포에서 생산된 치료 당단백질의 N-글리코실화 부위 점유를 증가시키는 방법이 기술된다. 특히, 이러한 방법은 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제(oligosaccharyltransferase)를 과다발현하는 재조합 숙주 세포를 제공하고, 특정 실시양태에서 이러한 올리고사카릴트랜스퍼라제는 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 코딩하는 숙주 세포 유전자의 발현의 존재 하에 효모 OTase 복합체의 하나 이상의 필수 단백질, 예를 들어, 리슈마니아 메이저(Leishmania major) STT3D 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 이러한 방법은 저급 진핵생물 세포 예컨대 효모 및 사상 진균 및 고급 진핵생물 세포 예컨대 식물 및 곤충 세포 및 포유동물 세포 모두에서 N-글리코실화 부위 점유가 증가된 치료 당단백질을 생산하는데 유용하다.
Description
관련 출원에 대한 교차 참조
전자 제출된 서열 목록에 대한 참조
발명의 배경
(1) 발명의 분야
본 발명은 본 발명에 따라 변형되지 않은 재조합 숙주 세포에서 생산된 치료 당단백질의 N-글리코실화 부위 점유와 비교하여, 본 발명에 따라 변형되고 이종성 당단백질을 발현하도록 유전자 조작된 재조합 숙주 세포에서 생산된 이종성 당단백질의 N-글리코실화 부위 점유를 증가시키는 방법에 관한 것이다. 특히, 본 발명은 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제(oligosaccharyltransferase) (특정 실시양태에서 숙주 세포의 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체의 존재 하에 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있음)를 과다발현하는 재조합 숙주 세포, 및 이러한 숙주 세포를 사용하여 이종성 당단백질을 생산하는 방법을 제공한다.
(2) 관련 기술의 설명
재조합 인간 단백질을 생산하는 능력은 인간 건강 관리에서의 큰 진전으로 이어졌고, 여전히 활발한 약물 개발 분야이다. 다수의 치료 단백질이 적합한 구조-기능 활성 및 이어지는 인간 혈청에서의 안정성을 확실히 하기 위해 단백질의 특정 아스파라긴 잔기에 번역 후에 글리칸이 부가되는 것 (N-글리코실화)을 필요로 한다. 인간에서의 치료적 용도를 위해, 당단백질은 인간-유사 N-글리코실화를 필요로 한다. 인간-유사 당단백질 프로세싱을 모방할 수 있는 포유동물 세포주 (예를 들어, 차이니즈 햄스터 난소 (CHO) 세포, 인간 망막 세포)는 낮은 단백질 역가, 긴 발효 시간, 비균질성 생성물 및 지속적인 바이러스 봉쇄가 포함되는 몇몇 단점이 있다. 따라서, 짧은 발효 시간으로 높은 단백질 역가를 생산할 뿐만 아니라, 인간-유사 당단백질을 또한 생산할 수 있는 발현 시스템을 사용하는 것이 바람직하다.
진균 숙주 예컨대 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 또는 메틸이용성(methylotrophic) 효모 예컨대 피키아 파스토리스(Pichia pastoris)는 치료 단백질 발현에 대한 뚜렷한 장점이 있고, 예를 들어, 이는 다량의 내인성 단백질을 분비하지 않고, 이종성 단백질을 생산하기 위한 강한 유도성 프로모터가 이용가능하며, 규정된 화학 배지에서 동물 혈청을 사용하지 않으면서 성장될 수 있고, 높은 역가의 재조합 단백질을 생산할 수 있다 (문헌 [Cregg et al., FEMS Microbiol. Rev. 24: 45-66 (2000)]). 그러나, 효모에서 발현된 글리코실화 단백질은 "고-만노스" 글리칸을 초래하는 추가적인 만노스 당을 일반적으로 함유한다. 고-만노스 N-글리칸은 특정 개체에 투여되었을 때 불리한 반응을 초래할 수 있기 때문에, 일반적으로 효모는 인간 용도에 의도되는 치료 당단백질을 생산하는데 사용되지 않았다. 그러나, 인간-유사 N-글리칸을 생산하도록 효모를 유전자 조작하는 방법들이 미국 출원 공개 번호 20040230042, 20050208617, 20040171826, 20050208617, 및 20060286637에 기술된 방법들과 함께 미국 특허 번호 7,029,872 및 7,449,308에 기술되어 있다. 이러한 방법들은 효모 유형 N-글리칸 대신에 인간-유사 복합 또는 하이브리드(hybrid) N-글리칸을 우세하게 갖는 치료 당단백질을 생산할 수 있는 재조합 효모를 구축하는데 사용되었다.
유전자 조작된 효모가 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산할 수 있는 한편, 당단백질 상의 N-글리칸 부착 부위의 점유가 광범위하게 다르고, 포유동물 세포에서 생산된 당단백질 내의 동일한 부위의 점유보다 일반적으로 더 낮다는 것이 발견되었다. 이는 피키아 파스토리스에서 생산된 다양한 재조합 항체에 대해 관찰되었다. 그러나, N-글리칸 부착 부위 점유의 다양성이 포유동물 세포에서도 마찬가지로 관찰되었다. 예를 들어, 문헌 [Gawlitzek et al., Identification of cell culture conditions to control N-glycosylation site-occupancy of recombinant glycoproteins expressed in CHO cells, Biotechnol. Bioengin. 103: 1164-1175 (2009)]에서, N-글리코실화 부위 점유가 CHO 세포에서 생산된 특정 당단백질들에 대한 특정 부위들에 대해 다르고, 이러한 부위들에서의 점유를 제어하기 위해 성장 조건에서의 변형이 이루어질 수 있다는 것이 개시되었다. 국제 출원 공개 번호 WO 2006107990에는 돌리콜-연결 올리고사카라이드 합성 경로를 사용하여 진핵생물 세포의 단백질 N-글리코실화를 개선하는 방법이 개시되어 있다. N-글리코실화 부위 점유의 제어가 문헌 [Jones et al., Biochim. Biophys. Acta. 1726: 121-137 (2005)]에서 리뷰되었다. 그러나, 재조합 숙주 세포에서 생산된 치료 단백질의 N-글리코실화 부위 점유를 증가시키는 방법이 여전히 요구된다.
발명의 개요
본 발명은 본원에 개시된 바와 같이 변형된 숙주 세포에서 생산된 당단백질의 N-글리코실화 부위 점유가 본원에 개시된 바와 같이 변형되지 않은 숙주 세포에서 생산된 동일한 당단백질의 N-글리코실화 부위 점유에 비해 증가된, 본원에 개시된 바와 같이 변형된 재조합 숙주 세포에서 치료 당단백질을 생산하는 방법을 제공한다. 예를 들어, 본원에 개시된 바와 같이 변형된 효모 숙주 세포에서, 본원에서 생산된 당단백질의 N-글리코실화 부위 점유가 재조합 포유동물 또는 인간 세포에서 생산된 동일한 당단백질의 N-글리코실화 부위 점유와 동일하거나 또는 이와 더욱 유사할 것이다.
재조합 숙주 세포에 생산된 당단백질 상의 N-글리코실화 부위 점유를 증가시키기 위해, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (OTase)가 숙주 세포에서의 당단백질의 발현 전에 또는 발현과 동시에 재조합 숙주 세포에서 과다발현된다. 특정 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 중 하나 이상이 숙주 세포의 내인성 헤테로올리고머성(hetero-oligomeric) 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 하나 이상의 필수 서브유닛의 치사성 돌연변이를 기능적으로 보완할 수 있다. 리슈마니아 메이저(Leishmania major) STT3D 단백질이 사카로미세스 세레비지아에서 STT3 유전자좌 및 WBP1, OST1, SWP1 및 OST2로부터 선택된 하나 이상의 유전자좌에서의 치사성 돌연변이를 억제하는 것으로 나타난 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제의 예이다 (문헌 [Naseb et al., Molec. Biol. Cell 19: 3758-3768 (2008)]). 일반적으로, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 숙주 세포의 내인성 STT3 단백질이 포함되는, 숙주 세포의 내인성 OTase 복합체를 구성하는 단백질의 존재 하에 구성적으로 또는 유도성으로 과다발현된다. 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 코딩하는 발현 카세트들은 숙주 세포 게놈 내의 임의의 부위 내로 통합될 수 있거나, 또는 숙주 세포의 염색체외 공간 내에 위치할 수 있고, 즉 플라스미드, 바이러스, 2 ㎛ 플라스미드, 미니염색체 등과 같은 자율적으로 복제되는 유전 요소일 수 있다.
특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제 중 하나 이상이 리슈마니아(Leishmania) 종의 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 특정 실시양태에서, 하나 이상의 단일-서브유닛 올리고사카릴트랜스퍼라제가 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자는 숙주 세포 STT3 단백질이 포함되는, 숙주 세포의 OTase 복합체를 구성하는 단백질을 코딩하는 내인성 유전자의 발현을 대신하여 과다발현되지 않는다. 그보다는, 숙주 세포의 STT3를 코딩하는 내인성 유전자의 발현을 포함하는, 숙주 세포의 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 유전자의 발현의 존재 하에 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자가 구성적으로 또는 유도성으로 과다발현된다. 단일-서브유닛 OTase를 코딩하는 각각의 발현 카세트는 숙주 세포 게놈 내의 임의의 부위 내로 통합될 수 있거나, 또는 숙주 세포의 염색체외 공간 내에 위치할 수 있고, 즉 플라스미드, 바이러스, 2 ㎛ 플라스미드, 미니염색체 등과 같은 자율적으로 복제되는 유전 요소일 수 있다.
포유동물- 또는 인간-유사 복합 N-글리칸을 생산하도록 유전자 조작된 피키아 파스토리스 숙주 세포를 사용하여 본원에서 본 발명이 예시되었다; 그러나, 본 발명이 다른 효모 또는 사상 진균 숙주 세포, 특히 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균에 적용되어 이러한 효모 또는 사상 진균 숙주 세포에서 생산된 당단백질의 전체적인 N-글리코실화 부위 점유를 개선시킬 수 있다. 추가적인 측면에서, 숙주 세포는 야생형 또는 내인성 숙주 세포 N-글리코실화 패턴, 예를 들어, 과만노실화(hypermannosylated) 또는 고-만노스 N-글리칸을 갖는 재조합 이종성 단백질을 생산하는 효모 또는 사상 진균이다. 추가적인 측면에서, 숙주 세포는 알파-1,6-만노실트랜스퍼라제(mannosyltransferase) 활성 (예를 들어, 사카로미세스 세레비지아에 또는 피키아 파스토리스와 같은, 그러나 이에 한정되지 않는 다양한 효모 균주의 경우의 och1p 활성)이 결여되어 고-만노스 N-글리칸을 갖는 재조합 이종성 단백질을 생산하는 효모 또는 사상 진균이다. 추가로, 본 발명은 식물 또는 포유동물 발현 시스템에서 생산된 당단백질, 특히 2개를 초과하는 N-연결 글리코실화 부위가 있는 당단백질의 전체적인 N-글리코실화 부위 점유를 개선하기 위해 식물 및 포유동물 발현 시스템에 또한 적용될 수 있다.
따라서, 상기의 한 측면에서, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 재조합 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 재조합 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.
상기의 추가적인 측면에서, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하는 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸을 갖는 이종성 당단백질을 생산하는 방법이 제공된다.
일반적으로, 상기 측면들에서, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현된다.
상기 방법의 추가적인 측면에서, 숙주 세포는 피키아 파스토리스, 피키아 핀란디카(Pichia finlandica), 피키아 트레할로필라(Pichia trehalophila), 피키아 코클라마에(Pichia koclamae), 피키아 멤브라나에파시엔스(Pichia membranaefaciens), 피키아 오푼티아에(Pichia opuntiae), 피키아 써모톨레란스 (Pichia thermotolerans), 피키아 살릭타리아(Pichia salictaria), 피키아 구에르쿠움(Pichia guercuum), 피키아 페이페리(Pichia pijperi), 피키아 스팁티스(Pichia stiptis), 피키아 메타놀리카(Pichia methanolica), 피키아 미누타(Pichia minuta) (오가타에아 미누타(Ogataea minuta), 피키아 린드네리(Pichia lindneri)), 피키아(Pichia) 종, 사카로미세스 세레비지아에, 사카로미세스(Saccharomyces) 종, 한세눌라 폴리모르파(Hansenula polymorpha), 클루이베로미세스(Kluyveromyces) 종, 클루이베로미세스 락티스(Kluyveromyces lactis), 칸디다 알비칸스(Candida albicans), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 오리자에(Aspergillus oryzae), 트리코더마 레에세이(Trichoderma reesei), 크리소스포리움 루크노웬세(Chrysosporium lucknowense), 푸사리움(Fusarium) 종, 푸사리움 그라미네움(Fusarium gramineum), 푸사리움 베네나툼(Fusarium venenatum), 및 뉴로스포라 크라사(Neurospora crassa)로 이루어진 군으로부터 선택된다. 또 다른 측면에서, 숙주 세포는 곤충, 식물 또는 포유동물 숙주 세포이다.
상기의 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 재조합 저급 진핵생물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 저급 진핵생물 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.
상기 방법의 추가적인 측면에서, 저급 진핵생물 숙주 세포는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 칸디다 알비칸스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼, 및 뉴로스포라 크라사로 이루어진 군으로부터 선택된다.
상기의 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 재조합 효모 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 재조합 효모 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.
상기 방법들에서, 재조합 효모 숙주 세포가 효모 N-글리칸 패턴의 당단백질을 생산하거나, 또는 과만노실화가 결여되었지만 고-만노스 N-글리칸을 생산하는 효모 패턴의 당단백질을 생산하도록 효모가 유전자 조작되었다. 예를 들어, α1,6-만노실트랜스퍼라제 활성, 예를 들어, Och1p 활성이 결여되도록 효모가 유전자 조작될 수 있다. 추가적인 측면에서, 포유동물 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 효모가 유전자 조작된다.
특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 추가적인 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체, 예를 들어, 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 예를 들어, 추가적인 측면에서, 예를 들어 단일-서브유닛 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 리슈마니아 메이저 STT3D 단백질이다.
상기 방법의 추가적인 측면에서, 효모 숙주 세포는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 및 칸디다 알비칸스로 이루어진 군으로부터 선택된다.
상기의 추가적인 측면에서, 효모 올리고사카릴트랜스퍼라제 (OTase) 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 재조합 효모 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 재조합 효모 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.
상기 방법들에서, 재조합 효모 숙주 세포가 효모 N-글리칸 패턴의 당단백질을 생산하거나, 또는 고-만노스 N-글리칸을 포함하지만 과만노실화가 결여된 효모 패턴의 당단백질을 생산하도록 효모가 유전자 조작되었다. 예를 들어, α1,6-만노실트랜스퍼라제 활성, 예를 들어, Och1p 활성이 결여되도록 효모가 유전자 조작될 수 있다. 추가적인 측면에서, 포유동물 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 효모가 유전자 조작된다.
특정 실시양태에서, 숙주 세포는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합을 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다. 특정 실시양태에서, 숙주 세포는 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, 또는 그의 조합을 코딩하는 하나 이상의 핵산을 추가로 포함한다.
상기 방법의 추가적인 측면에서, 효모 숙주 세포는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 및 칸디다 알비칸스로 이루어진 군으로부터 선택된다.
상기의 추가적인 측면에서, 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 사상 진균 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 사상 진균 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다. 사상 진균 숙주 세포는 N-글리칸이 사상 진균 패턴을 갖는 당단백질을 생산하거나, 또는 포유동물 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작된다.
특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질 또는 그의 조합이다. 추가적인 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체, 예를 들어, 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 예를 들어, 추가적인 측면에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 리슈마니아 메이저 STT3D 단백질이다.
상기의 추가적인 측면에서, 사상 진균 숙주 세포는 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼, 및 뉴로스포라 크라사로 이루어진 군으로부터 선택된다.
상기 방법들 중 어느 하나의 추가적인 실시양태에서, G0, G1, G2, A1, 또는 A2로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 복합 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 추가적인 실시양태에서, 양분화(bisected) N-글리칸을 갖거나 다중안테나성(multiantennary) N-글리칸을 갖는 하나 이상의 포유동물- 또는 인간-유사 복합 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 다른 실시양태에서, GlcNAcMan3GlcNAc2; GalGlcNAcMan3GlcNAc2; NANAGalGlcNAcMan3GlcNAc2; Man5GlcNAc2, GlcNAcMan5GlcNAc2, GalGlcNAcMan5GlcNAc2, 및 NANAGalGlcNAcMan5GlcNAc2로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 하이브리드 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 추가적인 실시양태에서, N-글리칸 구조가 G-2 구조 Man3GlcNAc2로 이루어진다.
상기 방법들 중 어느 하나의 특정 실시양태에서, 이종성 당단백질은, 예를 들어, 에리트로포이에틴 (EPO); 인터페론 α, 인터페론 β, 인터페론 γ 및 인터페론 ω와 같은 시토카인; 및 과립구-콜로니 자극 인자 (GCSF); 과립구 대식세포-콜로니 자극 인자 (GM-CSF); 인자 VIII, 인자 IX 및 인간 단백질 C와 같은 응고 인자; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-사슬; IgG, IgG 단편, IgG 융합물 및 IgM과 같은 이뮤노글로불린; 가용성 TNF 수용체-Fc 융합 단백질과 같은 이뮤노어드헤신 및 기타 Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터류킨; 유로키나제(urokinase); 키마제(chymase); 우레아 트립신 억제제; IGF-결합 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴; 혈관 내피 성장 인자-2; 골수성 전구세포 억제 인자-1; 오스테오프로테게린; α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글(kringle) 3; 글루코세레브로시다제(glucocerebrosidase); TNF 결합 단백질 1; 여포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막횡단 활성화제 및 칼슘 조정제 및 시클로필린 리간드; 글루카곤 유사 단백질 1; 또는 IL-2 수용체 효능제이다.
상기 방법들 중 어느 하나의 추가적인 실시양태에서, 이종성 단백질은 항체이고, 이의 예로는 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 또는 항-CD20 항체가 포함되지만 이에 한정되지는 않는다.
상기 방법들 중 어느 하나의 특정 측면에서, 숙주 세포는 글리코시다제(glycosidase), 만노시다제(mannosidase), 또는 글리코실트랜스퍼라제(glycosyltransferase) 활성 (UDP-GlcNAc 트랜스퍼라제 (GnT) I, GnT II, GnT III, GnT IV, GnT V, GnT VI, UDP-갈락토실트랜스퍼라제(galactosyltransferase) (GalT), 푸코실트랜스퍼라제(fucosyltransferase), 및 시알릴트랜스퍼라제(sialyltransferase)로 이루어진 군의 구성원으로부터 유래됨)의 하나 이상의 촉매 도메인을 코딩하는 하나 이상의 핵산 분자를 포함한다. 특정 실시양태에서, 만노시다제는 카에노랍디티스 엘레간스(C. elegans) 만노시다제 IA, 카에노랍디티스 엘레간스 만노시다제 IB, 드로소필라 멜라노가스터(D . melanogaster) 만노시다제 IA, 호모 사피엔스(H . sapiens) 만노시다제 IB, 페니실리움 시트리눔(P . citrinum) 만노시다제 I, 마우스 만노시다제 IA, 마우스 만노시다제 IB, 아스페르길루스 니둘란스 만노시다제 IA, 아스페르길루스 니둘란스 만노시다제 IB, 아스페르길루스 니둘란스 만노시다제 IC, 마우스 만노시다제 II, 카에노랍디티스 엘레간스 만노시다제 II, 호모 사피엔스 만노시다제 II, 및 만노시다제 III으로 이루어진 군으로부터 선택된다.
상기 방법들 중 어느 하나의 특정 측면에서, 촉매 도메인 및 세포성 표적화 신호 펩티드를 포함하는 융합 단백질을 형성함으로써 하나 이상의 촉매 도메인이 국소화된다. 세포성 표적화 신호 펩티드를 코딩하는 DNA 단편과 효소 활성이 있는 촉매 도메인을 코딩하는 DNA 단편의 인-프레임(in-frame) 결찰에 의해 형성된 하나 이상의 유전자 구축물에 의해 융합 단백질이 코딩될 수 있다. 표적화 신호 펩티드의 예로는 ER 또는 골지의 막-결합 단백질, 복구 신호, 제II형 막 단백질, 제I형 막 단백질, 막-스패닝(spanning) 뉴클레오티드 당 수송체, 만노시다제, 시알릴트랜스퍼라제, 글루코시다제(glucosidase), 만노실트랜스퍼라제, 및 포스포-만노실트랜스퍼라제가 포함되지만, 이에 한정되지는 않는다.
상기 방법들 중 어느 하나의 특정 측면에서, 숙주 세포는 UDP-GlcNAc 수송체, UDP-갈락토스 수송체, GDP-푸코스 수송체, CMP-시알산 수송체, 및 뉴클레오티드 디포스파타제(diphosphatase)로 이루어진 군으로부터 선택된 하나 이상의 효소를 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다.
상기 방법들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 α1,2-만노시다제 활성, UDP-GlcNAc 트랜스퍼라제 (GnT) I 활성, 만노시다제 II 활성, 및 GnT II 활성을 코딩하는 하나 이상의 핵산 분자를 포함한다.
상기 방법들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 α1,2-만노시다제 활성, UDP-GlcNAc 트랜스퍼라제 (GnT) I 활성, 만노시다제 II 활성, GnT II 활성, 및 UDP-갈락토실트랜스퍼라제 (GalT) 활성을 코딩하는 하나 이상의 핵산 분자를 포함한다.
상기 방법들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 만노실트랜스퍼라제 및 포스포만노실트랜스퍼라제로 이루어진 군으로부터 선택된 하나 이상의 효소의 활성이 결핍된다. 추가적인 측면에서, 숙주 세포는 1,6 만노실트랜스퍼라제, 1,3 만노실트랜스퍼라제, 및 1,2 만노실트랜스퍼라제로 이루어진 군으로부터 선택된 효소를 발현하지 않는다.
상기 방법들 중 어느 하나의 특정 측면에서, 숙주 세포는 피키아 파스토리스의 och1 돌연변이체이다.
(a) 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 숙주 세포 STT3 유전자의 발현을 포함하여 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 숙주 세포가 추가로 제공된다.
(a) 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 저급 진핵생물 숙주 세포가 추가로 제공된다.
(a) 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 효모 숙주 세포가 추가로 제공된다.
(a) 효모 올리고사카릴트랜스퍼라제 (OTase) 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 효모 숙주 세포가 추가로 제공된다.
(a) 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 사상 진균 숙주 세포가 추가로 제공된다.
(a) 효모 또는 사상 진균 올리고사카릴트랜스퍼라제 (OTase) 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 사상 진균 숙주 세포가 추가로 제공된다.
특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 추가적인 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체, 예를 들어, 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 예를 들어, 추가적인 측면에서, 예를 들어 단일-서브유닛 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 리슈마니아 메이저 STT3D 단백질이다.
추가적인 측면에서, 상기 숙주 세포는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, 또는 그의 조합을 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다.
상기 숙주 세포들 중 어느 하나의 추가적인 실시양태에서, G0, G1, G2, A1, 또는 A2로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 복합 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 추가적인 실시양태에서, 양분화 N-글리칸을 갖거나 다중안테나성 N-글리칸을 갖는 하나 이상의 인간-유사 복합 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 다른 실시양태에서, GlcNAcMan3GlcNAc2; GalGlcNAcMan3GlcNAc2; NANAGalGlcNAcMan3GlcNAc2; Man5GlcNAc2, GlcNAcMan5GlcNAc2, GalGlcNAcMan5GlcNAc2, 및 NANAGalGlcNAcMan5GlcNAc2로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 하이브리드 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 추가적인 실시양태에서, N-글리칸 구조가 G-2 구조 Man3GlcNAc2로 이루어진다.
상기 숙주 세포들 중 어느 하나의 특정 실시양태에서, 이종성 당단백질은, 예를 들어, 에리트로포이에틴 (EPO); 인터페론 α, 인터페론 β, 인터페론 γ 및 인터페론 ω와 같은 시토카인; 및 과립구-콜로니 자극 인자 (GCSF); 과립구 대식세포-콜로니 자극 인자 (GM-CSF); 인자 VIII, 인자 IX 및 인간 단백질 C와 같은 응고 인자; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-사슬; IgG, IgG 단편, IgG 융합물 및 IgM과 같은 이뮤노글로불린; 가용성 TNF 수용체-Fc 융합 단백질과 같은 이뮤노어드헤신 및 기타 Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터류킨; 유로키나제; 키마제; 우레아 트립신 억제제; IGF-결합 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴; 혈관 내피 성장 인자-2; 골수성 전구세포 억제 인자-1; 오스테오프로테게린; α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글 3; 글루코세레브로시다제; TNF 결합 단백질 1; 여포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막횡단 활성화제 및 칼슘 조정제 및 시클로필린 리간드; 글루카곤 유사 단백질 1; 및 IL-2 수용체 효능제로 이루어진 군으로부터 선택될 수 있다.
상기 숙주 세포들 중 어느 하나의 추가적인 실시양태에서, 이종성 단백질은 항체이고, 이의 예로는 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 또는 항-CD20 항체가 포함되지만 이에 한정되지는 않는다.
상기 숙주 세포들의 특정 측면에서, 숙주 세포는 글리코시다제, 만노시다제, 또는 글리코실트랜스퍼라제 활성 (UDP-GlcNAc 트랜스퍼라제 (GnT) I, GnT II, GnT III, GnT IV, GnT V, GnT VI, UDP-갈락토실트랜스퍼라제 (GalT), 푸코실트랜스퍼라제, 및 시알릴트랜스퍼라제로 이루어진 군의 구성원으로부터 유래됨)의 하나 이상의 촉매 도메인을 코딩하는 하나 이상의 핵산 분자를 포함한다. 특정 실시양태에서, 만노시다제는 카에노랍디티스 엘레간스 만노시다제 IA, 카에노랍디티스 엘레간스 만노시다제 IB, 드로소필라 멜라노가스터 만노시다제 IA, 호모 사피엔스 만노시다제 IB, 페니실리움 시트리눔 만노시다제 I, 마우스 만노시다제 IA, 마우스 만노시다제 IB, 아스페르길루스 니둘란스 만노시다제 IA, 아스페르길루스 니둘란스 만노시다제 IB, 아스페르길루스 니둘란스 만노시다제 IC, 마우스 만노시다제 II, 카에노랍디티스 엘레간스 만노시다제 II, 호모 사피엔스 만노시다제 II, 및 만노시다제 III으로 이루어진 군으로부터 선택된다.
상기 숙주 세포들 중 어느 하나의 특정 측면에서, 촉매 도메인 및 세포성 표적화 신호 펩티드를 포함하는 융합 단백질을 형성함으로써 하나 이상의 촉매 도메인이 국소화된다. 세포성 표적화 신호 펩티드를 코딩하는 DNA 단편과 효소 활성이 있는 촉매 도메인을 코딩하는 DNA 단편의 인-프레임 결찰에 의해 형성된 하나 이상의 유전자 구축물에 의해 융합 단백질이 코딩될 수 있다. 표적화 신호 펩티드의 예로는 ER 또는 골지의 막-결합 단백질, 복구 신호 예컨대 HDEL 또는 KDEL, 제II형 막 단백질, 제I형 막 단백질, 막-스패닝 뉴클레오티드 당 수송체, 만노시다제, 시알릴트랜스퍼라제, 글루코시다제, 만노실트랜스퍼라제, 및 포스포-만노실트랜스퍼라제에 대한 것들이 포함되지만, 이에 한정되지는 않는다.
상기 숙주 세포들 중 어느 하나의 특정 측면에서, 숙주 세포는 UDP-GlcNAc 수송체, UDP-갈락토스 수송체, GDP-푸코스 수송체, CMP-시알산 수송체, 및 뉴클레오티드 디포스파타제로 이루어진 군으로부터 선택된 하나 이상의 효소를 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다.
상기 숙주 세포들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 α1,2-만노시다제 활성, UDP-GlcNAc 트랜스퍼라제 (GnT) I 활성, 만노시다제 II 활성, 및 GnT II 활성을 코딩하는 하나 이상의 핵산 분자를 포함한다.
상기 숙주 세포들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 α1,2-만노시다제 활성, UDP-GlcNAc 트랜스퍼라제 (GnT) I 활성, 만노시다제 II 활성, GnT II 활성, 및 UDP-갈락토실트랜스퍼라제 (GalT) 활성을 코딩하는 하나 이상의 핵산 분자를 포함한다.
상기 숙주 세포들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 칸디다 알비칸스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼, 뉴로스포라 크라사, 식물 세포, 곤충 세포, 및 포유동물 세포로 이루어진 군으로부터 선택된다.
상기 숙주 세포들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 만노실트랜스퍼라제 및 포스포만노실트랜스퍼라제로 이루어진 군으로부터 선택된 하나 이상의 효소의 활성이 결핍된다. 추가적인 측면에서, 숙주 세포는 1,6 만노실트랜스퍼라제, 1,3 만노실트랜스퍼라제, 및 1,2 만노실트랜스퍼라제로 이루어진 군으로부터 선택된 효소를 발현하지 않는다.
상기 숙주 세포들 중 어느 하나의 특정 측면에서, 숙주 세포는 피키아 파스토리스이다. 추가적인 측면에서, 숙주 세포는 피키아 파스토리스의 och1 돌연변이체이다.
본원에서의 방법 및 숙주 세포는 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유된 당단백질 조성물을 생산하는데 사용될 수 있다.
추가로, 본원에서의 방법 및 숙주 세포가 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유되고 추가적인 측면에서는 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.
추가로, 포유동물-유사 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포 또는 방법이 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유되고 추가적인 측면에서는 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.
일부 측면에서, 푸코실화 포유동물- 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 숙주 세포가 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유되고 추가적인 측면에서는 푸코스를 갖는 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.
본원에서의 방법 및 숙주 세포는 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유된 항체 조성물을 생산하는데 사용될 수 있다.
추가로, 본원에서의 방법 및 숙주 세포가 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸에 푸코스가 결여된 항체 조성물을 생산하는데 사용될 수 있다.
추가로, 본원에서의 방법 및 효모 또는 사상 진균 숙주 세포가 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸에 푸코스가 결여된 항체 조성물을 생산하는데 사용될 수 있다.
추가로, 포유동물-유사 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포 또는 방법이 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다. 일부 측면에서, 푸코실화 포유동물- 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 숙주 세포가 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스가 있는 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.
조성물 내의 무손상 항체 분자의 약 70% 내지 약 99%에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 3-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다.
조성물 내의 무손상 항체 분자의 약 70% 내지 99%에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어(core) 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다.
특정 실시양태에서, 항체는 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 및 항-CD20 항체로 이루어진 군으로부터 선택된 항체를 포함한다.
본원에 기술된 숙주 세포 및 방법에 의해 생산된 하나 이상의 당단백질을 포함하는 조성물이 추가로 제공된다.
특정 실시양태에서, 본원에서 제공되는 당단백질 조성물은 GlcNAc(1-4)Man3GlcNAc2; Gal(1-4)GlcNAc(1-4)Man3GlcNAc2; NANA(1-4)Gal(1-4)GlcNAc(1-4)Man3GlcNAc2와 같은 N-글리칸이 포함되지만 이에 한정되지 않는, 푸코실화 및 비-푸코실화 하이브리드 및 복합 N-글리칸 (양분화 및 다중안테나성 종 포함)을 갖는 당단백질을 포함한다.
특정 실시양태에서, 본원에서 제공되는 당단백질 조성물은 GlcNAcMan3GlcNAc2; GalGlcNAcMan3GlcNAc2; NANAGalGlcNAcMan3GlcNAc2; GlcNAcMan5GlcNAc2; GalGlcNAcMan5GlcNAc2; 및 NANAGalGlcNAcMan5GlcNAc2로 이루어진 군으로부터 선택된 하나 이상의 하이브리드 N-글리칸을 갖는 당단백질을 포함한다. 특정 측면에서, 이러한 하이브리드 N-글리칸이 조성물 내의 우세한 N-글리칸 종이다. 추가적인 측면에서, 이러한 하이브리드 N-글리칸은 조성물 내의 하이브리드 N-글리칸의 약 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 또는 100%를 이루는 특정 N-글리칸 종이다.
특정 실시양태에서, 본원에서 제공되는 당단백질 조성물은 GlcNAc2Man3GlcNAc2; GalGlcNAc2Man3GlcNAc2; Gal2GlcNAc2Man3GlcNAc2; NANAGal2GlcNAc2Man3GlcNAc2; 및 NANA2Gal2GlcNAc2Man3GlcNAc2로 이루어진 군으로부터 선택된 하나 이상의 복합 N-글리칸을 갖는 당단백질을 포함한다. 특정 측면에서, 이러한 복합 N-글리칸이 조성물 내의 우세한 N-글리칸 종이다. 추가적인 측면에서, 이러한 복합 하이브리드 N-글리칸은 조성물 내의 복합 N-글리칸의 약 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99%, 또는 100%를 이루는 특정 N-글리칸 종이다.
특정 실시양태에서, N-글리칸이 푸코실화된다. 일반적으로, 푸코스는 N-글리칸의 환원 끝부분에서의 GlcNAc와의 α1,3-연결, N-글리칸의 환원 끝부분에서의 GlcNAc와의 α1,6-연결, N-글리칸의 비-환원 끝부분에서의 Gal과의 α1,2-연결, N-글리칸의 비-환원 끝부분에서의 GlcNac와의 α1,3-연결, 또는 N-글리칸의 비-환원 끝부분에서의 GlcNAc와의 α1,4-연결로 존재한다.
따라서, 상기 당단백질 조성물들의 특정 측면에서, 당형(glycoform)은 GlcNAcMan5GlcNAc2(Fuc), GlcNAcMan3GlcNAc2(Fuc), GlcNAc2Man3GlcNAc2(Fuc), GalGlcNAc2Man3GlcNAc2(Fuc), Gal2GlcNAc2Man3GlcNAc2(Fuc), NANAGal2GlcNAc2Man3GlcNAc2(Fuc), 및 NANA2Gal2GlcNAc2Man3GlcNAc2(Fuc)로 이루어진 군으로부터 선택된 당형이 생산되는 α1,3-연결 또는 α1,6-연결 푸코스; GlcNAc(Fuc)Man5GlcNAc2, GlcNAc(Fuc)Man3GlcNAc2, GlcNAc2(Fuc1 -2)Man3GlcNAc2, GalGlcNAc2(Fuc1-2)Man3GlcNAc2, Gal2GlcNAc2(Fuc1 -2)Man3GlcNAc2, NANAGal2GlcNAc2(Fuc1 -2)Man3GlcNAc2, 및 NANA2Gal2GlcNAc2(Fuc1 -2)Man3GlcNAc2로 이루어진 군으로부터 선택된 당형이 생산되는 α1,3-연결 또는 α1,4-연결 푸코스; 또는 Gal(Fuc)GlcNAc2Man3GlcNAc2, Gal2(Fuc1 -2)GlcNAc2Man3GlcNAc2, NANAGal2(Fuc1 -2)GlcNAc2Man3GlcNAc2, 및 NANA2Gal2(Fuc1 -2)GlcNAc2Man3GlcNAc2로 이루어진 군으로부터 선택된 당형이 생산되는 α1,2-연결 푸코스로 존재한다.
상기의 추가적인 측면에서, 복합 N-글리칸은 푸코실화 및 비-푸코실화 양분화 및 다중안테나성 종을 추가로 포함한다.
추가적인 측면에서, 당단백질은 Man3GlcNAc2 N-글리칸 구조로 이루어진 N-글리칸, 또는 Man5GlcNAc2를 포함하지만 이에 한정되지 않는 고-만노스 N-글리칸을 포함한다.
정의
본원에서 사용되는 경우에, 용어 "N-글리칸" 및 "당형"은 상호교환가능하게 사용되고, N-연결 올리고사카라이드, 예를 들어, 아스파라긴-N-아세틸글루코사민 연결에 의해 폴리펩티드의 아스파라긴 잔기에 부착된 올리고사카라이드를 지칭한다. N-연결 당단백질은 단백질 내의 아스파라긴 잔기의 아미드 질소에 연결된 N-아세틸글루코사민 잔기를 함유한다. 당단백질 상에서 발견되는 우세한 당은 글루코스, 갈락토스, 만노스, 푸코스, N-아세틸갈락토사민 (GalNAc), N-아세틸글루코사민 (GlcNAc) 및 시알산 (예를 들어, N-아세틸-뉴라민산 (NANA))이다. 이러한 당 기의 프로세싱은 ER의 내강에서 번역과 동시에 발생하고, N-연결 당단백질에 대해 골지체에서 번역 후에 계속된다.
N-글리칸에는 Man3GlcNAc2 ("Man"은 만노스를 지칭하고, "Glc"는 글루코스를 지칭하며, "NAc"는 N-아세틸을 지칭하고, GlcNAc는 N-아세틸글루코사민을 지칭한다)의 통상적인 5당류 코어가 있다. 일반적으로, N-글리칸 구조는 비-환원 끝부분을 왼쪽으로, 환원 끝부분을 오른쪽으로 하여 제시된다. N-글리칸의 환원 끝부분은 단백질 상의 글리코실화 부위를 이루는 Asn 잔기에 부착되는 끝부분이다. Man3GlcNAc2 ("Man3") 코어 구조 ("트리만노스 코어", "5당류 코어" 또는 "포시만노스(paucimannose) 코어"로 또한 지칭됨)에 부가되는 말초 당 (예를 들어, GlcNAc, 갈락토스, 푸코스 및 시알산)을 포함하는 분지 (안테나)의 개수와 관련하여 N-글리칸들이 상이하다. N-글리칸은 이의 분지 구성성분에 따라 분류된다 (예를 들어, 고-만노스, 복합 또는 하이브리드). "고-만노스" 유형 N-글리칸은 5개 이상의 만노스 잔기를 갖는다. "복합" 유형 N-글리칸은 전형적으로 "트리만노스" 코어의 1,3 만노스 팔(arm)에 부착된 하나 이상의 GlcNAc 및 1,6 만노스 팔에 부착된 하나 이상의 GlcNAc를 갖는다. 복합 N-글리칸은 시알산 또는 유도체 (예를 들어, "NANA" 또는 "NeuAc" [식중, "Neu"는 뉴라민산을 지칭하고 "Ac"는 아세틸을 지칭한다])로 임의적으로 변형된 갈락토스 ("Gal") 또는 N-아세틸갈락토사민 ("GalNAc") 잔기를 또한 가질 수 있다. 복합 N-글리칸은 "양분성(bisecting)" GlcNAc 및 코어 푸코스 ("Fuc")를 포함하는 사슬내 치환을 또한 가질 수 있다. 복합 N-글리칸은 "트리만노스 코어" 상의 다중 안테나를 또한 가질 수 있고, "다중 안테나성 글리칸"으로 종종 지칭된다. "하이브리드" N-글리칸은 트리만노스 코어의 1,3 만노스 팔의 말단 상의 하나 이상의 GlcNAc, 및 트리만노스 코어의 1,6 만노스 팔 상의 0개 이상의 만노스를 갖는다. 다양한 N-글리칸이 "당형"으로 또한 지칭된다.
복합 N-글리칸과 관련하여, 용어 "G-2", "G-1", "G0", "G1", "G2", "A1", 및 "A2"는 하기를 의미한다. "G-2"는 Man3GlcNAc2로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "G-1"은 GlcNAcMan3GlcNAc2로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "G0"은 GlcNAc2Man3GlcNAc2로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "G1"은 GalGlcNAc2Man3GlcNAc2로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "G2"는 Gal2GlcNAc2Man3GlcNAc2로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "A1"은 NANAGal2GlcNAc2Man3GlcNAc2로 특징화될 수 있는 N-글리칸 구조를 지칭하며; 용어 "A2"는 NANA2Gal2GlcNAc2Man3GlcNAc2로 특징화될 수 있는 N-글리칸 구조를 지칭한다. 달리 지시되지 않는 한, 용어 "G-2", "G-1", "G0", "G1", "G2", "A1", 및 "A2"는 N-글리칸의 환원 끝부분에서의 GlcNAc 잔기에 부착된 푸코스가 결여된 N-글리칸 종을 지칭한다. 이러한 용어가 "F"를 포함하는 경우, "F"는 N-글리칸 종이 N-글리칸의 환원 끝부분에서의 GlcNAc 잔기 상에 푸코스 잔기를 포함한다는 것을 가리킨다. 예를 들어, G0F, G1F, G2F, A1F, 및 A2F는 모두 N-글리칸이 N-글리칸의 환원 끝부분에서의 GlcNAc 잔기에 부착된 푸코스 잔기를 추가로 포함한다는 것을 가리킨다. 저급 진핵생물 예컨대 효모 및 사상 진균은 정상적으로는 푸코스를 생산하는 N-글리칸을 생산하지 않는다.
다중안테나성 N-글리칸과 관련하여, 용어 "다중안테나성 N-글리칸"은 N-글리칸의 1,6 팔 또는 1,3 팔의 비-환원 끝부분을 이루는 만노스 잔기 상의 GlcNAc 잔기, 또는 N-글리칸의 1,6 팔 및 1,3 팔의 비-환원 끝부분을 이루는 만노스 잔기 각각 상의 GlcNAc 잔기를 추가로 포함하는 N-글리칸을 지칭한다. 따라서, 다중안테나성 N-글리칸은 화학식 GlcNAc(2-4)Man3GlcNAc2, Gal(1-4)GlcNAc(2-4)Man3GlcNAc2, 또는 NANA(1-4)Gal(1-4)GlcNAc(2-4)Man3GlcNAc2를 특징으로 할 수 있다. 용어 "1-4"는 잔기 1개, 2개, 3개 또는 4개를 지칭한다.
양분화 N-글리칸과 관련하여, 용어 "양분화 N-글리칸"은 GlcNAc 잔기가 N-글리칸의 환원 끝부분에서의 만노스 잔기에 연결된 N-글리칸을 지칭한다. 양분화 N-글리칸은 화학식 GlcNAc3Man3GlcNAc2를 특징으로 할 수 있고, 이때 각각의 만노스 잔기가 이의 비-환원 끝부분에서 GlcNAc 잔기에 연결된다. 대조적으로, 다중안테나성 N-글리칸이 GlcNAc3Man3GlcNAc2로 특징화되는 경우, 이러한 화학식은 2개의 GlcNAc 잔기가 N-글리칸의 2개의 팔 중 하나의 비-환원 끝부분에서의 만노스 잔기에 연결되고, 1개의 GlcNAc 잔기가 N-글리칸의 나머지 팔의 비-환원 끝부분에서의 만노스 잔기에 연결되는 것을 가리킨다.
본원에서 사용된 약어는 당업계에서의 통상적인 용법의 약어이고, 예를 들어, 상기의 당 약어를 참조한다. 기타 통상적인 약어에는 "PNGase", 또는 "글리카나제(glycanase)" 또는 "글루코시다제"가 포함되고, 이들은 모두 펩티드 N-글리코시다제 F (EC 3.2.2.18)를 지칭한다.
본원에서 사용되는 경우에, 용어 "당단백질"은 하나 이상의 N-글리칸이 부착되어 있는 임의의 단백질을 지칭한다. 따라서, 이러한 용어는 당업계에서 일반적으로 당단백질로 인지되는 단백질, 및 하나 이상의 N-연결 글리코실화 부위를 함유하도록 유전자 조작된 단백질 둘 모두를 지칭한다.
본원에서 사용되는 경우에, "인간화 당단백질" 또는 "인간-유사 당단백질"은 4개 미만의 만노스 잔기를 갖는 N-글리칸이 부착되어 있는 단백질, 및 5개 이상의 만노스 잔기를 갖는 합성 당단백질 중간체 (또한 유용하고, 추가로 시험관내에서 또는 생체 내에서 조작될 수 있음)을 별법적으로 지칭한다. 바람직하게는, 본 발명에 따라 생산된 당단백질은, 적어도 일시적으로, 30 몰% 이상, 바람직하게는 40 몰% 이상, 더욱 바람직하게는 50, 60, 70, 80, 90, 또는 심지어 100 몰%의 Man5GlcNAc2 중간체를 함유한다. 이는, 예를 들어, "더 양호한", 즉 더 효율적인 글리코실화 효소를 발현하도록 본 발명의 숙주 세포를 조작함으로써 달성될 수 있다. 예를 들어, 단백질이 글리코실화되는 숙주 세포 내의 부위에 존재하는 조건 하에서 최적의 활성을 갖도록 만노시다제가 선택되고, 바람직하게는 활성이 요망되는 숙주 세포 기관으로 효소를 표적화하는 것에 의해, 숙주 세포 내로 도입된다
용어 "재조합 숙주 세포" ("발현 숙주 세포", "발현 숙주 시스템", "발현 시스템" 또는 간단히 "숙주 세포")는, 본원에서 사용되는 경우에, 재조합 벡터가 도입된 세포를 지칭하도록 의도된다. 이같은 용어는 특정 대상 세포뿐만 아니라 이같은 세포의 자손을 또한 지칭하도록 의도되는 것으로 이해되어야 한다. 돌연변이 또는 환경적인 영향으로 인해 후속 세대에서 특정한 변형이 발생할 수 있기 때문에, 이같은 자손은 실제로는 모 세포와 동일하지 않을 수 있지만, 본원에서 사용되는 경우의 용어 "숙주 세포"의 범주 내에 여전히 포함된다. 재조합 숙주 세포는 배양에서 성장된 단리된 세포 또는 세포주일 수 있거나, 또는 살아 있는 조직 또는 생물 내에 존재하는 세포일 수 있다. 바람직한 숙주 세포는 효모 및 진균이다.
당단백질 제제 내에 존재하는 글리칸의 "몰%"를 지칭할 때, 이러한 용어는 단백질 제제가 PNGase로 처리될 때 방출된 후, 당형 조성에 영향을 받지 않는 방법 (예를 들어, PNGase에 의해 방출된 글리칸 풀(pool)을 형광 태그(tag) 예컨대 2-아미노벤즈아미드로 표지한 후, 고성능 액체 크로마토그래피 또는 모세관 전기영동으로 분리하고 나서, 형광 강도에 의해 글리칸을 정량함)에 의해 정량된 N-연결 올리고사카라이드들의 풀 내에 존재하는 특정 글리칸의 몰%를 의미한다. 예를 들어, 50 몰% GlcNAc2Man3GlcNAc2Gal2NANA2는 방출된 글리칸의 50%가 GlcNAc2Man3GlcNAc2Gal2NANA2이고 나머지 50%는 다른 N-연결 올리고사카라이드로 구성된다는 것을 의미한다. 실시양태에서, 당단백질 제제 내의 특정 글리칸의 몰%는 20% 내지 100%, 바람직하게는 25%, 30%, 35%, 40% 또는 45% 초과, 더욱 바람직하게는 50%, 55%, 60%, 65% 또는 70% 초과, 가장 바람직하게는 75%, 80% 85%, 90% 또는 95% 초과일 것이다.
용어 "작동가능하게 연결된" 발현 제어 서열은 발현 제어 서열이 관심 유전자와 연속적이어서 관심 유전자를 제어하는 연결, 뿐만 아니라 트랜스(trans)로 또는 거리를 두고 작용하여 관심 유전자를 제어하는 발현 제어 서열을 지칭한다.
용어 "발현 제어 서열" 또는 "조절 서열"은 상호교환가능하게 사용되고, 본원에서 사용되는 경우에, 자신이 작동가능하게 연결된 코딩 서열의 발현에 영향을 미치는데 필요한 폴리뉴클레오티드 서열을 지칭한다. 발현 제어 서열은 핵산 서열의 전사, 전사후 이벤트 및 번역을 제어하는 서열이다. 발현 제어 서열에는 적합한 전사 개시, 종결, 프로모터 및 인핸서 서열; 효율적인 RNA 프로세싱 신호 예컨대 스플라이싱(splicing) 및 폴리아데닐화 신호; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 강화시키는 서열 (예를 들어, 리보솜 결합 부위); 단백질 안정성을 강화시키는 서열; 및 원하는 경우, 단백질 분비를 강화시키는 서열이 포함된다. 이같은 제어 서열의 성질은 숙주 생물에 따라 다르고, 진핵생물에서는, 이같은 제어 서열에는 일반적으로 프로모터, 리보솜 결합 부위, 및 전사 종결 서열이 포함된다. 용어 "제어 서열"은, 최소한, 이의 존재가 발현에 필수적인 모든 성분을 포함하도록 의도되고, 이의 존재가 유리한 추가적인 성분, 예를 들어, 리더 서열 및 융합 파트너 서열을 또한 포함할 수 있다.
용어 "형질감염시키다", "형질감염", "형질감염시키는" 등은 진핵생물 세포 (고급 및 저급 진핵생물 세포 둘 모두) 내로의 이종성 핵산 도입을 지칭한다. 전통적으로, 용어 "형질전환"이 효모 또는 진균 세포 내로의 핵산 도입을 기술하도록 사용되었다; 그러나, 본원에서는 용어 "형질감염"이 효모 및 진균 세포가 포함되는 임의의 진핵생물 세포 내로의 핵산 도입을 지칭하도록 사용된다.
용어 "진핵생물"은 유핵 세포 또는 생물을 지칭하고, 곤충 세포, 식물 세포, 포유동물 세포, 동물 세포 및 저급 진핵생물 세포를 포함한다.
용어 "저급 진핵생물 세포"에는 효모 및 사상 진균이 포함된다. 효모 및 사상 진균에는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 칸디다 알비칸스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼, 피스코미트렐라 파텐스(Physcomitrella patens) 및 뉴로스포라 크라사가 포함되지만 이에 한정되지는 않는다. 피키아 종, 임의의 사카로미세스 종, 한세눌라 폴리모르파, 임의의 클루이베로미세스 종, 칸디다 알비칸스, 임의의 아스페르길루스 종, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 임의의 푸사리움 종 및 뉴로스포라 크라사.
본원에서 사용되는 경우에, 용어 "항체", "이뮤노글로불린", "이뮤노글로불린들" 및 "이뮤노글로불린 분자"는 상호교환가능하게 사용된다. 각각의 이뮤노글로불린 분자는 이를 이의 특이적 항원에 결합하게 하는 독특한 구조를 갖지만, 모든 이뮤노글로불린은 본원에 기술된 바와 같이 전체적인 구조가 동일하다. 기본적인 이뮤노글로불린 구조 단위는 서브유닛들의 사량체를 포함하는 것으로 공지되어 있다. 각각의 사량체에는 2개의 동일한 폴리펩티드 사슬 쌍이 있고, 각각의 쌍에는 1개의 "경쇄" (약 25 kDa) 및 1개의 "중쇄" (약 50-70 kDa)가 있다. 각각의 사슬의 아미노-말단 부분은 항원 인식을 주로 담당하는 아미노산 약 100개 내지 110개 또는 이를 초과하는 개수의 가변 영역을 포함한다. 각각의 사슬의 카르복시-말단은 이펙터 기능을 주로 담당하는 불변 영역을 규정한다. 경쇄는 카파 또는 람다로 분류된다. 중쇄는 감마, 뮤, 알파, 델타 또는 엡실론으로 분류되고, 항체의 이소형(isotype)을 각각 IgG, IgM, IgA, IgD, 및 IgE로 규정한다.
경쇄 및 중쇄는 가변 영역 및 불변 영역으로 세분된다 (일반적으로, 문헌 [Fundamental Immunology (Paul, W., ed., 2nd ed. Raven Press, N.Y., 1989), Ch. 7] 참조). 각각의 경쇄/중쇄 쌍의 가변 영역이 항체 결합 부위를 형성한다. 따라서, 무손상 항체에는 2개의 결합 부위가 있다. 이관능성 또는 이중특이적 항체의 경우를 제외하고, 2개의 결합 부위가 동일하다. 사슬들 모두는 비교적 보존된 프레임워크 영역 (FR)이 3개의 초가변 영역 (상보성 결정 영역 또는 CDR로 또한 칭해짐)에 의해 연결된 동일한 일반 구조를 나타낸다. 각각의 쌍의 2개의 사슬로부터의 CDR이 프레임워크 영역에 의해 정렬되어, 특이적 에피토프에 대한 결합을 가능하게 한다. 이러한 용어들은 천연 발생 형태, 뿐만 아니라 단편 및 유도체를 포함한다. 이뮤노글로불린 (Ig) 클래스, 즉, IgG, IgA, IgE, IgM, 및 IgD가 이러한 용어의 범주 내에 포함된다. IgG의 서브타입, 즉, IgG1, IgG2, IgG3, 및 IgG4가 이러한 용어의 범주 내에 또한 포함된다. 이러한 용어는 가장 넓은 의미로 사용되고, 단일 모노클로날 항체 (효능제 및 길항제 항체 포함), 뿐만 아니라 다중 에피토프 또는 항원에 결합할 항체 조성물을 포함한다. 이러한 용어는 모노클로날 항체 (전장 모노클로날 항체 포함), 폴리클로날 항체, 다중특이적 항체 (예를 들어, 이중특이적 항체), 및 항체 단편 (단, CH2 도메인의 N-연결 글리코실화 부위를 포함하는 중쇄 이뮤노글로불린 불변 영역의 CH2 도메인의 적어도 일부분을 함유하거나 이를 함유하도록 변형됨), 또는 이들의 변이체를 구체적으로 포괄한다. Fc 영역만 포함하는 분자, 예컨대 이뮤노어드헤신 (미국 특허 출원 공개 번호 2004/0136986 (이의 개시내용은 참고로 본원에 포함됨)), Fc 융합물, 및 항체-유사 분자가 이러한 용어 내에 포함된다.
용어 "Fc 단편"은 CH2 및 CH3 도메인을 함유하는 항체의 C-말단의 '결정화 단편(fragment crystallized)' 영역을 지칭한다. 용어 "Fab 단편"은 VH, CH1, VL 및 CL 도메인을 함유하는 항체의 '항원 결합 단편(fragment antigen binding)' 영역을 지칭한다.
용어 "모노클로날 항체" (mAb)는, 본원에서 사용되는 경우에, 실질적으로 균질한 항체들의 집단으로부터 수득된 항체를 지칭하고, 즉, 집단을 이루는 개별적인 항체들이 미량으로 존재할 수 있는 가능한 천연 발생 돌연변이를 제외하고는 동일하다. 모노클로날 항체는 고도로 특이적이어서, 단일 항원 부위에 대해 지시된다. 또한, 상이한 결정인자 (에피토프)들에 대해 지시된 상이한 항체들을 전형적으로 포함하는 통상적인 (폴리클로날) 항체 제제와 대조적으로, 각각의 mAb는 항원 상의 단일 결정인자에 대해 지시된다. 이의 특이성에 더하여, 모노클로날 항체는, 예를 들어, 하이브리도마 배양에 의해, 다른 이뮤노글로불린에 의해 오염되지 않고 생산될 수 있다는 점에서 유리하다. 용어 "모노클로날"은 실질적으로 균질한 항체 집단으로부터 수득된다는 항체의 특성을 가리키는 것이며, 임의의 특정한 방법에 의한 항체 생산을 요구하는 것으로 간주되지 않아야 한다. 예를 들어, 본 발명에 따라 사용될 모노클로날 항체를 문헌 [Kohler et al., (1975) Nature, 256:495]에 최초로 기술된 하이브리도마 방법에 의해 제조할 수 있거나, 또는 재조합 DNA 방법 (예를 들어, 미국 특허 번호 4,816,567 (이의 개시내용은 참고로 본원에 포함됨) 참조)에 의해 제조할 수 있다.
용어 "항체" 또는 "이뮤노글로불린"의 범주 내에서의 용어 "단편"은, 이러한 단편이 여전히 표적 분자에 특이적으로 결합할 수 있는 한, 다양한 프로테아제(protease)로의 소화에 의해 생산된 것, 화학적 절단 및/또는 화학적 해리에 의해 생산된 것, 및 재조합에 의해 생산된 것을 포함한다. 이같은 단편에는 Fc, Fab, Fab', Fv, F(ab')2, 및 단일쇄 Fv (scFv) 단편이 있다. 이후, 용어 "이뮤노글로불린"은 용어 "단편"을 또한 포함한다.
이뮤노글로불린은 서열 면에서 변형되었지만 여전히 표적 분자에 특이적으로 결합할 수 있는 이뮤노글로불린 또는 단편을 추가로 포함하고, 이에는 종간 키메라 및 인간화 항체; 항체 융합물; 헤테로머(heteromer) 항체 복합체 및 항체 융합물, 예컨대 디아바디(diabody) (이중특이적 항체), 단일쇄 디아바디, 및 인트라바디(intrabody)가 포함된다 (예를 들어, 문헌 [Intracellular Antibodies: Research and Disease Applications, (Marasco, ed., Springer-Verlag New York, Inc., 1998)] 참조).
용어 "촉매적 항체"는 생화학적 반응을 촉매할 수 있는 이뮤노글로불린 분자를 지칭한다. 촉매적 항체는 당업계에 주지되어 있고, 미국 특허 출원 번호 7,205,136; 4,888,281; 5,037,750 (스코케트만(Schochetman) 등), 미국 특허 출원 번호 5,733,757; 5,985,626; 및 6,368,839 (바바스(Barbas) III 등)에 기술되어 있다 (이들의 개시내용은 모두 본원에 참고로 포함된다).
항체 및 항체-항원 복합체와 면역계 세포의 상호작용 및 반응의 다양성 (항체-의존적 세포-매개 세포독성 (ADCC) 및 보체-의존적 세포독성 (CDC) 포함), 면역복합체의 소거 (포식작용), B 세포에 의한 항체 생산 및 IgG 혈청 반감기가 각각 하기에서 정의되어 있다: 문헌 [Daeron et al., Annu. Rev. Immunol. 15: 203-234 (1997)]; [Ward and Ghetie, Therapeutic Immunol. 2:77-94 (1995)]; [Cox and Greenberg, Semin. Immunol. 13: 339-345 (2001)]; [Heyman, Immunol. Lett. 88:157-161 (2003)]; 및 [Ravetch, Curr. Opin. Immunol. 9: 121-125 (1997)].
본원에서 사용되는 경우에, "~로 본질적으로 이루어지는"이라는 용어는 언급된 정수에 실질적으로 영향을 미치거나 이를 변경시킬 변형 또는 다른 정수를 배제하면서 언급된 정수 또는 정수 군의 포함을 의미하는 것으로 이해될 것이다. N-글리칸의 종과 관련하여, 언급된 N-글리칸"으로 본질적으로 이루어지는"이라는 용어는 이러한 N-글리칸이 당단백질의 아스파라긴 잔기에 직접적으로 연결되는 N-아세틸글루코사민 (GlcNAc)에서 푸코실화되는지 여부와 관계없이 이러한 N-글리칸을 포함하는 것으로 이해될 것이다.
본원에서 사용되는 경우에, 용어 "우세하게" 또는 이의 변형 예컨대 "우세물" 또는 "우세한"은 당단백질을 PNGase로 처리하고, 방출된 글리칸들을 질량 분광법, 예를 들어, MALDI-TOF MS 또는 HPLC에 의해 분석한 후에 전체 천연 N-글리칸 중 몰 백분율 (%)이 가장 높은 글리칸 종을 의미하는 것으로 이해될 것이다. 달리 말하면, "우세하게"라는 구절은 개별물, 예컨대 특정 당형이 다른 어떤 개별물보다도 큰 몰%로 존재하는 것으로 정의된다. 예를 들어, 조성물이 40 몰%의 A종, 35 몰%의 B종 및 25 몰%의 C종으로 이루어진다면, 조성물은 A종을 우세하게 포함하고, B종이 다음으로 가장 우세한 종일 것이다. 일부 숙주 세포는 중성 N-글리칸 및 전하를 띤 N-글리칸 예컨대 만노실포스페이트를 포함하는 조성물을 생산할 수 있다. 따라서, 당단백질의 조성물이 다수의 전하를 띤 N-글리칸 및 전하를 띠지 않은 또는 중성인 N-글리칸을 포함할 수 있다. 본 발명에서, 조성물 내의 전체적인 다수의 중성 N-글리칸의 맥락에서 우세한 N-글리칸이 결정된다. 따라서, 본원에서 사용되는 경우에, "우세한 N-글리칸"은 조성물 내의 전체적인 다수의 중성 N-글리칸 중에서, 우세한 N-글리칸이 특정 구조의 것임을 의미한다.
본원에서 사용되는 경우에, 특정 당 잔기, 예컨대 푸코스, 또는 갈락토스 등"이 본질적으로 없는"이라는 용어는 당단백질 조성물에 이같은 잔기를 함유하는 N-글리칸이 실질적으로 없다는 것을 가리키도록 사용된다. 순도 관점에서 표현될 때, 본질적으로 없음은 이같은 당 잔기를 함유하는 N-글리칸 구조의 양이 10%를 초과하지 않고, 바람직하게는 5% 미만, 더욱 바람직하게는 1% 미만, 가장 바람직하게는 0.5% 미만임을 의미하고, 이때 백분율은 중량 기준 또는 몰% 기준이다. 따라서, 본 발명에 따른 당단백질 조성물 내의 실질적으로 모든 N-글리칸 구조가 예를 들어 푸코스 또는 갈락토스 또는 둘 모두가 없다.
본원에서 사용되는 경우에, 검출가능한 양의 특정 당 잔기, 예컨대 푸코스 또는 갈락토스가 임의의 시점에 N-글리칸 구조 상에 존재하지 않을 때, 당단백질 조성물에 이같은 잔기가 "결여되거나" 또는 "결여되어 있다". 예를 들어, 본 발명의 바람직한 실시양태에서, 당단백질 조성물이 효모 (예를 들어, 피키아 종; 사카로미세스 종; 클루이베로미세스 종; 아스페르길루스 종)가 포함되는 상기 정의된 바와 같은 저급 진핵생물에 의해 생산되고, "푸코스가 결여될" 것인데, 이는 이러한 생물의 세포에 푸코실화 N-글리칸 구조를 생산하는데 필요한 효소가 없기 때문이다. 따라서, 용어 "본질적으로 푸코스가 없는"은 용어 "푸코스가 결여된"을 포함한다. 그러나, 상기 기술된 바와 같이, 조성물이 한 시점에 푸코실화 N-글리칸 구조를 함유하였거나 또는 제한된, 그러나 검출가능한 양의 푸코실화 N-글리칸 구조를 함유하더라도, 조성물에 "푸코스가 본질적으로 없을" 수 있다.
도 1a - 1h는 야생형 균주 NRRL - Y11430 (도 1a)에서 시작하는 피키아 파스토리스 균주 YGLY13992 (도 1f) 및 균주 YGLY14401 (도 1g)의 계도를 나타낸다.
도 2는 피키아 파스토리스 알콜 옥시다제(oxidase) I (AOX1) 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 LmSTT3D ORF를 코딩하는 플라스미드 pGLY6301의 지도를 나타내다. 이러한 플라스미드는 URA6 유전자좌를 표적으로 하는 롤-인(roll-in) 벡터이다. 형질전환체의 선택은 피키아 파스토리스 RPL10 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 사카로미세스 세레비지아에 ARR3 ORF에 의해 코딩되는 비소 저항성을 사용한다.
도 3은 피키아 파스토리스 GAPDH 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 LmSTT3D ORF를 코딩하는 플라스미드 pGLY6294의 지도를 나타낸다. 이러한 플라스미드는 TRP1 유전자좌를 표적으로 하는 KINKO 벡터이다: TRP1 ORF의 3' 끝부분이 피키아 파스토리스 ALG3 전사 종결 서열에 인접한다. 형질전환체의 선택은 아시비아 고시피이(Ashbya gossypii) TEF1 프로모터 (PTEF) 및 아시비아 고시피이 TEF1 종결 서열 (TTEF)의 제어 하의 스트렙토미세스 노우르세이(Streptomyces noursei) 노르세오트리신(nourseothricin) 아세틸트랜스퍼라제 (NAT) ORF에 의해 코딩되는 노르세오트리신 저항성을 사용한다.
도 4는 플라스미드 pGLY6의 지도를 나타낸다. 플라스미드 pGLY6은 URA5 유전자좌를 표적으로 하고, 피키아 파스토리스 URA5 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpURA5-5')을 포함하는 핵산 분자가 한쪽 측면에, 피키아 파스토리스 URA5 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpURA5-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹(flanking)된 사카로미세스 세레비지아에 인버타제(invertase) 유전자 또는 전사 단위 (ScSUC2)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 5는 플라스미드 pGLY40의 지도를 나타낸다. 플라스미드 pGLY40은 OCH1 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 OCH1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpOCH1-5')을 포함하는 핵산 분자가 한쪽 측면에, OCH1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpOCH1-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 6은 플라스미드 pGLY43a의 지도를 나타낸다. 플라스미드 pGLY43a는 BMT2 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자에 인접한 클루이베로미세스 락티스 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 수송체 유전자 또는 전사 단위 (KlGlcNAc 수송체)를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 이러한 인접한 유전자들에 BMT2 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpPBS2-5')을 포함하는 핵산 분자가 한쪽 측면에, BMT2 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpPBS2-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다.
도 7은 플라스미드 pGLY48의 지도를 나타낸다. 플라스미드 pGLY48은 MNN4L1 유전자좌를 표적으로 하고, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자에 인접한, 피키아 파스토리스 GAPDH 프로모터 (PpGAPDH 프로모터)를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 종결 서열 (ScCYC TT)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 UDP-GlcNAc 수송체의 마우스 상동체 (MmGlcNAc 수송체) 오픈 리딩 프레임 (ORF)을 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하며, 이때 전체적인 발현 카세트들에 피키아 파스토리스 MNN4L1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpMNN4L1-5')을 포함하는 핵산 분자가 한쪽 측면에, MNN4L1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpMNN4L1-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 통합 벡터이다.
도 8은 플라스미드 pGLY45의 지도를 나타낸다. 플라스미드 pGLY45는 PNO1/MNN4 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 PNO1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpPNO1-5')을 포함하는 핵산 분자가 한쪽 측면에, MNN4 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpMNN4-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 9는 플라스미드 pGLY1430의 지도를 나타낸다. 플라스미드 pGLY1430은 ADE1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) N-말단에서 피키아 파스토리스 SEC12 리더 펩티드에 융합된 인간 GlcNAc 트랜스퍼라제 I 촉매 도메인 (코돈-최적화됨) (CO-NA10), (2) UDP-GlcNAc 수송체의 마우스 상동체 (MmTr), (3) N-말단에서 사카로미세스 세레비지아에 SEC12 리더 펩티드에 융합된 마우스 만노시다제 IA 촉매 도메인 (FB) (FB8), 및 (4) lacZ 반복물들 (lacZ)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 KINKO 통합 벡터이다. 이들 전체에 ADE1 유전자의 5' 영역 및 ORF (ADE1 5' 및 ORF) 및 ADE1 유전자의 3' 영역 (PpADE1-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, SEC4는 피키아 파스토리스 SEC4 프로모터이고, OCH1 TT는 피키아 파스토리스 OCH1 종결 서열이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이고, PpALG3 TT는 피키아 파스토리스 ALG3 종결 서열이며, PpGAPDH는 피키아 파스토리스 GADPH 프로모터이다.
도 10은 플라스미드 pGLY582의 지도를 나타낸다. 플라스미드 pGLY582는 HIS1 유전자좌를 표적으로 하고, (1) 사카로미세스 세레비지아에 UDP-글루코스 에피머라제(epimerase) (ScGAL10), (2) N-말단에서 사카로미세스 세레비지아에 KRE2-s 리더 펩티드 (33)에 융합된 인간 갈락토실트랜스퍼라제 I (hGalT) 촉매 도메인, (3) lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5), 및 (4) 드로소필라 멜라노가스터 UDP-갈락토스 수송체 (DmUGT)를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. 이들 전체에 HIS1 유전자의 5' 영역 (PpHIS1-5') 및 HIS1 유전자의 3' 영역 (PpHIS1-3')이 플랭킹된다. PMA1은 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, GAPDH는 피키아 파스토리스 GADPH 프로모터이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이며, PpALG12 TT는 피키아 파스토리스 ALG12 종결 서열이다.
도 11은 플라스미드 pGLY167b의 지도를 나타낸다. 플라스미드 pGLY167b는 ARG1 유전자좌를 표적으로 하고, (1) N-말단에서 사카로미세스 세레비지아에 MNN2 리더 펩티드에 융합된 드로소필라 멜라노가스터 만노시다제 II 촉매 도메인 (코돈-최적화됨) (CO-KD53), (2) 피키아 파스토리스 HIS1 유전자 또는 전사 단위, 및 (3) N-말단에서 사카로미세스 세레비지아에 MNN2 리더 펩티드에 융합된 래트 N-아세틸글루코사민 (GlcNAc) 트랜스퍼라제 II 촉매 도메인 (코돈-최적화됨) (CO-TC54)를 코딩하는 3개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. 이들 전체에 ARG1 유전자의 5' 영역 (PpARG1-5') 및 ARG1 유전자의 3' 영역 (PpARG1-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, PpGAPDH는 피키아 파스토리스 GADPH 프로모터이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이며, PpALG12 TT는 피키아 파스토리스 ALG12 종결 서열이다.
도 12는 플라스미드 pGLY3411 (pSH1092)의 지도를 나타낸다. 플라스미드 pGLY3411 (pSH1092)은 피키아 파스토리스 BMT4 유전자의 5' 뉴클레오티드 서열 (PpPBS4 5')이 한쪽 측면에, 피키아 파스토리스 BMT4 유전자의 3' 뉴클레오티드 서열 (PpPBS4 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 13은 플라스미드 pGLY3419 (pSH1110)의 지도를 나타낸다. 플라스미드 pGLY3430 (pSH1115)은 피키아 파스토리스 BMT1 유전자의 5' 뉴클레오티드 서열 (PpPBS1 5')이 한쪽 측면에, 피키아 파스토리스 BMT1 유전자의 3' 뉴클레오티드 서열 (PpPBS1 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 14는 플라스미드 pGLY3421 (pSH1106)의 지도를 나타낸다. 플라스미드 pGLY4472 (pSH1186)는 피키아 파스토리스 BMT3 유전자의 5' 뉴클레오티드 서열 (PpPBS3 5')이 한쪽 측면에, 피키아 파스토리스 BMT3 유전자의 3' 뉴클레오티드 서열 (PpPBS3 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유한다.
도 15는 플라스미드 pGLY3673의 지도를 나타낸다. 플라스미드 pGLY3673은 PRO1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan)을 코딩하는 발현 카세트를 함유하는 KINKO 통합 벡터이다.
도 16은 항-Her2 항체의 경쇄 및 중쇄를 코딩하는 pGLY6833의 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하는 롤-인 벡터이다. 경쇄 및 중쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 피키아 파스토리스 CIT1 3UTR 전사 종결 서열의 제어 하에 있다. 형질전환체의 선택은 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신R) ORF에 의해 코딩되는 제오신 저항성을 사용한다.
도 17은 항-RSV 항체의 경쇄 및 중쇄를 코딩하는 pGLY6564의 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하는 롤-인 벡터이다. 중쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하에 있다. 경쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 피키아 파스토리스 AOX1 전사 종결 서열의 제어 하에 있다. 형질전환체의 선택은 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신R) ORF에 의해 코딩되는 제오신 저항성을 사용한다.
도 18은 대조군 균주 대 LmSTT3D가 구성적으로 (GAPDH 프로모터) 또는 유도에 의해 (AOX1 프로모터) 발현되는 균주에서 생산된 항-Her2 및 항-RSV 항체의 N-글리코실화 부위 점유 백분율을 나타낸다.
도 19는 CHO 세포에서 생산된 상업적으로 입수가능한 항-Her2 항체 (헤르셉틴(HERCEPTIN))의 N-글리코실화 부위 점유에 비교된 균주 YGLY13992 및 균주 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유의 비교를 나타낸다. 균주 YGLY13992는 LmSTT3D를 코딩하는 발현 카세트를 포함하지 않는 반면, 균주 YGLY17351은 유도성 PpAOX1 프로모터의 제어 하의 LmSTT3을 코딩하는 발현 카세트를 포함한다.
도 20은 다양한 생물반응기에서 성장된 균주 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유 백분율이 생물반응기 규모와 관계없이 일관적이었음을 나타낸다.
도 21은 시판 항-Her2 항체 로트 (헤르셉틴)의 CE 및 Q-TOF 분석 결과를 나타낸다.
도 22는 도 21에 대해 사용된 것과 동일하지만 일정 기간 동안 PNGase F로 처리된 후의 시판 로트에 대한 CE 및 Q-TOF 분석 결과를 나타낸다.
도 23a - 23d는 YGLY7961에서 시작하는 피키아 파스토리스 균주 YGLY12900의 계도를 나타낸다.
도 24는 플라스미드 pGLY2456의 지도를 나타낸다. 플라스미드 pGLY2456은 TRP2 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) 코돈-최적화 마우스 CMP-시알산 수송체 (CO mCMP-Sia 수송체), (2) 코돈-최적화 인간 UDP-GlcNAc 2-에피머라제/N-아세틸만노사민 키나제(kinase) (CO hGNE), (3) 피키아 파스토리스 ARG1 유전자 또는 전사 단위, (4) 코돈-최적화 인간 CMP-시알산 신타제(synthase) (CO hCMP-NANA S), (5) 코돈-최적화 인간 N-아세틸뉴라미네이트-9-포스페이트 신타제 (CO hSIAP S), 및 (6) N-말단에서 사카로미세스 세레비지아에 KRE2 리더 펩티드에 융합된 코돈-최적화 마우스 a-2,6-시알릴트랜스퍼라제 촉매 도메인 (comST6-33)을 코딩하는 6개의 발현 카세트를 함유하는 KINKO 통합 벡터이다. 이들 전체에 TRP2 유전자의 5' 영역 및 ORF (PpTRP2 5') 및 TRP2 유전자의 3' 영역 (PpTRP2-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, CYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpTEF 프로모터는 피키아 파스토리스 TEF1 프로모터이고, PpTEF TT는 피키아 파스토리스 TEF1 종결 서열이고, PpALG3 TT는 피키아 파스토리스 ALG3 종결 서열이며, pGAP는 피키아 파스토리스 GAPDH 프로모터이다.
도 25는 플라스미드 pGLY5048의 지도를 나타낸다. 플라스미드 pGLY5048은 STE13 유전자좌를 표적으로 하고, (1) N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan) 및 (2) 피키아 파스토리스 URA5 유전자 또는 전사 단위를 코딩하는 발현 카세트들을 함유하는 통합 벡터이다.
도 26은 플라스미드 pGLY5019의 지도를 나타낸다. 플라스미드 pGLY5019는 DAP2 유전자좌를 표적으로 하고, 피키아 파스토리스 DAP2 유전자의 5' 뉴클레오티드 서열이 한쪽 측면에, 피키아 파스토리스 DAP2 유전자의 3' 뉴클레오티드 서열이 다른 쪽 측면에 플랭킹된, 아시비아 고시피이 TEF1 프로모터 및 아시비아 고시피이 TEF1 종결 서열에 작동가능하게 연결된 노르세오트리신 저항성 (NATR) ORF를 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 27은 pGLY5085의 플라스미드 지도를 나타낸다. 플라스미드 pGLY5085는 시알릴화 N-글리칸을 생산하는데 수반되는 제2 유전자 세트를 피키아 파스토리스 내로 도입하기 위한 KINKO 플라스미드이다. 피키아 파스토리스 ARG1 유전자가 히그로마이신 저항성을 코딩하는 발현 카세트 (HygR)로 교체되었고 플라스미드가 피키아 파스토리스 TRP5 유전자좌를 표적으로 한다는 것을 제외하고는, 이러한 플라스미드는 플라스미드 YGLY2456과 유사하다. 일렬의 6개의 카세트에 정지 코돈에서 끝나는 TRP5 유전자의 5' 영역 및 ORF로부터의 뉴클레오티드 서열에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, TRP5 유전자의 3' 영역으로부터의 뉴클레오티드 서열을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다.
도 28은 pGLY7240의 플라스미드 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하고, 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신R)을 코딩하는 ORF를 함유하는 통합 벡터이다. 이러한 플라스미드는 피키아 파스토리스 AOX1 프로모터에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열에 3' 끝부분에서 작동가능하게 연결된 GM-CSF/CWP1 융합 단백질을 코딩한다.
도 29는 GM-CSF가 1개의 부위로 우세하게 N-글리코실화되고 소수의 부분이 2개의 N 부위 및 비-글리코실화인 대조군 균주 (YGLY15560, 레인 9)와 대조적으로, 대다수의 GM-CSF (레인 2-8)가 2N-연결 부위로 글리코실화된 균주 YGLY16349 (LmSTT3D를 공동-발현함)에서 생산된 GM-CSF의 웨스턴 블롯(Western blot)을 나타낸다.
도 30은 각각 YGLY15560 (a) 및 YGLY16349 (b)로부터 발현된 GM-CSF의 Q-TOP 분석을 나타낸다. 비-글리코실화 GM-CSF는 검출되지 않았다.
도 2는 피키아 파스토리스 알콜 옥시다제(oxidase) I (AOX1) 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 LmSTT3D ORF를 코딩하는 플라스미드 pGLY6301의 지도를 나타내다. 이러한 플라스미드는 URA6 유전자좌를 표적으로 하는 롤-인(roll-in) 벡터이다. 형질전환체의 선택은 피키아 파스토리스 RPL10 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 사카로미세스 세레비지아에 ARR3 ORF에 의해 코딩되는 비소 저항성을 사용한다.
도 3은 피키아 파스토리스 GAPDH 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 LmSTT3D ORF를 코딩하는 플라스미드 pGLY6294의 지도를 나타낸다. 이러한 플라스미드는 TRP1 유전자좌를 표적으로 하는 KINKO 벡터이다: TRP1 ORF의 3' 끝부분이 피키아 파스토리스 ALG3 전사 종결 서열에 인접한다. 형질전환체의 선택은 아시비아 고시피이(Ashbya gossypii) TEF1 프로모터 (PTEF) 및 아시비아 고시피이 TEF1 종결 서열 (TTEF)의 제어 하의 스트렙토미세스 노우르세이(Streptomyces noursei) 노르세오트리신(nourseothricin) 아세틸트랜스퍼라제 (NAT) ORF에 의해 코딩되는 노르세오트리신 저항성을 사용한다.
도 4는 플라스미드 pGLY6의 지도를 나타낸다. 플라스미드 pGLY6은 URA5 유전자좌를 표적으로 하고, 피키아 파스토리스 URA5 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpURA5-5')을 포함하는 핵산 분자가 한쪽 측면에, 피키아 파스토리스 URA5 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpURA5-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹(flanking)된 사카로미세스 세레비지아에 인버타제(invertase) 유전자 또는 전사 단위 (ScSUC2)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 5는 플라스미드 pGLY40의 지도를 나타낸다. 플라스미드 pGLY40은 OCH1 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 OCH1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpOCH1-5')을 포함하는 핵산 분자가 한쪽 측면에, OCH1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpOCH1-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 6은 플라스미드 pGLY43a의 지도를 나타낸다. 플라스미드 pGLY43a는 BMT2 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자에 인접한 클루이베로미세스 락티스 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 수송체 유전자 또는 전사 단위 (KlGlcNAc 수송체)를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 이러한 인접한 유전자들에 BMT2 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpPBS2-5')을 포함하는 핵산 분자가 한쪽 측면에, BMT2 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpPBS2-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다.
도 7은 플라스미드 pGLY48의 지도를 나타낸다. 플라스미드 pGLY48은 MNN4L1 유전자좌를 표적으로 하고, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자에 인접한, 피키아 파스토리스 GAPDH 프로모터 (PpGAPDH 프로모터)를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 종결 서열 (ScCYC TT)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 UDP-GlcNAc 수송체의 마우스 상동체 (MmGlcNAc 수송체) 오픈 리딩 프레임 (ORF)을 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하며, 이때 전체적인 발현 카세트들에 피키아 파스토리스 MNN4L1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpMNN4L1-5')을 포함하는 핵산 분자가 한쪽 측면에, MNN4L1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpMNN4L1-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 통합 벡터이다.
도 8은 플라스미드 pGLY45의 지도를 나타낸다. 플라스미드 pGLY45는 PNO1/MNN4 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 PNO1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpPNO1-5')을 포함하는 핵산 분자가 한쪽 측면에, MNN4 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpMNN4-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 9는 플라스미드 pGLY1430의 지도를 나타낸다. 플라스미드 pGLY1430은 ADE1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) N-말단에서 피키아 파스토리스 SEC12 리더 펩티드에 융합된 인간 GlcNAc 트랜스퍼라제 I 촉매 도메인 (코돈-최적화됨) (CO-NA10), (2) UDP-GlcNAc 수송체의 마우스 상동체 (MmTr), (3) N-말단에서 사카로미세스 세레비지아에 SEC12 리더 펩티드에 융합된 마우스 만노시다제 IA 촉매 도메인 (FB) (FB8), 및 (4) lacZ 반복물들 (lacZ)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 KINKO 통합 벡터이다. 이들 전체에 ADE1 유전자의 5' 영역 및 ORF (ADE1 5' 및 ORF) 및 ADE1 유전자의 3' 영역 (PpADE1-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, SEC4는 피키아 파스토리스 SEC4 프로모터이고, OCH1 TT는 피키아 파스토리스 OCH1 종결 서열이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이고, PpALG3 TT는 피키아 파스토리스 ALG3 종결 서열이며, PpGAPDH는 피키아 파스토리스 GADPH 프로모터이다.
도 10은 플라스미드 pGLY582의 지도를 나타낸다. 플라스미드 pGLY582는 HIS1 유전자좌를 표적으로 하고, (1) 사카로미세스 세레비지아에 UDP-글루코스 에피머라제(epimerase) (ScGAL10), (2) N-말단에서 사카로미세스 세레비지아에 KRE2-s 리더 펩티드 (33)에 융합된 인간 갈락토실트랜스퍼라제 I (hGalT) 촉매 도메인, (3) lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5), 및 (4) 드로소필라 멜라노가스터 UDP-갈락토스 수송체 (DmUGT)를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. 이들 전체에 HIS1 유전자의 5' 영역 (PpHIS1-5') 및 HIS1 유전자의 3' 영역 (PpHIS1-3')이 플랭킹된다. PMA1은 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, GAPDH는 피키아 파스토리스 GADPH 프로모터이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이며, PpALG12 TT는 피키아 파스토리스 ALG12 종결 서열이다.
도 11은 플라스미드 pGLY167b의 지도를 나타낸다. 플라스미드 pGLY167b는 ARG1 유전자좌를 표적으로 하고, (1) N-말단에서 사카로미세스 세레비지아에 MNN2 리더 펩티드에 융합된 드로소필라 멜라노가스터 만노시다제 II 촉매 도메인 (코돈-최적화됨) (CO-KD53), (2) 피키아 파스토리스 HIS1 유전자 또는 전사 단위, 및 (3) N-말단에서 사카로미세스 세레비지아에 MNN2 리더 펩티드에 융합된 래트 N-아세틸글루코사민 (GlcNAc) 트랜스퍼라제 II 촉매 도메인 (코돈-최적화됨) (CO-TC54)를 코딩하는 3개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. 이들 전체에 ARG1 유전자의 5' 영역 (PpARG1-5') 및 ARG1 유전자의 3' 영역 (PpARG1-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, PpGAPDH는 피키아 파스토리스 GADPH 프로모터이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이며, PpALG12 TT는 피키아 파스토리스 ALG12 종결 서열이다.
도 12는 플라스미드 pGLY3411 (pSH1092)의 지도를 나타낸다. 플라스미드 pGLY3411 (pSH1092)은 피키아 파스토리스 BMT4 유전자의 5' 뉴클레오티드 서열 (PpPBS4 5')이 한쪽 측면에, 피키아 파스토리스 BMT4 유전자의 3' 뉴클레오티드 서열 (PpPBS4 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 13은 플라스미드 pGLY3419 (pSH1110)의 지도를 나타낸다. 플라스미드 pGLY3430 (pSH1115)은 피키아 파스토리스 BMT1 유전자의 5' 뉴클레오티드 서열 (PpPBS1 5')이 한쪽 측면에, 피키아 파스토리스 BMT1 유전자의 3' 뉴클레오티드 서열 (PpPBS1 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 14는 플라스미드 pGLY3421 (pSH1106)의 지도를 나타낸다. 플라스미드 pGLY4472 (pSH1186)는 피키아 파스토리스 BMT3 유전자의 5' 뉴클레오티드 서열 (PpPBS3 5')이 한쪽 측면에, 피키아 파스토리스 BMT3 유전자의 3' 뉴클레오티드 서열 (PpPBS3 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유한다.
도 15는 플라스미드 pGLY3673의 지도를 나타낸다. 플라스미드 pGLY3673은 PRO1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan)을 코딩하는 발현 카세트를 함유하는 KINKO 통합 벡터이다.
도 16은 항-Her2 항체의 경쇄 및 중쇄를 코딩하는 pGLY6833의 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하는 롤-인 벡터이다. 경쇄 및 중쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 피키아 파스토리스 CIT1 3UTR 전사 종결 서열의 제어 하에 있다. 형질전환체의 선택은 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신R) ORF에 의해 코딩되는 제오신 저항성을 사용한다.
도 17은 항-RSV 항체의 경쇄 및 중쇄를 코딩하는 pGLY6564의 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하는 롤-인 벡터이다. 중쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하에 있다. 경쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 피키아 파스토리스 AOX1 전사 종결 서열의 제어 하에 있다. 형질전환체의 선택은 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신R) ORF에 의해 코딩되는 제오신 저항성을 사용한다.
도 18은 대조군 균주 대 LmSTT3D가 구성적으로 (GAPDH 프로모터) 또는 유도에 의해 (AOX1 프로모터) 발현되는 균주에서 생산된 항-Her2 및 항-RSV 항체의 N-글리코실화 부위 점유 백분율을 나타낸다.
도 19는 CHO 세포에서 생산된 상업적으로 입수가능한 항-Her2 항체 (헤르셉틴(HERCEPTIN))의 N-글리코실화 부위 점유에 비교된 균주 YGLY13992 및 균주 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유의 비교를 나타낸다. 균주 YGLY13992는 LmSTT3D를 코딩하는 발현 카세트를 포함하지 않는 반면, 균주 YGLY17351은 유도성 PpAOX1 프로모터의 제어 하의 LmSTT3을 코딩하는 발현 카세트를 포함한다.
도 20은 다양한 생물반응기에서 성장된 균주 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유 백분율이 생물반응기 규모와 관계없이 일관적이었음을 나타낸다.
도 21은 시판 항-Her2 항체 로트 (헤르셉틴)의 CE 및 Q-TOF 분석 결과를 나타낸다.
도 22는 도 21에 대해 사용된 것과 동일하지만 일정 기간 동안 PNGase F로 처리된 후의 시판 로트에 대한 CE 및 Q-TOF 분석 결과를 나타낸다.
도 23a - 23d는 YGLY7961에서 시작하는 피키아 파스토리스 균주 YGLY12900의 계도를 나타낸다.
도 24는 플라스미드 pGLY2456의 지도를 나타낸다. 플라스미드 pGLY2456은 TRP2 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) 코돈-최적화 마우스 CMP-시알산 수송체 (CO mCMP-Sia 수송체), (2) 코돈-최적화 인간 UDP-GlcNAc 2-에피머라제/N-아세틸만노사민 키나제(kinase) (CO hGNE), (3) 피키아 파스토리스 ARG1 유전자 또는 전사 단위, (4) 코돈-최적화 인간 CMP-시알산 신타제(synthase) (CO hCMP-NANA S), (5) 코돈-최적화 인간 N-아세틸뉴라미네이트-9-포스페이트 신타제 (CO hSIAP S), 및 (6) N-말단에서 사카로미세스 세레비지아에 KRE2 리더 펩티드에 융합된 코돈-최적화 마우스 a-2,6-시알릴트랜스퍼라제 촉매 도메인 (comST6-33)을 코딩하는 6개의 발현 카세트를 함유하는 KINKO 통합 벡터이다. 이들 전체에 TRP2 유전자의 5' 영역 및 ORF (PpTRP2 5') 및 TRP2 유전자의 3' 영역 (PpTRP2-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, CYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpTEF 프로모터는 피키아 파스토리스 TEF1 프로모터이고, PpTEF TT는 피키아 파스토리스 TEF1 종결 서열이고, PpALG3 TT는 피키아 파스토리스 ALG3 종결 서열이며, pGAP는 피키아 파스토리스 GAPDH 프로모터이다.
도 25는 플라스미드 pGLY5048의 지도를 나타낸다. 플라스미드 pGLY5048은 STE13 유전자좌를 표적으로 하고, (1) N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan) 및 (2) 피키아 파스토리스 URA5 유전자 또는 전사 단위를 코딩하는 발현 카세트들을 함유하는 통합 벡터이다.
도 26은 플라스미드 pGLY5019의 지도를 나타낸다. 플라스미드 pGLY5019는 DAP2 유전자좌를 표적으로 하고, 피키아 파스토리스 DAP2 유전자의 5' 뉴클레오티드 서열이 한쪽 측면에, 피키아 파스토리스 DAP2 유전자의 3' 뉴클레오티드 서열이 다른 쪽 측면에 플랭킹된, 아시비아 고시피이 TEF1 프로모터 및 아시비아 고시피이 TEF1 종결 서열에 작동가능하게 연결된 노르세오트리신 저항성 (NATR) ORF를 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 27은 pGLY5085의 플라스미드 지도를 나타낸다. 플라스미드 pGLY5085는 시알릴화 N-글리칸을 생산하는데 수반되는 제2 유전자 세트를 피키아 파스토리스 내로 도입하기 위한 KINKO 플라스미드이다. 피키아 파스토리스 ARG1 유전자가 히그로마이신 저항성을 코딩하는 발현 카세트 (HygR)로 교체되었고 플라스미드가 피키아 파스토리스 TRP5 유전자좌를 표적으로 한다는 것을 제외하고는, 이러한 플라스미드는 플라스미드 YGLY2456과 유사하다. 일렬의 6개의 카세트에 정지 코돈에서 끝나는 TRP5 유전자의 5' 영역 및 ORF로부터의 뉴클레오티드 서열에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, TRP5 유전자의 3' 영역으로부터의 뉴클레오티드 서열을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다.
도 28은 pGLY7240의 플라스미드 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하고, 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신R)을 코딩하는 ORF를 함유하는 통합 벡터이다. 이러한 플라스미드는 피키아 파스토리스 AOX1 프로모터에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열에 3' 끝부분에서 작동가능하게 연결된 GM-CSF/CWP1 융합 단백질을 코딩한다.
도 29는 GM-CSF가 1개의 부위로 우세하게 N-글리코실화되고 소수의 부분이 2개의 N 부위 및 비-글리코실화인 대조군 균주 (YGLY15560, 레인 9)와 대조적으로, 대다수의 GM-CSF (레인 2-8)가 2N-연결 부위로 글리코실화된 균주 YGLY16349 (LmSTT3D를 공동-발현함)에서 생산된 GM-CSF의 웨스턴 블롯(Western blot)을 나타낸다.
도 30은 각각 YGLY15560 (a) 및 YGLY16349 (b)로부터 발현된 GM-CSF의 Q-TOP 분석을 나타낸다. 비-글리코실화 GM-CSF는 검출되지 않았다.
발명의 상세한 설명
본 발명은 당단백질의 N-글리코실화 부위 점유가 본원에 개시된 바와 같이 변형되지 않은 숙주 세포에서 생산된 동일한 당단백질의 N-글리코실화 부위 점유에 비해 증가된 숙주 세포에서 치료 당단백질을 생산하는 방법을 제공한다. 본 발명이 저급 진핵생물 숙주 세포, 예를 들어, 효모 숙주 세포 또는 사상 진균 숙주 세포에서 실행되는 경우, 숙주 세포에서 생산된 재조합 당단백질의 N-글리코실화 부위 점유가 포유동물 또는 인간 숙주 세포에서 생산된 동일한 재조합 당단백질의 N-글리코실화 부위 점유와 동일하거나 또는 이와 더욱 유사하다.
재조합 숙주 세포에 생산된 당단백질 상의 N-글리코실화 부위 점유를 증가시키기 위해, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (특정 실시양태에서, 하나 이상이 숙주 세포의 내인성 헤테로올리고머성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 이루는 하나 이상의 필수 서브유닛의 치사성 돌연변이를 기능적으로 억제할 수 있음)를 코딩하는 하나 이상의 핵산 분자가 숙주 세포에서의 당단백질의 발현 전에 또는 발현과 동시에 재조합 숙주 세포에서 과다발현된다.
리슈마니아 메이저 STT3A 단백질, 리슈마니아 메이저 STT3B 단백질, 및 리슈마니아 메이저 STT3D 단백질은 사카로미세스 세레비지아에에서 STT3 유전자좌의 결실의 치사성 표현형을 억제하는 것으로 나타난 단일-서브유닛 올리고사카릴트랜스퍼라제이다 (문헌 [Naseb et al., Molec. Biol. Cell 19: 3758-3768 (2008)]). 나셉(Naseb) 등 (동일 문헌)은 리슈마니아 메이저 STT3D 단백질이 WBP1, OST1, SWP1 또는 OST2 유전자좌의 결실의 치사성 표현형을 억제할 수 있음을 추가로 나타냈다. 문헌 [Hese et al., Glycobiology 19: 160-171 (2009)]에서는 리슈마니아 메이저 STT3A (STT3-1), STT3B (STT3-2), 및 STT3D (STT3-4) 단백질이 OST2, SWP1, 및 WBP1 유전자좌의 결실을 기능적으로 보완할 수 있음이 교시되었다. 리슈마니아 메이저 STT3D (LmSTT3D) 단백질은 숙주 세포에 의해 생산된 이종성 당단백질, 예를 들어 항체의 N-글리코실화 부위 점유를 강화시킬 수 있는 것으로 본원에서의 실시예에서 나타난, Δ stt3 돌연변이의 치사성 표현형 및 Δ wbp1, Δ ost1, Δ swp1 및 Δo s t2 돌연변이의 하나 이상의 치사성 표현형을 억제할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제이다.
숙주 세포의 STT3 단백질이 포함되는, 숙주 세포의 내인성 OTase 복합체를 구성하는 단백질의 존재 하에 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 구성적으로 또는 유도성으로 과다발현된다. 각각의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 코딩하는 발현 카세트는 숙주 세포 게놈 내의 임의의 부위 내로 통합될 수 있거나, 또는 숙주 세포의 염색체외 공간 내에 위치할 수 있고, 즉 플라스미드, 바이러스, 2 ㎛ 플라스미드, 미니염색체 등과 같은 자율적으로 복제되는 유전 요소일 수 있다. 일반적으로, 이종성 구성적 또는 유도성 프로모터 및 특정 숙주 세포 내에서 이종성 단백질을 발현시키는데 적절한 기타 이종성 전사 또는 번역 조절 요소에 작동가능하게 연결된 단일-서브유닛 올리고사카릴트랜스퍼라제 오픈 리딩 프레임 (ORF)을 코딩하는 핵산 분자를 각각 포함하는 발현 카세트 내에서 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 숙주 세포에 제공된다. 각각의 발현 카세트의 하나 이상의 카피가 통합을 위한 특정 유전자좌의 부위-특이적 표적화에 의해 또는 발현 카세트를 게놈 내로 무작위로 통합시키는 것에 의해 숙주 세포 게놈 내의 하나 이상의 위치 내로 통합된다. 표적화된 통합을 위한 유전자좌는 발현 카세트 내의 단일-서브유닛 올리고사카릴트랜스퍼라제의 이소성 구성적 또는 유도성 발현을 위한 유전자좌의 적절성을 기초로 선택될 수 있다. 단일- 및 이중-교차 상동 재조합 등과 같은 기술에 의해 이종성 핵산 분자를 숙주 세포 게놈 내로 통합시키는 방법이 당업계에 주지되어 있다 (예를 들어, 미국 출원 공개 번호 20090124000 및 국제 출원 공개 번호 WO2009085135 (이들의 개시내용은 참고로 본원에 포함됨) 참조). 별법적으로, 또는 발현 카세트의 하나 이상의 카피를 숙주 세포 게놈 내로 통합시키는 것에 더하여, 2μ 플라스미드, 바이러스 벡터, 미니염색체, 또는 자율적으로 복제되는 기타 유전자 벡터를 사용하여 발현 카세트의 하나 이상의 카피가 숙주 세포의 염색체외 공간 내에 위치한다.
본 발명이 복합 N-글리칸을 포함하는 포유동물 또는 인간-유사 글리코실화 패턴을 생산하도록 유전자 조작된 피키아 파스토리스 숙주 세포로 본원에서 예시되었지만, 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 발현하도록 본원에 개시된 바와 같이 변형되지 않은 숙주에서 생산된 당단백질의 것과 비교하여 숙주 세포에서 생산된 당단백질의 전체적인 N-글리코실화 부위 점유량을 증가시키기 위한 본 발명은 포유동물 또는 인간 글리코실화 패턴을 갖는 당단백질을 생산하도록 유전자 조작되지 않고, 대신 내인성 또는 야생형 글리코실화 패턴, 예를 들어 과만노실화 N-글리코실화 또는 숙주 세포에 알파-1,6-만노실트랜스퍼라제 (och1p) 활성이 결여된 경우의 고-만노스 N-글리코실화를 갖는 당단백질을 발현하는 피키아 파스토리스 숙주 세포에 또한 적용될 수 있다. 본 발명은 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 발현하도록 본원에 개시된 바와 같이 변형되지 않은 숙주에서 생산된 당단백질의 것과 비교하여 숙주 세포에서 생산된 당단백질의 전체적인 N-글리코실화 부위 점유량을 증가시키기 위해, 내인성 또는 야생형 글리코실화 패턴, 예를 들어 과만노실화 N-글리코실화 또는 숙주 세포에 알파-1,6-만노실트랜스퍼라제 (och1p) 활성이 결여된 경우의 고-만노스 N-글리코실화를 갖는 당단백질을 발현하거나 또는 포유동물 또는 인간-유사 복합 또는 하이브리드 N-글리칸을 생산하도록 유전자 조작된 기타 효모 또는 사상 진균 또는 식물 또는 조류 숙주 세포에 또한 적용될 수 있다. 본 발명은 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 발현하도록 본원에 개시된 바와 같이 변형되지 않은 숙주 세포에서 생산된 당단백질의 것과 비교하여 2개를 초과하는 N-연결 부위가 있는 당단백질의 전체적인 N-글리코실화 부위 점유를 증가시키기 위해 포유동물 발현 시스템에 또한 적용될 수 있다.
동물, 식물 및 진균의 OTase 복합체는 헤테로올리고머성 단백질 복합체이다. 잘 연구되어 있는 모델 생물인 사카로미세스 세레비지아에에서, 현재 OTase 복합체는 8개 이상의 상이한 서브유닛으로 이루어지는 것으로 보인다: Ost1p, Ost2p, Wbp1, Stt3p, Swp1p, Ost4p, Ost5p, 및 Ost3p/Ost6p (문헌 [Silberstein & Gilmore, FASEB J. 10: 849-858 (1996)]; [Knauer & Lehle, Biochim. Biophys. Acta. 1426: 259-273 (1999)]; [Dempski & Imperiali, Curr. Opin. Chem. Biol.6: 844-850 (2002)]; [Yan & Lennarz, J. Biol. Chem. 277: 47692-47700 (2005)]; [Kelleher & Gilmore, Glycobiol. 16:47R-62R (2006)]; [Weerapana & Imperiali, Glycobiol. 16: 91R-101R (2006)]). 피키아 파스토리스에서, OTase 복합체는 적어도 Ost1p, Ost2p, Ost3p, Ost4p, Ost6p, Wbp1, Swp1p, 및 Stt3p를 포함하는 것으로 보인다 (문헌 [Shutter et al., Nat. Biotechnol. 27: 561-566 (2009)] 참조).
STT3 단백질이 OTase 복합체 내의 촉매 서브유닛인 것으로 가정되었다 (문헌 [Yan & Lennarz, J. Biol. Chem. 277: 47692-47700 (2002)]; [Kelleher et al., Mol. Cell. 12: 101-111 (2003)]; [Nilsson et al., J. Cell Biol. 161: 715-725 (2003)]). 이러한 가정이 효모 Stt3p의 원핵생물 상동체가 어떠한 다른 부속 단백질의 부재 하에서도 활성 올리고사카릴트랜스퍼라제임을 나타내는 실험으로부터 지지되었다 (문헌 [Wacker et al., Science. 298: 1790-1793 (2002)]; [Kowarik et al., Science 314: 1148-1150 (2006)]). 효모 Stt3p에 대해 상동성인 단백질들이 거의 모든 진핵생물 게놈에서 코딩된다 (문헌 [Kelleher & Gilmore, Glycobiol. 16:47R-62R (2006)]). 그러나, 비교 게놈 분석은 OTase의 조성이 진핵생물의 진화적 분기 동안 점점 더 복잡해졌음을 시사한다.
단일-서브유닛 올리고사카릴트랜스퍼라제가 지아디아(Giardia) 및 키네토플라스티드(kinetoplastid) 내에 존재하는 한편, STT3, OST1, OST2 및 WBP1 상동체로 이루어지는 4-서브유닛 올리고사카릴트랜스퍼라제가 디플로모나드(diplomonad), 엔트아메바(entamoeba) 및 아피콤플렉산(apicomplexan) 종에서 발견된다. 추가적으로, 여러 형태의 추정 STT3 단백질이 트리파노소마티드(trypanosomatid) 게놈에서 코딩될 수 있다: 3가지 STT3 상동체가 트리파노소마 브루세이(Trypanosoma brucei)에서, 4가지가 리슈마니아 메이저에서 발견된다 (문헌 [McConville et al., Microbiol. Mol. Biol. Rev. 66: 122-154 (2002)]; [Berriman et al., Science. 309: 416-422 (2005)]; [Ivens et al., Science. 309: 436-442 (2005)]; [Samuelson et al., Proc. Natl. Acad. Sci. USA 102: 1548-1553 (2005)]; [Kelleher & Gilmore, Glycobiol. 16:47R-62R (2006)]).
트리파노소마티드 기생충에서, N-연결 글리코실화는 주로 진균 또는 동물 세포에 대해 기술된 경로를 따르지만, 상이한 올리고사카라이드 구조가 단백질에 전달된다 (문헌 [Parodi, Glycobiology 3: 193-199 (1993)]; [McConville et al., Microbiol. Mol. Biol. Rev. 66: 122-154 (2002)]). 종에 따라, Man6GlcNAc2 또는 Man7GlcNAc2가 리슈마니아 속에서 단백질로 전달되는 가장 큰 글리칸인 것으로 나타났다 (문헌 [Parodi, Glycobiology 3: 193-199 (1993)]). 가급적이면 Glc3Man9GlcNAc2를 사용하는 효모 및 포유동물 올리고사카릴트랜스퍼라제와 달리, 트리파노솜(trypanosome) 올리고사카릴트랜스퍼라제는 선택적이지 않고, 상이한 지질-연결 올리고사카라이드들을 동일한 속도로 전달한다 (문헌 [Bosch et al., J. Biol. Chem. 263:17360-17365 (1988)]). 따라서, 가장 간단한 진핵생물 올리고사카릴트랜스퍼라제는 박테리아 N-글리코실화 시스템에서 발견되는 올리고사카릴트랜스퍼라제와 유사한 단일 서브유닛 STT3 단백질이다. 문헌 [Nasab et al., Molecular Biology of the Cell 19: 3758-3768 (2008)]에서, 사카로미세스 세레비지아에에서 4개의 리슈마니아 메이저 STT3 단백질 각각이 개별적으로 발현되었고, 이들 중 3개 (LmSTT3A 단백질, LmSTT3B 단백질, 및 LmSTT3D 단백질)가 효모 STT3 유전자좌의 결실을 보완할 수 있는 것으로 발견되었다. 또한, LmSTT3D 발현은 다양한 필수 OTase 서브유닛을 코딩하는 유전자들에서의 단일 및 이중 결실의 치사성 표현형을 억제하였다. LmSTT3 단백질은 효모 OTase 복합체 내로 혼입되지 않았지만, 대신 효모 세포의 내인성 다량체성 효소를 교체할 수 있는 동종이량체성 효소를 형성하였다. 이러한 결과는 이러한 단일-서브유닛 올리고사카릴트랜스퍼라제들이 원핵생물 효소와 유사할 수 있는 한편, 진핵생물 글리코실화에 전형적인 기질, 즉 N-X-S/T N-글리코실화 인식 부위 및 돌리콜피로포스페이트-연결 고-만노스 올리고사카라이드를 사용한다는 것을 가리킨다.
효모에서의 N-글리코실화 부위 점유가, 예를 들어, 문헌 [Schultz and Aebi, Molec. Cell. Proteomics 8: 357-364 (2009)]; [Hese et al., 상기 문헌] 및 [Nasab et al., 상기 문헌]에 의해, 보고서에서 또한 논의되었다. 사카로미세스 세레비지아에에서의 톡소플라스마 곤디이(Toxoplasma gondii) 또는 트리파노소마 크루지(Trypanosoma cruzi) STT3 단백질의 발현이 stt3 결실의 치사성 표현형을 보완하는 것으로 나타났고 (문헌 [Shams-Eldin et al., Mol. Biochem. Parasitol. 143: 6-11 (2005)]; [Castro et al., Proc. Natl. Acad. Sci. USA 103: 14756-14760 (2006)]), 트리파노소마 크루지 STT3 단백질은 효모 OTase 복합체 내로 통합되는 한편, 리슈마니아 메이저 STT3 단백질은 대신 동종이량체를 형성하는 것으로 보인다 ([Nasab et al., 상기 문헌]). 그러나, 이러한 보고서들에서는, LmSTT3D 단백질이 내인성 단백질의 N-글리코실화 부위 점유를 측정한 연구에서 내인성 효모 STT3 유전자좌 및 효모 OTase 복합체의 기타 필수 성분의 치사성 돌연변이의 기능적 억제에 대해 시험되었다. 또한, 연구에서 사용된 효모 균주들이 하이브리드 또는 복합 N-글리칸을 포함하는 포유동물 또는 인간-유사 글리코실화 패턴이 아니라 효모 글리코실화 패턴을 갖는 당단백질을 생산하였다.
상기 보고서들과 대조적으로, 본 발명에서는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 단백질을 코딩하는 오픈 리딩 프레임 (본원에서, LmSTT3D를 코딩하는 오픈 리딩 프레임으로 예시됨)이 숙주 세포가 내인성 숙주 세포 STT3 유전자의 발현을 포함하여 숙주 세포 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 유전자를 추가로 발현하는 재조합 숙주 세포에서 구성적으로 또는 유도성으로 과다발현된다. 따라서, 숙주 세포가 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제, 및 내인성 숙주 세포 SST3 단백질이 포함되는 내인성 숙주 세포 OTase 복합체 둘 모두를 발현한다. 추가로, 재조합 효모, 사상 진균, 조류, 또는 식물 숙주 세포와 관련하여, 숙주 세포의 내인성 글리코실화 패턴을 갖는 당단백질이 아니라 복합 및/또는 하이브리드 N-글리칸을 포함하는 포유동물 또는 인간-유사 글리코실화 패턴을 포함하는 당단백질을 생산하도록 숙주 세포가 추가로 유전자 조작될 수 있다.
포유동물- 또는 인간-유사 복합 N-글리칸을 생산하도록 유전자 조작된 피키아 파스토리스 숙주 세포를 사용하여 본원에서 본 발명이 예시되었다; 그러나, 본 발명은 숙주 세포에서 생산된 당단백질의 전체적인 N-글리코실화 부위 점유를 개선시키기 위해 효모 또는 진균 N-글리칸 (과만노실화 N-글리칸 또는 고-만노스 N-글리칸)을 갖는 당단백질을 생산하거나 또는 포유동물- 또는 인간-유사 고-만노스, 복합, 또는 하이브리드 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작된 기타 효모 숙주 세포 (사카로미세스 세레비지아에, 스키조사카로미세스 폼베(Schizosaccharomyces pombe), 오가타에아 미누타, 및 피키아 파스토리스를 포함하지만 이에 한정되지는 않음) 또는 사상 진균 (트리코더마 레에세이를 포함하지만 이에 한정되지는 않음)에 또한 적용될 수 있다. 추가로, 본 발명은 식물 또는 포유동물 발현 시스템에서 생산된 당단백질, 특히 2개를 초과하는 N-연결 글리코실화 부위를 갖는 당단백질의 전체적인 N-글리코실화 부위 점유를 개선하기 위해 식물 및 포유동물 발현 시스템에 또한 적용될 수 있다.
따라서, 상기의 한 측면에서, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.
상기의 추가적인 측면에서, 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작되고, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하며, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.
올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자의 발현은 내인성 STT3 단백질 또는 상동체를 코딩하는 내인성 숙주 세포 유전자의 발현을 포함한다. 효모 숙주 세포의 경우에, 내인성 STT3 유전자의 발현을 포함하여, OTase 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현된다. 현재, 사카로미세스 세레비지아에 OTase 복합체를 구성하는 단백질을 코딩하는 유전자에 OST1, OST2, OST3, OST4, OST5, OST6, WBP1, SWP1, 및 STT3가 포함되는 것으로 공지되어 있고 (예를 들어, 문헌 [Spirig et al., Molec. Gen. Genet. 256: 628-637 (1997)] 참조), 피키아 파스토리스에서는, OTase 복합체가 적어도 Ost1p, Ost2p, Ost3p, Ost4p, Ost6p, Wbp1, Swp1p, 및 Stt3p를 포함하는 것으로 보인다 ([Shutter et al., 상기 문헌] 참조).
일반적으로, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체, 예를 들어, 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 따라서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 OTase 복합체의 하나 이상의 필수 단백질의 치사성 돌연변이를 기능적으로 보완하거나 구조할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 일반적으로, N-글리코실화 부위 점유를 증가시키기 위한 본원에서의 방법에서 사용될 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제는 특정 실시양태에서 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제이다. 예를 들어, 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 또는 피키아 파스토리스 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 리슈마니아 메이저 STT3D 단백질이다. 따라서, 특정 숙주 세포에 대해, 특정 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 특정 숙주 세포에서의 발현에 대해 적절하고, 단, 이러한 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제는 효모 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 억제할 수 있다. 추가 측면에서, 이종성 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제가 특정 숙주 세포에서의 발현에 대해 선택되고, 단 이러한 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 억제할 수 있다. 필수 단백질에는 OST1, OST2, WBP1, SWP1, 및 STT3이 포함된다.
본원에서 사용되는 경우에, 치사성 돌연변이에는 OTase 복합체의 필수 단백질을 코딩하는 유전자의 결실 또는 파괴, 또는 필수 단백질을 기능성이지 않게 하는 코딩 서열에서의 돌연변이가 포함된다. 이러한 용어는 shRNA 또는 RNAi를 사용하여 기능성 필수 단백질의 생산이 폐지되는 녹-다운(knock-down) 돌연변이를 추가로 포함할 수 있다.
하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 숙주 세포가 숙주 세포 STT3 단백질을 코딩하는 내인성 숙주 세포 유전자 (효모에서 STT3 유전자임)를 발현시키는 것을 포함하여, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 자신의 내인성 유전자를 발현하는 숙주 세포가 추가로 제공된다. 효모 숙주 세포의 추가적인 측면에서, 숙주 세포는 OTase 복합체를 구성하는 단백질을 코딩하는 내인성 유전자를 발현한다.
상기 중 어느 하나의 특정 측면에서, 숙주 세포는 단일-서브유닛 또는 다량체성 올리고사카릴트랜스퍼라제가 포함될 수 있는 추가적인 이종성 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다. 예를 들어, 숙주 세포가 LmSTT3A 단백질, LmSTT3B 단백질 및 LmSTT3D 단백질로 이루어진 군으로부터 선택된 하나 이상의 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자를 포함할 수 있다. 추가적인 측면에서, 숙주 세포가 LmSTT3C 단백질을 코딩하는 핵산 분자를 추가로 포함할 수 있다. 상기 중 어느 하나의 추가적인 측면에서, 숙주 세포가 톡소플라스마 곤디이 STT3 단백질, 트리파노소마 크루지 STT3 단백질, 트리파노소마 브루세이 STT3 단백질, 및 카에노랍디티스 엘레간스 STT3 단백질로 이루어진 군으로부터 선택된 하나 이상의 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자를 포함할 수 있다. 상기 중 어느 하나의 추가적인 측면에서, 숙주 세포가 피키아 파스토리스 STT3 단백질을 코딩하는 핵산 분자를 추가로 포함할 수 있다.
저급 진핵생물 예컨대 효모 또는 사상 진균이 재조합 당단백질의 발현에 종종 사용되는데, 이는 이들이 경제적으로 배양될 수 있고, 고수율을 제공하며, 적합하게 변형되는 경우 적절한 글리코실화가 가능하기 때문이다. 특히 효모는 확립된 유전학을 제공하여, 신속한 형질감염, 시험된 단백질 국소화 전략 및 수월한 유전자 녹-아웃(knock-out) 기술을 허용한다. 적절한 벡터에는 원한다면 발현 제어 서열, 예컨대 프로모터 (3-포스포글리세레이트 키나제 또는 기타 당분해 효소 포함), 및 복제 기점, 종결 서열 등이 있다.
유용한 저급 진핵생물 숙주 세포에는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 칸디다 알비칸스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼 및 뉴로스포라 크라사가 포함되지만, 이에 한정되지는 않는다. 다양한 효모, 예컨대 클루이베로미세스 락티스, 피키아 파스토리스, 피키아 메타놀리카, 및 한세눌라 폴리모르파가 세포 배양에 특히 적절한데, 이는 이들이 높은 세포 밀도로 성장할 수 있고, 다량의 재조합 단백질을 분비하기 때문이다. 유사하게, 사상 진균, 예컨대 아스페르길루스 니게르, 푸사리움 종, 뉴로스포라 크라사 등이 산업적 규모로 본 발명의 당단백질을 생산하는데 사용될 수 있다. 저급 진핵생물의 경우, 세포들이 일상적으로 약 1.5일 내지 3일 동안 성장된다.
따라서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 저급 진핵생물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 저급 진핵생물 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.
이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자; 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 저급 진핵생물 숙주 세포가 추가로 제공된다.
이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 효모 또는 사상 진균 숙주 세포가 추가로 제공된다. 이는 내인성 STT3 유전자의 발현을 포함하고, 이러한 유전자는 효모에서 STT3 유전자이다.
특정 측면에서, 상기 효모 또는 사상 진균 숙주 세포는 효모-유사 또는 사상 진균-유사 글리코실화 패턴을 갖는 당단백질을 생산하는 숙주 세포일 수 있다. 효모 글리코실화 패턴은 과만노실화 N-글리칸을 포함할 수 있거나, 또는 효모가 α1,6-만노실트랜스퍼라제 활성이 결여되도록 유전자 조작될 수 있고, 즉 효모 숙주가 och1p 활성이 결여되도록 유전자 조작되며, 이러한 경우, 효모는 추가로 과만노실화되지 않는 고-만노스 N-글리칸을 갖는 당단백질을 생산한다.
상기 방법 및 숙주 세포의 특정 실시양태에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 추가적인 측면에서, 예를 들어 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3D 단백질이다.
본원에서의 방법 및 숙주 세포는 이종성 당단백질의 조성물의 N-글리코실화 부위 점유가 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 및 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자를 발현하도록 본원에 기술된 바와 같이 변형되지 않은 숙주 세포에서 생산된 이종성 당단백질에 대한 N-글리코실화 부위 점유보다 큰 숙주 세포에서 이종성 당단백질을 생산하는 수단을 제공한다. 효모와 같은 저급 진핵생물 숙주 세포에 대해, 이종성 당단백질의 N-글리코실화 부위 점유가 포유동물 또는 인간 세포에서 생산되었을 때 이종성 당단백질에 대해 수득되는 것보다 낮은 경우, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 및 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자를 발현하는 숙주 세포에서 당단백질을 생산함으로써, 숙주 세포에서 생산된 당단백질의 N-글리코실화 부위 점유를 포유동물 또는 인간 세포에서의 당단백질의 N-글리코실화 부위 점유와 동일하게 또는 더욱 유사하게 만들 수 있다. 실시예에서 제시된 바와 같이, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 및 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자를 발현하는 피키아 파스토리스 숙주 세포가 항체의 N-글리코실화 부위 점유가 차이니즈 햄스터 난소 (CHO) 세포에서 생산된 항체의 것과 유사한 항체를 생산할 수 있다 (도 19를 또한 참조한다).
N-글리코실화 부위 점유를 측정하는 방법은 글리코실화 단백질과 비-글리코실화 단백질을 분리하고, 이들의 양을 측정하여, 하기 식을 사용하여 N-글리코실화 부위 점유를 결정하는 것이다:
(글리코실화 단백질의 몰) / (글리코실화 단백질의 몰 + 비-글리코실화 단백질의 몰) × 100 = N-글리코실화 부위 점유 %
항체 조성물 내의 항체의 N-글리코실화 부위 점유를 측정할 때, 조성물 내의 항체를 환원시키고, 글리코실화 및 비-글리코실화 중쇄의 몰을 결정한다. 각각의 중쇄는 Asn-297에 1개의 N-글리코실화 부위가 있다. N-글리코실화 부위 점유 %는 방출된 N-글리칸의 총 몰 및 항체 중쇄의 총 몰을 기초로 결정된다. 예를 들어, 94%의 N-글리코실화 부위 점유는 조성물 내의 중쇄의 94%가 Asn-297에 N-글리칸을 갖고, 중쇄의 6%는 N-글리칸이 결여될 것임을 가리킬 것이다. 항체는 2개의 중쇄 및 2개의 경쇄로 구성된다. 상기 예에서, 조성물 내의 항체에서, 두 중쇄 모두가 N-글리칸에 연결되거나, 2개의 중쇄 중 1개에 N-글리칸이 있거나, 또는 어느 사슬에도 N-글리칸이 없을 수 있다. 따라서, 중쇄의 94% N-글리코실화 부위 점유는 조성물 내의 항체의 약 88%에서 두 중쇄 모두가 N-글리코실화되었을 것이고 항체의 11.4%에서 2개의 중쇄 중 하나만 N-글리코실화되었을 것임을 시사할 것이다. 상기가 정확하다는 정성적인 지시를 얻기 위해, 전체 항체를 Q-TOF (하이브리드 4중극자 비행 시간 질량 분광측정계 + MS/MS 기능)와 같은 방법에 의해 분석한다.
항체의 N-글리코실화 부위 점유를 측정하기 위한 일반적인 방법은 실시예 3에 예시된 하기의 방법을 사용할 수 있다. 항체를 중쇄 (HC) 및 경쇄 (LC)로 환원시키고, 글리코실화 중쇄 (GHC) 및 비-글리코실화 중쇄 (NGHC)의 양을 모세관 전기영동과 같은 방법에 의해 결정한다. 하기의 식을 사용하여 N-글리코실화 부위 점유를 결정한다:
(GHC의 몰) / (GHC의 몰 + NGHC의 몰) × 100 = N-글리코실화 부위 HC 점유 %
임의의 N-글리코실화 부위에 대해, 이러한 부위가 점유되거나 점유되지 않는다. 따라서, 100%의 N-글리칸 점유는 1:1 (N-글리칸 1몰 / N-글리코실화 부위, 예를 들어, 환원된 항체로부터의 중쇄 1몰) 또는 2:1 (N-글리칸 2몰 / 2개의 N-글리코실화 부위가 있는 단백질, 예를 들어, 환원되지 않은 항체 1몰)의 비율과 등가일 것이다. 80%의 N-글리칸 점유는 0.8:1 (N-글리칸 0.8몰 / N-글리코실화 부위, 예를 들어, 환원된 항체로부터의 중쇄 1몰) 또는 1.6:1 (N-글리칸 1.6몰 / 2개의 N-글리코실화 부위가 있는 단백질, 예를 들어, 환원되지 않은 항체 1몰)의 비율과 등가일 것이다.
두 중쇄 모두가 글리코실화된 전체 항체의 비율의 추정값을 식 (GHC 분획)2 × 100 = 완전히 점유된 항체 (두 N-글리코실화 부위 모두가 점유된, 환원되지 않은 전체 항체)에 의해 개산할 수 있다. 실시예 3은 본원에서의 방법이 조성물 내의 환원되지 않은 전체 항체 분자의 약 70% 내지 약 98%에서 두 N-글리코실화 부위 모두가 점유된 항체 조성물의 생산을 가능하게 한다는 것을 나타낸다. N-글리코실화 부위 점유의 측정이 환원된 항체 분자를 사용하여 결정되었기 때문에, 본원에서의 결과는 단일 글리코실화 부위를 함유하는 당단백질 분자를 포함하는 조성물에 대해, 당단백질 분자의 84% 초과 내지 99% 이상이 N-글리코실화되었음을 나타낸다. 따라서, 본원에서의 방법 및 숙주 세포는 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유된 당단백질 조성물의 생산을 가능하게 한다.
당단백질 조성물 내의 당단백질의 N-글리코실화 부위 점유를 측정하는 또 다른 방법은 조성물 내의 당단백질로부터 N-글리칸을 방출시키고, 방출된 N-글리칸의 몰량, 및 당단백질의 몰량 × 당단백질 상의 글리코실화 부위의 개수를 측정함으로써 달성될 수 있다. 하기의 식을 사용할 수 있다:
( N - 글리칸의 총 몰)/(당단백질의 총 몰 × 부위의 개수) × 100 = N-글리코실화 부위 점유 %.
상기의 식은 점유된 전체 N-글리코실화 부위의 %를 제공할 것이다.
저급 진핵생물, 특히 효모를 글리코실화 패턴이 포유동물 또는 인간-유사 패턴이거나 인간화된 당단백질을 발현하도록 유전자 조작할 수 있다. 이러한 방식으로, 특정한 원하는 당형이 조성물에서 우세한 당단백질 조성물이 생산될 수 있다. 이는 미국 출원 공개 번호 2004/0018590 (이의 개시내용은 참고로 본원에 포함됨)에 기술된 바와 같이 선택된 내인성 글리코실화 효소를 제거하고/하거나 숙주 세포를 유전자 조작하고/하거나 외인성 효소를 공급하여 포유동물 글리코실화 경로 전체 또는 이의 일부분을 모방하도록 함으로써 달성될 수 있다. 원한다면, 코어 푸코실화와 함께 또는 코어 푸코실화 없이 당단백질이 생산될 수 있도록, 글리코실화의 추가적인 유전자 조작이 수행될 수 있다.
저급 진핵생물 예컨대 효모를 글리코실화 패턴이 포유동물-유사 또는 인간-유사 패턴이거나 인간화된 당단백질을 발현하도록 유전자 조작할 수 있다. 이는 전그로스(Gerngross) 등의 미국 특허 번호 7,449,308 (이의 개시내용은 참고로 본원에 포함됨)에 기술된 바와 같이 선택된 내인성 글리코실화 효소를 제거하고/하거나 외인성 효소를 공급함으로써 달성될 수 있다. 따라서, 본 발명의 특정 측면에서, 숙주 세포는 효모, 예를 들어, 메틸이용성 효모 예컨대 피키아 파스토리스 또는 오가타에아 미누타 및 이의 돌연변이체 및 이의 유전자 조작 변이체이다. 이러한 방식으로, 특정한 원하는 당형이 조성물에서 우세한 당단백질 조성물이 생산될 수 있다. 이는 미국 특허 번호 7,449,308 (이의 개시내용은 참고로 본원에 포함됨)에 기술된 바와 같이 선택된 내인성 글리코실화 효소를 제거하고/하거나 숙주 세포를 유전자 조작하고/하거나 외인성 효소를 공급하여 포유동물 글리코실화 경로 전체 또는 이의 일부분을 모방하도록 함으로써 달성될 수 있다. 원한다면, 코어 푸코실화와 함께 또는 코어 푸코실화 없이 당단백질이 생산될 수 있도록, 글리코실화의 추가적인 유전자 조작이 수행될 수 있다. 저급 진핵생물 숙주 세포 예컨대 효모의 사용은 이러한 세포가 당단백질의 우세한 당형이 조성물 내의 당단백질의 30 몰% 초과로 존재할 수 있도록 당단백질의 비교적 균질한 조성물을 생산할 수 있다는 점에서 추가로 유리하다. 특정 측면에서, 우세한 당형이 조성물 내에 존재하는 당단백질의 40 몰%, 50 몰%, 60 몰%, 70 몰%를 초과하여, 가장 바람직하게는 80 몰%를 초과하여 존재할 수 있다. 이는 전그로스 등의 미국 특허 번호 7,029,872 및 미국 특허 번호 7,449,308 (이들의 개시내용은 참고로 본원에 포함됨) 에 기술된 바와 같이 선택된 내인성 글리코실화 효소를 제거하고/하거나 외인성 효소를 공급함으로써 달성될 수 있다. 예를 들어, 고갈되지 않으면 만노스 잔기를 당단백질 상의 N-글리칸 상에 부가할 1,6-만노실 트랜스퍼라제 활성이 고갈되도록 숙주 세포가 선택 또는 조작될 수 있다.
한 실시양태에서, 숙주 세포는 α1,2-만노시다제 촉매 도메인과 일반적으로는 회합되지 않고 α1,2-만노시다제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 α1,2-만노시다제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 Man5GlcNAc2 당형을 포함하는 재조합 당단백질, 예를 들어, Man5GlcNAc2 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 예를 들어, 미국 특허 번호 7,029,872, 미국 특허 번호 7,449,308 및 미국 특허 출원 공개 번호 2005/0170452 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 Man5GlcNAc2 당형을 포함하는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다.
추가적인 실시양태에서, 바로 전의 숙주 세포가 N-아세틸글루코사미닐트랜스퍼라제(acetylglucosaminyltransferase) I (GlcNAc 트랜스퍼라제 I 또는 GnT I) 촉매 도메인과 일반적으로는 회합되지 않고 GlcNAc 트랜스퍼라제 I 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 GlcNAc 트랜스퍼라제 I 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GlcNAcMan5GlcNAc2 당형을 포함하는 재조합 당단백질, 예를 들어 GlcNAcMan5GlcNAc2 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 미국 특허 번호 7,029,872, 미국 특허 번호 7,449,308, 및 미국 특허 출원 공개 번호 2005/0170452 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 GlcNAcMan5GlcNAc2 당형을 포함하는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다. 상기 세포에서 생산된 당단백질이 Man5GlcNAc2 당형을 포함하는 재조합 당단백질이 생산되도록 시험관내에서 헥사미니다제(hexaminidase)로 처리될 수 있다.
추가적인 실시양태에서, 바로 전의 숙주 세포가 만노시다제 II 촉매 도메인과 일반적으로는 회합되지 않고 만노시다제 II 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 만노시다제 II 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GlcNAcMan3GlcNAc2 당형을 포함하는 재조합 당단백질, 예를 들어 GlcNAcMan3GlcNAc2 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 미국 특허 번호 7,029,872 및 미국 특허 번호 7,625,756 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 만노시다제 II 효소를 발현하고 GlcNAc2Man3GlcNAc2 당형이 우세하게 있는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다. 상기 세포에서 생산된 당단백질이 Man3GlcNAc2 당형을 포함하는 재조합 당단백질이 생산되도록 시험관내에서 헥사미니다제로 처리될 수 있다.
추가적인 실시양태에서, 바로 전의 숙주 세포가 N-아세틸글루코사미닐트랜스퍼라제 II (GlcNAc 트랜스퍼라제 II 또는 GnT II) 촉매 도메인과 일반적으로는 회합되지 않고 GlcNAc 트랜스퍼라제 II 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 GlcNAc 트랜스퍼라제 II 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GlcNAc2Man3GlcNAc2 당형을 포함하는 재조합 당단백질, 예를 들어 GlcNAc2Man3GlcNAc2 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 미국 특허 번호 7,029,872 및 7,449,308 및 미국 특허 출원 공개 번호 2005/0170452 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 GlcNAc2Man3GlcNAc2 당형을 포함하는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다. 상기 세포에서 생산된 당단백질이 Man3GlcNAc2 당형을 포함하는 재조합 당단백질이 생산되도록 시험관내에서 헥사미니다제로 처리될 수 있다.
추가적인 실시양태에서, 바로 전의 숙주 세포가 갈락토실트랜스퍼라제 촉매 도메인과 일반적으로는 회합되지 않고 갈락토실트랜스퍼라제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 갈락토실트랜스퍼라제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GalGlcNAc2Man3GlcNAc2 또는 Gal2GlcNAc2Man3GlcNAc2 당형 또는 이들의 혼합물을 포함하는 재조합 당단백질, 예를 들어 GalGlcNAc2Man3GlcNAc2 당형 또는 Gal2GlcNAc2Man3GlcNAc2 당형 또는 이들의 혼합물을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 미국 특허 번호 7,029,872 및 미국 특허 출원 공개 번호 2006/0040353 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 Gal2GlcNAc2Man3GlcNAc2 당형을 포함하는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다. 상기 세포에서 생산된 당단백질이 GlcNAc2Man3GlcNAc2 당형을 포함하는 재조합 당단백질, 예를 들어 GlcNAc2Man3GlcNAc2 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산되도록 시험관내에서 갈락토시다제(galactosidase)로 처리될 수 있다.
추가적인 실시양태에서, 바로 전의 숙주 세포가 시알릴트랜스퍼라제 촉매 도메인과 일반적으로는 회합되지 않고 시알릴트랜스퍼라제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 시알릴트랜스퍼라제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 NANA2Gal2GlcNAc2Man3GlcNAc2 당형 또는 NANAGal2GlcNAc2Man3GlcNAc2 당형 또는 이들의 혼합물을 우세하게 포함하는 재조합 당단백질이 생산된다. 효모 및 사상 진균과 같은 저급 진핵생물 숙주 세포에 대해, 숙주 세포가 N-글리칸으로의 전달을 위해 CMP-시알산을 제공하는 수단을 추가로 포함하는 것이 유용하다. 미국 특허 출원 공개 번호 2005/0260729 (이의 개시내용은 참고로 본원에 포함됨)에 CMP-시알산 합성 경로가 있도록 저급 진핵생물을 유전자 조작하는 방법이 개시되어 있고, 미국 특허 출원 공개 번호 2006/0286637 (이의 개시내용은 참고로 본원에 포함됨)에 시알릴화 당단백질을 생산하도록 저급 진핵생물을 유전자 조작하는 방법이 개시되어 있다. 상기 세포에서 생산된 당단백질이 Gal2GlcNAc2Man3GlcNAc2 당형 또는 GalGlcNAc2Man3GlcNAc2 당형 또는 이들의 혼합물을 우세하게 포함하는 재조합 당단백질이 생산되도록 시험관내에서 뉴라미니다제(neuraminidase)로 처리될 수 있다.
상기 숙주 세포들 중 어느 하나가 미국 특허 번호 7,598,055 및 미국 특허 출원 공개 번호 2007/0037248 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 개시된 바와 같이 양분화 (GnT III) 및/또는 다중안테나성 (GnT IV, V, VI, 및 IX) N-글리칸 구조를 갖는 당단백질이 생산되도록 GnT III, GnT IV, GnT V, GnT VI, 및 GnT IX로 이루어진 군으로부터 선택된 하나 이상의 GlcNAc 트랜스퍼라제를 추가로 포함할 수 있다.
추가적인 실시양태에서, GlcNAcMan5GlcNAc2 N-글리칸을 우세하게 갖는 당단백질을 생산하는 숙주 세포가 갈락토실트랜스퍼라제 촉매 도메인과 일반적으로는 회합되지 않고 갈락토실트랜스퍼라제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 갈락토실트랜스퍼라제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GalGlcNAcMan5GlcNAc2 당형을 우세하게 포함하는 재조합 당단백질이 생산된다.
추가적인 실시양태에서, GalGlcNAcMan5GlcNAc2 N-글리칸을 우세하게 갖는 당단백질을 생산한 바로 전의 숙주 세포가 시알릴트랜스퍼라제 촉매 도메인과 일반적으로는 회합되지 않고 시알릴트랜스퍼라제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 시알릴트랜스퍼라제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 NANAGalGlcNAcMan5GlcNAc2 당형을 포함하는 재조합 당단백질이 생산된다.
추가적인 측면에서, 상기 언급된 숙주 세포들 중 어느 하나에서, 숙주 세포가 푸코실트랜스퍼라제, 및 푸코스를 생산하고 푸코스를 ER 또는 골지로 수송하기 위한 경로를 포함하도록 추가로 변형된다. 당단백질 상의 N-글리칸 중 하나 이상이 푸코실화된 당단백질을 생산할 수 있도록 피키아 파스토리스를 변형시키는 방법의 예가 국제 출원 공개 번호 WO 2008112092 (이의 개시내용은 참고로 본원에 포함됨)에 개시되어 있다. 본 발명의 특정 측면에서, GDP-만노스-4,6-데히드라타제(dehydratase), GDP-케토-데옥시-만노스-에피머라제/GDP-케토-데옥시-갈락토스-리덕타제(reductase), GDP-푸코스 수송체, 및 푸코실트랜스퍼라제를 포함하는 푸코실화 경로를 포함하도록 피키아 파스토리스 숙주 세포가 추가로 변형된다. 특정 측면에서, α1,2-푸코실트랜스퍼라제, α1,3-푸코실트랜스퍼라제, α1,4-푸코실트랜스퍼라제, 및 α1,6-푸코실트랜스퍼라제로 이루어진 군으로부터 푸코실트랜스퍼라제가 선택된다.
다양한 상기 숙주 세포들이 하나 이상의 당 수송체 예컨대 UDP-GlcNAc 수송체 (예를 들어, 클루이베로미세스 락티스 및 무스 무스쿨로스(Mus musculus) UDP-GlcNAc 수송체), UDP-갈락토스 수송체 (예를 들어, 드로소필라 멜라노가스터 UDP-갈락토스 수송체), 및 CMP-시알산 수송체 (예를 들어, 인간 시알산 수송체)를 추가로 포함한다. 효모 및 사상 진균과 같은 저급 진핵생물 숙주 세포에서는 상기 수송체들이 결여되기 때문에, 효모 및 사상 진균과 같은 저급 진핵생물 숙주 세포가 상기 수송체들을 포함하도록 유전자 조작되는 것이 바람직하다.
숙주 세포는 포스포만노실트랜스퍼라제 유전자인 PNO1 및 MNN4B (예를 들어, 미국 특허 번호 7,198,921 및 7,259,007 (이들의 개시내용은 모두 본원에 참조로 포함됨) 참조) 중 하나 또는 둘 모두를 결실시키거나 파괴함으로써 포스포만노스 잔기를 갖는 당단백질을 제거하도록 유전자 조작된 피키아 파스토리스를 추가로 포함하고, 이는 추가적인 측면에서 MNN4A 유전자를 결실시키거나 파괴하는 것을 또한 포함할 수 있다. 파괴는 특정 효소를 코딩하는 오픈 리딩 프레임을 파괴하는 것, 또는 오픈 리딩 프레임의 발현을 파괴하는 것, 또는 간섭 RNA, 안티센스 RNA 등을 사용하여 β-만노실트랜스퍼라제 및/또는 포스포만노실트랜스퍼라제 중 하나 이상을 코딩하는 RNA의 번역을 폐지하는 것을 포함한다. 숙주 세포는 특정 N-글리칸 구조를 생산하도록 변형된 상기 언급된 숙주 세포들 중 어느 하나를 추가로 포함할 수 있다.
숙주 세포는 단백질 O-만노실트랜스퍼라제 (Dol-P-Man:단백질 (Ser/Thr) 만노실 트랜스퍼라제 유전자) (PMT) 중 하나 이상을 파괴하거나 결실시킴으로써 당단백질의 O-글리코실화를 제어하도록 유전자 변형되거나 (미국 특허 번호 5,714,377 (이의 개시내용은 본원에 참조로 포함됨) 참조), 또는 국제 출원 공개 번호 WO 2007061631 (이의 개시내용은 본원에 참조로 포함됨)에 개시된 바와 같이 Pmtp 억제제 및/또는 α1,2 만노시다제의 존재 하에 성장되거나, 또는 이렇게 유전자-변형 및 성장된 저급 진핵생물 세포 (예를 들어, 피키아 파스토리스와 같은 효모)를 추가로 포함한다. 파괴는 Pmtp를 코딩하는 오픈 리딩 프레임을 파괴하는 것, 또는 오픈 리딩 프레임의 발현을 파괴하는 것, 또는 간섭 RNA, 안티센스 RNA 등을 사용하여 Pmtp들 중 하나 이상을 코딩하는 RNA의 번역을 폐지하는 것을 포함한다. 숙주 세포는 특정 N-글리칸 구조를 생산하도록 변형된 상기 언급된 숙주 세포들 중 어느 하나를 추가로 포함할 수 있다.
Pmtp 억제제에는 벤질리덴 티아졸리딘디온이 포함되지만, 이에 한정되지는 않는다. 사용될 수 있는 벤질리덴 티아졸리딘디온의 예는 5-[[3,4-비스(페닐메톡시)페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산; 5-[[3-(1-페닐에톡시)-4-(2-페닐에톡시)]페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산; 및 5-[[3-(1-페닐-2-히드록시)에톡시)-4-(2-페닐에톡시)]페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산이다.
특정 실시양태에서, 하나 이상의 내인성 PMT 유전자의 기능 또는 발현이 감소, 파괴 또는 결실된다. 예를 들어, 특정 실시양태에서, PMT1, PMT2, PMT3, 및 PMT4 유전자로 이루어진 군으로부터 선택된 하나 이상의 내인성 PMT 유전자의 기능 또는 발현이 감소, 파괴 또는 결실되거나, 또는 숙주 세포가 하나 이상의 PMT 억제제의 존재 하에 배양된다. 추가적인 실시양태에서, 숙주 세포가 하나 이상의 PMT 유전자 결실 또는 파괴를 포함하고, 숙주 세포가 하나 이상의 Pmtp 억제제의 존재 하에 배양된다. 이러한 실시양태들의 특정 측면에서, 숙주 세포는 분비형 α-1,2-만노시다제를 또한 발현한다.
PMT 결실 또는 파괴 및/또는 Pmtp 억제제는 O-글리코실화 점유를 감소시킴으로써, 즉 글리코실화되는 당단백질 상의 O-글리코실화 부위의 총수를 감소시킴으로써 O-글리코실화를 제어한다. 세포에 의해 분비되는 α-1,2-만노시다제의 추가적인 부가는 당단백질 상에 있는 O-글리칸의 만노스 사슬 길이를 감소시킴으로써 O-글리코실화를 제어한다. 따라서, PMT 결실 또는 파괴 및/또는 Pmtp 억제제를 분비형 α-1,2-만노시다제와 조합하는 것은 점유 및 사슬 길이를 감소시킴으로써 O-글리코실화를 제어한다. 특정한 상황에서, PMT 결실 또는 파괴, Pmtp 억제제 및 α-1,2-만노시다제의 특정한 조합이 실험적으로 결정되는데, 이는 특정한 이종성 당단백질 (예를 들어, 항체)들이 상이한 효율 정도로 발현되어 골지체로 수송될 수 있고, 따라서 PMT 결실 또는 파괴, Pmtp 억제제 및 α-1,2-만노시다제의 특정한 조합을 필요로 할 수 있기 때문이다. 또 다른 측면에서, 하나 이상의 내인성 만노실트랜스퍼라제 효소를 코딩하는 유전자가 결실된다. 이러한 결실(들)은 분비형 α-1,2-만노시다제 및/또는 PMT 억제제를 제공하는 것과 조합될 수 있거나, 또는 분비형 α-1,2-만노시다제 및/또는 PMT 억제제를 제공하는 것을 대신할 수 있다.
따라서, O-글리코실화의 제어가 본원에 개시된 숙주 세포에서 더 양호한 총 수율로 또는 적합하게 어셈블리된 당단백질의 산출로 특정 당단백질을 생산하는데 유용할 수 있다. O-글리코실화의 감소 또는 제거는 당단백질 예컨대 전체 항체가 분비 경로를 횡단하여 세포 표면으로 수송될 때 이들의 어셈블리 및 수송에 이로운 효과가 있는 것으로 보인다. 따라서, O-글리코실화가 제어된 세포에서, 적합하게 어셈블리된 당단백질 예컨대 항체 단편의 수율이 O-글리코실화가 제어되지 않은 숙주 세포에서 수득되는 수율에 비해 증가된다.
α-만노시다제에 저항성인 β-연결 만노스 잔기가 있는 N-글리칸 및 O-글리칸의 가능성을 감소시키거나 제거하기 위해, β-만노실트랜스퍼라제 유전자 (예를 들어, BMT1, BMT2, BMT3, 및 BMT4) 중 하나 이상을 결실시키거나 파괴함으로써 α-만노시다제-저항성 N-글리칸을 갖는 당단백질을 제거하도록 재조합 당-조작(glycoengineered) 피키아 파스토리스 숙주 세포가 유전자 조작된다 (미국 특허 번호 7,465,577 및 미국 특허 번호 7,713,719 참조). BMT2, 및 BMT1, BMT3 및 BMT4 중 하나 이상의 결실 또는 파괴는 숙주 세포 단백질에 대한 항체에 대한 검출가능한 교차 반응성을 또한 감소시키거나 제거한다.
포유동물 또는 인간 샤페론(chaperone) 단백질을 코딩하는 핵산 분자를 과다발현시킴으로써 또는 하나 이상의 내인성 샤페론 단백질을 코딩하는 유전자를 하나 이상의 포유동물 또는 인간 샤페론 단백질을 코딩하는 핵산 분자로 교체함으로써 일부 경우에 당단백질의 수율이 개선될 수 있다. 게다가, 숙주 세포에서의 포유동물 또는 인간 샤페론 단백질의 발현이 세포에서의 O-글리코실화를 또한 제어하는 것으로 보인다. 따라서, 샤페론 단백질을 코딩하는 하나 이상의 내인성 유전자의 기능이 감소 또는 제거되고, 이러한 샤페론 단백질의 하나 이상의 포유동물 또는 인간 상동체를 코딩하는 벡터가 숙주 세포 내에서 발현되는 본원의 숙주 세포가 추가로 포함된다. 내인성 숙주 세포 샤페론 및 포유동물 또는 인간 샤페론 단백질이 발현되는 숙주 세포가 또한 포함된다. 추가적인 측면에서, 이러한 저급 진핵생물 숙주 세포는 효모 또는 사상 진균 숙주 세포이다. 재조합 단백질의 수율을 개선하고 이의 O-글리코실화를 감소시키거나 제어하기 위해 인간 샤페론 단백질이 도입된 숙주 세포의 샤페론 사용의 예가 국제 출원 공개 번호 WO 2009105357 및 WO2010019487 (이들의 개시내용은 본원에 참고로 포함됨)에 개시되어 있다. 상기와 유사하게, 상기 기술된 바와 같이 내인성 샤페론 단백질 중 하나 이상을 코딩하는 유전자를 하나 이상의 포유동물 또는 인간 샤페론 단백질을 코딩하는 핵산 분자로 교체하는 것 또는 하나 이상의 포유동물 또는 인간 샤페론 단백질을 과다발현시키는 것에 더하여, 단백질 O-만노실트랜스퍼라제 (PMT) 단백질을 코딩하는 하나 이상의 내인성 유전자의 기능 또는 발현이 감소, 파괴 또는 결실된 저급 진핵생물 숙주 세포가 추가로 포함된다. 특정 실시양태에서, PMT1, PMT2, PMT3, 및 PMT4 유전자로 이루어진 군으로부터 선택된 하나 이상의 내인성 PMT 유전자의 기능이 감소, 파괴 또는 결실된다.
따라서, 본원에 개시된 방법은 우세한 N-글리칸이 복합 N-글리칸, 하이브리드 N-글리칸, 및 고-만노스 N-글리칸으로 이루어진 군으로부터 선택되는 당단백질을 생산하도록 유전자 변형된 임의의 숙주 세포를 사용할 수 있고, 이때 복합 N-글리칸은 GlcNAc(2-4)Man3GlcNAc2, Gal(1-4)GlcNAc(2-4)Man3GlcNAc2, 및 NANA(1-4)Gal(1-4) GlcNAc(2-4)Man3GlcNAc2로 이루어진 군으로부터 선택될 수 있고; 하이브리드 N-글리칸은 GlcNAcMan3GlcNAc2; GalGlcNAcMan3GlcNAc2; NANAGalGlcNAcMan3GlcNAc2 GlcNAcMan5GlcNAc2, GalGlcNAcMan5GlcNAc2, 및 NANAGalGlcNAcMan5GlcNAc2로 이루어진 군으로부터 선택될 수 있으며; 고-만노스 N-글리칸은 Man5GlcNAc2, Man6GlcNAc2, Man7GlcNAc2, Man8GlcNAc2, 및 Man9GlcNAc2로 이루어진 군으로부터 선택될 수 있다. 예를 들어, 미국 출원 공개 번호 20050170452에 제시된 바와 같이, N-글리칸 구조 Man3GlcNAc2로 이루어진 N-글리칸을 갖는 당단백질이 추가로 포함된다.
따라서, 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작되고, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하는 저급 진핵생물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 저급 진핵생물 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.
상기의 추가적인 측면에서, 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작되고, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하는 효모 또는 사상 진균 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 효모 또는 사상 진균 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.
이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는, 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포가 추가로 제공된다. 이는 내인성 STT3 유전자의 발현을 포함하며, 상기 유전자는 효모에서 STT3 유전자이다.
일반적으로, 상기 방법 및 숙주 세포에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체의 하나 이상의 필수 단백질의 돌여변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 추가적인 측면에서, 예를 들어 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3D 단백질이다.
프로모터는 유전자 발현을 제어하기 위한 DNA 서열 요소이다. 특히, 프로모터는 전사 개시 부위를 상술하고, TATA 박스 및 상류 프로모터 요소를 포함할 수 있다. 선택된 프로모터는 선택된 특정 숙주 시스템에서 작동가능할 것으로 예상되는 것들이다. 예를 들어, 효모 예컨대 사카로미세스 세레비지아에, 클루이베로미세스 락티스, 오가타에아 미누타, 또는 피키아 파스토리스가 숙주 세포인 경우에는 효모 프로모터가 사용되는 반면, 아스페르길루스 니게르, 뉴로스포라 크라사, 또는 트리코더마 레에세이와 같은 숙주 세포에서는 진균 프로모터가 사용될 것이다. 효모 프로모터의 예로는 GAPDH, AOX1, SEC4, HH1, PMA1, OCH1, GAL1, PGK, GAP, TPI, CYC1, ADH2, PHO5, CUP1, MF α1, FLD1, PMA1, PDI, TEF, RPL10 및 GUT1 프로모터가 포함되지만, 이에 한정되지는 않는다. 문헌 [Romanos et al., Yeast 8: 423-488 (1992)]에서 효모 프로모터 및 발현 벡터의 리뷰가 제공된다. 문헌 [Hartner et al., Nucl. Acid Res. 36: e76 (pub on-line 6 June 2008)]에 피키아 파스토리스에서의 이종성 단백질의 미세-조정 발현을 위한 프로모터들의 라이브러리가 기술되어 있다.
본원에 개시된 핵산 분자에 작동가능하게 연결된 프로모터는 구성적 프로모터 또는 유도성 프로모터일 수 있다. 유도성 프로모터, 예를 들어 AOX1 프로모터는 유도제에 반응하여 전사 인자에 결합 시 증가된 속도 또는 감소된 속도로 전사를 지시하는 프로모터이다. 본원에서 사용되는 경우의 전사 인자에는 프로모터의 조절 또는 제어 영역에 결합하여 전사에 영향을 미칠 수 있는 임의의 인자가 포함된다. 숙주를 유도제에 노출시킴으로써 또는 유도제를 숙주 세포 배지로부터 제거함으로써 숙주 세포 내에서의 전사 인자의 RNA 합성 또는 프로모터 결합 능력을 제어할 수 있다. 따라서, 유도성 프로모터의 발현을 조절하기 위해, 유도제가 숙주 세포의 배양 배지에 첨가되거나 또는 이로부터 제거된다. 이같은 유도제에는 당, 포스페이트, 알콜, 금속 이온, 호르몬, 열, 냉기 등이 포함될 수 있다. 예를 들어, 효모에서 통상적으로 사용되는 유도제는 글루코스, 갈락토스, 알콜 등이다.
선택되는 전사 종결 서열은 선택된 특정 숙주 세포에서 작동가능한 것들이다. 예를 들어, 효모 숙주 세포 예컨대 사카로미세스 세레비지아에, 클루이베로미세스 락티스, 또는 피키아 파스토리스가 숙주 세포인 경우에는 효모 전사 종결 서열이 발현 벡터에서 사용되는 반면, 아스페르길루스 니게르, 뉴로스포라 크라사, 또는 트리코더마 레에세이와 같은 숙주 세포에서는 진균 전사 종결 서열이 사용될 것이다. 전사 종결 서열에는 사카로미세스 세레비지아에 CYC 전사 종결 서열 (ScCYC TT), 피키아 파스토리스 ALG3 전사 종결 서열 (ALG3 TT), 피키아 파스토리스 ALG6 전사 종결 서열 (ALG6 TT), 피키아 파스토리스 ALG12 전사 종결 서열 (ALG12 TT), 피키아 파스토리스 AOX1 전사 종결 서열 (AOX1 TT), 피키아 파스토리스 OCH1 전사 종결 서열 (OCH1 TT) 및 피키아 파스토리스 PMA1 전사 종결 서열 (PMA1 TT)이 포함되지만, 이에 한정되지는 않는다. 기타 전사 종결 서열을 실시예 및 당업계에서 확인할 수 있다.
효모를 유전자 조작하기 위해, 재조합 숙주 세포를 구축하는데 사용될 수 있는 선택 마커에는 약물 저항성 마커, 및 효모 숙주 세포가 필수적인 세포 영양물, 예를 들어 아미노산을 합성하도록 하는 유전적 기능이 포함된다. 효모에서 통상적으로 사용되는 약물 저항성 마커에는 클로람페니콜, 카나마이신, 메토트렉세이트, G418 (제네티신), 제오신 등이 포함된다. 효모 숙주 세포가 필수적인 세포 영양물을 합성하도록 하는 유전적 기능은 상응하는 게놈 기능에 영양요구성(auxotrophic) 돌연변이가 있는 이용가능한 효모 균주와 함께 사용된다. 통상적인 효모 선택 마커는 류신 (LEU2), 트립토판 (TRP1 및 TRP2), 프롤린 (PRO1), 우라실 (URA3, URA5, URA6), 히스티딘 (HIS3), 라이신 (LYS2), 아데닌 (ADE1 또는 ADE2) 등을 합성하기 위한 유전적 기능을 제공한다. 기타 효모 선택 마커에는 사카로미세스 세레비지아에로부터의 ARR3 유전자가 포함되고, 이는 아비산염의 존재 하에 성장되는 효모 세포에 아비산염에 대한 저항성을 부여한다 (문헌 [Bobrowicz et al., Yeast, 13:819-828 (1997)]; [Wysocki et al., J. Biol. Chem. 272:30061-30066 (1997)]). 다수의 적절한 통합 부위에는 미국 특허 번호 7,479,389 (이의 개시내용은 본원에 참고로 포함됨)에 열거된 것들이 포함되고, 사카로미세스 세레비지아에 및 기타 효모 또는 진균에 대해 공지된 유전자좌에 대한 상동체가 포함된다. 벡터를 효모 내로 통합시키는 방법이 주지되어 있다 (예를 들어, 미국 특허 번호 7,479,389, 미국 특허 번호 7,514,253, 미국 출원 공개 번호 2009012400, 및 WO2009/085135 (이들의 개시내용은 모두 본원에 참고로 포함됨) 참조). 삽입 부위의 예로는 피키아 ADE 유전자; 피키아 TRP (TRP1 내지 TRP2 포함) 유전자; 피키아 MCA 유전자; 피키아 CYM 유전자; 피키아 PEP 유전자; 피키아 PRB 유전자; 및 피키아 LEU 유전자가 포함되지만 이에 한정되지는 않는다. 피키아 ADE1 및 ARG4 유전자는 문헌 [Lin Cereghino et al., Gene 263:159-169 (2001)] 및 미국 특허 번호 4,818,700 (이의 개시내용은 본원에 참고로 포함됨)에 기술되어 있고, HIS3 및 TRP1 유전자는 문헌 [Cosano et al., Yeast 14:861-867 (1998)]에 기술되어 있으며, HIS4는 진뱅크(GenBank) 접속 번호 X56180에 기술되어 있다.
본원에 개시된 방법이 포유동물, 식물, 및 곤충 세포에서의 사용을 위해 개조될 수 있다. 동물 세포의 예로는 SC-I 세포, LLC-MK 세포, CV-I 세포, CHO 세포, COS 세포, 뮤린(murine) 세포, 인간 세포, HeLa 세포, 293 세포, VERO 세포, MDBK 세포, MDCK 세포, MDOK 세포, CRFK 세포, RAF 세포, TCMK 세포, LLC-PK 세포, PK15 세포, WI-38 세포, MRC-5 세포, T-FLY 세포, BHK 세포, SP2/0, NSO 세포, 및 이들의 유도체가 포함되지만, 이에 한정되지는 않는다. 곤충 세포에는 드로소필라 멜라노가스터 기원의 세포가 포함된다. 세포가 특정한 N-글리칸을 갖거나 또는 특정한 N-글리칸을 우세하게 갖는 이뮤노글로불린을 제조할 수 있게 하도록 이러한 세포들이 유전자 조작될 수 있다. 예를 들어, 미국 특허 번호 6,949,372에는 곤충 세포에서 시알릴화된 당단백질을 제조하는 방법이 개시되어 있다. 문헌 [Yamane-Ohnuki et al. Biotechnol. Bioeng. 87: 614-622 (2004)], [Kanda et al., Biotechnol. Bioeng. 94: 680-688 (2006)], [Kanda et al., Glycobiol. 17: 104-118 (2006)], 및 미국 출원 공개 번호 2005/0216958 및 2007/0020260 (이들의 개시내용은 본원에 참고로 포함됨)에는 이뮤노글로불린 상의 N-글리칸에 푸코스가 결여되었거나 또는 이뮤노글로불린 상의 N-글리칸에서 푸코스가 감소된 이뮤노글로불린을 생산할 수 있는 포유동물 세포가 개시되어 있다. 미국 특허 출원 공개 번호 2005/0074843 (이의 개시내용은 본원에 참고로 포함됨)에는 포유동물 세포에서 양분화 N-글리칸을 갖는 항체를 제조하는 것이 개시되어 있다.
포유동물, 곤충 또는 식물 세포에서의 발현 카세트의 발현을 조절하기 위해 선택된 조절성 프로모터는 선택된 세포 유형에서의 기능성에 대해 선택되어야 한다. 적절한 조절성 프로모터의 예로는 테트라사이클린-조절성 프로모터 (예를 들어, 문헌 [Berens & Hillen, Eur. J. Biochem. 270: 3109-3121 (2003)] 참조), RU 486-유도성 프로모터, 엑디손-유도성 프로모터, 및 카나마이신-조절성 시스템이 포함되지만, 이에 한정되지는 않는다. 이러한 프로모터들은 실시예에 기술된 발현 카세트에서 예시된 프로모터들을 대체할 수 있다. 포획 모이어티(capture moiety)가 선택된 세포 유형에서의 사용에 적절한 세포 표면 고정(anchoring) 단백질에 융합될 수 있다. GPI 단백질이 포함되는 세포 표면 고정 단백질이 포유동물, 곤충 및 식물 세포에 대해 주지되어 있다. GPI에 고정된 융합 단백질이 문헌 [Kennard et al., Methods Biotechnol. Vo. 8: Animal Cell Biotechnology (Ed. Jenkins. Human Press, Inc., Totowa, NJ) pp. 187-200 (1999])에 기술되어 있다. 적절한 재조합체를 제조하기 위해 발현 카세트를 숙주 세포 게놈 내로 통합시키기 위한 게놈 표적화 서열이 실시예에서 예시된 게놈 표적화 및 통합 서열을 대체할 수 있다. 안정적이고 일시적으로 형질감염된 포유동물, 곤충 및 식물 숙주 세포를 제조하기 위한 형질감염 방법이 당업계에 주지되어 있다. 형질감염된 숙주 세포가 본원에 개시된 바와 같이 구축되었으면, 세포를 본원에 개시된 바와 같이 관심 이뮤노글로불린의 발현에 대해 스크리닝하고 선택할 수 있다.
따라서, 상기의 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3 단백질)를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 포유동물 또는 곤충 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 포유동물 또는 곤충 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다. 추가적인 측면에서, 이러한 숙주 세포가 인간-유사 N-글리칸 또는 숙주 세포에 대해 일반적으로 내인성이지 않은 N-글리칸이 있는 당단백질을 생산하도록 유전자 조작된다.
상기의 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3 단백질)를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 포유동물 또는 곤충 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여, 이종성 당단백질의 N-글리코실화 부위 점유가 83%를 초과하는 이종성 당단백질을 생산하는 단계를 포함하는, 포유동물 또는 곤충 숙주 세포에서 이종성 당단백질의 N-글리코실화 부위 점유가 83%를 초과하는 이종성 당단백질을 생산하는 방법이 제공된다. 추가적인 측면에서, 이러한 숙주 세포가 인간-유사 N-글리칸 또는 숙주 세포에 대해 일반적으로 내인성이지 않은 N-글리칸이 있는 당단백질을 생산하도록 유전자 조작된다.
상기 방법들의 추가적인 실시양태에서, 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현된다.
상기 방법들의 특정 실시양태에서, N-글리코실화 부위 점유가 94% 이상이다. 추가적인 실시양태에서, N-글리코실화 부위 점유가 99% 이상이다.
이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3D 단백질)를 코딩하는 제1 핵산 분자, 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 내인성 숙주 세포 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 포유동물 또는 곤충 숙주 세포가 추가로 제공된다.
특정 실시양태에서, 고급 진핵생물 세포, 조직 또는 생물이 또한 식물계, 예를 들어, 밀, 벼, 옥수수, 담배 등으로부터의 것일 수 있다. 별법적으로, 선태류 세포가, 예를 들어, 피스코미트렐라(Physcomitrella), 푸나리아(Funaria), 스파그눔(Sphagnum), 세라토돈(Ceratodon), 마르찬티아(Marchantia), 및 스파에로카르포스(Sphaerocarpos) 속의 종으로부터 선택될 수 있다. 예시적인 식물 세포는 WO 2004/057002 및 WO2008/006554 (이들의 개시내용은 모두 본원에 참고로 포함됨)에 개시된 피스코미트렐라 파텐스의 선태류 세포이다. 식물 세포를 사용하는 발현 시스템이 세포가 특정 N-글리칸을 우세하게 갖는 이뮤노글로불린을 생산할 수 있게 하기 위해 글리코실화 경로가 변경되도록 추가로 조작될 수 있다. 예를 들어, 세포가 코어 푸코실트랜스퍼라제가 기능장애성이거나 없도록, 및/또는 자일로실트랜스퍼라제(xylosyltransferase)가 기능장애성이거나 없도록, 및/또는 β1,4-갈락토실트랜스퍼라제 기능장애성이거나 없도록 유전자 조작될 수 있다. 별법적으로, 갈락토스, 푸코스 및/또는 자일로스가 이러한 잔기들을 제거하는 효소로의 처리에 의해 이뮤노글로불린으로부터 제거될 수 있다. 당업계에 공지되어 있는 N-글리칸으로부터의 갈락토스, 푸코스 및/또는 자일로스 잔기의 제거를 초래하는 임의의 효소, 예를 들어 α-갈락토시다제, β-자일로시다제(xylosidase), 및 α-푸코시다제(fucosidase)를 사용할 수 있다. 별법적으로, 1,3-푸코실트랜스퍼라제 및/또는 1,2-자일로실트랜스퍼라제, 및/또는 1,4-갈락토실트랜스퍼라제가 기질로 사용할 수 없는 변형된 N-글리칸을 합성하는 발현 시스템을 사용할 수 있다. 식물 세포에서의 글리코실화 경로를 변형시키는 방법이 미국 특허 번호 7,449,308, 6,998,267 및 7,388,081 (이들의 개시내용은 본원에 참고로 포함됨)에 개시되어 있고, 이들은 인간-유사 N-글리칸을 갖는 재조합 당단백질을 제조하도록 식물을 유전자 조작하는 방법을 개시한다. WO 2008006554 (이의 개시내용은 본원에 참고로 포함됨)에는 자일로스 또는 푸코스가 없는 당단백질을 제조하도록 유전자 조작된 식물에서 당단백질 예컨대 항체를 제조하는 방법이 개시되어 있다. WO 2007006570 (이의 개시내용은 본원에 참고로 포함됨)에는 동물 또는 인간-유사 글리코실화 패턴을 갖는 당단백질을 제조하도록 선태류, 섬모충, 조류 및 효모를 유전자 조작하는 방법이 개시되어 있다.
따라서, 상기의 추가적인 측면에서, 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작되고, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3D 단백질)를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 식물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 식물 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.
상기의 추가적인 측면에서, 포유동물- 또는 인간-유사 N-글리칸이 있는 당단백질을 생산하도록 유전자 조작되고, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3D 단백질)를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 식물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여, 이종성 당단백질의 N-글리코실화 부위 점유가 83%를 초과하는 포유동물- 또는 인간-유사 N-글리칸이 있는 이종성 당단백질을 생산하는 단계를 포함하는, 식물 숙주 세포에서 이종성 당단백질의 N-글리코실화 부위 점유가 83%를 초과하는 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.
상기 방법들의 추가적인 실시양태에서, 내인성 숙주 세포 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현된다.
상기 방법들의 특정 실시양태에서, N-글리코실화 부위 점유가 94% 이상이다. 추가적인 실시양태에서, N-글리코실화 부위 점유가 99% 이상이다.
이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3D 단백질)를 코딩하는 제1 핵산 분자, 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 내인성 숙주 세포 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 식물 숙주 세포가 추가로 제공된다.
본원에서의 숙주 세포 및 방법은 광범위한 재조합 단백질 및 당단백질을 생산하는데 유용하다. 본원에 개시된 숙주 세포에서 생산될 수 있는 재조합 단백질 및 당단백질의 예로는 에리트로포이에틴 (EPO); 인터페론 α, 인터페론 β, 인터페론 γ 및 인터페론 ω와 같은 시토카인; 및 과립구-콜로니 자극 인자 (GCSF); 과립구 대식세포-콜로니 자극 인자 (GM-CSF); 인자 VIII, 인자 IX 및 인간 단백질 C와 같은 응고 인자; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-사슬; IgG, IgG 단편, IgG 융합물 및 IgM과 같은 이뮤노글로불린; 가용성 TNF 수용체-Fc 융합 단백질과 같은 이뮤노어드헤신 및 기타 Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터류킨; 유로키나제; 키마제; 우레아 트립신 억제제; IGF-결합 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴; 혈관 내피 성장 인자-2; 골수성 전구세포 억제 인자-1; 오스테오프로테게린; α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글 3; 글루코세레브로시다제; TNF 결합 단백질 1; 여포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막횡단 활성화제 및 칼슘 조정제 및 시클로필린 리간드; 글루카곤 유사 단백질 1; 및 IL-2 수용체 효능제가 포함되지만, 이에 한정되지는 않는다.
본원에 개시된 재조합 숙주 세포 및 방법은 갈락토스-함유 N-글리칸 백분율이 본원에 교시된 바와 같은 변형 이전의 숙주 세포에서 수득될 수 있는 갈락토스 백분율과 비교하여 증가된 항체 또는 Fc 융합 단백질 조성물을 제공하는 것이 바람직한 경우에 항체, Fc 융합 단백질 등을 생산하는데 특히 유용하다. 본원에서의 숙주 세포에서 제조될 수 있는 항체의 예로는 인간 항체, 인간화 항체, 키메라 항체, 중쇄 항체 (예를 들어, 낙타 또는 라마)가 포함되지만, 이에 한정되지는 않는다. 구체적인 항체에는 일반명 (표적) 하에 열거된 하기의 항체들이 포함되지만, 이에 한정되지는 않는다: 무로모납(Muromonab)-CD3 (항-CD3 수용체 항체), 압식시맙(Abciximab) (항-CD41 7E3 항체), 리툭시맙(Rituximab) (항-CD20 항체), 다클리주맙(Daclizumab) (항-CD25 항체), 바실릭시맙(Basiliximab) (항-CD25 항체), 팔리비주맙(Palivizumab) (항-RSV (호흡기 세포융합 바이러스) 항체), 인플릭시맙(Infliximab) (항-TNFα 항체), 트라스투주맙(Trastuzumab) (항-Her2 항체), 젬투주맙 오조가마니신(Gemtuzumab ozogamicin) (항-CD33 항체), 알렘투주맙(Alemtuzumab) (항-CD52 항체), 이브리튜모맙 티욱세텐(Ibritumomab tiuxeten) (항-CD20 항체), 아달리무맙(Adalimumab) (항-TNFα 항체), 오말리주맙(Omalizumab) (항-IgE 항체), 토시투모맙(Tositumomab)-131I (항-CD20 항체의 요오드화 유도체), 에팔리주맙(Efalizumab) (항-CD11a 항체), 세툭시맙(Cetuximab) (항-EGF 수용체 항체), 골리무맙(Golimumab) (항-TNFα 항체), 베바시주맙(Bevacizumab) (항 VEGF-A 항체), 및 이들의 변형물. 본원에 개시된 숙주 세포에서 제조될 수 있는 Fc-융합 단백질의 예로는 에타네르셉트(etanercept) (TNFR-Fc 융합 단백질), FGF-21-Fc 융합 단백질, GLP-1-Fc 융합 단백질, RAGE-Fc 융합 단백질, EPO-Fc 융합 단백질, ActRIIA-Fc 융합 단백질, ActRIIB-Fc 융합 단백질, 글루카곤-Fc 융합물, 옥신토모듈린-Fc-융합물, 및 이들의 유사체 및 변형물이 포함되지만, 이에 한정되지는 않는다.
따라서, 본원에서의 방법 및 숙주 세포는 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유되고 당단백질이 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.
추가로, 본원에서의 방법 및 숙주 세포는 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유되고 당단백질이 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.
추가로, 포유동물-유사 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포 및 방법이 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유되고 당단백질이 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.
일부 측면에서, 푸코실화 포유동물- 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 숙주 세포가 조성물 내의 당단백질의 N-글리코실화 부위의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상이 점유되고 당단백질이 푸코스를 갖는 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.
본원에 개시된 재조합 세포는 이종성 펩티드 또는 약물 분자에 화학적으로 접합시키기에 적절한 항체 및 Fc 단편을 생산하는데 사용될 수 있다. 예를 들어, WO2005047334, WO2005047336, WO2005047337, 및 WO2006107124 (이들의 개시내용은 본원에 참고로 포함됨)에 펩티드 또는 약물 분자를 Fc 단편에 화학적으로 접합시키는 것이 개시되어 있다. EP1180121, EP1105409, 및 US 6,593,295 (이들의 개시내용은 본원에 참고로 포함됨)에는 펩티드 등을 혈액 성분에 화학적으로 접합시키는 것이 개시되어 있고, 이는 전체 항체를 포함한다.
따라서, 본원에서의 방법 및 숙주 세포는 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.
추가로, 본원에서의 방법 및 숙주 세포는 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.
추가로, 포유동물-유사 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포 및 방법이 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.
일부 측면에서, 푸코실화 포유동물- 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 숙주 세포가 조성물 내의 항체 분자의 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스를 갖는 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.
실시예 3에서 제시된 바와 같이, 갈락토스-말단 N-글리칸을 제조하도록 유전자 조작된 피키아 파스토리스 균주에서 생산된 항체의 N-글리코실화 조성이 약 50-60 몰% G0, 18-24 몰% G1, 3-8% 몰% G2, 12-17 몰% Man5, 및 3-6 몰% 하이브리드 범위인 것으로 보인다.
따라서, 조성물 내의 항체 분자의 70% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 5-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 70% 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.
따라서, 조성물 내의 항체 분자의 75% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 5-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 75% 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.
추가로, 조성물 내의 항체 분자의 80% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 5-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 80% 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.
따라서, 조성물 내의 항체 분자의 85% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 5-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 85% 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.
추가로, 조성물 내의 항체 분자의 90% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 5-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 90% 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.
따라서, 조성물 내의 항체 분자의 95% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 5-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 95% 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.
추가로, 조성물 내의 항체 분자의 98% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 5-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 98% 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.
따라서, 조성물 내의 항체 분자의 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰%가 G0 구조이고, N-글리칸의 15-25 몰%가 G1 구조이고, N-글리칸의 4-12 몰%가 G2 구조이고, N-글리칸의 5-17 몰%가 Man5 구조이며, N-글리칸의 5-15 몰%가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 99% 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰%가 G0 구조이고, N-글리칸의 20-22 몰%가 G1 구조이며, N-글리칸의 약 16 내지 18 몰%가 Man5GlcNAc2 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.
특정 실시양태에서, 항체는 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 및 항-CD20 항체로 이루어진 군으로부터 선택된 항체를 포함한다.
본원에서 참조 또는 언급된 모든 특허 및 간행물은 본 발명이 속하는 분야의 당업자의 기술 수준을 나타내고, 각각의 이같은 참조된 특허 또는 간행물은 이의 전문이 개별적으로 참고로 포함되거나 이의 전문이 본원에 기재된 것과 동일한 정도로 참고로 본원에 포함된다.
하기의 실시예들은 본 발명의 추가적인 이해를 촉진하도록 의도된다.
실시예 1
유도성 또는 구성적 프로모터에 작동가능하게 연결된 리슈마니아 메이저 STT3D (LmSTT3D) 오픈 리딩 프레임 (ORF)을 코딩하는 발현 카세트를 포함하는 플라스미드를 하기와 같이 구축하였다.
LmSTT3D (서열 12)를 코딩하는 오픈 리딩 프레임이 피키아 파스토리스에서의 최적의 발현을 위해 코돈-최적화되었고, 진아트 아게(GeneArt AG) (독일 브란덴부르크)에 의해 합성되었다. LmSTT3D를 코딩하는 코돈-최적화 핵산 분자가 pGLY6287로 지정되었고, 이의 뉴클레오티드 서열이 서열 11에서 제시된다.
플라스미드 pGLY6301 (도 2)는 피키아 파스토리스 내의 URA6 유전자좌를 표적으로 하는 롤-인 통합 플라스미드이다. LmSTT3D를 코딩하는 발현 카세트는 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 피키아 파스토리스에서의 효과적인 발현을 위해 코돈-최적화된 LmSTT3D ORF를 코딩하는 핵산 분자를 포함한다. 형질전환체를 선택하기 위해, 이러한 플라스미드는 사카로미세스 세레비지아에 ARR3 ORF를 코딩하는 핵산 분자 (서열 32)가 피키아 파스토리스 RPL10 프로모터 서열 (서열 25)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결되어 있는, 사카로미세스 세레비지아에 ARR3 ORF를 코딩하는 발현 카세트를 포함한다. 이러한 플라스미드는 URA6 유전자좌 (서열 33)를 표적으로 하는 핵산 분자를 추가로 포함한다. EcoRI 부위가 5' 끝부분에, FseI 부위가 3' 끝부분에 플랭킹된 코돈-최적화 LmSTT3D ORF (pGLY6287)를 코딩하는 DNA 단편을 EcoRI 및 FseI로 소화된 플라스미드 pGFI30t 내로 클로닝함으로써, 플라스미드 pGLY6301이 구축되었다.
플라스미드 pGLY6294 (도 3)는 피키아 파스토리스 내의 TRP1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하는 KINKO 통합 벡터이다. KINKO (녹-아웃이 거의 또는 전혀 없는 녹-인(knock-in): Knock-In with little or No Knock-Out) 통합 벡터는 표적화된 유전자좌에서 유전자의 발현을 파괴하지 않으면서 표적화된 유전자좌 내로의 이종성 DNA의 삽입을 가능하게 하고, 미국 출원 공개 번호 20090124000에 기술되어 있다. LmSTT3D를 코딩하는 발현 카세트는 구성적 피키아 파스토리스 GAPDH 프로모터 서열 (서열 26)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 LmSTT3D ORF를 코딩하는 핵산 분자를 포함한다. 형질전환체를 선택하기 위해, 이러한 플라스미드는 노르세오트리신 저항성 (NATR) ORF (EROSCARF로부터의 pAG25로부터 유래됨, 사이언티픽 리서치 앤드 디벨롭먼트 게엠베하(Scientific Research and Development GmbH) (독일 D-61352 바트 홈부르크 다임러스트라쎄 13a), 문헌 [Goldstein et al., Yeast 15: 1541 (1999)] 참조)를 코딩하는 핵산 분자 (서열 34)가 아시비아 고시피이 TEF1 프로모터 서열 (서열 86)을 갖는 핵산 분자에 5' 끝부분에서, 아시비아 고시피이 TEF1 종결 서열 (서열 87)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결되어 있는, 노르세오트리신 저항성 (NATR) ORF를 코딩하는 발현 카세트를 포함한다. 이러한 2개의 발현 카세트에 피키아 파스토리스 ALG3 종결 서열 (서열 29)을 갖는 핵산 분자에 연결된 정지 코돈에서 끝나는 Trp1p를 코딩하는 ORF의 5' 영역으로부터의 뉴클레오티드 서열 (서열 30)을 포함하는 핵산 분자가 한쪽 측면에, TRP1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 31)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. NotI 부위가 5' 끝부분에, PacI 부위가 3' 끝부분에 플랭킹된 코돈-최적화 LmSTT3D ORF (pGLY6287)를 코딩하는 DNA 단편을 NotI 및 PacI로 소화된 플라스미드 pGLY597 내로 클로닝함으로써, 플라스미드 pGLY6294가 구축되었다. 아시비아 고시피이 TEF1 프로모터 (PTEF) 및 아시비아 고시피이 TEF1 종결 서열 (TTEF)에 작동가능하게 연결된 노르세오트리신 저항성 ORF (NAT)를 코딩하는 핵산 분자를 포함하는 발현 카세트.
상기 플라스미드들을 하기 실시예에서 제시된 바와 같이 내부에서 생산된 당단백질 상의 N-글리코실화 부위 점유를 증가시키기 위해 피키아 파스토리스 내로 LmSTT3D 발현 카세트를 도입하는데 사용할 수 있다.
실시예 2
유전자 조작된 피키아 파스토리스 균주 YGLY13992는 재조합 인간 항-Her2 항체를 생산하는 균주이고, 피키아 파스토리스 균주 YGLY14401은 재조합 인간 항-RSV 항체를 생산하는 균주이다. 이러한 균주들의 구축이 도 1a-1h에서 도식적으로 도해된다. 간략하게, 이러한 균주들을 하기와 같이 구축하였다.
앞서 기술된 방법을 사용하여 야생형 피키아 파스토리스 균주 NRRL -Y 11430으로부터 균주 YGLY8316을 구축하였다 (예를 들어, 미국 특허 번호 7,449,308; 미국 특허 번호 7,479,389; 미국 출원 공개 번호 20090124000; PCT 출원 공개 번호 WO2009085135; 문헌 [Nett and Gerngross, Yeast 20:1279 (2003)]; [Choi et al., Proc. Natl. Acad. Sci. USA 100:5022 (2003)]; [Hamilton et al., Science 301:1244 (2003)] 참조). 모든 플라스미드는 표준 분자 생물학 절차를 사용하여 pUC19 플라스미드에서 제조되었다. 피키아 파스토리스에서의 발현에 최적화된 뉴클레오티드 서열을 위해, 천연 뉴클레오티드 서열을 진옵티마이저(GENEOPTIMIZER) 소프트웨어 (진아트(GeneArt), 독일 레겐스부르크)에 의해 분석하였고, 결과를 사용하여, 코돈이 피키아 파스토리스 발현에 대해 최적화된 뉴클레오티드 서열을 생성시켰다. 전기천공에 의해 (전기천공기의 제조사인 바이오래드(BioRad)가 권장하는 바와 같은 표준 기술을 사용하여) 효모 균주를 형질전환시켰다.
플라스미드 pGLY6 (도 4)은 URA5 유전자좌를 표적으로 하는 통합 벡터이다. 이는 피키아 파스토리스 URA5 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 39)을 포함하는 핵산 분자가 한쪽 측면에, 피키아 파스토리스 URA5 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 40)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 사카로미세스 세레비지아에 인버타제 유전자 또는 전사 단위 (ScSUC2: 서열 38)를 포함하는 핵산 분자를 함유한다. 플라스미드 pGLY6을 선형화하고, 선형화된 플라스미드를 야생형 균주 NRRL -Y 11430 내로 형질전환시켜, ScSUC2 유전자가 이중-교차 상동 재조합에 의해 URA5 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY1 -3을 선택하였고, 이는 우라실에 대해 영양요구성이다.
플라스미드 pGLY40 (도 5)은 OCH1 유전자좌를 표적으로 하고, lacZ 반복물 (서열 42)을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 OCH1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 43)을 포함하는 핵산 분자가 한쪽 측면에, OCH1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 44)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (서열 41)를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 플라스미드 pGLY40을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY1 -3 내로 형질전환시켜, lacZ 반복물들이 플랭킹된 URA5 유전자가 이중-교차 상동 재조합에 의해 OCH1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY2 -3을 선택하였고, 이는 URA5에 대해 원영양성(prototrophic)이다. 균주 YGLY2 -3을 5-플루오로오로트산 (5-FOA)의 존재 하에 역선별(counterselecting)하여, URA5 유전자는 상실되었고 lacZ 반복물들만 OCH1 유전자좌 내에 잔존하는 다수의 균주를 생산하였다. 이는 균주를 우라실에 대해 영양요구성이게 한다. 균주 YGLY4 -3을 선택하였다.
플라스미드 pGLY43a (도 6)는 BMT2 유전자좌를 표적으로 하고, lacZ 반복물을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자에 인접한 클루이베로미세스 락티스 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 수송체 유전자 또는 전사 단위 (KlMNN2 -2, 서열 45)를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 이러한 인접한 유전자들에 BMT2 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 46)을 포함하는 핵산 분자가 한쪽 측면에, BMT2 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 47)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY43a를 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY4 -3 내로 형질전환시켜, KlMNN2 -2 유전자 및 lacZ 반복물들이 플랭킹된 URA5 유전자가 이중-교차 상동 재조합에 의해 BMT2 유전자좌 내로 삽입된 다수의 균주를 생산하였다. BMT2 유전자는 문헌 [Mille et al., J. Biol. Chem. 283: 9724-9736 (2008)] 및 미국 특허 번호 7,465,557에 개시되어 있다. 생산된 균주들로부터 균주 YGLY6 -3을 선택하였고, 이는 우라실에 대해 원영양성이다. 균주 YGLY6 -3을 5-FOA의 존재 하에 역선별하여, URA5 유전자는 상실되었고 lacZ 반복물들만 잔존하는 다수의 균주를 생산하였다. 이는 균주를 우라실에 대해 영양요구성이게 한다. 균주 YGLY8 -3을 선택하였다.
플라스미드 pGLY48 (도 7)는 MNN4L1 유전자좌를 표적으로 하고, lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자를 포함하는 핵산 분자에 인접한, 피키아 파스토리스 GAPDH 프로모터 (서열 26)를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 종결 서열 (서열 24)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 UDP-GlcNAc 수송체의 마우스 상동체 (서열 48) 오픈 리딩 프레임 (ORF)을 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하며, 이때 전체적인 발현 카세트들에 피키아 파스토리스 MNN4L1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 49)을 포함하는 핵산 분자가 한쪽 측면에, MNN4L1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 50)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 통합 벡터이다. 플라스미드 pGLY48을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY8 -3 내로 형질전환시켜, 마우스 UDP-GlcNAc 수송체를 코딩하는 발현 카세트 및 URA5 유전자가 이중-교차 상동 재조합에 의해 MNN4L1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. MNN4L1 유전자 (MNN4B로 또한 지칭됨)는 미국 특허 번호 7,259,007에 개시되어 있다. 생산된 균주들로부터 균주 YGLY10 -3을 선택한 후, 5-FOA의 존재 하에 역선별하여, URA5 유전자는 상실되었고 lacZ 반복물들만 잔존하는 다수의 균주를 생산하였다. 균주 YGLY12-3을 선택하였다.
플라스미드 pGLY45 (도 8)는 PNO1 / MNN4 유전자좌를 표적으로 하고, lacZ 반복물을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 PNO1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 51)을 포함하는 핵산 분자가 한쪽 측면에, MNN4 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 52)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 플라스미드 pGLY45를 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY12 -3 내로 형질전환시켜, lacZ 반복물들이 플랭킹된 URA5 유전자가 이중-교차 상동 재조합에 의해 PNO1 / MNN4 유전자좌 내로 삽입된 다수의 균주를 생산하였다. PNO1 유전자는 미국 특허 번호 7,198,921에 개시되어 있고, MNN4 유전자 (MNN4B로 또한 지칭됨)는 미국 특허 번호 7,259,007에 개시되어 있다. 생산된 균주들로부터 균주 YGLY14 -3을 선택한 후, 5-FOA의 존재 하에 역선별하여, URA5 유전자는 상실되었고 lacZ 반복물들만 잔존하는 다수의 균주를 생산하였다. 균주 YGLY16 -3을 선택하였다.
플라스미드 pGLY1430 (도 9)은 ADE1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 피키아 파스토리스 SEC12 리더 펩티드 (10)에 융합된 인간 GlcNAc 트랜스퍼라제 I 촉매 도메인 (NA), (2) UDP-GlcNAc 수송체의 마우스 상동체 (MmTr), (3) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 SEC12 리더 펩티드 (8)에 융합된 마우스 만노시다제 IA 촉매 도메인 (FB), 및 (4) 피키아 파스토리스 URA5 유전자 또는 전사 단위를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 KINKO 통합 벡터이다. KINKO (녹-아웃이 거의 또는 전혀 없는 녹-인: Knock-In with little or No Knock-Out) 통합 벡터는 표적화된 유전자좌에서 유전자의 발현을 파괴하지 않으면서 표적화된 유전자좌 내로의 이종성 DNA의 삽입을 가능하게 하고, 미국 출원 공개 번호 20090124000에 기술되어 있다. NA10을 코딩하는 발현 카세트는 5' 끝부분에서 SEC12 리더 10을 코딩하는 핵산 분자 (서열 54)에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 인간 GlcNAc 트랜스퍼라제 I 촉매 도메인을 코딩하는 핵산 분자 (서열 53)를 포함하고, 이는 피키아 파스토리스 PMA1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 PMA1 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. MmTr을 코딩하는 발현 카세트는 피키아 파스토리스 SEC4 프로모터 (서열 55)를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 OCH1 종결 서열 (서열 56)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, UDP-GlcNAc 수송체의 마우스 상동체 ORF를 코딩하는 핵산 분자를 포함한다. FB8을 코딩하는 발현 카세트는 5' 끝부분에서 SEC12 -m 리더 8을 코딩하는 핵산 분자 (서열 58)에 융합된, 마우스 만노시다제 IA 촉매 도메인을 코딩하는 핵산 분자 (서열 57)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. URA5 발현 카세트는 lacZ 반복물을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자를 포함한다. 일렬의 4개의 카세트에 ADE1 유전자의 5' 영역 및 완전한 ORF로부터의 뉴클레오티드 서열 (서열 59)에 이어지는 피키아 파스토리스 ALG3 종결 서열 (서열 29)을 포함하는 핵산 분자가 한쪽 측면에, ADE1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 60)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY1430을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY16 -3 내로 형질전환시켜, 일렬의 4개의 발현 카세트가 이중-교차 상동 재조합에 의해 ADE1 ORF에 바로 이어져서 ADE1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY2798을 선택하였고, 이는 아르기닌에 대해 영양요구성이고, 이제 우리딘, 히스티딘, 및 아데닌에 대해 원영양성이다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY3794를 선택하였고, 이는 갈락토스 말단 N-글리칸을 우세하게 갖는 당단백질을 제조할 수 있다.
플라스미드 pGLY582 (도 10)는 HIS1 유전자좌를 표적으로 하고, (1) 사카로미세스 세레비지아에 UDP-글루코스 에피머라제 (ScGAL10), (2) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 KRE2 -s 리더 펩티드 (33)에 융합된 인간 갈락토실트랜스퍼라제 I (hGalT) 촉매 도메인, (3) lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위, 및 (4) 드로소필라 멜라노가스터 UDP-갈락토스 수송체 (DmUGT)를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. ScGAL10을 코딩하는 발현 카세트는 피키아 파스토리스 PMA1 프로모터 (서열 88)를 포함하는 핵산 분자에 5' 끝부분에서 작동가능하게 연결되고, 피키아 파스토리스 PMA1 전사 종결 서열 (서열 62)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, ScGAL10 ORF를 코딩하는 핵산 분자 (서열 61)를 포함한다. 키메라 갈락토실트랜스퍼라제 I를 코딩하는 발현 카세트는 5' 끝부분에서 KRE2 -s 리더 33을 코딩하는 핵산 분자 (서열 64)에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 hGalT 촉매 도메인을 코딩하는 핵산 분자 (서열 63)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. URA5 발현 카세트는 lacZ 반복물을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자를 포함한다. DmUGT를 코딩하는 발현 카세트는 피키아 파스토리스 OCH1 프로모터 (서열 66)를 포함하는 핵산 분자에 5' 끝부분에서 작동가능하게 연결되고, 피키아 파스토리스 ALG12 전사 종결 서열 (서열 67)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, DmUGT ORF를 코딩하는 핵산 분자 (서열 65)를 포함한다. 일렬의 4개의 카세트에 HIS1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 68)을 포함하는 핵산 분자가 한쪽 측면에, HIS1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 69)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY582를 선형화시키고, 선형화된 플라스미드를 균주 YGLY3794 내로 형질전환시켜, 일렬의 4개의 발현 카세트가 상동 재조합에 의해 HIS1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 균주 YGLY3853을 선택하였고, 이는 히스티딘에 대해 영양요구성이고, 우리딘에 대해 원영양성이다.
플라스미드 pGLY167b (도 11)은 ARG1 유전자좌를 표적으로 하고, (1) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 MNN2 리더 펩티드 (53)에 융합된 드로소필라 멜라노가스터 만노시다제 II 촉매 도메인 (KD), (2) 피키아 파스토리스 HIS1 유전자 또는 전사 단위, 및 (3) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 MNN2 리더 펩티드 (54)에 융합된 래트 N-아세틸글루코사민 (GlcNAc) 트랜스퍼라제 II 촉매 도메인 (TC)을 코딩하는 3개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. KD53을 코딩하는 발현 카세트는 5' 끝부분에서 MNN2 리더 53을 코딩하는 핵산 분자 (서열 71)에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 드로소필라 멜라노가스터 만노시다제 II 촉매 도메인을 코딩하는 핵산 분자 (서열 70)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. HIS1 발현 카세트는 피키아 파스토리스 HIS1 유전자 또는 전사 단위 (서열 72)를 포함하는 핵산 분자를 포함한다. TC54를 코딩하는 발현 카세트는 5' 끝부분에서 MNN2 리더 54를 코딩하는 핵산 분자 (서열 74)에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 래트 GlcNAc 트랜스퍼라제 II 촉매 도메인을 코딩하는 핵산 분자 (서열 73)를 포함하고, 이는 피키아 파스토리스 PMA1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 PMA1 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 일렬의 3개의 카세트에 ARG1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 75)을 포함하는 핵산 분자가 한쪽 측면에, ARG1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 76)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY167b를 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY3853 내로 형질전환시켜, 일렬의 3개의 발현 카세트가 이중-교차 상동 재조합에 의해 ARG1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY4754를 선택하였고, 이는 아르기닌에 대해 영양요구성이고, 우리딘 및 히스티딘에 대해 원영양성이다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY4799를 선택하였다.
플라스미드 pGLY3411 (도 12)은 피키아 파스토리스 BMT4 유전자의 5' 뉴클레오티드 서열 (서열 77)이 한쪽 측면에, 피키아 파스토리스 BMT4 유전자의 3' 뉴클레오티드 서열 (서열 78)이 다른 쪽 측면에 플랭킹된, lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자를 포함하는 발현 카세트를 함유하는 통합 벡터이다. 플라스미드 pGLY3411을 선형화시키고, 선형화된 플라스미드를 YGLY4799 내로 형질전환시켜, URA5 발현 카세트가 이중-교차 상동 재조합에 의해 BMT4 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY6903을 선택하였고, 이는 우라실, 아데닌, 히스티딘, 프롤린, 아르기닌, 및 트립토판에 대해 원영양성이다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY7432 및 YGLY7433을 선택하였다.
플라스미드 pGLY3419 (도 13)는 피키아 파스토리스 BMT1 유전자의 5' 뉴클레오티드 서열 (서열 79)이 한쪽 측면에, 피키아 파스토리스 BMT1 유전자의 3' 뉴클레오티드 서열 (서열 80)이 다른 쪽 측면에 플랭킹된, lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자를 포함하는 발현 카세트를 함유하는 통합 벡터이다. 플라스미드 pGLY3419를 선형화하고, 선형화된 플라스미드를 균주 YGLY7432 및 YGLY7433 내로 형질전환시켜, URA5 발현 카세트가 이중-교차 상동 재조합에 의해 BMT1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY7656 및 YGLY7651을 선택하였고, 이들은 우라실, 아데닌, 히스티딘, 프롤린, 아르기닌, 및 트립토판에 대해 원영양성이다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY7930 및 YGLY7940을 선택하였다.
플라스미드 pGLY3421 (도 14)은 피키아 파스토리스 BMT3 유전자의 5' 뉴클레오티드 서열 (서열 81)이 한쪽 측면에, 피키아 파스토리스 BMT3 유전자의 3' 뉴클레오티드 서열 (서열 82)이 다른 쪽 측면에 플랭킹된, lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자를 포함하는 발현 카세트를 함유하는 통합 벡터이다. 플라스미드 pGLY3419를 선형화하고, 선형화된 플라스미드를 균주 YGLY7930 및 YGLY7940 내로 형질전환시켜, URA5 발현 카세트가 이중-교차 상동 재조합에 의해 BMT1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY7965 및 YGLY7961을 선택하였고, 이들은 우라실, 아데닌, 히스티딘, 프롤린, 아르기닌, 및 트립토판에 대해 원영양성이다.
플라스미드 pGLY3673 (도 15)는 PRO1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan)을 함유하는 KINKO 통합 벡터이다. aMATTrMan을 코딩하는 발현 카세트는 5' 끝부분에서 사카로미세스 세레비지아에 αMATpre 신호 펩티드를 코딩하는 핵산 분자 (서열 13)에 융합된, 트리코더마 레에세이 촉매 도메인을 코딩하는 핵산 분자 (서열 83)를 포함하고, 이는 피키아 파스토리스 AOX1 프로모터 (서열 23)를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 이러한 카세트에 PRO1 유전자의 5' 영역 및 완전한 ORF로부터의 뉴클레오티드 서열 (서열 89)에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, PRO1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 90)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 이러한 플라스미드는 PpARG1 유전자를 함유한다. 플라스미드 pGLY3673을 균주 YGLY7965 및 YGLY7961 내로 형질전환시켜 다수의 균주를 생산하였고, 생산된 균주들로부터 균주 YGLY78316 및 YGLY8323을 선택하였다.
플라스미드 pGLY6833 (도 16)은 피키아 파스토리스 내의 TRP2 유전자좌를 표적으로 하는, 항-Her2 항체의 경쇄 및 중쇄를 코딩하는 롤-인 통합 벡터이다. 항-Her2 중쇄를 코딩하는 발현 카세트는 사카로미세스 세레비지아에 메이팅(mating) 인자 전(pre)-신호 서열 (서열 14)을 코딩하는 핵산 분자 (차례로 이의 N-말단에서 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 융합됨)에 5' 끝부분에서, 피키아 파스토리스 CIT1 전사 종결 서열 (서열 85)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, 피키아 파스토리스에서의 효과적인 발현에 대해 코돈-최적화된 중쇄 ORF를 코딩하는 핵산 분자 (서열 15)를 포함한다. 항-Her2 경쇄를 코딩하는 발현 카세트는 사카로미세스 세레비지아에 메이팅 인자 전-신호 서열 (서열 14)을 코딩하는 핵산 분자 (차례로 이의 N-말단에서 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 융합됨)에 5' 끝부분에서, 피키아 파스토리스 CIT1 전사 종결 서열 (서열 85)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, 피키아 파스토리스에서의 효과적인 발현에 대해 코돈-최적화된 경쇄 ORF를 코딩하는 핵산 분자 (서열 17)를 포함한다. 형질전환체를 선택하기 위해, 이러한 플라스미드는 제오신 ORF를 코딩하는 핵산 분자 (서열 35)가 사카로미세스 세레비지아에 TEF 프로모터 서열 (서열 37)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결되어 있는, 제오신 ORF를 코딩하는 발현 카세트를 포함한다. 이러한 플라스미드는 TRP2 유전자좌 (서열 91)를 표적화하는 핵산 분자를 추가로 포함한다.
플라스미드 pGLY6564 (도 17)은 피키아 파스토리스 내의 TRP2 유전자좌를 표적으로 하는, 항-RSV 항체의 경쇄 및 중쇄를 코딩하는 롤-인 통합 벡터이다. 항-RSV 중쇄를 코딩하는 발현 카세트는 사카로미세스 세레비지아에 메이팅 인자 전-신호 서열 (서열 14)을 코딩하는 핵산 분자 (차례로 이의 N-말단에서 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 융합됨)에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, 피키아 파스토리스에서의 효과적인 발현에 대해 코돈-최적화된 중쇄 ORF를 코딩하는 핵산 분자 (서열 19)를 포함한다. 항-RSV 경쇄를 코딩하는 발현 카세트는 사카로미세스 세레비지아에 메이팅 인자 전-신호 서열 (서열 14)을 코딩하는 핵산 분자 (차례로 이의 N-말단에서 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 융합됨)에 5' 끝부분에서, 피키아 파스토리스 AOX1 전사 종결 서열 (서열 36)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, 피키아 파스토리스에서의 효과적인 발현에 대해 코돈-최적화된 경쇄 ORF를 코딩하는 핵산 분자 (서열 21)를 포함한다. 형질전환체를 선택하기 위해, 이러한 플라스미드는 제오신 ORF를 코딩하는 핵산 분자 (서열 35)가 사카로미세스 세레비지아에 TEF 프로모터 서열 (서열 37)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결되어 있는, 제오신 ORF를 코딩하는 발현 카세트를 포함한다. 이러한 플라스미드는 TRP2 유전자좌 (서열 91)를 표적화하는 핵산 분자를 추가로 포함한다.
항-Her2 항체를 코딩하는 pGLY6833을 YGLY8316 내로 형질전환시킴으로써 균주 YGLY13992를 생성시켰다. 생산된 균주들로부터 균주 YGLY13992를 선택하였다. 이러한 균주에서, 항-Her2 중쇄 및 경쇄를 코딩하는 발현 카세트가 피키아 파스토리스 TRP2 유전자좌 (PpTRP2)를 표적으로 한다. 이러한 균주는 LmSTT3D 발현 카세트를 포함하지 않는다. 항-RSV 항체를 코딩하는 pGLY6564를 YGLY8323 내로 형질전환시킴으로써 균주 YGLY14401을 생성시켰다. 생산된 균주들로부터 균주 YGLY14401을 선택하였다. 이러한 균주에서, 항-RSV 중쇄 및 경쇄를 코딩하는 발현 카세트가 피키아 파스토리스 TRP2 유전자좌 (PpTRP2)를 표적으로 한다. 이러한 균주는 LmSTT3D 발현 카세트를 포함하지 않는다.
본원에 개시된 적합한 균주의 상기 LmSTT3D 발현/통합 플라스미드 벡터로의 형질전환을 본질적으로 하기와 같이 수행하였다. 적합한 피키아 파스토리스 균주를 50 ㎖ YPD 배지 (효모 추출물 (1%), 펩톤 (2%), 및 덱스트로스 (2%))에서 밤새 약 0.2 내지 6의 OD로 성장시켰다. 얼음 상에서 30분 동안 인큐베이션한 후, 세포를 2500-3000 rpm에서 5분 동안의 원심분리에 의해 펠릿화시켰다. 배지를 제거하고, 세포를 멸균 빙냉 1 M 소르비톨로 3회 세척한 후, 0.5 ㎖의 멸균 빙냉 1 M 소르비톨에 재현탁시켰다. 10 ㎕의 선형화된 DNA (5-20 ㎍) 및 100 ㎕ 세포 현탁액을 전기천공 큐벳에서 합치고, 5분 동안 얼음 상에서 인큐베이션하였다. 바이오-래드의 진펄서 엑스셀(GenePulser Xcell)에서 미리 설정된 피키아 파스토리스 프로토콜 (2 kV, 25 μF, 200 Ω)에 따라 전기천공을 수행하고, 바로 이어서 1 ㎖ YPDS 회수 배지 (YPD 배지 + 1 M 소르비톨)를 첨가하였다. 형질전환된 세포를 실온 (24℃)에서 4시간 내지 밤새 회복시킨 후, 세포를 선택 배지 상에 플레이팅하였다.
그 후, 균주 YGLY13992 및 YGLY14401 각각을 상기 기술된 바와 같은 유도성 AOX1 프로모터의 제어 하에 LmSTT3D를 코딩하는 pGLY6301 또는 구성적 GAPDH 프로모터의 제어 하에 LmSTT3D를 코딩하는 pGLY6294로 형질전환시켜, 실시예 3에 기술된 균주들을 생산하였다.
실시예 3
통합/발현 플라스미드 pGLY6301 (LmSTT3D를 코딩하는 ORF가 유도성 PpAOX1 프로모터에 작동가능하게 연결되어 있는 발현 카세트를 포함함), 또는 pGLY6294 (LmSTT3D를 코딩하는 ORF가 구성적 PpGAPDH 프로모터에 작동가능하게 연결되어 있는 발현 카세트를 포함함)를 각각 SpeI 또는 SfiI로 선형화시키고, 선형화된 플라스미드를 피키아 파스토리스 균주 YGLY13992 또는 YGLY14401 내로 형질전환시켜, 표 1에 제시된 균주 YGLY17351, YGLY17368, YGLY17319, 및 YGLY17354를 생산하였다. 본질적으로 실시예 2에 기술된 바와 같이 형질전환을 수행하였다.
URA6 유전자좌에서의 pGLY6301의 게놈 통합을 프라이머 PpURA6out/UP (5'-CTGAGGAGTCAGATATCAGCTCAATCTCCAT-3'; 서열 1) 및 Puc19/LP (5'- TCCGGCTCGTATGTTGTGTGGAATTGT-3'; 서열 2) 또는 ScARR3/UP (5'- GGCAATAGTCGCGAGAATCCTTAAACCAT-3'; 서열 3) 및 PpURA6out/LP (5- CTGGATGTTTGATGGGTTCAGTTTCAGCTGGA-3'; 서열 4)를 사용하여 콜로니 PCR (cPCR)에 의해 확인하였다.
TRP1 유전자좌에서의 pGLY6294의 게놈 통합을 프라이머 PpTRP-5'out/UP (5'- CCTCGTAAAGATCTGCGGTTTGCAAAGT-3'; 서열 5) 및 PpALG3TT/LP (5'-CCTCCCACTGGAACCGATGATATGGAA-3'; 서열 6) 또는 PpTEFTT/UP (5'-GATGCGAAGTTAAGTGCGCAGAAAGTAATATCA-3'; 서열 7) 및 PpTRP1-3'out/LP (5'-CGTGTGTACCTTGAAACGTCAATGATACTTTGA-3'; 서열 8)를 사용하여 cPCR에 의해 확인하였다. LmSTT3D를 코딩하는 발현 카세트의 게놈 내로의 통합을 cPCR 프라이머 LmSTT3D/iUP (5'-GCGACTGGTTCCAATTGACAAGCTT-3' (서열 9) 및 LmSTT3D/iLP (5'- CAACAGTAGAACCAGAAGCCTCGTAAGTACAG-3' (서열 10)를 사용하여 확인하였다. PCR 조건은 95℃에서 2분의 사이클 1회, 95℃에서 20초, 55℃에서 20초 및 72℃에서 1분의 사이클 35회, 이어서 72℃에서 10분의 사이클 1회였다.
균주들을 식스포스(SixFors) 발효기에서 배양하여, N-글리코실화 부위 점유 분석을 위한 항체를 생산하였다. 항체 생산을 위한 형질전환된 균주의 세포 성장 조건은 일반적으로 하기와 같았다.
형질전환된 효모 균주의 단백질 발현을 1% 효모 추출물, 2% 펩톤, 100 mM 인산칼륨 완충제 (pH 6.0), 1.34% 효모 질소 베이스, 4×10-5% 비오틴 및 1% 글리세롤로 이루어진 완충된 글리세롤-복합 배지 (BMGY)를 사용하여 24℃에서 진탕 플라스크에서 수행하였다. 단백질 발현을 위한 유도 배지는 BMGY 내의 글리세롤 대신 1% 메탄올로 구성된 완충된 메탄올-복합 배지 (BMMY)였다. 유도 배지를 첨가한 시점에 메탄올 내의 Pmt 억제제 Pmti-3를 성장 배지에 18.3 μM의 최종 농도로 첨가하였다. 세포를 수확하고, 2,000 rpm에서 5분 동안 원심분리하였다.
식스포스 발효기 스크리닝 프로토콜은 표 2에 제시된 파라미터를 따랐다.
접종 후 약 18시간의 시점에, 350 ㎖의 배지 A (하기 표 3 참조) + 4% 글리세롤을 함유하는 식스포스 용기에 관심 균주를 접종하였다. 소량 (0.3 ㎖의 100% 메탄올 내의 0.2 ㎎/㎖)의 Pmti-3 (5-[[3-(1-페닐-2-히드록시)에톡시)-4-(2-페닐엑톡시)]페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산) (국제 출원 공개 번호 WO 2007061631 참조)을 접종물과 함께 첨가하였다. 약 20시간의 시점에, 17 ㎖ 50% 글리세롤 용액 (글리세롤 유가식(Fed-Batch) 공급물, 하기 표 4 참조) + 더 많은 용량 (0.3 ㎖의 4 ㎎/㎖)의 Pmti-3의 볼루스를 용기마다 첨가하였다. 약 26시간의 시점에, 용존 산소 (DO) 농도에서의 양성 스파이크에 의해 지시되는 바와 같이 글리세롤이 소비되었을 때, 메탄올 공급물 (하기 표 5 참조)을 0.7 ㎖/hr로 지속적으로 시작하였다. 동시에, 또 다른 용량의 Pmti-3 (0.3 ㎖의 4 ㎎/㎖ 스톡(stock))을 용기마다 첨가하였다. 약 48시간의 시점에, 또 다른 용량 (0.3 ㎖의 4 ㎎/㎖)의 Pmti-3을 용기마다 첨가하였다. 접종 후 약 60시간의 시점에 배양물을 수확하고 프로세싱하였다.
항-Her2 또는 항-RSV 항체 상의 N-글리칸의 점유를 하기와 같이 모세관 전기영동 (CE)을 사용하여 결정하였다. 세포 배양 배지로부터 항체를 회수하고, 단백질 A 칼럼 크로마토그래피에 의해 정제하였다. 단백질 A로 정제된 샘플 (100-200 ㎍)을 약 100 ㎕로 농축한 후, 완충제를 100 mM 트리스(Tris)-HCl pH 9.0 + 1% SDS로 교체하였다. 그 후, 베크만(Beckman)이 제공한 10 kDa 내부 표준물 2 ㎕와 함께 샘플을 5 ㎕ β-메르캅토에탄올 첨가에 의해 환원시키고, 5분 동안 비등시켰다. 그 후, 약 20 ㎕의 환원된 샘플을 베크만 쿨터(Beckman Coulter)가 권장하는 방법에 따라 베어-퓨즈드(bare-fused) 실리카 모세관 (약 70 ㎜, 50 ㎛ I.D.) 상에서 분석하였다.
도 18은 CE 분석으로부터의 중쇄의 N-글리코실화 부위 점유를 나타낸다. 이러한 도면은 두 항체 모두에 대해, N-연결 중쇄 종의 양이 약 80%에서 LmSTT3D가 구성적으로 발현되었을 때는 약 94%로, 항체 발현 유도와 동시에 LmSTT3D의 발현이 유도되었을 때는 약 99%로 증가하였음을 나타낸다.
표 7은 내인성 올리고사카릴트랜스퍼라제 (OST) 복합체의 존재 하에 LmSTT3D가 과다발현된 숙주 세포로부터 항체가 수득된 조성물에 대해 항-HER2 및 항-RSV 항체의 N-글리코실화 부위 점유가 증가되었음을 나타낸다. N-글리코실화 부위 점유를 결정하기 위해, 항체들을 환원시키고, 중쇄의 N-글리칸 점유를 결정하였다. 이러한 표는 일반적으로, 유도성 프로모터의 제어 하의 LmSTT3D의 과다발현이 시험된 두 항체 모두에 대해 약 82-83%에서 약 99%로 N-글리코실화 부위 점유 증가를 일으켰음을 나타낸다 (LmSTT3D 과다발현의 부재 하에서의 N-글리코실화 부위 점유에 비해 약 19% 증가). LmSTT3D 및 항체의 발현은 동일한 유도성 프로모터의 제어 하에 있었다. LmSTT3D의 과다발현이 구성적 프로모터의 제어 하에 있었을 때, N-글리코실화 부위 점유가 시험된 두 항체 모두에 대해 약 94%로 증가되었다 (LmSTT3D 과다발현의 부재 하에서의 N-글리코실화 부위 점유에 비해 약 13% 증가).
표 8은 환원된 항체 제제로부터의 개별적인 중쇄들의 N-글리코실화 부위 점유의 결정을 기초로 하는 내인성 올리고사카릴트랜스퍼라제 (OST) 복합체의 존재 하에 LmSTT3D가 과다발현된 숙주 세포로부터 수득된 전체 항체를 포함하는 조성물에 대한 N-글리코실화 부위 점유를 나타낸다. 식 (GHC 분획)2 × 100은 N-글리코실화된 중쇄 분획의 결정을 기초로 하는 완전히 점유된 항체 %의 추정값 또는 근삿값을 제공할 것이다.
Q-TOF 분석
사용된 고성능 액체 크로마토그래피 (HPLC) 시스템은 자동주입기가 장착된 애질런트(Agilent) 1200, 칼럼-가열 구획 및 210 및 280 nm에서 검출하는 UV 검출기로 이루어졌다. 이러한 시스템으로 수행된 모든 LC-MS 실험은 1 ㎖/분으로 러닝(running)되었다. MS 검출을 위해 유속이 분할되지 않았다. 질량 분광측정 분석을 양이온 방식으로 애큐러트-매스(Accurate-Mass) Q-TOF LC/MS 6520 (애질런트 테크놀러지(Agilent technology)) 상에서 수행하였다. 이중 ESI 소스의 온도를 350℃로 설정하였다. 질소 기체 유속은 콘(cone)에 대한 13 ℓ/h 및 350 ℓ/h로 설정하였고, 분무기는 45 psig로 설정하였으며, 이때 4500 볼트가 모세관에 적용되었다. 질량 검정 및 단백질 질량 측정치에 대해 API-TOF 기준 질량 용액 키트에 따라 HP-0921로부터 922.009의 기준 질량이 제조되었다. 300-3000 m/z의 이온 스펙트럼 범위에 대한 데이터를 취득하였고, 애질런트의 매스헌터(Masshunter)를 사용하여 프로세싱하였다.
샘플 제조는 하기와 같았다. 무손상 항체 샘플 (50 ㎍)을 50 ㎕의 25 mM NH4HCO3, pH 7.8에서 제조하였다. 탈글리코실화 항체에 대해, 무손상 항체 샘플의 50 ㎕ 분취량을 PNGase F (10 유닛)로 18시간 동안 37℃에서 처리하였다. 1 M DTT를 10 mM의 최종 농도로 무손상 항체 또는 탈글리코실화 항체의 분취량에 첨가함으로써 환원된 항체를 제조하고, 30분 동안 37℃에서 인큐베이션하였다.
3 ㎍의 무손상 또는 탈글리코실화 항체 샘플을 70℃에서 유지된 포로쉘(Poroshell) 300SB-C3 칼럼 (2.1 ㎜ × 75 ㎜, 5 ㎛) (애질런트 테크놀러지즈(Agilent Technologies)) 상에 로딩하였다. 먼저 단백질을 카트리지 상에서 1분 동안 90% 용매 A (0.1% HCOOH), 5% 용매 B (0.1% HCOOH 내의 90% 아세토니트릴)로 헹궜다. 그 후, 26분에 걸친 5-100%의 B의 구배에 이어지는 100% B에서의 3분 재생 및 5% B에서의 10분의 최종 평형 기간을 사용하여 용리를 수행하였다.
환원된 항체에 대해, 3 ㎍ 샘플을 40℃에서 유지된 포로쉘 300SB-C3 칼럼 (2.1 mm × 75 ㎜, 5 ㎛) (애질런트 테크놀러지즈) 상에 로딩하였다. 먼저 단백질을 카트리지 상에서 3분 동안 90% 용매 A, 5% 용매 B로 헹궜다. 그 후, 20분에 걸친 5-80%의 B의 구배에 이어지는 80% B에서의 7분 재생 및 5% B에서의 10분의 최종 평형 기간을 사용하여 용리를 수행하였다.
도 19는 YGLY17351에서 생산된 환원되지 않은 항-Her2 항체의 N-글리코실화 부위 점유가 CHO 세포에서 생산된 환원되지 않은 시판 항-Her2 항체 (헤르셉틴)의 N-글리코실화 부위 점유에 비교된 Q-TOF 분석 결과를 나타낸다. 이러한 도면은 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유가 CHO 세포에서 제조된 항-Her2 항체의 N-글리코실화 부위 점유와 비슷하다는 것을 나타낸다. 이러한 도면은 항체가 균주 YGLY17351에 의해 생산되었을 때, 1개의 N-글리코실화 부위만 점유된 항체의 양이 감소하였고, 두 N-글리코실화 부위 모두가 점유된 항체의 양이 증가하였음을 나타낸다. YGLY17351에서 생산된 항-Her2 항체에 대해 제시된 결과는 표 8에서 제시된 점유 근사값과 일치하였다.
도 20은 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유의 확장성을 나타낸다. N-글리칸 점유의 확장성을 평가하기 위해, 5 ㎖ 내지 40 ℓ 범위의 생물반응기에서 YGLY17351을 시험하였다. 일반적으로, 당-조작 피키아 파스토리스에서의 당단백질의 N-글리코실화 부위 점유는 당단백질을 생산하는데 사용된 공정 조건에 따라 변하는 것으로 관찰되었다. 그러나, LmSTT3D 과다발현 균주는 생물반응기의 규모 및 공정 조건과 관계없이 매우 일관적인 N-글리코실화 부위 점유 (99%)를 나타냈다. 따라서, 본 발명은 소규모 조건 하에 성장된 당-조작 피키아 파스토리스에서의 당단백질의 N-글리코실화 부위 점유가 대규모 조건 하에서 성장될 때 유지되는 방법을 제공한다.
도 21 및 22는 설명적인 목적을 위해 제공된다. 도 21은 CHO 세포에서 생산된 시판 항-Her2 항체 로트 (헤르셉틴)에 대한 CE 및 Q-TOF 분석 결과를 나타낸다. 도 22는 일정 기간 동안 PNGase F로 처리된 후의 동일한 시판 항-Her2 항체 로트에 대한 CE 및 Q-TOF 분석 결과를 나타낸다. PNGase F 처리 후, CE는 비-글리코실화 중쇄의 증가를 나타내고, Q-TOF는 비-글리코실화 항체의 존재를 나타낸다 (도 21 대 도 22 비교).
표 9는 LmSTT3D를 과다발현하지 않는 균주에 비교된 LmSTT3D를 과다발현하는 균주에서 생산된 항-Her2 및 항-RSV 항체의 N-글리칸 조성을 나타낸다. 이러한 도면에서 LmSTT3D 과다발현 균주로부터의 항체의 N-글리칸의 품질이 LmSTT3D를 과다발현하지 않는 균주로부터의 것에 필적한다는 것이 확인된다. 식스포스 (0.5 ℓ 생물반응기)로부터 항체를 생산하였고, 단백질 A로 정제된 항체로부터의 N-글리칸을 2AB 표지로 분석하였다. 전반적으로, LmSTT3D의 과다발현이 항체의 N-글리칸 조성에 유의하게 영향을 미치지 않는 것으로 보였다. 글리코실화 조성은 발효 조건의 함수로서 변할 수 있고, 따라서, 피키아 파스토리스 균주에서 생산된 항체의 글리코실화 조성은 약 50-70 몰% G0, 15-25 몰% G1, 4-12% 몰% G2, 5-17 몰% Man5, 및 3-15 몰% 하이브리드 범위일 수 있다.
표 10은 CHO 세포에서 생산되고 상표명 시나지스(SYNAGIS) 하에 팔리비주맙(palivizumab)으로 판매되는 여러 시판 항-RSV 항체 로트에 비교된 균주 YGLY14401에서 생산된 항-RSV 항체의 글리코실화 패턴의 비교를 나타낸다.
이러한 실시예는 본 발명이 포유동물 발현 시스템 예컨대 CHO 세포에서 생산된 재조합 당단백질의 N-글리코실화 부위 점유에 필적하는 재조합 당단백질의 N-글리코실화 부위 점유를 갖는 피키아 파스토리스에서의 재조합 당단백질 생산을 가능하게 한다는 것을 나타낸다.
실시예
4
리슈마니아 메이저 STT3A 단백질, 리슈마니아 메이저 STT3B 단백질, 및 리슈마니아 메이저 STT3D 단백질은 모두 사카로미세스 세레비지아에에서 STT3 유전자좌의 결실의 치사성 표현형을 억제하는 것으로 나타난 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제의 예이다 (문헌 [Naseb et al., Molec. Biol. Cell 19: 3758-3768 (2008)]). 나셉 등 (동일 문헌)은 리슈마니아 메이저 STT3D 단백질이 사카로미세스 세레비지아에에서 WBP1, OST1, SWP1 또는 OST2 유전자좌의 돌연변이의 치사성 표현형을 억제할 수 있음을 추가로 나타냈다. 문헌 [Hese et al., Glycobiology 19: 160-171 (2009)]는 리슈마니아 메이저 STT3A, STT3B, 및 STT3D 단백질이 WBP1, OST1, SWP1 및 OST2 유전자좌의 돌연변이를 기능적으로 보관할 수 있음을 시사하는 데이터를 제공한다. 기타 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제에는 단일-서브유닛 지아디아 또는 키네토플라스티드 STT3 단백질, 예를 들어, 카에노랍디티스 엘레간스 STT3 단백질, 트리파노소마 브루세이 STT3 단백질, 트리파노소마 크루지 STT3 단백질, 및 톡소플라스마 곤디이 STT3 단백질이 포함되지만, 이에 한정되지는 않는다. 나셉 등이 사카로미세스 세레비지아에 OTase 복합체 내로 혼입되지 않는다고 교시한 리슈마니아 메이저 STT3D 단백질과 대조적으로, 문헌 [Castro et al., Proc. Natl. Acad. Sci. USA 103: 14756-14760 (2006)]에서 트리파노소마 크루지 STT3은 사카로미세스 세레비지아에 OTase 복합체 내로 통합되는 것으로 보인다고 교시되었다.
이러한 실시예에서, 이전의 실시예에서의 숙주 세포와 유사하게 구축된 숙주 세포를 AOX1 프로모터에 작동가능하게 연결된 카에노랍디티스 엘레간스, 트리파노소마 크루지, 및 리슈마니아 메이저 STT3C으로부터의 STT3 단백질을 코딩하는 발현 카세트를 함유하는 플라스미드 벡터로 형질전환시켰다. 피키아 파스토리스 Stt3p을 코딩하는 발현 카세트를 함유하는 벡터가 실험에 포함되었다. 표 11에 제시된 바와 같이, 항-Her2 항체의 발현과 동시에 다양한 STT3 단백질이 발현되는 것이 N-글리코실화 부위 점유에서의 증가를 초래하는 것으로 보이지 않았다. 그러나, 다양한 STT3 단백질이 기질 특이성을 나타낼 수 있다. 예를 들어, 리슈마니아 메이저 STT3A, B, C, 및 D 단백질은 글리코실화 수준에서 기질 특이성 면에서 상이하고, 이는 필수적인 N-X-S/T 부착 부위에 더하여 추가적인 기질 특색이 특정 부착 부위에서의 N-연결 글리코실화에 영향을 미칠 수 있음을 시사한다 ([Naseb et al., 상기 문헌]). 표 9에 제시된 결과는 항-Her2 항체를 기질로 사용하였다. 항체의 각각의 중쇄의 CH2 도메인이 N-연결 글리코실화를 위한 단일 부위를 함유한다: 이는 일반적으로 아스파라긴 잔기 297 (Asn-297)에 있다 (문헌 [Kabat et al., Sequences of proteins of immunological interest, Fifth Ed., U.S. Department of Health and Human Services, NIH Publication No. 91-3242]). 따라서, 표 9에 제시된 결과는 N-글리코실화 부위 점유 %가 사용되는 특정 단일-서브유닛 올리고사카릴트랜스퍼라제의 기질 특이성에 영향을 받을 수 있음을 시사한다.
실시예
5
시알릴화 N-글리칸을 생산할 수 있는 균주를 하기와 같이 구축하였다. 균주를 인간 GM-CSF를 코딩하는 플라스미드 벡터 및 리슈마니아 메이저 STT3D를 코딩하는 플라스미드 벡터로 형질감염시켰다. 균주 구축이 도 23a-23d에서 개략적으로 도해된다. 간략하게, 하기와 같이 균주를 구축하였다.
플라스미드 pGLY2456 (도 24)은 TRP2 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) 마우스 CMP-시알산 수송체 (mCMP-Sia 수송체), (2) 인간 UDP-GlcNAc 2-에피머라제/N-아세틸만노사민 키나제 (hGNE), (3) 피키아 파스토리스 ARG1 유전자 또는 전사 단위, (4) 인간 CMP-시알산 신타제 (hCMP-NANA), (5) 인간 N-아세틸뉴라미네이트-9-포스페이트 신타제 (hSPS), (6) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 KRE2 리더 펩티드 (33)에 융합된 마우스 α-2,6-시알릴트랜스퍼라제 촉매 도메인 (mST6), 및 피키아 파스토리스 ARG1 유전자 또는 전사 단위를 코딩하는 6개의 발현 카세트를 함유하는 KINKO 통합 벡터이다. 마우스 CMP-시알산 수송체를 코딩하는 발현 카세트는 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 mCMP Sia 수송체 ORF 코돈을 코딩하는 핵산 분자 (서열 92)를 포함하고, 이는 피키아 파스토리스 PMA1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 PMA1 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 인간 UDP-GlcNAc 2-에피머라제/N-아세틸만노사민 키나제를 코딩하는 발현 카세트는 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 hGNE ORF를 코딩하는 핵산 분자 (서열 93)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 피키아 파스토리스 ARG1 유전자를 코딩하는 발현 카세트는 (서열 94)을 포함한다. 인간 CMP-시알산 신타제를 코딩하는 발현 카세트는 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 hCSS ORF를 코딩하는 핵산 분자 (서열 95)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 인간 N-아세틸뉴라미네이트-9-포스페이트 신타제를 코딩하는 발현 카세트는 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 hSIAP S ORF를 코딩하는 핵산 분자 (서열 96)를 포함하고, 이는 피키아 파스토리스 PMA1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 PMA1 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 키메라 마우스 α-2,6-시알릴트랜스퍼라제를 코딩하는 발현 카세트는 5' 끝부분에서 사카로미세스 세레비지아에 KRE2 신호 펩티드를 코딩하는 핵산 분자에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 mST6 촉매 도메인을 코딩하는 핵산 분자 (서열 97)를 포함하고, 이는 피키아 파스토리스 TEF 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 TEF 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 일렬의 6개의 카세트에 정지 코돈에서 종결되는 Trp2p 유전자의 5' 영역 및 ORF로부터의 뉴클레오티드 서열 (서열 98)에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, TRP2 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 99)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY2456을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY7961 내로 형질전환시켜, 6개의 발현 카세트가 이중-교차 상동 재조합에 의해 TRP2 ORF에 바로 이어져서 TRP2 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY8146을 선택하였다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY9296을 선택하였다.
플라스미드 pGLY5048 (도 25)은 STE13 유전자좌를 표적으로 하고, (1) N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan) 및 (2) 피키아 파스토리스 URA5 유전자 또는 전사 단위를 코딩하는 발현 카세트들을 함유하는 통합 벡터이다. aMATTrMan을 코딩하는 발현 카세트는 5' 끝부분에서 사카로미세스 세레비지아에 αMATpre 신호 펩티드를 코딩하는 핵산 분자 (서열 13)에 융합된, 트리코더마 레에세이 촉매 도메인을 코딩하는 핵산 분자 (서열 83)를 포함하고, 이는 피키아 파스토리스 AOX1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. URA5 발현 카세트는 lacZ 반복물을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자를 포함한다. 일렬의 2개의 카세트에 STE13 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 100)을 포함하는 핵산 분자가 한쪽 측면에, STE13 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 101)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY5048을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY9296 내로 형질전환시켜 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY9469를 선택하였다. 이러한 균주는 단일-만노스 O-글리코실화를 갖는 당단백질을 생산할 수 있다 (미국 출원 공개 번호 20090170159 참조).
플라스미드 pGLY5019 (도 26)는 DAP2 유전자좌를 표적으로 하고, 노르세오트리신 저항성 (NATR) 발현 카세트 (EROSCARF로부터의 pAG25로부터 유래됨, 사이언티픽 리서치 앤드 디벨롭먼트 게엠베하 (독일 D-61352 바트 홈부르크 다임러스트라쎄 13a), 문헌 [Goldstein et al., Yeast 15: 1541 (1999)] 참조)를 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하는 통합 벡터이다. NATR 발현 카세트 (서열 34)가 아시비아 고시피이 TEF1 프로모터 및 아시비아 고시피이 TEF1 종결 서열에 작동가능하게 연결되고, 여기에 피키아 파스토리스 DAP2 유전자의 5' 뉴클레오티드 서열 (서열 102)이 한쪽 측면에, 피키아 파스토리스 DAP2 유전자의 3' 뉴클레오티드 서열 (서열 103)이 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY5019를 선형화시키고, 선형화된 플라스미드를 균주 YGLY9469 내로 형질전환시켜, NATR 발현 카세트가 이중-교차 상동 재조합에 의해 DAP2 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY9797을 선택하였다.
플라스미드 pGLY5085 (도 27)은 시알릴화 N-글리칸을 생산하는데 수반되는 제2 유전자 세트를 피키아 파스토리스 내로 도입하기 위한 KINKO 플라스미드이다. 피키아 파스토리스 ARG1 유전자가 히그로마이신 저항성을 코딩하는 발현 카세트 (HygR)로 교체되었고 플라스미드가 피키아 파스토리스 TRP5 유전자좌를 표적으로 한다는 것을 제외하고는, 이러한 플라스미드는 플라스미드 YGLY2456과 유사하다. HYGR 저항성 카세트는 서열 104이다. HYGR 발현 카세트 (서열 104)가 아시비아 고시피이 TEF1 프로모터 및 아시비아 고시피이 TEF1 종결 서열에 작동가능하게 연결된다 (문헌 [Goldstein et al., Yeast 15: 1541 (1999)] 참조). 일렬의 6개의 카세트에 정지 코돈에서 끝나는 TRP5 유전자의 5' 영역 및 ORF로부터의 뉴클레오티드 서열 (서열 105)에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, TRP5 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 106)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY5085를 균주 YGLY9797 내로 형질전환시켜 다수의 균주를 생산하였고, 이로부터 균주 YGLY1200을 선택하였다.
피키아 파스토리스 TRP2 유전자좌 (PpTRP2)를 표적으로 하는 플라스미드 pGLY7240 (도 28)은 Kex2 절단 부위를 함유하는 링커를 통해 피키아 파스토리스 CWP1 단백질에 융합된 인간 GM-CSF를 포함하는 융합 단백질을 코딩한다. CWP1 단백질이 후기 골지에서 Kex2 엔도프로테아제(endoprotease)에 의해 GM-CSF로부터 제거되어, 유리 GM-CSF가 발효 상청액 내로 분비된다. 인간 GM-CSF의 아미노산 서열이 서열 108에서 제시되고, 이는 서열 108에 제시된 뉴클레오티드 서열에 의해 코딩된다. 융합 단백질 (서열 109)은 서열 110에 제시된 뉴클레오티드 서열에 의해 코딩된다. CWP1 신호 서열은 아미노산 1-18이고, CWP1 아미노산 서열은 아미노산 19-289이며, GGGSLVKR Kex2 링커 아미노산 서열 (서열 111)은 아미노산 290-297이고, GM-CSF 아미노산 서열은 아미노산 298-424이다. 융합 단백질의 발현이 Pp AOX1 프로모터 및 ScCYC 종결 서열에 작동가능하게 연결된다. 플라스미드 pGLY7240을 균주 YGLY12900 내로 형질전환시켜 다수의 균주를 생산하였고, 이로부터 균주 YGLY15660을 선택하였다. 균주 YGLY15660을 플라스미드 pGLY6301 (리슈마니아 메이저 STT3D를 코딩함)로 형질전환시켜 다수의 균주를 생산하였고, 이로부터 YGLY16349를 선택하였다.
도 29는 LmSTT3D가 비-항체 당단백질인 GM-CSF의 N-글리칸 점유를 또한 개선시켰음을 나타낸다. GM-CSF는 2개의 N-연결 부위를 함유하고, 야생형 피키아에서는 GM-CSF 상의 1개의 N-연결 부위가 우세하게 글리코실화된다. GM-CSF의 N-글리칸 점유에 대한 LmSTT3D의 영향을 연구하기 위해, 메탄올-유도성 LmSTT3D를 GM-CSF 생산 균주인 yGLY15560에서 과다발현시켰다. 마이크로24(Micro24) 생물반응기 (M24)를 사용하여 N-글리칸 점유를 평가하였다. M24로부터의 무세포 상청액을 웨스턴 블롯 및 15% SDS-PAGE를 사용하여 N-글리칸 점유에 대해 분석하였다. GM-CSF 특이적 항체로 검출된 웨스턴 블롯에 나타난 바와 같이, GM-CSF가 1개의 부위로 우세하게 N-글리코실화되고 소수의 부분이 2개의 N 부위 및 비-글리코실화인 대조군 균주 (yGLY15560, 레인 9)와 대조적으로, 대다수의 GM-CSF (레인 2-8)가 2N-연결 부위로 글리코실화된다. 총괄적으로, 이는 LmSTT3D가 다중 N-연결 부위를 보유하는 당단백질의 N-글리칸 점유를 개선시킬 수 있음을 가리킨다.
도 30은 각각 yGLY15560 (a) 및 yGLY16349 (b)로부터 발현된 GM-CSF의 Q-TOP 분석을 나타낸다. 이러한 분석에서 도 29에서 제시된 바와 같이 LmSTT3D의 존재 하에 대다수의 GM-CSF가 2N-연결 부위로 글리코실화된다는 것이 확인된다. 비-글리코실화 GM-CSF가 검출되지 않았다.
LC-ESI-TOF
이러한 연구에서 사용된 고성능 액체 크로마토그래피 (HPLC) 시스템은 자동주입기가 장착된 애질런트 1200, 칼럼-가열 구획 및 210 및 280 nm에서 검출하는 UV 검출기로 구성되었다. 이러한 시스템으로 수행된 모든 LC-MS 실험은 1 ㎖/분으로 러닝되었다. MS 검출을 위해 유속이 분할되지 않았다. 질량 분광측정 분석을 양이온 방식으로 애큐러트-매스 Q-TOF LC/MS 6520 (애질런트 테크놀러지) 상에서 수행하였다. 이중 ESI 소스의 온도를 350℃로 설정하였다. 질소 기체 유속은 콘에 대한 13 ℓ/h 및 350 ℓ/h로 설정하였고, 분무기는 45 psig로 설정하였으며, 이때 4500 볼트가 모세관에 적용되었다. 질량 검정 및 단백질 질량 측정치에 대해 API-TOF 기준 질량 용액 키트에 따라 HP-0921로부터 922.009의 기준 질량이 제조되었다. 300-3000 m/z의 이온 스펙트럼 범위에 대한 데이터를 취득하였고, 애질런트의 매스헌터를 사용하여 프로세싱하였다.
샘플 제조
무손상 항체 샘플 (50 ㎍)을 50 ㎕의 25 mM NH4HCO3, pH 7.8에서 제조하였다. 탈글리코실화 항체에 대해, 무손상 항체 샘플의 50 ㎕ 분취량을 PNGase F (10 유닛)로 18시간 동안 37℃에서 처리하였다. 1 M DTT를 10 mM의 최종 농도로 무손상 항체 또는 탈글리코실화 항체의 분취량에 첨가함으로써 환원된 항체를 제조하고, 30분 동안 37℃에서 인큐베이션하였다.
3 ㎍의 무손상 또는 탈글리코실화 항체 샘플을 70℃에서 유지된 포로쉘 300SB-C3 칼럼 (2.1 ㎜ × 75 ㎜, 5 ㎛) (애질런트 테크놀러지즈) 상에 로딩하였다. 먼저 단백질을 카트리지 상에서 1분 동안 90% 용매 A (0.1% HCOOH), 5% 용매 B (0.1% HCOOH 내의 90% 아세토니트릴)로 헹궜다. 그 후, 26분에 걸친 5-100%의 B의 구배에 이어지는 100% B에서의 3분 재생 및 5% B에서의 10분의 최종 평형 기간을 사용하여 용리를 수행하였다.
환원된 항체에 대해, 3 ㎍ 샘플을 40℃에서 유지된 포로쉘 300SB-C3 칼럼 (2.1 mm × 75 ㎜, 5 ㎛) (애질런트 테크놀러지즈) 상에 로딩하였다. 먼저 단백질을 카트리지 상에서 3분 동안 90% 용매 A, 5% 용매 B로 헹궜다. 그 후, 20분에 걸친 5-80%의 B의 구배에 이어지는 80% B에서의 7분 재생 및 5% B에서의 10분의 최종 평형 기간을 사용하여 용리를 수행하였다.
서열
실시예 1-4에 개시된 균주들 중 일부를 생산하는데 사용된 서열들이 표 12에서 제공된다.
설명된 실시양태들을 참조로 본 발명이 본원에서 기술되었지만, 본 발명이 이에 한정되지 않는다는 것을 이해하여야 한다. 본원의 교시 내용을 입수할 수 있는 당업자는 본 발명의 범주 내의 추가적인 변형 및 실시양태를 인지할 것이다. 따라서, 본 발명은 본원에 첨부된 청구항에 의해서만 제한된다.
SEQUENCE LISTING
<110> SETHURAMAN, Natarajan
CHOI, Byung-Kwon
PRINZ, Bianka
<120> METHOD FOR INCREASING N-GLYCOSYLATION
SITE OCCUPANCY ON THERAPEUTIC GLYCOPROTEINS PRODUCED IN
PICHIA PASTORIS
<130> GFI-MIS-00010
<150> 61/307,642
<151> 2010-02-24
<160> 111
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer PpURA6out/UP
<400> 1
ctgaggagtc agatatcagc tcaatctcca t 31
<210> 2
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer Puc19/LP
<400> 2
tccggctcgt atgttgtgtg gaattgt 27
<210> 3
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer PpURA6out/LP
<400> 3
ctggatgttt gatgggttca gtttcagctg ga 32
<210> 4
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer ScARR3/UP
<400> 4
ggcaatagtc gcgagaatcc ttaaaccat 29
<210> 5
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer PpTRP1-5'out/UP
<400> 5
cctcgtaaag atctgcggtt tgcaaagt 28
<210> 6
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer PpALG3TT/LP
<400> 6
cctcccactg gaaccgatga tatggaa 27
<210> 7
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer PpTEFTT/UP
<400> 7
gatgcgaagt taagtgcgca gaaagtaata tca 33
<210> 8
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer PpTRP-3'1out/LP
<400> 8
cgtgtgtacc ttgaaacgtc aatgatactt tga 33
<210> 9
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer LmSTT3D/iUP
<400> 9
cagactaaga ctgcttctcc acctgctaag 30
<210> 10
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer LmSTT3D/iLP
<400> 10
caacagtaga accagaagcc tcgtaagtac ag 32
<210> 11
<211> 2577
<212> DNA
<213> Leishmania major
<400> 11
atgggtaaaa gaaagggaaa ctccttggga gattctggtt ctgctgctac tgcttccaga 60
gaggcttctg ctcaagctga agatgctgct tcccagacta agactgcttc tccacctgct 120
aaggttatct tgttgccaaa gactttgact gacgagaagg acttcatcgg tatcttccca 180
tttccattct ggccagttca cttcgttttg actgttgttg ctttgttcgt tttggctgct 240
tcctgtttcc aggctttcac tgttagaatg atctccgttc aaatctacgg ttacttgatc 300
cacgaatttg acccatggtt caactacaga gctgctgagt acatgtctac tcacggatgg 360
agtgcttttt tctcctggtt cgattacatg tcctggtatc cattgggtag accagttggt 420
tctactactt acccaggatt gcagttgact gctgttgcta tccatagagc tttggctgct 480
gctggaatgc caatgtcctt gaacaatgtt tgtgttttga tgccagcttg gtttggtgct 540
atcgctactg ctactttggc tttctgtact tacgaggctt ctggttctac tgttgctgct 600
gctgcagctg ctttgtcctt ctccattatc cctgctcact tgatgagatc catggctggt 660
gagttcgaca acgagtgtat tgctgttgct gctatgttgt tgactttcta ctgttgggtt 720
cgttccttga gaactagatc ctcctggcca atcggtgttt tgacaggtgt tgcttacggt 780
tacatggctg ctgcttgggg aggttacatc ttcgttttga acatggttgc tatgcacgct 840
ggtatctctt ctatggttga ctgggctaga aacacttaca acccatcctt gttgagagct 900
tacactttgt tctacgttgt tggtactgct atcgctgttt gtgttccacc agttggaatg 960
tctccattca agtccttgga gcagttggga gctttgttgg ttttggtttt cttgtgtgga 1020
ttgcaagttt gtgaggtttt gagagctaga gctggtgttg aagttagatc cagagctaat 1080
ttcaagatca gagttagagt tttctccgtt atggctggtg ttgctgcttt ggctatctct 1140
gttttggctc caactggtta ctttggtcca ttgtctgtta gagttagagc tttgtttgtt 1200
gagcacacta gaactggtaa cccattggtt gactccgttg ctgaacatca accagcttct 1260
ccagaggcta tgtgggcttt cttgcatgtt tgtggtgtta cttggggatt gggttccatt 1320
gttttggctg tttccacttt cgttcactac tccccatcta aggttttctg gttgttgaac 1380
tccggtgctg tttactactt ctccactaga atggctagat tgttgttgtt gtccggtcca 1440
gctgcttgtt tgtccactgg tatcttcgtt ggtactatct tggaggctgc tgttcaattg 1500
tctttctggg actccgatgc tactaaggct aagaagcagc aaaagcaggc tcaaagacac 1560
caaagaggtg ctggtaaagg ttctggtaga gatgacgcta agaacgctac tactgctaga 1620
gctttctgtg acgttttcgc tggttcttct ttggcttggg gtcacagaat ggttttgtcc 1680
attgctatgt gggctttggt tactactact gctgtttcct tcttctcctc cgaatttgct 1740
tctcactcca ctaagttcgc tgaacaatcc tccaacccaa tgatcgtttt cgctgctgtt 1800
gttcagaaca gagctactgg aaagccaatg aacttgttgg ttgacgacta cttgaaggct 1860
tacgagtggt tgagagactc tactccagag gacgctagag ttttggcttg gtgggactac 1920
ggttaccaaa tcactggtat cggtaacaga acttccttgg ctgatggtaa cacttggaac 1980
cacgagcaca ttgctactat cggaaagatg ttgacttccc cagttgttga agctcactcc 2040
cttgttagac acatggctga ctacgttttg atttgggctg gtcaatctgg tgacttgatg 2100
aagtctccac acatggctag aatcggtaac tctgtttacc acgacatttg tccagatgac 2160
ccattgtgtc agcaattcgg tttccacaga aacgattact ccagaccaac tccaatgatg 2220
agagcttcct tgttgtacaa cttgcacgag gctggaaaaa gaaagggtgt taaggttaac 2280
ccatctttgt tccaagaggt ttactcctcc aagtacggac ttgttagaat cttcaaggtt 2340
atgaacgttt ccgctgagtc taagaagtgg gttgcagacc cagctaacag agtttgtcac 2400
ccacctggtt cttggatttg tcctggtcaa tacccacctg ctaaagaaat ccaagagatg 2460
ttggctcaca gagttccatt cgaccaggtt acaaacgctg acagaaagaa caatgttggt 2520
tcctaccaag aggaatacat gagaagaatg agagagtccg agaacagaag ataatag 2577
<210> 12
<211> 857
<212> PRT
<213> Leishmania major
<400> 12
Met Gly Lys Arg Lys Gly Asn Ser Leu Gly Asp Ser Gly Ser Ala Ala
1 5 10 15
Thr Ala Ser Arg Glu Ala Ser Ala Gln Ala Glu Asp Ala Ala Ser Gln
20 25 30
Thr Lys Thr Ala Ser Pro Pro Ala Lys Val Ile Leu Leu Pro Lys Thr
35 40 45
Leu Thr Asp Glu Lys Asp Phe Ile Gly Ile Phe Pro Phe Pro Phe Trp
50 55 60
Pro Val His Phe Val Leu Thr Val Val Ala Leu Phe Val Leu Ala Ala
65 70 75 80
Ser Cys Phe Gln Ala Phe Thr Val Arg Met Ile Ser Val Gln Ile Tyr
85 90 95
Gly Tyr Leu Ile His Glu Phe Asp Pro Trp Phe Asn Tyr Arg Ala Ala
100 105 110
Glu Tyr Met Ser Thr His Gly Trp Ser Ala Phe Phe Ser Trp Phe Asp
115 120 125
Tyr Met Ser Trp Tyr Pro Leu Gly Arg Pro Val Gly Ser Thr Thr Tyr
130 135 140
Pro Gly Leu Gln Leu Thr Ala Val Ala Ile His Arg Ala Leu Ala Ala
145 150 155 160
Ala Gly Met Pro Met Ser Leu Asn Asn Val Cys Val Leu Met Pro Ala
165 170 175
Trp Phe Gly Ala Ile Ala Thr Ala Thr Leu Ala Phe Cys Thr Tyr Glu
180 185 190
Ala Ser Gly Ser Thr Val Ala Ala Ala Ala Ala Ala Leu Ser Phe Ser
195 200 205
Ile Ile Pro Ala His Leu Met Arg Ser Met Ala Gly Glu Phe Asp Asn
210 215 220
Glu Cys Ile Ala Val Ala Ala Met Leu Leu Thr Phe Tyr Cys Trp Val
225 230 235 240
Arg Ser Leu Arg Thr Arg Ser Ser Trp Pro Ile Gly Val Leu Thr Gly
245 250 255
Val Ala Tyr Gly Tyr Met Ala Ala Ala Trp Gly Gly Tyr Ile Phe Val
260 265 270
Leu Asn Met Val Ala Met His Ala Gly Ile Ser Ser Met Val Asp Trp
275 280 285
Ala Arg Asn Thr Tyr Asn Pro Ser Leu Leu Arg Ala Tyr Thr Leu Phe
290 295 300
Tyr Val Val Gly Thr Ala Ile Ala Val Cys Val Pro Pro Val Gly Met
305 310 315 320
Ser Pro Phe Lys Ser Leu Glu Gln Leu Gly Ala Leu Leu Val Leu Val
325 330 335
Phe Leu Cys Gly Leu Gln Val Cys Glu Val Leu Arg Ala Arg Ala Gly
340 345 350
Val Glu Val Arg Ser Arg Ala Asn Phe Lys Ile Arg Val Arg Val Phe
355 360 365
Ser Val Met Ala Gly Val Ala Ala Leu Ala Ile Ser Val Leu Ala Pro
370 375 380
Thr Gly Tyr Phe Gly Pro Leu Ser Val Arg Val Arg Ala Leu Phe Val
385 390 395 400
Glu His Thr Arg Thr Gly Asn Pro Leu Val Asp Ser Val Ala Glu His
405 410 415
Gln Pro Ala Ser Pro Glu Ala Met Trp Ala Phe Leu His Val Cys Gly
420 425 430
Val Thr Trp Gly Leu Gly Ser Ile Val Leu Ala Val Ser Thr Phe Val
435 440 445
His Tyr Ser Pro Ser Lys Val Phe Trp Leu Leu Asn Ser Gly Ala Val
450 455 460
Tyr Tyr Phe Ser Thr Arg Met Ala Arg Leu Leu Leu Leu Ser Gly Pro
465 470 475 480
Ala Ala Cys Leu Ser Thr Gly Ile Phe Val Gly Thr Ile Leu Glu Ala
485 490 495
Ala Val Gln Leu Ser Phe Trp Asp Ser Asp Ala Thr Lys Ala Lys Lys
500 505 510
Gln Gln Lys Gln Ala Gln Arg His Gln Arg Gly Ala Gly Lys Gly Ser
515 520 525
Gly Arg Asp Asp Ala Lys Asn Ala Thr Thr Ala Arg Ala Phe Cys Asp
530 535 540
Val Phe Ala Gly Ser Ser Leu Ala Trp Gly His Arg Met Val Leu Ser
545 550 555 560
Ile Ala Met Trp Ala Leu Val Thr Thr Thr Ala Val Ser Phe Phe Ser
565 570 575
Ser Glu Phe Ala Ser His Ser Thr Lys Phe Ala Glu Gln Ser Ser Asn
580 585 590
Pro Met Ile Val Phe Ala Ala Val Val Gln Asn Arg Ala Thr Gly Lys
595 600 605
Pro Met Asn Leu Leu Val Asp Asp Tyr Leu Lys Ala Tyr Glu Trp Leu
610 615 620
Arg Asp Ser Thr Pro Glu Asp Ala Arg Val Leu Ala Trp Trp Asp Tyr
625 630 635 640
Gly Tyr Gln Ile Thr Gly Ile Gly Asn Arg Thr Ser Leu Ala Asp Gly
645 650 655
Asn Thr Trp Asn His Glu His Ile Ala Thr Ile Gly Lys Met Leu Thr
660 665 670
Ser Pro Val Val Glu Ala His Ser Leu Val Arg His Met Ala Asp Tyr
675 680 685
Val Leu Ile Trp Ala Gly Gln Ser Gly Asp Leu Met Lys Ser Pro His
690 695 700
Met Ala Arg Ile Gly Asn Ser Val Tyr His Asp Ile Cys Pro Asp Asp
705 710 715 720
Pro Leu Cys Gln Gln Phe Gly Phe His Arg Asn Asp Tyr Ser Arg Pro
725 730 735
Thr Pro Met Met Arg Ala Ser Leu Leu Tyr Asn Leu His Glu Ala Gly
740 745 750
Lys Arg Lys Gly Val Lys Val Asn Pro Ser Leu Phe Gln Glu Val Tyr
755 760 765
Ser Ser Lys Tyr Gly Leu Val Arg Ile Phe Lys Val Met Asn Val Ser
770 775 780
Ala Glu Ser Lys Lys Trp Val Ala Asp Pro Ala Asn Arg Val Cys His
785 790 795 800
Pro Pro Gly Ser Trp Ile Cys Pro Gly Gln Tyr Pro Pro Ala Lys Glu
805 810 815
Ile Gln Glu Met Leu Ala His Arg Val Pro Phe Asp Gln Val Thr Asn
820 825 830
Ala Asp Arg Lys Asn Asn Val Gly Ser Tyr Gln Glu Glu Tyr Met Arg
835 840 845
Arg Met Arg Glu Ser Glu Asn Arg Arg
850 855
<210> 13
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Saccharomyces cerevisiae mating factor pre-signal
peptide (DNA)
<400> 13
atgagattcc catccatctt cactgctgtt ttgttcgctg cttcttctgc tttggct 57
<210> 14
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Saccharomyces cerevisiae mating factor pre-signal
peptide
<400> 14
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala
<210> 15
<211> 1350
<212> DNA
<213> Artificial Sequence
<220>
<223> Anti-Her2 Heavy chain (VH + IgG1 constant region)
(DNA)
<400> 15
gaggttcagt tggttgaatc tggaggagga ttggttcaac ctggtggttc tttgagattg 60
tcctgtgctg cttccggttt caacatcaag gacacttaca tccactgggt tagacaagct 120
ccaggaaagg gattggagtg ggttgctaga atctacccaa ctaacggtta cacaagatac 180
gctgactccg ttaagggaag attcactatc tctgctgaca cttccaagaa cactgcttac 240
ttgcagatga actccttgag agctgaggat actgctgttt actactgttc cagatggggt 300
ggtgatggtt tctacgctat ggactactgg ggtcaaggaa ctttggttac tgtttcctcc 360
gcttctacta agggaccatc tgttttccca ttggctccat cttctaagtc tacttccggt 420
ggtactgctg ctttgggatg tttggttaaa gactacttcc cagagccagt tactgtttct 480
tggaactccg gtgctttgac ttctggtgtt cacactttcc cagctgtttt gcaatcttcc 540
ggtttgtact ctttgtcctc cgttgttact gttccatcct cttccttggg tactcagact 600
tacatctgta acgttaacca caagccatcc aacactaagg ttgacaagaa ggttgagcca 660
aagtcctgtg acaagacaca tacttgtcca ccatgtccag ctccagaatt gttgggtggt 720
ccatccgttt tcttgttccc accaaagcca aaggacactt tgatgatctc cagaactcca 780
gaggttacat gtgttgttgt tgacgtttct cacgaggacc cagaggttaa gttcaactgg 840
tacgttgacg gtgttgaagt tcacaacgct aagactaagc caagagaaga gcagtacaac 900
tccacttaca gagttgtttc cgttttgact gttttgcacc aggactggtt gaacggtaaa 960
gaatacaagt gtaaggtttc caacaaggct ttgccagctc caatcgaaaa gactatctcc 1020
aaggctaagg gtcaaccaag agagccacag gtttacactt tgccaccatc cagagaagag 1080
atgactaaga accaggtttc cttgacttgt ttggttaaag gattctaccc atccgacatt 1140
gctgttgagt gggaatctaa cggtcaacca gagaacaact acaagactac tccaccagtt 1200
ttggattctg atggttcctt cttcttgtac tccaagttga ctgttgacaa gtccagatgg 1260
caacagggta acgttttctc ctgttccgtt atgcatgagg ctttgcacaa ccactacact 1320
caaaagtcct tgtctttgtc ccctggttaa 1350
<210> 16
<211> 449
<212> PRT
<213> Artificial Sequence
<220>
<223> Anti-Her2 Heavy chain (VH + IgG1 constant region)
<400> 16
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr
20 25 30
Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln
100 105 110
Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val
115 120 125
Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala
130 135 140
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
145 150 155 160
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
165 170 175
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
180 185 190
Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys
195 200 205
Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp
210 215 220
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly
225 230 235 240
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
245 250 255
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu
260 265 270
Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
275 280 285
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
290 295 300
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
305 310 315 320
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
325 330 335
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
340 345 350
Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu
355 360 365
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
370 375 380
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
385 390 395 400
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp
405 410 415
Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
420 425 430
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
435 440 445
Gly
<210> 17
<211> 645
<212> DNA
<213> Artificial Sequence
<220>
<223> Anti-Her2 light chain (VL + Kappa constant region)
(DNA)
<400> 17
gacatccaaa tgactcaatc cccatcttct ttgtctgctt ccgttggtga cagagttact 60
atcacttgta gagcttccca ggacgttaat actgctgttg cttggtatca acagaagcca 120
ggaaaggctc caaagttgtt gatctactcc gcttccttct tgtactctgg tgttccatcc 180
agattctctg gttccagatc cggtactgac ttcactttga ctatctcctc cttgcaacca 240
gaagatttcg ctacttacta ctgtcagcag cactacacta ctccaccaac tttcggacag 300
ggtactaagg ttgagatcaa gagaactgtt gctgctccat ccgttttcat tttcccacca 360
tccgacgaac agttgaagtc tggtacagct tccgttgttt gtttgttgaa caacttctac 420
ccaagagagg ctaaggttca gtggaaggtt gacaacgctt tgcaatccgg taactcccaa 480
gaatccgtta ctgagcaaga ctctaaggac tccacttact ccttgtcctc cactttgact 540
ttgtccaagg ctgattacga gaagcacaag gtttacgctt gtgaggttac acatcagggt 600
ttgtcctccc cagttactaa gtccttcaac agaggagagt gttaa 645
<210> 18
<211> 214
<212> PRT
<213> Artificial Sequence
<220>
<223> Anti-Her2 light chain (VL + Kappa constant region)
<400> 18
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala
20 25 30
Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 19
<211> 1350
<212> DNA
<213> Artificial Sequence
<220>
<223> Anti-RSV Heavy chain (VH + IgG1 constant region)
(DNA)
<400> 19
caggttacat tgagagaatc cggtccagct ttggttaagc caactcagac tttgactttg 60
acttgtactt tctccggttt ctccttgtct acttccggaa tgtctgttgg atggatcaga 120
caaccacctg gaaaggcttt ggaatggctt gctgacattt ggtgggatga caagaaggac 180
tacaacccat ccttgaagtc cagattgact atctccaagg acacttccaa gaatcaagtt 240
gttttgaagg ttacaaacat ggacccagct gacactgcta cttactactg tgctagatcc 300
atgatcacta actggtactt cgatgtttgg ggtgctggta ctactgttac tgtctcgagt 360
gcttctacta agggaccatc cgtttttcca ttggctccat cctctaagtc tacttccggt 420
ggaaccgctg ctttgggatg tttggttaaa gactacttcc cagagccagt tactgtttct 480
tggaactccg gtgctttgac ttctggtgtt cacactttcc cagctgtttt gcaatcttcc 540
ggtttgtact ctttgtcctc cgttgttact gttccatcct cttccttggg tactcagact 600
tacatctgta acgttaacca caagccatcc aacactaagg ttgacaagag agttgagcca 660
aagtcctgtg acaagacaca tacttgtcca ccatgtccag ctccagaatt gttgggtggt 720
ccatccgttt tcttgttccc accaaagcca aaggacactt tgatgatctc cagaactcca 780
gaggttacat gtgttgttgt tgacgtttct cacgaggacc cagaggttaa gttcaactgg 840
tacgttgacg gtgttgaagt tcacaacgct aagactaagc caagagaaga gcagtacaac 900
tccacttaca gagttgtttc cgttttgact gttttgcacc aggactggtt gaacggtaaa 960
gaatacaagt gtaaggtttc caacaaggct ttgccagctc caatcgaaaa gactatctcc 1020
aaggctaagg gtcaaccaag agagccacag gtttacactt tgccaccatc cagagaagag 1080
atgactaaga accaggtttc cttgacttgt ttggttaaag gattctaccc atccgacatt 1140
gctgttgagt gggaatctaa cggtcaacca gagaacaact acaagactac tccaccagtt 1200
ttggattctg atggttcctt cttcttgtac tccaagttga ctgttgacaa gtccagatgg 1260
caacagggta acgttttctc ctgttccgtt atgcatgagg ctttgcacaa ccactacact 1320
caaaagtcct tgtctttgtc ccctggttaa 1350
<210> 20
<211> 449
<212> PRT
<213> Artificial Sequence
<220>
<223> Anti-RSV Heavy chain (VH + IgG1 constant region)
<400> 20
Gln Val Thr Leu Arg Glu Ser Gly Pro Ala Leu Val Lys Pro Thr Gln
1 5 10 15
Thr Leu Thr Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu Ser Thr Ser
20 25 30
Gly Met Ser Val Gly Trp Ile Arg Gln Pro Pro Gly Lys Ala Leu Glu
35 40 45
Trp Leu Ala Asp Ile Trp Trp Asp Asp Lys Lys Asp Tyr Asn Pro Ser
50 55 60
Leu Lys Ser Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys Asn Gln Val
65 70 75 80
Val Leu Lys Val Thr Asn Met Asp Pro Ala Asp Thr Ala Thr Tyr Tyr
85 90 95
Cys Ala Arg Ser Met Ile Thr Asn Trp Tyr Phe Asp Val Trp Gly Ala
100 105 110
Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val
115 120 125
Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala
130 135 140
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
145 150 155 160
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
165 170 175
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
180 185 190
Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys
195 200 205
Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp
210 215 220
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly
225 230 235 240
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
245 250 255
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu
260 265 270
Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
275 280 285
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
290 295 300
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
305 310 315 320
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
325 330 335
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
340 345 350
Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu
355 360 365
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
370 375 380
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
385 390 395 400
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp
405 410 415
Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
420 425 430
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
435 440 445
Gly
<210> 21
<211> 699
<212> DNA
<213> Artificial Sequence
<220>
<223> Anti-RSV light chain (VL + Kappa constant region
(DNA)
<400> 21
atgagattcc catccatctt cactgctgtt ttgttcgctg cttcttctgc tttggctgac 60
attcagatga cacagtcccc atctactttg tctgcttccg ttggtgacag agttactatc 120
acttgtaagt gtcagttgtc cgttggttac atgcactggt atcagcaaaa gccaggaaag 180
gctccaaagt tgttgatcta cgacacttcc aagttggctt ccggtgttcc atctagattc 240
tctggttccg gttctggtac tgagttcact ttgactatct cttccttgca accagatgac 300
ttcgctactt actactgttt ccagggttct ggttacccat tcactttcgg tggtggtact 360
aagttggaga tcaagagaac tgttgctgct ccatccgttt tcattttccc accatccgac 420
gaacaattga agtccggtac cgcttccgtt gtttgtttgt tgaacaactt ctacccacgt 480
gaggctaagg ttcagtggaa ggttgacaac gctttgcaat ccggtaactc ccaagaatcc 540
gttactgagc aggattctaa ggattccact tactcattgt cctccacttt gactttgtcc 600
aaggctgatt acgagaagca caaggtttac gcttgcgagg ttacacatca gggtttgtcc 660
tccccagtta ctaagtcctt caacagagga gagtgttaa 699
<210> 22
<211> 213
<212> PRT
<213> Artificial Sequence
<220>
<223> Anti-RSV light chain (VL + Kappa constant region
<400> 22
Asp Ile Gln Met Thr Gln Ser Pro Ser Thr Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Lys Cys Gln Leu Ser Val Gly Tyr Met
20 25 30
His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr
35 40 45
Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser
50 55 60
Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Asp
65 70 75 80
Asp Phe Ala Thr Tyr Tyr Cys Phe Gln Gly Ser Gly Tyr Pro Phe Thr
85 90 95
Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Thr Val Ala Ala Pro
100 105 110
Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr
115 120 125
Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys
130 135 140
Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu
145 150 155 160
Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser
165 170 175
Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala
180 185 190
Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe
195 200 205
Asn Arg Gly Glu Cys
210
<210> 23
<211> 934
<212> DNA
<213> Artificial Sequence
<220>
<223> Pp AOX1 promoter
<400> 23
aacatccaaa gacgaaaggt tgaatgaaac ctttttgcca tccgacatcc acaggtccat 60
tctcacacat aagtgccaaa cgcaacagga ggggatacac tagcagcaga ccgttgcaaa 120
cgcaggacct ccactcctct tctcctcaac acccactttt gccatcgaaa aaccagccca 180
gttattgggc ttgattggag ctcgctcatt ccaattcctt ctattaggct actaacacca 240
tgactttatt agcctgtcta tcctggcccc cctggcgagg ttcatgtttg tttatttccg 300
aatgcaacaa gctccgcatt acacccgaac atcactccag atgagggctt tctgagtgtg 360
gggtcaaata gtttcatgtt ccccaaatgg cccaaaactg acagtttaaa cgctgtcttg 420
gaacctaata tgacaaaagc gtgatctcat ccaagatgaa ctaagtttgg ttcgttgaaa 480
tgctaacggc cagttggtca aaaagaaact tccaaaagtc ggcataccgt ttgtcttgtt 540
tggtattgat tgacgaatgc tcaaaaataa tctcattaat gcttagcgca gtctctctat 600
cgcttctgaa ccccggtgca cctgtgccga aacgcaaatg gggaaacacc cgctttttgg 660
atgattatgc attgtctcca cattgtatgc ttccaagatt ctggtgggaa tactgctgat 720
agcctaacgt tcatgatcaa aatttaactg ttctaacccc tacttgacag caatatataa 780
acagaaggaa gctgccctgt cttaaacctt tttttttatc atcattatta gcttactttc 840
ataattgcga ctggttccaa ttgacaagct tttgatttta acgactttta acgacaactt 900
gagaagatca aaaaacaact aattattcga aacg 934
<210> 24
<211> 293
<212> DNA
<213> Artificial Sequence
<220>
<223> ScCYC TT
<400> 24
acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt acattcacgc 60
cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga agtctaggtc 120
cctatttatt ttttttaata gttatgttag tattaagaac gttatttata tttcaaattt 180
ttcttttttt tctgtacaaa cgcgtgtacg catgtaacat tatactgaaa accttgcttg 240
agaaggtttt gggacgctcg aaggctttaa tttgcaagct gccggctctt aag 293
<210> 25
<211> 600
<212> DNA
<213> Artificial Sequence
<220>
<223> PpRPL10 promoter
<400> 25
gttcttcgct tggtcttgta tctccttaca ctgtatcttc ccatttgcgt ttaggtggtt 60
atcaaaaact aaaaggaaaa atttcagatg tttatctcta aggttttttc tttttacagt 120
ataacacgtg atgcgtcacg tggtactaga ttacgtaagt tattttggtc cggtgggtaa 180
gtgggtaaga atagaaagca tgaaggttta caaaaacgca gtcacgaatt attgctactt 240
cgagcttgga accaccccaa agattatatt gtactgatgc actaccttct cgattttgct 300
cctccaagaa cctacgaaaa acatttcttg agccttttca acctagacta cacatcaagt 360
tatttaaggt atgttccgtt aacatgtaag aaaaggagag gatagatcgt ttatggggta 420
cgtcgcctga ttcaagcgtg accattcgaa gaataggcct tcgaaagctg aataaagcaa 480
atgtcagttg cgattggtat gctgacaaat tagcataaaa agcaatagac tttctaacca 540
cctgtttttt tccttttact ttatttatat tttgccaccg tactaacaag ttcagacaaa 600
<210> 26
<211> 486
<212> DNA
<213> Artificial Sequence
<220>
<223> PpGAPDH promoter
<400> 26
tttttgtaga aatgtcttgg tgtcctcgtc caatcaggta gccatctctg aaatatctgg 60
ctccgttgca actccgaacg acctgctggc aacgtaaaat tctccggggt aaaacttaaa 120
tgtggagtaa tggaaccaga aacgtctctt cccttctctc tccttccacc gcccgttacc 180
gtccctagga aattttactc tgctggagag cttcttctac ggcccccttg cagcaatgct 240
cttcccagca ttacgttgcg ggtaaaacgg aggtcgtgta cccgacctag cagcccaggg 300
atggaaaagt cccggccgtc gctggcaata atagcgggcg gacgcatgtc atgagattat 360
tggaaaccac cagaatcgaa tataaaaggc gaacaccttt cccaattttg gtttctcctg 420
acccaaagac tttaaattta atttatttgt ccctatttca atcaattgaa caactatcaa 480
aacaca 486
<210> 27
<211> 600
<212> DNA
<213> Artificial Sequence
<220>
<223> PpTEF1 promoter
<400> 27
ttaaggtttg gaacaacact aaactacctt gcggtactac cattgacact acacatcctt 60
aattccaatc ctgtctggcc tccttcacct tttaaccatc ttgcccattc caactcgtgt 120
cagattgcgt atcaagtgaa aaaaaaaaaa ttttaaatct ttaacccaat caggtaataa 180
ctgtcgcctc ttttatctgc cgcactgcat gaggtgtccc cttagtggga aagagtactg 240
agccaaccct ggaggacagc aagggaaaaa tacctacaac ttgcttcata atggtcgtaa 300
aaacaatcct tgtcggatat aagtgttgta gactgtccct tatcctctgc gatgttcttc 360
ctctcaaagt ttgcgatttc tctctatcag aattgccatc aagagactca ggactaattt 420
cgcagtccca cacgcactcg tacatgattg gctgaaattt ccctaaagaa tttctttttc 480
acgaaaattt tttttttaca caagattttc agcagatata aaatggagag caggacctcc 540
gctgtgactc ttcttttttt tcttttattc tcactacata cattttagtt attcgccaac 600
<210> 28
<211> 301
<212> DNA
<213> Artificial Sequence
<220>
<223> PpTEF1 TT
<400> 28
attgcttgaa gctttaattt attttattaa cataataata atacaagcat gatatatttg 60
tattttgttc gttaacattg atgttttctt catttactgt tattgtttgt aactttgatc 120
gatttatctt ttctacttta ctgtaatatg gctggcgggt gagccttgaa ctccctgtat 180
tactttacct tgctattact taatctattg actagcagcg acctcttcaa ccgaagggca 240
agtacacagc aagttcatgt ctccgtaagt gtcatcaacc ctggaaacag tgggccatgt 300
c 301
<210> 29
<211> 376
<212> DNA
<213> Artificial Sequence
<220>
<223> PpALG3 TT
<400> 29
atttacaatt agtaatatta aggtggtaaa aacattcgta gaattgaaat gaattaatat 60
agtatgacaa tggttcatgt ctataaatct ccggcttcgg taccttctcc ccaattgaat 120
acattgtcaa aatgaatggt tgaactatta ggttcgccag tttcgttatt aagaaaactg 180
ttaaaatcaa attccatatc atcggttcca gtgggaggac cagttccatc gccaaaatcc 240
tgtaagaatc cattgtcaga acctgtaaag tcagtttgag atgaaatttt tccggtcttt 300
gttgacttgg aagcttcgtt aaggttaggt gaaacagttt gatcaaccag cggctcccgt 360
tttcgtcgct tagtag 376
<210> 30
<211> 672
<212> DNA
<213> Artificial Sequence
<220>
<223> PpTRP1 5' region and ORF
<400> 30
gcggaaacgg cagtaaacaa tggagcttca ttagtgggtg ttattatggt ccctggccgg 60
gaacgaacgg tgaaacaaga ggttgcgagg gaaatttcgc agatggtgcg ggaaaagaga 120
atttcaaagg gctcaaaata cttggattcc agacaactga ggaaagagtg ggacgactgt 180
cctctggaag actggtttga gtacaacgtg aaagaaataa acagcagtgg tccattttta 240
gttggagttt ttcgtaatca aagtatagat gaaatccagc aagctatcca cactcatggt 300
ttggatttcg tccaactaca tgggtctgag gattttgatt cgtatatacg caatatccca 360
gttcctgtga ttaccagata cacagataat gccgtcgatg gtcttaccgg agaagacctc 420
gctataaata gggccctggt gctactggac agcgagcaag gaggtgaagg aaaaaccatc 480
gattgggctc gtgcacaaaa atttggagaa cgtagaggaa aatatttact agccggaggt 540
ttgacacctg ataatgttgc tcatgctcga tctcatactg gctgtattgg tgttgacgtc 600
tctggtgggg tagaaacaaa tgcctcaaaa gatatggaca agatcacaca atttatcaga 660
aacgctacat aa 672
<210> 31
<211> 834
<212> DNA
<213> Artificial Sequence
<220>
<223> PpTRP1 3' region
<400> 31
aagtcaatta aatacacgct tgaaaggaca ttacatagct ttcgatttaa gcagaaccag 60
aaatgtagaa ccacttgtca atagattggt caatcttagc aggagcggct gggctagcag 120
ttggaacagc agaggttgct gaaggtgaga aggatggagt ggattgcaaa gtggtgttgg 180
ttaagtcaat ctcaccaggg ctggttttgc caaaaatcaa cttctcccag gcttcacggc 240
attcttgaat gacctcttct gcatacttct tgttcttgca ttcaccagag aaagcaaact 300
ggttctcagg ttttccatca gggatcttgt aaattctgaa ccattcgttg gtagctctca 360
acaagcccgg catgtgcttt tcaacatcct cgatgtcatt gagcttagga gccaatgggt 420
cgttgatgtc gatgacgatg accttccagt cagtctctcc ctcatccaac aaagccataa 480
caccgaggac cttgacttgc ttgacctgtc cagtgtaacc tacggcttca ccaatttcgc 540
aaacgtccaa tggatcattg tcacccttgg ccttggtctc tggatgagtg acgttagggt 600
cttcccatgt ctgagggaag gcaccgtagt tgtgaatgta tccgtggtga gggaaacagt 660
tacgaacgaa acgaagtttt cccttctttg tgtcctgaag aattgggttc agtttctcct 720
ccttggaaat ctccaacttg gcgttggtcc aacgggggac ttcaacaacc atgttgagaa 780
ccttcttgga ttcgtcagca taaagtggga tgtcgtggaa aggagatacg actt 834
<210> 32
<211> 1215
<212> DNA
<213> Artificial Sequence
<220>
<223> ScARR3 ORF
<400> 32
atgtcagaag atcaaaaaag tgaaaattcc gtaccttcta aggttaatat ggtgaatcgc 60
accgatatac tgactacgat caagtcattg tcatggcttg acttgatgtt gccatttact 120
ataattctct ccataatcat tgcagtaata atttctgtct atgtgccttc ttcccgtcac 180
acttttgacg ctgaaggtca tcccaatcta atgggagtgt ccattccttt gactgttggt 240
atgattgtaa tgatgattcc cccgatctgc aaagtttcct gggagtctat tcacaagtac 300
ttctacagga gctatataag gaagcaacta gccctctcgt tatttttgaa ttgggtcatc 360
ggtcctttgt tgatgacagc attggcgtgg atggcgctat tcgattataa ggaataccgt 420
caaggcatta ttatgatcgg agtagctaga tgcattgcca tggtgctaat ttggaatcag 480
attgctggag gagacaatga tctctgcgtc gtgcttgtta ttacaaactc gcttttacag 540
atggtattat atgcaccatt gcagatattt tactgttatg ttatttctca tgaccacctg 600
aatacttcaa atagggtatt attcgaagag gttgcaaagt ctgtcggagt ttttctcggc 660
ataccactgg gaattggcat tatcatacgt ttgggaagtc ttaccatagc tggtaaaagt 720
aattatgaaa aatacatttt gagatttatt tctccatggg caatgatcgg atttcattac 780
actttatttg ttatttttat tagtagaggt tatcaattta tccacgaaat tggttctgca 840
atattgtgct ttgtcccatt ggtgctttac ttctttattg catggttttt gaccttcgca 900
ttaatgaggt acttatcaat atctaggagt gatacacaaa gagaatgtag ctgtgaccaa 960
gaactacttt taaagagggt ctggggaaga aagtcttgtg aagctagctt ttctattacg 1020
atgacgcaat gtttcactat ggcttcaaat aattttgaac tatccctggc aattgctatt 1080
tccttatatg gtaacaatag caagcaagca atagctgcaa catttgggcc gttgctagaa 1140
gttccaattt tattgatttt ggcaatagtc gcgagaatcc ttaaaccata ttatatatgg 1200
aacaatagaa attaa 1215
<210> 33
<211> 1144
<212> DNA
<213> Artificial Sequence
<220>
<223> URA6 region
<400> 33
caaatgcaag aggacattag aaatgtgttt ggtaagaaca tgaagccgga ggcatacaaa 60
cgattcacag atttgaagga ggaaaacaaa ctgcatccac cggaagtgcc agcagccgtg 120
tatgccaacc ttgctctcaa aggcattcct acggatctga gtgggaaata tctgagattc 180
acagacccac tattggaaca gtaccaaacc tagtttggcc gatccatgat tatgtaatgc 240
atatagtttt tgtcgatgct cacccgtttc gagtctgtct cgtatcgtct tacgtataag 300
ttcaagcatg tttaccaggt ctgttagaaa ctcctttgtg agggcaggac ctattcgtct 360
cggtcccgtt gtttctaaga gactgtacag ccaagcgcag aatggtggca ttaaccataa 420
gaggattctg atcggacttg gtctattggc tattggaacc accctttacg ggacaaccaa 480
ccctaccaag actcctattg catttgtgga accagccacg gaaagagcgt ttaaggacgg 540
agacgtctct gtgatttttg ttctcggagg tccaggagct ggaaaaggta cccaatgtgc 600
caaactagtg agtaattacg gatttgttca cctgtcagct ggagacttgt tacgtgcaga 660
acagaagagg gaggggtcta agtatggaga gatgatttcc cagtatatca gagatggact 720
gatagtacct caagaggtca ccattgcgct cttggagcag gccatgaagg aaaacttcga 780
gaaagggaag acacggttct tgattgatgg attccctcgt aagatggacc aggccaaaac 840
ttttgaggaa aaagtcgcaa agtccaaggt gacacttttc tttgattgtc ccgaatcagt 900
gctccttgag agattactta aaagaggaca gacaagcgga agagaggatg ataatgcgga 960
gagtatcaaa aaaagattca aaacattcgt ggaaacttcg atgcctgtgg tggactattt 1020
cgggaagcaa ggacgcgttt tgaaggtatc ttgtgaccac cctgtggatc aagtgtattc 1080
acaggttgtg tcggtgctaa aagagaaggg gatctttgcc gataacgaga cggagaataa 1140
ataa 1144
<210> 34
<211> 582
<212> DNA
<213> Artificial Sequence
<220>
<223> NatR ORF
<400> 34
atgggtacca ctcttgacga cacggcttac cggtaccgca ccagtgtccc gggggacgcc 60
gaggccatcg aggcactgga tgggtccttc accaccgaca ccgtcttccg cgtcaccgcc 120
accggggacg gcttcaccct gcgggaggtg ccggtggacc cgcccctgac caaggtgttc 180
cccgacgacg aatcggacga cgaatcggac gacggggagg acggcgaccc ggactcccgg 240
acgttcgtcg cgtacgggga cgacggcgac ctggcgggct tcgtggtcgt ctcgtactcc 300
ggctggaacc gccggctgac cgtcgaggac atcgaggtcg ccccggagca ccgggggcac 360
ggggtcgggc gcgcgttgat ggggctcgcg acggagttcg cccgcgagcg gggcgccggg 420
cacctctggc tggaggtcac caacgtcaac gcaccggcga tccacgcgta ccggcggatg 480
gggttcaccc tctgcggcct ggacaccgcc ctgtacgacg gcaccgcctc ggacggcgag 540
caggcgctct acatgagcat gccctgcccc taatcagtac tg 582
<210> 35
<211> 375
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the Sh ble ORF (Zeocin resistance
marker):
<400> 35
atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc 60
gagttctgga ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt 120
gtggtccggg acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac 180
aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag 240
gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag 300
ccgtgggggc gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc 360
gaggagcagg actga 375
<210> 36
<211> 260
<212> DNA
<213> Artificial Sequence
<220>
<223> PpAOX1 TT
<400> 36
tcaagaggat gtcagaatgc catttgcctg agagatgcag gcttcatttt gatacttttt 60
tatttgtaac ctatatagta taggattttt tttgtcattt tgtttcttct cgtacgagct 120
tgctcctgat cagcctatct cgcagctgat gaatatcttg tggtaggggt ttgggaaaat 180
cattcgagtt tgatgttttt cttggtattt cccactcctc ttcagagtac agaagattaa 240
gtgagacgtt cgtttgtgca 260
<210> 37
<211> 427
<212> DNA
<213> Artificial Sequence
<220>
<223> ScTEF1 promoter
<400> 37
gatcccccac acaccatagc ttcaaaatgt ttctactcct tttttactct tccagatttt 60
ctcggactcc gcgcatcgcc gtaccacttc aaaacaccca agcacagcat actaaatttc 120
ccctctttct tcctctaggg tgtcgttaat tacccgtact aaaggtttgg aaaagaaaaa 180
agagaccgcc tcgtttcttt ttcttcgtcg aaaaaggcaa taaaaatttt tatcacgttt 240
ctttttcttg aaaatttttt tttttgattt ttttctcttt cgatgacctc ccattgatat 300
ttaagttaat aaacggtctt caatttctca agtttcagtt tcatttttct tgttctatta 360
caactttttt tacttcttgc tcattagaaa gaaagcatag caatctaatc taagttttaa 420
ttacaaa 427
<210> 38
<211> 3029
<212> DNA
<213> Saccharomyces cerevisiea
<400> 38
aggcctcgca acaacctata attgagttaa gtgcctttcc aagctaaaaa gtttgaggtt 60
ataggggctt agcatccaca cgtcacaatc tcgggtatcg agtatagtat gtagaattac 120
ggcaggaggt ttcccaatga acaaaggaca ggggcacggt gagctgtcga aggtatccat 180
tttatcatgt ttcgtttgta caagcacgac atactaagac atttaccgta tgggagttgt 240
tgtcctagcg tagttctcgc tcccccagca aagctcaaaa aagtacgtca tttagaatag 300
tttgtgagca aattaccagt cggtatgcta cgttagaaag gcccacagta ttcttctacc 360
aaaggcgtgc ctttgttgaa ctcgatccat tatgagggct tccattattc cccgcatttt 420
tattactctg aacaggaata aaaagaaaaa acccagttta ggaaattatc cgggggcgaa 480
gaaatacgcg tagcgttaat cgaccccacg tccagggttt ttccatggag gtttctggaa 540
aaactgacga ggaatgtgat tataaatccc tttatgtgat gtctaagact tttaaggtac 600
gcccgatgtt tgcctattac catcatagag acgtttcttt tcgaggaatg cttaaacgac 660
tttgtttgac aaaaatgttg cctaagggct ctatagtaaa ccatttggaa gaaagatttg 720
acgacttttt ttttttggat ttcgatccta taatccttcc tcctgaaaag aaacatataa 780
atagatatgt attattcttc aaaacattct cttgttcttg tgcttttttt ttaccatata 840
tcttactttt ttttttctct cagagaaaca agcaaaacaa aaagcttttc ttttcactaa 900
cgtatatgat gcttttgcaa gctttccttt tccttttggc tggttttgca gccaaaatat 960
ctgcatcaat gacaaacgaa actagcgata gacctttggt ccacttcaca cccaacaagg 1020
gctggatgaa tgacccaaat gggttgtggt acgatgaaaa agatgccaaa tggcatctgt 1080
actttcaata caacccaaat gacaccgtat ggggtacgcc attgttttgg ggccatgcta 1140
cttccgatga tttgactaat tgggaagatc aacccattgc tatcgctccc aagcgtaacg 1200
attcaggtgc tttctctggc tccatggtgg ttgattacaa caacacgagt gggtttttca 1260
atgatactat tgatccaaga caaagatgcg ttgcgatttg gacttataac actcctgaaa 1320
gtgaagagca atacattagc tattctcttg atggtggtta cacttttact gaataccaaa 1380
agaaccctgt tttagctgcc aactccactc aattcagaga tccaaaggtg ttctggtatg 1440
aaccttctca aaaatggatt atgacggctg ccaaatcaca agactacaaa attgaaattt 1500
actcctctga tgacttgaag tcctggaagc tagaatctgc atttgccaat gaaggtttct 1560
taggctacca atacgaatgt ccaggtttga ttgaagtccc aactgagcaa gatccttcca 1620
aatcttattg ggtcatgttt atttctatca acccaggtgc acctgctggc ggttccttca 1680
accaatattt tgttggatcc ttcaatggta ctcattttga agcgtttgac aatcaatcta 1740
gagtggtaga ttttggtaag gactactatg ccttgcaaac tttcttcaac actgacccaa 1800
cctacggttc agcattaggt attgcctggg cttcaaactg ggagtacagt gcctttgtcc 1860
caactaaccc atggagatca tccatgtctt tggtccgcaa gttttctttg aacactgaat 1920
atcaagctaa tccagagact gaattgatca atttgaaagc cgaaccaata ttgaacatta 1980
gtaatgctgg tccctggtct cgttttgcta ctaacacaac tctaactaag gccaattctt 2040
acaatgtcga tttgagcaac tcgactggta ccctagagtt tgagttggtt tacgctgtta 2100
acaccacaca aaccatatcc aaatccgtct ttgccgactt atcactttgg ttcaagggtt 2160
tagaagatcc tgaagaatat ttgagaatgg gttttgaagt cagtgcttct tccttctttt 2220
tggaccgtgg taactctaag gtcaagtttg tcaaggagaa cccatatttc acaaacagaa 2280
tgtctgtcaa caaccaacca ttcaagtctg agaacgacct aagttactat aaagtgtacg 2340
gcctactgga tcaaaacatc ttggaattgt acttcaacga tggagatgtg gtttctacaa 2400
atacctactt catgaccacc ggtaacgctc taggatctgt gaacatgacc actggtgtcg 2460
ataatttgtt ctacattgac aagttccaag taagggaagt aaaatagagg ttataaaact 2520
tattgtcttt tttatttttt tcaaaagcca ttctaaaggg ctttagctaa cgagtgacga 2580
atgtaaaact ttatgatttc aaagaatacc tccaaaccat tgaaaatgta tttttatttt 2640
tattttctcc cgaccccagt tacctggaat ttgttcttta tgtactttat ataagtataa 2700
ttctcttaaa aatttttact actttgcaat agacatcatt ttttcacgta ataaacccac 2760
aatcgtaatg tagttgcctt acactactag gatggacctt tttgccttta tctgttttgt 2820
tactgacaca atgaaaccgg gtaaagtatt agttatgtga aaatttaaaa gcattaagta 2880
gaagtatacc atattgtaaa aaaaaaaagc gttgtcttct acgtaaaagt gttctcaaaa 2940
agaagtagtg agggaaatgg ataccaagct atctgtaaca ggagctaaaa aatctcaggg 3000
aaaagcttct ggtttgggaa acggtcgac 3029
<210> 39
<211> 898
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
PpURA5:
<400> 39
atcggccttt gttgatgcaa gttttacgtg gatcatggac taaggagttt tatttggacc 60
aagttcatcg tcctagacat tacggaaagg gttctgctcc tctttttgga aactttttgg 120
aacctctgag tatgacagct tggtggattg tacccatggt atggcttcct gtgaatttct 180
attttttcta cattggattc accaatcaaa acaaattagt cgccatggct ttttggcttt 240
tgggtctatt tgtttggacc ttcttggaat atgctttgca tagatttttg ttccacttgg 300
actactatct tccagagaat caaattgcat ttaccattca tttcttattg catgggatac 360
accactattt accaatggat aaatacagat tggtgatgcc acctacactt ttcattgtac 420
tttgctaccc aatcaagacg ctcgtctttt ctgttctacc atattacatg gcttgttctg 480
gatttgcagg tggattcctg ggctatatca tgtatgatgt cactcattac gttctgcatc 540
actccaagct gcctcgttat ttccaagagt tgaagaaata tcatttggaa catcactaca 600
agaattacga gttaggcttt ggtgtcactt ccaaattctg ggacaaagtc tttgggactt 660
atctgggtcc agacgatgtg tatcaaaaga caaattagag tatttataaa gttatgtaag 720
caaatagggg ctaataggga aagaaaaatt ttggttcttt atcagagctg gctcgcgcgc 780
agtgtttttc gtgctccttt gtaatagtca tttttgacta ctgttcagat tgaaatcaca 840
ttgaagatgt cactcgaggg gtaccaaaaa aggtttttgg atgctgcagt ggcttcgc 898
<210> 40
<211> 1060
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
PpURA5:
<400> 40
ggtcttttca acaaagctcc attagtgagt cagctggctg aatcttatgc acaggccatc 60
attaacagca acctggagat agacgttgta tttggaccag cttataaagg tattcctttg 120
gctgctatta ccgtgttgaa gttgtacgag ctcggcggca aaaaatacga aaatgtcgga 180
tatgcgttca atagaaaaga aaagaaagac cacggagaag gtggaagcat cgttggagaa 240
agtctaaaga ataaaagagt actgattatc gatgatgtga tgactgcagg tactgctatc 300
aacgaagcat ttgctataat tggagctgaa ggtgggagag ttgaaggtag tattattgcc 360
ctagatagaa tggagactac aggagatgac tcaaatacca gtgctaccca ggctgttagt 420
cagagatatg gtacccctgt cttgagtata gtgacattgg accatattgt ggcccatttg 480
ggcgaaactt tcacagcaga cgagaaatct caaatggaaa cgtatagaaa aaagtatttg 540
cccaaataag tatgaatctg cttcgaatga atgaattaat ccaattatct tctcaccatt 600
attttcttct gtttcggagc tttgggcacg gcggcgggtg gtgcgggctc aggttccctt 660
tcataaacag atttagtact tggatgctta atagtgaatg gcgaatgcaa aggaacaatt 720
tcgttcatct ttaacccttt cactcggggt acacgttctg gaatgtaccc gccctgttgc 780
aactcaggtg gaccgggcaa ttcttgaact ttctgtaacg ttgttggatg ttcaaccaga 840
aattgtccta ccaactgtat tagtttcctt ttggtcttat attgttcatc gagatacttc 900
ccactctcct tgatagccac tctcactctt cctggattac caaaatcttg aggatgagtc 960
ttttcaggct ccaggatgca aggtatatcc aagtacctgc aagcatctaa tattgtcttt 1020
gccagggggt tctccacacc atactccttt tggcgcatgc 1060
<210> 41
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpURA5 auxotrophic marker
<400> 41
tctagaggga cttatctggg tccagacgat gtgtatcaaa agacaaatta gagtatttat 60
aaagttatgt aagcaaatag gggctaatag ggaaagaaaa attttggttc tttatcagag 120
ctggctcgcg cgcagtgttt ttcgtgctcc tttgtaatag tcatttttga ctactgttca 180
gattgaaatc acattgaaga tgtcactgga ggggtaccaa aaaaggtttt tggatgctgc 240
agtggcttcg caggccttga agtttggaac tttcaccttg aaaagtggaa gacagtctcc 300
atacttcttt aacatgggtc ttttcaacaa agctccatta gtgagtcagc tggctgaatc 360
ttatgctcag gccatcatta acagcaacct ggagatagac gttgtatttg gaccagctta 420
taaaggtatt cctttggctg ctattaccgt gttgaagttg tacgagctgg gcggcaaaaa 480
atacgaaaat gtcggatatg cgttcaatag aaaagaaaag aaagaccacg gagaaggtgg 540
aagcatcgtt ggagaaagtc taaagaataa aagagtactg attatcgatg atgtgatgac 600
tgcaggtact gctatcaacg aagcatttgc tataattgga gctgaaggtg ggagagttga 660
aggttgtatt attgccctag atagaatgga gactacagga gatgactcaa ataccagtgc 720
tacccaggct gttagtcaga gatatggtac ccctgtcttg agtatagtga cattggacca 780
tattgtggcc catttgggcg aaactttcac agcagacgag aaatctcaaa tggaaacgta 840
tagaaaaaag tatttgccca aataagtatg aatctgcttc gaatgaatga attaatccaa 900
ttatcttctc accattattt tcttctgttt cggagctttg ggcacggcgg cggatcc 957
<210> 42
<211> 709
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the part of the Ec lacZ gene that was
used to construct the PpURA5 blaster (recyclable
auxotrophic marker)
<400> 42
cctgcactgg atggtggcgc tggatggtaa gccgctggca agcggtgaag tgcctctgga 60
tgtcgctcca caaggtaaac agttgattga actgcctgaa ctaccgcagc cggagagcgc 120
cgggcaactc tggctcacag tacgcgtagt gcaaccgaac gcgaccgcat ggtcagaagc 180
cgggcacatc agcgcctggc agcagtggcg tctggcggaa aacctcagtg tgacgctccc 240
cgccgcgtcc cacgccatcc cgcatctgac caccagcgaa atggattttt gcatcgagct 300
gggtaataag cgttggcaat ttaaccgcca gtcaggcttt ctttcacaga tgtggattgg 360
cgataaaaaa caactgctga cgccgctgcg cgatcagttc acccgtgcac cgctggataa 420
cgacattggc gtaagtgaag cgacccgcat tgaccctaac gcctgggtcg aacgctggaa 480
ggcggcgggc cattaccagg ccgaagcagc gttgttgcag tgcacggcag atacacttgc 540
tgatgcggtg ctgattacga ccgctcacgc gtggcagcat caggggaaaa ccttatttat 600
cagccggaaa acctaccgga ttgatggtag tggtcaaatg gcgattaccg ttgatgttga 660
agtggcgagc gatacaccgc atccggcgcg gattggcctg aactgccag 709
<210> 43
<211> 2875
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
PpOCH1
<400> 43
aaaacctttt ttcctattca aacacaaggc attgcttcaa cacgtgtgcg tatccttaac 60
acagatactc catacttcta ataatgtgat agacgaatac aaagatgttc actctgtgtt 120
gtgtctacaa gcatttctta ttctgattgg ggatattcta gttacagcac taaacaactg 180
gcgatacaaa cttaaattaa ataatccgaa tctagaaaat gaacttttgg atggtccgcc 240
tgttggttgg ataaatcaat accgattaaa tggattctat tccaatgaga gagtaatcca 300
agacactctg atgtcaataa tcatttgctt gcaacaacaa acccgtcatc taatcaaagg 360
gtttgatgag gcttaccttc aattgcagat aaactcattg ctgtccactg ctgtattatg 420
tgagaatatg ggtgatgaat ctggtcttct ccactcagct aacatggctg tttgggcaaa 480
ggtggtacaa ttatacggag atcaggcaat agtgaaattg ttgaatatgg ctactggacg 540
atgcttcaag gatgtacgtc tagtaggagc cgtgggaaga ttgctggcag aaccagttgg 600
cacgtcgcaa caatccccaa gaaatgaaat aagtgaaaac gtaacgtcaa agacagcaat 660
ggagtcaata ttgataacac cactggcaga gcggttcgta cgtcgttttg gagccgatat 720
gaggctcagc gtgctaacag cacgattgac aagaagactc tcgagtgaca gtaggttgag 780
taaagtattc gcttagattc ccaaccttcg ttttattctt tcgtagacaa agaagctgca 840
tgcgaacata gggacaactt ttataaatcc aattgtcaaa ccaacgtaaa accctctggc 900
accattttca acatatattt gtgaagcagt acgcaatatc gataaatact caccgttgtt 960
tgtaacagcc ccaacttgca tacgccttct aatgacctca aatggataag ccgcagcttg 1020
tgctaacata ccagcagcac cgcccgcggt cagctgcgcc cacacatata aaggcaatct 1080
acgatcatgg gaggaattag ttttgaccgt caggtcttca agagttttga actcttcttc 1140
ttgaactgtg taacctttta aatgacggga tctaaatacg tcatggatga gatcatgtgt 1200
gtaaaaactg actccagcat atggaatcat tccaaagatt gtaggagcga acccacgata 1260
aaagtttccc aaccttgcca aagtgtctaa tgctgtgact tgaaatctgg gttcctcgtt 1320
gaagaccctg cgtactatgc ccaaaaactt tcctccacga gccctattaa cttctctatg 1380
agtttcaaat gccaaacgga cacggattag gtccaatggg taagtgaaaa acacagagca 1440
aaccccagct aatgagccgg ccagtaaccg tcttggagct gtttcataag agtcattagg 1500
gatcaataac gttctaatct gttcataaca tacaaatttt atggctgcat agggaaaaat 1560
tctcaacagg gtagccgaat gaccctgata tagacctgcg acaccatcat acccatagat 1620
ctgcctgaca gccttaaaga gcccgctaaa agacccggaa aaccgagaga actctggatt 1680
agcagtctga aaaagaatct tcactctgtc tagtggagca attaatgtct tagcggcact 1740
tcctgctact ccgccagcta ctcctgaata gatcacatac tgcaaagact gcttgtcgat 1800
gaccttgggg ttatttagct tcaagggcaa tttttgggac attttggaca caggagactc 1860
agaaacagac acagagcgtt ctgagtcctg gtgctcctga cgtaggccta gaacaggaat 1920
tattggcttt atttgtttgt ccatttcata ggcttggggt aatagataga tgacagagaa 1980
atagagaaga cctaatattt tttgttcatg gcaaatcgcg ggttcgcggt cgggtcacac 2040
acggagaagt aatgagaaga gctggtaatc tggggtaaaa gggttcaaaa gaaggtcgcc 2100
tggtagggat gcaatacaag gttgtcttgg agtttacatt gaccagatga tttggctttt 2160
tctctgttca attcacattt ttcagcgaga atcggattga cggagaaatg gcggggtgtg 2220
gggtggatag atggcagaaa tgctcgcaat caccgcgaaa gaaagacttt atggaataga 2280
actactgggt ggtgtaagga ttacatagct agtccaatgg agtccgttgg aaaggtaaga 2340
agaagctaaa accggctaag taactaggga agaatgatca gactttgatt tgatgaggtc 2400
tgaaaatact ctgctgcttt ttcagttgct ttttccctgc aacctatcat tttccttttc 2460
ataagcctgc cttttctgtt ttcacttata tgagttccgc cgagacttcc ccaaattctc 2520
tcctggaaca ttctctatcg ctctccttcc aagttgcgcc ccctggcact gcctagtaat 2580
attaccacgc gacttatatt cagttccaca atttccagtg ttcgtagcaa atatcatcag 2640
ccatggcgaa ggcagatggc agtttgctct actataatcc tcacaatcca cccagaaggt 2700
attacttcta catggctata ttcgccgttt ctgtcatttg cgttttgtac ggaccctcac 2760
aacaattatc atctccaaaa atagactatg atccattgac gctccgatca cttgatttga 2820
agactttgga agctccttca cagttgagtc caggcaccgt agaagataat cttcg 2875
<210> 44
<211> 997
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
PpOCH1
<400> 44
aaagctagag taaaatagat atagcgagat tagagaatga ataccttctt ctaagcgatc 60
gtccgtcatc atagaatatc atggactgta tagttttttt tttgtacata taatgattaa 120
acggtcatcc aacatctcgt tgacagatct ctcagtacgc gaaatccctg actatcaaag 180
caagaaccga tgaagaaaaa aacaacagta acccaaacac cacaacaaac actttatctt 240
ctccccccca acaccaatca tcaaagagat gtcggaacca aacaccaaga agcaaaaact 300
aaccccatat aaaaacatcc tggtagataa tgctggtaac ccgctctcct tccatattct 360
gggctacttc acgaagtctg accggtctca gttgatcaac atgatcctcg aaatgggtgg 420
caagatcgtt ccagacctgc ctcctctggt agatggagtg ttgtttttga caggggatta 480
caagtctatt gatgaagata ccctaaagca actgggggac gttccaatat acagagactc 540
cttcatctac cagtgttttg tgcacaagac atctcttccc attgacactt tccgaattga 600
caagaacgtc gacttggctc aagatttgat caatagggcc cttcaagagt ctgtggatca 660
tgtcacttct gccagcacag ctgcagctgc tgctgttgtt gtcgctacca acggcctgtc 720
ttctaaacca gacgctcgta ctagcaaaat acagttcact cccgaagaag atcgttttat 780
tcttgacttt gttaggagaa atcctaaacg aagaaacaca catcaactgt acactgagct 840
cgctcagcac atgaaaaacc atacgaatca ttctatccgc cacagatttc gtcgtaatct 900
ttccgctcaa cttgattggg tttatgatat cgatccattg accaaccaac ctcgaaaaga 960
tgaaaacggg aactacatca aggtacaagg ccttcca 997
<210> 45
<211> 2159
<212> DNA
<213> Kluyveromyces lactis
<400> 45
aaacgtaacg cctggcactc tattttctca aacttctggg acggaagagc taaatattgt 60
gttgcttgaa caaacccaaa aaaacaaaaa aatgaacaaa ctaaaactac acctaaataa 120
accgtgtgta aaacgtagta ccatattact agaaaagatc acaagtgtat cacacatgtg 180
catctcatat tacatctttt atccaatcca ttctctctat cccgtctgtt cctgtcagat 240
tctttttcca taaaaagaag aagaccccga atctcaccgg tacaatgcaa aactgctgaa 300
aaaaaaagaa agttcactgg atacgggaac agtgccagta ggcttcacca catggacaaa 360
acaattgacg ataaaataag caggtgagct tctttttcaa gtcacgatcc ctttatgtct 420
cagaaacaat atatacaagc taaacccttt tgaaccagtt ctctcttcat agttatgttc 480
acataaattg cgggaacaag actccgctgg ctgtcaggta cacgttgtaa cgttttcgtc 540
cgcccaatta ttagcacaac attggcaaaa agaaaaactg ctcgttttct ctacaggtaa 600
attacaattt ttttcagtaa ttttcgctga aaaatttaaa gggcaggaaa aaaagacgat 660
ctcgactttg catagatgca agaactgtgg tcaaaacttg aaatagtaat tttgctgtgc 720
gtgaactaat aaatatatat atatatatat atatatattt gtgtattttg tatatgtaat 780
tgtgcacgtc ttggctattg gatataagat tttcgcgggt tgatgacata gagcgtgtac 840
tactgtaata gttgtatatt caaaagctgc tgcgtggaga aagactaaaa tagataaaaa 900
gcacacattt tgacttcggt accgtcaact tagtgggaca gtcttttata tttggtgtaa 960
gctcatttct ggtactattc gaaacagaac agtgttttct gtattaccgt ccaatcgttt 1020
gtcatgagtt ttgtattgat tttgtcgtta gtgttcggag gatgttgttc caatgtgatt 1080
agtttcgagc acatggtgca aggcagcaat ataaatttgg gaaatattgt tacattcact 1140
caattcgtgt ctgtgacgct aattcagttg cccaatgctt tggacttctc tcactttccg 1200
tttaggttgc gacctagaca cattcctctt aagatccata tgttagctgt gtttttgttc 1260
tttaccagtt cagtcgccaa taacagtgtg tttaaatttg acatttccgt tccgattcat 1320
attatcatta gattttcagg taccactttg acgatgataa taggttgggc tgtttgtaat 1380
aagaggtact ccaaacttca ggtgcaatct gccatcatta tgacgcttgg tgcgattgtc 1440
gcatcattat accgtgacaa agaattttca atggacagtt taaagttgaa tacggattca 1500
gtgggtatga cccaaaaatc tatgtttggt atctttgttg tgctagtggc cactgccttg 1560
atgtcattgt tgtcgttgct caacgaatgg acgtataaca agtacgggaa acattggaaa 1620
gaaactttgt tctattcgca tttcttggct ctaccgttgt ttatgttggg gtacacaagg 1680
ctcagagacg aattcagaga cctcttaatt tcctcagact caatggatat tcctattgtt 1740
aaattaccaa ttgctacgaa acttttcatg ctaatagcaa ataacgtgac ccagttcatt 1800
tgtatcaaag gtgttaacat gctagctagt aacacggatg ctttgacact ttctgtcgtg 1860
cttctagtgc gtaaatttgt tagtctttta ctcagtgtct acatctacaa gaacgtccta 1920
tccgtgactg catacctagg gaccatcacc gtgttcctgg gagctggttt gtattcatat 1980
ggttcggtca aaactgcact gcctcgctga aacaatccac gtctgtatga tactcgtttc 2040
agaatttttt tgattttctg ccggatatgg tttctcatct ttacaatcgc attcttaatt 2100
ataccagaac gtaattcaat gatcccagtg actcgtaact cttatatgtc aatttaagc 2159
<210> 46
<211> 870
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
PpBMT2
<400> 46
ggccgagcgg gcctagattt tcactacaaa tttcaaaact acgcggattt attgtctcag 60
agagcaattt ggcatttctg agcgtagcag gaggcttcat aagattgtat aggaccgtac 120
caacaaattg ccgaggcaca acacggtatg ctgtgcactt atgtggctac ttccctacaa 180
cggaatgaaa ccttcctctt tccgcttaaa cgagaaagtg tgtcgcaatt gaatgcaggt 240
gcctgtgcgc cttggtgtat tgtttttgag ggcccaattt atcaggcgcc ttttttcttg 300
gttgttttcc cttagcctca agcaaggttg gtctatttca tctccgcttc tataccgtgc 360
ctgatactgt tggatgagaa cacgactcaa cttcctgctg ctctgtattg ccagtgtttt 420
gtctgtgatt tggatcggag tcctccttac ttggaatgat aataatcttg gcggaatctc 480
cctaaacgga ggcaaggatt ctgcctatga tgatctgcta tcattgggaa gcttcaacga 540
catggaggtc gactcctatg tcaccaacat ctacgacaat gctccagtgc taggatgtac 600
ggatttgtct tatcatggat tgttgaaagt caccccaaag catgacttag cttgcgattt 660
ggagttcata agagctcaga ttttggacat tgacgtttac tccgccataa aagacttaga 720
agataaagcc ttgactgtaa aacaaaaggt tgaaaaacac tggtttacgt tttatggtag 780
ttcagtcttt ctgcccgaac acgatgtgca ttacctggtt agacgagtca tcttttcggc 840
tgaaggaaag gcgaactctc cagtaacatc 870
<210> 47
<211> 1733
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
PpBMT2
<400> 47
ccatatgatg ggtgtttgct cactcgtatg gatcaaaatt ccatggtttc ttctgtacaa 60
cttgtacact tatttggact tttctaacgg tttttctggt gatttgagaa gtccttattt 120
tggtgttcgc agcttatccg tgattgaacc atcagaaata ctgcagctcg ttatctagtt 180
tcagaatgtg ttgtagaata caatcaattc tgagtctagt ttgggtgggt cttggcgacg 240
ggaccgttat atgcatctat gcagtgttaa ggtacataga atgaaaatgt aggggttaat 300
cgaaagcatc gttaatttca gtagaacgta gttctattcc ctacccaaat aatttgccaa 360
gaatgcttcg tatccacata cgcagtggac gtagcaaatt tcactttgga ctgtgacctc 420
aagtcgttat cttctacttg gacattgatg gtcattacgt aatccacaaa gaattggata 480
gcctctcgtt ttatctagtg cacagcctaa tagcacttaa gtaagagcaa tggacaaatt 540
tgcatagaca ttgagctaga tacgtaactc agatcttgtt cactcatggt gtactcgaag 600
tactgctgga accgttacct cttatcattt cgctactggc tcgtgaaact actggatgaa 660
aaaaaaaaaa gagctgaaag cgagatcatc ccattttgtc atcatacaaa ttcacgcttg 720
cagttttgct tcgttaacaa gacaagatgt ctttatcaaa gacccgtttt ttcttcttga 780
agaatacttc cctgttgagc acatgcaaac catatttatc tcagatttca ctcaacttgg 840
gtgcttccaa gagaagtaaa attcttccca ctgcatcaac ttccaagaaa cccgtagacc 900
agtttctctt cagccaaaag aagttgctcg ccgatcaccg cggtaacaga ggagtcagaa 960
ggtttcacac ccttccatcc cgatttcaaa gtcaaagtgc tgcgttgaac caaggttttc 1020
aggttgccaa agcccagtct gcaaaaacta gttccaaatg gcctattaat tcccataaaa 1080
gtgttggcta cgtatgtatc ggtacctcca ttctggtatt tgctattgtt gtcgttggtg 1140
ggttgactag actgaccgaa tccggtcttt ccataacgga gtggaaacct atcactggtt 1200
cggttccccc actgactgag gaagactgga agttggaatt tgaaaaatac aaacaaagcc 1260
ctgagtttca ggaactaaat tctcacataa cattggaaga gttcaagttt atattttcca 1320
tggaatgggg acatagattg ttgggaaggg tcatcggcct gtcgtttgtt cttcccacgt 1380
tttacttcat tgcccgtcga aagtgttcca aagatgttgc attgaaactg cttgcaatat 1440
gctctatgat aggattccaa ggtttcatcg gctggtggat ggtgtattcc ggattggaca 1500
aacagcaatt ggctgaacgt aactccaaac caactgtgtc tccatatcgc ttaactaccc 1560
atcttggaac tgcatttgtt atttactgtt acatgattta cacagggctt caagttttga 1620
agaactataa gatcatgaaa cagcctgaag cgtatgttca aattttcaag caaattgcgt 1680
ctccaaaatt gaaaactttc aagagactct cttcagttct attaggcctg gtg 1733
<210> 48
<211> 981
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes MmSLC35A3 UDP-GlcNAc transporter
<400> 48
atgtctgcca acctaaaata tctttccttg ggaattttgg tgtttcagac taccagtctg 60
gttctaacga tgcggtattc taggacttta aaagaggagg ggcctcgtta tctgtcttct 120
acagcagtgg ttgtggctga atttttgaag ataatggcct gcatcttttt agtctacaaa 180
gacagtaagt gtagtgtgag agcactgaat agagtactgc atgatgaaat tcttaataag 240
cccatggaaa ccctgaagct cgctatcccg tcagggatat atactcttca gaacaactta 300
ctctatgtgg cactgtcaaa cctagatgca gccacttacc aggttacata tcagttgaaa 360
atacttacaa cagcattatt ttctgtgtct atgcttggta aaaaattagg tgtgtaccag 420
tggctctccc tagtaattct gatggcagga gttgcttttg tacagtggcc ttcagattct 480
caagagctga actctaagga cctttcaaca ggctcacagt ttgtaggcct catggcagtt 540
ctcacagcct gtttttcaag tggctttgct ggagtttatt ttgagaaaat cttaaaagaa 600
acaaaacagt cagtatggat aaggaacatt caacttggtt tctttggaag tatatttgga 660
ttaatgggtg tatacgttta tgatggagaa ttggtctcaa agaatggatt ttttcaggga 720
tataatcaac tgacgtggat agttgttgct ctgcaggcac ttggaggcct tgtaatagct 780
gctgtcatca aatatgcaga taacatttta aaaggatttg cgacctcctt atccataata 840
ttgtcaacaa taatatctta tttttggttg caagattttg tgccaaccag tgtctttttc 900
cttggagcca tccttgtaat agcagctact ttcttgtatg gttacgatcc caaacctgca 960
ggaaatccca ctaaagcata g 981
<210> 49
<211> 1128
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
PpMNN4L1
<400> 49
gatctggcca ttgtgaaact tgacactaaa gacaaaactc ttagagtttc caatcactta 60
ggagacgatg tttcctacaa cgagtacgat ccctcattga tcatgagcaa tttgtatgtg 120
aaaaaagtca tcgaccttga caccttggat aaaagggctg gaggaggtgg aaccacctgt 180
gcaggcggtc tgaaagtgtt caagtacgga tctactacca aatatacatc tggtaacctg 240
aacggcgtca ggttagtata ctggaacgaa ggaaagttgc aaagctccaa atttgtggtt 300
cgatcctcta attactctca aaagcttgga ggaaacagca acgccgaatc aattgacaac 360
aatggtgtgg gttttgcctc agctggagac tcaggcgcat ggattctttc caagctacaa 420
gatgttaggg agtaccagtc attcactgaa aagctaggtg aagctacgat gagcattttc 480
gatttccacg gtcttaaaca ggagacttct actacagggc ttggggtagt tggtatgatt 540
cattcttacg acggtgagtt caaacagttt ggtttgttca ctccaatgac atctattcta 600
caaagacttc aacgagtgac caatgtagaa tggtgtgtag cgggttgcga agatggggat 660
gtggacactg aaggagaaca cgaattgagt gatttggaac aactgcatat gcatagtgat 720
tccgactagt caggcaagag agagccctca aatttacctc tctgcccctc ctcactcctt 780
ttggtacgca taattgcagt ataaagaact tgctgccagc cagtaatctt atttcatacg 840
cagttctata tagcacataa tcttgcttgt atgtatgaaa tttaccgcgt tttagttgaa 900
attgtttatg ttgtgtgcct tgcatgaaat ctctcgttag ccctatcctt acatttaact 960
ggtctcaaaa cctctaccaa ttccattgct gtacaacaat atgaggcggc attactgtag 1020
ggttggaaaa aaattgtcat tccagctaga gatcacacga cttcatcacg cttattgctc 1080
ctcattgcta aatcatttac tcttgacttc gacccagaaa agttcgcc 1128
<210> 50
<211> 1231
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
PpMNN4L1
<400> 50
gcatgtcaaa cttgaacaca acgactagat agttgttttt tctatataaa acgaaacgtt 60
atcatcttta ataatcattg aggtttaccc ttatagttcc gtattttcgt ttccaaactt 120
agtaatcttt tggaaatatc atcaaagctg gtgccaatct tcttgtttga agtttcaaac 180
tgctccacca agctacttag agactgttct aggtctgaag caacttcgaa cacagagaca 240
gctgccgccg attgttcttt tttgtgtttt tcttctggaa gaggggcatc atcttgtatg 300
tccaatgccc gtatcctttc tgagttgtcc gacacattgt ccttcgaaga gtttcctgac 360
attgggcttc ttctatccgt gtattaattt tgggttaagt tcctcgtttg catagcagtg 420
gatacctcga tttttttggc tcctatttac ctgacataat attctactat aatccaactt 480
ggacgcgtca tctatgataa ctaggctctc ctttgttcaa aggggacgtc ttcataatcc 540
actggcacga agtaagtctg caacgaggcg gcttttgcaa cagaacgata gtgtcgtttc 600
gtacttggac tatgctaaac aaaaggatct gtcaaacatt tcaaccgtgt ttcaaggcac 660
tctttacgaa ttatcgacca agaccttcct agacgaacat ttcaacatat ccaggctact 720
gcttcaaggt ggtgcaaatg ataaaggtat agatattaga tgtgtttggg acctaaaaca 780
gttcttgcct gaagattccc ttgagcaaca ggcttcaata gccaagttag agaagcagta 840
ccaaatcggt aacaaaaggg ggaagcatat aaaaccttta ctattgcgac aaaatccatc 900
cttgaaagta aagctgtttg ttcaatgtaa agcatacgaa acgaaggagg tagatcctaa 960
gatggttaga gaacttaacg ggacatactc cagctgcatc ccatattacg atcgctggaa 1020
gacttttttc atgtacgtat cgcccaccaa cctttcaaag caagctaggt atgattttga 1080
cagttctcac aatccattgg ttttcatgca acttgaaaaa acccaactca aacttcatgg 1140
ggatccatac aatgtaaatc attacgagag ggcgaggttg aaaagtttcc attgcaatca 1200
cgtcgcatca tggctactga aaggccttaa c 1231
<210> 51
<211> 937
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
PpPNO1 and PpMNN4
<400> 51
tcattctata tgttcaagaa aagggtagtg aaaggaaaga aaaggcatat aggcgaggga 60
gagttagcta gcatacaaga taatgaagga tcaatagcgg tagttaaagt gcacaagaaa 120
agagcacctg ttgaggctga tgataaagct ccaattacat tgccacagag aaacacagta 180
acagaaatag gaggggatgc accacgagaa gagcattcag tgaacaactt tgccaaattc 240
ataaccccaa gcgctaataa gccaatgtca aagtcggcta ctaacattaa tagtacaaca 300
actatcgatt ttcaaccaga tgtttgcaag gactacaaac agacaggtta ctgcggatat 360
ggtgacactt gtaagttttt gcacctgagg gatgatttca aacagggatg gaaattagat 420
agggagtggg aaaatgtcca aaagaagaag cataatactc tcaaaggggt taaggagatc 480
caaatgttta atgaagatga gctcaaagat atcccgttta aatgcattat atgcaaagga 540
gattacaaat cacccgtgaa aacttcttgc aatcattatt tttgcgaaca atgtttcctg 600
caacggtcaa gaagaaaacc aaattgtatt atatgtggca gagacacttt aggagttgct 660
ttaccagcaa agaagttgtc ccaatttctg gctaagatac ataataatga aagtaataaa 720
gtttagtaat tgcattgcgt tgactattga ttgcattgat gtcgtgtgat actttcaccg 780
aaaaaaaaca cgaagcgcaa taggagcggt tgcatattag tccccaaagc tatttaattg 840
tgcctgaaac tgttttttaa gctcatcaag cataattgta tgcattgcga cgtaaccaac 900
gtttaggcgc agtttaatca tagcccactg ctaagcc 937
<210> 52
<211> 1906
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
PpPNO1 and PpMNN4
<400> 52
cggaggaatg caaataataa tctccttaat tacccactga taagctcaag agacgcggtt 60
tgaaaacgat ataatgaatc atttggattt tataataaac cctgacagtt tttccactgt 120
attgttttaa cactcattgg aagctgtatt gattctaaga agctagaaat caatacggcc 180
atacaaaaga tgacattgaa taagcaccgg cttttttgat tagcatatac cttaaagcat 240
gcattcatgg ctacatagtt gttaaagggc ttcttccatt atcagtataa tgaattacat 300
aatcatgcac ttatatttgc ccatctctgt tctctcactc ttgcctgggt atattctatg 360
aaattgcgta tagcgtgtct ccagttgaac cccaagcttg gcgagtttga agagaatgct 420
aaccttgcgt attccttgct tcaggaaaca ttcaaggaga aacaggtcaa gaagccaaac 480
attttgatcc ttcccgagtt agcattgact ggctacaatt ttcaaagcca gcagcggata 540
gagccttttt tggaggaaac aaccaaggga gctagtaccc aatgggctca aaaagtatcc 600
aagacgtggg attgctttac tttaatagga tacccagaaa aaagtttaga gagccctccc 660
cgtatttaca acagtgcggt acttgtatcg cctcagggaa aagtaatgaa caactacaga 720
aagtccttct tgtatgaagc tgatgaacat tggggatgtt cggaatcttc tgatgggttt 780
caaacagtag atttattaat tgaaggaaag actgtaaaga catcatttgg aatttgcatg 840
gatttgaatc cttataaatt tgaagctcca ttcacagact tcgagttcag tggccattgc 900
ttgaaaaccg gtacaagact cattttgtgc ccaatggcct ggttgtcccc tctatcgcct 960
tccattaaaa aggatcttag tgatatagag aaaagcagac ttcaaaagtt ctaccttgaa 1020
aaaatagata ccccggaatt tgacgttaat tacgaattga aaaaagatga agtattgccc 1080
acccgtatga atgaaacgtt ggaaacaatt gactttgagc cttcaaaacc ggactactct 1140
aatataaatt attggatact aaggtttttt ccctttctga ctcatgtcta taaacgagat 1200
gtgctcaaag agaatgcagt tgcagtctta tgcaaccgag ttggcattga gagtgatgtc 1260
ttgtacggag gatcaaccac gattctaaac ttcaatggta agttagcatc gacacaagag 1320
gagctggagt tgtacgggca gactaatagt ctcaacccca gtgtggaagt attgggggcc 1380
cttggcatgg gtcaacaggg aattctagta cgagacattg aattaacata atatacaata 1440
tacaataaac acaaataaag aatacaagcc tgacaaaaat tcacaaatta ttgcctagac 1500
ttgtcgttat cagcagcgac ctttttccaa tgctcaattt cacgatatgc cttttctagc 1560
tctgctttaa gcttctcatt ggaattggct aactcgttga ctgcttggtc agtgatgagt 1620
ttctccaagg tccatttctc gatgttgttg ttttcgtttt cctttaatct cttgatataa 1680
tcaacagcct tctttaatat ctgagccttg ttcgagtccc ctgttggcaa cagagcggcc 1740
agttccttta ttccgtggtt tatattttct cttctacgcc tttctacttc tttgtgattc 1800
tctttacgca tcttatgcca ttcttcagaa ccagtggctg gcttaaccga atagccagag 1860
cctgaagaag ccgcactaga agaagcagtg gcattgttga ctatgg 1906
<210> 53
<211> 1224
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes human GnTI
catalytic domain (NA) Codon-optimized
<400> 53
tcagtcagtg ctcttgatgg tgacccagca agtttgacca gagaagtgat tagattggcc 60
caagacgcag aggtggagtt ggagagacaa cgtggactgc tgcagcaaat cggagatgca 120
ttgtctagtc aaagaggtag ggtgcctacc gcagctcctc cagcacagcc tagagtgcat 180
gtgacccctg caccagctgt gattcctatc ttggtcatcg cctgtgacag atctactgtt 240
agaagatgtc tggacaagct gttgcattac agaccatctg ctgagttgtt ccctatcatc 300
gttagtcaag actgtggtca cgaggagact gcccaagcca tcgcctccta cggatctgct 360
gtcactcaca tcagacagcc tgacctgtca tctattgctg tgccaccaga ccacagaaag 420
ttccaaggtt actacaagat cgctagacac tacagatggg cattgggtca agtcttcaga 480
cagtttagat tccctgctgc tgtggtggtg gaggatgact tggaggtggc tcctgacttc 540
tttgagtact ttagagcaac ctatccattg ctgaaggcag acccatccct gtggtgtgtc 600
tctgcctgga atgacaacgg taaggagcaa atggtggacg cttctaggcc tgagctgttg 660
tacagaaccg acttctttcc tggtctggga tggttgctgt tggctgagtt gtgggctgag 720
ttggagccta agtggccaaa ggcattctgg gacgactgga tgagaagacc tgagcaaaga 780
cagggtagag cctgtatcag acctgagatc tcaagaacca tgacctttgg tagaaaggga 840
gtgtctcacg gtcaattctt tgaccaacac ttgaagttta tcaagctgaa ccagcaattt 900
gtgcacttca cccaactgga cctgtcttac ttgcagagag aggcctatga cagagatttc 960
ctagctagag tctacggagc tcctcaactg caagtggaga aagtgaggac caatgacaga 1020
aaggagttgg gagaggtgag agtgcagtac actggtaggg actcctttaa ggctttcgct 1080
aaggctctgg gtgtcatgga tgaccttaag tctggagttc ctagagctgg ttacagaggt 1140
attgtcacct ttcaattcag aggtagaaga gtccacttgg ctcctccacc tacttgggag 1200
ggttatgatc cttcttggaa ttag 1224
<210> 54
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes Pp SEC12 (10)
<400> 54
atgcccagaa aaatatttaa ctacttcatt ttgactgtat tcatggcaat tcttgctatt 60
gttttacaat ggtctataga gaatggacat gggcgcgcc 99
<210> 55
<211> 435
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpSEC4 promoter
<400> 55
gaagtaaagt tggcgaaact ttgggaacct ttggttaaaa ctttgtaatt tttgtcgcta 60
cccattaggc agaatctgca tcttgggagg gggatgtggt ggcgttctga gatgtacgcg 120
aagaatgaag agccagtggt aacaacaggc ctagagagat acgggcataa tgggtataac 180
ctacaagtta agaatgtagc agccctggaa accagattga aacgaaaaac gaaatcattt 240
aaactgtagg atgttttggc tcattgtctg gaaggctggc tgtttattgc cctgttcttt 300
gcatgggaat aagctattat atccctcaca taatcccaga aaatagattg aagcaacgcg 360
aaatccttac gtatcgaagt agccttctta cacattcacg ttgtacggat aagaaaacta 420
ctcaaacgaa caatc 435
<210> 56
<211> 404
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpOCH1 terminator
<400> 56
aatagatata gcgagattag agaatgaata ccttcttcta agcgatcgtc cgtcatcata 60
gaatatcatg gactgtatag tttttttttt gtacatataa tgattaaacg gtcatccaac 120
atctcgttga cagatctctc agtacgcgaa atccctgact atcaaagcaa gaaccgatga 180
agaaaaaaac aacagtaacc caaacaccac aacaaacact ttatcttctc ccccccaaca 240
ccaatcatca aagagatgtc ggaacacaaa caccaagaag caaaaactaa ccccatataa 300
aaacatcctg gtagataatg ctggtaaccc gctctccttc catattctgg gctacttcac 360
gaagtctgac cggtctcagt tgatcaacat gatcctcgaa atgg 404
<210> 57
<211> 1407
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes Mm ManI catalytic domain (FB)
<400> 57
gagcccgctg acgccaccat ccgtgagaag agggcaaaga tcaaagagat gatgacccat 60
gcttggaata attataaacg ctatgcgtgg ggcttgaacg aactgaaacc tatatcaaaa 120
gaaggccatt caagcagttt gtttggcaac atcaaaggag ctacaatagt agatgccctg 180
gatacccttt tcattatggg catgaagact gaatttcaag aagctaaatc gtggattaaa 240
aaatatttag attttaatgt gaatgctgaa gtttctgttt ttgaagtcaa catacgcttc 300
gtcggtggac tgctgtcagc ctactatttg tccggagagg agatatttcg aaagaaagca 360
gtggaacttg gggtaaaatt gctacctgca tttcatactc cctctggaat accttgggca 420
ttgctgaata tgaaaagtgg gatcgggcgg aactggccct gggcctctgg aggcagcagt 480
atcctggccg aatttggaac tctgcattta gagtttatgc acttgtccca cttatcagga 540
gacccagtct ttgccgaaaa ggttatgaaa attcgaacag tgttgaacaa actggacaaa 600
ccagaaggcc tttatcctaa ctatctgaac cccagtagtg gacagtgggg tcaacatcat 660
gtgtcggttg gaggacttgg agacagcttt tatgaatatt tgcttaaggc gtggttaatg 720
tctgacaaga cagatctcga agccaagaag atgtattttg atgctgttca ggccatcgag 780
actcacttga tccgcaagtc aagtggggga ctaacgtaca tcgcagagtg gaaggggggc 840
ctcctggaac acaagatggg ccacctgacg tgctttgcag gaggcatgtt tgcacttggg 900
gcagatggag ctccggaagc ccgggcccaa cactaccttg aactcggagc tgaaattgcc 960
cgcacttgtc atgaatctta taatcgtaca tatgtgaagt tgggaccgga agcgtttcga 1020
tttgatggcg gtgtggaagc tattgccacg aggcaaaatg aaaagtatta catcttacgg 1080
cccgaggtca tcgagacata catgtacatg tggcgactga ctcacgaccc caagtacagg 1140
acctgggcct gggaagccgt ggaggctcta gaaagtcact gcagagtgaa cggaggctac 1200
tcaggcttac gggatgttta cattgcccgt gagagttatg acgatgtcca gcaaagtttc 1260
ttcctggcag agacactgaa gtatttgtac ttgatatttt ccgatgatga ccttcttcca 1320
ctagaacact ggatcttcaa caccgaggct catcctttcc ctatactccg tgaacagaag 1380
aaggaaattg atggcaaaga gaaatga 1407
<210> 58
<211> 318
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes ScSEC12 (8)
<400> 58
atgaacacta tccacataat aaaattaccg cttaactacg ccaactacac ctcaatgaaa 60
caaaaaatct ctaaattttt caccaacttc atccttattg tgctgctttc ttacatttta 120
cagttctcct ataagcacaa tttgcattcc atgcttttca attacgcgaa ggacaatttt 180
ctaacgaaaa gagacaccat ctcttcgccc tacgtagttg atgaagactt acatcaaaca 240
actttgtttg gcaaccacgg tacaaaaaca tctgtaccta gcgtagattc cataaaagtg 300
catggcgtgg ggcgcgcc 318
<210> 59
<211> 1250
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-region that was used to knock
into the PpADE1 locus
<400> 59
gagtcggcca agagatgata actgttacta agcttctccg taattagtgg tattttgtaa 60
cttttaccaa taatcgttta tgaatacgga tatttttcga ccttatccag tgccaaatca 120
cgtaacttaa tcatggttta aatactccac ttgaacgatt cattattcag aaaaaagtca 180
ggttggcaga aacacttggg cgctttgaag agtataagag tattaagcat taaacatctg 240
aactttcacc gccccaatat actactctag gaaactcgaa aaattccttt ccatgtgtca 300
tcgcttccaa cacactttgc tgtatccttc caagtatgtc cattgtgaac actgatctgg 360
acggaatcct acctttaatc gccaaaggaa aggttagaga catttatgca gtcgatgaga 420
acaacttgct gttcgtcgca actgaccgta tctccgctta cgatgtgatt atgacaaacg 480
gtattcctga taagggaaag attttgactc agctctcagt tttctggttt gattttttgg 540
caccctacat aaagaatcat ttggttgctt ctaatgacaa ggaagtcttt gctttactac 600
catcaaaact gtctgaagaa aaatacaaat ctcaattaga gggacgatcc ttgatagtaa 660
aaaagcacag actgatacct ttggaagcca ttgtcagagg ttacatcact ggaagtgcat 720
ggaaagagta caagaactca aaaactgtcc atggagtcaa ggttgaaaac gagaaccttc 780
aagagagcga cgcctttcca actccgattt tcacaccttc aacgaaagct gaacagggtg 840
aacacgatga aaacatctct attgaacaag ctgctgagat tgtaggtaaa gacatttgtg 900
agaaggtcgc tgtcaaggcg gtcgagttgt attctgctgc aaaaaacctc gcccttttga 960
aggggatcat tattgctgat acgaaattcg aatttggact ggacgaaaac aatgaattgg 1020
tactagtaga tgaagtttta actccagatt cttctagatt ttggaatcaa aagacttacc 1080
aagtgggtaa atcgcaagag agttacgata agcagtttct cagagattgg ttgacggcca 1140
acggattgaa tggcaaagag ggcgtagcca tggatgcaga aattgctatc aagagtaaag 1200
aaaagtatat tgaagcttat gaagcaatta ctggcaagaa atgggcttga 1250
<210> 60
<211> 882
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-region that was used to knock
into the PpADE1 locus
<400> 60
atgattagta ccctcctcgc ctttttcaga catctgaaat ttcccttatt cttccaattc 60
catataaaat cctatttagg taattagtaa acaatgatca taaagtgaaa tcattcaagt 120
aaccattccg tttatcgttg atttaaaatc aataacgaat gaatgtcggt ctgagtagtc 180
aatttgttgc cttggagctc attggcaggg ggtcttttgg ctcagtatgg aaggttgaaa 240
ggaaaacaga tggaaagtgg ttcgtcagaa aagaggtatc ctacatgaag atgaatgcca 300
aagagatatc tcaagtgata gctgagttca gaattcttag tgagttaagc catcccaaca 360
ttgtgaagta ccttcatcac gaacatattt ctgagaataa aactgtcaat ttatacatgg 420
aatactgtga tggtggagat ctctccaagc tgattcgaac acatagaagg aacaaagagt 480
acatttcaga agaaaaaata tggagtattt ttacgcaggt tttattagca ttgtatcgtt 540
gtcattatgg aactgatttc acggcttcaa aggagtttga atcgctcaat aaaggtaata 600
gacgaaccca gaatccttcg tgggtagact cgacaagagt tattattcac agggatataa 660
aacccgacaa catctttctg atgaacaatt caaaccttgt caaactggga gattttggat 720
tagcaaaaat tctggaccaa gaaaacgatt ttgccaaaac atacgtcggt acgccgtatt 780
acatgtctcc tgaagtgctg ttggaccaac cctactcacc attatgtgat atatggtctc 840
ttgggtgcgt catgtatgag ctatgtgcat tgaggcctcc tt 882
<210> 61
<211> 2100
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes ScGAL10
<400> 61
atgacagctc agttacaaag tgaaagtact tctaaaattg ttttggttac aggtggtgct 60
ggatacattg gttcacacac tgtggtagag ctaattgaga atggatatga ctgtgttgtt 120
gctgataacc tgtcgaattc aacttatgat tctgtagcca ggttagaggt cttgaccaag 180
catcacattc ccttctatga ggttgatttg tgtgaccgaa aaggtctgga aaaggttttc 240
aaagaatata aaattgattc ggtaattcac tttgctggtt taaaggctgt aggtgaatct 300
acacaaatcc cgctgagata ctatcacaat aacattttgg gaactgtcgt tttattagag 360
ttaatgcaac aatacaacgt ttccaaattt gttttttcat cttctgctac tgtctatggt 420
gatgctacga gattcccaaa tatgattcct atcccagaag aatgtccctt agggcctact 480
aatccgtatg gtcatacgaa atacgccatt gagaatatct tgaatgatct ttacaatagc 540
gacaaaaaaa gttggaagtt tgctatcttg cgttatttta acccaattgg cgcacatccc 600
tctggattaa tcggagaaga tccgctaggt ataccaaaca atttgttgcc atatatggct 660
caagtagctg ttggtaggcg cgagaagctt tacatcttcg gagacgatta tgattccaga 720
gatggtaccc cgatcaggga ttatatccac gtagttgatc tagcaaaagg tcatattgca 780
gccctgcaat acctagaggc ctacaatgaa aatgaaggtt tgtgtcgtga gtggaacttg 840
ggttccggta aaggttctac agtttttgaa gtttatcatg cattctgcaa agcttctggt 900
attgatcttc catacaaagt tacgggcaga agagcaggtg atgttttgaa cttgacggct 960
aaaccagata gggccaaacg cgaactgaaa tggcagaccg agttgcaggt tgaagactcc 1020
tgcaaggatt tatggaaatg gactactgag aatccttttg gttaccagtt aaggggtgtc 1080
gaggccagat tttccgctga agatatgcgt tatgacgcaa gatttgtgac tattggtgcc 1140
ggcaccagat ttcaagccac gtttgccaat ttgggcgcca gcattgttga cctgaaagtg 1200
aacggacaat cagttgttct tggctatgaa aatgaggaag ggtatttgaa tcctgatagt 1260
gcttatatag gcgccacgat cggcaggtat gctaatcgta tttcgaaggg taagtttagt 1320
ttatgcaaca aagactatca gttaaccgtt aataacggcg ttaatgcgaa tcatagtagt 1380
atcggttctt tccacagaaa aagatttttg ggacccatca ttcaaaatcc ttcaaaggat 1440
gtttttaccg ccgagtacat gctgatagat aatgagaagg acaccgaatt tccaggtgat 1500
ctattggtaa ccatacagta tactgtgaac gttgcccaaa aaagtttgga aatggtatat 1560
aaaggtaaat tgactgctgg tgaagcgacg ccaataaatt taacaaatca tagttatttc 1620
aatctgaaca agccatatgg agacactatt gagggtacgg agattatggt gcgttcaaaa 1680
aaatctgttg atgtcgacaa aaacatgatt cctacgggta atatcgtcga tagagaaatt 1740
gctaccttta actctacaaa gccaacggtc ttaggcccca aaaatcccca gtttgattgt 1800
tgttttgtgg tggatgaaaa tgctaagcca agtcaaatca atactctaaa caatgaattg 1860
acgcttattg tcaaggcttt tcatcccgat tccaatatta cattagaagt tttaagtaca 1920
gagccaactt atcaatttta taccggtgat ttcttgtctg ctggttacga agcaagacaa 1980
ggttttgcaa ttgagcctgg tagatacatt gatgctatca atcaagagaa ctggaaagat 2040
tgtgtaacct tgaaaaacgg tgaaacttac gggtccaaga ttgtctacag attttcctga 2100
<210> 62
<211> 512
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpPMA1 terminator
<400> 62
taagcttcac gatttgtgtt ccagtttatc ccccctttat ataccgttaa ccctttccct 60
gttgagctga ctgttgttgt attaccgcaa tttttccaag tttgccatgc ttttcgtgtt 120
atttgaccga tgtctttttt cccaaatcaa actatatttg ttaccattta aaccaagtta 180
tcttttgtat taagagtcta agtttgttcc caggcttcat gtgagagtga taaccatcca 240
gactatgatt cttgtttttt attgggtttg tttgtgtgat acatctgagt tgtgattcgt 300
aaagtatgtc agtctatcta gatttttaat agttaattgg taatcaatga cttgtttgtt 360
ttaactttta aattgtgggt cgtatccacg cgtttagtat agctgttcat ggctgttaga 420
ggagggcgat gtttatatac agaggacaag aatgaggagg cggcgtgtat ttttaaaatg 480
gagacgcgac tcctgtacac cttatcggtt gg 512
<210> 63
<211> 1068
<212> DNA
<213> Artificial Sequence
<220>
<223> hGalT codon optimized (XB)
<400> 63
ggtagagatt tgtctagatt gccacagttg gttggtgttt ccactccatt gcaaggaggt 60
tctaactctg ctgctgctat tggtcaatct tccggtgagt tgagaactgg tggagctaga 120
ccacctccac cattgggagc ttcctctcaa ccaagaccag gtggtgattc ttctccagtt 180
gttgactctg gtccaggtcc agcttctaac ttgacttccg ttccagttcc acacactact 240
gctttgtcct tgccagcttg tccagaagaa tccccattgt tggttggtcc aatgttgatc 300
gagttcaaca tgccagttga cttggagttg gttgctaagc agaacccaaa cgttaagatg 360
ggtggtagat acgctccaag agactgtgtt tccccacaca aagttgctat catcatccca 420
ttcagaaaca gacaggagca cttgaagtac tggttgtact acttgcaccc agttttgcaa 480
agacagcagt tggactacgg tatctacgtt atcaaccagg ctggtgacac tattttcaac 540
agagctaagt tgttgaatgt tggtttccag gaggctttga aggattacga ctacacttgt 600
ttcgttttct ccgacgttga cttgattcca atgaacgacc acaacgctta cagatgtttc 660
tcccagccaa gacacatttc tgttgctatg gacaagttcg gtttctcctt gccatacgtt 720
caatacttcg gtggtgtttc cgctttgtcc aagcagcagt tcttgactat caacggtttc 780
ccaaacaatt actggggatg gggtggtgaa gatgacgaca tctttaacag attggttttc 840
agaggaatgt ccatctctag accaaacgct gttgttggta gatgtagaat gatcagacac 900
tccagagaca agaagaacga gccaaaccca caaagattcg acagaatcgc tcacactaag 960
gaaactatgt tgtccgacgg attgaactcc ttgacttacc aggttttgga cgttcagaga 1020
tacccattgt acactcagat cactgttgac atcggtactc catcctag 1068
<210> 64
<211> 183
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes ScMnt1 (Kre2) (33)
<400> 64
atggccctct ttctcagtaa gagactgttg agatttaccg tcattgcagg tgcggttatt 60
gttctcctcc taacattgaa ttccaacagt agaactcagc aatatattcc gagttccatc 120
tccgctgcat ttgattttac ctcaggatct atatcccctg aacaacaagt catcgggcgc 180
gcc 183
<210> 65
<211> 1074
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes DmUGT
<400> 65
atgaatagca tacacatgaa cgccaatacg ctgaagtaca tcagcctgct gacgctgacc 60
ctgcagaatg ccatcctggg cctcagcatg cgctacgccc gcacccggcc aggcgacatc 120
ttcctcagct ccacggccgt actcatggca gagttcgcca aactgatcac gtgcctgttc 180
ctggtcttca acgaggaggg caaggatgcc cagaagtttg tacgctcgct gcacaagacc 240
atcattgcga atcccatgga cacgctgaag gtgtgcgtcc cctcgctggt ctatatcgtt 300
caaaacaatc tgctgtacgt ctctgcctcc catttggatg cggccaccta ccaggtgacg 360
taccagctga agattctcac cacggccatg ttcgcggttg tcattctgcg ccgcaagctg 420
ctgaacacgc agtggggtgc gctgctgctc ctggtgatgg gcatcgtcct ggtgcagttg 480
gcccaaacgg agggtccgac gagtggctca gccggtggtg ccgcagctgc agccacggcc 540
gcctcctctg gcggtgctcc cgagcagaac aggatgctcg gactgtgggc cgcactgggc 600
gcctgcttcc tctccggatt cgcgggcatc tactttgaga agatcctcaa gggtgccgag 660
atctccgtgt ggatgcggaa tgtgcagttg agtctgctca gcattccctt cggcctgctc 720
acctgtttcg ttaacgacgg cagtaggatc ttcgaccagg gattcttcaa gggctacgat 780
ctgtttgtct ggtacctggt cctgctgcag gccggcggtg gattgatcgt tgccgtggtg 840
gtcaagtacg cggataacat tctcaagggc ttcgccacct cgctggccat catcatctcg 900
tgcgtggcct ccatatacat cttcgacttc aatctcacgc tgcagttcag cttcggagct 960
ggcctggtca tcgcctccat atttctctac ggctacgatc cggccaggtc ggcgccgaag 1020
ccaactatgc atggtcctgg cggcgatgag gagaagctgc tgccgcgcgt ctag 1074
<210> 66
<211> 798
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpOCH1 promoter
<400> 66
tggacacagg agactcagaa acagacacag agcgttctga gtcctggtgc tcctgacgta 60
ggcctagaac aggaattatt ggctttattt gtttgtccat ttcataggct tggggtaata 120
gatagatgac agagaaatag agaagaccta atattttttg ttcatggcaa atcgcgggtt 180
cgcggtcggg tcacacacgg agaagtaatg agaagagctg gtaatctggg gtaaaagggt 240
tcaaaagaag gtcgcctggt agggatgcaa tacaaggttg tcttggagtt tacattgacc 300
agatgatttg gctttttctc tgttcaattc acatttttca gcgagaatcg gattgacgga 360
gaaatggcgg ggtgtggggt ggatagatgg cagaaatgct cgcaatcacc gcgaaagaaa 420
gactttatgg aatagaacta ctgggtggtg taaggattac atagctagtc caatggagtc 480
cgttggaaag gtaagaagaa gctaaaaccg gctaagtaac tagggaagaa tgatcagact 540
ttgatttgat gaggtctgaa aatactctgc tgctttttca gttgcttttt ccctgcaacc 600
tatcattttc cttttcataa gcctgccttt tctgttttca cttatatgag ttccgccgag 660
acttccccaa attctctcct ggaacattct ctatcgctct ccttccaagt tgcgccccct 720
ggcactgcct agtaatatta ccacgcgact tatattcagt tccacaattt ccagtgttcg 780
tagcaaatat catcagcc 798
<210> 67
<211> 302
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpALG12 terminator
<400> 67
aatatatacc tcatttgttc aatttggtgt aaagagtgtg gcggatagac ttcttgtaaa 60
tcaggaaagc tacaattcca attgctgcaa aaaataccaa tgcccataaa ccagtatgag 120
cggtgccttc gacggattgc ttactttccg accctttgtc gtttgattct tctgcctttg 180
gtgagtcagt ttgtttcgac tttatatctg actcatcaac ttcctttacg gttgcgtttt 240
taatcataat tttagccgtt ggcttattat cccttgagtt ggtaggagtt ttgatgatgc 300
tg 302
<210> 68
<211> 461
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
PpHIS1
<400> 68
taactggccc tttgacgttt ctgacaatag ttctagagga gtcgtccaaa aactcaactc 60
tgacttgggt gacaccacca cgggatccgg ttcttccgag gaccttgatg accttggcta 120
atgtaactgg agttttagta tccattttaa gatgtgtgtt tctgtaggtt ctgggttgga 180
aaaaaatttt agacaccaga agagaggagt gaactggttt gcgtgggttt agactgtgta 240
aggcactact ctgtcgaagt tttagatagg ggttacccgc tccgatgcat gggaagcgat 300
tagcccggct gttgcccgtt tggtttttga agggtaattt tcaatatctc tgtttgagtc 360
atcaatttca tattcaaaga ttcaaaaaca aaatctggtc caaggagcgc atttaggatt 420
atggagttgg cgaatcactt gaacgataga ctattatttg c 461
<210> 69
<211> 1841
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
PpHIS1
<400> 69
gtgacattct tgtctttgag atcagtaatt gtagagcata gatagaataa tattcaagac 60
caacggcttc tcttcggaag ctccaagtag cttatagtga tgagtaccgg catatattta 120
taggcttaaa atttcgaggg ttcactatat tcgtttagtg ggaagagttc ctttcactct 180
tgttatctat attgtcagcg tggactgttt ataactgtac caacttagtt tctttcaact 240
ccaggttaag agacataaat gtcctttgat gctgacaata atcagtggaa ttcaaggaag 300
gacaatcccg acctcaatct gttcattaat gaagagttcg aatcgtcctt aaatcaagcg 360
ctagactcaa ttgtcaatga gaaccctttc tttgaccaag aaactataaa tagatcgaat 420
gacaaagttg gaaatgagtc cattagctta catgatattg agcaggcaga ccaaaataaa 480
ccgtcctttg agagcgatat tgatggttcg gcgccgttga taagagacga caaattgcca 540
aagaaacaaa gctgggggct gagcaatttt ttttcaagaa gaaatagcat atgtttacca 600
ctacatgaaa atgattcaag tgttgttaag accgaaagat ctattgcagt gggaacaccc 660
catcttcaat actgcttcaa tggaatctcc aatgccaagt acaatgcatt tacctttttc 720
ccagtcatcc tatacgagca attcaaattt tttttcaatt tatactttac tttagtggct 780
ctctctcaag cgataccgca acttcgcatt ggatatcttt cttcgtatgt cgtcccactt 840
ttgtttgtac tcatagtgac catgtcaaaa gaggcgatgg atgatattca acgccgaaga 900
agggatagag aacagaacaa tgaaccatat gaggttctgt ccagcccatc accagttttg 960
tccaaaaact taaaatgtgg tcacttggtt cgattgcata agggaatgag agtgcccgca 1020
gatatggttc ttgtccagtc aagcgaatcc accggagagt catttatcaa gacagatcag 1080
ctggatggtg agactgattg gaagcttcgg attgtttctc cagttacaca atcgttacca 1140
atgactgaac ttcaaaatgt cgccatcact gcaagcgcac cctcaaaatc aattcactcc 1200
tttcttggaa gattgaccta caatgggcaa tcatatggtc ttacgataga caacacaatg 1260
tggtgtaata ctgtattagc ttctggttca gcaattggtt gtataattta cacaggtaaa 1320
gatactcgac aatcgatgaa cacaactcag cccaaactga aaacgggctt gttagaactg 1380
gaaatcaata gtttgtccaa gatcttatgt gtttgtgtgt ttgcattatc tgtcatctta 1440
gtgctattcc aaggaatagc tgatgattgg tacgtcgata tcatgcggtt tctcattcta 1500
ttctccacta ttatcccagt gtctctgaga gttaaccttg atcttggaaa gtcagtccat 1560
gctcatcaaa tagaaactga tagctcaata cctgaaaccg ttgttagaac tagtacaata 1620
ccggaagacc tgggaagaat tgaataccta ttaagtgaca aaactggaac tcttactcaa 1680
aatgatatgg aaatgaaaaa actacaccta ggaacagtct cttatgctgg tgataccatg 1740
gatattattt ctgatcatgt taaaggtctt aataacgcta aaacatcgag gaaagatctt 1800
ggtatgagaa taagagattt ggttacaact ctggccatct g 1841
<210> 70
<211> 3105
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes Drosophila melanogaster ManII
codon-optimized (KD)
<400> 70
agagacgatc caattagacc tccattgaag gttgctagat ccccaagacc aggtcaatgt 60
caagatgttg ttcaggacgt cccaaacgtt gatgtccaga tgttggagtt gtacgataga 120
atgtccttca aggacattga tggtggtgtt tggaagcagg gttggaacat taagtacgat 180
ccattgaagt acaacgctca tcacaagttg aaggtcttcg ttgtcccaca ctcccacaac 240
gatcctggtt ggattcagac cttcgaggaa tactaccagc acgacaccaa gcacatcttg 300
tccaacgctt tgagacattt gcacgacaac ccagagatga agttcatctg ggctgaaatc 360
tcctacttcg ctagattcta ccacgatttg ggtgagaaca agaagttgca gatgaagtcc 420
atcgtcaaga acggtcagtt ggaattcgtc actggtggat gggtcatgcc agacgaggct 480
aactcccact ggagaaacgt tttgttgcag ttgaccgaag gtcaaacttg gttgaagcaa 540
ttcatgaacg tcactccaac tgcttcctgg gctatcgatc cattcggaca ctctccaact 600
atgccataca ttttgcagaa gtctggtttc aagaatatgt tgatccagag aacccactac 660
tccgttaaga aggagttggc tcaacagaga cagttggagt tcttgtggag acagatctgg 720
gacaacaaag gtgacactgc tttgttcacc cacatgatgc cattctactc ttacgacatt 780
cctcatacct gtggtccaga tccaaaggtt tgttgtcagt tcgatttcaa aagaatgggt 840
tccttcggtt tgtcttgtcc atggaaggtt ccacctagaa ctatctctga tcaaaatgtt 900
gctgctagat ccgatttgtt ggttgatcag tggaagaaga aggctgagtt gtacagaacc 960
aacgtcttgt tgattccatt gggtgacgac ttcagattca agcagaacac cgagtgggat 1020
gttcagagag tcaactacga aagattgttc gaacacatca actctcaggc tcacttcaat 1080
gtccaggctc agttcggtac tttgcaggaa tacttcgatg ctgttcacca ggctgaaaga 1140
gctggacaag ctgagttccc aaccttgtct ggtgacttct tcacttacgc tgatagatct 1200
gataactact ggtctggtta ctacacttcc agaccatacc ataagagaat ggacagagtc 1260
ttgatgcact acgttagagc tgctgaaatg ttgtccgctt ggcactcctg ggacggtatg 1320
gctagaatcg aggaaagatt ggagcaggct agaagagagt tgtccttgtt ccagcaccac 1380
gacggtatta ctggtactgc taaaactcac gttgtcgtcg actacgagca aagaatgcag 1440
gaagctttga aagcttgtca aatggtcatg caacagtctg tctacagatt gttgactaag 1500
ccatccatct actctccaga cttctccttc tcctacttca ctttggacga ctccagatgg 1560
ccaggttctg gtgttgagga ctctagaact accatcatct tgggtgagga tatcttgcca 1620
tccaagcatg ttgtcatgca caacaccttg ccacactgga gagagcagtt ggttgacttc 1680
tacgtctcct ctccattcgt ttctgttacc gacttggcta acaatccagt tgaggctcag 1740
gtttctccag tttggtcttg gcaccacgac actttgacta agactatcca cccacaaggt 1800
tccaccacca agtacagaat catcttcaag gctagagttc caccaatggg tttggctacc 1860
tacgttttga ccatctccga ttccaagcca gagcacacct cctacgcttc caatttgttg 1920
cttagaaaga acccaacttc cttgccattg ggtcaatacc cagaggatgt caagttcggt 1980
gatccaagag agatctcctt gagagttggt aacggtccaa ccttggcttt ctctgagcag 2040
ggtttgttga agtccattca gttgactcag gattctccac atgttccagt tcacttcaag 2100
ttcttgaagt acggtgttag atctcatggt gatagatctg gtgcttactt gttcttgcca 2160
aatggtccag cttctccagt cgagttgggt cagccagttg tcttggtcac taagggtaaa 2220
ttggagtctt ccgtttctgt tggtttgcca tctgtcgttc accagaccat catgagaggt 2280
ggtgctccag agattagaaa tttggtcgat attggttctt tggacaacac tgagatcgtc 2340
atgagattgg agactcatat cgactctggt gatatcttct acactgattt gaatggattg 2400
caattcatca agaggagaag attggacaag ttgccattgc aggctaacta ctacccaatt 2460
ccatctggta tgttcattga ggatgctaat accagattga ctttgttgac cggtcaacca 2520
ttgggtggat cttctttggc ttctggtgag ttggagatta tgcaagatag aagattggct 2580
tctgatgatg aaagaggttt gggtcagggt gttttggaca acaagccagt tttgcatatt 2640
tacagattgg tcttggagaa ggttaacaac tgtgtcagac catctaagtt gcatccagct 2700
ggttacttga cttctgctgc tcacaaagct tctcagtctt tgttggatcc attggacaag 2760
ttcatcttcg ctgaaaatga gtggatcggt gctcagggtc aattcggtgg tgatcatcca 2820
tctgctagag aggatttgga tgtctctgtc atgagaagat tgaccaagtc ttctgctaaa 2880
acccagagag ttggttacgt tttgcacaga accaatttga tgcaatgtgg tactccagag 2940
gagcatactc agaagttgga tgtctgtcac ttgttgccaa atgttgctag atgtgagaga 3000
actaccttga ctttcttgca gaatttggag cacttggatg gtatggttgc tccagaagtt 3060
tgtccaatgg aaaccgctgc ttacgtctct tctcactctt cttga 3105
<210> 71
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes Mnn2 leader (53)
<400> 71
atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60
tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcg 108
<210> 72
<211> 1729
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpHIS1 auxotrophic marker
<400> 72
caagttgcgt ccggtatacg taacgtctca cgatgatcaa agataatact taatcttcat 60
ggtctactga ataactcatt taaacaattg actaattgta cattatattg aacttatgca 120
tcctattaac gtaatcttct ggcttctctc tcagactcca tcagacacag aatatcgttc 180
tctctaactg gtcctttgac gtttctgaca atagttctag aggagtcgtc caaaaactca 240
actctgactt gggtgacacc accacgggat ccggttcttc cgaggacctt gatgaccttg 300
gctaatgtaa ctggagtttt agtatccatt ttaagatgtg tgtttctgta ggttctgggt 360
tggaaaaaaa ttttagacac cagaagagag gagtgaactg gtttgcgtgg gtttagactg 420
tgtaaggcac tactctgtcg aagttttaga taggggttac ccgctccgat gcatgggaag 480
cgattagccc ggctgttgcc cgtttggttt ttgaagggta attttcaata tctctgtttg 540
agtcatcaat ttcatattca aagattcaaa aacaaaatct ggtccaagga gcgcatttag 600
gattatggag ttggcgaatc acttgaacga tagactatta tttgctgttc ctaaagaggg 660
cagattgtat gagaaatgcg ttgaattact taggggatca gatattcagt ttcgaagatc 720
cagtagattg gatatagctt tgtgcactaa cctgcccctg gcattggttt tccttccagc 780
tgctgacatt cccacgtttg taggagaggg taaatgtgat ttgggtataa ctggtattga 840
ccaggttcag gaaagtgacg tagatgtcat acctttatta gacttgaatt tcggtaagtg 900
caagttgcag attcaagttc ccgagaatgg tgacttgaaa gaacctaaac agctaattgg 960
taaagaaatt gtttcctcct ttactagctt aaccaccagg tactttgaac aactggaagg 1020
agttaagcct ggtgagccac taaagacaaa aatcaaatat gttggagggt ctgttgaggc 1080
ctcttgtgcc ctaggagttg ccgatgctat tgtggatctt gttgagagtg gagaaaccat 1140
gaaagcggca gggctgatcg atattgaaac tgttctttct acttccgctt acctgatctc 1200
ttcgaagcat cctcaacacc cagaactgat ggatactatc aaggagagaa ttgaaggtgt 1260
actgactgct cagaagtatg tcttgtgtaa ttacaacgca cctagaggta accttcctca 1320
gctgctaaaa ctgactccag gcaagagagc tgctaccgtt tctccattag atgaagaaga 1380
ttgggtggga gtgtcctcga tggtagagaa gaaagatgtt ggaagaatca tggacgaatt 1440
aaagaaacaa ggtgccagtg acattcttgt ctttgagatc agtaattgta gagcatagat 1500
agaataatat tcaagaccaa cggcttctct tcggaagctc caagtagctt atagtgatga 1560
gtaccggcat atatttatag gcttaaaatt tcgagggttc actatattcg tttagtggga 1620
agagttcctt tcactcttgt tatctatatt gtcagcgtgg actgtttata actgtaccaa 1680
cttagtttct ttcaactcca ggttaagaga cataaatgtc ctttgatgc 1729
<210> 73
<211> 1068
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes Rat GnT II
(TC) Codon-optimized
<400> 73
tccttggttt accaattgaa cttcgaccag atgttgagaa acgttgacaa ggacggtact 60
tggtctcctg gtgagttggt tttggttgtt caggttcaca acagaccaga gtacttgaga 120
ttgttgatcg actccttgag aaaggctcaa ggtatcagag aggttttggt tatcttctcc 180
cacgatttct ggtctgctga gatcaactcc ttgatctcct ccgttgactt ctgtccagtt 240
ttgcaggttt tcttcccatt ctccatccaa ttgtacccat ctgagttccc aggttctgat 300
ccaagagact gtccaagaga cttgaagaag aacgctgctt tgaagttggg ttgtatcaac 360
gctgaatacc cagattcttt cggtcactac agagaggcta agttctccca aactaagcat 420
cattggtggt ggaagttgca ctttgtttgg gagagagtta aggttttgca ggactacact 480
ggattgatct tgttcttgga ggaggatcat tacttggctc cagacttcta ccacgttttc 540
aagaagatgt ggaagttgaa gcaacaagag tgtccaggtt gtgacgtttt gtccttggga 600
acttacacta ctatcagatc cttctacggt atcgctgaca aggttgacgt taagacttgg 660
aagtccactg aacacaacat gggattggct ttgactagag atgcttacca gaagttgatc 720
gagtgtactg acactttctg tacttacgac gactacaact gggactggac tttgcagtac 780
ttgactttgg cttgtttgcc aaaagtttgg aaggttttgg ttccacaggc tccaagaatt 840
ttccacgctg gtgactgtgg aatgcaccac aagaaaactt gtagaccatc cactcagtcc 900
gctcaaattg agtccttgtt gaacaacaac aagcagtact tgttcccaga gactttggtt 960
atcggagaga agtttccaat ggctgctatt tccccaccaa gaaagaatgg tggatggggt 1020
gatattagag accacgagtt gtgtaaatcc tacagaagat tgcagtag 1068
<210> 74
<211> 300
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes Mnn2 leader (54)
<400> 74
atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60
tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcggt caaggagtac 120
aaggagtact tagacagata tgtccagagt tactccaata agtattcatc ttcctcagac 180
gccgccagcg ctgacgattc aaccccattg agggacaatg atgaggcagg caatgaaaag 240
ttgaaaagct tctacaacaa cgttttcaac tttctaatgg ttgattcgcc cgggcgcgcc 300
<210> 75
<211> 1373
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
PpARG1
<400> 75
gatctggcct tccctgaatt tttacgtcca gctatacgat ccgttgtgac tgtatttcct 60
gaaatgaagt ttcaacctaa agttttggtt gtacttgctc cacctaccac ggaaactaat 120
atcgaaacca atgaaaaagt agaactggaa tcgtcaatcg aaattcgcaa ccaagtggaa 180
cccaaagact tgaatctttc taaagtctat tctagtgaca ctaatggcaa cagaagattt 240
gagctgactt ttcaaatgaa tctcaataat gcaatatcaa catcagacaa tcaatgggct 300
ttgtctagtg acacaggatc aattatagta gtgtcttctg caggaagaat aacttccccg 360
atcctagaag tcggggcatc cgtctgtgtc ttaagatcgt acaacgaaca ccttttggca 420
ataacttgtg aaggaacatg cttttcatgg aatttaaaga agcaagaatg tgttctaaac 480
agcatttcat tagcacctat agtcaattca cacatgctag ttaagaaagt tggagatgca 540
aggaactatt ctattgtatc tgccgaagga gacaacaatc cgttacccca gattctagac 600
tgcgaacttt ccaaaaatgg cgctccaatt gtggctctta gcacgaaaga catctactct 660
tattcaaaga aaatgaaatg ctggatccat ttgattgatt cgaaatactt tgaattgttg 720
ggtgctgaca atgcactgtt tgagtgtgtg gaagcgctag aaggtccaat tggaatgcta 780
attcatagat tggtagatga gttcttccat gaaaacactg ccggtaaaaa actcaaactt 840
tacaacaagc gagtactgga ggacctttca aattcacttg aagaactagg tgaaaatgcg 900
tctcaattaa gagagaaact tgacaaactc tatggtgatg aggttgaggc ttcttgacct 960
cttctctcta tctgcgtttc tttttttttt tttttttttt tttttttcag ttgagccaga 1020
ccgcgctaaa cgcataccaa ttgccaaatc aggcaattgt gagacagtgg taaaaaagat 1080
gcctgcaaag ttagattcac acagtaagag agatcctact cataaatgag gcgcttattt 1140
agtagctagt gatagccact gcggttctgc tttatgctat ttgttgtatg ccttactatc 1200
tttgtttggc tcctttttct tgacgttttc cgttggaggg actccctatt ctgagtcatg 1260
agccgcacag attatcgccc aaaattgaca aaatcttctg gcgaaaaaag tataaaagga 1320
gaaaaaagct cacccttttc cagcgtagaa agtatatatc agtcattgaa gac 1373
<210> 76
<211> 1470
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
PpARG1
<400> 76
gggactttaa ctcaagtaaa aggatagttg tacaattata tatacgaaga ataaatcatt 60
acaaaaagta ttcgtttctt tgattcttaa caggattcat tttctgggtg tcatcaggta 120
cagcgctgaa tatcttgaag ttaacatcga gctcatcatc gacgttcatc acactagcca 180
cgtttccgca acggtagcaa taattaggag cggaccacac agtgacgaca tctttctctt 240
tgaaatggta tctgaagcct tccatgacca attgatgggc tctagcgatg agttgcaagt 300
tattaatgtg gttgaactca cgtgctactc gagcaccgaa taaccagcca gctccacgag 360
gagaaacagc ccaactgtcg acttcatctg ggtcagacca aaccaagtca caaaatcctc 420
cttcatgagg gacctcttgc gctcggctga gaactctgat ttgatctaac atgcgaatat 480
cgggagagag accaccatgg atacataata ttttaccatc aatgatggca ctaagggtta 540
aaaagtcgaa cacctggcaa cagtacttcc agacagtggt ggaaccatat ttattgagac 600
attcctcata aaatccataa acctgagtga tctgtctgga ttcatgattt ccccttacca 660
atgtgatatg ttgaggaaac ttaattttta aaatcatgag taacgtgaac gtctccaacg 720
agaaatagcc tctatccaca tagtctccta ggaagatata gttctgtttt attccattag 780
aggaggatcc gggaaaccca ccactaatct tgaaaagttc cagtagatcg tgaaattggc 840
cgtgaatatc tccgcatact gtcactggac tctgcactgg ctgtatattg gattcctcca 900
tcagcaaatc cttcacccgt tcgcaaagat gcttcatatc attttcactt aaagccttgc 960
agcttttgac ttcttcaaac cactgatctg gtcctctttc tggcatgatt aaggtctata 1020
atatttctga gctgagatgt aaaaaaaaat aataaaaatg gggagtgaaa aagtgtgtag 1080
cttttaggag tttgggattg ataccccaaa atgatcttta tgagaattaa aaggtagata 1140
cgcttttaat aagaacacct atctatagta ctttgtggtc ttgagtaatt gagatgttca 1200
gcttctgagg tttgccgtta ttctgggata gtagtgcgcg accaaacaac ccgccaggca 1260
aagtgtgttg tgctcgaaga cgattgccag aagagtaagt ccgtcctgcc tcagatgtta 1320
cacactttct tccctagaca gtcgatgcat catcggattt aaacctgaaa ctttgatgcc 1380
atgatacgcc tagtcacgtc gactgagatt ttagataagc cccgatccct ttagtacatt 1440
cctgttatcc atggatggaa tggcctgata 1470
<210> 77
<211> 1043
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
BMT4
<400> 77
aagcttgttc accgttggga cttttccgtg gacaatgttg actactccag gagggattcc 60
agctttctct actagctcag caataatcaa tgcagcccca ggcgcccgtt ctgatggctt 120
gatgaccgtt gtattgcctg tcactatagc caggggtagg gtccataaag gaatcatagc 180
agggaaatta aaagggcata ttgatgcaat cactcccaat ggctctcttg ccattgaagt 240
ctccatatca gcactaactt ccaagaagga ccccttcaag tctgacgtga tagagcacgc 300
ttgctctgcc acctgtagtc ctctcaaaac gtcaccttgt gcatcagcaa agactttacc 360
ttgctccaat actatgacgg aggcaattct gtcaaaattc tctctcagca attcaaccaa 420
cttgaaagca aattgctgtc tcttgatgat ggagactttt ttccaagatt gaaatgcaat 480
gtgggacgac tcaattgctt cttccagctc ctcttcggtt gattgaggaa cttttgaaac 540
cacaaaattg gtcgttgggt catgtacatc aaaccattct gtagatttag attcgacgaa 600
agcgttgttg atgaaggaaa aggttggata cggtttgtcg gtctctttgg tatggccggt 660
ggggtatgca attgcagtag aagataattg gacagccatt gttgaaggta gagaaaaggt 720
cagggaactt gggggttatt tataccattt taccccacaa ataacaactg aaaagtaccc 780
attccatagt gagaggtaac cgacggaaaa agacgggccc atgttctggg accaatagaa 840
ctgtgtaatc cattgggact aatcaacaga cgattggcaa tataatgaaa tagttcgttg 900
aaaagccacg tcagctgtct tttcattaac tttggtcgga cacaacattt tctactgttg 960
tatctgtcct actttgctta tcatctgcca cagggcaagt ggatttcctt ctcgcgcggc 1020
tgggtgaaaa cggttaacgt gaa 1043
<210> 78
<211> 695
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
BMT4
<400> 78
gccttggggg acttcaagtc tttgctagaa actagatgag gtcaggccct cttatggttg 60
tgtcccaatt gggcaatttc actcacctaa aaagcatgac aattatttag cgaaataggt 120
agtatatttt ccctcatctc ccaagcagtt tcgtttttgc atccatatct ctcaaatgag 180
cagctacgac tcattagaac cagagtcaag taggggtgag ctcagtcatc agccttcgtt 240
tctaaaacga ttgagttctt ttgttgctac aggaagcgcc ctagggaact ttcgcacttt 300
ggaaatagat tttgatgacc aagagcggga gttgatatta gagaggctgt ccaaagtaca 360
tgggatcagg ccggccaaat tgattggtgt gactaaacca ttgtgtactt ggacactcta 420
ttacaaaagc gaagatgatt tgaagtatta caagtcccga agtgttagag gattctatcg 480
agcccagaat gaaatcatca accgttatca gcagattgat aaactcttgg aaagcggtat 540
cccattttca ttattgaaga actacgataa tgaagatgtg agagacggcg accctctgaa 600
cgtagacgaa gaaacaaatc tacttttggg gtacaataga gaaagtgaat caagggaggt 660
atttgtggcc ataatactca actctatcat taatg 695
<210> 79
<211> 1103
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
BMT1
<400> 79
catatggtga gagccgttct gcacaactag atgttttcga gcttcgcatt gtttcctgca 60
gctcgactat tgaattaaga tttccggata tctccaatct cacaaaaact tatgttgacc 120
acgtgctttc ctgaggcgag gtgttttata tgcaagctgc caaaaatgga aaacgaatgg 180
ccatttttcg cccaggcaaa ttattcgatt actgctgtca taaagacagt gttgcaaggc 240
tcacattttt ttttaggatc cgagataaag tgaatacagg acagcttatc tctatatctt 300
gtaccattcg tgaatcttaa gagttcggtt agggggactc tagttgaggg ttggcactca 360
cgtatggctg ggcgcagaaa taaaattcag gcgcagcagc acttatcgat ggaattcaca 420
gttataaata aaaacaaaaa ctcaaaaagt ttgggctcca caaaataact taatttaaat 480
ttttgtctaa taaatgaatg taattccaag attatgtgat gcaagcacag tatgcttcag 540
ccctatgcag ctactaatgt caatctcgcc tgcgagcggg cctagatttt cactacaaat 600
ttcaaaacta cgcggattta ttgtctcaga gagcaatttg gcatttctga gcgtagcagg 660
aggcttcata agattgtata ggaccgtacc aacaaattgc cgaggcacaa cacggtatgc 720
tgtgcactta tgtggctact tccctacaac ggaatgaaac cttcctcttt ccgcttaaac 780
gagaaagtgt gtcgcaattg aatgcaggtg cctgtgcgcc ttggtgtatt gtttttgagg 840
gcccaattta tcaggcgcct tttttcttgg ttgttttccc ttagcctcaa gcaaggttgg 900
tctatttcat ctccgcttct ataccgtgcc tgatactgtt ggatgagaac acgactcaac 960
ttcctgctgc tctgtattgc cagtgttttg tctgtgattt ggatcggagt cctccttact 1020
tggaatgata ataatcttgg cggaatctcc ctaaacggag gcaaggattc tgcctatgat 1080
gatctgctat cattgggaag ctt 1103
<210> 80
<211> 692
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
BMT1
<400> 80
gaattcacag ttataaataa aaacaaaaac tcaaaaagtt tgggctccac aaaataactt 60
aatttaaatt tttgtctaat aaatgaatgt aattccaaga ttatgtgatg caagcacagt 120
atgcttcagc cctatgcagc tactaatgtc aatctcgcct gcgagcgggc ctagattttc 180
actacaaatt tcaaaactac gcggatttat tgtctcagag agcaatttgg catttctgag 240
cgtagcagga ggcttcataa gattgtatag gaccgtacca acaaattgcc gaggcacaac 300
acggtatgct gtgcacttat gtggctactt ccctacaacg gaatgaaacc ttcctctttc 360
cgcttaaacg agaaagtgtg tcgcaattga atgcaggtgc ctgtgcgcct tggtgtattg 420
tttttgaggg cccaatttat caggcgcctt ttttcttggt tgttttccct tagcctcaag 480
caaggttggt ctatttcatc tccgcttcta taccgtgcct gatactgttg gatgagaaca 540
cgactcaact tcctgctgct ctgtattgcc agtgttttgt ctgtgatttg gatcggagtc 600
ctccttactt ggaatgataa taatcttggc ggaatctccc taaacggagg caaggattct 660
gcctatgatg atctgctatc attgggaagc tt 692
<210> 81
<211> 546
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-Region used for knock out of
BMT3
<400> 81
gatatctccc tggggacaat atgtgttgca actgttcgtt gttggtgccc cagtccccca 60
accggtacta atcggtctat gttcccgtaa ctcatattcg gttagaacta gaacaataag 120
tgcatcattg ttcaacattg tggttcaatt gtcgaacatt gctggtgctt atatctacag 180
ggaagacgat aagcctttgt acaagagagg taacagacag ttaattggta tttctttggg 240
agtcgttgcc ctctacgttg tctccaagac atactacatt ctgagaaaca gatggaagac 300
tcaaaaatgg gagaagctta gtgaagaaga gaaagttgcc tacttggaca gagctgagaa 360
ggagaacctg ggttctaaga ggctggactt tttgttcgag agttaaactg cataattttt 420
tctaagtaaa tttcatagtt atgaaatttc tgcagcttag tgtttactgc atcgtttact 480
gcatcaccct gtaaataatg tgagcttttt tccttccatt gcttggtatc ttccttgctg 540
ctgttt 546
<210> 82
<211> 378
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-Region used for knock out of
BMT3
<400> 82
acaaaacagt catgtacaga actaacgcct ttaagatgca gaccactgaa aagaattggg 60
tcccattttt cttgaaagac gaccaggaat ctgtccattt tgtttactcg ttcaatcctc 120
tgagagtact caactgcagt cttgataacg gtgcatgtga tgttctattt gagttaccac 180
atgattttgg catgtcttcc gagctacgtg gtgccactcc tatgctcaat cttcctcagg 240
caatcccgat ggcagacgac aaagaaattt gggtttcatt cccaagaacg agaatatcag 300
attgcgggtg ttctgaaaca atgtacaggc caatgttaat gctttttgtt agagaaggaa 360
caaacttttt tgctgagc 378
<210> 83
<211> 1494
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA encodes Tr ManI catalytic domain
<400> 83
cgcgccggat ctcccaaccc tacgagggcg gcagcagtca aggccgcatt ccagacgtcg 60
tggaacgctt accaccattt tgcctttccc catgacgacc tccacccggt cagcaacagc 120
tttgatgatg agagaaacgg ctggggctcg tcggcaatcg atggcttgga cacggctatc 180
ctcatggggg atgccgacat tgtgaacacg atccttcagt atgtaccgca gatcaacttc 240
accacgactg cggttgccaa ccaaggcatc tccgtgttcg agaccaacat tcggtacctc 300
ggtggcctgc tttctgccta tgacctgttg cgaggtcctt tcagctcctt ggcgacaaac 360
cagaccctgg taaacagcct tctgaggcag gctcaaacac tggccaacgg cctcaaggtt 420
gcgttcacca ctcccagcgg tgtcccggac cctaccgtct tcttcaaccc tactgtccgg 480
agaagtggtg catctagcaa caacgtcgct gaaattggaa gcctggtgct cgagtggaca 540
cggttgagcg acctgacggg aaacccgcag tatgcccagc ttgcgcagaa gggcgagtcg 600
tatctcctga atccaaaggg aagcccggag gcatggcctg gcctgattgg aacgtttgtc 660
agcacgagca acggtacctt tcaggatagc agcggcagct ggtccggcct catggacagc 720
ttctacgagt acctgatcaa gatgtacctg tacgacccgg ttgcgtttgc acactacaag 780
gatcgctggg tccttgctgc cgactcgacc attgcgcatc tcgcctctca cccgtcgacg 840
cgcaaggact tgaccttttt gtcttcgtac aacggacagt ctacgtcgcc aaactcagga 900
catttggcca gttttgccgg tggcaacttc atcttgggag gcattctcct gaacgagcaa 960
aagtacattg actttggaat caagcttgcc agctcgtact ttgccacgta caaccagacg 1020
gcttctggaa tcggccccga aggcttcgcg tgggtggaca gcgtgacggg cgccggcggc 1080
tcgccgccct cgtcccagtc cgggttctac tcgtcggcag gattctgggt gacggcaccg 1140
tattacatcc tgcggccgga gacgctggag agcttgtact acgcataccg cgtcacgggc 1200
gactccaagt ggcaggacct ggcgtgggaa gcgttcagtg ccattgagga cgcatgccgc 1260
gccggcagcg cgtactcgtc catcaacgac gtgacgcagg ccaacggcgg gggtgcctct 1320
gacgatatgg agagcttctg gtttgccgag gcgctcaagt atgcgtacct gatctttgcg 1380
gaggagtcgg atgtgcaggt gcaggccaac ggcgggaaca aatttgtctt taacacggag 1440
gcgcacccct ttagcatccg ttcatcatca cgacggggcg gccaccttgc ttaa 1494
<210> 84
<211> 1792
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'ARG1 and ORF
<400> 84
taccaattgc caaatcaggc aattgtgaga cagtggtaaa aaagatgcct gcaaagttag 60
attcacacag taagagagat cctactcata aatgaggcgc ttatttagta gctagtgata 120
gccactgcgg ttctgcttta tgctatttgt tgtatgcctt actatctttg tttggctcct 180
ttttcttgac gttttccgtt ggagggactc cctattctga gtcatgagcc gcacagatta 240
tcgcccaaaa ttgacaaaat cttctggcga aaaaagtata aaaggagaaa aaagctcacc 300
cttttccagc gtagaaagta tatatcagtc attgaagact attatttaaa taacacaatg 360
tctaaaggaa aagtttgttt ggcctactcc ggtggtttgg atacctccat catcctagct 420
tggttgttgg agcagggata cgaagtcgtt gcctttttag ccaacattgg tcaagaggaa 480
gactttgagg ctgctagaga gaaagctctg aagatcggtg ctaccaagtt tatcgtcagt 540
gacgttagga aggaatttgt tgaggaagtt ttgttcccag cagtccaagt taacgctatc 600
tacgagaacg tctacttact gggtacctct ttggccagac cagtcattgc caaggcccaa 660
atagaggttg ctgaacaaga aggttgtttt gctgttgccc acggttgtac cggaaagggt 720
aacgatcagg ttagatttga gctttccttt tatgctctga agcctgacgt tgtctgtatc 780
gccccatgga gagacccaga attcttcgaa agattcgctg gtagaaatga cttgctgaat 840
tacgctgctg agaaggatat tccagttgct cagactaaag ccaagccatg gtctactgat 900
gagaacatgg ctcacatctc cttcgaggct ggtattctag aagatccaaa cactactcct 960
ccaaaggaca tgtggaagct cactgttgac ccagaagatg caccagacaa gccagagttc 1020
tttgacgtcc actttgagaa gggtaagcca gttaaattag ttctcgagaa caaaactgag 1080
gtcaccgatc cggttgagat ctttttgact gctaacgcca ttgctagaag aaacggtgtt 1140
ggtagaattg acattgtcga gaacagattc atcggaatca agtccagagg ttgttatgaa 1200
actccaggtt tgactctact gagaaccact cacatcgact tggaaggtct taccgttgac 1260
cgtgaagtta gatcgatcag agacactttt gttaccccaa cctactctaa gttgttatac 1320
aacgggttgt actttacccc agaaggtgag tacgtcagaa ctatgattca gccttctcaa 1380
aacaccgtca acggtgttgt tagagccaag gcctacaaag gtaatgtgta taacctagga 1440
agatactctg aaaccgagaa attgtacgat gctaccgaat cttccatgga tgagttgacc 1500
ggattccacc ctcaagaagc tggaggattt atcacaacac aagccatcag aatcaagaag 1560
tacggagaaa gtgtcagaga gaagggaaag tttttgggac tttaactcaa gtaaaaggat 1620
agttgtacaa ttatatatac gaagaataaa tcattacaaa aagtattcgt ttctttgatt 1680
cttaacagga ttcattttct gggtgtcatc aggtacagcg ctgaatatct tgaagttaac 1740
atcgagctca tcatcgacgt tcatcacact agccacgttt ccgcaacggt ag 1792
<210> 85
<211> 414
<212> DNA
<213> Artificial Sequence
<220>
<223> PpCITI TT
<400> 85
ccggccattt aaatatgtga cgactgggtg atccgggtta gtgagttgtt ctcccatctg 60
tatatttttc atttacgatg aatacgaaat gagtattaag aaatcaggcg tagcaatatg 120
ggcagtgttc agtcctgtca tagatggcaa gcactggcac atccttaata ggttagagaa 180
aatcattgaa tcatttgggt ggtgaaaaaa aattgatgta aacaagccac ccacgctggg 240
agtcgaaccc agaatctttt gattagaagt caaacgcgtt aaccattacg ctacgcaggc 300
atgtttcacg tccatttttg attgctttct atcataatct aaagatgtga actcaattag 360
ttgcaatttg accaattctt ccattacaag tcgtgcttcc tccgttgatg caac 414
<210> 86
<211> 388
<212> DNA
<213> Artificial Sequence
<220>
<223> Ashbya gossypii TEF1 promoter
<400> 86
gatctgttta gcttgcctcg tccccgccgg gtcacccggc cagcgacatg gaggcccaga 60
ataccctcct tgacagtctt gacgtgcgca gctcaggggc atgatgtgac tgtcgcccgt 120
acatttagcc catacatccc catgtataat catttgcatc catacatttt gatggccgca 180
cggcgcgaag caaaaattac ggctcctcgc tgcagacctg cgagcaggga aacgctcccc 240
tcacagacgc gttgaattgt ccccacgccg cgcccctgta gagaaatata aaaggttagg 300
atttgccact gaggttcttc tttcatatac ttccttttaa aatcttgcta ggatacagtt 360
ctcacatcac atccgaacat aaacaacc 388
<210> 87
<211> 247
<212> DNA
<213> Artificial Sequence
<220>
<223> Ashbya gossypii TEF1 termination sequence
<400> 87
taatcagtac tgacaataaa aagattcttg ttttcaagaa cttgtcattt gtatagtttt 60
tttatattgt agttgttcta ttttaatcaa atgttagcgt gatttatatt ttttttcgcc 120
tcgacatcat ctgcccagat gcgaagttaa gtgcgcagaa agtaatatca tgcgtcaatc 180
gtatgtgaat gctggtcgct atactgctgt cgattcgata ctaacgccgc catccagtgt 240
cgaaaac 247
<210> 88
<211> 1037
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpPMA1 promoter
<400> 88
aaatgcgtac ctcttctacg agattcaagc gaatgagaat aatgtaatat gcaagatcag 60
aaagaatgaa aggagttgaa aaaaaaaacc gttgcgtttt gaccttgaat ggggtggagg 120
tttccattca aagtaaagcc tgtgtcttgg tattttcggc ggcacaagaa atcgtaattt 180
tcatcttcta aacgatgaag atcgcagccc aacctgtatg tagttaaccg gtcggaatta 240
taagaaagat tttcgatcaa caaaccctag caaatagaaa gcagggttac aactttaaac 300
cgaagtcaca aacgataaac cactcagctc ccacccaaat tcattcccac tagcagaaag 360
gaattattta atccctcagg aaacctcgat gattctcccg ttcttccatg ggcgggtatc 420
gcaaaatgag gaatttttca aatttctcta ttgtcaagac tgtttattat ctaagaaata 480
gcccaatccg aagctcagtt ttgaaaaaat cacttccgcg tttctttttt acagcccgat 540
gaatatccaa atttggaata tggattactc tatcgggact gcagataata tgacaacaac 600
gcagattaca ttttaggtaa ggcataaaca ccagccagaa atgaaacgcc cactagccat 660
ggtcgaatag tccaatgaat tcagatagct atggtctaaa agctgatgtt ttttattggg 720
taatggcgaa gagtccagta cgacttccag cagagctgag atggccattt ttgggggtat 780
tagtaacttt ttgagctctt ttcacttcga tgaagtgtcc cattcgggat ataatcggat 840
cgcgtcgttt tctcgaaaat acagcttagc gtcgtccgct tgttgtaaaa gcagcaccac 900
attcctaatc tcttatataa acaaaacaac ccaaattatc agtgctgttt tcccaccaga 960
tataagtttc ttttctcttc cgctttttga ttttttatct ctttccttta aaaacttctt 1020
taccttaaag ggcggcc 1037
<210> 89
<211> 1231
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 5'-region that was used to knock
into the PpPRO1 locus
<400> 89
gaagggccat cgaattgtca tcgtctcctc aggtgccatc gctgtgggca tgaagagagt 60
caacatgaag cggaaaccaa aaaagttaca gcaagtgcag gcattggctg ctataggaca 120
aggccgtttg ataggacttt gggacgacct tttccgtcag ttgaatcagc ctattgcgca 180
gattttactg actagaacgg atttggtcga ttacacccag tttaagaacg ctgaaaatac 240
attggaacag cttattaaaa tgggtattat tcctattgtc aatgagaatg acaccctatc 300
cattcaagaa atcaaatttg gtgacaatga caccttatcc gccataacag ctggtatgtg 360
tcatgcagac tacctgtttt tggtgactga tgtggactgt ctttacacgg ataaccctcg 420
tacgaatccg gacgctgagc caatcgtgtt agttagaaat atgaggaatc taaacgtcaa 480
taccgaaagt ggaggttccg ccgtaggaac aggaggaatg acaactaaat tgatcgcagc 540
tgatttgggt gtatctgcag gtgttacaac gattatttgc aaaagtgaac atcccgagca 600
gattttggac attgtagagt acagtatccg tgctgataga gtcgaaaatg aggctaaata 660
tctggtcatc aacgaagagg aaactgtgga acaatttcaa gagatcaatc ggtcagaact 720
gagggagttg aacaagctgg acattccttt gcatacacgt ttcgttggcc acagttttaa 780
tgctgttaat aacaaagagt tttggttact ccatggacta aaggccaacg gagccattat 840
cattgatcca ggttgttata aggctatcac tagaaaaaac aaagctggta ttcttccagc 900
tggaattatt tccgtagagg gtaatttcca tgaatacgag tgtgttgatg ttaaggtagg 960
actaagagat ccagatgacc cacattcact agaccccaat gaagaacttt acgtcgttgg 1020
ccgtgcccgt tgtaattacc ccagcaatca aatcaacaaa attaagggtc tacaaagctc 1080
gcagatcgag caggttctag gttacgctga cggtgagtat gttgttcaca gggacaactt 1140
ggctttccca gtatttgccg atccagaact gttggatgtt gttgagagta ccctgtctga 1200
acaggagaga gaatccaaac caaataaata g 1231
<210> 90
<211> 1425
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the 3'-region that was used to knock
into the PpPRO1 locus
<400> 90
aatttcacat atgctgcttg attatgtaat tataccttgc gttcgatggc atcgatttcc 60
tcttctgtca atcgcgcatc gcattaaaag tatacttttt tttttttcct atagtactat 120
tcgccttatt ataaactttg ctagtatgag ttctaccccc aagaaagagc ctgatttgac 180
tcctaagaag agtcagcctc caaagaatag tctcggtggg ggtaaaggct ttagtgagga 240
gggtttctcc caaggggact tcagcgctaa gcatatacta aatcgtcgcc ctaacaccga 300
aggctcttct gtggcttcga acgtcatcag ttcgtcatca ttgcaaaggt taccatcctc 360
tggatctgga agcgttgctg tgggaagtgt gttgggatct tcgccattaa ctctttctgg 420
agggttccac gggcttgatc caaccaagaa taaaatagac gttccaaagt cgaaacagtc 480
aaggagacaa agtgttcttt ctgacatgat ttccacttct catgcagcta gaaatgatca 540
ctcagagcag cagttacaaa ctggacaaca atcagaacaa aaagaagaag atggtagtcg 600
atcttctttt tctgtttctt cccccgcaag agatatccgg cacccagatg tactgaaaac 660
tgtcgagaaa catcttgcca atgacagcga gatcgactca tctttacaac ttcaaggtgg 720
agatgtcact agaggcattt atcaatgggt aactggagaa agtagtcaaa aagataaccc 780
gcctttgaaa cgagcaaata gttttaatga tttttcttct gtgcatggtg acgaggtagg 840
caaggcagat gctgaccacg atcgtgaaag cgtattcgac gaggatgata tctccattga 900
tgatatcaaa gttccgggag ggatgcgtcg aagtttttta ttacaaaagc atagagacca 960
acaactttct ggactgaata aaacggctca ccaaccaaaa caacttacta aacctaattt 1020
cttcacgaac aactttatag agtttttggc attgtatggg cattttgcag gtgaagattt 1080
ggaggaagac gaagatgaag atttagacag tggttccgaa tcagtcgcag tcagtgatag 1140
tgagggagaa ttcagtgagg ctgacaacaa tttgttgtat gatgaagagt ctctcctatt 1200
agcacctagt acctccaact atgcgagatc aagaatagga agtattcgta ctcctactta 1260
tggatctttc agttcaaatg ttggttcttc gtctattcat cagcagttaa tgaaaagtca 1320
aatcccgaag ctgaagaaac gtggacagca caagcataaa acacaatcaa aaatacgctc 1380
gaagaagcaa actaccaccg taaaagcagt gttgctgcta ttaaa 1425
<210> 91
<211> 1793
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpTRP2 gene integration locus
<400> 91
ggtttctcaa ttactatata ctactaacca tttacctgta gcgtatttct tttccctctt 60
cgcgaaagct caagggcatc ttcttgactc atgaaaaata tctggatttc ttctgacaga 120
tcatcaccct tgagcccaac tctctagcct atgagtgtaa gtgatagtca tcttgcaaca 180
gattattttg gaacgcaact aacaaagcag atacaccctt cagcagaatc ctttctggat 240
attgtgaaga atgatcgcca aagtcacagt cctgagacag ttcctaatct ttaccccatt 300
tacaagttca tccaatcaga cttcttaacg cctcatctgg cttatatcaa gcttaccaac 360
agttcagaaa ctcccagtcc aagtttcttg cttgaaagtg cgaagaatgg tgacaccgtt 420
gacaggtaca cctttatggg acattccccc agaaaaataa tcaagactgg gcctttagag 480
ggtgctgaag ttgacccctt ggtgcttctg gaaaaagaac tgaagggcac cagacaagcg 540
caacttcctg gtattcctcg tctaagtggt ggtgccatag gatacatctc gtacgattgt 600
attaagtact ttgaaccaaa aactgaaaga aaactgaaag atgttttgca acttccggaa 660
gcagctttga tgttgttcga cacgatcgtg gcttttgaca atgtttatca aagattccag 720
gtaattggaa acgtttctct atccgttgat gactcggacg aagctattct tgagaaatat 780
tataagacaa gagaagaagt ggaaaagatc agtaaagtgg tatttgacaa taaaactgtt 840
ccctactatg aacagaaaga tattattcaa ggccaaacgt tcacctctaa tattggtcag 900
gaagggtatg aaaaccatgt tcgcaagctg aaagaacata ttctgaaagg agacatcttc 960
caagctgttc cctctcaaag ggtagccagg ccgacctcat tgcacccttt caacatctat 1020
cgtcatttga gaactgtcaa tccttctcca tacatgttct atattgacta tctagacttc 1080
caagttgttg gtgcttcacc tgaattacta gttaaatccg acaacaacaa caaaatcatc 1140
acacatccta ttgctggaac tcttcccaga ggtaaaacta tcgaagagga cgacaattat 1200
gctaagcaat tgaagtcgtc tttgaaagac agggccgagc acgtcatgct ggtagatttg 1260
gccagaaatg atattaaccg tgtgtgtgag cccaccagta ccacggttga tcgtttattg 1320
actgtggaga gattttctca tgtgatgcat cttgtgtcag aagtcagtgg aacattgaga 1380
ccaaacaaga ctcgcttcga tgctttcaga tccattttcc cagcaggaac cgtctccggt 1440
gctccgaagg taagagcaat gcaactcata ggagaattgg aaggagaaaa gagaggtgtt 1500
tatgcggggg ccgtaggaca ctggtcgtac gatggaaaat cgatggacac atgtattgcc 1560
ttaagaacaa tggtcgtcaa ggacggtgtc gcttaccttc aagccggagg tggaattgtc 1620
tacgattctg acccctatga cgagtacatc gaaaccatga acaaaatgag atccaacaat 1680
aacaccatct tggaggctga gaaaatctgg accgataggt tggccagaga cgagaatcaa 1740
agtgaatccg aagaaaacga tcaatgaacg gaggacgtaa gtaggaattt atg 1793
<210> 92
<211> 2172
<212> DNA
<213> Artificial Sequence
<220>
<223> Human UDP-GlcNAc 2-epimerase/N-acetylmannosamine
kinase (HsGNE) codon opitimized
<400> 92
atggaaaaga acggtaacaa cagaaagttg agagtttgtg ttgctacttg taacagagct 60
gactactcca agttggctcc aatcatgttc ggtatcaaga ctgagccaga gttcttcgag 120
ttggacgttg ttgttttggg ttcccacttg attgatgact acggtaacac ttacagaatg 180
atcgagcagg acgacttcga catcaacact agattgcaca ctattgttag aggagaggac 240
gaagctgcta tggttgaatc tgttggattg gctttggtta agttgccaga cgttttgaac 300
agattgaagc cagacatcat gattgttcac ggtgacagat tcgatgcttt ggctttggct 360
acttccgctg ctttgatgaa cattagaatc ttgcacatcg agggtggtga agtttctggt 420
actatcgacg actccatcag acacgctatc actaagttgg ctcactacca tgtttgttgt 480
actagatccg ctgagcaaca cttgatttcc atgtgtgagg accacgacag aattttgttg 540
gctggttgtc catcttacga caagttgttg tccgctaaga acaaggacta catgtccatc 600
atcagaatgt ggttgggtga cgacgttaag tctaaggact acatcgttgc tttgcagcac 660
ccagttacta ctgacatcaa gcactccatc aagatgttcg agttgacttt ggacgctttg 720
atctccttca acaagagaac tttggttttg ttcccaaaca ttgacgctgg ttccaaagag 780
atggttagag ttatgagaaa gaagggtatc gaacaccacc caaacttcag agctgttaag 840
cacgttccat tcgaccaatt catccagttg gttgctcatg ctggttgtat gatcggtaac 900
tcctcctgtg gtgttagaga agttggtgct ttcggtactc cagttatcaa cttgggtact 960
agacagatcg gtagagagac tggagaaaac gttttgcatg ttagagatgc tgacactcag 1020
gacaagattt tgcaggcttt gcacttgcaa ttcggaaagc agtacccatg ttccaaaatc 1080
tacggtgacg gtaacgctgt tccaagaatc ttgaagtttt tgaagtccat cgacttgcaa 1140
gagccattgc agaagaagtt ctgtttccca ccagttaagg agaacatctc ccaggacatt 1200
gaccacatct tggagacatt gtccgctttg gctgttgatt tgggtggaac taacttgaga 1260
gttgctatcg tttccatgaa gggagagatc gttaagaagt acactcagtt caacccaaag 1320
acttacgagg agagaatcaa cttgatcttg cagatgtgtg ttgaagctgc tgctgaggct 1380
gttaagttga actgtagaat cttgggtgtt ggtatctcta ctggtggtag agttaatcca 1440
agagagggta tcgttttgca ctccactaag ttgattcagg agtggaactc cgttgatttg 1500
agaactccat tgtccgacac attgcacttg ccagtttggg ttgacaacga cggtaattgt 1560
gctgctttgg ctgagagaaa gttcggtcaa ggaaagggat tggagaactt cgttactttg 1620
atcactggta ctggtattgg tggtggtatc attcaccagc acgagttgat tcacggttct 1680
tccttctgtg ctgctgaatt gggacacttg gttgtttctt tggacggtcc agactgttct 1740
tgtggttccc acggttgtat tgaagcttac gcatcaggaa tggcattgca gagagaggct 1800
aagaagttgc acgacgagga cttgttgttg gttgagggaa tgtctgttcc aaaggacgag 1860
gctgttggtg ctttgcattt gatccaggct gctaagttgg gtaatgctaa ggctcagtcc 1920
atcttgagaa ctgctggtac tgctttggga ttgggtgttg ttaatatctt gcacactatg 1980
aacccatcct tggttatctt gtccggtgtt ttggcttctc actacatcca catcgttaag 2040
gacgttatca gacagcaagc tttgtcctcc gttcaagacg ttgatgttgt tgtttccgac 2100
ttggttgacc cagctttgtt gggtgctgct tccatggttt tggactacac tactagaaga 2160
atctactaat ag 2172
<210> 93
<211> 1854
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of the PpARG1 auxotrophic marker:
<400> 93
cagttgagcc agaccgcgct aaacgcatac caattgccaa atcaggcaat tgtgagacag 60
tggtaaaaaa gatgcctgca aagttagatt cacacagtaa gagagatcct actcataaat 120
gaggcgctta tttagtagct agtgatagcc actgcggttc tgctttatgc tatttgttgt 180
atgccttact atctttgttt ggctcctttt tcttgacgtt ttccgttgga gggactccct 240
attctgagtc atgagccgca cagattatcg cccaaaattg acaaaatctt ctggcgaaaa 300
aagtataaaa ggagaaaaaa gctcaccctt ttccagcgta gaaagtatat atcagtcatt 360
gaagactatt atttaaataa cacaatgtct aaaggaaaag tttgtttggc ctactccggt 420
ggtttggata cctccatcat cctagcttgg ttgttggagc agggatacga agtcgttgcc 480
tttttagcca acattggtca agaggaagac tttgaggctg ctagagagaa agctctgaag 540
atcggtgcta ccaagtttat cgtcagtgac gttaggaagg aatttgttga ggaagttttg 600
ttcccagcag tccaagttaa cgctatctac gagaacgtct acttactggg tacctctttg 660
gccagaccag tcattgccaa ggcccaaata gaggttgctg aacaagaagg ttgttttgct 720
gttgcccacg gttgtaccgg aaagggtaac gatcaggtta gatttgagct ttccttttat 780
gctctgaagc ctgacgttgt ctgtatcgcc ccatggagag acccagaatt cttcgaaaga 840
ttcgctggta gaaatgactt gctgaattac gctgctgaga aggatattcc agttgctcag 900
actaaagcca agccatggtc tactgatgag aacatggctc acatctcctt cgaggctggt 960
attctagaag atccaaacac tactcctcca aaggacatgt ggaagctcac tgttgaccca 1020
gaagatgcac cagacaagcc agagttcttt gacgtccact ttgagaaggg taagccagtt 1080
aaattagttc tcgagaacaa aactgaggtc accgatccgg ttgagatctt tttgactgct 1140
aacgccattg ctagaagaaa cggtgttggt agaattgaca ttgtcgagaa cagattcatc 1200
ggaatcaagt ccagaggttg ttatgaaact ccaggtttga ctctactgag aaccactcac 1260
atcgacttgg aaggtcttac cgttgaccgt gaagttagat cgatcagaga cacttttgtt 1320
accccaacct actctaagtt gttatacaac gggttgtact ttaccccaga aggtgagtac 1380
gtcagaacta tgattcagcc ttctcaaaac accgtcaacg gtgttgttag agccaaggcc 1440
tacaaaggta atgtgtataa cctaggaaga tactctgaaa ccgagaaatt gtacgatgct 1500
accgaatctt ccatggatga gttgaccgga ttccaccctc aagaagctgg aggatttatc 1560
acaacacaag ccatcagaat caagaagtac ggagaaagtg tcagagagaa gggaaagttt 1620
ttgggacttt aactcaagta aaaggatagt tgtacaatta tatatacgaa gaataaatca 1680
ttacaaaaag tattcgtttc tttgattctt aacaggattc attttctggg tgtcatcagg 1740
tacagcgctg aatatcttga agttaacatc gagctcatca tcgacgttca tcacactagc 1800
cacgtttccg caacggtagc aataattagg agcggaccac acagtgacga catc 1854
<210> 94
<211> 1308
<212> DNA
<213> Artificial Sequence
<220>
<223> Encodes human CMP-sialic acid synthase (HsCSS)
codon optimized
<400> 94
atggactctg ttgaaaaggg tgctgctact tctgtttcca acccaagagg tagaccatcc 60
agaggtagac ctcctaagtt gcagagaaac tccagaggtg gtcaaggtag aggtgttgaa 120
aagccaccac acttggctgc tttgatcttg gctagaggag gttctaaggg tatcccattg 180
aagaacatca agcacttggc tggtgttcca ttgattggat gggttttgag agctgctttg 240
gactctggtg ctttccaatc tgtttgggtt tccactgacc acgacgagat tgagaacgtt 300
gctaagcaat tcggtgctca ggttcacaga agatcctctg aggtttccaa ggactcttct 360
acttccttgg acgctatcat cgagttcttg aactaccaca acgaggttga catcgttggt 420
aacatccaag ctacttcccc atgtttgcac ccaactgact tgcaaaaagt tgctgagatg 480
atcagagaag agggttacga ctccgttttc tccgttgtta gaaggcacca gttcagatgg 540
tccgagattc agaagggtgt tagagaggtt acagagccat tgaacttgaa cccagctaaa 600
agaccaagaa ggcaggattg ggacggtgaa ttgtacgaaa acggttcctt ctacttcgct 660
aagagacact tgatcgagat gggatacttg caaggtggaa agatggctta ctacgagatg 720
agagctgaac actccgttga catcgacgtt gatatcgact ggccaattgc tgagcagaga 780
gttttgagat acggttactt cggaaaggag aagttgaagg agatcaagtt gttggtttgt 840
aacatcgacg gttgtttgac taacggtcac atctacgttt ctggtgacca gaaggagatt 900
atctcctacg acgttaagga cgctattggt atctccttgt tgaagaagtc cggtatcgaa 960
gttagattga tctccgagag agcttgttcc aagcaaacat tgtcctcttt gaagttggac 1020
tgtaagatgg aggtttccgt ttctgacaag ttggctgttg ttgacgaatg gagaaaggag 1080
atgggtttgt gttggaagga agttgcttac ttgggtaacg aagtttctga cgaggagtgt 1140
ttgaagagag ttggtttgtc tggtgctcca gctgatgctt gttccactgc tcaaaaggct 1200
gttggttaca tctgtaagtg taacggtggt agaggtgcta ttagagagtt cgctgagcac 1260
atctgtttgt tgatggagaa agttaataac tcctgtcaga agtagtag 1308
<210> 95
<211> 1080
<212> DNA
<213> Artificial Sequence
<220>
<223> Encodes human N-acetylneuraminate-9-phosphate
synthase (HsSPS) codon optimized
<400> 95
atgccattgg aattggagtt gtgtcctggt agatgggttg gtggtcaaca cccatgtttc 60
atcatcgctg agatcggtca aaaccaccaa ggagacttgg acgttgctaa gagaatgatc 120
agaatggcta aggaatgtgg tgctgactgt gctaagttcc agaagtccga gttggagttc 180
aagttcaaca gaaaggcttt ggaaagacca tacacttcca agcactcttg gggaaagact 240
tacggagaac acaagagaca cttggagttc tctcacgacc aatacagaga gttgcagaga 300
tacgctgagg aagttggtat cttcttcact gcttctggaa tggacgaaat ggctgttgag 360
ttcttgcacg agttgaacgt tccattcttc aaagttggtt ccggtgacac taacaacttc 420
ccatacttgg aaaagactgc taagaaaggt agaccaatgg ttatctcctc tggaatgcag 480
tctatggaca ctatgaagca ggtttaccag atcgttaagc cattgaaccc aaacttttgt 540
ttcttgcagt gtacttccgc ttacccattg caaccagagg acgttaattt gagagttatc 600
tccgagtacc agaagttgtt cccagacatc ccaattggtt actctggtca cgagactggt 660
attgctattt ccgttgctgc tgttgctttg ggtgctaagg ttttggagag acacatcact 720
ttggacaaga cttggaaggg ttctgatcac tctgcttctt tggaacctgg tgagttggct 780
gaacttgtta gatcagttag attggttgag agagctttgg gttccccaac taagcaattg 840
ttgccatgtg agatggcttg taacgagaag ttgggaaagt ccgttgttgc taaggttaag 900
atcccagagg gtactatctt gactatggac atgttgactg ttaaagttgg agagccaaag 960
ggttacccac cagaggacat ctttaacttg gttggtaaaa aggttttggt tactgttgag 1020
gaggacgaca ctattatgga ggagttggtt gacaaccacg gaaagaagat caagtcctag 1080
<210> 96
<211> 1092
<212> DNA
<213> Artificial Sequence
<220>
<223> Encodes mouse alpha-2,6-sialyl transferase
catalytic domain (MmmST6) (codon optimized)
<400> 96
gtttttcaaa tgccaaagtc ccaggagaaa gttgctgttg gtccagctcc acaagctgtt 60
ttctccaact ccaagcaaga tccaaaggag ggtgttcaaa tcttgtccta cccaagagtt 120
actgctaagg ttaagccaca accatccttg caagtttggg acaaggactc cacttactcc 180
aagttgaacc caagattgtt gaagatttgg agaaactact tgaacatgaa caagtacaag 240
gtttcctaca agggtccagg tccaggtgtt aagttctccg ttgaggcttt gagatgtcac 300
ttgagagacc acgttaacgt ttccatgatc gaggctactg acttcccatt caacactact 360
gaatgggagg gatacttgcc aaaggagaac ttcagaacta aggctggtcc atggcataag 420
tgtgctgttg tttcttctgc tggttccttg aagaactccc agttgggtag agaaattgac 480
aaccacgacg ctgttttgag attcaacggt gctccaactg acaacttcca gcaggatgtt 540
ggtactaaga ctactatcag attggttaac tcccaattgg ttactactga gaagagattc 600
ttgaaggact ccttgtacac tgagggaatc ttgattttgt gggacccatc tgtttaccac 660
gctgacattc cacaatggta tcagaagcca gactacaact tcttcgagac ttacaagtcc 720
tacagaagat tgcacccatc ccagccattc tacatcttga agccacaaat gccatgggaa 780
ttgtgggaca tcatccagga aatttcccca gacttgatcc aaccaaaccc accatcttct 840
ggaatgttgg gtatcatcat catgatgact ttgtgtgacc aggttgacat ctacgagttc 900
ttgccatcca agagaaagac tgatgtttgt tactaccacc agaagttctt cgactccgct 960
tgtactatgg gagcttacca cccattgttg ttcgagaaga acatggttaa gcacttgaac 1020
gaaggtactg acgaggacat ctacttgttc ggaaaggcta ctttgtccgg tttcagaaac 1080
aacagatgtt ag 1092
<210> 97
<211> 2172
<212> DNA
<213> Artificial Sequence
<220>
<223> Encodes human UDP-GlcNAc
2-epimerase/N-acetylmannosamine kinase (HsGNE)
(codon optimized)
<400> 97
atggaaaaga acggtaacaa cagaaagttg agagtttgtg ttgctacttg taacagagct 60
gactactcca agttggctcc aatcatgttc ggtatcaaga ctgagccaga gttcttcgag 120
ttggacgttg ttgttttggg ttcccacttg attgatgact acggtaacac ttacagaatg 180
atcgagcagg acgacttcga catcaacact agattgcaca ctattgttag aggagaggac 240
gaagctgcta tggttgaatc tgttggattg gctttggtta agttgccaga cgttttgaac 300
agattgaagc cagacatcat gattgttcac ggtgacagat tcgatgcttt ggctttggct 360
acttccgctg ctttgatgaa cattagaatc ttgcacatcg agggtggtga agtttctggt 420
actatcgacg actccatcag acacgctatc actaagttgg ctcactacca tgtttgttgt 480
actagatccg ctgagcaaca cttgatttcc atgtgtgagg accacgacag aattttgttg 540
gctggttgtc catcttacga caagttgttg tccgctaaga acaaggacta catgtccatc 600
atcagaatgt ggttgggtga cgacgttaag tctaaggact acatcgttgc tttgcagcac 660
ccagttacta ctgacatcaa gcactccatc aagatgttcg agttgacttt ggacgctttg 720
atctccttca acaagagaac tttggttttg ttcccaaaca ttgacgctgg ttccaaagag 780
atggttagag ttatgagaaa gaagggtatc gaacaccacc caaacttcag agctgttaag 840
cacgttccat tcgaccaatt catccagttg gttgctcatg ctggttgtat gatcggtaac 900
tcctcctgtg gtgttagaga agttggtgct ttcggtactc cagttatcaa cttgggtact 960
agacagatcg gtagagagac tggagaaaac gttttgcatg ttagagatgc tgacactcag 1020
gacaagattt tgcaggcttt gcacttgcaa ttcggaaagc agtacccatg ttccaaaatc 1080
tacggtgacg gtaacgctgt tccaagaatc ttgaagtttt tgaagtccat cgacttgcaa 1140
gagccattgc agaagaagtt ctgtttccca ccagttaagg agaacatctc ccaggacatt 1200
gaccacatct tggagacatt gtccgctttg gctgttgatt tgggtggaac taacttgaga 1260
gttgctatcg tttccatgaa gggagagatc gttaagaagt acactcagtt caacccaaag 1320
acttacgagg agagaatcaa cttgatcttg cagatgtgtg ttgaagctgc tgctgaggct 1380
gttaagttga actgtagaat cttgggtgtt ggtatctcta ctggtggtag agttaatcca 1440
agagagggta tcgttttgca ctccactaag ttgattcagg agtggaactc cgttgatttg 1500
agaactccat tgtccgacac attgcacttg ccagtttggg ttgacaacga cggtaattgt 1560
gctgctttgg ctgagagaaa gttcggtcaa ggaaagggat tggagaactt cgttactttg 1620
atcactggta ctggtattgg tggtggtatc attcaccagc acgagttgat tcacggttct 1680
tccttctgtg ctgctgaatt gggacacttg gttgtttctt tggacggtcc agactgttct 1740
tgtggttccc acggttgtat tgaagcttac gcatcaggaa tggcattgca gagagaggct 1800
aagaagttgc acgacgagga cttgttgttg gttgagggaa tgtctgttcc aaaggacgag 1860
gctgttggtg ctttgcattt gatccaggct gctaagttgg gtaatgctaa ggctcagtcc 1920
atcttgagaa ctgctggtac tgctttggga ttgggtgttg ttaatatctt gcacactatg 1980
aacccatcct tggttatctt gtccggtgtt ttggcttctc actacatcca catcgttaag 2040
gacgttatca gacagcaagc tttgtcctcc gttcaagacg ttgatgttgt tgtttccgac 2100
ttggttgacc cagctttgtt gggtgctgct tccatggttt tggactacac tactagaaga 2160
atctactaat ag 2172
<210> 98
<211> 1302
<212> DNA
<213> Artificial Sequence
<220>
<223> Pichia pastoris TRP2: 5' and ORF
<400> 98
actgggcctt tagagggtgc tgaagttgac cccttggtgc ttctggaaaa agaactgaag 60
ggcaccagac aagcgcaact tcctggtatt cctcgtctaa gtggtggtgc cataggatac 120
atctcgtacg attgtattaa gtactttgaa ccaaaaactg aaagaaaact gaaagatgtt 180
ttgcaacttc cggaagcagc tttgatgttg ttcgacacga tcgtggcttt tgacaatgtt 240
tatcaaagat tccaggtaat tggaaacgtt tctctatccg ttgatgactc ggacgaagct 300
attcttgaga aatattataa gacaagagaa gaagtggaaa agatcagtaa agtggtattt 360
gacaataaaa ctgttcccta ctatgaacag aaagatatta ttcaaggcca aacgttcacc 420
tctaatattg gtcaggaagg gtatgaaaac catgttcgca agctgaaaga acatattctg 480
aaaggagaca tcttccaagc tgttccctct caaagggtag ccaggccgac ctcattgcac 540
cctttcaaca tctatcgtca tttgagaact gtcaatcctt ctccatacat gttctatatt 600
gactatctag acttccaagt tgttggtgct tcacctgaat tactagttaa atccgacaac 660
aacaacaaaa tcatcacaca tcctattgct ggaactcttc ccagaggtaa aactatcgaa 720
gaggacgaca attatgctaa gcaattgaag tcgtctttga aagacagggc cgagcacgtc 780
atgctggtag atttggccag aaatgatatt aaccgtgtgt gtgagcccac cagtaccacg 840
gttgatcgtt tattgactgt ggagagattt tctcatgtga tgcatcttgt gtcagaagtc 900
agtggaacat tgagaccaaa caagactcgc ttcgatgctt tcagatccat tttcccagca 960
ggtaccgtct ccggtgctcc gaaggtaaga gcaatgcaac tcataggaga attggaagga 1020
gaaaagagag gtgtttatgc gggggccgta ggacactggt cgtacgatgg aaaatcgatg 1080
gacacatgta ttgccttaag aacaatggtc gtcaaggacg gtgtcgctta ccttcaagcc 1140
ggaggtggaa ttgtctacga ttctgacccc tatgacgagt acatcgaaac catgaacaaa 1200
atgagatcca acaataacac catcttggag gctgagaaaa tctggaccga taggttggcc 1260
agagacgaga atcaaagtga atccgaagaa aacgatcaat ga 1302
<210> 99
<211> 1085
<212> DNA
<213> Artificial Sequence
<220>
<223> Pichia pastoris TRP2 3' region
<400> 99
acggaggacg taagtaggaa tttatgtaat catgccaata catctttaga tttcttcctc 60
ttctttttaa cgaaagacct ccagttttgc actctcgact ctctagtatc ttcccatttc 120
tgttgctgca acctcttgcc ttctgtttcc ttcaattgtt cttctttctt ctgttgcact 180
tggccttctt cctccatctt tcgttttttt tcaagccttt tcagcagttc ttcttccaag 240
agcagttctt tgattttctc tctccaatcc accaaaaaac tggatgaatt caaccgggca 300
tcatcaatgt tccactttct ttctcttatc aataatctac gtgcttcggc atacgaggaa 360
tccagttgct ccctaatcga gtcatccaca aggttagcat gggccttttt cagggtgtca 420
aaagcatctg gagctcgttt attcggagtc ttgtctggat ggatcagcaa agactttttg 480
cggaaagtct ttcttatatc ttccggagaa caacctggtt tcaaatccaa gatggcatag 540
ctgtccaatt tgaaagtgga aagaatcctg ccaatttcct tctctcgtgt cagctcgttc 600
tcctcctttt gcaacaggtc cacttcatct ggcatttttc tttatgttaa ctttaattat 660
tattaattat aaagttgatt atcgttatca aaataatcat attcgagaaa taatccgtcc 720
atgcaatata taaataagaa ttcataataa tgtaatgata acagtacctc tgatgacctt 780
tgatgaaccg caattttctt tccaatgaca agacatccct ataatacaat tatacagttt 840
atatatcaca aataatcacc tttttataag aaaaccgtcc tctccgtaac agaacttatt 900
atccgcacgt tatggttaac acactactaa taccgatata gtgtatgaag tcgctacgag 960
atagccatcc aggaaactta ccaattcatc agcactttca tgatccgatt gttggcttta 1020
ttctttgcga gacagatact tgccaatgaa ataactgatc ccacagatga gaatccggtg 1080
ctcgt 1085
<210> 100
<211> 747
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'-Region of STE13
<400> 100
ttgggggcct ccaggacttg ctgaaatttg ctgactcatc ttcgccatcc aaggataatg 60
agttagctaa tgtgacagtt aatgagtcgt cttgactaac ggggaacatt tcattattta 120
tatccagagt caatttgata gcagagtttg tggttgaaat acctatgatt cgggagactt 180
tgttgtaacg accattatcc acagtttgga ccgtgaaaat gtcatcgaag agagcagacg 240
acatattatc tattgtggta agtgatagtt ggaagtccga ctaaggcatg aaaatgagaa 300
gactgaaaat ttaaagtttt tgaaaacact aatcgggtaa taacttggaa attacgttta 360
cgtgccttta gctcttgtcc ttacccctga taatctatcc atttcccgag agacaatgac 420
atctcggaca gctgagaacc cgttcgatat agagcttcaa gagaatctaa gtccacgttc 480
ttccaattcg tccatattgg aaaacattaa tgagtatgct agaagacatc gcaatgattc 540
gctttcccaa gaatgtgata atgaagatga gaacgaaaat ctcaattata ctgataactt 600
ggccaagttt tcaaagtctg gagtatcaag aaagagctgt atgctaatat ttggtatttg 660
ctttgttatc tggctgtttc tctttgcctt gtatgcgagg gacaatcgat tttccaattt 720
gaacgagtac gttccagatt caaacag 747
<210> 101
<211> 924
<212> DNA
<213> Artificial Sequence
<220>
<223> 3'-Region of STE13
<400> 101
ctactgggaa ccacgagaca tcactgcagt agtttccaag tggatttcag atcactcatt 60
tgtgaatcct gacaaaactg cgatatgggg gtggtcttac ggtgggttca ctacgcttaa 120
gacattggaa tatgattctg gagaggtttt caaatatggt atggctgttg ctccagtaac 180
taattggctt ttgtatgact ccatctacac tgaaagatac atgaaccttc caaaggacaa 240
tgttgaaggc tacagtgaac acagcgtcat taagaaggtt tccaatttta agaatgtaaa 300
ccgattcttg gtttgtcacg ggactactga tgataacgtg cattttcaga acacactaac 360
cttactggac cagttcaata ttaatggtgt tgtgaattac gatcttcagg tgtatcccga 420
cagtgaacat agcattgccc atcacaacgc aaataaagtg atctacgaga ggttattcaa 480
gtggttagag cgggcattta acgatagatt tttgtaacat tccgtacttc atgccatact 540
atatatcctg caaggtttcc ctttcagaca caataattgc tttgcaattt tacataccac 600
caattggcaa aaataatctc ttcagtaagt tgaatgcttt tcaagccagc accgtgagaa 660
attgctacag cgcgcattct aacatcactt taaaattccc tcgccggtgc tcactggagt 720
ttccaaccct tagcttatca aaatcgggtg ataactctga gttttttttt tcacttctat 780
tcctaaacct tcgcccaatg ctaccacctc caatcaacat cccgaaatgg atagaagaga 840
atggacatct cttgcaacct ccggttaata attactgtct ccacagagga ggatttacgg 900
taatgattgt aggtgggcct aatg 924
<210> 102
<211> 980
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'-Region of DAP2
<400> 102
cacctgggcc tgttgctgct ggtactgctg ttggaactgt tggtattgtt gctgatctaa 60
ggccgcctgt tccacaccgt gtgtatcgaa tgcttgggca aaatcatcgc ctgccggagg 120
ccccactacc gcttgttcct cctgctcttg tttgttttgc tcattgatga tatcggcgtc 180
aatgaattga tcctcaatcg tgtggtggtg gtgtcgtgat tcctcttctt tcttgagtgc 240
cttatccata ttcctatctt agtgtaccaa taattttgtt aaacacacgc tgttgtttat 300
gaaaagtcgt caaaaggtta aaaattctac ttggtgtgtg tcagagaaag tagtgcagac 360
ccccagtttg ttgactagtt gagaaggcgg ctcactattg cgcgaatagc atgagaaatt 420
tgcaaacatc tggcaaagtg gtcaatacct gccaacctgc caatcttcgc gacggaggct 480
gttaagcggg ttgggttccc aaagtgaatg gatattacgg gcaggaaaaa cagccccttc 540
cacactagtc tttgctactg acatcttccc tctcatgtat cccgaacaca agtatcggga 600
gtatcaacgg agggtgccct tatggcagta ctccctgttg gtgattgtac tgctatacgg 660
gtctcatttg cttatcagca ccatcaactt gatacactat aaccacaaaa attatcatgc 720
acacccagtc aatagtggta tcgttcttaa tgagtttgct gatgacgatt cattctcttt 780
gaatggcact ctgaacttgg agaactggag aaatggtacc ttttccccta aatttcattc 840
cattcagtgg accgaaatag gtcaggaaga tgaccaggga tattacattc tctcttccaa 900
ttcctcttac atagtaaagt ctttatccga cccagacttt gaatctgttc tattcaacga 960
gtctacaatc acttacaacg 980
<210> 103
<211> 1117
<212> DNA
<213> Artificial Sequence
<220>
<223> 3'-Region of DAP2
<400> 103
ggcagcaaag ccttacgttg atgagaatag actggccatt tggggttggt cttatggagg 60
ttacatgacg ctaaaggttt tagaacagga taaaggtgaa acattcaaat atggaatgtc 120
tgttgcccct gtgacgaatt ggaaattcta tgattctatc tacacagaaa gatacatgca 180
cactcctcag gacaatccaa actattataa ttcgtcaatc catgagattg ataatttgaa 240
gggagtgaag aggttcttgc taatgcacgg aactggtgac gacaatgttc acttccaaaa 300
tacactcaaa gttctagatt tatttgattt acatggtctt gaaaactatg atatccacgt 360
gttccctgat agtgatcaca gtattagata tcacaacggt aatgttatag tgtatgataa 420
gctattccat tggattaggc gtgcattcaa ggctggcaaa taaataggtg caaaaatatt 480
attagacttt ttttttcgtt cgcaagttat tactgtgtac cataccgatc caatccgtat 540
tgtaattcat gttctagatc caaaatttgg gactctaatt catgaggtct aggaagatga 600
tcatctctat agttttcagc ggggggctcg atttgcggtt ggtcaaagct aacatcaaaa 660
tgtttgtcag gttcagtgaa tggtaactgc tgctcttgaa ttggtcgtct gacaaattct 720
ctaagtgata gcacttcatc tacaatcatt tgcttcatcg tttctatatc gtccacgacc 780
tcaaacgaga aatcgaattt ggaagaacag acgggctcat cgttaggatc atgccaaacc 840
ttgagatatg gatgctctaa agcctcagta actgtaattc tgtgagtggg atctaccgtg 900
agcattcgat ccagtaagtc tatcgcttca gggttggcac cgggaaataa ctggctgaat 960
gggatcttgg gcatgaatgg cagggagcga acataatcct gggcacgctc tgatctgata 1020
gactgaagtg tctcttccga aacagtaccc agcgtactca aaatcaagtt caattgatcc 1080
acatagtctc ttcctctaaa aatgggtcgg ccaccta 1117
<210> 104
<211> 1666
<212> DNA
<213> Artificial Sequence
<220>
<223> HYGR resistance cassette
<400> 104
gatctgttta gcttgcctcg tccccgccgg gtcacccggc cagcgacatg gaggcccaga 60
ataccctcct tgacagtctt gacgtgcgca gctcaggggc atgatgtgac tgtcgcccgt 120
acatttagcc catacatccc catgtataat catttgcatc catacatttt gatggccgca 180
cggcgcgaag caaaaattac ggctcctcgc tgcggacctg cgagcaggga aacgctcccc 240
tcacagacgc gttgaattgt ccccacgccg cgcccctgta gagaaatata aaaggttagg 300
atttgccact gaggttcttc tttcatatac ttccttttaa aatcttgcta ggatacagtt 360
ctcacatcac atccgaacat aaacaaccat gggtaaaaag cctgaactca ccgcgacgtc 420
tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc gacctgatgc agctctcgga 480
gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg cgtggatatg tcctgcgggt 540
aaatagctgc gccgatggtt tctacaaaga tcgttatgtt tatcggcact ttgcatcggc 600
cgcgctcccg attccggaag tgcttgacat tggggaattc agcgagagcc tgacctattg 660
catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg cctgaaaccg aactgcccgc 720
tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct gcggccgatc ttagccagac 780
gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa tacactacat ggcgtgattt 840
catatgcgcg attgctgatc cccatgtgta tcactggcaa actgtgatgg acgacaccgt 900
cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt tgggccgagg actgccccga 960
agtccggcac ctcgtgcacg cggatttcgg ctccaacaat gtcctgacgg acaatggccg 1020
cataacagcg gtcattgact ggagcgaggc gatgttcggg gattcccaat acgaggtcgc 1080
caacatcttc ttctggaggc cgtggttggc ttgtatggag cagcagacgc gctacttcga 1140
gcggaggcat ccggagcttg caggatcgcc gcggctccgg gcgtatatgc tccgcattgg 1200
tcttgaccaa ctctatcaga gcttggttga cggcaatttc gatgatgcag cttgggcgca 1260
gggtcgatgc gacgcaatcg tccgatccgg agccgggact gtcgggcgta cacaaatcgc 1320
ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa gtactcgccg atagtggaaa 1380
ccgacgcccc agcactcgtc cgagggcaaa ggaataatca gtactgacaa taaaaagatt 1440
cttgttttca agaacttgtc atttgtatag tttttttata ttgtagttgt tctattttaa 1500
tcaaatgtta gcgtgattta tatttttttt cgcctcgaca tcatctgccc agatgcgaag 1560
ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt gaatgctggt cgctatactg 1620
ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa cgagct 1666
<210> 105
<211> 365
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of Pichia pastoris TRP5 5' integration
fragment
<400> 105
acgacggcca aattcatgat acacactctg tttcagctgg tttggactac cctggagttg 60
gtcctgaatt ggctgcctgg aaagcaaatg gtagagccca attttccgct gtaactgatg 120
cccaagcatt agagggattc aaaatcctgt ctcaattgga agggatcatt ccagcactag 180
agtctagtca tgcaatctac ggcgcattgc aaattgcaaa gactatgtct tcggaccagt 240
ccttagttat taatgtatct ggaaggggtg ataaggacgt ccagagtgta gctgagattt 300
tacctaaatt gggacctcaa attggatggg atttgcgttt cagcgaagac attactaaag 360
agtga 365
<210> 106
<211> 613
<212> DNA
<213> Artificial Sequence
<220>
<223> Sequence of Pichia pastoris TRP5 3' integration
fragment
<400> 106
tcgatagcac aatattcaac ttgactgggt gttaagaact aagagctctg ggaaactttg 60
tatttattac taccaacaca gtcaaattat tggatgtgtt tttttttcca gtacatttca 120
ctgagcagtt tgttatactc ggtctttaat ctccatatac atgcagattg taatacagat 180
ctgaacagtt tgattctgat tgatcttgcc accaatattc tatttttgta tcaagtaaca 240
gagtcaatga tcattggtaa cgtaacggtt ttcgtgtata gtagttagag cccatcttgt 300
aacctcattt cctcccatat taaagtatca gtgattcgct ggaacgatta actaagaaaa 360
aaaaaatatc tgcacatact catcagtctg taaatctaag tcaaaactgc tgtatccaat 420
agaaatcggg atatacctgg atgttttttc cacataaaca aacgggagtt cagcttactt 480
atggtgttga tgcaattcag tatgatccta ccaataaaac gaaactttgg gattttggct 540
gtttgaggga tcaaaagctg cacctttaca agattgacgg atcgaccatt agaccaaagc 600
aaatggccac caa 613
<210> 107
<211> 384
<212> DNA
<213> Artificial Sequence
<220>
<223> Encodes human GM-CSF
<400> 107
ccagctagat ctccatctcc atccactcaa ccatgggaac acgttaacgc tatccaagag 60
gctttgagat tgttgaactt gtccagagac actgctgctg aaatgaacga gactgttgag 120
gttatctccg agatgttcga cttgcaagag ccaacttgtt tgcagactag attggagttg 180
tacaagcagg gattgagagg atccttgact aagttgaagg gaccattgac tatgatggct 240
tcccactaca agcaacactg tccaccaact ccagaaacat cctgtgctac tcagatcatc 300
actttcgagt ccttcaaaga gaacttgaag gacttcttgt tggttatccc attcgactgt 360
tgggaaccag ttcaagaata ataa 384
<210> 108
<211> 126
<212> PRT
<213> Homo sapiens
<400> 108
Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His Val Asn
1 5 10 15
Ala Ile Gln Glu Ala Leu Arg Leu Leu Asn Leu Ser Arg Asp Thr Ala
20 25 30
Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe Asp Leu
35 40 45
Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys Gln Gly
50 55 60
Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met Met Ala
65 70 75 80
Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser Cys Ala
85 90 95
Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys Asp Phe
100 105 110
Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu
115 120 125
<210> 109
<211> 1275
<212> DNA
<213> Artificial Sequence
<220>
<223> Encodes CWP1-GMCSF fusion protein
<400> 109
atgttcaacc tgaaaactat tctcatctca acacttgcat cgatcgctgt tgccgaccaa 60
accttcggtg tccttctaat ccggagtgga tccccatatc actattcgac tctcactaat 120
agagacgaaa agattgttgc tggaggtggc aacaaaaaag tgaccctcac agatgaggga 180
gctctgaagt atgatggtgg taaatggata ggtcttgatg atgatggcta tgcggtacag 240
accgacaaac cagttacagg ttggagcact aacggtggat acctctattt tgaccaaggc 300
ttaattgttt gcacggagga ctatatcgga tatgtgaaga aacatggtga atgcaaaggt 360
gacagctatg gtatggcttg gaaggtactc ccagccgacg atgacaagga tgatgacaag 420
gatgatgata aagatgatga caaggattat gacgatgaca atgaccacgg tgatggtgat 480
tactattgct cgatcacagg aacctatgcc atcaaatcca aaggcagtaa gcatcaatac 540
gaggccatca aaaaagttga tgcacatcct catgtcttct ctgtaggagg agatcaggga 600
aacgatctga ttgtgacttt ccaaaaggat tgttcgctgg tagatcaaga taacagaggc 660
gtatatgttg accctaattc tggagaagtc ggaaacgttg acccttgggg agaactcacg 720
ccatctgtta aatgggatat tgacgacgga tacctgatct ttaatggtga gtccaatttc 780
aggtcatgtc catctggtaa tggatattca ttgtctatca aggattgtgt tgggggaact 840
gacattggcc ttaaagtatg ggagaaaggt ggaggttctt tggttaagag ggctccagct 900
agatctccat ctccatccac tcaaccatgg gaacacgtta acgctatcca agaggctttg 960
agattgttga acttgtccag agacactgct gctgaaatga acgagactgt tgaggttatc 1020
tccgagatgt tcgacttgca agagccaact tgtttgcaga ctagattgga gttgtacaag 1080
cagggattga gaggatcctt gactaagttg aagggaccat tgactatgat ggcttcccac 1140
tacaagcaac actgtccacc aactccagaa acatcctgtg ctactcagat catcactttc 1200
gagtccttca aagagaactt gaaggacttc ttgttggtta tcccattcga ctgttgggaa 1260
ccagttcaag aataa 1275
<210> 110
<211> 424
<212> PRT
<213> Artificial Sequence
<220>
<223> CWP1-GMCSF fusion protein
<400> 110
Met Phe Asn Leu Lys Thr Ile Leu Ile Ser Thr Leu Ala Ser Ile Ala
1 5 10 15
Val Ala Asp Gln Thr Phe Gly Val Leu Leu Ile Arg Ser Gly Ser Pro
20 25 30
Tyr His Tyr Ser Thr Leu Thr Asn Arg Asp Glu Lys Ile Val Ala Gly
35 40 45
Gly Gly Asn Lys Lys Val Thr Leu Thr Asp Glu Gly Ala Leu Lys Tyr
50 55 60
Asp Gly Gly Lys Trp Ile Gly Leu Asp Asp Asp Gly Tyr Ala Val Gln
65 70 75 80
Thr Asp Lys Pro Val Thr Gly Trp Ser Thr Asn Gly Gly Tyr Leu Tyr
85 90 95
Phe Asp Gln Gly Leu Ile Val Cys Thr Glu Asp Tyr Ile Gly Tyr Val
100 105 110
Lys Lys His Gly Glu Cys Lys Gly Asp Ser Tyr Gly Met Ala Trp Lys
115 120 125
Val Leu Pro Ala Asp Asp Asp Lys Asp Asp Asp Lys Asp Asp Asp Lys
130 135 140
Asp Asp Asp Lys Asp Tyr Asp Asp Asp Asn Asp His Gly Asp Gly Asp
145 150 155 160
Tyr Tyr Cys Ser Ile Thr Gly Thr Tyr Ala Ile Lys Ser Lys Gly Ser
165 170 175
Lys His Gln Tyr Glu Ala Ile Lys Lys Val Asp Ala His Pro His Val
180 185 190
Phe Ser Val Gly Gly Asp Gln Gly Asn Asp Leu Ile Val Thr Phe Gln
195 200 205
Lys Asp Cys Ser Leu Val Asp Gln Asp Asn Arg Gly Val Tyr Val Asp
210 215 220
Pro Asn Ser Gly Glu Val Gly Asn Val Asp Pro Trp Gly Glu Leu Thr
225 230 235 240
Pro Ser Val Lys Trp Asp Ile Asp Asp Gly Tyr Leu Ile Phe Asn Gly
245 250 255
Glu Ser Asn Phe Arg Ser Cys Pro Ser Gly Asn Gly Tyr Ser Leu Ser
260 265 270
Ile Lys Asp Cys Val Gly Gly Thr Asp Ile Gly Leu Lys Val Trp Glu
275 280 285
Lys Gly Gly Gly Ser Leu Val Lys Arg Ala Pro Ala Arg Ser Pro Ser
290 295 300
Pro Ser Thr Gln Pro Trp Glu His Val Asn Ala Ile Gln Glu Ala Leu
305 310 315 320
Arg Leu Leu Asn Leu Ser Arg Asp Thr Ala Ala Glu Met Asn Glu Thr
325 330 335
Val Glu Val Ile Ser Glu Met Phe Asp Leu Gln Glu Pro Thr Cys Leu
340 345 350
Gln Thr Arg Leu Glu Leu Tyr Lys Gln Gly Leu Arg Gly Ser Leu Thr
355 360 365
Lys Leu Lys Gly Pro Leu Thr Met Met Ala Ser His Tyr Lys Gln His
370 375 380
Cys Pro Pro Thr Pro Glu Thr Ser Cys Ala Thr Gln Ile Ile Thr Phe
385 390 395 400
Glu Ser Phe Lys Glu Asn Leu Lys Asp Phe Leu Leu Val Ile Pro Phe
405 410 415
Asp Cys Trp Glu Pro Val Gln Glu
420
<210> 111
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> KEX2 linker
<400> 111
Gly Gly Gly Ser Leu Val Lys Arg
1 5
Claims (26)
- (a) 이종성 단일-서브유닛 리슈마니아 메이저(Leishmania major) STT3D 단백질 올리고사카릴트랜스퍼라제(oligosaccharyltransferase)를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하고, 이때 내인성 OTase 복합체를 구성하는 단백질을 코딩하는 내인성 피키아 파스토리스(Pichia pastoris) 숙주 세포 유전자가 발현되는 것인 피키아 파스토리스 숙주 세포를 제공하는 단계, 및
(b) 피키아 파스토리스 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계
를 포함하는, 피키아 파스토리스 숙주 세포에서 이종성 당단백질을 생산하는 방법. - 삭제
- 삭제
- 제1항에 있어서, 피키아 파스토리스 숙주 세포에 의해 생산된 이종성 당단백질의 70% 이상이, 완전히 점유된 N-글리코실화 부위를 갖는 것인 방법.
- 제1항에 있어서, 피키아 파스토리스 숙주 세포가 GlcNAcMan3GlcNAc2, GalGlcNAcMan3GlcNAc2, NANAGalGlcNAcMan3GlcNAc2, Man5GlcNAc2, GlcNAcMan5GlcNAc2, GalGlcNAcMan5GlcNAc2, 및 NANAGalGlcNAcMan5GlcNAc2로부터 선택된 하나 이상의 N-글리칸을 포함하는 당단백질을 생산하도록 유전자 조작된 것인 방법.
- 제1항에 있어서, 이종성 당단백질이 에리트로포이에틴 (EPO), 시토카인, 인터페론 α, 인터페론 β, 인터페론 γ, 인터페론 ω, 과립구-콜로니 자극 인자 (GCSF), 과립구 대식세포-콜로니 자극 인자 (GM-CSF), 응고 인자 VIII, 응고 인자 IX, 응고 인자 인간 단백질 C, 항트롬빈 III, 트롬빈, 가용성 IgE 수용체 α-사슬, IgG, IgG 단편, IgG 융합물, IgM, 이뮤노어드헤신, Fc 융합 단백질, 가용성 TNF 수용체-Fc 융합 단백질, RAGE-Fc 융합 단백질, 인터류킨, 유로키나제(urokinase), 키마제(chymase), 우레아 트립신 억제제, IGF-결합 단백질, 표피 성장 인자, 성장 호르몬-방출 인자, 아넥신 V 융합 단백질, 안지오스타틴, 혈관 내피 성장 인자-2, 골수성 전구세포 억제 인자-1, 오스테오프로테게린, α-1-항트립신, α-태아 단백질, DNase II, 인간 플라스미노겐의 크링글(kringle) 3, 글루코세레브로시다제(glucocerebrosidase), TNF 결합 단백질 1, 여포 자극 호르몬, 세포독성 T 림프구 관련 항원 4 - Ig, 막횡단 활성화제 및 칼슘 조정제, 시클로필린 리간드, 글루카곤 유사 단백질 1, 또는 IL-2 수용체 효능제인 방법.
- 제1항에 있어서, 이종성 당단백질이 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 또는 항-CD20 항체인 방법.
- 삭제
- 제1항에 있어서, 피키아 파스토리스가 알파-1,6-만노실트랜스퍼라제 활성을 결여한 och1 돌연변이체가 되도록 유전자 조작된 것인 방법.
- (a) 이종성 단일-서브유닛 리슈마니아 메이저 STT3D 단백질 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 당단백질을 코딩하는 핵산 분자를 포함하고, 이때 내인성 OTase 복합체를 코딩하는 재조합 피키아 파스토리스 숙주 세포 유전자가 발현되는 것인 재조합 피키아 파스토리스 숙주 세포를 제공하는 단계, 및
(b) 재조합 피키아 파스토리스 숙주 세포를 당단백질을 발현시키기 위한 조건 하에 배양하여 조성물 내의 당단백질 상의 N-글리코실화 부위의 70% 이상이 N-글리칸으로 점유된 조성물을 생산하는 단계
를 포함하는, 조성물 내의 당단백질 상의 N-글리코실화 부위의 70% 이상이 N-글리칸으로 점유된 당단백질 조성물을 생산하는 방법. - 삭제
- 삭제
- (a) 이종성 단일-서브유닛 리슈마니아 메이저 STT3D 단백질 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자; 및
(b) 이종성 당단백질을 코딩하는 제2 핵산 분자
를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 유전자를 발현하는 피키아 파스토리스 숙주 세포. - 삭제
- 삭제
- 제13항에 있어서, GlcNAcMan3GlcNAc2, GalGlcNAcMan3GlcNAc2, NANAGalGlcNAcMan3GlcNAc2, Man5GlcNAc2, GlcNAcMan5GlcNAc2, GalGlcNAcMan5GlcNAc2, 및 NANAGalGlcNAcMan5GlcNAc2로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 N-글리칸을 포함하는 당단백질을 생산하도록 유전자 조작된 피키아 파스토리스 숙주 세포.
- 제13항에 있어서, 이종성 당단백질이 에리트로포이에틴 (EPO), 시토카인, 인터페론 α, 인터페론 β, 인터페론 γ, 인터페론 ω, 과립구-콜로니 자극 인자 (GCSF), 과립구 대식세포-콜로니 자극 인자 (GM-CSF), 응고 인자 VIII, 응고 인자 IX, 응고 인자 인간 단백질 C, 항트롬빈 III, 트롬빈, 가용성 IgE 수용체 α-사슬, IgG, IgG 단편, IgG 융합물, IgM, 이뮤노어드헤신, Fc 융합 단백질, 가용성 TNF 수용체-Fc 융합 단백질, RAGE-Fc 융합 단백질, 인터류킨, 유로키나제(urokinase), 키마제(chymase), 우레아 트립신 억제제, IGF-결합 단백질, 표피 성장 인자, 성장 호르몬-방출 인자, 아넥신 V 융합 단백질, 안지오스타틴, 혈관 내피 성장 인자-2, 골수성 전구세포 억제 인자-1, 오스테오프로테게린, α-1-항트립신, α-태아 단백질, DNase II, 인간 플라스미노겐의 크링글(kringle) 3, 글루코세레브로시다제(glucocerebrosidase), TNF 결합 단백질 1, 여포 자극 호르몬, 세포독성 T 림프구 관련 항원 4 - Ig, 막횡단 활성화제 및 칼슘 조정제, 시클로필린 리간드, 글루카곤 유사 단백질 1, 또는 IL-2 수용체 효능제인 피키아 파스토리스 숙주 세포.
- 제13항에 있어서, 이종성 당단백질이 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 또는 항-CD20 항체인 피키아 파스토리스 숙주 세포.
- 삭제
- 제13항에 있어서, 피키아 파스토리스가 알파-1,6-만노실트랜스퍼라제 활성을 결여한 och1 돌연변이체가 되도록 유전자 조작된 것인 피키아 파스토리스 숙주 세포.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US30764210P | 2010-02-24 | 2010-02-24 | |
US61/307,642 | 2010-02-24 | ||
PCT/US2011/025878 WO2011106389A1 (en) | 2010-02-24 | 2011-02-23 | Method for increasing n-glycosylation site occupancy on therapeutic glycoproteins produced in pichia pastoris |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120134116A KR20120134116A (ko) | 2012-12-11 |
KR101930961B1 true KR101930961B1 (ko) | 2018-12-19 |
Family
ID=44507177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127022052A KR101930961B1 (ko) | 2010-02-24 | 2011-02-23 | 피키아 파스토리스에서 생산된 치료 당단백질 상의 n-글리코실화 부위 점유를 증가시키는 방법 |
Country Status (11)
Country | Link |
---|---|
US (2) | US8715963B2 (ko) |
EP (1) | EP2539430B1 (ko) |
JP (1) | JP5976549B2 (ko) |
KR (1) | KR101930961B1 (ko) |
CN (1) | CN102858949B (ko) |
AU (1) | AU2011220878A1 (ko) |
BR (1) | BR112012020882A2 (ko) |
CA (1) | CA2788992A1 (ko) |
MX (1) | MX2012009802A (ko) |
RU (1) | RU2012140429A (ko) |
WO (1) | WO2011106389A1 (ko) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11377485B2 (en) | 2009-12-02 | 2022-07-05 | Academia Sinica | Methods for modifying human antibodies by glycan engineering |
US10087236B2 (en) | 2009-12-02 | 2018-10-02 | Academia Sinica | Methods for modifying human antibodies by glycan engineering |
WO2011130332A1 (en) | 2010-04-12 | 2011-10-20 | Academia Sinica | Glycan arrays for high throughput screening of viruses |
KR20140091017A (ko) * | 2011-10-28 | 2014-07-18 | 머크 샤프 앤드 돔 코포레이션 | Alg3 발현이 결핍된 피키아 파스토리스 균주에서 n-글리칸 점유율을 증가시키고 하이브리드 n-글리칸의 생산을 감소시키는 방법 |
US9567596B2 (en) | 2012-01-05 | 2017-02-14 | Glykos Finland Oy | Protease deficient filamentous fungal cells and methods of use thereof |
DK2852610T3 (en) | 2012-05-23 | 2018-09-03 | Glykos Finland Oy | PRODUCTION OF FUCOSYLED GLYCOPROTEIN |
EP2854851A4 (en) * | 2012-06-01 | 2016-03-30 | Momenta Pharmaceuticals Inc | METHODS ASSOCIATED WITH TRASTUZUMAB |
CA2890048C (en) | 2012-12-03 | 2022-05-03 | Merck Sharp & Dohme Corp. | O-glycosylated carboxy terminal portion (ctp) peptide-based insulin and insulin analogues |
EP2931895A4 (en) * | 2012-12-17 | 2016-08-10 | Merck Sharp & Dohme | MUTANT CELLS PMT2, OCH1, PMT5 |
US9518100B2 (en) | 2013-02-13 | 2016-12-13 | Merck Sharp & Dohme Corp. | Methods for increasing N-glycan occupancy and reducing production of hybrid N-glycans in Pichia pastoris strains lacking Alg3 expression |
US10435704B2 (en) | 2013-06-04 | 2019-10-08 | Icon Genetics Gmbh | Method of co-expressing a glycoprotein and a single-subunit olicosaccharyltransferase in a plant |
EP3027752B1 (en) * | 2013-07-01 | 2018-08-08 | Biocon Limited | Signal sequence for protein expression in pichia pastoris |
SI3016970T1 (sl) | 2013-07-04 | 2019-08-30 | Glykos Finland Oy | Nitaste glivične celice brez O-manoziltransferaze in postopki za uporabo le-teh |
JP2016523552A (ja) | 2013-07-10 | 2016-08-12 | ノバルティス アーゲー | 多重プロテアーゼ欠損糸状菌細胞及びその使用方法 |
CN105492620A (zh) * | 2013-07-10 | 2016-04-13 | 诺华股份有限公司 | 具有增加的n糖基化占位的糖蛋白的生产 |
WO2015034920A2 (en) * | 2013-09-03 | 2015-03-12 | Sloan-Kettering Institute For Cancer Research | Granulocyte macrophage colony-stimulating factor compositions |
CN105682666B (zh) | 2013-09-06 | 2021-06-01 | 中央研究院 | 使用醣脂激活人类iNKT细胞 |
US10865416B2 (en) * | 2014-04-17 | 2020-12-15 | Boehringer Ingelheim Rcv Gmbh & Co Kg | Recombinant host cell engineered to overexpress helper proteins |
CA2950415A1 (en) | 2014-05-27 | 2015-12-03 | Academia Sinica | Anti-cd20 glycoantibodies and uses thereof |
KR102576850B1 (ko) | 2014-05-27 | 2023-09-11 | 아카데미아 시니카 | 박테로이드 기원의 푸코시다제 및 이의 사용 방법 |
JP7062361B2 (ja) * | 2014-05-27 | 2022-05-06 | アカデミア シニカ | 抗her2糖操作抗体群およびその使用 |
KR102494193B1 (ko) | 2014-05-28 | 2023-01-31 | 아카데미아 시니카 | 항-tnf-알파 글리코항체 및 이의 용도 |
WO2016012468A1 (en) * | 2014-07-21 | 2016-01-28 | Novartis Ag | Production of glycoproteins with mammalian-like n-glycans in filamentous fungi |
CN105779490A (zh) * | 2014-12-16 | 2016-07-20 | 北京集智新创科技有限公司 | 一种och1缺陷型抗cd20四价抗体表达毕赤酵母的构建方法 |
KR102007930B1 (ko) | 2014-12-31 | 2019-08-06 | 주식회사 엘지화학 | 재조합 당단백질의 글리코실화 조절 방법 |
US10495645B2 (en) | 2015-01-16 | 2019-12-03 | Academia Sinica | Cancer markers and methods of use thereof |
TWI736523B (zh) | 2015-01-24 | 2021-08-21 | 中央研究院 | 新穎聚醣結合物及其使用方法 |
US9932599B2 (en) | 2015-03-02 | 2018-04-03 | Synthetic Genomics, Inc. | Regulatory elements from labyrinthulomycetes microorganisms |
EP3334751A1 (en) * | 2015-08-13 | 2018-06-20 | Glykos Finland Oy | Regulatory protein deficient trichoderma cells and methods of use thereof |
CN105087405A (zh) * | 2015-09-17 | 2015-11-25 | 杭州研真生物科技有限公司 | 一种毕赤酵母低糖基化突变菌株及其应用 |
EP3442584B1 (en) | 2016-03-15 | 2021-07-28 | Seagen Inc. | Combinations of pbd-based antibody drug conjugates with bcl-2 inhibitors |
WO2017210621A1 (en) | 2016-06-03 | 2017-12-07 | Seattle Genetics, Inc. | Combination of cd33 antibody drug conjugates with chemotherapeutic agents |
WO2017214433A1 (en) | 2016-06-09 | 2017-12-14 | Seattle Genetics, Inc. | Combinations of pbd-based antibody drug conjugates with flt3 inhibitors |
WO2018013551A1 (en) * | 2016-07-11 | 2018-01-18 | Massachusetts Institute Of Technology | Tools for next generation komagataella (pichia) engineering |
EP3500594A4 (en) | 2016-08-22 | 2020-03-11 | Cho Pharma Inc. | ANTIBODIES, BINDING FRAGMENTS AND METHOD FOR USE |
US10633454B2 (en) | 2016-11-01 | 2020-04-28 | Conagen Inc. | Expression of modified glycoproteins and glycopeptides |
US11802289B2 (en) * | 2017-08-03 | 2023-10-31 | Plantform Corporation | Transient silencing of ARGONAUTE1 and ARGONAUTE4 to increase recombinant protein expression in plants |
US11674125B2 (en) | 2017-12-18 | 2023-06-13 | The General Hospital Corporation | Glycoengineering |
WO2019213095A1 (en) * | 2018-05-01 | 2019-11-07 | Conagen Inc. | Recombinant organisms and methods for producing glycomolecules with high glycan occupancy |
CN112041456A (zh) * | 2018-05-01 | 2020-12-04 | 科纳根公司 | 用于产生具有低硫酸化的糖分子的重组生物体和方法 |
JP2022502018A (ja) * | 2018-09-24 | 2022-01-11 | オルタ ドグ テクニク ユニヴェルシテシ | 改変されたaox1プロモータバリアント |
US11110132B2 (en) * | 2018-11-09 | 2021-09-07 | Ohio State Innovation Foundation | Live attenuated parasitic vaccine |
CN114207122A (zh) * | 2019-08-09 | 2022-03-18 | 葛兰素史克生物有限公司 | 突变的pglb寡糖基转移酶 |
CN113549560B (zh) * | 2020-04-24 | 2024-02-13 | 中国人民解放军军事科学院军事医学研究院 | 一种用于糖蛋白制备的工程化酵母构建方法及其菌株 |
CA3226465A1 (en) * | 2021-07-23 | 2023-01-26 | Logan HURST | Protein compositions and methods of production |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4816567A (en) | 1983-04-08 | 1989-03-28 | Genentech, Inc. | Recombinant immunoglobin preparations |
US5037750A (en) | 1984-11-27 | 1991-08-06 | Igen, Inc. | Method for producing antibodies which catalyze chemical reactions |
US5156965A (en) | 1983-11-29 | 1992-10-20 | Igen, Inc. | Catalytic antibodies |
JP2540508B2 (ja) | 1983-11-29 | 1996-10-02 | イージエン・インコーポレイテッド | 化学反応を触媒する方法 |
US4818700A (en) | 1985-10-25 | 1989-04-04 | Phillips Petroleum Company | Pichia pastoris argininosuccinate lyase gene and uses thereof |
DE4226971C2 (de) | 1992-08-14 | 1997-01-16 | Widmar Prof Dr Tanner | Modifizierte Pilzzellen und Verfahren zur Herstellung rekombinanter Produkte |
US5733757A (en) | 1995-12-15 | 1998-03-31 | The Scripps Research Institute | Aldolase catalytic antibody |
US20040136986A1 (en) | 1997-10-31 | 2004-07-15 | Genentech, Inc. | Methods and compositions comprising glycoprotein glycoforms |
DK2180007T4 (da) | 1998-04-20 | 2017-11-27 | Roche Glycart Ag | Glycosyleringsteknik for antistoffer til forbedring af antistofafhængig cellecytotoxicitet |
EP2264177B1 (en) | 1998-12-09 | 2015-09-30 | Phyton Holdings, LLC | Glycoproteins having human-type glycosylation |
US6949372B2 (en) | 1999-03-02 | 2005-09-27 | The Johns Hopkins University | Engineering intracellular sialylation pathways |
AU765753B2 (en) | 1999-05-17 | 2003-09-25 | Conjuchem Biotechnologies Inc. | Protection of endogenous therapeutic peptides from peptidase activity through conjugation to blood components |
ES2209885T3 (es) | 1999-05-17 | 2004-07-01 | Conjuchem, Inc. | Peptidos insulinotropicos de larga duracion. |
AU2001256762A1 (en) | 2000-05-17 | 2001-11-26 | Mitsubishi Pharma Corporation | Process for producing protein with reduction of acidic sugar chain and glycoprotein produced thereby |
US7863020B2 (en) | 2000-06-28 | 2011-01-04 | Glycofi, Inc. | Production of sialylated N-glycans in lower eukaryotes |
WO2002000879A2 (en) | 2000-06-28 | 2002-01-03 | Glycofi, Inc. | Methods for producing modified glycoproteins |
US7598055B2 (en) | 2000-06-28 | 2009-10-06 | Glycofi, Inc. | N-acetylglucosaminyltransferase III expression in lower eukaryotes |
US7795002B2 (en) | 2000-06-28 | 2010-09-14 | Glycofi, Inc. | Production of galactosylated glycoproteins in lower eukaryotes |
US8697394B2 (en) | 2000-06-28 | 2014-04-15 | Glycofi, Inc. | Production of modified glycoproteins having multiple antennary structures |
US7449308B2 (en) | 2000-06-28 | 2008-11-11 | Glycofi, Inc. | Combinatorial DNA library for producing modified N-glycans in lower eukaryotes |
US7625756B2 (en) | 2000-06-28 | 2009-12-01 | GycoFi, Inc. | Expression of class 2 mannosidase and class III mannosidase in lower eukaryotic cells |
AU2002337935B2 (en) | 2001-10-25 | 2008-05-01 | Genentech, Inc. | Glycoprotein compositions |
US8932825B2 (en) | 2001-12-27 | 2015-01-13 | Glycofi Inc. | Method to engineer mammalian-type carbohydrate structures |
WO2003085107A1 (fr) | 2002-04-09 | 2003-10-16 | Kyowa Hakko Kogyo Co., Ltd. | Cellules à génome modifié |
US7781197B2 (en) | 2002-12-20 | 2010-08-24 | Greenovation Biotech Gmbh | Transformed bryophyte cell having disrupted endogenous alpha 1,3-fucosyl and beta 1,2-xylosyl transferase encoding nucleotide sequences for the production of heterologous glycosylated proteins |
US7332299B2 (en) | 2003-02-20 | 2008-02-19 | Glycofi, Inc. | Endomannosidases in the modification of glycoproteins in eukaryotes |
US7514253B2 (en) | 2003-05-16 | 2009-04-07 | Glycofi, Inc. | URA5 gene and methods for stable genetic integration in yeast |
WO2005047334A1 (en) | 2003-11-13 | 2005-05-26 | Hanmi Pharmaceutical. Co., Ltd. | Igg fc fragment for a drug carrier and method for the preparation thereof |
US7405198B2 (en) * | 2003-11-24 | 2008-07-29 | Neose Technologies, Inc. | Glycopegylated erythropoietin |
JP4861830B2 (ja) | 2003-12-24 | 2012-01-25 | グライコフィ, インコーポレイテッド | 糖タンパク質の産生において、グリカンのマンノシルリン酸化を除去する方法 |
US7479389B2 (en) | 2004-03-02 | 2009-01-20 | Glycofi, Inc. | ARG1, ARG2, ARG3, HIS1, HIS2, HIS5, HIS6 genes and methods for stable genetic integration |
JP4932699B2 (ja) | 2004-03-17 | 2012-05-16 | グライコフィ, インコーポレイテッド | 真菌および酵母におけるシチジンモノホスフェート−シアル酸合成経路を操作する方法 |
WO2005106010A2 (en) | 2004-04-29 | 2005-11-10 | Glycofi, Inc. | Methods for reducing or eliminating alpha-mannosidase resistant glycans in the production of glycoproteins |
US7004906B1 (en) | 2004-07-26 | 2006-02-28 | Siemens Medical Solutions Usa, Inc. | Contrast agent imaging with agent specific ultrasound detection |
US20060252672A1 (en) * | 2005-04-05 | 2006-11-09 | Betenbaugh Michael J | Protein N-glycosylation of eukaryotic cells using dolichol-linked oligosaccharide synthesis pathway, other N-gylosylation-increasing methods, and engineered hosts expressing products with increased N-glycosylation |
KR100754667B1 (ko) | 2005-04-08 | 2007-09-03 | 한미약품 주식회사 | 비펩타이드성 중합체로 개질된 면역글로불린 Fc 단편 및이를 포함하는 약제학적 조성물 |
ES2348857T3 (es) | 2005-07-12 | 2010-12-03 | Greenovation Biotech Gmbh | Mejoras en o relacionadas con la produccion de proteinas. |
US8206949B2 (en) | 2005-11-15 | 2012-06-26 | Glycofi, Inc. | Production of glycoproteins with reduced O-glycosylation |
JP5424871B2 (ja) | 2006-05-19 | 2014-02-26 | グライコフィ, インコーポレイテッド | 組換えベクター |
EP1878747A1 (en) | 2006-07-11 | 2008-01-16 | greenovation Biotech GmbH | Glyco-engineered antibodies |
CA2679732A1 (en) | 2007-03-07 | 2008-09-18 | Glycofi, Inc. | Production of glycoproteins with modified fucosylation |
US8026083B2 (en) * | 2007-04-03 | 2011-09-27 | Oxyrane Uk Limited | Yarrowia lipolytica and Pichia pastoris HAC1 nucleic acids |
CN101903531B (zh) | 2007-12-19 | 2013-09-18 | 格利科菲公司 | 用于蛋白质生产的酵母菌株 |
EP2245151B1 (en) | 2008-02-20 | 2014-12-24 | GlycoFi, Inc. | Vectors and yeast strains for protein production |
MX2011001706A (es) | 2008-08-12 | 2011-03-24 | Glycofi Inc | Vectores mejorados y cepas de levadura para produccion de proteina: sobreexpresion de ca2+ atpasa. |
TW201028431A (en) | 2008-10-31 | 2010-08-01 | Lonza Ag | Novel tools for the production of glycosylated proteins in host cells |
WO2010099186A1 (en) * | 2009-02-25 | 2010-09-02 | Merck Sharp & Dohme Corp. | Her2 antibody compositions |
-
2011
- 2011-02-23 US US13/579,972 patent/US8715963B2/en active Active
- 2011-02-23 AU AU2011220878A patent/AU2011220878A1/en not_active Abandoned
- 2011-02-23 RU RU2012140429/10A patent/RU2012140429A/ru not_active Application Discontinuation
- 2011-02-23 BR BR112012020882A patent/BR112012020882A2/pt not_active IP Right Cessation
- 2011-02-23 EP EP11747972.5A patent/EP2539430B1/en active Active
- 2011-02-23 MX MX2012009802A patent/MX2012009802A/es not_active Application Discontinuation
- 2011-02-23 JP JP2012555104A patent/JP5976549B2/ja active Active
- 2011-02-23 KR KR1020127022052A patent/KR101930961B1/ko active IP Right Grant
- 2011-02-23 CA CA2788992A patent/CA2788992A1/en not_active Abandoned
- 2011-02-23 CN CN201180011130.XA patent/CN102858949B/zh active Active
- 2011-02-23 WO PCT/US2011/025878 patent/WO2011106389A1/en active Application Filing
-
2014
- 2014-02-17 US US14/181,786 patent/US20140227290A1/en not_active Abandoned
Non-Patent Citations (1)
Title |
---|
Molecular Biology of the Cell. Vol. 19, No. 9, 페이지 3758-3768 (2008.09.)* |
Also Published As
Publication number | Publication date |
---|---|
EP2539430A4 (en) | 2014-02-12 |
US8715963B2 (en) | 2014-05-06 |
US20120328626A1 (en) | 2012-12-27 |
WO2011106389A1 (en) | 2011-09-01 |
AU2011220878A1 (en) | 2012-08-23 |
JP2013520205A (ja) | 2013-06-06 |
EP2539430B1 (en) | 2016-09-14 |
JP5976549B2 (ja) | 2016-08-24 |
RU2012140429A (ru) | 2014-03-27 |
US20140227290A1 (en) | 2014-08-14 |
KR20120134116A (ko) | 2012-12-11 |
CA2788992A1 (en) | 2011-09-01 |
CN102858949A (zh) | 2013-01-02 |
CN102858949B (zh) | 2016-07-06 |
BR112012020882A2 (pt) | 2015-11-03 |
EP2539430A1 (en) | 2013-01-02 |
MX2012009802A (es) | 2012-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101930961B1 (ko) | 피키아 파스토리스에서 생산된 치료 당단백질 상의 n-글리코실화 부위 점유를 증가시키는 방법 | |
AU2010218139B2 (en) | Metabolic engineering of a galactose assimilation pathway in the glycoengineered yeast Pichia pastoris | |
EP2771479B1 (en) | Methods for increasing n-glycan occupancy and reducing production of hybrid n-glycans in pichia pastoris strains lacking alg3 expression | |
KR20120084734A (ko) | 숙주 세포 항원에 대한 항체에 대한 검출가능한 교차 결합 활성이 결여된 단백질을 피키아 파스토리스에서 생산하는 방법 | |
US9518100B2 (en) | Methods for increasing N-glycan occupancy and reducing production of hybrid N-glycans in Pichia pastoris strains lacking Alg3 expression | |
US20110313137A1 (en) | Her2 antibody compositions | |
KR20140114278A (ko) | 변형된 o-글리코실화를 갖는 단백질의 생산을 위한 효모 균주 | |
KR20140134272A (ko) | 효모에서 만노실트랜스퍼라제 활성을 감소시키는 방법 | |
AU2013363266A1 (en) | pmt2, och1, pmt5 Mutant Cells | |
AU2012238203A1 (en) | Metabolic engineering of a galactose assimilation pathway in the glycoengineered yeast pichia pastoris | |
Class et al. | Patent application title: PMT2-, OCH1-, PMT5-MUTANT CELLS Inventors: Ming-Tang Chen (Lebanon, NH, US) Ming-Tang Chen (Bedford, NH, US) Byung-Kwon Choi (Norwich, VT, US) Byung-Kwon Choi (Lebanon, NH, US) Robert Davidson (Enfield, NH, US) Robert Davidson |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |