KR20070004585A - 2-미크론 패밀리 플라스미드 및 이의 용도 - Google Patents
2-미크론 패밀리 플라스미드 및 이의 용도 Download PDFInfo
- Publication number
- KR20070004585A KR20070004585A KR1020067014724A KR20067014724A KR20070004585A KR 20070004585 A KR20070004585 A KR 20070004585A KR 1020067014724 A KR1020067014724 A KR 1020067014724A KR 20067014724 A KR20067014724 A KR 20067014724A KR 20070004585 A KR20070004585 A KR 20070004585A
- Authority
- KR
- South Korea
- Prior art keywords
- plasmid
- protein
- sequence
- gene
- family
- Prior art date
Links
- 239000013612 plasmid Substances 0.000 title claims abstract description 533
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 427
- 238000003780 insertion Methods 0.000 claims abstract description 177
- 230000037431 insertion Effects 0.000 claims abstract description 177
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 93
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 93
- 239000002157 polynucleotide Substances 0.000 claims abstract description 93
- 238000012217 deletion Methods 0.000 claims abstract description 81
- 230000037430 deletion Effects 0.000 claims abstract description 81
- 238000006467 substitution reaction Methods 0.000 claims abstract description 78
- 101150042777 flp gene Proteins 0.000 claims abstract description 53
- 101100194345 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) REP2 gene Proteins 0.000 claims abstract description 37
- 108020004705 Codon Proteins 0.000 claims abstract description 26
- 102000004169 proteins and genes Human genes 0.000 claims description 287
- 235000018102 proteins Nutrition 0.000 claims description 285
- 210000004027 cell Anatomy 0.000 claims description 154
- 239000012634 fragment Substances 0.000 claims description 131
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 119
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 118
- 101710084218 Master replication protein Proteins 0.000 claims description 97
- 101710112078 Para-Rep C2 Proteins 0.000 claims description 97
- 101710119961 Trans-acting factor C Proteins 0.000 claims description 90
- 102100022880 Rab proteins geranylgeranyltransferase component A 2 Human genes 0.000 claims description 86
- 101001059240 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Site-specific recombinase Flp Proteins 0.000 claims description 80
- 108700026244 Open Reading Frames Proteins 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 76
- 239000003550 marker Substances 0.000 claims description 47
- 239000012581 transferrin Substances 0.000 claims description 42
- 108090000901 Transferrin Proteins 0.000 claims description 41
- 230000014616 translation Effects 0.000 claims description 41
- 102000009027 Albumins Human genes 0.000 claims description 40
- 108010088751 Albumins Proteins 0.000 claims description 40
- 102000004338 Transferrin Human genes 0.000 claims description 40
- 230000014509 gene expression Effects 0.000 claims description 30
- 108010006519 Molecular Chaperones Proteins 0.000 claims description 28
- 108091026890 Coding region Proteins 0.000 claims description 27
- 230000012010 growth Effects 0.000 claims description 26
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 24
- 102100023431 E3 ubiquitin-protein ligase TRIM21 Human genes 0.000 claims description 23
- 101000685877 Homo sapiens E3 ubiquitin-protein ligase TRIM21 Proteins 0.000 claims description 23
- 101000852539 Homo sapiens Importin-5 Proteins 0.000 claims description 23
- 102100036340 Importin-5 Human genes 0.000 claims description 23
- 241000235070 Saccharomyces Species 0.000 claims description 23
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 23
- 239000001963 growth medium Substances 0.000 claims description 22
- 102100022460 Alpha-1-acid glycoprotein 2 Human genes 0.000 claims description 19
- 101000678191 Homo sapiens Alpha-1-acid glycoprotein 2 Proteins 0.000 claims description 19
- 239000002609 medium Substances 0.000 claims description 19
- 230000009471 action Effects 0.000 claims description 18
- 210000005253 yeast cell Anatomy 0.000 claims description 17
- 101150101654 PSR1 gene Proteins 0.000 claims description 16
- 230000012846 protein folding Effects 0.000 claims description 16
- 239000006152 selective media Substances 0.000 claims description 16
- 101100020663 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) ppm-1 gene Proteins 0.000 claims description 15
- 239000002773 nucleotide Substances 0.000 claims description 14
- 125000003729 nucleotide group Chemical group 0.000 claims description 14
- 241000894007 species Species 0.000 claims description 14
- 230000004048 modification Effects 0.000 claims description 13
- 238000012986 modification Methods 0.000 claims description 13
- 238000012258 culturing Methods 0.000 claims description 12
- 238000004519 manufacturing process Methods 0.000 claims description 12
- 241000235648 Pichia Species 0.000 claims description 11
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 claims description 11
- 241000235649 Kluyveromyces Species 0.000 claims description 10
- 241000235017 Zygosaccharomyces Species 0.000 claims description 10
- 239000003085 diluting agent Substances 0.000 claims description 10
- 108020003519 protein disulfide isomerase Proteins 0.000 claims description 10
- -1 tPA Proteins 0.000 claims description 10
- 108010063045 Lactoferrin Proteins 0.000 claims description 8
- 102000010445 Lactoferrin Human genes 0.000 claims description 8
- CSSYQJWUGATIHM-IKGCZBKSSA-N l-phenylalanyl-l-lysyl-l-cysteinyl-l-arginyl-l-arginyl-l-tryptophyl-l-glutaminyl-l-tryptophyl-l-arginyl-l-methionyl-l-lysyl-l-lysyl-l-leucylglycyl-l-alanyl-l-prolyl-l-seryl-l-isoleucyl-l-threonyl-l-cysteinyl-l-valyl-l-arginyl-l-arginyl-l-alanyl-l-phenylal Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CSSYQJWUGATIHM-IKGCZBKSSA-N 0.000 claims description 8
- 229940078795 lactoferrin Drugs 0.000 claims description 8
- 235000021242 lactoferrin Nutrition 0.000 claims description 8
- 101000685886 Homo sapiens RNA-binding protein RO60 Proteins 0.000 claims description 7
- 102100023433 RNA-binding protein RO60 Human genes 0.000 claims description 7
- 241000235033 Zygosaccharomyces rouxii Species 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 108020001507 fusion proteins Proteins 0.000 claims description 7
- 102000037865 fusion proteins Human genes 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 6
- 108090000204 Dipeptidase 1 Proteins 0.000 claims description 6
- 102000003951 Erythropoietin Human genes 0.000 claims description 6
- 108090000394 Erythropoietin Proteins 0.000 claims description 6
- 108060003951 Immunoglobulin Proteins 0.000 claims description 6
- 101100451681 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SSA4 gene Proteins 0.000 claims description 6
- 102000036693 Thrombopoietin Human genes 0.000 claims description 6
- 108010041111 Thrombopoietin Proteins 0.000 claims description 6
- 230000001580 bacterial effect Effects 0.000 claims description 6
- 150000001720 carbohydrates Chemical class 0.000 claims description 6
- 229940105423 erythropoietin Drugs 0.000 claims description 6
- 102000018358 immunoglobulin Human genes 0.000 claims description 6
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 claims description 6
- 230000002103 transcriptional effect Effects 0.000 claims description 6
- 230000004906 unfolded protein response Effects 0.000 claims description 6
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 claims description 5
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 claims description 5
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 5
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 5
- 101100451671 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SSA3 gene Proteins 0.000 claims description 5
- 241000235029 Zygosaccharomyces bailii Species 0.000 claims description 5
- 230000007812 deficiency Effects 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 5
- 101150003194 CPR6 gene Proteins 0.000 claims description 4
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 claims description 4
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 claims description 4
- 101000845188 Homo sapiens Tetratricopeptide repeat protein 4 Proteins 0.000 claims description 4
- 101000664600 Homo sapiens Tripartite motif-containing protein 3 Proteins 0.000 claims description 4
- 241000235031 Lachancea fermentati Species 0.000 claims description 4
- 102100031279 Tetratricopeptide repeat protein 4 Human genes 0.000 claims description 4
- 102100038798 Tripartite motif-containing protein 3 Human genes 0.000 claims description 4
- 238000005520 cutting process Methods 0.000 claims description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims description 4
- 102100028814 ATP synthase mitochondrial F1 complex assembly factor 1 Human genes 0.000 claims description 3
- 102100022463 Alpha-1-acid glycoprotein 1 Human genes 0.000 claims description 3
- 102000007625 Hirudins Human genes 0.000 claims description 3
- 108010007267 Hirudins Proteins 0.000 claims description 3
- 101000789413 Homo sapiens ATP synthase mitochondrial F1 complex assembly factor 1 Proteins 0.000 claims description 3
- 101000678195 Homo sapiens Alpha-1-acid glycoprotein 1 Proteins 0.000 claims description 3
- 102100030951 Tissue factor pathway inhibitor Human genes 0.000 claims description 3
- 229940006607 hirudin Drugs 0.000 claims description 3
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 claims description 3
- 102100024341 10 kDa heat shock protein, mitochondrial Human genes 0.000 claims description 2
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 claims description 2
- 102100027520 ATP synthase mitochondrial F1 complex assembly factor 2 Human genes 0.000 claims description 2
- 102100032382 Activator of 90 kDa heat shock protein ATPase homolog 1 Human genes 0.000 claims description 2
- 101710162400 Activator of 90 kDa heat shock protein ATPase homolog 1 Proteins 0.000 claims description 2
- 102000004411 Antithrombin III Human genes 0.000 claims description 2
- 108090000935 Antithrombin III Proteins 0.000 claims description 2
- 108010039627 Aprotinin Proteins 0.000 claims description 2
- 102100029464 Aquaporin-9 Human genes 0.000 claims description 2
- 101150105736 BTT1 gene Proteins 0.000 claims description 2
- 102000004506 Blood Proteins Human genes 0.000 claims description 2
- 108010017384 Blood Proteins Proteins 0.000 claims description 2
- 102400000113 Calcitonin Human genes 0.000 claims description 2
- 108060001064 Calcitonin Proteins 0.000 claims description 2
- 102100034663 Caseinolytic peptidase B protein homolog Human genes 0.000 claims description 2
- 108010059013 Chaperonin 10 Proteins 0.000 claims description 2
- 108010058432 Chaperonin 60 Proteins 0.000 claims description 2
- 102000003914 Cholinesterases Human genes 0.000 claims description 2
- 108090000322 Cholinesterases Proteins 0.000 claims description 2
- 102100022641 Coagulation factor IX Human genes 0.000 claims description 2
- 102100023804 Coagulation factor VII Human genes 0.000 claims description 2
- 102000008186 Collagen Human genes 0.000 claims description 2
- 108010035532 Collagen Proteins 0.000 claims description 2
- 102100035966 DnaJ homolog subfamily A member 2 Human genes 0.000 claims description 2
- 108010079505 Endostatins Proteins 0.000 claims description 2
- 108010041308 Endothelial Growth Factors Proteins 0.000 claims description 2
- 101150021185 FGF gene Proteins 0.000 claims description 2
- 108010076282 Factor IX Proteins 0.000 claims description 2
- 108010023321 Factor VII Proteins 0.000 claims description 2
- 108010054218 Factor VIII Proteins 0.000 claims description 2
- 102000001690 Factor VIII Human genes 0.000 claims description 2
- 108010014173 Factor X Proteins 0.000 claims description 2
- 108010071289 Factor XIII Proteins 0.000 claims description 2
- 108010049003 Fibrinogen Proteins 0.000 claims description 2
- 102000008946 Fibrinogen Human genes 0.000 claims description 2
- 101100164983 Gallus gallus ATXN3 gene Proteins 0.000 claims description 2
- 108060003199 Glucagon Proteins 0.000 claims description 2
- 102400000321 Glucagon Human genes 0.000 claims description 2
- 108010088406 Glucagon-Like Peptides Proteins 0.000 claims description 2
- 102100025326 Golgin-45 Human genes 0.000 claims description 2
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 claims description 2
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 claims description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 claims description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 claims description 2
- 108010051696 Growth Hormone Proteins 0.000 claims description 2
- 102100030488 HEAT repeat-containing protein 6 Human genes 0.000 claims description 2
- 101150068227 HSP104 gene Proteins 0.000 claims description 2
- 101150007068 HSP81-1 gene Proteins 0.000 claims description 2
- 101150087422 HSP82 gene Proteins 0.000 claims description 2
- 101000936108 Homo sapiens ATP synthase mitochondrial F1 complex assembly factor 2 Proteins 0.000 claims description 2
- 101000771413 Homo sapiens Aquaporin-9 Proteins 0.000 claims description 2
- 101100122513 Homo sapiens BLZF1 gene Proteins 0.000 claims description 2
- 101000946436 Homo sapiens Caseinolytic peptidase B protein homolog Proteins 0.000 claims description 2
- 101000931210 Homo sapiens DnaJ homolog subfamily A member 2 Proteins 0.000 claims description 2
- 101000921370 Homo sapiens Elongation of very long chain fatty acids protein 1 Proteins 0.000 claims description 2
- 101000990566 Homo sapiens HEAT repeat-containing protein 6 Proteins 0.000 claims description 2
- 101000777670 Homo sapiens Hsp90 co-chaperone Cdc37 Proteins 0.000 claims description 2
- 101000957559 Homo sapiens Matrin-3 Proteins 0.000 claims description 2
- 101001030243 Homo sapiens Myosin-7 Proteins 0.000 claims description 2
- 101000836873 Homo sapiens Nucleotide exchange factor SIL1 Proteins 0.000 claims description 2
- 101000579484 Homo sapiens Period circadian protein homolog 1 Proteins 0.000 claims description 2
- 101000801684 Homo sapiens Phospholipid-transporting ATPase ABCA1 Proteins 0.000 claims description 2
- 101001126582 Homo sapiens Post-GPI attachment to proteins factor 3 Proteins 0.000 claims description 2
- 101000605345 Homo sapiens Prefoldin subunit 1 Proteins 0.000 claims description 2
- 101000797990 Homo sapiens Putative activator of 90 kDa heat shock protein ATPase homolog 2 Proteins 0.000 claims description 2
- 101001109419 Homo sapiens RNA-binding protein NOB1 Proteins 0.000 claims description 2
- 101000837443 Homo sapiens T-complex protein 1 subunit beta Proteins 0.000 claims description 2
- 101000653567 Homo sapiens T-complex protein 1 subunit delta Proteins 0.000 claims description 2
- 101000653663 Homo sapiens T-complex protein 1 subunit epsilon Proteins 0.000 claims description 2
- 101000713879 Homo sapiens T-complex protein 1 subunit eta Proteins 0.000 claims description 2
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 claims description 2
- 101000835696 Homo sapiens T-complex protein 1 subunit theta Proteins 0.000 claims description 2
- 101000653469 Homo sapiens T-complex protein 1 subunit zeta Proteins 0.000 claims description 2
- 101150050258 Hsp26 gene Proteins 0.000 claims description 2
- 101150028525 Hsp83 gene Proteins 0.000 claims description 2
- 102100031568 Hsp90 co-chaperone Cdc37 Human genes 0.000 claims description 2
- 108090001061 Insulin Proteins 0.000 claims description 2
- 102100023915 Insulin Human genes 0.000 claims description 2
- 102000006992 Interferon-alpha Human genes 0.000 claims description 2
- 108010047761 Interferon-alpha Proteins 0.000 claims description 2
- 102000003996 Interferon-beta Human genes 0.000 claims description 2
- 108090000467 Interferon-beta Proteins 0.000 claims description 2
- 102000008070 Interferon-gamma Human genes 0.000 claims description 2
- 108010074328 Interferon-gamma Proteins 0.000 claims description 2
- 108010050904 Interferons Proteins 0.000 claims description 2
- 102000014150 Interferons Human genes 0.000 claims description 2
- 102000019223 Interleukin-1 receptor Human genes 0.000 claims description 2
- 108050006617 Interleukin-1 receptor Proteins 0.000 claims description 2
- 108090000174 Interleukin-10 Proteins 0.000 claims description 2
- 102000003814 Interleukin-10 Human genes 0.000 claims description 2
- 108090000177 Interleukin-11 Proteins 0.000 claims description 2
- 102000003815 Interleukin-11 Human genes 0.000 claims description 2
- 102000000588 Interleukin-2 Human genes 0.000 claims description 2
- 108010002350 Interleukin-2 Proteins 0.000 claims description 2
- 108010063738 Interleukins Proteins 0.000 claims description 2
- 102000015696 Interleukins Human genes 0.000 claims description 2
- 101150108662 KAR2 gene Proteins 0.000 claims description 2
- 101150096459 LHS1 gene Proteins 0.000 claims description 2
- 102000016267 Leptin Human genes 0.000 claims description 2
- 108010092277 Leptin Proteins 0.000 claims description 2
- 101150014737 MADS1 gene Proteins 0.000 claims description 2
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 claims description 2
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 claims description 2
- 102100038645 Matrin-3 Human genes 0.000 claims description 2
- 108010025020 Nerve Growth Factor Proteins 0.000 claims description 2
- 101100015882 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) grpe gene Proteins 0.000 claims description 2
- 102100027096 Nucleotide exchange factor SIL1 Human genes 0.000 claims description 2
- 108090000445 Parathyroid hormone Proteins 0.000 claims description 2
- 102000003982 Parathyroid hormone Human genes 0.000 claims description 2
- 102100028293 Period circadian protein homolog 1 Human genes 0.000 claims description 2
- 108010051456 Plasminogen Proteins 0.000 claims description 2
- 102000013566 Plasminogen Human genes 0.000 claims description 2
- 108010001014 Plasminogen Activators Proteins 0.000 claims description 2
- 102000001938 Plasminogen Activators Human genes 0.000 claims description 2
- 102100038255 Prefoldin subunit 1 Human genes 0.000 claims description 2
- 108010076181 Proinsulin Proteins 0.000 claims description 2
- 101800004937 Protein C Proteins 0.000 claims description 2
- 102000017975 Protein C Human genes 0.000 claims description 2
- 229940096437 Protein S Drugs 0.000 claims description 2
- 102000029301 Protein S Human genes 0.000 claims description 2
- 108010066124 Protein S Proteins 0.000 claims description 2
- 102100036894 Protein patched homolog 2 Human genes 0.000 claims description 2
- 101710161395 Protein patched homolog 2 Proteins 0.000 claims description 2
- 108010094028 Prothrombin Proteins 0.000 claims description 2
- 102100027378 Prothrombin Human genes 0.000 claims description 2
- 102100032319 Putative activator of 90 kDa heat shock protein ATPase homolog 2 Human genes 0.000 claims description 2
- 102100022491 RNA-binding protein NOB1 Human genes 0.000 claims description 2
- 101100323459 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) APJ1 gene Proteins 0.000 claims description 2
- 101100441892 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CPR7 gene Proteins 0.000 claims description 2
- 101100125012 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ECM10 gene Proteins 0.000 claims description 2
- 101100280133 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) EUG1 gene Proteins 0.000 claims description 2
- 101100285707 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HSC82 gene Proteins 0.000 claims description 2
- 101100071588 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HSP12 gene Proteins 0.000 claims description 2
- 101100071604 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HSP42 gene Proteins 0.000 claims description 2
- 101100453261 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) JEM1 gene Proteins 0.000 claims description 2
- 101100236846 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MDJ2 gene Proteins 0.000 claims description 2
- 101100285899 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SSE2 gene Proteins 0.000 claims description 2
- 101100537260 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TIM10 gene Proteins 0.000 claims description 2
- 101800001700 Saposin-D Proteins 0.000 claims description 2
- 206010039509 Scab Diseases 0.000 claims description 2
- 101150108455 Sil1 gene Proteins 0.000 claims description 2
- 102100038803 Somatotropin Human genes 0.000 claims description 2
- 101000880156 Streptomyces cacaoi Subtilisin inhibitor-like protein 1 Proteins 0.000 claims description 2
- 102100028679 T-complex protein 1 subunit beta Human genes 0.000 claims description 2
- 102100029958 T-complex protein 1 subunit delta Human genes 0.000 claims description 2
- 102100029886 T-complex protein 1 subunit epsilon Human genes 0.000 claims description 2
- 102100036476 T-complex protein 1 subunit eta Human genes 0.000 claims description 2
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 claims description 2
- 102100026311 T-complex protein 1 subunit theta Human genes 0.000 claims description 2
- 102100030664 T-complex protein 1 subunit zeta Human genes 0.000 claims description 2
- 108090000190 Thrombin Proteins 0.000 claims description 2
- 102100031372 Thymidine phosphorylase Human genes 0.000 claims description 2
- 108700023160 Thymidine phosphorylases Proteins 0.000 claims description 2
- 101710139626 Tissue factor pathway inhibitor Proteins 0.000 claims description 2
- 108090001012 Transforming Growth Factor beta Proteins 0.000 claims description 2
- 102000004887 Transforming Growth Factor beta Human genes 0.000 claims description 2
- 101800001690 Transmembrane protein gp41 Proteins 0.000 claims description 2
- 101710090322 Truncated surface protein Proteins 0.000 claims description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 claims description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 claims description 2
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 claims description 2
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 claims description 2
- 229960005348 antithrombin iii Drugs 0.000 claims description 2
- 229960004405 aprotinin Drugs 0.000 claims description 2
- 239000003114 blood coagulation factor Substances 0.000 claims description 2
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 claims description 2
- 229960004015 calcitonin Drugs 0.000 claims description 2
- 108010015046 cell aggregation factors Proteins 0.000 claims description 2
- 229940048961 cholinesterase Drugs 0.000 claims description 2
- 229920001436 collagen Polymers 0.000 claims description 2
- 108060002021 cyanovirin N Proteins 0.000 claims description 2
- VJJPUSNTGOMMGY-MRVIYFEKSA-N etoposide Chemical compound COC1=C(O)C(OC)=CC([C@@H]2C3=CC=4OCOC=4C=C3[C@@H](O[C@H]3[C@@H]([C@@H](O)[C@@H]4O[C@H](C)OC[C@H]4O3)O)[C@@H]3[C@@H]2C(OC3)=O)=C1 VJJPUSNTGOMMGY-MRVIYFEKSA-N 0.000 claims description 2
- 229960005420 etoposide Drugs 0.000 claims description 2
- 229960004222 factor ix Drugs 0.000 claims description 2
- 229940012413 factor vii Drugs 0.000 claims description 2
- 229960000301 factor viii Drugs 0.000 claims description 2
- 229940012426 factor x Drugs 0.000 claims description 2
- 229940012444 factor xiii Drugs 0.000 claims description 2
- 229940012952 fibrinogen Drugs 0.000 claims description 2
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 claims description 2
- 229960004666 glucagon Drugs 0.000 claims description 2
- 239000000122 growth hormone Substances 0.000 claims description 2
- 101150072994 hsp30 gene Proteins 0.000 claims description 2
- ZPNFWUPYTFPOJU-LPYSRVMUSA-N iniprol Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC=4C=CC=CC=4)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]2N(CCC2)C(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N3)C(=O)NCC(=O)NCC(=O)N[C@@H](C)C(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](C(=O)N1)C(C)C)[C@@H](C)O)[C@@H](C)CC)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 ZPNFWUPYTFPOJU-LPYSRVMUSA-N 0.000 claims description 2
- 229940125396 insulin Drugs 0.000 claims description 2
- 108010093564 inter-alpha-inhibitor Proteins 0.000 claims description 2
- 229940079322 interferon Drugs 0.000 claims description 2
- 229960003130 interferon gamma Drugs 0.000 claims description 2
- 229960001388 interferon-beta Drugs 0.000 claims description 2
- 229940039781 leptin Drugs 0.000 claims description 2
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 claims description 2
- 101150098728 mdj1 gene Proteins 0.000 claims description 2
- 101150072699 mge1 gene Proteins 0.000 claims description 2
- 229940053128 nerve growth factor Drugs 0.000 claims description 2
- 239000000199 parathyroid hormone Substances 0.000 claims description 2
- 229960001319 parathyroid hormone Drugs 0.000 claims description 2
- 108010037251 peptide T1249 Proteins 0.000 claims description 2
- 229940127126 plasminogen activator Drugs 0.000 claims description 2
- 108010071286 prethrombins Proteins 0.000 claims description 2
- 229960000856 protein c Drugs 0.000 claims description 2
- 229940039716 prothrombin Drugs 0.000 claims description 2
- 229940044551 receptor antagonist Drugs 0.000 claims description 2
- 239000002464 receptor antagonist Substances 0.000 claims description 2
- 108010073863 saruplase Proteins 0.000 claims description 2
- 210000002966 serum Anatomy 0.000 claims description 2
- 101150017313 sls1 gene Proteins 0.000 claims description 2
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 claims description 2
- 229960004072 thrombin Drugs 0.000 claims description 2
- 108010065972 tick anticoagulant peptide Proteins 0.000 claims description 2
- 239000002753 trypsin inhibitor Substances 0.000 claims description 2
- 101150070177 ubi4 gene Proteins 0.000 claims description 2
- 229960005356 urokinase Drugs 0.000 claims description 2
- 108010047303 von Willebrand Factor Proteins 0.000 claims description 2
- 102100036537 von Willebrand factor Human genes 0.000 claims description 2
- 229960001134 von willebrand factor Drugs 0.000 claims description 2
- 239000003937 drug carrier Substances 0.000 claims 2
- 230000035899 viability Effects 0.000 claims 2
- 101710137189 Amyloid-beta A4 protein Proteins 0.000 claims 1
- 102100022704 Amyloid-beta precursor protein Human genes 0.000 claims 1
- 101710151993 Amyloid-beta precursor protein Proteins 0.000 claims 1
- 102400000068 Angiostatin Human genes 0.000 claims 1
- 108010079709 Angiostatins Proteins 0.000 claims 1
- 102400001047 Endostatin Human genes 0.000 claims 1
- 108010015776 Glucose oxidase Proteins 0.000 claims 1
- 239000004366 Glucose oxidase Substances 0.000 claims 1
- 102000015336 Nerve Growth Factor Human genes 0.000 claims 1
- DZHSAHHDTRWUTF-SIQRNXPUSA-N amyloid-beta polypeptide 42 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O)[C@@H](C)CC)C(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C(C)C)C1=CC=CC=C1 DZHSAHHDTRWUTF-SIQRNXPUSA-N 0.000 claims 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 claims 1
- 229940116332 glucose oxidase Drugs 0.000 claims 1
- 235000019420 glucose oxidase Nutrition 0.000 claims 1
- 230000002608 insulinlike Effects 0.000 claims 1
- 244000005700 microbiome Species 0.000 claims 1
- 239000011859 microparticle Substances 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 161
- 239000013615 primer Substances 0.000 description 89
- 101000609814 Dictyostelium discoideum Protein disulfide-isomerase 1 Proteins 0.000 description 59
- 101001114059 Homo sapiens Protein-arginine deiminase type-1 Proteins 0.000 description 59
- 102100023222 Protein-arginine deiminase type-1 Human genes 0.000 description 54
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 48
- 102100032491 Serine protease 1 Human genes 0.000 description 48
- 108091034117 Oligonucleotide Proteins 0.000 description 41
- 101150006914 TRP1 gene Proteins 0.000 description 41
- 229920001817 Agar Polymers 0.000 description 38
- 239000008272 agar Substances 0.000 description 38
- 239000000047 product Substances 0.000 description 35
- 101100243108 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PDI1 gene Proteins 0.000 description 33
- 101710112083 Para-Rep C1 Proteins 0.000 description 29
- 230000000694 effects Effects 0.000 description 29
- 238000013519 translation Methods 0.000 description 28
- 102100022881 Rab proteins geranylgeranyltransferase component A 1 Human genes 0.000 description 27
- 101710119887 Trans-acting factor B Proteins 0.000 description 27
- 108091028043 Nucleic acid sequence Proteins 0.000 description 26
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 22
- 239000013598 vector Substances 0.000 description 22
- 101100407358 Aspergillus niger pdiA gene Proteins 0.000 description 20
- 230000027455 binding Effects 0.000 description 20
- 230000029087 digestion Effects 0.000 description 19
- 230000004927 fusion Effects 0.000 description 18
- 229920001184 polypeptide Polymers 0.000 description 18
- 150000001413 amino acids Chemical class 0.000 description 17
- 230000001105 regulatory effect Effects 0.000 description 17
- 238000013518 transcription Methods 0.000 description 17
- 230000035897 transcription Effects 0.000 description 17
- 238000001712 DNA sequencing Methods 0.000 description 16
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 16
- 230000028327 secretion Effects 0.000 description 16
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 15
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 15
- 230000010076 replication Effects 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 14
- 239000003155 DNA primer Substances 0.000 description 13
- 108091006905 Human Serum Albumin Proteins 0.000 description 13
- 102000008100 Human Serum Albumin Human genes 0.000 description 13
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 13
- 108020005038 Terminator Codon Proteins 0.000 description 13
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 13
- 102000005431 Molecular Chaperones Human genes 0.000 description 12
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 12
- 230000035772 mutation Effects 0.000 description 12
- 108091008146 restriction endonucleases Proteins 0.000 description 12
- 230000009466 transformation Effects 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000010367 cloning Methods 0.000 description 11
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 11
- 238000012408 PCR amplification Methods 0.000 description 10
- 238000002741 site-directed mutagenesis Methods 0.000 description 10
- 102100025093 Zinc fingers and homeoboxes protein 2 Human genes 0.000 description 9
- 108010038633 aspartylglutamate Proteins 0.000 description 9
- 238000012423 maintenance Methods 0.000 description 9
- 230000036961 partial effect Effects 0.000 description 9
- XNSAINXGIQZQOO-SRVKXCTJSA-N protirelin Chemical compound NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H]1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-SRVKXCTJSA-N 0.000 description 9
- 230000006798 recombination Effects 0.000 description 9
- 238000005215 recombination Methods 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 9
- 238000012807 shake-flask culturing Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 102100029968 Calreticulin Human genes 0.000 description 8
- 101100125027 Dictyostelium discoideum mhsp70 gene Proteins 0.000 description 8
- 101150031823 HSP70 gene Proteins 0.000 description 8
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 8
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 8
- 238000004925 denaturation Methods 0.000 description 8
- 230000036425 denaturation Effects 0.000 description 8
- 101150052825 dnaK gene Proteins 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 229910052742 iron Inorganic materials 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- 101000766306 Homo sapiens Serotransferrin Proteins 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 7
- 229960000723 ampicillin Drugs 0.000 description 7
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 238000001243 protein synthesis Methods 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 108020005345 3' Untranslated Regions Proteins 0.000 description 6
- 101150097493 D gene Proteins 0.000 description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 238000000137 annealing Methods 0.000 description 6
- 210000004899 c-terminal region Anatomy 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 238000000760 immunoelectrophoresis Methods 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 229920002521 macromolecule Polymers 0.000 description 6
- 235000016709 nutrition Nutrition 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 229910052709 silver Inorganic materials 0.000 description 6
- 239000004332 silver Substances 0.000 description 6
- 230000005030 transcription termination Effects 0.000 description 6
- 230000032258 transport Effects 0.000 description 6
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 5
- 101710141722 Arylsulfatase Proteins 0.000 description 5
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 5
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 5
- 108010058643 Fungal Proteins Proteins 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 5
- 241001138401 Kluyveromyces lactis Species 0.000 description 5
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- 102100038583 Secreted Ly-6/uPAR-related protein 1 Human genes 0.000 description 5
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 5
- 108700019146 Transgenes Proteins 0.000 description 5
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 5
- 101150050575 URA3 gene Proteins 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000002759 chromosomal effect Effects 0.000 description 5
- 210000000805 cytoplasm Anatomy 0.000 description 5
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 5
- 239000013613 expression plasmid Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 210000004940 nucleus Anatomy 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 4
- YNYCTHOFPFNXMS-KABLSXSFSA-N (5e,8z,11z,14z)-5-fluoroicosa-5,8,11,14-tetraenoic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C(\F)CCCC(O)=O YNYCTHOFPFNXMS-KABLSXSFSA-N 0.000 description 4
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 4
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 4
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 4
- 241000206602 Eukaryota Species 0.000 description 4
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 4
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 4
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 4
- 101000824892 Homo sapiens SOSS complex subunit B1 Proteins 0.000 description 4
- 101000824890 Homo sapiens SOSS complex subunit B2 Proteins 0.000 description 4
- 102000008133 Iron-Binding Proteins Human genes 0.000 description 4
- 108010035210 Iron-Binding Proteins Proteins 0.000 description 4
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 4
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 4
- 241000235062 Pichia membranifaciens Species 0.000 description 4
- 101150062264 Raf gene Proteins 0.000 description 4
- 102000006382 Ribonucleases Human genes 0.000 description 4
- 108010083644 Ribonucleases Proteins 0.000 description 4
- 102100022320 SPRY domain-containing SOCS box protein 1 Human genes 0.000 description 4
- 102100022330 SPRY domain-containing SOCS box protein 2 Human genes 0.000 description 4
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 4
- 102000007562 Serum Albumin Human genes 0.000 description 4
- 108010071390 Serum Albumin Proteins 0.000 description 4
- 238000002835 absorbance Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 108010066875 alanyl-prolyl-tryptophyl-cysteine Proteins 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- XZNUGFQTQHRASN-XQENGBIVSA-N apramycin Chemical compound O([C@H]1O[C@@H]2[C@H](O)[C@@H]([C@H](O[C@H]2C[C@H]1N)O[C@@H]1[C@@H]([C@@H](O)[C@H](N)[C@@H](CO)O1)O)NC)[C@@H]1[C@@H](N)C[C@@H](N)[C@H](O)[C@H]1O XZNUGFQTQHRASN-XQENGBIVSA-N 0.000 description 4
- 229950006334 apramycin Drugs 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 229940098773 bovine serum albumin Drugs 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical class [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 210000000633 nuclear envelope Anatomy 0.000 description 4
- 210000004492 nuclear pore Anatomy 0.000 description 4
- 101150053681 pmt gene Proteins 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- 230000005945 translocation Effects 0.000 description 4
- 102000013563 Acid Phosphatase Human genes 0.000 description 3
- 108010051457 Acid Phosphatase Proteins 0.000 description 3
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 3
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 3
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 3
- 101100434663 Bacillus subtilis (strain 168) fbaA gene Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 102100029516 Basic salivary proline-rich protein 1 Human genes 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 3
- POSRGGKLRWCUBE-CIUDSAMLSA-N Cys-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N POSRGGKLRWCUBE-CIUDSAMLSA-N 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- 101150095274 FBA1 gene Proteins 0.000 description 3
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 3
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 3
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 3
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 3
- 101001125486 Homo sapiens Basic salivary proline-rich protein 1 Proteins 0.000 description 3
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 3
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- 102100022742 Lupus La protein Human genes 0.000 description 3
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 3
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 3
- 230000004989 O-glycosylation Effects 0.000 description 3
- 102000040894 ORMDL family Human genes 0.000 description 3
- 108091071954 ORMDL family Proteins 0.000 description 3
- 101150070377 PDI gene Proteins 0.000 description 3
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 3
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 3
- 101150094423 SCP2 gene Proteins 0.000 description 3
- 101150064154 SYCP3 gene Proteins 0.000 description 3
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 3
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 101150073336 Sycp1 gene Proteins 0.000 description 3
- 101150011246 Sycp2 gene Proteins 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 3
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 3
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 230000001651 autotrophic effect Effects 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 230000001876 chaperonelike Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 239000012228 culture supernatant Substances 0.000 description 3
- 230000021040 cytoplasmic transport Effects 0.000 description 3
- 230000001086 cytosolic effect Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 239000004744 fabric Substances 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 238000006317 isomerization reaction Methods 0.000 description 3
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 238000009630 liquid culture Methods 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 230000035764 nutrition Effects 0.000 description 3
- 238000010422 painting Methods 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 150000003573 thiols Chemical class 0.000 description 3
- 108020005087 unfolded proteins Proteins 0.000 description 3
- 230000006269 (delayed) early viral mRNA transcription Effects 0.000 description 2
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- 108020005065 3' Flanking Region Proteins 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 2
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 2
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 2
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 2
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 2
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 2
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 2
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 2
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 2
- XLHLPYFMXGOASD-CIUDSAMLSA-N Asn-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLHLPYFMXGOASD-CIUDSAMLSA-N 0.000 description 2
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 2
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- RKNIUWSZIAUEPK-PBCZWWQYSA-N Asp-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N)O RKNIUWSZIAUEPK-PBCZWWQYSA-N 0.000 description 2
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 2
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 2
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 2
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 2
- 101800001415 Bri23 peptide Proteins 0.000 description 2
- 102400000107 C-terminal peptide Human genes 0.000 description 2
- 101800000655 C-terminal peptide Proteins 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 101100242263 Drosophila melanogaster ORMDL gene Proteins 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 108010046276 FLP recombinase Proteins 0.000 description 2
- LLQPHQFNMLZJMP-UHFFFAOYSA-N Fentrazamide Chemical compound N1=NN(C=2C(=CC=CC=2)Cl)C(=O)N1C(=O)N(CC)C1CCCCC1 LLQPHQFNMLZJMP-UHFFFAOYSA-N 0.000 description 2
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 2
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 2
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 2
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 2
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 2
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 2
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 101150009006 HIS3 gene Proteins 0.000 description 2
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 2
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 2
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 2
- WCNXUTNLSRWWQN-DCAQKATOSA-N His-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WCNXUTNLSRWWQN-DCAQKATOSA-N 0.000 description 2
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 2
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 2
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 2
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 2
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 2
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 2
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- KXYLFJIQDIMURW-IHPCNDPISA-N Lys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCCN)=CNC2=C1 KXYLFJIQDIMURW-IHPCNDPISA-N 0.000 description 2
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 2
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 230000004988 N-glycosylation Effects 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 238000010222 PCR analysis Methods 0.000 description 2
- 101150013761 PSE1 gene Proteins 0.000 description 2
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 2
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 2
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 2
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 2
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 2
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 2
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 2
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 2
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 2
- 108091034057 RNA (poly(A)) Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 2
- 241000220317 Rosa Species 0.000 description 2
- 101710176276 SSB protein Proteins 0.000 description 2
- 101100241858 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OAC1 gene Proteins 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 2
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 2
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 2
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 2
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 2
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 2
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 2
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 2
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 2
- MWUYSCVVPVITMW-IGNZVWTISA-N Tyr-Tyr-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 MWUYSCVVPVITMW-IGNZVWTISA-N 0.000 description 2
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 2
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 2
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 2
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 2
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 2
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 2
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 2
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 2
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 2
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 108010054176 apotransferrin Proteins 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 102000006635 beta-lactamase Human genes 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 210000000172 cytosol Anatomy 0.000 description 2
- 230000002939 deleterious effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000000502 dialysis Methods 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000009585 enzyme analysis Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 2
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 230000002906 microbiologic effect Effects 0.000 description 2
- 239000006151 minimal media Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 230000003204 osmotic effect Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 101150079312 pgk1 gene Proteins 0.000 description 2
- 101150092906 pmt1 gene Proteins 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 238000013077 scoring method Methods 0.000 description 2
- 210000002955 secretory cell Anatomy 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000012430 stability testing Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229960000187 tissue plasminogen activator Drugs 0.000 description 2
- 108091005703 transmembrane proteins Proteins 0.000 description 2
- 102000035160 transmembrane proteins Human genes 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 108010037335 tyrosyl-prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- INOZZBHURUDQQR-AJNGGQMLSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 INOZZBHURUDQQR-AJNGGQMLSA-N 0.000 description 1
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 1
- JUEUYDRZJNQZGR-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JUEUYDRZJNQZGR-UHFFFAOYSA-N 0.000 description 1
- YCXQKJXTGDYKIO-UHFFFAOYSA-N 4-nitro-2,6-diphenylphenol Chemical compound OC1=C(C=2C=CC=CC=2)C=C([N+]([O-])=O)C=C1C1=CC=CC=C1 YCXQKJXTGDYKIO-UHFFFAOYSA-N 0.000 description 1
- HLXHCNWEVQNNKA-UHFFFAOYSA-N 5-methoxy-2,3-dihydro-1h-inden-2-amine Chemical compound COC1=CC=C2CC(N)CC2=C1 HLXHCNWEVQNNKA-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 108091071248 Alpha family Proteins 0.000 description 1
- 108010071619 Apolipoproteins Proteins 0.000 description 1
- 102000007592 Apolipoproteins Human genes 0.000 description 1
- WGLYHYWDYPSNPF-RQFIXDHTSA-N Apramycin sulfate Chemical compound OS(O)(=O)=O.O([C@H]1O[C@@H]2[C@H](O)[C@@H]([C@H](O[C@H]2C[C@H]1N)O[C@@H]1[C@@H]([C@@H](O)[C@H](N)[C@@H](CO)O1)O)NC)[C@@H]1[C@@H](N)C[C@@H](N)[C@H](O)[C@H]1O WGLYHYWDYPSNPF-RQFIXDHTSA-N 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 1
- CUQUEHYSSFETRD-ACZMJKKPSA-N Asn-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N CUQUEHYSSFETRD-ACZMJKKPSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- KWQPAXYXVMHJJR-AVGNSLFASA-N Asn-Gln-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KWQPAXYXVMHJJR-AVGNSLFASA-N 0.000 description 1
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 1
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- LDGUZSIPGSPBJP-XVYDVKMFSA-N Asp-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LDGUZSIPGSPBJP-XVYDVKMFSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- LDLZOAJRXXBVGF-GMOBBJLQSA-N Asp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N LDLZOAJRXXBVGF-GMOBBJLQSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 1
- NONWUQAWAANERO-BZSNNMDCSA-N Asp-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 NONWUQAWAANERO-BZSNNMDCSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- DKQCWCQRAMAFLN-UBHSHLNASA-N Asp-Trp-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O DKQCWCQRAMAFLN-UBHSHLNASA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- QLRRUWXMMVXORS-UHFFFAOYSA-N Augustine Natural products C12=CC=3OCOC=3C=C2CN2C3CC(OC)C4OC4C31CC2 QLRRUWXMMVXORS-UHFFFAOYSA-N 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108091071247 Beta family Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 1
- 101000984722 Bos taurus Pancreatic trypsin inhibitor Proteins 0.000 description 1
- 101150085381 CDC19 gene Proteins 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 108050001186 Chaperonin Cpn60 Proteins 0.000 description 1
- 102000052603 Chaperonins Human genes 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 206010061764 Chromosomal deletion Diseases 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 102000003813 Cis-trans-isomerases Human genes 0.000 description 1
- 108090000175 Cis-trans-isomerases Proteins 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 102100031162 Collagen alpha-1(XVIII) chain Human genes 0.000 description 1
- 241000272201 Columbiformes Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108010062580 Concanavalin A Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- QFMCHXSGIZPBKG-ZLUOBGJFSA-N Cys-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N QFMCHXSGIZPBKG-ZLUOBGJFSA-N 0.000 description 1
- NDUSUIGBMZCOIL-ZKWXMUAHSA-N Cys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N NDUSUIGBMZCOIL-ZKWXMUAHSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- IOLWXFWVYYCVTJ-NRPADANISA-N Cys-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N IOLWXFWVYYCVTJ-NRPADANISA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100453960 Drosophila melanogaster klar gene Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010032976 Enfuvirtide Proteins 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 241000701533 Escherichia virus T4 Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 101150038242 GAL10 gene Proteins 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101000609762 Gallus gallus Ovalbumin Proteins 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 1
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- XGKNQFOKIBKFTR-CIUDSAMLSA-N Gln-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCC(N)=O XGKNQFOKIBKFTR-CIUDSAMLSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- JNVGVECJCOZHCN-DRZSPHRISA-N Gln-Phe-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O JNVGVECJCOZHCN-DRZSPHRISA-N 0.000 description 1
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- SYTFJIQPBRJSOK-NKIYYHGXSA-N Gln-Thr-His Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 SYTFJIQPBRJSOK-NKIYYHGXSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 1
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- DXMOIVCNJIJQSC-QEJZJMRPSA-N Glu-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DXMOIVCNJIJQSC-QEJZJMRPSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- 102000030595 Glucokinase Human genes 0.000 description 1
- 108010021582 Glucokinase Proteins 0.000 description 1
- 102100031132 Glucose-6-phosphate isomerase Human genes 0.000 description 1
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 1
- 102100036669 Glycerol-3-phosphate dehydrogenase [NAD(+)], cytoplasmic Human genes 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 101150079981 HSP150 gene Proteins 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000005548 Hexokinase Human genes 0.000 description 1
- 108700040460 Hexokinases Proteins 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 1
- MVZASEMJYJPJSI-IHPCNDPISA-N His-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC3=CN=CN3)N MVZASEMJYJPJSI-IHPCNDPISA-N 0.000 description 1
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 1
- ULRFSEJGSHYLQI-YESZJQIVSA-N His-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ULRFSEJGSHYLQI-YESZJQIVSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101001072574 Homo sapiens Glycerol-3-phosphate dehydrogenase [NAD(+)], cytoplasmic Proteins 0.000 description 1
- 101000718476 Homo sapiens L-aminoadipate-semialdehyde dehydrogenase-phosphopantetheinyl transferase Proteins 0.000 description 1
- 101001018100 Homo sapiens Lysozyme C Proteins 0.000 description 1
- 101001121168 Homo sapiens ORM1-like protein 1 Proteins 0.000 description 1
- 101001121166 Homo sapiens ORM1-like protein 2 Proteins 0.000 description 1
- 101000586232 Homo sapiens ORM1-like protein 3 Proteins 0.000 description 1
- 101000742143 Homo sapiens Prenylated Rab acceptor protein 1 Proteins 0.000 description 1
- 101000642268 Homo sapiens Speckle-type POZ protein Proteins 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 1
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 1
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 1
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 1
- DNKDIDZHXZAGRY-HJWJTTGWSA-N Ile-Met-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N DNKDIDZHXZAGRY-HJWJTTGWSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- JDCQDJVYUXNCGF-SPOWBLRKSA-N Ile-Ser-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JDCQDJVYUXNCGF-SPOWBLRKSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- 235000003332 Ilex aquifolium Nutrition 0.000 description 1
- 241000209027 Ilex aquifolium Species 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102100024319 Intestinal-type alkaline phosphatase Human genes 0.000 description 1
- 101710184243 Intestinal-type alkaline phosphatase Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 229910021578 Iron(III) chloride Inorganic materials 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- 102100026384 L-aminoadipate-semialdehyde dehydrogenase-phosphopantetheinyl transferase Human genes 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 1
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- BIWVMACFGZFIEB-VFAJRCTISA-N Lys-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N)O BIWVMACFGZFIEB-VFAJRCTISA-N 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000006722 Mannosyltransferases Human genes 0.000 description 1
- 108010087568 Mannosyltransferases Proteins 0.000 description 1
- 101710140452 Mating factor alpha-1 Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- ILKCLLLOGPDNIP-RCWTZXSCSA-N Met-Met-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ILKCLLLOGPDNIP-RCWTZXSCSA-N 0.000 description 1
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- 101000708578 Milk vetch dwarf virus (isolate N) Para-Rep C3 Proteins 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 101100234604 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) ace-8 gene Proteins 0.000 description 1
- 102000003789 Nuclear pore complex proteins Human genes 0.000 description 1
- 108090000163 Nuclear pore complex proteins Proteins 0.000 description 1
- 102100026499 ORM1-like protein 1 Human genes 0.000 description 1
- 102100026498 ORM1-like protein 2 Human genes 0.000 description 1
- 102100030120 ORM1-like protein 3 Human genes 0.000 description 1
- 101150069294 ORM2 gene Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108010058846 Ovalbumin Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 101150012394 PHO5 gene Proteins 0.000 description 1
- 101150101848 PMA1 gene Proteins 0.000 description 1
- 101150093629 PYK1 gene Proteins 0.000 description 1
- 101710126321 Pancreatic trypsin inhibitor Proteins 0.000 description 1
- 241001504519 Papio ursinus Species 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 1
- 102000001105 Phosphofructokinases Human genes 0.000 description 1
- 108010069341 Phosphofructokinases Proteins 0.000 description 1
- 101710169169 Polyprenol monophosphomannose synthase Proteins 0.000 description 1
- 102100038619 Prenylated Rab acceptor protein 1 Human genes 0.000 description 1
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 1
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 1
- ANESFYPBAJPYNJ-SDDRHHMPSA-N Pro-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ANESFYPBAJPYNJ-SDDRHHMPSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- 108010011939 Pyruvate Decarboxylase Proteins 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101001072192 Rattus norvegicus Protein disulfide-isomerase Proteins 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 1
- 101100242262 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ORM2 gene Proteins 0.000 description 1
- 101100508745 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PSE1 gene Proteins 0.000 description 1
- 101100502339 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SFA1 gene Proteins 0.000 description 1
- 101000744436 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Trans-acting factor D Proteins 0.000 description 1
- 101100319895 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YAP3 gene Proteins 0.000 description 1
- 101100160515 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YPS1 gene Proteins 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101710141933 Single-stranded DNA-binding protein 1 Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 102000013275 Somatomedins Human genes 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 102100036422 Speckle-type POZ protein Human genes 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 101150001810 TEAD1 gene Proteins 0.000 description 1
- 101150074253 TEF1 gene Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241000030538 Thecla Species 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- VOHWDZNIESHTFW-XKBZYTNZSA-N Thr-Glu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O VOHWDZNIESHTFW-XKBZYTNZSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 102000007238 Transferrin Receptors Human genes 0.000 description 1
- 108010033576 Transferrin Receptors Proteins 0.000 description 1
- 241000009298 Trigla lyra Species 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 1
- PHNBFZBKLWEBJN-BPUTZDHNSA-N Trp-Glu-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PHNBFZBKLWEBJN-BPUTZDHNSA-N 0.000 description 1
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 1
- WKCFCVBOFKEVKY-HSCHXYMDSA-N Trp-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WKCFCVBOFKEVKY-HSCHXYMDSA-N 0.000 description 1
- XOSGQKFEIOCPIJ-SZMVWBNQSA-N Trp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CNC3=CC=CC=C32)N XOSGQKFEIOCPIJ-SZMVWBNQSA-N 0.000 description 1
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 1
- RKISDJMICOREEL-QRTARXTBSA-N Trp-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RKISDJMICOREEL-QRTARXTBSA-N 0.000 description 1
- YJQCOFNZVFGCAF-UHFFFAOYSA-N Tunicamycin II Natural products O1C(CC(O)C2C(C(O)C(O2)N2C(NC(=O)C=C2)=O)O)C(O)C(O)C(NC(=O)C=CCCCCCCCCC(C)C)C1OC1OC(CO)C(O)C(O)C1NC(C)=O YJQCOFNZVFGCAF-UHFFFAOYSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 1
- FXYOYUMPUJONGW-FHWLQOOXSA-N Tyr-Gln-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 FXYOYUMPUJONGW-FHWLQOOXSA-N 0.000 description 1
- LTSIAOZUVISRAQ-QWRGUYRKSA-N Tyr-Gly-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O LTSIAOZUVISRAQ-QWRGUYRKSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 1
- KWKJGBHDYJOVCR-SRVKXCTJSA-N Tyr-Ser-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O KWKJGBHDYJOVCR-SRVKXCTJSA-N 0.000 description 1
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 1
- 101150044776 URA5 gene Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- FBVUOEYVGNMRMD-NAKRPEOUSA-N Val-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N FBVUOEYVGNMRMD-NAKRPEOUSA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 229960005188 collagen Drugs 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 125000002228 disulfide group Chemical group 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000000463 effect on translation Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010041601 histidyl-aspartyl-glutamyl-leucine Proteins 0.000 description 1
- 108010045676 holotransferrin Proteins 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000004191 hydrophobic interaction chromatography Methods 0.000 description 1
- 238000012872 hydroxylapatite chromatography Methods 0.000 description 1
- 239000002471 hydroxymethylglutaryl coenzyme A reductase inhibitor Substances 0.000 description 1
- 101150045896 ilv-2 gene Proteins 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000010438 iron metabolism Effects 0.000 description 1
- RBTARNINKXHZNM-UHFFFAOYSA-K iron trichloride Chemical compound Cl[Fe](Cl)Cl RBTARNINKXHZNM-UHFFFAOYSA-K 0.000 description 1
- FXDLIMJMHVKXAR-UHFFFAOYSA-K iron(III) nitrilotriacetate Chemical compound [Fe+3].[O-]C(=O)CN(CC([O-])=O)CC([O-])=O FXDLIMJMHVKXAR-UHFFFAOYSA-K 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010013555 lipoprotein-associated coagulation inhibitor Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 235000019988 mead Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 210000001589 microsome Anatomy 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 210000005155 neural progenitor cell Anatomy 0.000 description 1
- 230000005937 nuclear translocation Effects 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 229940092253 ovalbumin Drugs 0.000 description 1
- 238000010979 pH adjustment Methods 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000003016 pheromone Substances 0.000 description 1
- 229940080469 phosphocellulose Drugs 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 239000002510 pyrogen Substances 0.000 description 1
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 1
- 108010005597 ran GTP Binding Protein Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000026267 regulation of growth Effects 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 101150018813 ssa1 gene Proteins 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- ZHSGGJXRNHWHRS-VIDYELAYSA-N tunicamycin Chemical compound O([C@H]1[C@@H]([C@H]([C@@H](O)[C@@H](CC(O)[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C(NC(=O)C=C2)=O)O)O1)O)NC(=O)/C=C/CC(C)C)[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1NC(C)=O ZHSGGJXRNHWHRS-VIDYELAYSA-N 0.000 description 1
- MEYZYGMYMLNUHJ-UHFFFAOYSA-N tunicamycin Natural products CC(C)CCCCCCCCCC=CC(=O)NC1C(O)C(O)C(CC(O)C2OC(C(O)C2O)N3C=CC(=O)NC3=O)OC1OC4OC(CO)C(O)C(O)C4NC(=O)C MEYZYGMYMLNUHJ-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/02—Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/08—Plasma substitutes; Perfusion solutions; Dialytics or haemodialytics; Drugs for electrolytic or acid-base disorders, e.g. hypovolemic shock
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Mycology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Animal Behavior & Ethology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Hematology (AREA)
- Diabetes (AREA)
- Dermatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
본 발명은 REP2 유전자 또는 FLP 유전자중 적어도 하나의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이에 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 포함하는 2㎛-패밀리 플라스미드를 제공한다.
플라스미드, 유전자, 벡터, 형질변형, 이스트
Description
본 출원은 변형된 플라스미드 및 이의 용도에 관한 것이다.
버딩 이스트와 매우 근접한 특정 관련 종들은 자연적으로 발생하는 환형 이중 스트랜드 DNA 플라스미드를 함유하는 것으로 알려져 있다. 총괄하여 2㎛-패밀리 플라스미드라고 칭하여지는 이러한 플리스미드는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii)(이전에는 지고사카로미세스 비스포러스(Zygosaccharomyces bisporus)로 분류됨))의 pSR1, pSB3 및 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailii)의 플라스미드 pSB1 및 pSB2, 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)의 플라스미드 pSM1, 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)의 플라스미드 pKD1, 피치아 멤브라나에파시엔스(Pichia membranaefaciens)(이후 "pPM1"이라 칭함)의 무명의 플라스미드 및 사카로미세스 세레비지아에(Saccharomyces cerevisiae)(Volkert, et al., 1989, Microbiological Reviews, 53, 299; Painting, et al., 1984, J. Applied Bacteriology, 56, 331) 및 S. 칼스버제네시스(S. carlsbergenesis)와 같은 다른 사카로미세스종의 2㎛ 플라스미드 및 변이체(Scp1, Scp2 및 Scp3와 같은)를 포함한다. 플라스미드의 패밀리로서 이러한 분자들은 이들이 플라스미드의 반대편상에 두개의 역위 반복을 소유하며, 약 6-kbp(4757-6615-bp 범위)의 유사한 크기, 적어도 3개의 오픈 리딩 프래임(이중 하나는 사이트 스페시픽 리콤비나아제(2㎛의 FLP와 같은)를 암호함) 및 역위 반복의 한쪽 말단에 근접하게 위치한 복제 오리진(ori)으로도 알려진 자가 복제 서열(ARS)을 갖는 점에서 일련의 공통된 특징을 공유한다(Futcher, 1988, Yeast, 4, 27; Murray et al., 1988, J. Mol . Biol . 200, 601 및 Toh-e et al., 1986, Basic Life Sci . 40, 425). 식별가능한 DNA 서열 상동성의 결여에도 불구하고, 이들의 공유된 분자적 구조 및 오픈 리딩 프래임의 기능 보존성은 패밀리 멤버들 간의 공통 관련성을 입증한다.
2㎛ 플라스미드(도 1)는 반수체 게놈당 60-100카피에서 대부분의 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 스트레인에 내인성인 6,318-bp 이중-스트랜드 DNA 플라스미드이다. 2㎛ 플라스미드는 두개의 599-bp 역위 반복 서열에 의해 분리된 스몰 유니크(US) 리전 및 라지 유니크(UL) 리전을 포함한다. 역위 반복 서열의 자리-특이 재조합은 생체내에서(in vivo) 플라스미드의 A-형 및 B-형간의 인터-컨버전을 일으킨다(Volkert & Brach, 1986, Cell, 46, 541). 상기 두 형태의 2㎛는 이들의 독특한 리전의 상대적 방향만 다르다.
사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 클로닝된 2㎛ 플라스미드(Scp1으로도 알려짐)의 DNA 시퀀싱 결과, 6,318-bp의 크기를 나타내나(Hartely 및 Doneloson, 1980, Nature, 286, 860), 2㎛, Scp2 및 Scp3의 다른 약간 보다 작은 변이체들은 125-bp 및 220-bp의 소 결실의 결과로 각각 STB로 알려진 리전에 존재하는 것으로 알려져 있다(Cameron et al., 1977, Nucl . Acids Res., 4, 1429: Kikuchi, 1983, Cell, 35, 487 및 Livingston & Hahne, 1979, Proc . Natl . Acad. Sci . USA, 76, 3727). 한 연구에서 전 세계의 약 80%의 자연 사카로미세스 스트레인이 2㎛에 대해 DNA 상동성을 가졌다(서던 블롯 분석시)(Hollenberg, 1982, Current Topics in Microbiology and Immunobiology, 96, 119). 또한, 변이(유전적 폴리모피즘)가 에스. 세레비지아에 및 에스. 칼스버제네시스에서 발견되는 2㎛ 플라스미드의 자연 집단내에서 발생하며, NCBI 서열(가입 번호 NC_001398)이 그 일 예이다.
2㎛ 플라스미드는 핵 국소화를 가지며 고수준의 유사분열 안정성을 나타낸다(Mead et al., 1986, Molecular & General Genetics, 205, 417). 2㎛ 플라스미드의 고유 안정성은 플라스미드-암호화 카피 수 증폭 및 키메릭 벡터의 발달도중 쉽게 손상되는 파티셔닝 메카니즘에 기인한다(Futcher & Cox, 1984, J. Bacteriol ., 157, 283; Bachmair & Ruis, 1984, Monatshefte fur Chemie, 115, 1229). 2㎛ 플라스미드를 함유하는 이스트 스트레인은 [cir+]로 알려져 있으며, 2㎛ 플라스미드를 함유하지 않는 이스트 스트레인은 [cir0]으로 알려져 있다.
US-리전은 REP2 및 FLP 유전자를 함유하며, UL-리전은 REP1 및 D(RAF로도 알려짐) 유전자, STB-로커스 및 복제 오리진을 함유한다(Broach & Hicks, 1980, Cell, 21, 501; Sutton & Broach, 1985, Mol . Cell. Biol ., 5, 2770). Flp 리콤비나아제는 역위 반복내의 FRT-사이트(Flp 인지 표적)에 바인딩하여 자리-특이 재조합을 매개하며, 이는 생체내에서 자연 플라스미드 증폭 및 플라스미드 복제수의 조절에 필수적이다(Senecoff et al, 1985, Proc . Natl . Acad . Sci . U.S.A., 82, 7270; Jayaram, 1985, Proc . Natl . Acad . Sci . U.S.A., 82, 5875). 2㎛-패밀리 플라스미드의 복제수는 Flp 리콤비나아제 활성의 변화에 의해 현저히 영향받을 수 있다(Sleep et al, 2001, Yeast, 18, 403; Rose & Broach, 1990, Methods Enzymol ., 185, 234). Rep1 및 Rep2 단백질은 플라스미드 분리를 매개하나 그 작용 모드는 불분명하다(Sengupta et al, 2001, J. Bacteriol ., 183, 2306). 이들은 또한 FLP 유전자의 전사를 억제한다(Reynolds et al, 1987, Mol . Cell. Biol ., 7, 3566).
FLP 및 REP2 유전자는 명확하게 이들간에 규정된 개재 서열없이 발산성 프로모터로부터 전사된다. FLP 및 REP2 전사는 이들의 번역 종결 코돈이후에 각각 24-bp 및 178-bp에서 모두 역위 반복 서열내의 동일한 서열 모티프에서 종결된다(Sutton & Broach, 1985, Mol . Cell. Biol ., 5, 2770).
FLP의 경우, C-말단 암호 서열이 또한 역위 반복 서열내에 놓여진다. 또한, 상기 두 역위 반복 서열은 599-bp에 걸쳐 매우 보존적이며, 이는 시험관내에서 FRT-사이트(65-bp미만)만이 자리-특이 재조합에 필수적임에도 불구하고 생체내에서 효율적인 플라스미드 복제 및 증폭에 유리한 것으로 간주되는 특징이다(Senecoff et al, 1985, Proc . Natl . Acad . Sci . U.S.A., 82, 7270; Jayaram, 1985, Proc . Natl . Acad . Sci . U.S.A., 82, 5875; Meyer-Leon et al, 1984, Cold spring Harbor Symposia On Quantitative Biology, 49, 797). Flp의 중요 촉매 잔기는 히스티딘-309 및 히스티딘 345에 의해 촉진되는 스트랜드-컷팅을 갖는 아르기닌-308 및 티로신-343(필수적임)이다(Prasad et al, 1987, Proc . Natl . Acad . Sci . U.S.A., 84, 2189; Chen et al, 1992, Cell, 69, 647; Grainge et al, 2001, J. Mol. Biol ., 314, 717).
두개의 작용 도메인이 Rep2에 표시된다. 잔기 15-58은 Rep1-바인딩 도메인을 형성하며, 잔기 59-296은 자가-결합 및 STB-바인딩 리전을 함유한다(Sengupta et al, 2001, J. Bacteriol ., 183, 2306).
2㎛ 플라스미드의 다수의 필수 작용 리전이 결여되어 있으나 작용성 cis 엘레멘트 ARS 및 STB를 보유하는 2㎛의 키메릭 혹은 대 결실 돌연변이 유도체는 세포분열시 모세포와 딸세포간의 분할을 효율적으로 할 수 없다. 이러한 플라스미드는 만일 이러한 작용이 트랜스로 제공되는 경우 예를 들어, 소위 [cir+] 숙주라고 불리우는 숙주내 작용성 2㎛ 플라스미드의 공급에 의해 역시 그러할 수 있다.
관심있는 유전자는 미리 2㎛ 플라스미드의 UL-리전내로 삽입된 바 있다. 예를 들어, EP 0 286 424의 플라스미드 pSAC3U1을 참조바란다. 그러나, US 리전과 UL 리전사이에 과도한 비대칭을 생성하지 않고 2㎛ 플라스미드의 UL-리전내로 유용하게 삽입될 수 있는 DNA의 양에는 한계가 있기 쉽다. 따라서, 2㎛ 플라스미드의 US-리전은 DNA 프레그먼트의 길이를 역위 반복의 한쪽 사이드와 동등하게 하는 경향이 있어 특히 부가적인 DNA 서열의 삽입에 매우 매력적이다.
이는 도 2에 나타낸 바와 같이, 플라스미드가 이미 이스트 선별 마커와 인접 DNA 서열의 도입에 의해 채워지는 발현 벡터용인 경우에 특히 그러하다. 예를 들어, 도 2에 나타낸 플라스미드는 β-락타마아제 유전자(앰피실린 저항성), LEU2 선별 마커 및 올리고뉴클레오타이드 링커를 포함하며, 여기서 후자 둘은 2㎛-패밀리 디스인테그레이션 벡터, pSAC3(참조 EP 0 286 424)의 UL-리전내의 유일한 SnaBI-사이트내로 삽입된다. 앰피실린 저항성 유전자를 함유하는 XbaI-사이트사이의 E. coli DNA는 이스트내로 형질변형된 후 도 2에 나타낸 바와 같은 플라스미드로부터 소실된다. 이는 Chinery & Hinchliffe, 1989, Curr . Genet., 16, 21 및 EP 0 286 424에 기술되어 있으며, 여기서 이러한 타입의 벡터는 "디스인테그레이션 벡터"로 명명된 다. 도 2에 나타낸 혼잡한 상태에서, 추가의 폴리뉴클레오타이드 삽입이 이루어질 수 있는지는 쉽게 식별되지 않는다. 링커내의 NotI-사이트는 부가적인 DNA 프레그먼트의 삽입용으로 사용되어 왔지만, 이는 UL 리전과 US 리전사이의 추가적인 비대칭에 기여한다(Sleep et al, 1991, Biotechnology(NY), 9, 183).
본 출원인은 이미 부가적인 DNA를 2㎛ 플라스미드내로 삽입하고 이의 높은 고유 플라스미드 안정성을 유지시키는 것을 시도하였다. 2㎛-패밀리 디스인테그레이션 플라스미드 pSAC300에서, URA3 유전자를 함유하는 1.1-kb DNA 프레그먼트는 URA3 유전자로부터의 전사가 REP2 전사와 같은 방향이 되는 식으로 US-리전내의 REP2와 FLP사이의 EagI-사이트내로 삽입되었다(참조 EP 0 286 424). S150-2B[cir0]은 pSAC300에 의해 우라실 독립영양성으로 형질변형되었으며, 이는 2㎛의 UL-리전내로 삽입된 URA3를 갖는 유사한 벡터보다 상당히 덜 안정적(30세대에서 50% 플라스미드 소실)인 것으로 나타났다(30세대에서 0-10% 플라스미드 소실)(Chinery & Hinchliffe, 1989, Curr . Genet., 16, 21; EP 0 286 424). 따라서, EagI 사이트에서의 삽입은 FLP 발현을 저해할 수 있으며, 삽입 위치는 그 결과물인 플라스미드의 안정성에 대한 깊은 영향을 미칠 수 있다는 결론이 얻어졌으며, 이는 Bijvoet et al., 1991, Yeast, 7, 347에 의해 확인된 결론이다.
2㎛-패밀리 플라스미드내로 추가 폴리뉴클레오타이드 서열을 삽입하는 것이 바람직하다. 예를 들어, 숙주 유래 단백질, 재조합 단백질, 또는 비-암호 안티센스 또는 RNA 저해(RNAi) 전사체를 암호하는 폴리뉴클레오타이드 서열의 삽입이 바람직할 수 있다. 더욱이, 2㎛-패밀리 플라스미드내로 다중의 추가 폴리뉴클레오타이드 서열을 도입하여, 이에 따라 예를 들어, 다중의 개별적으로 암호화된 다중-서브유니트 단백질, 동일한 대사 경로의 다른 멤버, 부가적인 선별 마커 또는 재조합 단백질(단일 또는 다중-서브유니트) 및 재조합 단백질의 발현을 돕는 샤프롱을 암호하는 플라스미드를 제공하는 것이 바람직하다.
그러나, 6,318-bp 2㎛ 플라스미드, 및 다른 2㎛-패밀리 플라스미드는 작용성 유전적 엘레멘트로 혼잡하게 되며(Sutton & Broach, 1985, Mol . Cell. Biol ., 5, 2770; Broach et al, 1979, Cell, 16, 827), 플라스미드 안정성에 수반된 손실없이 부가 DNA 서열의 삽입을 위해 존재하는 분명한 위치를 갖지 않는다. 실제로, 복제 오리진 및 D 유전자 로커스사이의 리전을 제외하고, 전체 2㎛ 플라스미드 게놈은 적어도 하나의 폴리(A)+ 종내로 전사되며, 종종 하나 이상의 폴리(A)+ 종내로 전사된다(Sutton & Broach, 1985, Mol . Cell. Biol ., 5, 2770). 결과적으로, 대부분의 삽입은 생체내에서 플라스미드 기능에 유해한 영향을 미칠 것으로 예측된다.
실제로, 당 기술분야의 숙련자는 2㎛-패밀리 플라스미드내로 이종성 폴리뉴클레오타이드 서열을 삽입하는 것에 대해 포기하였다.
Robinson et al, 1994, Bio/Technology, 12, 381-384는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)에서 재조합 부가 PDI 유전자 복제물이 사람 혈소판 유래 성장 인자(PDGF) B 동종이량체의 재조합 발현을 10배 증가시키고 쉬조사카로미세스 폼베(Schizosacharomyces pombe) 산 포스파타아제의 발현을 4배 증가시키는데 사용될 수 있음을 보고하였다. Robinson은 부가적인 염색체 통합 PDI 유전자 복제물을 이용하여 PDGF 및 S. 폼베 산 포스파타아제의 발현이 증가되는 것을 관찰하였다. Robinson은 다중-복제 2㎛ 발현 벡터를 사용하여 PDI 단백질 수준을 증가시키려는 시도는 이종 단백질 분비에 유해한 영향을 미친다고 보고하였다.
Shusta et al, 1998, Nature Biotechnology, 16, 773-777은 사카로미세스 세레비지아에(Saccharomyces cerevisiae)에서 단일 사슬 항체 프레그먼트(scFv)의 재조합 발현을 기술하였다. Shusta는 이스트 시스템에서 숙주 염색제내로 트랜스유전자의 통합과 에피솜 발현 벡터의 사용간의 선택은 분비에 크게 영향을 줄 수 있다고 보고하였으며(Parekh & Wittrup, 1997, Biotechnol , Prog ., 13, 117-122), δ 통합 벡터를 이용한 scFv 유전자의 숙주 염색체내로의 안정한 통합은 2㎛-기초 발현 플라스미드의 사용에 비해 우수하였다. Parekh & Wittrup, op. cit.는 이미 우 췌장 트립신 저해제(BPTI)의 발현이 2㎛-기초 발현 플라스미드보다는 δ 통합 벡터를 이용하여 크기 순서로 증가 되었음을 가르친 바 있다. 2㎛-기초 발현 플라스미드는 이종성 분비 단백질의 생산에 반-생산적인 것으로 언급되었다.
Bao et al, 2000, Yeast, 16, 329-341은 KlPDI1 유전자가 다중-복제 플라스미드, pKan707상의 K. lactis내로 도입되었음을 보고하였으며, 상기 플라스미드의 존재는 상기 스트레인의 저조한 성장을 야기하였음을 보고하였다. Bao et al, 2000, Bao & Fukuhara, 2001, Gene, 272, 103-110의 초기 발견에 비추어 숙주 염색체상의 KlPDI1의 단일 복제물을 도입하는 것이 선택되었다.
따라서, 상기 기술은 숙련자에게 다중복제 벡터보다는 이스트 염색체내로 트랜스유전자를 통합하는 것을 가르치고 있다. 따라서, 이스트를 형질변형하는 다른 방법이 요구된다.
본 발명은 2㎛-패밀리 플라스미드의 재조합적으로 변형된 형태에 관한 것이다.
2㎛-패밀리 플라스미드는 환형, 이중 스트랜드 DNA 플라스미드이다. 이는 재조합적으로 삽입된 서열을 제외하고 전형적으로 3,000-10,000bp사이, 바람직하게 4,500-7,000bp와 같이 작다. 본 발명에 사용되는 바람직한 2㎛-패밀리 플라스미드는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii))로부터 얻어지는 pSR1, pSB3 또는 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailii)로부터 얻어지는 pSB1 또는 pSB2, 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)로부터 얻어지는 pSM1, 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)으로부터 얻어지는 pKD1, 피치아 멤브라나에파시엔스(Pichia membranaefaciens)로부터 얻어지는 pPM1 및 예를 들어, Volkert, et al., 1989, Microbiological Reviews, 53, 299; Painting, et al., 1984, J. Applied Bacteriology, 56, 331에 기재된 바와 같은 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드 및 변이체(Scp1, Scp2 및 Scp3와 같은)를 포함한다.
2㎛-패밀리 플라스미드는 이스트군내에서의 안정한 다중복제 유지가 가능하나, 반드시 모든 2㎛-패밀리 플라스미드가 모든 타입의 이스트군내에서 다중복제 유지가 가능할 필요는 없다. 예를 들어, 2㎛-패밀리 플라스미드는 특히 사카로미세스 세레비지아에 및 사카로미세스 칼스버제네시스내에서 다중복제 유지가 가능하다.
"다중복제 유지"란 플라스미드가 각 이스트 세포내에서 다중 복제물로 존재하는 것을 의미한다. 2㎛-패밀리 플라스미드를 포함하는 이스트 세포는 [cir+]로 표시되며 2㎛-패밀리 플라스미드를 포함하지 않는 이스트 세포는 [cir0]로 표시된다. [cir+] 이스트 세포는 전형적으로 반수체 게놈당 20-90, 보다 전형적으로 30-80, 바람직하게 40-70, 보다 전형적으로 50-60카피와 같이 10-100카피의 2㎛-패밀리 플라스미드를 포함한다. 더욱이, 플라스미드 복제수는 반수체 게놈당 100이상으로 2㎛-유사 플라스미드의 플라스미드 복제수를 증가시킬 수 있는 숙주의 유전적 환경에 영향받을 수 있다(Gerbaud and Guerineau, 1980, Curr . Genetics, 1, 219, Holm, 1982, Cell, 29, 585, Sleep et al., 2001, Yeast, 18, 403 및 WO99/00504). 다중복제 안정성은 아래에 정의된다.
2㎛-패밀리 플라스미드는 전형적으로 다중복제 플라스미드로서 2㎛-패밀리 플라스미드의 안정한 유지에 작용하는 단백질을 각각 암호하는 적어도 3개의 오픈 리딩 프래임("ORFs")를 포함한다. 상기 3개의 ORFs에 의해 암호화된 단백질은 FLP, REP1 및 REP2로 표시될 수 있다. 2㎛-패밀리 플라스미드가 FLP, REP1 및 REP2를 암호하는 세가지 ORFs를 모두 포함하지 않는 경우에는 이러한 소실된 단백질을 암호하는 ORFs는 다른 플라스미드상에 또는 염색체 통합에 의해 트랜스로 제공되어야 한다.
"FLP" 단백질은 FLP에 의해 인지되는 역위 반복 서열간에 자리-특이 재조합을 촉진할 수 있는 단백질이다. 상기 역위 반복 서열은 FLP 재조합 표적(FRT) 사이트로 칭해지며 각각은 전형적으로 보다 큰 역위 반복의 일부로 존재한다(하기 참조). 바람직한 FLP 단백질은 예를 들어, Volkert et al, op. cit., Murray et al, op. cit 및 Painting et al, op. cit.에 기술된 바와 같은 플라스미드들, pSR1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드중 하나에 의해 암호화된 FLP 단백질의 서열을 포함한다. 이러한 FLP 단백질의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. "프레그먼트" 및 "변이체"는 동일한 FRT 서열간의 자리-특이 재조합을 촉진하는 본래 단백질의 능력을 보유하는 것들이다. 이러한 변이체 및 프레그먼트는 일반적으로 플라스미드들, pSR1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드중 하나에 의해 암호화된 FLP 단백질과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99%, 또는 그 이상의 상동성을 가질 것이다. 다른 FLP 단백질은 다른 FRT 서열 특이성을 가질 수 있다. 전형적인 FRT 사이트는 역위 반복 서열에 의해 플랭킹되는 코어 뉴클레오타이드 서열을 포함할 수 있다. 상기 2㎛ 플라스미드에서, FRT 코어 서열은 8뉴클레오타이드 길이이며 플랭킹 역위 반복 서열은 13뉴클레오타이드 길이이다(Volkert et al, op. cit.). 그러나 어느 주어진 FLP 단백질에 의해 인지되는 FRT 사이트는 2㎛ 플라스미드 FRT 사이트와 다를 수 있다.
REP1 및 REP2는 세포 분열도중 플라스미드 복제의 분할에 관여하며, 또한 FLP 발현 조절에 역할을 할 수 있다. 다른 2㎛-패밀리 플라스미드의 REP1 단백질사이에 상당한 서열 발산이 관찰되나, 이에 반해 다른 2㎛-패밀리 플라스미드로부터 유래된 REP2 단백질사이에 현재 가능한 서열 정렬은 존재하지 않는다. 바람직한 REP1 및 REP2 단백질은 예를 들어, Volkert et al, op. cit., Murray et al, op. cit 및 Painting et al, op. cit.에 기술된 바와 같은 플라스미드들, pSR1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드중 하나에 의해 암호화된 REP1 및 REP2 단백질의 서열을 포함한다. 이러한 REP1 및 REP2 단백질의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. REP1 및 REP2의 "프레그먼트" 및 "변이체"는 본래의 ORF 대신 그 플라스미드에 의해 암호화되는 경우, 적절한 이스트군내에서 플라스미드의 안정한 다중복제 유지가 중단되지 않는 것들이다. REP1 및 REP2의 이러한 변이체 및 프레그먼트는 일반적으로 플라스미드들, pSR1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드중 하나에 의해 암호화된 REP1 및 REP2 단백질과 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 805, 90%, 95%, 98%, 99% 또는 그 이상의 상동성을 가질 것이다.
플라스미드상의 ORFs에 의해 암호화된 REP1 및 REP2 단백질은 양립할 수 있어야 한다. REP1 및 REP2는 플라스미드의 다른 작용 엘레멘트와 함께 사용시 이를 암호하는 플라스미드의 안정한 다중복제 유지에 기여하는 경우 양립할 수 있다. REP1 및 REP2 ORF가 이를 암호하는 플라스미드의 안정한 다중복제 유지에 기여하는지 여부는 각각의 REP1 및 REP2 ORFs가 특이적으로 붕괴되는 플라스미드의 돌연변이를 제조함으로써 검출될 수 있다. 만일 ORF의 붕괴가 플라스미드의 안정한 다중복제 유지에 기여하는 경우 그 ORF는 변이되지 않은 형태로 플라스미드의 안정한 다중복제 유지에 기여하는 것으로 결론지을 수 있다. REP1 및 REP2 단백질은 pSR1, pSB1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드, 또는 이들의 변이체나 프레그먼트와 같은 동일한 자연적으로 발생하는 2㎛-패밀리 플라스미드에 의해 암호화된 REP1 및 REP2 단백질의 서열을 갖는 것이 바람직하다.
2㎛-패밀리 플라스미드는 두개의 역위 반복 서열을 포함한다. 상기 역위 반복는 이들 각각이 FRT 사이트(상기 참조)를 함유하는 한 어떠한 크기일 수 있다. 상기 역위 반복는 전형적으로 고 상동성이다. 이들은 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5% 또는 그 이상의 서열 일치를 공유할 수 있다. 바람직한 구현으로 이들은 동일하다. 전형적으로 상기 역위 반복는 각각 200-1000bp 길이이다. 바람직한 역위 반복 서열은 각각 200-300bp, 300-400bp, 400-500bp, 500-600bp, 600-700bp, 700-800bp, 800-900bp, 또는 900-1000bp의 길이를 갖는 것일 수 있다. 특히 바람직한 역위 반복는 플라스미드 pSR1(959bp), pSB1(675bp), pSB2(477bp), pSB3(391bp), pSM1(352bp), pKD1(346bp), 2㎛ 플라스미드(599bp), pSB4 및 pPM1의 것이다.
상기 역위 반복의 서열은 달라질 수 있다. 그러나, 각 역위 반복에서 FRT 사이트의 서열은 암호화된 FLP 단백질이 플라스미드의 역위 반복 서열사이의 자리-특이 재조합을 촉진하도록 작용할 수 있게 플라스미드에 의해 암호화된 FLP 단백질의 특이성과 양립할 수 있어야 한다. 역위 반복 서열사이의 재조합 (및 이에 따른 FLP 단백질의 플라스미드를 통한 FRT 사이트 인지 능력)은 당 기술분야에 알려진 방법에 의해 검출될 수 있다. 예를 들어, FLP 발현에 호의적인 조건하에서 이스트 세포내에 있는 플라스미드는 플라스미드의 한 리전의 방향이 다른 플라스미드 리전에 대해 변화됨으로써 발생할 수 있는 플라스미드의 리스트릭션 프로필 변화에 대해 평가될 수 있다. 리스트릭션 프로필 변화의 검출은 FLP 단백질이 플라스미드내 FRT 사이트를 인지할 수 있으며, 따라서 각 역위 반복내 FRT 사이트는 플라스미드에 의해 암호화된 FLP 단백질의 특이성과 양립할 수 있음을 나타낸다.
특히 바람직한 구현으로, FRT 사이트를 포함하는 역위 반복의 서열은 pSR1, pSB1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 또는 2㎛ 플라스미드와 같이 FLP 단백질을 암호하는 ORF와 동일한 2㎛-패밀리 플라스미드로부터 유래된다.
상기 역위 반복는 트랜스유전자와 같은 외생적으로 도입된 서열을 배제하고 전형적으로 (예, 2㎛ 플라스미드내에 UL 및 US와 같이 규정된 바와 같은) 역위 반복사이에 규정된 두 리전이 대략적으로 동일한 크기가 되도록 2㎛-패밀리 플라스미드내에 위치한다. 예를 들어, 두 리전중 하나는 다른 한 리전의 길이와 적어도 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 그 이상으로 최대 100%까지 동등한 길이를 가질 수 있다.
2㎛-패밀리 플라스미드는 FLP 및 하나의 역위 반복(다음 단락에 언급된 다른 역위 반복와 이를 구별하기위해 임의로 "IR1"이라 칭함)를 암호하는 ORF를 포함하며, 여기서 IR1은 예를 들어, 2㎛ 플라스미드에서 보여지는 바와 같이 어떠한 개재 암호 서열없이 FLP ORF의 원단(distal end)에 일어나는 방식으로 병렬된다. 이러한 정황에 있어서 "원단"이란 프로모터가 전사를 개시하는 말단에 반대하는 FLP ORF의 말단을 의미한다. 바람직한 구현으로, FLP ORF의 원단은 IR1과 겹쳐진다.
2㎛-패밀리 플라스미드는 REP2 및 다른 역위 반복(이전 단락에 언급된 IR1과 이를 구별하기위해 임의로 "IR2"라 칭함)를 암호하는 ORF를 포함하며, 여기서 IR2는 예를 들어, 2㎛ 플라스미드에서 보여지는 바와 같이 어떠한 개재 암호 서열없이 REP2 ORF의 원단에 일어나는 방식으로 병렬된다. 이러한 정황에 있어서 "원단"이란 프로모터가 전사를 개시하는 말단에 반대하는 REP2 ORF의 말단을 의미한다.
일 구현으로, REP2 및 FLP를 암호하는 ORFs는 2㎛-패밀리 플라스미드의 역위 반복사이에 규정된 두 리전의 동일한 리전상에 존재할 수 있으며, (만일 두 리전간에 크기가 같지않을 경우) 그 리전은 보다 크거나 작은 리전일 수 있다.
일 구현으로, REP2 및 FLP를 암호하는 ORFs는 발산성 프로모터로부터 전사될 수 있다.
전형적으로, 2㎛-패밀리 플라스미드의 역위 반복(예, 2㎛ 플라스미내에 UL 및 US로 규정된 바와 같이)사이에 규정된 리전은 다중복제 플라스미드로서 2㎛-패밀리 플라스미드의 안정한 유지시 작용하는 단백질을 암호하는 많아야 두개의 내생성 유전자를 포함한다. 따라서 바람직한 구현으로, 역위 반복사이에 규정된 플라스미드의 한 리전은 내생성 암호 서열로서 기껏해야 FLP 및 REP2; FLP 및 REP1; 또는 REP1 및 REP2를 암호하는 ORFs를 포함할 수 있다.
2㎛-패밀리 플라스미드는 전형적으로 양방향성인 복제 오리진(자가 복제 서열 - "ARS"라고도 알려짐)을 포함한다. 전형적인 이스트 염색체 복제 오리진의 일치 서열이 적합할 수 있다(Broach et al, 1982, Cold Spring Harbor Symp . Quant . Biol. 47, 1165-1174; Williamson, Yeast, 1985, 1, 1-14). 바람직한 ARSs는 pSR1, pSB1, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드로부터 분리된 것을 포함한다.
따라서, 2㎛-패밀리 플라스미드는 전형적으로 적어도 FLP 및 REP2를 암호하는 ORFs 및 각각 FLP 단백질과 양립가능한 FRT 사이트 및 ARS 서열을 포함하는 두개의 역위 반복 서열을 포함한다. 바람직하게 상기 플라스미드는 또한 REP1을 암호하는 ORF를 포함하나 이는 상기한 바와 같이 트랜스로 제공될 수 있다. 바람직하게 상기 FRT 사이트는 암호화된 FLP 단백질의 서열과 동일한 2㎛-패밀리 플라스미드로부터 유도된다. 바람직하게 암호화 REP1 및 REP2 단백질의 서열은 서로 동일한 2㎛-패밀리 플라스미드로부터 유도된다. 보다 바람직하게, 상기 FRT 사이트는 암호화 FLP, REP1 및 REP2 단백질의 서열과 동일한 2㎛-패밀리 플라스미드로부터 유도된다. 보다 바람직하게, FLP, REP1 및 REP2를 암호하는 ORFs의 서열 및 역위 반복의 서열(FRT 사이트 포함)은 동일한 2㎛-패밀리 플라스미드로부터 유도된다. 보다 바람직하게, ARS 사이트는 FLP, REP1 및 REP중 하나 또는 그 이상의 ORFs 및 역위 반복의 서열(FRT 사이트 포함)과 동일한 2㎛-패밀리 플라스미드로부터 획득된다. 바람직한 플라스미드는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii)로부터 얻어지는 플라스미드 pSR1, pSB3 및 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailli)로부터 얻어지는 pSB1 또는 pSB2, 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)로부터 얻어지는 pSM1, 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)으로부터 얻어지는 pKD1, 피치아 멤브라나에파시엔스(Pichia membranaefaciens)로부터 얻어지는 pPM1, 및 예를 들어, Volkert, et al., 1989, op. cit., Murray et al, op. cit. 및 Painting et al, op. cit.에 기재된 바와 같은 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드를 포함한다.
임의로, 2㎛-패밀리 플라스미드는 Volkert et al, op. cit.에 정의된 바와 같이 2㎛ 플라스미드의 STB 리전(REP3로도 알려짐)과 동등한 리전을 포함할 수 있다. 본 발명의 2㎛-패밀리 플라스미드에서 STB 리전은 3, 4, 5 또는 그 이상과 같은 둘 또는 그 이상의 직렬 반복 서열을 포함할 수 있다. 택일적으로, 직렬 반복 서열이 존재하지 않을 수 있다. 상기 직렬 반복은 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 bp 또는 그 이상의 길이와 같이 어떠한 길이일 수 있다. 직렬 반복의 서열이 동일할 필요는 없다. 약간의 서열 변화가 허용될 수 있다. REP1 및 REP2 ORFs의 하나 또는 두가지 모두와 동일한 플라스미드로부터 STB 리전을 선택하는 것이 바람직할 수 있다. STB 리전은 시스-작용 요소인 것으로 여겨지며 바람직하게 전사되지 않는다.
임의로, 2㎛-패밀리 플라스미드는 다중복제 플라스미드로서 2㎛-패밀리 플라스미드의 안정한 유지시 작용하는 단백질을 암호하는 부가적인 ORF를 포함할 수 있다. 상기 부가적인 단백질은 RAF 또는 D로 표시될 수 있다. RAF 또는 D 유전자를 암호하는 ORFs는 예를 들어, 2㎛ 플라스미드 및 pSM1상에 나타날 수 있다. 따라서 RAF 또는 D ORF는 2㎛ 플라스미드 또는 pSM1에 의해 암호화된 RAF 또는 D 유전자 ORFs의 단백질 산물을 암호하기에 적절한 서열, 또는 그 변이체 및 프레그먼트을 포함할 수 있다. 따라서 2㎛ 플라스미드 또는 pSM1의 RAF 또는 D 유전자의 단백질 산물의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. 2㎛ 플라스미드 또는 pSM1의 RAF 또는 D 유전자의 단백질 산물의 "프레그먼트" 및 "변이체"는 본래의 ORF 대신에 2㎛ 플라스미드 또는 pSM1에 의해 암호화되는 경우 적절한 이스트군내에서 플라스미드의 적절한 다중복제 유지를 붕괴시키지 않는 것들이다. 이러한 변이체 및 프레그먼트는 일반적으로 상기 2㎛ 플라스미드 또는 pSM1에 의해 암호화된 RAF 또는 D 유전자 ORFs의 단백질 산물과 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% 또는 그 이상의 상동성을 갖는다.
본 발명은 REP2 유전자 또는 FLP 유전자중 적어도 하나의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이에서의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 포함하는 2㎛-패밀리 플라스미드를 제공한다.
폴리뉴클레오타이드 서열 삽입은 플라스미드내로 삽입되는 어느 부가적인 폴리뉴클레오타이드 서열이다. 바람직한 폴리뉴클레오타이드 서열 삽입이 하기에 기술된다. 결실은 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 그 이상의 염기쌍에 이르는 제거와 같이 하나 또는 그 이상의 염기쌍의 제거이며, 이는 단일 인접 서열이거나 DNA 서열내에 리전으로부터 떨어진 것일 수 있다. 치환은 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 그 이상의 염기쌍에 이르는 대체와 같이 하나 또는 그 이상의 염기쌍의 대체이며, 이는 단일 인접 서열이거나 DNA 서열내에 리전으로부터 떨어진 것일 수 있다. 리전은 삽입, 결실 또는 치환중 어느 둘, 또는 세가지 모두에 의해 변형될 수 있다.
REP2 유전자 또는 FLP 유전자중 마지막 작용 코돈은 그 유전자의 프로모터로부터 가장 먼 하위에 있는 유전자의 오픈 리딩 프래임내에 있는 코돈이며, 이의 정지 코돈으로의 대체는 Chinery & Hinchliffe(1989, Curr. Genet., 16, 21-25)에 정의된 바와 같은 시험에 의해 측정되는 경우 플라스미드의 다중복제 안정성의 수용불가능한 손실을 초래할 것이다. 예를 들어, 접종 또는 계대배양 기간에 변형을 도입함으로써 원하는 수의 세대에 걸쳐 지수적 로그 성장을 유지하기위해 Chinery & Hinchliffe에 의해 정의된 시험을 변형하는 것이 적절할 수 있다. 이는 Chinery & Hinchliffe에 의해 사용된 분석 및 에스. 세레비지아에 S150-2B하에서 숙주 스트레인간의 차이를 평가하고 그리고/또는 어세이하에서 플라스미드(들)의 개별적 특성에 대한 시험을 최적화하는데 도움이 될 수 있으며, 이는 2㎛-유사 플라스미드의 소 US-리전내에서 삽입 사이트, 그리고/또는 2㎛-유사 플라스미드내 삽입 서열의 크기 및 특성과 같이 2㎛-유사 플라스미드내에서의 다른 차이점들 및/또는 2㎛-유사 플라스미드내 어딘가의 삽입을 확인함으로써 검출될 수 있다. Chinery & Hinchliffe(1989, Curr. Genet., 16, 21-25)에 정의된 비-선별 배지에서 성장하지 않는 이스트에 있어서 다른 적절한 비-선별 배지가 사용될 수 있다. 적절한 택일적인 비-선별 배지는 전형적으로 원하는 수의 세대에 걸쳐 지수적 로그 성장을 허용한다. 예를 들어, 수크로즈 또는 글루코즈가 택일적인 탄소 공급원으로 사용될 수 있다. 플라스미드 안정성은 규정된 수의 세대이후에 선별가능한 마커에 대해 독립 영양성을 유지하는 퍼센트 세포로 정의될 수 있다. 세대수는 바람직하게 pSAC35 또는 pSAC310과 같은 대조 플라스미드간의 차이를 나타내기에 충분할 것이며 혹은 이러한 대조 플라스미드에 유사한 안정성을 나타내기에 충분할 것이다. 세대수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 또는 그 이상일 수 있다. 보다 높은 수가 바람직하다. 수용가능한 플라스미드 안정성은 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9% 또는 실질적으로 100%일 수 있다. 보다 높은 퍼센트가 바람직하다. 플라스미드가 비-선별 배지상에서 성장시 100%보다 작은 안정성을 가질 수 있으나 그러한 플라스미드는 여전히 선별 배지에서 배양시 사용될 수 있다는 것을 숙련자는 인식할 것이다. 예를 들어, 실시예에 기술된 플라스미드 pDB2711은 실시예 1에 따라 안정성 측정시 단지 10% 안정성을 나타내지만 선별 성장 조건하에서 쉐이크 플라스크 배양시 재조합 트랜스페린 생산성이 15배 증가한다.
따라서, 폴리뉴클레오타이드 서열 삽입, 결실 또는 치환을 도입함으로써 어느 유전자에서 마지막 작용 코돈의 어느 포인트 하위에서의 REP2 또는 FLP 유전자의 붕괴는 플라스미드의 다중복제 안정성의 수용불가능한 손실을 초래하지 않을 것이다. 본 발명자들은 각각 플라스미드의 다중복제 안정성의 수용불가능한 손실을 초래하지않고, 2㎛ 플라스미드의 REP2 유전자가 코돈 59이후에 붕괴될 수 있으며 2㎛ 플라스미드의 FLP 유전자가 코돈 344이후에 붕괴될 수 있음을 예기치 않게 발견하였다. 다른 2㎛-패밀리 플라스미드에서 동등한 유전자내의 마지막 작용 코돈은 상기한 바와 같이 관련 유전자의 변형 및 안정성 측정에 의해 통상적으로 검출될 수 있다. 전형적으로, 따라서, 본 발명의 변형된 플라스미드는 그 변형이 플라스미드의 다중복제 안정성의 수용불가능한 손실을 초래하지 않는 점에서 안정하다.
본 발명의 2㎛ 플라스미드내에 REP2 및 FLP 유전자는 각각 이들에 인접한 역위 반복를 갖는다. 상기 역위 반복는 동일한 플라스미드내의 다른 역위 반복의 서열과 (역변환되는 경우) 매치되기 때문에 확인가능하다. "인접한"이란 FLP 또는 REP2 유전자 및 이의 역위 반복가 예를 들어, 2㎛ 플라스미드에서 보여지는 바와 같이 어느 개재 암호 서열없이 상기 유전자의 원단(distal end)에 일어나는 방식으로 병렬되는 것을 의미한다. 이러한 정황에 있어서 "원단"이란 프로모터가 전사를 개시하는 말단에 반대하는 상기 유전자의 말단을 의미한다. 바람직한 구현으로, 상기 유전자의 원단은 역위 반복와 겹쳐진다.
본 발명의 제1 바람직한 견지로, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 REP2 유전자의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이에서 일어나며, 바람직하게 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이에, 보다 바람직하게 REP2 유전자의 번역 종결 코돈이후와 FRT 사이트이전의 마지막 염기이전의 포지션에서 일어난다.
이러한 정황에 있어서 상기 용어 "사이"는 규정된 외측 한계를 포함하며, 따라서 예를 들어, "REP2 유전자의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이"의 삽입, 결실 및/또는 치환은 REP2 유전자의 마지막 작용코돈이후의 첫번째 염기에서의 삽입, 결실 및/또는 치환 및 FRT 사이트이전의 마지막 염기에서의 삽입, 결실 및/또는 치환을 포함한다.
본 발명의 제2 바람직한 견지로, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP 유전자의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내 FRT 사이트이전의 마지막 염기사이에 일어나며, 바람직하게 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이에 일어나며, 보다 바람직하게 FLP 암호 서열의 말단이후의 첫번째 염기에서와 같은 FLP 암호 서열의 말단이후의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이에 일어난다. 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP의 말단이후의 마지막 염기와 역위 반복내 FspI-사이트에서 일어날 수 있으나, 임의로 FspI-사이트내에서는 일어나지 않을 수 있다.
일 구현으로, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및/또는 REP2 유전자는 자연적으로 일어나는 2㎛-패밀리 플라스미드로부터 각각 유래된 FLP 유전자 및/또는 REP2 유전자의 서열을 갖는다.
상기 용어 "로부터 유래된"이란 이들이 유래된 서열과 동일한 서열을 갖는 서열을 포함한다. 그러나, 상기 정의한 바와 같이 이들의 변이체 및 프레그먼트가 또한 포함된다. 예를 들어, 2㎛ 플라스미드의 FLP 유전자로부터 유래된 서열을 갖는 FLP 유전자는 자연적으로 발생하는 유전자와 비교하여 변형된 프로모터 또는 다른 조절 서열을 가질 수 있다. 택일적으로, 2㎛ 플라스미드의 FLP 유전자로부터 유래된 서열을 갖는 FLP 유전자는 자연적으로 발생하는 유전자와 동일한 단백질을 암호하거나 또는 변형된 FLP 단백질을 암호하는 오픈 리딩 프래임내에 변형된 뉴클레오타이드 서열을 가질 수 있다. 특정 공급원으로부터 유래된 서열을 갖는 REP2 유전자에 대해서 동일한 고려가 적용된다.
자연적으로 발생하는 2㎛-패밀리 플라스미드는 2㎛-패밀리 플라스미드에 대해 필수적인 특징으로 상기 정의된 특징을 갖는 어느 플라스미드이며, 이러한 플라스미드는 이스트에서 자연적으로 존재하는 것으로 발견되는 것으로, 즉 이종 서열을 포함하는 것으로 재조합적으로 변형되지 않은 것이다. 바람직하게 자연적으로 발생하는 2㎛-패밀리 플라스미드는 pSR1(등록번호 X02398), pSB3(등록번호 X02608) 또는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii)로부터 얻어지는 플라스미드 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailli)로부터 얻어지는 pSB1 또는 pSB2(등록번호 NC_002055 또는 M18274), 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)로부터 얻어지는 pSM1(등록번호 NC_002054), 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)으로부터 얻어지는 pKD1(등록번호 X03961), 피치아 멤브라나에파시엔스(Pichia membranaefaciens)로부터 얻어지는 pPM1으로부터 선택되거나, 혹은 가장 바람직하게 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드(등록번호 NC_001398 또는 J01347)이다. 등록번호는 NCBI의 기탁번호를 칭한다.
바람직하게, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 및/또는 REP2 유전자에 인접한 역위 반복의 서열은 상기 유전자가 유래되는 서열과 동일한 자연 발생 2㎛-패밀리 플라스미드내의 이에 상응하는 역위 반복의 서열로부터 유래된다. 따라서, 예를 들어, 만일 FLP 유전자가 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드로부터 유래되는 경우, FLP 유전자에 인접한 역위 반복는 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드내의 FLP 유전자에 인접한 역위 반복로부터 유래된 서열을 갖는 것이 바람직하다. 만일 REP2 유전자가 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드로부터 유래되는 경우, REP2 유전자에 인접한 역위 반복는 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드내의 REP2 유전자에 인접한 역위 반복로부터 유래된 서열을 갖는 것이 바람직하다.
본 발명의 제1 바람직한 견지에서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 REP2 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 갖는 경우, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 REP 유전자의 코돈 59의 첫번째 염기와 인접 역위 반복내 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것이 바람직하며, 보다 바람직하게 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나며, 보다 바람직하게는 REP2 암호 서열의 마직막이후의 첫번째 염기에서와 같이 REP2 유전자의 번역 종결 코돈이후와 FRT 사이트이전의 마지막 염기이전의 포지션에서 일어난다.
상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 REP2 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 갖는 경우, 일 구현으로 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에 상기 REP2 유전자 및 그 인접 역위 반복의 서열은 SEQ ID NO:1 또는 이의 변이체로 정의된 바와 같다. SEQ ID NO:1에서, REP2 유전자의 코돈 59의 첫번째 염기는 염기 번호 175로 표시되며 FRT 사이트이전의 마지막 염기는 염기 번호 1216으로 표시된다. 여기에 주어진 FRT 서열은 Sadowski et al, 1986, pp7-10, Mechanisms of Yeast Recombination(Current Communications in Molecular Biology) CSHL. Ed. Klar, A. Strathern, J. N.의 55-염기-쌍이다. SEQ ID NO:1에서, 역위 반복의 첫번째 염기는 염기 번호 887로 표시되며 REP2 유전자의 번역 종결 코돈은 염기 번호 892로 표시된다.
본 발명의 보다 바람직한 구현으로, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 REP2 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 가지며, 저해의 부재하에서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복내에 XcmI 사이트 또는 FspI 사이트를 포함하며 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 XcmI 사이트 또는 FspI 사이트에서 일어난다. SEQ ID NO:1에서, XcmI 사이트는 염기 번호 935-949로 표시되며 FspI 사이트는 염기 번호 1172-1177로 표시된다.
본 발명의 제2 바람직한 견지에서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 갖는 경우, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP 유전자의 코돈 344의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것이 바람직하며, 보다 바람직하게 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나며, 보다 바람직하게는 FLP 암호 서열의 마직막이후의 첫번째 염기에서와 같이 FLP 암호 서열의 마지막이후의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어난다.
상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 갖는 경우, 일 구현으로 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에 상기 FLP 유전자 및 상기 FLP 유전자에 후속하는 역위 반복의 서열은 SEQ ID NO:2 또는 이의 변이체로 정의된 바와 같다. SEQ ID NO:2에서, FLP 유전자의 코돈 344의 첫번째 염기는 염기 번호 1030으로 표시되며 FRT 사이트이전의 마지막 염기는 염기 번호 1419로 표시되며, 상기 역위 반복의 첫번째 염기는 염기 번호 1090으로 표시되며, 그리고 FLP 암호 서열의 마지막이후의 첫번째 염기는 염기 번호 1273으로 표시된다.
본 발명의 보다 바람직한 구현으로, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및 인접 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 가지며, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환의 부재하에서, 역위 반복내에 HgaI 사이트 또는 FspI 사이트를 포함하며 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 HgaI 사이트상의 HgaI의 작용(HgaI은 이를 인지하는 5bp 서열을 절단함)에 의해 형성되는 컷에서 혹은 FspI에서 일어난다. SEQ ID NO:2에서, HgaI 사이트는 염기 번호 1262-1266으로 표시되며 FspI 사이트는 염기 번호 1375-1380으로 표시된다.
숙련자는 본 발명의 제1 및 제2 바람직한 견지에 의해 정의된 플라스미드의 특징이 상호 배타적이지 않음을 인식할 것이다. 따라서, 본 발명의 제3 바람직한 견지에 따른 플라스미드는 REP2 유전자 및 FLP 유전자 모두의 마지막 작용 코돈이후의 첫번째 염기와 상기 각 유전자에 인접한 역위 반복내 FRT 사이트이전의 마지막 염기사이의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 포함할 수 있으며, 여기서 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 동일하거나 다를 수 있다. 예를 들어, 본 발명의 제3 견지에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에 SEQ ID NO:1의 서열 또는 이의 변이체 및 SEQ ID NO:2의 서열 또는 이의 변이체를 포함할 수 있으며, 각각은 본 발명의 제1 및 제2 바람직한 견지에 대해 상기 언급한 바와 같은 포지션에서 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 각각 포함한다.
숙련자는 본 발명의 제1, 제2 및 제3 바람직한 견지의 특징이 또한 다른 서열 변형을 갖는 플라스미드의 가능성을 배제하지 않음을 인식할 것이다. 따라서, 예를 들어, 본 발명의 제1, 제2 및 제3 바람직한 견지의 2㎛-패밀리 플라스미드는 상기 정의된 바와 같은 포지션에 존재하지 않는 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 부가적으로 포함할 수 있다. 따라서, 상기 플라스미드는 본 발명의 삽입 사이트이외의 사이트에서 트랜스유전자를 부가적으로 운반할 수 있다.
2㎛ 플라스미드내에 택일적인 삽입 사이트는 당해 기술분야에 알려져 있으나 본 발명에 의해 정의된 삽입 사이트를 이용하는 경우의 유리함을 제공하지는 않는다. 그럼 에도 불구하고, 당해 기술분야에 알려진 사이트에서의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 이미 포함하는 플라스미드는 본 발명의 제1, 제2 및 제3 바람직한 견지에 의해 정의된 하나 또는 그 이상의 사이트에서의 하나 또는 그 이상의 추가 변형을 제조함으로써 추가 변형될 수 있다. 숙련자는 본 출원서의 도입부에 언급된 바와 같이 본 발명의 제1 및 제2 견지에 의해 정의된 것 이외에 2㎛-패밀리 플라스미드의 사이트에서 트랜스유전자의 삽입시 걸리는 상당한 기술적 한계가 존재함을 인식할 것이다.
당해 기술분야에 알려진 전형적인 변형 2㎛ 플라스미드는 FLP내 EcoRI에 삽입시 이용되는 플라스미드 pCV19, pCV20, CVneo, 삽입 사이트로서 D에서 EcoRI를 이용하는 플라스미드 pCV21, pGT41 및 pYE, 삽입 사이트로서 D에서 PstI을 이용하는 플라스미드 pHKB52, D에서 PstI 및 D에서 EcoRI을 이용하는 플라스미드 pJDB248, D에서 PstI 및 FLP에서 EcoRI을 삽입 사이트로 이용하는 플라스미드 pJDB219, FLP에서 ClaI을 삽입 사이트로 이용하는 플라스미드 pAB18, 삽입 사이트로서 D에서 PstI을 이용하는 플라스미드 pYT11, pYT14 및 pYT11-LEU, 및 삽입 사이트로서 FLP에서 EcoRI을 이용하는 플라스미드 PTY39와 같이 Rose & Broach(1990, Methods Enzymol ., 185, 234-279)에 기재된 것들을 포함한다. 다른 2㎛ 플라스미드는 pSAC3, pSAC3U1, pSAC3U2, pSAC300, pSAC310, pSAC3C1, pSAC3PL1, pSAC3SL4, 및 pSAC3SC1을 포함하며, 이들은 EP 0 286 424 및 Chinery & Hinchliffe(1989, Curr. Genet., 16, 21-25)에 기재되어 있으며, 적절한 2㎛ 삽입 사이트로서 PstI, EagI 또는 SnaBI으로 기재되어 있다. 또한 2㎛ 플라스미드는 pAYE255, pAYE316, pAYE443, pAYE522(Kerry-Williams et al, 1998, Yeast, 14, 161-169), pDB2244(WO00/44772) 및 pAYE329(Sleep et al, 2001, Yeast, 18, 403-421)를 포함한다.
일 바람직한 구현으로, 본 발명의 제1, 제2 및 제3 바람직한 견지에 의해 정의된 바와 같은 2㎛-유사 플라스미드는 ARS 서열주위의 전사되지 않은 리전내에서 일어나는 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 부가적으로 포함할 수 있다. 예를 들어, 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드에서, ARS 서열주위의 전사되지않은 리전은 ARS 서열에서 시작하여 D 유전자의 말단으로 연장된다. SnaBI내로의(복제 서열 ARS의 오리진 부근) 삽입은 Chinery & Hinchliffe, 1989, Curr . Genet., 16, 21-25에 기재되어 있다. 숙련자는 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 또한 Chinery & Hinchliffe에 의해 기술된 SnaBI 사이트에 이웃하는 포지션에서 전사되지 않은 리전내에서 일어날 수 있을 것으로 인식할 것이다.
본 발명의 제1, 제2 및 제3 견지중 어느 하나에 따른 플라스미드는 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 사카로미세스 칼스버제네시스(Saccharomyces. carlsbergenesis), 클루이베로미세스 락티스(Kluyveromyces lactis), 피치아 파스트로리스(Pichia pastroris) 및 피치아 멤브라나에파시엔스(Pichia membranaefaciens), 지고사카로미세스 칼스버제네시스(ZygoSaccharomyces rouxii ), 지고사카로미세스 베일리( Zygosaccharomyces bailii), 지고사카로미세스 퍼멘타티( Zygosaccharomyces fermentati ), 또는 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)과 같은 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 지고사카로미세스(Zygosaccharomyces), 또는 피치아(Pichia) 속의 멤버와 같이, 이스트에서 자가 복제가 가능한 플라스미드일 수 있다. 에스. 세레비지아에 및 에스. 칼스버제네시스는 모두 공지된 2㎛ 플라스미드의 자가 복제에 적절한 숙주 세포를 제공하는 것으로 여겨진다.
바람직한 구현으로, 본 발명의 2㎛-패밀리 플라스미드내에 포함되는 상기 또는 적어도 하나의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 폴리뉴클레오타이드 서열 삽입니다. 플라스미드의 안정성에 수용불가능하게 유해하지 않는 한 어느 폴리뉴클레오타이드 서열 삽입이 이용될 수 있으며, 이는 상기 플라스미드가 변형되지 않은 플라스미드(100%의 안정성으로 지정됨)와 비교시 YEPD 배지와 같은 비-선별 배지에서 적어도 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9% 또는 실질적으로 100% 안정한 것을 의미한다. 바람직하게, 상기 언급된 안정성 수준은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 또는 그 이상의 세대에 대해 배지에서 변형된 플라스미드 및 변형되지 않은 플라스미드를 포함하는 이스트 세포를 선별적으로 배양한 후 나타난다.
상기 플라스미드가 선별가능한 마커를 포함하는 경우, 배지는 숙주에 상기 플라스미드를 보유하려는 선별 압력을 줄 수 있기 때문에 형질변형체가 선별 조건하에서 성장되는 경우(예, 최소 배지에서) 보다 높은 수준의 안정성이 획득될 수 있다.
비-선별 및 선별(예, 최소)배지에서의 안정성은 상기 언급한 방법을 이용하여 검출될 수 있다. 선별 배지에서 안정성은 플라스미드가 이스트를 독립영양성으로 형질변형시키는데 사용될 수 있다는 관찰에 의해 입증될 수 있다.
전형적으로, 상기 폴리뉴클레오타이드 서열 삽입은 적어도 4, 6, 8, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500 또는 그 이상의 염기쌍 길이가 될 것이다. 일반적으로, 상기 폴리뉴클레오타이드 서열 삽입은 1kb, 2kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb, 10kb 또는 그 이상의 길이일 것이다. 숙련자는 본 발명의 2㎛ 플라스미드가 플라스미드내에 다른 사이트에서 다중 폴리뉴클레오타이드 서열 삽입을 포함할 수 있음을 인식할 것이다. 전형적으로, 폴리뉴클레오타이드 서열 삽입의 총 길이는 5kb, 10kb, 15kb, 20kb, 25kb 또는 30kb이하이나 보다 높은 총 길이가 가능하다.
상기 폴리뉴클레오타이드 서열은 새로운 제한 사이트를 도입하기위해 사용되는 링커 서열이거나 아닐 수 있다. 예를 들어, 합성 링커가 추가 제한 사이트(예, BamHI)을 도입하기위한 것과 같이 FLP 유전자이후의 FspI 사이트에 도입되거나 도입되지 않을 수 있다.
상기 폴리뉴클레오타이드 서열 삽입은 전사 리전을 함유할 수 있으며 또는 비 전사 리전을 함유할 수 있다. 전사 리전은 오픈 리딩 프래임을 암호하거나 또는 비-암호 리전일 수 있다. 상기 폴리뉴클레오타이드 서열 삽입은 전사 및 비 전사 리전 모두를 함유할 수 있다.
전사 리전은 RNA 폴리머라아제, 전형적으로 이스트 RNA 폴리머라아제에 의해 전사될 수 있는 DNA 리전이다. 전사 리전은 리보좀 또는 트랜스퍼 RNA와 같은 작용 RNA 분자 또는 또는 안티센스 또는 RNA 저해("RNAi") 분자와 같이 작용할 수 있는 RNA 분자를 암호할 수 있다. 택일적으로 전사 리전은 생체내에서 번역되어 단백질을 생산할 수 있는 오픈 리딩 프래임(ORF)을 함유할 수 있는 메신저 RNA 분자(mRNA)를 암호할 수 있다. 본 명세서에 사용된 용어 "단백질"은 모든 천연 및 비-천연 단백질, 폴리펩타이드 및 펩타이드를 포함한다. 바람직하게, 상기 ORF는 이종 단백질을 암호한다. "이종 단백질"이란 2㎛-패밀리 플라스미드에 의해 자연적으로 암호화되지 않는 단백질을 의미한다(즉, "비-2㎛-패밀리 플라스미드 단백질"). 편의상 용어 "이종 단백질" 및 "비-2㎛-패밀리 플라스미드 단백질"은 본 출원서에 걸쳐 동일한 의미로 사용된다. 따라서, 바람직하게 상기 이종 단백질은 Z. 로욱시로부터 얻어지는 pSR1, pSB3 또는 pSB4, 모두 Z. 베일리로부터 얻어지는 pSB1 또는 pSB2, Z. 퍼멘타티로부터 얻어지는 pSM1, K. 드로소필라럼으로부터 얻어지는 pKD1, P. 멤브라나에파시엔스로부터 얻어지는 pPM1 및 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드중 어느 하나에 의해 암호화된 FLP, REP1, REP2, 또는 RAF/D 단백질이 아니다.
상기 폴리뉴클레오타이드 서열 삽입은 오픈 리딩 프래임을 암호하는 경우 오픈 리딩 프래임을 암호하지 않는 일부 폴리뉴클레오타이드 서열("비암호 리전"으로 불리움)을 부가적으로 포함할 수 있다.
폴리뉴클레오타이드 서열 삽입내의 비암호 리전은 오픈 리딩 프래임에 작동적으로 연결되어 오픈 리딩 프래임의 전사 및 그 결과물인 전사체의 번역을 가능케 하는 하나 또는 그 이상의 조절 서열을 함유할 수 있다.
용어 "조절 서열"은 작동적으로 연결된 오픈 리딩 프래임의 발현(즉, 전사 및/또는 번역)을 조절(즉, 촉진 혹은 감소)하는 서열을 칭한다. 조절 리전은 전형적으로 프로모터, 터미네이터, 리보좀 바인딩 사이트 등을 포함한다. 숙련자는 조절 리전의 선택이 의도된 발현 시스템에 따라 달라질 것임을 인식할 것이다. 예를 들어, 프로모터는 구성적이거나 유도성일 수 있으며 세포- 또는 조직-타입 특이적 또는 비특이적일 수 있다.
발현 시스템이 사카로미세스 세레비지아에(Saccharomyces cerevisiae)와 같은 이스트인 경우, 에스. 세레비지아에에 대한 적절한 프로모터는 PGK1 유전자, GAL1 또는 GAL10 유전자, TEF1 , TEF2 , PYK1 , PMA1 , CYC1 , PHO5 , TRP1 , ADH1 , ADH2 , 글리세르알데히드-3-포스페이트 디하이드로게나아제, 헥소키나아제, 피루베이트 디카르복실라아제, 포스포프룩토키나아제, 트리오즈 포스페이트 이소머라아제, 포스포글루코즈 이소머라아제, 글루코키나아제, α-메이팅 팩터 페로몬, PRB1 프로모터, PRA1 프로모터, GPD1 프로모터, 및 5'조절 리전부와 다른 프로모터의 5'조절 리전부 또는 상위 작용 사이트의 하이브리드를 포함하는 하이브리드 프로모터(예, EP-A-258 067의 프로모터)와 관련된 것들을 포함한다.
적절한 전사 종결 신호는 당 기술분야에 잘 알려져 있다. 숙주 세포가 진핵성인 경우, 전사 종결 신호는 바람직하게 전사 종결 및 폴리아데닐화에 적절한 신호를 갖는 진핵 유전자의 3' 측면 서열로부터 유래된다. 적절한 3' 측면 서열은 예를 들어 사용된 발현 조절 서열에 자연적으로 연결된 유전자의 것일 수 있는 것으로, 즉 프로모터에 상응할 수 있다. 택일적으로, 이들은 다를 수 있다. 이러한 경우 숙주가 이스트, 바람직하게 에스. 세레비지아에인 경우에 에스. 세레비지아에 ADH1, ADH2 , CYC1 또는 PGK1 유전자의 종결 신호가 바람직하다.
2㎛ 유전자와 같은 이웃하는 유전자내로의 전사 통독을 억제하기위해 전사 종결 서열이 프로모터 및 오픈 리딩 프래임의 상위 및 하위 모두에 위치하도록 샤프롱 PDI1의 프로모터 및 오픈 리딩 프래임과 같이 이종성 유전자의 프로모터 및 오픈 리딩 프래임이 전사 종결 서열에 의해 플랭킹되는 것이 유익할 수 있으며 그 반대도 그러하다.
일 구현으로, 사카로미세스 세레비지아에와 같은 이스트에서 호의적인 조절 서열은 EP 431 880에서 가르쳐진 이스트 프로모터(예, 사카로미세스 세레비지아에 PRB1 프로모터); 및 전사 종결자, 바람직하게 EP 60 057에서 가르쳐진 사카로미세스 ADH1의 종결자를 포함한다.
번역 통독을 최소화하여 연장된 비-천연 융합 단백질의 생산을 피하기 위해 비암호 리전은 UAA, UAG 또는 UGA와 같은 번역 정지 코돈을 암호하는 하나이상의 DNA 서열을 포함하는 것이 유익할 수 있다. 상기 번역 정지 코돈 UAA이 바람직하다. 바람직하게, 적어도 두개의 번역 정지 코돈이 포함된다.
용어 "작동적으로 연결된"이란 조절 리전이 의도된 방식으로 오픈 리딩 프래임에 영향을 미치도록 하는 오픈 리딩 프래임과 관계를 형성하는 것과 같이 어느 비암호 리전내에 조절 서열이 위치한다는 의미를 포함한다. 따라서 오픈 리딩 프래임에 "작동적으로 연결된" 조절 리전은 조절 리전이 조절 서열과 양립가능한 조건하에서 의도된 방식으로 오픈 리딩 프래임의 전사 및/또는 번역에 영향을 미칠 수 있는 방식으로 위치한다.
본 발명의 제1, 제2 또는 제3 견지에 의해 정의된 바와 같이 폴리뉴클레오타이드 서열 삽입이 단백질을 암호하는 오픈 리딩 프래임을 포함하는 경우, 암호화된 단백질은 분비되는 것이 유리할 수 있다. 이러한 경우, 분비 리더 서열을 암호하는 서열이 오픈 리딩 프래임에 포함될 수 있다.
이스트 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 지고사카로미세스 종, 클루이베로미세스 락티스(Kluyveromyces lactis) 및 피치아 파스트로리스(Pichia pastroris)와 같은 진핵 종에서 단백질 생성에 있어서, 공지 리더 서열은 에스. 세레비지아에 액시드 포스파타아제 단백질(Pho5p)(참조 EP 366 400), 인버타아제 단백질(Suc2p)(참조 Smith et al.(1985) Science, 229, 1219-1224) 및 히트-쇼크 단백질-150(Hsp150p)(참조 WO 95/33833)의 리더 서열을 포함한다. 또한, 에스. 세레비지아에 메이팅 팩터 알파-1 단백질(MFα-1) 및 사람 리소자임 및 사람 혈청 알부민(HSA) 단백질의 리더 서열이 사용되며, 이에 한정하는 것은 아니나 후자가 사람 알부민 분비용으로 특히 사용된다. WO 90/01063에는 MFα-1 리더 서열의 사용에 비해 사람 알부민의 오염 프레그먼트의 생성을 유익하게 감소시키는 MFα-1과 HSA 리더 서열의 융합체가 개시되어 있다. 또한, 천연 프랜스페린 리더 서열은 트랜스페린 및 다른 이종 단백질의 분비를 지시하는데 사용될 수 있다.
택일적으로, 상기 암호 단백질은 세포내(intracellular)성일 수 있다.
일 바람직한 구현으로, 본 발명의 제1, 제2 또는 제3 견지에 의해 정의된 바와 같은 적어도 하나의 폴리뉴클레오타이드 서열 삽입은 이스트 단백질을 암호하는 서열을 포함하는 오픈 리딩 프래임을 포함한다. 다른 바람직한 구현으로, 본 발명의 제1, 제2 또는 제3 견지에 의해 정의된 바와 같은 적어도 하나의 폴리뉴클레오타이드 서열 삽입은 2㎛-유사 플라스미드가 유래되는 동일한 숙주의 이스트 단백질을 암호하는 서열을 포함하는 오픈 리딩 프래임을 포함한다.
다른 바람직한 구현으로, 본 발명의 제1, 제2 또는 제3 견지에 의해 정의된 바와 같은 적어도 하나의 폴리뉴클레오타이드 서열 삽입은 단백질 폴딩에 관련되는 단백질을 암호하거나 샤프롱 활성을 갖거나 폴딩되지 않은 단백질 반응에 관련되는 단백질을 암호하는 서열(Stanford Genome Database(SGD), http:://db.yeastgenome.org)을 포함하는 오픈 리딩 프래임을 포함한다. 바람직한 단백질은 AHA1 , CCT2 , CCT3 , CCT4 , CCT5 , CCT6 , CCT7 , CCT8 , CNS1 , CPR3 , CPR6 , ER01, EUG1 , HCH1 , HSP10 , HSP12 , HSP104 , HSP26 , HSP30 , HSP42 , HSP60 , HSP78 , HSP82, JEM1 , MDJ1 , MDJ2 , MPD1 , MPD2 , PD11 , PFD1 , ABC1 , APJ1 , ATP11 , ATP12 , BTT1, CDC37 , CNS1 , CPR6 , CPR7 , HSC82 , KAR2 , LHS1 , MGE1 , MRS11 , NOB1 , ECM10 , SSA1, SSA2 , SSA3 , SSA4 , SSC1 , SSE2 , SIL1 , SLS1 , ORM1 , UBI4 , ORM2 , PER1 , PTC2 , PSE1 및 HAC1 또는 절단된 무인트론 HAC1(Valkonen et al. 2003, Applied Environ. Micro. 69, 2065)에 의해 암호화된 단백질로부터 선택될 수 있다.
단백질 폴딩에 관련되는 바람직한 단백질, 또는 샤프롱 활성을 갖는 단백질 또는 폴딩되지 않은 단백질 반능에 관련되는 단백질은 다음과 같을 수 있다:
(SSA1 , SSA2 , SSA3 , SSA4 , SSB1 및 SSB2에 의해 암호화되는 단백질과 같은 Kar2p, SSA 및 SSB 단백질을 포함하는) hsp70 패밀리의 단백질 멤버인 단백질, HSP90-패밀리의 멤버인 단백질, 또는 HSP40-패밀리의 멤버인 단백질 또는 DNA-J 및 DNA-J-유사 단백질(예, Jem1p, Mdj2p)을 포함하는 조절시 관련되는 단백질과 같은 히트 쇼크 단백질;
Orm2p와 같은 Hjelmqvist et al, 2002, Genome Biology, 3(6), research0027.1-0027.16에 의해 기술된 ORMDL 패밀리의 멤버인 단백질.
예를 들어, SSA1 , SSA2 , SSA3 , SSA4 , SSB1 및 SSB2에 의해 암호화된 단백질과 같은 SSA 및 SSB 단백질을 포함하는 hsp 70 단백질과 같은 시토졸내에서 활동하는 단백질;
설피드릴 산화 또는 디설피드 결합 형성, 파괴 또는 이성질체화에 관련되는 단백질, 또는 단백질 디설피드 이소머라아제(예, Pdi1p, Mpd1p), 동종성(예, Eug1p) 및/또는 관련 단백질(예, Mpd2p, Fmo1p, Ero1p)과 같이 특히, 분비 및 세포 표면 단백질의 생합성도중 단백질에서 티올:디설피드 교환 반응을 촉진하는 단백질;
성숙 단백질보다는 예를 들어, SSA1 , SSA2 , SSA3 , SSA4 , SSB1 및 SSB2에 의해 암호화되는 단백질과 같이 SSA 및 SSB를 포함하는 hsp70 단백질과 같은 폴딩되지 않은 단백질에 우선적으로 혹은 배타적으로 결합하는 단백질;
예를 들어, SSA1 , SSA2 , SSA3 , SSA4 , SSB1 및 SSB2에 의해 암호화되는 단백질과 같이 SSA 및 SSB를 포함하는 hsp70 단백질과 같은 시토졸내에서 전구체 단백질의 응집을 저해하는 단백질.
폴딩되지 않은 단백질 반응에 관련되거나 혹은 Hjelmqvist et al, 2002(상기 참조)(예, Orm2p)에 의해 기술된 ORMDL 패밀리의 멤버와 같이 폴딩되지 않은 단백질 반응을 유도하는 제제(터니카마이신 및 디티오트레이톨과 같은)에 대한 증가된 저항성을 제공하는 단백질 또는 스트레스에 대한 반응과 관련된 단백질(예, Ubi4p);
PDI와 같이, EP 0 746 611 및 Hillson et al, 1984, Methods Enzymol., 107, 281-292에 기술된 바와 같은 스크램블링된 리보뉴클레아제의 RNA에 대한 리보뉴클레아제 활성을 재활성화시킬 수 있는 단백질;
소포체(예, Lha1p) 또는 세포내 활성 사이트(예, PseIp)내로의 효율적인 변위에 필요한 단백질을 포함하는 적절한 폴딩 수송 및/또는 분비를 일으키기위해 미성숙 형태의 폴리펩타이드에 일시적으로 결합하는 단백질;
바람직한 샤프롱은 디설피드 이소머라아제(PDI) 또는 소포체의 루멘내에 디설피드 결합의 형성을 촉진하는 것과 동등한 능력을 갖는 이들의 프레그먼트 또는 변이체이다. "PDI"란 EP 0 746 611 및 Hillson et al, 1984, Methods Enzymol. 107, 281-292에 기술된 바와 같은 스크램블링된 리보뉴클라아제의 RNA에 대한 리보뉴클라아제 활성을 재활성화시키는 능력을 갖는 어느 단백질을 포함한다.
단백질 디설피드 이소머라아제는 전형적으로 티올:디설피드 상혹작용 반응을 촉진하는 효소이며, 그리고 분비 세포에서 E.R. 루멘의 주로 상주하는 단백질 성분이다. 이는 분비 단백질 생합성에서 역할을 하는 것으로 제시되으며(Freedman, 1984, Trends Biochem . Sci., 9, 438-41), 이는 원위치에서 직접적인 가교 시험에 의해 뒷받침되었다(Roth 및 Pierce, 1987, Biochemistry, 26, 4179-82). PDI에 결함이 있는 마이크로솜 멤브레인은 코트랜슬래이셔널 단백질 디설피드 형성시 특정 결함을 나타낸다는 발견(Bulleid 및 Freedman, 1988, Nature, 335, 649-51)은 그 효소가 분비 및 세포 표면 단백질의 생합성도중 본래의 디설피드 결합 형성의 촉매로서 작용함을 의미한다. 이 역할은 티올:디설피드 상호작용 반응을 촉진하여 네트 단백질 디설피드 형성, 파괴 또는 이성질체화를 이끌며, 그리고 단백질 폴딩 및 광범위하게 다양한 감소된, 폴딩되지 않은 단백질 기질에서 본래의 디설피드 결합의 형성을 촉진할 수 있다(Freeman et al., 1989, Biochem . Soc . symp ., 55, 167-192)는 시험관내에서 효소의 촉매 특성으로 알려진 것과 부합한다. PDI는 또한 이소머라아제 활성이 결여된 돌연변이 PDI가 단백질 폴딩을 촉진하기때문에 샤프롱으로 작용한다(Hayano et al., 1995, FEBS Letters, 377, 505-511). 최근, 디설피드 이성질체화가 아닌 설피드릴 산화는 에스. 세레비지아에에서 단백질 디설피드 이소머라아제의 중요한 기능인 것으로 보고되었다(Solovyov et al., 2004, J. Biol. Chem., 279(33)34095-34100). 상기 효소의 DNA 및 아미노산 서열은 여러 종에 대해 알려져 있으며(Scherens et al, 1991, Yeast, 7, 185-193; Farquhar et al, 1991, Gene, 108, 81-89; EP074661; EP0293793; EP0509841) 포유류 간으로부터 동종성에 대해 정제된 상기 효소의 작용 메카니즘에 대한 정보는 증가하고 있다(Creighton et al, 1980, J. Mol . Biol ., 142, 43-62; Freedman et al, 1988, Biochem . Soc . Trans., 16, 96-9; Gilbert, 1989, Biochemistry, 28, 7298-7305; Lundstrom 및 Holmgren, 1990, J. Biol . Chem ., 265, 9114-9120; Hawkins 및 Freedman, 1990, Biochem . J., 275, 335-339). 세포내에서 단백질 폴딩, 어셈블리 및 변위의 매개자로서 관련된 현재 다수의 단백질 팩터중에서(Rothman, 1989, Cell, 59, 591-601), PDI는 잘 정의된 촉매 활성을 갖는다.
숙주내에서 내생성 PDI 유전자의 결실 또는 불활성화는 생존불가능한 숙주의 생성을 일으킨다. 즉, 내생성 PDI 유전자는 "필수" 유전자이다.
PDI는 포유류 조직으로부터 용이하게 분리되며 그 동종 효소는 특질상 산성 pI(4.0-4.5)을 갖는 동종이량체(2x57kD)이다(Hillson et al, 1984, Methods Enzymol., 107, 281-292). 상기 효소는 또한 밀 및 조류 클라미도모나스 레인하디(Chlamydomonas reinhardii)(Kaska et al, 1990, Biochem . J., 268, 63-68), 래트(Edman et al, 1985, Nature, 317, 267-270), 소(Yamauchi et al, 1987, Biochem. Biophys . Res. Comm ., 146, 1485-1492), 사람(Pihlajaniemi et al, 1987, EMBO J., 6, 643-9), 이스트(Scherens et al, 상기 참조; Farquhar et al, 상기 참조) 및 병아리(Parkkonen et al, 1988, Biochem . J., 256, 1005-1011)로부터 정제된다. 이러한 척추동물 종으로부터 얻어지는 단백질은 전체적으로 고도의 서열 보존성을 나타내며 모두 래트 PDI 서열에 처음 주목된 여러 전체적 특징들을 보여준다(Edman et al., 1985, op. cit.).
이스트 단백질 디설피드 이소머라아제 전구체, PDI1은 Genbank 등록번호 CAA42373 또는 BAA00723으로 발견될 수 있다:
택일적인 PDI 서열은 Genbank 등록번호 CAA38402로 발견될 수 있다. 이는 다음과 같은 530 아미노산 서열을 갖는다.
상기 PDI 서열의 변이체 및 프레그먼트, 및 이외의 자연 발생 PDI 서열의 변이체가 또한 본 발명에 포함된다. 이러한 정황에 있어서, PDI의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 단백질에 예를 들어, 효소 활성(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.
"보존적 치환"이란 Val, Ile, Leu, Ala, Met; Asp, Glu; Asn, Gln; Ser, Thr, Gly, Ala; Lys, Arg, His; 및 Phe, Tyr, Trp와 같은 의도된 조합이다. 바람직한 보존적 치환은 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr을 포함한다.
"변이체"는 전형적으로 이것이 유도된 폴리펩타이와 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.
두 폴리펩타이드간의 퍼센트 서열 동일성은 하기에 언급된 바와 같이 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있다. 이러한 변이체는 자연적이거나 혹은 당 기술분야에 잘 알려져 있는 바와 같은 단백질 합성 및 사이트-디렉티드 돌연변이 생성 방법을 이용하여 제조될 수 있다.
이러한 정황에 있어서 PDI의 "프레그먼트"는 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 성숙 PDI 단백질의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 PDI 단백질의 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.
PDI의 프레그먼트 또는 변이체는 에스. 세레비지아에와 같은 숙주 세포에서 재조합적으로 발현되는 경우 숙주 세포에서 내생적으로 암호화된 PDI 유전자의 결실을 보완할 수 있는 단백질일 수 있다. 예를 들어, 다른 이스트 또는 다른 균류, 또는 사람 또는 다른 척추동물과 같은 다른 진핵생물, 또는 동물 또는 식물과 같은 다른 유기체에 의해 암호화된 동족체와 같은 자연 발생 PDI 동족체일 수 있다.
다른 바람직한 샤프롱은 SSA1 또는 등가의 샤프롱-유사 활성을 갖는 이의 프레그먼트나 변이체이다. YG100으로도 알려진 SSA1은 에스. 세레비지아에의 염색체 1에 위치하며 크기는 1.93-kbp이다.
SSA1의 공개된 단백질 서열은 다음과 같다:
SSA1에 대한 공개된 암호 서열은 다음과 같지만 하기 서열은 동일한 단백질 산물을 암호하는 택일적인 뉴클레오타이드 서열을 얻기위해 디제너레이트 치환에 의해 변형될 수 있는 것으로 인식될 것이다.
단백질 Ssa1p는 Hsp70 단백질 패밀리에 속하며 세포질내에 상주한다. Hsp70s는 다수의 샤프롱 활성들 즉, 단백질 합성, 어셈블리 및 폴딩의 보조; 폴리펩타이드의 여러 세포내 위치로의 변위 매개, 및 단백질 응집물의 분해를 수행하는 능력을 갖는다(Becker & Craig, 1994, Eur . J. Biochem . 219, 11-23). Hsp70 유전자는 고 보존적이며, N-말단 ATP-바인딩 도메인 및 C-말단 펩타이드-바인딩 도메인을 갖는다. Hsp70 단백질은 주로 폴딩되지 않은 단백질의 펩타이드 백본과 상호작용한다. hsp70 단백질에 의한 펩타이드의 바인딩 및 방출은 ATP-의존적 프로세스이며 hsp70의 형태적 변화가 수반된다(Becker & Craig, 1994, 상기 참조).
세포질 hsp70 단백질은 특히 단백질의 합성, 폴딩 및 분비에 관련된다(Becker & Craig, 1994, 상기 참조). 에스. 세레비지아에에서 hsp70 단백질은 SSA(SSA 1-4) 및 SSB(SSB 1 및 2), 두 그룹으로 나뉘며, 이들은 서로 기능적으로 구별된다. SSA 패밀리는 그룹으로부터 적어도 하나의 단백질이 세포 생존능을 유지하기위해 활성적이어야 하는 점에서 필수적이다(Becker & Craig, 1994, 상기 참조). 세포질 hsp70 단백질은 우선적으로 폴딩되지 않은 미성숙 단백질에 우선적으로 결합한다. 이는 이들이 세포질내에 다중분자 복합체내로 집합되기전에 폴딩되지 않은 상태로 유지되고 여러 가지 세포기관으로의 전위를 촉진함으로써 전구체 단백질의 응집을 저해하는 것을 제시한다(Becker & Craig, 1994, 상기 참조). SSA 단백질은 특히 소포체 및 미토콘드리아내로의 전위를 위한 전구체의 번역후 생체내 합성 및 유지와 관련된다(Kim et al., 1998, Proc . Natl . Acad . Sci . USA. 95, 12860-12865; Ngosuwan et al., 2003, J. Biol . Chem . 278(9), 7034-7042). Ssa1p는 손상된 단백질에 바인딩하고, 이를 부분적으로 폴딩된 형태로 안정화하고 리폴딩 또는 분해가 일어나도록 하는 것으로 나타났다(Becker & Craig, 1994, 상기 참조; Glover & Lindquist, 1998, Cell. 94, 73-82).
SSA1의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. 이러한 정황에 있어서 SSA1의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 단백질에 예를 들어, 효소 활성(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.
"보존적 치환"이란 Val, Ile, Leu, Ala, Met; Asp, Glu; Asn, Gln; Ser, Thr, Gly, Ala; Lys, Arg, His; 및 Phe, Tyr, Trp와 같은 의도된 조합이다. 바람직한 보존적 치환은 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr을 포함한다.
SSA1의 "변이체"는 전형적으로 본래 SSA1의 서열과 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.
두 폴리펩타이드간의 퍼센트 서열 동일성은 하기에 언급된 바와 같이 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있다. 이러한 변이체는 자연적이거나 혹은 당 기술분야에 잘 알려져 있는 바와 같은 단백질 합성 및 사이트-디렉티드 돌연변이 생성 방법을 이용하여 제조될 수 있다.
이러한 정황에 있어서 SSA1의 "프레그먼트"는 본래 SSA1의 서열이외에 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 전체 성숙 SSA1 단백질의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 SSA1 단백질의 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.
SSA1의 프레그먼트 또는 변이체는 에스. 세레비지아에와 같은 숙주 세포에서 재조합적으로 발현되는 경우 숙주 세포에서 내생적으로 암호화된 SSA1 유전자의 결실을 보완할 수 있는 단백질일 수 있다. 예를 들어, 다른 이스트 또는 다른 균류, 또는 사람 또는 다른 척추동물과 같은 다른 진핵생물, 또는 동물 또는 식물과 같은 다른 유기체에 의해 암호화된 동족체와 같은 자연 발생 SSA1 동족체일 수 있다.
다른 바람직한 샤프롱은 PSE1 또는 등가의 샤프롱-유사 활성을 갖는 이의 프레그먼트나 변이체이다.
KAP121으로도 알려진 PSE1은 염색체 XIII에 위치하는 필수 유전자이다.
단백질 pse1p에 대한 공개된 단백질 서열은 다음과 같다:
공개된 PSE1의 뉴클레오타이드 암호 서열은 다음과 같지만 하기 서열은 동일한 단백질 산물을 암호하는 택일적인 뉴클레오타이드 서열을 얻기위해 디제너레이트 치환에 의해 변형될 수 있는 것으로 인식될 것이다.
PSE1 유전자는 3.25-kbp크기이다. Pse1p는 거대분자의 핵 세포질 운반에 관련된다(Seedorf & Silver, 1997, Proc . Natl . Acad . Sci . USA. 94, 8590-8595). 이 공정은 핵 엔벨로프에 매입되고 뉴클레오포린으로 구성된 핵 포어 콤플렉스(NPC)를 통해 일어난다(Ryan & Wente, 2000, Curr . Opin . Cell Biol . 12, 361-371). 단백질은 핵 이입, 핵 위치화 서열(NLS) 및 방출, 핵 방출 서열(NES)에 필요한 정보를 함유하는 특정 서열을 갖는다(Pemberton et al., 1998, Curr . Opin . Cell Biol . 10, 392-399). Pse1p는 단백질의 한 그룹인 캐리오페린/임포틴이며, 이는 α 및 β 패밀리로 나뉜다. 캐리오페린은 NLS 및 NES를 인지함으로써 핵막을 횡단하는 거대분자의 수송을 매개하고 NPC와 상호작용하는 가용성 운반 팩터이다(Seedorf & Silver, 1997, 상기 참조; Pemberton et al., 1998, 상기 참조; Ryan & Wente, 2000, 상기 참조). 핵 포어를 통한 전위는 소 GTP-바인딩 단백질, Ran에 의해 촉진된 GTP 가수분해에 의해 유도된다(Seedorf & Silver, 1997, 상기 참조). Pse1p는 캐리오페린 β로 확인된 바 있다. 14개의 캐리오페린 β 단백질이 에스. 세레비지아에에서 확인되어 있으며 그 중 4개만이 필수적이다. 이는 아마도 다중 캐리오페린이 단일 거대분자의 운반을 매개하기 때문인 것으로 여겨진다(Isoyama et al., 2001, J. Biol . Chem . 276(24), 21863-21869). Pse1p는 엔벨로프에 핵으로 그리고 세포질에 특정 범위로 위치화된다. 이는 운반 작용의 일부로서 단백질이 핵 내외로 이동함을 제시한다(Seedorf & Silver, 1997, 상기 참조). Pse1p는 전사 팩터(Isoyama et al., 2001, 상기 참조; Ueta et al., 2003, J. Biol . Chem . 278(50), 50120-50127), 히스톤(Mosammaparast et al., 2002, J. Biol . Chem . 277(1), 862-868), 및 리보좀내로 모이기전 리보좀 단백질(Pemberton et al., 1998, 상기 참조)의 핵 이입에 관련된다. 이는 또한 핵으로부터 mRNA의 방출을 매개한다. 캐리오페린은 RNA-바인딩 단백질상에서 발견되는 별개의 NES를 인지하고 바인딩하며, 이는 핵으로부터 방출되기 전에 RNA를 코팅한다(Seedorf & Silver, 1997, Pemberton et al., 1998, 상기 참조).
거대분자의 핵세포질 운반은 세포 주기에 걸친 적절한 프로그레션에 필수적이기 때문에, pse1p와 같은 핵 운반 팩터는 성장 조절에 새로운 후보 표적이다(Seedorf & Silver, 1997, 상기 참조).
에스. 세레비지아에에서 다중복제 플라스미드상의 Pse1p(단백질 분비 인핸서)의 과발현은 또한 생물학적으로 활성적인 단백질의 레퍼터리의 단백질 분비 수준을 증가시키는 것으로 나타났다(Chow et al., 1992; J. Cell. Sci . 101(3), 709-719).
PSE1의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. 이러한 정황에 있어서 PSE1의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 단백질에 예를 들어, 효소 활성(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.
"보존적 치환"이란 Val, Ile, Leu, Ala, Met; Asp, Glu; Asn, Gln; Ser, Thr, Gly, Ala; Lys, Arg, His; 및 Phe, Tyr, Trp와 같은 의도된 조합이다. 바람직한 보존적 치환은 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr을 포함한다.
PSE1의 "변이체"는 전형적으로 본래 PSE1의 서열과 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.
두 폴리펩타이드간의 퍼센트 서열 동일성은 하기에 언급된 바와 같이 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있다. 이러한 변이체는 자연적이거나 혹은 당 기술분야에 잘 알려져 있는 바와 같은 단백질 합성 및 사이트-디렉티드 돌연변이 생성 방법을 이용하여 제조될 수 있다.
이러한 정황에 있어서 PSE1의 "프레그먼트"는 본래 PSE1의 서열이외에 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 전체 성숙 PSE1 단백질의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 PSE1 단백질의 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.
PSE1의 프레그먼트 또는 변이체는 에스. 세레비지아에와 같은 숙주 세포에서 재조합적으로 발현되는 경우 숙주 세포에서 내생적으로 암호화된 PSE1 유전자의 결실을 보완할 수 있는 단백질일 수 있다. 예를 들어, 다른 이스트 또는 다른 균류, 또는 사람 또는 다른 척추동물과 같은 다른 진핵생물, 또는 동물 또는 식물과 같은 다른 유기체에 의해 암호화된 동족체와 같은 자연 발생 PSE1 동족체일 수 있다.
다른 바람직한 샤프롱은 ORM2 또는 등가의 샤프롱-유사 활성을 갖는 이의 프레그먼트나 변이체이다.
YLR350W으로도 알려진 ORM2는 에스. 세레비지아에 게놈의 염색체 XII(포지션 828729-829379)에 위치하며, 이스트 단백질 Orm1p과 유사한 진화적으로 보존된 단백질을 암호하는 유전자이다. Hjelmqvist et al, 2002, Genome Biology, 3(6), research0027.1-0027.16에는 ORM2가 3가지 사람 유전자(ORMDL1, ORMDL2 및 ORMDL3)를 포함하는 유전자 패밀리에 속하며 또한 마이크로스포리디아, 식물, 드로조필라(Drosophila), 유로코데이트 및 척추동물에서 동종성인 것으로 보고되어 있다. ORMDL 유전자는 단백질 소포체(ER)내에 부착된 트랜스멤브레인 단백질을 암호하는 것으로 보고되어 있다.
단백질 Orm2p는 폴딩되지 않은 단백질 반응을 유도하는 제제에 대한 저항성에 필요하다. Hjelmqvist et al, 2002(상기 참조)에는 두 에스. 세레비지아에 ORMDL 동족체(ORM1 및 ORM2)의 더블 넉아웃은 감소된 성장율 및 터니카마이신 및 디티오트레이톨에 대한 보다 큰 민감성을 일으키는 것으로 보고되어 있다.
Orm2p의 공개 서열은 다음과 같다:
상기 단백질은 하기와 같은 암호 뉴클레오타이드에 의해 에스. 세레비지아에에서 암호화되지만, 하기 서열은 동일한 단백질 산물을 암호하는 택일적인 뉴클레오타이드 서열을 얻기위해 디제너레이트 치환에 의해 변형될 수 있는 것으로 인식될 것이다.
ORM2의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. 이러한 정황에 있어서 ORM2의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 단백질에 예를 들어, 효소 활성(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.
"보존적 치환"이란 Val, Ile, Leu, Ala, Met; Asp, Glu; Asn, Gln; Ser, Thr, Gly, Ala; Lys, Arg, His; 및 Phe, Tyr, Trp와 같은 의도된 조합이다. 바람직한 보존적 치환은 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr을 포함한다.
ORM2의 "변이체"는 전형적으로 본래 ORM2의 서열과 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.
두 폴리펩타이드간의 퍼센트 서열 동일성은 하기에 언급된 바와 같이 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있다. 이러한 변이체는 자연적이거나 혹은 당 기술분야에 잘 알려져 있는 바와 같은 단백질 합성 및 사이트-디렉티드 돌연변이 생성 방법을 이용하여 제조될 수 있다.
이러한 정황에 있어서 ORM2의 "프레그먼트"는 본래 ORM2의 서열이외에 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 전체 성숙 ORM2 단백질의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 ORM2 단백질의 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.
ORM2의 프레그먼트 또는 변이체는 에스. 세레비지아에와 같은 숙주 세포에서 재조합적으로 발현되는 경우 숙주 세포에서 내생적으로 암호화된 ORM2 유전자의 결실을 보완할 수 있는 단백질일 수 있다. 예를 들어, 다른 이스트 또는 다른 균류, 또는 사람 또는 다른 척추동물과 같은 다른 진핵생물, 또는 동물 또는 식물과 같은 다른 유기체에 의해 암호화된 동족체와 같은 자연 발생 ORM2 동족체일 수 있다.
본 발명의 제1, 제2 또는 제3 견지에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입내에 또는 플라스미드의 어딘가 다른 곳에 알부민의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질을 암호하는 오픈 리딩 프래임을 포함한다. 택일적으로, 플라스미드로 형질변형되는 숙주세포는 그 게놈내에 내생성 혹은 이종성 서열로서 알부민의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질을 암호하는 오픈 리딩 프래임을 포함할 수 있다.
"알부민"이란 어느 공급원으로부터 얻어진 알부민 단백질의 서열을 갖는 단백질을 포함한다. 전형적으로 상기 공급원은 포유류이다. 바람직한 일 구현으로 상기 혈청 알부민은 사람 혈청 알부민("HSA")이다. 용어 "사람 혈청 알부민"은 사람에서 자연적으로 일어나는 아미노산 서열을 갖는 혈청 알부민 및 이의 변이체를 의미한다. 바람직하게 상기 알부민은 WO 90/13653에 개시된 아미노산 서열 또는 이의 변이체를 갖는다. HSA 암호 서열은 사람 유전자에 상응하는 cDNA를 분리하는 공지 방법에 의해 얻어질 수 있으며 예를 들어 EP 73 646 및 EP 286 424에 또한 개시되어 있다.
다른 바람직한 구현으로 "알부민"은 우 혈청 알부민의 서열을 갖는다. 용어 "우 혈청 알부민"은 예를 들어 Swissprot 등록번호 P02769로부터 취해지는 바와 같은, 소에서 자연적으로 발생하는 아미노산 서열 및 하기 정의된 바와 같은 이의 변이체를 갖는 혈청 알부민을 의미한다. 용어 "우 혈청 알부민"은 하기 정의된 바와 같이 전장 우 혈청 알부민의 프레그먼트 또는 이의 변이체를 의미하는 것을 포함한다.
다른 바람직한 구현으로, 상기 알부민은 개(예, 참조 Swissprot 등록번호 P49822), 돼지(예, 참조 Swissprot 등록번호 P08835), 염소(예, Sigma로부터 제품번호 A2514 또는 A4164로서 이용가능), 칠면조(예, 참조 Swissprot 등록번호 O73860), 개코원숭이(예, Sigma로부터 제품번호 A1516으로 이용가능), 고양이(예, 참조 Swissprot 등록번호 P49064), 닭(예, 참조 Swissprot 등록번호 P19121), 오발부민(예, 닭 오발부민)(예, 참조 Swissprot 등록번호 P01012), 당나귀(예, 참조 Swissprot 등록번호 P39090), 기니 돼지(예, Sigma로부터 제품번호 A3060, A2639, O5483 또는 A6539로 이용가능), 햄스터(예, Sigma로부터 제품번호 A5409로 이용가능), 말(예, 참조 Swissprot 등록번호 P35747), 붉은털원숭이(예, 참조 Swissprot 등록번호 Q28522), 마우스(예, 참조 참조 Swissprot 등록번호 O89020), 비둘기(예, Khan et al, 2002, Int. J. Biol. Macromol., 30(3-4), 171-8에 의해 정의된 바와 같은), 토끼(예, 참조 Swissprot 등록번호 P49065)로 부터 얻어지는 혈청 알부민 중에서 유래된 알부민이며 하기 정의된 바와 같이 이들의 변이체 및 프레그먼트를 포함한다.
다수의 자연적으로 발생하는 알부민의 돌여변이 형태가 알려져 있다. 다수가 Peters(1996, All About Albumin: Biochemistry, Genetics and Medical Applications, Academic Press, Inc., San Diego, California, p.170-181)에 기재되어 있다. 상기 정의된 바와 같은 변이체는 이러한 자연적으로 발생하는 돌연변이중 하나일 수 있다.
"변이체 알부민"은 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 알부민 단백질에 예를 들어, 바인딩 활성(예, 비릴루빈에 대한 바인딩과 같은 타입 및 특정 활성), 삼투 몰농도(혈장 압력, 콜로이드 삼투압), 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 알부민 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.
"보존적 치환"이란 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr, Lys, Arg; 및 Phe, Tyr과 같은 의도된 조합이다. 이러한 변이체는 본 명세서에 참고문헌으로 편입된 미국 특허 제 4,302,386(Stevens, 1982, 11, 24 제출)에 기재된 바와 같은 사이트-디렉티드 돌연변이 생성 방법과 같이 당 기술분야에 잘 알려진 기술에 의해 제조될 수 있다.
전형적으로 알부민 변이체는 자연적으로 발생하는 알부민과 적어도 40%, 일반적으로 적어도 50%, 보다 전형적으로 적어도 60%, 바람직하게 적어도 70%, 보다 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 가장 바람직하게 적어도 98% 또는 그 이상의 서열 동일성을 갖는다. 두 폴리펩타이드간의 퍼센트 서열 동일성은 예를 들어 University of Wisconsin Genetic Computing Group의 GAP 프로그램과 같은 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있으며 퍼센트 동일성은 폴리펩타이드의 서열을 적절히 정렬하여 그 관계로 계산된다. 정렬은 택일적으로 Clustal W 프로그램(Thompson et al., 1994)을 이용하여 수행될 수 있다. 사용되는 파라미터는 다음과 같다:
패스트 페어와이즈 파라미터: K-터플(워드) 크기; 1, 윈도우 크기; 5, 갭 페널티; 3, 탑 다이아고날 수; 5. 스코어링 방법: x 퍼센트. 다중 정렬 파라미터: 갭 오픈 페널티; 10, 갭 익스텐션 페널티; 0.05. 스코어링 매트릭스: BLOSUM.
상기 사용된 용어 "프레그먼트"는 예를 들어 바인딩 활성(예, 비릴루빈에 대한 바인딩과 같은 타입 및 특정 활성), 삼투 몰농도(혈장 압력, 콜로이드 삼투압), 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 한 전장 알부민의 어느 프레그먼트 또는 이의 변이체를 포함한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다. 프레그먼ㅌ는 적어도 하나의 알부민의 전체 서브도메인을 포함할 수 있다. HSA의 도메인은 재조합 단백질로서 발현되며(Dockal, M. et al., 1999, J. Biol . Chem ., 274, 29303-29310), 여기서 도메인 I은 아미노산 1-197로 구성되는 것을 정의되었으며, 도메인 II는 아미노산 189-385로 구성되는 것으로 정의되었으며 그리고 도메인 III는 아미노산 381-585로 구성되는 것으로 정의되었다. 도메인 I과 II사이에 그리고 도메인 II와 III사이에 존재하는 연장된 α-헬릭스 구조(h10-h1) 때문에, 상기 도메인의 부분 오버랩이 일어난다(Peters, 1996, op. cit., Table 2-4). HSA는 또한 6개의 서브도메인(서브도메인 IA, IB, IIA, IIB, IIIA 및 IIIB)을 포함한다. 서브도메인 IA는 아미노산 6-105를 포함하며, 서브도메인 IB는 아미노산 120-177을 포함하며, 서브도메인 IIA는 아미노산 200-291을 포함하며, 서브도메인 IIB는 아미노산 316-369를 포함하며, 서브도메인 IIIA는 아미노산 392-491을 포함하며 그리고 서브도메인 IIIB는 아미노산 512-583을 포함한다. 프레그먼트는 상기 정의된 바와 같은 하나 또는 그 이상의 서브도메인 전체 또는 일부를 포함하거나 이들 도메인 및/또는 서브도메인의 어느 조합을 포함할 수 있다.
따라서 폴리뉴클레오타이드 삽입은 알부민을 암호하는 오픈 리딩 프래임 또는 이의 변이체나 프레그먼트를 포함할 수 있다.
택일적으로, 본 발명의 제1, 제2 또는 제3 견지에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입내에 또는 플라스미드의 어딘가 다른 곳에 트랜스페린의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질을 암호하는 오픈 리딩 프래임을 포함한다. 택일적으로, 플라스미드로 형질변형되는 숙주세포는 그 게놈내에 내생성 혹은 이종성 서열로서 트랜스페린의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질을 암호하는 오픈 리딩 프래임을 포함할 수 있다.
본 명세서에 사용된 용어 "트랜스페린"은 트랜스페린 패밀리의 모든 멤버(Testa, Prosteins of iron metabolism, CRC Press, 2002; Haris & Aisen , Iron carriers and iron proteins, Vol. 5, Physical Bioinorganic Chemistry, VCH, 1991) 및 트랜스레핀, 돌연변이 트랜스페린(Mason et al, 1993, Biochemistry, 32, 5472; Mason et al, 1998, Biochem . J., 330(1), 35), 트렁캐이티드 트랜스페린, 트랜스페린 로브(Mason et al, 1996, Protein Expr . Purif ., 8, 119; Mason et al, 1991, Protein Expr . Purif ., 2, 214), 락토페린, 돌연변이 락토페린, 트렁캐이티드 락토페린, 락토페린 로브와 같은 이의 유도체 또는 다른 펩타이드, 폴리펩타이드 또는 단백질과 상기 중 어느 하나의 융합체를 포함한다(Shin et al, 1995, Proc. Natl . Acad . Sci . USA, 92, 2820; Ali et al, 1999, J. Biol . Chem ., 274, 24066; Mason et al, 2002, Biochemistry, 41, 9448).
트랜스페린은 사람 트랜스페린일 수 있다. 용어 "사람 트랜스페린"은 사람으로부터 유래된 트랜스페린과 구별불가능한 물질 또는 이의 변이체나 프레그먼트를 칭하는 것으로 사용된다. "변이체"는 보존적 혹은 비-보존적인 삽입, 결실, 및 치환이 존재하나, 단, 이러한 변화가 트랜스페린의 유용한 리간드-바인딩 또는 면역유발성을 실질적으로 변화시키지 않는 것을 포함한다.
트랜스페린의 돌연변이가 본 발명에 포함된다. 이러한 돌연변이는 변화된 면역유발성을 가질 수 있다. 예를 들어, 트랜스페린 둘연변이는 변형된(예, 감소된) 글리코실화를 나타낼 수 있다. 트랜스페린 분자의 N-결합 글리코실화 패턴은 N, X, 또는 S/T의 어느 또는 모든 포지션에서 N-X-S/T와 같은 아미노산 글리코실화 일치 서열을 첨가/제거함으로써 변형될 수 있다. 트랜스페린 돌연변이는 금속 이온 및/또는 트랜스페린 수용체와 같은 다른 단백질에 대한 이들의 자연적인 바인딩이 달라질 수 있다. 이러한 방식으로 변형된 트랜스페린 돌연변이의 예는 다음과 같이 예시된다.
사람 트랜스페린 또는 사람 트랜스페린 유사체의 자연-발생 다형 변이체가 또한 포함된다. 일반적으로, 사람 트랜스페린의 변이체 또는 프레그먼트는 중량대 중량으로 사람 트랜스페린의 리간드 바인딩 활성(예를 들어 철-바인딩)의 적어도 50%(바람직하게 적어도 80%, 90% 또는 95%)를 갖는다. 트랜스페린 또는 시료의 철 바인딩 활성은 철이 없는 상태 및 완전히 철이 적재된 상태에서 470nm:280nm 흡광도에서 분광학적으로 측정될 수 있다. 제제는 달리 언급되지 않는 한 철이 없어야 한다. 철은 0.1M 시트레이트, 0.1M 아세테이트, 10mM EDTA pH4.5에서 투석에 의해 트랜스페린 또는 시료로부터 제거될 수 있다. 단백질은 100mM HEPES, 10mM NaHCO3 pH8.0에서 약 20mg/mL이어야 한다. 280nm에서 흡광도가 정밀하게 분광학적으로 측정될 수 있도록 물에 희석된 아포-트랜스페린(Calbiochem, CN Biosciences, Nottingham, UK)의 470nm:280nm 흡광비를 측정한다(0% 철 바인딩). 2mL 1M NaOH내에 니트로트리아세트산 191mg을 용해한 다음 0.5M 페릭 클로라이드 2mL를 첨가함으로써 20mM 철-니트릴로트리아세테이트(FeNTA) 용액을 준비한다. 탈이온수로 50mL로 희석한다. 새로 준비한 충분한 초과량의 20mM FeNTA를 첨가함으로써 철과 함께 아포-트랜스페린을 적재한 다음(100% 철 바인딩), 100mM HEPES, 10mM NaHCO3 pH8.0에서 홀로-트랜스페린 제조물을 완전히 투석하여 470nm:280nm에서 흡광비를 측정하기 전에 잔존하는 FeNTA를 제거한다. 시료를 이용하여 상기 방법을 반복하며, 이는 초기에 철이 없어야 하며 대조군과 최종 비율을 비교한다.
또한, 상기 어느 것을 포함하는 단일 또는 다중 이종성 융합체; 또는 알부민, 트랜스페린 또는 면역글로블빈이나 이들 어느 것의 변이체나 프레그먼트와의 단일 또는 다중 이종성 융합체가 사용될 수 있다. 이러한 융합체는 WO 01/79271에 예시된 바와 같은 알부민 N-말단 융합체, 알부민 C-말단 융합체 및 co-N-말단 및 C-말단 알부민 융합체, 및 트랜스페린 N-말단 융합체, 트랜스페린 C-말단 융합체, 및 co-N-말단 및 C-말단 트랜스페린 융합체를 포함한다.
숙련자는 또한 어느 다른 유전자 또는 변이체의 오픈 리딩 프래임 또는 그 일부가 본 발명과 함께 사용시 폴리뉴클레오타이드 서열을 형성하는 경우 오픈 리딩 프래임의 전체 또는 일부를 형성하기위해 사용될 수 있다는 것이 인식될 것이다. 예를 들어, 상기 오픈 리딩 프래임은 어느 서열을 포함하는 단백질을 암호할 수 있으며 이는 천연 단백질(효소원을 포함하는), 또는 천연 단백질의 변이체, 또는 프레그먼트(예를 들어, 도메인일 수 있음); 또는 완전 합성 단백질; 또는 다른 단백질(천연 또는 합성)의 단일 또는 다중 융합체일 수 있다. 이러한 단백질은 이에 한정하는 것은 아니나 WO 01/79258, WO 01/79271, WO 01/79442, WO 01/79443, WO 01/79444 및 WO 01/79480에 제공된 리스트, 또는 이의 변이체나 프레그먼트로부터 취해질 수 있다. 이러한 특허출원은 이러한 정황에서 알부민에 대한 융합체 파트너의 단백질 리스트는 나타내나, 본 발명은 이에 한정하는 것은 아니며, 본 발명의 목적상 이에 열거된 어느 단백질은 단독으로 혹은 알부민, 면역글로블린의 Fc 리전, 트랜스페린, 락토페린 또는 어느 다른 단백질 또는 원하는 폴리펩타이드와 같이 상기 어느 것을 포함하는 융합 단백질을 포함하는 상기 어느 것의 프레그먼트 또는 변이체에 대한 융합 파트너로 존재할 수 있다. 트랜스페린 융합체의 다른 예는 미국 특허 출원 US2003/0221201 및 US2003/0226155에 주어져 있다.
본 발명에 의한 발현을 위한 원하는 단백질의 바람직한 다른 예는 모노클로날 항체, 에토포시드, 혈청 단백질(혈 응고 인자와 같은), 안티스타신, 진드기 항응고 펩타이드, 트랜스페린, 락토페린, 엔도스타틴, 안지로스타틴, 콜라겐, 면역글로블린 또는 면역글로블린-기초 분자 또는 이의 프레그먼트(예, Small Modular ImmunoPharmaceuticalTM("SMIP") 또는 dAb, Fab'프래그먼트, F(ab')2, scAb, scFv 또는 scFv 프레그먼트), Kunitz 도메인 단백질(알부민 융합체를 함유하거나 함유하지 않은 WO 03/066824에 기재된 바와 같은 것들) 인터페론, 인터루킨, IL10, IL11, IL2, 인터페론 α 종 및 아종, 인터페론 β 종 및 아종, 인터페론 γ 종 및 아종, 렙틴, CNTF, CNTFAX15, IL1- 수용체 안타고니스트, 에리트로포에틴(EPO) 및 EPO 모사물, 트롬보포에틴(TPO) 및 TPO 모사물, 프로샙타이드, 시아노비린-N, 5-헬릭스, T20 펩타이드, T1249 펩타이드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA(조직 플라스미노겐 활성제), 히루딘, 혈소판 유래 성장 인자, 파라티로이드 호르몬, 프로인슐린, 인슐린, 글루카곤, 글루카곤-유사 펩타이드, 인슐린-유사 성장 인자, 칼시토닌, 성장 호르몬, 형질변형 성장 인자 β, 종양 괴사 인자, G-CSF, GM-CSF, M-CSF, FGF, 프리 폼 및 활성 폼 모두를 포함하며 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈, 폰 빌레브란트 인자, α1-안티트립신, 플라스미노겐 활성제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII를 포함하는 응집 인자, 신경 성장 인자, LACI(리포프로틴 관련 응집 억제제, 조직 팩터 경로 억제제 또는 외래 경로 억제제로도 알려짐), 혈소판-유래 내피세포 성장 인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체, 인터-알파 트립신 억제제, 안티트롬빈 III, 아포-리포프로틴 종, 프로틴 C, 프로틴 S를 포함하는 서열, 상기 어느 것의 변이체나 프레그먼트 또는 융합 단백질을 포함한다. 상기 단백질은 히루딘이거나 아닐 수도 있다.
이러한 정황에서 상기 열거된 단백질의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 알부민 단백질에 예를 들어, 효소 활성이나 수용체 바인딩(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.
"보존적 치환"이란 Val, Ile, Leu, Ala, Met; Asp, Glu; Asn, Gln; Ser, Thr, Gly, Ala; Lys, Arg, His; 및 Phe, Tyr, Trp와 같은 의도된 조합이다. 바람직한 보존적 치환은 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr을 포함한다.
"변이체"는 전형적으로 이것이 유도된 폴리펩타이와 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.
두 폴리펩타이드간의 퍼센트 서열 동일성은 예를 들어 University of Wisconsin Genetic Computing Group의 GAP 프로그램과 같은 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있으며 퍼센트 동일성은 폴리펩타이드의 서열을 적절히 정렬하여 그 관계로 계산된다.
정렬은 택일적으로 Clustal W 프로그램(Thompson et al., (1994) Nucleic Acids Res., 22(22), 4673-80)을 이용하여 수행될 수 있다. 사용되는 파라미터는 다음과 같다:
이러한 변이체는 자연적이거나 혹은 당 기술분야에 잘 알려져 있는 바와 같은 단백질 합성 및 사이트-디렉티드 돌연변이 생성 방법을 이용하여 제조될 수 있다.
이러한 정황에 있어서 상기 언급된 단백질의 "프레그먼트"는 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 전체 성숙 폴리펩타이드의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 원하는 단백질의 바람직한 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.
본 발명의 제1, 제2 또는 제3 견지에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입내에 또는 플라스미드의 어딘가 다른 곳에 알부민의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질, 또는 상기 실시예로부터 취해지는 어느 다른 단백질(융합 파트너에 융합되거나 융합되지 않은)을 암호하는 오픈 리딩 프래임 및 적어도 하나의 다른 이종성 서열을 포함하며, 여기서 상기 적어도 하나의 다른 이종성 서열은 오픈 리딩 프래임과 같은 전사 리전을 함유할 수 있다. 일 구현으로, 상기 오픈 리딩 프래임은 이스트 단백질의 서열을 포함하는 단백질을 암호할 수 있다. 다른 구현으로, 상기 오픈 리딩 프래임은 단백질 폴딩에 관련되는 단백질의 서열을 포함하거나, 혹은 샤프롱 활성을 갖거나 혹은 폴딩되지 않은 단백질 반응에 관련되는 단백질, 바람직하게는 단백질 디설피드 이소머라아제를 암호할 수 있다.
그 결과물인 플라스미드는 US과 UL 리전사이에 균형을 갖거나 갖지 않을 수 있다. 예를 들어, US과 UL 리전사이에 또는 UL과 US 리전사이에 1:1, 5:4, 5:3, 5:2, 5:1 또는 5:<1의 크기 비율이 이루어질 수 있다. 본 발명의 유용성은 균형이 유지되는 것에 의존하지 않는다.
본 발명은 또한 본 발명의 플라스미드를 제조하는 방법을 제공하며, 이는
(a) REP2 유전자 또는 FLP 유전자 및 상기 유전자에 인접한 역위 반복를 포함하는 2㎛-패밀리 플라스미드를 제공하는 단계;
(b) 폴리뉴클레오타이드 서열을 제공하고 상기 폴리뉴클레오타이드 서열을 상기 플라스미드내로 본 발명의 제1, 제2 또는 제3 바람직한 견지에 따른 포지션에 삽입하는 단계; 그리고/또는
(c) 단계 (b)에 부가적으로 혹은 택일적으로, 본 발명의 제1, 제2 또는 제3 바람직한 견지에 따른 포지션에서 상기 뉴클레오타이드 염기의 일부 또는 모두를 삭제하는 단계; 그리고/또는
(d) 단계 (b) 및 (c)중 어느 하나에 부가적으로 또는 택일적으로, 본 발명의 제1, 제2 또는 제3 바람직한 견지에 따른 포지션에서 상기 뉴클레오타이드 염기의 일부 또는 모두를 택일적인 뉴클레오타이드 염기로 치환하는 단계
를 포함한다.
단계 (b), (c) 및 (d)는 Sambrook et al., Molecular Cloning: A Laboratory Manual, 2001, 3rd edition에 기술된 바와 같은 클로닝 기술, 사이트-디렉티드 돌연변이 생성 방법 등을 포함하는 당 기술분야에 잘 알려진 기술을 이용하여 달성될 수 있다. 예를 들어, 이러한 한 방법은 코헤시브 말단을 통한 라이게이션을 포함한다. 친화성 코헤시브 말단은 적절한 제한효소의 작용에 의해 삽입을 위한 DNA 프레그먼트 및 플라스미드상에 생성될 수 있다. 이러한 말단은 상보적인 염기 쌍형성을 통해 신속히 어닐링되며 잔존하는 닉은 DNA 라이게이즈의 작용에 의해 폐쇄될 수 있다.
다른 방법은 합성 이중 스트랜드 올리고뉴클레오타이드 링커 및 어댑터를 사용한다. 블런트 말단을 갖는 DNA 프레그먼트는 튀어나온 3'말단을 제거하고 우묵 들어간 3'말단을 채우는 박테리오파지 T4 DNA 폴리머라아제 또는 E. coli DNA 폴리머라아제 I에 의해 생성된다. 규정된 제한효소에 대한 인지 서열을 함유하는 블러트-말단 이중 스트랜드 DNA의 합성 링커 및 조각들은 T4 DNA 라이게이즈에 의해 블런트-말단 DNA 프레그먼트에 라이게이션될 수 있다. 이들은 실질적으로 적절한 제한 효소로 절단되어 코헤시브 말단을 형성하고 친화적 말단을 갖는 발현벡터에 라이게이션된다. 또한 어댑터는 라이게이션에 사용되는 하나의 블런트 말단을 함유하나 하나의 이행된 코헤시브 말단을 또한 소유하는 화학적으로 합성된 DNA 프레그먼트이다. 택일적으로 DNA 프레그먼트 또는 DNA 프레그먼트들은 임의로 코헤시브 말단을 함유하는 하나 또는 그 이상의 합성 이중 스트랜드 올리고뉴클레오타이드의 존재 혹은 부재하에서 DNA 라이게이즈의 작용에 의해 함께 라이게이션될 수 있다.
여러 제한 엔도뉴클레아제 사이트를 함유하는 합성 링커는 Sigma-Genosys Ltd, London Road, Pampisford, Cambridge, United Kingom을 포함하는 여러 공급원으로부터 상업적으로 이용가능하다.
따라서, 본 발명은 또한 상기 방법에 의해 획득가능한 플라스미드를 제공한다.
본 발명은 또한 상기 정의된 바와 같은 플라스미드를 포함하는 숙주 세포를 제공한다. 상기 숙주 세포는 어느 타입의 세포일 수 있다. 박테리아 및 이스트 숙주 세포가 바람직하다. 박테리아 숙주 세포가 클로닝용으로 유용할 수 있다. 이스트 숙주 세포는 플라스미드에 존재하는 유전자의 발현에 유용할 수 있다.
일 구현으로 상기 숙주 세포는 플라스미드가 다중복제 플라스미드로서 안정한 세포이다. 한 이스트 타입으로 얻어지는 플라스미드가 다른 이스트 타입에서 유지될 수 있다(Irie et al, 1991, Gene, 108(1), 139-144; Irie et al, 1991, Mol. Gen. Genet., 225(2), 257-265). 예를 들어, 지고사카로미세스 로욱시(Zygosaccharomyces rouxii)의 pSR1은 사카로미세스 세레비지아에(Saccharomyces cerevisiae)에서 유지될 수 있다. 플라스미드가 pSR1, pSB3 또는 pSB4에 기초한 경우, 숙주 세포는 지고사카로미세스 로욱시일 수 있으며, 플라스미드가 pSB1 또는 pSB2인 경우, 숙주 세포는 지고사카로미세스 베일리(Zgosaccharomyces bailli)일 수 있으며, 플라스미드가 pPM1에 기초한 경우, 숙주 세포는 피치아 멤브라나에파시엔스(Pichia membranaefaciens)일 수 있으며, 플라스미드가 pSM1에 기초한 경우, 숙주 세포는 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)일 수 있으며, 플라스미드가 pKD1에 기초한 경우, 숙주 세포는 클루이베로미세스 드로소필라럼(Kluyeveromyces drosophilarum)일 수 있으며 그리고 플라스미드가 2㎛ 플라스미드에 기초한 경우 숙주 세포는 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 또는 사카로미세스 칼스버제네시스(Saccharomyces carlsbergenesis)일 수 있다. 본 발명의 2㎛-패밀리 플라스미드는 만일 자연적으로 발생하는 플라스미드로부터 유래된 서열을 갖는 유전자 FLP , REP1 및 REP2중에서 하나, 두개 또는 바람직하게 세개를 포함하는 경우 자연적으로 발생하는 플라스미드에 "기초한" 것으로 칭해질 수 있다.
상기 정의한 바와 같은 플라스미드는 표준 기술을 통해 숙주내로 도입될 수 있다. 원핵 숙주 세포의 형질변형에 대해서는 예를 들어, Cohen et al(1972) Proc . Natl. Acad . Sci . USA 69, 2110 및 Sambrook et al(2001) Molecular Cloning, A Laboratory Manual, 3rd Ed. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY를 참조 바란다. 이스트 세포의 형질변형은 Sherman et al(1986) Methods in Yeast Genetics, A Laboratory Manual, Cold Spring Harbor, NY에 기술되어 있다. Beggs(1978) Nature 275, 104-109의 방법이 또한 유용하다. 에스. 세레비지아에의 형질변형 방법은 EP 251 744, EP 258 067 및 WO 90/01063에 일반적으로 가르쳐져 있다. 척추동물 세포와 관련하여, 예를 들어 칼슘 포스페이트 및 DEAE-덱스트란 또는 리포좀 배합물과 같이 이러한 세포를 트랜스펙팅하는데 유용한 시약은 Stratagene Cloning Systems, 또는 Life Technologies Inc., Gaithersburg, MD 20877, USA로부터 이용가능하다.
일렉트로포레이션이 또한 세포를 형질변형하는데 유용하며 이스트 세포, 박테리아 세포 및 척추동물 세포를 형질변형하는 기술분야에 잘 알려져 있다. 일렉트로포레이션에 의한 형질변형 방법은 Becker & Guarente(1990) Methods Enzymol. 194, 182에 기술되어 있다.
일반적으로, 상기 플라스미드는 모든 숙주를 형질변형시키지 않을 것이며, 따라서 형질변형된 숙주 세포를 선별할 필요가 있을 것이다. 따라서, 본 발명의 제1, 제2 또는 제3 견지중 어느 하나에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입, 또는 플라스미드상의 어딘가에 이에 한정하는 것은 아니나 박테리아 선별 마커 및/또는 이스트 선별 마커를 포함하는 선별 마커를 포함할 수 있다. 다수의 다른 선별 마커가 당 기술분야에 알려져 있으나 전형적인 박테리아 선별 마커는 β-락타마아제 유전자이다. 적절한 이스트 선별 마커는 LEU2(또는 β-락타마아제 말레이트 디하이드로게나아제의 활성을 갖는 단백질을 암호하는 등가 유전자), TRP1 , HIS3, HIS3 , URA3 , URA5 , SFA1 , ADE2 , MET15 , LYS5 , LYS2 , ILV2 , FBA1 , PSE1 , PDI1 및 PGK1을 포함한다. 이용가능한 다른 옵션의 견지로, 가장 적절한 선별 마커가 선택될 수 있다. 만일 그렇게 수행되는 것이 원하여 지는 경우 URA3 및/또는 LEU2가 회피될 수 있다. pgk1 이스트 스트레인에서 PGK1에 대해 입증된 바와 같이(Piper 및 Curran, 1990, Curr . Genet. 17, 119), 당 기술분야의 숙련자는 염색체 결실 또는 불활성화가 생존불가능한 숙주를 야기하는 어느 유전자, 소위 필수 유전자는 만일 작용 유전자가 플라스미드상에 제공되는 경우 선별 마커로 사용될 수 있다는 것을 인식할 것이다. 적절한 필수 유전자는 Stanford Genome Database(SGD)(http::db.yeastgenome.org)에서 발견될 수 있다.
또한, 본 발명의 제1, 제2 또는 제3 견지중 어느 하나에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입내에 또는 플라스미드상의 어딘가에 하나이상의 선별 마커를 포함할 수 있다.
한 선별 기술은 발현벡터내로 형질변형된 세포내에 선별가능한 형질을 암호하는 어느 필수 조절 엘리먼트를 갖는 DNA 서열 마커를 편입시키는 것을 포함한다. 이러한 마커는 디하이드로폴레이트 환원효소, G418 또는 진핵 세포 배양을 위한 네오마이신 저항성 유전자, 및 E. coli 및 다른 박테리아에서 배양을 위한 테트라사이클린, 카나마이신 또는 앰피실린(즉, β-락타마아제) 저항성 유전자를 포함한다. 택일적으로, 이러한 선별가능한 특성을 위한 유전자는 원하는 숙주 세포를 동시-형질변형시키는데 사용되는 다른 벡터에 사용될 수 있다.
형질변형된 세포를 성공적으로 확인하는 다른 방법은 임의로, 재조합 폴리펩타이드(즉, 플라스미드상의 폴리뉴클레오타이드 서열에 의해 암호화되고, 그 폴리뉴클레오타이드가 그 숙주에 의해 자연적으로 생성되지 않는 점에서 숙주 세포에 이종성인 폴리뉴클레오타이드)의 발현이 이루어지도록 본 발명의 플라스미드의 도입으로 얻어지는 세포를 성장시키는 것을 포함한다. 세포는 수거되고 용해될 수 있으며 이들의 DNA 또는 RNA 컨텐트를 Southern(1975) J. Mol . Biol . 98, 503 또는 Berent et al(1985) Biotech 3, 208, 또는 당 기술분야에 일반적인 다른 DNA 및 RNA 분석 방법에 의해 재조합 서열의 존재에 대해 조사한다. 택일적으로, 형질변형된 세포 배양물의 상층액내에 폴리펩타이드의 존재는 항체를 이용하여 검출될 수 있다.
재조합 DNA의 존재에 대해 직접적인 검출에 부가적으로, 성공적인 형질변형은 재조합 DNA가 단백질 발현을 지시할 수 있는 경우 잘 알려진 면역학적 방법에 의해 확인될 수 있다. 예를 들어, 발현 벡터로 성공적으로 형질변형된 세포는 적절한 항원성을 나타내는 단백질을 생성한다. 형질변형된 것으로 의심되는 세포 시료를 수거하고 적절한 항체를 이용하여 그 단백질에 대해 조사한다.
따라서, 형질변형된 숙주 세포에 부가적으로, 본 발명은 또한 이러한 세포의 배양물, 바람직하게 모노클로날(동종성으로 클로닝된) 배양물, 또는 배지에서 모노클로날 배양물로부터 유래된 배양물을 포함한다. 택일적으로, 형질변형된 세포는 그 자체로 산업적으로/상업적으로 또는 약학적으로 유용한 제품을 나타내며, 배양 배지로부터 정제될 수 있고 임의로 이의 의도된 산업적/상업적 또는 약학적 용도에 적절한 방식으로 담체 또는 희석제와 함께 배합될 수 있으며, 그리고 임의로 이의 사용에 적절한 방식으로 포장되고 주어질 수 있다. 예를 들어, 전체 세포(whole cell)를 고정할 수 있으며; 또는 세포 배양물을 공정, 작물 또는 다른 원하는 표적에 또는 그 안으로 직접 분사하는데 사용될 수 있다. 마찬가지로, 이스트 세포와 같은 전체 세포는 방향제, 향료 및 약제와 같은 상당히 다양한 적용처에 캡슐로 사용될 수 있다.
그 다음 형질변형된 숙주 세포는 플라스미드내에 하나 또는 그 이상의 폴리뉴클레오타이드 서열 삽입물내 어느 ORF(s)의 발현이 이루어지도록 충분한 시간동안 당 기술분야의 숙련자에게 알려진 적절한 조건하에서, 그리고 본 명세서에 기재된 가르침의 견지로 배양될 수 있다.
본 발명은 또한 (a) 상기 정의한 바와 같은 본 발명의 제1, 제2 또는 제3 견지에 따른 플라스미드를 제공하는 단계; (b) 적절한 숙주 세포를 제공하는 단계; (c) 상기 숙주 세포를 상기 플라스미드로 형질변형시키는 단계; 및 (d) 배양 배지에서 형질변형된 숙주 세포를 배양하여 이에 따라 그 단백질을 생성하는 단계를 포함하는 단백질 생성 방법을 제공한다.
박테리아(예, 이. 콜라이(E. coli) 및 바실러스 서브틸리스(Bacillus subtilis)), 이스트, 필라멘트성 균류(예, 아스퍼질러스(Aspergillus)), 식물 세포, 전체 식물, 동물 세포 및 곤충 세포를 포함하는 다수의 발현 시스템이 알려져 있다.
일 구현으로 바람직한 숙주 세포는 플라스미드가 안정한 다중복제 플라스미드로 유지될 수 있는 이스트이다. 이러한 이스트는 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 클루이베로미세스 락티스(Kluyveromyces lactis), 피치아 파스트로리스(Pichia pastroris), 지고사카로미세스 로욱시(Zygosaccharomyces rouxii), 지고사카로미세스 베일리(Zygosaccharomyces bailii), 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati), 및 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)을 포함한다.
만일 플라스미드가 선별가능한(예, LEU2) 마커를 함유하도록 변형되며 상기 마커의 소실에 의해 측정시, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 100 또는 그 이상의 세대 이후에 적어도 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9% 또는 실질적으로 100%의 안정성을 갖는 경우에 플라스미드는 숙주에서 안정한 다중복제 플라스미드로 유지될 수 있다. 마커의 소실은 Chinery & Hinchliffe(1989, Curr . Genet., 16, 21-25)를 참고로 상기한 바와 같이 평가될 수 있다.
예를 들어, 유전자 암호 서열의 붕괴에 의한 것과 같이 단백질의 O-글리코실화에 관련되는 하나 또는 그 이상의 만노실 트랜스퍼라아제가 결핍된 이스트를 사용하는 것이 특히 유리하다.
재조합적으로 발현되는 단백질은 숙주 세포에 의해 바람직하지 않은 번역후 변형이 일어날 수 있다. 예를 들어, 상기 알부민 단백질 서열은 N-결합 글리코실화를 위한 어느 사이트를 함유하지 않으며 그리고 O-결합 글리코실화에 의해 자연적으로 변형되는 것이 보고된 바 없다. 그러나, 다수의 이스트 종에서 생성되는 재조합 사람 알부민("rHA")은 일반적으로 만노즈와 관련된 O-결합 글리코실화에 의해 변형될 수 있는 것으로 발견되었다. 만노실화 알부민은 렉틴 콘카나발린 A에 바인딩할 수 있다. 이스트에 의해 생성되는 만노실화 알부민의 양은 하나 또는 그 이상의 PMT 유전자가 결핍된 이스트 스트레인을 이용하여 감소될 수 있다(WO 94/04687). 이를 달성하는 가장 편리한 방법은 Pmt 단백질중 하나를 감소된 수준으로 생성되도록 그 게놈내에 결핍된 이스트를 생성하는 것이다. 예를 들어, Pmt 단백질이 거의 혹은 전혀 생성되지 않도록 암호 서열 또는 조절 리전에서(또는 PMT 유전자중 하나의 발현을 조절하는 다른 유전자에서) 결실, 삽입 또는 전위가 있을 수 있다. 택일적으로, 상기 이스트는 항-Pmt 항체와 같은 항-Pmt 제제를 생성하도록 형질변형될 수 있다.
만일 에스. 세레비지아에 이외에 다른 이스트가 사용된다면, 예를 들어, 피치아 파스트로리스(Pichia pastroris) 및 클루이베로미세스 락티스(Kluyveromyces lactis)에서 에스. 세레비지아에의 PMT 유전자와 등가인 하나 또는 그 이상의 유전자의 붕괴가 또한 유리할 수 있다. 에스. 세레비지아에로부터 분리된 PMT1(또는 어느 다른 PMT 유전자)의 서열이 다른 균류 종에서 유사한 효소 활성을 암호하는 유전자의 확인 또는 붕괴에 사용될 수 있다. 클루이베로미세스 락티스(Kluyveromyces lactis)의 PMT1 동족체의 클로닝은 WO 94/04687에 기재되어 있다.
상기 이스트는 유리하게 WO 95/33833 및 WO 95/23857에 각각 가르쳐진 바와 같은 HSP150 및/또는 YAP3 유전자의 결실을 갖는다.
본 발명은 또한 상기 정의한 바와 같이 본 발명의 플라스미드를 포함하는 숙주 세포를 제공하는 단계 및 상기 숙주 세포를 배양 배지에서 배양하여 그 단백질을 생성하는 단계를 포함하는 단백질 생성 방법을 제공한다. 상기 배양 배지는 비-선별적이거나 플라스미드의 안정한 다중복제 유지시 선별적인 상태에 놓여질 수 있다.
본 발명의 플라스미드로부터 발현되는 단백질을 생성하는 방법은 바람직하게 배양된 숙주 세포 또는 배양 배지로부터 이에 따라 생성된 단백질을 분리하는 단계를 더욱 포함한다.
이에 따라 생성된 단백질은 세포내에 존재할 수 있으며, 또는 분비된 경우에는 배양 배지내에 및/또는 숙주 세포의 세포질 주변에 존재할 수 있다. 상기 단백질은 상기 세포 및/또는 배양 배지로부터 당 기술분야에 알려진 다수 방법에 의해 분리될 수 있다. 예를 들어, 재조합적으로 발현되는 알부민의 회수를 위한 정제 기술은 다음과 같이 기재되어 있다. WO 92/04367에는 매트릭스-유래 염료의 제거가 기재되어 있으며, EP 464 590에는 이스트-유래 착색제의 제거가 기재되어 있으며, EP 319 067에는 알칼린 침전 및 알부민의 친지질성 상으로의 후속적 적용이 기재되어 있으며, 그리고 WO 96/37515, US 5 728 553 및 WO 00/44772에는 전체 정제 공정이 기재되어 있다. 알부민 이외의 다른 단백질은 이러한 단백질을 정제하는데 유용한 것으로 발견된 어느 기술에 의해 배양 배지로부터 정제될 수 있다.
이러한 잘 알려진 방법은 암모늄 설페이트 또는 에탄올 침전, 산 또는 용매 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로오즈 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화 크로마토그래피, 수산화인회석(hydroxylapatite) 크로마토그래피, 렉틴 크로마토그래피, 농축, 희석, pH 조정, 정용여과, 한외여과, 고성능 액체 크로마토그래피("HPLC"), 역상 HPLC, 전도성 조정 등을 포함한다.
일 구현으로, 이에 따라 분리된 단백질을 상업적으로 허용가능한 순도 수준으로 더욱 정제하는데 상기 언급된 기술 중 어느 하나이상이 사용될 수 있다. 상업적으로 허용가능한 수준의 순도는 적어도 0.01 g.L-1, 0.02 g.L-1, 0.03 g.L-1, 0.04 g.L-1, 0.05 g.L-1, 0.06 g.L-1, 0.07 g.L-1, 0.08 g.L-1, 0.09 g.L-1, 0.1 g.L-1, 0.2 g.L-1, 0.3 g.L-1, 0.4 g.L-1, 0.5 g.L-1, 0.6 g.L-1, 0.7 g.L-1, 0.8 g.L-1, 0.9 g.L-1, 1 g.L-1, 2 g.L-1, 3 g.L-1, 4 g.L-1, 5 g.L-1, 6 g.L-1, 7 g.L-1, 8 g.L-1, 9 g.L-1, 10 g.L-1, 15 g.L-1, 20 g.L-1, 25 g.L-1, 30 g.L-1, 40 g.L-1, 50 g.L-1, 60 g.L-1, 70 g.L-1, 80 g.L-1, 90 g.L-1, 100 g.L-1,150 g.L-1, 200 g.L-1, 250 g.L-1, 300 g.L-1, 350 g.L-1, 400 g.L-1, 500 g.L-1, 600 g.L-1, 700 g.L-1, 800 g.L-1, 900 g.L-1, 1000 g.L-1, 또는 그 이상의 농도로 단백질을 공급하는 것을 포함한다.
이에 따라 정제된 단백질은 동결건조된다. 택일적으로 이는 담체 또는 희석제와 함께 배합될 수 있으며, 임의로 단위 형태로 존재할 수 있다.
단백질은 약학적으로 허용가능한 수준의 순도로 분리되는 것이 바람직하다. 만일 그 단백질이 본질적으로 발열원이 없으며 그 단백질의 활성과 관련되지 않은 의학적 영향을 일으키지 않고 약학적으로 효과적인 양으로 투여될 수 있다면, 약학적으로 허용가능한 수준의 순도를 갖는다.
그 결과물인 단백질은 알려진 어느 효용처에 사용될 수 있으며, 알부민의 경우 중증 화상, 쇼크 및 실혈을 치료하기위해 환자에게 i.v. 투여하는 것, 배양 배지를 보충하는 것, 그리고 다른 단백질의 배합물에 부형제로 보충하는 것을 포함한다.
본 발명의 방법에 의해 얻어진 치료적으로 유용한 원하는 단백질이 단독으로 투여될 수 있지만, 하나이상의 허용가능한 담체나 희석제와 함께 약학 배합물로서 제공되는 것이 바람직하다. 상기 담체(들) 또는 희석제(들)는 원하는 단백질과 친화적이며 이의 수용자에게는 유해하지않은 견지로 "허용가능"하여야 한다. 전형적으로, 상기 담체 또는 희석제는 멸균되고 발열원이 없는 물이나 염수가 될 것이다.
임의로, 이에 따라 배합된 단백질은 정제, 캡슐, 주사가능한 용액 등의 형태와 같은 단위 투여 형태로 제공될 것이다.
본 발명자들은 "필수" 단백질의 서열을 포함하는 단백질을 암호하는 플라스미드로 운반되는 유전자가 상기 플라스미드의 부재하에서 상기 필수 단백질을 생성하지 않는 숙주 세포에서 상기 플라스미드를 안정하게 유지하는데 사용될 수 있음을 또한 입증하였다. 바람직한 필수 단백질은 선별 마커로서 작용할 뿐만 아니라 플라스미드 안정성을 증가시켜주며, 이의 발현은 동시에 숙주 세포내에서 재조합 유전자에 의해 암호화되는 이종성 단백질의 발현을 증가시켜주는 추가적인 잇점을 제공할 수 있는 필수 샤프롱이다. 이 시스템은 사용자가 플라스미드에 의해 운반되는 것이 요구되는 재조합 유전자의 수를 최소화하는 것을 가능케 한다. 예를 들어, 전형적인 종래기술의 플라스미드는 숙주 세포 배양 공정도중에 플라스미드를 안정하게 유지되도록 하는 것을 가능케 하는 마커 유전자(상기한 바와 같이 기재된 것들)를 운반한다. 이러한 마커 유전자는 원하는 효과를 달성하는데 필요로 하는 어느 다른 유전자에 부가적으로 플라스미드상에 보유될 필요가 있다. 그러나, 외생성 DNA 서열을 편입하는 플라스미드의 능력은 제한되며, 이에 따라 원하는 효과를 달성하는데 필요한 서열 삽입의 수를 최소화하는 잇점이 있다. 더욱이, 일부 마커 유전자(영양 요구성 마커 유전자와 같은)는 그 마커 유전자의 효과를 얻기위해 특정 조건하에서 생성되어야 하는 배양 공정이 요구된다. 이러한 특정 조건은 세포 성장 또는 단백질 생성에 최적이 아닐 수 있으며, 또는 불충분하거나 과도하게 비용이 많이 드는 성장 시스템이 사용되는 것을 필요로 할 수 있다.
따라서, 플라스미드로 운반되는 유전자로서 "필수 단백질"의 서열을 포함하는 단백질을 재조합적으로 암호하는 유전자를 상기 플라스미드의 부재하에서 상기 "필수 단백질"을 생성하는 것이 불가능한 세포에서 플라스미드 안정성을 증가시키는데 사용하는 것이 가능하다.
상기 "필수 단백질"은 숙주 세포내에서 그 암호 유전자(들)이 결실되거나 불활성화되는 경우, 상기 숙주 세포가 영양 요구성(생합성) 요구를 발달시키지 않는 것이다. "영양 요구성(생합성) 요구"란 성장 배지에 첨가 또는 변형에 의해 보완될 수 있는 결핍을 포함한다. 따라서, 본 발명의 이러한 정황에서 "필수 단백질"을 암호하는 "필수 마커 유전자"는 숙주 세포에서 결실 또는 불활성화되는 경우에 성장 배지에 첨가 또는 변형에 의해 보완될 수 없는 결핍을 일으키는 것이다. 이러한 시스템의 잇점은 "필수 마커 유전자"가 플라스미드의 부재하에서 그 유전자 산물을 생성할 수 없는 숙주 세포에서 플라스미드상에 선별 마커로 사용되어 상기 세포를 특정 선별(예, 선별 배지) 조건하에서 배양할 필요가 있는 불리함없이 증가된 플라스미드 안정성을 달성할 수 있다는 것이다. 따라서, 상기 숙주 세포는 플라스미드 안정성을 잃지않고 어느 특정 마커 유전자에 적응될 필요 없는 조건하에서 배양될 수 있다. 예를 들어, 이러한 시스템을 이용하여 생성된 숙주 세포는 복합 또는 완전치 배지와 같은 비-선별 배지에서 배양될 수 있으며, 이는 영양 요구성 마커 유전자에 영향을 미치도록 통상적으로 사용되는 최소 배지보다 경제적일 수 있다.
예를 들어, 상기 세포는 결실되거나 아니면 불활성화된 내생성 유전자 똔느 유전자들을 가질 수 있다.
만일 상기 "필수 단백질"이 "필수" 샤프롱인 경우, 선별 성장 조건이 필요없이 플라스미드 안정성을 향상시키고 숙주 세포에서 내생적으로 암호화되거나 이종성인 단백질과 같은 단백질의 생성을 증가시키는 이중 잇점을 제공할 수 있으므로 특히 바람직하다. 만일 숙주 세포에 의해 단백질 생성을 증가시키는 필수 샤프롱의 과발현을 사용하는 것이 선택되는 경우에, 이 시스템은 또한 플라스미드에 의해 운반될 필요가 있는 재조합 유전자의 수를 최소화시키는 잇점을 갖는다.
본 발명의 이러한 견지에서 사용되는 바람직한 "필수 단백질"은 "필수" 샤프롱 PD11 및 PSE1, 및 단백질을 암호하는 내생성 유전자(들)이 숙주 세포에서 결실되거나 불활성화되는 경우에 숙주 세포가 영양 요구성(생합성) 요구를 발달시키지 않는 PGK1 또는 FBA1과 같은 다른 "필수" 유전자를 포함한다.
따라서, 제4 견지로 본 발명은 (본 발명의 제1, 제2 또는 제3 견지중 어느 하나에 따른 플라스미드와 같은) 플라스미드를 포함하는 숙주 세포를 또한 제공하며, 상기 플라스미드는 상기 플라스미드의 부재하에서 상기 숙주 세포가 샤프롱을 생성할 수 없는 필수 샤프롱을 암호하는 유전자를 포함한다. 바람직하게, 상기 플라스미드의 부재하에서 상기 숙주 세포는 생존 불가능하다. 상기 숙주 세포는 또한 본 발명의 앞서 언급된 견지와 관련하여 상술된 것들과 같이 이종성(또는 재조합 유전자가 숙주 세포에 의해 암호화된 단백질과 서열이 일치하는 단백질을 암호하는 점에서 동종성인) 단백질을 암호하는 재조합 유전자를 포함한다.
본 발명은 또한 제5 견지로 단독의 선별 마커로서 필수 샤프롱을 암호하는 유전자를 포함하는 플라스미드를 제공한다. 상기 플라스미드는 또한 이종성 단백질을 암호하는 유전자를 포함할 수 있다. 상기 플라스미드는 2㎛-패밀리 플라스미드일 수 있으며, 바람직하게는 본 발명의 제1, 제2 또는 제3 견지중 어느 하나에 따른 플라스미드이다.
본 발명은 또한 제6 견지로 플라스미드는 필수 샤프롱을 암호하는 유전자를 포함하며, 숙주 세포는 플라스미드의 부재하에서 샤프롱을 생성할 수 없으며 그리고 숙주 세포는 또한 이종성 단백질을 암호하는 재조합 유전자를 포함하는 플라스미드를 포함하는 숙주 세포를 제공하는 단계; 상기 필수 샤프롱 및 이종성 단백질의 발현이 이루어지는 조건하에서 배양 배지에서 숙주 세포를 배양하는 단계; 및 임의로 배양된 숙주 세포 또는 배양 배지로부터 이에 따라 발현된 이종성 단백질을 정제하는 단계; 및 추가적인 임의로 이에 따라 정제된 단백질을 동결건조하는 단계를 포함하는 이종성 단백질 생성 방법을 제공한다.
상기 방법은 또한 정제된 이종성 단백질을 담체 또는 희석제와 함께 배합하는 단계 및 임의로 이에 따라 정제된 단백질을 상기 언급한 방식으로 단위 투여 형태로 제공하는 단계를 포함할 수 있다. 비람직한 일 구현으로, 상기 방법은 완전 배지와 같은 비선별 배지에서 숙주 세포를 배양하는 것을 포함한다.
도 1은 2㎛ 플라스미드의 플라스미드 맵을 나타낸다.
도 2는 pSAC35의 플라스미드 맵을 나타낸다.
도 3은 일부 예시된 FLP 삽입 사이트를 나타낸다.
도 4-8, 10, 11, 13-32, 36-42, 44-46, 48-54 및 57-76은 여러가지 플라스미드의 맵을 나타낸다.
도 9는 PDII 유전자를 함유하는 pDB2429를 나타낸다.
도 12는 일부 예시된 REP2 삽입부를 나타낸다.
도 33은 실시예에 관련된 표 3을 나타낸다.
도 34는 SEQ ID NO: 1을 나타낸다.
도 35는 SEQ ID NO: 2를 나타낸다.
도 43은 PCR 프라미머 DS248 및 DS250이다.
도 47은 여러 가지 pSAC35-유래 플라스미드를 함유하는 에스. 세레비지아에에 대한 비선별 액체 배양물에서 세대 성장의 수가 증가되는 플라스미드 안정성을 보여준다.
도 55는 RIE의 결과를 나타낸다. 10mL YEPD 쉐이크 플라스크에 pDB3078로부터 분리된 1.41kb NotI/PstI pdi1 :: TRP1 디스럽핑 DNA 프레그먼트로 트립토판 프로토트로피에 대해 형질변형된 DXY1 trp1 Δ[pDB2976], DXY1 trp1 Δ[pDB2977], DXY1 trp1Δ[pDB2978], DXY1 trp1 Δ[pDB2979], DXY1 trp1 Δ[pDB2980] 또는 DXY1 trp1 Δ[pDB2981]를 접종하였다. 형질변형체를 30℃, 200rpm으로 4일간 성장시켰다. 로켓 면역전기영동 겔(Weeke, B. 1976. Rocket immunoelectrophoresis. In N. H. Azelsen, J. Kroll, 및 B. Weeke[eds.], A manual of quantitative immunoelectrophoresis. Methods and applications. Universitetsforlaget, Oslo, Norway)의 웰당 4μL 배양 상층액을 적재하였다. rHA 표준 농도는 ㎍/mL로 700μL 고트 항-HA(5mL 물에 재부유된 Sigma 제품 A-1151)/50mL 아가로즈이다. 프리시핀은 쿠마시 블루로 염색되었다. 계속되는 분석을 위해 선택된 분리물을 표시하였다(*).
도 56은 RIE의 결과를 나타낸다. 10mL YEPD 쉐이크 플라스크에 DXY1 [pDB2244], DXY1 [pDB2976], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2976], DXY1 [pDB2978], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2978], DXY1 [pDB2980], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2980], DXY1 [pDB2977], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2977], DXY1 [pDB2979] DXY1 trp1 Δ pdi1 :: TRP1 [pDB2979], DXY1 [pDB2981] 및 DXY1 trp1 Δ pdi1 :: TRP1 [pDB2981]를 접종하rh, 30℃, 200rpm으로 4일간 성장시켰다. 로켓 면역전기영동 겔의 웰당 4μL 배양 상층액을 적재하였다. rHA 표준 농도는 ㎍/mL로 800μL 고트 항-HA(5mL 물에 재부유된 Sigma 제품 A-1151)/50mL 아가로즈이다. 프리시핀은 쿠마시 블루로 염색되었다. 계속되는 분석을 위해 선택된 분리물을 표시하였다(*).
이러한 실시예는 β- 락타마아제 유전자(이스트내로 형질변형후 플라스미드로부터 소실되는 앰피실린 저항성을 위한), LEU2 선별 마커 및 올리고뉴클레오타이드 링커(이중 후자 둘은 2㎛-패밀리 디스인테그레이션 벡터, pSAC3(참조 EP 0 286 424)의 UL-리전내 유일한 SnaBI-사이트내로 삽입됨)를 포함하는 도 2에 나타낸 타입의 일반적으로 pSAC35로 명명되는 2㎛-패밀리 플라스미드의 US-리전내 제한 엔도뉴클레아제 사이트에 의해 규정된 다수의 포지션내로 부가적인 DNA 서열의 삽입을 설명한다. 선택된 사이트는 REP2 및 FLP 암호 리전의 3'-말단쪽을 향하거나 또는 그 하위 역위 반복 서열내이다. 짧은 합성 DNA 링커를 각 사이트내로 삽입하고 변형된 플라스미드의 상대적인 안정성을 비선별 배지에서 성장도중 비교하였다. DNA 삽입을 위한 바람직한 사이트가 확인되었다. "관심 대상의 유전자"을 함유하는 보다 긴 DNA 프레그먼트의 삽입은 PD11 유전자를 함유하는 DNA 프레그먼트를 REP2이 후의 XcmI-사이트내로 삽입함으로써 입증되었다.
실시예
1
pSAC35
의 스몰
유니크
리전내
XcmI
-
사이트내로
합성 DNA 링커의 삽입
pSAC35의 US-리전내로 부가적인 DNA의 삽입을 위해 초기에 평가한 사이트는 599-bp 역위 반복내 XcmI-사이트이었다. 한 XcmI-사이트는 REP2 번역 종결 코돈이후 51-bp를 자르는데 반해, 다른 하나의 XcmI-사이트는 역위 반복와의 오버랩에 기인하여 FLP 암호 서열의 말단이전 127-bp를 자른다(참조 도 3).
삽입된 서열은 올리고뉴클레오타이드 CF86 및 CF87의 0.5mM 용액을 어닐링하여 제조된 52-bp 링커이었다. 이 DNA 링커는 암호화된 제한 사이트가 pSAC35에 없는 코어 리전 "SnaBI-PacI-FseI/SfiI-SmaI-SnaBI"을 함유하였다.
XcmI 링커(CF86+CF87)
플라스미드 pSAC35는 XcmI으로 부분 다이제스팅되고, 선형 11-kb 프레그먼트는 0.7%(w/v) 아가로즈 겔로 분리되고 CF86/CF87 XcmI 링커(그대로, 10-1 및 10-2 희석)로 라이게이션되고 E. coli DH5α내로 형질변형되었다. 앰피실린 저항성 형질변형체를 선별하고 SmaI 다이제스팅에 의해 선형화될 수 있는 플라스미드의 존재에 대해 스크리닝하였다. 제한 효소 분석으로 REP2이후의 XcmI-사이트내로 클로닝된 링커를 갖는 pDB2688(도 4)을 확인하였다. 올리고뉴클레오타이드 프라이머 CF88, CF98 및 CF99(표 1)를 이용한 DNA 시퀀싱으로 올바른 링커 서열이 함유된 삽입물을 확인하였다.
표 1: 올리고뉴클레오타이드 시퀀싱 프라이머:
제한 효소 분석으로 또한 FLP 유전자내 XcmI-사이트내로 클로닝된 링커를 갖는 pDB2689(도 5)를 확인하였다. 그러나, pDB2689내 링커는 프라이머 CF90 및 CF91을 이용한 DNA 시퀀싱에 의해 FseI/SfiI 사이트(CF86+CF87 링커내 굵게 표시된)내에 G:C 염기쌍 소실을 갖는 것으로 나타났다. 이는 번역 종결 코돈이전의 56개의 다른 아미노산으로 대체된 39 C-말단 아미노산 잔기를 갖는 돌연변이 Flp-단백질에 대한 암호 서열을 생성하였다.
pDB2689 링커 서열에서 염기쌍 소실은 pDB2786을 생성하도록 수정되었다(도 6). 이를 달성하기위해, 올리고뉴클레오타이드 CF104 및 CF105로부터 31-bp 5'-포스포릴레이티드 SnaBI-링커를 제조하였다. 이는 CIAP(calf intestinal alkaline phosphatase)로 미리 처리된 pDB2689의 SnaBI 사이트내로 라이게이션되었다. CF90, CF91, CF100 및 CF101을 이용한 DNA 시퀀싱으로 pDB2786내 올바른 DNA 링커 서열을 확인하였다. 이는 번역 종결이전 14개의 다른 잔기로 대체된 39 C-말단 잔기를 갖는 돌연변이 Flp-단백질에 대한 암호 서열을 생성하였다.
Sna
BI
링커(
CF104
+
CF105
)
pDB2786에 반대 방향으로 SnaBI 링커의 라이게이션에 의해 부가적인 플라스미드, pDB2789(도 7)를 또한 제조하였다. pDB2798내에 링커 서열은 DNA 시퀀싱에 의해 확인되었다. 플라스미드 pDB2798은 전사 종결이전 8개의 다른 잔기로 대체된 39 C-말단 잔기를 갖는 돌연변이 Flp-단백질에 대해 암호하는 서열을 함유하였다.
또한 삽입 사이트에 Flp 단백질을 트렁캐이팅하기위해 FLP 유전자내 XcmI-사 이트내로 링커를 클로닝하였다. 사용된 링커는 올리고뉴클레오타이드 CF120 및 CF121로부터 제조된 45-bp 5'-포스포릴레이티드 XcmI-링커이었다.
Xcm
I
링커(
CF120
+
CF121
)
이 CF120/CF121 XcmI 링커는 XcmI으로 부분 다이제스팅에 의해 생성된 11-kb pSAC35 프레그먼트로 라이게이션된 다음 CIAP로 처리되었다. 앰피실린 저항성 E. coli DH5α 형질변형체의 분석으로 pDB2823(도 8)을 함유하는 클론을 확인하였다. 프라이머 CF90, CF91, CF100 및 CF101을 이용한 DNA 시퀀싱으로 pDB2823내의 링커 서열을 확인하였다. 삽입된 링커내의 번역 종결은 41 C-말단 잔기가 결여된 Flp(1-382)의 생성을 일으킬 수 있다.
링커 서열의 pSAC35내 XcmI-사이트내로의 삽입으로부터 플라스미드 안정성에 대한 강도는 pDB2688 및 pDB2689에 대해 평가되었다. 플라스미드 안정성은 YEPS에서 비선별 배양 도중 LEU2 마커의 소실에 의해 에스. 세레비지아에에서 검출되었다. pSAC3와 구조적으로 유사하나 LEU2 선별 마커를 함유하는 SnaBI 사이트에 삽입 된 부가적인 DNA를 함유하는 pSAC35로 형질변형된 동일한 이스트 스트레인이 대조군으로 사용되었다(Chinery & Hinchliffe, 1989, Curr . Genet., 16. 21).
상기 이스트 스트레인은 변형 리튬 아세테이트 방법을 이용하여 루신 프로토트로피로 형질변형되었다(Sigma yeast transformation kit, YEAST-1, protocol 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18)). 형질변형체는 BMMD-agar 플래이트상에서 선별되었으며 후속적으로 BMMD-agar 플래이트상에서 패치아웃 되었다. 저온 보존된 트리할로즈 스톡을 10mL BMMD 쉐이크 플라스크 배양물(24시간, 30℃, 200rpm)로부터 제조하였다.
YEPD 및 BMMD의 조성물은 Sleep et al., 2002, Yeast 18, 403에 기재되어 있다. YEPS 및 BMMS는 단독 초기 탄소 공급원으로서 2%(w/v) 글루코즈가 2%(w/v) 수크로즈로 대체된 것을 제외하고 YEPD 및 BMMD와 조성이 동일하다.
플라스미드 안정성을 조사하기위해 1mL 저온 보존된 스톡을 녹이고 250mL 코니컬 플라스크에 담긴 100mL YEPS(초기 OD600 0.04-0.09)내로 접종하고 오비탈 쉐이커(200rpm, Innova 4300 인큐베이터 쉐이커, New Brunswick Scientific)에서 30℃로 약 72시간동안 배양하였다.
각 플라스크로부터 시료를 제거하고 YEPS-broth(10-2 내지 10-5 희석), 100μL 분액을 YEPS-아가 플래이트상에 이중으로 플래이팅하였다. 세포를 30℃에서 3-4일간 성장시켜 단일 콜로니를 형성시켰다. 각각의 이스트 스톡을 분석하기위해, 100개의 무작위 콜로니를 BMMS-아가 플래이트에 반복하여 패치한 다음 YEPS-아가 플래이트에서 마찬가지로 수행하였다. 30℃에서 3-4일간 성장시킨 후 BMMS-아가 플래이트 및 YEPS-아가 플래이트 모두에서 콜로니 성장의 퍼센트를 플라스미드 안정성 척도로 측정하였다.
형질변형체로부터 LEU2 마커의 소실을 측정한 상기 분석에서, pSAC35 및 pDB2688은 100% 안정한 것으로 나타났으며, pDB2689는 72% 안정한 것으로 나타났다. 나아가, 전사 서열을 변경시키고 599-bp 역위 반복간의 상동성을 분열시킴에도 불구하고 상기 링커를 REP2이후의 XcmI-사이트내로 삽입하는 것은 플라스미드 안정성에 명백한 영향을 주지 않았다. FLP내 XcmI 사이트로의 삽입 역시 역위 반복의 분열 및 Flp 단백질의 변이 모두에도 불구하고 예기치않게 안정한 플라스미드를 이끌었다.
실시예
2
PDI1
유전자의
pDB2688
의
XcmI
링커내로의
삽입
라지 DNA 프레그먼트의 2㎛-유사 벡터내로의 삽입은 에스. 세레비지아에 PDI1 유전자를 pDB2688의 XcmI 링커내로 클로닝함으로써 입증되었다. PD11 유전자(도 9)는 상기 PDI1 유전자를 함유하는 보다 큰 에스. 세레비지아에 SKQ2n 게노믹 DNA 프레그먼트의 1.9kb SacI-SpeI 프레그먼트(US 6,291,205에 기재되어 있으며 그리고 또한 Crouzet & Tuite, 1987, Mol . Gen. Genet., 210, 581-583 및 Farquhar et al, 1991(상기 참조)에서 Clone C7로 기재된 플라스미드 pMA3a:C7로 제공되는 바와 같은)상에서 클로닝되었으며, 이는 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 클로닝되었으며 PDI1 유전자의 3' 비번역 리전내 유일한 Bsu36I-사이트에 삽입된 SacI 제한 사이트를 함유하는 합성 DNA 링커를 가졌다. 상기 1.9kb SacI-SpeI 프레그먼트는 T4 DNA 폴리머라아제로 처리하여 SpeI 5'-오버행을 채우고 SacI 3'-오버행을 제거하였다. 번역 개시 코돈의 PDI1 프로모터 상위의 212-bp 및 번역 종결 코돈의 148-bp 하위을 포함하였다. 이를 SmaI 선형화/CIAP 처리된 pDB2688로 라이게이션하여 PDI1 유전자가 REP2와 동일한 방향으로 전사되는 플라스미드 pDB2690(도 10)를 생성하였다. 에스. 세레비지아에 스트레인은 pDB2690을 이용하여 루신 프로토트로피로 형질변형되었다.
후속적으로 사람 트랜스페린 돌연변이(N413Q, N611Q)에 대한 발현 카세트를 pDB2690의 NotI-사이트내로 클로닝하여 pDB2711(도 11)을 생성하였다. pDB2711내 발현 카세트는 에스. 세레비지아에 PRB1 프로모터, HSA/MFα 융합 리더 서열(EP 387319; Sleep et al, 1990, Biotechnology(N.Y.), 8, 42)을 함유하며, 사람 트랜스페린 돌연변이(N413Q, N611Q)에 대한 암호 서열 및 에스. 세레비지아에 ADH1 종결자가 후속하였다. 플라스미드 pDB2536(도 36)은 pSAC35의 NotI-사이트내로 동일한 발현 벡터의 삽입에 의해 동일하게 구성되었다.
2μm-벡터의 US-리전내로 "관심 대상의 유전자"를 삽입하는 잇점은 pDB2536으로 형질변형된 동일한 이스트에 비해, pDB2711로 형질변형된 이스트의 발효도중 재조합 트랜스페린 N413Q, N611Q 분비를 약 7-배 증가시키는 것으로 입증되었다. 재조합 트랜스페린 N413Q, N611Q 분비가 약 15-배 증가하는 것이 쉐이크 플라스크 배양에서 관찰되었다(데이타로는 나타내지 않음).
플라스미드 pDB2688, pDB2690, pDB2711, pDB2563 및 pSAC35의 상대적인 안정성은 상기한 방법을 이용하여 YEPS 배지에서 성장된 동일한 이스트 스트레인에서 측정되었다(표 2).
이러한 분석에서, PDI1 삽입물이 없는 pDB2688에 대한 100% 안정성과 비교하여 pDB2690은 32% 안정성을 나타내었다. 이러한 플라스미드 안정성 감소는 pSAC35의 라지 유니크 리전내 NotI-사이트내로의 rTF(N413Q, N611Q) 발현 카세트의 삽입에 기인하여 pDB2536으로 관찰된 플라스미드 안정성 감소보다 낮았다(표 2).
또한, pDB2711로 형질변형된 동일한 이스트로부터의 rTF(N413Q, N611Q) 수율이 pDB2536으로 형질변형된 동일한 이스트로부터 달성되는 것과 비교하여 감소되지 않았으므로 고 세포밀도 발효도중 최소 배지에서의 선별적 성장은 YEPS 배지에서 관찰되는 PDI1 삽입에 기인하는 증가된 플라스미드 불안정성을 극복할 수 있다.
표 2: pSAC35의 스몰 유니크 리전내로 PDI1 삽입에 대한 플라스미드 안정성 데이타의 요약. YEPS-아가상에 플래이팅하기전 비선별 쉐이크 플라스크 배양으로 3일 성장시킨 것으로부터 얻어진 데이타.
플라스미드 | 삽입부 (들) | 비고 | 상대 안정성 |
pSAC35 | - | - | 100% |
pDB2688 | XcmI | 역위 반복내 링커 | 100% |
pDB2690 | XcmI | XcmI 링커내 PDI1 | 32% |
pDB2711 | XcmI, NotI | XcmI 링커내 PDI1, NotI에 rTf 카세트 | 10% |
pDB2536 | NotI | NotI에 rTf 카세트 | 17% |
실시예
3
pSAC35
의 역위 반복
내
REP2
유전자 및 하위
서열내로
DNA 링커의 삽입
REP2 유전자 및 이의 역위 반복 하위내 서열내로 부가적인 DNA의 삽입에 유용한 한계를 규정짓기위해, 추가적인 링커가 pSAC35내로 삽입되었다. 도 12는 이러한 삽입에 사용된 제한 사이트 및 이러한 사이트에서 Rep2 단백질의 번역 종결에 미치는 영향을 나타낸다.
REP2내 XmnI-사이트에 삽입된 링커는 올리고뉴클레오타이드 CF108 및 CF109로부터 제조된 44-bp 서열이었다.
XmnI 링커(CF108+CF109)
pSAC35내에 다른 XmnI-사이트로 삽입되는 것을 방지하기 위해, REP2 및 FLP 유전자를 함유한 pSAC35의 3,076-bp XbaI 프레그먼트를 E. coli 클로닝 벡터 pDB2685(도 13)내로 일차 서브-클로닝하여 pDB2783(도 14)을 생성하였다.
플라스미드 pDB2685는 클렙시엘라 뉴모니아에(Klebsiella pneumoniae)의 아프라마이신 저항성 유전자(Rao et al, 1983, Antimicrob . Agents Chemother., 24, 689) 및 pMCS5의 다중 클로닝 사이트(Hoheisel, 1994, Biotechniques, 17, 456)를 함유하는 pCF17로부터 유래된 pUC18-유사 클로닝 벡터이다. pCF17은 pIJ8600(Sun et al., 1999, Microbiology, 145(9), 2221-7)으로부터 EcoRI, NheI 및 DNA 폴리머라아제 I의 Klenow 프레그먼트로 다이제스팅하고, 셀프-라이게이션한 다음 컴피턴트 E. coli DH5α 세포의 형질변형 및 아프라마이신 설페이트를 이용한 선별에 의 해 반응 산물로부터 분리하여 제조되었다. 플라스미드 pDB2685는 pMCS5의 439bp SspI-SwaI 프레그먼트를 pCF17내로 클로닝하고, 이를 MscI으로 커팅하고 CIAP로 처리하여 제조하였다. 블루/화이트 선별은 IPTG 유도에 의존하지 않는다.
플라스미드 pDB2783은 XmnI으로 선형화되고 CF108/CF109 XmnI-링커로 라이게이션되어 pDB2799(도 15) 및 pDB2780(나타내지 않음)으로 생성되었다. 플라스미드 pDB2799는 Rep2를 생성하기위한 삽입 사이트(1-244)에 번역 종결에 올바른 방향으로 CF108/CF109 XmnI 링커를 함유하였으며, 한편 pDB2780은 반대 방향으로 클로닝된 링커를 함유하였다. 프라이머 CF98 및 CF99를 이용하여 DNA 시퀀싱을 수행함으로써 올바른 링커 서열을 확인하였다.
pDB2799의 3,120bp XbaI 프레그먼트를 CIAP로 부분 XbaI 다이제스션 및 처리에 의해 생성된 7,961-bp pSAC35 프레그먼트로 후속적으로 라이게이션하여 플라스미드 pDB2817(B-형) 및 pDB2818(A-형) 디스인테그레이션 벡터(각각 도 16 및 17)를 생성하였다.
pSAC35내 ApaI-사이트에 링커의 삽입은 T4 DNA 폴리머라아제에 의한 3'-5' 엑소뉴클레아제 다이제스션을 이용하거나 이용하지않고 수행하였다. 이는 번역 종결전에 Rep2(1-271) 또는 Rep2(1-269)에 대한 암호 서열을 생성하였다. 하기 그림에서 대각선으로 표시된 서열 GGCC는 ApaI 다이제스션후 생성된 3'-오버행으로부터 제거하여 글리신-170(GGC) 및 프롤린-171에 대한 코돈의 뉴클레오타이드를 제거하였다.
엑소뉴클레아제 다이제스션없이 ApaI-사이트에 삽입된 링커는 올리고뉴클레오타이드 CF116 및 CF117로 부터 제조된 50-bp 5'-포스포릴레이티드 링커이었다.
Apa
I
-링커(
CF116
+
CF117
)
이는 ApaI으로 선형화되고 CIAP로 처리된 pSAC35로 라이게이션되어 pDB2788(도 18) 및 pDB2789(나타내지 않음)로 생성되었다. pDB2788내의 링커는 프롤린-271이후 번역 종결에 대해 올바른 방향이었으며, 한편 pDB2789내의 링커는 반 대 방향이었다.
T4 DNA 폴리머라아제에 의한 엑소뉴클레아제 다이제스션으로 ApaI-사이트에 삽입된 링커는 코어 종결 링커로 불리는 올리고뉴클레오타이드 CF106 및 CF107로부터 제조된 43-bp 5'-포스포릴레이티드 링커이었다.
코어 종결-링커(
CF106
+
CF107
)
상기 코어 종결 링커는 ApaI으로 선형화되고 T4 DNA 폴리머라아제로 다이제스션되고 CIAP로 처리된 pSAC35로 라이게이션되었다. 이 라이게이션은 글루타메이트-269이후에 번역 종결에 대하여 올바른 방향으로 클로닝된 링커를 갖는 pDB2787(도 19)을 생성하였다.
올바른 DNA 서열은 올리고뉴클레오타이드 프라이머 CF98 및 CF99를 이용하여 ApaI-링커를 함유하는 모든 클론에서 확인되었다.
코어 종결 링커(CF106+CF107)는 또한 pDB2783(도 14)의 FspI-사이트내로 삽입을 위해 사용되었다. 상기 코어 종결 링커(CF106+CF107)는 CIAP로 처리된 부분 FspI 다이제스션에 의해 선형화된 pDB2783내로 라이게이션되었다. 아프라마이신 저항성 E. coli DH5α 형질변형체로부터 분리된 플라스미드는 FspI을 이용한 다이제스션에 의해 스크리닝되고 선별된 클론은 M13 포워드 및 리버스 프라이머를 이용하여 시퀀싱되었다.
플라스미드 pDB2801(나타내지 않음)은 (REP2 유전자에 가장 근접한 PacI-사이트에 대해) 올바른 방향으로 클로닝된 두 링커 카피를 함유하는 것으로 확인되었다. 상기 링커 이외의 카피는 상기 다중 클로닝 사이트 리전으로부터 FseI-사이트를 함유하는 116-bp NruI-HpaI 프레그먼트를 일차 삭제하고 FseI으로 다이제스션하고 재라이게이션하여 pDB2802(도 20)을 생성함으로써 후속적으로 제거되었다. 올리고뉴클레오타이드 CF126을 이용한 DNA 시퀀싱으로 올바른 링커 서열을 확인하였다.
3,119-bp pDB2802 XbaI 프레그먼트는 후속적으로 부분 XbaI 다이제스션 및 CIAP 처리에 의해 생성된 7, 961-bp pSAC35 프레그먼트로 라이게이션되어 pDB2805(B-형) 및 pDB2806(A-형) 디스인테그레이션 벡터(각각 도 21 및 22)가 생성되었다.
실시예
4
pSAC35
의 역위 반복
내
FLP
유전자 및 하위
서열내로의
DNA 링커 삽입
역위 반복내 FLP 유전자 및 하위 서열내로의 부가적인 DNA의 삽입을 위한 유용한 한정을 규정짓기위해 DNA 링커를 pSAC35내로 삽입하였다. 도 3은 이러한 삽입에 사용된 제한 사이트 및 이러한 사이트에서 Flp 단백질의 번역 종결에 미치는 영향을 나타낸다.
BclI-사이트에 삽입된 링커는 올리고뉴클레오타이드 CF118 및 CF119로부터 제조된 49-bp 5'-포스포릴레이티드 링커이었다.
Bcl
I
링커(
CF118
+
CF119
)
pSAC35내에 BclI-사이트의 Dam-메틸화에 기인하여, BclI-링커는 E. coli 스트레인 ET12567 pUZ8002(Macneil et al, 1992, Gene, 111, 61; Kieser et al, 2000, Practical Streptomyces Genetics, The John Innes Foundation, Norwich)으로부터 분리된 비-메틸화 pSAC35내로 클로닝되었다. 플라스미드 pSAC35는 BclI으로 선형화되고 CIAP로 처리되고 BclI-링커로 라이게이션되어 pDB2816(도 23)로 생성되었다. 올리고뉴클레오타이드 프라이머 CF91 및 CF100을 이용한 시퀀싱은 세개의 BclI-링커 카피가 pDB2816내에 존재하며, 이는 모두 히스티딘-353이후 Flp의 번역 종결 대해 올바른 방향이었음을 보여주었다.
PacI으로 pDB2816을 다이제스션하고 셀프-라이게이션을 수행하여 pDB2814 및 pDB2815(도 24 및 25)를 생성하였으며, 이는 각각 BclI-링커의 하나 및 두개의 카피를 함유하였다. 상기 링커의 DNA 서열은 프라이머 CF91 및 CF100을 이용하여 확인하였다. 에스. 세레비지아에에서, 트렁캐이티드 Flp(1-353) 단백질은 pDB2814, pDB2815 또는 pDB2816으로 형질변형된 이스트에 의해 생성될 것이다.
pDB2814에 반대 방향으로 BclI-링커의 단일 카피를 라이게이션하여 부가적인 플라스미드 pDB2846(데이타로 나타내지 않음)을 또한 생성하였다. 이는 번역 종결이전에 14개의 다른 잔기가 후속하는 Flp의 일차 352-잔기에 대한 암호 서열을 가졌다.
HgaI-사이트에 삽입된 링커는 올리고뉴클레오타이드 CF114 및 CF115로부터 제조된 47-bp 5'-포스포릴레이티드 링커이었다.
Hga
I
링커(
CF114
+
CF115
)
HgaI 링커는 부분 HgaI 다이제스션에 의해 선형화되고 CIAP로 처리된 pDB2811로 라이게이션되어 pDB2811(도 26)을 생성하였다. 올리고뉴클레오타이드 CF90, CF91 및 CF100을 이용한 DNA 시퀀싱으로 올바른 링커 삽입을 확인하였다.
pDB2811의 3,123-bp XbaI 프레그먼트는 부분 XbaI 다이제스션 및 CIAP 처리에 의해 생성된 7,961-bp pSAC35 프레그먼트로 후속적으로 라이게이션되어 HgaI-사이트에 삽입된 DNA를 함유하는 pDB2812(B-형) 및 pDB2813(A-형) 디스인테그레이션 벡터(각각 도 27 및 28)를 생성하였다.
FLP이후 FspI 사이트에 삽입된 코어 종결 링커(CF106+CF107)를 갖는 플라스미드 pDB2803 및 pD2804(각각 도 29 및 30)가 pDB2801을 제작하는데 사용된 방법과 동일한 방법에 의해 분리되었다. 올바른 링커 삽입은 DNA 시퀀싱에 의해 확인되었다. 플라스미드 pDB2804는 (FLP 유전자에 가장 근접한 PacI-사이트에) 올바른 방향으로 삽입된 링커를 함유하였으며, 한편 pDB2803은 반대 방향으로 상기 링커를 함 유하였다.
pDB2804 3,119-bp XbaI 프레그먼트는 부분 XbaI 다이제스션 및 CIAP 처리에 의해 생성된 7,961-bp pSAC35 프레그먼트로 라이게이션되어 FLP이후 FspI-사이트에 삽입된 DNA를 함유하는 pDB2807(B-형) 및 pDB2808(A-형) 디스인테그레이션 벡터(각각 도 31 및 32)를 생성하였다.
실시예
5
스몰
유니크
리전
및 역위 반복
내로
삽입된 DNA 링커를 함유하는 pSAC35-유사 플라스미드로 형질변형된 이스트에서
LEU2
마커의
상대적 안정성
US-리전 및 역위 반복내로 삽입된 DNA 링커를 함유하는 pSAC35-유사 플라스미드로 에스. 세레비지아에 스트레인을 형질변형하였다. 플라스미드 안정성을 시험하기위해 저온보존된 트레할로즈 스톡을 제조하였다(표 3). 플라스미드 안정성은 pSAC35에 삽입된 링커에 대해 상기 언급한 바와 같이 분석하였다. 각 삽입 사이트 분석을 위해 두개의 플라스크를 셋팅하였다. 또한, 쉐이크 플래이크 배양 3일후 세포로부터 유도된 콜로니의 분석을 위해, 콜로니를 성장시키고 추가 4일 쉐이크 플라스크 배양된 세포를 분석하였다. 이를 위해, 100μL 시료를 매 3일된 플라스크로부터 수거하고 추가 약 96시간(94-98시간)동안 30.0℃에서 오비탈 쉐이커에서 100mL YEPS 브로스에서 계대 배양하였으며, 이후 단일 콜로니를 획득하고 LEU2 마커의 소실에 대해 분석하였다. 이러한 경우 분석은 선별된 스트레인의 단일 플라스크로 제한되었으며, 50 콜로니가 채집되었다. 전체 결과를 표 4에 요약하였다.
표 4: pSAC35내로 DNA 삽입에 대한 플라스미드 안정성 데이타의 요약
세트 1은 비-선별 쉐이크 플라스크 배양 3일로부터 얻어진 데이타를 나타낸다.
세트 2는 비-선별 쉐이크 플라스크 배양 7일로부터 얻어진 데이타를 나타낸다.
A)
REP2
삽입 사이트
플라스미드(들) | 삽입 사이트 | 비고 | 상대적 안정성 | |
세트 1 | 세트 2 | |||
pSAC35 | - | 대조구 | 99% | 100% |
pDB2817 & pDB2818 | XmnI | REP2(1-244) | 39% | 16% |
pDB2787 | ApaI/T4 pol. | REP2(1-269) | 45% | 0% |
pDB2788 | ApaI | REP2(1-271) | 33% | 0% |
pDB2688 | XcmI | 역위 반복 | 100% | 100% |
pDB2805 & pDB2806 | FspI | 역위 반복 | 100% | 100% |
B)
FLP
삽입 사이트
플라스미드(들) | 삽입 사이트 | 비고 | 상대적 안정성 | |
세트 1 | 세트 2 | |||
pDB2814 | BclI | FLP(1-353) | 67% | 64% |
pDB2823 | XmnI | FLP(1-382) | 64% | 53% |
pDB2812 & pDB2813 | HgaI | 역위 반복 | 100% | 100% |
pDB2808 | FspI | 100% | 100% |
변형 pSAC35 플라스미드 모두는 이스트를 루신 독립영양성으로 형질변형시킬 수 있으며, 이는 부가적인 DNA가 2㎛ DNA의 기능적으로 혼잡한 리전내에 삽입되었음에도 불구하고 모두 에스. 세레비지아에에서 복제 및 분할될 수 있음을 보여준다. 이는 2㎛ US-리전내 모든 사이트에 삽입된 43-52 염기쌍 링커 뿐만 아니라 PDI1 유전자를 함유하는 보다 큰 DNA 삽입으로 플라스미드에 적용되었다.
링커 삽입 사이트에 있어서, 데이타는 실험 및 반복 모두에서 재현가능하였다. REP2 또는 FLP 오픈 리딩 프래임의 외부이지만 역위 반복내에 있는 모든 사이트는 사용된 시험 조건하에서 100% 안정한 것으로 나타났다. 플라스미드 불안정성(즉, 플라스미드 소실)은 REP2 및 FLP 오픈 리딩 프래임내 사이트내로 삽입된 링커에서 관찰되었다. REP2 삽입의 관찰된 플라스미드 불안정성은 FLP 삽입에 대한 것보다 높았다. REP2 삽입에 있어서, LEU2 마커의 소실은 비-선별 배지에서 연장된 성장 기간동안 계속되었으며, 한편 FLP 삽입에 대하여 거의 차이가 없었다.
REP2 유전자내로의 삽입은 셀프-결합 및 2㎛의 STB-위치에 바인딩시 작용하는 것으로 알려진(Sengupta et al, 2001, J. Bacteriol ., 183, 2306) 리전내에 트렁캐이티드된 Rep2 폴리펩타이드를 생성하였다.
FLP 유전자내로의 삽입은 트렁캐이티드 Flp 단백질을 형성하였다. 모든 삽입 사이트는 Flp 단백질의 올바른 기능에 필수적인 C-말단 도메인내 티로신-343이후이 었다(Prasad et al, 1987, Proc . Natl . Acad . Sci . U.S.A., 84, 2189; Chen et al, 1992, Cell, 69, 647; Grainge et al, 2001, J. Mol . Biol ., 314, 717).
FLP XcmI-사이트내로 삽입시 또한 Flp 단백질 산물을 트렁캐이팅하는 경우를 제외하고, 역위 반복 리전내로 어떠한 삽입도 없는 경우 플라스미드 불안정성이 검출되는 것으로 나타났다. 역위 반복 리전내 FspI-사이트에 삽입은 플라스미드 복제에 중요한 FRT(Flp 인지 표적)에 가장 근접하였다.
pSAC35-유사 플라스미드는 REP2 오픈 리딩 프래임 또는 FLP 오픈 리딩 프래임 또는 역위 반복 서열내로 삽입된 43-52 염기쌍 DNA 링커로 구성되었다. 또한, PD11 유전자를 함유하는 1.9kb DNA 프레그먼트를 REP2이후 XcmI-사이트에 DNA 링커내로 삽입하였다.
삽입된 부가적인 DNA를 갖는 pSAC35-유사 벡터 모두 이스트를 루신 독립영양성으로 형질변형시킬 수 있었다. 따라서, DNA가 2㎛ DNA의 기능적으로 혼잡한 리전내에 삽입되었음에도 불구하고 플라스미드 복제 및 분할 기작은 파괴되지 않았다.
비-선별 배지에서 성장도중 LEU2 선별 마커의 소실을 측정함에 의한 플라스미드 안정성 검사는 DNA 링커를 역위 반복내로 삽입하는 것이 플라스미드를 불안정화시키지 않았으며, 한편 플라스미드 안정성은 REP2 및 FLP 오픈 리딩 프래임내로 삽입에 의해 감소되었음을 보여주었다. 그러나, 본 발명의 제1 및 제2 견지에 의해 정의된 일부 포지션에서 REP2 및 FLP 오픈 리딩 프래임내로 삽입이 이루어지는 경우 비-선별 배지 성장 조건하에서 플라스미드 안정성의 감소에도 불구하고, 그 결과물인 플라스미드는 선별 배지상에서 성장시 이스트에 사용되기에 충분히 높은 안정성을 갖는다.
실시예
6
pSAC35
의 스몰
유니크
리전내
REP2
유전자 직후 DNA 서열의 삽입
REP2 유전자 및 이의 역위 반복 하위내 서열내로 부가적인 DNA의 삽입에 유용한 제한을 더욱 규정짓기위해, 합성 DNA 링커를 REP2 번역 종결 코돈(TGA) 직후 pSAC35내로 삽입하였다. 2㎛(또는 pSAC35)내 REP2 암호 서열 직후에 알맞게 위치하는 자연적으로 발생하는 제한 엔도뉴클레아제 사이트가 없는 경우, SnaBI-사이트를 올리고뉴클레오타이드 디렉티드 돌연변이 생성 방법에 의해 이 포지션에 도입하였다. REP2의 하위에 인접한 유니크 SnaBI-사이트를 갖는 pSAC35 유도체는 pDB2938(도 37)로 명명되었다. pDB2938에서, 역위 반복의 말단은 SnaBI-사이트의 삽입에 의해 역위 반복의 나머지로 대체되었다. pDB2954(도 38)은 후속적으로 pDB2938의 유니크 SnaBI 사이트내로 삽입된 올리고뉴클레오타이드 CF104 및 CF105(상기 참조)로부터 제조된 SnaBI-링커와 동일한 31-bp 서열로 구성되었으며, REP2의 TGA 번역 종결 코돈 직후에 위치한 제한 엔도뉴클레아제 사이트의 순서는 SnaBI-PacI-FseI/SfiI-SmaI-SnaBI이었다.
pDB2938을 구성하기 위해, pDB2783(도 14)의 1,085-bp NcoI-BamHI 프레그먼트는 pMCS5(Hoheisel, 1994, Biotechniques, 17, 456)내로 일차 계대 배양되었으며, 이는 NcoI, BamHI 및 CIAP로 다이제스션되었다. 이는 pDB2809(도 39)를 생성하였으며, 후속적으로 올리고뉴클레오타이드 CF127 및 CF128을 이용하여 돌연변이되어 pDB2920(도 40)을 생성하였다.
51-bp 돌연변이발생
올리고뉴클레오타이드
CF127
및
CF128
SnaBI 인지 서열은 밑줄을 그었다.
올리고뉴클레오타이드 디렉티드 돌연변이 생성은 Stratagene의 QuickChangeTM Site-Directed Mutagenesis Kit의 지시 매뉴얼에 따라 수행되었다. 플라스미드 DNA의 SnaBI 및 HindIII 제한 다이제스션으로 pDB2920을 함유한 앰피실린 저항성 E.coli 형질변형체를 확인하였다. SnaBI 제한 사이트 및 전체 1,091-bp NcoI-BamHI 프레그먼트에 대한 올바른 DNA 서열의 삽입된 6-bp 서열은 올리고뉴클 레오타이드 프라이머 CF98, CF99, CF129, CF130 및 M13 포워드 및 리버스 프라이머(표 1)를 이용한 DNA 시퀀싱에 의해 pDB2920에서 확인되었다.
pDB2920의 1,091-bp NcoI-BamHI 프레그먼트는 아가로즈 겔 정제에 의해 분리되고 pDB2783의 약 4.7-kb NcoI-BamHI 프레그먼트로 라이게이션되어 pDB2936(도 41)을 생성하였다. pDB2783 4.7kb NcoI-BamHI 프레그먼트는 우선 NcoI으로 부분 다이제스션하여 선형화되고 아가로즈 겔 전기영동에 의해 정제된 pDB2783의 완전 BamHI 다이제스션에 의해 분리되었다. E. coli DH5α 세포는 그 라이게이션 산물에 의해 아프라마이신 저항성으로 형질변형되었다. pDB2936은 아프라마이신 저항성 클론으로부터 분리된 플라스미드 DNA의 SnaBI 다이제스션에 의해 확인되었다.
후속적으로 pDB2936의 3,082-bp XbaI 프레그먼트는 부분 XbaI 다이제스션 및 CIAP 처리에 의해 생성된 7,961-bp pSAC35 프레그먼트로 라이게이션되어 디스인테그레이션 벡터 pDB2938(2㎛ B-형, 도 37)를 생성하였다.
pDB2938은 SnaBI 및 CIAP로 다이제스션되고 pDB2939(도 42)의 약 2-kb SnaBI 프레그먼트로 라이게이션되었다. pDB2939는 에스. 세레비지아에 S288c 게노믹 DNA로부터 올리고뉴클레오타이드 프라이머 DS248 및 DS250(도 43)을 이용하여 PDI1 유전자를 PCR 증폭한 다음, PCR 산물을 EcoRI 및 BamHI으로 다이제스션하고 약 1.98-kb 프레그먼트를 EcoRI 및 BamHI으로 잘린 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 클로닝하였다. pDB2939의 DNA 시퀀싱으로 도 43에 굵게 표시된 DS248 서열내에 'G' 소실을 확인하였다. pDB2939의 약 2-kb SnaBI 프레그먼트는 후속적으로 pDB2938의 유일한 SnaBI-사이트내로 클로닝되어 플라스미드 pDB2950(도 44)이 생성되었다. pDB2950내 PDI1 유전자는 REP2 유전자와 동일한 방향으로 전사된다.
pDB2950은 후속적으로 SmaI으로 다이제스션되고 약 11.1-kb DNA 프레그먼트는 환형화되어 S288c PDI1 서열이 제거되었다. 이는 REP2의 TGA 번역 종결 코돈 직후에 위치한 SnaBI-PacI-FseI/SfiI-SmaI-SnaBI 링커를 갖는 플라스미드 pDB2954(도 38)를 생성하였다.
pDB2938의 유일한 SnaBI-사이트내로 에스. 세레비지아에 S288c PDI1 유전자를 클로닝하는 것에 부가적으로, 에스. 세레비지아에 SKQ2n PDI1 유전자가 마찬가지로 이 사이트에 삽입되었다. 에스. 세레비지아에 SKQ2n PDI1 유전자 서열은 Clone C7(Crouzet & Tuite, 1987, 상기 참조; Farquhar et al, 1991, 상기 참조)으로도 알려진 pMA3a:C7(US 6,291,205)의 PDI1 유전자를 함유하는 플라스미드 DNA로부터 PCR 증폭되었다. SKQ2n PDI1 유전자는 올리고뉴클레오타이드 프라이머 DS248 및 DS250(도 43)을 이용하여 증폭되었다. 약 2-kb PCR 산물을 EcoRI 및 BamHI으로 다이제스션하고, EcoRI 및 BamHI으로 잘려진 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 라이게이션하여 플라스미드 pDB2943(도 45)을 생성하였다. SKQ2n PDI1 서열의 5'말단은 EcoRI, SacI, SnaBI, PacI, FseI, SfiI 및 SmaI 사이트를 포함하도록 연장된 블런트-엔드 SpeI-사이트와 유사하고, 3'말단은 SmaI, SnaBI 및 BamHI 사이트를 포함하도록 연장된 블런트-엔드 Bsu36I 사이트와 유사한 사이트까지 연장되었다. PDI1 프로모터 길이는 약 210bp이다. 전체 DNA 서열은 PDI1 프레그먼트에 대해 조사되었으며 이는 에스. 세레비지아에 스트레인 SKQ2n 서열(NCBI 등록번호 CAA38402)의 PDI 단백질을 암호하나 포지션 114에 세린 잔기(아르기닌 잔기가 아닌)를 갖는 것으로 나타났다. pDB2939내 에스. 세레비지아에 S288c 서열과 마찬가지로, pDB2943은 도 43에서 굵게 표시된 DS248 서열내에서 'G' 소실이 있었다. pDB2943의 약 1,989-bp SnaBI 프레그먼트는 후속적으로 pDB2938내 유일한 SnaBI-사이트내로 클로닝되었다. 이는 플라스미드 pDB2952(도 46)를 생성하였며, 여기서 SKQ2n PDI1 유전자는 REP2와 동일한 방향으로 전사된다.
실시예
7
REP2
유전자 직후에 삽입된 DNA를 함유하는
pSAC35
-유사 플라스미드로 형질변형된 이스트에서
LEU2
마커의
상대적 안정성
pSAC35내 REP2 유전자 이후에 도입된 SnaBI-사이트에 링커 서열의 삽입이 플라스미드 안정성에 미치는 영향은 pDB2954에 대해 평가되었다. 이는 초기 실시예에 사용된 것과 동일한 에스. 세레비지아에 스트레인에서 YEPS에서 비-선별 성장도중 LEU2 마커의 소실로 조사되었다. pDB2954의 안정성은 실시예 1에 기재된 방법으로 pSAC35(대조구 플라스미드), pDB2688(XcmI-링커) 및 pDB2817(XmnI-링커)의 안정성과 비교되었다.
이스트 스트레인은 변형 리튬 아세테이트 방법(Sigma yeast transformation kit, YEAST-1, 프로토콜 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18))을 이용하여 루신 독립영양성으로 형질변형되었다. 형질변형체는 BMMD-아가 플래이트에서 선별되었으며, 후속적으로 BMMD-아가 플래이트상에서 패치아웃되었다. 10mL BMMD 쉐이크 플라스크 배양물(24시간, 30℃, 200rpm)로부터 이와 동일한 양의 멸균 40%(w/v) 트레할로즈를 혼합하고 -80℃(즉, 영하 80℃)에서 분취량을 동결시켜 저온 보존된 트레할로즈 스톡을 제조하였다.
플라스미드 안정성 검사를 위해, 1mL 저온보존 스톡을 해동하고 250mL 코니컬 플라스크에 담긴 100mL YEPS(초기 OD600 0.04-0.09)내에 접종하고 오비털 쉐이커(200rpm, Innova 4300 배양기, New Brunswick Scientific)에서 30℃에서 약 72시간(전형적으로 70-74시간) 배양하였다. 각 스트레인은 2회 분석되었다.
각 플라스크로부터 시료를 수거하고 YEPS-브로스에 희석하고(10-2 내지 10-5 희석) YEPS-아가 플래이트상에 이중으로 100μL 분취량을 플래이팅하였다. 세포를 30℃에서 3-4일간 배양하여 단일 콜로니가 발달하도록 하였다. 분석되는 각 이스트 스톡에 있어서, 100개의 무작위 콜로니를 이중으로 BMMS-아가 플래이트상에서 패치한 다음 YEPS-아가 플래이트상에서 패치하였다. 30℃에서 3-4일간 배양한 후, BMMS-아가 플래이트 및 YEPS-아가 플래이트 모두에서 콜로니 성장 퍼센트를 플라스미드 안정성의 척도로 측정하였다.
상기 분석 결과를 하기 표 5A에 나타내었다. 이러한 결과는 pDB2954가 본질적으로 pSAC35 대조구 및 pDB2688 만큼 안정함을 보여준다. 이러한 타입의 평가에서, 저 수준의 불안정성은 종종 pSAC35 대조구에서조차 검출될 수 있다(참조 표 4). 더욱이, REP2의 번역 종결 코돈 직후의 역위 반복 서열내로 인위적으로 도입된 SnaBI-사이트는 합성 링커 서열의 삽입을 위한 역위 반복내 XcmI-사이트와 동등한 것으로 나타났다. 그러나 XcmI-사이트는 PDI1 유전자를 함유하는 약 2-kb DNA 프레그먼트의 삽입을 위한 SnaBI-사이트에 바람직한 것으로 나타났다.
표 5A: 여러가지 DNA 삽입을 함유하는 pSAC35-기초 벡터의 상대적 안정성
플라스미드 | US- 리전내 삽입 사이트 | US- 리전내 삽입된 유전자 | UL- 리전내 SnaBI/NotI-사이트에 삽입된 유전자(들) | 상대적 안정성(%) |
pSAC35 | - | - | LEU2 | 100 |
pDB2688 | XcmI | - | LEU2 | 99.5 |
pDB2954 | SnaBI | - | LEU2 | 99 |
pDB2817 | XmnI | - | LEU2 | 27 |
pDB2690 | XmnI | PDI1(SKQ2n) | LEU2 | 39.5 |
pDB2952 | SnaBI | PDI1(SKQ2n) | LEU2 | 0 |
pDB2950 | SnaBI | PDI1(S288c) | LEU2 | 0 |
플라스미드 pDB2952 및 pDB2950에 대하여 이러한 평가의 "0 퍼센트 안정성"이 비-선별 배지에서 획득되었으며, 이는 상대적 플라스미드 안정성을 표시한다. 이 평가는 다른 링커 삽입물의 상대적 안정성을 비교하도록 최적화되었다. 선별 배지에서, SnaBI-사이트에 PDI1을 갖는 플라스미드는(플라스미드(하기 pDB2959 및 pDB2960과 같은)를 더욱 불안정하게 하는 것으로 알려진 NotI 사이트에 부가적인 트랜스페린 유전자를 포함하는 경우에도) 비-선별 YEPD-아가 및 항-트랜스페린 항체를 함유하는 선별 BMMD-아가 플래이트 모두에 분비 트랜스페린의 "프리시피틴 할로스"를 생성하였다. 분비된 트랜스페린의 프리시피틴 할로스는 SnaBI-사이트에 삽입된 PDI1 유전자가 없는 pDB2961로부터 관찰되지 않았다. 이러한 결과는 SnaBI-사이트가 이종 단백질의 분비를 증가시킬 수 있는 PDI1과 같은 대 유전자의 삽입에 유용함을 입증한다. 이러한 결과는 모두 대조구 스트레인에서 생성되었다. pDB2959 및 pDB2960을 함유하는 스트레인 A에 대해서도 증가가 발견되었으나, 이 경우 또한 (스트레인 A의 게놈내 엑스트라 PDI1 유전자에 기인하여)보다 낮은 수준의 분비가 pDB2961에서 관찰되었다. 대조구 스트레인으로부터의 결과는 하기 표 5B에 요약되었다. 25mL BMMD-아가 또는 YEPD-아가당 염소 폴리클로날 항-트랜스페린 항혈청(Callbiochem) 100μL를 함유한 항체 플래이트가 사용되었다. 스트레인들은 항체 플래이트상에 패치되고 30℃에서 48-72시간동안 배양되었으며, 이 후 프리시피틴 "할로스"는 고 수준의 재조합 트랜스페린을 분비하는 콜로니 주변의 아가에서 관찰되었다. 매우 낮은 수준의 트랜스페린 분비는 이 시험에서 관찰되지 않았다.
pDB2711(도 11)에서 발견되는 바와 같은 rTf(N413Q, N611Q)에 대한 3.27-kb NotI 카세트를 pDB2711과 동일한 방향으로 유일한 NotI-사이트내로 삽입함으로써, 플라스미드 pDB2959, pDB2960 및 pDB2961은 pDB2950(도 44), pDB2952(도 46) 및 pDB2954(도 38)로부터 각각 구성되었다.
표 5B: REP2 직후 사이트에 여러 가지 PDI1 유전자 삽입을 함유하는 pSAC35-기초 벡터로 형질변형된 대조구 스트레인로부터의 증가된 트랜스페린 분비
플라스미드 | US- 리전내 삽입 사이트 | US- 리전내 삽입된 유전자 | UL- 리전내 SnaBI / NotI -사이트에 삽입된 유전자(들) | 항- 트랜스페린 Ab - 플래이트에서 검출되는 트랜스페린 분비 | |
BMMD-항 Tf | YEPD-항 Tf | ||||
pDB2960 | SnaBI | PDI1(SKQ2n) | LEU2 + rTf | 유 | 유 |
pDB2959 | SnaBI | PDI1(S288c) | LEU2 + rTf | 유 | 유 |
pDB2961 | SnaBI | - | LEU2 + rTf | 무 | 무 |
실시예
8
pSAC35
-유사 플라스미드로 형질변형된 이스트에서 비-선별 조건에서 성장 30세대에 걸쳐 조사된
LEU2
마커의
안정성
US-리전에 삽입된 DNA를 갖는 pSAC35-유사 플라스미드의 안정성은 Chinery & Hinchcliffe(1989, Curr . Genet., 16, 21-25)에 의해 정의된 것과 유사한 방법을 이용하여 조사되었다. 이는 앞선 실시예에서 사용된 것과 동일한 에스. 세레비지아에 스트레인에서 규정된 수의 세대에 걸쳐 비-선별 YEPS 배지상에 대수 성장도중 LEU2 마커의 소실로 검출되었다. 30 세대가 대조구 플라스미드, pSAC35간의 차이를 보여주기에 적절하였으며, 또는 상기 대조구 플라스미드에 상당한 안정성을 나타내기에 적적하였다. 본 시험에 의한 분석을 위해 선별된 플라스미드는 pSAC35(대조구), pDB2688(XcmI-링커), pDB2812(HgaI-링커), pDB2817(XmnI-링커), pDB2960(REP2이후 XcmI 사이트에 삽입된 PDI1 유전자) 및 pDB2711(REP2이후 XcmI 사이트에 삽입된 PDI1 유전자 및 UL-리전내 NotI-사이트에 삽입된 트랜스페린 발현 카세트)이었다.
스트레인들을 선별(BMMS) 배지 30℃에서 대수 단계로 성장시키고 250mL 코니컬 플라스크내에서 30℃로 미리 데워진 100mL 비-선별(YEPS) 배지에 접종하여 1.25x105 내지 5x105cells/ml를 생성하였다. 각 플라스크에 접종된 세포수는 헤모사이토미터를 이용하여 적절히 측정하여 배양 시료에서 세포수를 계산하였다. 분취량을 또한 비-선별(YEPS) 아가에 플래이팅하고 30℃에서 3-4일간 배양하였으며, 이후 각 스톡을 분석하기위해 100개의 무작위 콜로니를 선별(BMMS) 아가 및 비-선별(YEPS) 아가에 이중으로 플래이팅하여 플라스미드를 보유하는 세포의 비율을 평가하였다. 30℃에서 3-4일간 배양한 후, BMMS 아가 및 YEPS 아가 플래이트 모두에서 성장하는 콜로니의 퍼센트를 플라스미드 안정성의 척도로 측정하였다.
비-선별 액체 배양물을 2000rpm으로 교반하면서 24시간동안 30℃에서 배양하여 헤모사이토미터 계산으로 측정시 약 1x107cells/ml을 이루었다. 그 다음 배양물 을 새로운 미리 데워진 비-선별 배지에 재접종하여 1.25x105 내지 5x105cells/ml을 생성하였다. 분취량을 다시 비-선별 아가에 플래이팅하고, 후속적으로 선별 아가 및 비-선별 아가에 이중으로 플래이팅하여 플라스미드의 보유를 평가하였다. 또한, 비-선별 액체 배지에서 세포 세대수를 계산하는 것이 가능하였다. 지수적 대수 성장은 액체 배양시 30 세대동안 유지되었으며, 이는 pSAC35와 같은 대조구 플라스미드에 상당한 안정성을 나타내기에 충분하였다. 플라스미드 안정성은 선별가능한 LEU2 마커를 유지하는 퍼센트 세포로 정의되었다.
비-선별 배지에서 성장을 통한 플라스미드-암호화된 표현형의 보유를 평가하는 상기 분석 결과를 표 6 및 도 47에 나타내었다.
표 6: 선별된 pSAC35-유사 플라스미드의 비-선별 배지에서 30 세대동안 성장된 에스. 세레비지아에 스트레인에서의 상대적 안정성
플라스미드 | US- 리전내 링커 삽입 사이트 | US- 리전내 삽입된 유전자 | UL- 리전내 SnaBI/NotI-사이트에 삽입된 유전자(들) | 30세대후 퍼센트 안정성(%) |
pSAC35 | - | - | LEU2 | 100 |
pDB2688 | REP2이후 XcmI | - | LEU2 | 100 |
pDB2812 | FLP이후 HgaI | - | LEU2 | 100 |
pDB2817 | REP2이후 XmnI | - | LEU2 | 1 |
pDB2690 | REP2이후 XcmI | PDI1(SKQ2n) | LEU2 | 33 |
pDB2711 | REP2이후 XcmI | PDI1(SKQ2n) | LEU2 + rTf | 2 |
도 47은 분석된 각 스트레인에 대해 비-선별 액체 배지에서 세대수 증가에 따른 LEU2 마커의 소실을 나타낸다.
대조구 플라스미드 pSAC35는 본 시험의 전체 30-세대에 걸쳐 100% 안정성을 보유하였다. 플라스미드 pBD2688 및 pDB2812 모두 pSAC35 만큼 안정한 것으로 나타났다. 따라서, 각각 REP2이후 XcmI-사이트 또는 FLP이후 HgaI-사이트내로 링커의 삽입은 플라스미드 안정성에 명백한 영향을 주지 않았다. 반대로, REP2 유전자내 XmnI-링커의 삽입은 감소된 플라스미드 안정성을 미치는 것으로 나타났다.
REP2이후 XcmI-링커내에 에스. 세레비지아에 PDI1 유전자를 함유하는 플라스미드 pDB2690는 30세대 성장후 약 33% 안정성을 가졌으며, 이는 2㎛-기초 벡터의 US-리전내로 이러한 대 DNA 프레그먼트의 삽입이 플라스미드 안정성 감소를 일으켰음을 나타낸다. 그러나, 이러한 안정성 감소는 pDB2711에서 관찰된 것보다 낮았으며, pSAC35의 라지 유니크 리전내 NotI-사이트내로 재조합 트랜스페린(N413Q, N611Q) 발현 카세트의 삽입은 플라스미드를 더욱 불안정화시키는 작용을 하였다. 이러한 관찰은 실시예 2의 결과와 일치한다(참조 표 2).
플라스미드 pDB2711의 안정성은 에스. 세레비지아에의 다른 스트레인에서 상기 방법에 의해 평가되었으며, 유사한 결과가 획득되었다(데이타로는 나타내지 않음). 이는 플라스미드의 안정성은 스트레인에 의존하지 않음을 보여준다.
실시예
9
2㎛-기초
플라스미드상에서
PDI1
유전자를 겸비한
PDI1
유전자 붕괴는 플라스미드 안정성을 증가시켰다.
표 7에 열거된 DNA 단일 스트랜드 올리고뉴클레오타이드 DNA 프라이머는 이스트 PDI1 암호 리전의 상위 리전 및 이스트 PDI1 암호 리전의 다른 하위 리전을 증폭시키도록 디자인되었다.
표 7: 올리고뉴클레오타이드 프라이머
프라이머 | 설명 | 서열 |
DS299 | 5' PDI1 프라이머, 38mer | 5'-CGTAGCGGCCGCCTGAAAGGGGTTGACCGTCCGTCGGC-3' |
DS300 | 5' PDI1 프라이머, 40mer | 5'-CGTAAAGCTTCGCCGCCCGACAGGGTAACATATTATCAC-3' |
DS301 | 3' PDI1 프라이머, 38mer | 5'-CGTAAAGCTTGACCACGTAGTAATAATAAGTGCATGGC-3' |
DS302 | 3' PDI1 프라이머, 41mer | 5'-CGTACTGCAGATTGGATAGTGATTAGAGTGTATAGTCCCGG-3' |
DS303 | 18mer | 5'-GGAGCGACAAACCTTTCG-3' |
DS304 | 20mer | 5'-ACCGTAATAAAAGATGGCTG-3' |
DS305 | 24mer | 5'-CATCTTGTGTGTGAGTATGGTCGG-3' |
DS306 | 14mer | 5'-CCCAGGATAATTTTCAGG-3' |
주형으로 게노믹 DNA 유래된 S288c를 이용하여 프라이머 DS299 및 DS300은 PCR에 의해 PDI1의 5'리전을 증폭하였으며, 프라이머 DS301 및 DS302는 PDI1의 3'리전을 증폭하였다. PCR 조건은 다음과 같았다: 1μL S288c 주형 DNA(0.01ng/μL, 0.1ng/μL, 1ng/μL, 10ng/μL 및 100ng/μL로), 5μL 10X버퍼(Fast Start Taq+Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H2O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9700을 이용하여 수행되었다. 조건은 다음과 같았다: 95℃에서 4분간 변성[고정], 그 다음 [사이클] 20사이클동안 95℃에서 30초간 변성, 45℃에서 30초간 어닐링, 72℃에서 45초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정]. 0.22kbp PDI1 5' PCR 산물은 NotI 및 HindIII로 잘려지고, 0.34kbp PDI1 3' PCR 산물은 HindIII 및 PstI으로 잘려졌다.
플라스미드 pMCS5(Hoheisel, 1994, Biotechniques 17, 456-460)(도 48)는 HindIII로 다이제스션되고 T4 DNA 폴리머라아제 + dNTPs로 블런트 엔딩되고 라이게이션되어 pDB2964(도 49)로 생성되었다.
플라스미드 pDB2964는 HindIII 다이제스션되고 CIAP로 처리되고 한편, NotI 및 HindIII로 다이제스션된 0.22kbp PDI1 5' PCR 산물 및 HindIII 및 PstI으로 다이제스션된 0.34kbp PDI1 3'PCR 산물과 라이게이션되어 pDB3069(도 50)으로 생성되었으며, 이는 포워드 및 리버스 유니버설 프라이머 및 DNA 시퀀싱 프라이머 DS303, DS304 및 DS306(표 7)을 이용하여 시퀀싱되었다.
프라이머 DS234 및 DS235(표 8)는 PCR 산물의 말단중 어느 하나에 HindIII 제한 사이트를 편입하는 YIplac204(Gietz & Sugino, 1988, Gene, 74, 527-534)의 변형 TRP1 마커 유전자를 증폭시키는데 사용되었다. PCR 조건은 다음과 같았다: 1μL 주형 YIplac204(0.01ng/μL, 0.1ng/μL, 1ng/μL, 10ng/μL 및 100ng/μL로), 5μL 10X버퍼(Fast Start Taq + Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H2O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9600을 이용하여 수행되었다. 조건은 다음과 같았다: 95℃에서 4분간 변성[고정], 그 다음 [사이클] 20사이클동안 95℃에서 30초간 변성, 45℃에서 45초간 어닐링, 72℃에서 90초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정]. 0.86kbp PCR 산물은 HindIII로 잘려지고 pMCS5의 HindIII 사이트내로 클로닝되어 pDB2778(도 51)로 생성되었다. 유니버설 포워드 및 리버스 프라이머 뿐만 아니라 DS236, DS237, DS238 및 DS239(표 8)를 이용한 제한 효소 다이제스션 및 시퀀싱으로 변형 TRP1 유전자의 시퀀스가 맞았음을 확인하였다.
표 8: 올리고뉴클레오타이드 프라이머
pDB2778로부터 HindIII 다이제스션에 의해 0.86kb TRP1 유전자가 분리되었으며 pDB3069의 HindIII 사이트내로 클로닝되어 pDB3078(도 52) 및 pDB3079(도 53)가 생성되었다. pDB3078 또는 pDB3079로부터 NotI/PstI 다이제스션에 의해 1.4kb pdi1::TRP1 디스럽팅 DNA 프레그먼트가 분리되었다.
TRP1 결핍된 이스트 스트레인(trp1 Δ)은 trpΔ가 생성되면 TRP1 마커 유전자(pDB2778)에 대한 상동성이 게놈내에 남아있지 않아 앞으로 존재하게 될 TRP1 함유 구조물과 TRP1 로커스 사이에 동종성 재조합을 저해할 수 있도록 구성되게 하였다. 선택된 숙주 스트레인의 게놈으로부터 본래 TRP1 서열을 완전 제거하기 위해, 올리고뉴클레오타이드는 통합 벡터 YIplac204(Gietz & Sugino, 1988, Gene, 74, 527-534)상에 존재하는 TRP1 마커 유전자 외부의 TRP1 유전자의 5'UTR과 3'UTR의 구역을 증폭시키도록 디자인되었다. YIplac204 TRP1 마커 유전자는 내부 HindIII, PstI 및 XbaI 사이트가 사이트 디렉티드 돌연변이 생성에 의해 제거된 점에서 본래/염색체 TRP1 유전자와 다르다(Gietz & Sugino, 1988, Gene, 74, 527-534). YIplac204 변형 TRP1 마커 유전자는 TRP1 유전자와 TRP1 프로모터의 102bp만 함유된 1.453kbp 블런트-엔드 게노믹 프레그먼트 EcoRI 프레그먼트(Gietz & Sugino, 1988, Gene, 74, 527-534)로부터 제작되었다. 이는 상대적으로 짧은 프로모터임에도 불구하고 trp1 영양요구성 돌연변이를 보완하기에 명확히 충분하였다(Gietz & Sugino, 1988, Gene, 74, 527-534). TRP1 ORF의 시작에서 102bp 5'에 위치한 EcoRI 사이트의 DNA 서열 상위만 5' TRP1 UTR을 생성하는데 사용되었다. 3'UTR의 선택은 이것이 기능 변형된 TRP1 마커의 3' 말단 외부에 존재하는 한 아주 중요하진 않았으며, 이는 번역 종결 코돈의 85bp 하위이 되도록 선택되었다.
단일 스트랜드 올리고뉴클레오타이드 DNA 프라이머는 PCR 증폭도중 제한 효소 사이트가 이후 클로닝 단계에 사용되는 PCR 산물의 말단에 더해지도록 TRP1 유전자의 5'UTR 및 3'UTR 리전을 증폭시키도록 디자인되고 구성되었다. 프라이머 DS230 및 DS231(표 8)은 PCR에 의해 TRP1의 5'리전을 증폭시켰으며, 프라이머 DS232 및 DS233(표 8)은 S288c 게노믹 DNA를 주형으로 이용하여 TRP1의 3'리전을 증폭시켰다. PCR 조건은 다음과 같았다: 1μL 주형 S288c 게노믹 DNA(0.01ng/μL, 0.1ng/μL, 1ng/μL, 10ng/μL 및 100ng/μL로), 5μL 10X버퍼(Fast Start Taq + Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H2O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9600을 이용하여 수행되었다. 조건은 다음과 같았다: 95℃에서 4분간 변성[고정], 그 다음 [사이클] 20사이클동안 95℃에서 30초간 변성, 45℃에서 45초간 어닐링, 72℃에서 90초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정].
0.19kbp TRP1 5'UTR PCR 산물은 EcoRI 및 HindIII로 잘려지고, 0.2kbp TRP1 3'UTR PCR 산물은 BamHI 및 HindIII로 잘려지고 BamHI/EcoRI으로 선형화된 pAYE505내로 라이게이션되어 플라스미드 pDB2777(도 54)가 생성되었다. pAYE505의 구성은 WO 95/33833에 기재되어 있다. 플라스미드 백본 및 클로닝된 삽입물 서열로부터 프라이밍하도록 디자인된 포워드 및 리버스 프라이머를 이용한 DNA 시퀀싱을 수행하여 모든 경우에 클로닝된 TRP1 유전자의 5' 및 3'UTR 서열이 예측한 DNA 서열을 가졌음을 확인하였다. 플라스미드 pDB2777은 TRP1의 5' 및 3'UTR로부터 유래된 서열 융합을 포함하는 TRP1 디스럽팅 프레그먼트를 함유하였다. 이 0.383kbp TRP1 디스럽팅 프레그먼트는 EcoRI을 이용한 완전 다이제스션에 의해 pDB2777로부터 제거되었다.
이스트 스트레인 DXY1(Kerry-Williams et al., 1988, Yeast, 14, 161-169)는 변형 리튬 아세테이트 방법(Sigma yeast transformation kit, YEAST-1, protocol 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18)을 이용하여 알부민 발현 플라스미드 pDB2244를 가지고 루신 독립영양성으로 형질변형되어 이스트 스트레인 DXY1[pDB2244]을 생성하였다. 알부민 발현 플라스미드 pDB2244의 구성은 WO 00/44772에 기재되어 있다. 형질변형체는 BMMD-아가 플래이트상에서 선별되고, 후속적으로 BMMD-아가 플래이트상에서 패치아웃되었다. 저온보존된 트레할로스 스톡을 10mL BMMD 쉐이크 플라스크 배양물로부터 제조하였다(24시간, 30℃, 200rpm).
DXY[pDB2244]는 Toyn et al., (2000 Yeast 16, 553-560)에 기재된 바와 같은 역 선별 트립토판 유사체를 포함하는 영양 아가를 이용하여 pDB2777로부터 0.383kbp EcoRI TRP1 디스럽팅 DNA 프레그먼트를 가지고 트립토판 자가영양성으로 형질변형되었다. 5-FAA의 독성 영향에 저항적인 콜로니를 집어서 제2 라운드의 5-FAA 플래이트에 스트리킹하여 이들이 실제로 5-FAA에 저항적이었음을 확인하였고 어느 백그라운드 성장을 피하여 선택하였다. 성장된 콜로니들은 그 다음 BMMD 및 BMMD + 트립토판상에 재-패치되어 트립토판 자가영양성인지 확인하였다.
후속적으로 트립토판 자가영양성인 것으로 나타난 콜로니를 분리체가 trp1이었음을 확인하기위해 YCplac22(Gietz & Sugino, 1988, Gene, 74, 527-534)를 이용한 형질변형에 의한 추가 분석용으로 선택하였다.
TRP1 로커스를 지나는 PCR 증폭은 트립토판 자가영양성이 이 리전내 결실에 기인한 것임을 확인하기위해 사용되었다. 게노믹 DNA는 5-FAA에 저항적이며 트립토판 첨가없이 최소배지에서 성장이 불가능한 것으로 확인된 분리체로부터 준비되었다. 프라이머 CED005 및 CED006(표 8)을 이용한 게노믹 TRP1 로커스의 PCR 증폭은 다음과 같이 이루어졌다: 1μL 주형 게노믹 DNA, 5μL 10X버퍼(Fast Start Taq + Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H2O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9600을 이용하여 수행되었다. 조건은 다음과 같았다: 94℃에서 10분간 변성[고정], 그 다음 [사이클] 40사이클동안 94℃에서 30초간 변성, 55℃에서 30초간 어닐링, 72℃에서 120초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정]. 야생형 TRP1 로커스의 PCR 증폭은 1.34kbp 크기의 PCR 산물을 형성하였으며, 제거된 TRP1 리전을 지나는 증폭은 보다 0.50kbp 작은 0.84kbp PCR 산물을 형성하였다. PCR 분석으로 예측된 제거를 갖는 DXY1 유도 trp- 스트레인(trp1 Δ[pDB2244])를 확인하였다.
이스트 스트레인 DXY1 trp1 Δ[pDB2244]은 Sleep et al., 1991, Bio/Technology, 9, 183-187에 기술된 바와 같은 발현 플라스미드 pDB2244로 교정되었다. trp1 Δcir0은 변형 리튬 아세테이트 방법(Sigma yeast transformation kit, YEAST-1, protocol 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18))을 이용하여 pDB2244, pDB2976, pDB2977, pDB2978, pDB2979, pDB2980 또는 pDB2981(pDB2976, pDB2977 및 pDB2980 또는 pDB2981의 생성을 실시예 10에 보다 상세히 언급된다.)를 가지고 루신 독립영양성으로 형질변형되었다. 형질변형체는 트립토판이 보충된 BMMD-아가 플래이트상에서 선별되어 후속적으로 트립토판이 보충된 BMMD-아가 플래이트상에서 패치아웃되었다. 저온보존된 트레할로스 스톡을 트립토판이 보충된 10mL BMMD 쉐이크 플라스크 배양물로부터 준비되었다(24시간, 30℃, 200 rpm).
이스트 스트레인 DXY1 trp1 Δ[pDB2976], DXY1 trp1 Δ[pDB2977], DXY1 trp1 Δ[pDB3078], DXY1 trp1 Δ[pDB3079], DXY1 trp1 Δ[pDB2980] 또는 DXY1 trp1 Δ[pDB2981]은 변형 리튬 아세테이트 방법(Sigma yeast transformation kit, YEAST-1, protocol 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18))을 이용하여 트립토판 독립영양성으로 형질변형되었으며 1.41kb pdi1 :: TRP1 디스럽팅 DNA 프레그먼트가 NotI/PstI 다이제스션에 의해 pDB3078로부터 분리되었다. 형질변형체는 BMMD-아가 플래이트상에서 선별되어 후속적으로 BMMD-아가 플래이트상에서 패치아웃되었다.
각 스트레인의 6 형질변형체가 50mL 쉐이크 플라스크에 담긴 10mL YEPD내로 접종되었으며 오비털 쉐이커에서 30℃에서, 200rpm으로 4일간 배양되었다. 게노믹 DNA는 트립토판 독립영향성 및 DXY1[pDB2244]로 부터 준비되었다(Lee, 1992, Biotechniques, 12, 677). 프라이머 DS236 및 DS303(표 7 및 8)를 이용한 게노믹 PDI1 로커스의 PCR 증폭은 다음과 같이 이루어졌다: 1μL 주형 게노믹 DNA, 5μL 10X버퍼(Fast Start Taq + Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H2O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9700을 이용하여 수행되었다. 조건은 다음과 같았다: 94℃에서 4분간 변성[고정], 그 다음 [사이클] 30사이클동안 94℃에서 30초간 변성, 50℃에서 30초간 어닐링, 72℃에서 60초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정]. 야생형 PDI1 로커스의 PCR 증폭은 PCR 산물을 형성하지 않았으며, 제거된 PDI1 리전을 지나는 증폭은 보다 0.65kbp PCR 산물을 형성하였다. PCR 분석으로 시험된 모든 36 포텐셜 pdi1 :: TRP1 스트레인은 예측된 pdi1 :: TRP1 제거를 갖는 것을 확인하였다.
재조합 알부민 타이터는 로켓 면역전기영동으로 비교되었다(도 55). 각 그룹에서, DXY1 trp1 Δ[pDB2976], DXY1 trp1 Δ[pDB2978], DXY1 trp1 Δ[pDB2980], DXY1 trp1Δ[pDB2977], 및 DXY1 trp1 Δ[pDB2979]중 모든 6 pdi1 :: TRP1 분해물은 매우 유사한 rHA 생산능을 가졌다. DXY1 trp1 Δ[pDB2981]의 6 pdi1 :: TRP1 분해물만이 rHA 발현 타이터가 다양하였다. 도 55에 나타낸 6 pdi1 :: TRP1 분해물은 단일 콜로니를 분리하기위해 YEPD 아가상에 스프레딩한 다음 BMMD 아가상에 재패치하였다.
DXY1 [pDB2244], DXY1 [pDB2976], DXY1 [pDB2978], DXY1 [pDB2980], DXY1 [pDB2977], DXY1 [pDB2979] 및 DXY1 [pDB2981]과 함께 DXY1 trp1 Δ pdi1 :: TRP1 [pDB2976], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2978], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2980], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2977], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2979] 및 DXY1 trp1 Δ pdi1 :: TRP1 [pDB2981]의 3 단일 세포 분리물을 50mL 쉐이크 플라스크에 담긴 10mL YEPD내로 접종하고 30℃에서 200rpm으로 4일간 오비털 쉐이커에서 배양하였다. 배양 상층액을 수거하고 재조합 알부민 타이터를 로켓 면역전기영동으로 비교하였다(도 56). 도 56에 나타낸 30개의 야생형 PDI1 및 pdiI::TRP1 분해물은 단일 콜로니를 분리하기 위해 YEPD 아가상에 스프레딩되었다. 그 다음 각 스트레인으로부터 100개의 단일 세포 콜로니를 고트 항-HSA 항체(Sleep et al., 1991, Bio/Technology, 9, 183-187)를 함유하는 BMMD 아가 또는 YEPD 아가상에 재패치하여 재조합 알부민의 발현을 검출하였으며, 각 콜로니의 Leu+/rHA+, Leu-/rHA+ 또는 Leu-/rHA- 표현형을 기록하였다(표 9).
표 9:
이러한 데이타는 PDI1 유전자가 염색체 암호화된 PDI를 갖지 않는 숙주 스트레인에서 플라스미드상에 선별 마커로 사용되는 경우 이러한 완전 배지와 같은 비-선별 배지에서도 플라스미드 보유율이 증가됨을 나타낸다. 이는 "필수" 샤프롱(예, PDI1 또는 PSE1), 또는 제거 혹은 불활성화되는 경우 영양요구성(생합성) 요구를 형성하지 않는 어느 다른 어느 "필수" 유전자 산물(예, PGK1 또는 FBA1)이 세포가 특정 선별 조건하에서 배양되는 것을 필요로 하는 불리함없이 증가된 플라스미드 안정성을 달성하기위해 그 유전자 산물을 생산할 수 없는 플라스미드의 부재하에서 숙주 세포내 플라스미드상에 선별 마커로 사용될 수 있음을 보여준다. "영양요구성(생합성) 요구"란 성장 배지에 첨가 또는 변형에 의해 보완될 수 있는 결핍을 포함한다. 따라서, 본 발명의 이러한 정황에서 "필수 마커 유전자"는 숙주세포에서 제거 혹은 불활성화되는 경우 성장 배지에 첨가나 변형에 의해 보완될 수 없는 결핍을 일으키는 것이다.
실시예
10
동일한 2㎛-유사
플라스미드상에
여러가지
PDI1
유전자 및
여러가지
이종 단백질에 대한 발현 카세트를 함유하는 발현 벡터의 구성
PDI1
유전자의
PCR
증폭 및
YIplac211
내로의
클로닝
에스. 세레비지아에 S288c 및 에스. 세레비지아에 SKQ2n의 PDI1 유전자를 PCR에 의해 증폭하여 프로모터 서열을 함유하는 다른 길이의 5'-비번역 리전을 갖는 DNA 프레그먼트를 생성하였다. PCR 프라이머는 PCR 산물을 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)의 EcoRI 및 BamHI 사이트내로 삽입할 수 있도록 디자인되었다. 부가적인 제한 엔도뉴클레아제 사이트가 또한 후속적인 클로닝을 촉진하기 위해 PCR 프라이머에 편입되었다. 표 10은 구성된 플라스미드를 설명하며 표 11은 PDI1 유전자를 증폭하기 위해 사용된 PCR 프라이머 서열을 제공한다. 이러한 YIplac211-기초 플라스미드내에서 PDI1 프로모터 길이의 차이는 표 10에 나타내어진다.
에스. 세레비지아에 S288c 게노믹 DNA로부터 PDI1 유전자의 PCR 증폭하고, 그 다음 PCR 산물을 EcoRI 및 BamHI으로 다이제스션하고 이로부터 얻어진 약 1.98-kb 프레그먼트를 EcoRI 및 BamHI으로 잘려진 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 클로닝하여 pDB2939(도 57)를 생성하였다. pDB2939의 DNA 시퀀싱으로 표 5에 굵게 표시된 DS248 서열내에서 'G' 소실을 확인하였다. PDI1 유전자를 시퀀싱하는데 사용된 올리고뉴클레오타이드 프라이머는 표 6에 열거되며, 공개된 S288c PDI1 유전자 서열(코디네이트 50221 내지 48653의 염색체 III상의 PDI1/YCL043C + 상위 서열의 1000 염기쌍 및 하위 서열의 1000 염기쌍(http://www.yeastgenome.org/Genebank Accession number NC001135))로 부터 디자인되었다.
표 10: PDI1 유전자를 함유하는 YIplac211-기초 플라스미드
표 11: 에스. 세레비지아에 PDI1 유전자의 PCR 증폭용 올리고뉴클레오타이드 프라이머
표 12: 에스. 세레비지아에 PDI1 유전자의 DNA 시퀀싱용 올리고뉴클레오타이드
플라스미드 pDB2941(도 58) 및 pDB2942(도 59)는 마찬가지로 표 10 및 11에 나타낸 PCR 프라이머를 이용하여 증폭하고 그 약 1.90-kb 및 1.85-kb EcoRI-BamHI 프레그먼트를 각각 YIplac211내로 클로닝함으로써 구성되었다. 올바른 DNA 서열을 pDB2941 및 pDB2942에서 PDI1 유전자에 대해 확인하였다.
에스. 세레비지아에 SKQ2n PDI1 유전자 서열은 Clone C7(Crouzet & Tuite, 1987, 상기 참조; Farquhar et al., 1991, 상기 참조)으로도 알려진 pMA3a:C7(US 6,291,205)의 PDI1 유전자를 함유하는 플라스미드 DNA로부터 증폭되었다. SKQ2n PDI1 유전자는 올리고뉴클레오타이드 프라이머 DS248 및 DS250(표 10 및 11)을 이용하여 증폭되었다. 이로부터 얻어진 약 2.01-kb PCR 산물은 EcoRI 및 BamHI으로 다이제스션되고 EcoRI 및 BamHI으로 잘려진 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 라이게이션되어 플라스미드 pDB2943(도 60)을 생성하였다. SKQ2n PDI1 서열의 5'말단은 EcoRI, SacI, SnaBI, PacI, FseI, SfiI 및 SmaI 사이트를 포함하도록 연장된 블런트-엔드 SpeI-사이트와 유사하며, 3'말단은 SmaI, SnaBI 및 BamHI 사이트를 포함하도록 연장된 블런트-엔드 Bsu36I 사이트와 유사하다. PDI1 프로모터 길이는 약 210bp이다. 전체 DNA 서열은 표 12에 주어진 올리고뉴클레오타이드 프라이머를 이용하여 PDI1 프레그먼트에 대해 조사되었다. 이는 에스. 세레비지아에 스트레인 SKQ2n(NCBI 등록번호 CAA38402)의 PDI 단백질에 대한 암호 서열이 존재하나 포지션 114에 세린 잔기(앞서 공개된 바와 같이 아르기닌 잔기가 아닌)를 갖는 것으로 나타났다. 마찬가지로, pDB2939의 에스. 세레비지아에 S288c 서열에서와 같은 방식으로, 또한 pDB2943은 표 5에 굵게 표시된 DS248 서열내에 'G' 소실을 가졌다.
플라스미드 pDB2963(도 61) 및 pDB2945(도 62)는 마찬가지로 표 10 및 11에 기재된 PCR 프라이머를 이용하여 증폭되고 그 약 1.94-kb 및 1.87-kb EcoRI-BamHI 프레그먼트를 각각 YIplac211내로 클로닝함으로써 구성되었다. 예측된 DNA 서열을 pDB2963 및 pDB2945에서 PDI1 유전자에 대해 확인하였으며, 아미노산 114의 포지션 에 세린 코돈을 갖는 것으로 나타났다.
REP2 이후 XcmI-사이트에 삽입된 다른 PDI1 유전자를 갖는 pSAC35-기초 rHA 발현 플라스미드의 구성:
다른 PDI1 유전자와 함께 rHA의 동시-발현을 위한 pSAC35-기초 플라스미드를 제작하였다(표 13).
표 13: 다른 PDI1 유전자와 함께 rHA의 동시-발현을 위한 pSAC35-기초 플라스미드
pDB2243(도 63, WO 00/44772에 기재된 바와 같음)의 rHA 발현 카세트를 2,992-bp NotI 프레그먼트상에서 우선 분리하고, 후속적으로 pDB2688(도 4)의 NotI-사이트내로 클로닝하여 pDB2693(도 64)를 생성하였다. pDB2693은 SnaBI으로 다이제스션되고, CIAP로 처리된 다음, pDB2943, pDB2963, pDB2945, pDB2939, pDB2941 및 pDB2942의 PDI1 유전자를 함유하는 SnaBI 프레그먼트와 라이게이션되었다. 이는 플라스미드 pDB2976 - pDB2987(도 65 - 76)을 생성하였다. REP2와 동일한 방향으로 전사된 PDI1은 "방향 A"로 표시되었으며, REP2와 반대 방향으로 전사된 PDI1은 "방향 B"로 표시되었다(표 13).
<110> Delta Biotechnology Limited
<120> 2-MICRON FAMILY PLASMID AND USE THEREOF
<150> GB 0329722.3
<151> 2003-12-23
<160> 85
<170> KopatentIn 1.71
<210> 1
<211> 1485
<212> DNA
<213> Saccharomyces cerevisiae REP2 gene and adjacent inverted repeat on 2um plasmid
<400> 1
atggacgaca ttgaaacagc caagaatctg acggtaaaag cacgtacagc ttatagcgtc 60
tgggatgtat gtcggctgtt tattgaaatg attgctcctg atgtagatat tgatatagag 120
agtaaacgta agtctgatga gctactcttt ccaggatatg tcataaggcc catggaatct 180
ctcacaaccg gtaggccgta tggtcttgat tctagcgcag aagattccag cgtatcttct 240
gactccagtg ctgaggtaat tttgcctgct gcgaagatgg ttaaggaaag gtttgattcg 300
attggaaatg gtatgctctc ttcacaagaa gcaagtcagg ctgccataga tttgatgcta 360
cagaataaca agctgttaga caatagaaag caactataca aatctattgc tataataata 420
ggaagattgc ccgagaaaga caagaagaga gctaccgaaa tgctcatgag aaaaatggat 480
tgtacacagt tattagtccc accagctcca acggaagaag atgttatgaa gctcgtaagc 540
gtcgttaccc aattgcttac tttagttcca ccagatcgtc aagctgcttt aataggtgat 600
ttattcatcc cggaatctct aaaggatata ttcaatagtt tcaatgaact ggcggcagag 660
aatcgtttac agcaaaaaaa gagtgagttg gaaggaagga ctgaagtgaa ccatgctaat 720
acaaatgaag aagttccctc caggcgaaca agaagtagag acacaaatgc aagaggagca 780
tataaattac aaaacaccat cactgagggc cctaaagcgg ttcccacgaa aaaaaggaga 840
gtagcaacga gggtaagggg cagaaaatca cgtaatactt ctagggtatg atccaatatc 900
aaaggaaatg atagcattga aggatgagac taatccaatt gaggagtggc agcatataga 960
acagctaaag ggtagtgctg aaggaagcat acgatacccc gcatggaatg ggataatatc 1020
acaggaggta ctagactacc tttcatccta cataaataga cgcatataag tacgcattta 1080
agcataaaca cgcactatgc cgttcttctc atgtatatat atatacaggc aacacgcaga 1140
tataggtgcg acgtgaacag tgagctgtat gtgcgcagct cgcgttgcat tttcggaaac 1200
gctcgttttc ggaaacgctt tgaagttcct attccgaagt tcctattctc tagaaagtat 1260
aggaacttca gagcgctttt gaaaaccaaa agcgctctga agacgcactt tcaaaaaacc 1320
aaaaacgcac cggactgtaa cgagctacta aaatattgcg aataccgctt ccacaaacat 1380
tgctcaaaag tatctctttg ctatatatct ctgtgctata tccctatata acctacccat 1440
ccacctttcg ctccttgaac ttgcatctaa actcgacctc tacat 1485
<210> 2
<211> 1688
<212> DNA
<213> Saccharomyces cerevisiae FLP gene and adjacent inverted repeat on 2um plasmid
<400> 2
atgccacaat ttggtatatt atgtaaaaca ccacctaagg tgcttgttcg tcagtttgtg 60
gaaaggtttg aaagaccttc aggtgagaaa atagcattat gtgctgctga actaacctat 120
ttatgttgga tgattacaca taacggaaca gcaatcaaga gagccacatt catgagctat 180
aatactatca taagcaattc gctgagtttc gatattgtca ataaatcact ccagtttaaa 240
tacaagacgc aaaaagcaac aattctggaa gcctcattaa agaaattgat tcctgcttgg 300
gaatttacaa ttattcctta ctatggacaa aaacatcaat ctgatatcac tgatattgta 360
agtagtttgc aattacagtt cgaatcatcg gaagaagcag ataagggaaa tagccacagt 420
aaaaaaatgc ttaaagcact tctaagtgag ggtgaaagca tctgggagat cactgagaaa 480
atactaaatt cgtttgagta tacttcgaga tttacaaaaa caaaaacttt ataccaattc 540
ctcttcctag ctactttcat caattgtgga agattcagcg atattaagaa cgttgatccg 600
aaatcattta aattagtcca aaataagtat ctgggagtaa taatccagtg tttagtgaca 660
gagacaaaga caagcgttag taggcacata tacttcttta gcgcaagggg taggatcgat 720
ccacttgtat atttggatga atttttgagg aattctgaac cagtcctaaa acgagtaaat 780
aggaccggca attcttcaag caataaacag gaataccaat tattaaaaga taacttagtc 840
agatcgtaca ataaagcttt gaagaaaaat gcgccttatt caatctttgc tataaaaaat 900
ggcccaaaat ctcacattgg aagacatttg atgacctcat ttctttcaat gaagggccta 960
acggagttga ctaatgttgt gggaaattgg agcgataagc gtgcttctgc cgtggccagg 1020
acaacgtata ctcatcagat aacagcaata cctgatcact acttcgcact agtttctcgg 1080
tactatgcat atgatccaat atcaaaggaa atgatagcat tgaaggatga gactaatcca 1140
attgaggagt ggcagcatat agaacagcta aagggtagtg ctgaaggaag catacgatac 1200
cccgcatgga atgggataat atcacaggag gtactagact acctttcatc ctacataaat 1260
agacgcatat aagtacgcat ttaagcataa acacgcacta tgccgttctt ctcatgtata 1320
tatatataca ggcaacacgc agatataggt gcgacgtgaa cagtgagctg tatgtgcgca 1380
gctcgcgttg cattttcgga agcgctcgtt ttcggaaacg ctttgaagtt cctattccga 1440
agttcctatt ctctagaaag tataggaact tcagagcgct tttgaaaacc aaaagcgctc 1500
tgaagacgca ctttcaaaaa accaaaaacg caccggactg taacgagcta ctaaaatatt 1560
gcgaataccg cttccacaaa cattgctcaa aagtatctct ttgctatata tctctgtgct 1620
atatccctat ataacctacc catccacctt tcgctccttg aacttgcatc taaactcgac 1680
ctctacat 1688
<210> 3
<211> 522
<212> PRT
<213> Saccharomyces cerevisiae PDI1 protein sequence
<400> 3
Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu
1 5 10 15
Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser
20 25 30
Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser
35 40 45
His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys
50 55 60
Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu
65 70 75 80
Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu
85 90 95
Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys
100 105 110
Asn Ser Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala
115 120 125
Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala
130 135 140
Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr
145 150 155 160
Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr
165 170 175
Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser
180 185 190
Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser
195 200 205
Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala
210 215 220
Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr
225 230 235 240
Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly
245 250 255
Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu
260 265 270
Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met
275 280 285
Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn
290 295 300
Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr
305 310 315 320
Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp
325 330 335
Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu
340 345 350
Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln
355 360 365
Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys
370 375 380
Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu
385 390 395 400
Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr
405 410 415
Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile
420 425 430
Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu
435 440 445
Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser
450 455 460
Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile
465 470 475 480
Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu
485 490 495
Ala Gln Glu Lys Ala Ala Glu Glu Ala Asp Ala Asp Ala Glu Leu Ala
500 505 510
Asp Glu Glu Asp Ala Ile His Asp Glu Leu
515 520
<210> 4
<211> 530
<212> PRT
<213> Saccharomyces cerevisiae alternative PDI1 protein sequence
<400> 4
Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu
1 5 10 15
Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser
20 25 30
Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser
35 40 45
His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys
50 55 60
Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu
65 70 75 80
Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu
85 90 95
Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys
100 105 110
Asn Arg Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala
115 120 125
Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala
130 135 140
Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr
145 150 155 160
Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr
165 170 175
Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser
180 185 190
Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser
195 200 205
Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala
210 215 220
Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr
225 230 235 240
Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly
245 250 255
Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu
260 265 270
Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met
275 280 285
Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn
290 295 300
Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr
305 310 315 320
Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp
325 330 335
Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu
340 345 350
Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln
355 360 365
Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys
370 375 380
Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu
385 390 395 400
Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr
405 410 415
Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile
420 425 430
Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu
435 440 445
Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser
450 455 460
Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile
465 470 475 480
Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu
485 490 495
Ala Gln Glu Lys Ala Ala Glu Glu Ala Glu Ala Asp Ala Glu Ala Glu
500 505 510
Ala Asp Ala Asp Ala Glu Leu Ala Asp Glu Glu Asp Ala Ile His Asp
515 520 525
Glu Leu
530
<210> 5
<211> 642
<212> PRT
<213> Saccharomyces cerevisiae SSA1 protein sequence
<400> 5
Met Ser Lys Ala Val Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val
1 5 10 15
Ala His Phe Ala Asn Asp Arg Val Asp Ile Ile Ala Asn Asp Gln Gly
20 25 30
Asn Arg Thr Thr Pro Ser Phe Val Ala Phe Thr Asp Thr Glu Arg Leu
35 40 45
Ile Gly Asp Ala Ala Lys Asn Gln Ala Ala Met Asn Pro Ser Asn Thr
50 55 60
Val Phe Asp Ala Lys Arg Leu Ile Gly Arg Asn Phe Asn Asp Pro Glu
65 70 75 80
Val Gln Ala Asp Met Lys His Phe Pro Phe Lys Leu Ile Asp Val Asp
85 90 95
Gly Lys Pro Gln Ile Gln Val Glu Phe Lys Gly Glu Thr Lys Asn Phe
100 105 110
Thr Pro Glu Gln Ile Ser Ser Met Val Leu Gly Lys Met Lys Glu Thr
115 120 125
Ala Glu Ser Tyr Leu Gly Ala Lys Val Asn Asp Ala Val Val Thr Val
130 135 140
Pro Ala Tyr Phe Asn Asp Ser Gln Arg Gln Ala Thr Lys Asp Ala Gly
145 150 155 160
Thr Ile Ala Gly Leu Asn Val Leu Arg Ile Ile Asn Glu Pro Thr Ala
165 170 175
Ala Ala Ile Ala Tyr Gly Leu Asp Lys Lys Gly Lys Glu Glu His Val
180 185 190
Leu Ile Phe Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Phe
195 200 205
Ile Glu Asp Gly Ile Phe Glu Val Lys Ala Thr Ala Gly Asp Thr His
210 215 220
Leu Gly Gly Glu Asp Phe Asp Asn Arg Leu Val Asn His Phe Ile Gln
225 230 235 240
Glu Phe Lys Arg Lys Asn Lys Lys Asp Leu Ser Thr Asn Gln Arg Ala
245 250 255
Leu Arg Arg Leu Arg Thr Ala Cys Glu Arg Ala Lys Arg Thr Leu Ser
260 265 270
Ser Ser Ala Gln Thr Ser Val Glu Ile Asp Ser Leu Phe Glu Gly Ile
275 280 285
Asp Phe Tyr Thr Ser Ile Thr Arg Ala Arg Phe Glu Glu Leu Cys Ala
290 295 300
Asp Leu Phe Arg Ser Thr Leu Asp Pro Val Glu Lys Val Leu Arg Asp
305 310 315 320
Ala Lys Leu Asp Lys Ser Gln Val Asp Glu Ile Val Leu Val Gly Gly
325 330 335
Ser Thr Arg Ile Pro Lys Val Gln Lys Leu Val Thr Asp Tyr Phe Asn
340 345 350
Gly Lys Glu Pro Asn Arg Ser Ile Asn Pro Asp Glu Ala Val Ala Tyr
355 360 365
Gly Ala Ala Val Gln Ala Ala Ile Leu Thr Gly Asp Glu Ser Ser Lys
370 375 380
Thr Gln Asp Leu Leu Leu Leu Asp Val Ala Pro Leu Ser Leu Gly Ile
385 390 395 400
Glu Thr Ala Gly Gly Val Met Thr Lys Leu Ile Pro Arg Asn Ser Thr
405 410 415
Ile Ser Thr Lys Lys Phe Glu Ile Phe Ser Thr Tyr Ala Asp Asn Gln
420 425 430
Pro Gly Val Leu Ile Gln Val Phe Glu Gly Glu Arg Ala Lys Thr Lys
435 440 445
Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Ser Gly Ile Pro Pro Ala
450 455 460
Pro Arg Gly Val Pro Gln Ile Glu Val Thr Phe Asp Val Asp Ser Asn
465 470 475 480
Gly Ile Leu Asn Val Ser Ala Val Glu Lys Gly Thr Gly Lys Ser Asn
485 490 495
Lys Ile Thr Ile Thr Asn Asp Lys Gly Arg Leu Ser Lys Glu Asp Ile
500 505 510
Glu Lys Met Val Ala Glu Ala Glu Lys Phe Lys Glu Glu Asp Glu Lys
515 520 525
Glu Ser Gln Arg Ile Ala Ser Lys Asn Gln Leu Glu Ser Ile Ala Tyr
530 535 540
Ser Leu Lys Asn Thr Ile Ser Glu Ala Gly Asp Lys Leu Glu Gln Ala
545 550 555 560
Asp Lys Asp Thr Val Thr Lys Lys Ala Glu Glu Thr Ile Ser Trp Leu
565 570 575
Asp Ser Asn Thr Thr Ala Ser Lys Glu Glu Phe Asp Asp Lys Leu Lys
580 585 590
Glu Leu Gln Asp Ile Ala Asn Pro Ile Met Ser Lys Leu Tyr Gln Ala
595 600 605
Gly Gly Ala Pro Gly Gly Ala Ala Gly Gly Ala Pro Gly Gly Phe Pro
610 615 620
Gly Gly Ala Pro Pro Ala Pro Glu Ala Glu Gly Pro Thr Val Glu Glu
625 630 635 640
Val Asp
<210> 6
<211> 1929
<212> DNA
<213> Saccharomyces cerevisiae SSA1 DNA sequence
<400> 6
atgtcaaaag ctgtcggtat tgatttaggt acaacatact cgtgtgttgc tcactttgct 60
aatgatcgtg tggacattat tgccaacgat caaggtaaca gaaccactcc atcttttgtc 120
gctttcactg acactgaaag attgattggt gatgctgcta agaatcaagc tgctatgaat 180
ccttcgaata ccgttttcga cgctaagcgt ttgatcggta gaaacttcaa cgacccagaa 240
gtgcaggctg acatgaagca cttcccattc aagttgatcg atgttgacgg taagcctcaa 300
attcaagttg aatttaaggg tgaaaccaag aactttaccc cagaacaaat ctcctccatg 360
gtcttgggta agatgaagga aactgccgaa tcttacttgg gagccaaggt caatgacgct 420
gtcgtcactg tcccagctta cttcaacgat tctcaaagac aagctaccaa ggatgctggt 480
accattgctg gtttgaatgt cttgcgtatt attaacgaac ctaccgccgc tgccattgct 540
tacggtttgg acaagaaggg taaggaagaa cacgtcttga ttttcgactt gggtggtggt 600
actttcgatg tctctttgtt gttcattgaa gacggtatct ttgaagttaa ggccaccgct 660
ggtgacaccc atttgggtgg tgaagatttt gacaacagat tggtcaacca cttcatccaa 720
gaattcaaga gaaagaacaa gaaggacttg tctaccaacc aaagagcttt gagaagatta 780
agaaccgctt gtgaaagagc caagagaact ttgtcttcct ccgctcaaac ttccgttgaa 840
attgactctt tgttcgaagg tatcgatttc tacacttcca tcaccagagc cagattcgaa 900
gaattgtgtg ctgacttgtt cagatctact ttggacccag ttgaaaaggt cttgagagat 960
gctaaattgg acaaatctca agtcgatgaa attgtcttgg tcggtggttc taccagaatt 1020
ccaaaggtcc aaaaattggt cactgactac ttcaacggta aggaaccaaa cagatctatc 1080
aacccagatg aagctgttgc ttacggtgct gctgttcaag ctgctatttt gactggtgac 1140
gaatcttcca agactcaaga tctattgttg ttggatgtcg ctccattatc cttgggtatt 1200
gaaactgctg gtggtgtcat gaccaagttg attccaagaa actctaccat ttcaacaaag 1260
aagttcgaga tcttttccac ttatgctgat aaccaaccag gtgtcttgat tcaagtcttt 1320
gaaggtgaaa gagccaagac taaggacaac aacttgttgg gtaagttcga attgagtggt 1380
attccaccag ctccaagagg tgtcccacaa attgaagtca ctttcgatgt cgactctaac 1440
ggtattttga atgtttccgc cgtcgaaaag ggtactggta agtctaacaa gatcactatt 1500
accaacgaca agggtagatt gtccaaggaa gatatcgaaa agatggttgc tgaagccgaa 1560
aaattcaagg aagaagatga aaaggaatct caaagaattg cttccaagaa ccaattggaa 1620
tccattgctt actctttgaa gaacaccatt tctgaagctg gtgacaaatt ggaacaagct 1680
gacaaggaca ccgtcaccaa gaaggctgaa gagactattt cttggttaga cagcaacacc 1740
actgccagca aggaagaatt cgatgacaag ttgaaggagt tgcaagacat tgccaaccca 1800
atcatgtcta agttgtacca agctggtggt gctccaggtg gcgctgcagg tggtgctcca 1860
ggcggtttcc caggtggtgc tcctccagct ccagaggctg aaggtccaac cgttgaagaa 1920
gttgattaa 1929
<210> 7
<211> 1089
<212> PRT
<213> Saccharomyces cerevisiae PSE1 protein sequence
<400> 7
Met Ser Ala Leu Pro Glu Glu Val Asn Arg Thr Leu Leu Gln Ile Val
1 5 10 15
Gln Ala Phe Ala Ser Pro Asp Asn Gln Ile Arg Ser Val Ala Glu Lys
20 25 30
Ala Leu Ser Glu Glu Trp Ile Thr Glu Asn Asn Ile Glu Tyr Leu Leu
35 40 45
Thr Phe Leu Ala Glu Gln Ala Ala Phe Ser Gln Asp Thr Thr Val Ala
50 55 60
Ala Leu Ser Ala Val Leu Phe Arg Lys Leu Ala Leu Lys Ala Pro Pro
65 70 75 80
Ser Ser Lys Leu Met Ile Met Ser Lys Asn Ile Thr His Ile Arg Lys
85 90 95
Glu Val Leu Ala Gln Ile Arg Ser Ser Leu Leu Lys Gly Phe Leu Ser
100 105 110
Glu Arg Ala Asp Ser Ile Arg His Lys Leu Ser Asp Ala Ile Ala Glu
115 120 125
Cys Val Gln Asp Asp Leu Pro Ala Trp Pro Glu Leu Leu Gln Ala Leu
130 135 140
Ile Glu Ser Leu Lys Ser Gly Asn Pro Asn Phe Arg Glu Ser Ser Phe
145 150 155 160
Arg Ile Leu Thr Thr Val Pro Tyr Leu Ile Thr Ala Val Asp Ile Asn
165 170 175
Ser Ile Leu Pro Ile Phe Gln Ser Gly Phe Thr Asp Ala Ser Asp Asn
180 185 190
Val Lys Ile Ala Ala Val Thr Ala Phe Val Gly Tyr Phe Lys Gln Leu
195 200 205
Pro Lys Ser Glu Trp Ser Lys Leu Gly Ile Leu Leu Pro Ser Leu Leu
210 215 220
Asn Ser Leu Pro Arg Phe Leu Asp Asp Gly Lys Asp Asp Ala Leu Ala
225 230 235 240
Ser Val Phe Glu Ser Leu Ile Glu Leu Val Glu Leu Ala Pro Lys Leu
245 250 255
Phe Lys Asp Met Phe Asp Gln Ile Ile Gln Phe Thr Asp Met Val Ile
260 265 270
Lys Asn Lys Asp Leu Glu Pro Pro Ala Arg Thr Thr Ala Leu Glu Leu
275 280 285
Leu Thr Val Phe Ser Glu Asn Ala Pro Gln Met Cys Lys Ser Asn Gln
290 295 300
Asn Tyr Gly Gln Thr Leu Val Met Val Thr Leu Ile Met Met Thr Glu
305 310 315 320
Val Ser Ile Asp Asp Asp Asp Ala Ala Glu Trp Ile Glu Ser Asp Asp
325 330 335
Thr Asp Asp Glu Glu Glu Val Thr Tyr Asp His Ala Arg Gln Ala Leu
340 345 350
Asp Arg Val Ala Leu Lys Leu Gly Gly Glu Tyr Leu Ala Ala Pro Leu
355 360 365
Phe Gln Tyr Leu Gln Gln Met Ile Thr Ser Thr Glu Trp Arg Glu Arg
370 375 380
Phe Ala Ala Met Met Ala Leu Ser Ser Ala Ala Glu Gly Cys Ala Asp
385 390 395 400
Val Leu Ile Gly Glu Ile Pro Lys Ile Leu Asp Met Val Ile Pro Leu
405 410 415
Ile Asn Asp Pro His Pro Arg Val Gln Tyr Gly Cys Cys Asn Val Leu
420 425 430
Gly Gln Ile Ser Thr Asp Phe Ser Pro Phe Ile Gln Arg Thr Ala His
435 440 445
Asp Arg Ile Leu Pro Ala Leu Ile Ser Lys Leu Thr Ser Glu Cys Thr
450 455 460
Ser Arg Val Gln Thr His Ala Ala Ala Ala Leu Val Asn Phe Ser Glu
465 470 475 480
Phe Ala Ser Lys Asp Ile Leu Glu Pro Tyr Leu Asp Ser Leu Leu Thr
485 490 495
Asn Leu Leu Val Leu Leu Gln Ser Asn Lys Leu Tyr Val Gln Glu Gln
500 505 510
Ala Leu Thr Thr Ile Ala Phe Ile Ala Glu Ala Ala Lys Asn Lys Phe
515 520 525
Ile Lys Tyr Tyr Asp Thr Leu Met Pro Leu Leu Leu Asn Val Leu Lys
530 535 540
Val Asn Asn Lys Asp Asn Ser Val Leu Lys Gly Lys Cys Met Glu Cys
545 550 555 560
Ala Thr Leu Ile Gly Phe Ala Val Gly Lys Glu Lys Phe His Glu His
565 570 575
Ser Gln Glu Leu Ile Ser Ile Leu Val Ala Leu Gln Asn Ser Asp Ile
580 585 590
Asp Glu Asp Asp Ala Leu Arg Ser Tyr Leu Glu Gln Ser Trp Ser Arg
595 600 605
Ile Cys Arg Ile Leu Gly Asp Asp Phe Val Pro Leu Leu Pro Ile Val
610 615 620
Ile Pro Pro Leu Leu Ile Thr Ala Lys Ala Thr Gln Asp Val Gly Leu
625 630 635 640
Ile Glu Glu Glu Glu Ala Ala Asn Phe Gln Gln Tyr Pro Asp Trp Asp
645 650 655
Val Val Gln Val Gln Gly Lys His Ile Ala Ile His Thr Ser Val Leu
660 665 670
Asp Asp Lys Val Ser Ala Met Glu Leu Leu Gln Ser Tyr Ala Thr Leu
675 680 685
Leu Arg Gly Gln Phe Ala Val Tyr Val Lys Glu Val Met Glu Glu Ile
690 695 700
Ala Leu Pro Ser Leu Asp Phe Tyr Leu His Asp Gly Val Arg Ala Ala
705 710 715 720
Gly Ala Thr Leu Ile Pro Ile Leu Leu Ser Cys Leu Leu Ala Ala Thr
725 730 735
Gly Thr Gln Asn Glu Glu Leu Val Leu Leu Trp His Lys Ala Ser Ser
740 745 750
Lys Leu Ile Gly Gly Leu Met Ser Glu Pro Met Pro Glu Ile Thr Gln
755 760 765
Val Tyr His Asn Ser Leu Val Asn Gly Ile Lys Val Met Gly Asp Asn
770 775 780
Cys Leu Ser Glu Asp Gln Leu Ala Ala Phe Thr Lys Gly Val Ser Ala
785 790 795 800
Asn Leu Thr Asp Thr Tyr Glu Arg Met Gln Asp Arg His Gly Asp Gly
805 810 815
Asp Glu Tyr Asn Glu Asn Ile Asp Glu Glu Glu Asp Phe Thr Asp Glu
820 825 830
Asp Leu Leu Asp Glu Ile Asn Lys Ser Ile Ala Ala Val Leu Lys Thr
835 840 845
Thr Asn Gly His Tyr Leu Lys Asn Leu Glu Asn Ile Trp Pro Met Ile
850 855 860
Asn Thr Phe Leu Leu Asp Asn Glu Pro Ile Leu Val Ile Phe Ala Leu
865 870 875 880
Val Val Ile Gly Asp Leu Ile Gln Tyr Gly Gly Glu Gln Thr Ala Ser
885 890 895
Met Lys Asn Ala Phe Ile Pro Lys Val Thr Glu Cys Leu Ile Ser Pro
900 905 910
Asp Ala Arg Ile Arg Gln Ala Ala Ser Tyr Ile Ile Gly Val Cys Ala
915 920 925
Gln Tyr Ala Pro Ser Thr Tyr Ala Asp Val Cys Ile Pro Thr Leu Asp
930 935 940
Thr Leu Val Gln Ile Val Asp Phe Pro Gly Ser Lys Leu Glu Glu Asn
945 950 955 960
Arg Ser Ser Thr Glu Asn Ala Ser Ala Ala Ile Ala Lys Ile Leu Tyr
965 970 975
Ala Tyr Asn Ser Asn Ile Pro Asn Val Asp Thr Tyr Thr Ala Asn Trp
980 985 990
Phe Lys Thr Leu Pro Thr Ile Thr Asp Lys Glu Ala Ala Ser Phe Asn
995 1000 1005
Tyr Gln Phe Leu Ser Gln Leu Ile Glu Asn Asn Ser Pro Ile Val Cys
1010 1015 1020
Ala Gln Ser Asn Ile Ser Ala Val Val Asp Ser Val Ile Gln Ala Leu
1025 1030 1035 1040
Asn Glu Arg Ser Leu Thr Glu Arg Glu Gly Gln Thr Val Ile Ser Ser
1045 1050 1055
Val Lys Lys Leu Leu Gly Phe Leu Pro Ser Ser Asp Ala Met Ala Ile
1060 1065 1070
Phe Asn Arg Tyr Pro Ala Asp Ile Met Glu Lys Val His Lys Trp Phe
1075 1080 1085
Ala
<210> 8
<211> 3270
<212> DNA
<213> Saccharomyces cerevisiae PSE1 DNA sequence
<400> 8
atgtctgctt taccggaaga agttaataga acattacttc agattgtcca ggcgtttgct 60
tcccctgaca atcaaatacg ttctgtagct gagaaggctc ttagtgaaga atggattacc 120
gaaaacaata ttgagtatct tttaactttt ttggctgaac aagccgcttt ctcccaagat 180
acaacagttg cagcattatc tgctgttctg tttagaaaat tagcattaaa agctccccct 240
tcttcgaagc ttatgattat gtccaaaaat atcacacata ttaggaaaga agttcttgca 300
caaattcgtt cttcattgtt aaaagggttt ttgtcggaaa gagctgattc aattaggcac 360
aaactatctg atgctattgc tgagtgtgtt caagacgact taccagcatg gccagaatta 420
ctacaagctt taatagagtc tttaaaaagc ggtaacccaa attttagaga atccagtttt 480
agaattttga cgactgtacc ttatttaatt accgctgttg acatcaacag tatcttacca 540
atttttcaat caggctttac tgatgcaagt gataatgtca aaattgctgc agttacggct 600
ttcgtgggtt attttaagca actaccaaaa tctgagtggt ccaagttagg tattttatta 660
ccaagtcttt tgaatagttt accaagattt ttagatgatg gtaaggacga tgcccttgca 720
tcagtttttg aatcgttaat tgagttggtg gaattggcac caaaactatt caaggatatg 780
tttgaccaaa taatacaatt cactgatatg gttataaaaa ataaggattt agaacctcca 840
gcaagaacca cagcactcga actgctaacc gttttcagcg agaacgctcc ccaaatgtgt 900
aaatcgaacc agaattacgg gcaaacttta gtgatggtta ctttaatcat gatgacggag 960
gtatccatag atgatgatga tgcagcagaa tggatagaat ctgacgatac cgatgatgaa 1020
gaggaagtta catatgacca cgctcgtcaa gctcttgatc gtgttgcttt aaagctgggt 1080
ggtgaatatt tggctgcacc attgttccaa tatttacagc aaatgatcac atcaaccgaa 1140
tggagagaaa gattcgcggc catgatggca ctttcctctg cagctgaggg ttgtgctgat 1200
gttctgatcg gcgagatccc aaaaatcctg gatatggtaa ttcccctcat caacgatcct 1260
catccaagag tacagtatgg atgttgtaat gttttgggtc aaatatctac tgatttttca 1320
ccattcattc aaagaactgc acacgataga attttgccgg ctttaatatc taaactaacg 1380
tcagaatgca cctcaagagt tcaaacgcac gccgcagcgg ctctggttaa cttttctgaa 1440
ttcgcttcga aggatattct tgagccttac ttggatagtc tattgacaaa tttattagtt 1500
ttattacaaa gcaacaaact ttacgtacag gaacaggccc taacaaccat tgcatttatt 1560
gctgaagctg caaagaataa atttatcaag tattacgata ctctaatgcc attattatta 1620
aatgttttga aggttaacaa taaagataat agtgttttga aaggtaaatg tatggaatgt 1680
gcaactctga ttggttttgc cgttggtaag gaaaaatttc atgagcactc tcaagagctg 1740
atttctatat tggtcgcttt acaaaactca gatatcgatg aagatgatgc gctcagatca 1800
tacttagaac aaagttggag caggatttgc cgaattctgg gtgatgattt tgttccgttg 1860
ttaccgattg ttataccacc cctgctaatt actgccaaag caacgcaaga cgtcggttta 1920
attgaagaag aagaagcagc aaatttccaa caatatccag attgggatgt tgttcaagtt 1980
cagggaaaac acattgctat tcacacatcc gtccttgacg ataaagtatc agcaatggag 2040
ctattacaaa gctatgcgac acttttaaga ggccaatttg ctgtatatgt taaagaagta 2100
atggaagaaa tagctctacc atcgcttgac ttttacctac atgacggtgt tcgtgctgca 2160
ggagcaactt taattcctat tctattatct tgtttacttg cagccaccgg tactcaaaac 2220
gaggaattgg tattgttgtg gcataaagct tcgtctaaac taatcggagg cttaatgtca 2280
gaaccaatgc cagaaatcac gcaagtttat cacaactcgt tagtgaatgg tattaaagtc 2340
atgggtgaca attgcttaag cgaagaccaa ttagcggcat ttactaaggg tgtctccgcc 2400
aacttaactg acacttacga aaggatgcag gatcgccatg gtgatggtga tgaatataat 2460
gaaaatattg atgaagagga agactttact gacgaagatc ttctcgatga aatcaacaag 2520
tctatcgcgg ccgttttgaa aaccacaaat ggtcattatc taaagaattt ggagaatata 2580
tggcctatga taaacacatt ccttttagat aatgaaccaa ttttagtcat ttttgcatta 2640
gtagtgattg gtgacttgat tcaatatggt ggcgaacaaa ctgctagcat gaagaacgca 2700
tttattccaa aggttaccga gtgcttgatt tctcctgacg ctcgtattcg ccaagctgct 2760
tcttatataa tcggtgtttg tgcccaatac gctccatcta catatgctga cgtttgcata 2820
ccgactttag atacacttgt tcagattgtc gattttccag gctccaaact ggaagaaaat 2880
cgttcttcaa cagagaatgc cagtgcagcc atcgccaaaa ttctttatgc atacaattcc 2940
aacattccta acgtagacac gtacacggct aattggttca aaacgttacc aacaataact 3000
gacaaagaag ctgcctcatt caactatcaa tttttgagtc aattgattga aaataattcg 3060
ccaattgtgt gtgctcaatc taatatctcc gctgtagttg attcagtcat acaagccttg 3120
aatgagagaa gtttgaccga aagggaaggc caaacggtga taagttcagt taaaaagttg 3180
ttgggatttt tgccttctag tgatgctatg gcaattttca atagatatcc agctgatatt 3240
atggagaaag tacataaatg gtttgcataa 3270
<210> 9
<211> 216
<212> PRT
<213> Saccharomyces cerevisiae ORM2 protein sequence
<400> 9
Met Ile Asp Arg Thr Lys Asn Glu Ser Pro Ala Phe Glu Glu Ser Pro
1 5 10 15
Leu Thr Pro Asn Val Ser Asn Leu Lys Pro Phe Pro Ser Gln Ser Asn
20 25 30
Lys Ile Ser Thr Pro Val Thr Asp His Arg Arg Arg Arg Ser Ser Ser
35 40 45
Val Ile Ser His Val Glu Gln Glu Thr Phe Glu Asp Glu Asn Asp Gln
50 55 60
Gln Met Leu Pro Asn Met Asn Ala Thr Trp Val Asp Gln Arg Gly Ala
65 70 75 80
Trp Leu Ile His Ile Val Val Ile Val Leu Leu Arg Leu Phe Tyr Ser
85 90 95
Leu Phe Gly Ser Thr Pro Lys Trp Thr Trp Thr Leu Thr Asn Met Thr
100 105 110
Tyr Ile Ile Gly Phe Tyr Ile Met Phe His Leu Val Lys Gly Thr Pro
115 120 125
Phe Asp Phe Asn Gly Gly Ala Tyr Asp Asn Leu Thr Met Trp Glu Gln
130 135 140
Ile Asn Asp Glu Thr Leu Tyr Thr Pro Thr Arg Lys Phe Leu Leu Ile
145 150 155 160
Val Pro Ile Val Leu Phe Leu Ile Ser Asn Gln Tyr Tyr Arg Asn Asp
165 170 175
Met Thr Leu Phe Leu Ser Asn Leu Ala Val Thr Val Leu Ile Gly Val
180 185 190
Val Pro Lys Leu Gly Ile Thr His Arg Leu Arg Ile Ser Ile Pro Gly
195 200 205
Ile Thr Gly Arg Ala Gln Ile Ser
210 215
<210> 10
<211> 651
<212> DNA
<213> Saccharomyces cerevisiae ORM2 DNA sequence
<400> 10
atgattgacc gcactaaaaa cgaatctcca gcttttgaag agtctccgct tacccccaat 60
gtgtctaacc tgaaaccatt cccttctcaa agcaacaaaa tatccactcc agtgaccgac 120
cataggagaa gacggtcatc cagcgtaata tcacatgtgg aacaggaaac cttcgaagac 180
gaaaatgacc agcagatgct tcccaacatg aacgctacgt gggtcgacca gcgaggcgcg 240
tggttgattc atatcgtcgt aatagtactc ttgaggctct tctactcctt gttcgggtcg 300
acgcccaaat ggacgtggac tttaacaaac atgacctaca tcatcggatt ctatatcatg 360
ttccaccttg tcaaaggtac gcccttcgac tttaacggtg gtgcgtacga caacctgacc 420
atgtgggagc agattaacga tgagactttg tacacaccca ctagaaaatt tctgctgatt 480
gtacccattg tgttgttcct gattagcaac cagtactacc gcaacgacat gacactattc 540
ctctccaacc tcgccgtgac ggtgcttatt ggtgtcgttc ctaagctggg aattacgcat 600
agactaagaa tatccatccc tggtattacg ggccgtgctc aaattagtta g 651
<210> 11
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> CF86 oligonucleotide
<400> 11
ggagtggtac gtattaatta aggccggcca ggcccgggta cgtaccaatt ga 52
<210> 12
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> CF87 oligonucleotide
<400> 12
caattggtac gtacccgggc ctggccggcc ttaattaata cgtaccactc ct 52
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CF88 primer
<400> 13
atcacgtaat acttctaggg 20
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CF98 primer
<400> 14
agagtgagtt ggaaggaagg 20
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CF99 primer
<400> 15
agctcgtaag cgtcgttacc 20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CF90 primer
<400> 16
ctagtttctc ggtactatgc 20
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CF91 primer
<400> 17
gagttgacta atgttgtggg 20
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CF100 primer
<400> 18
aaagctttga agaaaaatgc 20
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CF101 primer
<400> 19
gcaaggggta ggatcgatcc 20
<210> 20
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> CF123 primer
<400> 20
attcgagctc ggtacctacg tact 24
<210> 21
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> CF126 primer
<400> 21
cccgggcacg tgggatcctc taga 24
<210> 22
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> M13 Forward primer
<400> 22
gtaaaacgac ggccagt 17
<210> 23
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> M13 Reverse primer
<400> 23
aacagctatg accatg 16
<210> 24
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> CF129 primer
<400> 24
gtgtttatgc ttaaatgcg 19
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CF130 primer
<400> 25
tcctcttgca tttgtgtctc 20
<210> 26
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> CF131 primer
<400> 26
atcttcctat tattatagc 19
<210> 27
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> CF104 oligonucleotide
<400> 27
gtattaatta aggccggcca ggcccgggta c 31
<210> 28
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> CF105 oligonucleotide
<400> 28
gtacccgggc ctggccggcc ttaattaata c 31
<210> 29
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> CF120 oligonucleotide
<400> 29
gtaataatac gtattaatta aggccggcca ggcccgggta cgtaa 45
<210> 30
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> CF121 oligonucleotide
<400> 30
tacgtacccg ggcctggccg gccttaatta atacgtatta ttact 45
<210> 31
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> CF108 oligonucleotide
<400> 31
ataataatac gtattaatta aggccggcca ggcccgggta cgta 44
<210> 32
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> CF109 oligonucleotide
<400> 32
tacgtacccg ggcctggccg gccttaatta atacgtatta ttat 44
<210> 33
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment of REP2 coding sequence - Forward
<400> 33
accatcactg agggccctaa agcg 24
<210> 34
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Fragment of REP2 coding sequence - Reverse
<400> 34
tagggccctc agtgatggt 19
<210> 35
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> CF116 oligonucleotide
<400> 35
cttaataata cgtattaatt aaggccggcc aggcccgggt acgtagggcc 50
<210> 36
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> CF117 oligonucleotide
<400> 36
ctacgtaccc gggcctggcc ggccttaatt aatacgtatt attaagggcc 50
<210> 37
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> CF106 oligonucleotide
<400> 37
taataatacg tattaattaa ggccggccag gcccgggtac gta 43
<210> 38
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> CF107 oligonucleotide
<400> 38
tacgtacccg ggcctggccg gccttaatta atacgtatta tta 43
<210> 39
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> CF118 oligonucleotide
<400> 39
gatcactaat aatacgtatt aattaaggcc ggccaggccc gggtacgta 49
<210> 40
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> CF119 oligonucleotide
<400> 40
gatctacgta cccgggcctg gccggcctta attaatacgt attattagt 49
<210> 41
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> CF114 oligonucleotide
<400> 41
agtactataa tacgtattaa ttaaggccgg ccaggcccgg gtacgta 47
<210> 42
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> CF115 oligonucleotide
<400> 42
gtacttacgt acccgggcct ggccggcctt aattaatacg tattata 47
<210> 43
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> CF127 oligonucleotide
<400> 43
cgtaatactt ctagggtatg atacgtatcc aatatcaaag gaaatgatag c 51
<210> 44
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> CF128 oligonucleotide
<400> 44
gcattatgaa gatcccatac tatgcatagg ttatagtttc ctttactatc g 51
<210> 45
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> DS299 primer
<400> 45
cgtagcggcc gcctgaaagg ggttgaccgt ccgtcggc 38
<210> 46
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> DS300 primer
<400> 46
cgtaaagctt cgccgcccga cagggtaaca tattatcac 39
<210> 47
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> DS301 primer
<400> 47
cgtaaagctt gaccacgtag taataataag tgcatggc 38
<210> 48
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> DS302 primer
<400> 48
cgtactgcag attggatagt gattagagtg tatagtcccg g 41
<210> 49
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS303 primer
<400> 49
ggagcgacaa acctttcg 18
<210> 50
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DS304 primer
<400> 50
accgtaataa aagatggctg 20
<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> DS305 primer
<400> 51
catcttgtgt gtgagtatgg tcgg 24
<210> 52
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS306 primer
<400> 52
cccaggataa ttttcagg 18
<210> 53
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> DS230 primer
<400> 53
tagcgaattc aatcagtaaa aatcaacgg 29
<210> 54
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> DS231 primer
<400> 54
gtcaaagctt caaaaaaaga aaagctccgg 30
<210> 55
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> DS232 primer
<400> 55
tagcggatcc gaattcggcg gttgtttgca agaccgag 38
<210> 56
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> DS233 primer
<400> 56
gtcaaagctt taaagataat gctaaatcat ttgg 34
<210> 57
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> DS234 primer
<400> 57
tgacaagctt tcggtcgaaa aaagaaaagg agagg 35
<210> 58
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> DS235 primer
<400> 58
tgacaagctt gatcttttat gcttgctttt c 31
<210> 59
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS236 primer
<400> 59
aatagttcag gcactccg 18
<210> 60
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> DS237 primer
<400> 60
tggaaggcaa gagagcc 17
<210> 61
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS238 primer
<400> 61
taaaatgtaa gctctcgg 18
<210> 62
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> DS239 primer
<400> 62
ccaaccaagt atttcgg 17
<210> 63
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CED005 primer
<400> 63
gagctgacag ggaaatggtc 20
<210> 64
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CED006 primer
<400> 64
tacgaggata cggagagagg 20
<210> 65
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> DS248 primer
<400> 65
gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggcta gtctcttttt 60
ccaatttgcc accgtgtagc attttgttgt 90
<210> 66
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> DS249 primer
<400> 66
gtcaggatcc tacgtacccg gggatatcat tatcatcttt gtcgtggtca tcttgtgtg 59
<210> 67
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> gtcaggatcc tacgtacccg ggtaaggcgt tcgtgcagtg tgacgaatat agcg
<400> 67
gtcaggatcc tacgtacccg ggtaaggcgt tcgtgcagtg tgacgaatat agcg 54
<210> 68
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<223> DS251 primer
<400> 68
gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggccc gtatggacat 60
acatatatat atatatatat atatatattt tgttacgcg 99
<210> 69
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> DS252 primer
<400> 69
gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggctt gttgcaagca 60
gcatgtctaa ttggtaattt taaagctgcc 90
<210> 70
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> DS267 primer
<400> 70
gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggccc gtatggacat 60
acatatatat atatatatat atatatatat attttgttac gcg 103
<210> 71
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> DS253 primer
<400> 71
cctccctgct gctcgcc 17
<210> 72
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS254 primer
<400> 72
ctgtaagaac atggctcc 18
<210> 73
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS255 primer
<400> 73
ctcgatcgat tacgaggg 18
<210> 74
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> DS256 primer
<400> 74
aagaaagccg atatcgc 17
<210> 75
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS257 primer
<400> 75
caactctctg aagaggcg 18
<210> 76
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> DS258 primer
<400> 76
caacgccaca tccgacg 17
<210> 77
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> DS259 primer
<400> 77
gtaattctga tcactttgg 19
<210> 78
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> DS260 primer
<400> 78
gcacttatta ttactacgtg g 21
<210> 79
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> DS261 primer
<400> 79
gttttccttg atgaagtcg 19
<210> 80
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS262 primer
<400> 80
gtgaccacac catggggc 18
<210> 81
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS263 primer
<400> 81
gttgccggcg tgtctgcc 18
<210> 82
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS264 primer
<400> 82
ttgaaatcat cgtctgcg 18
<210> 83
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> DS265 primer
<400> 83
cggcagttct aggtccc 17
<210> 84
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DS266 primer
<400> 84
ccacagcctc ttgttggg 18
<210> 85
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> M13/pUC primer (-40)
<400> 85
gttttcccag tcacgac 17
Claims (63)
- REP2 유전자 또는 FLP 유전자중 적어도 하나의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이에 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 포함하는 2㎛-패밀리 플라스미드.
- 제 1항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및/또는 REP2 유전자는 각각 자연 발생 2㎛-패밀리 플라스미드로부터 유래된 FLP 유전자 및/또는 REP2 유전자를 갖는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 1항에 있어서, 상기 자연 발생 2㎛-패밀리 플라스미드는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii))로부터 얻어지는 pSR1, pSB3 또는 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailii)로부터 모두 얻어지는 pSB1 또는 pSB2, 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)로부터 얻어지는 pSM1, 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)으로부터 얻어지는 pKD1, 피치아 멤브라나에파시엔스(Pichia membranaefaciens)로부터 얻어지는 pPM1 및 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드로부터 선택되는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 2항 또는 제 3항에 있어서, 상기 FLP 및/또는 REP2 유전자에 인접한 역위 반복의 서열은 상기 유전자가 유래되는 서열과 동일한 자연 발생 2㎛-패밀리 플라스미드내의 이에 상응하는 역위 반복의 서열로부터 유래되는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 2항 내지 제 4항 중 어느 한 항에 있어서, 상기 자연 발생 2㎛-패밀리 플라스미드는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드인 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 5항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 REP2 유전자의 코돈 59의 첫번째 염기와 인접 역위 반복내 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 5항 또는 제 6항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 REP2 유전자 및 인접 역위 반복의 서열은 SEQ ID NO:1 또는 이의 변이체로 정의되는 것임을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 REP2 암호 서열의 마직막이후의 첫번째 염기에서와 같이 REP2 암호 서열의 마지막이후의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, REP2 암호 서열이 후속하는 역위 반복는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래되는 서열을 가지며 그리고 바람직하게 상기 폴리 뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복내 XcmI 사이트 또는 FspI 사이트에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 5항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP 유전자의 코돈 344의 첫번째 염기와 인접 역위 반복내 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 5항 또는 제 11항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 암호 서열 및 인접 역위 반복의 서열은 SEQ ID NO:2 또는 이의 변이체로 정의되는 것임을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 11항 또는 제 12항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 13항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환 은 FLP 암호 서열의 마지막이후 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 14항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP 암호 서열의 마지막이후 첫번째 염기에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 11항 내지 제 15항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, FLP 유전자가 후속하는 역위 반복는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래되는 서열을 가지며 그리고 바람직하게 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복내 HgaI 사이트 또는 FspI 사이트에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 11항 내지 제 16항 중 어느 한 항에 있어서, REP2 유전자 및 FLP 유전자 모두의 마지막 작용 코돈이후 첫번째 염기와 상기 유전자 각각에 인접한 역위 반복내 FRT 사이트이전 마지막 염기사이에 폴리뉴클레오타이드 서열 삽입, 결실 및/또 는 치환을 포함하며, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 동일하거나 다를 수 있는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 11항 내지 제 17항 중 어느 한 항에 있어서, 제 11항 내지 제 17항 중 어느 한 항에 정의된 바와 같은 포지션이 아닌 포지션에서 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 더욱 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 18항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 ARS 서열주변의 비전사 리전내에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 1항 내지 제 19항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환 또는 적어도 하나의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 폴리뉴클레오타이드 서열 삽입인 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 20항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입은 오픈 리딩 프래임을 암호하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 21항에 있어서, 상기 오픈 리딩 프래임은 비-2㎛-패밀리 플라스미드 단백질을 암호하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 22항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 단백질 폴딩에 관련되는 단백질, 또는 샤프롱 활성을 갖거나 폴딩되지 않은 단백질 반응에 관련되는 단백질, 알부민, 모노클로날 항체, 에토포시드, 혈청 단백질(혈 응고 인자와 같은), 안티스타신, 진드기 항응고 펩타이드, 트랜스페린, 락토페린, 엔도스타틴, 안지로스타틴, 콜라겐, 면역글로블린 또는 면역글로블린-기초 분자 또는 이의 프레그먼트(예, dAb, Fab'프래그먼트, F(ab')2, scAb, scFv 또는 scFv 프레그먼트), Kunitz 도메인 단백질, 인터페론, 인터루킨, IL10, IL11, IL2, 인터페론 α 종 및 아종, 인터페론 β 종 및 아종, 인터페론 γ 종 및 아종, 렙틴, CNTF, CNTFAX15, IL1-수용체 안타고니스트, 에리트로포에틴(EPO) 및 EPO 모사물, 트롬보포에틴(TPO) 및 TPO 모사물, 프로샙타이드, 시아노비린-N, 5-헬릭스, T20 펩타이드, T1249 펩타 이드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA, 히루딘, 혈소판 유래 성장 인자, 파라티로이드 호르몬, 프로인슐린, 인슐린, 글루카곤, 글루카곤-유사 펩타이드, 인슐린-유사 성장 인자, 칼시토닌, 성장 호르몬, 형질변형 성장 인자 β, 종양 괴사 인자, G-CSF, GM-CSF, M-CSF, FGF, 프리 폼 및 활성 폼 모두를 포함하며 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈, 폰 빌레브란트 인자, α1-안티트립신, 플라스미노겐 활성제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII를 포함하는 응집 인자, 신경 성장 인자, LACI, 혈소판-유래 내피세포 성장 인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체 단백질, 인터-알파 트립신 억제제, 안티트롬빈 III, 아포-리포프로틴 종, 프로틴 C, 프로틴 S의 서열, 또는 상기 어느 것의 변이체나 프레그먼트를 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 알부민의 서열, 이의 변이체나 프레그먼트, 또는 어느 이러한 서열을 포함하는 융합 단백질을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 트랜스페린의 서열, 이의 변이체나 프레그먼트, 또는 어느 이러한 서열을 포함하는 융합 단백질을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 락토페린의 서열, 이의 변이체나 프레그먼트, 또는 어느 이러한 서열을 포함하는 융합 단백질을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 Fc의 서열, 이의 변이체나 프레그먼트, 또는 어느 이러한 서열을 포함하는 융합 단백질을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 AHA1 , CCT2 , CCT3, CCT4 , CCT5 , CCT6 , CCT7 , CCT8 , CNS1 , CPR3 , CPR6 , ER01 , EUG1 , HCH1 , HSP10, HSP12 , HSP104 , HSP26 , HSP30 , HSP42 , HSP60 , HSP78 , HSP82 , JEM1 , MDJ1 , MDJ2, MPD1 , MPD2 , PD11 , PFD1 , ABC1 , APJ1 , ATP11 , ATP12 , BTT1 , CDC37 , CNS1 , CPR6, CPR7 , HSC82 , KAR2 , LHS1 , MGE1 , MRS11 , NOB1 , ECM10 , SSA1 , SSA2 , SSA3 , SSA4, SSC1 , SSE2 , SIL1 , SLS1 , ORM1 , UBI4 , ORM2 , PER1 , PTC2 , PSE1 및 HAC1 또는 절단된 무인트론 HAC1 중 어느 하나에 의해 암호화되는, 단백질 폴딩에 관련되는 단백질, 또는 샤프롱 활성을 갖거나 폴딩되지 않은 단백질 반응에 관련되는 단백질의 서열을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 23항 또는 제 28항에 있어서, 상기 샤프롱은 단백질 디설피드 이소머라아제(PDI)이거나, 또는 ORM2, SSA1 또는 PSE1에 의해 암호화된 단백질인 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 22항 내지 제 29항 중 어느 한 항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 분미 리더 서열을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 22항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 박테리아 선별 마커 및/또는 이스트 선별 마커의 서열을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 31항에 있어서, 상기 박테리아 선별 마커는 β-락타마아제 유전자이며 그리고/또는 상기 이스트 선별 마커는 LEU2 선별 마커인 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- 제 1항 내지 제 32항 중 어느 한 항에 있어서, 플라스미드는 (i) 비-2㎛-패밀리 플라스미드 단백질을 암호하는 이종성 서열; (ii) 단백질 폴딩에 관련되는 단백질, 샤프롱 또는 폴딩되지 않은 단백질 반응에 관련되는 단백질, 바람직하게 단백질 디설피드 이소머라아제의 서열을 포함하는 단백질을 암호하는 이종성 서열; 및 (iii) 선별 마커의 서열을 포함하는 단백질을 암호하는 이종성 서열을 포함하며, 상기 이종성 서열의 적어도 하나는 제 1항 내지 제 16항 중 어느 한 항에 의해 정의된 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
- (a) REP2 유전자 및 상기 REP2 유전자에 후속하는 역위 반복, 또는 FLP 유전자 및 상기 FLP 유전자에 후속하는 역위 반복의 서열을 포함하며, 각각의 경우에 역위 반복는 FRT 사이트를 포함하는 플라스미드를 제공하는 단계;(b) 폴리뉴클레오타이드 서열을 제공하고 상기 폴리뉴클레오타이드 서열을 상기 플라스미드내로 제 1항 내지 제 16항 중 어느 한 항에 정의된 포지션에 삽입 하는 단계; 그리고/또는(c) 제 1항 내지 제 16항 중 어느 한 항에 정의된 포지션에서 상기 뉴클레오타이드 염기의 일부 또는 모두를 제거하는 단계; 그리고/또는(d) 제 1항 내지 제 16항 중 어느 한 항에 정의된 포지션에서 상기 뉴클레오타이드 염기의 일부 또는 모두를 택일적인 뉴클레오타이드 염기로 치환하는 단계를 포함하는 제 1항 내지 제 33항 중 어느 한 항에 의해 정의된 플라스미드 제조 방법.
- 제 34항의 방법에 의해 획득가능한 플라스미드.
- 제 33항 및 제 35항 중 어느 한 항에 의해 정의된 플라스미드를 포함하는 숙주 세포.
- 제 36항에 있어서, 상기 숙주 세포는 이스트 세포인 것을 특징으로 하는 숙주 세포.
- 제 36항 또는 제 37항에 있어서, 상기 플라스미드는 다중복제 플라스미드로서 안정한 것을 특징으로 하는 숙주 세포.
- 제 38항에 있어서, 상기 플라스미드는 pSR1, pSB3 또는 pSB4에 기초하고 상기 이스트 세포는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii))이거나, 상기 플라스미드는 pSB1 또는 pSB2에 기초하고 상기 이스트 세포는 지고사카로미세스 베일리(Zygosaccharomyces bailii)이거나, 상기 플라스미드는 pSM1에 기초하고 상기 이스트 세포는 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)이거나, 상기 플라스미드는 pKD1에 기초하고 상기 이스트 세포는 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)이거나, 상기 플라스미드는 pPM1에 기초하고 상기 이스트 세포는 피치아 멤브라나에파시엔스(Pichia membranaefaciens)이거나 또는 상기 플라스미드는 2㎛ 플라스미드에 기초하고 상기 이스트 세포는 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 또는 사카로미세스 칼스버제네시스(Saccharomyces. carlsbergenesis)인 것을 특징으로 하는 숙주 세포.
- 제 38항 또는 제 39항에 있어서, 상기 플라스미드가 선별 마커를 함유하거나 함유하도록 변형되는 경우, 안정성은 상기 마커의 소실에 의한 측정으로 적어도 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9% 또는 5세대후 실질적으로 100%인 것을 특징으로 하는 숙주 세포.
- (a) 제 1항 내지 제 33항 또는 제 35항 중 어느 한 항에 의해 정의된 플라스미드를 제공하는 단계;(b) 적절한 숙주 세포를 제공하는 단계;(c) 상기 숙주 세포를 상기 플라스미드로 형질변형시키는 단계; 및(d) 상기 형질변형된 숙주 세포를 배양 배지에서 배양하는 단계;(e) 이에 따라 단백질을 생성하는 단계를 포함하는 단백질 생성 방법.
- 제 1항 내지 제 33항 또는 제 35항 중 어느 한 항에 의해 정의된 플라스미드를 포함하는, 제 36항 내지 제 40항 중 어느 한 항에 의해 정의된 숙주 세포를 제공하는 단계 및 상기 숙주 세포를 배양 배지에서 배양하여 단백질을 생성하는 단계를 포함하는 단백질 생성 방법.
- 제 41항 또는 제 42항에 있어서, 배양된 숙주 세포 또는 배양 배지로부터 이 에 따라 생성된 단백질을 분리하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
- 제 43항에 있어서, 분리된 단백질을 상업적으로 허용가능한 수준의 순도로 정제하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
- 제 44항에 있어서, 정제된 단백질을 담체 또는 희석제와 배합하는 단계 및 임의로 이에 따라 배합된 단백질을 단위 형태로 제공하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
- 제 43항에 있어서, 분리된 단백질을 약학적으로 허용가능한 수준의 순도로 정제하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
- 제 44항에 있어서, 정제된 단백질을 약학적으로 허용가능한 담체 또는 희석제와 배합하는 단계 및 임의로 이에 따라 배합된 단백질을 단위 형태로 제공하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
- 단독 이스트 선별 마커로서, 필수 단백질을 암호하는 유전자 또는 유전자들이 숙주세포에서 제거 혹은 불활성화되는 경우 상기 숙주 세포는 배양시 생존불가능하고 그 결핍은 성장 배지에 첨가나 변형에 의해 보완될 수 없는 점에서 숙수 이스트 세포의 생존능에 필수적인 단백질을 암호하는 유전자를 포함하는 플라스미드.
- 제 48항에 있어서, 상기 필수적인 단백질을 암호하는 유전자는 플라스미드에 의해 암호화된 단독 선별 마커인 것을 특징으로 하는 플라스미드.
- 제 48항 또는 제 49항에 있어서, 상기 필수적인 단백질은 샤프롱(chaperone)인 것을 특징으로 하는 플라스미드.
- 제 51항에 있어서, 상기 샤프롱은 단백질 디설피드 이소머라아제 또는 Pse1p인 것을 특징으로 하는 플라스미드.
- 제 48항 내지 제 51항 중 어느 한 항에 있어서, 제 23항 내지 제 27항 중 어느 한 항에 의해 정의된 단백질과 같은 비-2㎛-패밀리 플라스미드 단백질을 암호하는 유전자를 더욱 포함하는 것을 특징으로 하는 플라스미드.
- 제 48항 내지 제 52항 중 어느 한 항에 있어서, 상기 플라스미드는 2㎛-패밀리 플라스미드인 것을 특징으로 하는 플라스미드.
- 제 53항에 있어서, 상기 플라스미드는 제 1항 내지 제 33항 중 어느 한 항에 의해 정의된 플라스미드인 것을 특징으로 하는 플라스미드.
- 숙주 세포의 생존능에 필수적인 단백질을 암호하는 유전자를 포함하는 플라스미드를 포함하며, 상기 플라스미드의 부재하에서, 상기 숙주 세포는 상기 필수적인 단백질을 생성할 수 없고 성장 배지에 첨가나 변형에 의해 생존가능하도록 될 수 없는 숙주 세포.
- 제 55항에 있어서, 상기 플라스미드는 제 1항 내지 제 33항 또는 제 48항 내 지 제 54항 중 어느 한 항에 따른 플라스미드인 것을 특징으로 하는 숙주 세포.
- 제 55항 또는 제 56항에 있어서, 상기 플라스미드의 부재하에서 상기 숙주 세포는 생존가능한 것을 특징으로 하는 숙주 세포.
- 제 55항 내지 제 57항 중 어느 한 항에 있어서, 상기 숙주 세포는 제 23항 내지 제 27항 중 어느 한 항에 의해 정의된 단백질과 같은 원하는 단백질을 암호하는 재조합 유전자를 더욱 포함하는 것을 특징으로 하는 숙주 세포.
- 제 58항에 있어서, 상기 원하는 단백질은 제 23항 내지 제 27항 중 어느 한 항에 의해 정의된 비-2㎛-패밀리 플라스미드인 것을 특징으로 하는 숙주 세포.
- 제 59항에 있어서, 상기 필수적인 단백질은 단백질 디설피드 이소머라아제 또는 PSE1과 같은 샤프롱인 것을 특징으로 하는 숙주 세포.
- 제 59항 또는 제 60항에 있어서, 상기 재조합 유전자는 상기 필수적인 단백질을 암호하는 유전자와 동일한 플라스미드상에 위치하는 것을 특징으로 하는 숙주 세포.
- 제 59항 내지 제61항 중 어느 한 항에 의해 정의된 숙주 세포를 제공하는 단계;필수 단백질 및 원하는(desired) 단백질의 발현이 이루어지는 조건하에 배양 배지에서 상기 숙주 세포를 배양하는 단계; 및임의로 배양된 숙주 세포 또는 배양 배지로부터 이에 따라 발현된 원하는 단백질을 분리하는 단계; 및임의로 이에 따라 분리된 원하는 단백질을 상업적으로 허용가능한 수준의 순도로 정제하는 단계; 및추가적인 임의로 이에 따라 정제된 단백질을 동결건조하거나 정제된 원하는 단백질을 담체 또는 희석제(약학적으로 허용가능한 담체 또는 희석제)와 배합하는 단계; 및임의로 이에 따라 배합된 원하는 단백질을 단위 형태로 제공하는 단계를 포함하는 원하는 재조합 단백질을 생성하는 방법.
- 제 62항에 있어서, 상기 숙주 세포를 배양하는 단계는 복합 배지 또는 완전 배지와 같은 비-선별 배지에서 상기 숙주 세포를 배양하는 것을 포함하는 것을 특징으로 하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB0329722.3A GB0329722D0 (en) | 2003-12-23 | 2003-12-23 | Modified plasmid and use thereof |
GB0329722.3 | 2003-12-23 | ||
PCT/GB2004/005435 WO2005061719A1 (en) | 2003-12-23 | 2004-12-23 | 2-micron family plasmid and use thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070004585A true KR20070004585A (ko) | 2007-01-09 |
KR101298157B1 KR101298157B1 (ko) | 2013-08-21 |
Family
ID=30776295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067014724A KR101298157B1 (ko) | 2003-12-23 | 2004-12-23 | 2-미크론 패밀리 플라스미드 및 이의 용도 |
Country Status (14)
Country | Link |
---|---|
US (1) | US8252551B2 (ko) |
EP (1) | EP1711602B1 (ko) |
JP (1) | JP4964596B2 (ko) |
KR (1) | KR101298157B1 (ko) |
CN (2) | CN1922326B (ko) |
AT (1) | ATE483812T1 (ko) |
AU (1) | AU2004303597C1 (ko) |
CA (1) | CA2551496C (ko) |
DE (1) | DE602004029503D1 (ko) |
DK (1) | DK1711602T3 (ko) |
GB (2) | GB0329722D0 (ko) |
NZ (1) | NZ548154A (ko) |
WO (1) | WO2005061719A1 (ko) |
ZA (1) | ZA200605589B (ko) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005516607A (ja) * | 2002-02-07 | 2005-06-09 | デルタ バイオテクノロジー リミテッド | Hiv阻害タンパク質 |
GB0329722D0 (en) | 2003-12-23 | 2004-01-28 | Delta Biotechnology Ltd | Modified plasmid and use thereof |
US9057061B2 (en) | 2003-12-23 | 2015-06-16 | Novozymes Biopharma Dk A/S | Gene expression technique |
US20080044853A1 (en) * | 2004-06-21 | 2008-02-21 | Novozymes A/S | Stably Maintained Multiple Copies of at Least Two Orf in the Same Orientation |
GB0512707D0 (en) * | 2005-06-22 | 2005-07-27 | Delta Biotechnology Ltd | Gene expression technique |
CA2695830A1 (en) | 2007-08-08 | 2009-02-12 | Novozymes Biopharma Dk A/S | Transferrin variants and conjugates |
JP2012516878A (ja) | 2009-02-06 | 2012-07-26 | ノボザイムス バイオファーマ デーコー アクティーゼルスカブ | 精製プロセス |
EP3243835B1 (en) | 2009-02-11 | 2024-04-10 | Albumedix Ltd | Albumin variants and conjugates |
CA2776241A1 (en) | 2009-10-30 | 2011-05-05 | Novozymes Biopharma Dk A/S | Albumin variants |
WO2011124718A1 (en) | 2010-04-09 | 2011-10-13 | Novozymes A/S | Albumin derivatives and variants |
CN101974547B (zh) * | 2010-07-30 | 2012-06-27 | 天津大学 | 含FLP的pBBR1MCS-2重组质粒及运动发酵单胞菌基因组DNA修饰的方法 |
KR20130105649A (ko) | 2010-09-07 | 2013-09-25 | 부타맥스 어드밴스드 바이오퓨얼스 엘엘씨 | 피루베이트로부터 아세토락테이트로의 전환을 촉매작용시키는 폴리펩티드를 암호화하는 폴리뉴클레오티드의 통합 |
CA2811596A1 (en) * | 2010-09-30 | 2012-04-05 | Codexis, Inc. | Use of an endogenous 2-micron yeast plasmid for gene over expression |
KR20140092759A (ko) | 2011-03-24 | 2014-07-24 | 부타맥스 어드밴스드 바이오퓨얼스 엘엘씨 | 숙주 세포 및 아이소부탄올의 제조 방법 |
EP2780364A2 (en) | 2011-11-18 | 2014-09-24 | Eleven Biotherapeutics, Inc. | Proteins with improved half-life and other properties |
WO2013102147A2 (en) | 2011-12-30 | 2013-07-04 | Butamax (Tm) Advanced Biofuels Llc | Genetic switches for butanol production |
EP2808388B1 (en) * | 2012-01-23 | 2019-03-13 | AGC Inc. | Expression vector and method for producing protein |
US9944691B2 (en) | 2012-03-16 | 2018-04-17 | Albumedix A/S | Albumin variants |
WO2013177063A1 (en) * | 2012-05-21 | 2013-11-28 | University Of Southern California | Uses of protein precursors as prodrugs |
US20140128326A1 (en) | 2012-11-08 | 2014-05-08 | Novozymes Biopharma Dk A/S | Albumin variants |
CN103898142B (zh) * | 2014-03-04 | 2016-03-02 | 北京理工大学 | 一种硫醇过氧化物酶提高毕赤酵母外源蛋白质表达量的方法 |
CN105087520B (zh) * | 2014-05-21 | 2018-07-20 | 中国科学院上海生命科学研究院 | 一种促进重组极端耐热α-淀粉酶可溶性表达的方法 |
CN104946659A (zh) * | 2015-03-27 | 2015-09-30 | 杭州北斗生物技术有限公司 | 重组人生长激素的制备方法及其peg化修饰物的制备方法 |
BR112018003179A2 (pt) | 2015-08-20 | 2018-09-25 | Albumedix As | conjugados e variantes de albumina |
CA3005953A1 (en) * | 2015-12-22 | 2017-06-29 | Albumedix Ltd | Improved protein expression strains |
CN109153985B (zh) * | 2016-01-12 | 2022-02-22 | Agc株式会社 | 转化体、以及转铁蛋白的制造方法 |
CN107367619A (zh) * | 2017-08-30 | 2017-11-21 | 福建师范大学 | Tcp1蛋白在制备乳腺癌术后预后评估试剂盒中的应用、乳腺癌预后评估试剂盒及方法 |
DK3775222T5 (da) | 2018-03-26 | 2024-08-19 | Novozymes As | Chaperoneproteiner fra svampe |
CN110184292B (zh) * | 2019-06-17 | 2023-01-20 | 湖北大学 | 一种利用分子伴侣提高酵母细胞表面展示功能性Infliximab Fab片段的方法 |
CN112680371A (zh) * | 2019-10-18 | 2021-04-20 | 广东利世康低碳科技有限公司 | 一种水解餐厨垃圾中蛋白成分的产朊假丝酵母双基因共表达菌株及其构建方法 |
CN110592090A (zh) * | 2019-10-30 | 2019-12-20 | 福建师范大学 | Ssa4基因启动子及利用该启动子驱动外源基因转录的毕赤酵母表达载体 |
US11739166B2 (en) | 2020-07-02 | 2023-08-29 | Davol Inc. | Reactive polysaccharide-based hemostatic agent |
CN112501141A (zh) * | 2020-10-22 | 2021-03-16 | 重庆中元汇吉生物技术有限公司 | 一种增加人甲状腺过氧化物酶产量的试剂和表达方法 |
CN114410496B (zh) * | 2022-02-16 | 2023-10-03 | 江南大学 | 一种提高毕赤酵母外源蛋白产量的方法 |
CN114957488A (zh) * | 2022-05-19 | 2022-08-30 | 中国科学院生物物理研究所 | 芳香烃受体蛋白稳定高效表达的方法及其应用 |
GB202301988D0 (en) | 2023-02-13 | 2023-03-29 | Phenotypeca Ltd | Breeding process |
GB202301983D0 (en) | 2023-02-13 | 2023-03-29 | Phenotypeca Ltd | Engineered eukaryotic cell |
GB202301984D0 (en) | 2023-02-13 | 2023-03-29 | Phenotypeca Ltd | Engineered eukaryotic cell |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9019919D0 (en) | 1990-09-12 | 1990-10-24 | Delta Biotechnology Ltd | Purification of proteins |
US4302386A (en) | 1978-08-25 | 1981-11-24 | The Ohio State University | Antigenic modification of polypeptides |
NZ199722A (en) | 1981-02-25 | 1985-12-13 | Genentech Inc | Dna transfer vector for expression of exogenous polypeptide in yeast;transformed yeast strain |
IL66614A (en) | 1981-08-28 | 1985-09-29 | Genentech Inc | Method of constructing a dna sequence encoding a polypeptide,microbial production of human serum albumin,and pharmaceutical compositions comprising it |
GB8615701D0 (en) | 1986-06-27 | 1986-08-06 | Delta Biotechnology Ltd | Stable gene integration vector |
GB8620926D0 (en) | 1986-08-29 | 1986-10-08 | Delta Biotechnology Ltd | Yeast promoter |
DE3888381T2 (de) | 1987-04-09 | 1994-07-28 | Delta Biotechnology Ltd | Hefevektor. |
IL86455A0 (en) | 1987-06-01 | 1988-11-15 | Takeda Chemical Industries Ltd | Polypeptide and production thereof |
IL88326A (en) | 1987-11-18 | 1993-03-15 | Gist Brocades Nv | Purification of serum albumin |
AU626288B2 (en) | 1988-02-05 | 1992-07-30 | Commonwealth Scientific And Industrial Research Organisation | Gene expression system (particularly for rotavirus vp7 protein) involving a foreign signal peptide and optionally a transmembrane anchor sequence |
WO1990001063A1 (en) | 1988-07-23 | 1990-02-08 | Delta Biotechnology Limited | New secretory leader sequences |
US5759802A (en) | 1988-10-26 | 1998-06-02 | Tonen Corporation | Production of human serum alubumin A |
GB8909916D0 (en) | 1989-04-29 | 1989-06-14 | Delta Biotechnology Ltd | Polypeptides |
US5571691A (en) | 1989-05-05 | 1996-11-05 | Baylor College Of Medicine | Production of recombinant lactoferrin and lactoferrin polypeptides using CDNA sequences in various organisms |
GB8927480D0 (en) | 1989-12-05 | 1990-02-07 | Delta Biotechnology Ltd | Mutant fungal strain detection and new promoter |
JP3230091B2 (ja) | 1990-06-25 | 2001-11-19 | ウェルファイド株式会社 | ヒト血清アルブミンの着色抑制方法 |
ES2080957T3 (es) | 1990-07-13 | 1996-02-16 | Transkaryotic Therapies Inc | Metodo para escrutar una genoteca. |
GB2249096A (en) * | 1990-10-11 | 1992-04-29 | Ciba Geigy | Saccharomyces cerevisiae strains lacking carboxypeptidase yscY activity for expression of proteins at high yields |
JPH07502723A (ja) * | 1991-02-08 | 1995-03-23 | ザ・ユニバーシテイ・オブ・バーモント・アンド・ステイト・アグリカルチユラル・カレツジ | 組み替えトランスフェリン、トランスフェリン半−分子、及びそれらの突然変異体 |
SG84484A1 (en) | 1991-02-25 | 2001-11-20 | Ciba Geigy Ag | Improved yeast vectors |
EP0509841A3 (en) | 1991-04-18 | 1993-08-18 | Tonen Corporation | Co-expression system of protein disulfide isomerase gene and useful polypeptide gene and process for producing the polypeptide using its system |
ZA932568B (en) * | 1992-04-24 | 1993-11-12 | Baylor College Midecine A Non | Production of recombinant human lactoferrin |
US6291205B1 (en) * | 1992-06-12 | 2001-09-18 | Merck & Co., Inc. | Method of increasing production of disulfide bonded recombinant proteins by saccharomyces cerevisiae |
AU4571993A (en) | 1992-07-29 | 1994-03-03 | Unilever Plc | Process for producing anti-freeze peptides |
DE4226971C2 (de) | 1992-08-14 | 1997-01-16 | Widmar Prof Dr Tanner | Modifizierte Pilzzellen und Verfahren zur Herstellung rekombinanter Produkte |
US5728553A (en) | 1992-09-23 | 1998-03-17 | Delta Biotechnology Limited | High purity albumin and method of producing |
WO1994008012A1 (en) | 1992-10-02 | 1994-04-14 | Research Corporation Technologies, Inc. | Methods for increasing secretion of overexpressed proteins |
GB9404270D0 (en) | 1994-03-05 | 1994-04-20 | Delta Biotechnology Ltd | Yeast strains and modified albumins |
GB9411356D0 (en) | 1994-06-07 | 1994-07-27 | Delta Biotechnology Ltd | Yeast strains |
JP3945866B2 (ja) * | 1996-09-04 | 2007-07-18 | サントリー株式会社 | メタノール酵母由来のプロテインジスルフィドイソメラーゼ遺伝子 |
GB9703406D0 (en) * | 1997-02-19 | 1997-04-09 | Chiron Spa | Expression of heterologous proteins |
WO1998056928A1 (en) | 1997-06-13 | 1998-12-17 | Stichting Instituut Voor Dierhouderij En Diergezondheid | Increased production of proteins by using chaperone-like proteins |
GB9713412D0 (en) | 1997-06-26 | 1997-08-27 | Delta Biotechnology Ltd | Improved protein expression strains |
HUP0003541A3 (en) | 1997-09-05 | 2003-08-28 | Pentapharm Ag | Expression vector for improved production of polypeptides in yeast |
IT1306207B1 (it) | 1999-01-15 | 2001-05-30 | Biopolo S C A R L | Produzione di proteine eterologhe da zygosaccharomyces bailii. |
GB9902000D0 (en) * | 1999-01-30 | 1999-03-17 | Delta Biotechnology Ltd | Process |
US6926898B2 (en) | 2000-04-12 | 2005-08-09 | Human Genome Sciences, Inc. | Albumin fusion proteins |
US20030226155A1 (en) | 2001-08-30 | 2003-12-04 | Biorexis Pharmaceutical Corporation | Modified transferrin-antibody fusion proteins |
US7176278B2 (en) | 2001-08-30 | 2007-02-13 | Biorexis Technology, Inc. | Modified transferrin fusion proteins |
JP2005516607A (ja) | 2002-02-07 | 2005-06-09 | デルタ バイオテクノロジー リミテッド | Hiv阻害タンパク質 |
AU2003271043A1 (en) | 2002-08-07 | 2004-02-25 | Novozymes Biopharma Dk A/S | Albumin-fused ciliary neurotrophic factor |
DE10252245A1 (de) | 2002-11-07 | 2004-05-27 | Prof. Dr. Danilo Porro Università degli Studi di Milano-Bicocca Dipartimento die Biotechnologie e Bioscienze | Verfahren zur Expression und Sekretion von Proteinen mittels der nicht-konventionellen Hefe Zygosaccharomyces bailii |
US6939676B2 (en) | 2002-12-30 | 2005-09-06 | The United States Of America As Represented By The Secretary Of Argriculture | Selection procedure for identifying transgenic cells, embryos, and plants without the use of antibiotics |
GB0305989D0 (en) | 2003-03-15 | 2003-04-23 | Delta Biotechnology Ltd | Agent |
US9057061B2 (en) | 2003-12-23 | 2015-06-16 | Novozymes Biopharma Dk A/S | Gene expression technique |
GB0329681D0 (en) | 2003-12-23 | 2004-01-28 | Delta Biotechnology Ltd | Gene expression technique |
GB0329722D0 (en) | 2003-12-23 | 2004-01-28 | Delta Biotechnology Ltd | Modified plasmid and use thereof |
GB0402660D0 (en) | 2004-02-06 | 2004-03-10 | Medical Res Council | Heterologous protein expression |
EP1748071A4 (en) | 2004-05-21 | 2009-01-07 | Takara Bio Inc | PROCESS FOR PRODUCTION OF POLYPEPTIDE |
-
2003
- 2003-12-23 GB GBGB0329722.3A patent/GB0329722D0/en not_active Ceased
-
2004
- 2004-12-23 JP JP2006546328A patent/JP4964596B2/ja not_active Expired - Fee Related
- 2004-12-23 DE DE602004029503T patent/DE602004029503D1/de active Active
- 2004-12-23 AT AT04806229T patent/ATE483812T1/de active
- 2004-12-23 ZA ZA200605589A patent/ZA200605589B/xx unknown
- 2004-12-23 US US10/584,486 patent/US8252551B2/en not_active Expired - Fee Related
- 2004-12-23 CN CN2004800420229A patent/CN1922326B/zh not_active Expired - Fee Related
- 2004-12-23 GB GB0614610A patent/GB2424888B/en not_active Expired - Fee Related
- 2004-12-23 AU AU2004303597A patent/AU2004303597C1/en not_active Ceased
- 2004-12-23 WO PCT/GB2004/005435 patent/WO2005061719A1/en active Application Filing
- 2004-12-23 EP EP04806229A patent/EP1711602B1/en not_active Not-in-force
- 2004-12-23 CA CA2551496A patent/CA2551496C/en not_active Expired - Fee Related
- 2004-12-23 NZ NZ548154A patent/NZ548154A/en not_active IP Right Cessation
- 2004-12-23 DK DK04806229.3T patent/DK1711602T3/da active
- 2004-12-23 KR KR1020067014724A patent/KR101298157B1/ko not_active IP Right Cessation
-
2005
- 2005-12-23 CN CN200580048615.0A patent/CN101128587B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CA2551496A1 (en) | 2005-07-07 |
CN101128587B (zh) | 2014-02-12 |
CN101128587A (zh) | 2008-02-20 |
GB0614610D0 (en) | 2006-08-30 |
NZ548154A (en) | 2009-05-31 |
DE602004029503D1 (de) | 2010-11-18 |
CN1922326A (zh) | 2007-02-28 |
CN1922326B (zh) | 2011-02-09 |
JP4964596B2 (ja) | 2012-07-04 |
KR101298157B1 (ko) | 2013-08-21 |
US20080261861A1 (en) | 2008-10-23 |
AU2004303597A1 (en) | 2005-07-07 |
ATE483812T1 (de) | 2010-10-15 |
GB0329722D0 (en) | 2004-01-28 |
AU2004303597B2 (en) | 2008-09-25 |
ZA200605589B (en) | 2007-12-27 |
DK1711602T3 (da) | 2011-01-31 |
AU2004303597C1 (en) | 2009-05-14 |
EP1711602B1 (en) | 2010-10-06 |
CA2551496C (en) | 2014-12-09 |
GB2424888B (en) | 2008-03-26 |
US8252551B2 (en) | 2012-08-28 |
GB2424888A (en) | 2006-10-11 |
JP2007515961A (ja) | 2007-06-21 |
EP1711602A1 (en) | 2006-10-18 |
WO2005061719A1 (en) | 2005-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101298157B1 (ko) | 2-미크론 패밀리 플라스미드 및 이의 용도 | |
KR101262682B1 (ko) | 유전자 발현 기술 | |
JP5631533B2 (ja) | 遺伝子発現技術 | |
JP5781986B2 (ja) | 遺伝子発現技術 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
AMND | Amendment | ||
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
E90F | Notification of reason for final refusal | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160720 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170719 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |