KR20130094830A - 재조합 단백질의 높은 레벨의 발현을 위한 발현 벡터 - Google Patents
재조합 단백질의 높은 레벨의 발현을 위한 발현 벡터 Download PDFInfo
- Publication number
- KR20130094830A KR20130094830A KR1020137011512A KR20137011512A KR20130094830A KR 20130094830 A KR20130094830 A KR 20130094830A KR 1020137011512 A KR1020137011512 A KR 1020137011512A KR 20137011512 A KR20137011512 A KR 20137011512A KR 20130094830 A KR20130094830 A KR 20130094830A
- Authority
- KR
- South Korea
- Prior art keywords
- vector
- expression
- expression vector
- gene
- pzrc
- Prior art date
Links
- 239000013604 expression vector Substances 0.000 title claims abstract description 70
- 230000014509 gene expression Effects 0.000 title claims description 126
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title description 10
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title description 10
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 203
- 239000013598 vector Substances 0.000 claims abstract description 165
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 35
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 24
- 230000003115 biocidal effect Effects 0.000 claims abstract description 23
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims abstract description 15
- 210000004027 cell Anatomy 0.000 claims description 83
- 238000001890 transfection Methods 0.000 claims description 47
- 238000000034 method Methods 0.000 claims description 39
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 claims description 37
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 claims description 28
- 239000012634 fragment Substances 0.000 claims description 25
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 claims description 23
- 229930027917 kanamycin Natural products 0.000 claims description 22
- 229960000318 kanamycin Drugs 0.000 claims description 22
- 229930182823 kanamycin A Natural products 0.000 claims description 22
- 238000013519 translation Methods 0.000 claims description 21
- 230000002708 enhancing effect Effects 0.000 claims description 18
- 229950010131 puromycin Drugs 0.000 claims description 18
- -1 Darbepoietin Proteins 0.000 claims description 12
- 210000003483 chromatin Anatomy 0.000 claims description 11
- 108010077544 Chromatin Proteins 0.000 claims description 10
- 108091092195 Intron Proteins 0.000 claims description 10
- 229960004927 neomycin Drugs 0.000 claims description 10
- 229930193140 Neomycin Natural products 0.000 claims description 9
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims description 8
- 210000003705 ribosome Anatomy 0.000 claims description 8
- 108090000394 Erythropoietin Proteins 0.000 claims description 7
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 claims description 7
- 102000003951 Erythropoietin Human genes 0.000 claims description 6
- 102100039737 Eukaryotic translation initiation factor 4 gamma 2 Human genes 0.000 claims description 6
- 101001034811 Homo sapiens Eukaryotic translation initiation factor 4 gamma 2 Proteins 0.000 claims description 6
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 claims description 6
- 241000700605 Viruses Species 0.000 claims description 6
- 229940105423 erythropoietin Drugs 0.000 claims description 6
- 229940088597 hormone Drugs 0.000 claims description 6
- 239000005556 hormone Substances 0.000 claims description 6
- 230000008488 polyadenylation Effects 0.000 claims description 6
- 102100021519 Hemoglobin subunit beta Human genes 0.000 claims description 5
- 108091005904 Hemoglobin subunit beta Proteins 0.000 claims description 5
- 108010051181 TNK-tissue plasminogen activator Proteins 0.000 claims description 5
- 108091023040 Transcription factor Proteins 0.000 claims description 5
- 102000040945 Transcription factor Human genes 0.000 claims description 5
- 229960002964 adalimumab Drugs 0.000 claims description 5
- 229960000575 trastuzumab Drugs 0.000 claims description 5
- 241000701161 unidentified adenovirus Species 0.000 claims description 5
- 102000011022 Chorionic Gonadotropin Human genes 0.000 claims description 4
- 108010062540 Chorionic Gonadotropin Proteins 0.000 claims description 4
- 102100026735 Coagulation factor VIII Human genes 0.000 claims description 4
- 108010011459 Exenatide Proteins 0.000 claims description 4
- 102000006771 Gonadotropins Human genes 0.000 claims description 4
- 108010086677 Gonadotropins Proteins 0.000 claims description 4
- 102100039619 Granulocyte colony-stimulating factor Human genes 0.000 claims description 4
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 claims description 4
- 101000746367 Homo sapiens Granulocyte colony-stimulating factor Proteins 0.000 claims description 4
- 108090001061 Insulin Proteins 0.000 claims description 4
- 102000004877 Insulin Human genes 0.000 claims description 4
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 claims description 4
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 claims description 4
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 claims description 4
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 claims description 4
- 102000014150 Interferons Human genes 0.000 claims description 4
- 108010050904 Interferons Proteins 0.000 claims description 4
- 102000015696 Interleukins Human genes 0.000 claims description 4
- 108010063738 Interleukins Proteins 0.000 claims description 4
- 101001032761 Rattus norvegicus Granzyme-like protein 2 Proteins 0.000 claims description 4
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 claims description 4
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 claims description 4
- 108060008682 Tumor Necrosis Factor Proteins 0.000 claims description 4
- 229960000397 bevacizumab Drugs 0.000 claims description 4
- 108010006025 bovine growth hormone Proteins 0.000 claims description 4
- JUFFVKRROAPVBI-PVOYSMBESA-N chembl1210015 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N[C@H]1[C@@H]([C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO[C@]3(O[C@@H](C[C@H](O)[C@H](O)CO)[C@H](NC(C)=O)[C@@H](O)C3)C(O)=O)O2)O)[C@@H](CO)O1)NC(C)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 JUFFVKRROAPVBI-PVOYSMBESA-N 0.000 claims description 4
- 229960001519 exenatide Drugs 0.000 claims description 4
- 108010015174 exendin 3 Proteins 0.000 claims description 4
- LMHMJYMCGJNXRS-IOPUOMRJSA-N exendin-3 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@H](C)O)[C@H](C)O)C(C)C)C1=CC=CC=C1 LMHMJYMCGJNXRS-IOPUOMRJSA-N 0.000 claims description 4
- 239000002622 gonadotropin Substances 0.000 claims description 4
- 229940125396 insulin Drugs 0.000 claims description 4
- 229940079322 interferon Drugs 0.000 claims description 4
- 229960004641 rituximab Drugs 0.000 claims description 4
- 229960000187 tissue plasminogen activator Drugs 0.000 claims description 4
- 102000003390 tumor necrosis factor Human genes 0.000 claims description 4
- 101000719121 Arabidopsis thaliana Protein MEI2-like 1 Proteins 0.000 claims description 3
- 108700031361 Brachyury Proteins 0.000 claims description 3
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 claims description 3
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 claims description 3
- 108700041152 Endoplasmic Reticulum Chaperone BiP Proteins 0.000 claims description 3
- 102100021451 Endoplasmic reticulum chaperone BiP Human genes 0.000 claims description 3
- 102000012858 Eukaryotic Initiation Factor-4G Human genes 0.000 claims description 3
- 108010057192 Eukaryotic Initiation Factor-4G Proteins 0.000 claims description 3
- 108010027992 HSP70 Heat-Shock Proteins Proteins 0.000 claims description 3
- 102000018932 HSP70 Heat-Shock Proteins Human genes 0.000 claims description 3
- 102000009331 Homeodomain Proteins Human genes 0.000 claims description 3
- 108010048671 Homeodomain Proteins Proteins 0.000 claims description 3
- 101000857677 Homo sapiens Runt-related transcription factor 1 Proteins 0.000 claims description 3
- 102000009151 Luteinizing Hormone Human genes 0.000 claims description 3
- 108010073521 Luteinizing Hormone Proteins 0.000 claims description 3
- 208000009525 Myocarditis Diseases 0.000 claims description 3
- 108700020796 Oncogene Proteins 0.000 claims description 3
- 102000052812 Ornithine decarboxylases Human genes 0.000 claims description 3
- 108700005126 Ornithine decarboxylases Proteins 0.000 claims description 3
- 102000005877 Peptide Initiation Factors Human genes 0.000 claims description 3
- 108010044843 Peptide Initiation Factors Proteins 0.000 claims description 3
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 claims description 3
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 claims description 3
- 102000001253 Protein Kinase Human genes 0.000 claims description 3
- 101001032756 Rattus norvegicus Granzyme-like protein 1 Proteins 0.000 claims description 3
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 3
- 101001001642 Xenopus laevis Serine/threonine-protein kinase pim-3 Proteins 0.000 claims description 3
- 108091008324 binding proteins Proteins 0.000 claims description 3
- 230000002490 cerebral effect Effects 0.000 claims description 3
- 229940040129 luteinizing hormone Drugs 0.000 claims description 3
- 108060006633 protein kinase Proteins 0.000 claims description 3
- FAWLNURBQMTKEB-URDPEVQOSA-N 213546-53-3 Chemical compound N([C@@H](C)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N1[C@@H](CCC1)C(O)=O)C(C)C)C(C)C)C(=O)[C@@H]1CCCN1C(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)N)C(C)C FAWLNURBQMTKEB-URDPEVQOSA-N 0.000 claims description 2
- 102000007469 Actins Human genes 0.000 claims description 2
- 108010085238 Actins Proteins 0.000 claims description 2
- 102000010970 Connexin Human genes 0.000 claims description 2
- 108050001175 Connexin Proteins 0.000 claims description 2
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 claims description 2
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 claims description 2
- 102000003864 Human Follicle Stimulating Hormone Human genes 0.000 claims description 2
- 108010082302 Human Follicle Stimulating Hormone Proteins 0.000 claims description 2
- 229940028334 follicle stimulating hormone Drugs 0.000 claims description 2
- 229940084986 human chorionic gonadotropin Drugs 0.000 claims description 2
- 239000003550 marker Substances 0.000 claims description 2
- 230000017128 negative regulation of NF-kappaB transcription factor activity Effects 0.000 claims description 2
- 230000003612 virological effect Effects 0.000 claims description 2
- 239000002773 nucleotide Substances 0.000 claims 5
- 125000003729 nucleotide group Chemical group 0.000 claims 5
- 102000043276 Oncogene Human genes 0.000 claims 1
- 102000023732 binding proteins Human genes 0.000 claims 1
- 229940015047 chorionic gonadotropin Drugs 0.000 claims 1
- 210000003470 mitochondria Anatomy 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 abstract description 22
- 108020004414 DNA Proteins 0.000 description 63
- 239000002609 medium Substances 0.000 description 54
- 239000013612 plasmid Substances 0.000 description 47
- 239000000047 product Substances 0.000 description 47
- 238000002965 ELISA Methods 0.000 description 32
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 30
- 230000001105 regulatory effect Effects 0.000 description 28
- 230000015572 biosynthetic process Effects 0.000 description 22
- 241000588724 Escherichia coli Species 0.000 description 18
- 108010008165 Etanercept Proteins 0.000 description 18
- 102000035824 beta Subunit Follicle Stimulating Hormone Human genes 0.000 description 18
- 108010081485 beta Subunit Follicle Stimulating Hormone Proteins 0.000 description 18
- 230000029087 digestion Effects 0.000 description 18
- 108091008146 restriction endonucleases Proteins 0.000 description 18
- 230000010354 integration Effects 0.000 description 17
- 238000013518 transcription Methods 0.000 description 17
- 230000035897 transcription Effects 0.000 description 17
- 102000004190 Enzymes Human genes 0.000 description 16
- 108090000790 Enzymes Proteins 0.000 description 16
- 229940088598 enzyme Drugs 0.000 description 16
- 239000006228 supernatant Substances 0.000 description 16
- 241000287828 Gallus gallus Species 0.000 description 15
- 108010014251 Muramidase Proteins 0.000 description 15
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 15
- 102000002287 alpha Subunit Glycoprotein Hormones Human genes 0.000 description 15
- 108010000732 alpha Subunit Glycoprotein Hormones Proteins 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 15
- 230000001225 therapeutic effect Effects 0.000 description 15
- 102000016943 Muramidase Human genes 0.000 description 14
- 229960000274 lysozyme Drugs 0.000 description 14
- 235000010335 lysozyme Nutrition 0.000 description 14
- 239000004325 lysozyme Substances 0.000 description 14
- 230000001965 increasing effect Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 229960000403 etanercept Drugs 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 238000010367 cloning Methods 0.000 description 10
- 239000003623 enhancer Substances 0.000 description 10
- 239000013599 cloning vector Substances 0.000 description 9
- 238000010790 dilution Methods 0.000 description 8
- 239000012895 dilution Substances 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 6
- 238000012408 PCR amplification Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 239000003155 DNA primer Substances 0.000 description 5
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 5
- 108020001096 dihydrofolate reductase Proteins 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 108020005065 3' Flanking Region Proteins 0.000 description 4
- 108020005029 5' Flanking Region Proteins 0.000 description 4
- 230000004544 DNA amplification Effects 0.000 description 4
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 4
- 108010039185 Tenecteplase Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 239000012737 fresh medium Substances 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000007067 DNA methylation Effects 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 102000005936 beta-Galactosidase Human genes 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 3
- 108010004073 cysteinylcysteine Proteins 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 102000005396 glutamine synthetase Human genes 0.000 description 3
- 108020002326 glutamine synthetase Proteins 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 229960000485 methotrexate Drugs 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 230000002195 synergetic effect Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 229940113038 tnkase Drugs 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- 101710095342 Apolipoprotein B Proteins 0.000 description 2
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 2
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- XELISBQUZZAPQK-CIUDSAMLSA-N Cys-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N XELISBQUZZAPQK-CIUDSAMLSA-N 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 2
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 2
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 2
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- WTPKKLMBNBCCNL-ACZMJKKPSA-N Ser-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N WTPKKLMBNBCCNL-ACZMJKKPSA-N 0.000 description 2
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 2
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- NRUPKQSXTJNQGD-XGEHTFHBSA-N Thr-Cys-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NRUPKQSXTJNQGD-XGEHTFHBSA-N 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 2
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 2
- 108091034131 VA RNA Proteins 0.000 description 2
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000006197 histone deacetylation Effects 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 239000013615 primer Substances 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 230000010473 stable expression Effects 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 1
- ANGAOPNEPIDLPO-XVYDVKMFSA-N Ala-His-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N ANGAOPNEPIDLPO-XVYDVKMFSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 1
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- PHQXWZGXKAFWAZ-ZLIFDBKOSA-N Ala-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 PHQXWZGXKAFWAZ-ZLIFDBKOSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- BBYTXXRNSFUOOX-IHRRRGAJSA-N Arg-Cys-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BBYTXXRNSFUOOX-IHRRRGAJSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- BSGSDLYGGHGMND-IHRRRGAJSA-N Arg-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N BSGSDLYGGHGMND-IHRRRGAJSA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- STHNZYKCJHWULY-AVGNSLFASA-N Arg-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O STHNZYKCJHWULY-AVGNSLFASA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- MLJZMGIXXMTEPO-UBHSHLNASA-N Asn-Trp-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O MLJZMGIXXMTEPO-UBHSHLNASA-N 0.000 description 1
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- KACWACLNYLSVCA-VHWLVUOQSA-N Asp-Trp-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KACWACLNYLSVCA-VHWLVUOQSA-N 0.000 description 1
- 102000006734 Beta-Globulins Human genes 0.000 description 1
- 108010087504 Beta-Globulins Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108010069241 Connexin 43 Proteins 0.000 description 1
- 102000001045 Connexin 43 Human genes 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 1
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 1
- CPTUXCUWQIBZIF-ZLUOBGJFSA-N Cys-Asn-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CPTUXCUWQIBZIF-ZLUOBGJFSA-N 0.000 description 1
- DVKQPQKQDHHFTE-ZLUOBGJFSA-N Cys-Cys-Asn Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)N DVKQPQKQDHHFTE-ZLUOBGJFSA-N 0.000 description 1
- QJUDRFBUWAGUSG-SRVKXCTJSA-N Cys-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N QJUDRFBUWAGUSG-SRVKXCTJSA-N 0.000 description 1
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 1
- KEBJBKIASQVRJS-WDSKDSINSA-N Cys-Gln-Gly Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N KEBJBKIASQVRJS-WDSKDSINSA-N 0.000 description 1
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- XMVZMBGFIOQONW-GARJFASQSA-N Cys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)C(=O)O XMVZMBGFIOQONW-GARJFASQSA-N 0.000 description 1
- KVGPYKUIHZJWGA-BQBZGAKWSA-N Cys-Met-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O KVGPYKUIHZJWGA-BQBZGAKWSA-N 0.000 description 1
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 1
- JIVJQYNNAYFXDG-LKXGYXEUSA-N Cys-Thr-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JIVJQYNNAYFXDG-LKXGYXEUSA-N 0.000 description 1
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 1
- HPZAJRPYUIHDIN-BZSNNMDCSA-N Cys-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N HPZAJRPYUIHDIN-BZSNNMDCSA-N 0.000 description 1
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 1
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010092408 Eosinophil Peroxidase Proteins 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- 102100037260 Gap junction beta-1 protein Human genes 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- KYFSMWLWHYZRNW-ACZMJKKPSA-N Gln-Asp-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KYFSMWLWHYZRNW-ACZMJKKPSA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- ZRXBYKAOFHLTDN-GUBZILKMSA-N Gln-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N ZRXBYKAOFHLTDN-GUBZILKMSA-N 0.000 description 1
- QFTRCUPCARNIPZ-XHNCKOQMSA-N Gln-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)C(=O)O QFTRCUPCARNIPZ-XHNCKOQMSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 1
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 1
- GXMBDEGTXHQBAO-NKIYYHGXSA-N Gln-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N)O GXMBDEGTXHQBAO-NKIYYHGXSA-N 0.000 description 1
- DAAUVRPSZRDMBV-KBIXCLLPSA-N Gln-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DAAUVRPSZRDMBV-KBIXCLLPSA-N 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- WPJDPEOQUIXXOY-AVGNSLFASA-N Gln-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WPJDPEOQUIXXOY-AVGNSLFASA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- UENPHLAAKDPZQY-XKBZYTNZSA-N Glu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O UENPHLAAKDPZQY-XKBZYTNZSA-N 0.000 description 1
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 1
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- QOOFKCCZZWTCEP-AVGNSLFASA-N Glu-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QOOFKCCZZWTCEP-AVGNSLFASA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- YDWZGVCXMVLDQH-WHFBIAKZSA-N Gly-Cys-Asn Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O YDWZGVCXMVLDQH-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 1
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 1
- YTKOTXRIWQHSAZ-GUBZILKMSA-N His-Glu-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N YTKOTXRIWQHSAZ-GUBZILKMSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 1
- HZWWOGWOBQBETJ-CUJWVEQBSA-N His-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O HZWWOGWOBQBETJ-CUJWVEQBSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000889953 Homo sapiens Apolipoprotein B-100 Proteins 0.000 description 1
- 101000987586 Homo sapiens Eosinophil peroxidase Proteins 0.000 description 1
- 101000920686 Homo sapiens Erythropoietin Proteins 0.000 description 1
- 101150062179 II gene Proteins 0.000 description 1
- CTHAJJYOHOBUDY-GHCJXIJMSA-N Ile-Cys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N CTHAJJYOHOBUDY-GHCJXIJMSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- JLYUZRKPDKHUTC-WDSOQIARSA-N Leu-Pro-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JLYUZRKPDKHUTC-WDSOQIARSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000003959 Lymphotoxin-beta Human genes 0.000 description 1
- 108090000362 Lymphotoxin-beta Proteins 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 1
- TWTNGJMBFRTKEX-FXQIFTODSA-N Met-Cys-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O TWTNGJMBFRTKEX-FXQIFTODSA-N 0.000 description 1
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 1
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 1
- RBGLBUDVQVPTEG-DCAQKATOSA-N Met-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N RBGLBUDVQVPTEG-DCAQKATOSA-N 0.000 description 1
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 101150054880 NASP gene Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 1
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 1
- 241000710778 Pestivirus Species 0.000 description 1
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 1
- AEEQKUDWJGOFQI-SRVKXCTJSA-N Phe-Cys-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N AEEQKUDWJGOFQI-SRVKXCTJSA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- FFSLAIOXRMOFIZ-GJZGRUSLSA-N Pro-Gly-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)CNC(=O)[C@@H]1CCCN1 FFSLAIOXRMOFIZ-GJZGRUSLSA-N 0.000 description 1
- JUJGNDZIKKQMDJ-IHRRRGAJSA-N Pro-His-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O JUJGNDZIKKQMDJ-IHRRRGAJSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 1
- JRBWMRUPXWPEID-JYJNAYRXSA-N Pro-Trp-Cys Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CS)C(=O)O)C(=O)[C@@H]1CCCN1 JRBWMRUPXWPEID-JYJNAYRXSA-N 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- JJKSSJVYOVRJMZ-FXQIFTODSA-N Ser-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)CN=C(N)N JJKSSJVYOVRJMZ-FXQIFTODSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- GRRAECZXRONTEE-UBHSHLNASA-N Ser-Cys-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GRRAECZXRONTEE-UBHSHLNASA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- PZHJLTWGMYERRJ-SRVKXCTJSA-N Ser-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O PZHJLTWGMYERRJ-SRVKXCTJSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 1
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- VOHWDZNIESHTFW-XKBZYTNZSA-N Thr-Glu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O VOHWDZNIESHTFW-XKBZYTNZSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- KAFKKRJQHOECGW-JCOFBHIZSA-N Thr-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(O)=O)=CNC2=C1 KAFKKRJQHOECGW-JCOFBHIZSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 1
- HYLNRGXEQACDKG-NYVOZVTQSA-N Trp-Asn-Trp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HYLNRGXEQACDKG-NYVOZVTQSA-N 0.000 description 1
- JISIQDCOHJOOPU-WFBYXXMGSA-N Trp-Cys-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O JISIQDCOHJOOPU-WFBYXXMGSA-N 0.000 description 1
- HXMJXDNSFVNSEH-IHPCNDPISA-N Trp-Cys-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N HXMJXDNSFVNSEH-IHPCNDPISA-N 0.000 description 1
- CZSMNLQMRWPGQF-XEGUGMAKSA-N Trp-Gln-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CZSMNLQMRWPGQF-XEGUGMAKSA-N 0.000 description 1
- AWYXDHQQFPZJNE-QEJZJMRPSA-N Trp-Gln-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N AWYXDHQQFPZJNE-QEJZJMRPSA-N 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 1
- NSOMQRHZMJMZIE-GVARAGBVSA-N Tyr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NSOMQRHZMJMZIE-GVARAGBVSA-N 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- SMLCYZYQFRTLCO-UWJYBYFXSA-N Tyr-Cys-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O SMLCYZYQFRTLCO-UWJYBYFXSA-N 0.000 description 1
- KLGFILUOTCBNLJ-IHRRRGAJSA-N Tyr-Cys-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O KLGFILUOTCBNLJ-IHRRRGAJSA-N 0.000 description 1
- YWXMGBUGMLJMIP-IHPCNDPISA-N Tyr-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC3=CC=C(C=C3)O)N YWXMGBUGMLJMIP-IHPCNDPISA-N 0.000 description 1
- BODHJXJNRVRKFA-BZSNNMDCSA-N Tyr-Cys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BODHJXJNRVRKFA-BZSNNMDCSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- BWVHQINTNLVWGZ-ZKWXMUAHSA-N Val-Cys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BWVHQINTNLVWGZ-ZKWXMUAHSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 1
- PYPZMFDMCCWNST-NAKRPEOUSA-N Val-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N PYPZMFDMCCWNST-NAKRPEOUSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- YQMILNREHKTFBS-IHRRRGAJSA-N Val-Phe-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YQMILNREHKTFBS-IHRRRGAJSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 1
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 108010015416 connexin 32 Proteins 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012444 downstream purification process Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 1
- 229940089161 ginsenoside Drugs 0.000 description 1
- 229930182494 ginsenoside Natural products 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 230000001456 gonadotroph Effects 0.000 description 1
- 229940094892 gonadotropins Drugs 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 102000052249 human APOB Human genes 0.000 description 1
- 102000044890 human EPO Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- SXTAYKAGBXMACB-UHFFFAOYSA-N methionine S-imide-S-oxide Natural products CS(=N)(=O)CCC(N)C(O)=O SXTAYKAGBXMACB-UHFFFAOYSA-N 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 210000000299 nuclear matrix Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 229960000160 recombinant therapeutic protein Drugs 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000000754 repressing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 229960000216 tenecteplase Drugs 0.000 description 1
- 229940126622 therapeutic monoclonal antibody Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/65—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
- C12N15/68—Stabilisation of the vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
- C12N9/6421—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
- C12N9/6424—Serine endopeptidases (3.4.21)
- C12N9/6456—Plasminogen activators
- C12N9/6459—Plasminogen activators t-plasminogen activator (3.4.21.68), i.e. tPA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21069—Protein C activated (3.4.21.69)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/46—Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
- C12N2840/203—Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은, 흥미있는 유전자에 실시가능하게 결합된 프로모터(promoter operably linked to gene of interest), TPL 및 VA 유전자 I 및 II, 매트릭스 부착 영역(MARs)/SARs, 항생물질 마커를 포함하는, 단백질들 및 펩티드들의 생산을 위한 발현 벡터에 관한 것이다. 상기 벡터는 적절한 숙주 세포에서 트랜스펙션된다.
Description
본 발명은, 재조합 치료 단백질(recombinant therapeutic proteins)의 높은 레벨 발현을 위한 신규한 발현 벡터에 관한 것이다. 특히, 본 발명은, 재조합 단백질을 코딩하는 유전자 서열 및 매트릭스 부착 영역(matrix attachment region)과 같은 적어도 하나의 실시가능하게 결합된 발현 증진 요소(at least one operably linked expression enhancing element)를 갖는 발현 벡터를 나타낸 것이다. 상기 벡터는, 그 밖의 조절 인자를 더 포함할 수도 있다. 다른 실시형태에서, 본 발명은 상기 발현 벡터로 트렌스펙션된 포유동물 세포를 포함한다(the invention comprises mammalian cells transfected with the said expression vector).
치료 단백질의 증가된 요구는 주로, 소분자 기초 약물(small molecule based drugs)과 비교하여, 독성의 명확한 위험을 현저하게 감소시키는, 이들의 일반적인 매우 특정한 목표의 행동 때문이다(The increased demand of therapeutic proteins is primarily due to their generally highly specific target of action which results in significantly reduced and well-defined risk of toxicity compared to small molecule based drugs). 모든 이러한 환자-우호적인 특성(patient-friendly qualities)을 가짐에도 불구하고, 대부분의 치료 단백질은, 이들은 엄청난 비용을 지속적으로 유지하여야 하기 때문에, 전 세계에서 대부분의 사람에게 접근하기 어려운 상태로 있다. 따라서, 삶의 질을 현저하게 개선시키는, 에리스로포이에틴, 다베포이에틴(Darbepoietin), TNKase, 에타너셉트(Etanercept), 성선자극호르몬(Gonadotropins)와 같은 그 밖의 중요한 약물 또는 인명구조(life saving), 및 리툭시맙(Rituximab), 트라스투주맙(Trastuzumab) 및 그 밖의 치료 모노클론 항체(other therapeutic monoclonal antibodies) 등과 같은 많은 항-암 모노클로날 약물은, 매우 작은 퍼센트의 사람에 의해서만 제공되는 반면에, 전 세계에 대다수의 아픈 사람들은 이들을 제공받지 못한다. 따라서, 이러한 약물의 비용을 낮추는 것에 대한 필요가 시급하다.
이러한 높은 비용의 높은 요소(A large component of this high cost)는, 이들의 낮은 생산 산출량(their low production yields) 때문에 발생되는 이들의 제조와 관련되어 있다. 클론(clone)의 생산 산출량은, 배양 조건[배지 구성요소(media components), 온도, pH etc.] 및 다운스트림 정제 과정(downstream purification process)과 같은 외부의 요소, 및 벡터의 선별과 같은 내부의 요소 및 프로모터, 전사(transcription) 또는 번역 증진 요소(translation enhancing elements) 등과 같은 이의 조절 요소(its regulatory elements) 및 이들의 적절한 방향(their appropriate orientation) 및 또한 적절한 숙주 세포의 선택과 같은 몇 가지 요소의 선택에 달려있다. 포유동물 세포는, 이가 글리코실화의 천연의 능력(natural capacity)을 가짐으로써, 재조합 치료의 단백질의 높은 발현을 수득하기 위한 가장 유망한 발현 시스템이다. 또한, 이러한 발현 시스템에서, 번역 후 변형(post-translational modifications)이 인간 세포 발현 단백질에서 발견되는 것과 유사하게 할 가능성이 많고, 따라서 생리적인 활동성(physiological activity)을 만들게 한다. 그러나, 진핵생물의 세포에서의 발현 레벨은, 또 다른 내부의 인자(another internal factor), 즉 숙주 세포의 게놈에서 흥미있는 유전자를 포함하는 재조합 발현 구조물(recombinant expression construct)의 통합 부위(integration site)에 따라 매우 좌우된다.
원하는 단백질을 코딩하는 흥미있는 유전자를 포함하는 재조합 발현 플라스미드는, 원하는 재조합 단백질을 발현하는, 안정된 CHO 트랜스펙턴트(stable CHO transfectants) 또는 그 밖의 포유동물 트랜스펙턴트를 생성하는데 일상적으로 사용된다. 진핵생물 과발현(eukaryotic overexpression)을 위한 이상적인 시스템은, 강하고, 안정적이거나 또는 장기간 발현을 가능하게 하는 위치에서의 타겟 세포(target cell)의 게놈에서의 발현 카세트의 통합(integration of the expression cassette)을 가질 수 있다. 그러나, 가장 현재의 방법은, 숙주 세포의 게놈 내로 플라스미드 DNA의 임의적인 통합(random integration)만을 달성한다. 상기 발현 레벨이, 이러한 트랜스펙션 공정(transfection process)에서 발생된 클론 집단(clonal populations)에서의 매우 가변적임을 상기 문헌으로부터 분명하다(Brian K Lucas et al., Nucleic Acids Research, 1996, Vol. 24, No. 9 , R.T. Schimke et al., Br. J. Cancer (1985), 51, 459-465, Wurtele H, et al., Gene Ther. 2003 Oct;10(21):1791-9. Biotechnol Prog. 2000 Sep-Oct;16(5):710-5, Yoshikawa T et al., Biotechnol Prog. 2000 Sep-Oct;16(5):710-5., Kim NS, et al., Biotechnol Prog. 2001 Jan-Feb;17(1):69-75). 또한, 높은 레벨로 원하는 재조합 단백질을 발현시킬 수 있는, 안정되게 통합된 재조합 유전자를 운반하는 형질주입종(transfectomas carrying the stably integrated recombinant gene)의 빈도는 매우 낮다.
일반적으로, 다수의 안정되게 트랜스펙션된 세포는, 높은 레벨로 상기 재조합 단백질을 발현하는 클론을 확인하기 위해 스크린되어야 한다(a large number of stably transfected cells must be screened to identify clones which express the recombinant proteins at high levels). 포유동물 게놈은 매우 크고, 이의 오직 0.1 % 만이 전사적으로 활성 서열(transcriptionally)을 포함하는 바와 같이, 이는 통합 부위의 유전적인 환경(the genomic environment of the integration site)의 효과 때문일 것으로 주로 여겨진다(Little (1993) Nature 366:204). 통합에 발현에 영향을 미치는 통합(integration influencing expression)의 부위의 이러한 현상을 "위치 효과(position effect)"라고 한다. 위치 효과는, 하기의 메커니즘의 어떠한 것 또는 모두로 인하여, 양성적인 또는 음성적인 방식(positive or negative manner)으로 통합된 유전자의 발현 레벨을 조절한다 - 1) 통합된 유전자의 발현을 조절하는데 참여할 수도 있는, 통합의 부위 근처에 조절하는 요소(regulatory elements)의 존재, 2) 통합의 부위에서 염색질 구조(chromatin structure), 3) 통합의 부위에서 DNA 메틸화 활성도(methylation activity). 위치 효과의 음성적인 영향은, DNA 메틸화 또는 히스톤 탈아세틸(histone deacetylation)을 통해 유전자 발현억제(gene silencing)로서 엄격할 수 있다(The negative impact of position effect can be as harsh as gene silencing via DNA methylation or histone deacetylation).
따라서, CHO 세포의 게놈 내로 임의적인 플라스미드 통합의 기술이, 높은 레벨의 유전자 발현시킬 수 있는 전사적으로 활성 구역(transcriptionally active zone) 내로 재조합 유전자의 삽입을 항상 야기할 것임은, 아주 가능성이 적은 일이다. 이는, 높은 발현 클론(high expressing clone)을 발견하도록 선별되는데 필요한 클론의 수가 매우 클 것임을 의미한다.
임의적인 통합(random integration)과 관련된 문제점을 극복하기 위해, 게놈에서 부위 특이적인 방식으로 원하는 유전자를 통합하기 위한 시스템의 발견은 문헌에 기재되어 있고, 제한된 성공(limited success)과 함께 사용되고 있다. 예를 들어, 몇몇 그룹은, 게놈의 전사적으로 활성 부위에서 흥미있는 유전자의 부위-특이적인 재조합 매개 도입(site-specific recombination mediated introduction)을 위한 특정한 효소를 사용한다. Cre 및 FLP와 같은 재조합효소는 동일한 타겟 부위(the same target sites)와 통합(integration) 및 절단(excision) 둘 다를 수행한다(Sauer, B. (1994) Curr Opin. Biotechnol., 5, 521-527, Sternberg et al, J Mol Biol, 1981,150,467-486, Broach et al, Cell, 1980,21,501-508). 그러나, 이러한 재조합효소가 포유동물 세포에서의 효과적인 통합을 수행할지라도, 이들이 매개하는 순 통합 빈도(net integration frequency)는 과도한 반작용(excessive back reaction) 때문에 매우 낮다. 따라서, 안정적이고 높은 발현의 문제는 해결되어야할 것으로 여전히 남아있다.
전통적으로, 안정된 높게 생산하는 세포주를 성취하기 위해, 메토트렉세이트(MTX) 매개된 유전자 확대 과정(methotrexate mediated gene amplification process)과 같은 유전자 복제 수를 증가시키는 방법이 일반적으로 사용된다. 트랜스펙션은, 원하는 표현형을 갖는 단일 세포 클론의 광범위한 검색이 따른다(Transfection is followed by extensive search of single cell clones having the desired phenotype). 또한, 메토트렉세이트의 레벨은, 각각의 증가 레벨(each increment level)에서 안정화되기 위해 세포를 위한 충분한 시간이 주어지면서, 소폭 증가로(in small increments) 일반적으로 증가된다. 따라서, 트랜스펙션된 포유동물 세포로부터 발현을 증가시키는 이러한 과정은 시간 소모가 크고, 노동 집약적이다.
진핵생물의 유전자의 전사는, 여러 가지의 cis- 및 trans-작용하는 조절 요소(cis- and trans-acting regulatory elements)에 의해 조절된다(Dillon et.al., (1993) Trends Genet. 9:134). 가장 특징지어진 cis- 요소 중 두 가지는, 프로모터 및 인핸서(enhancers)이다. 프로모터는, 상기 유전자의 코딩 서열(coding sequence)에 대한 5' 가까이의 DNA 서열이다(Promoters are DNA sequences immediately 5' to the coding sequence of the gene). 이들은, 기본적인 전사 장치(basic transcription apparatus)를 형성하는, 트랜스-작용하는 전사 인자(trans-acting transcription factors)를 위한 다수의 결합 부위를 포함한다. 유리하게, 인핸서(enhancers)는 또한, 트랜스-작용하는 전사 인자를 위한 다수의 결합 부위로 구성되어 있지만, 코팅 서열의 업스트림 또는 다운스트림에서 멀리 또는 인트론 내 조차도 발견될 수 있다. 이러한 요소는, 방향 독립 방식(orientation independent manner)으로 또한 작용할 수 있다. 프로모터 및 인핸서의 활성도는, 일시적인 발현 시스템(transient expression systems)에서 검출될 수 있고, 이들은, 조직 특이적이거나 또는 조직 특이적이지 않을 수도 있는 요소를 포함한다.
본 발명의 발명자는, 높은 발현 레벨의 재조합 단백질을 성취하기 위해, a) CMV 프로모터, b) 인트론, c) TPL, d) VA 유전자 및 e) 소의 성장 호르몬 폴리아데닐화 서열(bovine growth hormone polyadenylation sequence)와 같은 조절 요소의 병용 효과(combined effect)를, 이들의 출원 WO2007017903에 이미 기재되어 있다.
cis-작용하는 조절 요소의 그 밖의 카테고리는, 염색질 구조(chromatin structure)를 조절하는 것으로 여겨지는 것이고, 유전자자리 조절 영역(locus control regions, LCRs)[Grosveld et.al., (1987) Cell 51:975], 매트릭스 부착 영역(matrix attachment regions, MARs)[Phi-Van et.al., (1990) Mol. Cell. Biol. 10:2302], 스캐폴드 부착 영역(scaffold attachment regions, SARs)[Gasser and Laemmli (1987) Trens Genet. 3:16], 인슐레이터 요소(insulator elements)[Kellum and Schedl (1991) Cell 64:941] 및 핵 매트릭스-관련 DNAs(Nuclear matrix-Associating DNAs)[Bode J et.al., (1992) Science 255:195]을 포함한다.
MARs 및 SARs는, 이들은 긴 거리(long distances) 상에서 작용할 수 있으므로 유사한 인핸서(similar enhancers)이지만, 이들의 효과가 안정적으로 형질전환된 세포주(stably transformed cell lines) 또는 형질전환 동물(transgenic animal)에서만 검출할 수 있으므로 유일하다. LCRs는, 이들은 위치 및 방향 의존적이고, 조직 특이적인 방식으로 활동성이 있으므로, 다른 타입의 인핸서와 또한 다르다.
SARs/MARs 요소는, 위치 효과의 문제점을 제거하고, 발현 구조(expression construct)에서의 매우 유효한 유전자를 제공하는데 사용되고 있다. 이들은, 인근의 숙주 세포 염색질 요소(neighbouring host cell chromatin elements)가 전이유전자 발현(transgene expression)에 영향을 미치는 것을 예방한다.
MARs는, 유효하게 번역된 유전자를 둘러싸는 영역(regions surrounding actively transcribed genes)으로부터 분리되지만, 또한 동원체(centromere) 및 텔로미어 영역(telomeric regions)으로부터 분리된다. 그들은, 전사 활성도(transcription activity)를 조절함으로써 원하는 유전자의 발현을 증가시킨다.
초파리 Scs 경계 요소(Drosophila Scs boundary element), hspSAP MAR, 마우스 T 세포 수용체 TCRα, 랫 유전자자리 조절 부위(Rat locus control region), β-글로빈 MAR, 아폴리포단백질 B SAR 요소 등과 같은 몇몇의 상이한 MARs/SARs는, 존재하는 문헌에서 상이한 종 및 상이한 고도로 발현된 유전자(different highly expressed genes)로부터 보고되고 있다. 대부분의 이러한 요소는, CHO 세포에서 원하는 유전자의 발현 레벨에서의 향상을 조정하기 위해 낮게 나타난다(P.A. Girod and Nicolas Mermod, Gene Transfer and Expression in Mammalian Cell, 2003). 대조적으로, 닭 라이소자임 MAR(Chicken Lysozyme MAR, cLysMAR)은, MAR 요소가 부재한 경우의 대조군과 비교한 바와 같이, 5 내지 6 배 보다 높은 발현 레벨(5 to 6 fold higher expression levels)을 나타낸다(P.A. Girod and Nicolas Mermod, Gene Transfer and Expression in Mammalian Cell, 2003). 또한, 동일한 MARs가 발현 카세트의 측면에 배치된 양쪽에 사용된 경우, 발현 레벨에서의 4 내지 5배의 추가적인 증가가 관찰된다(P.A. Girod and Nicolas Mermod, Gene Transfer and Expression in Mammalian Cell, 2003). 따라서, 이는, cLysMAR이 선행 기술에서 보고된 가장 촉망받는 요소임을 명확하다. cLysMAR는, 닭 라이소자임 유전자의 먼 업스트림에 위치한다(cLysMAR is localized far upstream of the chicken lysozyme gene)(Phi-Van and Stratling, EMBO, 7,3, pp 655-64,1988). 형질전환된 동물 세포주에서, 이러한 MAR은, 전이유전자 발현의 전체적인 레벨을 증가시키고, 보고 유전자(reporter gene) 주위에 위치한 경우, 이의 위치 의존적인 가변성(position dependent variability)을 감소시키는 것으로 나타내었다(Stief et al., Nature, 341, pp 343-345, 1989). 이러한 효과는, 전이유전자 발현의 조직 특이성(McKnight et al., 1992) 뿐만 아니라 이종의 프로모터 및 세포까지 미치는 것으로 발견되었다(Phi-Van et al., Molecular and Cellular Biology, 10,5 pp 2302-2307, 1990).
US7422874에는, β 갈락토시다아제 보고 유전자(β galactosidase reporter gene), scu-PA 유전자 및 TGF-β SRII 유전자의 발현을 증가시키기 위해, PMS 벡터 구조에서, 조절 요소 - pSV-gal 또는 pCMV-gal 프로모터, MCS 부위 및 전사의 종결 부위(transcriptional termination site)와 결합하여, β-글로빈 MAR의 사용에 대해 기재되어 있다. 그들은, 88 %의 클론(clones)에서의 β 갈락토시다아제를 위한 20 ug/백만 세포의 중간의 발현 레벨(moderate expression levels)을 수득할 수 있었다. 이들은 또한, MARs를 제외한 상기 벡터로서 동일한 조절 요소로 구성된 대조군 벡터 구조와 비교하여, 4 배 이상의 발현 레벨을 갖는 scu-PA를 위한 클론을 생성할 수 있었다. 유전자 증폭(gene amplification)을 위한 MARs 및 DHFR 시스템이 TGF-β SRII의 발현에 함께 사용된 경우, 이들은, 트랜스펙션 후에 100 ng/million cells/day 및 1 uM MTX 까지 MTX 매개된 유전자 증폭의 몇 회 후에, 10 ug/million cells/day을 생산하는 기본적인 클론을 생산될 수 있었다. 그러나, 이러한 특허에서 수득된 발현 레벨은, TNKase, 다베포이에틴, 및 단일클론 항체와 같은 생물치료 단백질(biotherapeutics proteins)에 대해 오늘날 상업적으로 실현가능하지 않다.
US7371542는, LTBR-Fc[림프독소 베타 수용체-IgG Fc 융합 단백질(Lymphotoxin beta receptor - IgG Fc Fusion protein)]의 발현을 증가시키도록, 발현 벡터 구조에서 조절 요소 - CMV 프로모터, 인트론, Ori P 및 Poly A와 함께 β IFN S/MAR의 용도에 대해 기재되어 있고, MARs를 제외한 상기 벡터와 같은 동일한 조절 요소로 구성되는 대조군 벡터와 비교하여, CHO 세포에서 발현 레벨에서 4.5 배 향상이 달성되었다. 그들은 또한, 발현 벡터에서 β IFN S/MAR의 용도가 벡터 pCEP-LTBR-Fc를 사용하여 293 EBNA 세포에서 6.3 배 발현 레벨을 증가시킴을 발견하였다. 그러나, 상기 발현 레벨은 여전히 매우 낮다(20 mg/L in 5 days). 상기 벡터
pCB_SM1_LTBR-Fc는, 9 일에 40 mg/L의 생산성을 갖는 293 EBNA 세포에서 클론을 제공할 수 있었다. 그러나, 이러한 특허에서 수득된 생산성 레벨은, 이러한 생물치료 분자(biotherapeutic molecules)에 바람직한 레벨에 훨씬 못 미친다.
US5731178은, 프로모터 및 인핸서를 포함하는 벡터 구조에서 cLysMARs을 사용함으로써 원하는 유전자의 증진된 발현에 대해 기재되어 있다. 그들은, mar 요소가 인핸서 및 프로모터로 단지 구성된 대조군 구조 상에서 인핸서 및 프로모터 요소와 함께 사용된 경우, 안정된 트랜스펙션에서 cLysMAR 요소의 사용이 10 배 이상으로 보고 유전자 CAT 활성도를 개선시킬 수 있으나, MAR 요소가 이 자체로 어떠한 주요한 영향을 나타낼 수 없음을, 나타낸다.
Poljak et al.,(1994) Nucleic Acid Res., 22(21):4386-94)는, cLysMAR이 SV40 프로모터 및 인핸서와 결합되어 사용된 경우, 약 15 배로 CAT 보고 유전자의 발현에서의 증가를 보고하였다. 이 자체로 cLysMAR은 원하는 유전자의 발현을 증가시키는데 매우 좋지 못함, 더 정확히 말하면 이는 조금의 감소를 나타냄을 발견하였다.
따라서, 상기의 예는, 본 분야의 숙련자에게 알려진 표준 조절 요소(standard regulatory elements)를 포함하는 상기 대조군 벡터 구조가 높은 발현을 뒷받침하기에 본래 충분하지 않는 사실을 보여준다. 그리고, 추가적으로 MARs/SARs와 함께 결합 후에도, 상기 발현 레벨은, 재조합 치료법(recombinant therapeutics)의 실행 가능한 생산을 위해 상업적으로 요구된 이러한 것들로 증가되지 않는다. 따라서, 요소의 유일한 조합(unique combination)은, 원하는 발현 레벨을 성취하기 위해 여전히 요구된다.
따라서, 이는, 점점 더 많은 입수가능한 이들을 제조하기 위해, 치료 단백질의 발현을 추가적으로 증가시키도록, 산업에서의 중요한 필요가 존재함이, 명확해진다. 따라서, 하나는, 상이한 종류의 타겟 유전자와 함께 증가된 발현을 제공하도록, 합성 방식(synergistica fashion)에서의 MARs와 함께 작용할 수 있는, 상기 발현 벡터에서의 요소의 조합(combination)을 위한 필요를 느끼게 한다. 본 발명의 발명자는, 조절 요소의 유일한 조합의 공동의 작용(concerted action)이, 시간 절약 방식(time saving manner)에서의 재조합 단백질의 최적의 발현을 위해 필수적임을, 이후로 입증되고 있다.
US7129062에는, 재조합 단백질의 발현 - 약 20 배의 anti Rhesus D IgG 및 루시페라아제(luciferase)-을 증가시키기 위해, 하나의 벡터는 흥미있는 유전자를 포함하고,두 번째의 것은 cLysMARs를 포함하는, 2 개 이상의 연결되지 않는 벡터(more than 2 unlinked vectors)의 공동-트랜스펙션(co-transfection)에 대해 기재되어 있고, 이들은 이러한 공동 트렌스펙션 전략을 사용하여 200 mg/L에서 인간 항 Rhesus D IgG(human anti Rhesus D IgG)를 또한 생산할 수 있었다. 그러나, 이는 문헌(DNA Cloning: Mammalian systems; By David M. Glover, B. D. Hames)에서 널리 보고되어 있고, 또한, 공동트랜스펙션이, 트랜스펙션된 개체수에서의 가변성(variability) 및 이종혼성(heterogeneity)을 증가시킴을 우리의 경험에서도 또한 알 수 있었다. 게다가, 본 발명은, 단일 트랜스펙션(single transfection)을 사용하여 원하는 산출량을 획득하였다.
US20080102523에서는, SV40 프로모터-인핸서 및/또는 CMV 프로모터, ori site 및 폴리 A 영역으로 이루어진 상기 대조군 벡터 구조와 비교한 바와 같이, 3 배의 베터-갈락토시다아제 및 6 배의 면역글로불린의 발현을 증가시키기 위해 β-글로빈 MAR의 용도에 대해 기재되어 있다. 상기 특허 출원서는, β-글로빈 MAR 조절 요소의 도움 뿐만 아니라 MTX 매개된 유전자 증폭 둘 다를 통해 발현에서의 보통의 증가(moderate increase) 만을 성취하고, 이로 인하여 전체 과정이 지루하고, 시간 소비적으로 만들 수 있다. 이는, 본 발명자는, 조절 요소의 이들의 유일한 조합과 함께 및 MTX-DHFR 선택 방법과 같은 어떠한 길고 지루한 방법의 사용 없이, 높은 발현을 성취하는 것이 현재의 발명과 대조적이다.
US5888774에는, 인간 아폴리포단백질 B SAR 요소(human apolipoprotein B SAR element)를 이용하여 높은 발현의 에리스로포이에틴에 대해 기재되어 있고, EPO/million cells/24 Hrs의 1500 내지 1700 IU의 발현이 보고되어 있다. 본 발명자에 의해 소유된 WO 2007017903에는, US5888774에서 보고된 수치보다 현저하게 더 높은, 2366 내지 3549 IU/106 cells/24 Hrs 또는 18.2 내지 27.3 ㎍/106 cells/24 Hrs와 동등한, 168 hrs 배양에서, 11,830 IU/ml(91 ㎍/ml)의 발현 레벨에서 재조합 인간 에리스로포이에틴을 생산하기 위한 방법에 대해 기재되어 있다. 그리고, 본 발명은, 몇몇의 치료상의 단백질을 위해, WO2007017903의 벡터 상에 현저하게 발현 레벨을 추가적으로 증가시킨다.
따라서, 진핵생물의 숙주 세포의 생산성을 추가적으로 증가시키기 위해, 신규한 발현 벡터를 개발하는 것을 여전히 원하고 있다. 놀랍게도, 지난 수십 년간 이러한 분야에서 생성된 지식의 엄청난 양에도 불구하고, 오늘날 본 분야에서 알려진 숙련자가, 단순하게 선택할 수 없고, 상당한 높은 발현을 제공하는 발현 벡터를 디자인하도록, 내부의 인자 또는 조절 요소의 조합을 선택한다. 추가적으로, 높은 발현 벡터를 생성하기 위한 적절한 요소의 조합은, 터를 사용하여 흥미있는 원하는 유전자의 높은 발현이 오직 하나의 요소에 기인하지 않을 수 없고, 그러나 적절한 요소의 조합이 안정된 높게 발현하는 세포 주를 얻기 위해 바람직하지 않기 때문에, 본 분야의 숙련자에 의해 일상적으로 추정되지 않을 것이다. 따라서, 이러한 본 발명은, 예를 들어, 이의 안정성을 증가시키고, 번역 효율성(translation efficiency)을 증가시킴으로써, mRNA 분자의 생명을 확장시키는, 증가된 전사에 의해 mRNA 레벨을 증가시키는데 있어서, 다중 역할(multiple roles)을 갖는, CMV 프로모터, 인트론, TPL, 및 VA 유전자와 같은, 그 밖의 조절 요소와 함께, 닭 라이소자임 MAR 요소[chicken lysozyme MAR element(s)]와 같은 발현 증진시키는 요소를 포함하는 신규한 발현 벡터를 제공함으로써 이러한 문제를 해결책을 제공하고, 따라서, 상기 트랜스펙션된 포유동물 숙주 세포에서의 재조합 단백질의 높고 안정된 발현을 유도하는 공동의 방식(synergistic manner)을 작용한다. cis 또는 trans 방향에서의 cLysMAR의 측면의 발현 카세트로 이루어진(consisting of the expression cassette flanked by cLysMAR in a cis or trans orientation), 본 발명의 상기 발현 벡터에서의 이러한 요소의 조합은, 트랜스펙션된 세포주에서의 치료 단백질의 안정되고, 높은 발현을 결과적으로 야기한다.
본 발명의 목적
본 발명은, 포유동물 세포에서의 흥미있는 단백질의 발현 효율성을 증가시키는 발현 벡터를 제공한다.
하나의 실시형태에서, 본 발명은, 흥미있는 유전자에 실시가능하게 결합된 프로모터(a promoter operably linked to the gene of interest), 발현 증진 요소, 그 밖의 조절 요소, 즉, TPL, VA I 및 II 유전자 또는 이의 변이체, 번역 종결자(translation terminator) 및 항생물질 마커(antibiotic marker)를 포함하는 신규한 발현 벡터를 제공하고, 상기 발현 증진 요소는 염색질 부착 영역(chromatin attachment region)이다.
하나의 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs로부터 선택된 발현 증진 요소와 함께, 클로닝 부위에 실시가능하게 결합된 프로모터(promoter operably linked to cloning sites), 흥미있는 유전자, 번역 종결자, TPL, VA I 및 II 유전자, 적절한 항생물질 마커를 포함한다.
대체적인 실시형태(alternate embodiment)에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs으로부터 선택된 발현 증진 요소(expression enhancing elements)와 함께, 클론 부위에 실사가능하게 결합된 프로모터(promoter operably linked to cloning sites), 흥미있는 유전자, BGH와 같은 번역 종결자, 인트론, 적절한 마커 및 선택적으로 내부의 리보솜 결합 부위를 포함한다.
하나의 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs으로부터 선택된 발현 증진 요소와 함께, 클론 부위에 실시가능하게 결합된 프로모터, 흥미있는 유전자, BGH와 같은 번역 종결자, TPL, VA I 및 II 유전자, 인트론, 적절한 항생물질 마커 및 임의적으로 내부의 리보좀 결합 부위를 포함한다.
또 다른 실시형태에서, 본 발명은, 본 발명의 실시형태에 따라 상기 발현 벡터로 트렌스펙션된, 포유동물 숙주 세포에서의 흥미있는 유전자를 발현시키기 위한 방법을 제공한다.
도 1은, pZRCII의 벡터 그림(vector diagram)을 나타낸 것이다.
도 2는, pZRC III의 벡터 그림을 나타낸 것이다.
도 3은, pZRC III-TNK-Hyg의 벡터 그림을 나타낸 것이다.
도 4는, pZRC III-Darbe-Hyg의 벡터 그림을 나타낸 것이다.
도 5는, pZRC III- Etanercept-Hyg의 벡터 그림을 나타낸 것이다.
도 6은, pZRC III- FSHα-IRES-FSHβ-Hyg 벡터의 벡터 그림을 나타낸 것이다.
도 7은, pZRC III- FSHβ-IRES-FSHβ-Hyg 벡터의 벡터 그림을 나타낸 것이다.
도 8 은, pZRC III- TNK-Puro의 벡터 그림을 나타낸 것이다.
도 9는, pZRC III-DARBE- Puro의 벡터 그림을 나타낸 것이다.
도 10은, pZRC III- FSHα- IRES- FSHβ-Puro 벡터의 벡터 그림을 나타낸 것이다.
도 11은, pZRC III- FSHα- IRES- FSH β-Neo 벡터의 벡터 그림을 나타낸 것이다.
도 12는, pZRC III- FSHβ- IRES- FSHα-Neo 벡터의 벡터 그림을 나타낸 것이다.
도 13은, pZRC III-Etanercept- Neo의 벡터 그림을 나타낸 것이다.
도 14는, pZRC III-TNK-Neo의 벡터 그림을 나타낸 것이다.
도 2는, pZRC III의 벡터 그림을 나타낸 것이다.
도 3은, pZRC III-TNK-Hyg의 벡터 그림을 나타낸 것이다.
도 4는, pZRC III-Darbe-Hyg의 벡터 그림을 나타낸 것이다.
도 5는, pZRC III- Etanercept-Hyg의 벡터 그림을 나타낸 것이다.
도 6은, pZRC III- FSHα-IRES-FSHβ-Hyg 벡터의 벡터 그림을 나타낸 것이다.
도 7은, pZRC III- FSHβ-IRES-FSHβ-Hyg 벡터의 벡터 그림을 나타낸 것이다.
도 8 은, pZRC III- TNK-Puro의 벡터 그림을 나타낸 것이다.
도 9는, pZRC III-DARBE- Puro의 벡터 그림을 나타낸 것이다.
도 10은, pZRC III- FSHα- IRES- FSHβ-Puro 벡터의 벡터 그림을 나타낸 것이다.
도 11은, pZRC III- FSHα- IRES- FSH β-Neo 벡터의 벡터 그림을 나타낸 것이다.
도 12는, pZRC III- FSHβ- IRES- FSHα-Neo 벡터의 벡터 그림을 나타낸 것이다.
도 13은, pZRC III-Etanercept- Neo의 벡터 그림을 나타낸 것이다.
도 14는, pZRC III-TNK-Neo의 벡터 그림을 나타낸 것이다.
정의
염색질 부착 영역은, 단백질성 핵 매트릭스(proteinaceous nuclear matrix)와 함께 이들의 상호작용을 통해, DNA의 위상학적으로 강요된 루프(topologically constrained loops)를 형성하는 염색질의 구조 성분(structural components of chromatin)이다.
사용된 약어:
CMV --- 거대세포 바이러스(Cytomegalovirus)
TPL --- 삼부 리더(Tripartite Leader)
VA 유전자 또는 VA I 및 II 유전자 --- 바이러스 관련된 RNA 유전자 I 및 II(Virus associated RNA genes I and II)
BGH ---소의 성장 호르몬(Bovine growth hormone)
본 발명은, 포유동물 숙주 세포에서 의미 있는 치료학적 단백질 및 펩티드의 발현의 효율성을 증가시키는 신규한 발현 벡터를 제공한다. 상기 신규한 벡터는, 증가된 전사(transcription)의 장점을 첨가하면서, 위치 효과(position effect)와 연관된 문제점을 추가적으로 제거하고, 번역(translation)이 조절 요소의 유일한 조합과 함께 성취된다.
하나의 실시형태에서, 본 발명은, 흥미있는 유전자에 실시가능하게 결합된 프로모터, 발현 증진 요소, PL, VAI 및 II 유전자 또는 이의 변이체, 번역 종결자 및 항생물질 마커를 포함하는 신규한 발현 벡터를 제공하고, 상기 발현 부착 요소는, 염색질 부착 영역이다. 염색질 부착 영역은 MARs 및 SARs로부터 선택된 것이다.
실시형태에서, 본 발명은, 흥미있는 유전자에 실시가능하게 결합된 프로모터, TPL 및 VA 유전자 I 및 II, 매트릭스 부착 영역(matrix attachment regions)(MARs)/SARs, 번역 종결자(translation terminator), 항생물질 마커를 포함하는 단백질 및 펩티드의 생산을 위한 발현 벡터를 제공한다.
대체적인 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, 클론 부위에 실시가능하게 결합된 프로모터, 흥미있는 유전자, BGH와 같은 번역 종결자, 인트론, 적절한 항생물질 마커, 및 임의적으로 MARs 및/또는 SARs으로부터 선택된 발현 증진 요소(expression enhancing elements)와 함께 내부의 리보솜 결합 부위를 포함한다.
하나의 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, 클론 부위에 실시가능하게 결합된 프로모터, 흥미있는 유전자, BGH와 같은 번역 종결자, TPL, VA I 및 II 유전자, 인트론, 적절한 항생물질 마커 및 MARs 및/또는 SARs로부터 선택된 발현 증진 요소와 함께 임의적으로 내부의 리보솜 결합을 포함한다.
본 발명의 실시형태에 따라, 상기 프로모터는, CMV 프로머터, SV40 프로모터, 아데노바이러스 프로머터(adenovirus promoter), 베타 액틴 프로모터(Beta actin promoter), 금속티오닌 프로모터(metallothionin promoters) 또는 그 밖의 원핵세포(prokaryotic) 또는 진핵생물의 바이러스 프로모터(eukaryotic virus promoters)로 이루어진 군으로부터 선택된 것이다. 바람직한 실시형태에서, CMV 프로머터가 사용된다.
상기 프로모터는 유전자의 가까이에 일반적으로 위치하고, 이는, 동일한 가닥 및 즉, 상기 전사가닥(sense strand)의 5' 영역을 향하는, 업스트림(upstream)에서 조절되고, 이는 전사를 촉진시킨다.
본 발명의 실시형태에 따라, 상기 클론 부위는, AatI, AatII, Acc113I, Acc16I, Acc65I, AccIII, AclNI, AseI, AsnI, Asp718I, BalI, BamHI, BanI, BanII, BbeI, BbiII, BbsI, BbuI, Bbv16II, BclI, BcoI, BglI, BglII, BlnI, Bsh1365I, BsiEI, BsiHKAI, BsiI, BspEIBspHI, BstZI, CciNI, Cfr10I, Cfr42I, Cfr9I, CfrI, Csp45I, DrdI, DsaIEaeI, EagI, Eam1104I, Eco47III, Eco52I, Eco57I, Eco88I, Eco91I, EcoICRI, EcoO109I, EcoRI, EcoT14I, FriOI, FseI, FspI, HaeII, Hin1I, HincII, HindII, KasI, Ksp632I, KspI, KpnI, LspI, MamI, MflI, MluNI, MroI, MroNI, MspA1I, NaeI, NarI, NcoI, NdeI, NgoAIV, NheI, NotI, NspBII, NspI, NspV, PacI, PaeI, PflMI, PinAI, Ple19I, Pme55I, PmeI, Ppu10I, PpuMI, PshBI, Psp124BI, Psp5II, PspAI, PspALI, PspEI, PstI, PstNHI, PvuI, PvuII, SacI, SacII, ScaI, SfcI, SfiI, SpeI, SphI, Van91I, VneI, XhoI, XhoII, XmaI, XmaIII, Zsp2I로부터 선택될 수 있지만, 이로 제한되지 않는다.
본 발명의 실시형태에 따라, 상기 번역 종결자는, 소 성장 호르몬, 아데노바이러스 및 진핵생물 바이러스 번역 종결자 서열로 이루어진 군으로부터 선택된 것이다. 바람직한 실시형태에서, 상기 번역 종결자는 BGH Poly A이다.
추가적인 실시형태에서, 상기 내부의 리보좀 결합 부위(internal ribosomal binding sites)는, 피코르나바이러스 IRES(Picornavirus IRES), 아프타바이러스 IRES(Aphthovirus IRES), 간염 A IRES(Hepatitis A IRES), 간염 C IRES, 페스티바이러스 IRES(Pestivirus IRES), 뇌심근염 바이러스 IRES로부터 선택된 것이고, 바람직하게 뇌심근염 바이러스 IRES이다.
본 발명의 실시형태에 따라, 매트릭스 부착 영역과 같은 발현 증진 요소는, 닭 라이소자임 MAR, 초파리 Scs 경계 요소(Drosophila Scs boundary element), hspSAP MAR, 마우스 T 세포 수용체 TCRa, 랫 유전자자리 대조 영역(rat locus control region), 및 β-글로불린 MAR, 및 아폴리포 단백질 B SAR 요소로부터 선택된 것이다.
바람직한 실시형태에서, 닭 라이소자임 MAR(Sequence id 5)은, 5' 측면 서열(5' flanking sequence) 또는 3' 측면 서열에서 복제된다(cloned). 가장 바람직한 실시형태에서, 닭 라이소자임 MAR은, 전사의 조립(transcriptional assembly)의 5' 및 3' 측면 서열 둘 다에서 클론된다.
본 발명에서, 흥미있는 유전자는, 본 분야에서 알려진 방법에 따라 발현 벡터에서 클론된다(SAMBROOK, J.; FRITSCH, E.F. and MANIATIS, T. Molecular Cloning: a laboratory manual. 2nd ed. N.Y., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, 1989. 1659). 본 발명의 실시형태에 따라, 흥미있는 유전자는, 조직 플라스미노겐 활성인자, TNK-TPA, 다베포이에틴, 에리스로포이에틴, 인슐린, GCSF, 인터류킨, 종양 괴사 인자, 인터페론, TNFR-IgGFc, 리툭시맙, 베바시주맙, 아달리무맙, 트라스투주맙[지네릭 네임(generic names)]과 같은 모노클론항체 및 Fc 영역, Fab와 같은 이들의 단편, GLP-I, GLP-II, IGF-I, IGF-II, 혈소판 유래 증식 인자, FVII, FVIII, FIV 및 FXIII, 엑센딘-3, 엑센딘 4, MYT-2, NF-κB 억제 인자 NRF, AML1/RUNX1, Gtx 호메오도메인 단백질과 같은 전사 인자, 진핵생물 개시 인자 4G(elF4G)a, 진핵생물 개시 인자 4Gl(elF4Gl)a, 사멸 관련 단백질 5(DAP5)와 같은 번역 인자, c-myc, L-myc, Pim-1, 단백질 키나아제 p58PITSLRE, p53과 같은 종양유전자, 여포 자극 호르몬, 융모성 생식선 자극호르몬, 인간 황체형성 호르몬 등으로부터 선택된 생식선 자극 호르몬과 같은 호르몬, 및 면역글로불린 중쇄 결합 단백질(BiP), 열 충격 단백질 70, 미토콘드리아의 H+-ATP 생성효소의 β-서브유닛(subunit), 오르니틴 탈카르복실화효소, 코넥신 32 및 43, HIF-1a, APC 로부터 선택된, 단백질들 및 펩티드들 및 이의 기능적인 유사체들을 코딩할 수도 있다(According to an embodiment of the present invention the gene of interest may encode suitable proteins and peptides and functional analogues thereof selected from tissue plasminogen activator, TNK-TPA, Darbepoietin, Erythropoietin, Insulin, GCSF, Interleukin, Tumor necrosis factor, Interferon, TNFR-IgGFc, Monoclonal antibodies such as Rituximab, Bevacizumab, Adalimumab, Trastuzumab (generic names) and their fragments like Fc region, Fab, GLP-I, GLP-II, IGF-I, IGF-II, Platelet derived growth factor, FVII, FVIII, FIV and FXIII, exendin-3, exendin 4, transcription factors like MYT-2, NF-?B repressing factor NRF, AML1/RUNX1, Gtx homeodomain protein, translation factors like Eukaryotic initiation factor 4G (elF4G)a, Eukaryotic initiation factor 4Gl (elF4Gl)a, Death associated protein 5 (DAP5), oncogene like c-myc, L-myc, Pim-1, Protein kinase p58PITSLRE, p53 hormones such as gonadotropic hormones selected from Follicle stimulating hormone, Human Chorionic Gonadotropin, Human Leutinizing Hormone, etc. and immunoglobulin heavy chain binding protein (BiP), Heat shock protein 70, β-subunit of mitochondrial H+-ATP synthase, Ornithine decarboxylase, connexins 32 and 43, HIF-1a, APC). 이에 따라서, 기능적인 유사체(functional analogues)는, 이의 천연 단백질 및 펩티드와 유사하거나 또는 동일한 기능을 갖는 단백질 또는 펩티드를 의미한다.
본 발명에 따라, 발현 벡터 구조는, 실시가능하게 결합된 프로모터, 클론 부위(cloning sites), 흥미있는 유전자, 전사 종결자, 인트론, 적절한 항생물질 마커, TPL, VA 유전자 I 및 II을 추가적으로 포함하는 발현 조립(expression assembly)을 포함한다. 이러한 발현 벡터는, 서열 id no. 4(6)에 나타낸 pZRCII로서 나타낸다. 또 다른 실시형태에서, 매트릭스 부착 영역(Matrix attachment region, MAR) 또는 SARs, 바람직하게 MAR과 같은 발현 증진 요소의 유전자 서열은 추가적으로 pZRCII에서 클론된다. 이는 새로운 발현 벡터는, 서열 id no 6에 나타낸 pZRCIII로서 나타낸다. 매트릭스 부착 영역은 pZRCIII의 5' 또는 3' 측면 영역(5' or 3' flanking region)에서 클론된다. 바람직한 실시형태에서, 매트릭스 부착 영역은, pZRCIII의 5' 및 3' 측면 영역에서 클론된다. 본 발명의 pZRCIII 구조는, 현저하게 흥미있는 유전자의 발현을 증진시킬 뿐만 아니라, 트랜스펙션 효율성을 개선시키는 것으로서, 선행 기술에 알려진 벡터를 넘어 향상된 것이다. 본 벡터 구조 pZRCIII는 모든 단백질 및 펩티드의 발현에 적합하다.
발현 벡터 pZRCIII에서 적절한 항생물질 마커는, 카나마이신(kanamycine), 히그로마이신 퓨로마이신(hygromycin puromycin), 및 DHFR로부터 선택된 것이다. 또 다른 실시형태에서, 상기 발현 벡터 pZRCIII는,임의적으로 DHFR 및/또는 내부의 리보솜의 결합 부위(internal ribosomal binding site, IRES)의 유전자 서열을 운반한다(carries).
하나의 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs로부터 선택된 발현 증진 요소와 결합하여, 클론 부위, 흥미있는 유전자, 번역 종결자, TPL(Seq ID no. 2), VA I 및 II 유전자(Seq ID no. 3), 적절한 항생물질 마커를 포함한다.
또 다른 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs로부터 선택된 발현 증진 요소와 결합하여, 클론 부위에 실시가능하게 결합된 프로모터, 흥미있는 유전자, 번역 종결자, 인트론(Seq ID no. 1), 적절한 마커 및 임의적으로 내부의 리보좀 결합 부위를 포함한다.
단백질 및 펩티드의 원하는 발현의 생산을 위한 발현 벡터는, 적절한 요소를 포함하지만, 3 가지 요소, 즉 프로모터의 3' 말단에서의 아데노바이러스성 삼부 리 더 서열(Adenoviral Tripartite leader sequence), 아데노바이러스 주요한 최근의 전사물(adenovirus major late transcript)의 5' 제공 부위(5' donor site) 및 TPL의 3' 말단에 위치하는 마우스 면역글로불린의 3' 절단 부위(3' splice site)(Seq ID no. 2)를 포함하는 혼성 (키메라) 인트론[hybrid (chimeric) intron], 아데노바이러스성 VA RNA I 및 II 유전자(Seq ID no. 3)로 한정하는 것은 아니다. 매트릭스 부착 영역은, Mlu I에서 5' 측면 서열(5' flanking sequence) 또는 BGH 폴리 A 서열의 말단에서 3' 측면 서열(3' flanking sequence)에서 클론된다. 매트릭스 부착 영역의 방향(orientation)은 선택적이다. 게다가, 본 발명의 MARs 요소는, 아세노바이러스성 삼부 리더 서열, 혼성 (키메라) 인트론, TPL (Seq ID no. 2) 및 아데노바이러스성 VA RNA I 및 II 유전자(Seq ID no. 3)와 결합하여, 상승 작용에 의해 원하는 유전자의 발현을 증진시킬 뿐 아니라, 트랜스펙션 효율 및 원하는 클론의 수를 증가시킨다.
바람직한 실시형태에서, 본 발명은, 치료학적 단백질 및 펩티드의 발현을 위한 신규한 발현 벡터 구조를 제공하고, 상기 발현 벡터 구조는, MARs 및/또는 SARs로부터 선택된 발현 증진시키는 요소(expression enhancing elements)와 결합하여, 클론 부위에 실시가능하게 결합된 프로모터, 흥미로운 유전자, 전사 종결자, TPL(Seq ID no. 2), VA I 및 II 유전자(Seq ID no. 3), 인트론(Seq ID no. 1), 적절한 마커 및 임의적으로 내부의 리소좀 결합을 포함한다. 실시형태에서, 상기 발현 벡터는, 흥미있는 유전자에 실시가능하게 결합된 프로모터 또는 이의 변이체, VA I 및 II 유전자 또는 이의 변이체, TPL 또는 이의 변이체, 키메라 인트론(Chimeric Intron) 또는 이의 변이체, 항생물질 마커, 매트릭스 부착 영역, 임의적으로 내부의 리보솜 결합 부위, 소의 성장 호르몬 폴리아데닐화(Bovine growth harmone polyadenylation)를 포함한다.
하나의 실시형태에서, 흥미있는-히그로마이신 벡터의 PZRCIII-유전자는, CMV 프로모터에 의해 유도된 흥미있는 유전자와 실시가능하게 결합된 서열 id no 5에 나타낸 cLysMARs(cLysMARs setforth the in sequence id no 5 operably linked with gene of interest driven by a CMV promoter), TPL, 서열 id no 1에 나타낸 키메라 인트론(chimeric intron), 서열 id no.3에 나타낸 VA 유전자 I 및 II, BGH 폴리아데닐화(polyadenylation) 및 다수의 클론 부위(multiple cloning sites)를 포함한다. 다수의 클론 부위는, XhoI, NotI와 같은 제한 부위를 포함한다. 흥미있는 어떠한 유전자는, 발현 카세트 외부에 위치하는 VA 유전자 및 발현 카세트에서 CMV 프로모터, TPL, 키메라 인트론(chimeric intron)과 같은 그 밖의 조절 요소와 함께, 상기 발현 카세트의 업스트림(upstream) 및 다운스트림(downstream) 둘 다에서 닭 라이소자임 MAR 요소를 갖는 벡터의 다수의 클론부위(multiple cloning site) 내로 클론된 융합 단백질 에타너셉트(fusion protein Etanercept)(TNFR-Fc)의 화학적으로 합성된 유전자와 유사한 다수의 클론 부위에서 클론될 수 있다. 상기 벡터는, 트랜스팩턴트의 선별을 위한 히그로마이신 저항성 유전자를 갖는다(The vector has a hygromycin resistance gene for selection of transfectants). 본 발명의 이러한 양상에 따라 제조된 벡터 구조의 예로서, pZRCIII-에타너셉트에타너셉트(etanerceptetanercept)-히그로마이신 벡터가 부다페스트 조약(Budapest treaty) 하에 맡겼고, 접근 번호(accession number)는 MTCC 5656이다.
또 다른 실시형태에서, 흥미있는-네오마시니 벡터의 PZRCIII-유전자는, CMV 프로모터와 실시가능하게 결합된 서열 id no 5에 나타낸 C-Lys-MARs, TPL, 서열 id no 1에 나타낸 키메릭 인트론(chimeric intron), 서열 id no. 3에 나타낸 VA 유전자 I 및 II, BGH 폴리아데닐화(BGH polyadenylation) 및 다수 클론 부위를 포함한다. 다수 클론 부위는, XhoI, NotI와 같은 제한 부위를 포함한다. 흥미있는 어떠한 유전자는, 상기 발현 카세트에서 CMV 프로모터, TPL, 키메릭 인트론과 같은 그 밖의 조절 요소 및 발현 카세트 외부에 위치한 VA 유전자(VA genes placed outside the expression cassette)와 결합하여, 상기 발현 카세트의 업스트림 및 다운스트림 둘 다에서 닭 리소자임 MAR 요소를 갖는 벡터의 다수의 클론 부위 내로 클론된 융합 단백질 에타너셉트(TNFR-Fc)의 화학적으로 합성된 유전자와 같은 다수 클론 부위에서 클론될 수 있다. 상기 벡터는 트랜스펙턴트(transfectants)의 선별을 위해 히그로마이신(네오마이신) 저항성 유전자를 갖는다.
본 발명의 이러한 양상에 따라 제조된 벡터 구조의 예로서, pZRCIII-에타너셉트-네오마이신 벡터는 부다페스트 조약(Budapest treaty) 하에 맡겼고, 접근 번호(accession number)는 MTCC 5657이다.
다른 실시형태에서, 흥미있는-IRES-히그로마이신 벡터(interest-IRES-Hygromycin vector)의 PZRCIII-유전자는, CMV 프로모터에 실시가능하게 결합된 서열 id no 5 에 나타낸 cLysMARs, TPL, 서열 id no 1에 나타낸 키메릭 인트론, 서열 id no. 3에 나타낸 VA 유전자 I 및 II, BGH 폴리아데닐화 및 다수의 클론 부위를 포함한다. 다수의 클론 부위는, XhoI, NotI와 같은 제한 부위를 포함한다. 흥미있는 어떠한 유전자는, 발현 카세트에서 CMV 프로모터, TPL, 키메릭 인트론과 같은 그 밖의 조절 요소 및 상기 발현 카세트의 외부에 위치한 VA 유전자와 함께, 벡터의 다중 클론 부위 내로 클론된 FSH α 및 FSH β 서브유닛(subunits) 및 발현 카세트의 업스트림 및 다운스트림 둘 다에서 닭 라이소자임 MAR 요소를 갖는, IRES에 의해 각각 실시가능하게 결합된 둘 다 FSH α 및 FSH β 서브유닛 둘 다의 화학적으로 합성된 유전자와 같은 다수 클론 부위에서 클론될 수 있다. 상기 벡터는 트랜스펙턴트의 선별을 위해 히그로마이신 저항성 유전자를 갖는다. 본 발명의 이러한 측면에 따라 제조된 벡터 구조의 예로서, pZRCIII FSH α-IRES-FSH β 히그로마이신 벡터는 부다페스트 조약(Budapest treaty) 하에 맡겼고, 접근 번호(accession number)는 MTCC 5655이다.
실시형태에서, 본 분야의 숙련자에게 알려진 방법에 의해 포유동물 숙주 세포로 트랜스펙션된다. 포유동물 숙주 세포는, 단백질의 상업적인 생산을 위해 널리 알려진, CHO[중국 햄스터 난소(Chinese hamster ovary)] 세포주, BHK[어린 햄스터 신장(Baby hamster kidney)] 세포주 등으로부터 선택될 수도 있다. 또 다른 실시형태에서, 상기 트랜스펙션된 숙주 세포는, 흥미있는 유전자의 추가적인 발현을 증가시키도록, 카나마이신, 히그로마이신, 퓨로마이신으로부터 선택된 적절한 항생물질을 포함하는 상이한 벡터로 추가적으로 트랜스펙션된다.
하나의 실시형태에서, 상기 트랜스펙션된 세포주는, 히그로마이신, 퓨로마이신, 카나마이신, G418 또는 그 밖의 항생물질을 사용함으로써 선택된 CHO K1 이다.
게다가, 상기 트랜스펙션된 세포주는, 만약 상기 발현 벡터가 DHFR의 유전자를 운반한다면, 예를 들어, 메토트렉세이트, DHFR 선택 배지를 사용함으로써 선택된다. 이러한 선택은, 상기 트랜스펙션된 세포주에서 선택 압력에서 점진적으로 증가에 의존한다(Kaufman and Sharp, 1982; Schimke et al., 1982).
또 다른 실시형태에서, 상기 트랜스펙션된 세포주는, 발현 벡터가 글루타민 합성효소(Glutamine synthetase)의 유전자를 운반하는 바와 같이, 글루타민 합성효소(GS) 선택 배지, 예를 들어 메티오닌 술폭시민(methionine sulphoximine)(MSX)에서 선택된다.
이런 이유로, 본 발명은, 현저하게 전사 및 번역을 증가시키고, 또한 유전자 통합의 위치 효과를 억제하는, 조절 요소(regulatory elements)의 유일한 조합(unique combination)을 포함하는 신규한 발현 벡터를 제공하고, 따라서 상기 재조합 단백질의 안정되고, 높은 발현에 대한 상승 효과(synergistic effect)를 제공한다. 게다가, 이는, 많은 수의 클론의 노동 집약적인 선별이 일반적인 요소(typical element)의 존재에서 급격히 감소되는 바와 같은, 시간 효과적인 방식에서의 산업적인 규모에서의 치료학적 단백질 및 펩티드, 모노클로날 항체의 생산을 제공한다. 게다가, 본 발현 벡터는, 안정되고 일시적인 발현 둘 다에 사용될 수 있다.
본 발명은, 실시예의 도움과 함께 추가적으로 설명된다. 실시예는, 설명적인 목적을 위해서만 나타낸 것이고, 본 발명은 이들만으로 제한되는 것은 아니다.
실시예
1.
pZRC
III
벡터의 구성
모든 조절 요소, 즉 TPL, VA, CMV 프로모터, 키메릭 인트론 및 BGH 폴리아데닐환 및 종결 서열(termination sequences)과 함께 전체의 전사 조립(whole transcription assembly)은 독일 GeneART에서 화학적으로 합성된, 특허 출원 WO2007017903에 기재되어 있다. 클로닝 벡터 pMK (GeneART, Germany)에서 클론된 이러한 전체 조립(this whole assembly)(GeneART, Germany)은, pZRC II (도 1, Seq ID No. 4)라고 부른다. 닭 라이소자임 MAR DNA 단편(Seq ID No 5)(Phi-Van, L. and Stratling,W.H, Biochemistry 35 (33), 10735-10742 (1996))은 화학적으로 합성되고, 클로닝 벡터(cloning vector)에서 클론된다. 두 개의 닭 라이소자임 MAR 단편은, 상기 벡터 내로 이미 예비-디자인된(pre-designed) SacI 및 MluI 부위를 사용하여, pZRC II 벡터에서 발현 카세트의 어느 한 쪽에서의 측면(flanks)으로서 삽입된다. SacI 오버행(SacI overhang)은, SacI 부위를 갖는 프라이머를 사용하여 PCR에 의해 닭 라이소자임 MAR 단편에 첨가되었다. 명확하게, 40 사이클의 PCR 증폭(amplification)은, 50 mM Tris-Cl(pH 8.3), 2.5 mM MgCl2, 각각 250 μM의 4 dNTPs 및 Pfu 중합효소의 5 유닛을 포함하는 50 ㎕의 부피에서의 유전자 특이적인 올리고뉴클레오티드 프라이머(gene specific oligonucleotide primers)의 100 피코몰(100 picomoles)을 사용하여 실행하였다. 각각의 PCR 증폭 사이클은, 30 sec 동안 95 ℃[변성(denaturation)], 30 sec 동안 62 ℃[어닐링(annealing)] 및 2 min 동안 72 ℃[확장(extension)]으로 이루어져 있다. PCR 반응의 증폭된 생산물은, 1 % 아가로스 겔(Agarose gel)에서 용해된다(resolved). 대략 1664 염기쌍 크기(approx 1664 base pairs size)의 원하는 단편을 겔로부터 잘라내고, Qiagen Gel 추출 키트를 사용하여 정제되었다. 이러한 정제된 DNA 단편은, Sac I(MBI Fermentas, USA)와 함께 상기 정제된 PCR 생산물 및 벡터 둘 다의 제한 절단(restriction digestion) 후에 pZRC II 벡터 내로 연결되었다(ligated). 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 수득된 형질전환체(transformant)는 카나마이신 저항을 기초로 기록된다. 적은 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소를 사용하여 제한 절단에 의해 닭 라이소자임 MAR 단편의 존재를 위해 분석된다. pZRC II 벡터에서 정확한 통합(correct integration)을 갖는 것으로 발현된 하나의 이러한 플라스미드는 pZRC II 1MAR (Sac) 매개 벡터[pZRC II 1MAR (Sac) intermediate vector]로 명명되었다.
또 다른 닭 라이소자임 MAR 단편에 Mlu I 오버행(Mlu I overhang)을 첨가하기 위해, 이를, 50 mM Tris-Cl (pH8.3), 2.5 mM MgCl2, 4 dNTPs의 250 μM 각각 및 5 units의 Pfu 중합효소를 포함하는 50 ㎕의 부피에서 유전자 특이적인 올리고뉴클레오티드 프라이머의 100 피코몰(picomoles)을 사용하여 PCR 증폭의 40 사이클을 하였다. 각각의 PCR 증폭 사이클은, 30 sec 동안 95 ℃(변성), 30 sec 동안 62 ℃(어닐링) 및 2 min 동안 72 ℃(확장)으로 이루어져 있다. PCR 반응의 증폭된 생산물은 1 % 아가로스 겔에 용해시켰다. 대략 1664 염기쌍 크기(approx 1664 base pairs size)의 원하는 단편을 겔로부터 잘라내고, Qiagen Gel 추출 키트를 사용하여 정제되었다. 이러한 정제된 DNA 단편은, Mlu I(MBI Fermentas, USA)와 함께 상기 정제된 PCR 생산물 및 벡터 둘 다의 제한 절단(restriction digestion) 후에 pZRC II-1MAR(Sac) 벡터 내로 연결되었다. 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformant)는 카나마이신 저항을 기초로 기록된다. 약 10 개의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소를 사용하여 제한 절단에 의해 MluI 위치에서 닭 라이소자임 MAR 단편의 존재를 위해 분석되었다. pZRC II-1MAR(Sac) 벡터에서 MluI 부위에서 cLysMAR의 정확한 통합을 갖는 것으로 발견된 하나의 이러한 플라스미드는 pZRC III로 명명된다(도 2, Seq ID no 6).
실시예
2.
pZRC
III
-
TNK
벡터의 구조
테넥테플라즈(Tenecteplase)(TNKase 또는 TNK-TPA) 유전자(Seq ID No7)는 화학적으로 합성되고, 클로닝 벡터 pMK (Geneart, Germany) 내로 클론된다. pZRC II 벡터에서 TNK 유전자를 클론하기 위해, 첫 번째 EcoR I 및 Not I 오버행은 50 mM Tris-Cl (pH8.3), 2.5 mM MgCl2, 4 dNTPs의 250 μM 각각 및 5 units의 Pfu 중합효소를 포함하는 50 ㎕의 부피에서 상기 제한 부위를 포함하는 특이적인 올리고뉴클레오티드 프라이머의 100 피코몰(picomoles)을 사용하여 PCR 증폭의 40 사이클을 사용하여 TNK 유전자 내로 포함되었다. 각각의 PCR 증폭 사이클은, 30 sec 동안 95 ℃(변성), 30 sec 동안 62 ℃(어닐링) 및 2 min 동안 72 ℃(확장)에서의 배양(incubation)으로 이루어져 있다. PCR 반응의 증폭된 생산물은 1 % 아가로스 겔에 용해시켰다. 크기에서 대략 1710 염기쌍의 원하는 단편을 겔로부터 잘라내고, Qiagen Gel 추출 키트를 사용하여 정제되었다. TNK의 이러한 정제된 DNA 단편은 EcoR I 및 Not I으로 절단되고, EcoR I 및 Not I (MBI Fermentas, USA)과 함께 절단된 pZRC III 벡터(실시예 1에 기재되어 있음) 내로 연결된다(ligated). 상기 연결 생산물(ligation product)은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformant)는 카나마이신 저항의 기초로 기록된다. 약 10 개의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소를 사용하여 제한 소화에 의해 TNK 단편의 존재를 위해 분석되었다. pZRC III 벡터에서 통합된 TNK 유전자를 갖는, 하나의 이러한 플라스미드는, pZRC III-TNK로 명명된다.
실시예
3.
pZRC
III
-
TNK
-
Hyg
벡터의 구조
히그로마이신 저항성 유전자로 조절된 종결자 및 SV40 프로모터를 갖고 대략 1550 염기쌍의 히그로마이신 전사 조립(Hygromycin transcription assembly)은 Pfu 중합효소(MBI Fermentas, USA)를 사용하여 뭉툭하게 절단되고(blunt ended), 그리고 난 다음에 Kpn I (MBI Fermentas, USA)로 미리 절단된, pZRC III-TNK 벡터 내로 연결되고, Pfu 중합효소를 사용하여 무디게 만들었다(blunted). 연결 생산물(ligation product)을, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 히그로마이신 저항 유전자의 존재에 대해 분석되었다. pZRC III-TNK 에 연결된 히그로마이신 전사 조립(Hygromycin transcription assembly)을 갖는 하나의 이러한 플라스미드가 pZRC III-TNK-Hyg 벡터로 명명되었다(도 3, Seq ID No.8). 그리고 난 다음에, 이러한 벡터를, 상기 클론된 TNK 유전자의 서열을 확인하기 위해, 자동화된 DNA 서열기(ABI)를 사용하여 DNA를 시퀀싱하였다(This vector was then subjected to DNA sequencing using automated DNA sequencer to verify the sequence of the cloned TNK gene).
실시예
4.
pZRC
III
-
Darbe
-
Hyg
벡터의 구조
pZRC - EPO (WO2007017903)는, TA 벡터 pTZ57R (MBI Fermentas)에서 클론된 다음에, pTZ57R-Darbe로 명명된, 대략 600 bp의 다베포이에틴 유전자 단편(Darbepoetin gene fragment)(Seq ID No.9 및 이에 상응하는 DNA 서열 ID 21)을 수득하기 위해, 에리스로포이에틴 유전자의 부위 지정 돌연변이(site directed mutagenesis)를 수행하기 위한 주형(template)으로서 사용된다.
pZRC III-TNK-Hyg는, TNK 유전자를 제거하기 위해 Xho I 및 Not I으로 절단시키고, 남아있는 높은 분자량 DNA(remaining high molecular weight DNA)는 다베포이에틴 유전자 삽입물(Darbepoetin gene insert)과 함께 연결을 위해 벡터로서 사용된다. pTZ57R-Darbe는 대략 600 bp 다베포이에틴 유전자 단편을 겔 분리하기 위해 Xho I 및 Not I 으로 절단되었다. 벡터 및 삽입물 둘 다의 연결을 실행하고, 상기 연결 생산물을 E. coli Top 10F'에서 변형되고, 형질전환체는 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 다베포이에틴 유전자(Darbepoetin gene)의 존재에 대해 분석되었다. 연결된 다베포이에틴 유전자를 갖는 하나의 이러한 플라스미드는 pZRC III-Darbe-Hyg 벡터로 명명된다(도 4, Seq ID No. 10). 그리고 난 다음에, 이러한 벡터를, 상기 클론된 다베포이에틴 유전자의 서열을 확인하기 위해, 자동화된 DNA 서열기(automated DNA sequencer)(ABI)를 사용하여 DNA를 시퀀싱하였다
실시예
5.
pZRC
III
-
Etanercept
-
Hyg
벡터의 구조
벡터 pZRC III- Darbe-Hyg는, 대략 600 bp의 다베포이에틴 유전자를 제거하고, 대략 9430 bp의 벡터 골격(vector backbone)을 생성하기 위해, Xho I 및 Not I 효소(MBI Fermentas)로 절단되었다. 대략 1481 bp의 화학적으로 합성된, CHO 코돈 최적화된, 에타너셉트 유전자(Etanercept gene)(Seq ID No. 11 및 이에 상응하는 DNA 서열 ID 22)는, 삽입물을 수득하기 위해, Xho I 및 Not I (MBI Fermentas)를 사용하여 상기 클로닝 벡터로부터 분리된다. 벡터 및 삽입물 둘 다의 연결이 실행되고, 연결 생산물(ligation product)은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 에타너셉트 유전자의 존재에 대해 분석되었다. 연결된 에타너셉타 유전자를 갖는 하나의 이러한 플라스미드는 pZRC III-Etanercept-Hyg 벡터로 명명되었다(도 5, Seq ID No. 12). 그리고 난 다음에, 이러한 벡터를, 상기 클론된 에타너셉타 유전자의 서열을 확인하기 위해, 자동화된 DNA 서열기(automated DNA sequencer)(ABI)를 사용하여 DNA를 시퀀싱하였다.
실시예
6.
pZRC
III
-
FSH
α-
IRES
-
FSH
β-
Hyg
벡터의 구조
a)
pZRC
III
-
FSH
α
-
Hyg
벡터의 구조
대략 9430 bp의 벡터 골격(vector backbone)은, 대략 600 bp의 다베포이에틴 유전자를 제거하기 위해, Xho I 및 Not I (MBI Fermentas)로 pZRC III- Darbe-Hyg 벡터로 절단시킴으로써 생산된다. 대략 359 bp의 FSH 알파 서브유닛(FSH alpha subunit)의 화학적으로 합성된 유전자(Seq ID No. 13 이에 상응하는 DNA 서열 ID 23)는, 효소 Xho I 및 Not I(MBI Fermentas)를 사용하여, 진아트 클로닝 벡터 pMA(Geneart cloning vector pMA)로부터 분리된다. 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 FSH 알파 서브유닛 유전자의 존재에 대해 분석되었다. 상기 연결된 FSH 알파 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는 pZRC III-FSH α-Hyg 벡터로 명명된다.
b)
pZRC
III
-
FSH
α-
IRES
-
FSH
β-
Hyg
벡터의 구조
벡터 pZRC III-FSH α-Hyg는, 대략 9790 bp의 상기 벡터 골격을 생성하기 위해, Not I(MBI Fermentas)로 절단되었다. 대략 591 bp의 IRES 유전자 단편(Seq ID No. 14)은, 첫 번째 삽입물을 수득하기 위해, 효소 Not I 및 Xma I(MBI Fermentas)를 사용하여 벡터 pIRES Hyg로부터 분리된다. 대략 401 bp의 FSH 베타 서브유닛(Seq ID No. 15 이에 상응하는 DNA 서열 ID 24)의 화학적으로 합성된 유전자는, 두 번째 삽입물을 수득하기 위해, 효소 Xma I 및 Not I (MBI Fermentas)를 사용하여 진아트 클론 벡터 pMA(Geneart cloning vector pMA)로부터 분리된다. 상기 2 개의 삽입물을 융합시키고, 상기 융합된 유전자 생산물을 상기 벡터와 함께 연결시켰다. 상기 연결 생산물을, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 IRES 및 FSH 베타 서브유닛 유전자의 존재에 대해 분석되었다. IRES 및 FSH 베타 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III - FSH α- IRES - FSH β- Hyg 벡터로 명명된다(도 6, Seq ID No. 16). 그리고 난 다음에, 이러한 벡터를, FSHα 및 FSHβ 유전자의 서열을 확인하기 위해, 자동화된 DNA 서열기(ABI)를 사용하여 DNA를 시퀀싱하였다. 상기 클론도니 유전자의 서열은, 자동화된 DNA 서열기(ABI)를 사용함으로써 확인되었다.
실시예
7.
pZRC
III
-
FSH
β-
IRES
-
FSH
α-
Hyg
벡터의 구조
a)
pZRC
III
-
FSH
β
-
Hyg
벡터의 구조
벡터 pZRC III- FSHα-IRES-FSHβ-Hyg는, FSHα, IRES 및 FSHβ 유전자의 제거 후에, 대략 9430 bp의 벡터 골격을 생성하기 위해, Xho I 및 Not I (MBI Fermentas)로 절단되었다. 대략 401 bp의 FSH 베타 서브유닛의 화학적으로 합성된 유전자는, 효소 Xho I 및 Not I (MBI Fermentas)를 사용하여 진아트 클로닝 벡터 pMA(Geneart cloning vector pMA)로부터 분리된다. 상기 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생성물을 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 FSH 베타 서브유닛 유전자의 존재에 대해 분석되었다. 상기 연결된 FSH 베타 서브유닛을 갖는 하나의 이러한 플라스미드는 pZRC III-FSH β-Hyg 벡터로 명명된다.
b)
pZRC
III
-
FSH
β-
IRES
-
FSH
α-
Hyg
벡터
의 구조
벡터 pZRC III- FSH β-Hyg는, 대략 9790 bp의 상기 벡터 골격을 생성하기 위해 Not I (MBI Fermentas)로 절단된다. 대략 591 bp의 IRES 유전자 단편은, 첫 번째 삽입물(IRES)를 수득하기 위해, 효소 Not I 및 Xho I (MBI Fermentas)를 사용하여 벡터 pIRES Hyg로부터 분리된다. 대략 359 bp의 FSH 알파 서브유닛의 화학적으로 합성된 유전자는, 두 번째 삽입물을 수득하기 위해, 효소 Xho I 및 Not I (MBI Fermentas)를 사용하여 진아트 클로닝 벡터 pMA로부터 분리된다. 이는 상기 벡터 및 2 개의 삽입물의 세 조각 연결이 뒤따른다(This was followed by three piece ligation of the vector and the 2 inserts). 상기 연결 생산물(ligation product)을, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 IRES 및 FSH 알파 서브유닛 유전자의 존재에 대해 분석되었다. 연결된 IRES 및 FSH 알파 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III FSH β- IRES - FSH α- Hyg 벡터로 명명된다(도 7). 상기 클론된 유전자의 서열은, 자동화된 DNA 서열기(automated DNA sequencer)(ABI)를 사용하여 확인되었다.
실시예
10.
pZRC
III
-
TNK
-
퓨로마이신
벡터의 구조
SV40 프로모터 및 종결자 조절된 퓨로마이신 저항 유전자를 갖고, BamH1 호환가능한 말단을 운반하는 크기로 대략 1110 염기쌍의 퓨로마이신 전사 조립은 BamH I(MBI Fermentas, USA)로 또한 절단된 pZRC III-TNK 벡터 내로 연결된다(The Puromycin transcription assembly of approx 1110 base pairs in size having the SV40 Promoter and terminator controlled Puromycin resistance gene and carrying BamH1 compatible ends ligated into pZRC III-TNK vector which was also digested with BamH I). 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소를 사용하여 제한 절단에 의해 퓨로마이신 단편의 존재를 위해 분석된다. pZRC III- TNK 벡터에서 연결된 퓨로마이신 전사 조립을 갖는 하나의 이러한 플라스미드는, pZRC III- TNK-Puro 벡터로 명명된다(도 8, Seq ID No. 17). 상기 클론된 TNK 유전자의 서열은, 자동화된 DNA 서열기(ABI)를 사용함으로써 확인되었다.
실시예
11.
pZRC
III
-
다베포이에틴
-
Puro
벡터(
pZRC
III
-
Darbepoetin
-
Puro
vector)의 구조
pZRC III-TNK-Puro는, TNK 유전자 단편을 제거하기 위해 Xho I 및 Not I (MBI Fermentas)로 절단된다. pTZ57R-Darbe는, 대략 600 bp 다베포이에틴 유전자 단편을 겔 분리하기 위해 Xho I 및 Not I으로 절단된다. 벡터 및 삽입물 둘 다의 연결을 하였다. 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 다베포이에틴 유전자 단편의 존재에 대해 분석되었다. 하나의 이러한 플라스미드는 pZRC III-Darbe-Puro 벡터로 명명된 연결된 다베포이에틴 유전자를 갖는 것이다(도 9, Seq ID No. 18). 상기 클론된 다베포이에틴 유전자의 서열은, 자동화된 DNA 서열기(automated DNA sequencer)(ABI)를 사용함으로써 확인된다.
실시예
12.
pZRC
III
-
FSH
α-
IRES
-
FSH
β-
Puro
벡터의 구조
pZRC III- FSHα-IRES-FSHβ-Puro 벡터로부터의 히그로마이신 카세트가 제거되고, 특정한 올리고뉴클레오티드 프라이머(specific oligonucleotide primers)와 함께 PCR 반응을 사용하여, pZRC III-Darbe-Puro로부터 확장된 퓨로마이신 저항 유전자 통제된 종결자 및 SV40 프라이머를 갖는 크기에서 대략 1110 염기쌍의 퓨로마이신 전사 조절로 교체된다(Hygromycin cassette from pZRC III- FSHα-IRES-FSHβ-Puro vector was removed and replaced with the Puromycin transcription assembly of approx. 1110 base pairs in size having the SV40 Promoter and terminator controlled Puromycin resistance gene amplified from pZRC III-Darbe-Puro using a PCR reaction with specific oligonucleotide primers). 상기 수득된 PCR 생산물은 특정한 엔도뉴클레아제(specific endonucleases)를 사용하여 절단되고, 벡터 골격과 함께 추가적인 연결에 사용된다. 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 퓨로마이신 저항 유전자의 존재에 대해 분석되었다. 상기 연결된 퓨로마이신 저항 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III - FSH α- IRES - FSH β- Puro 벡터로 명명된다(도 10).
실시예
13.
pZRC
III
-
FSH
α-
IRES
-
FSH
β-
네오
벡터의 구조
벡터 pZRC III- FSHα- IRES- FSHβ-Puro는, 퓨로마이신 저항 유전자의 제거 후에, 대략 9980 bp의 벡터 골격을 생산하기 위해, Pac I 및 Bam HI (MBI Fermentas)로 절단된다. 대략 1518 bp의 네오마이신 저항 유전자는, pcDNA 3.1 (Invitrogen) 플라스미드로부터 분리된다. 상기 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 네오마이신 저항 유전자의 존재에 대해 분석되었다. 연결된 네오마이신 저항 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III - FSH α- IRES - FSH β- Neo 벡터로 명명된다(도 11). FSHα, IRES 및 FSHβ 유전자의 서열은 자동화된 DNA 서열기(ABI)를 사용함으로써 확인된다.
실시예
14.
pZRC
III
-
FSH
β-
IRES
-
FSH
α-
Neo
벡터의 구조
a)
pZRC
III
-
FSH
β
-
Neo
벡터의 구조
벡터 pZRC III- FSHα- IRES-FSH β-Neo는, FSHα, IRES 및 FSH β 유전자의 제거 후에, 대략 9400 bp의 상기 벡터 골격을 생성하기 위해, Xho I 및 Not I (MBI Fermentas)로 절단된다. 대략 401 bp의 FSH 베타 서브유닛의 화학적으로 합성된 유전자는, 효소 Xho I 및 Not I (MBI Fermentas)를 사용하여 진아트 클로닝 벡터 pMA로부터 분리된다. 상기 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 FSH 베타 서브유닛 유전자의 존재에 대해 분석되었다. 상기 연결된 FSH 베타 서브유닛을 갖는 하나의 이러한 플라스미드는 pZRC III- FSH β-Neo 벡터로 명명된다.
b) pZRC III FSH β- IRES - FSH α- Neo 벡터 의 구조
벡터 pZRC III- FSH β-Neo는 대략 9800 bp의 상기 벡터 골격을 생성하기 위해, Not I (MBI Fermentas)로 절단된다. 대략 591 bp의 IRES DNA단편은, 첫 번째 삽입물을 수득하기 위해, 효소 Not I 및 Xho I(MBI Fermentas)를 사용하여 벡터 pIRES Hyg로부터 분리된다. 대략 359 bp의 FSH 알파 서브유닛의 화학적으로 합성된 유전자는, 두 번째 삽입물을 수득하기 위해, 효소 Xho I 및 Not I (MBI Fermentas)를 사용하여 진아트 벡터 pMA(Geneart vector pMA)로부터 분리된다. 이는 상기 벡터 및 2 개의 삽입물의 세 개의 조각의 연결이 뒤따른다. 그리고 난 다음에, 상기 연결 생산물은, E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 IRES 및 FSH 알파 서브유닛 유전자의 존재에 대해 분석되었다. 상기 연결된 IRES 및 FSH 알파 서브유닛 유전자를 갖는 하나의 이러한 플라스미드는, 수득된 pZRC III FSH β- IRES - FSH α- Neo 벡터로 명명되었다(도 12). 상기 클론된 유전자의 서열은, 자동화된 DNA 서열기(ABI)를 사용함으로써 확인된다.
실시예
17.
pZRC
III
-
Etanercept
-
Neo
벡터의 구조
벡터 pZRC III- FSHα-IRES- FSHβ-Neo는, FSHα, IRES 및 FSHβ 유전자를 제거하고, 에타너셉트 유전자(Etanercept gene)를 클로닝하기 위해 사용될 수 있도록, 대략 9400 bp의 상기 벡터 골격을 수득하기 위해, Xho I 및 Not I (MBI Fermentas) 효소와 함께 절단되었다. 에타너셉트의 대략1481 bp 유전자는, 상기 삽입물을 수득하기 위해, Xho I 및 Not I(MBI Fermentas) 효소를 사용하여 벡터 pZRC III-Etanercept-Hyg 로부터 분리되었다. 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 에타너셉트 유전자의 존재에 대해 분석되었다. 통합된 에타너셉트 유전자를 갖는 하나의 이러한 플라스미드는, pZRC III-Etanercept-Neo 벡터로 명명된다(도 13, Seq ID No. 19). 상기 클론된 에타너셉트 유전자의 서열은 자동화된 DNA 서열기(ABI)를 사용함으로써 확인되었다.
실시예
18.
pZRC
III
-
TNK
-
Neo
벡터의 구조
벡터 pZRC III-Etanercept-Neo는, 대략 1481 에타너셉트 유전자(Etanercept gene)를 제거하고, 대략 9400 bp의 벡터 구조를 수득하기 위해, 효소 Xho I 및 Not I (MBI Fermentas)로 절단된다. 대략 1692 bp의 TNK 유전자의 삽입물은, Xho I 및 Not I 효소(MBI Fermentas)로 상기 벡터 pZRC III - TNK - Hyg를 절단한 후에 수득되었다. 상기 벡터 및 삽입물 둘 다의 연결을 수행하고, 상기 연결 생산물은 E. coli Top 10F'에서 변형되고(transformed), 형질전환체(transformants)가 카나마이신 저항의 기초로 기록된다. 몇몇의 이러한 콜로니로부터 분리된 플라스미드 DNA는, 다양한 제한 효소(restriction enzymes)를 사용하여 제한 절단(restriction digestion)에 의해 TNK 유전자의 존재에 대해 분석되었다. 상기 연결된 TNK 유전자를 갖는 하나의 이러한 플라스미드는 pZRC III-TNK-Neo 벡터로 명명된다(도 14). 상기 클론된 TNK 유전자의 서열은, 자동화된 DNA 서열기(ABI)를 사용함으로써 확인되었다.
실시예
19.
에타너셉트의
발현
Set
Ⅰ
-
pZRC
III
-
Etanercept
-
Hyg
벡터를 사용하여
CHO
-
K1
-S 세포주에서 안정된
트랜스펙션
FreestyleTM CHO-K1-S 세포는, 4 mM 글루타민으로 보충된, PowerCHO2 CD 배지[화학적 규명된 배지(chemically defined medium), Lonza]에서 일상적으로 배양된다. 세포는, 습기가 있는 인큐베이터(humidified incubator)에서 5% CO2 및 37 ℃에서 교반(agitation)(120 rpm) 하에서 유지시켰다. 세포를 매일 3rd/4th 일마다 계수하였고, 완전한 배지 교환이 제공되었다. 트랜스펙션은 네온 트랜스펙션 시스템(Neon Transfection system)(Invitrogen)을 사용하여 수행되었다. 트랜스펙션 하루 전에, CHO-KI-S 세포를 신선한 배지 내로 통과되었고, 트랜스펙션을 위해 사용전에 적어도 하나의 더블링을 가능하게 한다(and allowed at least one doubling before use for transfection). 트랜스펙션은, 제조사(Invitrogen)에 의해 기재된 표준 프로토콜 당으로서, Sgs I (Asc I) linearised pZRC III-Etanercept-Hyg 플라스미드를 사용하여 수행되었다. 트랜스펙션 후에, 상기 세포는, 1 mL의 예비-항온된 배양 배지(pre-warmed culture medium)를 포함하는, 24 웰 플레이트의 하나의 웰 내로 이동되었다. 세포를, 습기가 있는 인큐베이터(humidified incubator)에서 5 % CO2, 37 ℃ 에서 유지시켰다. 그 다음날에, 미니폴 생성(minipool generation)을 위해, 트랜스펙션된 개채군(transfected population)을, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에 평편시켰다(plated). 15 내지 30일 후에, 96 웰 플레이트로부터의 상청액(supernatant)은 ELISA에 의한 생산물 형성 분석(product formation analysis)을 위해 제거되었다. 상기 선택된 높게 발현하는 미니폴(The selected high expressing minipools)은 24 웰 플레이트로 이동시킨 다음에, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 발현하는 미니폴(High expressing minipools)은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 디미팅 희석(single cell dimiting dilution)을 수행하기 위해 선택되었다. 약 15 내지 30일 후에, 96 웰 플레이트로부터의 상청액은, ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은, 24 웰 플레이트로 이동시키고, 그런 다음에 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동시켰고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 생산하는 클론(High producing clones)은 재트랜스펙션(re transfections)을 위해 선택된다.
Set
Ⅱ
-
pZRC
III
-
Etanercept
-
Neo
벡터
를 사용하여
Set
Ⅰ
로부터
수득된
클론의 안정된
재트랜스펙션
높게 발현되는 클론은, Set I 트랜스펙션에서, 동일한 방법에 의해 Sgs I (Acs I)에 의해 선형화된 pZRC III-Etanercept-Neo 플라스미드를 사용하여 재-트랜스펙션을 수행하기 위해 선택되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군(transfected population)은, 4 mM 글루타민, 600 ㎍/ml의 히그로마이신, 및 500 ㎍/ml의 네오마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 평판되었다(plated). 15 내지 30일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그 다음에, 상기 선택된 높게 발현하는 미니폴은, 24 웰 플레이트에 이동된 다음에, 4 mM 글루타민 및 상기 항생물질 압력(antibiotic pressures)으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 생산하는 미니폴은, 4 mM 글루타민으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정하는 희석(single cell limiting dilution)을 수행하기 위해 선택되었다. 15 내지 30일 후에 또 다시, 96웰 플레이트로부터 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은 24 웰 플레이트에 이동시킨 다음에, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 발현하는 재트랜스펙션된 클론(High expressing retransfected clones)은, 패드 배치 모드(fed batch mode)에서의 진탕 튜브(shake tubes)에서의 상기 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 120 rpm, 37 ℃, 5 % CO2 에서, 진탕기(shaker)에서 스핀 튜브(spin tubes)에서의 이러한 선택된 클론을 사용하여 실행되었다. 클론은, 12 일에 대략 700 mg/l 내지 1000 mg/1의 범위에서의 생산 레벨로 수득되었다.
실시예
20.
TNK
의 발현
Set
Ⅰ
-
pZRC
III
-
TNK
-
Hyg
벡터를 사용한
CHO
-
K1
-S 세포주에서 안정된
트랜스펙션
FreestyleTM CHO-K1-S 세포는, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 일상적으로 배양된다. 세포는, 습기가 있는 인큐베이터에서 5% CO2, 및 37 ℃에서 교반(agitation)(120 rpm) 하에서 유지된다. 세포를 3rd/4th 일마다 계수하였고, 완전한 배지 교환(complete medium exchange)을 제공하였다. 트랜스펙션은 네오 트랜스펙션 시스템(Neon Transfection system)(Invitrogen)을 사용하여 수행되었다. 트랜스펙션 하루 전에, CHO-KI-S 세포는 신선한 배지 내로 통과되었고, 트랜스펙션을 위해 사용 전에 적어도 하나의 더블링(at least one doubling)을 가능하게 한다. 트랜스펙션은, 제조사(Invitrogen)에 의해 기재된 표준 프로토콜 당 Sgs I (Asc I) linearised pZRC III-TNK-Hyg 플라스미드를 사용하여 실행하였다. 트랜스펙션 후에, 상기 세포는 1 mL의 예비-항온된 배양 배지를 포함하는, 24 웰 플레이트의 하나의 웰 내로 이동시켰다. 세포는, 습기가 있는 인큐베이터에서 5 % CO2, 37 ℃에서 유지되었다. 그 다음 일에, 미니폴 생성(minipool generation)을 위해, 트랜스펙션된 개체군은 4 mM 글루타민 및 500 ㎍/ml의 히그로마이신으로 보충된, PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30 일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 상기 선택된 높게 발현하는 미니폴은, 24 웰 플레이트에 이동시킨 다음에, 그 다음에 6 웰 플레이트에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 발현하는 미니폴은, 4 mM 글루타민 및 500 ㎍/ml의 히그로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza) PowerCHO2 CD 배지에서 96 웰 플레이트에서 단일 세포 디미팅 희석(single cell dimiting dilution)을 수행하기 위해 선택되었다. 약 15 내지 30 일 후에, 96웰 플레이트로부터의 상청액을 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은 24 웰 플레이트로 이동된 다음에, 6 웰 플레이트로 이동된 다음에, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석하였다. 높게 생산하는 클론(High producing clones)은 재트랜스펙션을 위해 선택되었다. 높게 발현하는 클론은, 피드 배치 모드(fed batch mode)에서 진탕 튜브(shake tubes)에서 상기 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5 % CO2 , 37 ℃, 230 rpm에서 진탕기(Kuhner-Germany)에서 스핀 튜브(spin tubes)에서 10 ml 배지에서 이러한 선택된 클론을 사용하여 실행되었다. 클론은 9 일에 150 mg/l의 생산 레벨을 수득하였다.
Set
Ⅱa
-
pZRC
III
-
TNK
-
Puro
벡터를 사용하여
Set
I로부터
수득된
클론의 안정된 재-
트랜스펙션
높게 발현하는 클론은, Set I 트랜스펙션에서 동일한 절차에 의해 Sgs I (Acs I)에 의해 선형화된 pZRC III-TNK-Puro 플라스미드를 사용하여 재-트랜스펙션을 수행하기 위해 선택되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은, 4 mM 글루타민, 500 ㎍/ml의 히그로마이신, 및 3 ug/ml의 퓨로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30 일 후에, 96 웰 플레이트로부터의 상청액은, ELISA에 의해 생산물 형성을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 미니폴은 24 웰 플레이트로 이동되고, 그리고 난 다음에 6 웰 플레이트에 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 생성되는 미니폴은, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석(single cell limiting dilution)을 수행하기 위해 선택되었다. 15 내지 20 일 후에, 96웰 플레이트로부터의 상청액은, ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 상기 선택된 높게 발현하는 클론은 24 웰 플레이트로 이동된 다음에, 6 웰 플레이트로 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 발현하는 클론은, 피드 배치 모드에서 진탕 튜브에서 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5 % CO2, 37 ℃, 120 rpm에서 진탕기(Kuhner-Germany)에서의 스핀 튜브(spin tubes)에서 이러한 선택된 클론을 사용하여 수행되었다. 클론은 11 일에 290 mg/l의 생산 레벨을 산출되었다.
Set
Ⅱb
-
pZRC
III
-
TNK
-
Neo
벡터를 사용하여
Set
I로부터
수득된
클론의 안정된 재-
트랜스펙션
높게 생성하는 클론(High producing clones)은, Set I 트랜스펙션에서 동일한 절차에 의해 Sgs I (Acs I)에 의해 선형화된 pZRC III-TNK-Neo 플라스미드를 사용하여 재-트랜스펙션을 수행하기 위해 선택되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은, 4 mM 글루타민, 600 ㎍/ml의 히그로마이신 및 500 ㎍/ml의 네오마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되엇다. 상기 선택된 높게 발현하는 미니폴은 24 웰 플레이트로 이동된 다음에, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동되고, 상기 언급된 항생물질 압력(the mentioned antibiotic pressures) 및 발현 레벨은 ELISA에 의한 각각의 레벨에서 분석되었다. 높게 생성하는 미니폴은, 4 mM 글루타민으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석(single cell limiting dilution)을 수행하기 위해 선택되었다. 15 내지 30 일 후에 또 다시, 96웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 상기 선택된 높게 발현하는 클론은 24 웰 플레이트로 이동시킨 다음에, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 발현하는 클론은, 피드 배치 모드에서 진탕 튜브에서 상기 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5% CO2, 37 ℃, 120 rpm 에서 진탕기(Kuhner-Germany)에서의 스핀 튜브(spin tubes)에서 이러한 선택된 클론을 사용하여 수행되었다. 클론은 10 일에 390 mg/l의 생산 레벨로 산출되었다.
실시예
21.
pZRC
III
-
Darbe
-
Hyg
벡터를 사용한
다베포이에틴의
발현
Set
Ⅰ
-
pZRC
III
-
Darbe
-
Hyg
벡터를 사용하여
CHO
-
K1
-S 세포주에서의 안정된
트랜스펙션
FreestyleTM CHO-K1-S 세포는 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 일상적으로 배양되었다. 세포는, 습기가 있는 인큐베이터에서 5 % CO2 및 37 ℃에서 교반(120 rpm) 하에서 유지시켰다. 세포를 매 3rd/4th 일에 계수하고, 완전한 배지 교환을 제공하였다. 트랜스펙션은 네오 트랜스펙션 시스템(Invitrogen)을 사용하여 수행되었다. 트랜스펙션 하루 전에, CHO-KI-S 세포를 신선한 배지 내로 통과시키고, 트랜스펙션을 위해 사용 전에 적어도 하나 더블링(at least one doubling)을 가능하게 하였다. 트랜스펙션은, 제조사(Invitrogen)에 의해 기재된 표준 프로토콜 당 Sgs I (Asc I) linearised pZRC III-Darbe-Hyg 플라스미드를 사용하여 수행되었다. DNA의 트랜스펙션 후에, 상기 세포는, 1 mL의 예비-항온된 배양 배지를 포함하는, 24 웰 플레이트의 하나의 웰 내로 이동되었다. 세포는 습기가 있는 인큐베이터에서 5 % CO2, 37 ℃에서 유지되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 20일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에 상기 선택된 높게 발현되는 미니폴은 24 웰 플레이트에 이동되고, 6 웰 플레이트에 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 두 개의 높게 발현하는 미니폴은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 ProCHO5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석을 수행하기 위해 선택되었다. 15 내지 30 일 후에 또 다시, 96웰 플레이트로부터의 상청액은 ELISA에 의해 생성물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은 24 웰 플레이트로 이동되고, 그리고 난 다음에 6 웰 플레이트로 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 발현하는 클론은, 피드 배치 모드에서 진탕 튜브에서 상기 생성물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5% CO2, 37 ℃, 230 rpm에서 진탕기(Kuhner-Germany)에서 스핀 튜브(spin tubes)에서 10 ml 배지에서 이러한 선택된 클론을 사용하여 수행되었다. 클론은 11 일에 340 mg/l의 생산 레벨을 산출되었다.
실시예
22.
FSH
의 발현
Set
Ⅰ
-
pZRC
III
-
FSH
α-
IRES
-
FSH
β-
Hyg
벡터를 사용하여
CHO
-
K1
-S 세포주에서 안정된
트랜스펙션
FreestyleTM CHO-K1-S 세포는, 4 mM 글루타민으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 일상적으로 배양되었다. 세포를 습기가 있는 인큐베이터에서 5 % CO2, 및 37 ℃에서 교반(120 rpm) 하에서 유지시켰다. 세포를 매 3rd/4th 일마다 계수하였고, 완전한 배지 교환이 제공되었다. 트랜스펙션은 네오 트랜스펙션 시스템(Invitrogen)을 사용하여 실행되었다. 트랜스펙션 하루 전에, CHO-KI-S 세포는 신선한 배지 내로 통과하고, 트랜스펙션을 위해 사용 전에 적어도 하나의 더블링(at least one doubling)을 가능하게 한다. 트랜스펙션은, 제조사(Invitrogen)에 의해 기재된 표준 프로토콜 당 Sgs I (Asc I) linearised pZRC III - FSH α- IRES - FSH β- Hyg _플라스미드를 사용하여 실행되었다. 트랜스펙션 후에, 상기 세포는 1 mL의 예비-항온된 배양 배지를 포함하는, 24 웰 플레이트의 하나의 웰 내로 이동되었다. 세포는 습기가 있는 인큐베이터에서 5 % CO2, 37 ℃에서 유지되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30 일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 미니폴은 24 웰 플레이트로 이동되고, 그 다음에 4 mM 글루타민 및 상기 항생물질 압력으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동되었고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 발현하는 미니폴은, 4 mM 글루타민 및 600 ㎍/ml의 히그로마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석을 수행하기 위해 선택되었다. 15 내지 30 일 후에, 96웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 상기 선택된 높게 발현하는 클론은 그리고 난 다음에 24 웰 플레이트로 이동되고, 그리고 난 다음에 4 mM 글루타민 및 상기 항생물질 압력으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨에서 분석되었다. 높게 생산하는 클론(High producing clones)은 재트랜스펙션(retransfections)을 위해 선택되었다.
Set
Ⅱ
-
pZRC
III
-
FSH
α-
IRES
-
FSH
β-
Neo
벡터를 사용하여
Set
Ⅰ
로부터
수득된
클론의 안정된 재-
트랜스펙션
클론은, Set I 트랜스펙션으로서 상기 동일한 방법에 의해 Sgs I (Acs I)에 의해 선형화된 pZRC III - FSH α- IRES - FSH β- Neo 플라스미드를 사용하여 재-트랜스펙션을 수행하기 위해 선택되었다. 그 다음 날에, 미니폴 생성을 위해, 트랜스펙션된 개체군은 4 mM 글루타민, 600 ㎍/ml의 히그로마이신, 및 500 ㎍/ml의 네오마이신으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 평판되었다. 15 내지 30 일 후에, 96 웰 플레이트로부터의 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에 선택된 높게 발현하는 미니폴은 24 웰 플레이트로 이동되고, 그리고 난 다음에 4 mM 글루타민 및 상기 항생물질 압력으로 보충된 PowerCHO2 CD(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트로에 이동시키고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 생성하는 재트랜스펙션된 미니폴은, 4 mM 글루타민 및 언급된 항생물질 압력으로 보충된 Pro CHO 5 배지(Lonza)에서 96 웰 플레이트에서 단일 세포 한정 희석(single cell limiting dilution)을 수행하기 위해 선택되었다. 15 내지 30 일 후에 또다시, 96 웰 플레이트로부터 상청액은 ELISA에 의해 생산물 형성 분석을 위해 제거되었다. 그리고 난 다음에, 상기 선택된 높게 발현하는 클론은, 24 웰 플레이트로 이동된 다음에, 4 mM 글루타민 및 언급된 항생물질 압력으로 보충된 PowerCHO2 CD 배지(화학적으로 한정된 배지, Lonza)에서 6 웰 플레이트에 이동되고, 발현 레벨은 ELISA에 의해 각각의 레벨로 분석되었다. 높게 발현하는 클론은 즉, 피드 배치 모드(fed batch mode)에서 진탕 튜브에서 상기 생산물 형성을 분석하기 위해 선택되었다. 이러한 실험은, 5 % CO2, 37 ℃, 120 rpm에서 진탕기(Kuhner-Germany)에서 스핀 튜브에서 이러한 선택된 클론을 사용하여 실행되었다. 생산 레벨은, 상이한 클론과 함께 10 일에 대략 20 mg/l 내지 50 mg/l의 범위로 수득되었다.
SEQUENCE LISTING
<110> CADILA HEALTHCARE LIMITED
<120> A NOVEL EXPRESSION VECTOR FOR HIGH LEVEL EXPRESSION OF
RECOMBINANT PROTEINS
<130> 2806-MUM-10
<150> IN: 2806/MUM/2010
<151> 2010-10-08
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 324
<212> DNA
<213> Artificial
<220>
<223> Chimeric INTRON
<400> 1
aattaattcg ctgtctgcga gggccagctg ttggggtgag tactccctct caaaagcggg 60
catgacttct gcgctaagat tgtcagtttc caaaaacgag gaggatttga tattcacctg 120
gcccgcggtg atgcctttga gggtggccgc gtccatctgg tcagaaaaga caatcttttt 180
gttgtcaagc ttgaggtgtg gcaggcttga gatctggcca tacacttgag tgacaatgac 240
atccactttg cctttctctc cacaggtgtc cactcccagg tccaactgca ggtcgagcat 300
gcatctaggg cgcccgcact agag 324
<210> 2
<211> 395
<212> DNA
<213> Artificial
<220>
<223> TPL
<400> 2
gtttagtgaa ccgtcagatc ctcttccgca tcgctgtctg cgagggccag ctgttggggt 60
gagtactccc tctcaaaagc gggcatgact tctgcgctaa gaatgtcagt ttccaaaaac 120
gaggaggatt tgatattcac tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 180
ggtcagaaaa gacaatcttt ttgttgtcaa gcttccttga tgatgtcata cttatcctgt 240
cccttttttt tccacagctc gcggttgagg acaaactctt cgcggtcttt ccagtactct 300
tggatcggaa acccgtcggc ctccgaacgg tactccgcca ccgagggacc tgagcgagtc 360
cgcatcgacc ggatcggaaa acctctcgac gtacc 395
<210> 3
<211> 627
<212> DNA
<213> Artificial
<220>
<223> VA I & II Genes
<400> 3
ggtacctcgg gacgctctgg ccggtgaggc gtgcgcagtc gttgacgctc tagaccgtgc 60
aaaaggagag cctgtaagcg ggcactcttc cgtggtctgg tggataaatt cgcaagggta 120
tcatggcgga cgaccggggt tcgaaccccg gatccggccg tccgccgtga tccatgcggt 180
taccgcccgc gtgtcgaacc caggtgtgcg acgtcagaca acgggggagc gctccttttg 240
gcttccttcc aggcgcggcg gctgctgcgc tagctttttt ggccactggc cgcgcgcggc 300
gtaagcggtt aggctggaaa gcgaaagcat taagtggctc gctccctgta gccggagggt 360
tattttccaa gggttgagtc gcaggacccc cggttcgagt ctcgggccgg ccggactgcg 420
gcgaacgggg gtttgcctcc ccgtcatgca agaccccgct tgcaaattcc tccggaaaca 480
gggacgagcc ccttttttgc ttttcccaga tgcatccggt gctgcggcag atgcgccccc 540
ctcctcagca gcggcaagag caagagcagc ggcagacatg cagggcaccc tccccttctc 600
ctaccgcgtc aggaggggca acatccg 627
<210> 4
<211> 4584
<212> DNA
<213> Artificial
<220>
<223> pZRC II
<400> 4
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920
tacctcggga cgctctggcc ggtgaggcgt gcgcagtcgt tgacgctcta gaccgtgcaa 1980
aaggagagcc tgtaagcggg cactcttccg tggtctggtg gataaattcg caagggtatc 2040
atggcggacg accggggttc gaaccccgga tccggccgtc cgccgtgatc catgcggtta 2100
ccgcccgcgt gtcgaaccca ggtgtgcgac gtcagacaac gggggagcgc tccttttggc 2160
ttccttccag gcgcggcggc tgctgcgcta gcttttttgg ccactggccg cgcgcggcgt 2220
aagcggttag gctggaaagc gaaagcatta agtggctcgc tccctgtagc cggagggtta 2280
ttttccaagg gttgagtcgc aggacccccg gttcgagtct cgggccggcc ggactgcggc 2340
gaacgggggt ttgcctcccc gtcatgcaag accccgcttg caaattcctc cggaaacagg 2400
gacgagcccc ttttttgctt ttcccagatg catccggtgc tgcggcagat gcgcccccct 2460
cctcagcagc ggcaagagca agagcagcgg cagacatgca gggcaccctc cccttctcct 2520
accgcgtcag gaggggcaac atccgacgcg ttgacattga ttattgacta gttattaata 2580
gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact 2640
tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat 2700
gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta 2760
tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc 2820
tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg 2880
ggactttcct acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg 2940
gttttggcag tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct 3000
ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa 3060
atgtcgtaac aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt 3120
ctatataagc agagctggtt tagtgaaccg tcagatcctc ttccgcatcg ctgtctgcga 3180
gggccagctg ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagaa 3240
tgtcagtttc caaaaacgag gaggatttga tattcactgg cccgcggtga tgcctttgag 3300
ggtggccgcg tccatctggt cagaaaagac aatctttttg ttgtcaagct tccttgatga 3360
tgtcatactt atcctgtccc ttttttttcc acagctcgcg gttgaggaca aactcttcgc 3420
ggtctttcca gtactcttgg atcggaaacc cgtcggcctc cgaacggtac tccgccaccg 3480
agggacctga gcgagtccgc atcgaccgga tcggaaaacc tctcgacgta ccaattaatt 3540
cgctgtctgc gagggccagc tgttggggtg agtactccct ctcaaaagcg ggcatgactt 3600
ctgcgctaag attgtcagtt tccaaaaacg aggaggattt gatattcacc tggcccgcgg 3660
tgatgccttt gagggtggcc gcgtccatct ggtcagaaaa gacaatcttt ttgttgtcaa 3720
gcttgaggtg tggcaggctt gagatctggc catacacttg agtgacaatg acatccactt 3780
tgcctttctc tccacaggtg tccactccca ggtccaactg caggtcgagc atgcatctag 3840
ggcgcccgca ctagaggctc gaggaattcc ccggggatat cgtttaaacc cacgatcgtg 3900
gaagcggccg cccgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt 3960
tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 4020
taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 4080
gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg 4140
gtgggctcta tggcttctga ggcggaaaga accagctggg gctctagggg gtatccccac 4200
ggagctcatg gcgcgcctag gccttgacgg ccttccttca attcgcccta tagtgagtcg 4260
tattacgtcg cgctcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 4320
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 4380
ggcccgcacc gaaacgccct tcccaacagt tgcgcagcct gaatggcgaa tgggagcgcc 4440
ctgtagcggc cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg 4500
atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac 4560
aaaatattaa cgcttacaat ttag 4584
<210> 5
<211> 1668
<212> DNA
<213> Artificial
<220>
<223> CLysMAR
<400> 5
gcatccataa tataactgta ccaggttttg gtttattaca tgtgactgac ggcttcctat 60
gcgtgctcag aaaacggcag ttgggcactg cactgcccgg tgatggtgcc acggtggctc 120
ctgccgcctt ctttgatatt cactctgttg tatttcatct cttgttgccg atgaaaggat 180
ataacagtct ctgaggaaat acttggtatt tcttctgatc agcgttttta taagtaatgt 240
tgaatattgg ataaggctgt gtgtcctttg tcttgggaga caaagcccac agcaggtggt 300
ggttgggtgg tggcagctca gtgacaggag aggttttttt gcctgttttt tttgttgttt 360
ttttttttta agtaaggtgt tcttttttct tagtaaaatt tctactggac tgtatgtttt 420
gacaggtcag aaacatttct tcaaaagaag aaccttttgg aaactgtaca gcccttttct 480
ttcattccct ttttgctttc tgtgccaatg cctttggttc tgattgcatt atggaaaacg 540
ttgatcggaa cttgaggttt ttatttatag tgtggcttga aagcttggat agctgttgtt 600
acatgagata ccttattaag tttaggccag cttgatgctt tatttttttt cctttgaagt 660
agtgagcgtt ctctggtttt tttcctttga aactggcgag gcttagattt ttctaatggg 720
attttttacc tgatgatcta gttgcatacc caaatgcttg taaatgtttt cctagttaac 780
atgttgataa cttcggattt acatgttgta tatacttgtc atctgtgttt ctagtaaaaa 840
tatatggcat ttatagaaat acgtaattcc tgatttcctt ttttttttat ctctatgctc 900
tgtgtgtaca ggtcaaacag acttcactcc tatttttatt tatagaattt tatatgcagt 960
ctgtcgttgg ttcttgtgtt gtaaggatac agccttaaat ttcctagagc gatgctcagt 1020
aaggcgggtt gtcacatggg ttcaaatgta aaacgggcac gtttgctgct gccttcccag 1080
atccaggaca ctaaactgct tctgcaactg aggtataaat cgcttcagat cccaggaagt 1140
gtagatccac gtgcatattc ttaaagaaga atgaatactt tctaaaatat gttggcatag 1200
gaagcaagct gcatggattt atttgggact taaattattt tggtaacgga gtgcataggt 1260
tttaaacaca gttgcagcat gctaacgagt cacagcattt atgcagaagt gatgcctgtt 1320
gcagctgttt acggcactgc cttgcagtga gcattgcaga taggggtggg gtgctttgtg 1380
tcgtgttggg acacgctgcc acacagccac ctcccgaaca tatctcacct gctgggtact 1440
tttcaaacca tcttagcagt agtagatgag ttactatgaa acagagaagt tcctcagttg 1500
gatattctca tgggatgtct tttttcccat gttgggcaaa gtatgataaa gcatctctat 1560
ttgtaaatta tgcacttgtt agttcctgaa tcctttctat agcaccactt attgcagcag 1620
gtgtaggctc tggtgtggcc tgtgtctgtg cttcaatctt ttaagctt 1668
<210> 6
<211> 7932
<212> DNA
<213> Artificial
<220>
<223> pZRC III
<400> 6
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920
tacctcggga cgctctggcc ggtgaggcgt gcgcagtcgt tgacgctcta gaccgtgcaa 1980
aaggagagcc tgtaagcggg cactcttccg tggtctggtg gataaattcg caagggtatc 2040
atggcggacg accggggttc gaaccccgga tccggccgtc cgccgtgatc catgcggtta 2100
ccgcccgcgt gtcgaaccca ggtgtgcgac gtcagacaac gggggagcgc tccttttggc 2160
ttccttccag gcgcggcggc tgctgcgcta gcttttttgg ccactggccg cgcgcggcgt 2220
aagcggttag gctggaaagc gaaagcatta agtggctcgc tccctgtagc cggagggtta 2280
ttttccaagg gttgagtcgc aggacccccg gttcgagtct cgggccggcc ggactgcggc 2340
gaacgggggt ttgcctcccc gtcatgcaag accccgcttg caaattcctc cggaaacagg 2400
gacgagcccc ttttttgctt ttcccagatg catccggtgc tgcggcagat gcgcccccct 2460
cctcagcagc ggcaagagca agagcagcgg cagacatgca gggcaccctc cccttctcct 2520
accgcgtcag gaggggcaac atccgacgcg tgcatccata atataactgt accaggtttt 2580
ggtttattac atgtgactga cggcttccta tgcgtgctca gaaaacggca gttgggcact 2640
gcactgcccg gtgatggtgc cacggtggct cctgccgcct tctttgatat tcactctgtt 2700
gtatttcatc tcttgttgcc gatgaaagga tataacagtc tctgaggaaa tacttggtat 2760
ttcttctgat cagcgttttt ataagtaatg ttgaatattg gataaggctg tgtgtccttt 2820
gtcttgggag acaaagccca cagcaggtgg tggttgggtg gtggcagctc agtgacagga 2880
gaggtttttt tgcctgtttt ttttgttgtt tttttttttt aagtaaggtg ttcttttttc 2940
ttagtaaaat ttctactgga ctgtatgttt tgacaggtca gaaacatttc ttcaaaagaa 3000
gaaccttttg gaaactgtac agcccttttc tttcattccc tttttgcttt ctgtgccaat 3060
gcctttggtt ctgattgcat tatggaaaac gttgatcgga acttgaggtt tttatttata 3120
gtgtggcttg aaagcttgga tagctgttgt tacatgagat accttattaa gtttaggcca 3180
gcttgatgct ttattttttt tcctttgaag tagtgagcgt tctctggttt ttttcctttg 3240
aaactggcga ggcttagatt tttctaatgg gattttttac ctgatgatct agttgcatac 3300
ccaaatgctt gtaaatgttt tcctagttaa catgttgata acttcggatt tacatgttgt 3360
atatacttgt catctgtgtt tctagtaaaa atatatggca tttatagaaa tacgtaattc 3420
ctgatttcct ttttttttta tctctatgct ctgtgtgtac aggtcaaaca gacttcactc 3480
ctatttttat ttatagaatt ttatatgcag tctgtcgttg gttcttgtgt tgtaaggata 3540
cagccttaaa tttcctagag cgatgctcag taaggcgggt tgtcacatgg gttcaaatgt 3600
aaaacgggca cgtttgctgc tgccttccca gatccaggac actaaactgc ttctgcaact 3660
gaggtataaa tcgcttcaga tcccaggaag tgtagatcca cgtgcatatt cttaaagaag 3720
aatgaatact ttctaaaata tgttggcata ggaagcaagc tgcatggatt tatttgggac 3780
ttaaattatt ttggtaacgg agtgcatagg ttttaaacac agttgcagca tgctaacgag 3840
tcacagcatt tatgcagaag tgatgcctgt tgcagctgtt tacggcactg ccttgcagtg 3900
agcattgcag ataggggtgg ggtgctttgt gtcgtgttgg gacacgctgc cacacagcca 3960
cctcccgaac atatctcacc tgctgggtac ttttcaaacc atcttagcag tagtagatga 4020
gttactatga aacagagaag ttcctcagtt ggatattctc atgggatgtc ttttttccca 4080
tgttgggcaa agtatgataa agcatctcta tttgtaaatt atgcacttgt tagttcctga 4140
atcctttcta tagcaccact tattgcagca ggtgtaggct ctggtgtggc ctgtgtctgt 4200
gcttcaatct tttaagctta cgcgttgaca ttgattattg actagttatt aatagtaatc 4260
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 4320
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 4380
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 4440
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 4500
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 4560
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 4620
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 4680
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 4740
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 4800
aagcagagct ggtttagtga accgtcagat cctcttccgc atcgctgtct gcgagggcca 4860
gctgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta agaatgtcag 4920
tttccaaaaa cgaggaggat ttgatattca ctggcccgcg gtgatgcctt tgagggtggc 4980
cgcgtccatc tggtcagaaa agacaatctt tttgttgtca agcttccttg atgatgtcat 5040
acttatcctg tccctttttt ttccacagct cgcggttgag gacaaactct tcgcggtctt 5100
tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtactccgcc accgagggac 5160
ctgagcgagt ccgcatcgac cggatcggaa aacctctcga cgtaccaatt aattcgctgt 5220
ctgcgagggc cagctgttgg ggtgagtact ccctctcaaa agcgggcatg acttctgcgc 5280
taagattgtc agtttccaaa aacgaggagg atttgatatt cacctggccc gcggtgatgc 5340
ctttgagggt ggccgcgtcc atctggtcag aaaagacaat ctttttgttg tcaagcttga 5400
ggtgtggcag gcttgagatc tggccataca cttgagtgac aatgacatcc actttgcctt 5460
tctctccaca ggtgtccact cccaggtcca actgcaggtc gagcatgcat ctagggcgcc 5520
cgcactagag gctcgaggaa ttccccgggg atatcgttta aacccacgat cgtggaagcg 5580
gccgcccgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 5640
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 5700
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 5760
caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 5820
tctatggctt ctgaggcgga aagaaccagc tggggctcta gggggtatcc ccacggagct 5880
cgcatccata atataactgt accaggtttt ggtttattac atgtgactga cggcttccta 5940
tgcgtgctca gaaaacggca gttgggcact gcactgcccg gtgatggtgc cacggtggct 6000
cctgccgcct tctttgatat tcactctgtt gtatttcatc tcttgttgcc gatgaaagga 6060
tataacagtc tctgaggaaa tacttggtat ttcttctgat cagcgttttt ataagtaatg 6120
ttgaatattg gataaggctg tgtgtccttt gtcttgggag acaaagccca cagcaggtgg 6180
tggttgggtg gtggcagctc agtgacagga gaggtttttt tgcctgtttt ttttgttgtt 6240
tttttttttt aagtaaggtg ttcttttttc ttagtaaaat ttctactgga ctgtatgttt 6300
tgacaggtca gaaacatttc ttcaaaagaa gaaccttttg gaaactgtac agcccttttc 6360
tttcattccc tttttgcttt ctgtgccaat gcctttggtt ctgattgcat tatggaaaac 6420
gttgatcgga acttgaggtt tttatttata gtgtggcttg aaagcttgga tagctgttgt 6480
tacatgagat accttattaa gtttaggcca gcttgatgct ttattttttt tcctttgaag 6540
tagtgagcgt tctctggttt ttttcctttg aaactggcga ggcttagatt tttctaatgg 6600
gattttttac ctgatgatct agttgcatac ccaaatgctt gtaaatgttt tcctagttaa 6660
catgttgata acttcggatt tacatgttgt atatacttgt catctgtgtt tctagtaaaa 6720
atatatggca tttatagaaa tacgtaattc ctgatttcct ttttttttta tctctatgct 6780
ctgtgtgtac aggtcaaaca gacttcactc ctatttttat ttatagaatt ttatatgcag 6840
tctgtcgttg gttcttgtgt tgtaaggata cagccttaaa tttcctagag cgatgctcag 6900
taaggcgggt tgtcacatgg gttcaaatgt aaaacgggca cgtttgctgc tgccttccca 6960
gatccaggac actaaactgc ttctgcaact gaggtataaa tcgcttcaga tcccaggaag 7020
tgtagatcca cgtgcatatt cttaaagaag aatgaatact ttctaaaata tgttggcata 7080
ggaagcaagc tgcatggatt tatttgggac ttaaattatt ttggtaacgg agtgcatagg 7140
ttttaaacac agttgcagca tgctaacgag tcacagcatt tatgcagaag tgatgcctgt 7200
tgcagctgtt tacggcactg ccttgcagtg agcattgcag ataggggtgg ggtgctttgt 7260
gtcgtgttgg gacacgctgc cacacagcca cctcccgaac atatctcacc tgctgggtac 7320
ttttcaaacc atcttagcag tagtagatga gttactatga aacagagaag ttcctcagtt 7380
ggatattctc atgggatgtc ttttttccca tgttgggcaa agtatgataa agcatctcta 7440
tttgtaaatt atgcacttgt tagttcctga atcctttcta tagcaccact tattgcagca 7500
ggtgtaggct ctggtgtggc ctgtgtctgt gcttcaatct tttaagcttg agctcatggc 7560
gcgcctaggc cttgacggcc ttccttcaat tcgccctata gtgagtcgta ttacgtcgcg 7620
ctcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa 7680
tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga 7740
aacgcccttc ccaacagttg cgcagcctga atggcgaatg ggagcgccct gtagcggcca 7800
ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 7860
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 7920
cttacaattt ag 7932
<210> 7
<211> 562
<212> PRT
<213> Artificial
<220>
<223> TNK
<400> 7
Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly
1 5 10 15
Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Phe Arg Arg
20 25 30
Gly Ala Arg Ser Tyr Gln Val Ile Cys Arg Asp Glu Lys Thr Gln Met
35 40 45
Ile Tyr Gln Gln His Gln Ser Trp Leu Arg Pro Val Leu Arg Ser Asn
50 55 60
Arg Val Glu Tyr Cys Trp Cys Asn Ser Gly Arg Ala Gln Cys His Ser
65 70 75 80
Val Pro Val Lys Ser Cys Ser Glu Pro Arg Cys Phe Asn Gly Gly Thr
85 90 95
Cys Gln Gln Ala Leu Tyr Phe Ser Asp Phe Val Cys Gln Cys Pro Glu
100 105 110
Gly Phe Ala Gly Lys Cys Cys Glu Ile Asp Thr Arg Ala Thr Cys Tyr
115 120 125
Glu Asp Gln Gly Ile Ser Tyr Arg Gly Asn Trp Ser Thr Ala Glu Ser
130 135 140
Gly Ala Glu Cys Thr Asn Trp Gln Ser Ser Ala Leu Ala Gln Lys Pro
145 150 155 160
Tyr Ser Gly Arg Arg Pro Asp Ala Ile Arg Leu Gly Leu Gly Asn His
165 170 175
Asn Tyr Cys Arg Asn Pro Asp Arg Asp Ser Lys Pro Trp Cys Tyr Val
180 185 190
Phe Lys Ala Gly Lys Tyr Ser Ser Glu Phe Cys Ser Thr Pro Ala Cys
195 200 205
Ser Glu Gly Asn Ser Asp Cys Tyr Phe Gly Asn Gly Ser Ala Tyr Arg
210 215 220
Gly Thr His Ser Leu Thr Glu Ser Gly Ala Ser Cys Leu Pro Trp Asn
225 230 235 240
Ser Met Ile Leu Ile Gly Lys Val Tyr Thr Ala Gln Asn Pro Ser Ala
245 250 255
Gln Ala Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Gly
260 265 270
Asp Ala Lys Pro Trp Cys His Val Leu Lys Asn Arg Arg Leu Thr Trp
275 280 285
Glu Tyr Cys Asp Val Pro Ser Cys Ser Thr Cys Gly Leu Arg Gln Tyr
290 295 300
Ser Gln Pro Gln Phe Arg Ile Lys Gly Gly Leu Phe Ala Asp Ile Ala
305 310 315 320
Ser His Pro Trp Gln Ala Ala Ile Phe Ala Ala Ala Ala Ala Ser Pro
325 330 335
Gly Glu Arg Phe Leu Cys Gly Gly Ile Leu Ile Ser Ser Cys Trp Ile
340 345 350
Leu Ser Ala Ala His Cys Phe Gln Glu Arg Phe Pro Pro His His Leu
355 360 365
Thr Val Ile Leu Gly Arg Thr Tyr Arg Val Val Pro Gly Glu Glu Glu
370 375 380
Gln Lys Phe Glu Val Glu Lys Tyr Ile Val His Lys Glu Phe Asp Asp
385 390 395 400
Asp Thr Tyr Asp Asn Asp Ile Ala Leu Leu Gln Leu Lys Ser Asp Ser
405 410 415
Ser Arg Cys Ala Gln Glu Ser Ser Val Val Arg Thr Val Cys Leu Pro
420 425 430
Pro Ala Asp Leu Gln Leu Pro Asp Trp Thr Glu Cys Glu Leu Ser Gly
435 440 445
Tyr Gly Lys His Glu Ala Leu Ser Pro Phe Tyr Ser Glu Arg Leu Lys
450 455 460
Glu Ala His Val Arg Leu Tyr Pro Ser Ser Arg Cys Thr Ser Gln His
465 470 475 480
Leu Leu Asn Arg Thr Val Thr Asp Asn Met Leu Cys Ala Gly Asp Thr
485 490 495
Arg Ser Gly Gly Pro Gln Ala Asn Leu His Asp Ala Cys Gln Gly Asp
500 505 510
Ser Gly Gly Pro Leu Val Cys Leu Asn Asp Gly Arg Met Thr Leu Val
515 520 525
Gly Ile Ile Ser Trp Gly Leu Gly Cys Gly Gln Lys Asp Val Pro Gly
530 535 540
Val Tyr Thr Lys Val Thr Asn Tyr Leu Asp Trp Ile Arg Asp Asn Met
545 550 555 560
Arg Pro
<210> 8
<211> 11138
<212> DNA
<213> Artificial
<220>
<223> pZRC III- TNK- Hyg
<400> 8
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920
atccttatcg attttaccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1980
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 2040
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 2100
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgctcg 2160
aagcggccgg ccgccccgac tctagactat tcctttgccc tcggacgagt gctggggcgt 2220
cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg 2280
cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga 2340
ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca 2400
agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc cggatgcctc 2460
cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg 2520
ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt 2580
atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg 2640
acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca 2700
ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat 2760
atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg 2820
ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac cggctgcaga 2880
acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag 2940
atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg aatcgggagc 3000
gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta 3060
tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg 3120
ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg 3180
acagacgtcg cggtgagttc aggctttccg gatctatcca tcatggtggc tttaccaaca 3240
gtaccggaat gccaagcttt ttgcaaaagc ctaggcctcc aaaaaagcct cctcactact 3300
tctggaatag ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc 3360
agcgatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta 3420
ggggcgggac tatggttgct gactaattga gatgcagatc gcagatcctc gggacgctct 3480
ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag 3540
cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg 3600
gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa 3660
cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt ccaggcgcgg 3720
cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg ttaggctgga 3780
aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc aagggttgag 3840
tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg gggtttgcct 3900
ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag cccctttttt 3960
gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag cagcggcaag 4020
agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg tcaggagggg 4080
caacatccga cgcgtgcatc cataatataa ctgtaccagg ttttggttta ttacatgtga 4140
ctgacggctt cctatgcgtg ctcagaaaac ggcagttggg cactgcactg cccggtgatg 4200
gtgccacggt ggctcctgcc gccttctttg atattcactc tgttgtattt catctcttgt 4260
tgccgatgaa aggatataac agtctctgag gaaatacttg gtatttcttc tgatcagcgt 4320
ttttataagt aatgttgaat attggataag gctgtgtgtc ctttgtcttg ggagacaaag 4380
cccacagcag gtggtggttg ggtggtggca gctcagtgac aggagaggtt tttttgcctg 4440
ttttttttgt tgtttttttt ttttaagtaa ggtgttcttt tttcttagta aaatttctac 4500
tggactgtat gttttgacag gtcagaaaca tttcttcaaa agaagaacct tttggaaact 4560
gtacagccct tttctttcat tccctttttg ctttctgtgc caatgccttt ggttctgatt 4620
gcattatgga aaacgttgat cggaacttga ggtttttatt tatagtgtgg cttgaaagct 4680
tggatagctg ttgttacatg agatacctta ttaagtttag gccagcttga tgctttattt 4740
tttttccttt gaagtagtga gcgttctctg gtttttttcc tttgaaactg gcgaggctta 4800
gatttttcta atgggatttt ttacctgatg atctagttgc atacccaaat gcttgtaaat 4860
gttttcctag ttaacatgtt gataacttcg gatttacatg ttgtatatac ttgtcatctg 4920
tgtttctagt aaaaatatat ggcatttata gaaatacgta attcctgatt tccttttttt 4980
tttatctcta tgctctgtgt gtacaggtca aacagacttc actcctattt ttatttatag 5040
aattttatat gcagtctgtc gttggttctt gtgttgtaag gatacagcct taaatttcct 5100
agagcgatgc tcagtaaggc gggttgtcac atgggttcaa atgtaaaacg ggcacgtttg 5160
ctgctgcctt cccagatcca ggacactaaa ctgcttctgc aactgaggta taaatcgctt 5220
cagatcccag gaagtgtaga tccacgtgca tattcttaaa gaagaatgaa tactttctaa 5280
aatatgttgg cataggaagc aagctgcatg gatttatttg ggacttaaat tattttggta 5340
acggagtgca taggttttaa acacagttgc agcatgctaa cgagtcacag catttatgca 5400
gaagtgatgc ctgttgcagc tgtttacggc actgccttgc agtgagcatt gcagataggg 5460
gtggggtgct ttgtgtcgtg ttgggacacg ctgccacaca gccacctccc gaacatatct 5520
cacctgctgg gtacttttca aaccatctta gcagtagtag atgagttact atgaaacaga 5580
gaagttcctc agttggatat tctcatggga tgtctttttt cccatgttgg gcaaagtatg 5640
ataaagcatc tctatttgta aattatgcac ttgttagttc ctgaatcctt tctatagcac 5700
cacttattgc agcaggtgta ggctctggtg tggcctgtgt ctgtgcttca atcttttaag 5760
cttacgcgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 5820
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 5880
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 5940
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6000
gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6060
tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6120
atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6180
cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 6240
agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 6300
ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 6360
gtgaaccgtc agatcctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta 6420
ctccctctca aaagcgggca tgacttctgc gctaagaatg tcagtttcca aaaacgagga 6480
ggatttgata ttcactggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca 6540
gaaaagacaa tctttttgtt gtcaagcttc cttgatgatg tcatacttat cctgtccctt 6600
ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt actcttggat 6660
cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc gagtccgcat 6720
cgaccggatc ggaaaacctc tcgacgtacc aattaattcg ctgtctgcga gggccagctg 6780
ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagat tgtcagtttc 6840
caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 6900
gtccatctgg tcagaaaaga caatcttttt gttgtcaagc ttgaggtgtg gcaggcttga 6960
gatctggcca tacacttgag tgacaatgac atccactttg cctttctctc cacaggtgtc 7020
cactcccagg tccaactgca ggtcgagcat gcatctaggg cgcccgcact agaggctcga 7080
ggaattccac catggacgcc atgaagcggg gactgtgctg tgtgctgctg ctgtgtggcg 7140
ccgtgttcgt gtcccctagc caggaaatcc acgcccggtt cagaaggggc gccaggtcct 7200
accaagttat ctgccgggac gaaaagaccc agatgatcta ccagcagcac cagtcctggc 7260
tgcggcccgt gctgcggtcc aaccgggtgg agtactgctg gtgcaactcc ggcagagccc 7320
agtgccactc cgtgcctgtg aagtcctgct ccgagcctag atgcttcaac ggcggcacct 7380
gtcagcaggc cctgtacttc tccgacttcg tgtgccagtg ccctgagggc ttcgccggca 7440
agtgctgcga gatcgacacc cgggccacct gttacgagga ccagggcatc tcctaccggg 7500
gcaactggtc taccgccgag tctggcgccg agtgcaccaa ctggcagtcc tccgccctgg 7560
cccagaagcc ttactctggc agacggcctg acgccatcag actgggcctg ggcaaccaca 7620
actactgccg gaaccctgac cgggactcca agccttggtg ctacgtgttc aaggccggca 7680
agtactcctc cgagttctgc tccacccctg cctgctctga gggcaactcc gactgctact 7740
tcggcaacgg ctccgcctac agaggcaccc actccctgac cgagtccggc gcctcttgcc 7800
tgccttggaa ctccatgatc ctgatcggca aggtgtacac cgcccagaac ccttccgctc 7860
aggccctggg actcggaaag cacaattatt gtcgcaatcc cgacggcgac gccaaacctt 7920
ggtgtcacgt gctgaagaac cggcggctga catgggaata ctgcgacgtg ccttcctgct 7980
ctacctgcgg cctgcggcag tactcccagc ctcagttccg gatcaagggc ggcctgttcg 8040
ccgatatcgc ctcccaccct tggcaggccg ccatcttcgc cgctgctgcc gcttctcctg 8100
gcgagagatt cctgtgcggc ggcatcctga tctccagctg ctggattctg tctgccgccc 8160
actgcttcca ggaacggttc cctcctcacc acctgaccgt gatcctgggc cggacctaca 8220
gagtcgtgcc cggcgaggaa gaacagaaat tcgaggtgga gaagtatatc gtgcacaaag 8280
agttcgacga cgacacctac gacaacgata tcgccctgct gcagctgaag tccgactcct 8340
ccagatgcgc ccaggaatcc tccgtcgttc ggaccgtgtg tctgccacct gccgacctgc 8400
agctgcctga ctggaccgag tgcgagctgt ccggctacgg caagcacgag gccctgtccc 8460
ccttctactc cgagcggctg aaagaagctc atgtacggct gtacccctct agccggtgca 8520
cctcccagca tctgctgaac cggaccgtga ccgacaacat gctgtgtgcc ggcgacacca 8580
gatctggcgg ccctcaggcc aacctgcacg acgcctgcca gggcgatagt ggcggacctc 8640
tcgtgtgcct caacgacggc aggatgaccc tcgtgggcat catctcttgg ggcctgggct 8700
gtggccagaa agacgtgcct ggcgtgtaca ccaaagtgac caactacctg gactggatca 8760
gggacaacat gcggccttga tgagcggccg cccgctgatc agcctcgact gtgccttcta 8820
gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 8880
ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 8940
attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata 9000
gcaggcatgc tggggatgcg gtgggctcta tggcttctga ggcggaaaga accagctggg 9060
gctctagggg gtatccccac ggagctcgca tccataatat aactgtacca ggttttggtt 9120
tattacatgt gactgacggc ttcctatgcg tgctcagaaa acggcagttg ggcactgcac 9180
tgcccggtga tggtgccacg gtggctcctg ccgccttctt tgatattcac tctgttgtat 9240
ttcatctctt gttgccgatg aaaggatata acagtctctg aggaaatact tggtatttct 9300
tctgatcagc gtttttataa gtaatgttga atattggata aggctgtgtg tcctttgtct 9360
tgggagacaa agcccacagc aggtggtggt tgggtggtgg cagctcagtg acaggagagg 9420
tttttttgcc tgtttttttt gttgtttttt ttttttaagt aaggtgttct tttttcttag 9480
taaaatttct actggactgt atgttttgac aggtcagaaa catttcttca aaagaagaac 9540
cttttggaaa ctgtacagcc cttttctttc attccctttt tgctttctgt gccaatgcct 9600
ttggttctga ttgcattatg gaaaacgttg atcggaactt gaggttttta tttatagtgt 9660
ggcttgaaag cttggatagc tgttgttaca tgagatacct tattaagttt aggccagctt 9720
gatgctttat tttttttcct ttgaagtagt gagcgttctc tggttttttt cctttgaaac 9780
tggcgaggct tagatttttc taatgggatt ttttacctga tgatctagtt gcatacccaa 9840
atgcttgtaa atgttttcct agttaacatg ttgataactt cggatttaca tgttgtatat 9900
acttgtcatc tgtgtttcta gtaaaaatat atggcattta tagaaatacg taattcctga 9960
tttccttttt tttttatctc tatgctctgt gtgtacaggt caaacagact tcactcctat 10020
ttttatttat agaattttat atgcagtctg tcgttggttc ttgtgttgta aggatacagc 10080
cttaaatttc ctagagcgat gctcagtaag gcgggttgtc acatgggttc aaatgtaaaa 10140
cgggcacgtt tgctgctgcc ttcccagatc caggacacta aactgcttct gcaactgagg 10200
tataaatcgc ttcagatccc aggaagtgta gatccacgtg catattctta aagaagaatg 10260
aatactttct aaaatatgtt ggcataggaa gcaagctgca tggatttatt tgggacttaa 10320
attattttgg taacggagtg cataggtttt aaacacagtt gcagcatgct aacgagtcac 10380
agcatttatg cagaagtgat gcctgttgca gctgtttacg gcactgcctt gcagtgagca 10440
ttgcagatag gggtggggtg ctttgtgtcg tgttgggaca cgctgccaca cagccacctc 10500
ccgaacatat ctcacctgct gggtactttt caaaccatct tagcagtagt agatgagtta 10560
ctatgaaaca gagaagttcc tcagttggat attctcatgg gatgtctttt ttcccatgtt 10620
gggcaaagta tgataaagca tctctatttg taaattatgc acttgttagt tcctgaatcc 10680
tttctatagc accacttatt gcagcaggtg taggctctgg tgtggcctgt gtctgtgctt 10740
caatctttta agcttgagct catggcgcgc ctaggccttg acggccttcc ttcaattcgc 10800
cctatagtga gtcgtattac gtcgcgctca ctggccgtcg ttttacaacg tcgtgactgg 10860
gaaaaccctg gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg 10920
cgtaatagcg aagaggcccg caccgaaacg cccttcccaa cagttgcgca gcctgaatgg 10980
cgaatgggag cgccctgtag cggccactca accctatctc ggtctattct tttgatttat 11040
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 11100
acgcgaattt taacaaaata ttaacgctta caatttag 11138
<210> 9
<211> 193
<212> PRT
<213> Artificial
<220>
<223> Darbepoetin
<400> 9
Met Gly Val His Glu Cys Pro Ala Trp Leu Trp Leu Leu Leu Ser Leu
1 5 10 15
Leu Ser Leu Pro Leu Gly Leu Pro Val Leu Gly Ala Pro Pro Arg Leu
20 25 30
Ile Cys Asp Ser Arg Val Leu Glu Arg Tyr Leu Leu Glu Ala Lys Glu
35 40 45
Ala Glu Asn Ile Thr Thr Gly Cys Asn Glu Thr Cys Ser Leu Asn Glu
50 55 60
Asn Ile Thr Val Pro Asp Thr Lys Val Asn Phe Tyr Ala Trp Lys Arg
65 70 75 80
Met Glu Val Gly Gln Gln Ala Val Glu Val Trp Gln Gly Leu Ala Leu
85 90 95
Leu Ser Glu Ala Val Leu Arg Gly Gln Ala Leu Leu Val Asn Ser Ser
100 105 110
Gln Val Asn Glu Thr Leu Gln Leu His Val Asp Lys Ala Val Ser Gly
115 120 125
Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala Leu Gly Ala Gln Lys Glu
130 135 140
Ala Ile Ser Pro Pro Asp Ala Ala Ser Ala Ala Pro Leu Arg Thr Ile
145 150 155 160
Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val Tyr Ser Asn Phe Leu
165 170 175
Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala Cys Arg Thr Gly Asp
180 185 190
Arg
<210> 10
<211> 10023
<212> DNA
<213> Artificial
<220>
<223> pZRC III- DARBE- Hyg
<400> 10
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920
atccttatcg attttaccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1980
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 2040
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 2100
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgctcg 2160
aagcggccgg ccgccccgac tctagactat tcctttgccc tcggacgagt gctggggcgt 2220
cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg 2280
cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga 2340
ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca 2400
agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc cggatgcctc 2460
cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg 2520
ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt 2580
atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg 2640
acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca 2700
ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat 2760
atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg 2820
ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac cggctgcaga 2880
acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag 2940
atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg aatcgggagc 3000
gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta 3060
tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg 3120
ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg 3180
acagacgtcg cggtgagttc aggctttccg gatctatcca tcatggtggc tttaccaaca 3240
gtaccggaat gccaagcttt ttgcaaaagc ctaggcctcc aaaaaagcct cctcactact 3300
tctggaatag ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc 3360
agcgatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta 3420
ggggcgggac tatggttgct gactaattga gatgcagatc gcagatcctc gggacgctct 3480
ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag 3540
cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg 3600
gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa 3660
cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt ccaggcgcgg 3720
cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg ttaggctgga 3780
aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc aagggttgag 3840
tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg gggtttgcct 3900
ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag cccctttttt 3960
gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag cagcggcaag 4020
agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg tcaggagggg 4080
caacatccga cgcgtgcatc cataatataa ctgtaccagg ttttggttta ttacatgtga 4140
ctgacggctt cctatgcgtg ctcagaaaac ggcagttggg cactgcactg cccggtgatg 4200
gtgccacggt ggctcctgcc gccttctttg atattcactc tgttgtattt catctcttgt 4260
tgccgatgaa aggatataac agtctctgag gaaatacttg gtatttcttc tgatcagcgt 4320
ttttataagt aatgttgaat attggataag gctgtgtgtc ctttgtcttg ggagacaaag 4380
cccacagcag gtggtggttg ggtggtggca gctcagtgac aggagaggtt tttttgcctg 4440
ttttttttgt tgtttttttt ttttaagtaa ggtgttcttt tttcttagta aaatttctac 4500
tggactgtat gttttgacag gtcagaaaca tttcttcaaa agaagaacct tttggaaact 4560
gtacagccct tttctttcat tccctttttg ctttctgtgc caatgccttt ggttctgatt 4620
gcattatgga aaacgttgat cggaacttga ggtttttatt tatagtgtgg cttgaaagct 4680
tggatagctg ttgttacatg agatacctta ttaagtttag gccagcttga tgctttattt 4740
tttttccttt gaagtagtga gcgttctctg gtttttttcc tttgaaactg gcgaggctta 4800
gatttttcta atgggatttt ttacctgatg atctagttgc atacccaaat gcttgtaaat 4860
gttttcctag ttaacatgtt gataacttcg gatttacatg ttgtatatac ttgtcatctg 4920
tgtttctagt aaaaatatat ggcatttata gaaatacgta attcctgatt tccttttttt 4980
tttatctcta tgctctgtgt gtacaggtca aacagacttc actcctattt ttatttatag 5040
aattttatat gcagtctgtc gttggttctt gtgttgtaag gatacagcct taaatttcct 5100
agagcgatgc tcagtaaggc gggttgtcac atgggttcaa atgtaaaacg ggcacgtttg 5160
ctgctgcctt cccagatcca ggacactaaa ctgcttctgc aactgaggta taaatcgctt 5220
cagatcccag gaagtgtaga tccacgtgca tattcttaaa gaagaatgaa tactttctaa 5280
aatatgttgg cataggaagc aagctgcatg gatttatttg ggacttaaat tattttggta 5340
acggagtgca taggttttaa acacagttgc agcatgctaa cgagtcacag catttatgca 5400
gaagtgatgc ctgttgcagc tgtttacggc actgccttgc agtgagcatt gcagataggg 5460
gtggggtgct ttgtgtcgtg ttgggacacg ctgccacaca gccacctccc gaacatatct 5520
cacctgctgg gtacttttca aaccatctta gcagtagtag atgagttact atgaaacaga 5580
gaagttcctc agttggatat tctcatggga tgtctttttt cccatgttgg gcaaagtatg 5640
ataaagcatc tctatttgta aattatgcac ttgttagttc ctgaatcctt tctatagcac 5700
cacttattgc agcaggtgta ggctctggtg tggcctgtgt ctgtgcttca atcttttaag 5760
cttacgcgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 5820
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 5880
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 5940
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6000
gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6060
tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6120
atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6180
cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 6240
agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 6300
ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 6360
gtgaaccgtc agatcctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta 6420
ctccctctca aaagcgggca tgacttctgc gctaagaatg tcagtttcca aaaacgagga 6480
ggatttgata ttcactggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca 6540
gaaaagacaa tctttttgtt gtcaagcttc cttgatgatg tcatacttat cctgtccctt 6600
ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt actcttggat 6660
cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc gagtccgcat 6720
cgaccggatc ggaaaacctc tcgacgtacc aattaattcg ctgtctgcga gggccagctg 6780
ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagat tgtcagtttc 6840
caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 6900
gtccatctgg tcagaaaaga caatcttttt gttgtcaagc ttgaggtgtg gcaggcttga 6960
gatctggcca tacacttgag tgacaatgac atccactttg cctttctctc cacaggtgtc 7020
cactcccagg tccaactgca ggtcgagcat gcatctaggg cgcccgcact agaggctcga 7080
gccaccatgg gggtgcacga atgtcctgcc tggctgtggc ttctcctgtc cctgctgtcg 7140
ctccctctgg gcctcccagt cctgggcgcc ccaccacgcc tcatctgtga cagccgagtc 7200
ctggagaggt acctcttgga ggccaaggag gccgagaata tcacgacggg ctgtaatgaa 7260
acctgcagct tgaatgagaa tatcactgtc ccagacacca aagttaattt ctatgcctgg 7320
aagaggatgg aggtcgggca gcaggccgta gaagtctggc agggcctggc cctgctgtcg 7380
gaagctgtcc tgcggggcca ggccctgttg gtcaactctt cccaggtgaa cgagaccctg 7440
cagctgcatg tggataaagc cgtcagtggc cttcgcagcc tcaccactct gcttcgggct 7500
ctgggagccc agaaggaagc catctcccct ccagatgcgg cctcagctgc tccactccga 7560
acaatcactg ctgacacttt ccgcaaactc ttccgagtct actccaattt cctccgggga 7620
aagctgaagc tgtacacagg ggaggcctgc aggacagggg acagatgagc ggccgcccgc 7680
tgatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 7740
ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 7800
gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 7860
aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct 7920
tctgaggcgg aaagaaccag ctggggctct agggggtatc cccacggagc tcgcatccat 7980
aatataactg taccaggttt tggtttatta catgtgactg acggcttcct atgcgtgctc 8040
agaaaacggc agttgggcac tgcactgccc ggtgatggtg ccacggtggc tcctgccgcc 8100
ttctttgata ttcactctgt tgtatttcat ctcttgttgc cgatgaaagg atataacagt 8160
ctctgaggaa atacttggta tttcttctga tcagcgtttt tataagtaat gttgaatatt 8220
ggataaggct gtgtgtcctt tgtcttggga gacaaagccc acagcaggtg gtggttgggt 8280
ggtggcagct cagtgacagg agaggttttt ttgcctgttt tttttgttgt tttttttttt 8340
taagtaaggt gttctttttt cttagtaaaa tttctactgg actgtatgtt ttgacaggtc 8400
agaaacattt cttcaaaaga agaacctttt ggaaactgta cagccctttt ctttcattcc 8460
ctttttgctt tctgtgccaa tgcctttggt tctgattgca ttatggaaaa cgttgatcgg 8520
aacttgaggt ttttatttat agtgtggctt gaaagcttgg atagctgttg ttacatgaga 8580
taccttatta agtttaggcc agcttgatgc tttatttttt ttcctttgaa gtagtgagcg 8640
ttctctggtt tttttccttt gaaactggcg aggcttagat ttttctaatg ggatttttta 8700
cctgatgatc tagttgcata cccaaatgct tgtaaatgtt ttcctagtta acatgttgat 8760
aacttcggat ttacatgttg tatatacttg tcatctgtgt ttctagtaaa aatatatggc 8820
atttatagaa atacgtaatt cctgatttcc tttttttttt atctctatgc tctgtgtgta 8880
caggtcaaac agacttcact cctattttta tttatagaat tttatatgca gtctgtcgtt 8940
ggttcttgtg ttgtaaggat acagccttaa atttcctaga gcgatgctca gtaaggcggg 9000
ttgtcacatg ggttcaaatg taaaacgggc acgtttgctg ctgccttccc agatccagga 9060
cactaaactg cttctgcaac tgaggtataa atcgcttcag atcccaggaa gtgtagatcc 9120
acgtgcatat tcttaaagaa gaatgaatac tttctaaaat atgttggcat aggaagcaag 9180
ctgcatggat ttatttggga cttaaattat tttggtaacg gagtgcatag gttttaaaca 9240
cagttgcagc atgctaacga gtcacagcat ttatgcagaa gtgatgcctg ttgcagctgt 9300
ttacggcact gccttgcagt gagcattgca gataggggtg gggtgctttg tgtcgtgttg 9360
ggacacgctg ccacacagcc acctcccgaa catatctcac ctgctgggta cttttcaaac 9420
catcttagca gtagtagatg agttactatg aaacagagaa gttcctcagt tggatattct 9480
catgggatgt cttttttccc atgttgggca aagtatgata aagcatctct atttgtaaat 9540
tatgcacttg ttagttcctg aatcctttct atagcaccac ttattgcagc aggtgtaggc 9600
tctggtgtgg cctgtgtctg tgcttcaatc ttttaagctt gagctcatgg cgcgcctagg 9660
ccttgacggc cttccttcaa ttcgccctat agtgagtcgt attacgtcgc gctcactggc 9720
cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc 9780
agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg aaacgccctt 9840
cccaacagtt gcgcagcctg aatggcgaat gggagcgccc tgtagcggcc actcaaccct 9900
atctcggtct attcttttga tttataaggg attttgccga tttcggccta ttggttaaaa 9960
aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac gcttacaatt 10020
tag 10023
<210> 11
<211> 489
<212> PRT
<213> Artificial
<220>
<223> Etanercept
<400> 11
Met Ala Pro Val Ala Val Trp Ala Ala Leu Ala Val Gly Leu Glu Leu
1 5 10 15
Trp Ala Ala Ala His Ala Leu Pro Ala Gln Val Ala Phe Thr Pro Tyr
20 25 30
Ala Pro Glu Pro Gly Ser Thr Cys Arg Leu Arg Glu Tyr Tyr Asp Gln
35 40 45
Thr Ala Gln Met Cys Cys Ser Lys Cys Ser Pro Gly Gln His Ala Lys
50 55 60
Val Phe Cys Thr Lys Thr Ser Asp Thr Val Cys Asp Ser Cys Glu Asp
65 70 75 80
Ser Thr Tyr Thr Gln Leu Trp Asn Trp Val Pro Glu Cys Leu Ser Cys
85 90 95
Gly Ser Arg Cys Ser Ser Asp Gln Val Glu Thr Gln Ala Cys Thr Arg
100 105 110
Glu Gln Asn Arg Ile Cys Thr Cys Arg Pro Gly Trp Tyr Cys Ala Leu
115 120 125
Ser Lys Gln Glu Gly Cys Arg Leu Cys Ala Pro Leu Arg Lys Cys Arg
130 135 140
Pro Gly Phe Gly Val Ala Arg Pro Gly Thr Glu Thr Ser Asp Val Val
145 150 155 160
Cys Lys Pro Cys Ala Pro Gly Thr Phe Ser Asn Thr Thr Ser Ser Thr
165 170 175
Asp Ile Cys Arg Pro His Gln Ile Cys Asn Val Val Ala Ile Pro Gly
180 185 190
Asn Ala Ser Met Asp Ala Val Cys Thr Ser Thr Ser Pro Thr Arg Ser
195 200 205
Met Ala Pro Gly Ala Val His Leu Pro Gln Pro Val Ser Thr Arg Ser
210 215 220
Gln His Thr Gln Pro Thr Pro Glu Pro Ser Thr Ala Pro Ser Thr Ser
225 230 235 240
Phe Leu Leu Pro Met Gly Pro Ser Pro Pro Ala Glu Gly Ser Thr Gly
245 250 255
Asp Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro
260 265 270
Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys
275 280 285
Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val
290 295 300
Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr
305 310 315 320
Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu
325 330 335
Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His
340 345 350
Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys
355 360 365
Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln
370 375 380
Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met
385 390 395 400
Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro
405 410 415
Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn
420 425 430
Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu
435 440 445
Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val
450 455 460
Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln
465 470 475 480
Lys Ser Leu Ser Leu Ser Pro Gly Lys
485
<210> 12
<211> 10911
<212> DNA
<213> Artificial
<220>
<223> pZRC III - Etanercept - Hyg
<400> 12
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920
atccttatcg attttaccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1980
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 2040
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 2100
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgctcg 2160
aagcggccgg ccgccccgac tctagactat tcctttgccc tcggacgagt gctggggcgt 2220
cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg 2280
cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga 2340
ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca 2400
agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc cggatgcctc 2460
cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg 2520
ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt 2580
atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg 2640
acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca 2700
ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat 2760
atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg 2820
ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac cggctgcaga 2880
acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag 2940
atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg aatcgggagc 3000
gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta 3060
tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg 3120
ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg 3180
acagacgtcg cggtgagttc aggctttccg gatctatcca tcatggtggc tttaccaaca 3240
gtaccggaat gccaagcttt ttgcaaaagc ctaggcctcc aaaaaagcct cctcactact 3300
tctggaatag ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc 3360
agcgatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta 3420
ggggcgggac tatggttgct gactaattga gatgcagatc gcagatcctc gggacgctct 3480
ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag 3540
cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg 3600
gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa 3660
cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt ccaggcgcgg 3720
cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg ttaggctgga 3780
aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc aagggttgag 3840
tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg gggtttgcct 3900
ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag cccctttttt 3960
gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag cagcggcaag 4020
agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg tcaggagggg 4080
caacatccga cgcgtgcatc cataatataa ctgtaccagg ttttggttta ttacatgtga 4140
ctgacggctt cctatgcgtg ctcagaaaac ggcagttggg cactgcactg cccggtgatg 4200
gtgccacggt ggctcctgcc gccttctttg atattcactc tgttgtattt catctcttgt 4260
tgccgatgaa aggatataac agtctctgag gaaatacttg gtatttcttc tgatcagcgt 4320
ttttataagt aatgttgaat attggataag gctgtgtgtc ctttgtcttg ggagacaaag 4380
cccacagcag gtggtggttg ggtggtggca gctcagtgac aggagaggtt tttttgcctg 4440
ttttttttgt tgtttttttt ttttaagtaa ggtgttcttt tttcttagta aaatttctac 4500
tggactgtat gttttgacag gtcagaaaca tttcttcaaa agaagaacct tttggaaact 4560
gtacagccct tttctttcat tccctttttg ctttctgtgc caatgccttt ggttctgatt 4620
gcattatgga aaacgttgat cggaacttga ggtttttatt tatagtgtgg cttgaaagct 4680
tggatagctg ttgttacatg agatacctta ttaagtttag gccagcttga tgctttattt 4740
tttttccttt gaagtagtga gcgttctctg gtttttttcc tttgaaactg gcgaggctta 4800
gatttttcta atgggatttt ttacctgatg atctagttgc atacccaaat gcttgtaaat 4860
gttttcctag ttaacatgtt gataacttcg gatttacatg ttgtatatac ttgtcatctg 4920
tgtttctagt aaaaatatat ggcatttata gaaatacgta attcctgatt tccttttttt 4980
tttatctcta tgctctgtgt gtacaggtca aacagacttc actcctattt ttatttatag 5040
aattttatat gcagtctgtc gttggttctt gtgttgtaag gatacagcct taaatttcct 5100
agagcgatgc tcagtaaggc gggttgtcac atgggttcaa atgtaaaacg ggcacgtttg 5160
ctgctgcctt cccagatcca ggacactaaa ctgcttctgc aactgaggta taaatcgctt 5220
cagatcccag gaagtgtaga tccacgtgca tattcttaaa gaagaatgaa tactttctaa 5280
aatatgttgg cataggaagc aagctgcatg gatttatttg ggacttaaat tattttggta 5340
acggagtgca taggttttaa acacagttgc agcatgctaa cgagtcacag catttatgca 5400
gaagtgatgc ctgttgcagc tgtttacggc actgccttgc agtgagcatt gcagataggg 5460
gtggggtgct ttgtgtcgtg ttgggacacg ctgccacaca gccacctccc gaacatatct 5520
cacctgctgg gtacttttca aaccatctta gcagtagtag atgagttact atgaaacaga 5580
gaagttcctc agttggatat tctcatggga tgtctttttt cccatgttgg gcaaagtatg 5640
ataaagcatc tctatttgta aattatgcac ttgttagttc ctgaatcctt tctatagcac 5700
cacttattgc agcaggtgta ggctctggtg tggcctgtgt ctgtgcttca atcttttaag 5760
cttacgcgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 5820
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 5880
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 5940
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6000
gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6060
tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6120
atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6180
cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 6240
agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 6300
ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 6360
gtgaaccgtc agatcctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta 6420
ctccctctca aaagcgggca tgacttctgc gctaagaatg tcagtttcca aaaacgagga 6480
ggatttgata ttcactggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca 6540
gaaaagacaa tctttttgtt gtcaagcttc cttgatgatg tcatacttat cctgtccctt 6600
ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt actcttggat 6660
cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc gagtccgcat 6720
cgaccggatc ggaaaacctc tcgacgtacc aattaattcg ctgtctgcga gggccagctg 6780
ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagat tgtcagtttc 6840
caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 6900
gtccatctgg tcagaaaaga caatcttttt gttgtcaagc ttgaggtgtg gcaggcttga 6960
gatctggcca tacacttgag tgacaatgac atccactttg cctttctctc cacaggtgtc 7020
cactcccagg tccaactgca ggtcgagcat gcatctaggg cgcccgcact agaggctcga 7080
gccatggctc cagtggctgt gtgggctgct ctggctgtgg gcctggaact gtgggccgct 7140
gctcacgctc tgcctgctca ggtggccttc accccttatg cccctgagcc tggctccacc 7200
tgcaggctgc gggagtacta cgaccagacc gcccagatgt gctgctccaa gtgctctcct 7260
ggccagcacg ccaaggtgtt ctgcaccaag acctccgaca ccgtgtgcga ctcttgcgag 7320
gactccacct acacccagct ctggaactgg gtgcccgagt gcctgtcctg cggctccaga 7380
tgctcctccg accaggtgga gacacaggcc tgtacacggg agcagaatcg gatttgcaca 7440
tgcaggcctg gctggtactg cgccctgtcc aagcaggaag gatgcaggct gtgcgcccct 7500
ctgaggaagt gcagacctgg cttcggcgtg gctaggcctg gcaccgagac atccgacgtc 7560
gtgtgcaagc cttgtgcccc tggcaccttc tccaacacca catcctccac cgacatctgc 7620
cggcctcacc agatctgcaa cgtggtggcc atccctggca acgccagcat ggacgccgtg 7680
tgcacctcca cctcccccac cagatctatg gcccctggcg ccgtgcatct gcctcagcct 7740
gtgtccaccc ggtcccagca tacccagcct acacctgagc cctctaccgc cccttctacc 7800
tccttcctgc tgcctatggg cccttctcct ccagctgagg gctctaccgg cgacgagcct 7860
aagtcctgcg acaagaccca cacctgtccc ccctgccctg cccctgaact gctgggaggc 7920
cccagcgtgt tcctgttccc cccaaagccc aaggacaccc tgatgatctc ccggaccccc 7980
gaagtgacct gcgtggtggt ggacgtgtcc cacgaggacc ctgaagtgaa gttcaattgg 8040
tacgtggacg gcgtggaagt gcacaacgcc aagaccaagc ccagagagga acagtacaac 8100
tccacctacc gggtggtgtc cgtgctgacc gtgctgcacc aggactggct gaacggcaaa 8160
gagtacaagt gcaaggtgtc caacaaggct ctgcctgccc ccatcgaaaa gaccatctcc 8220
aaggccaagg gccagccccg cgagcctcag gtgtacaccc tgcctccttc ccgggaggag 8280
atgaccaaga accaggtgtc cctgacctgt ctggtcaagg gcttctaccc ctccgatatc 8340
gccgtggaat gggagtccaa cggacagccc gagaacaact acaagaccac cccccctgtg 8400
ctggactccg acggctcatt cttcctgtac tccaagctga ccgtggacaa gtcccggtgg 8460
cagcagggca acgtgttctc ctgctccgtg atgcacgagg ccctgcacaa ccactacacc 8520
cagaagagct tatccctgtc tcctggcaag tgataagcgg ccgcccgctg atcagcctcg 8580
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 8640
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 8700
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 8760
tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 8820
agaaccagct ggggctctag ggggtatccc cacggagctc gcatccataa tataactgta 8880
ccaggttttg gtttattaca tgtgactgac ggcttcctat gcgtgctcag aaaacggcag 8940
ttgggcactg cactgcccgg tgatggtgcc acggtggctc ctgccgcctt ctttgatatt 9000
cactctgttg tatttcatct cttgttgccg atgaaaggat ataacagtct ctgaggaaat 9060
acttggtatt tcttctgatc agcgttttta taagtaatgt tgaatattgg ataaggctgt 9120
gtgtcctttg tcttgggaga caaagcccac agcaggtggt ggttgggtgg tggcagctca 9180
gtgacaggag aggttttttt gcctgttttt tttgttgttt ttttttttta agtaaggtgt 9240
tcttttttct tagtaaaatt tctactggac tgtatgtttt gacaggtcag aaacatttct 9300
tcaaaagaag aaccttttgg aaactgtaca gcccttttct ttcattccct ttttgctttc 9360
tgtgccaatg cctttggttc tgattgcatt atggaaaacg ttgatcggaa cttgaggttt 9420
ttatttatag tgtggcttga aagcttggat agctgttgtt acatgagata ccttattaag 9480
tttaggccag cttgatgctt tatttttttt cctttgaagt agtgagcgtt ctctggtttt 9540
tttcctttga aactggcgag gcttagattt ttctaatggg attttttacc tgatgatcta 9600
gttgcatacc caaatgcttg taaatgtttt cctagttaac atgttgataa cttcggattt 9660
acatgttgta tatacttgtc atctgtgttt ctagtaaaaa tatatggcat ttatagaaat 9720
acgtaattcc tgatttcctt ttttttttat ctctatgctc tgtgtgtaca ggtcaaacag 9780
acttcactcc tatttttatt tatagaattt tatatgcagt ctgtcgttgg ttcttgtgtt 9840
gtaaggatac agccttaaat ttcctagagc gatgctcagt aaggcgggtt gtcacatggg 9900
ttcaaatgta aaacgggcac gtttgctgct gccttcccag atccaggaca ctaaactgct 9960
tctgcaactg aggtataaat cgcttcagat cccaggaagt gtagatccac gtgcatattc 10020
ttaaagaaga atgaatactt tctaaaatat gttggcatag gaagcaagct gcatggattt 10080
atttgggact taaattattt tggtaacgga gtgcataggt tttaaacaca gttgcagcat 10140
gctaacgagt cacagcattt atgcagaagt gatgcctgtt gcagctgttt acggcactgc 10200
cttgcagtga gcattgcaga taggggtggg gtgctttgtg tcgtgttggg acacgctgcc 10260
acacagccac ctcccgaaca tatctcacct gctgggtact tttcaaacca tcttagcagt 10320
agtagatgag ttactatgaa acagagaagt tcctcagttg gatattctca tgggatgtct 10380
tttttcccat gttgggcaaa gtatgataaa gcatctctat ttgtaaatta tgcacttgtt 10440
agttcctgaa tcctttctat agcaccactt attgcagcag gtgtaggctc tggtgtggcc 10500
tgtgtctgtg cttcaatctt ttaagcttga gctcatggcg cgcctaggcc ttgacggcct 10560
tccttcaatt cgccctatag tgagtcgtat tacgtcgcgc tcactggccg tcgttttaca 10620
acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 10680
tttcgccagc tggcgtaata gcgaagaggc ccgcaccgaa acgcccttcc caacagttgc 10740
gcagcctgaa tggcgaatgg gagcgccctg tagcggccac tcaaccctat ctcggtctat 10800
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 10860
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaattta g 10911
<210> 13
<211> 116
<212> PRT
<213> Artificial
<220>
<223> FSH alpha
<400> 13
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
<210> 14
<211> 599
<212> DNA
<213> Artificial
<220>
<223> IRES
<400> 14
gcggccgcgc cgcactagag gaattccgcc cctctccccc cccccctaac gttactggcc 60
gaagccgctt ggaataaggc cggtgtgcgt ttgtctatat gttattttcc accatattgc 120
cgtcttttgg caatgtgagg gcccggaaac ctggccctgt cttcttgacg agcattccta 180
ggggtctttc ccctctcgcc aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag 240
ttcctctgga agcttcttga agacaaacaa cgtctgtagc gaccctttgc aggcagcgga 300
accccccacc tggcgacagg tgcctctgcg gccaaaagcc acgtgtataa gatacacctg 360
caaaggcggc acaaccccag tgccacgttg tgagttggat agttgtggaa agagtcaaat 420
ggctctcctc aagcgtattc aacaaggggc tgaaggatgc ccagaaggta ccccattgta 480
tgggatctga tctggggcct cggtgcacat gctttacatg tgtttagtcg aggttaaaaa 540
aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataa 599
<210> 15
<211> 129
<212> PRT
<213> Artificial
<220>
<223> FSH beta
<400> 15
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Ile Glu Lys
20 25 30
Glu Glu Cys Arg Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
<210> 16
<211> 10801
<212> DNA
<213> Artificial
<220>
<223> pZRC III- FSH alpha- IRES- FSH beta- Hyg
<400> 16
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920
atccttatcg attttaccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1980
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 2040
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 2100
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgctcg 2160
aagcggccgg ccgccccgac tctagactat tcctttgccc tcggacgagt gctggggcgt 2220
cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg 2280
cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga 2340
ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca 2400
agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc cggatgcctc 2460
cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg 2520
ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt 2580
atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg 2640
acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca 2700
ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat 2760
atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg 2820
ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac cggctgcaga 2880
acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag 2940
atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg aatcgggagc 3000
gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta 3060
tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg 3120
ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg 3180
acagacgtcg cggtgagttc aggctttccg gatctatcca tcatggtggc tttaccaaca 3240
gtaccggaat gccaagcttt ttgcaaaagc ctaggcctcc aaaaaagcct cctcactact 3300
tctggaatag ctcagaggcc gaggcggcct cggcctctgc ataaataaaa aaaattagtc 3360
agcgatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg ggcggagtta 3420
ggggcgggac tatggttgct gactaattga gatgcagatc gcagatcctc gggacgctct 3480
ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag agcctgtaag 3540
cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg gacgaccggg 3600
gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc gcgtgtcgaa 3660
cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt ccaggcgcgg 3720
cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg ttaggctgga 3780
aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc aagggttgag 3840
tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg gggtttgcct 3900
ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag cccctttttt 3960
gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag cagcggcaag 4020
agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg tcaggagggg 4080
caacatccga cgcgtgcatc cataatataa ctgtaccagg ttttggttta ttacatgtga 4140
ctgacggctt cctatgcgtg ctcagaaaac ggcagttggg cactgcactg cccggtgatg 4200
gtgccacggt ggctcctgcc gccttctttg atattcactc tgttgtattt catctcttgt 4260
tgccgatgaa aggatataac agtctctgag gaaatacttg gtatttcttc tgatcagcgt 4320
ttttataagt aatgttgaat attggataag gctgtgtgtc ctttgtcttg ggagacaaag 4380
cccacagcag gtggtggttg ggtggtggca gctcagtgac aggagaggtt tttttgcctg 4440
ttttttttgt tgtttttttt ttttaagtaa ggtgttcttt tttcttagta aaatttctac 4500
tggactgtat gttttgacag gtcagaaaca tttcttcaaa agaagaacct tttggaaact 4560
gtacagccct tttctttcat tccctttttg ctttctgtgc caatgccttt ggttctgatt 4620
gcattatgga aaacgttgat cggaacttga ggtttttatt tatagtgtgg cttgaaagct 4680
tggatagctg ttgttacatg agatacctta ttaagtttag gccagcttga tgctttattt 4740
tttttccttt gaagtagtga gcgttctctg gtttttttcc tttgaaactg gcgaggctta 4800
gatttttcta atgggatttt ttacctgatg atctagttgc atacccaaat gcttgtaaat 4860
gttttcctag ttaacatgtt gataacttcg gatttacatg ttgtatatac ttgtcatctg 4920
tgtttctagt aaaaatatat ggcatttata gaaatacgta attcctgatt tccttttttt 4980
tttatctcta tgctctgtgt gtacaggtca aacagacttc actcctattt ttatttatag 5040
aattttatat gcagtctgtc gttggttctt gtgttgtaag gatacagcct taaatttcct 5100
agagcgatgc tcagtaaggc gggttgtcac atgggttcaa atgtaaaacg ggcacgtttg 5160
ctgctgcctt cccagatcca ggacactaaa ctgcttctgc aactgaggta taaatcgctt 5220
cagatcccag gaagtgtaga tccacgtgca tattcttaaa gaagaatgaa tactttctaa 5280
aatatgttgg cataggaagc aagctgcatg gatttatttg ggacttaaat tattttggta 5340
acggagtgca taggttttaa acacagttgc agcatgctaa cgagtcacag catttatgca 5400
gaagtgatgc ctgttgcagc tgtttacggc actgccttgc agtgagcatt gcagataggg 5460
gtggggtgct ttgtgtcgtg ttgggacacg ctgccacaca gccacctccc gaacatatct 5520
cacctgctgg gtacttttca aaccatctta gcagtagtag atgagttact atgaaacaga 5580
gaagttcctc agttggatat tctcatggga tgtctttttt cccatgttgg gcaaagtatg 5640
ataaagcatc tctatttgta aattatgcac ttgttagttc ctgaatcctt tctatagcac 5700
cacttattgc agcaggtgta ggctctggtg tggcctgtgt ctgtgcttca atcttttaag 5760
cttacgcgtt gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta 5820
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 5880
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 5940
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 6000
gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 6060
tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 6120
atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg 6180
cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg 6240
agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca 6300
ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta 6360
gtgaaccgtc agatcctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta 6420
ctccctctca aaagcgggca tgacttctgc gctaagaatg tcagtttcca aaaacgagga 6480
ggatttgata ttcactggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca 6540
gaaaagacaa tctttttgtt gtcaagcttc cttgatgatg tcatacttat cctgtccctt 6600
ttttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt actcttggat 6660
cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc gagtccgcat 6720
cgaccggatc ggaaaacctc tcgacgtacc aattaattcg ctgtctgcga gggccagctg 6780
ttggggtgag tactccctct caaaagcggg catgacttct gcgctaagat tgtcagtttc 6840
caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 6900
gtccatctgg tcagaaaaga caatcttttt gttgtcaagc ttgaggtgtg gcaggcttga 6960
gatctggcca tacacttgag tgacaatgac atccactttg cctttctctc cacaggtgtc 7020
cactcccagg tccaactgca ggtcgagcat gcatctaggg cgcccgcact agaggctcga 7080
gccaccatgg actactaccg gaagtacgcc gccatcttcc tggtgaccct gtccgtgttc 7140
ctgcacgtgc tgcactctgc ccctgacgtg caggactgcc ctgagtgcac cctgcaggaa 7200
aacccattct tcagccagcc tggcgcccct atcctgcagt gcatgggctg ctgcttctcc 7260
agagcctacc ctacccctct gcggtccaag aaaaccatgc tggtgcagaa aaacgtgacc 7320
tccgagtcta cctgctgcgt ggccaagtcc tacaacagag tgaccgtgat gggcggcttc 7380
aaggtggaga accacaccgc ctgccactgc tctacctgct actaccacaa gtcctgatga 7440
gcggccgcgc cgcactagag gaattccgcc cctctccccc cccccctaac gttactggcc 7500
gaagccgctt ggaataaggc cggtgtgcgt ttgtctatat gttattttcc accatattgc 7560
cgtcttttgg caatgtgagg gcccggaaac ctggccctgt cttcttgacg agcattccta 7620
ggggtctttc ccctctcgcc aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag 7680
ttcctctgga agcttcttga agacaaacaa cgtctgtagc gaccctttgc aggcagcgga 7740
accccccacc tggcgacagg tgcctctgcg gccaaaagcc acgtgtataa gatacacctg 7800
caaaggcggc acaaccccag tgccacgttg tgagttggat agttgtggaa agagtcaaat 7860
ggctctcctc aagcgtattc aacaaggggc tgaaggatgc ccagaaggta ccccattgta 7920
tgggatctga tctggggcct cggtgcacat gctttacatg tgtttagtcg aggttaaaaa 7980
aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataac 8040
ccgggccacc atgaagaccc tgcagttctt cttcctgttc tgctgctgga aggccatctg 8100
ctgcaactct tgcgagctga ccaacatcac aatcgccatc gagaaagagg aatgccggtt 8160
ctgcatctcc atcaacacca cttggtgcgc cggctactgc tacacccgcg acctggtgta 8220
caaggaccct gcccggccta agatccagaa aacctgcacc ttcaaagaac tggtgtacga 8280
gacagtgcgg gtgccaggct gcgctcacca cgccgactcc ctgtacacct accctgtggc 8340
cacccagtgc cactgcggca agtgcgactc cgactccacc gactgtaccg tgcggggcct 8400
gggcccttct tactgctcct tcggcgagat gaaggaatga tgaccagcgg ccgcccgctg 8460
atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 8520
ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 8580
atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa 8640
gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc 8700
tgaggcggaa agaaccagct ggggctctag ggggtatccc cacggagctc gcatccataa 8760
tataactgta ccaggttttg gtttattaca tgtgactgac ggcttcctat gcgtgctcag 8820
aaaacggcag ttgggcactg cactgcccgg tgatggtgcc acggtggctc ctgccgcctt 8880
ctttgatatt cactctgttg tatttcatct cttgttgccg atgaaaggat ataacagtct 8940
ctgaggaaat acttggtatt tcttctgatc agcgttttta taagtaatgt tgaatattgg 9000
ataaggctgt gtgtcctttg tcttgggaga caaagcccac agcaggtggt ggttgggtgg 9060
tggcagctca gtgacaggag aggttttttt gcctgttttt tttgttgttt ttttttttta 9120
agtaaggtgt tcttttttct tagtaaaatt tctactggac tgtatgtttt gacaggtcag 9180
aaacatttct tcaaaagaag aaccttttgg aaactgtaca gcccttttct ttcattccct 9240
ttttgctttc tgtgccaatg cctttggttc tgattgcatt atggaaaacg ttgatcggaa 9300
cttgaggttt ttatttatag tgtggcttga aagcttggat agctgttgtt acatgagata 9360
ccttattaag tttaggccag cttgatgctt tatttttttt cctttgaagt agtgagcgtt 9420
ctctggtttt tttcctttga aactggcgag gcttagattt ttctaatggg attttttacc 9480
tgatgatcta gttgcatacc caaatgcttg taaatgtttt cctagttaac atgttgataa 9540
cttcggattt acatgttgta tatacttgtc atctgtgttt ctagtaaaaa tatatggcat 9600
ttatagaaat acgtaattcc tgatttcctt ttttttttat ctctatgctc tgtgtgtaca 9660
ggtcaaacag acttcactcc tatttttatt tatagaattt tatatgcagt ctgtcgttgg 9720
ttcttgtgtt gtaaggatac agccttaaat ttcctagagc gatgctcagt aaggcgggtt 9780
gtcacatggg ttcaaatgta aaacgggcac gtttgctgct gccttcccag atccaggaca 9840
ctaaactgct tctgcaactg aggtataaat cgcttcagat cccaggaagt gtagatccac 9900
gtgcatattc ttaaagaaga atgaatactt tctaaaatat gttggcatag gaagcaagct 9960
gcatggattt atttgggact taaattattt tggtaacgga gtgcataggt tttaaacaca 10020
gttgcagcat gctaacgagt cacagcattt atgcagaagt gatgcctgtt gcagctgttt 10080
acggcactgc cttgcagtga gcattgcaga taggggtggg gtgctttgtg tcgtgttggg 10140
acacgctgcc acacagccac ctcccgaaca tatctcacct gctgggtact tttcaaacca 10200
tcttagcagt agtagatgag ttactatgaa acagagaagt tcctcagttg gatattctca 10260
tgggatgtct tttttcccat gttgggcaaa gtatgataaa gcatctctat ttgtaaatta 10320
tgcacttgtt agttcctgaa tcctttctat agcaccactt attgcagcag gtgtaggctc 10380
tggtgtggcc tgtgtctgtg cttcaatctt ttaagcttga gctcatggcg cgcctaggcc 10440
ttgacggcct tccttcaatt cgccctatag tgagtcgtat tacgtcgcgc tcactggccg 10500
tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 10560
cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgaa acgcccttcc 10620
caacagttgc gcagcctgaa tggcgaatgg gagcgccctg tagcggccac tcaaccctat 10680
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 10740
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaattta 10800
g 10801
<210> 17
<211> 10710
<212> DNA
<213> Artificial
<220>
<223> pZRC III- TNK- Puro
<400> 17
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920
taccggatct gcgatctgca tctcaattag tcagcaacca tagtcccgcc cctaactccg 1980
cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatcg ctgactaatt 2040
ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca gaagtagtga 2100
ggaggctttt ttggaggcct aggcttttgc aaaaagcttg gcattccggt actgttggta 2160
aagccaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtccccc 2220
gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg 2280
acccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg 2340
ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca 2400
cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt 2460
tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc 2520
ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac cagggcaagg 2580
gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg 2640
ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg 2700
tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg 2760
gtgcctgatc tagctagagt cggggcggcc ggccgcttcg agcagacatg ataagataca 2820
ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 2880
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2940
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaagca 3000
agtaaaacct ctacaaatgt ggtaaaatcg ataaggatcc tcgggacgct ctggccggtg 3060
aggcgtgcgc agtcgttgac gctctagacc gtgcaaaagg agagcctgta agcgggcact 3120
cttccgtggt ctggtggata aattcgcaag ggtatcatgg cggacgaccg gggttcgaac 3180
cccagatccg gccgtccgcc gtgatccatg cggttaccgc ccgcgtgtcg aacccaggtg 3240
tgcgacgtca gacaacgggg gagcgctcct tttggcttcc ttccaggcgc ggcggctgct 3300
gcgctagctt ttttggccac tggccgcgcg cggcgtaagc ggttaggctg gaaagcgaaa 3360
gcattaagtg gctcgctccc tgtagccgga gggttatttt ccaagggttg agtcgcagga 3420
cccccggttc gagtctcggg ccggccggac tgcggcgaac gggggtttgc ctccccgtca 3480
tgcaagaccc cgcttgcaaa ttcctccgga aacagggacg agcccctttt ttgcttttcc 3540
cagatgcatc cggtgctgcg gcagatgcgc ccccctcctc agcagcggca agagcaagag 3600
cagcggcaga catgcagggc accctcccct tctcctaccg cgtcaggagg ggcaacatcc 3660
gacgcgtgca tccataatat aactgtacca ggttttggtt tattacatgt gactgacggc 3720
ttcctatgcg tgctcagaaa acggcagttg ggcactgcac tgcccggtga tggtgccacg 3780
gtggctcctg ccgccttctt tgatattcac tctgttgtat ttcatctctt gttgccgatg 3840
aaaggatata acagtctctg aggaaatact tggtatttct tctgatcagc gtttttataa 3900
gtaatgttga atattggata aggctgtgtg tcctttgtct tgggagacaa agcccacagc 3960
aggtggtggt tgggtggtgg cagctcagtg acaggagagg tttttttgcc tgtttttttt 4020
gttgtttttt ttttttaagt aaggtgttct tttttcttag taaaatttct actggactgt 4080
atgttttgac aggtcagaaa catttcttca aaagaagaac cttttggaaa ctgtacagcc 4140
cttttctttc attccctttt tgctttctgt gccaatgcct ttggttctga ttgcattatg 4200
gaaaacgttg atcggaactt gaggttttta tttatagtgt ggcttgaaag cttggatagc 4260
tgttgttaca tgagatacct tattaagttt aggccagctt gatgctttat tttttttcct 4320
ttgaagtagt gagcgttctc tggttttttt cctttgaaac tggcgaggct tagatttttc 4380
taatgggatt ttttacctga tgatctagtt gcatacccaa atgcttgtaa atgttttcct 4440
agttaacatg ttgataactt cggatttaca tgttgtatat acttgtcatc tgtgtttcta 4500
gtaaaaatat atggcattta tagaaatacg taattcctga tttccttttt tttttatctc 4560
tatgctctgt gtgtacaggt caaacagact tcactcctat ttttatttat agaattttat 4620
atgcagtctg tcgttggttc ttgtgttgta aggatacagc cttaaatttc ctagagcgat 4680
gctcagtaag gcgggttgtc acatgggttc aaatgtaaaa cgggcacgtt tgctgctgcc 4740
ttcccagatc caggacacta aactgcttct gcaactgagg tataaatcgc ttcagatccc 4800
aggaagtgta gatccacgtg catattctta aagaagaatg aatactttct aaaatatgtt 4860
ggcataggaa gcaagctgca tggatttatt tgggacttaa attattttgg taacggagtg 4920
cataggtttt aaacacagtt gcagcatgct aacgagtcac agcatttatg cagaagtgat 4980
gcctgttgca gctgtttacg gcactgcctt gcagtgagca ttgcagatag gggtggggtg 5040
ctttgtgtcg tgttgggaca cgctgccaca cagccacctc ccgaacatat ctcacctgct 5100
gggtactttt caaaccatct tagcagtagt agatgagtta ctatgaaaca gagaagttcc 5160
tcagttggat attctcatgg gatgtctttt ttcccatgtt gggcaaagta tgataaagca 5220
tctctatttg taaattatgc acttgttagt tcctgaatcc tttctatagc accacttatt 5280
gcagcaggtg taggctctgg tgtggcctgt gtctgtgctt caatctttta agcttacgcg 5340
ttgacattga ttattgacta gttattaata gtaatcaatt acggggtcat tagttcatag 5400
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 5460
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 5520
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 5580
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 5640
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 5700
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 5760
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 5820
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 5880
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctggtt tagtgaaccg 5940
tcagatcctc ttccgcatcg ctgtctgcga gggccagctg ttggggtgag tactccctct 6000
caaaagcggg catgacttct gcgctaagaa tgtcagtttc caaaaacgag gaggatttga 6060
tattcactgg cccgcggtga tgcctttgag ggtggccgcg tccatctggt cagaaaagac 6120
aatctttttg ttgtcaagct tccttgatga tgtcatactt atcctgtccc ttttttttcc 6180
acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 6240
cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc atcgaccgga 6300
tcggaaaacc tctcgacgta ccaattaatt cgctgtctgc gagggccagc tgttggggtg 6360
agtactccct ctcaaaagcg ggcatgactt ctgcgctaag attgtcagtt tccaaaaacg 6420
aggaggattt gatattcacc tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 6480
ggtcagaaaa gacaatcttt ttgttgtcaa gcttgaggtg tggcaggctt gagatctggc 6540
catacacttg agtgacaatg acatccactt tgcctttctc tccacaggtg tccactccca 6600
ggtccaactg caggtcgagc atgcatctag ggcgcccgca ctagaggctc gaggaattcc 6660
accatggacg ccatgaagcg gggactgtgc tgtgtgctgc tgctgtgtgg cgccgtgttc 6720
gtgtccccta gccaggaaat ccacgcccgg ttcagaaggg gcgccaggtc ctaccaagtt 6780
atctgccggg acgaaaagac ccagatgatc taccagcagc accagtcctg gctgcggccc 6840
gtgctgcggt ccaaccgggt ggagtactgc tggtgcaact ccggcagagc ccagtgccac 6900
tccgtgcctg tgaagtcctg ctccgagcct agatgcttca acggcggcac ctgtcagcag 6960
gccctgtact tctccgactt cgtgtgccag tgccctgagg gcttcgccgg caagtgctgc 7020
gagatcgaca cccgggccac ctgttacgag gaccagggca tctcctaccg gggcaactgg 7080
tctaccgccg agtctggcgc cgagtgcacc aactggcagt cctccgccct ggcccagaag 7140
ccttactctg gcagacggcc tgacgccatc agactgggcc tgggcaacca caactactgc 7200
cggaaccctg accgggactc caagccttgg tgctacgtgt tcaaggccgg caagtactcc 7260
tccgagttct gctccacccc tgcctgctct gagggcaact ccgactgcta cttcggcaac 7320
ggctccgcct acagaggcac ccactccctg accgagtccg gcgcctcttg cctgccttgg 7380
aactccatga tcctgatcgg caaggtgtac accgcccaga acccttccgc tcaggccctg 7440
ggactcggaa agcacaatta ttgtcgcaat cccgacggcg acgccaaacc ttggtgtcac 7500
gtgctgaaga accggcggct gacatgggaa tactgcgacg tgccttcctg ctctacctgc 7560
ggcctgcggc agtactccca gcctcagttc cggatcaagg gcggcctgtt cgccgatatc 7620
gcctcccacc cttggcaggc cgccatcttc gccgctgctg ccgcttctcc tggcgagaga 7680
ttcctgtgcg gcggcatcct gatctccagc tgctggattc tgtctgccgc ccactgcttc 7740
caggaacggt tccctcctca ccacctgacc gtgatcctgg gccggaccta cagagtcgtg 7800
cccggcgagg aagaacagaa attcgaggtg gagaagtata tcgtgcacaa agagttcgac 7860
gacgacacct acgacaacga tatcgccctg ctgcagctga agtccgactc ctccagatgc 7920
gcccaggaat cctccgtcgt tcggaccgtg tgtctgccac ctgccgacct gcagctgcct 7980
gactggaccg agtgcgagct gtccggctac ggcaagcacg aggccctgtc ccccttctac 8040
tccgagcggc tgaaagaagc tcatgtacgg ctgtacccct ctagccggtg cacctcccag 8100
catctgctga accggaccgt gaccgacaac atgctgtgtg ccggcgacac cagatctggc 8160
ggccctcagg ccaacctgca cgacgcctgc cagggcgata gtggcggacc tctcgtgtgc 8220
ctcaacgacg gcaggatgac cctcgtgggc atcatctctt ggggcctggg ctgtggccag 8280
aaagacgtgc ctggcgtgta caccaaagtg accaactacc tggactggat cagggacaac 8340
atgcggcctt gatgagcggc cgcccgctga tcagcctcga ctgtgccttc tagttgccag 8400
ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 8460
gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 8520
ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 8580
gctggggatg cggtgggctc tatggcttct gaggcggaaa gaaccagctg gggctctagg 8640
gggtatcccc acggagctcg catccataat ataactgtac caggttttgg tttattacat 8700
gtgactgacg gcttcctatg cgtgctcaga aaacggcagt tgggcactgc actgcccggt 8760
gatggtgcca cggtggctcc tgccgccttc tttgatattc actctgttgt atttcatctc 8820
ttgttgccga tgaaaggata taacagtctc tgaggaaata cttggtattt cttctgatca 8880
gcgtttttat aagtaatgtt gaatattgga taaggctgtg tgtcctttgt cttgggagac 8940
aaagcccaca gcaggtggtg gttgggtggt ggcagctcag tgacaggaga ggtttttttg 9000
cctgtttttt ttgttgtttt ttttttttaa gtaaggtgtt cttttttctt agtaaaattt 9060
ctactggact gtatgttttg acaggtcaga aacatttctt caaaagaaga accttttgga 9120
aactgtacag cccttttctt tcattccctt tttgctttct gtgccaatgc ctttggttct 9180
gattgcatta tggaaaacgt tgatcggaac ttgaggtttt tatttatagt gtggcttgaa 9240
agcttggata gctgttgtta catgagatac cttattaagt ttaggccagc ttgatgcttt 9300
attttttttc ctttgaagta gtgagcgttc tctggttttt ttcctttgaa actggcgagg 9360
cttagatttt tctaatggga ttttttacct gatgatctag ttgcataccc aaatgcttgt 9420
aaatgttttc ctagttaaca tgttgataac ttcggattta catgttgtat atacttgtca 9480
tctgtgtttc tagtaaaaat atatggcatt tatagaaata cgtaattcct gatttccttt 9540
tttttttatc tctatgctct gtgtgtacag gtcaaacaga cttcactcct atttttattt 9600
atagaatttt atatgcagtc tgtcgttggt tcttgtgttg taaggataca gccttaaatt 9660
tcctagagcg atgctcagta aggcgggttg tcacatgggt tcaaatgtaa aacgggcacg 9720
tttgctgctg ccttcccaga tccaggacac taaactgctt ctgcaactga ggtataaatc 9780
gcttcagatc ccaggaagtg tagatccacg tgcatattct taaagaagaa tgaatacttt 9840
ctaaaatatg ttggcatagg aagcaagctg catggattta tttgggactt aaattatttt 9900
ggtaacggag tgcataggtt ttaaacacag ttgcagcatg ctaacgagtc acagcattta 9960
tgcagaagtg atgcctgttg cagctgttta cggcactgcc ttgcagtgag cattgcagat 10020
aggggtgggg tgctttgtgt cgtgttggga cacgctgcca cacagccacc tcccgaacat 10080
atctcacctg ctgggtactt ttcaaaccat cttagcagta gtagatgagt tactatgaaa 10140
cagagaagtt cctcagttgg atattctcat gggatgtctt ttttcccatg ttgggcaaag 10200
tatgataaag catctctatt tgtaaattat gcacttgtta gttcctgaat cctttctata 10260
gcaccactta ttgcagcagg tgtaggctct ggtgtggcct gtgtctgtgc ttcaatcttt 10320
taagcttgag ctcatggcgc gcctaggcct tgacggcctt ccttcaattc gccctatagt 10380
gagtcgtatt acgtcgcgct cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 10440
tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 10500
cgaagaggcc cgcaccgaaa cgcccttccc aacagttgcg cagcctgaat ggcgaatggg 10560
agcgccctgt agcggccact caaccctatc tcggtctatt cttttgattt ataagggatt 10620
ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 10680
tttaacaaaa tattaacgct tacaatttag 10710
<210> 18
<211> 9595
<212> DNA
<213> Artificial
<220>
<223> pZRC III- DARBE- Puro
<400> 18
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaagagg 1920
taccggatct gcgatctgca tctcaattag tcagcaacca tagtcccgcc cctaactccg 1980
cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatcg ctgactaatt 2040
ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca gaagtagtga 2100
ggaggctttt ttggaggcct aggcttttgc aaaaagcttg gcattccggt actgttggta 2160
aagccaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtccccc 2220
gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg 2280
acccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg 2340
ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca 2400
cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt 2460
tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc 2520
ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac cagggcaagg 2580
gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg 2640
ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg 2700
tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg 2760
gtgcctgatc tagctagagt cggggcggcc ggccgcttcg agcagacatg ataagataca 2820
ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 2880
tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 2940
acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaagca 3000
agtaaaacct ctacaaatgt ggtaaaatcg ataaggatcc tcgggacgct ctggccggtg 3060
aggcgtgcgc agtcgttgac gctctagacc gtgcaaaagg agagcctgta agcgggcact 3120
cttccgtggt ctggtggata aattcgcaag ggtatcatgg cggacgaccg gggttcgaac 3180
cccagatccg gccgtccgcc gtgatccatg cggttaccgc ccgcgtgtcg aacccaggtg 3240
tgcgacgtca gacaacgggg gagcgctcct tttggcttcc ttccaggcgc ggcggctgct 3300
gcgctagctt ttttggccac tggccgcgcg cggcgtaagc ggttaggctg gaaagcgaaa 3360
gcattaagtg gctcgctccc tgtagccgga gggttatttt ccaagggttg agtcgcagga 3420
cccccggttc gagtctcggg ccggccggac tgcggcgaac gggggtttgc ctccccgtca 3480
tgcaagaccc cgcttgcaaa ttcctccgga aacagggacg agcccctttt ttgcttttcc 3540
cagatgcatc cggtgctgcg gcagatgcgc ccccctcctc agcagcggca agagcaagag 3600
cagcggcaga catgcagggc accctcccct tctcctaccg cgtcaggagg ggcaacatcc 3660
gacgcgtgca tccataatat aactgtacca ggttttggtt tattacatgt gactgacggc 3720
ttcctatgcg tgctcagaaa acggcagttg ggcactgcac tgcccggtga tggtgccacg 3780
gtggctcctg ccgccttctt tgatattcac tctgttgtat ttcatctctt gttgccgatg 3840
aaaggatata acagtctctg aggaaatact tggtatttct tctgatcagc gtttttataa 3900
gtaatgttga atattggata aggctgtgtg tcctttgtct tgggagacaa agcccacagc 3960
aggtggtggt tgggtggtgg cagctcagtg acaggagagg tttttttgcc tgtttttttt 4020
gttgtttttt ttttttaagt aaggtgttct tttttcttag taaaatttct actggactgt 4080
atgttttgac aggtcagaaa catttcttca aaagaagaac cttttggaaa ctgtacagcc 4140
cttttctttc attccctttt tgctttctgt gccaatgcct ttggttctga ttgcattatg 4200
gaaaacgttg atcggaactt gaggttttta tttatagtgt ggcttgaaag cttggatagc 4260
tgttgttaca tgagatacct tattaagttt aggccagctt gatgctttat tttttttcct 4320
ttgaagtagt gagcgttctc tggttttttt cctttgaaac tggcgaggct tagatttttc 4380
taatgggatt ttttacctga tgatctagtt gcatacccaa atgcttgtaa atgttttcct 4440
agttaacatg ttgataactt cggatttaca tgttgtatat acttgtcatc tgtgtttcta 4500
gtaaaaatat atggcattta tagaaatacg taattcctga tttccttttt tttttatctc 4560
tatgctctgt gtgtacaggt caaacagact tcactcctat ttttatttat agaattttat 4620
atgcagtctg tcgttggttc ttgtgttgta aggatacagc cttaaatttc ctagagcgat 4680
gctcagtaag gcgggttgtc acatgggttc aaatgtaaaa cgggcacgtt tgctgctgcc 4740
ttcccagatc caggacacta aactgcttct gcaactgagg tataaatcgc ttcagatccc 4800
aggaagtgta gatccacgtg catattctta aagaagaatg aatactttct aaaatatgtt 4860
ggcataggaa gcaagctgca tggatttatt tgggacttaa attattttgg taacggagtg 4920
cataggtttt aaacacagtt gcagcatgct aacgagtcac agcatttatg cagaagtgat 4980
gcctgttgca gctgtttacg gcactgcctt gcagtgagca ttgcagatag gggtggggtg 5040
ctttgtgtcg tgttgggaca cgctgccaca cagccacctc ccgaacatat ctcacctgct 5100
gggtactttt caaaccatct tagcagtagt agatgagtta ctatgaaaca gagaagttcc 5160
tcagttggat attctcatgg gatgtctttt ttcccatgtt gggcaaagta tgataaagca 5220
tctctatttg taaattatgc acttgttagt tcctgaatcc tttctatagc accacttatt 5280
gcagcaggtg taggctctgg tgtggcctgt gtctgtgctt caatctttta agcttacgcg 5340
ttgacattga ttattgacta gttattaata gtaatcaatt acggggtcat tagttcatag 5400
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 5460
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 5520
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 5580
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 5640
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 5700
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 5760
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 5820
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 5880
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctggtt tagtgaaccg 5940
tcagatcctc ttccgcatcg ctgtctgcga gggccagctg ttggggtgag tactccctct 6000
caaaagcggg catgacttct gcgctaagaa tgtcagtttc caaaaacgag gaggatttga 6060
tattcactgg cccgcggtga tgcctttgag ggtggccgcg tccatctggt cagaaaagac 6120
aatctttttg ttgtcaagct tccttgatga tgtcatactt atcctgtccc ttttttttcc 6180
acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 6240
cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc atcgaccgga 6300
tcggaaaacc tctcgacgta ccaattaatt cgctgtctgc gagggccagc tgttggggtg 6360
agtactccct ctcaaaagcg ggcatgactt ctgcgctaag attgtcagtt tccaaaaacg 6420
aggaggattt gatattcacc tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 6480
ggtcagaaaa gacaatcttt ttgttgtcaa gcttgaggtg tggcaggctt gagatctggc 6540
catacacttg agtgacaatg acatccactt tgcctttctc tccacaggtg tccactccca 6600
ggtccaactg caggtcgagc atgcatctag ggcgcccgca ctagaggctc gagccaccat 6660
gggggtgcac gaatgtcctg cctggctgtg gcttctcctg tccctgctgt cgctccctct 6720
gggcctccca gtcctgggcg ccccaccacg cctcatctgt gacagccgag tcctggagag 6780
gtacctcttg gaggccaagg aggccgagaa tatcacgacg ggctgtaatg aaacctgcag 6840
cttgaatgag aatatcactg tcccagacac caaagttaat ttctatgcct ggaagaggat 6900
ggaggtcggg cagcaggccg tagaagtctg gcagggcctg gccctgctgt cggaagctgt 6960
cctgcggggc caggccctgt tggtcaactc ttcccaggtg aacgagaccc tgcagctgca 7020
tgtggataaa gccgtcagtg gccttcgcag cctcaccact ctgcttcggg ctctgggagc 7080
ccagaaggaa gccatctccc ctccagatgc ggcctcagct gctccactcc gaacaatcac 7140
tgctgacact ttccgcaaac tcttccgagt ctactccaat ttcctccggg gaaagctgaa 7200
gctgtacaca ggggaggcct gcaggacagg ggacagatga gcggccgccc gctgatcagc 7260
ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 7320
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 7380
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 7440
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc 7500
ggaaagaacc agctggggct ctagggggta tccccacgga gctcgcatcc ataatataac 7560
tgtaccaggt tttggtttat tacatgtgac tgacggcttc ctatgcgtgc tcagaaaacg 7620
gcagttgggc actgcactgc ccggtgatgg tgccacggtg gctcctgccg ccttctttga 7680
tattcactct gttgtatttc atctcttgtt gccgatgaaa ggatataaca gtctctgagg 7740
aaatacttgg tatttcttct gatcagcgtt tttataagta atgttgaata ttggataagg 7800
ctgtgtgtcc tttgtcttgg gagacaaagc ccacagcagg tggtggttgg gtggtggcag 7860
ctcagtgaca ggagaggttt ttttgcctgt tttttttgtt gttttttttt tttaagtaag 7920
gtgttctttt ttcttagtaa aatttctact ggactgtatg ttttgacagg tcagaaacat 7980
ttcttcaaaa gaagaacctt ttggaaactg tacagccctt ttctttcatt ccctttttgc 8040
tttctgtgcc aatgcctttg gttctgattg cattatggaa aacgttgatc ggaacttgag 8100
gtttttattt atagtgtggc ttgaaagctt ggatagctgt tgttacatga gataccttat 8160
taagtttagg ccagcttgat gctttatttt ttttcctttg aagtagtgag cgttctctgg 8220
tttttttcct ttgaaactgg cgaggcttag atttttctaa tgggattttt tacctgatga 8280
tctagttgca tacccaaatg cttgtaaatg ttttcctagt taacatgttg ataacttcgg 8340
atttacatgt tgtatatact tgtcatctgt gtttctagta aaaatatatg gcatttatag 8400
aaatacgtaa ttcctgattt cctttttttt ttatctctat gctctgtgtg tacaggtcaa 8460
acagacttca ctcctatttt tatttataga attttatatg cagtctgtcg ttggttcttg 8520
tgttgtaagg atacagcctt aaatttccta gagcgatgct cagtaaggcg ggttgtcaca 8580
tgggttcaaa tgtaaaacgg gcacgtttgc tgctgccttc ccagatccag gacactaaac 8640
tgcttctgca actgaggtat aaatcgcttc agatcccagg aagtgtagat ccacgtgcat 8700
attcttaaag aagaatgaat actttctaaa atatgttggc ataggaagca agctgcatgg 8760
atttatttgg gacttaaatt attttggtaa cggagtgcat aggttttaaa cacagttgca 8820
gcatgctaac gagtcacagc atttatgcag aagtgatgcc tgttgcagct gtttacggca 8880
ctgccttgca gtgagcattg cagatagggg tggggtgctt tgtgtcgtgt tgggacacgc 8940
tgccacacag ccacctcccg aacatatctc acctgctggg tacttttcaa accatcttag 9000
cagtagtaga tgagttacta tgaaacagag aagttcctca gttggatatt ctcatgggat 9060
gtcttttttc ccatgttggg caaagtatga taaagcatct ctatttgtaa attatgcact 9120
tgttagttcc tgaatccttt ctatagcacc acttattgca gcaggtgtag gctctggtgt 9180
ggcctgtgtc tgtgcttcaa tcttttaagc ttgagctcat ggcgcgccta ggccttgacg 9240
gccttccttc aattcgccct atagtgagtc gtattacgtc gcgctcactg gccgtcgttt 9300
tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 9360
cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgaaacgccc ttcccaacag 9420
ttgcgcagcc tgaatggcga atgggagcgc cctgtagcgg ccactcaacc ctatctcggt 9480
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct 9540
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttag 9595
<210> 19
<211> 10869
<212> DNA
<213> Artificial
<220>
<223> pZRC III- Etanercept- Neo
<400> 19
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120
ggaagagtat gattgaacag gatggcctgc atgcgggtag cccggcagcg tgggtggaac 180
gtctgtttgg ctatgattgg gcgcagcaga ccattggctg ctctgatgcg gcggtgtttc 240
gtctgagcgc gcagggtcgt ccggtgctgt ttgtgaaaac cgatctgagc ggtgcgctga 300
acgagctgca ggatgaagcg gcgcgtctga gctggctggc caccaccggt gttccgtgtg 360
cggcggtgct ggatgtggtg accgaagcgg gccgtgattg gctgctgctg ggcgaagtgc 420
cgggtcagga tctgctgtct agccatctgg cgccggcaga aaaagtgagc attatggcgg 480
atgccatgcg tcgtctgcat accctggacc cggcgacctg tccgtttgat catcaggcga 540
aacatcgtat tgaacgtgcg cgtacccgta tggaagcggg cctggtggat caggatgatc 600
tggatgaaga acatcagggc ctggcaccgg cagagctgtt tgcgcgtctg aaagcgagca 660
tgccggatgg cgaagatctg gtggtgaccc atggtgatgc gtgcctgccg aacattatgg 720
tggaaaatgg ccgttttagc ggctttattg attgcggccg tctgggcgtg gcggatcgtt 780
atcaggatat tgcgctggcc acccgtgata ttgcggaaga actgggcggc gaatgggcgg 840
atcgttttct ggtgctgtat ggcattgcgg caccggatag ccagcgtatt gcgttttatc 900
gtctgctgga tgaatttttc taataactgt cagaccaagt ttactcatat atactttaga 960
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1020
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1080
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1140
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1200
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 1260
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1320
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1380
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1440
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1500
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1560
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1620
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1680
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1740
attaggcacc ccaggcttta cccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 1800
ggagagcgcc caatacgcaa ggaaacagct atgaccatgt taatgcagct ggcacgacag 1860
gtttcccgac tggaaagcgg gcagtgaaag gaaggcccat gaggccagtt aattaactgt 1920
ggaatgtgtg tcagttaggg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 1980
aaagcatgca tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag 2040
gcagaagtat gcaaagcatg catctcaatt agtcagcaac catagtcccg cccctaactc 2100
cgcccatccc gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa 2160
ttttttttat ttatgcagag gccgaggccg cctctgcctc tgagctattc cagaagtagt 2220
gaggaggctt ttttggaggc ctaggctttt gcaaaaagct cccgggagct tgtatatcca 2280
ttttcggatc tgatcaagag acaggatgag gatcgtttcg catgattgaa caagatggat 2340
tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac 2400
agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc 2460
tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc 2520
tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag 2580
cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc 2640
ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg 2700
atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc 2760
ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc 2820
cagccgaact gttcgccagg ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga 2880
cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca 2940
tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg 3000
atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg 3060
ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgagcgg 3120
gactctgggg ttcgaaatga ccgaccaagc gacgcccaac ctgccatcac gagatttcga 3180
ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg 3240
gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca acttgtttat 3300
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 3360
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg 3420
ggatcctcgg gacgctctgg ccggtgaggc gtgcgcagtc gttgacgctc tagaccgtgc 3480
aaaaggagag cctgtaagcg ggcactcttc cgtggtctgg tggataaatt cgcaagggta 3540
tcatggcgga cgaccggggt tcgaacccca gatccggccg tccgccgtga tccatgcggt 3600
taccgcccgc gtgtcgaacc caggtgtgcg acgtcagaca acgggggagc gctccttttg 3660
gcttccttcc aggcgcggcg gctgctgcgc tagctttttt ggccactggc cgcgcgcggc 3720
gtaagcggtt aggctggaaa gcgaaagcat taagtggctc gctccctgta gccggagggt 3780
tattttccaa gggttgagtc gcaggacccc cggttcgagt ctcgggccgg ccggactgcg 3840
gcgaacgggg gtttgcctcc ccgtcatgca agaccccgct tgcaaattcc tccggaaaca 3900
gggacgagcc ccttttttgc ttttcccaga tgcatccggt gctgcggcag atgcgccccc 3960
ctcctcagca gcggcaagag caagagcagc ggcagacatg cagggcaccc tccccttctc 4020
ctaccgcgtc aggaggggca acatccgacg cgtgcatcca taatataact gtaccaggtt 4080
ttggtttatt acatgtgact gacggcttcc tatgcgtgct cagaaaacgg cagttgggca 4140
ctgcactgcc cggtgatggt gccacggtgg ctcctgccgc cttctttgat attcactctg 4200
ttgtatttca tctcttgttg ccgatgaaag gatataacag tctctgagga aatacttggt 4260
atttcttctg atcagcgttt ttataagtaa tgttgaatat tggataaggc tgtgtgtcct 4320
ttgtcttggg agacaaagcc cacagcaggt ggtggttggg tggtggcagc tcagtgacag 4380
gagaggtttt tttgcctgtt ttttttgttg tttttttttt ttaagtaagg tgttcttttt 4440
tcttagtaaa atttctactg gactgtatgt tttgacaggt cagaaacatt tcttcaaaag 4500
aagaaccttt tggaaactgt acagcccttt tctttcattc cctttttgct ttctgtgcca 4560
atgcctttgg ttctgattgc attatggaaa acgttgatcg gaacttgagg tttttattta 4620
tagtgtggct tgaaagcttg gatagctgtt gttacatgag ataccttatt aagtttaggc 4680
cagcttgatg ctttattttt tttcctttga agtagtgagc gttctctggt ttttttcctt 4740
tgaaactggc gaggcttaga tttttctaat gggatttttt acctgatgat ctagttgcat 4800
acccaaatgc ttgtaaatgt tttcctagtt aacatgttga taacttcgga tttacatgtt 4860
gtatatactt gtcatctgtg tttctagtaa aaatatatgg catttataga aatacgtaat 4920
tcctgatttc cttttttttt tatctctatg ctctgtgtgt acaggtcaaa cagacttcac 4980
tcctattttt atttatagaa ttttatatgc agtctgtcgt tggttcttgt gttgtaagga 5040
tacagcctta aatttcctag agcgatgctc agtaaggcgg gttgtcacat gggttcaaat 5100
gtaaaacggg cacgtttgct gctgccttcc cagatccagg acactaaact gcttctgcaa 5160
ctgaggtata aatcgcttca gatcccagga agtgtagatc cacgtgcata ttcttaaaga 5220
agaatgaata ctttctaaaa tatgttggca taggaagcaa gctgcatgga tttatttggg 5280
acttaaatta ttttggtaac ggagtgcata ggttttaaac acagttgcag catgctaacg 5340
agtcacagca tttatgcaga agtgatgcct gttgcagctg tttacggcac tgccttgcag 5400
tgagcattgc agataggggt ggggtgcttt gtgtcgtgtt gggacacgct gccacacagc 5460
cacctcccga acatatctca cctgctgggt acttttcaaa ccatcttagc agtagtagat 5520
gagttactat gaaacagaga agttcctcag ttggatattc tcatgggatg tcttttttcc 5580
catgttgggc aaagtatgat aaagcatctc tatttgtaaa ttatgcactt gttagttcct 5640
gaatcctttc tatagcacca cttattgcag caggtgtagg ctctggtgtg gcctgtgtct 5700
gtgcttcaat cttttaagct tacgcgttga cattgattat tgactagtta ttaatagtaa 5760
tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 5820
gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 5880
tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta 5940
cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 6000
gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 6060
tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt 6120
tggcagtaca tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac 6180
cccattgacg tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt 6240
cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat 6300
ataagcagag ctggtttagt gaaccgtcag atcctcttcc gcatcgctgt ctgcgagggc 6360
cagctgttgg ggtgagtact ccctctcaaa agcgggcatg acttctgcgc taagaatgtc 6420
agtttccaaa aacgaggagg atttgatatt cactggcccg cggtgatgcc tttgagggtg 6480
gccgcgtcca tctggtcaga aaagacaatc tttttgttgt caagcttcct tgatgatgtc 6540
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc 6600
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtactccg ccaccgaggg 6660
acctgagcga gtccgcatcg accggatcgg aaaacctctc gacgtaccaa ttaattcgct 6720
gtctgcgagg gccagctgtt ggggtgagta ctccctctca aaagcgggca tgacttctgc 6780
gctaagattg tcagtttcca aaaacgagga ggatttgata ttcacctggc ccgcggtgat 6840
gcctttgagg gtggccgcgt ccatctggtc agaaaagaca atctttttgt tgtcaagctt 6900
gaggtgtggc aggcttgaga tctggccata cacttgagtg acaatgacat ccactttgcc 6960
tttctctcca caggtgtcca ctcccaggtc caactgcagg tcgagcatgc atctagggcg 7020
cccgcactag aggctcgagc catggctcca gtggctgtgt gggctgctct ggctgtgggc 7080
ctggaactgt gggccgctgc tcacgctctg cctgctcagg tggccttcac cccttatgcc 7140
cctgagcctg gctccacctg caggctgcgg gagtactacg accagaccgc ccagatgtgc 7200
tgctccaagt gctctcctgg ccagcacgcc aaggtgttct gcaccaagac ctccgacacc 7260
gtgtgcgact cttgcgagga ctccacctac acccagctct ggaactgggt gcccgagtgc 7320
ctgtcctgcg gctccagatg ctcctccgac caggtggaga cacaggcctg tacacgggag 7380
cagaatcgga tttgcacatg caggcctggc tggtactgcg ccctgtccaa gcaggaagga 7440
tgcaggctgt gcgcccctct gaggaagtgc agacctggct tcggcgtggc taggcctggc 7500
accgagacat ccgacgtcgt gtgcaagcct tgtgcccctg gcaccttctc caacaccaca 7560
tcctccaccg acatctgccg gcctcaccag atctgcaacg tggtggccat ccctggcaac 7620
gccagcatgg acgccgtgtg cacctccacc tcccccacca gatctatggc ccctggcgcc 7680
gtgcatctgc ctcagcctgt gtccacccgg tcccagcata cccagcctac acctgagccc 7740
tctaccgccc cttctacctc cttcctgctg cctatgggcc cttctcctcc agctgagggc 7800
tctaccggcg acgagcctaa gtcctgcgac aagacccaca cctgtccccc ctgccctgcc 7860
cctgaactgc tgggaggccc cagcgtgttc ctgttccccc caaagcccaa ggacaccctg 7920
atgatctccc ggacccccga agtgacctgc gtggtggtgg acgtgtccca cgaggaccct 7980
gaagtgaagt tcaattggta cgtggacggc gtggaagtgc acaacgccaa gaccaagccc 8040
agagaggaac agtacaactc cacctaccgg gtggtgtccg tgctgaccgt gctgcaccag 8100
gactggctga acggcaaaga gtacaagtgc aaggtgtcca acaaggctct gcctgccccc 8160
atcgaaaaga ccatctccaa ggccaagggc cagccccgcg agcctcaggt gtacaccctg 8220
cctccttccc gggaggagat gaccaagaac caggtgtccc tgacctgtct ggtcaagggc 8280
ttctacccct ccgatatcgc cgtggaatgg gagtccaacg gacagcccga gaacaactac 8340
aagaccaccc cccctgtgct ggactccgac ggctcattct tcctgtactc caagctgacc 8400
gtggacaagt cccggtggca gcagggcaac gtgttctcct gctccgtgat gcacgaggcc 8460
ctgcacaacc actacaccca gaagagctta tccctgtctc ctggcaagtg ataagcggcc 8520
gcccgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc 8580
cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 8640
gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 8700
gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 8760
atggcttctg aggcggaaag aaccagctgg ggctctaggg ggtatcccca cggagctcgc 8820
atccataata taactgtacc aggttttggt ttattacatg tgactgacgg cttcctatgc 8880
gtgctcagaa aacggcagtt gggcactgca ctgcccggtg atggtgccac ggtggctcct 8940
gccgccttct ttgatattca ctctgttgta tttcatctct tgttgccgat gaaaggatat 9000
aacagtctct gaggaaatac ttggtatttc ttctgatcag cgtttttata agtaatgttg 9060
aatattggat aaggctgtgt gtcctttgtc ttgggagaca aagcccacag caggtggtgg 9120
ttgggtggtg gcagctcagt gacaggagag gtttttttgc ctgttttttt tgttgttttt 9180
tttttttaag taaggtgttc ttttttctta gtaaaatttc tactggactg tatgttttga 9240
caggtcagaa acatttcttc aaaagaagaa ccttttggaa actgtacagc ccttttcttt 9300
cattcccttt ttgctttctg tgccaatgcc tttggttctg attgcattat ggaaaacgtt 9360
gatcggaact tgaggttttt atttatagtg tggcttgaaa gcttggatag ctgttgttac 9420
atgagatacc ttattaagtt taggccagct tgatgcttta ttttttttcc tttgaagtag 9480
tgagcgttct ctggtttttt tcctttgaaa ctggcgaggc ttagattttt ctaatgggat 9540
tttttacctg atgatctagt tgcataccca aatgcttgta aatgttttcc tagttaacat 9600
gttgataact tcggatttac atgttgtata tacttgtcat ctgtgtttct agtaaaaata 9660
tatggcattt atagaaatac gtaattcctg atttcctttt ttttttatct ctatgctctg 9720
tgtgtacagg tcaaacagac ttcactccta tttttattta tagaatttta tatgcagtct 9780
gtcgttggtt cttgtgttgt aaggatacag ccttaaattt cctagagcga tgctcagtaa 9840
ggcgggttgt cacatgggtt caaatgtaaa acgggcacgt ttgctgctgc cttcccagat 9900
ccaggacact aaactgcttc tgcaactgag gtataaatcg cttcagatcc caggaagtgt 9960
agatccacgt gcatattctt aaagaagaat gaatactttc taaaatatgt tggcatagga 10020
agcaagctgc atggatttat ttgggactta aattattttg gtaacggagt gcataggttt 10080
taaacacagt tgcagcatgc taacgagtca cagcatttat gcagaagtga tgcctgttgc 10140
agctgtttac ggcactgcct tgcagtgagc attgcagata ggggtggggt gctttgtgtc 10200
gtgttgggac acgctgccac acagccacct cccgaacata tctcacctgc tgggtacttt 10260
tcaaaccatc ttagcagtag tagatgagtt actatgaaac agagaagttc ctcagttgga 10320
tattctcatg ggatgtcttt tttcccatgt tgggcaaagt atgataaagc atctctattt 10380
gtaaattatg cacttgttag ttcctgaatc ctttctatag caccacttat tgcagcaggt 10440
gtaggctctg gtgtggcctg tgtctgtgct tcaatctttt aagcttgagc tcatggcgcg 10500
cctaggcctt gacggccttc cttcaattcg ccctatagtg agtcgtatta cgtcgcgctc 10560
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 10620
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgaaac 10680
gcccttccca acagttgcgc agcctgaatg gcgaatggga gcgccctgta gcggccactc 10740
aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 10800
ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt 10860
acaatttag 10869
<210> 20
<211> 1710
<212> DNA
<213> Artificial
<220>
<223> TNK ( DNA sequence corresponding to Seq ID No. 7)
<400> 20
gaattccacc atggacgcca tgaagcgggg actgtgctgt gtgctgctgc tgtgtggcgc 60
cgtgttcgtg tcccctagcc aggaaatcca cgcccggttc agaaggggcg ccaggtccta 120
ccaagttatc tgccgggacg aaaagaccca gatgatctac cagcagcacc agtcctggct 180
gcggcccgtg ctgcggtcca accgggtgga gtactgctgg tgcaactccg gcagagccca 240
gtgccactcc gtgcctgtga agtcctgctc cgagcctaga tgcttcaacg gcggcacctg 300
tcagcaggcc ctgtacttct ccgacttcgt gtgccagtgc cctgagggct tcgccggcaa 360
gtgctgcgag atcgacaccc gggccacctg ttacgaggac cagggcatct cctaccgggg 420
caactggtct accgccgagt ctggcgccga gtgcaccaac tggcagtcct ccgccctggc 480
ccagaagcct tactctggca gacggcctga cgccatcaga ctgggcctgg gcaaccacaa 540
ctactgccgg aaccctgacc gggactccaa gccttggtgc tacgtgttca aggccggcaa 600
gtactcctcc gagttctgct ccacccctgc ctgctctgag ggcaactccg actgctactt 660
cggcaacggc tccgcctaca gaggcaccca ctccctgacc gagtccggcg cctcttgcct 720
gccttggaac tccatgatcc tgatcggcaa ggtgtacacc gcccagaacc cttccgctca 780
ggccctggga ctcggaaagc acaattattg tcgcaatccc gacggcgacg ccaaaccttg 840
gtgtcacgtg ctgaagaacc ggcggctgac atgggaatac tgcgacgtgc cttcctgctc 900
tacctgcggc ctgcggcagt actcccagcc tcagttccgg atcaagggcg gcctgttcgc 960
cgatatcgcc tcccaccctt ggcaggccgc catcttcgcc gctgctgccg cttctcctgg 1020
cgagagattc ctgtgcggcg gcatcctgat ctccagctgc tggattctgt ctgccgccca 1080
ctgcttccag gaacggttcc ctcctcacca cctgaccgtg atcctgggcc ggacctacag 1140
agtcgtgccc ggcgaggaag aacagaaatt cgaggtggag aagtatatcg tgcacaaaga 1200
gttcgacgac gacacctacg acaacgatat cgccctgctg cagctgaagt ccgactcctc 1260
cagatgcgcc caggaatcct ccgtcgttcg gaccgtgtgt ctgccacctg ccgacctgca 1320
gctgcctgac tggaccgagt gcgagctgtc cggctacggc aagcacgagg ccctgtcccc 1380
cttctactcc gagcggctga aagaagctca tgtacggctg tacccctcta gccggtgcac 1440
ctcccagcat ctgctgaacc ggaccgtgac cgacaacatg ctgtgtgccg gcgacaccag 1500
atctggcggc cctcaggcca acctgcacga cgcctgccag ggcgatagtg gcggacctct 1560
cgtgtgcctc aacgacggca ggatgaccct cgtgggcatc atctcttggg gcctgggctg 1620
tggccagaaa gacgtgcctg gcgtgtacac caaagtgacc aactacctgg actggatcag 1680
ggacaacatg cggccttgat gagcggccgc 1710
<210> 21
<211> 601
<212> DNA
<213> Artificial
<220>
<223> Darbepoetin (DNA sequence corresponding to Seq ID No. 9)
<400> 21
ctcgagccac catgggggtg cacgaatgtc ctgcctggct gtggcttctc ctgtccctgc 60
tgtcgctccc tctgggcctc ccagtcctgg gcgccccacc acgcctcatc tgtgacagcc 120
gagtcctgga gaggtacctc ttggaggcca aggaggccga gaatatcacg acgggctgta 180
atgaaacctg cagcttgaat gagaatatca ctgtcccaga caccaaagtt aatttctatg 240
cctggaagag gatggaggtc gggcagcagg ccgtagaagt ctggcagggc ctggccctgc 300
tgtcggaagc tgtcctgcgg ggccaggccc tgttggtcaa ctcttcccag gtgaacgaga 360
ccctgcagct gcatgtggat aaagccgtca gtggccttcg cagcctcacc actctgcttc 420
gggctctggg agcccagaag gaagccatct cccctccaga tgcggcctca gctgctccac 480
tccgaacaat cactgctgac actttccgca aactcttccg agtctactcc aatttcctcc 540
ggggaaagct gaagctgtac acaggggagg cctgcaggac aggggacaga tgagcggccg 600
c 601
<210> 22
<211> 1489
<212> DNA
<213> Artificial
<220>
<223> Etanercept (DNA sequence corresponding to Seq ID No. 11)
<400> 22
ctcgagccat ggctccagtg gctgtgtggg ctgctctggc tgtgggcctg gaactgtggg 60
ccgctgctca cgctctgcct gctcaggtgg ccttcacccc ttatgcccct gagcctggct 120
ccacctgcag gctgcgggag tactacgacc agaccgccca gatgtgctgc tccaagtgct 180
ctcctggcca gcacgccaag gtgttctgca ccaagacctc cgacaccgtg tgcgactctt 240
gcgaggactc cacctacacc cagctctgga actgggtgcc cgagtgcctg tcctgcggct 300
ccagatgctc ctccgaccag gtggagacac aggcctgtac acgggagcag aatcggattt 360
gcacatgcag gcctggctgg tactgcgccc tgtccaagca ggaaggatgc aggctgtgcg 420
cccctctgag gaagtgcaga cctggcttcg gcgtggctag gcctggcacc gagacatccg 480
acgtcgtgtg caagccttgt gcccctggca ccttctccaa caccacatcc tccaccgaca 540
tctgccggcc tcaccagatc tgcaacgtgg tggccatccc tggcaacgcc agcatggacg 600
ccgtgtgcac ctccacctcc cccaccagat ctatggcccc tggcgccgtg catctgcctc 660
agcctgtgtc cacccggtcc cagcataccc agcctacacc tgagccctct accgcccctt 720
ctacctcctt cctgctgcct atgggccctt ctcctccagc tgagggctct accggcgacg 780
agcctaagtc ctgcgacaag acccacacct gtcccccctg ccctgcccct gaactgctgg 840
gaggccccag cgtgttcctg ttccccccaa agcccaagga caccctgatg atctcccgga 900
cccccgaagt gacctgcgtg gtggtggacg tgtcccacga ggaccctgaa gtgaagttca 960
attggtacgt ggacggcgtg gaagtgcaca acgccaagac caagcccaga gaggaacagt 1020
acaactccac ctaccgggtg gtgtccgtgc tgaccgtgct gcaccaggac tggctgaacg 1080
gcaaagagta caagtgcaag gtgtccaaca aggctctgcc tgcccccatc gaaaagacca 1140
tctccaaggc caagggccag ccccgcgagc ctcaggtgta caccctgcct ccttcccggg 1200
aggagatgac caagaaccag gtgtccctga cctgtctggt caagggcttc tacccctccg 1260
atatcgccgt ggaatgggag tccaacggac agcccgagaa caactacaag accacccccc 1320
ctgtgctgga ctccgacggc tcattcttcc tgtactccaa gctgaccgtg gacaagtccc 1380
ggtggcagca gggcaacgtg ttctcctgct ccgtgatgca cgaggccctg cacaaccact 1440
acacccagaa gagcttatcc ctgtctcctg gcaagtgata agcggccgc 1489
<210> 23
<211> 365
<212> DNA
<213> Artificial
<220>
<223> FSH alpha (DNA sequence corresponding to Seq ID No. 13)
<400> 23
ctcgagccac catggactac taccggaagt acgccgccat cttcctggtg accctgtccg 60
tgttcctgca cgtgctgcac tctgcccctg acgtgcagga ctgccctgag tgcaccctgc 120
aggaaaaccc attcttcagc cagcctggcg cccctatcct gcagtgcatg ggctgctgct 180
tctccagagc ctaccctacc cctctgcggt ccaagaaaac catgctggtg cagaaaaacg 240
tgacctccga gtctacctgc tgcgtggcca agtcctacaa cagagtgacc gtgatgggcg 300
gcttcaaggt ggagaaccac accgcctgcc actgctctac ctgctactac cacaagtcct 360
gatga 365
<210> 24
<211> 415
<212> DNA
<213> Artificial
<220>
<223> FSH beta (DNA sequence corresponding to Seq ID No. 15)
<400> 24
cccgggccac catgaagacc ctgcagttct tcttcctgtt ctgctgctgg aaggccatct 60
gctgcaactc ttgcgagctg accaacatca caatcgccat cgagaaagag gaatgccggt 120
tctgcatctc catcaacacc acttggtgcg ccggctactg ctacacccgc gacctggtgt 180
acaaggaccc tgcccggcct aagatccaga aaacctgcac cttcaaagaa ctggtgtacg 240
agacagtgcg ggtgccaggc tgcgctcacc acgccgactc cctgtacacc taccctgtgg 300
ccacccagtg ccactgcggc aagtgcgact ccgactccac cgactgtacc gtgcggggcc 360
tgggcccttc ttactgctcc ttcggcgaga tgaaggaatg atgaccagcg gccgc 415
Claims (28)
- 흥미있는 유전자에 실시가능하게 결합된 프로모터, 발현 증진 요소(expression enhancement elements), TPL, VA I 및 II 유전자 또는 이의 변이체들, 번역 종결자(translation terminator) 및 항생물질 마커(antibiotic marker)를 포함하는 발현 벡터로서, 상기 발현 증진 요소는 염색질 부착 영역(chromatin attachment region)인, 발현 벡터.
- 제1항에 있어서,
a) 인트론 또는 이의 변이체들
b) 임의적으로 내부의 리보솜의 결합 부위(Internal ribosomal binding site) 또는 이의 변이체들,
을 더 포함하는, 발현 벡터.
- 제1항에 있어서,
상기 염색질 부착 영역은, 적절한 매트릭스 부착 영역(matrix attachment region)인, 발현 벡터.
- 제1항에 있어서,
상기 염색질 부착 영역은, 적절한 스캐폴드 부착 영역(scaffold attachment region)인, 발현 벡터.
- 제3항에 있어서,
상기 매트릭스 부착 영역은, 초파리 Scs 경계 요소(Drosophila Scs boundary element), hspSAP MAR, cLysMARs, 마우스 T 세포 수용체 TCRα, 랫 유전자자리 조절 부위(Rat locus control region), β-글로빈 MAR로부터 선택된, 발현 벡터.
- 제3항 또는 제5항에 있어서,
상기 매트릭스 부착 영역은 cLysMARs인, 발현 벡터.
- 제5항에 있어서,
상기 cLysMARs는, 서열 id no. 5 에 나타낸 뉴클레오티드 서열을 갖는, 발현 벡터.
- 제1항에 있어서,
상기 프로모터는, CMV 프로모터, SV40 프로모터, 아데노바이러스 프로모터, 베타 액틴 프로모터(Beta actin promoter), 메탈로티오닌 프로모터(metallothionin Promoters), 또는 그 밖의 원핵세포 또는 진핵세포 바이러스 프로모터로 이루어진 군으로부터 선택된, 발현 벡터. 바람직하게 CMV 프로모터.
- 제2항에 있어서,
상기 내부의 리보솜의 결합 부위는 뇌심근염 바이러스 IRES인, 발현 벡터.
- 제2항 및 제9항에 있어서,
상기 내부의 리보솜의 결합 부위는 서열 id no. 14에 나타낸 뉴클레오티드 서열을 가지는, 발현 벡터.
- 제1항에 있어서,
상기 VA I 및 II 유전자는, 서열 id no. 3에 나타낸 뉴클레오티드 서열을 가지는, 발현 벡터.
- 제1항에 있어서,
상기 TPL은, 서열 id no. 2에 나타낸 뉴클레오티드 서열을 가지는, 발현 벡터.
- 제2항에 있어서,
상기 키메라 인트론(chimeric Intron)은 서열 id no. 1에 나타낸 뉴클레오티드 서열을 갖는, 발현 벡터.
- 제1항에 있어서,
흥미있는 유전자는, 조직 플라스미노겐 활성인자(tissue plasminogen activator), TNK-TPA, 다베포이에틴(Darbepoietin), 에리스로포이에틴(Erythropoietin), 인슐린, GCSF, 인터류킨(Interleukin), 종양 괴사 인자(Tumor necrosis factor), 인터페론(Interferon), TNFR-IgGFc, 리툭시맙(rituximab), 베바시주맙(bevacizumab), 아달리무맙(adalimumab), 트라스투주맙(trastuzumab)으로부터 선택된 모노클론항체 및 Fc 영역, Fab와 같은 이들의 단편, GLP-I, GLP-II, IGF-I, IGF-II, 혈소판 유래 증식 인자(Platelet derived growth factor), FVII, FVIII, FIV 및 FXIII, 엑센딘-3, 엑센딘 4, MYT-2, NF-κB 억제 인자 NRF, AML1/RUNX1, Gtx 호메오도메인 단백질과 같은 전사 인자, 진핵생물 개시 인자 4G(elF4G)a(Eukaryotic initiation factor 4G(elF4G)a), 진핵생물 개시 인자 4Gl(elF4Gl)a, 사멸 관련 단백질 5(Death associated protein 5, DAP5)로부터 선택된 번역 인자(translation factor), c-myc, L-myc, Pim-1, 단백질 키나아제 p58PITSLRE, p53과 같은 종양유전자, 여포 자극 호르몬(Follicle stimulating hormone), 융모성 생식선 자극호르몬(Human Chorionic Gonadotropin), 인간 황체형성 호르몬(Human Luteinizing Hormone)으로부터 선택된 생식선 자극 호르몬으로부터 선택된 호르몬, 및 면역글로불린 중쇄 결합 단백질(immunoglobulin heavy chain binding protein, BiP), 열 충격 단백질 70(Heat shock protein 70), 미토콘드리아의 H+-ATP 생성효소의 β-서브유닛(subunit), 오르니틴 탈카르복실화효소(Ornithine decarboxylase), 코넥신 32 및 43(connexins 32 and 43), HIF-1a, APC 로부터 선택된, 단백질 및 펩티드 및 이의 유사체를 코딩하는, 발현 벡터.
- 제1항에 있어서,
상기 항생물질 마커는, 카나마이신(kanamycin), 퓨로마이신(puromycin), 히그로마이신(hygromycin) 및 네오마이신(neomycin)으로부터 선택된, 발현 벡터.
- 제1항 내지 제15항 중 어느 한 항에 있어서,
상기 cLysMARs은 상기 발현 카세트(expression cassette)의 어느 한 쪽의 측면(flank)에서 클론되는, 발현 벡터.
- 제1항 및 제2항 중 어느 한 항에 있어서,
a) 프로모터 또는 이의 변이체,
b) VA I 및 II 유전자 또는 이의 변이체,
c) TPL 또는 이의 변이체,
d) 키메라 인트론(chimeric Intron) 또는 이의 변이체,
e) 항생물질 마커,
f) 매트릭스 부착 영역,
g) 임의적으로 내부의 리보솜의 결합 부위,
h) 소 성장 호르몬 폴리아데닐화 서열
에 실시가능하게 결합된 흥미있는 유전자를 포함하는, 발현 벡터.
- 제1항 내지 제17항 중 어느 한 항에 있어서,
접근 번호(accession number) MTCC 5655를 갖는, 발현 벡터.
- 제1항 내지 제18항 중 어느 한 항에 있어서,
접근 번호 MTCC 5656을 갖는, 발현 벡터.
- 제1항 내지 제19항 중 어느 한 항에 있어서,
접근 번호 MTCC 5657을 갖는, 발현 벡터.
- 제1항 내지 제20항 중 어느 한 항의 벡터로 형질전환된 숙주 세포.
- 제20항에 있어서,
CHO 또는 BHK 세포주 또는 이들의 유도체들(derivatives)로부터 선택된, 숙주 세포.
- a) 제1항 내지 제22항 중 어느 한 항의 발현 벡터를 구성하고;
b) 흥미있는 단백질 또는 펩티드를 발현시키는 적절한 숙주 세포에서 상기 발현 벡터의 형질전환(transformation);
을 포함하는, 단백질들 및 펩티드들 및 이의 변이체들의 생산을 위한 방법.
- a) 제1항 내지 제23항 중 어느 한 항의 발현 벡터를 구성하고;
b) 적절한 숙주 세포에서 상기 발현 벡터의 트랜스펙션(transfection);
c) 흥미있는 단백질 또는 펩티드를 발현하는 적절한 트랜스펙션된 숙주 세포를 선별하고;
d) 단계 (c)에서 선별된 적절한 숙주 세포는 제1항 내지 제23항 중 어느 한 항의 발현 벡터로 더 재트랜스펙션되고(retransfected);
e) 흥미있는 단백질 또는 펩티드를 발현하는 적절한 재트랜스펙션된 숙주 세포;
를 포함하는, 단백질들 및 펩티드들 및 이의 변이체들의 생산을 위한 방법.
- 제23항 및 제24항에 있어서,
상기 발현 벡터는 접근 번호 MTCC 5655를 갖는, 방법.
- 제23항 및 제24항에 있어서,
상기 발현 벡터는 접근 번호 MTCC 5656을 갖는, 방법.
- 제23항 및 제24항에 있어서,
상기 발현 벡터는 접근 번호 MTCC 5657을 갖는, 방법.
- 제23항 및 제24항에 있어서,
상기 단백질 및 펩티드는, 조직 플라스미노겐 활성인자, TNK-TPA, 다베포이에틴, 에리스로포이에틴, 인슐린, GCSF, 인터류킨, 종양 괴사 인자, 인터페론, TNFR-IgGFc, 리툭시맙, 베바시주맙, 아달리무맙, 트라스투주맙과 같은 모노클론항체 및 Fc 영역, Fab와 같은 이들의 단편, GLP-I, GLP-II, IGF-I, IGF-II, 혈소판 유래 성장 인자(Platelet derived growth factor), FVII, FVIII, FIV 및 FXIII, 엑센딘-3, 엑센딘 4, 여포 자극 호르몬, 융모성 생식선 자극호르몬, 인간 황체형성 호르몬으로부터 선택된 생식선 자극 호르몬과 같은 호르몬으로부터 선택된, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN2806MU2010 | 2010-10-08 | ||
IN2806/MUM/2010 | 2010-10-08 | ||
PCT/IN2011/000703 WO2012046255A2 (en) | 2010-10-08 | 2011-10-10 | Expression vector for high level expression of recombinant proteins |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130094830A true KR20130094830A (ko) | 2013-08-26 |
KR101607734B1 KR101607734B1 (ko) | 2016-03-30 |
Family
ID=45464050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137011512A KR101607734B1 (ko) | 2010-10-08 | 2011-10-10 | 재조합 단백질의 높은 레벨의 발현을 위한 발현 벡터 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20130244280A1 (ko) |
EP (1) | EP2625277B1 (ko) |
JP (1) | JP5888616B2 (ko) |
KR (1) | KR101607734B1 (ko) |
AR (1) | AR083376A1 (ko) |
AU (1) | AU2011311189B2 (ko) |
BR (1) | BR112013008459A2 (ko) |
CA (1) | CA2813903A1 (ko) |
EA (1) | EA201390461A1 (ko) |
NZ (1) | NZ609903A (ko) |
WO (1) | WO2012046255A2 (ko) |
ZA (1) | ZA201302939B (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015099513A1 (ko) * | 2013-12-27 | 2015-07-02 | 재단법인 목암생명공학연구소 | 증가된 유전자 발현능을 갖는 발현벡터 |
KR20200054278A (ko) * | 2017-09-19 | 2020-05-19 | 도이체스 크렙스포르슝스첸트룸 | 세포의 유전적 변형을 위한 비-통합 dna 벡터 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112013025099B1 (pt) * | 2011-03-30 | 2021-08-10 | Pangen Biotech Inc. | Vetor de expressão para células animais |
US9062106B2 (en) | 2011-04-27 | 2015-06-23 | Abbvie Inc. | Methods for controlling the galactosylation profile of recombinantly-expressed proteins |
US9067990B2 (en) | 2013-03-14 | 2015-06-30 | Abbvie, Inc. | Protein purification using displacement chromatography |
WO2013158279A1 (en) | 2012-04-20 | 2013-10-24 | Abbvie Inc. | Protein purification methods to reduce acidic species |
WO2013158273A1 (en) | 2012-04-20 | 2013-10-24 | Abbvie Inc. | Methods to modulate c-terminal lysine variant distribution |
US9249182B2 (en) | 2012-05-24 | 2016-02-02 | Abbvie, Inc. | Purification of antibodies using hydrophobic interaction chromatography |
KR20140015999A (ko) * | 2012-07-27 | 2014-02-07 | 한화케미칼 주식회사 | 신규 MARs 및 이를 이용하여 목적 단백질을 생산하는 방법 |
US9512214B2 (en) | 2012-09-02 | 2016-12-06 | Abbvie, Inc. | Methods to control protein heterogeneity |
AU2013381687A1 (en) * | 2013-03-12 | 2015-09-24 | Abbvie Inc. | Human antibodies that bind human TNF-alpha and methods of preparing the same |
US9017687B1 (en) | 2013-10-18 | 2015-04-28 | Abbvie, Inc. | Low acidic species compositions and methods for producing and using the same using displacement chromatography |
WO2014151878A2 (en) | 2013-03-14 | 2014-09-25 | Abbvie Inc. | Methods for modulating protein glycosylation profiles of recombinant protein therapeutics using monosaccharides and oligosacharides |
WO2015051293A2 (en) | 2013-10-04 | 2015-04-09 | Abbvie, Inc. | Use of metal ions for modulation of protein glycosylation profiles of recombinant proteins |
US9085618B2 (en) | 2013-10-18 | 2015-07-21 | Abbvie, Inc. | Low acidic species compositions and methods for producing and using the same |
US9181337B2 (en) | 2013-10-18 | 2015-11-10 | Abbvie, Inc. | Modulated lysine variant species compositions and methods for producing and using the same |
US20150139988A1 (en) | 2013-11-15 | 2015-05-21 | Abbvie, Inc. | Glycoengineered binding protein compositions |
KR101599138B1 (ko) * | 2014-06-17 | 2016-03-03 | 한국생명공학연구원 | 재조합 단백질 발현 증진을 위한 유전자 절편을 포함하는 벡터 및 이의 용도 |
CN105274112B (zh) * | 2015-11-20 | 2018-01-16 | 江南大学 | 一种在酸性条件下诱导表达的启动子 |
CN107177611B (zh) * | 2017-05-23 | 2020-03-20 | 江苏康禾生物制药有限公司 | 编码组织型纤溶酶原激活剂的dna分子及其重组细胞株 |
CN107502594A (zh) * | 2017-07-14 | 2017-12-22 | 中国药科大学 | 一种稳定表达外源性ex-4基因的骨髓源间充质干细胞株 |
CN113025651B (zh) * | 2021-03-31 | 2023-03-24 | 重庆医科大学 | 靶向HBV核心启动子的药物筛选细胞模型、Triciribine及结构类似物新应用 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5731178A (en) | 1990-03-21 | 1998-03-24 | Behringwerke Aktiengesellschaft | Attachment-elements for stimulation of eukaryotic expression systems |
US5888774A (en) | 1994-12-19 | 1999-03-30 | Cangene Corporation | Recombinant DNA molecules and expression vectors for erythropoietin |
KR100408844B1 (ko) | 2000-07-29 | 2003-12-06 | 한국산업기술평가원 | 동물세포 발현벡터 |
US7129062B2 (en) | 2001-01-26 | 2006-10-31 | Selexis Sa | Matrix attachment regions and methods for use thereof |
WO2005005644A1 (en) | 2003-07-11 | 2005-01-20 | Cytos Biotechnology Ag | Gene expression system |
US8772021B2 (en) | 2005-03-04 | 2014-07-08 | Celltrion, Inc. | Expression vector for animal cell comprising at least one copy of MAR DNA sequences at the 3′ terminal of transcription termination region of a gene and method for the expression of foreign gene using the vector |
EA011619B1 (ru) * | 2005-06-20 | 2009-04-28 | Кадила Хелзкэр Лимитед | Экспрессионный вектор и способ продуцирования высоких уровней белков |
EP2109674A2 (en) * | 2007-01-08 | 2009-10-21 | Millipore Corporation | High expression cell line that eliminates gene amplification |
CN101802170A (zh) * | 2007-01-08 | 2010-08-11 | 米利波尔公司 | 在存在降低水平的一或多种污染物的条件下制备重组蛋白的细胞培养方法 |
WO2011015917A2 (en) * | 2009-08-03 | 2011-02-10 | Avesthagen Limited | Vectors and compounds for expression of recombinant tnk-tpa (tenecteplase) |
-
2011
- 2011-10-10 AU AU2011311189A patent/AU2011311189B2/en not_active Ceased
- 2011-10-10 KR KR1020137011512A patent/KR101607734B1/ko not_active IP Right Cessation
- 2011-10-10 EA EA201390461A patent/EA201390461A1/ru unknown
- 2011-10-10 EP EP11805635.7A patent/EP2625277B1/en active Active
- 2011-10-10 WO PCT/IN2011/000703 patent/WO2012046255A2/en active Application Filing
- 2011-10-10 CA CA2813903A patent/CA2813903A1/en not_active Abandoned
- 2011-10-10 US US13/877,931 patent/US20130244280A1/en not_active Abandoned
- 2011-10-10 NZ NZ60990311A patent/NZ609903A/en not_active IP Right Cessation
- 2011-10-10 JP JP2013532320A patent/JP5888616B2/ja not_active Expired - Fee Related
- 2011-10-10 BR BR112013008459A patent/BR112013008459A2/pt not_active IP Right Cessation
- 2011-10-11 AR ARP110103745A patent/AR083376A1/es unknown
-
2013
- 2013-04-23 ZA ZA2013/02939A patent/ZA201302939B/en unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015099513A1 (ko) * | 2013-12-27 | 2015-07-02 | 재단법인 목암생명공학연구소 | 증가된 유전자 발현능을 갖는 발현벡터 |
KR20200054278A (ko) * | 2017-09-19 | 2020-05-19 | 도이체스 크렙스포르슝스첸트룸 | 세포의 유전적 변형을 위한 비-통합 dna 벡터 |
Also Published As
Publication number | Publication date |
---|---|
CA2813903A1 (en) | 2012-04-12 |
WO2012046255A8 (en) | 2013-05-10 |
EP2625277B1 (en) | 2017-09-06 |
NZ609903A (en) | 2015-04-24 |
AU2011311189A1 (en) | 2013-05-30 |
JP5888616B2 (ja) | 2016-03-22 |
AU2011311189B2 (en) | 2015-10-08 |
KR101607734B1 (ko) | 2016-03-30 |
EP2625277A2 (en) | 2013-08-14 |
ZA201302939B (en) | 2013-12-23 |
EA201390461A1 (ru) | 2013-09-30 |
JP2013541953A (ja) | 2013-11-21 |
WO2012046255A3 (en) | 2012-05-31 |
AR083376A1 (es) | 2013-02-21 |
BR112013008459A2 (pt) | 2016-06-28 |
US20130244280A1 (en) | 2013-09-19 |
WO2012046255A2 (en) | 2012-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101607734B1 (ko) | 재조합 단백질의 높은 레벨의 발현을 위한 발현 벡터 | |
CN110891420B (zh) | Cas转基因小鼠胚胎干细胞和小鼠及其应用 | |
TWI232239B (en) | Novel method for integrating genes at specific sites in mammalian cells via homologous recombination and vectors for accomplishing the same | |
KR20210143230A (ko) | 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물 | |
KR20230019843A (ko) | 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물 | |
US6410220B1 (en) | Self-assembling genes, vectors and uses thereof | |
KR20200132849A (ko) | CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절 | |
JP5051738B2 (ja) | 人工遍在的クロマチン開放エレメント(ucoe) | |
JP2024099582A (ja) | アルブミン遺伝子座からの導入遺伝子発現のための組成物及び方法 | |
KR20170096999A (ko) | 신규한 cho 통합 부위 및 이의 용도 | |
KR20210143897A (ko) | 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합 | |
CN101688222A (zh) | 启动子 | |
JP3956307B2 (ja) | テナガザル白血病ウイルスベースのレトロウイルスベクター | |
JP2004089200A (ja) | 一定の細胞系又は微生物の内因性遺伝子の発現特徴の変性のための方法 | |
JPH11502122A (ja) | タンパク質生産および輸送 | |
KR20210144861A (ko) | 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위 | |
CN110637090A (zh) | 用于表达大型核酸转基因的质粒载体 | |
CN113939595A (zh) | 包括人源化白蛋白基因座的非人动物 | |
CN113692225B (zh) | 经基因组编辑的鸟类 | |
KR20240037192A (ko) | 게놈 통합을 위한 방법 및 조성물 | |
EP3562944B1 (en) | Transgenic rabbits and method for bioproduction | |
ES2339428T3 (es) | Expresion de genes mejorada. | |
CN115362000A (zh) | 使用多核苷酸沉默和替换的神经退行性病症的基因疗法 | |
KR20100102235A (ko) | 발현에서의 방향성 편향을 감소시키는 방법 | |
KR20240029020A (ko) | Dna 변형을 위한 crispr-트랜스포손 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |