CN104619726B - 由超折叠绿色荧光蛋白构成的融合蛋白及其用途 - Google Patents
由超折叠绿色荧光蛋白构成的融合蛋白及其用途 Download PDFInfo
- Publication number
- CN104619726B CN104619726B CN201380016014.6A CN201380016014A CN104619726B CN 104619726 B CN104619726 B CN 104619726B CN 201380016014 A CN201380016014 A CN 201380016014A CN 104619726 B CN104619726 B CN 104619726B
- Authority
- CN
- China
- Prior art keywords
- gly
- leu
- fusion protein
- asp
- lys
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108020001507 fusion proteins Proteins 0.000 title claims description 131
- 102000037865 fusion proteins Human genes 0.000 title claims description 131
- 108010043121 Green Fluorescent Proteins Proteins 0.000 title abstract description 7
- 102000004144 Green Fluorescent Proteins Human genes 0.000 title abstract description 7
- 239000005090 green fluorescent protein Substances 0.000 title abstract description 7
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 131
- 238000000034 method Methods 0.000 claims abstract description 42
- 102000014914 Carrier Proteins Human genes 0.000 claims abstract description 39
- 108010078791 Carrier Proteins Proteins 0.000 claims abstract description 39
- 210000004027 cell Anatomy 0.000 claims description 85
- 108090000623 proteins and genes Proteins 0.000 claims description 76
- 230000014509 gene expression Effects 0.000 claims description 53
- 102000004169 proteins and genes Human genes 0.000 claims description 49
- 108091005946 superfolder green fluorescent proteins Proteins 0.000 claims description 47
- 239000013604 expression vector Substances 0.000 claims description 36
- 230000004927 fusion Effects 0.000 claims description 28
- 150000007523 nucleic acids Chemical class 0.000 claims description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 24
- 210000003000 inclusion body Anatomy 0.000 claims description 24
- 150000001413 amino acids Chemical group 0.000 claims description 23
- 241000588724 Escherichia coli Species 0.000 claims description 21
- 102000039446 nucleic acids Human genes 0.000 claims description 20
- 108020004707 nucleic acids Proteins 0.000 claims description 20
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 17
- 102000003982 Parathyroid hormone Human genes 0.000 claims description 16
- 108090000445 Parathyroid hormone Proteins 0.000 claims description 16
- 229960001319 parathyroid hormone Drugs 0.000 claims description 16
- 239000000199 parathyroid hormone Substances 0.000 claims description 16
- 238000000746 purification Methods 0.000 claims description 16
- 230000029087 digestion Effects 0.000 claims description 14
- 108060001064 Calcitonin Proteins 0.000 claims description 13
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 claims description 13
- 229960004015 calcitonin Drugs 0.000 claims description 13
- 102000055006 Calcitonin Human genes 0.000 claims description 12
- 108090000631 Trypsin Proteins 0.000 claims description 12
- 102000004142 Trypsin Human genes 0.000 claims description 12
- 239000012588 trypsin Substances 0.000 claims description 12
- 108010065920 Insulin Lispro Proteins 0.000 claims description 11
- WNRQPCUGRUFHED-DETKDSODSA-N humalog Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 WNRQPCUGRUFHED-DETKDSODSA-N 0.000 claims description 11
- 229920000936 Agarose Polymers 0.000 claims description 10
- 108010088406 Glucagon-Like Peptides Proteins 0.000 claims description 10
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 10
- 230000001580 bacterial effect Effects 0.000 claims description 10
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 10
- 229960002068 insulin lispro Drugs 0.000 claims description 10
- 239000011347 resin Substances 0.000 claims description 10
- 229920005989 resin Polymers 0.000 claims description 10
- 108010076818 TEV protease Proteins 0.000 claims description 8
- 230000002797 proteolythic effect Effects 0.000 claims description 8
- 230000007030 peptide scission Effects 0.000 claims description 7
- 239000002243 precursor Substances 0.000 claims description 7
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 claims description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 5
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 claims description 5
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 5
- 239000000411 inducer Substances 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 229930182817 methionine Natural products 0.000 claims description 5
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 claims description 4
- 108010011459 Exenatide Proteins 0.000 claims description 4
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 claims description 4
- 108010019598 Liraglutide Proteins 0.000 claims description 4
- 108090000190 Thrombin Proteins 0.000 claims description 4
- 229960001519 exenatide Drugs 0.000 claims description 4
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 claims description 4
- 229960002701 liraglutide Drugs 0.000 claims description 4
- 229960004072 thrombin Drugs 0.000 claims description 4
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 claims description 3
- 108010057186 Insulin Glargine Proteins 0.000 claims description 3
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 claims description 3
- 238000001261 affinity purification Methods 0.000 claims description 3
- 235000019253 formic acid Nutrition 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 3
- 229960002869 insulin glargine Drugs 0.000 claims description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 claims description 3
- 108010013369 Enteropeptidase Proteins 0.000 claims description 2
- 102100029727 Enteropeptidase Human genes 0.000 claims description 2
- 101000976075 Homo sapiens Insulin Proteins 0.000 claims description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 238000012869 ethanol precipitation Methods 0.000 claims description 2
- 238000002523 gelfiltration Methods 0.000 claims description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 claims description 2
- 238000005342 ion exchange Methods 0.000 claims description 2
- MHWLWQUZZRMNGJ-UHFFFAOYSA-N nalidixic acid Chemical compound C1=C(C)N=C2N(CC)C=C(C(O)=O)C(=O)C2=C1 MHWLWQUZZRMNGJ-UHFFFAOYSA-N 0.000 claims description 2
- 229960000210 nalidixic acid Drugs 0.000 claims description 2
- 244000063299 Bacillus subtilis Species 0.000 claims 1
- 235000014469 Bacillus subtilis Nutrition 0.000 claims 1
- 125000000089 arabinosyl group Chemical group C1([C@@H](O)[C@H](O)[C@H](O)CO1)* 0.000 claims 1
- 102000004196 processed proteins & peptides Human genes 0.000 abstract description 56
- 125000000539 amino acid group Chemical group 0.000 abstract description 10
- 108020004414 DNA Proteins 0.000 description 48
- 239000013612 plasmid Substances 0.000 description 44
- 235000018102 proteins Nutrition 0.000 description 40
- 239000002609 medium Substances 0.000 description 28
- 238000003752 polymerase chain reaction Methods 0.000 description 28
- 108091008146 restriction endonucleases Proteins 0.000 description 27
- 229960000723 ampicillin Drugs 0.000 description 26
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 26
- 239000013615 primer Substances 0.000 description 25
- 238000000605 extraction Methods 0.000 description 24
- 238000003776 cleavage reaction Methods 0.000 description 23
- 230000007017 scission Effects 0.000 description 23
- 239000013598 vector Substances 0.000 description 22
- 235000001014 amino acid Nutrition 0.000 description 21
- 229940024606 amino acid Drugs 0.000 description 21
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 21
- 229920001184 polypeptide Polymers 0.000 description 21
- 239000000499 gel Substances 0.000 description 20
- 125000003275 alpha amino acid group Chemical group 0.000 description 19
- 239000000047 product Substances 0.000 description 18
- 238000013519 translation Methods 0.000 description 15
- 108020004705 Codon Proteins 0.000 description 12
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 12
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 11
- 239000006228 supernatant Substances 0.000 description 11
- 238000005119 centrifugation Methods 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 239000000243 solution Substances 0.000 description 10
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 229960002378 oftasceine Drugs 0.000 description 9
- 102000012410 DNA Ligases Human genes 0.000 description 8
- 108010061982 DNA Ligases Proteins 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 108010076181 Proinsulin Proteins 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 8
- 238000001962 electrophoresis Methods 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 239000003155 DNA primer Substances 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 229920004890 Triton X-100 Polymers 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 239000004202 carbamide Substances 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 239000006166 lysate Substances 0.000 description 6
- 239000012139 lysis buffer Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000003488 releasing hormone Substances 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 108010086019 Secretin Proteins 0.000 description 5
- 102100037505 Secretin Human genes 0.000 description 5
- 239000013504 Triton X-100 Substances 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 5
- 230000009089 cytolysis Effects 0.000 description 5
- 210000000805 cytoplasm Anatomy 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000004007 reversed phase HPLC Methods 0.000 description 5
- 229960002101 secretin Drugs 0.000 description 5
- OWMZNFCDEHGFEP-NFBCVYDUSA-N secretin human Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(N)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)C1=CC=CC=C1 OWMZNFCDEHGFEP-NFBCVYDUSA-N 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 4
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 4
- 102000003670 Carboxypeptidase B Human genes 0.000 description 4
- 108090000087 Carboxypeptidase B Proteins 0.000 description 4
- 239000007995 HEPES buffer Substances 0.000 description 4
- 102000016943 Muramidase Human genes 0.000 description 4
- 108010014251 Muramidase Proteins 0.000 description 4
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- PBCJIPOGFJYBJE-UHFFFAOYSA-N acetonitrile;hydrate Chemical compound O.CC#N PBCJIPOGFJYBJE-UHFFFAOYSA-N 0.000 description 4
- -1 dessertraline Proteins 0.000 description 4
- 238000000502 dialysis Methods 0.000 description 4
- 229960000789 guanidine hydrochloride Drugs 0.000 description 4
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 229960000274 lysozyme Drugs 0.000 description 4
- 235000010335 lysozyme Nutrition 0.000 description 4
- 239000004325 lysozyme Substances 0.000 description 4
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 3
- 108010075254 C-Peptide Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 108010032976 Enfuvirtide Proteins 0.000 description 3
- 101800001586 Ghrelin Proteins 0.000 description 3
- 102400000442 Ghrelin-28 Human genes 0.000 description 3
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 108090001061 Insulin Proteins 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- MVQGZYIOMXAFQG-GUBZILKMSA-N Met-Ala-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MVQGZYIOMXAFQG-GUBZILKMSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- OIRCOABEOLEUMC-GEJPAHFPSA-N bivalirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 OIRCOABEOLEUMC-GEJPAHFPSA-N 0.000 description 3
- 108010055460 bivalirudin Proteins 0.000 description 3
- 229960001500 bivalirudin Drugs 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 239000013043 chemical agent Substances 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- PEASPLKKXBYDKL-FXEVSJAOSA-N enfuvirtide Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(C)=O)[C@@H](C)O)[C@@H](C)CC)C1=CN=CN1 PEASPLKKXBYDKL-FXEVSJAOSA-N 0.000 description 3
- 229960002062 enfuvirtide Drugs 0.000 description 3
- GNKDKYIHGQKHHM-RJKLHVOGSA-N ghrelin Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)CN)COC(=O)CCCCCCC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 GNKDKYIHGQKHHM-RJKLHVOGSA-N 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- VGKDLMBJGBXTGI-SJCJKPOMSA-N sertraline Chemical compound C1([C@@H]2CC[C@@H](C3=CC=CC=C32)NC)=CC=C(Cl)C(Cl)=C1 VGKDLMBJGBXTGI-SJCJKPOMSA-N 0.000 description 3
- 229960002073 sertraline Drugs 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 229960002811 ziconotide Drugs 0.000 description 3
- BPKIMPVREBSLAJ-QTBYCLKRSA-N ziconotide Chemical compound C([C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]2C(=O)N[C@@H]3C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CSSC2)C(N)=O)=O)CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CSSC3)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(N1)=O)CCSC)[C@@H](C)O)C1=CC=C(O)C=C1 BPKIMPVREBSLAJ-QTBYCLKRSA-N 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108010079882 Bax protein (53-86) Proteins 0.000 description 2
- 102400000739 Corticotropin Human genes 0.000 description 2
- 101800000414 Corticotropin Proteins 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 108010000437 Deamino Arginine Vasopressin Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102000005593 Endopeptidases Human genes 0.000 description 2
- 108010059378 Endopeptidases Proteins 0.000 description 2
- 102000051325 Glucagon Human genes 0.000 description 2
- 108060003199 Glucagon Proteins 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 102000018997 Growth Hormone Human genes 0.000 description 2
- 108010051696 Growth Hormone Proteins 0.000 description 2
- 239000000095 Growth Hormone-Releasing Hormone Substances 0.000 description 2
- 108010007267 Hirudins Proteins 0.000 description 2
- 102000007625 Hirudins Human genes 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 102000005755 Intercellular Signaling Peptides and Proteins Human genes 0.000 description 2
- 108010070716 Intercellular Signaling Peptides and Proteins Proteins 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- LEVWYRKDKASIDU-IMJSIDKUSA-N L-cystine Chemical compound [O-]C(=O)[C@@H]([NH3+])CSSC[C@H]([NH3+])C([O-])=O LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 108010000817 Leuprolide Proteins 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- 102000005157 Somatostatin Human genes 0.000 description 2
- 108010056088 Somatostatin Proteins 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 108010050144 Triptorelin Pamoate Proteins 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 108010003205 Vasoactive Intestinal Peptide Proteins 0.000 description 2
- 102400000015 Vasoactive intestinal peptide Human genes 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- DDPFHDCZUJFNAT-PZPWKVFESA-N chembl2104402 Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CCCCCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 DDPFHDCZUJFNAT-PZPWKVFESA-N 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- IDLFZVILOHSSID-OVLDLUHVSA-N corticotropin Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](N)CO)C1=CC=C(O)C=C1 IDLFZVILOHSSID-OVLDLUHVSA-N 0.000 description 2
- 229960000258 corticotropin Drugs 0.000 description 2
- 229960003067 cystine Drugs 0.000 description 2
- 229960004281 desmopressin Drugs 0.000 description 2
- NFLWUMRGJYTJIN-NXBWRCJVSA-N desmopressin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSCCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(N)=O)=O)CCC(=O)N)C1=CC=CC=C1 NFLWUMRGJYTJIN-NXBWRCJVSA-N 0.000 description 2
- 108700032313 elcatonin Proteins 0.000 description 2
- 229960000756 elcatonin Drugs 0.000 description 2
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 2
- 229960004666 glucagon Drugs 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- 239000000122 growth hormone Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 229940006607 hirudin Drugs 0.000 description 2
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- VBUWHHLIZKOSMS-RIWXPGAOSA-N invicorp Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 VBUWHHLIZKOSMS-RIWXPGAOSA-N 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- GFIJNRVAKGFPGQ-LIJARHBVSA-N leuprolide Chemical compound CCNC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)CC1=CC=C(O)C=C1 GFIJNRVAKGFPGQ-LIJARHBVSA-N 0.000 description 2
- 229960004338 leuprorelin Drugs 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 101150031139 pth gene Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 2
- 229960000553 somatostatin Drugs 0.000 description 2
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 229960004824 triptorelin Drugs 0.000 description 2
- VXKHXGOKWPXYNA-PGBVPBMZSA-N triptorelin Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 VXKHXGOKWPXYNA-PGBVPBMZSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- BEJKOYIMCGMNRB-GRHHLOCNSA-N (2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BEJKOYIMCGMNRB-GRHHLOCNSA-N 0.000 description 1
- PSLCKQYQNVNTQI-BHFSHLQUSA-N (2s)-2-aminobutanedioic acid;(2s)-2-aminopentanedioic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O.OC(=O)[C@@H](N)CCC(O)=O PSLCKQYQNVNTQI-BHFSHLQUSA-N 0.000 description 1
- HZKLCOYAVAAQRD-VGMNWLOBSA-N (3s)-3-[[2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]-4-[[(1r)-1-carboxyethyl]amino]-4-oxobutanoic acid Chemical compound OC(=O)[C@@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N HZKLCOYAVAAQRD-VGMNWLOBSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101100337060 Caenorhabditis elegans glp-1 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- PZOHPVWRSNXCRP-QRCCJXOFSA-N GPL-1 Chemical compound C([C@@H](NC(=O)CC(O)CCCCCCCCCCCCCCCCCCCCCCCCCCCCC)C(=O)N[C@H]([C@@H](C)OC1[C@@H]([C@H](O)[C@H](O)[C@H](C)O1)O[C@H]1[C@@H]([C@H](O)[C@@H](O)[C@H](C)O1)O)C(=O)N[C@H](C)C(=O)N[C@@H](C)COC1[C@@H]([C@H](OC)[C@@H](OC)[C@H](C)O1)O)C1=CC=CC=C1 PZOHPVWRSNXCRP-QRCCJXOFSA-N 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- GDBQQVLCIARPGH-UHFFFAOYSA-N Leupeptin Natural products CC(C)CC(NC(C)=O)C(=O)NC(CC(C)C)C(=O)NC(C=O)CCCN=C(N)N GDBQQVLCIARPGH-UHFFFAOYSA-N 0.000 description 1
- 101710107068 Myelin basic protein Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102400000757 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- DZHSAHHDTRWUTF-SIQRNXPUSA-N amyloid-beta polypeptide 42 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O)[C@@H](C)CC)C(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C(C)C)C1=CC=CC=C1 DZHSAHHDTRWUTF-SIQRNXPUSA-N 0.000 description 1
- 229940127095 analogue insulin Drugs 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010086780 arginyl-glycyl-aspartyl-alanine Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 229960003773 calcitonin (salmon synthetic) Drugs 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000009614 chemical analysis method Methods 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 229940039227 diagnostic agent Drugs 0.000 description 1
- 239000000032 diagnostic agent Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 150000008195 galaktosides Chemical class 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 101150102822 glp-1 gene Proteins 0.000 description 1
- 150000002307 glutamic acids Chemical class 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 239000000413 hydrolysate Substances 0.000 description 1
- 125000002349 hydroxyamino group Chemical group [H]ON([H])[*] 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010052968 leupeptin Proteins 0.000 description 1
- GDBQQVLCIARPGH-ULQDDVLXSA-N leupeptin Chemical compound CC(C)C[C@H](NC(C)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C=O)CCCN=C(N)N GDBQQVLCIARPGH-ULQDDVLXSA-N 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 210000004248 oligodendroglia Anatomy 0.000 description 1
- 239000010815 organic waste Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000001814 protein method Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 108020002667 ribulokinase Proteins 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 108010068072 salmon calcitonin Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- CILIXQOJUNDIDU-ASQIGDHWSA-N teduglutide Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O)[C@@H](C)CC)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)CC)C1=CC=CC=C1 CILIXQOJUNDIDU-ASQIGDHWSA-N 0.000 description 1
- 108010073046 teduglutide Proteins 0.000 description 1
- 229960002444 teduglutide Drugs 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 235000021119 whey protein Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43595—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/585—Calcitonins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/605—Glucagons
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/635—Parathyroid hormone, i.e. parathormone; Parathyroid hormone-related peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Toxicology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Endocrinology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Diabetes (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明涉及使用源于超折叠绿色荧光蛋白及其变体的新的载体蛋白产生含有10到200个氨基酸残基重组肽的方法。
Description
相关申请
本申请是要求在2012年3月23日递交的美国临时申请No.61/615,178的权益和优先权,该美国临时申请的全部内容以引用的方式并入本文中。
技术领域
本发明在广义上涉及含有小于200个氨基酸残基的重组肽和一个或多个源于超折叠绿色荧光蛋白或其变体的新的载体蛋白或变体,以及使用源于超折叠绿色荧光蛋白或其突变体的新的载体蛋白生产重组肽的方法。
背景技术
肽是一类生物分子,其被广泛地在许多生物医学研究领域中用作试剂、在疾病的治疗中用作治疗性药物、在检测病原菌中用作诊断剂以及用作生物标记物。合成肽通常有两种方法,一种是化学合成,另外一种是重组表达。化学合成已被用于制备多种治疗性肽,包括可的瑞林、甲状旁腺素(PTH)、胰高血糖素样肽(GLP-1)及其衍生物艾塞那肽和利拉鲁肽、恩夫韦肽、降血钙素、比伐卢定、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽和胰岛素。该方法需要氨基酸片段的多步缩合而形成肽,同时也需要繁琐的保护、去保护和纯化等步骤。到目前为止,大多数低于50个氨基酸残基的商业化肽是用这种方法生产。由于制药行业和生物医学研究中肽的需求在不断增加,用于化学合成的氨基酸片段的价格也在持续攀升。因此,日常使用的治疗性肽药物比如GLP-1类似物,在未来将难以保持可以承受的价格。尽管化学合成小于50个氨基酸残基的肽在技术上是可行的,但较低的产量以及合成过程中产生的大量的有机废物是相当不合算的。现在,大多数超过50个氨基酸残基的肽是在细菌、酵母、昆虫、哺乳动物等细胞宿主中重组表达的。多年来,使用融合蛋白表达多肽一直是比较常用的方法。可用的载体蛋白包括谷胱甘肽-s-转移酶(W094/04688 and Ray etal.,BioTechnology,11,64,1993)、核酮糖激酶(US patent No.5,206,154 and Callawayet al.,Antimicrob.Agents&Chemo.,37,1614-1919,1993)、gp-55蛋白(Gram H.et al.,Biotechnology,12,1017-1023,1994)、类固醇异构酶(Kuliopulos A.et al.,J.Am.Chem.Soc.,116,4599-4607,1994)、泛素(Pilon A.et al.,Biotecnol.Prog.374-379,1997)、牛凝乳酶原(Hauht et al.,Biotechnolo.Bioengineer.,7,55-61,1998)、GB1结构域(Darrinm et al.,Biochemistry,41,7267-7274,2003)、RNA结合蛋白(Sharon M.etal.,Protein Exp.And Purif.,24,374-383,2002)、SH2结构域(Fairlie W.et al.,Protein Exp.And Purif.26,171-178,2002)、纤维素酶结合蛋白、小泛素样修饰蛋白、内含肽、抗菌/增加通透性的蛋白、碳酸酐酶(US Patent No:5,962,270 and W097/29127)、乳清蛋白(W095/27782)、beta-牛乳糖(Shen S.,PNAS,281,4627-4631,1984)以及氯霉素乙酰转移酶(Dykes C.et al.,European Journal of Biochemistry,174,411-416,1988)。选择这些融合载体是因为它们在宿主细胞内具有相对高的表达水平和快速折叠的特性。虽然可用,但使用融合载体蛋白重组表达的肽的终产率一般不会超过100mg/L。此外,用于肽表达的现在可用的融合蛋白方法有许多技术上的问题,尤其对于产生小于50个氨基酸残基的肽(Vileghe et al.,Drug Discovery Today,15,40-56,2010)。
非常有必要研发一种新的载体蛋白,所述新的载体蛋白克服其它现有载体蛋白产生重组肽的限制。
发明内容
本发明至少部分基于这样的意外发现:超折叠绿色荧光蛋白或其变体当被用作载体蛋白时,在细菌细胞的细胞质或者包涵体中会得到高表达水平的重组肽。因此,本发明的一个方面涉及一种用于构建用于产生作为融合蛋白的重组肽的稳定表达系统的新的载体蛋白。具体而言,所述载体蛋白包括超折叠绿色荧光蛋白或其变体。
在一个实施方案中,所产生的融合蛋白以完整和稳定的形式表达。在一个实施方案中,所述新的载体蛋白容易通过方便的方法去除并且不会使后续的肽纯化步骤复杂化。在本发明的一个实施方案中,所述目标肽被靶向以通过对本发明的载体蛋白进行基因工程而形成包涵体,用于避免细胞内的蛋白水解式降解。依据本发明,提供了一种用于表达目标肽的融合载体蛋白,该融合载体蛋白来自于超折叠绿色荧光蛋白或者其变体,长度包括237个或者更多个氨基酸。优选地,所述的融合载体蛋白的氨基酸序列在结构式I中列出:
T1-A1-T2(I)
其中,
T1为不存在、甲硫氨酸、组氨酸标签或者至少一个肽裂解位点;
Al为超折叠绿色荧光蛋白;
T2为不存在、组氨酸标签或者至少一个肽裂解位点,条件是T1和T2至多有一个不存在。
在实施方案中,Al为超折叠绿色荧光蛋白,所述蛋白具有如下氨基酸序列:Ser-Lys-Gly-Glu-Glu-Leu-Phe-Thr-Gly-Val-Val-Pro-Ile-Leu-Val-Glu-Leu-Asp-Gly-Asp-Val-Asn-Gly-His-Lys-Phe-Ser-Val-Arg-Gly-Glu-Gly-Glu-Gly-Asp-Ala-Thr-Asn-Gly-Lys-Leu-Thr-Leu-Lys-Phe-Ile-Cys-Thr-Thr-Gly-Lys-Leu-Pro-Val-Pro-Trp-Pro-Thr-Leu-Val-Thr-Thr-Leu-Thr-Tyr-Gly-Val-Gln-Cys-Phe-Ser-Arg-Tyr-Pro-Asp-His-Met-Lys-Arg-His-Asp-Phe-Phe-Lys-Ser-Ala-Met-Pro-Glu-Gly-Tyr-Val-Gln-Glu-Arg-Thr-Ile-Ser-Phe-Lys-Asp-Asp-Gly-Thr-Tyr-Lys-Thr-Arg-Ala-Glu-Val-Lys-Phe-Glu-Gly-Asp-Thr-Leu-Val-Asn-Arg-Ile-Glu-Leu-Lys-Gly-Ile-Asp-Phe-Lys-Glu-Asp-Gly-Asn-Ile-Leu-Gly-His-Lys-Leu-Glu-Tyr-Asn-Phe-Asn-Ser-His-Asn-Val-Tyr-Ile-Thr-Ala-Asp-Lys-Gln-Lys-Asn-Gly-Ile-Lys-Ala-Asn-Phe-Lys-Ile-Arg-His-Asn-Val-Glu-Asp-Gly-Ser-Val-Gln-Leu-Ala-Asp-His-Tyr-Gln-Gln-Asn-Thr-Pro-Ile-Gly-Asp-Gly-Pro-Val-Leu-Leu-Pro-Asp-Asn-His-Tyr-Leu-Ser-Thr-Gln-Ser-Val-Leu-Ser-Lys-Asp-Pro-Asn-Glu-Lys-Arg-Asp-His-Met-Val-Leu-Leu-Glu-Phe-Val-Thr-Ala-Ala-Gly-Ile-Thr-His-Gly-Met-Asp-Glu-Leu-Tyr-Lys(SEQ ID NO:l),或与SEQ ID NO:1至少80%,至少90%,至少95%,至少97%或者至少99%相同的氨基酸序列。
肽裂解位点可以选自例如:Met、Cys、Pro、Asn、Glu、Tyr、Trp、Lys、Arg、Asn-Gly、Asp-Met-Gln-Asp-Ile、Asp-Glu-Val-Asp-Ile、Leu-Glu-Val-Asp-Ile、Trp-Glu-His-Asp-Ile、Leu-Glu-His-Asp-Ile、Val-Glu-Ile-Asp-Ile、Val-Glu-His-Asp-Ile、Ile-Glu-Thr-Asp-Ile、Leu-Glu-Thr-Asp-Ile、Ile-Glu-Ala-Asp-Ile、Asp-Asp-Asp-Asp-Lys、Arg-Gly-Glu-lie、Arg-Gly-Asp-Ile、Arg-Gly-Asp-Ile、Arg-Gly-Asp-Ala、Ile-Glu-Pro-Asp-Ile、Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO:3)、Glu-Asn-Leu-Tyr-Phe-Gln-Ser(SEQ IDNO:5),以及在这一领域内已知的任何其他蛋白水解位点。
组氨酸标签优选由三个至八个组氨酸残基组成。
在本发明的一个实施方案中,融合蛋白包括以上限定的融合载体蛋白,连接至少一个目标肽。所述目标肽可以连接到所述融合载体蛋白的C-末端或者N-末端。一般情况下,所述目标肽有10-200个氨基酸的序列长度。
在本发明的一个实施方案中,融合蛋白的DNA序列是经密码子优化的,用于在其细胞宿主中有效翻译。
在本发明的一个实施方案中,所述目标肽优选选自以下的肽:可的瑞林、甲状旁腺素、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、恩夫韦肽、降血钙素、比伐卢定、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽和胰岛素原、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体(生成)激素释放激素、分泌素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、BH3肽、β-淀粉样变肽或上述肽的片段。
所述融合蛋白优选还包含在所述融合载体蛋白与所述目标肽之间的裂解位点。
依据本发明,还提供了一种编码上述的融合蛋白的核酸序列。该核酸序列是经密码子优化的,用于在其细胞宿主中有效翻译。
仍依据本发明,提供了一种包括上述核酸序列的表达载体,所述序列连接至用于表达编码所述融合蛋白的所述核酸序列的启动子。所述启动子可以是例如pL启动子、lamda启动子、pBAD启动子、trc启动子或者T7启动子。
依据本发明,提供了一种宿主细胞,例如大肠杆菌(E.coli)Top10、DH5α、DH10b、BL21或者JM101细胞,所述宿主细胞转化有上述表达载体。优选地,所述宿主细胞为大肠杆菌或者枯草芽孢杆菌(B.subtilis)。或者,所述宿主细胞为酵母细胞、昆虫细胞或哺乳动物细胞。
依据本发明,提供了一种产生融合蛋白的方法,包括在适合表达所述表达载体的条件下培养上述宿主细胞,从而产生融合蛋白。所述合适条件可以包括用于诱导所述宿主细胞表达所述表达载体的诱导剂。该诱导剂可以是阿拉伯糖、IPTG或者温度。在本发明的一个实施方案中,所述方法还包括对所产生的融合蛋白进行纯化的步骤。
所述纯化步骤优选包括乙醇沉淀、离子交换、使用Ni-NTA琼脂糖树脂的亲和纯化中的至少一个。在该方法中,所述融合蛋白优选还被蛋白水解消化,以从所述融合蛋白中释放所述目标肽。所述蛋白水解消化可以例如通过溴化氰、甲酸、HCl、凝血酶或者蛋白酶(例如胰蛋白酶)实现。所释放的目标肽可以被HPLC更进一步纯化。
依据本发明,提供了上述融合载体蛋白或核酸用于表达目标肽的用途。所述核酸可以被用于表达载体中,用于表达目标蛋白。上述的宿主细胞也可以用于表达目标蛋白。
本发明中的相关术语定义如下。
本文使用的术语“sfGFP”或“超折叠绿色荧光蛋白”是指这样的多肽,即其来源于或者基于超折叠绿色荧光蛋白的蛋白序列和它的变体(Pedelacq J.D.et al.,NatureBiotechnology,1;79-88,2006;and Tansila N.et al.,Biotechnology Letters,30;1391-1396,2008),以及其他重排的、截短的变体或其中一些氨基酸已被删除、替换的杂交形式,以及修饰例如其中一个或者多个氨基酸已被变成修饰的如糖基化的氨基酸或非常用氨基酸,条件是所述杂合形式或修饰形式的蛋白保持sfGFP作为载体蛋白的生物学活性。优选的变体中有保守的氨基酸替换,发生在一个或多个预测的非必需氨基酸残基处。“保守氨基酸替换”是指氨基酸残基被具有相似侧链的氨基酸残基替换。具有相似侧链的氨基酸残基的家族在本领域中已有定义。这些家族包括具有碱性侧链(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如天冬氨酸、谷氨酸)、非带电极性侧链(甘氨酸、天冬酰胺、谷酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链的侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。这样,GFP中的预测的非必需氨基酸残基就被来自相同侧链家族的另外的氨基酸残基所替换。或者,在另外一个实施方案中,突变可以例如通过饱和诱变在部分或全部sfGFP编码序列中被随机引入,所得的变体可以被筛选出来以鉴定保持活性的变体。
不包含第一个甲硫氨酸的整个超折叠绿色荧光蛋白的氨基酸序列以及编码该蛋白的DNA的经密码子优化后的核酸序列分别如SEQ ID NO:1和SEQ ID NO:2所示。
所述目标肽是指作为产物的任何小蛋白或寡肽。为了本发明的实际应用,肽应当包括由肽键连接的最少10个氨基酸残基,或由肽键连接的最多200个氨基酸残基。
本文使用的“裂解位点”是指这样的氨基酸序列,其包括氨基酸或氨基酸的序列,该氨基酸或氨基酸的序列为化学试剂或者酶提供了识别位点,以使该肽链在该位点被所述化学试剂或酶裂解。
“转化的宿主细胞”是指包含重组体材料的细菌、酵母、昆虫或哺乳动物细胞,或包含表达重组产物所需的遗传物质的细菌、酵母、昆虫或哺乳动物细胞。遗传物质可以被任何已知的方法引入细胞,这些方法包括转化、转导、电穿孔和转染。通常情况下,在整个本发明中,术语“转化的”或“转化”不是特指以上提及的已知方法的任一种。
除非另有定义,本文使用的所有技术或科学术语与本发明所属的专业领域中的普通技术人员所理解的相同。虽然类似或等同于本文描述的方法和材料可以用于实施或测试本发明,合适的方法和材料如下所述。所有出版物、专利申请、专利和本文提及的其它参考文献都以其整体通过引用并入。在冲突的情况下,以本说明书,包括定义为准。此外,材料、方法和实施例仅是说明性的,而不是为了进行限制。
从以下的详细描述和权利要求书可以很明显地发现本发明的优点和其它特点。
附图说明
图1A和图1B显示了本发明的融合蛋白的可能排列,其中目标肽连接到所述C-末端(图1A)或所述N-末端(图1B)或所述载体蛋白。
图2A和图2B显示了图1A和图1B的融合蛋白的多个实施方案。其中裂解位点(C位点)连接所述载体蛋白和所述目标肽。
图3A和图3B显示了本发明的融合蛋白的其它两个实施方案,目标肽有一个(图3A)或多个(图3B)重复。
图4A和图4B分别显示了两个质粒pSFGFPN-NcoI和pSFGFPC-MCS表达载体,含有用作载体蛋白的超折叠绿色荧光蛋白。
图5显示了在以阿拉伯糖诱导4小时和21小时后,包涵体中的所表达的prolispro-sfGFP融合蛋白的SDS-PAGE。
图6显示了所表达的sfGFP-proinsulin赖脯胰岛素融合蛋白在用胰蛋白酶和羧基肽酶B消化后的SDS-PAGE。
图7显示了纯化的赖脯胰岛素的MOLDI-TOF质谱分析。
图8显示了所表达的sfGFP-PTH融合蛋白的SDS-PAGE。
图9显示了所表达的sfGFP-Calcitonin融合蛋白SDS-PAGE。
图10显示了所表达的sfGFP-GLP1融合蛋白SDS-PAGE。
具体实施方式
通过融合蛋白以可溶或包涵体的形式表达重组肽是公认的方法。本发明利用一种新的载体蛋白,以提供用于产生重组肽的另一种方法。所述载体蛋白源于超折叠绿色荧光蛋白。通过融合蛋白编码并从中释放的重组肽可以根据本文描述的这些方法回收。本发明提供了融合蛋白构建体,以建立一种新的、低成本的且高效率的方法,用于大规模制备重组肽。
依据本发明,因此提供了一种通过使用新的融合蛋白产生重组肽的方法。所述载体蛋白是超折叠绿色荧光蛋白或其变体之一。由超折叠绿色荧光蛋白引导的融合蛋白在大肠杆菌中高表达。所述超折叠的绿色荧光蛋白和所述目标肽可以通过蛋白水解敏感(裂解)位点连接。所述裂解位点通常是特定的氨基酸或氨基酸的特定序列以生成融合蛋白,所述融合蛋白被裂解剂选择性地裂解。裂解剂可以是化学试剂如溴化氰或酸。裂解剂也可以是内肽酶,如胰蛋白酶,、凝血酶,、肠激酶,或另一种其他特异性蛋白酶。
本发明的一个实施方案提供了一种改进的方法,用于在细菌细胞内表达不溶性的包涵体形式的融合蛋白后,获得来自所述细胞的重组肽。该融合蛋白以包涵体形式表达,增加了所述重组肽的产率,并保护了所述目标肽的完整性。
本发明的第二实施方案涉及一种改进的方法,以通过在超折叠绿色荧光蛋白中插入一个或多个组氨酸标签来简化纯化步骤。由化学试剂或内肽酶裂解所述融合蛋白后,所述超折叠绿色荧光蛋白标签可以通过重复组氨酸标签亲和纯化得以除去。籍此,一般可以减少来自其它细胞蛋白裂解过程的污染物。
第三实施方案涉及一种表达所述融合蛋白的方法,其中甲硫氨酸残基连接所述目标肽和所述载体超折叠绿色荧光蛋白。所述融合蛋白以包涵体形式表达,并在变性条件例如用尿素或盐酸胍下纯化。所述融合蛋白可以溶解于甲酸,然后用溴化氰裂解,以释放所述目标肽。在裂解所述融合蛋白后,包含超折叠绿色荧光蛋白的片段可以通过色谱法除去。
第四实施方案涉及一种表达含有甲硫氨酸残基的目标肽的方法。所述融合蛋白以包涵体形式表达,并在变性条件下例如用尿素或盐酸胍纯化。所述融合蛋白可以通过相对生理缓冲液透析而重折叠。然后,可以用蛋白水解酶如胰蛋白酶、TEV蛋白酶或凝血酶裂解所述融合蛋白以释放所述目标肽。在裂解所述融合蛋白后,可以通过色谱去除含有超折叠绿色荧光蛋白的片段。
本发明的第五实施方案涉及所述目标肽与载体蛋白超折叠绿色荧光蛋白的氮末端或碳末端的融合物,如图1A和图1B所示。所述目标肽的大小可以是10到200个氨基酸残基。所述载体蛋白具有SEQ ID NO:1中列出的氨基酸序列。
所述融合蛋白的大小会随着所述目标肽的性质和拷贝数量而有变化。所述融合蛋白应该足够大,以避免被内源性蛋白酶降解。所述融合蛋白可以如图1A和图1B中所示的两种方式进行排列。或者,所述目标肽与载体蛋白(超折叠绿色荧光蛋白)的N-末端或C-末端通过具体氨基酸序列的裂解位点(图2A和图2B)连接。在图2A和图2B中,裂解位点包含的氨基酸或氨基酸的序列,提供了化学反应或酶反应的识别位点,使得所述的化学试剂或酶裂解该位点的肽链。
所述目标肽可以由10到200氨基酸残基的一个或多个连续序列组成。大的肽特别是来源于没有独特三维结构的蛋白序列的那些。多种目标肽可以有如图3A和图3B所示的几种形式。在图3A中,一个包括单个拷贝的所述目标肽。在图3B中,另一个由多个串联重复的单个目标肽组成。每个重复序列可以是相同的或不同的肽,所述重复由“互连”序列连接,所述“互连”序列可以是Met、Lys、Arg、Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO:3)、Glu-Asn-Leu-Tyr-Phe-Gln-Ser(SEQ ID NO:5)或其他合适的氨基酸序列。所述互连序列不是必须与连接所述载体蛋白和所述目标肽的“连接”序列不同。使用不同的连接连接体提供了这样的优点,即两个或多个不同的裂解剂(如化学物质或酶)可以从所述融合蛋白中逐个地释放所述目标肽并将所述每个目标肽彼此分离。
所述融合的肽的具体实施方案是目标肽可以以单个的或多个连接的重复出现,其包括可的瑞林、甲状旁腺素、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、恩夫韦肽、降血钙素、比伐卢定、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽和胰岛素原、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体(生成)激素释放激素、分泌素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、BH3肽、β-淀粉样变肽。这些肽的一个共同特性是它们都具有柔性和脆弱的构象,使它们不稳定,容易蛋白水解式降解。
所述裂解位点和所述目标肽优选经过选择,以使所述目标肽不包含相同裂解位点。所述裂解位点包括Met、Lys、Arg、Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO:3)、Glu-Asn-Leu-Tyr-Phe-Gln-Ser(SEQ ID NO:5)或其他合适的氨基酸序列。可以设计新的裂解位点,以使用化学裂解剂或酶或这两者的组合。在某些情况下,可能需要利用裂解位点将具体的功能基团引入到所述目标肽的C-末端,比如通过溴化氰裂解。
编码所述目标肽的DNA序列可以获自天然来源(如基因组DNA),也可以利用细菌细胞或其它宿主细胞的密码子偏爱性通过化学合成获得。
本发明的一个实施方案提供了一种从基因组DNA中扩增编码具体肽的DNA序列的方法。通常情况下,设计两个引物以在PCR产物的两端引入两个独特的限制性内切酶切位点。所述PCR反应在可以控制反应温度的PCR扩增设备上进行。PCR DNA聚合酶,例如Taq酶、Pfu酶、Phusion DNA聚合酶,被用于PCR反应中,反应条件采用供应商提供的方案。PCR产物用至少一种限制性内切酶直接消化,或者若有必要,在被限制性内切酶消化前进行清洗步骤。所述消化反应混合物用DNA纯化方法进行净化。DNA的纯化可以通过使用琼脂糖凝胶电泳或PCR纯化试剂盒来实现。所述纯化的PCR产物作为编码目标肽的插入物。在一些实例中,编码所述目标肽的插入物不能从天然来源获得。在该后一种情形中,编码所述目标肽的DNA片段通过化学合成制备。通常,至少两个寡核苷酸引物是化学合成的,且每一末端至少含有一个限制性内切酶位点。这两个寡核苷酸在中间区域有至少10个碱基对可以是互补或重叠的。PCR扩增可以用于通过重叠的寡核苷酸序列生成完整的插入物。
编码融合蛋白的DNA序列包含至少四个部分,包括亲和标签的DNA序列、载体蛋白(超折叠绿色荧光蛋白)的DNA序列、裂解位点的DNA序列和目标肽的DNA序列。典型地,DNA序列片段的排列可以与图2A和图2B中描述的相同。所述亲和标签的DNA序列可以被插入在融合蛋白DNA序列中的任何位置。该融合蛋白的DNA序列可以被连接到任何的细菌表达质粒中,以构建表达载体。该表达载体含有至少一个启动子,如lac、T7、Tac、lamda、pL或pBAD和一个抗生素标记,如氨苄青霉素,卡那霉素或四环素。
所构建的表达载体可以被转化到细菌宿主细胞以复制质粒,用于小规模DNA制备(小量制备)和测序。所述构建体通过DNA测序以对其进行确认,再将所述表达载体转化细菌宿主细胞以表达所述融合蛋白。含有所述融合蛋白表达载体的细胞可以在存在至少一种抗生素的LB培养基或基本培养基中培养。该融合蛋白的表达被诱导剂诱导,所述诱导剂例如IPTG、半乳糖苷、萘啶酸、温度或阿拉伯糖。
融合蛋白的纯化是指将该融合蛋白从宿主细胞中分离出来的过程。细胞一般通过离心或过滤收集。通常将细胞沉淀重悬在含有50mM磷酸盐、10mM Tris和50mM NaCl的裂解缓冲液中。所述裂解缓冲液可以包含离散剂,例如尿素或盐酸胍。悬浮的细胞可进一步经受French Press或超声处理,以彻底破坏细胞。将所述裂解物离心以从其它成分分离出所需的融合蛋白。在一些情况下,该融合蛋白是以纯包涵体的形式从细胞中分离出来的。所述包涵体可通过常规技术从粗制细胞裂解物中分离,例如通过离心。所述粗制包涵体可以经过初步纯化步骤,例如以50mM磷酸盐、1mM EDTA,pH为7.5的溶液洗一次,然后以含低浓度离散计例如尿素或盐酸胍的相同缓冲液洗涤至少两次。将纯包涵体溶解在高浓度的离散缓冲液中,然后进行重折叠。重折叠过程可以通过在生理缓冲液中进行透析所述悬浮的样品,或通过反相色谱柱除盐,再进行冷冻干燥。在一些情况下,所述融合蛋白以细胞内不溶包涵体形式产生,但没有设计亲和标签。在这种情况下,在裂解物中的所述融合蛋白通过溶剂提取粗纯后再用离子交换色谱法进一步纯化。如果有必要,该融合蛋白可通过反相HPLC进行纯化。在其它情况下,该融合蛋白可以通过亲和色谱法,如作为组氨酸标签结合的Ni-NTA亲和珠,在天然条件下或在变性条件下进行纯化。
在裂解后,所述混合物被用来将所述目标肽从所述载体蛋白分离出来。在一些实例中,该混合物可以直接用于HPLC纯化。将所述混合物的pH值调节到低于3.0,在HPLC纯化之前将样品过滤,以去除固体颗粒。在一些实例中,该混合物用水稀释(如至大约10倍),并冷冻以干燥,然后用反相HPLC柱纯化,使用含0.1%TFA的乙腈-水梯度。在其他实例中,该混合物最初通过组氨酸标签亲和色谱法和反相色谱法纯化,以除去盐、载体蛋白、未消化的融合蛋白以及非特异性消化的肽。最后,将纯的肽冻干,并由质谱进行确认。
表1列出了下文示例的一些重组肽,它们在本发明中已经被表达。数据显示,目前表达系统可以高效地、高产量地产生纯肽。
表1所表达的重组肽的实例
术语“分离的”或“纯化的”物质指的是大体上或基本上不含在其天然状态正常与其共存的组分的物质。例如,这指原始分离的DNA片段,不排除其他分离的蛋白、基因或者人工后加入的编码区。纯度和均匀度通常用化学分析技术例如聚丙烯酰胺凝胶电泳或高效液相色谱确定。如果蛋白是制品中的主要成分,那么它就是基本纯化的。分离的核酸是与位于基因侧翼且编码所述基因之外的蛋白的其他开放阅读框分离。
本文使用的“分离的”或“纯化的”蛋白或其生物活性部分基本上不含细胞物质或用于获取所述目标蛋白的细胞或组织源中的其它污染蛋白,或者基本不含化学合成时的化学前体或其他化学物。词组“基本不含细胞物质”包括这样的融合蛋白或目标蛋白的制品,即其中所述蛋白已经从其被分离或重组产生的细胞的细胞组分分离。在一个实施方案中,词组“基本不含细胞物质”包括目标蛋白制品,其含有低于约30%(干重)的非目标蛋白(在本文中也称为“污染蛋白”),更优选低于约20%的非目标蛋白,还更优选低于约10%的非目标蛋白。最优选低于约5%的非目标蛋白。当所述目标蛋白或其生物活性部分是重组生产时,还优选基本上不含培养基,即培养基含量要约少于约20%,更优选少于约10%,最优选少于约5%的蛋白制品的体积。在实施方案中,所述优化的目标蛋白为至少为80%,至少90%,至少95%,或至少98%。
本发明还涉及编码本发明中所述的融合蛋白的核酸。获得该编码所述融合蛋白的核酸可以通过使用已知的任何方法获得(例如,通过使用可与所述序列的3'和5'末端杂交的合成引物的PCR扩增,和/或通过使用所述给定基因需要特异的寡核苷酸序列从cDNA或基因组文库克隆)。
对于所述目标蛋白的重组表达,含有编码该蛋白全部或部分的核苷酸序列的核酸可被插入合适的表达载体中(即包含对所插入的肽编码序列进行转录和翻译的必需元件的载体)。在一些实施方案中,所述调节元件是异源的(即不是其天然基因启动子)。或者,所述必要的转录和翻译信号也可以由所述基因和/或它们的两侧区域的天然启动子提供。
多种宿主载体系统可用于表达所述一个或多个肽编码序列的。这些宿主载体系统包括(但不限于):(ⅰ)被牛痘病毒、腺病毒等感染的哺乳动物细胞系统;(ⅱ)感染杆状病毒等的昆虫细胞系统;(ⅲ)含有酵母载体的酵母;或(iv)感染噬菌体、DNA、质粒DNA、粘粒DNA的细菌。根据所用的宿主载体系统,可以使用大量的合适转录和翻译元件的任何一个。
表达载体内的启动子/增强子可以利用植物、动物、昆虫或真菌的调控序列,如本发明所提供的。例如,可以使用来自酵母和其它真菌的启动子/增强子元件(如GAL4启动子、醇脱氢酶启动子、磷酸甘油激酶启动子、碱性磷酸酶启动子)。或者或另外,它们可以包括动物转录调控区,例如:(i)胰岛β细胞内有活性的胰岛素基因控制区(参见例如Hanahan,etal.,1985.Nature 315:115122);(ii)淋巴样细胞内有活性的免疫球蛋白基因控制区(参见例如Grosschedl,et al.,1984.Cell 38:647658);(iii)肝内有活性的白蛋白基因控制区(参见例如Pinckert,et al.,1987.Genes and Dev 1:268276);(iv)脑少突胶质细胞内有活性的本髓鞘碱性蛋白基因控制区(参见例如Readhead,et al.,1987.Cell 48:703712);以及(v)下丘脑内有活性的促性腺激素释放激素基因控制区(参见例如Mason,et al.,1986.Science 234:13721378),等等。
表达载体或它们的衍生物包括,例如人或动物病毒(如牛痘病毒或腺病毒)、昆虫病毒(例如,杆状病毒)、酵母载体、噬菌体载体(例如λ噬菌体)、质粒载体和粘粒载体。
可以选择这样的宿主细胞株,即其调节插入的目标序列的表达,或按照所需的具体方式对所述序列编码的表达肽进行修饰或加工。另外,在选择的宿主株中在存在某些诱导剂下可以增强某些启动子的表达,从而有利于对基因工程肽表达的控制。此外,对于表达的肽的翻译和翻译后的加工和修饰(例如,糖基化、磷酸化等),不同的宿主细胞具有特征的或特性的机制。因此可以选择合适的细胞系或宿主系统,以确保实现外源肽的所需的修饰和加工。例如,细菌系统内的肽表达可用于产生非糖基化的核心肽。而在哺乳动物细胞内表达可确保外源肽的“天然的”糖基化。
如上所述,本发明还包括用作载体蛋白的sfGFP的衍生物、片段、同系物、类似物和变体,以及编码这些蛋白或多肽的核酸。对于核酸而言,本文提供的衍生物、片段和类似物被定义为至少有6个(连续的)核酸的序列,并且其具有足够的长度以进行特异性杂交。对于氨基酸而言,本文提供的衍生物、片段以及类似物被定义为至少含有4个(连续的)氨基酸的序列,其长度足以进行表位的特异性识别。
所述片段的长度应小于sfGFP或编码其的核酸所源自的相应全长核酸或多肽的长度。如果衍生物或类似物包含修饰的核酸或氨基酸,所述衍生物和类似物可以是全长的也可以不是全长的。sfGFP的衍生物或类似物包括,例如包括大体上与该蛋白同源的区域的分子,在多个实施方案中,当与比对序列进行对比时,在氨基酸序列上至少约30%、50%、70%、80%、95%、98%或甚至99%的同一性,其中比对通过本领域中已知的计算机同源性程序进行。例如,计算序列同一性可以使用序列分析软件(Sequence Analysis SoftwarePackage of the Genetics Computer Group,University of Wisconsin BiotechnologyCenter,1710 University Avenue,Madison,Wis.53705)来测量,采用其默认参数。
在多肽序列与参照序列的同一性小于100%的情况下,所述不同位置优选是参照序列的保守替换,但不是必须的。保守替换通常包括以下组内的替换:甘氨酸和丙氨酸;缬氨酸、异亮氨酸和亮氨酸;天冬氨酸和谷氨酸;天冬酰胺和谷氨酰胺;丝氨酸和苏氨酸;赖氨酸和精氨酸;以及苯丙氨酸和酪氨酸。因此,本发明包括这样的肽,即其具有突变序列,使得它们保持与具有相应亲本序列的蛋白同源,例如在序列上、在功能上以及在抗原性或其它功能上。例如,这种突变可以是涉及保守氨基酸改变的突变,如广义上相似分子性质的氨基酸之间的改变。例如,脂肪族丙氨酸、缬氨酸、亮氨酸和异亮氨酸内的互换可以认为是保守的。有时甘氨酸替换其中一个也可以被认为是保守的。其他保守互换包括脂肪族天冬氨酸和谷氨酸的替换;酰胺基族天冬酰胺和谷氨酰胺的替换;羟基氨基酸丝氨酸和苏氨酸的替换;芳香族氨基酸苯丙氨酸、酪氨酸和色氨酸的替换;碱性氨基酸赖氨酸、精氨酸和组氨酸的替换;含硫氨基酸甲硫氨酸和半胱氨酸的替换。有时甲硫氨酸和亮氨酸的替换也可以认为是保守的。优选的保守替换组是天冬氨酸-谷氨酸;天冬酰胺-谷氨酰胺;缬氨酸-亮氨酸-异亮氨酸;丙氨酸-缬氨酸;苯丙氨酸-酪氨酸;和赖氨酸-精氨酸。
在具体多肽被认为与确定长度的参照多肽有具体同一性百分比时,所述同一性百分比是相对于所述参照肽的。因此,与100个氨基酸长的参照肽链有50%同一性的肽可以是与所述参照肽的50个氨基酸长度部分完全相同的50个氨基酸多肽。它也可能是一个100个氨基酸长的多肽,与参考多肽在其全长上有50%相同。当然,其它多肽也会满足相同的标准。
在实施方案中,本发明的载体蛋白具有与SEQ ID NO:1至少80%(例如,至少85%,至少90%,至少95%,或至少97%)相同的序列。在实施方案中,本发明的融合蛋白包括目标蛋白和具有与SEQ ID NO:1至少80%(例如,至少85%,至少90%,至少95%,或至少97%)的序列的载体蛋白。在实施方案中,编码所述融合蛋白核酸包括。
本发明还包括所公开的多核苷酸或肽的等位变体;即天然产生的所述分离多核苷酸的替换形式,它们也编码与所述多核苷酸编码的肽相同的、同源或相关的肽。或者,非天然存在的变体可以通过诱变技术或直接合成来产生。
所公开的多核苷酸和肽的物种的同系物也由本发明提供。“变体”是指这样的多核苷酸或多肽,即其与本发明的多核苷酸或多肽不同,但保持它们基本的性质。通常,变体是极其相似的,并且许多区域与本发明的多核苷酸或多肽是相同的。所述变体可以含有编码区、非编码区或两者中的突变。
在一些实施方案中,改变的序列包括这样的插入物,即其使得总的氨基酸序列变长,而蛋白保持转运特性。此外,改变的序列可以包括这样的随机的或设计的内部缺失,即其使得整个氨基酸序列缩短,而蛋白保持运输特性。
本文引用的出版物和专利文件都通过引用并入本文,如同每个出版物或文件都被具体地和单独地指出通过引用并入本文一样。引用出版物和专利文件的目的不是承认任何属于现有技术,也不构成任何承认其内容或日期。本发明现在已经通过书面描述的形式进行描述,本领域技术人员应认识到,本发明可以以多种实施方案来实施,而前面的描述和下面的实施例是为了说明而不是限制后面权利要求。
实施例
实施例1.构建表达载体pSFGFPN-NcoI。
本发明中所有的质粒的构建都按照标准的克隆方法和QuikChange定点突变方法,使用新英格兰生物实验室的高保真DNA聚合酶。所有构建的质粒的序列都通过DNA测序进行验证。所有的寡核苷酸引物是从整合DNA技术公司(Integrated DNA Technologies)购买。
质粒pSFGFPN-NcoⅠ含有编码超折叠绿色荧光蛋白的经密码子优化的基因,所述超折叠绿色荧光蛋白C-末端有6x组氨酸标签。还有NcoⅠ限制性内切酶切位点,它与所述超折叠绿色荧光蛋白基因的编码核苷酸的前两个氨基酸重叠。生成这个位点是用于后续将目标肽基因克隆到质粒中,从而与超折叠绿色荧光蛋白在其C-末端形成融合基因。为了构建pSFGFPN-NcoI,两个寡核苷酸引物
5'-ATTAACCATGGTTAGCAAAGGTG-3'和5'-
GATCTCGAGCTTTAATGGTGATGATGATGGTGGCTGCCTTTATACAG-3',用于使用聚合酶链反应(PCR)扩增合成的超折叠绿色荧光蛋白DNA。第一引物含有NcoⅠ限制性内切酶切位点;所述第二引物包含XhoI限制性内切酶切位点。SEQ ID NO:2所示的所述超折叠绿色荧光蛋白DNA由Epoch Biolabs公司合成,并被密码子优化,用于在大肠杆菌中有效翻译所编码的超折叠绿色荧光蛋白。将PCR扩增的DNA用NcoI和XhoI限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割,使用Qiagen凝胶提取试剂盒进行提取。然后,将所提取的消化的DNA使用T4 DNA连接酶连接到预切的pBAD/Myc-HisA载体(来自Invitrogen公司)上。通过NcoI和XhoI限制性内切酶消化pBAD/Myc-His A获得所述预切的pBAD/Myc-His A载体,并使用Qiagen PCR清洗试剂盒进行清洗。然后,将所述连接的产物以化学法转化Top10细胞中。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的溶菌肉汤(LB)平板上过夜。挑取5个活菌落,在5ml液体LB培养基中培养,用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后,所述提取的质粒使用两个测序寡核苷酸引物进行测序
5'-CCTACCTGACGCTTTTTATCGCAACTC-3',和
5'-GGCTGAAAATCTTCTCTCATCCGCC-3',以确认正确插入。最终得到的质粒被命名为pSFGFPN-NcoⅠ。
实施例2:构建表达载体pSFGFPC-MCS。
质粒pSFGFPC-MCS含有编码超折叠绿色荧光蛋白的密码子优化的基因,所述超折叠绿色荧光蛋白有N-末端6x组氨酸标签。在所述超折叠绿色荧光蛋白基因的C-末端还有多克隆位点(MCS),包含XhoI、BglⅡ、PstⅠ、KpnI、EcoRI和HindIII的限制性内切酶切位点。生成这个多克隆位点用于后续将目标肽基因克隆到所述质粒中,以与超折叠绿色荧光蛋白在其N-末端形成融合基因。为了获得pSFGFPC-MCS,两个引物5'-ACCATGGTTCACCATCATCATCACCATGCGGCGAGCAA-3'和
5'-ATCTCGAGCTTTATACAGTTCATCCATA-3'被用于使用PCR扩增相同的超折叠绿色荧光蛋白DNA。第一引物含有NcoⅠ限制性内切酶切位点;第二引物含有XhoI限制性内切酶切位点。将PCR扩增的DNA用NcoI和XhoI限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割,使用Qiagen凝胶提取试剂盒进行提取。然后,将所提取的消化DNA使用T4 DNA连接酶连接到预切的pBAD/Myc-His A载体(来自Invitrogen公司)上。通过NcoI和XhoI限制性内切酶消化pBAD/Myc-His A获得所述预切的pBAD/Myc-His A载体,并使用Qiagen PCR清洗试剂盒进行清洗。然后,将所述连接的产物以化学法转化Top10细胞中。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落,在5ml液体LB培养基中培养,用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后,所述提取的质粒使用两个测序寡核苷酸引物进行测序
5'-CCTACCTGACGCTTTTTATCGCAACTC-3'
和5'-GGCTGAAAATCTTCTCTCATCCGCC-3',以确认正确插入。最终得到的质粒被命名为pSFGFPC-MCS。
实施例3:构建表达载体pSFGFPN-prolispro。
表达载体pSFGFPN-prolispro包含编码人胰岛素类似物赖脯胰岛素的前体蛋白(prolispro;其氨基酸序列如SEQ ID NO:7所示)的基因,所述前体蛋白与超折叠绿色荧光蛋白的N-末端融合,所述超折叠绿色荧光蛋白还有C-末端的6x组氨酸标签。在prolispro基因的前面,插入三肽Met-Ala-Arg编码序列,为的是后续容易地以胰蛋白酶裂解该三肽。在prolispro和超折叠绿色荧光蛋白之间的连接肽是八肽Arg-Glu-Asn-Leu-Tyr-Phe-Gln-Gly。该八肽既可以在Arg之后被胰蛋白酶水解,也可以在Gln-Gly之间被TEV蛋白酶水解。该八肽的DNA序列也被密码子优化,用于在大肠杆菌中有效翻译。为了构建pSFGFPN-prolispro,两个引物5'-GAATTAACCATGGCGCGTTTCGTTAACCAACACCTG-3'和
5'-AACCCATGGCTCCCTGAAAATACAGGTTTTCACGATTACAGTAATTTTC-3'被用于使用PCR扩增合成的prolispro DNA。两个引物都含有NcoⅠ限制性内切酶切位点。所述合成的Prolispro DNA由Epoch Biolab公司提供,SEQ ID NO:8所示的其序列被优化,用于在大肠杆菌中有效翻译。将所述PCR扩增的DNA用NcoⅠ限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割,使用Qiagen凝胶提取试剂盒进行提取。然后,将所提取的消化的DNA使用T4 DNA连接酶连接到预切的psfGFPN-NcoI载体上。通过以NcoI和DpnI限制性内切酶消化psfGFPN-NcoI三小时获得所述预切的psfGFPN-NcoI载体,并使用Qiagen PCR清洗试剂盒清洗进行清洗。然后,将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落,在5ml液体LB培养基中培养,用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后,所提取的质粒使用测序寡核苷酸引物5'-CCTACCTGACGCTTTTTATCGCAACTC-3'进行测序,以确认正确插入。最终得到的质粒被命名为pSFGFPN-prolispro。在该质粒中,所述融合基因编码具有如SEQ ID NO:9所示的序列的融合蛋白,具有如SEQ ID NO:10所示的DNA序列。
实施例4:构建表达载体pSFGFPN-proinsulin。
表达载体pSFGFPN-proinsulin含有编码人胰岛素前体蛋白(胰岛素原;其氨基酸序列如SEQ ID NO:11所示,其核苷酸序列如SEQ ID NO:12所示)的基因,所述前体蛋白与超折叠绿色荧光蛋白的N-末端融合,所述超折叠绿色荧光蛋白还有C-末端的6x组氨酸标签。在所述胰岛素原基因的前面,插入三肽的Met-Ala-Arg编码序列,为的是后续容易地以胰蛋白酶裂解该三肽。在胰岛素原和超折叠绿色荧光蛋白之间的连接肽是八肽Arg-Glu-Asn-Leu-Tyr-Phe-Gln-Gly。该八肽既可以在Arg之后被胰蛋白酶水解,也可以在Gln-Gly之间被TEV蛋白酶水解。该八肽的DNA序列也被密码子优化,用于在大肠杆菌中有效翻译。为了构建pSFGFPN-proinsulin,将两个引物5'-CCGAAAACTCGTCGCGAAGCAGAGG-3'
和5'-AGTATAGAAGAAGCCACGTTCACC-3'用于使用PCR扩增表达载体pSFGFPN-proinsulin。使用T4多核苷酸激酶将PCR扩增的DNA磷酸化,然后通过DpnI限制性内切酶消化,以除去原始的pSFGFPN-proinsulin。最终消化的DNA通过琼脂糖电泳进行分离。将所需的条带切割,并使用Qiagen凝胶提取试剂盒进行提取。然后,将所提取的DNA使用T4 DNA连接酶连接到其自身。然后,将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落,在5ml液体LB培养基中培养,用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后,将所述提取的质粒使用测序寡核苷酸引物5'-CCTACCTGACGCTTTTTATCGCAACTC-3'进行测序,以确认正确插入。最终得到的质粒被命名为pSFGFPN-proinsulin。在该质粒中,所述融合基因编码具有如SEQ ID NO:13所示的序列的融合蛋白,具有如SEQ ID NO:14的DNA序列。
实施例5:构建表达载体pSFGFP-proglargine。
表达载体pSFGFPN-proglargine包含编码人胰岛素类似物甘精胰岛素(glargine)的前体蛋白(proglargine;其氨基酸序列如SEQ ID NO:15所示,其核苷酸序列如SEQ IDNO:16所示)的基因,所述前体蛋白与超折叠绿色荧光蛋白的N-末端融合,所述超折叠绿色荧光蛋白有C-末端的6x组氨酸标签。在胰岛素原基因的前面,插入三肽Met-Ala-Arg编码序列,为的是后续容易地以胰蛋白酶裂解该三肽。在proglargin和超折叠绿色荧光蛋白之间的连接肽是八肽Arg-Glu-Asn-Leu-Tyr-Phe-Gln-Gly。该八肽既可以在Arg之后被胰蛋白酶水解,也可以在Gln-Gly之间被TEV蛋白酶水解。该八肽的DNA序列也被密码子优化,用于在大肠杆菌中有效翻译。为了构建pSFGFPN-proglargine,将两个引物5'-CGTGAAAACCTGTATTTTCAGG-3'和5'-GCCACAGTAATTTTCCAGCTTATAC-3'用于使用PCR扩增表达载体pSFGFPN-proglargine。使用T4多核苷酸激酶将PCR扩增的DNA磷酸化,然后通过DpnI限制性内切酶消化,以除去原始的pSFGFPN-proinsulin。最终消化的DNA通过琼脂糖电泳进行分离。将所需的条带切割,并使用Qiagen凝胶提取试剂盒进行提取。然后,将所述提取的DNA使用T4 DNA连接酶连接到其自身。然后,将所述连接的产物以化学法转化Top10细胞。挑取5个活菌落,在5ml液体LB培养基中培养,用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后,将所提取的质粒使用测序寡核苷酸引物5'-CCTACCTGACGCTTTTTATCGCAACTC-3'进行测序,以确认正确插入。最终得到的质粒被命名为pSFGFPN-proglargine。在该质粒中,所述融合基因编码具有如SEQ ID NO:17所示的序列的融合蛋白,具有如SEQ ID NO:18的DNA序列。
实施例6:构建表达载体pSFGFPC-PTH。
表达载体pSFGFPC-PTH包含编码PTH(其氨基酸序列如SEQ ID NO:19所示,其核苷酸序列如SEQ ID NO:20所示)的基因,所述PTH与超折叠绿色荧光蛋白的C-末端与融合,所述超折叠绿色荧光蛋白还有N-末端6x组氨酸标签。超折叠绿色荧光蛋白和PTH之间的连接肽是六肽Glu-Asn-Leu-Tyr-Phe-Gln。该六肽可以被识别,并通过TEV蛋白酶在Gln后水解。此六肽的DNA序列也被密码子优化,用于在大肠杆菌中有效翻译。为了构建pSFGFPC-PTH载体,将两个引物5'-ACCTCGAGATGAAAACCTGTATTTTCAGTCTGTTTCTGAAA-3'
和5'-TCTAATTCCCTTAGAAGTTGTTAAGCTCCTG-3'用于使用PCR的扩增合成的PTH基因。所述第一引物包含XhoI限制性内切酶切位点;所述第二引物包含EcoRⅠ限制性内切酶切位点。合成的PTH基因由Epoch Biolabs公司提供,并且序列被优化,用于在大肠杆菌中有效翻译。将所述PCR扩增的DNA用XhoI和EcoRI限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割,并使用Qiagen凝胶提取试剂盒提取。然后,将所提取的消化DNA使用T4 DNA连接酶连接到预切psfGFPC-MCS载体上。通过XhoI和EcoRI限制性内切酶消化psfGFPC-MCS三小时得到预切的psfGFPC-MCS载体,并使用Qiagen PCR清洗试剂盒进行清洗。然后,将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落,在5mlLB液体培养基中培养,用于使用Qiagen凝胶提取试剂盒进行质粒提取。所述提取的质粒使用测序寡核苷酸引物5'--GGCTGAAAATCTTCTCTCATCCGCC-3'进行测序,以确认正确插入。最终得到的质粒被命名为pSFGFPC-PTH。在该质粒中,所述融合基因编码具有如SEQ ID NO:21所示序列的融合蛋白,具有如SEQ ID NO:22的DNA序列。
实施例7:构建表达载体pSFGFPC-calcitonin。
表达载体pSFGFPC-calcitonin包含编码鲑鱼降钙素(其氨基酸序列如SEQ ID NO:23所示,其核苷酸序列如SEQ ID NO:24所示)的基因,所述鲑鱼降钙素与超折叠绿色荧光蛋白的C-末端融合,所述超折叠绿色荧光蛋白还有N-末端6x组氨酸标签。超折叠绿色荧光蛋白和降钙素之间的连接肽是六肽Glu-Asn-Leu-Tyr-Phe-Gln。该六肽可以被识别,并通过TEV蛋白酶在Gln后水解。此六肽的DNA序列也被密码子优化,用于在大肠杆菌中有效翻译。为了构建pSFGFPC-calcitonin,将两个引物
5'-AGCTCGAGATGAAAACCTGTATTTTCAGTGCTCTGCGCTGTC-3'
和5'-TCGAATTCCCTTACGGGGTACCAGA-3'用于使用PCR扩增合成的降钙素基因。所述第一引物包含XhoI限制性内切酶切位点;所述第二引物包含EcoRI限制性内切酶切位点。合成的降钙素DNA由Epoch Biolabs公司提供,并且序列被优化用于在大肠杆菌中有效表达。将所述PCR扩增的DNA以XhoI和EcoRI限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳分离。将所述消化的DNA的所需条带切割,并使用Qiagen凝胶提取试剂盒进行提取。然后,将所提取的消化DNA使用T4 DNA连接酶连接到预切psfGFPC-MCS载体。通过以XhoI和EcoRI限制性内切酶消化psfGFPC-MCS三小时得到预切的psfGFPC-MCS载体,并使用QiagenPCR清洗试剂盒进行清洗。然后,将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落,在5 ml液体LB培养基中培养,用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后,将所述提取的质粒使用测序寡核苷酸引物
5'-GGCTGAAAATCTTCTCTCATCCGCC-3'进行测序,以确认正确插入。最终获得的质粒被命名为pSFGFPC–calcitonin。在该质粒中,所述融合基因编码具有如SEQ ID NO:25所示的序列的融合蛋白,具有如SEQ ID NO:26的DNA序列。
实施例8:构建表达载体pSFGFPC-GLP1。
表达载体pSFGFPC-GLP1含有编码GLP-1(其氨基酸序列如SEQ ID NO:27所示,其核苷酸序列如SEQ ID NO:28所示)的基因,所述GLP-1与超折叠绿色荧光蛋白的C-末端融合,所述超折叠绿色荧光蛋白还有N-末端的6x组氨酸标签。超折叠绿色荧光蛋白和PTH之间的连接肽是六肽Glu-Asn-Leu-Tyr-Phe-Gln。该六肽可以被识别,并被TEV蛋白酶在Gln残基后水解。此六肽的DNA序列也被密码子优化,用于在大肠杆菌中有效翻译。为了构建pSFGFPC-GLP1,将两个引物5'-AGCTCGAGATGAAAACCTGTATTTTCAGCACGGTGGTGGTAC-3'
和5'-TCGAATTCCCTTAAGACGGCGGCGGCGCACC-3'用于使用PCR扩增合成的GLP-1基因。所述第一引物包含XhoI限制性内切酶切位点;所述第二引物包含EcoRⅠ限制性内切酶切位点。所述合成的GLP-1 DNA由Epoch Biolabs公司提供,并且所述序列被优化用于在大肠杆菌中有效翻译。将所述PCR扩增的DNA以XhoI和EcoRI限制性内切酶消化三个小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割,并使用Qiagen凝胶提取试剂盒进行提取。然后,将所提取的消化的DNA使用T4 DNA连接酶连接到预切的psfGFPC-MCS载体。通过以XhoI和EcoRI限制性内切酶消化psfGFPC-MCS三小时得预切的psfGFPC-MCS载体,并使用Qiagen PCR清洗试剂盒进行清洗。然后,将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落,在5ml液体LB培养基中培养,用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后,将所述提取的质粒使用测序寡核苷酸引物
5'-GGCTGAAAATCTTCTCTCATCCGCC-3'进行测序,以确认正确插入。最终得到的质粒被命名为pSFGFPC-GLP-1,在该质粒中,所述融合基因编码具有如SEQ ID NO:29所示的序列的融合蛋白,具有如SEQ ID NO:30的DNA序列。
实施例9:prolispro的表达。
为了表达prolispro-sfGFP蛋白,将经测序确认的psfGFPN-prolispro质粒以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落,在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后,将所述过夜培养物接种到含有100μg/ml的氨苄青霉素的1L 2YT培养基中,并于37℃培养,直到OD600为0.7。然后,向所述培养基中加入20%阿拉伯糖溶液至0.2%的终浓度,以诱导所述融合蛋白的表达。将所述细胞继续培养22小时,然后离心(4500rpm,20min,4℃)收集。经诱导后3小后,整个细胞培养物变成了绿色。最后收集的细胞沉淀物即使在日光下也表现出强的荧光,这表明prolispro-sfGFP融合蛋白表达量在非常高的水平。
将所收集的细胞悬浮于20ml裂解缓冲液(50mM HEPES,pH 7.4、500mM NaCl、10mMDTT、10%甘油、0.1%的Triton X-100、5mM咪唑和1μg/ml溶菌酶)。将所述悬浮细胞超声处理,并使裂解物通过离心(10200rpm,60min,4℃)变澄清。上清液和细胞碎片的后SDS-PAGE分析表明:大部分的融合蛋白是以不溶形式的包涵体表达的,因此,发明人接着进行包涵体纯化方案,以纯化表达的prolispro-sfGFP融合蛋白。弃去上清液,将沉淀物重新悬浮于40ml洗涤缓冲液中,所述洗涤缓冲液含有50mM Tris-盐酸(pH8.0)、100 mM NaCl、0.1%NaN3和0.5%的Triton-X 100,并再次离心(10200rpm,20min,4℃)。此后,弃去上清液,将沉淀物再在不含Triton-X-100的相同40ml的洗涤缓冲液重新悬浮,并离心(10200rpm,20min,4℃)。将该过程再重复两次。SDS-PAGE分析表明为相当纯的包涵体。将最后的沉淀物重新悬浮在8M尿素,然后使用Ni-NTA树脂在变性条件下进行纯化。该prolispro-sfGFP融合蛋白的最终确定表达水平为1.5g/L,这相当于350mg/L的prolispro。还测试了prolispro-sfGFP融合蛋白表达的时间依赖。收集诱导4小时和21小时的细胞,然后纯化它们的包涵体。图5显示出了在两种情况下的相对表达水平。显而易见的是,21小时诱导得到了表达量要高得多的prolispro-sfGFP融合蛋白。
实施例10:对prolispro-sfGFP融合蛋白进行加工,以获得成熟的赖脯胰岛素。
为了获得成熟的赖脯胰岛素,对所述prolispro-sfGFP融合蛋白使用快速重折叠方法进行重折叠。将所述Ni-NTA纯化的prolispro-sfGFP存储在8M尿素和10mM Tris-HCl(pH为9.2)。然后,将含有10mM Tris-HCl(pH 9.2)、10mM甘氨酸、1mM EDTA和4.5mM胱氨酸的重折叠缓冲液缓慢加入到prolispro-sfGFP溶液中,达到1:1的最终体积比。接着,将半胱氨酸加入到上述溶液中,至0.5mM的终浓度,并通过反转管2-3次轻轻的混合,然后将管置于孵育箱中,不加搅拌在30℃下维持45min。在胱氨酸和半胱氨酸的存在下形成二硫键,引导prolispro的正确折叠。然后进行过夜透析,将所述折叠的prolispro-sfGFP蛋白的缓冲液改变为消化缓冲液(50mM Tris-HCl,pH 9.0)。
透析后,收集所述prolispro-sfGFP溶液,并浓缩至1mg/ml,然后用胰蛋白酶(E/S:1:600,W/W)和羧肽酶B(E/S:1:600,W/W)在4℃下消化5小时。然后,加入0.5μg/ml亮抑酶肽以终止消化反应。图6是显示了prolispro-sfGFP蛋白用胰蛋白酶和羧基肽酶B消化之前和之后的SDS-PAGE凝胶。所述凝胶清楚地显示了由prolispro-sfGFP融合蛋白变成赖脯胰岛素的所需过程。所述凝胶中的赖脯胰岛素带与市售胰岛素的带清楚地匹配。所述凝胶还显示了正确的折叠过程。另一方面,胰蛋白酶也识别B链中的精氨酸残基,得到了小得多的消化产物条带。
然后,将prolispro-sfGFP融合蛋白的胰蛋白酶和羧肽酶B消化的产物相对于含50mM磷酸钠(pH 8)的缓冲液透析,然后上柱在Sephedex G-25凝胶过滤柱(来自GEHealthcare)。使用相同缓冲液将不同消化产物从所述柱中洗脱。收集含有赖脯胰岛素的级分,并浓缩至1mg/ml。最终获得的纯赖脯胰岛素的产率大约为200mg/L。对所述纯化的赖脯胰岛素进行MALDI-TOF质谱分析。在图7中所示的检测出分子量为5733.6Da,这恰好与理论分子量相符合。
实施例11:proinsulin-sfGFP融合蛋白的表达。
为了表达所述proinsulin-sfGFP融合蛋白,将经测序确认的pSFGFPN-proinsulin的质粒以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落,在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后,将过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L 2YT培养基中,并于37℃培养,直到OD600为0.7。然后,向所述培养基中加入20%阿拉伯糖溶液至0.2%的终浓度,以诱导所述融合蛋白的表达。来自所述包涵体的所述表达的融合蛋白的后续纯化步骤都与prolispro-sfGFP融合蛋白的步骤相同。所述proinsulin-sfGFP融合蛋白的最终确定的表达水平为145mg/L,这对应于约350mg/L的胰岛素原表达水平。
实施例12:proglargine-sfGFP融合蛋白的表达。
为了表达所述proglargine-sfGFP融合蛋白,将经序列确认的psfGFPN-proglargine的质粒用于以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落,在含有100μg/ml的氨苄青霉素的5mlLB培养基中培养过夜。然后,将所述过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L2YT培养基中,并于37℃培养,直到OD600为0.7。然后,向所述培养基中加入20%阿拉伯糖溶液至0.2%的终浓度,以诱导所述融合蛋白的表达。来自所述包涵体的所述表达的融合蛋白的后续纯化步骤都与prolispro-sfGFP融合蛋白的步骤相同。所述proglargine-sfGFP融合蛋白的最终确定的表达水平为140mg/L,这对应于约345mg/L的胰岛素原表达水平。
实施例13:sfGFP-PTH融合蛋白的表达。
为了表达所述sfGFP-PTH融合蛋白,将经测序确认的psfGFPC-PTH质粒用于以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落,在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后,将所述过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L 2YT培养基中,并于37℃培养,直到OD600为0.7。然后,向所述培养基中加入20%阿拉伯糖溶液至0.2%的终浓度,以诱导所述融合蛋白的表达。将所述细胞继续培养16小时,然后通过离心(4500rpm,20min,4℃)收集。
将所述收集的细胞再悬浮于20ml裂解缓冲液(50mM HEPES,pH 7.4、500mM NaCl、10mM DTT、10%甘油、0.1%的Triton X-100、5mM咪唑和1μg/ml溶菌酶)。将所述再悬浮的细胞超声处理,并使裂解物通过离心(10200rpm,60min,4℃)变澄清。上清液和细胞碎片的后续SDS-PAGE分析表明:部分的所述融合蛋白在胞质中以可溶形式表达,部分的所述融合蛋白在包涵体中以不溶性形式表达。由于所述可溶性蛋白容易处理,发明人将所述上清液与Ni-NTA树脂混合,并通过以含有250mM咪唑的裂解缓洗脱所述树脂来纯化所述可溶性融合蛋白。图8显示出了从Ni-NTA树脂洗脱的sfGFP-PTH融合蛋白的不同组分,表明了高纯度。最终得到的sfGFP-PTH融合蛋白的确定的表达产率是600mg/L,这相当于PTH自身60mg/L的表达水平。鉴于部分的所述融合蛋白在包涵体中,所述sfGFP-PTH融合蛋白和PTH的真实表达水平更高。所述纯化的sfGFP-PTH融合物还被TEV蛋白酶消化,以释放PTH。将所述消化的产物用C18柱的反相HPLC进一步分离,使用含0.1%TFA的乙腈-水梯度,以获得纯的PTH。
实施例14:sfGFP-calcitonin融合蛋白的表达。
为了表达所述sfGFP-calcitonin融合蛋白,将经测序确认的psfGFPC-calcitonin质粒用于以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落,在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后,将所述过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L 2YT培养基中,并于37℃培养,直到OD600为0.7。然后,向所述培养基中加入20%阿拉伯糖溶液至0.2%的终浓度,以诱导所述融合蛋白的表达。将所述细胞继续培养16小时,然后通过离心(4500rpm,20min,4℃)收集。
将所述收集的细胞再悬浮于20ml裂解缓冲液中(50mM HEPES,pH 7.4、500mMNaCl、10mM DTT、10%甘油、0.1%的Triton X-100、5mM咪唑和1μg/ml溶菌酶)。将所述再悬浮的细胞超声处理,并使裂解液通过离心(10200rpm,60min,4℃)变澄清。同PTH相似,上清液和细胞碎片的后续SDS-PAGE分析表明:部分的所述融合蛋白在胞质中以可溶形式表达,分的所述融合蛋白在包涵体中以不溶性形式表达。发明人对来自所述上清液的所述融合蛋白进行纯化。将所述上清液与Ni-NTA树脂混合,并通过以含有250mM咪唑的裂解缓洗脱所述树脂来纯化所述可溶性融合蛋白。最终得到的sfGFP-calcitonin融合物的确定的表达产率是500mg/L,这相当于降钙素自身50mg/L的表达水平。通过在不同时间收集细胞并分析来自细胞质的纯化的融合蛋白,还分析了所述融合蛋白表达的诱导时间依赖性。图9显示了约8-10诱导表达水平达到最高。所述纯化的sfGFP-calcitonin融合物也可通过TEV蛋白酶消化以释放降钙素。将所述消化的水解产物使用C18柱上的反相HPLC进一步分离,使用含0.1%TFA的乙腈-水梯度洗脱,能够以获得纯的降钙素。
实施例15:GLP-1的表达。
为了表达所述sfGFP-GLP-1融合蛋白,将经过测序确认的psfGFPC-GLP1质粒通过以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落,在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后,将所述过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L 2YT培养基中,并于37℃培养,直到OD600为0.7。然后,向所述培养基中加入20%阿拉伯糖溶液至0.2%的终浓度,以诱导融合蛋白的表达。将所述细胞继续培养16小时,然后通过离心(4500rpm,20min,4℃)收集。
将所述收集的细胞再悬浮于20ml裂解缓冲液中(50mM HEPES,pH 7.4,、500mM氯化钠,、10mM DTT、10%甘油、0.1%的Triton X-100、5mM咪唑和1μg/ml溶菌酶)。将所述再悬浮的细胞超声处理,使所述裂解液通过离心(10200rpm,60min,4℃)变澄清。与PTH和降钙素类似,所述上清液和所述细胞碎片的后续SDS-PAGE分析表明:部分的所述融合蛋白在胞质中以可溶形式表达,部分的所述融合蛋白在包涵体中以不溶性形式表达。发明人对来自所述上清液的所述融合蛋白进行纯化。将所述上清液与Ni-NTA树脂混合,通过以含有250mM咪唑的裂解缓洗脱所述树脂来纯化所述可溶性融合蛋白。图10所示的所述纯化的融合蛋白的SDS-PAGE分析表明了高纯度。最终得到的sfGFP-GLP-1融合物的确定的表达产率是500mg/L,这相当于GPL-1自身65mg/L的表达水平。所述纯化的sfGFP-GLP-1融合物也可被TEV蛋白酶消化以释放降钙素。将所述消化的产物使用C18柱上的反相HPLC进一步分离,使用含0.1%TFA的乙腈-水梯度以获得纯的降钙素。
通过引用并入
本文提及的每篇专利文件和科学文章的整个公开物都通过引用并入,用于所有目的。
等价物
在背离其原则和基本特征的情况下,本发明能够以其他具体的形式具体实现。因此,前面所述的具体实施方案在所有方面被认为是用于说明,而不是对本文所述发明的限制。因此,本发明的范围不是由前面的描述而是由附加的权利要求书所阐明,并且落在权利要求的等价意义和范围内的所有改变都意欲被包含于其中。
Claims (25)
1.一种融合蛋白,所述融合蛋白包括融合载体蛋白连接至至少一个目标肽,
其中所述融合载体蛋白具有结构式I中列出的氨基酸序列:
T1-A1-T2(I),
其中,T1为不存在、甲硫氨酸、组氨酸标签或者至少一个肽裂解位点;
A1为超折叠绿色荧光蛋白,其氨基酸序列如下:Ser-Lys-Gly-Glu-Glu-Leu-Phe-Thr-Gly-Val-Val-Pro-Ile-Leu-Val-Glu-Leu-Asp-Gly-Asp-Va1-Asn-Gly-His-Lys-Phe-Ser-Val-Arg-Gly-Glu-Gly-Glu-Gly-Asp-Ala-Thr-Asn-Gly-Lys-Leu-Thr-Leu-Lys-Phe-Ile-Cys-Thr-Thr-Gly-Lys-Leu-Pro-Val-Pro-Trp-Pro-Thr-Leu-Val-Thr-Thr-Leu-Thr-Tyr-Gly-Val-Gln-Cys-Phe-Ser-Arg-Tyr-Pro-Asp-His-Met-Lys-Arg-His-Asp-Phe-Phe-Lys-Ser-Ala-Met-Pro-Glu-Gly-Tyr-Val-Gln-Glu-Arg-Thr-Ile-Ser-Phe-Lys-Asp-Asp-Gly-Thr-Tyr-Lys-Thr-Arg-Ala-Glu-Val-Lys-Phe-Glu-Gly-Asp-Thr-Leu-Val-Asn-Arg-Ile-Glu-Leu-Lys-Gly-Ile-Asp-Phe-Lys-Glu-Asp-Gly-Asn-Ile-Leu-Gly-His-Lys-Leu-Glu-Tyr-Asn-Phe-Asn-Ser-His-Asn-Val-Tyr-Ile-Thr-Ala-Asp-Lys-Gln-Lys-Asn-Gly-Ile-Lys-Ala-Asn-Phe-Lys-Ile-Arg-His-Asn-Val-Glu-Asp-Gly-Ser-Val-Gln-Leu-Ala-Asp-His-Tyr-Gln-Gln-Asn-Thr-Pro-Ile-Gly-Asp-Gly-Pro-Val-Leu-Leu-Pro-Asp-Asn-His-Tyr-Leu-Ser-Thr-Gln-Ser-Val-Leu-Ser-Lys-Asp-Pro-Asn-Glu-Lys-Arg-Asp-His-Met-Val-Leu-Leu-Glu-Phe-Val-Thr-Ala-Ala-Gly-Ile-Thr-His-Gly-Met-Asp-Glu-Leu-Tyr-Lys(SEQ ID N0:1),
T2为不存在、组氨酸标签或者至少一个肽裂解位点,条件是T1和T2至多有一个不存在,
其中所述目标肽选自赖脯胰岛素的前体蛋白、人胰岛素前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、降钙素、胰高血糖素样肽、艾塞那肽和利拉鲁肽。
2.权利要求1的融合蛋白,其中所述肽裂解位点选自:Arg-Glu-Asn-Leu-Tyr-Phe-Gln-Gly、Glu-Asn-Leu-Tyr-Phe-Gln。
3.权利要求1的融合蛋白,其中所述组氨酸标签由三个至八个组氨酸残基组成。
4.权利要求1的融合蛋白,其中所述融合蛋白为SEQ ID No:9、13、17、21、25或29的氨基酸序列。
5.权利要求1-3任一项的融合蛋白,其中所述目标肽连接至所述融合载体蛋白的N-末端。
6.权利要求1-3任一项的融合蛋白,其中所述目标肽连接至所述融合载体蛋白的C-末端。
7.权利要求1-3任一项的融合蛋白,还包括在所述融合载体蛋白和所述目标肽之间的肽裂解位点。
8.权利要求1-3任一项的融合蛋白,其中所述融合蛋白是分离的。
9.一种编码权利要求1-7任一项的融合蛋白的核酸。
10.权利要求9的核酸,其中所述核酸为SEQ ID No:10、14、18、22、26或30的序列。
11.权利要求9或10的核酸,其中所述核酸是分离的。
12.一种含有权利要求9或10的核酸的表达载体,所述核酸可操作地连接到用于表达编码所述融合蛋白的所述核酸序列的启动子。
13.权利要求12的表达载体,其中所述启动子是lac启动子、T7启动子、Tac启动子,lamda启动子、pL启动子、trc启动子或pBAD启动子。
14.一种以权利要求12或13的表达载体转化的宿主细胞。
15.权利要求14的宿主细胞,其中所述宿主细胞是大肠杆菌(E.coli)DH5α、DH10b、Top10、BL21、JM101、JM105或者NM522。
16.权利要求14的宿主细胞,其中所述宿主细胞来自于大肠杆菌或枯草芽孢杆菌(B.subtilis)。
17.一种用于产生融合蛋白方法,所述方法包括如下步骤:在适合表达所述表达载体的条件下培养权利要求14-16任一项限定的宿主细胞,从而产生细菌包涵体中的所述核酸编码的融合蛋白。
18.权利要求17的方法,其中所述适合表达所述表达载体的条件包括用于诱导所述宿主细胞表达所述表达载体的诱导剂。
19.权利要求18的方法,其中所述诱导剂是阿拉伯糖、IPTG、萘啶酸或温度。
20.权利要求17的方法,所述方法还包括纯化所产生的融合蛋白的步骤。
21.权利要求20的方法,其中所述纯化步骤包括乙醇沉淀、离子交换、使用Ni-NTA琼脂糖树脂亲和纯化中至少一个。
22.权利要求17的方法,其中对所述融合蛋白进一步进行蛋白水解消化,以从所述融合蛋白释放所述目标肽。
23.权利要求22的方法,其中所述蛋白水解消化通过溴化氰、甲酸或HCl来实现。
24.权利要求22的方法,其中所述蛋白水解消化通过胰蛋白酶、TEV蛋白酶、凝血酶或肠激酶来实现。
25.权利要求22的方法,其中将所述释放的目标肽通过凝胶过滤或HPLC进一步纯化。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261615178P | 2012-03-23 | 2012-03-23 | |
US61/615,178 | 2012-03-23 | ||
PCT/US2013/033702 WO2013142859A2 (en) | 2012-03-23 | 2013-03-25 | Fusion proteins of superfolder green fluorescent protein and use thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104619726A CN104619726A (zh) | 2015-05-13 |
CN104619726B true CN104619726B (zh) | 2018-05-18 |
Family
ID=49223458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380016014.6A Active CN104619726B (zh) | 2012-03-23 | 2013-03-25 | 由超折叠绿色荧光蛋白构成的融合蛋白及其用途 |
Country Status (3)
Country | Link |
---|---|
US (3) | US9714274B2 (zh) |
CN (1) | CN104619726B (zh) |
WO (1) | WO2013142859A2 (zh) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9714274B2 (en) | 2012-03-23 | 2017-07-25 | Suzhou Kunpeng Biotech Co., Ltd. | Fusion proteins of superfolder green fluorescent protein and use thereof |
US9920102B2 (en) | 2015-05-15 | 2018-03-20 | Albert Einstein College Of Medicine, Inc. | Fusion tags for protein expression |
KR101830792B1 (ko) * | 2016-01-27 | 2018-02-21 | 건국대학교 산학협력단 | 항균 펩타이드를 포함하는 불용성 융합단백질 및 이를 이용한 항균 펩타이드의 제조 방법 |
CN106591343B (zh) * | 2016-11-29 | 2020-02-18 | 湖北大学 | 一种超折叠绿色荧光蛋白介导异源蛋白在大肠杆菌中分泌表达方法 |
CL2016003427A1 (es) | 2016-12-30 | 2017-06-23 | Univ Chile | Una secuencia peptídica de una proteína guía para la producción de un péptido de interés; un vector de expresión; una célula huésped; un proceso para para la producción de un péptido de interés. |
CN107916301A (zh) * | 2017-12-05 | 2018-04-17 | 芜湖英特菲尔生物制品产业研究院有限公司 | 一种牛干扰素α生物学活性检测方法 |
CN112469736A (zh) * | 2018-08-01 | 2021-03-09 | 国立大学法人鹿儿岛大学 | 肽融合蛋白质 |
CN109134637B (zh) * | 2018-09-26 | 2021-08-31 | 生工生物工程(上海)股份有限公司 | 荧光蛋白的纯化方法 |
CN111718417B (zh) * | 2019-03-19 | 2022-10-14 | 宁波鲲鹏生物科技有限公司 | 含有荧光蛋白片段的融合蛋白及其用途 |
CN110358770B (zh) * | 2019-07-27 | 2021-08-03 | 福建农林大学 | 一种酵母生物合成芋螺毒素的方法 |
BR102019017792A2 (pt) * | 2019-08-27 | 2021-11-16 | Fundação Oswaldo Cruz | Receptáculo proteico, método para produção do receptáculo, método de identificação de patógenos ou de diagnóstico de doenças, e, uso do receptáculo |
CN110628801A (zh) * | 2019-10-09 | 2019-12-31 | 武汉博欧特生物科技有限公司 | 一种蛋白表达及纯化的方法 |
CN113135990A (zh) * | 2020-01-20 | 2021-07-20 | 宁波鲲鹏生物科技有限公司 | 利拉鲁肽衍生物及其制备方法 |
CN113773391B (zh) * | 2020-06-09 | 2023-10-20 | 宁波鲲鹏生物科技有限公司 | 一种门冬胰岛素的制备方法 |
CN113773392B (zh) * | 2020-06-09 | 2023-04-07 | 宁波鲲鹏生物科技有限公司 | 一种甘精胰岛素的制备方法 |
CN113773399B (zh) * | 2020-06-09 | 2023-05-12 | 宁波鲲鹏生物科技有限公司 | 一种甘精胰岛素衍生物及其应用 |
CN113773400B (zh) * | 2020-06-09 | 2023-08-18 | 宁波鲲鹏生物科技有限公司 | 一种门冬胰岛素衍生物及其应用 |
CN113773398B (zh) * | 2020-06-10 | 2023-05-23 | 宁波鲲鹏生物科技有限公司 | 一种德谷胰岛素衍生物及其应用 |
CN113773397B (zh) * | 2020-06-10 | 2023-10-20 | 宁波鲲鹏生物科技有限公司 | 一种德谷胰岛素的制备方法 |
CN113773395A (zh) * | 2020-06-10 | 2021-12-10 | 宁波鲲鹏生物科技有限公司 | 一种地特胰岛素的制备方法 |
CN113773396A (zh) * | 2020-06-10 | 2021-12-10 | 宁波鲲鹏生物科技有限公司 | 一种地特胰岛素衍生物及其应用 |
JP2023529486A (ja) * | 2020-06-11 | 2023-07-10 | ニンポー クンペン バイオテック カンパニー,リミテッド | セマグルチド誘導体およびその製造方法と使用 |
CN113801233B (zh) * | 2020-06-11 | 2024-03-01 | 宁波鲲鹏生物科技有限公司 | 一种索玛鲁肽的制备方法 |
CN114057886B (zh) * | 2020-07-24 | 2024-03-01 | 宁波鲲鹏生物科技有限公司 | 一种索玛鲁肽衍生物及其制备方法 |
CN113801234B (zh) * | 2020-06-11 | 2024-03-01 | 宁波鲲鹏生物科技有限公司 | 一种索玛鲁肽衍生物及其应用 |
CN113801236A (zh) * | 2020-06-11 | 2021-12-17 | 宁波鲲鹏生物科技有限公司 | 一种赖脯胰岛素的制备方法 |
CN113801235A (zh) * | 2020-06-11 | 2021-12-17 | 宁波鲲鹏生物科技有限公司 | 一种赖脯胰岛素衍生物及其应用 |
CN114075523A (zh) * | 2020-07-27 | 2022-02-22 | 宁波鲲鹏生物科技有限公司 | 一种产甘精胰岛素融合蛋白的重组大肠杆菌发酵培养方法 |
US20220184204A1 (en) * | 2020-09-14 | 2022-06-16 | Ming-Chung KAN | Self-assembled protein nanoparticle and its applications thereof |
WO2022178113A1 (en) * | 2021-02-17 | 2022-08-25 | The Trustees Of Columbia University In The City Of New York | Probiotic-guided car-t cells for tumor targeting |
CN117347621B (zh) * | 2023-08-25 | 2024-03-12 | 广东省农业科学院农业生物基因研究中心 | 一种用蛋白模拟抗原-纳米抗体检测黄曲霉毒素b1的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7390639B2 (en) * | 2002-08-09 | 2008-06-24 | National Research Council Of Canada | Staphylococcal nuclease fusion proteins for the production of recombinant peptides |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6803188B1 (en) * | 1996-01-31 | 2004-10-12 | The Regents Of The University Of California | Tandem fluorescent protein constructs |
DE69836075T2 (de) * | 1997-04-25 | 2007-06-06 | SemBioSys Genetics, Inc., Calgary | Verfahren zur spaltung von fusionproteinen |
US7390640B2 (en) * | 2005-02-22 | 2008-06-24 | Los Alamos National Security, Llc | Circular permutant GFP insertion folding reporters |
AU2009243187C1 (en) * | 2008-04-28 | 2015-12-24 | President And Fellows Of Harvard College | Supercharged proteins for cell penetration |
US9714274B2 (en) | 2012-03-23 | 2017-07-25 | Suzhou Kunpeng Biotech Co., Ltd. | Fusion proteins of superfolder green fluorescent protein and use thereof |
-
2013
- 2013-03-25 US US14/387,456 patent/US9714274B2/en active Active
- 2013-03-25 CN CN201380016014.6A patent/CN104619726B/zh active Active
- 2013-03-25 WO PCT/US2013/033702 patent/WO2013142859A2/en active Application Filing
-
2017
- 2017-06-29 US US15/638,145 patent/US10239922B2/en active Active
-
2019
- 2019-01-29 US US16/260,935 patent/US10662231B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7390639B2 (en) * | 2002-08-09 | 2008-06-24 | National Research Council Of Canada | Staphylococcal nuclease fusion proteins for the production of recombinant peptides |
Non-Patent Citations (3)
Title |
---|
A novel method for high-level production of TEV protease by superfolder GFP tag;Wu X et al;《J Biomed Biotechnol.》;20100223;第2009卷;第1-8页 * |
Expression and use of superfolder green fluorescent protein at high temperatures in vivo: a tool to study extreme thermophile biology.;Cava F;《Environ Microbiol》;20080107;第10卷(第3期);605-613 * |
GenBank:HQ873313.1;Equbal,M.J.;《NCBI》;20110209;1 * |
Also Published As
Publication number | Publication date |
---|---|
WO2013142859A2 (en) | 2013-09-26 |
US20150051374A1 (en) | 2015-02-19 |
US9714274B2 (en) | 2017-07-25 |
US10239922B2 (en) | 2019-03-26 |
US20180016310A1 (en) | 2018-01-18 |
US20190144512A1 (en) | 2019-05-16 |
CN104619726A (zh) | 2015-05-13 |
WO2013142859A3 (en) | 2013-12-27 |
US10662231B2 (en) | 2020-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104619726B (zh) | 由超折叠绿色荧光蛋白构成的融合蛋白及其用途 | |
EP0305500B1 (en) | Process for the purification of recombinant polypeptides | |
US5013653A (en) | Product and process for introduction of a hinge region into a fusion protein to facilitate cleavage | |
EP2787083B1 (en) | Efficient production of peptides | |
WO2022241831A1 (zh) | 多肽的制备方法 | |
JP2021512157A (ja) | グルカゴンペプチドの製造 | |
WO2018136572A1 (en) | Expression construct and method for producing proteins of interest | |
JP7266325B2 (ja) | 蛍光タンパク質フラグメントを含む融合タンパク質およびその用途 | |
JP4088584B2 (ja) | 融合タンパク質から目的タンパク質を分離する方法。 | |
AU2016100212A4 (en) | Method of producing a recombinant peptide | |
EP3741774A1 (en) | N-terminal fusion partner for producing recombinant polypeptide, and method for producing recombinant polypeptide using same | |
WO1991015502A1 (en) | Process for purifying polypeptide | |
Su-Xia et al. | Cloning and expression of a new rat procarboxypeptidase B gene in Escherichia coli and purification of recombination carboxypeptidase B | |
CN108779152B (zh) | 包含抗菌肽的不溶性融合蛋白以及利用上述不溶性融合蛋白的抗菌肽制造方法 | |
RU2801248C2 (ru) | Гибридный белок, содержащий фрагменты флуоресцентных белков, и его применение | |
CN117801123B (zh) | 沃索利肽可溶性中间体、中间体制备方法及沃索利肽的制备方法 | |
KR20230016155A (ko) | 대장균을 이용한 글루카곤 호르몬 생산 시스템 | |
KR20210079235A (ko) | Whep 도메인 융합에 의한 목적 단백질의 수용성 증진 방법 | |
CN110655584A (zh) | 自断蛋白的活性控制及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |