KR20180072715A - 조절가능한 리보솜 번역 속도를 위한 조성물 및 사용 방법 - Google Patents
조절가능한 리보솜 번역 속도를 위한 조성물 및 사용 방법 Download PDFInfo
- Publication number
- KR20180072715A KR20180072715A KR1020187012404A KR20187012404A KR20180072715A KR 20180072715 A KR20180072715 A KR 20180072715A KR 1020187012404 A KR1020187012404 A KR 1020187012404A KR 20187012404 A KR20187012404 A KR 20187012404A KR 20180072715 A KR20180072715 A KR 20180072715A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- codon
- host cell
- triacontanucleotide
- molecule
- Prior art date
Links
- 238000013519 translation Methods 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims description 48
- 239000000203 mixture Substances 0.000 title description 3
- 108020004705 Codon Proteins 0.000 claims abstract description 237
- 102000040430 polynucleotide Human genes 0.000 claims description 91
- 108091033319 polynucleotide Proteins 0.000 claims description 91
- 230000014616 translation Effects 0.000 claims description 91
- 239000002157 polynucleotide Substances 0.000 claims description 90
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 89
- 108090000623 proteins and genes Proteins 0.000 claims description 81
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 65
- 229920001184 polypeptide Polymers 0.000 claims description 61
- 102000004169 proteins and genes Human genes 0.000 claims description 57
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims description 49
- 150000007523 nucleic acids Chemical class 0.000 claims description 44
- 150000001413 amino acids Chemical group 0.000 claims description 42
- 241000607142 Salmonella Species 0.000 claims description 31
- 230000014509 gene expression Effects 0.000 claims description 31
- 108020004414 DNA Proteins 0.000 claims description 29
- 239000002773 nucleotide Substances 0.000 claims description 29
- 125000003729 nucleotide group Chemical group 0.000 claims description 29
- 206010042772 syncope Diseases 0.000 claims description 27
- 102000039446 nucleic acids Human genes 0.000 claims description 24
- 108020004707 nucleic acids Proteins 0.000 claims description 24
- 102000004877 Insulin Human genes 0.000 claims description 21
- 108090001061 Insulin Proteins 0.000 claims description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 20
- 229940125396 insulin Drugs 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 19
- 230000001105 regulatory effect Effects 0.000 claims description 18
- 230000001965 increasing effect Effects 0.000 claims description 16
- 241000588724 Escherichia coli Species 0.000 claims description 11
- 230000001939 inductive effect Effects 0.000 claims description 10
- 241001138501 Salmonella enterica Species 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 8
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 7
- 239000013604 expression vector Substances 0.000 claims description 7
- 102000053602 DNA Human genes 0.000 claims description 6
- 230000033228 biological regulation Effects 0.000 claims description 6
- 238000012258 culturing Methods 0.000 claims description 6
- 239000004026 insulin derivative Substances 0.000 claims description 6
- 230000002829 reductive effect Effects 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 241001566735 Archon Species 0.000 claims description 4
- 229920001872 Spider silk Polymers 0.000 claims description 4
- 229920002477 rna polymer Polymers 0.000 claims description 4
- 230000006798 recombination Effects 0.000 claims description 3
- 238000005215 recombination Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 33
- 108020004999 messenger RNA Proteins 0.000 abstract description 10
- 210000004027 cell Anatomy 0.000 description 72
- 235000018102 proteins Nutrition 0.000 description 50
- 238000003776 cleavage reaction Methods 0.000 description 41
- 230000007017 scission Effects 0.000 description 41
- 101150001815 flgM gene Proteins 0.000 description 39
- 230000035772 mutation Effects 0.000 description 34
- 230000028327 secretion Effects 0.000 description 27
- 235000001014 amino acid Nutrition 0.000 description 24
- 108091026890 Coding region Proteins 0.000 description 16
- 210000003495 flagella Anatomy 0.000 description 16
- 238000013518 transcription Methods 0.000 description 16
- 108020001507 fusion proteins Proteins 0.000 description 14
- 102000037865 fusion proteins Human genes 0.000 description 14
- 238000000746 purification Methods 0.000 description 14
- 230000035897 transcription Effects 0.000 description 14
- 241000282414 Homo sapiens Species 0.000 description 12
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 12
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 230000001419 dependent effect Effects 0.000 description 11
- 230000004927 fusion Effects 0.000 description 11
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 10
- 239000001963 growth medium Substances 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 108700010070 Codon Usage Proteins 0.000 description 9
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 9
- 102000035195 Peptidases Human genes 0.000 description 9
- 108091005804 Peptidases Proteins 0.000 description 9
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 8
- 108010013369 Enteropeptidase Proteins 0.000 description 8
- 102100029727 Enteropeptidase Human genes 0.000 description 8
- 239000004365 Protease Substances 0.000 description 8
- 230000001580 bacterial effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 235000019419 proteases Nutrition 0.000 description 8
- 101150038062 fliC gene Proteins 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 108020004566 Transfer RNA Proteins 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 101100281124 Aquifex aeolicus (strain VF5) flaA gene Proteins 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 102000003746 Insulin Receptor Human genes 0.000 description 5
- 108010001127 Insulin Receptor Proteins 0.000 description 5
- 108010016616 cysteinylglycine Proteins 0.000 description 5
- 229960002869 insulin glargine Drugs 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 230000001717 pathogenic effect Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 4
- 241000588722 Escherichia Species 0.000 description 4
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 4
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 4
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 4
- 241000723792 Tobacco etch virus Species 0.000 description 4
- 108010069584 Type III Secretion Systems Proteins 0.000 description 4
- 238000001042 affinity chromatography Methods 0.000 description 4
- 108010004073 cysteinylcysteine Proteins 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 230000004899 motility Effects 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- -1 tripeptide Proteins 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 3
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 3
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 3
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 3
- 101100108073 Drosophila melanogaster Actn gene Proteins 0.000 description 3
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 3
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 3
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 3
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 3
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 3
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 3
- 108050006002 RNA polymerase sigma factor FliA Proteins 0.000 description 3
- 241000607768 Shigella Species 0.000 description 3
- 241000607734 Yersinia <bacteria> Species 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 101150017109 fliA gene Proteins 0.000 description 3
- 102000034356 gene-regulatory proteins Human genes 0.000 description 3
- 108091006104 gene-regulatory proteins Proteins 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- FAAHJOLJYDXKKU-ZHDGNLTBSA-N (2s)-6-amino-2-[[(2s)-1-[(2s,3r)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-hydroxybutanoyl]pyrrolidine-2-carbonyl]amino]hexanoic acid Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CN)C1=CC=C(O)C=C1 FAAHJOLJYDXKKU-ZHDGNLTBSA-N 0.000 description 2
- 108090000915 Aminopeptidases Proteins 0.000 description 2
- 102000004400 Aminopeptidases Human genes 0.000 description 2
- 108020005098 Anticodon Proteins 0.000 description 2
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 2
- 108010037058 Bacterial Secretion Systems Proteins 0.000 description 2
- 241001239379 Calophysus macropterus Species 0.000 description 2
- 241000606161 Chlamydia Species 0.000 description 2
- 241000606153 Chlamydia trachomatis Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 101500025354 Homo sapiens Insulin B chain Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 108010057186 Insulin Glargine Proteins 0.000 description 2
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 2
- 108010006519 Molecular Chaperones Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 239000012722 SDS sample buffer Substances 0.000 description 2
- 206010070834 Sensitisation Diseases 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- 241000607762 Shigella flexneri Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 2
- 101150057615 Syn gene Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 239000003708 ampul Substances 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- RASZIXQTZOARSV-BDPUVYQTSA-N astacin Chemical compound CC=1C(=O)C(=O)CC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C(=O)C(=O)CC1(C)C RASZIXQTZOARSV-BDPUVYQTSA-N 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 229940038705 chlamydia trachomatis Drugs 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 229960005232 insulin (human) Drugs 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- 101150066555 lacZ gene Proteins 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 108010066381 preproinsulin Proteins 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 229960001860 salicylate Drugs 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000008313 sensitization Effects 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 1
- 101150090724 3 gene Proteins 0.000 description 1
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- 108010075409 Alanine carboxypeptidase Proteins 0.000 description 1
- 102100022749 Aminopeptidase N Human genes 0.000 description 1
- 108030000961 Aminopeptidase Y Proteins 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- 244000221226 Armillaria mellea Species 0.000 description 1
- 235000011569 Armillaria mellea Nutrition 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- 108090000658 Astacin Proteins 0.000 description 1
- 102000034498 Astacin Human genes 0.000 description 1
- 108090000363 Bacterial Luciferases Proteins 0.000 description 1
- 108010049990 CD13 Antigens Proteins 0.000 description 1
- 101100533230 Caenorhabditis elegans ser-2 gene Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108090000712 Cathepsin B Proteins 0.000 description 1
- 102000004225 Cathepsin B Human genes 0.000 description 1
- 102100023336 Chymotrypsin-like elastase family member 3B Human genes 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- 102100034560 Cytosol aminopeptidase Human genes 0.000 description 1
- UYUXSRADSPPKRZ-SKNVOMKLSA-N D-glucurono-6,3-lactone Chemical compound O=C[C@H](O)[C@H]1OC(=O)[C@@H](O)[C@H]1O UYUXSRADSPPKRZ-SKNVOMKLSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- FMKGDHLSXFDSOU-BDPUVYQTSA-N Dienon-Astacin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)C(=O)C(=CC1(C)C)O)C=CC=C(/C)C=CC2=C(C)C(=O)C(=CC2(C)C)O FMKGDHLSXFDSOU-BDPUVYQTSA-N 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 108010040721 Flagellin Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 102000013382 Gelatinases Human genes 0.000 description 1
- 108010026132 Gelatinases Proteins 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 101150013707 HBB gene Proteins 0.000 description 1
- LJUIEESLIAZSFR-SRVKXCTJSA-N His-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LJUIEESLIAZSFR-SRVKXCTJSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000907951 Homo sapiens Chymotrypsin-like elastase family member 3B Proteins 0.000 description 1
- 108010002231 IgA-specific serine endopeptidase Proteins 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- IPYVXYDYLHVWHU-GMOBBJLQSA-N Ile-Asn-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N IPYVXYDYLHVWHU-GMOBBJLQSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108010089308 Insulin Detemir Proteins 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- 108010004098 Leucyl aminopeptidase Proteins 0.000 description 1
- 102000002704 Leucyl aminopeptidase Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100033320 Lysosomal Pro-X carboxypeptidase Human genes 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108090000192 Methionyl aminopeptidases Proteins 0.000 description 1
- 102000034452 Methionyl aminopeptidases Human genes 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 101710123586 Negative regulator of flagellin synthesis Proteins 0.000 description 1
- 241000238903 Nephila Species 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 1
- 102100038358 Prostate-specific antigen Human genes 0.000 description 1
- 101800001494 Protease 2A Proteins 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101000715359 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Carboxypeptidase S Proteins 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- SNWIAPVRCNYFNI-SZMVWBNQSA-N Trp-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SNWIAPVRCNYFNI-SZMVWBNQSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- CLEGSEJVGBYZBJ-MEYUZBJRSA-N Tyr-Thr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CLEGSEJVGBYZBJ-MEYUZBJRSA-N 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- 241000607477 Yersinia pseudotuberculosis Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 108091006055 affinity-tagged proteins Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 235000003676 astacin Nutrition 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000000463 effect on translation Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 101150104647 fljB gene Proteins 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 231100000089 gene mutation induction Toxicity 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 235000003869 genetically modified organism Nutrition 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010038088 glutamyl-glycyl-seryl-leucyl-glutamine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010092515 glycyl endopeptidase Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 101710121690 his operon leader peptide Proteins 0.000 description 1
- WNRQPCUGRUFHED-DETKDSODSA-N humalog Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 WNRQPCUGRUFHED-DETKDSODSA-N 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 229960003948 insulin detemir Drugs 0.000 description 1
- 229960002068 insulin lispro Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- UGOZVNFCFYTPAZ-IOXYNQHNSA-N levemir Chemical compound CCCCCCCCCCCCCC(=O)NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H]1NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2N=CNC=2)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2N=CNC=2)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=2C=CC=CC=2)C(C)C)CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(C)C)CSSC[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC2=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CSSC1)C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 UGOZVNFCFYTPAZ-IOXYNQHNSA-N 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 101150035025 lysC gene Proteins 0.000 description 1
- 108010057284 lysosomal Pro-X carboxypeptidase Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 239000004031 partial agonist Substances 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000009745 pathological pathway Effects 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 108010017378 prolyl aminopeptidase Proteins 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000007026 protein scission Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 210000003370 receptor cell Anatomy 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 101150076849 rpoS gene Proteins 0.000 description 1
- YGSDEFSMJLZEOE-UHFFFAOYSA-M salicylate Chemical compound OC1=CC=CC=C1C([O-])=O YGSDEFSMJLZEOE-UHFFFAOYSA-M 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108040006206 sigma factor activity proteins Proteins 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 108010059339 submandibular proteinase A Proteins 0.000 description 1
- 229960004793 sucrose Drugs 0.000 description 1
- 125000001174 sulfone group Chemical group 0.000 description 1
- 239000013595 supernatant sample Substances 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 125000003831 tetrazolyl group Chemical group 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 231100000611 venom Toxicity 0.000 description 1
- 239000012130 whole-cell lysate Substances 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/06—Linear peptides containing only normal peptide links having 5 to 11 amino acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K11/00—Depsipeptides having up to 20 amino acids in a fully defined sequence; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43513—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
- C07K14/43518—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/002—Vectors comprising a special translation-regulating system controllable or inducible
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/10—Vectors comprising a special translation-regulating system regulates levels of translation
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Toxicology (AREA)
- Endocrinology (AREA)
- Diabetes (AREA)
- Insects & Arthropods (AREA)
- Tropical Medicine & Parasitology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 mRNA 번역에 대한 코돈 컨텍스트 및 동의 코돈 변화의 효과에 관한 것이다.
Description
1961년에, 크릭 등(Crick et al.)은 이들의 랜드마크를 공개했다[참조: Nature paper, "General nature of the genetic code for proteins" (Crick, F. H., et al. Nature 192:1227-32 (1961)]. +1 및 -1 프레임쉬프트 돌연변이를 조합하는 단순하면서 여전히 교묘한 유전적 접근법을 사용하여, 크릭 등은 분자 생물학의 중심 교리의 일부인 삼중항 코드에 대한 증거를 제공했다: DNA는 RNA 폴리머라제에 의해 mRNA로 전사되고, 이는 리보솜에 의해 단백질로 번역된다. 단백질의 아미노산 서열에 대한 유전자 코드는, 20개 아미노산 및 번역 종결(정지 코돈) 부위를 특정하는 64개 삼중항 코돈으로 이루어져 있다. 번역되는 mRNA 중의 특정 코돈 및 동족 아미노아실-tRNA의 안티코돈을 규정하는 3개 염기(안티코돈 루프 내의 염기 36, 35 및 34) 사이의 상호작용은 디코딩 프로세스를 결정한다[참조: Grosjean, H., et al., FEBS Lett. 584:252-264 (2010)].
디코딩 프로세스는 보다 복잡하다는 것이 현재 공지되어 있다. 소정 코돈을 번역하는 리보솜의 능력은 이의 인접하는 코돈(번역에 대한 코돈 컨텍스트 효과로서 지칭됨) 및 아마도 mRNA 이차 구조에 의해 매우 영향을 받는다[참조: Goodman, D. B., et al., Science 342:475-478 (2013)]. 소정 코돈의 번역은 또한 mRNA 개방 판독 프레임 내의 코돈 위치에 의해 영향을 받는다. 추가로, 동의 돌연변이(코딩된 아미노산을 변화시키지 않는 코돈 내의 뉴클레오티드 변화)는 장기간 진화론적으로 침묵인 것으로 생각되지만[참조: Nei, M. Mol. Biol. Evol. 22:2318-2342 (2005)], 동의 코돈은 번역 속도 및 정확성, 공번역 폴딩, 단백질 분비 및 전체 발현 수준에 의해 영향을 받는다[참조: Hunt, R. C., et al., Trends Genet. 30:308-321 (2014)]. 최근의 증거는 동의 코돈을 제공하는 돌연변이와 인간 질환, 예를 들면, 암 사이의 관련성을 뒷받침한다[참조: Sauna, Z. E., and C. Kimchi-Sarfaty, Nat Rev Genet 12:683-91 (2011); Supek, F., et al., Cell 156:1324-35 (2014)].
본 발명은, 상이한 리보솜 번역 속도 및 정확성, 단백질 폴딩 및 발현을 제공하는 코돈 쌍의 동의 변화를 제공한다. 한 가지 실시형태에서, 본 발명은 유전적으로 변형된 생물체에서 단백질의 발현을 조작하기 위한 15-염기쌍 서열을 제공한다. 본 발명은 또한 질환 상태와 연관된 유해한 효과를 제공하는 폴리뉴클레오티드 돌연변이를 스크리닝하는 방법을 제공한다.
한 가지 실시형태에서, 본 발명은, 목적하는 단백질을 코딩하는 이종성 폴리뉴클레오티드 서열에 부가될 때, 목적하는 폴리펩티드의 조절된 생성을 제공하는 단백질의 번역 효율을 증가 또는 감소시키는 조작된 FlgM 코딩 서열 또는 이의 10개-코돈-단편을 제공한다.
한 가지 실시형태에서, 본 발명은 추가로 세균 분비 시스템(예를 들면, 편모 유형 III 분비(T3S) 시스템(T3SS))을 사용하여 목적하는 단백질을 배양 배지 내로 분리시키고, 따라서 단백질 회수를 위해 세포 용해를 필요로 하는 방법보다 더욱 효율적인 단백질 생성 방법을 제공한다.
본 발명은 또한, 적어도 10개 코돈을 갖는 돌연변이 트리아콘타뉴클레오티드 서열을 포함하는 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 하나 이상이 동의 코돈인, 재조합 핵산 분자를 제공한다. 특정 실시형태에서, 상기 재조합 핵산 분자는 돌연변이 트리아콘타뉴클레오티드 서열로 이루어진다. 또 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 아미노산 서열 MSIDRTSPLK(서열번호 1)을 코딩한다. 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 전장 FlgM 아미노산 서열: MSIDRTSPLKPVSTVQTRETSDTPVQKTRQEKTSAATSASVTLSDAQAKLMQPGVSDINMERVEALKTAIRNGELKMDTGKIADSLIREAQSYLQSK(서열번호 3)를 코딩하는 서열의 일부이다.
한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은, 목적하는 폴리펩티드를 코딩하는 이종성 폴리뉴클레오티드 서열에 작동적으로 연결된다. 또 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 5'에서 3' 방향으로 작동적으로 연결된다. 특정 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 아미노산 서열 서열번호 3을 코딩하고, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 5'에서 3' 방향으로 작동적으로 연결된다.
한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 추가로 절단 부위 뉴클레오티드 서열에 작동적으로 연결된다. 한 가지 실시형태에서, 상기 절단 부위는 토바코 에취 바이러스(Tobacco Etch Virus; TEV) 프로테아제 절단 부위 또는 엔테로키나제(ETK) 절단 부위를 코딩한다. 또 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 절단 부위 뉴클레오티드 서열, 및 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된다.
한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 5'-최다 코돈을 치환한다. 한 가지 실시형태에서, 목적하는 폴리펩티드는 돌연변이 트리아콘타뉴클레오티드 서열에 이종성이다.
한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 리보핵산 서열이다. 또 다른 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 데옥시리보핵산 서열이다.
한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 합성 서열이다.
한 가지 실시형태에서, 5'에서 3' 방향에서 돌연변이 트리아콘타뉴클레오티드 서열의 제6 및 제8 코돈은 동의 코돈이다.
한 가지 실시형태에서, 벡터는 본 발명의 돌연변이 서열을 포함한다. 또 다른 실시형태에서, 상기 벡터는 발현 벡터이다.
한 가지 실시형태에서, 벡터는, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되고, 절단 부위를 코딩하는 뉴클레오티드 서열에 작동적으로 연결된다. 또 다른 실시형태에서, 절단 부위 뉴클레오티드 서열은 돌연변이 트리아콘타뉴클레오티드 서열 및 목적하는 폴리뉴클레오티드 서열 사이에 존재한다. 또 다른 실시형태에서, 상기 벡터는 정제 태그를 코딩하는 핵산 서열을 추가로 포함하고, 여기서 상기 핵산은 돌연변이 트리아콘타뉴클레오티드 서열에 작동적으로 연결된다.
한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열은 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열, 정제 태그를 코딩하는 핵산 서열, 및 임의로, 절단 부위를 코딩하는 뉴클레오티드 서열에 작동적으로 연결된다.
한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열 또는 폴리뉴클레오티드 서열은 이종성 프로모터에 작동적으로 연결된다. 또 다른 실시형태에서, 상기 프로모터는 유도성 프로모터, 구성적 프로모터 또는 조직 특이적 프로모터이다. 본 발명의 유도성 프로모터는 아라비노즈 유도성 프로모터, 예를 들면, ParaBAD(ΔaraBAD) 프로모터 또는 살리실레이트 유도성 프로모터, 예를 들면, Psal 프로모터일 수 있다. 한 가지 실시형태에서, 숙주 세포는 재조합 분자를 포함한다. 또 다른 실시형태에서, 숙주 세포는 세균, 진균, 효모, 바이러스, 식물, 곤충 또는 포유류 세포이다. 또 다른 실시형태에서, 숙주 세포는 살로넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포이다. 또 다른 실시형태에서, 숙주 세포는 살모넬라 엔테리카(Salmonella enterica) 세포이다. 한 가지 실시형태에서, 절단 부위에 임의로 추가로 작동적으로 연결되는 폴리뉴클레오티드 서열에 작동적으로 연결된 돌연변이 트리아콘타뉴클레오티드 서열은 숙주 세포 게놈 내로 작동적으로 통합된다.
한 가지 실시형태에서, 숙주 세포는 본 발명의 벡터를 포함한다.
한 가지 실시형태에서, 벡터 내의 폴리뉴클레오티드 서열은 숙주 세포 내에서의 발현을 위해 코돈 최적화되었다.
본 발명은, 10개 코돈을 갖는 핵산 서열을 포함하는 재조합 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈인, 재조합 분자를 제공한다. 한 가지 실시형태에서, 상기 핵산 서열은 폴리뉴클레오티드 서열에 작동적으로 연결된다.
본 발명은 조절된 번역 속도를 갖고 데카코돈 서열 5'- AUGAGCAUUGACCGUACCUCACCUUUGAAA-3'(서열번호 2)을 포함하는 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈인, 재조합 핵산 분자를 제공한다. 특정 실시형태에서, 상기 핵산 분자는 이러한 핵산 서열을 포함하고 아미노산 서열 서열번호 3을 코딩한다.
한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU, ACA 또는 ACG이고, 상기 재조합 분자는 데카코돈 서열을 포함하는 분자와 비교하여 증가된 번역 속도를 갖는다. 한 가지 실시형태에서, 제6 코돈은 동의 코돈이고, 상기 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 5 내지 약 15배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 9 내지 약 15배 증가를 갖는다.
한 가지 실시형태에서, 제8 코돈은 동의 코돈 CCG이고, 상기 재조합 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 감소된 번역 속도를 갖는다. 한 가지 실시형태에서, 제8 코돈은 동의 코돈이고, 상기 재조합 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 0.01 내지 약 0.10배 감소를 갖는다. 또 다른 실시형태에서, 상기 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 0.03 내지 약 0.07배 감소를 갖는다.
한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU이고, 제8 코돈은 동의 코돈 CCG이고, 상기 재조합 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 증가된 번역 속도를 갖는다. 한 가지 실시형태에서, 제6 코돈은 동의 코돈이고, 제8 코돈은 동의 코돈이고, 상기 재조합 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 10 내지 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 번역 속도의 약 20 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 번역 속도의 약 30 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 번역 속도의 약 40 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 천연 데카코돈 서열을 포함하는 분자와 비교하여 번역 속도의 약 27.5 내지 40.5배 증가를 갖는다.
한 가지 실시형태에서, 상기 데카코돈 서열은, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된다.
본 발명은, 숙주 세포 내의 단백질 생성을 조절하는 방법으로서, 본 발명의 숙주 세포를 단백질 발현에 충분한 조건하에 배양하는 것을 포함하고, 여기서 재조합 핵산 분자가 숙주 세포에 안정하게 도입되는, 방법을 제공한다. 한 가지 실시형태에서, 상기 재조합 핵산 분자는 10개 코돈을 갖는 돌연변이 트리아콘타뉴클레오티드 서열을 포함하고, 여기서 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나는 동의 코돈이다. 한 가지 실시형태에서, 상기 재조합 분자는 10개 코돈을 갖는 핵산 서열을 포함하고, 여기서 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나는 동의 코돈이다. 또 다른 실시형태에서, 동의 코돈을 포함하는 핵산 서열은 아미노산 서열 서열번호 3을 코딩한다.
한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU, ACA 또는 ACG이고, 여기서 단백질 생성은 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 증가된다. 한 가지 실시형태에서, 제6 코돈은 동의 코돈이고, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 5 내지 약 15배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 9 내지 약 15배 증가를 갖는다.
한 가지 실시형태에서, 제8 코돈은 동의 코돈 CCG이고, 여기서 단백질 생성은 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 감소된다. 한 가지 실시형태에서, 제8 코돈은 동의 코돈이고, 상기 재조합 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 0.01 내지 약 0.10배 감소를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 0.03 내지 약 0.07배 감소를 갖는다.
한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU이고, 제8 코돈은 동의 코돈 CCG이고, 단백질 생성은 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 증가된다.
한 가지 실시형태에서, 제6 코돈은 동의 코돈이고, 제8 코돈은 동의 코돈이고, 상기 재조합 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 10 내지 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 20 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 30 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 약 40 내지 약 50배 증가를 갖는다. 또 다른 실시형태에서, 상기 분자는 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성의 27.5 내지 40.5배 증가를 갖는다.
본 발명은, 폴리뉴클레오티드 서열의 번역 속도를 증가시키는 방법으로서, 단백질을 코딩하고, 10개 코돈을 포함하고 NH2-MSIDRTSPLK-COOH(서열번호 1)를 코딩하는 야생형 트리아콘타뉴클레오티드 서열에 작동적으로 연결되는 폴리뉴클레오티드를 제공하는 단계 및 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈이도록 상기 트리아콘타뉴클레오티드 서열을 돌연변이시키는 단계를 포함하는, 방법을 제공한다. 추가의 실시형태에서, 상기 야생형 트리아콘타뉴클레오티드 서열 및 돌연변이 트리아콘타뉴클레오티드 서열은 아미노산 서열 서열번호 3을 코딩한다.
한 가지 실시형태에서, 수득되는 돌연변이 트리아콘타뉴클레오티드 서열의 제6 코돈은 동의 코돈 ACU, ACA 또는 ACG를 포함하고, 상기 폴리뉴클레오티드 서열의 번역 속도는 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 증가된다.
한 가지 실시형태에서, 수득되는 돌연변이 트리아콘타뉴클레오티드 서열의 제8 코돈은 동의 코돈 CCG를 포함하고, 상기 폴리뉴클레오티드 서열의 번역 속도는 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 감소된다.
한 가지 실시형태에서, 제6 코돈은 동의 코돈 ACU이고, 제8 코돈은 동의 코돈 CCG이고, 상기 폴리뉴클레오티드 서열의 번역 속도는 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 증가된다.
본 발명은, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결된 돌연변이 트리아콘타뉴클레오티드 서열을 함유하는 숙주 세포를 배양하는 것을 포함하는, 목적하는 폴리펩티드를 생성하는 방법을 제공한다. 한 가지 실시형태에서, 상기 돌연변이 트리아콘타뉴클레오티드 서열 및 폴리뉴클레오티드 서열은 절단 부위를 코딩하는 뉴클레오티드 서열 및/또는 정제 태그를 코딩하는 핵산 서열에 작동적으로 연결된다. 한 가지 실시형태에서, 상기 펩티드는 배양 배지로부터 정제된다. 한 가지 실시형태에서, 정제 태그를 사용하여 펩티드를 배양 배지로부터 정제한다. 한 가지 실시형태에서, 상기 트리아콘타뉴클레오티드 서열은 아미노산 서열 서열번호 3을 갖는 FlgM 단백질을 코딩하고, 상기 펩티드는 FlgM 단백질로부터 단리된다. 또 다른 실시형태에서, 절단 부위를 사용하여 폴리펩티드를 FlgM 단백질로부터 단리한다.
본 발명은, 유형 III 분비 시스템을 갖고 또한 목적하는 폴리펩티드를 코딩하는 이종성 폴리뉴클레오티드 서열에 작동적으로 연결된 돌연변이 트리아콘타뉴클레오티드 서열을 함유하는 하나 이상의 세균 세포를 배양하는 것을 포함하는 목적하는 폴리펩티를 생성하는 방법으로서, 상기 폴리펩티드가 배양 배지 내로 분비되는, 방법을 제공한다. 한 가지 실시형태에서, 세균 세포는 살모넬라(Salmonella) 또는 에스케리키아(Escherichia) 세포이다. 한 가지 실시형태에서, 상기 트리아콘타뉴클레오티드 서열은 전장 FlgM 펩티드를 코딩한다. 한 가지 실시형태에서, 상기 트리아콘타뉴클레오티드 서열 및 폴리뉴클레오티드 서열은 정제 태그 및/또는 절단 부위를 코딩하는 뉴클레오티드 서열에 작동적으로 연결된다. 한 가지 실시형태에서, 상기 방법은 목적하는 폴리펩티드의 생성을 위해 연속 유동 제조 시스템을 사용한다. 한 가지 실시형태에서, 상기 연속 유동 제조 시스템은 인슐린, MaSp1 또는 MaSp2 단백질을 생성한다.
도 1은 어셈블리에 커플링된 살모넬라 엔테리카(Salmonella enterica) 편모 유전자 조절을 도시한다.
도 2는 지수 배양에서 FlgM 항-σ28 활성에 대한 flgM의 코돈 Thr6 및 Pro8의 동의 변화의 효과를 도시한다. 데이터는 FlgM 항-σ28 활성의 수준으로 제시되어 있다. 야생형 코돈(ACC)은 검정된 동의 Thr6 및 Pro8 코돈의 15개 조합 각각에 대해 최저 FlgM 활성/루시퍼라제 활성을 나타냈다.
도 3은 flgM의 Pro8 CCG 번역-결함 대립유전자의 억제에 대한 동의 코돈 돌연변이유발의 효과를 도시한다. 표지 배지 상에서 야생형 FlgM 활성을 나타낸 돌연변이체는 FlgM 서열 위에 제시되어 있다. 약간 증가된 FlgM 활성을 갖는 돌연변이체는 Ser2(ACG에서 AGT으로), Thre6(ACC에서 정지 코돈으로), Val12(GTT에서 GTG로 및 GTT에서 GTC으로)이다. FlgM 서열(10개 단리물) 하부에 도시된 나머지 돌연변이체는 표현형을 갖지 않는다. 괄호 안의 숫자는 반복 회수를 나타낸다.
도 4는 항-6xHis 항체를 사용한 웨스턴 블롯을 통해 조작된 살모넬라(Salmonella) 세포의 분비된 분획(상부) 및 세포 분획(하부) 내의 FlgM::6xHis::ETK::인슐린-글라르긴 키메라 단백질의 검출을 도시한다.
도 2는 지수 배양에서 FlgM 항-σ28 활성에 대한 flgM의 코돈 Thr6 및 Pro8의 동의 변화의 효과를 도시한다. 데이터는 FlgM 항-σ28 활성의 수준으로 제시되어 있다. 야생형 코돈(ACC)은 검정된 동의 Thr6 및 Pro8 코돈의 15개 조합 각각에 대해 최저 FlgM 활성/루시퍼라제 활성을 나타냈다.
도 3은 flgM의 Pro8 CCG 번역-결함 대립유전자의 억제에 대한 동의 코돈 돌연변이유발의 효과를 도시한다. 표지 배지 상에서 야생형 FlgM 활성을 나타낸 돌연변이체는 FlgM 서열 위에 제시되어 있다. 약간 증가된 FlgM 활성을 갖는 돌연변이체는 Ser2(ACG에서 AGT으로), Thre6(ACC에서 정지 코돈으로), Val12(GTT에서 GTG로 및 GTT에서 GTC으로)이다. FlgM 서열(10개 단리물) 하부에 도시된 나머지 돌연변이체는 표현형을 갖지 않는다. 괄호 안의 숫자는 반복 회수를 나타낸다.
도 4는 항-6xHis 항체를 사용한 웨스턴 블롯을 통해 조작된 살모넬라(Salmonella) 세포의 분비된 분획(상부) 및 세포 분획(하부) 내의 FlgM::6xHis::ETK::인슐린-글라르긴 키메라 단백질의 검출을 도시한다.
정의
본 발명의 이해를 용이하게 하기 위해, 다수의 용어 및 문구가 하기에 정의된다. 하기 용어 및 문구의 당해 기술분야에서 인식되는 동의어 및 대체어는, 구체적으로 기재되지 않더라도, 고려된다.
본 명세서 및 특허청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는, 문맥이 명백하게 달리 지시하지 않는 한, 복수 형태를 포함한다. 즉, "a"는, 달리 명시하지 않는 한, "하나 이상"을 의미한다.
용어 "약" 또는 "대략"은 대략적으로, 주위 또는 영역 내를 의미한다. 용어 "약" 또는 "대략"은 당해 기술분야의 숙련가에 의해 결정된 특정 값에 대한 허용가능한 상황 오차 범위 내를 추가로 의미하고, 이는 당해 값이 측정되거나 결정되는 방법, 즉 특정 목적에 요구된 측정 시스템의 제한 또는 정확도, 예를 들면, 사료 제형 내의 영양소의 양에 부분적으로 의존할 것이다. 용어 "약" 또는 "대략"이 수치 범위와 함께 사용되는 경우, 기재된 수치 값 상하의 경계를 확장함으로써 그 범위를 변경한다. 예를 들면, "약 5.5 내지 6.5g/l"는 수치 범위의 경계가 5.5 이하 및 6.5 이상으로 확장하여 해당 특정 값이 그 범위 내에서 동일한 기능적 결과를 달성하는 것을 의미한다. 예를 들면, "약" 및 "대략"은 당해 기술분야의 관행에 따라 1 또는 복수의 표준 편차 내인 것을 의미할 수 있다. 또는, "약" 및 "대략"은 소정 값의 20% 이하, 바람직하게는 10% 이하, 보다 바람직하게는 5% 이하 및 더욱 바람직하게는 1% 이하의 범위를 의미할 수 있다.
"A 및/또는 B" 등의 문구에 사용된 용어 "및/또는"은 "A 및 B", "A 또는 B", "A" 및 "B"를 포함하는 것으로 의도된다. 마찬가지로, "A, B 및/또는 C" 등의 문구에 사용된 용어 "및/또는"은 각각의 하기 실시형태를 포괄하는 것으로 의도된다: A, B 및 C; A, B 또는 C; A 또는 C; A 또는 B; B 또는 C; A 및 C; A 및 B; B 및 C; A(단독); B(단독); 및 C(단독).
달리 명시되지 않는 한, 모든 명칭 "A%-B%", "A-B%," "A% 내지 B%," "A 내지 B%," "A%-B," "A% 내지 B"는 이들의 보통 의미와 관습적 의미를 제공한다. 일부 실시형태에서, 이들 명칭은 동의어이다.
용어 "실질적으로" 또는 "실질적"은 기재되거나 특허청구된 상태가 기재된 표준으로서 모든 중요한 측면에서 기능하는 것을 의미한다. 따라서, "실질적으로 포함하지 않는"은, 수치 값이 일부 불순물 또는 물질의 존재를 나타내는 경우에도, 자유 상태로서 모든 중요한 측면에서 기능하는 상태를 포괄하는 것을 의미한다. "실질적"은 일반적으로 90% 초과, 바람직하게는 95% 초과, 가장 바람직하게는 99% 초과의 값을 의미한다. 특정 값이 명세서 및 특허청구범위에 사용되는 경우, 달리 언급하지 않는 한, 용어 "실질적으로"는 특정 값에 대한 허용가능한 오차 범위를 의미한다.
"임의의" 또는 "임의로"는 후속적으로 기재된 사상, 상황 또는 물질이 발생하거나 발생하지 않거나 존재할 수도 있음을 의미하고, 해당 기재는 사상, 상황 또는 물질이 존재하는 경우 및 발생하지 않거나 존재하지 않는 경우을 포함한다.
용어 "형질전환" 및 "형질감염"은 수용체 세포 내로 핵산 분자(예: 발현 벡터)의 도입을 의미한다. 형질전환 또는 형질감염 기술은 당해 기술분야에 공지되어 있다. 핵산 서열(예: 발현 벡터에 의해 운반된 코딩 서열)이 상기 수용체(숙주) 세포의 게놈(염색체 DNA) 내로 도입(통합)되는 것이 특정될 수 있다.
"FlgM" 및 "flgM"은 유형 III 분비 시스템에서 플라젤린 합성을 음으로 조절하는 단백질 및 폴리뉴클레오티드 서열을 각각 지칭한다[참조: Gillen and Hughes, Molecular Characterization of flgM, a Gene Encoding a Negative Regulator of Flagellin Synthesis in Salmonella typhimurium , J. Bacteriology 173(20): 6453-6459 (1991)].
용어 "재조합" 또는 "돌연변이체"는 참조된 생성물이 이의 천연 존재 대응물에 관하여 변경된 것을 의미한다.
용어 "트리아콘타뉴클레오티드 서열"은 적어도 30개 뉴클레오티드 길이인 뉴클레오티드 서열을 의미한다. 예를 들면, 본 발명의 트리아콘타뉴클레오티드 서열은 30개 뉴클레오티드로 이루어질 수 있거나, 예를 들면, 전장 FlgM 단백질을 코딩하는 보다 큰 서열의 일부일 수 있다.
용어 "코돈"은 함께 하나의 아미노산을 코딩하는 3개 구성적 뉴클레오티드를 지칭한다.
용어 "데카코돈"은 적어도 5개 코돈(즉, 적어도 15개 뉴클레오티드)을 포함하는 뉴클레오티드 서열을 의미한다. 예를 들면, 본 발명의 데카코돈 서열은 10개 코돈으로 이루어질 수 있거나, 약 97개 코돈을 포함하고 전장 FlgM 펩티드를 코딩할 수 있다.
용어 "동의 코돈"은 야생형과 비교하여 변경되지만 야생형 코돈과 동일한 아미노산을 코딩하는 코돈을 의미한다.
용어 "핵산", "폴리뉴클레오티드" 및 "뉴클레오티드"는 본원에서 동의로 사용된다. 용어 "폴리뉴클레오티드"는, 단수 또는 복수로 사용되는 경우, 일반적으로 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 지칭하고, 이는 변형되지 않은 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있다. 따라서, 예를 들면, 본원에 정의된 폴리뉴클레오티드는, 제한 없이, 단일- 및 이중-가닥 DNA, 단일- 및 이중-가닥 영역을 포함하는 DNA, 단일- 및 이중-가닥 RNA, 및 단일- 및 이중-가닥 영역을 포함하는 RNA, 단일-가닥이거나 보다 통상적으로 이중-가닥일 수 있거나 단일- 및 이중-가닥 영역을 포함하는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함한다. 따라서, 안정성 또는 기타 이유로 변형된 골격을 갖는 DNA 또는 RNA는 해당 용어가 본원에서 의도되는 "폴리뉴클레오티드"이다. 더욱이, 이상 염기, 예를 들면, 이노신, 또는 변형된 염기, 예를 들면, 트리티움화 염기를 포함하는 DNA 또는 RNA는 본원에서 의도되는 용어 "폴리뉴클레오티드" 내에 포함된다. 일반적으로, 용어 "폴리뉴클레오티드"는 모든 화학적, 효소적 및/또는 대사적으로 변형된 형태의 비변형된 폴리뉴클레오티드를 포괄한다. 폴리뉴클레오티드는 시험관내 재조합 DNA-매개된 기술 및 세포을 포함하는 다양한 방법에 의해 또는 생물체에서 DNA의 발현에 의해 제조할 수 있다.
용어 "단백질", "폴리펩티드" 및 "펩티드"는 본원에서 동의어로 사용된다. 본원에 사용된 바와 같이, 용어 "폴리펩티드"는 단일 "폴리펩티드" 뿐만 아니라 복수의 "폴리펩티드"를 포괄하는 것으로 의도되고, 아미드 결합(또한 펩티드 결합으로 공지됨)에 의해 선형으로 연결된 단량체(아미노산)로 구성된 분자를 지칭한다. 용어 "폴리펩티드"는 2개 이상의 아미노산의 임의의 쇄 또는 쇄들을 지칭하고, 특정 길이의 생성물을 지칭하는 것은 아니다. 따라서, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, "단백질", "아미노산" 또는 2개 이상의 아미노산의 쇄 또는 쇄들을 지칭하기 위해 사용된 임의의 기타 용어는 "폴리펩티드"의 정의에 포함되고, 용어 "폴리펩티드"는 임의의 이들 용어 대신에 또는 이들 용어와 호환적으로 사용될 수 있다. 용어 "폴리펩티드"는 또한, 제한 없이, 글리코실화, 아세틸화, 포스포릴화, 아미드화, 공지된 보호/차단 그룹에 의한 유도체화, 단백질분해 절단, 또는 비-천연 존재 아미노산에 의한 변형을 포함하는, 폴리펩티드의 발현후 변형의 생성물을 지칭하는 것으로 의도된다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래할 수 있거나 재조합 기술에 의해 생성될 수 있지만, 지시된 핵산 서열로부터 반드시 번역되는 것은 아니다. 이는, 화학적 합성을 포함하는 임의의 방식으로 생성될 수 있다. 본 발명의 특정 실시형태는 적어도 FlgM 펩티드 및 폴리펩티드를 포함하는 융합 펩티드를 포함하고, 여기서 폴리펩티드 및 FlgM 펩티드는 서로 천연적으로 회합하지 않는다(즉, 폴리펩티드는 FlgM 펩티드에 대해 이종성이다). 이러한 폴리펩티드는 "이종성 폴리펩티드", "표적 폴리펩티드", "소망하는 폴리펩티드" 또는 "목적하는 폴리펩티드"로서 지칭될 수 있다.
"단리된" 생물학적 성분(예를 들면, 핵산 분자 또는 단백질)은 해당 성분이 천연에서 발생하는 생물체의 세포 내의 기타 생물학적 성분, 즉, 기타 염색체 및 염색체외 DNA 및 RNA, 단백질 및 세포소기관으로부터 실질적으로 분리되거나 정제되었다. "단리된" 핵산 및 단백질은 표준 정제 방법에 의해 정제된 핵산 및 단백질을 포함한다. 해당 용어는 또한 화학적으로 합성된 핵산 뿐만 아니라 숙주 세포에서 재조합 발현에 의해 제조된 핵산 및 단백질을 포괄한다.
용어 "이종성", "외래" 또는 "비-천연"은, 예를 들면, 서로 자연적으로 회합하지 않는 2개의 구조를 지칭한다. 예를 들면, 뉴클레오티드 서열이 이종성 프로모터에 작동적으로 연결되는 경우, 뉴클레오티드 서열은, 해당 뉴클레오티드 서열 및 프로모터 서열이 동일한 생물체로부터 유래하더라도, 프로모터와 자연적으로 회합하지 않는다.
용어 "리보핵산" 및 "RNA는 본원에서 동의적으로 사용된다.
용어 "데옥시리보핵산" 및 "DNA"는 본원에서 동의적으로 사용된다.
본원에 사용된 "벡터"는 클로닝 벡터, 발현 벡터, BAC 또는 YAC 벡터를 포함하는 플라스미드, 또는 세포 내로 폴리뉴클레오티드 서열을 수송할 수 있는 기타 핵산 분자일 수 있다. 벡터는 폴리뉴클레오티드 서열의 저장, 클로닝을 위해 설계될 수 있고/있거나 폴리뉴클레오티드 서열의 발현을 위해 설계될 수 있다. "플라스미드" 및 "벡터"는, 플라스미드가 통상 사용되는 형태의 벡터이기 때문에, 호환적으로 사용될 수 있다. 용어 "발현 벡터"는 세포에 의한 발현에 적합한 형태(예를 들면, 전사 조절 요소에 연결됨)로 유전자 작제물을 함유하는 임의의 벡터(예: 플라스미드, 코스미드 또는 파지 염색체)을 포함한다. 본원에 사용된 바와 같은 "작제물" 또는 "유전자 작제물"은 전체 염색체 및/또는 미토콘드리아 게놈을 포함하지 않는다. 특정한 숙주 세포 내에서 사용하기에 적합한 발현 벡터는 공지되어 있고, 통상의 실험 및 공지된 기술을 사용하여 용이하게 동정된다(예를 들면, 본원에서 이의 전체가 참조로서 도입되는, 미국 특허 제7,785,830호; 제8,663,980호; 제8,628,954호).
본원에 사용된 "숙주 세포"는 분자가 도입되거나 도입되어 있는 세포를 지칭한다. 일반적으로, 본원에서 숙주 세포는 외래(이종성, 비-천연) 분자가 도입되거나 도입되어 있는 세포를 지칭한다. 특정 실시형태에서, 본원의 숙주 세포는 세균 세포이다. 특정 실시형태에서, 숙주 세포는 그람-음성 세균 세포이다. 특정 실시형태에서, 숙주 세포는 유형 III 분비(T3S) 시스템(T3SS) 등의 분비 시스템을 포함하는 세균 세포이다. 특정 실시형태에서, 본원의 숙주 세포는 살모넬라(Salmonella), 시겔라(Shigella), 클라미디아(Chlamydia), 예르시니아(Yersinia), 슈도모나스(Pseudomonas) 및 에스케리키아(Escherichia) 세포로 이루어진 그룹으로부터 선택된다. 특정 실시형태에서, 본원의 숙주 세포는 살모넬라 엔테리카(Salmonella enterica) 혈청형 티피무리움(Typhimurium), 시겔라 플렉스네리(Shigella flexneri), 클라미디아 트라코마티스(Chlamydia trachomatis), 예르시니아 슈도투베르쿨로시스(Yersinia pseudotuberculosis), 슈도모나스 에루기노사(Pseudomonas aeruginosa) 및 에스케리키아 콜라이(Escherichia coli) 세포로 이루어진 그룹으로부터 선택된다.
본원에 사용된 "정제 태그"는, 예를 들면, 크기 배제 크로마토그래피, 이온 교환 크로마토그래피 및/또는 친화성 크로마토그래피를 사용한 단백질 정제를 보조하는 리간드를 지칭한다. 정제 태그 및 이들의 용도는 당해 기술분야에 공지되어 있고[참조: Thermo Scientific Protein Purification Handbook 2010], 예를 들면, 폴리-히스티딘, 글루타티온 S-트랜스퍼라제(GST), Myc, Ha, FLAG, 또는 말토즈 결합 단백질(MBP)일 수 있다. 따라서, 단백질을 정제, 수집, 수득 또는 단리하는 단계는 크기 배제 크로마토그래피, 이온 교환 크로마토그래피 또는 친화성 크로마토그래피를 포함한다. 특정 실시형태에서, FlgM 펩티드, 또는 FlgM을 포함하는 융합(키메라) 단백질을 정제하는 단계는 친화성 크로마토그래피 및, 예를 들면, FlgM 또는 융합 단백질의 또 다른 구성원에 결합하는 항체를 포함하는 σ28 친화성 컬럼 또는 친화성 컬럼을 사용한다. 한 가지 실시형태에서, FlgM 펩티드 및 정제 태그를 적어도 포함하는 융합 단백질을 정제하는 단계는 친화성 크로마토그래피 및, 예를 들면, 정제 태그에 결합하는 친화성 컬럼을 사용한다.
본원에서 사용된 "절단 부위"는 화학적 또는 단백질(예를 들면, 제한 효소 또는 프로테아제)에 의해 인식되고/되거나 절단되는 서열을 지칭한다. 절단 부위는 당해 기술분야에 공지되어 있다(예를 들면, 본원에서 이의 전체가 참조로서 도입되는 미국 특허공개번호 제2015/0037868호). 절단 부위는 폴리뉴클레오티드 서열(예: 제한 효소 부위) 또는 아미노산 성려(예: 펩티다제 부위)일 수 있기 때문에, 당해 기술분야의 숙련가는, 인용되는 문맥에 기초하여, "절단 부위"가 폴리뉴클레오티드 서열 또는 아미노산 서열을 지칭하는지를 인식할 것이다. 예시적 절단 부위는 알라닌 카복시펩티다제, 아르밀라리아 멜레아(Armillaria mellea ) 아스타신, 세균 류실 아미노펩티다제, 암 응고촉진제, 카텝신 B, 클로스트리파인, 시토졸 알라닐 아미노펩티다제, 엘라스타제, 엔도프로테이나제 Arg-C, 엔테로키나제, 가스트릭신, 젤라티나제, Gly-X 카복시펩티다제, 글리실 엔도펩티다제, 인간 리노바이러스 3C 프로테아제, 하이포데르민 C, Iga-특이적 세린 엔도펩티다제, 류실 아미노펩티다제, 류실 엔도펩티다제, lysC, 리소좀 프로-X 카복시펩티다제, 리실 아미노펩티다제, 메티오닐 아미노펩티다제, 믹소박터, 나르딜리신, 췌장 엔도펩티다제 E, 피코르나인 2A, 피코르나인 3C, 프로엔도펩티다제, 프롤릴 아미노펩티다제, 프로단백질 전환효소 I, 프로단백질 전환효소 II, 루셀리신, 사카로펩신, 세메노젤라제, T-플라스미노겐 활성화제, 트롬빈, 조직 칼리크레인, 담배 에칭 바이러스(TEV), 토가비린, 트립토파닐 아미노펩티다제, U-플라스미노겐 활성화제, V8, 베놈빈 A, 베놈빈 AB 및 Xaa-프로 아미노펩티다제로 이루어진 그룹으로부터 선택된 프로테아제에 의해 인식되는 것들을 포함한다(참조: 본원에서 이의 전체가 참조로서 도입되는 미국 특허공개공보 제2015/0037868호). 일부 실시형태에서, 절단 부위는 프로테아제 절단 부위이다. 일부 실시형태에서, 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 또는 엔테로키나제(ETK) 절단 부위이다. 융합(키메라) 펩티드의 성분은 융합 펩티드 정제의 단계 전, 동안 또는 후에 절단 부위에서의 절단을 통해 분리(방출)할 수 있다. 예를 들면, 융합 단백질이 이종성 폴리펩티드 및 절단 부위에 융합된 FlgM 단백질을 포함하고 융합 펩티드가 배양 배지 내로 분비되는 경우, FlgM 단백질 및 폴리펩티드는 배양 배지로부터 정제 단계 전에 배양 배지에 대한 프로테아제의 적용에 의해 단리할 수 있거나, 융합 단백질은 배양 배지로부터 정제한 다음, 프로테아제를 융합 펩티드에 적용하여 폴리펩티드로부터 FlgM 단백질을 방출시킬 수 있다. 특정한 실시형태에서, 융합 단백질 분해(절단) 단계는 정제 단계와 동시에 수행된다. 예를 들면, 융합 단백질은 친화성 컬럼을 통과할 수 있고, 이종성 폴리펩티드 또는 정제 태그는 친화성 컬럼에 결합할 수 있고, 결합되는 동안, 절단제가 적용되어 절단 부위가 절단되고 융합 펩티드가 분해된다.
통상적인 바와 같이, 명칭 "NH2" 또는 "N-"은 아미노산 서열의 N-말단을 지칭하고, 명칭 "COOH" 또는 "C-"는 아미노산 서열의 C-말단을 지칭한다.
개체에 적용되는 것으로 본원에 사용된 용어 "천연-존재", "천연" 또는 "야생형"은 개체가 자연에서 발견될 수 있다는 사실을 지칭한다. 예를 들면, 자연에서 공급원으로부터 단리될 수 있고 실험실 또는 다른 방법으로 인간에 의해 의도적으로 변형되지 않은 생물체(바이러스 포함)에 존재하는 폴리펩티드 또는 폴리뉴클레오티드 서열은 야생형이다.
본원에 사용된 바와 같은 "돌연변이"는 야생형 서열과 비교하여 뉴클레오티드 또는 아미노산의 변경을 지칭한다. 본원에서 돌연변이 또는 "변경"은 통상적으로, 교호, 그러나 동의 코돈을 제공하는 코딩 폴리뉴클레오티드 서열 내의 제조된 핵산 변화이다(즉, 코딩된 아미노산 잔기는 돌연변이의 결과로서 변화되지 않는다). 이러한 돌연변이체, 동의 코돈 최적화된 서열의 생성 및 동정은 본원에 추가로 기재된 바와 같다.
본원에 사용된 용어 "조절 서열"은, 이들이 결찰되는 코딩 서열의 발현 및 프로세싱을 수행하는데 필요한 폴리뉴클레오티드 서열을 지칭한다. 용어 "조절 서열"은, 이의 존재가 발현 및 프로세싱에 필수적인 최소한 모든 성분을 포함하는 것으로 의도되고, 또한 이의 존재가 유리한 추가 성분, 예를 들면, 리더 서열 및 융합 파트너 서열을 포함할 수 있다. 조절 서열은 "전사 조절 요소(전사 조절 요소(TCE))"일 수 있고, 이의 성질은 숙주 생물체에 따라 상이하다. 당해 기술분야의 숙련가는 원핵생물에서 이러한 TCE가 일반적으로 프로모터, 리보솜 결합 부위 및 전사 종결 서열을 포함하고, 진핵생물에서 일반적으로 이러한 TCE가 프로모터 및 전사 종결 서열을 포함한다는 것을 인식할 것이다. 조절 서열은 조절가능하거나(예를 들면, 유도가능한) 구성적일 수 있다.
본 발명에 따라, 임의의 프로모터가 사용될 수 있다. 프로모터는 통상적으로 코딩 서열의 상류(5') 뉴클레오티드 서열을 지칭하고, RNA 폴리머라제, 및 정확한 전사에 필요한 기타 인자의 인식을 제공함으로써 코딩 서열의 발현을 조절한다. 본 발명에 따라 사용된 프로모터는, 조절인자 요소가 발현 조절을 위해 부차되는 전사 개시 부위를 특정하는 최소 프로모터를 포함할 수 있다.
본원에 사용된 용어 "작동가능하게 연결된" 또는 "작동적으로 연결된"은, 성분이 이들의 의도된 방식으로 기능할 수 있도록 하는 관계에 있는 성분의 배치를 지칭한다. 당해 기술분야의 숙련가는 특정 상황하에 성분의 성질에 따라(예를 들면, 절단 부위 또는 정제 태그), 함께 "작동적으로 연결된" 2개 이상의 성분이 반드시 연속적으로 연결되거나 연속적으로 회합될 필요는 없다는 것을 인식할 것이다. 코딩 서열에 "작동적으로 연결된" 조절 서열은 코딩 서열의 발현이 조절 서열과 양립하는 조건하에 달성되는 방식으로 결찰된다. 2개 폴리뉴클레오티드 서열이 전사 조절 요소(TCE)(또는 하나 이상의 전사 조절 요소) 등의 조절 요소에 작동적으로 연결되는 것으로 언급되는 경우, 당해 기술분야의 숙련가는 다양한 구성이 기능적이고 포함된다는 것을 인식할 것이다. 예를 들면, 당해 기술분야의 숙련가는 적어도 모든 하기 구성이 포함된다는 것을 인식할 것이다: NH2-전사 조절 요소-제1 폴리뉴클레오티드 서열-제2 폴리뉴클레오티드 서열-COOH; NH2-전사 조절 요소-제2 폴리뉴클레오티드 서열-제1 폴리뉴클레오티드 서열-COOH; NH2-제1 전사 조절 요소-제1 폴리뉴클레오티드 서열-제2 전사 조절 요소-제2 폴리뉴클레오티드 서열-COOH; NH2-제2 전사 조절 요소-제2 폴리뉴클레오티드 서열-제1 전사 조절 요소-제1 폴리뉴클레오티드 서열-COOH; NH2-제1 전사 조절 요소-제2 폴리뉴클레오티드 서열-제2 전사 조절 요소-제1 폴리뉴클레오티드 서열-COOH; NH2-제2 전사 조절 요소-제1 폴리뉴클레오티드 서열-제1 전사 조절 요소-제2 폴리뉴클레오티드 서열- COOH; 및 이들의 조합. 추가로, 예를 들면, 돌연변이 트리아콘타뉴클레오티드 서열이 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열, 정제 태그를 코딩하는 핵산 서열 및 절단 부위에 작동적으로 연결되는 것으로 언급되는 경우, 당해 기술분야의 숙련가는 다양한 구성이 기능적이고 포함된다는 것을 인식할 것이다. 예를 들면, 당해 기술분야의 숙련가는 적어도 하기 구성이 포함된다는 것을 인식할 것이다(5'으로부터 3' 말단까지): 5'-(돌연변이 트리아콘타뉴클레오티드 서열)-(절단 부위)-(폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)-3'; 5'-(정제 태그를 코딩하는 핵산 서열)-(돌연변이 트리아콘타뉴클레오티드 서열)-(절단 부위)-(폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)-3'; 5'-(돌연변이 트리아콘타뉴클레오티드 서열)-(절단 부위)-(폴리펩티드를 코딩하는 폴리뉴클레오티드 서열)-(정제 태그를 코딩하는 핵산 서열)-3'; 및 이의 조합.
2개 핵산 서열 또는 2개 아미노산 서열 사이의 유사성은 "서열 동일성"으로 지칭된다. 서열 동일성은 퍼센트 동일성(또는 유사성)의 측면에서 빈번하게 측정되고; 퍼센트가 보다 높을수록 2개 서열은 더욱 유사하다. 인간 폴리펩티드의 동족체 또는 오르토로그 및 상응하는 cDNA 또는 유전자 서열(들)은, 표준 방법을 사용하여 정렬하는 경우, 비교적 고도의 서열 동일성을 보유할 것이다. 이러한 서열 동일성은, 오르토로거스 단백질 또는 유전자 또는 cDNA가, 보다 밀접하게 관련된 종(예: 인간 및 씨. 엘레간스(C. elegans) 서열)과 비교하여, 보다 밀접하게 관련되는 종(예: 인간 및 침팬지 서열)으로부터 유래하는 경우에 더욱 현저할 것이다.
비교를 위한 서열의 정렬 방법은 당해 기술분야에 공지되어 있다. 다양한 프로그램 및 정렬 알고리즘은 문헌[참조: Smith & Waterman Adv. Appl. Math. 2: 482, 1981; Needleman & Wunsch J. Mol. Biol. 48: 443, 1970; Pearson & Lipman Proc. Natl. Acad. Sci. USA 85: 2444, 1988; Higgins & Sharp Gene, 73: 237-244, 1988; Higgins & Sharp CABIOS 5: 151-153, 1989; Corpet et al. Nuc. Acids Res. 16, 10881-90, 1988; Huang et al. Computer Appls. in the Biosciences 8:155-65, 1992; and Pearson et al. Meth. Mol. Bio. 24:307-31, 1994. Altschul et al. J. Mol. Biol. 215:403-410, 1990]에 기재되어 있고, 서열 정렬 방법 및 상동성 계산에 대한 상세한 고려사항을 제시한다.
NCBI Basic Local Alignment Search Tool(BLAST)[참조: Altschul et al. J. Mol. Biol. 215:403-410, 1990]은, 서열 분석 프로그램 blastp, blastn, blastx, tblastn 및 tblastx와 관련하여 사용하기 위한, 생물정보를 위한 국립 센터(NCBI, Bethesda, Md.)를 포함하는 몇몇 공급원으로부터 및 인터넷 상에서 이용가능하다. 예를 들면, 약 30개 초과의 아미노산의 아미노산 서열 비교를 위해, Blast 2 서열 함수는 디펄트 파라미터로 설정한 디펄트 BLOSUM62 매트릭스를 사용하여 사용된다(11의 갭 존재 코스트, 및 1의 잔기 갭 비용당). 짧은 펩티드(30개 이하의 아미노산)을 정렬하는 경우, 정렬은, 디펄트 파라미터로 설정한 PAM30 매트릭스를 사용하는 Blast 2 서열 함수를 사용하여 수행한다(오픈 갭 9, 확장 갭 1 페널티).
2개의 핵산 분자가 밀접하게 관련되어 있는 또 다른 표시는 2개 분자가 엄격한 조건하에 서로 하이브리드화하는 것이다. 엄격한 조건은 서열 의존적이고, 상이한 환경적 파라미터하에 상이하다. 일반적으로, 엄격한 조건은 규정된 이온 강도 및 pH에서 특정 서열에 대해 열 융점(Tm)보다 약 5℃ 내지 20℃ 낮도록 선택된다. Tm은 50%의 표적 서열이 완전하게 매칭된 프로브 또는 상보성 가닥과 하이브리드화된 상태로 잔류하는 온도(규정된 이온 강도 및 pH하에)이다. 핵산 하이브리드화의 조건 및 엄격성의 계산은 문헌[참조:Sambrook et al. (In Molecular Cloning: A Laboratory Manual, CSHL, New York, 1989) and Tijssen (Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes Part I, Chapter 2, Elsevier, New York, 1993]에서 발견할 수 있다.
고도의 서열 동일성을 나타내지 않는 핵산 서열은, 그럼에도 불구하고, 유전자 코드의 축퇴로 인해, 유사한 아미노산 서열을 코딩한다. 핵산 서열의 변화는 모두 동일한 단백질을 실질적으로 코딩하는 복수 핵산 분자를 생성하기 위해 이러한 축퇴를 사용하여 이루어질 수 있는 것으로 이해된다.
문구 "번역에 대한 동의 코돈 및 코돈 컨텍스트 효과"는 약어 CEOT(codon effects on translation)을 사용하여 지칭할 수 있다.
본원에서 문구 "동의 코돈 돌연변이체"(SCM)은, 야생형 코딩 서열과 비교하여, 하나 이상의 동의 코돈을 포함하도록 돌연변이되어 있는 코돈 서열을 지칭한다. 문구 "SCM flgM"은, 돌연변이의 결과로서 돌연변이되고 하나 이상의 동의 코돈을 포함하는 flgM 코딩 서열을 지칭한다(즉, "SCM flgM"은 돌연변이 flgM 코딩 서열을 지칭한다). 본원에 사용된 바와 같이, "동의 코돈 돌연변이유발/변경"(SCA)는 수득되는 돌연변이/변경된 서열이 상응하는 조절 서열과 비교하여 하나 이상의 동의 코돈을 포함하도록 코딩 서열을 돌연변이(즉, 변경)시키는 단계를 지칭한다.
번역 속도를 검정하는 방법
본 발명은, 살모넬라(Salmonella)의 히스티딘 생합성(his) 오페론에서 전사 약독화로 불리우는 조절 메카니즘의 특성화 잇점을 취하는 번역 속도를 측정하는 검정법에 관한 것이다[참조: Chevance et al., PLOS Genetics 10(6):1-14 (2014)]. his 구조 유전자의 전사는 세포에서 하전된 히스티딜-tRNA의 수준에 의존적이고, mRNA 또는 리더 서열 펩티드 안정성과 독립적이다. his 오페론의 5'-영역은 7개 연속 His 코돈을 갖는 16개 아미노산 개방 판독 프레임을 갖는다. 하전된 His-tRNA 수준이 높으면, 약독화가 발생하고, RNA 폴리머라제가 his 오페론의 전사를 중단한다. 하전된 His-tRNA가 낮으면, 리보솜이 7개 His 코돈의 스트레치 내에 스톨하고, 약독화 메카니즘은 RNA 폴리머라제가 제한 His-tRNA에 반응하여 his 구조 유전자 내로 지속하도록 방해된다. 시스템은, 개개 코돈, 코돈 쌍, 삼중항 등을 통한 번역 속도를 측정하고 리보섬이 동일한 아미노산(소위 침묵 코돈 또는 동의 코돈)에 대해 상이한 코돈을 통해 얼마나 빨리 번역할 수 있는지를 측정하기 위해 개발되었다. 이러한 방식에서, 검정은 번역 속도, 및 하나 이상의 동의 코돈이 번역 속도에 어떻게 영향을 미치는지를 측정하기 위해 개발되었다.
예시적 시스템은 his 구조 유전자를, His 약독화를 위한 리포터로서 lac 오페론으로 치환함으로써 생성했다. lac 오페론 전사를 조절하는 his 약독화 시스템으로, 이러한 시스템은 색 지표 매질의 잇점을 취하여 약독화의 단순한 정량적 색-판독치를 제공할 수 있다. 콜로니-색 표현형에 기초하여, 약독화되거나 약독화되지 않은 his-lac 작제물의 수준을 측정한다. lac 오페론 리포터 시스템을 사용하여, 리더 펩티드의 His5 위치를 63개 코돈 모두로 치환하고, 리더 펩티드 영역에서 리보솜 스톨링 정도에 대한 개개 코돈의 효과를 측정했다(Id.). His5에서 코돈 변화에 기인하여 리보솜의 스톨링으로부터 발생된 탈-약독화의 수준을 측정했다. 정지 코돈(UAA, UAG 및 UGA)는 최고 수준의 탈-약독화를 나타냈고, 아르기닌 코돈 AGA 및 AGG는 높은 수준의 탈-약독화를 나타냈다(Id.). 단일 tRNA 종에 의해 판독되는 제3 위치 NNU 대 NNC를 비교하면, NNU의 번역은 NNC와 비교하여 높은 수준의 탈-약독화를 나타냈다(Id.). 이는, NNG가 단일 tRNA 종에 의해 동족 NNU보다 더욱 빠르게 번역되는 것을 나타내는 시험관내 연구와 일치한다.
번역 속도에 대한 코돈 컨텍스트의 효과를 측정하기 위해 이러한 번역 속도계 검정의 사용은 UCA 코돈으로 5' 및 3' 컨텍스트에서 각 코돈의 효과를 측정함으로써 추가로 증명되었다. UCA 코돈은, 하나의 필수 tRNA 종, SerT tRNA에 의해서만 번역되기 때문에 특히 유용하다. his 오페론 리더 펩티드 중의 His4-His5에 위치된 모든 UCA-NNN 및 NNN-UCA 코돈 쌍에 대한 Mac-Lac 지표 배지 상의 his-lac 발현을 측정했다. 64개 코돈 중의 22개는 코돈 컨텍스트 효과를 나타냈다. 달리 말하면, 번역 속도는 64개 코돈 중의 22개에 있어서 UCA-NNN 및 NNN-UCA 코돈 쌍에 대해 상이했다. 가장 현저한 컨텍스트 효과는 티로신 코돈으로 수득되었다. UCA-UAU 및 UCA-UAC 작제물은 정지 코돈에 의해 생성된 것들에 필적하는 탈-약독화 수준을 나타냈다. 그러나, 역 배향, UAU-UCA 및 UAC-UCA에서, 탈-약독화는 낮다. UCA-UAU 및 UCA-UAC 코돈 쌍은 낮은 속도로 번역되는 반면, 역 배향 UAU-UCA 및 UAC-UCA는 빠른 속도로 번역된다. CGU 코돈에 의한 코돈 컨텍스트 효과는 또한 현저하다. UCA-CGU 및 CGU-UCA 둘 다는 빠른 번역 속도를 나타내고, 여전히 His4-His-5 위치에서 CAU(His)-CGU는 매우 낮은 속도로 번역된다.
번역 속도를 조절하는 방법
세균은 상이한 구조 및 기능을 갖는 다양한 분비 시스템을 포함한다. 그람-음성 세균은, 예를 들면, 외부 및 내부 막 중의 하나 또는 둘 다에 걸쳐 있고 환경적 반응, 부착 또는 병원성 프로세스에서 중요한 역할을 담당하는 적어도 6개의 상이한 분비 시스템(유형 I-VI)를 포함한다[참조: Costa et al., Secretion systems in Gram-negative bacteria: structural and mechanistic insights, Nature Reviews, Microbiology 13:343-359 (2015)]. 편모 조립을 위해, 예를 들면, 세균은 분비 시스템(예: T3SS)을 사용할 수 있고, 편모 구조 및 조립에 요구되는 단백질은 세포질로부터 내보내고, 외부 막을 통과하고 성장 편모 구조를 통과한다.
살모넬라 엔테리카(Salmonella enterica) 편모는, 후크-기부 바디(HBB) 복합체로서 공지된 복잡한 모터 구조를 함유하고, 이는 세포 벽 및 막 내에 매립된다. HBB는, 세포 표면으로부터 약 10마이크론 연장하는 긴, 외부 필라멘트에 연결된다.최대 10,000 FliC 서브유닛을 포함하는 외부 필라멘트는 HBB로부터 연장한다. 각 필라멘트는 약 1%의 전체 세포 단백질을 나타낸다. 양성자 모티브는 모터-필라멘트의 회전에 동력을 제공하여, 액체 환경 및 표면에 걸쳐 세균을 추진시킨다. HBB는 또한, 구조의 중심 채널을 통해 기질의 분비를 지시하는 유형 III 분비 시스템을 함유한다. 서브유닛은, 이들이 자가 조립하는, 성장 세포기관의 선단으로 이동한다.
화학감작 시스템의 유전자를 포함하는 편모 레굴론에는 60개 이상의 유전자가 있다. 이들 유전자의 전사를 도 1에 제시된 바와 같이 편모 어셈블리에 결합된다. 편모 레굴론은 3개 프로모터 부류의 전사 계층으로 편성된다. 부류 1 오페론은 종종 마스터 오페론으로 불리우고, 전사 조절인자 FlhD 및 FlhC를 코딩한다. FlhD 및 FlhC 단백질은 복합체 FlhD4C2를 형성하고, 이는 편모 부류 2 프로모터로부터 σ70 RNA 폴리머라제-의존성 전사를 지시한다. 부류 2 프로모터로부터 발현된 유전자는 HBB 복합체의 구조 및 조립으로부터 필요한 단백질을 코딩한다. HBB 유전자에 추가하여, 몇몇 조절 단백질은 부류 2 프로모터로부터 전사되고; 이들 중에서 현저한 것은 σ28 구조 유전자, FliA, 및 항-σ28 유전자, FlgM이다. σ28 및 FlgM은, 편모 부류 3 프로모터의 전사를 HBB의 완성에 결합시키는 조절 단백질이다. σ28 단백질은, 편모 부류 3 프로모터로부터 전사하기 위해 RNA 폴리머라제를 지시하는 편모-특이적 전사 인자이다. 부류 3 유전자는 편모 필라멘트의 구조 유전자, 및 변화하는 농도의 세포외 리간드에 따라 편모 회전의 방향을 조절하는 화학감작 신호 전달 시스템의 유전자를 포함한다.
HBB 조립 동안, 편모 유형 III 분비(T3S) 시스템은 로드-후크 분비 기질에 특이적이다. HBB 완료시, T3S 장치의 FlhB 성분은 형태 변화를 겪고, 분비 특이성은 후기 또는 필라멘트-형 분비로 전환된다. HBB 완료 전에, FlgM은 편모 부류 3 프로모터로부터 σ28-의존성 전사를 억제한다. FlgM은 후기 분비 기질이고, HBB 완료 및 분비 특이성 전환시, FlgM은 세포로부터 분비되어, σ28을 방출하여 부류 3 프로모터로부터 전사한다.
FlgM 단백질은, 분비 프로세스 동안 절단되지 않은 이의 N-말단에서 분비 신호를 포함한다. T3SS를 통한 기질 분비는 종종 분비 장치로 기질의 샤프론-보조된 전달에 의해 촉진된다. 이러한 방식으로, FlgM 분비는 FlgM의 C-말단 절반에 대한 분비 샤프론 σ28의 결합에 의해 크기 증강된다.
FlgM은 작은 T3S 기질이고 최종 편모 구조의 일부가 아니기 때문에, 주변세포질 또는 세포외 환경으로 외래 단백질의 분비를 지시하는 비히클로서 사용될 수 있다. 본 발명자들은 이종성 코딩 서열에 작동적으로 연결된 FlgM 폴리뉴클레오티드 서열이 다양한 생물체에서 발현될 수 있고 편모 T3S 시스템에 의해 분비될 수 있음을 밝혀냈다(참조: U.S. PG PUB NO. 제2015/0225466호, 이의 전체가 본원에서 참조로서 도입됨). 구체적으로, 이종성 단백질에 융합된 FlgM 펩티드를 포함하는 키메라 단백질은 편모 T3SS 구조를 통해 배양 배지 내로 발현 및 분비된다(참조: U.S. PG PUB NO. 제2015/0225466호, 이의 전체가 본원에서 참조로서 도입됨). 본 발명자들은, FlgM 융합 펩티드의 발현이 유도성 및/또는 과발현 조절 서열을 사용하여 조절될 수 있음을 추가로 밝혀냈고, 이는 배지 내의 염 농도(예: NaCl 및 KCl)에 의해 조작될 수 있으며, 융합 펩티드 또는 이의 성분은 다양한 수단을 사용하여 배지로부터 단리될 수 있다(Id.).
본원의 실시예는 배양 배지 내에서 키메라 단백질의 조절된 생성 및 분비를 위한 T3SS의 용도를 추가로 증명한다. 한 가지 실시형태에서, 폴리펩티드는 인슐린이다.
본원에 사용된 바와 같이, 용어 "인슐린"은, 동물 신체에서 탄수화물의 대사에 영향을 받고 진성 당뇨병의 치료에 유용한 췌장의 활성 원리를 의미한다. 이 용어는, 구조, 용도 및 의도된 효과에 있어서 천연 존재 인슐린과 동일하거나 유사하고 진성 당뇨병의 치료에 유용한 합성 및 생물공학 유래된 생성물을 포함한다.
용어 "인슐린" 또는 "인슐린 분자"는, 서열번호 1에 제시된 아미노산 서열을 갖는 A-쇄 펩티드 및 서열번호 2에 제시된 아미노산 서열을 갖는 B-쇄 펩티드를 포함하는 51개 아미노산 헤테로이량체를 지시하는 총칭이고, 여기서 A 쇄의 위치 6 및 11에서 시스테인 잔기는 디설파이드 결합으로 연결되고, A 쇄의 위치 7에서 및 B 쇄의 위치 7에서 시스테인 잔기는 디설파이드 결합으로 연결되고, A 쇄의 위치 20에서 및 B 쇄의 위치 19에서 시스테인 잔기는 디설파이드 결합으로 연결된다. 용어 "인슐린"은 또한 인슐린 분자의 전구체를 포함한다.
본원에 사용된 용어 "인슐린 유사체"는, 천연 A-쇄 펩티드 및/또는 B-쇄 펩티드의 하나 이상의 변형(들)을 포함하는 임의의 헤테로이량체 유사체를 포함한다. 변형은, 이로써 한정되지 않지만, A4, A5, A8, A9, A10, A12, A13, A14, A15, A16, A17, A18, A19, A21, B1, B2, B3, B4, B5, B9, B10, B13, B14, B15, B16, B17, B18, B20, B21, B22, B23, B26, B27, B28, B29 및 B30로부터 선택된 위치에서 천연 아미노산을 아미노산으로 치환시키는 것; 및/또는 위치 B1-4 및 B26-30 중의 어느 하나 또는 모두를 결실시키는 것을 포함한다. 인슐린 유사체는, A-쇄 펩티드 및/또는 B-쇄 펩티드의 N 또는 C 말단에서 1 내지 10개 아미노산을 갖는 분자를 포함한다. 인슐린 유사체는 A-쇄 펩티드 및/또는 B-쇄 펩티드의 C-말단에서 아미드화된 분자를 추가로 포함한다. 인슐린 유사체의 예는, 이로써 한정되지 않지만, 국제 출원 제WO20100080606호, 제WO2009/099763호 및 제WO2010080609호에 개시된 헤테로이량체 유사체를 포함하고, 이의 개시는 본원에서 참조로서 도입된다. 인슐린 글라르긴(Gly(A21), Arg(B31), Arg(B32)-인간 인슐린), 인슐린 리스프로(Lys(B28), Pro(B29)-인간 인슐린, 인슐린 글루실린(Lys(B3), Glu(B29)-인간 인슐린) 및 인슐린 디테미르(Lys-미리스트산(B29)-인간 인슐린)은 상업적으로 이용가능한 인슐린 유사체의 예이다.
용어 "인슐린 유사체"는, 인슐린 수용체에서 검출가능한 활성을 거의 또는 전혀 갖지 않지만, 천연 인슐린과 비교하여 인슐린 수용체에서 적어도 1%, 10%, 50%, 75% 또는 90%의 활성을 갖는 인슐린 수용체에서 활성을 갖도록 하나 이상의 아미노산 변형 또는 치환을 포함하도록 변형된 헤테로이량체 폴리펩티드 분자를 추가로 포함한다. 특정 측면에서, 인슐린 유사체는, 천연 인슐린과 동일하게 인슐린 수용체에서 2배 내지 100배 낮은 활성을 갖는 부분 효능제이다. 다른 측면에서, 인슐린 유사체는 인슐린 수용체에서 증강된 활성을 갖는다.
편모 분비 시스템 유전자 내의 동의 코돈 돌연변이를 사용하는 발현 시스템 및, 이러한 돌연변이 작동적으로 부가되는 경우, 이종성 폴리뉴클레오티드 번역을 조절하는 방법이 본원에 추가로 기재되어 있다. 본 발명의 동의 코돈 돌연변이유발은 숙주 세포(생물)의 코돈 사용(바이어스)에 의존하는 전통적 코돈 최적화와는 상이하다. 코돈 사용 바이어스는 특정 코돈이 특정 생물에 의해 사용되는 상대적 양에 의존한다. 당해 기술분야의 숙련가는 생물 사이에서, 아미노산에 대한 하나의 동의 코돈이 동일한 아미노산에 대한 다른 동의 코돈과 비교하여 더욱 보급되어 있음을 장기간 동안 인식하고 있다(즉, 생물은 특정 동의 코돈의 사용에 대해 "선호"하거나 "바이어스"를 갖는다). 다양한 생물은 상이한 동의 코돈을 선호할 수 있고, 또는 상이한 코돈 사용 바이어스를 갖는다.
에스케리키아 콜라이(Escherichia coli) 및 살모넬라 엔테리카(Salmonella enterica)에서 코돈 사용 빈도의 표는 하기에 제시되어 있다. 여기서, 보다 높은 사용 빈도 값은 동의 코돈에 대해 보다 큰 바이어스(선호)에 상응한다(WorldWideWeb.sci.sdsu.edu/~smaloy/MicrobialGenetics/topics/rev-sup/wobble.html, last visited November 15, 2015에서 이용가능함). 또한 코돈 바이어스 데이터베이스[참조: (WorldWideWeb.homepages.luc.edu/~cputonti/cbdb/genera/shigella.html) 및 Hilterbrand, et al. (CBDB: The codon bias database, BMC Bioinformatics 13(62):1-7 (2012)]를 참조한다.
이. 콜라이 및 에스. 티피무리움1에서 코돈 선호
1 수는 이. 콜라이 및 에스. 티피무리움에서 약 450,000 유전자의 DNA 서열에 기초하여 1000 코돈당 코돈 사용의 평균 빈도를 나타낸다. 일부 추가 코돈 빈도는 밀러[참조: Miller(1992)]에서 발견할 수 있다.
일반적으로, 예를 들면, 숙주 세포 내의 이종성 폴리뉴클레오티드 서열의 발현을 위한 숙주 세포의 선호 동의 코돈의 존재는 번역 효율의 증가를 제공했다. 종래의 코돈 최적화 기술은, 번역 효율의 증가시키기 위해 숙주 세포의 선호 코돈이 존재하거나 번역 효율을 감소시키기 위해 부재하도록 코딩 서열을 돌연변이시킴으로써 코돈 사용 바이어스를 이용한다.
유전자 발현을 증가 또는 감소시키는, 살모넬라(Salmonella) 유형 III 분비 시스템의 fliA, fliC 및 flgM 유전자에서 동의 코돈 돌연변이가 단리되었다. fliA에 있어서, GAU로부터 GAC로의 동의 코돈 13(Asp) 변화는 생성된 σ28 단백질에서 약 2배 증가를 제공했다[참조: Barker, C. S., et al., Assembling Flagella in Salmonella Mutant Strains Producing a Type III Export Apparatus without FliO, J. Bacteriol. 196(23):4001-4011 (2014)]. 유사하게는, 살모넬라(Salmonella) T3SS의 fliC 유전자에 있어서, UUG로부터 CUG로의 동의 코돈 13(Leu) 변화는 약 1배 더 많은 FliC 단백질을 생성했고, 코돈 14(Thr)에서 ACC로부터 ACA 또는 ACG로의 동의 코돈 변화는 각각 약 2배 및 약 1.5배 더 많은 FliC 단백질을 생성했다[참조: Rosu, V., et al., Translation Inhibition of the Salmonella fliC Gene by the FliC 5' Untranslated Region, fliC Coding Sequences, and FlgM, J. Bacteriol. 188(12):4497-4507 (2006)].
예를 들면, 상기 표에 도시된 바와 같은 코돈 사용 바이어스에 기초하여, GAC(22)보다 ASP GAU 코돈(33)에 대한 살모넬라(Salmonella)의 선호는 놀랍게도 GAC 코돈을 사용한 단백질 생성에서 적어도 약 2배 증가시킨다[참조: Barker et al., supra]. 마찬가지로, ACA(6) 및 ACG(15) 코돈에 비해 Thr ACC 코돈(25)에 대한 선호는 놀랍게도 각각 ACA 및 ACG 코돈을 사용하는 단백질 생성에서 적어도 약 2배 및 1.5배 증가를 가져온다[참조: Rosu et al., supra].
실시예
세균 균주 및 배지
살모넬라 엔테리카(Salmonella enterica) 혈청형 티피무리움 LT2의 통상 사용된 비-병원성 균주를 모든 실험을 위해 사용했다. LT2는, 이를 비병원성으로 되게 하는, ropS 및 mviA 유전자에서 돌연변이를 갖는다[참조: Yarus, Rates of aminoacyl-tRNA selection at 29 sense codons in vivo, J. Mol. Biol. 209: 65-77 (1989); Hughes & providing transposition functions to defective transposons, Genetics 119: 9-12 (1988); Johnston & Roth, Genetic analysis of the histidine operon control region of Salmonella typhimurium, J. Mol. Biol. 145: 713-734 (1981)]. mviA 유전자는 살모넬라(Salmonella) 병원성에 관여하는 2성분 시스템의 조절인자를 코딩한다. rpoS 유전자 생성물(정지상 시그마 전사 인자)은 복수의 병원성 인자의 발현에 요구된다. 살모넬라(Salmonella)의 병원성 경로 내의 2개 돌연변이는 병원성의 약독화를 제공한다.
세포는 루리아-베르타니(LB) 배지에서 배양하고, 필요한 경우, 암피실린(100 ㎍/밀리리터) 또는 테트라사이클린(15 ㎍/밀리리터)를 보충했다. 에스. 티피무리움 P22 HT105/1 int-201의 일반화된 형질도입 파지를 모든 형질도입 교배에 사용했다[참조: Johnston & Roth, DNA sequence changes of mutations altering attenuation control of the histidine operon of Salmonella typhimurium, J. Mol. Biol. 145: 735-756 (1981)].
균주 작제
표적화된 염색체 돌연변이유발은 문헌[참조: Datsenko and Wanner (One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products, PNAS 97: 6640- 6645 (2000)]에 기재된 바와 같이 tetRA 삽입 및 L-Red 리콤비나제 시스템으로의 치환을 통해 수행했다.
모든 프라이머는 인테그레이티드(Integrated) DNA 기술(Coralville, IA)에 의해 합성했다. 모든 PCR 반응은 프루프 판독 폴리머라제를 사용하여 수행했다[참조: Accuprime Pfx, Invitrogen or Phusion, Fermenta]. L-Red에 의해 매개된 재조합 생성물은 Taq DNA 폴리머라제를 사용하여 PCR-검사하고, 추가로 서열분석했다.
번역-최저속 코돈 쌍의 스크리닝
저속 쌍 또는 고속 쌍을 함유하는 균주는 상기 기재된 바와 같이 L-Red 재조합을 사용하여 작제했다. 전기천공 및 무수 테트라사이클린 플레이트 상에 플레이팅 후, 플레이트를 맥콘케이(MacConkey)-락토즈 및 테트라졸리움-락토즈 지시약 플레이트 상에 복제했다. 테트라졸륨 플레이트(Lac+) 상의 백색 콜로니를 단리하고 DNA 서열 분석을 위해 수송했다. T-N-N 코돈을 특이적으로 회피하여 정지 코돈의 단리를 방지했다. Tz-Lac 스크리닝을 사용하여 His 리더 시스템에서 번역-저속 및 번역-고속 코돈 쌍을 동정했다.
β-갈락토시다제 검정
30마이크로리터의 밤새 배양물을 3ml의 신선한 LB 배지에 계대배양했다. 튜브를 37℃에서 진탕하면서 내용물이 OD 0.4의 중간-대수-밀도에 도달할 때까지 배양했다. 배양물을 아이스 상에 놓고, 스펀 다운하고, 3ml의 냉-완충된 염수에 재현탁시켰다. 0.5ml의 배양 샘플(필요한 경우 희석시킴)을 0.55ml의 완전 Z-완충액(Z-완충액 + 5ml의 10% 나트륨 도데실 설페이트 및 100ml의 클로로포름)에 첨가했다[참조: Stanley R. Maloy, Experimental Techniques in Bacterial Genetics. (Jones and Bartlett Publishers, Inc. 1990)]. 검정은 상기 기재된 바와 같이 계속했다(Id.). 각 균주에 대해, 3개 독립적 생물학적 복제에 대해 검정을 실시했다.
질환 또는 상태와 연관된 코딩 서열에서 동의 코돈 쌍의 종정
질환 또는 상태와 연관된 폴리뉴클레오티드 서열(예: 코딩 서열) 내의 동의 코돈 돌연변이의 검색은, 예를 들면, 데이터베이스를 사용하여 수행한다. 동의 돌연변이는 임의의 추가 돌연변이(삽입 및 결실 포함)와 독립적이다. 동의 돌연변이는 양측에 인접하는 15개 염기 쌍 서열에 기초하여 해석된다. 폴리뉴클레오티드 서열의 발현(예를 들면, 코딩된 단백질의 발현)에 대해 동의 코돈 돌연변이가 갖는 효과는 동의 코돈 돌연변이된/변경된 (SCA) 폴리뉴클레오티드 서열을 숙주 세포 내로 도입하고 숙주 세포를 폴리뉴클레오티드 발현에 충분한 조건하에 배양함으로써 검증한다. 임의의 효과는 비교가능한 대조군 세포 내의 야생형 폴리뉴클레오티드 발현과 비교하여 결정한다. 수득된 단백질 생성은 SDS-PAGE 및 웨스턴 블롯에 의해 결정한다.
SDS-PAGE 및 웨스턴 블롯
FlgM(및 임의로 폴리-히스티딘 정제 태그)를 포함하는 발현된 키메라 단백질, 또는 동의 코돈 돌연변이된 폴리뉴클레오티드 서열로부터 발현된 폴리펩티드는 전체 세포 용해물 또는 배양 상청액으로부터 회수하고, SDS 폴리아크릴아미드 겔 전기영동에 적용한 다음, 폴리클로날 항-FlgM 항체, 모노클로날 항-6xHis(래빗) 항체, 또는 검출을 위한 항-폴리펩티드 항체를 사용한 면역블롯에 의해 분석했다. 항원-항체 복합체는 LI-COR 오디세이 또는 Bio-Rad ChemiDoc 영상화 시스템을 사용하여 화학발광 또는 적외선 검출에 의해 가시화한다. 화학발광 발색을 위해, 호세라디쉬 퍼옥시다제(HRP) 및 ECL 검출 키트(Amersham Biosciences)와 접합된 이차 염소 항-래빗 항체(Bio-Rad)가 사용된다. 적외선 검출을 위해, 이차 항-래빗 IRDye690(LI-COR)이 사용된다. 단백질 밴드의 농도 측정은 Mac OS X를 위한 ImageJ 1.45s를 사용하여 수행한다[참조: Abramoff et al., Image processing with ImageJ, Biophotonics Int. 11:36-42(2004)].
단백질 융합체의 재조합 발현 및 정제
최적화된 융합 단백질을 발현하는 세포는 신선한 단일 콜로니로부터 채취하고, 밤새 10ml LB에서 성장시켰다. 밤새 배양물을 배플 플라스크에서 1리터의 신선한 배지로 1:100 희석시키고, 6 내지 12시간 동안 200rpm으로 진탕 배양기에서 성장시킨다. 적절한 경우, 발현은 0.2% 아라비노즈 또는 Na-살리실레이트의 첨가에 의해 처음 2시간 후에 발현을 유도한다. 세포를 원심분리(7,000rpm)에 의해 펠렛화하고, 목적하는 재조합 폴리펩티드를 함유하는 상청액은 잔류 세균의 제거를 위해 0.22-㎛ 폴리에틸렌설폰 필터(Corning, NY), 저-분자-결합 막에 통과시킨다. 추가의 정제를 위해, 3g NiIDA 수지(Protino Ni-IDA; Machery-Nagel)가 충전된 중력 유동 컬럼(Bio-Rad)을 사용하고, 친화성-태그된 단백질을, 250mM 이미다졸을 함유하는 완충액으로 pH 7.5에서 음성 조건하에 용출시킨다.
분비 검정
밤새 배양물을 LB에서 1:100으로 희석시키고, 37℃에서 2시간 동안 성장시킨 다음, 0.2% L-아라비노즈를 첨가하여 각각의 FlgM 융합체의 발현을 유도한다. 세포를 추가로 4 내지 12시간 동안 37℃에서 유지하면서, 융합 단백질을 발현시킨다. 이어서, 600nm에서의 광학 밀도(OD600)를 모든 균주에 대해 측정한다.
수득된 세포 배양물의 2-밀리리터 분액을 4℃ 및 7,000rpm에서 10분 동안 원심분리하여, 각각의 분액에 대해, 펠렛 및 상청액을 수득한다. 상청액을 0.2㎛ 기공 크기(Acrodisk 시린지 필터; Pall Life Sciences)로 저-단백질-결합 필터를 통해 여과하여 잔류하는 세포를 제거한다. 또는, 분액을 최대 속도로 2회 원심분리하여 잔류 세포를 제거한다. 여과된 또는 2회-원심분리된 상청액 중의 분비된 단백질은 TCA(10% 최종 농도)의 첨가에 의해 침전시킨다. 상청액 샘플을 2μL SDS 샘플 완충액(100mM 트리스[pH 6.8], 4% SDS, 10% 글리세롤, 2% B-머캅토에탄올, 25mM EDTA, 0.04% 브로모페놀 블루)에 재현탁시키고, 20 OD600 단위/μ로 조정한다. 세포 펠렛 분획을 2% SDS 샘플 완충액에 현탁시키고, 이의 용적을 조정하여 20 OD600 단위/μ를 수득한다.
실시예 1: 번역에 대한 동의 코돈 돌연변이체의 효과
편모 항-σ28 유전자의 아미노산 Ser7에 대해 UCA를 번역하는 것에 결함이 있는 SerT tRNA의 대립유전자, flgM를 단리했다[참조: Chevance, F. F., et al., J Bacteriol 188:297-304 (2006)]. 살모넬라(Salmonella) 편모 시스템에서 세린에 대한 UCA 코돈을 갖는 다수의 유전자가 존재함에도 불구하고, serT tRNA 대립유전자만이 flgM 번역에 영향을 미쳤다. 이론에 국한시키고자 하는 것은 아니지만, flgM의 UCA(Ser7) 코돈의 번역에 대한 serT 돌연변이 대립유전자의 효과는 코돈-컨텍스트 효과인 것으로 생각된다.
σ28-의존성 프로모터로부터의 전사는 FlgM에 의해 억제된다. 리포터로서 세균 루시퍼라제 오페론(lux)를 사용하여, FlgM의 항-σ28 활성을 측정했다. FlgM 활성이 높은 경우, P motA -lux의 σ28-의존성 전사는 낮다. 동의 돌연변이를 위치 Ser7에 인접하게 도입하고, flgM mRNA 번역에 대한 인접 동의 돌연변이의 효과를 측정했다.
flgM의 UCA Ser7에 인접하는 Thr6 및 Pro8 코돈의 동의 변화의 모든 16개 조합을 제조했다. σ28-의존성 P motA -lux 전사의 FlgM 억제를 측정했다. 결과는 도 2에 제시되어 있다.
ACU, ACA 또는 ACG에 대한 Thr6에서의 동의 변화는 FlgM 억제 활성의 약 11 내지 13배 증가를 생성한다. CCU에서 CCG로의 동의 Pro8 코돈 변화는 FlgM 억제 활성의 약 20배 감소를 제공한다. Thr6에서 ACC에서 ACU로의 변화와 Pro8에서 CCU에서 CCG로의 변화와의 조합은 FlgM 억제 활성의 약 34배 증가를 제공한다. 이들 결과는 코돈 번역의 효율이 최대 2개의 인접한 코돈에 의해 영향을 받는 것을 입증한다(도 2 참조).
실시예 2: FlgM
의 동의 유전자돌연변이유발을 사용한 폴리뉴클레오티드의 조절
Pro8에서 CCU에서 CCG로의 변화를 포함하는 flgM 서열로 출발하여, 아미노산 2 내지 25를 코딩하는 flgM 유전자의 영역은, 평균적으로, 각각의 올리고뉴클레오티드가 아미노산 2 내지 25에 대해 동의 코돈 변화를 갖도록 설계된 도핑된 올리고뉴클레오티드 돌연변이유발을 사용하여 변형시켰다. 결과는 도 3에 제시된 바와 같다.
Pro8 이전의 2개 코돈 및 Pro9 CCG 이후의 Leu9 코돈에서 동의 변화만이 야생형 GlgM 억제 활성으로의 회복을 제공했다. 이들 결과는 특정 코돈의 번역 효율이 인접하는 2개 코돈에 의존하는 것을 입증한다.
FlgM의 아미노산 Thr6-Ser7-Pro8-Leu9를 코딩하는 동의 변화는 FlgM 단백질 수준에서 약 2배 범위를 제공한다. 그러나, FlgM은 σ28-의존성 fliC 전사를 억제하는 조절 단백질이기 때문에, FlgM 단백질 수준에서 약 2배 범위는 fliC 전사 활성에서 약 1000배 이상 범위를 생성한다. 예를 들면, CCU로부터 CCG(프롤린을 코딩)로 flgM의 코돈 8에서 동의 코돈 변화는 약 2배 더 낮은 FlgM 단백질 수준을 제공했다. FlgM 단백질 수준에서 약 20배 감소는 σ28-의존성 fliC 프로모터의 전사에서 약 20배 증가를 제공했다.
실시예 3: FlgM의 동의 돌연변이유발을 사용한 이종성 폴리뉴클레오티드 번역의 조절
lacZ의 최초 10개 코돈을 flgM의 최초 10개 코돈으로 치환했고, flgM 서열은 Pro8에서 CCU에서 CCG로의 동의 코돈 변화를 포함하도록 돌연변이시켰다(5'에서 3' 방향으로, 프롤린을 코딩하는 flgM의 코돈 수 8). 상기 결과와 일치하게, 컨텍스트-코돈-최적화된 flgM 서열의 조절하에 이종성 lacZ 서열의 발현은 감소된 β-갈락토시다제 활성을 제공했다. β-갈락토시다제 활성은 약 210에서 150단위로 감소했다.
이들 결과는, 폴리펩티드(여기서는 lacz)를 코딩하는 폴리뉴클레오티드 서열이 컨텍스트-코돈-최적화된 FlgM 서열(SCM FlgM)에 작동적으로 연결되고 발현되어 세균 분비 시스템(여기서는 조작된 T3SS)를 통해 분비되는 경우, FlgM의 하나 이상의 Thr6-Ser7-Pro8-Leu9에서 동의 변화가 이종성 단백질 생성(여기서는 LacZ)을 초래한다는 것을 입증한다.
본 발명의 분비 시스템을 사용하여 재조합에 의해 생성될 수 있는 예시적 폴리펩티드는 하기 표 1에 수록되어 있다.
단백질 | 예시적 서열 정보 |
인슐린(인간) | A 쇄: GIVEQCCTSICSLYQLENYCN B 쇄: FVNQHLCGSHLVEALYLVCGERGFFYTPKT |
인슐린 글라르긴(인간) | A 쇄: GIVEQCCTSICSLYQLENYCG B 쇄: FVNQHLCGSHLVEALYLVCGERGFFYTPKTRR |
인슐린 프리-프로인슐린(인간) | UniProtKB 수탁 번호 P01308 및 GenBank 수탁 번호 CAA49913 참조[Chekhranova et al., Mol. Biol. 26(3): 596-600 (1992)]: MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAED LQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 예시적 mRNA 서열은 GenBank 수탁 번호 X70508 [Chekhranova et al., Mol. Biol. 26(3): 596-600 (1992)]에서 이용가능하다. |
인슐린 리소프로 | A 쇄: GIVEQCCTSICSLYQLENYCN B chain: FVNQHLCGSHLVEALYLVCGERGFFYTKPT |
MaSp1 (주요 앰풀레이트 스피드로인 1; 거미 실크 단백질) (예를 들면, 네필라(Nephila) 거미로부터 MaSp1A 또는 MaSp1B 포함) | Gaines and Marcotte, Insect Mol. Biol. 17(5): 465-474 (2008); US 특허 제8,642,734호(이의 전체가 본원에서 참조로서 도입됨); US 특허 제7,521,228호(이의 전체가 본원에서 참조로서 도입됨); US PG PUB NO. 제2014/0093965호(이의 전체가 본원에서 참조로서 도입됨). |
MaSp2 (주요 앰풀레이트 스피드로인 2; 거미 실크 단백질) | US 특허 제8,642,734호(이의 전체가 본원에서 참조로서 도입됨); US 특허 제7,521,228호(이의 전체가 본원에서 참조로서 도입됨); US PG PUB NO. 제2014/0093965호(이의 전체가 본원에서 참조로서 도입됨).. |
실시예 4: α T3SS
를 사용한 이종성 단백질 생성의 조절
인간 인슐린 글라르긴 핵산 서열, 폴리-히스티딘 뉴클레오티드 서열, 엔테로키나제 절단 부위 및 ParaBAD 프로모터에 작동적으로 연결된 전장 야생형 FlgM 폴리뉴클레오티드 서열을 포함하는 핵산 분자를 살모넬라 엔테리카(Salmonella enterica) 혈청형 티피무리움(Typhimurium) 세포에 도입하고 발현시켰다. 살모넬라(Salmonella) 세포를 본 발명자에 의해 이전에 기재된 몇몇 T3S 유전자 내에서 변형시키고(U.S. PG PUB NO. 제2015/0225466호, 이의 전체가 본원에서 참조로서 도입됨), 구체적으로 하기를 포함했다: ParaBAD 1::flgM-His6-ETK-인슐린 글라르긴 ΔflgMN7753 ΔflgKL7770 PflhDC7793 fliA*5225 ΔfliB-T7771 fljB enx vh2(균주 TS1으로 지칭됨). FlgM::인슐린 키메라 단백질은 세포에 의해 분비되었고, 항-6xHis 항체를 사용한 웨스턴 블롯에 의해 검출되었다. 결과는 도 4에 제시되어 있다.
실시예 5: T3SS 및 동의 돌연변이유발을 사용한 이종성 단백질 생성의 조절
조작된 살모넬라(Salmonella) T3SS로부터 인간 인슐린의 분비는, 폴리-히스티딘 정제 태그 핵산 서열, 절단 부위(예: 엔테로키나제 절단 부위), 및 인간 인슐린의 A 및 B 쇄를 코딩하는 폴리뉴클레오티드 서열에 작동적으로 연결되는 FlgM 뉴클레오티드 서열(야생형 또는 동의 코돈 돌연변이된 FlgM 서열)을 살모넬라(Salmonella) 세포 내에 도입하여 발현시킴으로써 추가로 최적화시킬 수 있고, 여기서 인간 인슐린 B 쇄 서열은 동의 코돈 돌연변이를 포함한다. 예를 들면, 인간 인슐린 B 쇄 내의 2개 인접한 아르기닌 잔기를 컨텍스트 코돈 최적화시켜 인슐린 발현 및 T3SS를 통한 분비를 증가시킬 수 있다. 특히, 야생형 인접한 아르기닌 코돈 CGC 및 CGG(5'에서 3' 방향으로)은 CGU 및 CGU; CGU 및 CGC; CGC 및 CGU; CGC 및 CGC; 또는 CGG 및 CGC로 돌연변이시킬 수 있다. N-말단에서 C-말단 방향으로, 폴리-히스티딘 정제 태그, 절단 부위 및 인간 인슐린을 코딩하는 핵산 서열을 포함하는 예시적 작제물은 서열번호 16에 제공되어 있다. 서열번호 16에 의해 제공된 서열은 본원의 다른 곳 및 본 발명자들에 의해 U.S. PG PUB NO. 제2015/0225466호(이의 전체가 본원에서 참조로서 도입됨)에 기재된 FlgM 서열에 부착될 수 있다. 동의 코돈 최적화된 아르기닌 코돈의 수득되는 쌍은 증가된 인간 인슐린 발현 및 분비를 유발할 것으로 예상된다. FlgM, 폴리-히스티딘 정제 태그, 절단 부위 및 인슐린을 포함하는 키메라 단백질은 상기 기재된 바와 같이 검출하고 정제할 수 있다. 인슐린 단백질은 상기 기재된 바와 같이 키메라 단백질로부터 단리할 수 있다.
서열 식별자 | 서열 기재 | 서열 (5'에서 3' 방향으로 또는 N-말단에서 C-말단 방향으로 기재됨) |
1 | 야생형 FlgM 단백질의 최초 10개 아미노산 잔기(서열번호 3의 최초 10개 잔기에 상응). | MSIDRTSPLK |
2 | 야생형 FlgM mRNA 서열의 최초 10개 코돈(즉, 30 뉴클레오티드) | ATGAGCATTGACCGTACCTCACCTTTGAAA |
3 | 전장 97 잔기 야생형 FlgM 아미노산 서열[Gillen and Hughes, J. Bacteriology 173(20): 6453-6459 (1991); 예를 들면, GenBank 수탁 번호 AAA27075 및 UniProtKB 수탁 번호 P26477로 공개적으로 이용가능]. 밑줄친 최초 10개 잔기(즉, 서열번호 1). | MSIDRTSPLKPVSTVQTRETSDTPVQKTRQEKTSAATSASVTLSDAQAKLMQPGVSDINMERVEALKTAIRNGELKMDTGKIADSLIREAQSYLQSK |
4 | 야생형 FlgM 유전자 서열[Gillen and Hughes, J. Bacteriology 173(20): 6453-6459 (1991); 예를 들면, GenBank 수탁 번호 M74222에서 공개적으로 이용가능]. 밑줄친 코딩 영역(즉, 서열번호 5). 볼드체의 이의 최초 10개 코돈(즉, 서열번호 2). | AATATTCTTATTAACCTATAATTGTGTAAAGATTTTGTCGCGGCTGCCGATGAGATATTCAACCATGATGGTAGCTGGCCGCTACAACGTAACCCTCGATGAGGATAAATAA ATGAGCATTGACCGTACCTCACCTTTGA AA CCCGTTAGCACTGTCCAGACGCGCGAAACCAGCGACACGCCGGTACAAAAAACGCGTCAGGAAAAAAC GTCCGCCGCGACGAGCGCCAGCGTAACGTTAAGCGACGCGCAAGCGAAGCTCATGCAGCCAGGCGTCAGC GACATTAATATGGAACGCGTCGAAGCATTAAAAACGGCTATCCGTAACGGTGAGTTAAAAATGGATACGG GAAAAATAGCAGACTCGCTCATTCGCGAGGCGCAGAGCTACTTACAGAGTAAATAAGCGTATGACTCGTT TGTCAGAAATACTTGACCAGATGACCACCGTCCTGAATGACCTGAAGACGGTGATGGACGCCGAGCAACA ACAGCTTTCCGTAGGCCAGATTAACGGCAGCCAGCTACAGCGTATTACAGAAGAAAAAAGCTCGTTGCTG GCGACGCTGGATTATCTGGAACAACAGCGCCGTCTGGAGCAGAATGC |
5 | 전장 야생형 FlgM 코딩 영역 및 정지 코돈(서열번호 4의 뉴클레오티드 113 내지 406에 상응, 밑줄친 정지 코돈). | atgagcattgaccgtacctcacctttgaaacccgttagcactgtccagacgcgcgaaaccagcgacacgccggtacaaaaaacgcgtcaggaaaaaacgtccgccgcgacgagcgccagcgtaacgttaagcgacgcgcaagcgaagctcatgcagccaggcgtcagcGacattaatatggaacgcgtcgaagcattaaaaacggctatccgtaacggtgagttaaaaatggatacgggaaaaatagcagactcgctcattcgcgaggcgcagagctacttacagagtaaataa |
6 | 전장 야생형 FlgM mRNA(볼드체의 최초 10개 코돈(즉, 서열번호 2에 상응하는 mRNA 서열), 밑줄친 정지 코돈). | AUGAGCAUUGACCGUACCUCACCUUUGAAACCCGUUAGCACUGUCCAGACGCGCGAAACCAGCGACACGCCGGUACAAAAAACGCGUCAGGAAAAAACGUCCGCCGCGACGAGCGCCAGCGUAACGUUAAGCGACGCGCAAGCGAAGCUCAUGCAGCCAGGCGUCAGCGACAUUAAUAUGGAACGCGUCGAAGCAUUAAAAACGGCUAUCCGUAACGGUGAGUUAAAAAUGGAUACGGGAAAAAUAGCAGACUCGCUCAUUCGCGAGGCGCAGAGCUACUUACAGAGUAAAUAA |
7 | AGCSer2AGT 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGTATTGACCGTACCTCACCTTTGAAA |
8 | ACCThr6ACA 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGCATTGACCGTACATCACCTTTGAAA |
9 | ACCThr6ACG 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGCATTGACCGTACGTCACCTTTGAAA |
10 | ACCThr6ACT 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGCATTGACCGTACTTCACCTTTGAAA |
11 | TCASer7TCG 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGCATTGACCGTACCTCGCCTTTGAAA |
12 | TCASer7TCC 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGCATTGACCGTACCTCCCCTTTGAAA |
13 | TCASer7TCT 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGCATTGACCGTACCTCTCCTTTGAAA |
14 | CCTPro8CCG 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGCATTGACCGTACCTCACCGTTGAAA |
15 | TTGLeu9TTA 동의 코돈 돌연변이 트리아콘타뉴클레오티드 flgM 서열. 밑줄친 돌연변이. | ATGAGCATTGACCGTACCTCACCTTTAAAA |
16 | 폴리-히스티딘 정제 태그 서열(볼드체), 절단 부위(밑줄) 및 프리-프로 인슐린 서열(볼드체 및 밑줄의 B 쇄 및 볼드체 및 이중 밑줄의 A 쇄)를 포함하는 인간 인슐린 글라르긴 작제물. | ATG CAT CAT CAT CAT CAT CAT GGT GGC CGC TTT GTG AAC CAA CAC CTG TGC GGC TCA CAC CTG GTG GAA GCT CTC TAC CTA GTG TGC GGG GAA CGA GGC TTC TTC TAC ACA CCC AAG ACC CGC CGG GAG GCA GAG GAC CTG CAG GTG GGG CAG GTG GAG CTG GGC GGG GGC CCT GGT GCA GGC AGC CTG CAG CCC TTG GCC CTG GAG GGG TCT CTG CAG GCG CGT GGC ATT GTG GAA CAA TGC TGT ACC AGC ATC TGC TCC CTC TAC CAG CTG GAG AAC TAC TGC GGC TAG |
요약 및 요약 섹션이 아닌 상세한 설명 섹션은 특허청구범위를 해석하기 위해 사용되는 것이 의도되는 것을 이해해야 한다. 요약 및 요약 섹션은 본 발명자(들)에 의해 검토되는 바와 같이, 본 발명의 하나 이상, 그너나 전부는 아닌 예시적 실시형태를 기재하고, 따라서 어떠한 방식으로도 본 발명 및 첨부된 특허청구범위를 한정하는 것은 아니다. 본원에서 인용된 모든 특허, 특허 출원 및 참조문헌은 이들의 전체가 참조로서 도입된다.
본 발명은 특정의 기능의 실시 및 이의 관계를 설명하는 기능적 구성 블록의 도움으로 상기 기재되었다. 이들 기능적 구성 블록의 경계는 설명의 편의를 위해 본원에서 임의로 정의되어 있다. 특정한 기능 및 이의 관계가 적절하게 실시되는 한, 대체 경계를 정의할 수 있다.
SEQUENCE LISTING
<110> UNIVERSITY OF UTAH RESEARCH FOUNDATION
<120> COMPOSITIONS FOR ADJUSTABLE RIBOSOME TRANSLATION SPEED AND
METHODS OF USE
<130> IPA180500-US
<140> PCT/US2016/055162
<141> 2016-10-03
<150> 62/236,477
<151> 2015-10-02
<150> 62/263,404
<151> 2015-12-04
<160> 23
<170> PatentIn version 3.5
<210> 1
<211> 10
<212> PRT
<213> Salmonella typhimurium
<400> 1
Met Ser Ile Asp Arg Thr Ser Pro Leu Lys
1 5 10
<210> 2
<211> 30
<212> DNA
<213> Salmonella typhimurium
<400> 2
atgagcattg accgtacctc acctttgaaa 30
<210> 3
<211> 97
<212> PRT
<213> Salmonella typhimurium
<400> 3
Met Ser Ile Asp Arg Thr Ser Pro Leu Lys Pro Val Ser Thr Val Gln
1 5 10 15
Thr Arg Glu Thr Ser Asp Thr Pro Val Gln Lys Thr Arg Gln Glu Lys
20 25 30
Thr Ser Ala Ala Thr Ser Ala Ser Val Thr Leu Ser Asp Ala Gln Ala
35 40 45
Lys Leu Met Gln Pro Gly Val Ser Asp Ile Asn Met Glu Arg Val Glu
50 55 60
Ala Leu Lys Thr Ala Ile Arg Asn Gly Glu Leu Lys Met Asp Thr Gly
65 70 75 80
Lys Ile Ala Asp Ser Leu Ile Arg Glu Ala Gln Ser Tyr Leu Gln Ser
85 90 95
Lys
<210> 4
<211> 607
<212> DNA
<213> Salmonella typhimurium
<400> 4
aatattctta ttaacctata attgtgtaaa gattttgtcg cggctgccga tgagatattc 60
aaccatgatg gtagctggcc gctacaacgt aaccctcgat gaggataaat aaatgagcat 120
tgaccgtacc tcacctttga aacccgttag cactgtccag acgcgcgaaa ccagcgacac 180
gccggtacaa aaaacgcgtc aggaaaaaac gtccgccgcg acgagcgcca gcgtaacgtt 240
aagcgacgcg caagcgaagc tcatgcagcc aggcgtcagc gacattaata tggaacgcgt 300
cgaagcatta aaaacggcta tccgtaacgg tgagttaaaa atggatacgg gaaaaatagc 360
agactcgctc attcgcgagg cgcagagcta cttacagagt aaataagcgt atgactcgtt 420
tgtcagaaat acttgaccag atgaccaccg tcctgaatga cctgaagacg gtgatggacg 480
ccgagcaaca acagctttcc gtaggccaga ttaacggcag ccagctacag cgtattacag 540
aagaaaaaag ctcgttgctg gcgacgctgg attatctgga acaacagcgc cgtctggagc 600
agaatgc 607
<210> 5
<211> 294
<212> DNA
<213> Salmonella typhimurium
<400> 5
atgagcattg accgtacctc acctttgaaa cccgttagca ctgtccagac gcgcgaaacc 60
agcgacacgc cggtacaaaa aacgcgtcag gaaaaaacgt ccgccgcgac gagcgccagc 120
gtaacgttaa gcgacgcgca agcgaagctc atgcagccag gcgtcagcga cattaatatg 180
gaacgcgtcg aagcattaaa aacggctatc cgtaacggtg agttaaaaat ggatacggga 240
aaaatagcag actcgctcat tcgcgaggcg cagagctact tacagagtaa ataa 294
<210> 6
<211> 294
<212> RNA
<213> Salmonella typhimurium
<400> 6
augagcauug accguaccuc accuuugaaa cccguuagca cuguccagac gcgcgaaacc 60
agcgacacgc cgguacaaaa aacgcgucag gaaaaaacgu ccgccgcgac gagcgccagc 120
guaacguuaa gcgacgcgca agcgaagcuc augcagccag gcgucagcga cauuaauaug 180
gaacgcgucg aagcauuaaa aacggcuauc cguaacggug aguuaaaaau ggauacggga 240
aaaauagcag acucgcucau ucgcgaggcg cagagcuacu uacagaguaa auaa 294
<210> 7
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> AGCSer2AGT synonymous codon mutant triacontanucleotide flgM
sequence
<400> 7
atgagtattg accgtacctc acctttgaaa 30
<210> 8
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> ACCThr6ACA synonymous codon mutant triacontanucleotide flgM
sequence
<400> 8
atgagcattg accgtacatc acctttgaaa 30
<210> 9
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> ACCThr6ACG synonymous codon mutant triacontanucleotide flgM
sequence
<400> 9
atgagcattg accgtacgtc acctttgaaa 30
<210> 10
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> ACCThr6ACT synonymous codon mutant triacontanucleotide
<400> 10
atgagcattg accgtacttc acctttgaaa 30
<210> 11
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> TCASer7TCG synonymous codon mutant triacontanucleotide flgM
sequence
<400> 11
atgagcattg accgtacctc gcctttgaaa 30
<210> 12
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> TCASer7TCC synonymous codon mutant triacontanucleotide flgM
sequence
<400> 12
atgagcattg accgtacctc ccctttgaaa 30
<210> 13
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> TCASer7TCT synonymous codon mutant triacontanucleotide flgM
sequence
<400> 13
atgagcattg accgtacctc tcctttgaaa 30
<210> 14
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> CCTPro8CCG synonymous codon mutant triacontanucleotide flgM
sequence
<400> 14
atgagcattg accgtacctc accgttgaaa 30
<210> 15
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> TTGLeu9TTA synonymous codon mutant triacontanucleotide flgM
sequence
<400> 15
atgagcattg accgtacctc acctttaaaa 30
<210> 16
<211> 291
<212> DNA
<213> Artificial Sequence
<220>
<223> Human insulin glargine construct
<400> 16
atgcatcatc atcatcatca tggtggccgc tttgtgaacc aacacctgtg cggctcacac 60
ctggtggaag ctctctacct agtgtgcggg gaacgaggct tcttctacac acccaagacc 120
cgccgggagg cagaggacct gcaggtgggg caggtggagc tgggcggggg ccctggtgca 180
ggcagcctgc agcccttggc cctggagggg tctctgcagg cgcgtggcat tgtggaacaa 240
tgctgtacca gcatctgctc cctctaccag ctggagaact actgcggcta g 291
<210> 17
<211> 21
<212> PRT
<213> Homo sapiens
<400> 17
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Asn
20
<210> 18
<211> 30
<212> PRT
<213> Homo sapiens
<400> 18
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
20 25 30
<210> 19
<211> 21
<212> PRT
<213> Homo sapiens
<400> 19
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Gly
20
<210> 20
<211> 32
<212> PRT
<213> Homo sapiens
<400> 20
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
<210> 21
<211> 110
<212> PRT
<213> Homo sapiens
<400> 21
Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu
1 5 10 15
Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly
20 25 30
Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe
35 40 45
Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly
50 55 60
Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu
65 70 75 80
Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys
85 90 95
Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
100 105 110
<210> 22
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Insulin lisopro A chain
<400> 22
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Asn
20
<210> 23
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Insulin lisopro B chain
<400> 23
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Lys Pro Thr
20 25 30
Claims (55)
- 적어도 10개 코돈을 갖는 돌연변이 트리아콘타뉴클레오티드 서열을 포함하는 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 하나 이상이 동의 코돈(synonymous codons)인, 재조합 핵산 분자.
- 적어도 10개 코돈을 갖는 돌연변이 트리아콘타뉴클레오티드 서열로 이루어진 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8 및 제9 코돈 중의 적어도 하나가 동의 코돈인, 재조합 핵산 분자.
- 제1항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 아미노산 서열 NH2-MSIDRTSPLK-COOH(서열번호 1)를 코딩하는, 재조합 분자.
- 제1항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이, 목적하는 폴리펩티드를 코딩하는 이종성 폴리뉴클레오티드 서열에 작동적으로 연결되는, 재조합 분자.
- 제4항에 있어서, 상기 목적하는 폴리펩티드가 표 1에 수록된 폴리펩티드로부터 선택되는, 재조합 분자.
- 제4항에 있어서, 상기 목적하는 폴리페티드가 인슐린, 거미 실크 단백질 MaSp1, 또는 거미 실크 단백질 MaSp2인, 재조합 분자.
- 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 5'에서 3' 방향으로 폴리뉴클레오티드 서열에 작동적으로 연결되는, 재조합 분자.
- 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 폴리뉴클레오티드 서열의 아미노-말단 최다 코돈을 치환하고, 상기 이종성 폴리뉴클레오티드 서열이 목적하는 폴리펩티드를 코딩하는, 재조합 분자.
- 제1항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 서열번호 3을 코딩하는, 재조합 분자.
- 제1항 또는 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 리보핵산 서열인, 재조합 분자.
- 제1항 또는 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 데옥시리보핵산 서열인, 재조합 분자.
- 제1항 또는 제4항에 있어서, 상기 폴리뉴클레오티드 서열이 리보핵산 서열인, 재조합 분자.
- 제1항 또는 제4항에 있어서, 상기 폴리뉴클레오티드 서열이 데옥시리보핵산 서열인, 재조합 분자.
- 제1항 또는 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열이 합성 서열인, 재조합 분자.
- 제4항에 있어서, 상기 돌연변이 트리아콘타뉴클레오티드 서열 및 폴리뉴클레오티드 서열 중의 하나 또는 둘 모두가 합성 서열인, 재조합 분자.
- 제1항에 있어서, 5'에서 3' 방향으로 제6 및 제8 코돈이 동의 코돈인, 재조합 분자.
- 제1항 내지 제16항 중의 어느 한 항의 재조합 분자를 포함하는 벡터.
- 제17항에 있어서, 상기 벡터가 발현 벡터이고, 상기 돌연변이 트리아콘타뉴클레오티드 서열 및 폴리뉴클레오티드 서열이 이종성 프로모터에 작동적으로 연결되는, 벡터.
- 제18항에 있어서, 상기 이종성 프로모터가 유도성 프로모터, 구성적 프로모터, 또는 조직 특이적 프로모터인, 벡터.
- 제19항에 있어서, 상기 유도성 프로모터가 ParaBAD 또는 Psal 프로모터인, 벡터.
- 제1항 내지 제16항 중의 어느 한 항의 재조합 분자를 포함하는 숙주 세포.
- 제21항에 있어서, 상기 폴리뉴클레오티드 서열이, 숙주 세포 내에서의 발현을 위해 코돈 최적화되어 있는, 숙주 세포.
- 제21항에 있어서, 상기 숙주 세포가 살모넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포인, 숙주 세포.
- 제23항에 있어서, 상기 숙주 세포가 살모넬라 엔테리카(Salmonella enterica) 세포인, 숙주 세포.
- 제17항 내지 제19항 중의 어느 한 항의 벡터를 포함하는 숙주 세포.
- 제25항에 있어서, 상기 숙주 세포가 살모넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포인, 숙주 세포.
- 제26항에 있어서, 상기 숙주 세포가 살모넬라 엔테리카(Salmonella enterica) 세포인, 숙주 세포.
- 서열 5'-AUGAGCAUUGACCGUACCUCACCUUUGAAA-3'(서열번호 2)를 포함하는, 조절된 번역 속도를 갖는 재조합 핵산 분자로서, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈인, 재조합 핵산 분자.
- 제28항에 있어서, 상기 제6 코돈이 동의 코돈 ACU, ACA 또는 ACG이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 증가된 번역 속도를 갖는, 재조합 분자.
- 제28항에 있어서, 상기 제6 코돈이 동의 코돈이고, 상기 분자가 비변형된 서열을 포함하는 분자와 비교하여 번역 속도의 약 9 내지 15배 증가를 갖는, 재조합 분자.
- 제28항에 있어서, 상기 제8 코돈이 동의 코돈 CCG이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 감소된 번역 속도를 갖는, 재조합 분자.
- 제28항에 있어서, 상기 제8 코돈이 동의 코돈이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 번역 속도의 약 0.03 내지 0.07배 감소를 갖는, 재조합 분자.
- 제28항에 있어서, 상기 제6 코돈이 동의 코돈 ACU이고, 상기 제8 코돈이 동의 코돈 CCG이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 증가된 번역 속도를 갖는, 재조합 분자.
- 제28항에 있어서, 상기 제6 코돈이 동의 코돈이고, 상기 제8 코돈이 동의 코돈이고, 상기 재조합 분자가 비변형된 서열을 포함하는 분자와 비교하여 번역 속도의 약 27.5 내지 40.5배 증가를 갖는, 재조합 분자.
- 목적하는 폴리펩티드를 코딩하는 핵산 서열에 작동적으로 연결된 제28항 내지 제34항 중의 어느 한 항의 재조합 분자를 포함하는 단리된 폴리뉴클레오티드.
- 제28항 내지 제35항 중의 어느 한 항의 재조합 분자 또는 폴리뉴클레오티드를 포함하는, 벡터.
- 제28항 내지 제35항 중의 어느 한 항의 재조합 분자 또는 폴리뉴클레오티드를 포함하는 숙주 세포.
- 제37항에 있어서, 상기 숙주 세포가 살모넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포인, 숙주 세포.
- 제37항에 있어서, 상기 숙주 세포가 살모넬라 엔테리카(Salmonella enterica) 세포인, 숙주 세포.
- 숙주 세포 내의 단백질 생성을 조절하는 방법으로서,
숙주 세포를 단백질 발현에 충분한 조건하에 배양하는 것을 포함하고, 여기서 제4항 내지 제9항, 제12항, 제13항 및 제15항 중의 어느 한 항의 재조합 분자가 상기 숙주 세포에 안정하게 도입되는, 방법. - 제40항에 있어서, 상기 숙주 세포가 살모넬라(Salmonella) 또는 에스케리키아 콜라이(Escherichia coli) 세포인, 방법.
- 제40항에 있어서, 상기 숙주 세포가 살모넬라 엔테리카(Salmonella enterica ) 세포인, 방법.
- 제40항에 있어서, 상기 제6 코돈이 동의 코돈 ACU, ACA 또는 ACG이고, 단백질 생성이 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 증가되는, 방법.
- 제40항에 있어서, 상기 제6 코돈이 동의 코돈이고, 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성에서 약 9 내지 15배 증가를 제공하는, 방법.
- 제40항에 있어서, 상기 제8 코돈이 동의 코돈 CCG이고, 단백질 생성이 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 감소되는, 방법.
- 제40항에 있어서, 상기 제8 코돈이 동의 코돈이고, 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성에서 약 0.03 내지 0.07배 감소를 제공하는, 방법.
- 제40항에 있어서, 상기 제6 코돈이 동의 코돈 ACU이고, 상기 제8 코돈이 동의 코돈 CCG이고, 단백질 생성이 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 증가되는, 방법.
- 제40항에 있어서, 상기 제6 코돈이 상기 동의 코돈이고, 상기 제8 코돈이 상기 동의 코돈이고, 야생형 트리아콘타뉴클레오티드 서열을 사용하는 상응하는 숙주 세포와 비교하여 단백질 생성에서 약 27.5 내지 40.5배 증가를 제공하는, 방법.
- 폴리뉴클레오티드 서열의 번역 속도를 증가시키는 방법으로서,
단백질을 코딩하고, 10개 코돈을 포함하고 NH2-MSIDRTSPLK-COOH(서열번호 1)를 코딩하는 야생형 트리아콘타뉴클레오티드 서열에 작동적으로 연결되는 폴리뉴클레오티드 서열을 제공하는 단계 및
상기 트리아콘타뉴클레오티드 서열을 돌연변이시켜, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈으로 되도록 하는 단계를 포함하는, 방법. - 숙주 세포에서 목적하는 폴리펩티드의 특이적 세포 생성능을 증가시키는 방법으로서,
(a) 상기 목적하는 폴리펩티드를 코딩하고, 10개 코돈을 포함하고 NH2-MSIDRTSPLK-COOH(서열번호 1)를 코딩하는 야생형 트리아콘타뉴클레오티드 서열에 작동적으로 연결되는 폴리뉴클레오티드 서열을 제공하는 단계,
(b) 상기 트리아콘타뉴클레오티드 서열을 돌연변이시켜, 5'에서 3' 방향으로 제6, 제7, 제8, 제9 및 제10 코돈 중의 적어도 하나가 동의 코돈으로 되도록 하는 단계,
(c) 상기 폴리뉴클레오티드 서열을 상기 숙주 세포에 도입시키는 단계,
(d) 상기 세포를 상기 도입된 폴리폴리뉴클레오티드가 발현되는 조건하에 배양하는 단계 및
(e) 상기 목적하는 폴리펩티드를 단리하는 단계를 포함하는, 방법. - 제49항 또는 제50항에 있어서, 상기 수득되는 돌연변이 트리아콘타뉴클레오티드 서열의 제6 코돈이 동의 코돈 ACU, ACA 또는 ACG를 포함하고, 상기 폴리뉴클레오티드 서열의 번역 속도가 상기 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 증가되는, 방법.
- 제51항에 있어서, 상기 방법이 번역 속도의 약 9 내지 15배 증가를 생성하는, 방법.
- 제49항 또는 제50항에 있어서, 상기 제6 코돈이 동의 코돈 ACU이고, 상기 제8 코돈이 동의 코돈 CCG이고, 상기 폴리뉴클레오티드 서열의 번역 속도가 야생형 트리아콘타뉴클레오티드 서열 조절하의 번역과 비교하여 증가되는, 방법.
- 제53항에 있어서, 상기 방법이 번역 속도의 약 27.5 내지 40.5배 증가를 생성하는, 방법.
- 제40항 내지 제54항 중의 어느 한 항에 있어서, 상기 단백질 또는 폴리펩티드가, 인슐린, 인슐린 분자 또는 인슐린 유사체를 코딩하는 이종성 폴리뉴클레오티드 서열에 작동적으로 연결되는, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562236477P | 2015-10-02 | 2015-10-02 | |
US62/236,477 | 2015-10-02 | ||
US201562263404P | 2015-12-04 | 2015-12-04 | |
US62/263,404 | 2015-12-04 | ||
PCT/US2016/055162 WO2017059424A1 (en) | 2015-10-02 | 2016-10-03 | Compositions for adjustable ribosome translation speed and methods of use |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180072715A true KR20180072715A (ko) | 2018-06-29 |
Family
ID=58427919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187012404A KR20180072715A (ko) | 2015-10-02 | 2016-10-03 | 조절가능한 리보솜 번역 속도를 위한 조성물 및 사용 방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11293028B2 (ko) |
EP (1) | EP3356525A4 (ko) |
JP (1) | JP6938482B2 (ko) |
KR (1) | KR20180072715A (ko) |
CN (1) | CN108368500B (ko) |
MA (1) | MA43056A (ko) |
WO (1) | WO2017059424A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6938482B2 (ja) | 2015-10-02 | 2021-09-22 | ユニバーシティー オブ ユタ リサーチ ファンデーション | 調節可能なリボソーム翻訳速度のための組成物および使用法 |
KR20240013955A (ko) * | 2022-07-21 | 2024-01-31 | 충남대학교산학협력단 | 멜리틴 분비를 위한 재조합 발현 벡터 및 이로 형질전환된 약독화 살모넬라 균주 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020097200A (ko) * | 2000-03-21 | 2002-12-31 | 엘리트라 파마슈티컬즈, 인코포레이티드 | 원핵세포에서의 필수유전자의 동정 |
CA2498776A1 (en) * | 2002-09-13 | 2004-03-25 | The University Of Queensland | Gene expression system based on codon translation efficiency |
US7888489B2 (en) * | 2005-01-24 | 2011-02-15 | Dsm Ip Assets B.V. | Method for producing a compound of interest in a filamentous fungal cell |
EP2099818A2 (en) * | 2006-11-29 | 2009-09-16 | Novozymes Inc. | Bacillus licheniformis chromosome |
EP2198303A4 (en) * | 2007-09-10 | 2011-08-03 | Cheryl A Nickerson | BASED ON THE CULTURE OF MICRO-ORGANISMS UNDER LOW-DIMENT LIQUIDITY CONDITIONS AND METHODS OF COMPOSITION |
US20120027786A1 (en) | 2010-02-23 | 2012-02-02 | Massachusetts Institute Of Technology | Genetically programmable pathogen sense and destroy |
EP2556085A2 (en) * | 2010-04-05 | 2013-02-13 | Bar-Ilan University | Protease-activatable pore-forming polypeptides |
JP6496243B2 (ja) | 2012-05-30 | 2019-04-03 | ユニヴァーシティー オブ ユタ リサーチ ファウンデーション | Iii型分泌系を使用したペプチド発現および精製のための組成物および方法 |
SG10201602115PA (en) | 2012-09-19 | 2016-05-30 | Univ Singapore | Codon optimization of a synthetic gene(s) for protein expression |
JP6938482B2 (ja) | 2015-10-02 | 2021-09-22 | ユニバーシティー オブ ユタ リサーチ ファンデーション | 調節可能なリボソーム翻訳速度のための組成物および使用法 |
-
2016
- 2016-10-03 JP JP2018517217A patent/JP6938482B2/ja active Active
- 2016-10-03 EP EP16852823.0A patent/EP3356525A4/en active Pending
- 2016-10-03 WO PCT/US2016/055162 patent/WO2017059424A1/en active Application Filing
- 2016-10-03 US US15/765,132 patent/US11293028B2/en active Active
- 2016-10-03 CN CN201680070930.1A patent/CN108368500B/zh active Active
- 2016-10-03 MA MA043056A patent/MA43056A/fr unknown
- 2016-10-03 KR KR1020187012404A patent/KR20180072715A/ko not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
US11293028B2 (en) | 2022-04-05 |
MA43056A (fr) | 2018-08-08 |
EP3356525A4 (en) | 2019-03-27 |
WO2017059424A1 (en) | 2017-04-06 |
CN108368500B (zh) | 2023-05-26 |
CN108368500A (zh) | 2018-08-03 |
JP2018529365A (ja) | 2018-10-11 |
EP3356525A1 (en) | 2018-08-08 |
JP6938482B2 (ja) | 2021-09-22 |
US20180282738A1 (en) | 2018-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Starosta et al. | The bacterial translation stress response | |
Levengood-Freyermuth et al. | Role of the carboxyl-terminal domain of TolA in protein import and integrity of the outer membrane | |
EP1791961B1 (en) | Protein production method utilizing yebf | |
KR20170121291A (ko) | 감소된 창자 염증 및/또는 강화된 창자 점막 장벽으로부터 이익을 얻는 질병을 치료하기 위해 공학처리된 박테리아 | |
ES2925049T3 (es) | Bacterias manipuladas para reducir la hiperfenilalaninemia | |
Capeness et al. | Activity of Bdellovibrio hit locus proteins, Bd0108 and Bd0109, links Type IVa pilus extrusion/retraction status to prey-independent growth signalling | |
Garza-Sánchez et al. | Amino acid starvation and colicin D treatment induce A-site mRNA cleavage in Escherichia coli | |
Ardissone et al. | Cell cycle constraints on capsulation and bacteriophage susceptibility | |
WO2017075485A1 (en) | Bacteria engineered to treat disorders in which trimethylamine (tma) is detrimental | |
WO2013181404A2 (en) | COMPOSITIONS AND METHODS FOR PEPTIDE EXPRESSION AND PURIFICATION USING A TYPE lll SECRETION SYSTEM | |
EP3262061A1 (en) | Peptides for facilitating secretion and uses thereof | |
WO2008019183A2 (en) | Biopolymer and protein production using type iii secretion systems of gram negative bacteria | |
Muramoto et al. | Effect of cellular level of FliK on flagellar hook and filament assembly in Salmonella typhimurium | |
KR20180072715A (ko) | 조절가능한 리보솜 번역 속도를 위한 조성물 및 사용 방법 | |
WO1994000463A2 (en) | Production of hyaluronic acid by transeformed microorganisms | |
Fröderberg et al. | Complementation of bacterial SecE by a chloroplastic homologue | |
ES2922009T3 (es) | Variantes de beta-lactamasa | |
CN112292157A (zh) | 细胞移植用组合物和细胞移植方法 | |
Nie et al. | The phosphodiesterase DibA interacts with the c‐di‐GMP receptor LapD and specifically regulates biofilm in Pseudomonas putida | |
Corver et al. | Proteolytic activity of surface exposed HtrA determines its expression level and is needed to survive acidic conditions in Clostridioides difficile | |
Zou et al. | Analysis of virulence proteins in pathogenic Acinetobacter baumannii to provide early warning of zoonotic risk | |
Michel | Multiple molecular adaptation strategies of Clostridioides difficile to respond to various stresses in the gut environment during infection | |
JP6218512B2 (ja) | アユ冷水病菌由来毒素 | |
EP2048155A1 (en) | Method and means for the production of pharmaceutically active natural products | |
CA3233224A1 (en) | Chimeric protein and expression system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |