KR20180020213A - 유도성 공발현 시스템에 사용을 위한 벡터 - Google Patents
유도성 공발현 시스템에 사용을 위한 벡터 Download PDFInfo
- Publication number
- KR20180020213A KR20180020213A KR1020187000942A KR20187000942A KR20180020213A KR 20180020213 A KR20180020213 A KR 20180020213A KR 1020187000942 A KR1020187000942 A KR 1020187000942A KR 20187000942 A KR20187000942 A KR 20187000942A KR 20180020213 A KR20180020213 A KR 20180020213A
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- host cell
- promoter
- inducible promoter
- seq
- Prior art date
Links
- 230000001939 inductive effect Effects 0.000 title claims abstract description 240
- 230000004186 co-expression Effects 0.000 title description 46
- 239000013598 vector Substances 0.000 title description 28
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 420
- 230000014509 gene expression Effects 0.000 claims abstract description 304
- 210000004027 cell Anatomy 0.000 claims description 308
- 102000004169 proteins and genes Human genes 0.000 claims description 139
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 136
- 239000002773 nucleotide Substances 0.000 claims description 132
- 125000003729 nucleotide group Chemical group 0.000 claims description 132
- 238000000034 method Methods 0.000 claims description 78
- 241000588724 Escherichia coli Species 0.000 claims description 75
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 claims description 69
- 102000040430 polynucleotide Human genes 0.000 claims description 61
- 108091033319 polynucleotide Proteins 0.000 claims description 61
- 239000002157 polynucleotide Substances 0.000 claims description 61
- 239000000411 inducer Substances 0.000 claims description 60
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 claims description 52
- 230000027455 binding Effects 0.000 claims description 47
- 230000002829 reductive effect Effects 0.000 claims description 43
- 238000012217 deletion Methods 0.000 claims description 25
- 230000037430 deletion Effects 0.000 claims description 25
- 101150076178 araE gene Proteins 0.000 claims description 24
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 108020003519 protein disulfide isomerase Proteins 0.000 claims description 18
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 17
- 108010078791 Carrier Proteins Proteins 0.000 claims description 15
- 101150085802 prpB gene Proteins 0.000 claims description 14
- 101150057627 trxB gene Proteins 0.000 claims description 14
- 239000012634 fragment Substances 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 13
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 claims description 12
- 101150009573 phoA gene Proteins 0.000 claims description 12
- 101100345721 Bacillus subtilis (strain 168) mmgF gene Proteins 0.000 claims description 11
- 101150079081 pphB gene Proteins 0.000 claims description 11
- 101100532764 Escherichia coli (strain K12) scpC gene Proteins 0.000 claims description 10
- 101150077061 prpD gene Proteins 0.000 claims description 10
- 101100345719 Bacillus subtilis (strain 168) mmgE gene Proteins 0.000 claims description 9
- 230000002103 transcriptional effect Effects 0.000 claims description 9
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 claims description 8
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 claims description 8
- HMFHBZSHGGEWLO-IOVATXLUSA-N D-xylofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@H]1O HMFHBZSHGGEWLO-IOVATXLUSA-N 0.000 claims description 7
- 108010036164 Glutathione synthase Proteins 0.000 claims description 7
- 108010079911 Thioredoxin-disulfide reductase Proteins 0.000 claims description 7
- 101150097746 araB gene Proteins 0.000 claims description 7
- 101150096947 gshB gene Proteins 0.000 claims description 7
- OIRDTQYFTABQOQ-UHTZMRCNSA-N Vidarabine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1O OIRDTQYFTABQOQ-UHTZMRCNSA-N 0.000 claims description 6
- 230000004075 alteration Effects 0.000 claims description 6
- OIRDTQYFTABQOQ-UHFFFAOYSA-N ara-adenosine Natural products Nc1ncnc2n(cnc12)C1OC(CO)C(O)C1O OIRDTQYFTABQOQ-UHFFFAOYSA-N 0.000 claims description 6
- 101150035354 araA gene Proteins 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 6
- 108010066381 preproinsulin Proteins 0.000 claims description 6
- 101150011516 xlnD gene Proteins 0.000 claims description 6
- 101150052264 xylA gene Proteins 0.000 claims description 6
- 101150010108 xylF gene Proteins 0.000 claims description 6
- 101100015982 Dictyostelium discoideum gcsA gene Proteins 0.000 claims description 5
- 101100172084 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) egtA gene Proteins 0.000 claims description 5
- 108091023040 Transcription factor Proteins 0.000 claims description 5
- 102000040945 Transcription factor Human genes 0.000 claims description 5
- 101150019860 gshA gene Proteins 0.000 claims description 5
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 5
- 101150110790 xylB gene Proteins 0.000 claims description 5
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 claims description 4
- 108010065825 Immunoglobulin Light Chains Proteins 0.000 claims description 4
- 101150004248 xylH gene Proteins 0.000 claims description 4
- NYHBQMYGNKIUIF-FJFJXFQQSA-N 9-beta-D-arabinofuranosylguanine Chemical compound C12=NC(N)=NC(O)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1O NYHBQMYGNKIUIF-FJFJXFQQSA-N 0.000 claims description 3
- 101150019464 ARAF gene Proteins 0.000 claims description 3
- 101100429087 Bacillus subtilis (strain 168) xlyA gene Proteins 0.000 claims description 3
- 101100002294 Escherichia coli (strain K12) argK gene Proteins 0.000 claims description 3
- 101100416564 Escherichia coli (strain K12) rfbA gene Proteins 0.000 claims description 3
- 101100095178 Escherichia coli (strain K12) scpB gene Proteins 0.000 claims description 3
- 101150088541 SCPA gene Proteins 0.000 claims description 3
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 claims description 3
- 101150084021 araG gene Proteins 0.000 claims description 3
- 101150023525 araH gene Proteins 0.000 claims description 3
- 101150092394 argK gene Proteins 0.000 claims description 3
- 101150055510 rfbB gene Proteins 0.000 claims description 3
- 101150117748 rfbC gene Proteins 0.000 claims description 3
- 101150061409 rfbD gene Proteins 0.000 claims description 3
- 101150091078 rhaA gene Proteins 0.000 claims description 3
- 101150032455 rhaB gene Proteins 0.000 claims description 3
- 101150052254 rhaD gene Proteins 0.000 claims description 3
- 101150097837 rhaT gene Proteins 0.000 claims description 3
- 101150099889 rmlA gene Proteins 0.000 claims description 3
- 101150043440 rmlB gene Proteins 0.000 claims description 3
- 101150016581 rmlC gene Proteins 0.000 claims description 3
- 101150078780 rmlD gene Proteins 0.000 claims description 3
- 101150024466 scpB gene Proteins 0.000 claims description 3
- 101150033155 sspP gene Proteins 0.000 claims description 3
- 101150068654 xylG gene Proteins 0.000 claims description 3
- 230000002269 spontaneous effect Effects 0.000 claims 1
- 239000013604 expression vector Substances 0.000 abstract description 76
- 230000006698 induction Effects 0.000 abstract description 47
- 239000000047 product Substances 0.000 description 149
- 235000018102 proteins Nutrition 0.000 description 104
- 108090000765 processed proteins & peptides Proteins 0.000 description 76
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 74
- 102000004196 processed proteins & peptides Human genes 0.000 description 72
- 229920001184 polypeptide Polymers 0.000 description 64
- 230000006870 function Effects 0.000 description 58
- 108091026890 Coding region Proteins 0.000 description 51
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 48
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 37
- 239000013612 plasmid Substances 0.000 description 31
- 210000000805 cytoplasm Anatomy 0.000 description 27
- 239000000427 antigen Substances 0.000 description 26
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 25
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 23
- 108091007433 antigens Proteins 0.000 description 23
- 102000036639 antigens Human genes 0.000 description 23
- 102000004190 Enzymes Human genes 0.000 description 22
- 108090000790 Enzymes Proteins 0.000 description 22
- 229940088598 enzyme Drugs 0.000 description 22
- 229960000598 infliximab Drugs 0.000 description 22
- 241000282414 Homo sapiens Species 0.000 description 21
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 21
- 230000001086 cytosolic effect Effects 0.000 description 20
- 108091008146 restriction endonucleases Proteins 0.000 description 19
- 238000004519 manufacturing process Methods 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 230000035772 mutation Effects 0.000 description 18
- 239000000523 sample Substances 0.000 description 18
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 17
- 238000010367 cloning Methods 0.000 description 17
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 16
- 229910052799 carbon Inorganic materials 0.000 description 16
- 230000010076 replication Effects 0.000 description 16
- 150000001413 amino acids Chemical class 0.000 description 15
- 230000000295 complement effect Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 15
- 241000894006 Bacteria Species 0.000 description 14
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 14
- 230000001580 bacterial effect Effects 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 13
- 239000000872 buffer Substances 0.000 description 12
- 238000001077 electron transfer detection Methods 0.000 description 12
- 108091006047 fluorescent proteins Proteins 0.000 description 12
- 102000034287 fluorescent proteins Human genes 0.000 description 12
- 108010054624 red fluorescent protein Proteins 0.000 description 12
- 238000013518 transcription Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 12
- 108010006519 Molecular Chaperones Proteins 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 11
- 230000003115 biocidal effect Effects 0.000 description 11
- 230000002950 deficient Effects 0.000 description 11
- 229940125396 insulin Drugs 0.000 description 11
- 229930027917 kanamycin Natural products 0.000 description 11
- 229960000318 kanamycin Drugs 0.000 description 11
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 11
- 229930182823 kanamycin A Natural products 0.000 description 11
- 108010060845 lactose permease Proteins 0.000 description 11
- 102000039446 nucleic acids Human genes 0.000 description 11
- 108020004707 nucleic acids Proteins 0.000 description 11
- 150000007523 nucleic acids Chemical class 0.000 description 11
- 238000004885 tandem mass spectrometry Methods 0.000 description 11
- 108090001061 Insulin Proteins 0.000 description 10
- 102000004877 Insulin Human genes 0.000 description 10
- PNNNRSAQSRJVSB-BXKVDMCESA-N aldehydo-L-rhamnose Chemical compound C[C@H](O)[C@H](O)[C@@H](O)[C@@H](O)C=O PNNNRSAQSRJVSB-BXKVDMCESA-N 0.000 description 10
- 101150077538 gor gene Proteins 0.000 description 10
- 230000012010 growth Effects 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- 239000008188 pellet Substances 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 9
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 9
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 9
- 108020005091 Replication Origin Proteins 0.000 description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 9
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 9
- 239000003242 anti bacterial agent Substances 0.000 description 9
- 230000033228 biological regulation Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 9
- 238000011534 incubation Methods 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 238000004448 titration Methods 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- -1 DsbC / DsbG Proteins 0.000 description 8
- 102000005431 Molecular Chaperones Human genes 0.000 description 8
- 229910019142 PO4 Inorganic materials 0.000 description 8
- XBDQKXXYIPTUBI-UHFFFAOYSA-N Propionic acid Chemical compound CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 8
- 238000001360 collision-induced dissociation Methods 0.000 description 8
- 238000010494 dissociation reaction Methods 0.000 description 8
- 230000005593 dissociations Effects 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 230000013595 glycosylation Effects 0.000 description 8
- 238000006206 glycosylation reaction Methods 0.000 description 8
- 239000001963 growth medium Substances 0.000 description 8
- 101150001899 lacY gene Proteins 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 239000010452 phosphate Substances 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 7
- 102100031780 Endonuclease Human genes 0.000 description 7
- 108060003951 Immunoglobulin Proteins 0.000 description 7
- 235000001014 amino acid Nutrition 0.000 description 7
- 229960000723 ampicillin Drugs 0.000 description 7
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 7
- 229940088710 antibiotic agent Drugs 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 7
- 229960005091 chloramphenicol Drugs 0.000 description 7
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 7
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 102000018358 immunoglobulin Human genes 0.000 description 7
- 239000012139 lysis buffer Substances 0.000 description 7
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 7
- 101100002068 Bacillus subtilis (strain 168) araR gene Proteins 0.000 description 6
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- 101100267110 Escherichia coli (strain K12) ygfI gene Proteins 0.000 description 6
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 238000011529 RT qPCR Methods 0.000 description 6
- 108090000631 Trypsin Proteins 0.000 description 6
- 102000004142 Trypsin Human genes 0.000 description 6
- 101150024831 ahpC gene Proteins 0.000 description 6
- 101150044616 araC gene Proteins 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 6
- 125000003147 glycosyl group Chemical group 0.000 description 6
- 239000008101 lactose Substances 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 101150099879 prpR gene Proteins 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 230000032258 transport Effects 0.000 description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 241001646716 Escherichia coli K-12 Species 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 108010024636 Glutathione Proteins 0.000 description 5
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- 101710163270 Nuclease Proteins 0.000 description 5
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 5
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 5
- 230000003281 allosteric effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 101150001544 crr gene Proteins 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 150000002500 ions Chemical class 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 235000000346 sugar Nutrition 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 108091006106 transcriptional activators Proteins 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 239000012588 trypsin Substances 0.000 description 5
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 4
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- 108010063907 Glutathione Reductase Proteins 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- 102000016943 Muramidase Human genes 0.000 description 4
- 108010014251 Muramidase Proteins 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 4
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 239000012148 binding buffer Substances 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 210000000170 cell membrane Anatomy 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- GNGACRATGGDKBX-UHFFFAOYSA-N dihydroxyacetone phosphate Chemical compound OCC(=O)COP(O)(O)=O GNGACRATGGDKBX-UHFFFAOYSA-N 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000037442 genomic alteration Effects 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 229960003180 glutathione Drugs 0.000 description 4
- 238000003364 immunohistochemistry Methods 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 101150109249 lacI gene Proteins 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 239000004325 lysozyme Substances 0.000 description 4
- 235000010335 lysozyme Nutrition 0.000 description 4
- 229960000274 lysozyme Drugs 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000001590 oxidative effect Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 101150098466 rpsL gene Proteins 0.000 description 4
- 238000013207 serial dilution Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- 101150038987 xylR gene Proteins 0.000 description 4
- 102100024341 10 kDa heat shock protein, mitochondrial Human genes 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 description 3
- 241000219194 Arabidopsis Species 0.000 description 3
- 108010059013 Chaperonin 10 Proteins 0.000 description 3
- 108010058432 Chaperonin 60 Proteins 0.000 description 3
- 101710154303 Cyclic AMP receptor protein Proteins 0.000 description 3
- 241000393496 Electra Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 102100023737 GrpE protein homolog 1, mitochondrial Human genes 0.000 description 3
- 102000004447 HSP40 Heat-Shock Proteins Human genes 0.000 description 3
- 108010042283 HSP40 Heat-Shock Proteins Proteins 0.000 description 3
- 101000829489 Homo sapiens GrpE protein homolog 1, mitochondrial Proteins 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- 229920001213 Polysorbate 20 Polymers 0.000 description 3
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 3
- 241000607720 Serratia Species 0.000 description 3
- 102000003673 Symporters Human genes 0.000 description 3
- 108090000088 Symporters Proteins 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 3
- 102000002933 Thioredoxin Human genes 0.000 description 3
- 238000002835 absorbance Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 230000029936 alkylation Effects 0.000 description 3
- 238000005804 alkylation reaction Methods 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000004090 dissolution Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 238000005194 fractionation Methods 0.000 description 3
- 230000036252 glycation Effects 0.000 description 3
- 125000000487 histidyl group Chemical class [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 3
- 230000003284 homeostatic effect Effects 0.000 description 3
- 230000001900 immune effect Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 235000018977 lysine Nutrition 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 101150093139 ompT gene Proteins 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 3
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 3
- 230000003389 potentiating effect Effects 0.000 description 3
- 235000019260 propionic acid Nutrition 0.000 description 3
- QAQREVBBADEHPA-IEXPHMLFSA-N propionyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 QAQREVBBADEHPA-IEXPHMLFSA-N 0.000 description 3
- 238000001243 protein synthesis Methods 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 108010001535 sulfhydryl oxidase Proteins 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 108060008226 thioredoxin Proteins 0.000 description 3
- 229940094937 thioredoxin Drugs 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- 108700012359 toxins Proteins 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 2
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 2
- FPQQSJJWHUJYPU-UHFFFAOYSA-N 3-(dimethylamino)propyliminomethylidene-ethylazanium;chloride Chemical compound Cl.CCN=C=NCCCN(C)C FPQQSJJWHUJYPU-UHFFFAOYSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- 241000588624 Acinetobacter calcoaceticus Species 0.000 description 2
- 241000242764 Aequorea victoria Species 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 2
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- 241000589149 Azotobacter vinelandii Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 108030001720 Bontoxilysin Proteins 0.000 description 2
- 241000722885 Brettanomyces Species 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 241000010804 Caulobacter vibrioides Species 0.000 description 2
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 241000252867 Cupriavidus metallidurans Species 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- FNZLKVNUWIIPSJ-RFZPGFLSSA-N D-xylulose 5-phosphate Chemical compound OCC(=O)[C@@H](O)[C@H](O)COP(O)(O)=O FNZLKVNUWIIPSJ-RFZPGFLSSA-N 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 241000588921 Enterobacteriaceae Species 0.000 description 2
- 102000009109 Fc receptors Human genes 0.000 description 2
- 108010087819 Fc receptors Proteins 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- 102100036442 Glutathione reductase, mitochondrial Human genes 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 240000001929 Lactobacillus brevis Species 0.000 description 2
- 235000013957 Lactobacillus brevis Nutrition 0.000 description 2
- 101001010029 Lactobacillus helveticus Putative phosphotransferase enzyme IIA component Proteins 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- 108010059896 Manganese peroxidase Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 101150101654 PSR1 gene Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- NBBJYMSMWIIQGU-UHFFFAOYSA-N Propionic aldehyde Chemical compound CCC=O NBBJYMSMWIIQGU-UHFFFAOYSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108010041974 Rhamnulokinase Proteins 0.000 description 2
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 241000589196 Sinorhizobium meliloti Species 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 244000057717 Streptococcus lactis Species 0.000 description 2
- 235000014897 Streptococcus lactis Nutrition 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 102000013090 Thioredoxin-Disulfide Reductase Human genes 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- ANHVRCNNGJMJNG-BZSNNMDCSA-N Tyr-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CS)C(=O)O)N)O ANHVRCNNGJMJNG-BZSNNMDCSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 108030002454 Versatile peroxidases Proteins 0.000 description 2
- 108700040099 Xylose isomerases Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 239000002168 alkylating agent Substances 0.000 description 2
- 229940100198 alkylating agent Drugs 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 2
- 239000001099 ammonium carbonate Substances 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 101150088725 ascG gene Proteins 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- 101150049515 bla gene Proteins 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 230000001925 catabolic effect Effects 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 229960002376 chymotrypsin Drugs 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 229940127089 cytotoxic agent Drugs 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- VWWQXMAJTJZDQX-UYBVJOGSSA-N flavin adenine dinucleotide Chemical compound C1=NC2=C(N)N=CN=C2N1[C@@H]([C@H](O)[C@@H]1O)O[C@@H]1CO[P@](O)(=O)O[P@@](O)(=O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C2=NC(=O)NC(=O)C2=NC2=C1C=C(C)C(C)=C2 VWWQXMAJTJZDQX-UYBVJOGSSA-N 0.000 description 2
- 235000019162 flavin adenine dinucleotide Nutrition 0.000 description 2
- 239000011714 flavin adenine dinucleotide Substances 0.000 description 2
- 229940093632 flavin-adenine dinucleotide Drugs 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 101150045500 galK gene Proteins 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 101150074251 lpp gene Proteins 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000000155 melt Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 235000020030 perry Nutrition 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 108010071189 phosphoenolpyruvate-glucose phosphotransferase Proteins 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 102200038213 rs767568897 Human genes 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000003260 vortexing Methods 0.000 description 2
- YNOXCRMFGMSKIJ-NFNCENRGSA-N (2S,3S)-2-methylcitric acid Chemical compound OC(=O)[C@@H](C)[C@](O)(C(O)=O)CC(O)=O YNOXCRMFGMSKIJ-NFNCENRGSA-N 0.000 description 1
- BSABBBMNWQWLLU-VKHMYHEASA-N (S)-lactaldehyde Chemical compound C[C@H](O)C=O BSABBBMNWQWLLU-VKHMYHEASA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- JKMPXGJJRMOELF-UHFFFAOYSA-N 1,3-thiazole-2,4,5-tricarboxylic acid Chemical compound OC(=O)C1=NC(C(O)=O)=C(C(O)=O)S1 JKMPXGJJRMOELF-UHFFFAOYSA-N 0.000 description 1
- NFGXHKASABOEEW-UHFFFAOYSA-N 1-methylethyl 11-methoxy-3,7,11-trimethyl-2,4-dodecadienoate Chemical compound COC(C)(C)CCCC(C)CC=CC(C)=CC(=O)OC(C)C NFGXHKASABOEEW-UHFFFAOYSA-N 0.000 description 1
- IVLXQGJVBGMLRR-UHFFFAOYSA-N 2-aminoacetic acid;hydron;chloride Chemical compound Cl.NCC(O)=O IVLXQGJVBGMLRR-UHFFFAOYSA-N 0.000 description 1
- 108030005611 2-methylcitrate dehydratases Proteins 0.000 description 1
- XMTQQYYKAHVGBJ-UHFFFAOYSA-N 3-(3,4-DICHLOROPHENYL)-1,1-DIMETHYLUREA Chemical compound CN(C)C(=O)NC1=CC=C(Cl)C(Cl)=C1 XMTQQYYKAHVGBJ-UHFFFAOYSA-N 0.000 description 1
- 102100039217 3-ketoacyl-CoA thiolase, peroxisomal Human genes 0.000 description 1
- 102100038740 Activator of RNA decay Human genes 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 1
- 244000003363 Allium ursinum Species 0.000 description 1
- 235000005336 Allium ursinum Nutrition 0.000 description 1
- 241001135756 Alphaproteobacteria Species 0.000 description 1
- 101710154825 Aminoglycoside 3'-phosphotransferase Proteins 0.000 description 1
- 108010032595 Antibody Binding Sites Proteins 0.000 description 1
- 101000651036 Arabidopsis thaliana Galactolipid galactosyltransferase SFR2, chloroplastic Proteins 0.000 description 1
- 101710129685 Arabinose-proton symporter Proteins 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- YQPSDMUGFKJZHR-QRTARXTBSA-N Asn-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)N)N YQPSDMUGFKJZHR-QRTARXTBSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- KNDCWFXCFKSEBM-AVGNSLFASA-N Asp-Tyr-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KNDCWFXCFKSEBM-AVGNSLFASA-N 0.000 description 1
- HTSSXFASOUSJQG-IHPCNDPISA-N Asp-Tyr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HTSSXFASOUSJQG-IHPCNDPISA-N 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 241001135755 Betaproteobacteria Species 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 101710117542 Botulinum neurotoxin type A Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000534630 Brevibacillus choshinensis Species 0.000 description 1
- BCZXFFBUYPCTSJ-UHFFFAOYSA-L Calcium propionate Chemical compound [Ca+2].CCC([O-])=O.CCC([O-])=O BCZXFFBUYPCTSJ-UHFFFAOYSA-L 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- 241001550206 Colla Species 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 1
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 1
- 102000015295 Cysteine Dioxygenase Human genes 0.000 description 1
- 108010039724 Cysteine dioxygenase Proteins 0.000 description 1
- 101710134744 D-xylose transporter Proteins 0.000 description 1
- 101710174504 D-xylose-proton symporter Proteins 0.000 description 1
- ZAQJHHRNXZUBTE-WUJLRWPWSA-N D-xylulose Chemical compound OC[C@@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-WUJLRWPWSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010092160 Dactinomycin Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000006271 Discosoma sp. Species 0.000 description 1
- 108010089072 Dolichyl-diphosphooligosaccharide-protein glycotransferase Proteins 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108010041308 Endothelial Growth Factors Proteins 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 101001088154 Escherichia coli Regulatory protein rop Proteins 0.000 description 1
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 102000018389 Exopeptidases Human genes 0.000 description 1
- 108010091443 Exopeptidases Proteins 0.000 description 1
- 108010014172 Factor V Proteins 0.000 description 1
- 108010008177 Fd immunoglobulins Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 241000192128 Gammaproteobacteria Species 0.000 description 1
- 230000010558 Gene Alterations Effects 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- BETSEXMYBWCDAE-SZMVWBNQSA-N Gln-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BETSEXMYBWCDAE-SZMVWBNQSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- 108010081687 Glutamate-cysteine ligase Proteins 0.000 description 1
- 102100039696 Glutamate-cysteine ligase catalytic subunit Human genes 0.000 description 1
- SXRSQZLOMIGNAQ-UHFFFAOYSA-N Glutaraldehyde Chemical compound O=CCCCC=O SXRSQZLOMIGNAQ-UHFFFAOYSA-N 0.000 description 1
- 102100034294 Glutathione synthetase Human genes 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- 102000011714 Glycine Receptors Human genes 0.000 description 1
- 108010076533 Glycine Receptors Proteins 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 241000204933 Haloferax volcanii Species 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- RXKFKJVJVHLRIE-XIRDDKMYSA-N His-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CN=CN3)N RXKFKJVJVHLRIE-XIRDDKMYSA-N 0.000 description 1
- HZWWOGWOBQBETJ-CUJWVEQBSA-N His-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O HZWWOGWOBQBETJ-CUJWVEQBSA-N 0.000 description 1
- SWTSERYNZQMPBI-WDSOQIARSA-N His-Trp-Met Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(O)=O)C1=CN=CN1 SWTSERYNZQMPBI-WDSOQIARSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101100153048 Homo sapiens ACAA1 gene Proteins 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108090000862 Ion Channels Proteins 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 244000285963 Kluyveromyces fragilis Species 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 108010001469 L-rhamnose isomerase Proteins 0.000 description 1
- ZAQJHHRNXZUBTE-UCORVYFPSA-N L-ribulose Chemical compound OC[C@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-UCORVYFPSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000186679 Lactobacillus buchneri Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 108050004171 Lon proteases Proteins 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 1
- 101100043756 Metarhizium robertsii (strain ARSEF 23 / ATCC MYA-3075) subE gene Proteins 0.000 description 1
- 101100038261 Methanococcus vannielii (strain ATCC 35089 / DSM 1224 / JCM 13029 / OCM 148 / SB) rpo2C gene Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101100301239 Myxococcus xanthus recA1 gene Proteins 0.000 description 1
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 101150048063 NTP1 gene Proteins 0.000 description 1
- 208000036110 Neuroinflammatory disease Diseases 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101710138657 Neurotoxin Proteins 0.000 description 1
- 102000019315 Nicotinic acetylcholine receptors Human genes 0.000 description 1
- 108050006807 Nicotinic acetylcholine receptors Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 102000000470 PDZ domains Human genes 0.000 description 1
- 108050008994 PDZ domains Proteins 0.000 description 1
- 241000609499 Palicourea Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 102000015731 Peptide Hormones Human genes 0.000 description 1
- 108010038988 Peptide Hormones Proteins 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 1
- JDMKQHSHKJHAHR-UHFFFAOYSA-N Phe-Phe-Leu-Tyr Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)CC1=CC=CC=C1 JDMKQHSHKJHAHR-UHFFFAOYSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 1
- 101100492656 Plasmodium berghei (strain Anka) ApiAT8 gene Proteins 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 102000002294 Purinergic P2X Receptors Human genes 0.000 description 1
- 108010000836 Purinergic P2X Receptors Proteins 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000011530 RNeasy Mini Kit Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108030003267 Rhamnulose-1-phosphate aldolases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 108010041388 Ribonucleotide Reductases Proteins 0.000 description 1
- 102000000505 Ribonucleotide Reductases Human genes 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000192263 Scheffersomyces shehatae Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 241000607715 Serratia marcescens Species 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000205091 Sulfolobus solfataricus Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 101710167005 Thiol:disulfide interchange protein DsbD Proteins 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 101710154918 Trigger factor Proteins 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- PKZIWSHDJYIPRH-JBACZVJFSA-N Trp-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKZIWSHDJYIPRH-JBACZVJFSA-N 0.000 description 1
- 108010057266 Type A Botulinum Toxins Proteins 0.000 description 1
- QJBWZNTWJSZUOY-UWJYBYFXSA-N Tyr-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QJBWZNTWJSZUOY-UWJYBYFXSA-N 0.000 description 1
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- IVOMOUWHDPKRLL-UHFFFAOYSA-N UNPD107823 Natural products O1C2COP(O)(=O)OC2C(O)C1N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-UHFFFAOYSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 102100029089 Xylulose kinase Human genes 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 229930183665 actinomycin Natural products 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- PYMYPHUHKUWMLA-VAYJURFESA-N aldehydo-L-arabinose Chemical compound OC[C@H](O)[C@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-VAYJURFESA-N 0.000 description 1
- HXXFSFRBOHSIMQ-VFUOTHLCSA-N alpha-D-glucose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-VFUOTHLCSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 239000004411 aluminium Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003957 anion exchange resin Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000002137 anti-vascular effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 101150017736 araD gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 238000006065 biodegradation reaction Methods 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 108091006004 biotinylated proteins Proteins 0.000 description 1
- 238000004061 bleaching Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 229940089093 botox Drugs 0.000 description 1
- 231100001103 botulinum neurotoxin Toxicity 0.000 description 1
- 229940053031 botulinum toxin Drugs 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- ZTQSAGDEMFDKMZ-UHFFFAOYSA-N butyric aldehyde Natural products CCCC=O ZTQSAGDEMFDKMZ-UHFFFAOYSA-N 0.000 description 1
- 108091006374 cAMP receptor proteins Proteins 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 239000004330 calcium propionate Substances 0.000 description 1
- 235000010331 calcium propionate Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000004850 capillary HPLC Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 229960004424 carbon dioxide Drugs 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 1
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000004656 cell transport Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000005465 channeling Effects 0.000 description 1
- 239000013522 chelant Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 101150036359 clpB gene Proteins 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 238000012875 competitive assay Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 101150006779 crp gene Proteins 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 229940095074 cyclic amp Drugs 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 229940009976 deoxycholate Drugs 0.000 description 1
- KXGVEGMKQFWNSR-LLQZFEROSA-N deoxycholic acid Chemical compound C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 KXGVEGMKQFWNSR-LLQZFEROSA-N 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000000132 electrospray ionisation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 229940096118 ella Drugs 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000005243 fluidization Methods 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 125000002446 fucosyl group Chemical group C1([C@@H](O)[C@H](O)[C@H](O)[C@@H](O1)C)* 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000005350 fused silica glass Substances 0.000 description 1
- 101150041954 galU gene Proteins 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 238000002873 global sequence alignment Methods 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 102000035122 glycosylated proteins Human genes 0.000 description 1
- 108091005608 glycosylated proteins Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000003966 growth inhibitor Substances 0.000 description 1
- 101150096208 gtaB gene Proteins 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 235000014304 histidine Nutrition 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000013383 initial experiment Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002608 insulinlike Effects 0.000 description 1
- 230000037427 ion transport Effects 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 239000002029 lignocellulosic biomass Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 101150023497 mcrA gene Proteins 0.000 description 1
- 101150017580 mcrC gene Proteins 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- MZFOKIKEPGUZEN-FBMOWMAESA-N methylmalonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C(C(O)=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MZFOKIKEPGUZEN-FBMOWMAESA-N 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- DUWWHGPELOTTOE-UHFFFAOYSA-N n-(5-chloro-2,4-dimethoxyphenyl)-3-oxobutanamide Chemical compound COC1=CC(OC)=C(NC(=O)CC(C)=O)C=C1Cl DUWWHGPELOTTOE-UHFFFAOYSA-N 0.000 description 1
- 230000003959 neuroinflammation Effects 0.000 description 1
- 239000002581 neurotoxin Substances 0.000 description 1
- 231100000618 neurotoxin Toxicity 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- JFNLZVQOOSMTJK-KNVOCYPGSA-N norbornene Chemical compound C1[C@@H]2CC[C@H]1C=C2 JFNLZVQOOSMTJK-KNVOCYPGSA-N 0.000 description 1
- 101150012154 nupG gene Proteins 0.000 description 1
- HEGSGKPQLMEBJL-RKQHYHRCSA-N octyl beta-D-glucopyranoside Chemical compound CCCCCCCCO[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HEGSGKPQLMEBJL-RKQHYHRCSA-N 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 108010003052 omptin outer membrane protease Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 229940037201 oris Drugs 0.000 description 1
- 229940043515 other immunoglobulins in atc Drugs 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- KLAKIAVEMQMVBT-UHFFFAOYSA-N p-hydroxy-phenacyl alcohol Natural products OCC(=O)C1=CC=C(O)C=C1 KLAKIAVEMQMVBT-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 101150022503 phoR gene Proteins 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920001583 poly(oxyethylated polyols) Polymers 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 108010033058 propionate - CoA ligase Proteins 0.000 description 1
- FVSKHRXBFJPNKK-UHFFFAOYSA-N propionitrile Chemical compound CCC#N FVSKHRXBFJPNKK-UHFFFAOYSA-N 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 238000012514 protein characterization Methods 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- 238000000164 protein isolation Methods 0.000 description 1
- 101150109655 ptsG gene Proteins 0.000 description 1
- 239000008213 purified water Substances 0.000 description 1
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000006172 rhamnosylation Effects 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 108090000589 ribonuclease E Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 101150085857 rpo2 gene Proteins 0.000 description 1
- 101150090202 rpoB gene Proteins 0.000 description 1
- 102220195881 rs1057517859 Human genes 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000002821 scintillation proximity assay Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- JXKPEJDQGNYQSM-UHFFFAOYSA-M sodium propionate Chemical compound [Na+].CCC([O-])=O JXKPEJDQGNYQSM-UHFFFAOYSA-M 0.000 description 1
- 239000004324 sodium propionate Substances 0.000 description 1
- 235000010334 sodium propionate Nutrition 0.000 description 1
- 229960003212 sodium propionate Drugs 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 1
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000004065 wastewater treatment Methods 0.000 description 1
- 229920003169 water-soluble polymer Polymers 0.000 description 1
- 101150074257 xylE gene Proteins 0.000 description 1
- 108091022915 xylulokinase Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 150000008498 β-D-glucosides Chemical class 0.000 description 1
- 150000008495 β-glucosides Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/02—Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/24—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
- C07K16/241—Tumor Necrosis Factors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/005—Glycopeptides, glycoproteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/24—Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/55—Fab or Fab'
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/90—Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
- C07K2317/92—Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/002—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Diabetes (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Hematology (AREA)
- Veterinary Medicine (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Preliminary Treatment Of Fibers (AREA)
- General Factory Administration (AREA)
Abstract
본 발명은 각 유전자 산물의 발현의 제어된 유도가 가능한 유도성 공발현 시스템에 사용을 위한 발현 벡터를 제공한다.
Description
관련 출원의 참조
본 출원은 2012년 8월 5일자로 출원된 미국 가출원 제61/679,751호 및 2012년 12월 29일자로 출원된 미국 가출원 제61/747,246호에 대한 우선권의 이득을 35 U.S.C. §119(e) 하에 청구하는, 2013년 8월 5일자로 출원된 국제 특허 출원 PCT/US2013/053562의 35 U.S.C. §371 하의 국내 단계 진입 건인 미국 특허 출원 제 14/419,653호의 일부 계속 출원인 미국 특허 출원 제14/740,475호의 일부 계속 출원이고, 이들 전부의 전체 내용을 본 명세서에 참고로 편입시킨다.
미국 특허 출원 제14/740,475호는 또한 2012년 8월 5일자로 출원된 미국 가출원 제61/679,751호, 및 2012년 12월 29일자로 출원된 미국 가출원 제61/747,246호에 대한 우선권의 이득을 35 U.S.C. §119(e) 하에 청구하는 2013년 8월 5일자로 출원된 국제 특허 출원 PCT/US2013/053562의 우선권을 청구하는 2014년 2월 5일자로 출원된 국제 특허 출원 PCT/US2014/014968의 부분 계속 출원이며, 이들 전부의 전체 내용을 본 명세서에 참고로 편입시킨다.
서열 목록에 대한 참조
본 출원은 본 명세서에 참고로 편입되는 전자 제출된 서열 목록을 포함한다.
발명의 분야
본 발명은 분자 생물학 및 생명공학적 제조의 일반 기술 분야이다. 보다 구체적으로, 본 발명은 재조합 단백질 발현의 기술 분야이다.
생명공학적 물질의 생산은 복잡한 과정이고, 희망하는 생성물이 상이한 유전자에 의해 코딩되는 분자의 조합, 예컨대 2 이상의 상이한 폴리펩타이드로 형성된 다량체 단백질인 경우에는 더 그러하다. 다수 유전자 산물의 성공적인 공발현은 1종 이상의 유전자 산물의 동시 발현으로 인해 심각해 지는, 수많은 도전의 극복을 요구한다. 극복해야만 하는 문제들은 1가지 이상의 벡터 유형을 사용시 상용성 발현 벡터의 생성; 생성물의 정확한 화학양론적 비율의 획득; 결합 파트너에 대해 적절한 입체형태로 정확하게 폴딩되는 유전자 산물의 생성; 세포 및 원치않는 단백질, 예컨대 부정확하게 폴딩되고/되거나 부정확한 입체형태인 단백질로부터 희망 단백질의 정제; 및 희망 생성물(들)의 수율을 극대화하는 한 측면에 따라, 봉입체 형성의 최소화를 포함한다. 많은 다양한 접근법들이 이들 도전을 해결하기 위해 착수되었지만, 더 양호한 공발현 방법에 대한 요구는 여전히 존재한다.
lac 및 ara 프로모터를 함유하는 플라스미드를 포함하여, 몇몇 유도성 박테리아 단백질 발현 시스템이 개별 단백질을 발현하고자 고안되었다. 이들 시스템은 그들이 야생형 이.콜라이(E. coli)의 전체 성장 배양 개체군 내에서 균일하게 단백질을 유도시키는데 실패함에 따라 발현시키기 힘든 단백질의 공발현에서 유용성이 제한적이었다(Khlebnikov and Keasling, "Effect of lacY expression on homogeneity of induction from the Ptac and Ptrc promoters by natural and synthetic inducers", Biotechnol Prog 2002 May-Jun; 18(3): 672-674). 야생형 이.콜라이 lac 및 ara 시스템의 경우처럼, 유도인자에 대한 수송 단백질의 발현이 유도인자의 존재에 의존적인 경우, 유도인자의 세포 농도는 수송 단백질의 생성을 개시시키기 위한 한계치 수준에 도달해야만 하지만, 그러한 한계치에 도달했을 때, 비제어적인 양성 피드백 루프가 발생될 수 있고, 그 결과는 세포 내 유도인자의 고수준 및 그에 따라 유도성 프로모터로부터 발현의 고수준, 즉 "실무율(all-or-none)" 현상이다. 성장 배지 내 유도인자의 농도 증가는 고발현 방식으로 존재하는 개체군 내 세포의 비율을 증가시킨다. 이러한 유형의 시스템이 개체군 규모에서 단백질 발현의 농도-의존적 유도를 유발시키지만, 독성인 것을 포함하여, 발현의 엄격한 제어를 요하거나, 가용성이 불충분하거나, 또는 다른 이유로 특별한 농도를 요하는 단백질의 발현 및 생성은 최적이하이다.
유도인자의 유도인자-의존적 수송을 제거하여, 단일 프로모터 발현 시스템에서 "실무율" 유도 현장을 해결하려는 일부 노력이 이루어져 왔다. 일례는 락토스 퍼미아제 유전자(lacYam)에 무효 돌연변이를 갖고, 수송체의 부재 하에서 어느 정도 세포막을 통과할 수 있는 lac 프로모터의 대체 유도인자, 예컨대 IPTG(아이소프로필-티오-β-D-갈락토사이드)를 사용하는 것이다(Jensen et al., "The use of lac-type promoters in control analysis", Eur J Biochem 1993 Jan 15; 211(1-2): 181-191). 다른 접근법은 아라비노스 수송체 유전자에 결함이 있지만, 락토스 퍼미아제 유전자에 돌연변이, lacY(A117C)를 갖는 균주에서 아라비노스 유도성 프로모터를 사용하여, 세포로 아라비노스를 수송할 수 있게 하는 것이다(Morgan-Kiss et al., "Long-term and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A 2002 May 28; 99(11): 7373-7377).
개별 단백질 발현 시스템의 성분들은 공발현 시스템에서 그들의 사용을 배제하고, 종종 비상용성인데, 그들이 상이한 유도인자-프로모터 시스템 사이의 혼선'으로 인해 부정적으로 영향받을 수 있거나, 상호 배타적인 게놈 변형을 요구하거나, 또는 일반 대사 조절이 가해질 수 있기 때문이다. lac 및 ara 유도성 프로모터 시스템간 '혼선' 문제를 해결하기 위한 시도는 lac 프로모터의 유도인자인, IPTG 존재 하에서 araBAD 프로모터를 유도시키는 이의 능력을 개선시키기 위한 AraC 전사 활성인자의 방향성 진화를 포함하였다(Lee et al., "Directed evolution of AraC for improved compatibility of arabinose- and lactose-inducible promoters", Appl Environ Microbiol 2007 Sep; 73(18): 5711-5715; Epub 2007 Jul 20). 그러나, ara 및 lac 유도성 프로모터를 기반으로 하는 발현 벡터의 상용성은 상호 배타적 게놈 변형, 즉 아라비노스에 의한 araBAD 프로모터의 균일 유도를 위한 lacY 점 돌연변이(lacY(A117C)), 및 IPTG에 의한 lac 프로모터의 균일 유도를 위한 무효 lacY 유전자의 요건에 기인하여 여전히 제한적이다. 일반 대사 조절, 예를 들어 탄소 이화산물 억제(CCR)가 또한 유도성 프로모터의 상용성에 영향을 줄 수 있다. CCR은 다른 당류보다 포도당의 우선적인 사용에서 확인되는 바와 같이, 보다 선호되는 화합물이 존재할 때 탄소-함유 화합물의 이용에 필요한 유전자의 억제를 특징으로 한다. ara 및 prp 유도성 프로모터 시스템의 경우에서, 아라비노스의 존재는 prpBCDE 프로모터로부터 발현을 유도하는 피로피오네이트의 능력을 감소시키며, CCR이 관여하는 것으로 여겨지는 효과이다(Park et al., "The mechanism of sugar-mediated catabolite repression of the propionate catabolic genes in Escherichia coli", Gene 2012 Aug 1; 504(1): 116-121, Epub 2012 May 3). 이들 문제를 극복한 유도성 공발현 시스템에 대한 필요성이 명확하게 존재한다.
본 발명은 각 유전자 산물 성분의 제어된 유도를 할 수 있는 유도성 공발현 시스템에서 사용을 위한 발현 작제물(expression construct)을 제공한다. 본 발명의 일 실시형태는 2종 이상의 유도성 프로모터를 포함하는 발현 작제물이고, 상기 유도성 프로모터의 적어도 하나는 상기 유도성 프로모터의 다른 것의 유도인자와 상이한 유도인자에 반응성이고, 상기 유도성 프로모터의 어떠한 것도 테트라사이클린 유도성 프로모터, 구리 유도성 프로모터, 및 메티오닌 유도성 프로모터로 이루어진 군으로부터 선택된 유도성 프로모터가 아니다. 일부 실시형태에서, 상기 발현 작제물은 락토스 유도성 프로모터를 포함하지 않고, 일정 실시형태에서, 상기 발현 작제물은 포스페이트 고갈에 의한 유도성 프로모터를 포함하지 않는다. 추가 실시형태에서, 발현 작제물은 염색체외(extrachromosomal)에 존재한다. 본 발명의 추가 실시형태는 2종 이상의 유도성 프로모터를 포함하는 발현 작제물을 제공하고, 상기 유도성 프로모터의 적어도 하나는 상기 유도성 프로모터의 다른 것의 유도인자와 상이한 유도인자에 반응성이고, (A) 각각의 유도성 프로모터는 L-아라비노스 유도성 프로모터, 프로피오네이트 유도성 프로모터, 람노스 유도성 프로모터, 자일로스 유도성 프로모터, 락토스 유도성 프로모터, 및 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택되거나, 또는 (B) 적어도 1종의 유도성 프로모터는 araBAD 프로모터, prpBCDE 프로모터, rhaSR 프로모터, xlyA 프로모터, lacZYA 프로모터, 및 phoA 프로모터로 이루어진 군으로부터 선택되거나, 또는 (C) 상기 발현 작제물은 일부 실시형태에서 prpBCDE 프로모터인 적어도 1종의 프로피오네이트 유도성 프로모터, 및 L-아라비노스 유도성 프로모터, 람노스 유도성 프로모터, 자일로스 유도성 프로모터, 락토스 유도성 프로모터 및 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택된 적어도 1종의 유도성 프로모터를 포함하거나, 또는 (D) 상기 발현 작제물은 일부 실시형태에서 araBAD 프로모터인 적어도 1종의 L-아라비노스 유도성 프로모터, 및 프로피오네이트 유도성 프로모터, 람노스 유도성 프로모터, 자일로스 유도성 프로모터, 락토스 유도성 프로모터, 및 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택된 적어도 1종의 유도성 프로모터를 포함하거나, 또는 (E) 적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이거나, 또는 (F) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 4937 내지 5185의 적어도 50개(또는 적어도 75개, 또는 적어도 100개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열을 포함하거나, 또는 (G) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 2818 내지 3151의 적어도 50개(또는 적어도 75개, 또는 적어도 100개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%) 서열 동일성을 갖는 뉴클레오타이드 서열을 포함하거나, 또는 (H) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 2818 내지 3151의 적어도 50개(또는 적어도 75개, 또는 적어도 100개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드, 및 서열번호 15의 뉴클레오타이드 4937 내지 5185의 적어도 50개(또는 적어도 75개, 또는 적어도 100개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드를 포함하거나, 또는 (I) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3000개(또는 적어도 3250개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드를 포함하거나, 또는 (J) 상기 발현 작제물은 서열번호 15의 적어도 3000개(또는 적어도 3250개, 또는 적어도 3500개, 또는 적어도 4000개, 또는 적어도 5000개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열을 포함하거나, 또는 (K) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 1833 내지 5304를 포함하거나, 또는 (L) 상기 발현 작제물은 서열번호 15를 포함하거나, 또는 (M) 상기 발현 작제물은 유도성 프로모터에 결합하는 전사 조절인자를 코딩하는 폴리뉴클레오타이드 서열을 더 포함하고, 일부 실시형태에서, 상기 전사 조절인자는 AraC, PrpR, RhaR 및 XylR로 이루어진 군으로부터 선택되거나; 또는 (N) 상기 발현 작제물은 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함한다.
본 발명은 또한 (a) 서열번호 15의 뉴클레오타이드 4937 내지 5185의 적어도 225개(또는 적어도 240개)의 인접한 염기와 적어도 97%의 서열 동일성을 갖는 뉴클레오타이드; (b) 서열번호 15의 뉴클레오타이드 4937 내지 5304의 적어도 300개(또는 적어도 350개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열; (c) 서열번호 15의 뉴클레오타이드 2818 내지 3259의 적어도 350개(또는 적어도 375개, 또는 적어도 400개, 또는 적어도 425개)의 인접한 염기와 적어도 87%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열; (d) 서열번호 2의 뉴클레오타이드 10 내지 1822의 적어도 400개(또는 적어도 450개, 또는 적어도 500개)의 인접한 염기와 적어도 90%(또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열; (e) 서열번호 15의 뉴클레오타이드 2818 내지 3259; (f) 서열번호 15의 뉴클레오타이드 4937 내지 5185; (g) 서열번호 15의 뉴클레오타이드 4937 내지 5304; (h) 서열번호 15의 뉴클레오타이드 2818 내지 3259 및 서열번호 15의 뉴클레오타이드 4937 내지 5185; (i) 서열번호 15의 뉴클레오타이드 2818 내지 3259 및 서열번호 15의 뉴클레오타이드 4937 내지 5304; (j) 서열번호 2의 뉴클레오타이드 10 내지 1822; 및 (k) 서열번호 2, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8 및 서열번호 15로 이루어진 군으로부터 선택된 뉴클레오타이드 서열로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는 발현 작제물을 제공한다. 본 발명의 일정 실시형태에서, 상기 발현 작제물은 일부 실시형태에서 araBAD 프로모터인 L-아라비노스 유도성 프로모터; 일부 실시형태에서 prpBCDE 프로모터인 프로피오네이트 유도성 프로모터; 일부 실시형태에서 rhaSR 프로모터인 람노스 유도성 프로모터; 일부 실시형태에서 xlyA 프로모터인 자일로스 유도성 프로모터; 일부 실시형태에서 lacZYA 프로모터인 락토스 유도성 프로모터; 및 일부 실시형태에서 phoA 프로모터인 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택된 유도성 프로모터를 포함하고, 일부 실시형태에서, 상기 발현 작제물은 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함한다.
본 발명의 추가 실시형태에서, 발현 작제물은 pBAD240, pPRO43, pPRO44, pPRO45, pPRO430, pPRO430CloDF, 및 pSOL로 이루어진 군으로부터 선택된 플라스미드에 폴리뉴클레오타이드 서열을 삽입시키는 단계를 포함하는 방법에 의해 생성된다.
본 발명은 적어도 1종의 유도성 프로모터를 포함하는 상기 단락에 기술된 바와 같은 본 발명의 적어도 1종의 발현 작제물을 포함하는 숙주 세포를 더 제공한다. 본 발명의 일부 실시형태에서, 이러한 숙주 세포는 원핵생물 세포이고, 일부 예에서는 이. 콜라이 세포이고, 일정 실시형태에서는 이. 콜라이 ASE(DGH) 세포이다. 본 발명의 다른 실시형태에서, 숙주 세포는 진핵생물 세포이고, 일부 예에서는 효모 세포이며, 일부 추가 예에서는 사카로마이세스 세레비지아(Saccharomyces cerevisiae) 세포이다. 본 발명은 또한 하기 중 하나 이상을 더 포함하는 숙주 세포를 제공한다: (a) araBAD 유전자의 결실; (b) araE 및/또는 araFGH 유전자의 변경된 유전자 기능; (c) lacY(A177C) 유전자;(d) prpB 및/또는 prpD 유전자의 감소된 유전자 기능; (e) sbm/scpA-ygfD/argK-ygfGH/scpBC 유전자의 감소된 유전자 기능; (f) gor 및 trxB 유전자의 감소된 유전자 기능; (g) AscG 유전자의 감소된 유전자 기능; (h) 신호 펩타이드가 결여된 DsbC의 형태를 코딩하는 폴리뉴클레오타이드; (i) Erv1p를 코딩하는 폴리뉴클레오타이드; 및 (j) 샤페론, 예컨대 단백질 다이설파이드 아이소머라제(PDI)를 코딩하는, 폴리뉴클레오타이드. 일정 추가 실시형태에서, (A) 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자에 대한 수송체 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 변경을 가지며, 다른 예로서, 상기 수송체 단백질을 코딩하는 유전자는 araE, araF, araG, araH, rhaT, xylF, xylG, 및 xylH로 이루어진 군으로부터 선택되거나, 또는 특히 araE이거나, 또는 상기 유전자 기능의 변경은 보다 구체적으로 항시성 프로모터(constitutive promoter)로부터 araE의 발현이고/이거나; (B) 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖고, 추가 예로서, 적어도 1종의 상기 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 유전자는 araA, araB, araD, prpB, prpD, rhaA, rhaB, rhaD, xylA 및 xylB로 이루어진 군으로부터 선택되고/되거나; (C) 숙주 세포는, 추가 실시형태에서 유전자가 scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC 및 rmlD로 이루어진 군으로부터 선택되는, 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖고/갖거나; (D) 숙주 세포는 티오레독신 환원효소 유전자, 특히 trxB의 유전자 기능의 감소된 수준을 갖고/갖거나; (E) 숙주 세포는, 일정 실시형태에서 유전자가 글루타티온 환원효소 유전자 gor 및/또는 글루타티온 합성효소 유전자 gshA 및 gshB 중 하나 이상인, 글루타티온 환원효소 유전자 및/또는 글루타티온 합성효소 유전자의 유전자 기능의 감소된 수준을 갖고/갖거나; (F) 숙주 세포는 AhpC의 적어도 하나의 돌연변이체를 발현하고/하거나; (G) 숙주 세포는 적어도 1종의 L-아라비노스 유도성 프로모터 및 AraC를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 L-아라비노스 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 갖고, 상기 유전자는 araA 및 araB로 이루어진 군으로부터 선택되고/되거나; (H) 숙주 세포는 적어도 1종의 프로피오네이트 유도성 프로모터 및 PrpR을 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 프로피오네이트 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 갖고, 상기 유전자는 prpB 및 prpD로 이루어진 군으로부터 선택된다.
본 발명의 다른 측면에서, 2 이상의 유형의 발현 작제물을 포함하는 숙주 세포가 제공되고, 각 유형의 상기 발현 작제물은 유도성 프로모터를 포함하며, 상기 각 유형의 발현 작제물은 서로 다른 유형의 발현 작제물의 유도성 프로모터가 아닌 유도성 프로모터를 포함하거나, 또는 각 유형의 상기 발현 작제물은 서로 다른 유형의 발현 작제물의 복제 기원과 상이한 복제 기원을 포함한다.
본 발명의 추가 실시형태에서, 숙주 세포에 포함되는 적어도 1종의 발현 작제물은 유도성 프로모터에 결합하는 전사 조절인자를 코딩하는 폴리뉴클레오타이드 서열을 더 포함하고, 일부 실시형태에서, 전사 조절인자를 코딩하는 폴리뉴클레오타이드 서열 및 상기 전사 조절인자가 결합하는 유도성 프로모터는 동일한 발현 작제물에 존재하고, 추가 예에서, 전사 조절인자는 AraC, PrpR, RhaR 및 XylR로 이루어진 군으로부터 선택되거나, 또는 구체적으로 AraC이거나, 또는 PrpR이다.
본 발명은 또한 적어도 1종의 유도성 프로모터를 포함하는, 상기 단락에 기술된 바와 같은 적어도 1종의 발현 작제물을 포함하는 숙주 세포를 또한 제공하고, 상기 적어도 1종의 발현 작제물은 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함한다. 본 발명의 다른 예는 적어도 1종의 유도성 프로모터 및 유도성 프로모터로부터 전사되는 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 포함하는 적어도 1종의 발현 작제물을 포함하는 숙주 세포를 포함하고, 일정 실시형태에서 적어도 1종의 유전자 산물은 폴리펩타이드이거나, 또는 신호 서열이 결여된 폴리펩타이드이거나, 또는 적어도 하나 및 20개 보다 적은 이황화 결합, 또는 적어도 2개 및 17개보다 적은 이황화 결합, 또는 적어도 18개 및 100개보다 적은 이황화 결합, 또는 적어도 3개 및 10개보다 적은 이황화 결합, 또는 적어도 3개 및 8개보다 적은 이황화 결합을 형성하는 폴리펩타이드이거나, 또는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개 및 9개로 이루어진 군으로부터 선택된 다수의 이황화 결합을 형성하는 폴리펩타이드이거나, 또는 면역글로불린 중쇄 또는 경쇄 또는 이의 단편이거나, 또는 인플릭시맙 중쇄 또는 경쇄 또는 이의 단편이다.
본 발명은 또한 예컨대 상기 기술된 바와 같은 본 발명의 숙주 세포의 배양물을 성장시키는 단계, 및 일부 실시형태에서 적어도 1종의 유도성 프로모터의 유도인자를 첨가하는 단계, 및 추가 실시형태에서, 배양물로부터 유전자 산물을 정제하는 단계에 의해 유전자 산물을 생성시키는 방법을 제공한다. 본 발명의 특정 측면에서, 상기 방법으로 생성된 유전자 산물은 적어도 하나의 이황화 결합을 형성하거나, 또는 적어도 2개 및 17개보다 적은 이황화 결합을 형성하거나, 또는 적어도 2개 및 10개보다 적은 이황화 결합을 형성하거나, 또는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개 및 9개로 이루어진 군으로부터 선택된 다수의 이황화 결합을 형성하는 폴리펩타이드이거나, 또는 면역글로불린 중쇄 또는 경쇄 또는 이의 단편이다. 본 발명은 또한 상기 방법으로 생성된 유전자 산물을 제공하고, 상기 유전자 산물은 신호 펩타이드가 결여되고, 일정 실시형태에서 적어도 하나의 이황화 결합, 또는 적어도 2개 및 17개보다 적은 이황화 결합, 또는 적어도 18개 및 100개 보다 적은 이황화 결합, 또는 적어도 3개 및 10개보다 적은 이황화 결합, 또는 적어도 3개 및 8개보다 적은 이황화 결합을 형성하거나, 또는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개 및 9개로 이루어진 군으로부터 선택된 다수의 이황화 결합을 형성하는 폴리펩타이드이거나, 또는 면역글로불린 중쇄 또는 경쇄 또는 이의 단편이다. 이 방법으로 생성된 유전자 산물, 및 일부 실시형태에서는, 일정 실시형태에서 항체이거나, 또는 보다 구체적인 예에서, 무당화 항체, 키메라 항체, 또는 인간 항체인, 다량체 생성물의 일부가 또한 본 발명에서 제공된다.
또한 상기 단락에 기술된 바와 같은 발현 작제물을 포함하는 키트; 숙주 세포를 포함하는 키트로서, 상기 숙주 세포는 상기 단락에 기술된 바와 같은 본 발명의 적어도 1종의 발현 작제물을 포함하는 숙주 세포인 키트; 및 일부 실시형태에서 적어도 1종의 유도인자를 배양물에 첨가하는 단계를 포함하는, 본 발명의 숙주 세포를 성장시켜 생성된 유전자 산물 또는 다량체 생성물을 포함하는 키트로서, 일부 실시형태에서 상기 다량체 생성물은 항체이거나, 또는 보다 구체적인 예에서 무당화 항체, 키메라 항체 또는 인간 항체인 키트가 본 발명의 시스템 및 방법에 의해 제공된다.
도 1은 유도인자(5)의 적용시 상이한 유전자 산물을 발현시켜, 다량체 생성물(6)을 형성하는, 2종의 상이한 유도성 발현 벡터(3) 및 (4)를 포함하는 숙주 세포(1)를 포함하는, 유도성 공발현 시스템의 개략적인 예시도이다.
도 2는 유도성 공발현 시스템의 특정 용도의 개략적인 개시도로서, 이. 콜라이 숙주 세포 게놈(2)이 신호 펩타이드가 결여된 다이설파이드 아이소머라제 DsbC의 세포질 형태를 코딩하며, 발현 벡터 pBAD24(또는 L-아라비노스 유도성 프로모터를 함유하는 다른 발현 벡터, 예컨대 pBAD240)(3)는 면역글로불린 중쇄의 L-아라비노스 유도성 발현을 제공하고, 발현 벡터 pPRO33(또는 프로피오네이트 유도성 프로모터를 함유하는 다른 발현 벡터, 예컨대 pPRO43, pPRO430, pPRO430(CloDF13), pPRO44, 또는 pPRO45)(4)은 면역글로불린 경쇄의 프로피오네이트 유도성 발현을 제공하며, 유도(5) 시 다량체 항체 생성물(6)을 형성시킨다.
도 3은 유도인자(5)의 적용 시 상이한 유전자 산물을 발현하여, 다량체 생성물(6)을 형성하는, 2종의 상이한 유도성 프로모터(3) 및 (4)를 포함하는 유도성 발현 벡터를 포함하는 숙주 세포(1)를 포함하는, 유도성 공발현 시스템의 개략적인 예시도이다.
도 4는 유도성 공발현 시스템의 특정 용도의 개략적인 예시도로서, 이. 콜라이 숙주 세포 게놈(2)은 유전자 변경 예컨대 신호 펩타이드가 결여된 다이설파이드 아이소머라제 DsbC의 세포질 형태를 포함하고, 다중 프로모터 발현 벡터 예컨대 pSOL은 (3) 면역글로불린 중쇄의 L-아라비노스 유도성 발현 및 (4) 면역글로불린 경쇄의 프로피오네이트 유도성 발현을 제공하여, 유도(5) 시 다량체 항체 생성물(6)을 형성시킨다.
도 5는 유도성 공발현 시스템에 사용하기 위한 벡터("pSOL"이라고도 하는 "이중 벡터")의 개략적인 대표도이다.
도 6은 박테리아 세포에서 형광 단백질의 공발현의 시간 경과를 도시한 그래프이고, 이 그래프에서, 프로피오네이트 유도성 prpBCDE 프로모터로부터 발현된 적색 형광 단백질(RedFP) 유래의 형광이 도시된다. 'pSOL': 이. 콜라이 ASE(DGH) 세포 내 pSOL-YellowFP-RedFP. 'pPRO, pBAD': 이. 콜라이 ASE(DGH) 세포 내 pBAD24-YellowFP/pPRO33-RedFP. 샘플의 각 평균군에 대한 유도인자 농도는 범례에 도시하였는데, 프로피오네이트 농도(0mM, 5mM, 또는 20mM)를 먼저 열거하였고, 다음으로 L-아라비노스 농도(0 마이크로몰, 6.66 마이크로몰, 또는 66.61 마이크로몰)를 열거하였다.
도 7은 박테리아 세포에서 형광 단백질의 공발현의 시간 경과를 도시한 그래프로서, 이 그래프에서 L-아라비노스 유도성 araBAD 프로모터로부터 발현된, 노란색 형광 단백질(YellowFP) 유래의 형광을 도시한다. 'pSOL': 이. 콜라이 ASE(DGH) 세포 내 pSOL-YellowFP-RedFP. 'pBAD, pPRO': 이. 콜라이 ASE(DGH) 세포 내 pBAD24-YellowFP/pPRO33-RedFP. 샘플의 각 평균군에 대한 유도인자 농도는 범례에 도시하였는데, L-아라비노스 농도(0 마이크로몰, 6.66 마이크로몰, 또는 66.61 마이크로몰)를 먼저 열거한 후, 프로피오네이트 농도(0mM, 5mM, 또는 20mM)를 열거하였다.
도 2는 유도성 공발현 시스템의 특정 용도의 개략적인 개시도로서, 이. 콜라이 숙주 세포 게놈(2)이 신호 펩타이드가 결여된 다이설파이드 아이소머라제 DsbC의 세포질 형태를 코딩하며, 발현 벡터 pBAD24(또는 L-아라비노스 유도성 프로모터를 함유하는 다른 발현 벡터, 예컨대 pBAD240)(3)는 면역글로불린 중쇄의 L-아라비노스 유도성 발현을 제공하고, 발현 벡터 pPRO33(또는 프로피오네이트 유도성 프로모터를 함유하는 다른 발현 벡터, 예컨대 pPRO43, pPRO430, pPRO430(CloDF13), pPRO44, 또는 pPRO45)(4)은 면역글로불린 경쇄의 프로피오네이트 유도성 발현을 제공하며, 유도(5) 시 다량체 항체 생성물(6)을 형성시킨다.
도 3은 유도인자(5)의 적용 시 상이한 유전자 산물을 발현하여, 다량체 생성물(6)을 형성하는, 2종의 상이한 유도성 프로모터(3) 및 (4)를 포함하는 유도성 발현 벡터를 포함하는 숙주 세포(1)를 포함하는, 유도성 공발현 시스템의 개략적인 예시도이다.
도 4는 유도성 공발현 시스템의 특정 용도의 개략적인 예시도로서, 이. 콜라이 숙주 세포 게놈(2)은 유전자 변경 예컨대 신호 펩타이드가 결여된 다이설파이드 아이소머라제 DsbC의 세포질 형태를 포함하고, 다중 프로모터 발현 벡터 예컨대 pSOL은 (3) 면역글로불린 중쇄의 L-아라비노스 유도성 발현 및 (4) 면역글로불린 경쇄의 프로피오네이트 유도성 발현을 제공하여, 유도(5) 시 다량체 항체 생성물(6)을 형성시킨다.
도 5는 유도성 공발현 시스템에 사용하기 위한 벡터("pSOL"이라고도 하는 "이중 벡터")의 개략적인 대표도이다.
도 6은 박테리아 세포에서 형광 단백질의 공발현의 시간 경과를 도시한 그래프이고, 이 그래프에서, 프로피오네이트 유도성 prpBCDE 프로모터로부터 발현된 적색 형광 단백질(RedFP) 유래의 형광이 도시된다. 'pSOL': 이. 콜라이 ASE(DGH) 세포 내 pSOL-YellowFP-RedFP. 'pPRO, pBAD': 이. 콜라이 ASE(DGH) 세포 내 pBAD24-YellowFP/pPRO33-RedFP. 샘플의 각 평균군에 대한 유도인자 농도는 범례에 도시하였는데, 프로피오네이트 농도(0mM, 5mM, 또는 20mM)를 먼저 열거하였고, 다음으로 L-아라비노스 농도(0 마이크로몰, 6.66 마이크로몰, 또는 66.61 마이크로몰)를 열거하였다.
도 7은 박테리아 세포에서 형광 단백질의 공발현의 시간 경과를 도시한 그래프로서, 이 그래프에서 L-아라비노스 유도성 araBAD 프로모터로부터 발현된, 노란색 형광 단백질(YellowFP) 유래의 형광을 도시한다. 'pSOL': 이. 콜라이 ASE(DGH) 세포 내 pSOL-YellowFP-RedFP. 'pBAD, pPRO': 이. 콜라이 ASE(DGH) 세포 내 pBAD24-YellowFP/pPRO33-RedFP. 샘플의 각 평균군에 대한 유도인자 농도는 범례에 도시하였는데, L-아라비노스 농도(0 마이크로몰, 6.66 마이크로몰, 또는 66.61 마이크로몰)를 먼저 열거한 후, 프로피오네이트 농도(0mM, 5mM, 또는 20mM)를 열거하였다.
비상용성 고발현 시스템 성분의 문제는 개별 발현 작제물 상에 위치되고, 일부 실시형태에서는 상이한 유도인자에 의해 활성화되는 상용성의 균일하게 유도될 수 있는 프로모터 시스템을 이용하는 협동적인 박테리아 공발현 시스템의 개발에 의해 해결된다. 본 발명의 장점은 제한없이, 1) 유도성 공발현 시스템 내 성분의 개선된 상용성; 2) 함께 다량체를 형성하는 유전자 산물, 또는 유전자 산물의 다른 조합의 유도성 발현(2 이상의 유전자 산물의 공발현); 3) 독립적으로 적정할 수 있는 유도에 의한 유전자 산물 공발현의 개선된 제어; 4) 유전자 산물 복합체 및 예컨대 다량체 생성물을 발현시키기 힘든 다른 생성물 및 이황화 결합을 형성하는 생성물의 개선된 발현; 5) 유전자 산물 공발현의 능력적인 최적화를 포함한다.
공발현되는 유전자 산물. 본 발명의 유도성 공발현 시스템은 희망 생성물에 기여하는 2 이상의 상이한 유전자 산물을 공발현하도록 디자인된다. 희망 생성물은 공발현된 유전자 산물로부터 생성된 다량체일 수 있거나, 또는 공발현을 사용하여 희망 생성물에 더해 그 희망 생성물의 발현을 보조하는 추가의 생성물 또는 생성물들의 조합을 생성시킬 수 있다.
'다량체 생성물'은 다량체 생성물의 기능을 수행하도록 함께 조립되는 유전자 산물의 세트를 의미하고, 유전자 산물과 다른 분자, 예컨대 변형 효소(키나제, 펩티다제 등), 샤페론, 수송체 등 간의 일시적인 회합을 의미하지 않는다. 본 발명의 일정 실시형태에서, 다량체 생성물은 이종다량체이다. 많은 실시형태에서, 공발현된 유전자 산물은 다량체 단백질의 서브유닛인 폴리펩타이드이게 된다. 그러나, 다수의 상이한 비코딩 RNA 분자, 또는 폴리펩타이드와 비코딩 RNA 유전자 산물의 조합을 공발현하기 위해 본 발명의 유도성 공발현 시스템을 사용하는 것이 또한 가능하다. 비단백질 코딩 RNA(npcRNA), 비메신저 RNA(nmRNA), 및 기능적 RNA(fRNA)라고도 하는, 비코딩 RNA 분자는 많은 상이한 유형의 RNA 분자, 예컨대 메신저 RNA가 아니고, 따라서 번역을 통해 폴리펩타이드의 형성을 위한 주형이 아닌 마이크로RNA를 포함한다.
많은 생물학적으로 중요한 생성물이 상이한 폴리펩타이드 사슬의 조합으로 형성된다. 항체 및 항체 단편 이외에도, 본 발명의 유도성 공발현 방법으로 생성시킬 수 있는 다른 다량체 생성물은 G-커플링된 단백질 수용체 및 리간드-게이팅 이온 채널 예컨대 니코틴성 아세틸콜린 수용체, GABAA 수용체, 글리신 수용체, 세로토닌 수용체, 글루타메이트 수용체, 및 ATP-게이팅 수용체 예컨대 P2X 수용체를 포함한다. 보툴리늄 신경독소(흔히 BoTN, BTX, 또는 이의 시판 형태 중 하나, 보톡스(BOTOX)(상표명)(오나보툴리늄톡신A)라고 함)는 이황화 결합으로 연결된 중쇄 및 경쇄로 형성된다(Simpson et al., "The role of the interchain disulfide bond in governing the pharmacological actions of botulinum toxin", J Pharmacol Exp Ther 2004 Mar; 308(3): 857-864, Epub 2003 Nov 14). 상이한 폴리펩타이드 사슬로 형성된 생성물의 다른 예는 인슐린으로서, 진핵생물에서 단일 폴리펩타이드 사슬로 먼저 번역되어, 폴딩된 후 최종적으로 이황화 결합에 의해 함께 유지되는 2개의 폴리펩타이드 사슬로 절단된다. 단일한 숙주 세포에서 보튤리늄 신경독소 또는 성숙한 인슐린의 효율적인 생성이 본 발명의 유도성 공발현 방법의 사용의 예시이다.
본 발명의 방법은 정확하게 폴딩되고/되거나 기능성 생성물로 조립되고, 그러한 기능성 생성물 내의 바람직한 위치(예컨대 실시예 11과 같은 방법으로 결정할 수 있음)에서 바람직한 개수의 이황화 결합을 갖는 유전자 산물을 생성하도록 디자인된다. 유전자 산물 예컨대 폴리펩타이드에 대한 이황화 결합의 개수는 그것이 바람직한 기능성 생성물로 존재 시 그 유전자 산물에 의해 형성되는 분자내 및 분자간 결합의 총 개수이다. 예를 들어, 인간 IgG 항체의 경쇄는 전형적으로 3개의 이황화 결합(2개의 분자내 결합 및 1개의 분자간 결합)을 가지며, 인간 IgG 항체의 중쇄는 전형적으로 7개의 이황화 결합(4개의 분자내 결합 및 3개의 분자간 결합)을 갖는다. 일부 실시형태에서, 바람직한 유전자 산물은 다른 유전자 산물, 예컨대 그 바람직한 유전자 산물의 생성에 유익한, 샤페론과 공발현된다. 샤페론은 다른 유전자 산물의 비공유 폴딩 또는 언폴딩, 및/또는 조립 또는 탈조립을 보조하지만, 구조가 극들의 정상적인 생물학적 기능을 수행시(폴딩 및/또는 조립의 과정을 완료함) 최종 단량체 또는 다량체 유전자 산물 구조에는 존재하지 않는 단백질이다. 샤페론은 발현 작제물 내 유도성 프로모터 또는 항시성 프로모터로부터 발현될 수 있거나, 또는 숙주 세포 염색체로부터 발현될 수 있고, 바람직하게는, 숙주 세포내 샤페론 단백질(들)의 발현은 바람직한 생성물로 적절하게 폴딩 및/또는 조립되는 공발현된 유전자 산물을 생성하도록 충분하게 높은 수준이다. 이. 콜라이 숙주 세포에 존재하는 샤페론의 예는 세포질 또는 주변세포질 단백질의 단백질 응집을 방지하는데 사용되고 있는, 폴딩 인자 DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/IbpB, Skp, Tig(촉발 인자), 및 FkpA이다. DnaK/DnaJ/GrpE, GroEL/GroES, 및 ClpB는 단백질 폴딩을 보조하는데서 상승적으로 기능할 수 있고 따라서 조합한 이들 샤페론의 발현은 단백질 발현에 이득인 것으로 확인되었다(Makino et al., "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 2011 May 14; 10: 32). 원핵생물 숙주 세포에서 진핵생물 단백질을 발현하는 경우, 진핵생물 샤페론 단백질, 예컨대 동일 또는 관련 진핵생물 종 유래의 단백질 단백질 다이설파이드 아이소머라제(PDI)가 본 발명의 일정 실시형태에서, 바람직한 유전자 산물과 공발현되거나 또는 유도적으로 공발현된다.
유도성 프로모터. 다음은 유전자 산물의 발현 또는 공발현을 위한 발현 작제물에 사용할 수 있는 유도성 프로모터와, 그러한 발현 작제물을 함유하는 숙주 세포에 대해 만들 수 있는 유전자 변형의 일부에 대한 설명이다. 이들 유도성 프로모터 및 관련 유전자의 예는 달리 특정하지 않으면, 이. 콜라이 K-12(미국 균주 은행(American Type Culture Collection) 기탁 번호 ATCC 10798)의 아균주인, 에스케리치아 콜라이(Escherichia coli)(이. 콜라이) 균주 MG1655(미국 균주 은행 기탁 번호 ATCC 700926)에서 유래된다. 표 1은 유도성 프로모터 및 관련 유전자의 이들 예에 대한 뉴클레오타이드 서열의 이. 콜라이 MG1655에서의 게놈 위치를 열거한다. 표 1에서 게놈 위치로 언급된, 뉴클레오타이드 및 다른 유전자 서열은 본 명세서에 참고로 분명하게 편입된다. 본 명세서에 기술된 이. 콜라이 프로모터, 유전자 및 균주에 관한 추가의 정보는 ecoliwiki.net에 위치하는, 온라인 EcoliWiki 자원을 비롯하여, 많은 공공 자원에서 확인할 수 있다.
아라비노스 프로모터(본 명세서에서 사용 시, '아라비노스'는 L-아라비노스를 의미함). 아라비노스 이용에 관여하는 몇몇 이. 콜라이 오페론-araBAD, araC, araE, 및 araFGH-은 아라비노스에 의해 유도될 수 있지만 용어 '아라비노스 프로모터' 및 'ara 프로모터'는 전형적으로 araBAD 프로모터를 표시하는데 사용된다. 몇몇 추가 용어, 예컨대 Para, ParaB, ParaBAD, 및 PBAD가 이. 콜라이 araBAD 프로모터를 표시하는데 사용되어 왔다. 'ara 프로모터' 또는 상기 제공된 대체 용어의 본 명세서에서 사용은 이. 콜라이 araBAD 프로모터를 의미한다. 다른 용어의 사용에서 확인할 수 있듯이, 'araC-araBAD 프로모터', araBAD 프로모터는 2방향성 프로모터의 일부로 여겨지는데, araBAD 프로모터는 한 방향으로 araBAD 오페론의 발현을 제어하고, araBAD 프로모터와 아주 가깝게 반대 가닥 상에 있는 araC 프로모터는 다른 방향으로 araC 코딩 서열의 발현을 제어한다. AraC 단백질은 ara BAD 프로모터의 양성 및 음성 전사 조절인자이다. 아라비노스의 부재하에서, AraC 단백질은 PBAD로부터의 전사를 억제하지만, 아라비노스 존재 하에서, AraC 단백질은, 아라비노스 결합 시 이의 입체형태를 변경하여, PBAD로부터의 전사를 가능하게 하는 양성 조절 성분이 된다. araBAD 오페론은 L-아라비노스를, 중간체 L-리불로스 및 L-리불로스-포스페이트를 통해 D-자일룰로스-5-포스페이트로 전환시켜, 대사시키는 단백질을 코딩한다. 아라비노스 유도성 프로모터로부터 발현의 유도를 극대화시키는 목적을 위해, L-아라비노스의 L-리불로스로의 전환을 촉매하는, AraA의 기능을 제거하거나 또는 감소시키고, 경우에 따라 또한 AraB 및 AraD 중 적어도 하나의 기능을 제거하거나 또는 감소시키는데 유용하다. 아라비노스를 다른 당류로 전환시키는 세포의 능력을 제거하거나 또는 감소시켜서, 세포 내 아라비노스의 유효 농도를 감소시키는 숙주 세포의 능력을 제거하거나 또는 감소시키는 것은 아라비노스 유도성 프로모터의 유도에 더 많은 아라비노스를 이용할 수 있게 한다. 아라비노스를 숙주 세포로 이동시키는 수송체를 코딩하는 유전자는 저친화성 L-아라비노스 양자 심포터를 코딩하는 araE,및 ABC 수퍼패밀리 고친화성 L-아라비노스 수송체의 서브유닛을 코딩하는 araFGH 오페론이다. L-아라비노스를 세포로 수송할 수 있는 다른 단백질은 LacY 락토스 퍼미아제의 일정 돌연변이체로서, 각각 위치 177에 알라닌 대신 시스테인 또는 발린 아미노산을 갖는, LacY(A177C) 및 LacY(A177V) 단백질이다(Morgan-Kiss et al., "Long-term and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A 2002 May 28; 99(11): 7373-7377). 아라비노스 유도성 프로모터의 균일한 유도를 달성하기 위해, 아라비노스에 의한 조절과 독립적으로 아라비노스를 세포로 수송시키는 것이 유용하다. 이는 오직 항시성 프로모터로부터 전사되도록 AraFGH 수송체 단백질의 활성을 제거 또는 감소시키고 araE의 발현을 변경시켜 항시성 프로모터로부터만 전사되도록 하여 수행될 수 있다. araE의 항상성 발현은 천연 araE 유전자의 기능을 제거하거나 또는 감소시키고, 항시성 프로모터로부터 발현되는 AraE 단백질에 대한 코딩 서열을 포함하는 발현 작제물을 세포에 도입시키는 것에 의해 수행될 수 있다. 대안적으로, AraFGH 기능이 결여된 세포에서, 숙주 세포의 염색체 araE 유전자의 발현을 제어하는 프로모터는 아라비노스 유도성 프로모터에서 항시성 프로모터로 변화될 수 있다. 유사한 방식으로, 아라비노스 유도성 프로모터의 균일한 유도를 위한 추가 대안으로서, AraE 기능이 결여된 숙주 세포는 항시성 프로모터로부터 발현되는 세포에 존재하는 임의의 기능성 AraFGH 코딩 서열을 가질 수 있다. 다른 대안으로서, 숙주 염색체 내 항시성 프로모터로 천연 araE 및 araFGH 프로모터를 치환시켜서, 항시성 프로모터로부터 araE 유전자 및 araFGH 오페론 둘 다를 발현시키는 것이 가능하다. 또한 AraE 및 the AraFGH 아라비노스 수송체 둘 다의 활성을 제거시키거나 또는 감소시키고, 그러한 상황에서 LacY 락토스 퍼미아제가 아라비노스를 수송시킬 수 있게 하는 LacY 락토스 퍼미아제 내 돌연변이를 사용하는 것이 가능하다. lacY 유전자의 발현은 아라비노스에 의해 정상적으로는 조절되지 않으므로, LacY 돌연변이체 예컨대 LacY(A177C) 또는 LacY(A177V)의 사용은 아라비노스 유도성 프로모터가 아라비노스의 존재에 의해 유도될 때 '실무율' 유도 현상을 야기시키지 않는다. LacY(A177C) 단백질은 세포로 아라비노스를 수송하는 것이 보다 효과적으로 확인되므로, LacY(A177C) 단백질을 코딩하는 폴리뉴클레오타이드의 사용이 LacY(A177V) 단백질을 코딩하는 폴리뉴클레오타이드의 사용보다 바람직하다.
프로피오네이트 프로모터. '프로피오네이트 프로모터' 또는 'prp 프로모터'는 이. 콜라이 prpBCDE 오페론을 위한 프로모터이고, PprpB라고도 한다. ara 프로모터와 유사하게, prp 프로모터는 2방향성 프로모터의 일부로서, 한 방향으로는 prpBCDE 오페론의 발현을 제어하고, 다른 방향으로 prpR 코딩 서열의 발현을 제어하는 prpR 프로모터를 갖는다. PrpR 단백질은 prp 프로모터의 전사 조절인자이고, PrpP 단백질이 2-메틸사이트레이트('2-MC')에 결합시 prp 프로모터로부터의 전사를 활성화시킨다. 프로피오네이트(프로파노에이트라고도 함)는 프로피온산(또는 '프로판산')의 이온, CH3CH2COO―이고, 물의 염석시 유성층을 생성하고 비누성 칼륨 염을 갖는, 이러한 분자 부류의 일정 특성을 공유하는 화학식 H(CH2) n COOH를 갖는 최소의 '지방'산이다. 시판되는 프로피오네이트는 일반적으로 프로피온산의 1가 양이온 염, 예컨대 나트륨 프로피오네이트(CH3CH2COONa), 또는 2가 양이온 염, 예컨대 칼슘 프로피오네이트(Ca(CH3CH2COO)2)로 판매된다. 프로피오네이트는 막투과성이고 PrpE(프로피오닐-CoA 합성효소)에 의한 프로피오네이트의 프로피오닐-CoA로의 전환, 및 이후 PrpC(2-메틸사이트레이트 신타제)에 의한 프로피오닐-CoA의 2-MC로의 전환에 의해 2-MC로 대사된다. prpBCDE 오페론에 의해 코딩되는 다른 단백질, PrpD(2-메틸사이트레이트 디하이드라타제) 및 PrpB(2-메틸아이소사이트레이트 리아제)는 더 작은 생성물 예컨대 피루베이트 및 숙시네이트로 2-MC의 추가 이화작용에 관여한다. 세포 성장 배지에 첨가된 프로피오네이트에 의한 프로피오네이트 유도성 프로모터의 유도를 극대화하기 위해서, 프로피오네이트를 2-MC로 전환시키기 위한 PrpC 및 PrpE 활성뿐만 아니라, 제거되거나 또는 감소된 PrpD 활성, 및 경우에 따라 2-MC가 대사되는 것을 방지하는 PrpB 활성을 갖는 숙주 세포를 갖는 것이 바람직하다. 2-MC 생합성에 관여하는 단백질을 코딩하는 다른 오페론은 scpA-argK-scpBC 오페론이고, sbm-ygfDGH 오페론이라고도 한다. 이들 유전자는 이후 PrpC에 의해 2-MC로 전환시킬 수 있는, 프로피오닐-CoA로 숙시네이트의 전환에 필요한 단백질을 코딩한다. 이들 단백질의 기능의 제거 또는 감소는 2-MC 유도인자의 생성을 위한 유사한 경로를 제거시키고, 따라서 프로피오네이트 유도성 프로모터의 발현의 배경 수준을 감소시키게 되고, 외생적으로 공급되는 프로피오네이트에 대한 프로피오네이트 유도성 프로모터의 감응성을 증가시키게 된다. 균주 JSB(Lee and Keasling, "A propionate-inducible expression system for enteric bacteria", Appl Environ Microbiol 2005 Nov; 71(11): 6856-6862)를 생성시키기 위해, 이. 콜라이 BL21(DE3)에 도입시킨 sbm-ygfD-ygfG-ygfH-ygfI의 결실은 외생적으로 공급된 유도인자의 부재 하에서 배경 발현을 감소시키는데 도움이 되었지만. 이러한 결실은 또한 균주 JSB의 prp 프로모터로부터의 총 발현을 감소시킨 것으로 확인되었다. 그러나, 결실 sbm-ygfD-ygfG-ygfH-ygfI는 또한 기능이 알려지지 않은 추정상 LysR-패밀리 전사 조절인자를 코딩하는 ygfI에 분명하게 영향을 준다는 것을 주의해야 한다. 유전자 sbm-ygfDGH는 하나의 오페론으로서 전사되고, ygfI는 대항 가닥으로부터 전사된다. ygfH 및 ygfI 코딩 서열의 3' 말단이 소수의 염기쌍에 의해 중첩되어서, sbm-ygfDGH 오페론의 전부를 제거시킨 결실이 역시 분명하게 ygfI 코딩 기능을 제거한다. ygfI의 발현이 영향받지 않도록 ygfH(또는 scpC) 유전자의 3' 말단을 충분하게 남겨둔 채로 sbm-ygfDGH 유전자 산물, 예컨대 YgfG(ScpB라고도 함, 메틸말로닐-CoA 디카복실라제)의 서브셋의 기능 제거 또는 감소, 또는 대부분의 sbm-ygfDGH(또는 scpA-argK-scpBC) 오페론의 결실은 유도된 발현의 최대 수준을 감소시키지 않고 프로피오네이트 유도성 프로모터로부터의 배경 발현을 감소시키기에 충분할 수 있다.
람노스 프로모터(본 명세서에서 사용 시, '람노스'는 L-람노스를 의미함). '람노스 프로모터' 또는 'rha 프로모터', 또는 PrhaSR은 이. 콜라이 rhaSR 오페론을 위한 프로모터이다. ara 및 prp 프로모터처럼, rha 프로모터는 2방향성 프로모터의 일부로서, 한 방향으로 rhaSR 오페론의 발현을 제어하고, rhaBAD 프로모터는 다른 방향으로 rhaBAD 오페론의 발현을 제어한다. 그러나, rha 프로모터는 발현을 조정하는데 관여하는 2개의 전사 조절인자, RhaR 및 RhaS를 갖는다. RhaR 단백질은 람노스의 존재 하에서 rhaSR 오페론의 발현을 활성화시키는 한편, RhaS 단백질은 각각 L-람노스 이화 및 수송 오페론의 발현을 활성화시킨다(Wickstrum et al., "The AraC/XylS family activator RhaS negatively autoregulates rhaSR expression by preventing 사이클릭 AMP receptor protein activation", J Bacteriol 2010 Jan; 192(1): 225-232). RhaS 단백질이 또한 rhaSR 오페론의 발현을 활성화시킬 수 있지만, 사실상 RhaS는 훨씬 더 많은 수준으로 RhaR과의 발현을 공동활성화시키는 사이클릭 AMP 수용체 단백질(CRP)의 능력을 방해하여 이 발현을 음성적으로 자가조절한다. rhaBAD 오페론은 L-람노스를 L-람눌로스로 전환시키는 람노스 이화작용 단백질 RhaA(L-람노스 아이소머라제); L-람눌로스를 인산화시켜서 L-람눌로스-1-P를 형성시키는 RhaB(람눌로키나제); 및 L-람눌로스-1-P를 L-락트알데하이드 및 DHAP(다이하이드록시아세톤포스페이트)로 전환시키는 RhaD(람눌로스-1-포스페이트 알돌라제)를 코딩한다. 람노스 유도성 프로모터로부터 발현의 유도에 이용할 수 있는 람노스의 양을 극대화하기 위해서, RhaA, 또는 경우에 따라 RhaA, 및 RhaB 및 RhaD 중 하나의 기능을 제거시키거나 또는 감소시켜서, 이화작용에 의해 분해되는 람노스의 양을 감소시키는 것이 바람직하다. 이. 콜라이 세포는 또한 rmlBDACX(또는 rfbBDACX) 오페론에 의해 코딩되는 단백질 RmlA, RmlB, RmlC 및 RmlD(각각 RfbA, RfbB, RfbC 및 RfbD라고도 함)의 활성을 통해 알파-D-포도당-1-P로부터 L-람노스를 합성할 수 있다. 람노스 유도성 프로모터로부터의 배경 발현을 감소시키고, 외생적으로 공급되는 람노스에 의한 람노스 유도성 프로모터의 유도의 감응성을 강화시키기 위해, RmlA, RmlB, RmlC 및 RmlD 단백질 중 1종 이상의 기능을 제거시키거나 또는 감소시키는 것이 유용할 수 있다. L-람노스는 RhaT, 람노스 퍼미아제 또는 L-람노스:양자 심포터에 의해 세포로 수송된다. 상기에 언급한 바와 같이, RhaT의 발현은 전사 조절인자 RhaS에 의해 활성화된다. RhaT의 발현을 람노스(RhaS의 발현을 유도)에 의한 유도에 독립적으로 만들기 위해, 숙주 세포는 세포 내 모든 기능성 RhaT 코딩 서열이 항시성 프로모터로부터 발현되도록 변경될 수 있다. 추가적으로, 기능성 RhaS가 생성되지 않도록, RhaS에 대한 코딩 서열을 결실시키거나 또는 불활성화시킬 수 있다. 세포에서 RhaS의 기능을 제거시키거나 또는 감소시켜서, rhaSR 프로모터로부터의 발현 수준은 RhaS에 의한 음성적 자가조절 부재로 인해 증가되고, 람노스 이화작용성 오페론 rhaBAD의 발현 수준을 감소되어, rha 프로모터로부터 발현을 유도시키는 람노스의 능력이 더 증가된다.
자일로스 프로모터(본 명세서에서 사용 시, '자일로스'는 D-자일로스를 의미함). 자일로스 프로모터, 또는 'xyl 프로모터', 또는 PxylA는 이. 콜라이 xylAB 오페론을 위한 프로모터를 의미한다. 자일로스 프로모터 영역은 xylAB 오페론 및 xylFGHR 오페론이 둘 다 이. 콜라이 염색체 상에서 반대 방향으로 인접한 자일로스 유도성 프로모터로부터 발현된다는 점에서 다른 유도성 프로모터와 구성이 유사하다(Song and Park, "Organization and regulation of the D-xylose operons in Escherichia coli K-12: XylR acts as a transcriptional activator", J Bacteriol. 1997 Nov; 179(22): 7025-7032). PxylA 및 PxylF 프로모터 둘 다의 전사 조절인자는 자일로스 존재 하에서 이들 프로모터의 발현을 활성화시키는, XylR이다. xylR 유전자는 xylFGHR 오페론의 일부로서 또는 xylH 및 xylR 단백질-코딩 서열 사이에 위치된, 자일로스에 의해 유도될 수 없는, 그 자체의 약한 프로모터로부터 발현된다. D-자일로스는 XylA(D-자일로스 아이소머라제)에 의해 D-자일로스를 D-자일룰로스로 전환시킨 후, XylB(자일룰로키나제)에 의해 인산화되어 D-자일룰로스-5-P를 형성하여 이화된다. 자일로스 유도성 프로모터로부터의 발현의 유도에 이용할 수 있는 세포에서 자일로스의 양을 극대화시키기 위해, 적어도 XylA의 기능, 또는 경우에 따라 XylA 및 XylB 둘 다의 기능을 제거시키거나 또는 감소시켜, 이화작용에 의해 분해되는 자일로스의 양을 감소시키는 것이 바람직하다. xylFGHR 오페론은 ABC 수퍼패밀리 고친화성 D-자일로스 수송체의 서브유닛인, XylF, XylG, 및 XylH를 코딩한다. 이. 콜라이 저친화성 자일로스-양자 심포터를 코딩하는 xylE 유전자는 그 발현이 역시 자일로스에 의해 유도될 수 있는 별개의 오페론을 나타낸다. 자일로스 수송체의 발현을 자일로스에 의한 유도에 독립적으로 만들기 위해서, 숙주 세포는 모든 기능성 자일로스 수송체가 항시성 프로모터로부터 발현되도록 변경될 수 있다. 예를 들어, xylFGHR 오페론은 xylFGH 코딩 서열이 결실되어, XylR이 자일로스 유도성 PxylF 프로모터로부터 발현되는 유일한 활성 단백질로서 남겨지고, 이의 천연 프로모터보다는 항시성 프로모터로부터 xylE 코딩 서열이 발현되도록 변경될 수 있다. 다른 예로서, xylR 코딩 서열은 발현 작제물의 PxylA 또는 PxylF 프로모터로부터 발현되는 한편, xylFGHR 오페론이 결실되고 xylE가 항상적으로 발현되거나, 또는 대안적으로 xylFGH 오페론(발현 작제물에 존재하므로 xylR 코딩 서열이 결여)은 항시성 프로모터로부터 발현되고 xylE 코딩 서열은 활성 단백질을 생성하지 않도록 결실되거나 또는 변경된다.
락토스 프로모터. 용어 '락토스 프로모터'는 lacZYA 오페론을 위한 락토스 유도성 프로모터를 의미하고, 또한 lacZp1이라고도 불리는 프로모터이며, 이러한 락토스 프로모터는 이. 콜라이 K-12 아균주 MG1655의 게놈 서열(NCBI 기준 서열 NC_000913.2, 11-JAN-2012)에서 대략 365603-365568(마이너스 가닥, 대략 365603-365598에 RNA 중합효소 결합('-35') 부위, 365579-365573에 프리브노우 박스('-10'), 및 365567에 전사 개시 부위를 가짐)에 위치된다. 일부 실시형태에서, 본 발명의 유도성 공발현 시스템은 락토스 유도성 프로모터 예컨대 lacZYA 프로모터를 포함할 수 있다. 다른 실시형태에서, 본 발명의 유도성 공발현 시스템은 락토스 유도성 프로모터가 아닌 하나 이상의 유도성 프로모터를 포함한다.
알칼리 포스파타제 프로모터. 용어 '알칼리 포스파타제 프로모터' 및 'phoA 프로모터'는 phoApsiF 오페론을 위한 프로모터로서, 포스페이트 고갈 상태 하에서 유도되는 프로모터를 의미한다. phoA 프로모터 영역은 이. 콜라이 K-12 아균주 MG1655의 게놈 서열(NCBI 기준 서열 NC_000913.3, 16-DEC-2014)에서 대략 401647-401746(플러스 가닥, 401695-401701에 프리브노우 박스('-10')가짐(Kikuchi et al., "The nucleotide sequence of the promoter and the amino-terminal region of alkaline phosphatase structural gene(phoA) of Escherichia coli", Nucleic Acids Res 1981 Nov 11; 9(21): 5671-5678))에 위치한다. phoA 프로모터를 위한 전사 활성인자는, PhoB로서, 센서 단백질 Phor과 함께, 이. 콜라이에서 2-성분 신호 전달 시스템을 형성하는 전사 조절인자이다. PhoB 및 PhoR은 이. 콜라이 K-12 아균주 MG1655의 게놈 서열(NCBI 기준 서열 NC_000913.3, 16-DEC-2014)에서 대략 417050-419300(플러스 가닥, 417,142-417,831에 PhoB 코딩 서열 및 417,889-419,184에 PhoR 코딩 서열을 가짐)에 위치된, phoBR 오페론으로부터 전사된다. phoA 프로모터는 유도인자의 첨가에 의해서보다는 물질-세포내 포스페이트-의 결여에 의해 유도된다는 점에서 상기 기술된 유도성 프로모터와 다르다. 이러한 이유로, phoA 프로모터는 일반적으로 숙주 세포가 포스페이트가 고갈된 단계, 예컨대 발효의 후기 단계에 생성되게끔 유전자 산물의 전사를 유도시키는데 사용된다. 일부 실시형태에서, 본 발명의 유도성 공발현 시스템은 phoA 프로모터를 포함할 수 있다. 다른 실시형태에서, 본 발명의 유도성 공발현 시스템은 phoA 프로모터가 아닌 하나 이상의 유도성 프로모터를 포함한다.
발현 작제물. 발현 작제물은 관심 대상 1종 이상의 유전자 산물의 발현을 위해 디자인된 폴리뉴클레오타이드이고, 따라서 천연적으로 유래된 분자가 아니다. 발현 작제물은 숙주 세포 염색체로 통합될 수 있거나, 또는 숙주 세포 염색체와 독립적으로 복제되는 폴리뉴클레오타이드 분자, 예컨대 플라스미드 또는 인공 염색체로서 숙주 세포 내에서 유지될 수 있다. 발현 작제물의 예는 숙주 세포 염색체로 하나 이상의 폴리뉴클레오타이드 서열의 삽입에 의한 폴리뉴클레오타이드이고, 삽입된 폴리뉴클레오타이드 서열은 염색체 코딩 서열의 발현을 변경시킨다. 발현 벡터는 1종 이상의 유전자 산물의 발현에 특별하게 사용되는 플라스미드 발현 작제물이다. 1종 이상의 발현 작제물은 숙주 세포 염색체로 통합될 수 있거나 또는 염색체외 폴리뉴클레오타이드 예컨대 플라스미드 또는 인공 염색체 상에 유지될 수 있다. 다음은 유전자 산물의 발현 또는 공발현을 위해 발현 작제물에 사용될 수 있는 특정 유형의 폴리뉴클레오타이드 서열의 설명이다.
복제 기원. 발현 작제물은 독립적으로 복제되는 폴리뉴클레오타이드로서 숙주 세포 내에서 유지되기 위해서, 레플리콘이라고도 하는, 복제 기원을 포함해야만 한다. 복제를 위해 동일한 기전을 사용하는 상이한 레플리콘은 반복되는 세포 분열을 통해 단일한 숙주 세포에서 함께 유지될 수 없다. 그 결과, 플라스미드는 표 2에 나타낸 바와 같이, 그들이 함유하는 복제 기원에 따라서 비상용성 군으로 분류될 수 있다.
발현 작제물에 사용을 위한 복제 기원 및 대표 플라스미드 [1] | |||
비상용성군 | 복제 기원: | 카피수: | 대표 플라스미드(ATCC 기탁 번호): |
colE1,pMB1 | colE1 | 15-20 | colE1(ATCC 27138) |
pMB1 | 15-20 | pBR322(ATCC 31344) | |
변형된pMB1 | 500-700 | pUC9(ATCC 37252) | |
IncFII, pT181 | R1(ts) | 15-120 | pMOB45(ATCC 37106) |
F, P1, p15A, pSC101, R6K, RK2 [2] |
p15A | 18-22 | pACYC177(ATCC 37031); pACYC184(ATCC 37033); pPRO33(애드진 17810) [3] |
pSC101 | ∼5 | pSC101(ATCC 37032): pGBM1(ATCC 87497) |
|
RK2 | 4-7 [2] | RK2(ATCC 37125) | |
CloDF13 [4] | CloDF13 | 20-40 [4] | pCDFDuet™-1(EMD 밀리포어 카탈로그 번호 71340-3) |
ColA [4] | ColA | 20-40 [4] | pCOLADuet™-1(EMD 밀리포어 카탈로그 번호 71406-3) |
RSF1030 [4] | RSF1030 (NTP1이라고도 함) |
> 100 [4] | pRSFDuet™-1(EMD 밀리포어 카탈로그 번호 71341-3) |
표 2에 대한 주석: [1] www.bio.davidson.edu/courses/Molbio/Protocols/ORIs.html, 및 문헌 [Sambrook and Russell, "Molecular Cloning: A laboratory manual", 3rd Ed., Cold Spring Harbor Laboratory Press, 2001]로부터 개작함. [2] Kues and Stahl, "Replication of plasmids in gram-negative bacteria", Microbiol Rev 1989 Dec; 53(4): 491-516. [3] pPRO33 플라스미드(미국 특허 제8178338 B2호; May 15 2012; Keasling, Jay)가 애드진 플라스미드 17810으로서 애드진(Addgene)(www.addgene.org)에서 입수 가능함. [4] openwetware.org/wiki/CH391L/S12/Origins_of_Replication; 2013년 8월 3일 접속. |
복제 기원은 다른 기준 중에서도, 비상용성 군, 카피수, 및/또는 숙주 범위를 기반으로 발현 작제물에 사용을 위해 선택될 수 있다. 상기에 기술된 바와 같이, 2 이상의 상이한 발현 작제물이 다수의 유전자 산물의 공발현을 위해 동일 숙주 세포에서 사용되려면, 상이한 발현 작제물이 상이한 비상용성 군 유래의 복제 기원을 함유하는 것, 예를 들어 한 발현 작제물에는pMB1 레플리콘이 다른 것에는 p15A 레플리콘인 것이 최선이다. 숙주 염색체 분자의 수에 대한, 세포 내 발현 작제물의 평균 카피수는 그 발현 작제물에 함유된 복제 기원에 의해 결정된다. 카피수는 세포 당 소수의 카피부터 수백의 범위일 수 있다(표 2). 본 발명의 일 실시형태에서, 동일한 유도인자에 의해 활성화되지만, 상이한 복제 기원을 갖는 유도성 프로모터를 포함하는 상이한 발현 작제물이 사용된다. 세포 내에서 일정한 근사치의 카피수로 각각의 다른 발현 작제물을 유지시키는 복제 기원을 선택하여, 상이한 발현 작제물로부터 발현되는 다른 유전자 산물에 대해서, 한 발현 작제물로부터 발현되는 유전자 산물의 전체 생성 수준을 조정하는 것이 가능하다. 예로서, 다량체 단백질의 서브유닛 A 및 B를 공발현시키기 위해, colE1 레플리콘, ara 프로모터, 및 ara 프로모터로부터 발현되는 서브유닛 A에 대한 코딩 서열: 'colE1-Para-A'를 포함하는 발현 작제물을 생성시킨다. 다른 발현 작제물은 p15A 레플리콘, ara 프로모터, 및 서브유닛 B에 대한 코딩 서열: 'p15A-Para-B'를 포함하는 것을 생성시킨다. 이들 2가지 발현 작제물은 동일한 숙주 세포 내에서 함께 유지될 수 있고, 서브유닛 A 및 B 둘 다의 발현은 성장 배지에 하나의 유도인자, 아라비노스의 첨가에 의해 유도된다. 2개 서브유닛의 발현된 양의 화학양론적 비율을 원하는 비율에 더 가깝게 만들기 위해서, 서브유닛 A의 발현 수준을 서브유닛 B의 발현 수준에 비해 상당히 증가시킬 필요가 있으면, 예를 들어, pUC9 플라스미드의 복제 기원('pUC9ori')에 존재하는 바와 같은 변형된pMB1 레플리콘을 갖는 서브유닛 A에 대한 신규한 발현 작제물: pUC9ori-Para-A를 생성시킬 수 있다. 고카피수 발현 작제물 예컨대 pUC9ori-Para-A로부터 발현되는 서브유닛 A는 p15A-Para-B로부터의 서브유닛 B의 발현에 비해 생성되는 서브유닛 A의 양을 증가시킬 것이다. 유사한 방식으로, 저카피수로 발현 작제물을 유지시키는 복제 기원, 예컨대 pSC101의 사용은 그 작제물로부터 발현되는 유전자 산물의 전체 수준을 감소시킬 수 있다. 복제 기원의 선택은 또한 어떠한 숙주 세포가 그 레플리콘을 포함하는 발현 작제물을 유지시킬 수 있는지 결정할 수 있다. 예를 들어, colE1 복제 기원을 포함하는 발현 작제물은 장내세균과에 속하는 종으로, 이용할 수 있는 숙주 범위가 비교적 협소한데 반해, RK2 레플리콘을 포함하는 발현 작제물은 이. 콜라이, 슈도모나스 애루지노사(Pseudomonas aeruginosa), 슈도모나스 푸티다(Pseudomonas putida), 아조토박터 비넬란디(Azotobacter vinelandii), 및 알칼리제네스 유트로퍼스(Alcaligenes eutrophus)에서 유지될 수 있고, 발현 작제물이 RK2 레플리콘 및 RK2 플라스미드 유래 일부 조절인자 유전자를 포함하면, 시노리조비움 멜리로티(Sinorhizobium meliloti), 아그로박테리움 투머파시엔스(Agrobacterium tumefaciens), 카울로박터 크레센터스(Caulobacter crescentus), 아시네토박터 칼코아세티커스(Acinetobacter calcoaceticus), 및 로도박터 스파에로이데스(Rhodobacter sphaeroides)처럼 다양한 숙주 세포에서 유지시킬 수 있다(Kues and Stahl, "Replication of plasmids in gram-negative bacteria", Microbiol Rev 1989 Dec; 53(4): 491-516).
진핵생물 세포에서 유도성 발현 또는 공발현을 위한 발현 작제물을 생성시키는데 유사한 고려사항을 적용할 수 있다. 예를 들어, 사카로마이세스 세레비지아( Saccharomyces cerevisiae)의 2-미크론 원형 플라스미드는 다른 효모 균주 유래의 플라스미드, 예컨대 pSR1(ATCC 기탁 번호 48233 및 66069; Araki et al., "Molecular and functional organization of yeast plasmid pSR1", J Mol Biol 1985 Mar 20; 182(2): 191-203) 및 pKD1(ATCC 기탁 번호. 37519; Chen et al., "Sequence organization of the circular plasmid pKD1 from the yeast Kluyveromyces drosophilarum", Nucleic Acids Res 1986 Jun 11; 14(11): 4471-4481)와 상용성이다.
선별 마커. 발현 작제물은 일반적으로 선별 배양 배지에서 숙주 세포의 생존 또는 성장에 필수적인 단백질을 코딩하는, 선별 마커라고도 하는, 선별 유전자를 포함한다. 선별 유전자를 포함하는 발현 작제물을 함유하지 않는 숙주 세포는 그 배양 배지에서 생존하지 못하게 된다. 전형적인 선별 유전자는 항생제 또는 다른 독소에 대한 내성을 부여하거나, 또는 숙주 세포의 영양 요구성 결핍을 보완하는 단백질을 코딩한다. 선별 계획의 일례는 약물 예컨대 숙주 세포의 성장을 중지시키는 항생체를 이용하는 것이다. 선별 마커를 포함하는 발현 작제물을 함유하는 세포들은 약물 내성을 부여하는 단백질을 생성시켜서 그 선별법을 견디게 된다. 선별 마커의 선별에 일반적으로 사용되는 항생제의 일부예(및 항생제 내성 표현형을 제공하는 유전자를 표시하는 약어)는 암피실린(AmpR), 클로람페니콜(CmlR 또는 CmR), 카나마이신(KanR), 스펙티노마이신(SpcR), 스트렙토마이신(StrR), 및 테트라사이클린(TetR)이다. 표 2의 많은 대표 플라스미드는 선별 마커를 포함하는데, 예컨대 pBR322(AmpR, TetR);pMOB45(CmR, TetR); pACYC177(AmpR, KanR); 및 pGBM1(SpcR, StrR)이다. 선별 유전자에 대한 천연 프로모터 영역은 일반적으로, 이의 유전자 산물의 코딩 서열과 함께, 발현 작제물의 선별 마커 부분의 일부로서 포함된다. 대안적으로, 선별 유전자의 코딩 서열은 항시성 프로모터로부터 발현될 수 있다.
유도성 프로모터. 본 명세서에서 기술한 바와 같이, 본 발명의 유도성 공발현 시스템의 일부로서 발현 작제물에 포함될 수 있는 몇몇 상이한 유도성 프로모터가 존재한다. 바람직한 유도성 프로모터는 이. 콜라이 K-12 아균주 MG1655 게놈 서열을 기준으로 표 1에 정의된 바와 같은 프로모터 폴리뉴클레오타이드 서열의 적어도 30개(보다 바람직하게는, 적어도 40개, 가장 바람직하게 적어도 50개)의 인접한 염기와 적어도 80% 폴리뉴클레오타이드 서열 동일성(보다 바람직하게는, 적어도 90% 동일성, 가장 바람직하게는, 적어도 95% 동일성)을 공유하고, 폴리뉴클레오타이드 서열 동일성의 백분율은 실시예 11의 방법을 이용하여 결정된다. '표준' 유도 조건(실시예 5 참조) 하에서, 바람직한 유도성 프로모터는 De Mey 등의 정량적 PCR 방법(실시예 6)을 이용하여 결정 시, 이. 콜라이 K-12 아균주 MG1655의 상응하는 '야생형' 유도성 프로모터의 강도의 적어도 75%(보다 바람직하게는, 적어도 100%, 가장 바람직하게는, 적어도 110%)를 갖는다. 발현 작제물 내에서, 유도성 프로모터는 유도적으로 발현시키려는 유전자 산물의 코딩 서열에 대해 5'(또는 '상류')에 위치되어서, 유도성 프로모터의 존재는 유전자 산물을 코딩하는 폴리뉴클레오타이드의 코딩 서열에 대해 5'에서 3' 방향으로 유전자 산물 코딩 서열의 전사를 유도하게 된다.
리보솜 결합 부위. 폴리펩타이드 유전자 산물의 경우, 유도적으로 발현시키고자 하는 유전자 산물의 코딩 서열의 전사 개시 부위와 개시 코돈 사이의 영역의 뉴클레오타이드 서열은 폴리펩타이드 유전자 산물의 mRNA의 5' 비번역 영역('UTR')에 상응한다. 바람직하게는, 5' UTR에 상응하는 발현 작제물의 영역은 숙주 세포의 종에서 확인되는 공통 리보솜 결합 부위(RBS, 또한 샤인-달가르노(Shine-Dalgarno) 서열이라고도 함)와 유사한 폴리뉴클레오타이드 서열을 포함한다. 원핵생물(고세균 및 박테리아)에서, RBS 공통 서열은 GGAGG 또는 GGAGGU이고, 박테리아 예컨대 이. 콜라이에서, RBS 공통 서열은 AGGAGG 또는 AGGAGGU이다. RBS는 전형적으로 5개 내지 10개의 개재 뉴클레오타이드만큼 개시 코돈으로부터 이격된다. 발현 작제물에서, RBS 서열은 바람직하게 AGGAGGU 공통 서열과 바람직하게 적어도 55% 동일하고, 보다 바람직하게 적어도 70% 동일하며, 가장 바람직하게 적어도 85% 동일하고, 5개 내지 10개의 개재 뉴클레오타이드, 보다 바람직하게 6개 내지 9개의 개재 뉴클레오타이드, 및 가장 바람직하게 6개 또는 7개의 개재 뉴클레오타이드만큼 개시 코돈으로부터 이격된다. 바람직한 번역 개시 속도를 일으키는 소정 RBS의 능력은 RBS 계산기를 사용하여, 웹사이트 salis.psu.edu/software/RBSLibraryCalculatorSearchMode에서 계산할 수 있고, 동일한 도구를 사용하여 100,000+배 범위에 걸친 번역 속도에 대해 합성 RBS를 최적화시킬 수 있다(Salis, "The ribosome binding site calculator", Methods Enzymol 2011; 498: 19-42).
다중 클로닝 부위. 폴리링커라고도 하는 다중 클로닝 부위(MCS)는 서로 중첩되거나 또는 매우 가깝게 다수의 제한효소 부위를 함유하는 폴리뉴클레오타이드이다. MCS의 제한효소 부위는 전형적으로 MCS 서열 내에서 1회 존재하고, 바람직하게 플라스미드의 나머지 또는 다른 폴리뉴클레오타이드 작제물 내에 존재하지 않아서, 제한 효소가 오직 MCS 내에서만 플라스미드 또는 다른 폴리뉴클레오타이드 작제물을 절단할 수 있게 한다. MCS 서열의 예는 pBAD18, pBAD18-Cm, pBAD18-Kan, pBAD24, pBAD28, pBAD30, 및 pBAD33를 포함하는, pBAD 시리즈의 발현 벡터(Guzman et al., "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol 1995 Jul; 177(14): 4121-4130); 또는 pBAD 벡터에서 유도된 pPRO 시리즈의 발현 벡터, 예컨대 pPRO18, pPRO18-Cm, pPRO18-Kan, pPRO24, pPRO30, 및 pPRO33(미국 특허 제8178338호 B2; May 15 2012; Keasling, Jay)의 것이 있다. 다중 클로닝 부위는 프로모터 서열의 3'(또는 하류)에 다중 클로닝 부위를 위치시켜서 발현 작제물의 생성에 사용될 수 있으며, MCS는 코딩 서열의 전사가 일어나게 되도록 프로모터에 대해 적절한 위치에, 작제물에 발현 또는 공발현시키려는 유전자 산물의 코딩 서열을 삽입시키는데 사용될 수 있다. 어떠한 제한 효소가 MCS 내에서 절단에 사용되는지에 따라서, 코딩 서열 또는 다른 폴리뉴클레오타이드 서열이 발현 작제물에 삽입된 후 발현 작제물 내에 MCS 서열의 일부 부분이 남을 수 있다. 임의의 남겨진 MCS 서열은 삽입된 서열의 상류, 또는 하류, 또는 양쪽 부분에 있을 수 있다. 리보솜 결합 부위는 MCS의 상류, 바람직하게는 바로 인접하거나 또는 오직 소수의 뉴클레오타이드만큼 MCS로부터 이격될 수 있고, 이러한 경우에 RBS는 MCS에 삽입된 임의의 코딩 서열의 상류이게 된다. 다른 대안은 MCS 내에 리보솜 결합 부위를 포함시키는 것인데, 이러한 경우, MCS내에서 절단에 사용되는 제한 효소의 선택은 RBS가 삽입된 서열에 대해서 어떻게 유지되는지 여부를 결정하게 된다. 추가의 대안은 바람직하게 전사된 메신저 RNA로부터 번역의 개시를 자극하도록 임의의 코딩 서열에 대해 적절하게, MCS에서 발현 작제물에 삽입시키려는 폴리뉴클레오타이드 서열 내에 RBS를 포함시키는 것이다.
항시성 프로모터로부터의 발현. 본 발명의 발현 작제물은 항시성 프로모터로부터 발현되는 코딩 서열을 또한 포함할 수 있다. 유도성 프로모터와 달리, 항시성 프로모터는 대부분의 성장 조건 하에서 계속적인 유전자 산물 생성을 개시한다. 항시성 프로모터의 일례는 베타-락타마제를 코딩하고 pBR322(ATCC 31344), pACYC177(ATCC 37031), 및 pBAD24(ATCC 87399)를 포함하는, 많은 플라스미드에 의해 숙주 세포에 부여되는 암피실린 내성(AmpR) 표현형을 담당하는, Tn3 bla 유전자의 것이 있다. 발현 작제물에 사용될 수 있는 다른 항시성 프로모터는 이. 콜라이 K-12 아균주 MG1655에서 위치 1755731-1755406(플러스 가닥)에 위치하는 이. 콜라이 지단백질 유전자, lpp의 프로모터이다(Inouye and Inouye, "Up-promoter mutations in the lpp gene of Escherichia coli", Nucleic Acids Res 1985 May 10; 13(9): 3101-3110). 이. 콜라이에서 이종성 유전자 발현에 사용되는 항시성 프로모터의 추가예는 이. 콜라이 K-12 아균주 MG1655에서 위치 1321169-1321133(마이너스 가닥)에 위치하는 trpLEDCBA 프로모터가 있다(Windass et al., "The construction of a synthetic Escherichia coli trp promoter and its use in the expression of a synthetic interferon gene", Nucleic Acids Res 1982 Nov 11; 10(21): 6639-6657). 항시성 프로모터는 본 명세서에 기술된 대로, 선별 마커의 발현, 및 또한 희망 생성물의 공발현에 유용한 다른 유전자 산물의 항상성 발현을 위해 발현 작제물에 사용될 수 있다. 예를 들어, 유도성 프로모터의 전사 조절인자, 예컨대 AraC, PrpR, RhaR 및 XylR은 2방향성 유도성 프로모터로부터 발현되지 않으면, 대안적으로 그들이 조절하는 유도성 프로모터와 동일한 발현 작제물 상에서, 또는 다른 발현 작제물 상에서, 항시성 프로모터로부터 발현될 수 있다. 유사하게, 유도인자의 생성 또는 수송에 유용한 유전자 산물, 예컨대 PrpEC, AraE 또는 Rha, 또는 소수의 예로서, 세포의 환원-산화 환경을 변형시키는 단백질이 발현 작제물 내의 항시성 프로모터로부터 발현될 수 있다. 공발현되는 유전자 산물의 생성에 유용한 유전자 산물, 및 최종 희망 생성물은 또한 샤페론 단백질, 보조인자 수송체 등을 포함한다.
신호 펩타이드. 본 발명의 방법에 의해 발현되거나 또는 공발현되는 폴리펩타이드 유전자는 각각 그러한 유전자 산물이 숙주 세포 세포질에서 주변 세포질로 유출되거나, 또는 세포질에 유지되는 것이 바람직한지 여부에 따라서, 신호 펩타이드를 함유할 수 있거나, 또는 그들이 결여될 수 있다. 신호 펩타이드(또한 신호 서열, 리더 서열, 또는 리더 펩타이드라고도 함)는 단일 알파-나선을 형성하는 경향을 갖는, 구조적으로 소수성 아미노산의 스트레치, 대략 5개 내지 20개 아미노산 길이 및 종종 대략 10개 내지 15개 아미노산 길이를 특징으로 한다. 이러한 소수성 스트레치는 종종 양으로 하전된 아미노산(구체적으로 리신)이 농축된 더 짧은 스트레치가 바로 앞에 선행된다. 성숙한 폴리펩타이드로부터 절단되는 신호 펩타이드는 전형적으로 신호 펩티아제에 의해 인식되고 절단되는 아미노산의 스트레치에서 종결된다. 신호 펩타이드는 원핵생물의 원형질막(또는 이.콜라이 같은 그람 음성 박테리아의 내막)을 통해서, 또는 진핵생물의 소포체로, 번역과 동시에 또는 번역 후에, 폴리펩타이드의 수송을 유도하는 능력을 통해 기능적으로 특징될 수 있다. 신호 펩타이드가 이. 콜라이와 같은 숙주 세포의 주변세포질 공간으로 폴리펩타이드를 수송시킬 수 있는 정도는 예를 들어, 예컨대 실시예 12에 제공된 방법을 이용해서, 세포질에 유지된 단백질로부터 주변세포질 단백질을 분리하여 결정할 수 있다.
숙주 세포. 본 발명의 유도성 공발현 시스템은 다수의 유전자 산물을 발현하도록 디자인되었고, 본 발명의 일정 실시형태에서, 유전자 산물은 숙주 세포에서 공발현된다. 다량체 생성물의 성분의 효율적이고 비용 효과적인 유도성 공발현을 가능하게 하는 숙주 세포의 예가 제공된다. 숙주 세포는 배양된 단리된 세포이외에도, 다세포 유기체의 일부인 세포, 또는 상이한 유기체 또는 유기체의 체계 내에서 성장시킨 세포를 포함할 수 있다. 또한, 본 발명의 유도성 공발현 시스템의 발현 작제물은 세포 무함유 시스템, 예컨대 맥아 추출물 또는 박테리아 세포 추출물을 기반으로 한 것, 예컨대 이. 콜라이 추출물 및 항온처리 장치 예컨대 RTS 프로테오마스터(ProteoMaster)(Roche Diagnostics GmbH; Mannheim, Germany)를 사용한 연속-교환 세포 무함유(CEDF) 단백질 합성 시스템(Jun et al., "Continuous-exchange cell-free protein synthesis using PCR-generated DNA and an RNase E-deficient extract", Biotechniques 2008 Mar; 44(3): 387-391)에서 사용될 수 있다.
원핵생물 숙주 세포. 본 발명의 일부 실시형태에서, 유전자 산물의 공발현을 위해 디자인된 발현 작제물은 숙주 세포, 바람직하게 원핵생물 숙주 세포에 제공된다. 원핵생물 숙주 세포는 고세균(예컨대 할로페락스 볼카니(Haloferax volcanii), 설포로버스 솔파타리커스(Sulfolobus solfataricus)), 그람 양성 박테리아(예컨대 바실리스 서브틸리스(Bacillus subtilis), 바실러스 리체니포르미스(Bacillus licheniformis), 브레비바실러스 코시넨시스(Brevibacillus choshinensis), 락토바실러스 브레비스(Lactobacillus brevis), 락토바실러스 부치네리(Lactobacillus buchneri), 락토코커스 락티스(Lactococcus lactis), 및 스트렙토마이세스 리비단스(Streptomyces lividans)), 또는 알파프로테오박테리아(아그로박테리움 투머파시엔스(Agrobacterium tumefaciens), 카울로박터 크레센터스(Caulobacter crescentus), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 및 시노리조비움 멜리로티(Sinorhizobium meliloti)), 베타프로테오박테리아(알칼리제네스 유트로퍼스(Alcaligenes eutrophus)), 및 감마프로테오박테리아(아시네토박터 칼코아세티커스(Acinetobacter calcoaceticus), 아조토박터 비네란디(Azotobacter vinelandii), 에스케리치아 콜라이(Escherichia coli), 슈도모나스 애루지노사(Pseudomonas aeruginosa), 및 슈도모나스 푸티다(Pseudomonas putida))를 포함한 그람 음성 박테리아를 포함할 수 있다. 바람직한 숙주 세포는 장내세균과의 감마프로테오박테리아, 예컨대 엔테로박터(Enterobacter), 어위니아(Erwinia), 에스케리치아(이. 콜라이 포함), 클렙시엘라(Klebsiella), 프로테우스(Proteus), 살모넬라(Salmonella)(살모넬라 티피뮤리움(Salmonella typhimurium)), 세라티아(Serratia)(세라티아 마르세스칸스(Serratia marcescans)) 및 시겔라(Shigella)를 포함한다.
진핵생물 숙주 세포. 진핵생물 세포 예컨대 효모(캔디다 세하타(Candida shehatae), 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 프라질리스(Kluyveromyces fragilis), 다른 클루이베로마이세스 종, 피키아 파스토리스(Pichia pastoris), 사카로마이세스 세레비지아(Saccharomyces cerevisiae), 사카로마이세스 칼스베르젠시스(Saccharomyces carlsbergensis)라고도 알려진 사카로마이세스 파스토리아너스(Saccharomyces pastorianus), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 데케라/브레타노마이세스(Dekkera/Brettanomyces) 종 및 야로위아 리포리티카(Yarrowia lipolytica)); 다른 진균(아스퍼질러스 니둘란스(Aspergillus nidulans), 아스퍼질러스 니거(Aspergillus niger), 뉴로스포라 크라사(Neurospora crassa), 페니실리움(Penicillium), 톨리포클라디움(Tolypocladium), 트리코더마 레에시아(Trichoderma reesia)); 곤충 세포주(드로소필라 멜라노가스터 슈나이더(Drosophila melanogaster Schneider) 2 세포 및 스포돕테라 프루지페르다(Spodoptera frugiperda) Sf9 세포); 및 불멸화 세포주(중국 햄스터 난소(CHO) 세포, HeLa 세포, 어린 햄스터 신장(BHK) 세포, 원숭이 신장 세포(COS), 인간 배아 신장(HEK, 293, 또는 HEK-293) 세포, 및 인간 간세포 암종 세포(Hep G2))를 포함한 포유동물 세포주를 포함하는, 많은 추가 유형의 숙주 세포가 본 발명의 유도성 공발현 시스템에 사용될 수 있다. 상기 숙주 세포들은 미국 균주 은행(American Type Culture Collection)에서 입수할 수 있다.
숙주 세포 유전자 기능에 대한 변경. 유도인자에 의한 숙주 세포 개체군의 효율적이고 균일한 유도를 촉진하기 위해서, 유도성 발현 작제물을 포함하는 숙주 세포의 유전자 기능에 일정 변경을 만들 수 있다. 바람직하게는, 발현 작제물, 숙주 세포 유전자형, 및 유도 조건의 조합은 실시예 6에 기술된 바와 같은 Khlebnikov 등의 방법으로 측정시, 각 유도된 프로모터로부터 유전자 산물을 발현하는 배양에서 세포의 적어도 75%(보다 바람직하게 적어도 85%, 및 가장 바람직하게는, 적어도 95%)를 유발시킨다. 이. 콜라이 이외의 숙주 세포의 경우, 이들 변경은 이. 콜라이 유전자와 유사한 숙주 세포 내에서 기능을 보유하는 유전자, 또는 이. 콜라이 유전자와 구조적으로 유사한 유전자의 기능을 포함할 수 있다. 숙주 세포 유전자 기능에 대한 변경은 그 전체의 유전자 단백질-코딩 서열을 결실시키거나, 또는 유전자의 충분히 큰 부분을 결실시키거나, 유전자에 서열을 삽입시키거나, 또는 아니면 유전자 서열을 변경시키도록 기능성 유전자 산물의 감소된 수준이 그 유전자로부터 만들어지게 유전자 기능을 제거 또는 감소시키는 것을 포함한다. 숙주 세포 유전자 기능에 대한 변경은 또한, 예를 들어 유전자의 더 높은 수준의 전사를 유도하는 더 강력한 프로모터를 생성하도록 천연 프로모터를 변경시키거나, 또는 더욱 고도의 활성 유전자 산물이 유발되게, 단백질 코딩 서열에 미스센스 돌연변이를 도입시켜 유전자 기능을 증가시키는 것을 포함한다. 숙주 세포 유전자 기능에 변경은 예를 들어, 항상적으로 활성화된 프로모터를 생성시키도록 천연 유도성 프로모터를 변경하는 것을 포함하여, 임의 방식으로 유전자 기능을 변경시키는 것을 포함한다. 유도성 프로모터와 관련하여 본 명세서에 기술된 바와 같이, 유도인자의 수송 및 대사를 위한 유전자 기능의 변경, 및 샤페론 단백질의 변경된 발현이외에도, 탄소 이화산물 억제(CCR) 조절 시스템 및/또는 숙주 세포의 환원-산화 환경을 변화시키는 것도 가능하다.
탄소 이화산물 억제 ( CCR). 숙주 내에서 활성 CCR 조 절 시스템의 존재는 유도성 프로모터로부터 전사를 활성화시키는 유도인자의 능력에 영향을 줄 수 있다. 예를 들어, 숙주 세포 예컨대 이. 콜라이를 포도당을 함유하는 배지에서 성장시키는 경우, 다른 탄소 공급원의 이용에 필요한 유전자, 예컨대 araBAD 및 prpBCDE 오페론은 적어도, 심지어 아리비노스 또는 프로피오네이트 유도인자가 또한 성장 배지에 존재하더라도 낮은 수준으로 발현된다. 포도당 이외의 탄소 공급원의 이용 체계가 또한 존재하는데, ara 및 prp 유도성 프로모터 시스템의 경우처럼, 아라비노스의 존재가 prpBCDE 프로모터로부터 발현을 유도하는 프로피오네이트의 능력을 감소시킨다(Park et al., "The mechanism of sugar-mediated catabolite repression of the propionate catabolic genes in Escherichia coli", Gene 2012 Aug 1; 504(1): 116-121; Epub 2012 May 3). 따라서 세포의 CCR 기전은 선호되는 탄소 공급원이 덜 선호되는 탄소 공급원에 의한 유도를 억제하게 하게 되므로, 유도성 공발현 시스템에서 2 이상의 탄소 공급원을 사용하는 것을 더 어렵게 만든다. 상기 문헌 [Park et al.]의 저자들은 cAMP와 독립적으로 기능할 수 있는 변경된 cAMP 수용체 단백질을 생성하는 돌연변이체 crp 유전자, 또는 CCR의 조절에 관여하는 PTS(포스포트랜스퍼라제 시스템) 유전자의 결실을 사용하여, 아라비노스에 의한 prp 프로모터의 억제를 경감시키고자 시도하였지만, 양쪽 시도 모두 대체로 성공적이지 않았다.
그러나, 문헌 [Park et al.] 저자들이 사용한 PTS-넉아웃 균주는 이. 콜라이 ptsHI-crr 오페론이 결실된 균주 TP2811을 기반으로 한다(Hernandez-Montalvo et al., "Character-ization of sugar mixtures utilization by an Escherichia coli mutant devoid of the phosphotransferase system", Appl Microbiol Biotechnol 2001 Oct; 57(1-2): 186-191). 전체 ptsHI-crr 오페론의 결실은 단지 crr 유전자의 결실보다 더욱 유의하게 전체 cAMP 합성에 영향을 주는 것으로 확인되었다(Levy et al., "cyclic AMP synthesis in Escherichia coli strains bearing known deletions in the pts phosphotransferase operon", Gene 1990 Jan 31; 86(1): 27-33). 다른 접근법은 이. 콜라이에서 CCR의 핵심 성분인, 포도당 특이적 EII A(EII Aglc)를 코딩하는 숙주 세포의 ptsG 유전자의 기능을 제거시키거나 또는 감소시키는 것이다(Kim et al., "Simultaneous consumption of pentose and hexose sugars: an optimal microbial phenotype for efficient fermentation of lignocellulosic biomass", Appl Microbiol Biotechnol 2010 Nov; 88(5): 1077-1085, Epub 2010 Sep 14). prp 프로모터의 높은 전사를 야기시키는, 숙주 세포 예컨대 이. 콜라이의 게놈 내 다른 변경은 AscG를 코딩하는, ascG 유전자의 유전자 기능을 제거시키거나 또는 감소시키는 것이다. AscG는 정상 성장 조건 하에서 베타-D-글루코사이드-이용 오페론 ascFB의 억제인자이고, 또한 prp 프로모터의 전사를 억제하며, prp 프로모터로부터의 전사를 증가시키는 것으로 확인되었다(Ishida et al., "Participation of regulator AscG of the beta-glucoside utilization operon in regulation of the propionate catabolism operon", J Bacteriol 2009 Oct; 191(19): 6136-6144; Epub 2009 Jul 24). 추가의 대안은 강력한 항시성 프로모터의 제어 하에, 또는 보다 선호되는 탄소 공급원 유도인자의 제어 하에 위치시켜서, 덜 선호되는 탄소 공급원 유도인자에 의해 유도될 수 있는 프로모터의 전사 조절인자의 발현을 증가시키는 것이다. 예를 들어, 보다 선호되는 아라비노스의 존재 하에서 덜 선호되는 탄소 공급원 자일로스의 이용에 필요한 유전자의 유도를 증가시키기 위해서, XylR의 코딩 서열을 이. 콜라이 araBAD 오페론에 위치시켰다(Groff et al., "Supplementation of intracellular XylR leads to coutilization of hemicellulose sugars", Appl Environ Microbiol 2012 Apr; 78(7): 2221-2229, Epub 2012 Jan 27). 따라서 유도성 공발현 작제물을 포함하는 숙주 세포는 덜 선호되는 탄소 공급원 유도인자(들)에 의해 유도될 수 있는 프로모터의 전사 조절인자에 대한 유전자 기능의 증가된 수준, 및 CCR 시스템, 예컨대 crr 및/또는 ptsG 및/또는 ascG에 관여하는 유전자에 대해 제거되거나 또는 감소된 유전자 기능을 포함한다.
다른 화합물로 유도인자를 대사시키는(metabolize) 능력이 결여되도록, 유전자 변형된 본 발명의 숙주 세포는 덜 선호되는 탄소 공급원에 의해 조절되는 프로모터 상의 유도인자에 의한 CCR을 반드시 보이는 것은 아니다. 상당한 CCR 효과의 부재는 매우 낮은 농도의 비대사 유도인자를 사용했을 때 관찰되며, 놀랍게도, 이러한 매우 낮은 농도는 또한 유전자 산물의 최적 수율을 생성시키는데 가장 효과적이다. 예를 들어, 유전자 산물의 공발현은 L-아라비노스 유도성 araBAD 프로모터로부터 하나의 유전자 산물 성분 및 프로피오네이트 유도성 prpBCDE 프로모터로부터 다른 유전자 산물 성분을 발현시켜 수행될 수 있다. 숙주 세포, 예컨대 이. 콜라이 EB0001 및 EB0002 세포(하기 실시예 1에 기술됨)에서, 공발현은 전형적으로 세포의 OD 유닛 당 100 마이크로몰(0.0015%) 미만의 L-아라비노스 유도인자 농도에서 다량체 유전자 산물의 최고 수율이 생성되었고, 이들 L-아라비노스 농도에서, prpBCDE 프로모터의 매우 적거나 또는 전혀 없는 L-아라비노스 매개 CCR이 관찰되었다.
보조인자의 세포 수송. 기능을 위해 보조인자를 필요로 하는 효소를 생성시키기 위해 본 발명의 유도성 공발현 시스템을 사용하는 경우, 이용가능한 전구체로부터 보조인자를 합성할 수 있거나, 또는 환경으로부터 흡수할 수 있는 숙주 세포를 사용하는 것이 도움이 된다. 일반적인 보조인자는 ATP, 조효소 A, 플라빈 아데닌 다이뉴클레오타이드(FAD), NAD+/NADH, 및 헴을 포함한다.
숙주 세포 환원-산화 환경. 많은 다량체 유전자 산물, 예컨대 항체는 이황화 결합을 함유한다. 이. 콜라이 및 많은 다른 세포의 세포질은 정상적으로 티오레독신 및 글루타레독신/글루타티온 효소 시스템에 의해 환원 상태가 유지된다. 이는 세포질에서 이황화 결합의 형성을 못하게 만들고, 이황화 결합이 필요한 단백질은 이황화 결합 형성 및 이성질체화가 DsbABCD 및 DsbG를 포함하는 Dsb 시스템에 의해 촉매되는 주변세포질로 유출된다. 주변세포질로 모두 정상적으로 수송되는, 시스테인 옥시다제 DsbA, 다이설파이드 아이소머라제 DsbC, 또는 Dsb 단백질의 조합의 높은 발현은 이황화 결합을 필요로 하는 이종성 단백질의 발현에 이용되었다(Makino et al., "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 2011 May 14; 10: 32). 이들 Dsb 단백질의 세포질 형태, 예컨대 신호 펩타이드가 결여되어서 주변세포질로 수송되지 않는 DsbC('cDsbC')의 세포질 형태를 발현시키는 것이 또한 가능하다. 세포질 Dsb 단백질 예컨대 cDsbC는 숙주 세포의 세포질을 더욱 산화적으로 만들고 그에 따라 세포질에서 생성되는 이종성 단백질에서 이황화 결합의 형성에 더욱 도움이 되게 만드는데 유용하다. 숙주 세포 세포질은 또한 티오레독신 및 글루타레독신/글루타티온 효소 시스템을 직접적으로 변경시켜 더욱 산화적으로 만들어질 수 있는데, 티오레독신 환원효소(trxB)와 함께, 글루타티온 환원효소(gor) 또는 글루타티온 합성효소(gshB)에 결함이 있는 돌연변이체 균주는 세포질을 산화적으로 만든다. 이들 균주는 리보뉴클레오타이드를 감소시킬 수 없고, 따라서 외생성 환원제, 예컨대 다이티오트레이톨(DTT)의 부재 하에서 성장할 수 없다. 퍼옥시리독신 AhpC를 코딩하는 유전자 ahpC에 억제인자 돌연변이(ahpC*)는 환원된 글루타티온을 발생시키는 다이설파이드 환원효소로 전환시켜서, 효소 리보뉴클레오타이드 환원효소 상에서 전자의 채널링을 가능하게 하고 gor 및 trxB에 결함이 있거나, gshB 및 trxB에 결함이 있는 세포가 DTT 부재 하에서 성장할 수 있게 한다. AhpC의 상이한 부류의 돌연변이된 형태는 감마글루타밀시스테인 합성효소(gshA)의 활성에 결함 및 trxB에 결함이 있는 균주가 DTT 부재 하에서 성장할 수 있게 하며, 이들은 AhpC V164G, AhpC S71F, AhpC E173/S71F, AhpC E171Ter, 및 AhpC dup162-169를 포함한다(Faulkner et al., "Functional plasticity of a peroxidase allows evolution of diverse disulfide-reducing pathways", Proc Natl Acad Sci U S A 2008 May 6; 105(18): 6735-6740, Epub 2008 May 2). 세포질이 산화된 이러한 균주에서, 노출된 단백질 시스테인은 이황화 결합의 형성이 일어나는, 그들의 생리적 기능의 반적으로, 티오레독신에 의해 촉매되는 과정에서 쉽게 산화된다.
숙주 세포에 만들 수 있는 다른 변경은 숙주 세포 세포질 내 효모 미토콘드리아의 내막 공간으로부터 설프하이드릴 옥시다제 Erv1p를 발현시키는 것인데, 이는 gor 또는 trxB에 돌연변이의 부재 하에서도, 이. 콜라이의 세포질 내에서 진핵생물 기원의 다양한 복합체, 이황화-결합된 단백질의 생성을 증가시키는 것으로 확인되었다(Nguyen et al., "Pre-expression of a sulfhydryl oxidase significantly increases the yields of eukaryotic disulfide bond containing proteins expressed in the cytoplasm of E. coli" Microb Cell Fact 2011 Jan 7; 10: 1). 유도성 공발현 작제물을 포함하는 숙주 세포는 바람직하게 또한 cDsbC 및/또는 Erv1p를 발현하고, trxB 유전자 기능에 결함이 있고, 또한 gor, gshB 또는 gshA의 유전자 기능에 결함이 있으며, 적어도 하나의 적절한 돌연변이체 형태의 AhpC를 발현하여 숙주 세포가 DTT 부재 하에서 성장할 수 있게 된다.
폴리펩타이드 유전자 산물의 당화. 숙주 세포는 폴리펩타이드를 당화시키는 그들의 능력에 변경을 가질 수 있다. 예를 들어, 진핵생물 숙주 세포는 당단백질을 형성하는 폴리펩타이드의 정상 진핵생물 당화를 손상시키도록, 글리코실트랜스퍼라제 및/또는 올리고사카릴트랜스퍼라제 유전자의 유전자 기능을 제거하거나 또는 감소시킬 수 있다. 폴리펩타이드를 정상적으로 당화시키지 않는, 원핵생물 숙주 세포, 예컨대 이. 콜라이는 당화 기능을 제공하는 진핵생물 및 원핵생물 유전자 세트를 발현하도록 변경될 수 있다(DeLisa et al., "Glycosylated protein expression in prokaryotes", WO2009089154A2, 2009 Jul 16).
유전자 기능이 변경된 이용가능한 숙주 세포 균주. 본 발명의 유도성 공발현 시스템 및 방법에 사용하는데 바람직한 숙주 세포 균주를 생성시키기 위해서, 이미 바람직한 유전자 변경을 포함하는 균주를 사용해서 출발하는 것이 유용하다(표 3).
숙주 세포 균주 | ||
균주: | 유전자형: | 공급처: |
이. 콜라이 TOP10 | F- mcrAΔ( mrr-hsdRMS-mcrBC) φ80lacZΔM15 ΔlacX74 recA1 araD139Δ(ara-leu)7697 galU galK rpsL (StrR) endA1 nupG λ- | 인비트로젠 라이프 테크놀로지스 카탈로그 번호 C4040-10, C4040-03, C4040-06, C4040-50, 및 C4040-52 |
이.콜라이 오리가미(Origami)(상표명) 2 | Δ(ara-leu)7697 ΔlacX74 ΔphoA PvuII phoR araD139 ahpC galE galK rpsL F'[lac + lacI q pro] gor522::Tn10 trxB(StrR, TetR) | Merck(EMD 밀리포어 케미칼스) 카탈로그 번호 71344 |
이. 콜라이 셔플(SHuffle)(등록상표) 익스프레스 | fhuA2 [lon] ompT ahpC gal λatt::pNEB3-r1-cDsbC(Spec, lacI) ΔtrxB sulA11 R(mcr-73::miniTn10--TetS)2 [dcm] R(zgb-210::Tn10 --TetS) endA1 ΔgorΔ(mcrC-mrr)114::IS10 | 뉴 잉글랜드 바이오랩스 카탈로그 번호 C3028H |
숙주 세포 유전자 기능을 변경하는 방법. 유전자 기능을 제거하거나, 감소시키거나 또는 변화시키기 위해 숙주 세포 유전자에 변경을 가하기 위해 당분야에 알려진 많은 방법들이 존재한다. 숙주 세포 예컨대 이. 콜라이 및 다른 원핵생물에서 유전자의 표적화된 파괴를 만드는 방법이 기술되었고(Muyrers et al., "Rapid modification of bacterial artificial chromosomes by ET-recombination", Nucleic Acids Res 1999 Mar 15; 27(6): 1555-1557; Datsenko and Wanner, "One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products", Proc Natl Acad Sci U S A 2000 Jun 6; 97(12): 6640-6645), 유사한 Red/ET 재조합 방법을 사용하기 위한 키트가 시판된다(예를 들어, 독일, 하이델베르그 소재의 진 브릿지스 게엠베하의 퀵 앤 이지(Quick & Easy) 이. 콜라이 유전자 결실 키트). 본 발명의 일 실시형태에서, 숙주 세포의 하나 이상의 유전자의 기능은 파괴하려는 유전자의 코딩 서열 내 뉴클레오타이드 서열, 예컨대 서열의 게놈 위치를 참고로 여기에 편입된 이. 콜라이 K-12 아균주 MG1655 코딩 서열 중 하나를 동정하고, 보다 구체적으로 그 코딩 서열 내에서 각각 50개 뉴클레오타이드의 2개의 인접한 스트레치를 선택하여 제거시키거나 또는 감소된다. 다음으로 퀵 앤 이지 이. 콜라이 유전자 결실 키트를 제조사의 설명서에 따라 사용하여 선별 마커를 함유하는 폴리뉴클레오타이드 작제물을 선택된 인접한 코딩 서열의 스트레치 사이에 삽입시켜서, 유전자의 정상 기능을 제거시키거나 또는 감소시킨다. Red/ET 재조합 방법은 또한 프로모터 서열을, 상이한 프로모터 예컨대 항시성 프로모터, 또는 일정 수준의 전사를 촉진할 것으로 예상되는 인공 프로모터로 치환시키는데 사용될 수 있다(De Mey et al., "promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 2010 Mar 24; 10: 26). 숙주 세포 유전자의 기능은 또한 RNA 침묵화 방법으로 제거시키거나 또는 감소될 수 있다(Man et al., "Artificial trans-encoded small non-coding RNAs specifically silence the selected gene expression in bacteria", Nucleic Acids Res 2011 Apr; 39(8): e50, Epub 2011 Feb 3). 추가로, 숙주 세포 유전자 기능을 변경시키는 기지의 돌연변이를 전통적인 유전자 방법을 통해 숙주 세포에 도입시킬 수 있다.
본 발명의 유도성 공발현 시스템
본 발명의 유도성 공발현 시스템은 2 이상의 발현 작제물을 포함하는 숙주 세포를 포함하고, 상기 발현 작제물은 유전자 산물의 발현을 유도하는 유도성 프로모터를 포함하며, 상기 숙주 세포는 유전자 산물의 균일한 유도성 발현을 가능하게 하는 변경된 유전자 기능을 갖는다. 도 1은 하기 성분들을 갖는 본 발명의 유도성 공발현 시스템의 개략적이 대표도를 도시한다: (1) 숙주 세포, (2) 숙주 게놈(유전자 변경을 포함), (3) 유전자 산물의 발현을 유도하는 유도성 프로모터를 포함하는 발현 벡터 'X', (4) 다른 유전자 산물의 발현을 유도하는 유도성 프로모터를 포함하는 상이한 발현 벡터 'Y', (5) 발현의 화학적 유도인자, 및 (6) 다량체 공발현 생성물. 도 3은 유도성 프로모터((3) 및 (4)) 및 동일한 발현 벡터 상에 존재하는 유도성 프로모터에 의해 발현되는 생성물의 코딩 서열을 갖는 도 1에 도시된 것과 유사한 개략적인 대표도를 도시한다.
도 2는 균일하게 유도될 수 있는 발현을 가능하게 하는 적절한 게놈 변경을 수용하는 이. 콜라이 숙주 세포 내에서 pPRO33(미국 특허 제8178338호 B2; May 15 2012; Keasling, Jay)(또는 pPRO43, pPRO430, pPRO430(CloDF13), pPRO44, 또는 pPRO45) 발현 벡터 상에서 프로피오네이트 유도성 프로모터(prpBCDE 프로모터)와 조합하여 pBAD24(또는 pBAD240) 발현 벡터 상의 araBAD 프로모터를 이용하는, 본 발명의 유도성 공발현 시스템의 특정 예의 개략적인 대표도를 도시한다. 이러한 방식으로, 다량체 생성물의 각 성분의 발현의 엄격한 제어 및 최적화가 수많은 공발현 용도에 사용을 위해 획득될 수 있다. 이러한 실시형태에서, 숙주 세포(1)는 단백질 발현 분야에서 통용되는, 그람 음성 박테리아 에스케리치아 콜라이이다. 숙주 게놈(2)은 신호 펩타이드가 결여된 다이설파이드 아이소머라제 DsbC의 세포질 형태의 발현을 포함하여, 균일하게 유도될 수 있는 단백질 공발현을 용이하게 하는 돌연변이 또는 다른 변경을 갖는 숙주 세포의 게놈이다. 일 실시형태에서, 게놈 변경은 외생적으로 적용되는 L-아라비노스로 플라스미드 기반 ara 프로모터의 균일한 유도를 용이하게 하기 위한, araBAD 오페론 넉아웃 돌연변이 및, 항시성 프로모터로부터 araE 및 araFGH의 발현, 또는 araEFGH-결핍 배경에서 lacY 유전자 내 점 돌연변이(A117C), 및 또한 생체내에서 2-메틸사이트레이트로 전환되는, 외생적으로 적용된 프로피오네이트로 플라스미드 기반 프로피오네이트 프로모터의 균일한 유도를 용이하게 하기 위한, 불활성화된 프로피오네이트 물질 대사 유전자, prpD를 포함한다. 유도성 공발현 시스템에 유용하고, 숙주 세포에 도입될 수 있는 다른 게놈 변경은 제한없이, prpBCDE 프로모터로부터의 배경 발현을 감소시키기 위한, scpA-argK-scpBC 오페론의 표적화 불활성화; L-아라비노스 유도성 프로모터 예컨대 araBAD 프로모터로부터 덜 선호되는 탄소 공급원(프로피오네이트)에 대한 전사 조절인자(PrpR)의 발현, 및/또는 L-아라비노스 존재 하에서 프로피오네이트에 의한 유도의 CCR 시스템에 의한 억제를 피하기 위해, CCR 시스템, 예컨대 crr 및/또는 ptsG에 관여하는 유전자에 대한 제거 또는 감소된 유전자 기능; 티오레독신 환원효소(trxB)와 함께, 글루타티온 환원효소(gor) 또는 글루타티온 합성효소(gshB)에 대한 유전자 기능 수준의 감소, 및/또는 숙주 세포질에 덜 강력한 환원 환경을 제공하고 이황화 결합 형성을 촉진하도록, 숙주 세포 세포질에 효모 미토콘드리아 설프하이드릴 옥시다제 Erv1p의 발현; 예컨대 샤페론 단백질 예컨대 DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/IbpB, Skp, Tig(촉발 인자), 및/또는 FkpA의 강력한 항시성 프로모터로부터의 발현의 증가된 수준; 및 내생성 프로테아제 활성(예컨대 Lon 및 OmpT 프로테아제의 활성) 및 리컴비나제 활성을 감소시키는 다른 돌연변이를 포함한다.
도 2에 도시한 바와 같이, 2종의 상용성 발현 벡터(3, 4)는 2종의 상이한 유전자 산물의 동시 발현(공발현)을 가능하도록 숙주 세포에 유지된다. 이러한 실시형태에서, 한 발현 벡터('L-아라비노스 유도된 발현 벡터')는 L-아라비노스 유도된 프로모터를 함유하고, araBAD 프로모터가 다중 클로닝 부위(MCS)에 클로닝된 삽입된 발현 서열의 발현을 구동시키는 pBAD 또는 관련 플라스미드와 유사하거나 또는 동일하다. L-아라비노스 유도된 발현 벡터는 또한 온전한 발현 벡터를 함유하는 숙주 세포(박테리아 콜로니)의 선별을 용이하게 하기 위해서, 항생제 내성 유전자(예컨대 베타-락타마제를 코딩하고 암피실린에 대한 내성을 부여하는 Tn3 bla 유전자, 또는 아미노글리코사이드 3'-포스포트랜스퍼라제를 코딩하고 카나마이신에 대한 내성을 부여하는 유전자)에 대한 코딩 서열을 함유한다. 복제 기원(ORI)은 박테리아 숙주 세포 내에서 플라스미드의 증식에 필요하다. L-아라비노스 유도된 발현 플라스미드는 또한 araC를 코딩하는 폴리뉴클레오타이드 서열을 함유하는데, 이 전사 조절인자는 araBAD 프로모터의 L-아라비노스 유도를 가능하게 하고 전사 억제를 통해서 비유도 상태시 '누수' 배경 발현을 감소시킨다. 다른 발현 벡터('프로피오네이트 유도된 발현 벡터')는 프로피오네이트 유도된 프로모터가 다중 클로닝 부위(MCS)에 클로닝된 삽입된 발현 서열의 발현을 구동시키는, pPRO 또는 관련 플라스미드와 유사하거나 또는 동일하다. 플라스미드는 또한 온전한 발현 벡터를 함유하는 숙주 세포의 선별을 용이하게 하도록 항생제 내성 유전자(예컨대 클로람페니콜에 대한 내성을 부여하는 클로람페니콜 아세틸트랜스퍼라제를 코딩하는 cat 유전자)의 코딩 서열을 함유한다. 복제 기원(ORI)은 박테리아 숙주 세포 내에서 플라스미드의 증식에 필요하다. 또한, 프로피오네이트 유도된 발현 벡터는 PrpR을 코딩하는 폴리뉴클레오타이드 서열을 함유하고, 이 전사 조절인자는 prpBCDE 프로모터의 프로피오네이트(2-메틸사이트레이트) 유도를 가능하게 하고 비유도 상태에서 '누수' 배경 발현을 감소시킨다. 유도의 개별 적정, 플라스미드 상용성, 및 발현 벡터의 공증식을 용이하게 하기 위해서, 발현 벡터는 상이한 유도인자에 반응성인 프로모터, 상용성 복제 기원, 및 상이한 항생제 내성 마커를 함유하는 것이 유용하다. 본 발명의 일 실시형태에서, L-아라비노스 유도성 araBAD 프로모터를 함유하는 pBAD24(pMB1 또는 'pBR322' ORI, AmpR) 또는 관련 발현 벡터 예컨대 pBAD240(pMB1 ORI, KanR)은 숙주 세포 내에서 프로피오네이트 유도성 prpBCDE 프로모터를 함유하는 pPRO33, pPRO43, pPRO430, 또는 관련 발현 벡터(p15A ORI, CmR)와 조합된다.
프로피오네이트 유도성 prpBCDE 프로모터 예컨대 pPRO430(CloDF13), pPRO44(RSF1030 ORI), 또는 pPRO45(CloDF13)를 함유하는 상용성 발현 벡터는 또한 araBAD-프로모터 함유 발현 벡터(pMB1 ORI)와 조합하여 사용될 수 있다. 발현 벡터는 적절한 항생제, 즉 암피실린, 클로람페니콜, 및/또는 카나마이신이 보충된 성장 배지를 사용해서 공증식되고 유지된다. 일 실시형태에서, 하나의 발현 벡터는 전체 길이 항체의 중쇄를 코딩하는 폴리뉴클레오타이드 서열을 포함하고, 다른 발현 벡터는 전체 길이 항체의 경쇄를 코딩하는 폴리뉴클레오타이드 서열을 포함하고, 각 코딩 서열은 개별 발현 벡터의 MCS에 인프레임으로 클로닝되었다. 일정 유전자 산물 예컨대 항체의 생성을 위해서, 숙주 유기체에 대한 코딩 서열 최적화(다른 고려사항 중에서, 코돈 편중성 및 GC 함량에 대한 조정을 포함)는 공발현 시스템의 발현 작제물에 삽입되는 코딩 서열을 결정하게 된다.
도 2를 다시 참조하면, 유전자 산물의 공발현은 저렴한 외생적으로 적용된 화학적 대사산물, L-아라비노스 및 프로피오네이트(5)에 의해 유도된다. 각 유전자 산물의 발현의 유도 수준은 그 자체의 화학적 유도인자로 독립적으로 적정하여서, 단백질 공발현의 최적화를 용이하게 한다. 이는 안정화를 위한 결합 파트너를 필요로 하는 단백질 복합체 및 단백질의 발현에 유용하고, 달리 단백질을 발현시키는 것이 어려운, 예컨대 가용성이 불충분하거나 또는 세포 독성이 있는 것들의 발현을 용이하게 할 수 있다. 이러한 예에서, 유도 시, 항체 중쇄 및 경쇄는 각각 개별적으로 발현된 후, 단백질은 중쇄 및 경쇄를 구성하는 전체 길이 항체의 형성 및 안정화를 가능하게 하는 이황화 브릿지(박테리아 숙주의 세포질내)를 연결하고 형성한다. 단백질은 숙주 유기체의 다양한 구획을 향할 수 있다. 예를 들어, 이. 콜라이에서, 단백질은 세포질, 세포막, 주변세포질에서 발현될 수 있거나, 또는 배지로 분비될 수 있다. 적절한 항온처리 시간 후, 세포 및 배지를 수집하고, 공발현된 유전자 산물(6)을 포함하는, 전체 단백질을 추출한다. 추출 후, 희망 생성물은 공발현 시스템에서 생성된 유전자 산물의 성질에 따라서 당분야에 잘 알려진 많은 방법들(예를 들어, 액상 크로마토그래피)를 이용해서 정제할 수 있다. 도 2에 도시된 예에서, 다량체 생성물(전체 길이 항체)는 크로마토그래피 방법을 이용해서 추출 및 정제된다. 정제된 온전한 항체는 단백질-결합 염료 또는 면역조직화학법을 포함하는, 표준 기술을 이용해서 비변성 겔 상에서 시각화된다. 전체 길이 항체 생성물은 많은 연구, 진단 또는 다른 용도에 사용될 수 있다.
도 4는 아라비노스 유도성 프로모터(3), 프로피오네이트 유도성 프로모터(4), 및 동일한 발현 벡터에 존재하는 항체 중쇄 및 경쇄에 대한 코딩 서열을 갖는, 도 2에 도시된 것과 유사한 개략적인 대표도를 도시한다. 프로피오네이트 유도성 프로모터로부터 항체 중쇄 및 아라비노스 유도성 프로모터로부터 항체 경쇄를 발현시키는 것이 또한 가능하다.
본 발명의 방법으로 제조된 생성물
다양한 공발현 용도, 및 생성물의 특성에서, 본 발명의 유도성 공발현 시스템을 이용하는 광범위한 다능성이 존재한다.
당화. 본 발명의 방법으로 공발현된 유전자 산물은 당화되거나 또는 비당화될 수 있다. 본 발명의 일 실시형태에서, 공발현된 유전자 산물은 폴리펩타이드이다. 당화된 폴리펩타이드는 공유적으로 부착된 글리코실기를 포함하는 폴리펩타이드이고, 폴리펩타이드의 특정 잔기에 정상적으로 부착된 모든 글리코실기를 포함하는 폴리펩타이드(완전 당화된 폴리펩타이드), 부분적으로 당화된 폴리펩타이드, 당화가 정상적으로 일어나지 않는 1개 이상의 잔기에 당화된(변경된 당화) 폴리펩타이드, 및 1개 이상의 특정 잔기에 정상적으로 부착된 글리코실기와 구조적으로 다른 적어도 하나의 글리코실기로 당화된(변형된 당화) 폴리펩타이드를 포함한다. 변형된 당화의 예는 폴리펩타이드를 푸코실화시키는 능력이 결여된 숙주 세포에서 폴리펩타이드의 발현에 의해, 그들에 부착된 글리코실기에 푸코실 모이어티를 결여시킨 폴리펩타이드인, "탈푸코실화" 또는 "푸코스 결핍" 폴리펩타이드의 생성이다. 비당화 폴리펩타이드는 공유적으로 결합된 글리코실기를 포함하지 않는 폴리펩타이드이다. 비당화 폴리펩타이드는 폴리펩타이드의 탈당화, 또는 무당화 폴리펩타이드의 생성의 결과일 수 있다. 탈당화 폴리펩타이드는 당화된 폴리펩타이드를 효소적으로 탈당화시켜 얻을 수 있는데 반해, 무당화 폴리펩타이드는 폴리펩타이드를 당화시키는 능력을 갖지 않는 숙주 세포, 예컨대 원핵생물 세포 또는 적어도 1종의 당화 효소의 기능이 제거되거나 또는 감소된 세포에서 폴리펩타이드를 발현시켜 생성시킬 수 있다. 특정 실시형태에서, 공발현된 폴리펩타이드는 무당화되고, 보다 특정 실시형태에서, 무당화 폴리펩타이드는 원핵생물 세포 예컨대 이. 콜라이에서 공발현된다.
유전자 산물의 다른 변형. 본 발명의 방법에 의해 공발현된 유전자 산물은 다른 유형의 분자에 공유적으로 연결될 수 있다. 본 발명의 범주를 제한하지 않고, 공발현된 유전자 산물에 공유적으로 연결될 수 있는 분자의 예는 폴리펩타이드(예컨대 수용체, 리간드, 사이토카인, 성장 인자, 폴리펩타이드 호르몬, DNA-결합 도메인, 단백질 상호작용 도메인 예컨대 PDZ 도메인, 키나제 도메인, 항체 및 임의의 이러한 폴리펩타이드의 단편); 수용성 중합체(예컨대 폴리에틸렌 글리콜(PEG), 카복시메틸셀룰로스, 덱스트란, 폴리비닐 알콜, 폴리옥시에틸화 폴리올(예컨대 글리세롤), 폴리에틸렌 글리콜 프로피온알데하이드, 및 유사한 화합물, 이의 유도체, 또는 혼합물); 및 세포독성제(예컨대 화학요법제, 성장 억제제, 독소(예컨대 박테리아, 진균, 식물, 또는 동물 기원의 효소 활성 독소, 또는 이의 단편), 및 방사능 동위원소)를 포함한다.
또한, 본 발명의 방법으로 공발현시키려는 유전자 산물은 유전자 산물의 정제 및/또는 검출에 도움을 주는 분자 모이어티를 포함하도록 디자인될 수 있다. 많은 그러한 모이어티는 당분야에 공지되어 있고, 일례로서, 폴리펩타이드 유전자 산물은 6개 또는 그 이상의 히스티딘, 바람직하게 6개 내지 10개 연속되는 히스티딘 잔기, 가장 바람직하게 6개 히스티딘 잔기를 그의 N 말단 또는 C 말단에 갖는, 폴리히스티딘 '태그' 서열을 포함하도록 디자인될 수 있다. 폴리펩타이드의 말단 상에 폴리히스티딘 서열의 존재는 코발트 또는 니켈 기반 친화성 매질이 그에 결합될 수 있어서, 다른 폴리펩타이드로부터 분리될 수 있게 한다. 폴리히스티딘 태그 서열은 엑소펩티다제에 의해 제거될 수 있다. 다른 예로서, 형광 단백질 서열을 폴리펩타?? 유전자 산물의 일부로서 발현시킬 수 있는데, 형광 단백질에 대한 아미노산 서열을 폴리펩타이드 유전자 산물의 아미노산 서열의 N 말단 또는 C 말단에 첨가시킨다. 일정 파장의 빛에 노출시 최종 융합 단백질이 형광하여, 융합 단백질의 존재를 육안으로 검출할 수 있게 된다. 잘 알려진 형광 단백질은 애쿠오레아 빅토리아(Aequorea victoria)의 녹색 형광 단백질이고, 많은 다른 형광 단백질이 그들을 코딩하는 뉴클레오타이드 서열과 함께 시판된다.
항체. 본 발명의 일 실시형태에서, 공발현된 유전자 산물은 항체이다. 용어 '항체'는 광범위한 의미로 사용되고 특히 '천연' 항체, 완전 인간 항체, 인간화된 항체, 키메라 항체, 다중특이적 항체(예컨대 이중특이적 항체), 단일클론 항체, 다클론 항체, 항체 단편, 및 항원에 결합할 수 있는 항체에서 유도된 다른 폴리펩타이드를 포함한다. 본 명세서에서 달리 표시하지 않으면, 면역글로불린 중쇄의 잔기의 번호매김('EU 번호매김')은 문헌[Kabat et al., Sequences of Proteins of Immunological Interest, Fifth Edition, 1991, National Institute of Health, Bethesda, Maryland]에서처럼 EU 지수(인간 IgG1 EU 항체의 잔기 번호매김)이다.
'천연' 항체는 일반적으로 2개의 동일한 경(L)쇄 및 2개의 동일한 중(H)쇄로 구성된, 약 150,000 달톤의 이종사량체 당단백질이다. 각 경쇄는 하나의 공유 이황화 결합에 의해 중쇄에 연결되는 한편, 사슬간 이황화 연결의 수는 상이한 면역글로불린 아이소타입의 중쇄 간에 다양하다. 각각의 중쇄 및 경쇄는 또한 규칙적으로 간격을 둔 사슬내 이황화 브릿지를 갖는다. 각각의 중쇄는 이의 N 말단에 수많은 불변 도메인이 후속되는 가변 도메인(VH)을 갖는다. 각각의 경쇄는 이의 N 말단에 가변 도메인(VL) 및 C 말단에 불변 도메인을 가지며, 경쇄의 불변 도메인은 중쇄의 제1 불변 도메인과 정렬되고 경쇄 가변 도메인은 중쇄의 가변 도메인과 정렬된다. 용어 '가변'은 가변 도메인의 일정 부분이 항체들 간에 서열이 광범위하게 다르고 항원에 대한 각 특정 항체의 특이성 미치 결합에 사용된다는 점을 의미한다. 그러나, 가변성은 항체의 가변 도메인 전반에서 고르게 분포되는 것은 아니다. 경쇄 및 중쇄 가변 도메인 둘 다의 초가변 영역(HVR)이라고 하는 3개 절편에 집중되어 있다. 가변 도메인의 보다 고도로 보존된 부분은 프레임워크 영역(FR)이라고 한다. 천연 중쇄 및 경쇄의 가변 도메인은 각각 3개의 HVR에 의해 연결된 4개의 FR 영역을 포함하고, 다른 사슬 유래의 HVR은 항체의 항원-결합 부위의 형성에 기여한다.
용어 'Fc 영역'은 면역글로불린 중쇄의 C 말단 영역을 의미하고, 천연 Fc 영역 및 변이 Fc 영역을 포함한다. 면역글로불린 중쇄의 Fc 영역의 경계가 다양할 수 있지만, 인간 IgG 중쇄 Fc 영역은 위치 Cys226의 아미노산 잔기, 또는 Pro230에서 이의 카복실 말단까지의 스트레치로 정의될 수 있다. 다르게, Fc 영역은 보존된 CH2 면역글로불린 도메인의 N 말단 잔기(Ala231)부터 C 말단으로 확장된 것으로 정의될 수 있고, 다수의 보존된 도메인 예컨대 CH2, CH3 및 CH4를 포함할 수 있다. 천연 Fc 영역의 C 말단 리신(EU 번호매김 체계에 따른 잔기 447)은 예를 들어, 항체의 생성 또는 정제 동안, 또는 항체의 중쇄를 코딩하는 핵산을 재조합적으로 조작하여 제거시킬 수 있다. 따라서, 온전한 항체의 조성물은 모든 K447 잔기가 제거된 항체 개체군, K447 잔기가 제거되지 않은 항체 개체군, 및 K447 잔기가 있고 없는 항체의 혼합물을 갖는 항체 개체군을 포함할 수 있다. 항체의 Fc 영역은 면역학적 세포의 동원 및 항체 의존적 세포독성(ADCC)에 결정적이다. 구체적으로, 항체에 의해 유발되는 ADCC 반응의 성질은 많은 세포 유형의 표면 상에 위치하는 수용체(FcR)와 Fc 영역의 상호작용에 의존적이다. 인간은 적어도 5가지의 상이한 부류의 Fc 수용체를 함유한다. FcR에 항체의 결합은 다른 면역학적 세포를 동원하는 그 능력 및 동원된 세포의 유형을 결정한다. 따라서, 오직 일정 종류의 세포만을 동원할 수 있는 변경된 Fc 영역을 갖는 항체를 조작하는 능력은 요법에 결정적으로 중요할 수 있다(미국 특허 출원 제20090136936호 A1, 05-28-2009, Georgiou, George). 포유동물 세포에 의해 생성되는 천연 항체는 전형적으로 Fc 영역의 CH2 도메인의 Asn297에 N-연결을 통해 일반적으로 부착되는, 분지형, 이중촉각 올리고당을 포함한다. 일정 실시형태에서, 본 발명의 방법으로 생성된 항체는 당화되지 않거나 또는 무당화인데, 예를 들어 Fc 영역의 잔기 297의 치환, 또는 폴리펩타이드를 당화시키는 능력을 갖지 않는 숙주 세포에서의 발현에 기인한다. 변경된 ADCC 반응으로 인해, 비당화 항체는 더 낮은 수준의 염증 반응 예컨대 신경 염증을 자극시킬 수 있다. 또한, 또한, 무당화 Fc 영역을 갖는 항체는 Fc 수용체에 대해 매우 낮은 결합 친화성을 가지므로, 그러한 항체는 이들 수용체를 보유하는 다수의 면역 세포에 결합하지 않는다. 이는 비특이적 결합을 감소시키고, 또는 생체 내에서 항체의 반감기를 증가시켜서, 요법제로 매우 유리하게 만들기 때문에 상당한 장점이다.
용어 '전체 길이 항체', '온전한 항체', 및 '전체 항체'는 이하에 정의된 바와 같은 항체 단편이 아닌 이의 실질적으로 온전한 '천연' 형태의 항체를 의미하는데 상호교환적으로 사용된다. 이 용어는 특히 가변 도메인 및 Fc 영역을 각각이 포함하는 중쇄를 갖는 항체를 의미한다. '항체 단편'은 바람직하게 이의 항원 결합 영역을 포함하는, 온전한 항체의 일부를 포함한다. 항체 단편의 예는 Fab, Fab', F(ab')2, Fc, Fd 및 Fv 단편; 다이아바디; 선형 항체; 단쇄 항체 분자 예컨대 scFv; 및 항체 단편으로 형성된 다중특이적 항체를 포함한다.
'인간 항체'는 인간에 의해 생성된 항체에 상응하는 아미노산 서열을 보유한 것이다. '키메라' 항체는 중쇄 및/또는 경쇄의 일부분이 특정 종에서 유도되거나 또는 특정 항체 부류 또는 아부류에 속하는 항체의 상응하는 서열과 동일하거나, 또는 일정 정도의 아미노산 서열 동일성을 공유하는 한편, 사슬(들)의 나머지는 다른 종에서 유도되거나 또는 다른 항체 부류 또는 아부류에 속하는 항체의 상응하는 서열과 동일하거나, 또는 일정 정도 아미노산 서열 동일성을 공유하는 것을 비롯하여, 그러한 항체의 단편을 의미한다. '인간화' 항체는 비인간 면역글로불린 분자에서 유도된 최소 아미노산 잔기를 함유하는 키메라 항체이다. 일 실시형태에서, 인간화 항체는 수용자 항체의 HVR 잔기가 비인간 종(도너 항체) 예컨대 마우스, 래트, 토끼 또는 인간이외의 영장류의 면역글로불린 HVR 유래의 잔기로 치환된 인간 면역글로불린(수용자 항체)이다. 일부 예에서, 인간 수용자 항체의 FR 잔기는 상응하는 비인간 잔기로 치환된다. 또한, 인간화 항체는 수용자 항체 또는 도너 항체에 존재하지 않는 잔기를 포함할 수 있다. 용어 '단일클론 항체'는 실질적으로 균질한 항체의 개체군에서 얻은 항체를 의미하며, 그 개체군을 포함하는 개별 항체는 가능한 돌연변이, 예컨대 소량에 존재할 수 있는 천연 유래 돌연변이를 제외하고는 동일하다. 따라서, 수식어 '단일클론'은 개별 항체의 혼합물이 아닌 항체의 특징을 의미한다. 상이한 결정부(에피토프)에 대항해 유도된 상이한 항체를 전형적으로 포함하는, 다클론 항체 조제물과 대조적으로, 단일클론 항체 조제물의 각각의 단일클론 항체는 항원 상의 동일한 단일 결정부에 대항해 유도된다. 그들의 특이성 이외에도, 단일클론 항체 조제물은 그들이 전형적으로 다른 면역글로불린으로 오염되지 않는다는 점에서 유리하다.
분자 예컨대 항체의 '결합 친화성'은 일반적으로 분자의 단일 결합 부위 및 이의 결합 파트너(예컨대 항체 및 이에 결합하는 항원) 사이의 비공유적 상호작용의 총합의 강도를 의미한다. 달리 언급하지 않으면, '결합 친화성'은 결합쌍 구성원(예컨대 항체 및 항원) 사이의 1:1 상호작용을 반영하는 고유한 결합 친화성을 의미한다. 그의 파트너 Y에 대한 분자 X의 친화성은 일반적으로 해리 상수(Kd)로 표시할 수 있다. 저친화성 항체(높은 Kd)는 일반적으로 항원에 서서히 결합하여 쉽게 해리되는 경향이 있는 반면, 고친화성 항체(저 Kd)는 일반적으로 빠르게 항체에 결합하여 더 길게 결합된 채로 남아 있는 경향이 있다. 결합 친화성을 측정하는 다양한 방식이 당분야에 공지되어 있고, 임의의 그러한 방식을 본 발명의 목적을 위해 사용할 수 있다. 결합 친화성을 측정하기 위한 특정한 예시적인 방법을 실시예 8에 기술한다. 본 발명의 방법에 의해 생성되고/되거나 사용되는 항체 및 항체 단편은 실시예 8에 기술된 바와 같은 표면 플라스몬 공명 검정법으로 측정 시 바람직하게 100mM보다 낮은 결합 친화성을 가지며, 보다 바람직하게 10nM보다 낮은 결합 친화성을 갖고, 가장 바람직하게 2nM보다 낮은 결합 친화성을 갖는다.
무당화 항체를 인식하는 항체(2차). 이. 콜라이 기반 또는 당화 효소가 없는 다른 원핵생물 발현 시스템에서 항체의 생성은 일반적으로 1차 항체로서 사용할 수 있는, 무당화 항체를 산출한다. 무당화 1차 항체를 생성하기 위해 본 발명의 유도성 공발현 시스템을 사용하는 것 이외에도, 본 발명의 유도성 공발현 시스템은 또한 무당화 1차 항체를 특이적으로 인식하는 2차 항체를 효과적으로 생성시키는데 사용될 수 있다. 본 발명의 일 측면은 연구, 분석, 진단 또는 치료 목적을 위해 비당화 또는 무당화 1차 항체를 검출할 수 있는 2차 항체 시스템이다. 일례로서, 2차 항체 시스템은 하기 성분들과 함께 제공된다: 에피토프, 1차 항체, 2차 항체, 및 검출 시스템. 에피토프는 살아있는 동물에 도입시 면역학적 반응을 생성하는 항원 결정부이거나 또는 아니면 항체에 의해 인식될 수 있는 항원의 일부분(일반적으로 단백질)이다. 실제로, 관심 에피토프는 혼합물 또는 조직 내에 존재할 수 있다. 일 실시형태에서, 에피토프는 인간 조직에서 암종 세포에서 발현되는 단백질이다. 1차 항체는 에피토프를 인식하여 결합하고, 바람직하게는 에피토프에 특이적으로 결합하는, 항체 단편, 단일 전체 길이 항체(단일 클론), 또는 상이한 전체 길이 항체의 혼합물(다클론)이다. 이러한 예에서 전체 길이 항체는 이황화 브릿지에 의해 연결된 2개의 중쇄 폴리펩타이드 및 2개의 경쇄 폴리펩타이드를 포함한다. 각각의 사슬은 불변 영역 (Fc) 및 가변 영역(Fv)을 포함한다. 전체 길이 항체에 2개의 항원 결합 부위가 존재한다. 본 발명의 일 실시형태에서, 1차 항체는 관심 에피토프를 인식하여 결합하는 전체 길이 무당화 항체(예컨대 이. 콜라이 기반 발현 시스템에서 생성)이다. 2차 항체는 무당화 1차 항체를 인식하여 결합하고, 바람직하게 무당화 1차 항체에 특이적으로 결합하는, 항체 단편, 단일 전체 길이 항체(단일클론), 또는 상이한 전체 길이 항체의 혼합물(다클론)이다. 본 발명의 일 실시형태에서, 2차 항체는 전체 길이 1차 항체의 무당화 Fc 부분을 인식하여 결합하는 전체 길이 항체이다. 이러한 경우에서, 항체 결합 부위는 C 말단 리신 잔기가 있거나 또는 없는, 무당화 1차 항체의 Fc 부분을 특이적으로 인식하도록 선택 및/또는 조작된다. 다른 실시형태에서, 2차 항체는 무당화 1차 항체의 추가 영역(에피토프), 또는 제한없이 1차 항체에 공유적으로 부착된 폴리펩타이드를 포함하는 추가의 조작된 에피토프를 인식하도록 조작될 수 있다. 2차 항체는 전체 길이 무당화 항체 분자(다양한 면역글로불린 부류 예컨대 IgG, IgA 등을 포함) 또는 항체 단편 예컨대 Fc 또는 Fab 상에 존재하는 단일 또는 다수 부위(에피토프)에서 유도될 수 있다. 따라서, 이러한 방식으로 생성된 일부 2차 항체는 임의의 무당화 전체 길이 항체에 대해 광범위한 특이성을 가질 수 있다. 본 발명의 1차 및 2차 항체는 또한 전통적인 방법(면역화된 토끼를 사용한 다클론 항체 생성 또는 마우스 하이브리도마를 사용한 단일클론 항체 생성) 및 재조합 DNA 기술 예컨대 항원 결합 폴리펩타이드를 동정하기 위한 파지 디스플레이 방법에 의해 생성된 것을 포함한다.
검출 시스템은 일반적으로, 2차 항체의 검출, 시각화, 및/또는 정량을 할 수 있는 2차 항체에 결합하거나 또는 연결되는 작용제를 포함한다. 다양한 검출 시스템은 제한없이 형광 염료, 효소, 방사능 동위원소, 또는 중금속을 포함해 당분야에 잘 알려져 있다. 이들은 2차 항체에 추가의 폴리펩타이드의 직접 물리적 연결을 포함할 수 있거나 또는 포함하지 않을 수 있다. 이러한 2차 항체 시스템의 적용은 제한없이, 면역조직화학법, 웨스턴 블롯팅, 및 효소-연결 면역흡착 검정법(ELISA)을 포함한다. 예를 들어, 면역조직화학법에서 사용을 위한 일 실시형태에서, 관심 에피토프는 조직의 얇은 절개부 상에 존재할 수 있어서, 무당화 1차 항체를 그 조직에 도포하여 에피토프에 결합되도록 한다. 미결합된 1차 항체를 제거한 후, 무당화 1차 항체에 특이적으로 결합할 수 있는 2차 항체를 조직에 도포하여 1차 항체에 결합할 수 있게 한다. 미결합된 항체를 제거한 후, 검출 시스템 시약을 도포한다. 예를 들어, 2차 항체가 효소에 연결되면, 발색성 효소 기질이 조직에 도포되어 반응할 수 있게 한다. 반응성 효소 기질의 직접 현미경 또는 형광현미경 시각화를 이후 수행할 수 있다. 다른 검출 방법이 당분야에 잘 알려져 있다. 무당화 항체를 인식하는 2차 항체를 사용하는 시스템의 장점은 제한없이, 다음을 포함한다: 1) 2차 항체가 달리 진핵생물 조직에 존재하지 않는 1차 항체의 무당화 Fc 부분에 결합하도록 디자인되었기 때문에 면역조직화학에서 증가된 특이성; 2) 1차 항체에 대한 증가된 특이성 때문에 감소된 배경 염색; 3) 1차 및/또는 2차 항체를 원핵생물 예컨대 이. 콜라이에서 발생시킬 수 있으므로 2차 항체 시스템 생성의 감소된 비용; 및 4) 항체 개발의 전체 공정이 원핵생물 예컨대 이. 콜라이에서 수행될 수 있기 때문에, 마우스 및 토끼를 포함하는, 포유동물의 불필요한 이용의 회피.
산업 용도로 사용되는 효소. 많은 산업 공정들이 본 발명의 방법으로 생성될 수 있는 효소를 이용한다. 이들 공정은 폐수 처리 및 다른 생물환경정화 및/또는 해독 공정; 제지 및 섬유 산업 재료의 표백; 및 생연료로 효율적으로 발효될 수 있는 재료료 생물량의 분해를 포함한다. 많은 예에서, 미생물 숙주 세포 또는 바람직하게 박테리아 숙주 세포에서 이들 용도를 위한 효소를 생성시키는 것이 바람직하지만, 활성 효소는 효소 폴딩 및/또는 보조인자의 요구 문제로 인해 대량으로 발현시키는 것이 어렵다. 본 발명의 일정 실시형태에서, 본 발명의 유도성 공발현 방법은 산업적 용도의 효소, 예컨대 아라비노스 이용 및 자일로스 이용 효소(예를 들어, 자일로스 아이소머라제(EC 5.3.1.5)) 또는 리그닌 분해 퍼옥시다제(예를 들어, 리그닌 퍼옥시다제(EC 1.11.1.14), 망간 퍼옥시다제(EC 1.11.1.13), 다재다능 퍼옥시다제(EC 1.11.1.16), 또는 라카제(EC 1.10.3.2))를 생성시키는데 사용된다.
실시예 1
공발현을 촉진하도록 숙주 세포에 게놈 변경의 도입
상기에 기술된 바와 같이 숙주 세포 유전자 발현에 일정 변경은 희망 유전자 산물(들)의 공발현을 개선시킬 수 있다. 일정 숙주 세포, 이. 콜라이 ASE(DGH) 세포는 이. 콜라이 셔플(SHuffle)(등록상표) 익스프레스 세포로부터 유도되었고, 그들 유전자형은 이. 콜라이 셔플 익스프레스 ΔaraBAD Δsbm-ygfDGH ΔaraEp::J23104로 표시할 수 있다. 이. 콜라이 ASE(DGH) 세포는 다음과 같이 생성시켰다. 결실 및 변경은 게놈 서열을 균일하게 제거하는, 대항선택에 의한 결실로 설명되는, 리컴비니어링 방법을 사용하여 진 브릿지스 게엠베하(Gene Bridges GmbH) (독일 하이델베르크 소재)를 통해 이. 콜라이 셔플 익스프레스 숙주 세포 게놈에 만들었다. 숙주 세포에 의한 아라비노스 이화작용이 감소되도록 숙주 세포 araBAD 오페론의 결실을 만들어, 보다 많은 아라비노스 유도인자가 araBAD 프로모터를 포함하는 발현 작제물로부터 공발현되는 유전자 산물의 유도에 이용될 수 있다. 이러한 결실은 이. 콜라이 게놈의 위치 70,135 내지 65,867(마이너스 가닥)(게놈 뉴클레오타이드 서열 내 위치는 모두 표 1에 제공됨)에 상응하는, araBAD 오페론의 4269개 염기쌍을 제거하여, 천연 araBAD 프로모터의 대부분 내지 AraD 코딩 영역의 소수 코돈을 제외한 전부가 제거된다. 결실 접합부 주변 뉴클레오타이드 서열(마이너스 가닥)(위치 70,136 | 위치 65,866)은 TTAT | TACG이다. 다른 결실을 sbm-ygfDGH(scpA-argK-scpBC라고도 함) 오페론 내에 만들어서, 2-메틸 사이트레이트의 생합성에 관여하는 유전자의 기능을 제거해, 외생적으로 공급되는 프로피오네이트에 대한 숙주 세포의 프로피오네이트 유도성 프로모터의 감응성을 증가시켰다. sbm-ygfDGH 결실은 5542개 염기쌍(이. 콜라이 게놈의 위치 3,058,754 내지 3,064,295)을 제거하여, sbm-ygfDGH 프로모터 및 ygfH 코딩 서열의 마지막 코돈을 제외한 오페론의 전부를 제거시키는 한편, 인접한 ygfI 코딩 서열 및 중지 코돈은 온전하게 남겨두었다. 결실 연결부 주변의 뉴클레오타이드 서열(플러스 가닥)(위치 3,058,753 | 위치 3,064,296)은 ACAA | GGGT이다. 이. 콜라이 셔플 익스프레스 숙주 세포 게놈에 만들어진 이들 결실 이외에도, 진 브릿지스 게엠베하는 게놈 rpsL 유전자 코딩 서열에 점 돌연변이를 도입시켜, 마이너스 가닥 상에서 위치 3,472,574부터 3,472,200까지 연장되어, 위치 3,472,447의 A가 G로 변화되어서, Lys43에 대한 코돈이 Arg에 대한 코돈으로 변경되고 그 결과 돌연변이체 rpsL-Arg43 유전자가 발현될 때 스트렙토마이신-내성 표현형을 유발되었다. 상기 기술된 바와 같이 보다 엄격하게 제어된 유도성 발현을 가증하게 하는, 숙주 세포 게놈에 대한 다른 변경은 araE 프로모터를 아라비노스에 반응성인 것보다는 항상성으로 만드는 것이다. CRP-cAMP 및 AraC 결합 부위를 포함하는, 천연 araE 프로모터의 대부분은 97개 염기쌍(위치 2,980,335 내지 2,980,239(마이너스 가닥))을 결실시키고 항상성 J23104 프로모터의 35개 염기쌍 서열을 갖는 서열로 치환하여 제거하였다(서열번호 1; J23104의 뉴클레오타이드 서열은 partsregistry.org 웹사이트, parts.igem.org/Main_Page에서 입수함). 변경된 araE 프로모터 내 최종 접합 부위 서열은 TGAA | TTGA ... TAGC | TTCA이다.
EB0001이라고도 하는 균주인, 이. 콜라이 ASE(DGH)의 유전자형은 다음과 같이 표시될 수 있다:
ΔaraBAD fhuA2 [lon] ompT ahpC Δ gal λatt::pNEB3-r1-cDsbC(Spec, lacI) ΔtrxB sulA11 R(mcr-73::miniTn10--TetS)2 [dcm] R(zgb-210::Tn10--TetS) ΔaraEp::J23104 ΔscpA-argK-scpBC endA1 rpsL-Arg43 ΔgorΔ(mcrC-mrr)114::IS10
균주 EB0002는 EB0001 prpD, 또는 다음과 같이 발현될 수 있는 유전자형을 갖는다:
ΔaraBAD fhuA2 ΔprpD [lon] ompT ahpC Δ gal λatt::pNEB3-r1-cDsbC(Spec, lacI) ΔtrxB sulA11 R(mcr-73::miniTn10--TetS)2 [dcm] R(zgb-210::Tn10--TetS) ΔaraEp::J23104 ΔscpA-argK-scpBC endA1 rpsL-Arg43 ΔgorΔ(mcrC-mrr)114::IS10
임의의 이들 게놈 변경, 또는 이들의 임의 조합을 갖는, 이. 콜라이 숙주 세포 예컨대 이. 콜라이 셔플 익스프레스 숙주 세포 또는 EB0001 세포 또는 EB0002 세포가 유전자 산물의 유도성 공발현에 적용될 수 있다.
실시예 2
유도성 프로모터를 포함한 발현 벡터
A. 발현 벡터 pPRO43
발현 벡터 pPRO43(서열번호 2)은 프로피오네이트 유도성 prpBCDE 프로모터로부터 관심 유전자 산물을 발현시키는데 사용되었고, pPRO33 발현 벡터의 뉴클레오타이드 서열을 기준으로 구축되었다. pPRO33의 뉴클레오타이드 서열은 pBAD18 벡터(유전자 은행 등록 번호 X81838.1), prpR-PprpB 영역의 이. 콜라이 게놈 서열, 및 문헌[Guzman et al., "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol 1995 Jul; 177(14): 4121-4130], 및 [미국 특허 제8178338호 B2; May 15 2012; Keasling, Jay]에 기술된 바와 같은 pBAD33 벡터의 서열로부터 편집되었다. pPRO33의 뉴클레오타이드 서열은 서열분석으로 확인하였고 서열번호 3으로 제공하였다.
pPRO43에서 전사 활성인자 prpR을 코딩하는 뉴클레오타이드 서열은 문헌 [Welch et al., "Design parameters to control synthetic gene expression in Escherichia coli", PLoS One 2009 Sep 14; 4(9): e7002; doi: 10.1371/journal.pone.0007002]에 기술된 것과 같은 방법을 이용해서 DNA2.0(캘리포니아주 멘로파크 소재)을 통해서 이. 콜라이에서 발현을 위해 최적화시켰다. pPRO43의 최적화된 prpR 서열은 도시된 것과 반대 가닥 상에서, 서열번호 2의 뉴클레오타이드 1593 내지 7인 prpP 코딩 서열의 상류의 다른 서열 및 RBS를 포함한다. pPRO43 벡터는 또한 2개의 HindIII 부위가, 하나는 MCS에 2번째는 prpP 코딩 서열에 있는 pPRO33과 대조적으로 다중 클로닝 부위(MCS)에 오직 하나의 HindIII 제한효소 부위를 갖는다.
B. 발현 벡터 pPRO430 및 pPRO430(CloDF13)
발현 벡터 pPRO430(서열번호 4)은 pPRO43의 뉴클레오타이드 서열(서열번호 2)을 기반으로 DNA2.0으로 합성되었다. pPRO430 벡터는 p15 복제 기원, 클로람페니콜에 내성(CmR)을 부여하는 유전자, 상기 기술된 이. 콜라이에서 발현을 위해 최적화된 prpR 코딩 서열, 및 코딩 서열이 삽입될 수 있는 프로피오네이트 유도성 prpBCDE 프로모터 하류의 클로닝 부위를 함유한다는 점에서 pPRO43과 유사하다. pPRO430 발현 벡터는 클로닝 부위의 상류에 최적화된 RBS 서열-AGGAGGAAAACATA(서열번호 4의 뉴클레오타이드 3566-3579)을 갖는다는 점에서 pPRO43과 상이하다. pPRO430 발현 벡터는 또한 일부 뉴클레오타이드 서열의 제거 및 짧은 종결인자의 사용을 통해 pPRO43에 비해 간소화되었고, 그 결과 pPRO430 뉴클레오타이드 서열(서열번호 4)은 5883 염기인 pPRO43 뉴클레오타이드 서열(서열번호 2)과 비교하여, 오직 3698 염기를 갖는다. pPRO430(CloDF13) 발현 벡터(서열번호 5)는 BfuAI 제한효소 부위가 측접된, pPRO430의 p15 복제 기원이 pPRO430의 고카피수 CloDF13 복제 기원(CloDF13)으로 치환된 것을 제외하고 pPRO430과 동일하다.
C. 발현 벡터 pBAD240
발현 벡터 pBAD240(서열번호 6)은 pBAD24의 뉴클레오타이드 서열(유전자은행 데이터베이스 등록 번호 X81837.1(25-OCT-1995))을 기반으로 DNA2.0에 의해 합성되었다. 발현 벡터 pBAD240은 코딩 서열이 삽입될 수 있는 클로닝 부위의 상류에 최적 RBS 서열-AGGAGGTAAAAA(서열번호 6의 뉴클레오타이드 3125 내지 3136)을 갖는 것이 pBAD24와 상이하다. pBAD240 뉴클레오타이드 서열은 또한 일부 뉴클레오타이드 서열의 제거, 및 더 짧은 종결인자의 사용에 의해 pBAD24에 비해 감소되었고, 그 결과 pBAD240 뉴클레오타이드 서열(서열번호 C)은 4542개 염기의 pBAD24 뉴클레오타이드 서열과 비교하여, 오직 3255개 염기를 갖는다. pBAD240 발현 벡터는 또한 pBAD24의 암피실린 내성 유전자보다는, 카나마이신 내성을 부여하는 유전자(KanR)를 포함한다.
D. 발현 벡터 pPRO44 및 pPRO45
발현 벡터 pPRO44(서열번호 7) 및 pPRO45(서열번호 8)는 pPRO43(서열번호 2)의 뉴클레오타이드 서열을 기반으로 생성되었는데, pPRO44(RSF1030) 및 pPRO45(CloDF13) 발현 벡터에 사용된 것과 상이한 복제 기원을 갖는다. 프라이머는 각각의 복제 기원 서열의 상류에 AatII 제한효소 부위 및 상류에 SpeI 제한효소 부위를 첨가하기 위해서, pPRO43, RSF1030 복제 기원, 및 CloDF13 복제 기원에 대해 디자인되었다. pPRO43 및 RSF1030 뉴클레오타이드 서열은 이들 프라이머(각각 서열번호 9 및 10, 서열번호 11 및 12)를 이용해서 증폭되었고, 증폭된 생성물은 SpeI 및 AatII로 분해하였으며, 바람직한 제한효소 단편을 겔 정제하여 함께 결찰시켜서 pPRO44(서열번호 7)를 생성시켰다. 최종 pPRO44 발현 벡터를 서열분석하여 PCR 증폭을 통해 돌연변이가 도입되지 않았음을 확인하였다. pPRO45를 생성시키기 위해서, CloDF13 뉴클레오타이드 서열을 프라이머(서열번호 13 및 14)를 이용해서 증폭시켜 SpeI 및 AatII 부위를 첨가시켰고, CloDF13 증폭 생성물 및 pPRO44는 SpeI 및 AatII 제한 효소로 분해하여 바람직한 단편을 겔 정제하였으며, 이후 함께 결찰시켜 pPRO45(서열번호 8)를 형성시켰다. pPRO45의 CloDF13 부분을 서열분석하여 PCR 증폭을 통해 돌연변이가 도입되지 않았음을 확인하였다.
실시예 3
박테리아 세포에서 형광 단백질의 유도성 공발현을 위한 이중 프로모터 벡터 pSOL의 사용
A. 이중-프로모터 pSOL 발현 벡터의 구축.
'이중 벡터' 또는 'pSOL'이라고 하는, 2종의 상이한 유도성 프로모터를 포함하는 발현 벡터를 도 5에 개략적으로 도시하였다. 이 벡터는 DNA2.0(캘리포니아주 멘로파크 소재)에 의해 합성하였고, 이. 콜라이 숙주 세포에서 발현을 위해 최적화된, 몇몇 폴리뉴클레오타이드 서열, 또는 '성분'을 함유한다. pSOL에서 이용된 폴리뉴클레오타이드 성분의 설명을 하기 표 4에 제공하였고, pSOL의 뉴클레오타이드 서열은 서열번호 15로 제공하였다.
pSOL 이중-프로모터 발현 벡터의 폴리뉴클레오타이드 성분 | ||
성분의 명칭: | 서열번호 15(또는 이의 상보체)에서 성분의 위치: | 성분의 설명: |
BfuAI | 상보체(29-38) | BfuAI 제한효소 부위 |
Ori_pBR | 39-651 | pBR322(pMB1) 복제 기원 |
ROP | 상보체(703-894) | 코딩 서열: 이. 콜라이 조절 단백질 rop(RNA one modulator rom) |
BfuAI | 895-900 | BfuAI 제한효소 부위 |
Kan-R | 상보체(901-1710) | 코딩 서열: 카나마이신 내성 단백질 |
P_kan | 상보체(1711-1832) | 카나마이신 내성 단백질의 발현을 위한 프로모터 |
term. apFAB389 | 상보체(1833-1923) | 종결인자 apFAB389(BIOFAB, 에머빌, 캘리포니아 소재) |
BsmBI | 상보체(1924-1929) | BsmBI 제한효소 부위 |
araC | 상보체(1930-2808) | 코딩 서열: AraC 전사 조절 단백질 |
MKS | 상보체(2809-2817) | 코딩 서열: MKS(메티오닌-리신-세린) |
rbs | 상보체(2818-2840) | 리보솜 결합 부위 |
araC 프로모터 | 상보체(2959-2987) | AraC의 발현용 프로모터 |
araBAD 프로모터 | 3084-3111 | 삽입된 코딩 서열의 발현을 위한 araBAD 오페론 유래의 프로모터 |
NheI | 3134-3139 | NheI 제한효소 부위 |
최적화된 RBS | 3140-3151 | 최적화된 리보솜 결합 부위(pBAD240의 것과 같음) |
BsaI | 상보체(3158-3163) | BsaI 제한효소 부위 |
BsaI | 3164-3169 | BsaI 제한효소 부위 |
XbaI | 3172-3177 | XbaI 제한효소 부위 |
term. apFAB391 | 3178-3259 | 종결인자 apFAB391(BIOFAB, 에머빌, 캘리포니아 소재) |
term. apFAB381 | 상보체(3260-3349) | 종결인자 apFAB391(BIOFAB, 에머빌, 캘리포니아 소재) |
opt. prpR | 상보체(3350-4936) | 최적화된 코딩 서열: PrpR 전사 조절 단백질 |
prpB 프로모터 | 5114-5129 | 삽입된 코딩 서열의 발현을 위한 prpBCDE 오페론 유래의 프로모터 |
HindIII | 5166-5171 | HindIII 제한효소 부위 |
rbs | 5172-5185 | 최적화된 리보솜 결합 부위(pPRO430의 것과 같음) |
BsaI | 상보체(5186-5191) | BsaI 제한효소 부위 |
BsaI | 5192-5197 | BsaI 제한효소 부위 |
Xho | 5199-5204 | XhoI 제한효소 부위 |
3 프레임 중지 | 5205-5215 | 모든 3개 정방향 리딩 프레임의 중지 코돈 |
term. apFAB390 | 5216-5304 | 종결인자 apFAB390(BIOFAB, 에머빌, 캘리포니아 소재) |
구체적으로, pSOL 발현 벡터는 관심 단백질의 유도성 공발현을 위해 사용할 수 있는 2종의 상이한 유도성 프로모터: 아라비노스 유도성 araBAD 프로모터 및 프로피오네이트 유도성 prpBCDE 프로모터를 포함한다. pSOL의 변이체가 또한 관심 단백질의 유도성 공발현을 위해 사용될 수 있는데, 예컨대 araBAD 프로모터 및 prpBCDE 프로모터의 위치가 복제 기원에 대해 바뀐 pSOL 기반 발현 벡터이다. pSOL 발현 벡터의 추가의 유용한 변이체는 AraC 전사 활성인자에 대한 코딩 서열 및/또는 PrpR 전사 활성인자에 대한 코딩 서열이 발현 벡터에 존재하지 않지만, 대신 개별 폴리뉴클레오타이드 예컨대 상이한 염색체외 성분, 또는 숙주 게놈으로부터 발현되는 것을 포함한다. pSOL 발현 벡터의 추가 변이체는 서열번호 15의 pSOL 뉴클레오타이드 위치 5304 내지 29 사이에 삽입된 제3 유도성 프로모터를 포함하는 것으로서, 상기 제3 유도성 프로모터가 prpB 프로모터 및 이의 관련 클로닝 부위 및 종결인자의 하류에 있고, prpB 프로모터와 동일한 방향으로 배향된다. pSOL 발현 벡터의 이러한 변이체의 제3 유도성 프로모터는 예를 들어 람노스 유도성 프로모터 예컨대 rhaSR 프로모터, 자일로스 유도성 프로모터 예컨대 xylAB 프로모터, 또는 포스페이트 고갈에 의한 유도성 프로모터 예컨대 phoA 프로모터일 수 있다.
B. 형광 단백질의 유도성 공발현.
pBAD24 및 pPRO33 발현 벡터의 조합으로부터의 공발현과 이중 프로모터 pSOL 벡터로부터의 공발현의 수준을 비교하기 위해서, pBAD24 및 pPRO33 벡터를 사용하여 노란색 형광 단백질(YellowFP) 및 적색 형광 단백질(RedFP)을 각각 발현시켰다. pSOL의 L-아라비노스 유도성 araBAD 프로모터를 사용하여 YellowFP를 발현시켰고, 프로피오네이트 유도성 prpBCDE 프로모터를 사용하여 RedFP를 발현시켰다. The YellowFP는 515㎚에서 여기되고 528㎚ 내지 530㎚에서 최대 방출을 가지며(Nagai et al., "A variant of yellow fluorescent protein with fast and efficient maturation for cell-biological applications", Nat Biotechnol 2002 Jan; 20(1): 87-90), RedFP는 610㎚에서 최대 방출을 갖고 587㎚에서 여기된다(Shaner et al., "Improved monomeric red, orange and yellow fluorescent proteins derived from Discosoma sp. red fluorescent protein", Nat Biotechnol 2004 Dec; 22(12): 1567-1572; Epub 2004 Nov 21).
pBAD24-YellowFP 및 pPRO33-RedFP 플라스미드를 구축하기 위해서, YellowFP 및 RedFP에 대한 코딩 서열을 DNA 2.0을 통해 이. 콜라이에서 발현을 위해 최적화시켰다. YellowFP 및 RedFP에 대해 최적화된 코딩 서열은 NheI 및 SalI으로 분해하였고, 분해된 삽입물을 각각 NheI/SalI-절단 pBAD24 및 pPRO33에 결찰시켰다. pSOL의 경우, DNA2.0은 각각 araBAD 프로모터 및 prpBCDE 프로모터 영역에서 최적화된 리보솜 결합 부위의 하류에서 pSOL 발현 벡터에 YellowFP 및 RedFP에 대해 최적화된 코딩 서열을 삽입시키기 위해 증폭 기반 엘렉트라 클로닝 시스템을 사용하였다. pBAD24-YellowFP 및 pPRO33-RedFP 발현 작제물은 이. 콜라이 ASE(DGH) 세포(이. 콜라이 ASE(DGH) 세포는 실시예 1에 기술됨)에 공동형질전환시켰고, pSOL-YellowFP-RedFP 발현 작제물을 또한 개별적으로 이. 콜라이 ASE(DGH) 세포에 형질전환시켰다.
ASE(DGH)('pBAD, pPRO') 중 pBAD24-YellowFP/pPRO33-RedFP 및 ASE(DGH)('pSOL') 중 pSOL-YellowFP-RedFP의 배양물을 밤새 37℃에서 각각 클로람페니콜과 암피실린을 함유하거나 또는 카나마이신을 함유하는 LB 배지 중에서 275 RPM에서 진탕하면서 성장시켰다. 0.7의 OD600에서, 세포를 항생제가 더해진 LB 배지 2 x 6mL로 0.01의 OD600으로 희석시키고, 30℃에서 0.75의 OD600에 도달할 때까지 275 RPM에서 진탕하면서 성장시켰다. 세포를 30℃에서 7분 동안 3800 x g에서 펠렛화시켰고, 추가 탄소 공급원없이 항생제가 더해진 M9 배지에 0.7의 OD600으로 재현탁시켰다. 재현탁된 세포를 다음과 같이 웰당 200 마이크로리터로 다중 웰 플레이트에 플레이팅하였다.
A, B열: ASE(DGH) 콜로니 1의 pBAD24-YellowFP/pPRO33-RedFP
C, D열: ASE(DGH) 콜로니 2의 pBAD24-YellowFP/pPRO33-RedFP
E, F열: ASE(DGH) 콜로니 1의 pSOL-YellowFP-RedFP
G, H열: ASE(DGH) 콜로니 2의 pSOL-YellowFP-RedFP
세포를 다양한 농도의 프로피오네이트(수동) 및 L-아라비노스(디지탈 분배기에 의함)의 첨가에 의해 유도시켰는데 프로피오네이트 농도는 0mM, 1mM, 2.5mM, 5mM, 및 20mM이었고 L-아라비노스 농도는 0 마이크로몰, 0.67 마이크로몰, 3.33 마이크로몰, 6.66 마이크로몰, 및 66.61 마이크로몰이었다.
플레이트를 "급속" 진탕 속도를 이용해서 30℃에서 바이오텍 시너지(Biotek Synergy)(등록상표) 4 마이크로플레이트(BioTek Instruments Inc., Winooski, Vermont)에서 항온처리하고, 형광성을 15분마다 8시간 동안 모니터링하였다. 형광 값을 동일한 유도인자 농도에서 배양된 샘플에 대해 평균 내었고, 평광발광은 도 6 및 도 7에 도시된 바와 같이 시간에 따라 그래프화하였다. 도 6은 프로피오네이트 유도성 prpBCDE 프로모터로부터 발현된, 시간에 따라 RedFP로부터의 형광도를 도시한다. 샘플의 각 평균군에 대한 유도인자 농도는 범례에 도시하였고, 프로피오네이트 농도가 먼저 열거된 후, L-아라비노스 농도를 열거하였다. 도 7은 L-아라비노스 유도성 araBAD 프로모터로부터 발현된, 시간에 따른 YellowFP로부터의 형광도를 도시한다. 샘플의 각 평균군에 대한 유도인자 농도를 범례에 도시하였고, L-아라비노스 농도가 먼저 열거된 후 프로피오네이트 농도를 열거하였다. 유도인자 농도의 각 조합의 경우, 관찰된 형광도에 의해 표시된 바와 같이, 측정된 형광 단백질의 발현은 pBAD24-YellowFP/pPRO33-RedFP 조합에 존재하는 상응하는 유도성 프로모터보다 pSOL 이중 프로모터 발현 벡터에 존재하는 유도성 프로모터로부터가 더 높았다. pBAD24 및 pPRO33에 비해 pSOL로부터 형광 단백질 발현의 이러한 높은 수준은 도 6 및 도 7에 도시된 유도인자 농도의 조합에서 관찰되었을 뿐만 아니라, 명확을 기하기 위하여 그래프에서 생략시킨 유도인자 농도의 조합에서도 관찰되었다.
C. 프리프로인슐린과 단백질 다이설파이드 아이소머라제의 유도성 공발현.
이중 프로모터 pSOL 벡터를 사용한 단백질 다이설파이드 아이소머라제(PDI)와 프리프로인슐린의 공발현에 의해 생성된 프리프로인슐린의 양을 pBAD240(서열번호 6) 및 pPRO430(서열번호 4) 발현 벡터(이들 벡터의 구축에 대해 실시예 2 참조)의 조합을 사용한 공발현으로 생성된 프리프로인슐린의 양과 비교하였다.
pBAD240 및 pPRO430 벡터를 사용하여 각각 프리프로인슐린 및 단백질 다이설파이드 아이소머라제(PDI)를 발현시켰다. pSOL 내 L-아라비노스 유도성 araBAD 프로모터를 사용하여, 프리프로인슐린을 발현시켰고, 프로피오네이트 유도성 prpBCDE 프로모터를 사용하여 PDI를 발현시켰다. 염화칼슘 처리에 의한 형질전환에 적격하게 만든 EB0001 세포(이. 콜라이 ASE(DGH) 세포라고도 함, 실시예 1 참조)를 pBAD240-프리프로인슐린 및 pPRO430-PDI 벡터 둘 다를 함유하는 용액에 첨가한 후, 42℃에서 20초간 열충격을 주고 5분간 얼음 상에 두었다. 공동형질전환된 세포를 900 마이크로리터 SOC 과성장 배지(뉴 잉글랜드 바이오랩스 카탈로그 번호 B9020S)에 37℃에서 1시간 동안 275 RPM에서 진탕하면서 25 마이크로그램/mL의 카나마이신 및 12 마이크로그램/mL의 클로람페니콜을 함유하는 한천 플레이트 상에 플레이팅하기전에 회수하였다. pPRO430을 함유하는 세포의 성장을 위한 50 마이크로그램/mL의 카나마이신, 및 12 마이크로그램/mL의 클로람페니콜의 항생제 농도를 액체 배양 조건에서 사용하였다. EB0001 세포를 유사한 방식으로 단일 pSOL-프리프로인슐린-PDI 벡터로 형질전환시켰지만, 한천 플레이트 상에 플레이팅하고, 이후에 50 마이크로그램/mL의 카나마이신만을 함유하는, 액체 배양으로 성장시켰다. 각 형질전환으로부터 단일 콜로니를 선택하여 적절한 항생제(들)가 더해진 LB 배지에서 30℃로 275 RPM에서 진탕하면서 밤새 정지기에 도달할 때까지 배양하였고, 이들 배양물을 사용하여 EB0001 균주 내 pBAD240-프리프로인슐린/pPRO430-PDI 및 EB0001 균주 내 pSOL-프리프로인슐린-PDI의 글리세롤 스톡을 확립시켰다.
유도를 위해 세포를 성장시키기 위해서, 적절한 항생제(들)가 있는 100mL의 LB 배지에 각 글리세롤 스톡으로부터 직접 접종하였고, 밤새 30℃에서 275 RPM으로 진탕하면서 배양하였다. 적절한 항생제(들)가 있는 100mL의 신선한 LB 배지에 0.2의 OD600에 도달할 때까지 희석한 후, 이 세포를 다시 30℃에서 275 RPM으로 진탕하면서 OD600가 0.6 내지 0.8에 도달할 때까지 배양하였다. 이 시점에, 적절한 부피를 펠렛화(3800 x g, 10분)시켜서 80mL 유도 배지(적절한 항생제(들)가 더해진 M9)에 현탁하여 0.7 내지 0.75의 OD600을 제공하였다.
유도 배지에 재현탁된 세포를 3mL/웰식 유도를 위해 24웰의 깊은 웰 배양 플레이트에 플레이팅하였다. 다음으로 각 유도인자 조건을 위해 300X 유도인자 스톡의 10 마이크로리터를 섞어서 플레이트에서 배양물을 유도시켰고, 6시간 동안 27℃에서 275 RPM으로 진탕하면서 항온처리시켰다. 각 웰의 배양물의 OD600은 6시간 항온처리 후 100 마이크로리터의 이중증류수에 100 마이크로리터의 배양물을 첨가하고, 큐벳 OD로 전환시키기 위해 하기 그래프 맞춤을 이용하여 에포치(Epoch) 플레이트 판독기(BioTek, Winooski, Vermont)를 사용하여 측정하였다: OD600_큐벳 =(OD600_플레이트*1.9796)-0.07. 각 웰의 세포를 이후 3800 x g에서 7분간 실온에서 펠렛화하여 수확하였다. 상청액은 펠렛으로부터 흡입시켜 버렸고 세포 펠렛 샘플을 -80℃에 저장하였다.
각 세포 펠렛의 프리프로인슐린의 양은 제조사의 설명서에 따라서 WES 시스템(ProteinSimple, 캘리포니아주 산호세 소재) 상에서 이동시키는, 모세관 전기영동 웨스턴 블롯을 이용하여 결정하였다. 저장된 세포 펠렛을 얼음 상에서 10분간 해동시킨 후, 유도 후 수확 시 배양 농도보다 2배 더 높은 세포 농도로 용해 완충액(배양물 mL 당 인산칼륨 pH 8, 1% 옥틸글루코사이드; 1X 프로테아제 억제제; 2 U 벤조나제(EMD# 70746, EMD Millipore, 매사추세츠주 빌레리카 소재); 및 배양물 mL 당 2.25 kU r리소자임(EMD# 71110, EMD Millipore, 매사추세츠주 빌레리카 소재))에서 용해시켰다. 용해는 얼음에서 10분간 항온처리시켜 진행시킨 후, 샘플을 20,000 x g에서 15분간 4℃에서 원심분리로 투명하게 하였다. WES 분석을 위한 준비에서, 용해물을 0.1X WES 완충액에 희석하고, 이들을 0.02X의 최종 농도가 되게 하였다. 각 샘플에 대해서, 5 마이크로리터의 희석된 샘플을 1.25 마이크로리터 환원 5X 샘플 완충액(형광 표준물과 함께, 200mM의 최종 농도로 DTT 첨가)에 첨가하였다. WES 시스템에 로딩하기 전에, 샘플을 95℃에서 10분간 가열하였다. 프리프로인슐린의 검출을 위한 1차 항체는 마우스 항인슐린 항체였고, 2차 항체는 홀스래디시 퍼옥시다제(HRP)가 표지된 염소 항마우스 항체였다. WES 분석의 결과는 표 5 및 표 6에 나타내었다.
2종의 개별 벡터를 이용해서 PDI와 공발현 시 생성된 프리프로인슐린의 양(마이크로그램/mL/OD) | |||||||
L-아라비노스 농도(마이크로몰) | |||||||
0.123 | 1.23 | 3.7 | 11.1 | 33.3 | 300 | ||
프로피오네이트 농도(mM) |
0 | 0.08 | 0.35 | 2.77 | 4.33 | 3.63 | 6.43 |
0.1 | 0.12 | 0.66 | 2.28 | 3.46 | 4.24 | 5.42 | |
1 | 0.19 | 1.31 | 4.85 | 5.47 | 6.58 | 9.82 |
단일 pSOL 벡터를 이용해서 PDI와 공발현시 생성된 프리프로인슐린의 양(마이크로그램/mL/OD) | |||||||
L-아라비노스 농도(마이크로몰) | |||||||
0.123 | 1.23 | 3.7 | 11.1 | 33.3 | 300 | ||
프로피오네이트 농도 (mM) |
0 | 0.02 | 10.02 | 18.64 | 21.58 | 21.99 | 22.35 |
0.27 | 0.00 | 7.57 | 15.24 | 16.55 | 19.79 | 18.21 | |
0.8 | 0.69 | 8.56 | 16.57 | 19.15 | 19.95 | 18.51 | |
2.4 | 0.34 | 9.58 | 19.14 | 15.38 | 16.55 | 12.90 |
표 5 및 표 6의 결과의 비교는 비슷한 유도인자 농도에서, pSOL 벡터는 2-벡터 공발현 시스템보다 2배 내지 8배 더 많은 양의 프리프로인슐린을 생성시켰음을 보여준다.
실시예 4
인플릭시맙의 유도성 공발현
인플릭시맙은 염증성 사이토카인인 TNF-알파에 결합하는 키메라 단일클론 항체이고, TNF-알파가 관여하는 병태 예컨대 자가면역 질환(크론병, 류마티스성 관절염, 건선 등)의 치료에 사용된다. 인플릭시맙은 중쇄(서열번호 16으로 표시된 아미노산 서열) 및 경쇄(서열번호 17로 표시된 아미노산 서열)로 형성되고, 이들 사슬 각각은 마우스 항-TNF-알파 항체로부터 유도된 가변 도메인 서열, 및 인간 불변 도메인을 갖는다. 이. 콜라이에서 발현을 위한 코돈 최적화 및 서열번호 16 및 17을 코딩하는 폴리뉴클레오타이드의 합성은 DNA2.0(캘리포니아주 멘로파크 소재)으로 수행하였다.
DNA2.0 엘렉트라 클로닝 방법(www.dna20.com/products/expression-vectors/electra-system)을 사용하여 인플릭시맙 발현 작제물을 생성시켰다. pBAD240 발현 벡터의 엘렉트라 클로닝 부위로 인플릭시맙 중쇄에 대한 최적 코딩 서열을 삽입시켜 형성된 발현 작제물은 pBAD240-인플릭시맙_HC이고, 서열번호 18로 표시된 뉴클레오타이스 서열을 갖는다. pPRO430 발현 벡터의 엘렉트라 클로닝 부위에 인플릭시맙 경쇄에 대해 최적화된 코딩 서열을 삽입시켜 형성된 발현 작제물은 pPRO430-인플릭시맙_LC이고, 서열번호 19로 표시된 뉴클레오타이드 서열을 갖는다. 최적화된 인플릭시맙 중쇄 및 경쇄 코딩 서열 둘 다를 유사한 방식으로 pSOL 발현 벡터(서열번호 15)에 클로닝하여서, araBAD 프로모터로부터 중쇄가 발현되고, prpBCDE 프로모터로부터 경쇄가 발현되게 하였다. 최종 pSOL-인플릭시맙 발현 벡터는 서열번호 20으로 표시된 뉴클레오타이드 서열을 갖는다. pBAD240-인플릭시맙_HC 및 pPRO430-인플릭시맙_LC 발현 작제물을 사용하여 42℃에서 열 충격과 이후, 37℃에서 밤새 성장을 통해 이. 콜라이 ASE(DGH) 세포를 공동형질전환시켰고, pSOL-인플릭시맙 발현 작제물도 유사한 방식으로 이. 콜라이 ASE(DGH) 세포에 형질전환시켜서, ASE(DGH)(pBAD240-인플릭시맙_HC/pPRO430-인플릭시맙_LC) 세포 및 ASE(DGH)(pSOL-인플릭시맙) 세포를 생성시켰다.
이들 세포는 일반적으로 실시예 3에 기술된 대로 성장시켰는데, 선별 화합물 예컨대 카나마이신 및/또는 클로람페니콜의 필요에 따른 첨가를 포함하였고, 항체 발현의 유도를 위해 세포를 대략 0.7(0.6-1.0)의 OD600에서 추가의 탄소 공급원없이 M9 배지에 재현탁시켰다. 다음으로 세포를 아라비노스(초기에 0.1%를 포함한 농도) 및 프로피오네이트(초기에 50mM을 포함한 농도)의 첨가를 통해 유도시켰다. 아라비노스 및 프로피오네이트의 농도의 조정은 실시예 5에 기술된 대로 수행할 수 있다. 유도 후, 항체가 생성된 숙주 세포를 효소 예컨대 리소자임을 사용한 화학적 용해에 의해서, 또는 기계적 파괴 방법 예컨대 초음파 처리 또는 미세유체 모델 M-110Y 미세유동화기(Microfluidics International Corp., 매사추세츠주 웨스트우드 소재)를 사용한 미세유동화를 통해 파괴하였다. 15분간 실온에서 20,000 x g에서 원심분리를 사용하여 불용성 분획으로부터 분리하였고, 발현된 항체를 포함한 가용성 단백질을 함유하는 상청액을 수집하였다.
인플릭시맙 항체는 제조사의 설명서(역시 실시예 3 참조)에 따라서, WES 시스템(ProteinSimple, 캘리포니아주 산호세 소재) 상에서 이동시키는, 모세관 전기영동 웨스턴 블롯을 이용하여 검출 및 정량하였다. 가용성 단백질 추출물을 모세관 세트에 적재하고, 단백질을 크기별로 전기영동으로 분리한 후, 샘플 내 항체를 차단 단계(1차 상체의 사용대신), 및 인간 항체 중쇄 및 경쇄를 인식하는 HRP-접합된 염소 항인간 2차 항체와 항온처리시켜 검출하였다. 항체 검출은 모세관에 화학발광 기질의 첨가 및 효소-촉매 반응 동안 방출되는 빛의 직접 포획을 통해 수행하였다. 분자량 추정치는 각 실시에 대해 12 kDa 내지 230 kDa 범위의 6개 바이오틴화된 단백질을 이용하여 생성시킨 표준 곡선을 이용해서 계산하였다. 형광 표준물을 샘플 적재 완충액에 포함시켜서, 분자량 표준물과 샘플을 정렬시키는데 사용된 내부 표준물을 각 샘플에 제공하였다.
소정 분자량으로 존재하는 단백질의 양을 결정하기 위해서, 기지량의 단백질 포준물을 일부 모세관에서 이동시켰다. 이러한 경우에, 예를 들어 10 마이크로그램/mL에서 출발하여 1.0 나노그램/mL로 희석시킨, 기지 단백질 농도를 갖는 시판 인플릭시맙의 연속 희석물을 준비하였다. 대략 5 WES 시스템 모세관을 사용해서 연속 희석물을 이동시켰다. 실험 및 연속 희석물 모세관 둘 다에서 각 인플릭시맙 단백질 밴드에 대해, 단백질 밴드의 화학발광 강도를 나타내는 WES 시스템 소프트웨어를 통해 곡선을 생성시키고, 각 곡선 하 영역을 평가하고, 이들 영역의 표준 곡선을 인플릭시맙 연속 희석물 모세관의 인플릭시맙 단백질 밴드에 대해 그래프화하였다. 실험 샘플의 농도를 결정하기 위해서, 실험 인플릭시맙 샘플의 화학발광 강도를 나타내는 각 곡선 하 영역은 기지 인플릭시맙 농도의 샘플에 대해 생성시킨 표준 곡선과 비교할 수 있다.
인플릭시맙 항체는 실시예 7에 기술된 대로 더욱 정제될 수 있고, 인플릭시맙 항체의 추가 특징규명은 실시예 8(항체 결합 친화성의 측정) 및 실시예 9(공발현 생성물에 존재하는 이황화 결합의 특징규명)에 기술되어 있다.
실시예 5
다양한 유도인자 농도에 의한 공발현의 적정
본 발명의 발현 시스템을 사용해서 다량체 생성물의 생성을 최적화하기 위해서, 유도인자의 농도를 독립적으로 조정 또는 적정하는 것이 가능하다. 유도성 프로모터 예컨대 L-아라비노스 유도성, 프로피오네이트 유도성, L-람노스 유도성, 또는 D-자일로스 유도성 프로모터를 포함하는 발현 작제물을 함유하는 숙주 세포를 적절한 항생제를 함유하는 M9 최소 배지에서 원하는 밀도(예컨대 대략 0.5의 OD600) 로 성장시킨 후, 세포를 경우에 따라 탄소 공급원 예컨대 글리세롤 없이, 적절한 항생제 및 다양한 농도의 각 유도제와 함께 제조된, 소량의 M9 최소 배지에 분취하였다. 소량 적정은 200mL 내지 500mL 진탕 플라스크에서 수행할 수 있다. 발현을 유도하는데 필요한 L-아라비노스, L-람노스, 또는 D-자일로스의 농도는 전형적으로 세포의 OD 유닛 당 0.02%보다 낮다(그리고 종종 실질적으로 낮다). 적정 실험에서, 시험되는 L-아라비노스의 농도는 모두 세포의 OD 유닛 당 2% 내지 1.5%, 1%, 0.5%, 0.2%, 0.1%, 0.05%, 0.04%, 0.03%, 0.02%, 0.01%, 0.005%, 0.002%, 0.001%, 0.0005%, 0.0002%, 0.0001%, 0.00005%, 0.00002%, 0.00001%, 0.000005%, 0.000002%, 0.000001%, 0.0000005%, 0.0000002%, 0.0000001%, 0.00000005%, 0.00000002%, 및 0.00000001% 범위일 수 있다. 66.61 마이크로몰 농도의 L-아라비노스는 0.001%의 L-아라비노스에 상응한다. L-아라비노스, L-람노스, 또는 D-자일로스에 대한 대안적인 적정 실험은 몰농도로 표시되는 하기 농도를 시험하는 것이다: 모두 세포의 OD 유닛 당, 250mM, 100mM, 50mM, 25mM, 10mM, 5mM, 2.5mM, 1.0mM, 500 마이크로몰, 250 마이크로몰, 100 마이크로몰, 75 마이크로몰, 50 마이크로몰, 25 마이크로몰, 10 마이크로몰, 5.0 마이크로몰, 2.5 마이크로몰, 1.0 마이크로몰, 500nM, 250nM, 100nM, 50nM, 25nM, 10nM, 5.0nM, 2.5nM, 1.0nM, 500pM, 250pM, 100pM, 50pM, 25pM, 10pM, 5.0pM, 2.5pM, 및 1.0pM. 프로피오네이트의 경우, 시험되는 농도는 모두 세포의 OD 유닛 당 1M 내지 750mM, 500mM, 250mM, 100mM, 75mM, 50mM, 25mM, 10mM, 5mM, 1mM, 750 마이크로몰, 500 마이크로몰, 250 마이크로몰, 100 마이크로몰, 50 마이크로몰, 25 마이크로몰, 10 마이크로몰, 5.0 마이크로몰, 2.5 마이크로몰, 1.0 마이크로몰, 500nM, 250nM, 100nM, 50nM, 25nM, 10nM, 5.0nM, 2.5nM, 및 1.0nM 범위일 수 있다.
시험되는 L-아라비노스(또는 L-람노스 또는 D-자일로스)의 각 농도 'x'의 경우, 제1 유도인자의 농도 'x'를 함유하는 각 튜브에 첨가되는 상이한 유도인자 예컨대 프로피오네이트의 농도는 일련의 각 샘플에서 다양하였다. 대안적으로, 적절 실험은 유도인자를 대사하는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는 숙주 세포의 경우, 세포의 OD 유닛 당 0.0015%(100 마이크로몰)의 임의의 L-아라비노스, L-람노스, 또는 D-자일로스, 및/또는 세포의 OD 유닛 당 100 마이크로몰(또는 50 마이크로몰 내지 250 마이크로몰의 농도) 프로피오네이트인 유도인자 농도의 '표준' 조합에서 출발할 수 있다. 유도인자를 대사하는 단백질이 기능성인 숙주 세포의 경우, 유도인자 농도의 '표준' 조합은 세포의 OD 유닛 당 0.2%(13mM)의 임의의 L-아라비노스, L-람노스, 또는 D-자일로스, 및/또는 세포의 OD 유닛 당 83mM(또는 50mM 내지 100mM 농도)의 프로피오네이트이다. '표준' 조합에서 변화시킨 유도인자 농도의 추가 조합이 시험되었고, 일련의 적정 실험에서, 초기 실험의 결과를 사용하여 이후 실험에서 사용되는 유도인자 농도를 '미세 조율'할 수 있다. 유사한 적정 실험을 제한없이 L-아라비노스, 프로피오네이트, L-람노스, 및 D-자일로스를 포함하는, 본 발명의 유도성 공발현 시스템에서 사용되는 임의의 유도인자 조합으로 수행할 수 있다. 6시간 동안 유도인자의 존재 하에서 성장 후, 세포를 펠렛화시키고, 희망 생성물을 세포로부터 추출하고, 세포의 질량 값 당 생성물의 수율을 정량적 면역 검정법 예컨대 ELISA에 의해서, 또는 생성물의 정제 및 280㎚에서 UV 흡광도를 통한 정량으로 결정한다.
발현되는 단백질을 형광 단백질 모이어티, mKate2 적색 형광 단백질 (Evrogen, 러시아 모스크바 소재), 또는 애쿠오레아 빅토리아(Aequorea victoria) 및 바실러스 세레우스(Bacillus cereus) 유래의 강화된 녹색 형광 단백질에 의해 제공되는, 형광 단백질 모이어티를 포함하도록 조작하는, 고수율 검정법을 이용해서 유도인자 농도를 적정하는 것이 가능하다. 고수율 적정 실험에서 유도인자의 상이한 농도에 의해 생성된 유전자 산물의 양 및 활성을 결정하는 다른 접근법은 생체분자 결합 상호작용을 측정할 수 있는 센서, 예컨대 표면 플라스몬 공명을 검출하는 센서, 또는 생체층 간섭계(BLI)를 적용한 센서(예를 들어, 옥테트(Octet)(등록상표) QK 시스템(forteBIO, 캘리포니아주 멘로파크 소재))를 사용하는 것이다. 발현되는 유전자 산물에 충분한 특이성으로 결합하는 항체가 이용가능하면, 유전자 산물은 상기 실시예 3에 기술된 바와 같이 WES 시스템 상에서 이동시키는, 모세관 전기영동 웨스턴 블롯을 이용해서 검출 및 정량할 수 있다.
실시예 6
프로모터의 강도 및 유도성 발현의 균일성의 측정
프로모터의 강도는 적합한 대조군에 대해서, 그 프로모터에서 개시되는 유전자 산물의 전사량으로서 측정된다. 발현 작제물의 유전자 산물의 발현을 유도하는 항시성 프로모터의 경우, 프로모터의 '야생형' 형태, 또는 '하우스키핑' 유전자 유래의 프로모터를 시험하려는 프로모터 대신에 사용하는 것을 제외하고, 적합한 대조군은 동일한 발현 작제물을 사용할 수 있었다. 유도성 프로모터의 경우, 프로모터로부터 유전자 산물의 발현은 유도 및 비유도 조건 하에서 비교할 수 있다.
A. 프로모터로부터 전사된 RNA의 수준을 결정하기 위해 정량적 PCR을 사용한 프로모터 강도의 측정
De Mey 등의 방법("Promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 2010 Mar 24; 10: 26)을 이용해서 배양으로 성장시킬 수 있는 숙주 세포에서 프로모터의 상대적 강도를 결정하였다. 시험하려는 프로모터를 갖는 발현 작제물을 포함하는 숙주 세포, 및 대조군 발현 작제물을 함유하는 대조군 숙주 세포는 삼중으로 배양으로 성장시켰다. 1mL의 샘플을 mRNA 및 단백질 수집을 위해 OD600 = 1.0에서 채취하였다. 전체 RNA 추출은 RNeasy 미니 키트(QIAGEN, 네덜란드 소재)를 이용해서 수행하였다. RNA의 순도는 퀴아젠(QIAGEN)에서 추천하는 FA-아가로스 겔 상에서 입증하였고 RNA 농도는 260㎚의 흡광도를 측정하여 결정하였다. 2 마이크로그램의 RNA를 사용하고 무작위 프라이머 및 리버트애드(RevertAid) H 마이너스 M-MulV 역전사효소(Fermentas, 매릴랜드 글렌 버니 소재)를 사용하여 cDNA를 합성하였다. 프로모터의 강도는 프로모터로부터 생성되는 전사물에 상응하는 cDNA를 증폭시키기 위해 디자인된 정방향 및 역방향 프라이머를 사용하여 아이사이클러 아이큐(iCycler IQ)(등록상표)(Bio-Rad, 벨기에 에케 소재)에서 수행한 RT-qPCR을 통해 결정하였다. (이러한 목적을 위해 문헌 [De Mey et al.]의 저자들은 Fw-ppc-qPCR 및 Rv-ppc-qPCR 프라이머, 및 대조군 하우스키핑 유전자 rpoBand 유래의 프라이머 Fw-rpoB-qPCR 및 Rv-rpoB-qPCR을 사용하였음). SYBR GreenER qPCR 수퍼믹스(Life Technologies, 뉴옥주 그랜드 아일랜드 소재)를 이용해서 간단한 UDG(우라실 DNA 글리코실라제) 항온처리(50℃에서 2분) 직후 PCR 증폭(95℃에서 8.5분; 40사이클의 95℃에서 15초 및 60℃에서 1분) 및 프라이머 이량체 존재를 확인하고 반응의 특이성을 분석하기 위한 용융 곡선 분석(95℃에서 1분, 55℃에서 1분 및 80사이클로 10초간 55℃+0.5℃/사이클)을 수행하였다. PCR 사이클링 전 UDG 항온처리 단계는 이전 반응으로부터 임의의 오염된 dU 함유 생성물을 파괴한다. UDG는 이후 정상 PCR 사이클링 동아나 고온에 의해 불활성화되어서, 진짜 표적 서열의 증폭을 가능하게 한다. 각 샘플은 삼중으로 수행하였다. 상대적 발현 비율은 PE 어플라이드 바이오시스템(PerkinElmer, 캘리포니아주 포스터 시티 소재)의 "델타-델타 ct 방법"을 이용해서 계산하였다.
B. 형광 리포터 유전자를 사용한 유도성 프로모터 강도 및 유도의 균일성 측정
이들 실험은 Khlebnikov 등의 방법("Regulatable arabinose-inducible gene expression system with consistent control in all cells of a culture", J Bacteriol 2000 Dec; 182(24): 7029-7034)을 이용해서 수행하였다. 유도성 프로모터의 유도를 측정하는 실험은 탄소 공급원으로서 3.4% 글리세롤이 보충된 C 배지에서 수행하였다(Helmstetter, "DNA synthesis during the division cycle of rapidly growing Escherichia coli B/r", J Mol Biol 1968 Feb 14; 31(3): 507-518). 형광 리포터 유전자의 발현을 제어하는 적어도 1종의 유도성 프로모터를 포함하는 발현 작제물을 함유하는 이. 콜라이 균주는 0.6 내지 0.8의 600㎚(OD600)에서의 광학 밀도까지 항생제 선별 하에 37℃에서 성장시켰다. 세포는 원심분리(15,000 x g)를 통해 회수하였고, 탄소 공급원이 없는 C 배지에서 세척하고, 항생제, 글리세롤 및/또는 유도인자(유전자 발현의 유도용)를 함유하는 신선한 C 배지에 0.1 내지 0.2의 OD600까지 재현탁시키고, 6시간 동안 항온처리시켰다. 분석을 위해 성장 기간 동안 통상적으로 샘플을 채취하였다. 배양물 형광은 360/40-nm-파장 여기 및 520/10-nm-파장 발광 필터를 구비한 벌사플루오르(Versafluor) 형광광도계(Bio-Rad Inc., 캘리포니아주 에르쿨레스 소재) 상에서 측정하였다. 유도시 유도성 프로모터로부터의 발현 강도는 대조군(예컨대 비유도) 세포에 대해 유도된 세포의 최대 개체군-평균 형광의 비율(형광/OD 비율)로 표시할 수 있다. 세포 개체군 내에서 유도의 균일성을 결정하기 위해서, 유세포측정법을 아르곤 레이저(488㎚의 파장 및 15 mW에서 방출) 및 525㎚ 파장 통과대역 필터를 구비한 벡크만-쿨터 에픽스(Beckman-Coulter EPICS) XL 유세포 측정기(Beckman Instruments Inc., 캘리포니아주 팰로앨토 소재) 상에서 수행하였다. 분석 전에, 샘플 세포를 여과(필터 공극 크기, 0.22 마이크로미터)시킨 포스페이트-완충 염수로 세척하고, 0.05의 OD600으로 희석시키고, 얼음에 위치시켰다. 각 샘플에 대해, 500 내지 1,000 이벤트/초 사이의 속도로 30,000 이벤트를 수집하였다. 각 샘플에서 유도된(형광) 세포의 비율은 유세포측정 데이터로부터 계산할 수 있다.
실시예 7
항체의 정제
본 발명의 유도성 공발현 시스템을 생성된 항체는 임의의 세포 및 찌꺼기를 제거하기 위해 10분간 10,000 x g에서 용해된 숙주 세포의 샘플을 원심분리하여 정제하였다. 상청액을 0.45 마이크로미터 필터를 통해 여과시켰다. 1mL의 재조합 단백질 G-세파로스(Sepharose)(등록상표) 4B 칼럼(Life Technologies, 뉴옥주 그랜드 아일랜드 소재)을 1mL/분의 유속을 얻도록 설치하였고, 하기 완충액과 함께 사용하였다: 결합 완충액: 0.02M 인산나트륨, pH 7.0; 용리 완충액: 0.1M 글리신-HCl, pH 2.7; 및 중화 완충액: 1M Tris-HCl, pH 9.0. 칼럼은 5 칼럼 부피(5mL)의 결합 완충액으로 평형화시킨 후, 샘플을 칼럼에 적용하였다. 칼럼은 5 내지 10 칼럼 부피의 결합 완충액으로 세척하여 불순물 및 미결합 물질을 제거하였고, 용리물에서 단백질이 검출되지 않을 때까지 계속하였다(280㎚의 UV 흡광도로 결정). 다음으로 칼럼을 5 칼럼 부피의 용래 완충액으로 용리하였고, 칼럼을 즉시 5 내지 10 칼럼 부피의 결합 완충액으로 재평형화시켰다.
실시예 8
항체 결합 친화성의 측정
"Kd" 또는 "Kd 값"으로 표시하는, 항체 결합 친화성은 하기 검정법으로 기술한 바와 같이 관심 항체의 Fab 형식 및 이의 항원을 이용해서 수행된 방사성표지된 항원-결합 검정법(RIA)에 의해 측정된다. 전체 길이 항체의 Fab 형식의 생성은 당분야에 공지되어 있다. 항원에 대한 Fab의 용액-결합 친화성은 미표지된 항원의 적정 시리즈 존재 하에서 최소 농도의 (125I)-표지된 항원으로 Fab를 평형화시킨 후, 항-Fab 항체 코딩된 플레이트로 결합된 항원을 포획하여 측정한다(예를 들어, 하기 문헌들을 참조함: Chen et al., "Selection and analysis of an optimized anti-VEGF antibodi: crystal structure of an affinity-matured Fab in complex with antigen", J Mol Biol 1999 Nov 5; 293(4): 865-881). 검정 조건을 확립하기 위해서, 마이크로타이터 플레이트(DYNEX Technologies, Inc., 버지니아주 샹타이 소재)를 밤새 50mM의 탄산나트륨(pH 9.6) 중 5 마이크로그램/mL의 포획 항-Fab 항체(Cappel Labs, 펜실베니아주 웨스트체스터 소재)로 코팅시키고, 후속하여 실온(대략 23℃)에서 2 내지 5시간 동안 PBS 중 2%(w/v) 소혈청 알부민으로 차단시켰다. 비흡착 플레이트(Nunc #269620; Thermo Scientific, 뉴욕주 로체스터 소재)에서, 100pM 또는 26pM [125I]-항원을 관심 Fab의 연속 희석물과 혼합하였다(예를 들어, 문헌 Presta et al., "Humanization of an anti-vascular endothelial growth factor monoclonal Antibody for the therapy of solid tumors and other disorders", Cancer Res 1997 Oct 15; 57(20): 4593-4599]의 항-VEGF 항체, Fab-12의 평가와 일관적임). 관심 Fab를 다음으로 밤새 항온처리시켰지만, 이러한 항온처리는 평형에 도달한 것을 보장하기 위해 장기간(예를 들어, 약 65시간) 동안 계속할 수 있다. 이후, 혼합물을 실온에서 항온처리(예를 들어, 1시간)을 위해 포획 플레이트로 옮겼다. 이후 용액을 제거하고 플레이트를 8회 PBS 중 0.1% 트윈(TWEEN)20(상표명) 계면활성제로 세척하였다. 플레이트를 건조시켰을 경우, 150 마이크로리터/웰의 섬광제(MICROSCINT-20™; PerkinElmer, 매사추세츠주 월섬 소재)를 첨가하였고, 플레이트를 10분간 탑카운트(TOPCOUNT)(상표명) 감마 카운터(PerkinElmer) 상에서 계측하였다. 20% 미만 또는 그와 동일한 최대 결합을 제공하는 각 Fab의 농도를 경쟁-결합 검정법에 사용을 위해 선택하였다.
대안적으로, Kd 또는 Kd 값은 대략 10 반응 유닛(RU)에서 고정된 항원 CM5 칩을 이용해서 25℃에서 비아코어(BIACORE)(등록상표)-2000 또는 비아코어-3000 장비(BIAcore, Inc., 뉴저지주 피스카타웨이 소재)를 사용한 표면-플라스몬 공명 검정을 사용하여 측정한다. 간략하게, 카복시메틸화된 덱스트란 바이오센서 칩(CM5, BIAcore Inc.)을 공급사의 설명서에 따라서 N-에틸-N'-(3-다이메틸아미노-프로필)-카보다이이미드 하이드로클로라이드(EDC) 및 N-하이드록시숙신이미드(NHS)로 활성화시켰다. 대략 10 RU의 커플링된 단백질을 획득하기 위해 5 마이크로리터/분의 유속으로 주입 전에 항원을 5 마이크로그램/mL(대략 0.2 마이크로몰)로, 10mM 아세트산나트륨, pH 4.8을 이용해서 희석하였다. 항원의 주입 후, 1M 에탄올아민을 주입하여 미반응 기를 차단하였다. 동역학 측정을 위해 Fab의 2배 연속 희석물(0.78nM 내지 500nM)을 대략 25 마이크로리터/분의 유속으로 25℃에서 0.05% 트윈 20 계면활성제를 함유한 PBS(PBST) 중에서 주입하였다. 결합 속도(kon) 및 해리 속도(koff)는 결합 및 해리 센서그램을 동시에 적합화시켜서 단순 일대일 랑뮈어 결합 모델(비아코어 평가 소프트웨어 버전 3.2)을 사용해서 계산하였다. 평형 해리 상수(Kd)는 koff/kon비율로 계산하였다. 상기 표면-플라스몬 공명 검정에 의해 결합 속도가 106 M-1s-1을 넘으면, 결합 속도는 분광광도계, 예컨대 스탑-플로우-장착된 분광광도계(Aviv Instruments) 또는 교반 큐벳 구비된 8000-시리즈 SLM-아민코(AMINCO)(상표명) 분광광도계(ThermoSpectronic)에서 측정하듯이 증가된 농도의 항원 존재 하에, 25℃에서 PBS, pH 7.2 중 20nM 항-항원 항체(Fab 형태)의 형광 방출 강도(여기=295㎚; 방출=340㎚, 16㎚ 통과대역)의 증가 또는 감소를 측정하는 형광 소광 기술을 이용해서 결정할 수 있다.
항체-항원 결합에 대한 평형 해리 상수(Kd)를 결정하기 위한 다른 방법은 옥테트 레드 시스템(ForteBio, Pall Corporation, 뉴욕주 포트 워싱턴)(www.fortebio.com/octet-RED96.html)을 사용한다. 초기 측정 단계는 기준값을 결정한 후, His-태깅된 항원을 25nM의 농도로 Ni-NTA 바이오센서 상에 10분간 1X KB+ 완충액(PBS 중 0.01% BSA, 0.002% 트윈-20, pH 7.4) 중에서 적재시킨 후, 다른 기준값 측정 단계(오직 2분간 1X KB+ 완충액)를 후속하였다. 센서를 이후 10분간 항체를 함유한 웰에 함침(해리 단계)시키고, 20분간 1X KB+ 완충액으로 세척하여 해리를 측정하였다. 평형 해리 상수(Kd)는 koff 및 kon 속도를 결정하는 옥테트 소프트웨어를 사용하여, koff/kon의 비율로 계산하였다.
실시예 9
발현 생성물에 존재하는 이황화 결합의 특징규명
단백질 발현 생성물의 이황화 결합 개수 및 위치는 비환원 조건 하에서, 프로테아제, 예컨대 트립신으로 단백질의 분해, 및 최종 펩타이드 단편에 대한 순차적 전자 전달 해리(ETD) 및 충돌-유도 해리(CID) MS 단계(MS2, MS3)를 조합한 질량 분광광도법(MS)을 수행하여 결정할 수 있다(Nili et al., "Defining the disulfide bonds of insulin-like growth factor-bond protein-5 by tandem mass spectrometry with electron transfer dissociation and collision-induced dissociation", J Biol Chem 2012 Jan 6; 287(2): 1510-1519; Epub 2011 Nov 22).
공발현된 단백질의 분해. 이황화 결합 재배열을 방지하기 위해서, 임의의 자유 시스테인 잔기를 먼저 알킬화를 통해 차단하였는데, 발현된 단백질을 4 M 우레아를 포함한 완충액에 20℃에서 30분간 진탕하면서 알킬화제 요오도아세타미드(5mM)과 빛으로부터 보호하여 항온처리시켰다. 대안적으로 바람직하게 NEM이 알킬화제로 사용되었고, 변성 조건(6M GuaHCl) 하에서 수행된 환원/알킬화와 조합하여 트립신 단백질가수분해하였다. 알킬화 후, 공발현된 단백질은 프리캐스트 겔을 이용해서 비환원 SDS-PAGE를 통해 분리하였다. 대안적으로, 공발현된 단백질은 요오도아세타미드 또는 NEM이 있거나, 또는 대조군으로서 없이 전기영동 후 겔에서 항온처리시켰다. 단백질 밴드를 염색하고, 이중탈이온수로 탈염색하고, 절개하고, 30분간 20℃에서 진탕하면서 500 마이크로리터의 50mM 중탄산암모늄, 50%(v/v) 아세토나이트릴에서 2회 항온처리시켰다. 단백질 샘플을 2분간 100% 아세토나이트릴에서 탈수시키고, 진공 원심분리를 통해 건조시키고, 얼음 상에서 15분간 50mM 중탄산암모늄 및 5mM 염화칼슘을 함유하는 완충액 중에서 10 mg/mL의 트립신 또는 카이모트립신으로 재수화시켰다. 과량의 완충액을 제거하고 효소가 없는 50 마이크로리터의 동일 완충액으로 교체한 후, 진탕하면서 각각 트립신 및 카이모트립신에 대해 37℃ 또는 20℃에서 16시간 동안 항온처리하였다. 분해는 3 마이크로리터의 88% 포름산을 첨가하여 중지시키고, 간단한 와류 후, 상청액을 제거하고 분석까지 -20℃에 저장하였다. 트립신분해가 불충분한 서열 범위(75% 미만)를 제공하면 대안적인 단백질 단편화 방법(LysC, Glu-C, 또는 CNBr)이 사용된다. NEM의 존재 하에서 산성 조건 하에 환원제 TCEP(트리스(2-카복시에틸)포스핀)의 사용은 부분적으로 온전한 이황화 연결을 갖는 단편에 대한 접근성을 제공한다. 이황화-온전한 분해 지도는 환원(DTT 또는 TCEP) 분해 지도와 비교하였다.
질량 분광분석법에 의한 이황화 결합의 위치. 펩타이드를 0.1% 포름산을 함유하는 이동상에서 20 마이크로리터/분으로 1㎜×8㎜ 트랩 칼럼(Michrom BioResources, Inc., 캘리포니아주 오번 소재) 상에 주입하였다. 트랩 카트리지를 5 mm Zorbax SB-C18 정지상을 함유하는 0.5㎜ ×250㎜ 칼럼(Agilent Technologies, Santa Clara, CA)과 인라인으로 위치시키고, 펩타이드를 1100 시리즈 모세관 HPLC(Agilent Technologies)를 이용해서 10 마이크로그램/분으로 90분간 2 내지 30% 아세토나이트릴 농도구배를 통해 분리하였고, 대안적으로 UPLC에 적합한 C18 칼럼을 사용하였다. 펩타이드는 ETD 소스가 구비된 LTQ 벨로스(Velos) 선형 이온 트랩(Thermo Fisher Scientific Inc., 매사추세츠주 월섬 소재)을 이용해서 분석하였다. 전자분무 이온화는 캡티브 스프레이 소스(Captive Spray source)(Michrom Bioresources, Inc.), 또는 바람직하게 3.0 kV에서 미코팅된, 약한 용융 실리카 이미터(New Objective Inc., 매사추세츠주 워번 소재)를 이용해서 수행하였다. 대안적으로, 중형 단백질가수분해 단편의 분석은 써모(Thermo) LTQ-FT MS(7 Tesla) 장비, 또는 시냅트(Synapt) G2-Si 4극자 진행파 이온 이동성 비행시간(ToF) 질량 분광광도계(Waters Corp., 매사추세츠주 밀퍼드 소재)를 사용하여 수행하였다. 바람직하게는, 펩타이드는 오비트랩 퓨젼(Orbitrap Fusion)(상표명) 트리브리드(Tribrid)(상표명) 질량 분광광도계(Thermo Fisher Scientific)를 사용하여 분석하였다. 이황화-연결된 펩타이드는 카복시 말단에 2개의 염기성 잔기(아르기닌 또는 리신) 및 2개의 N 말단의 존재로 인하여 트립신처리 후 +4 또는 그보다 큰 전하 상태를 갖는다. 이들 이황화-연결된 펩타이드는 오비트랩 퓨젼 장비를 통해 우선적으로 단리시켜서 이황화 결합이 ETD 단편화를 이용해서 분해될 수 있다. 점검 MS 스캔은 점검 스캔에서 가장 강한 이온 상의 CID 및 ETD MS2 스캔으로 이루어진 7 데이터-의존적 스캔이 후속되었고, ETD MS2 스캔에서 제1 내지 제5의 가장 강한 이온에 대한 5 MS3 CID 스캔을 후속하였다. CID 스캔은 35의 정규화된 충돌 에너지를 사용하였고, ETD 스캔은 보충 활성화가 가능한 100 ms 활성화 시간을 사용하였다. MS2 CID 및 ETD 스캔을 개시하는 최소 신호는 10,000이었고, MS3 CID 스캔의 개시를 위한 최소 신호는 1000이었고, 모든 MS2 및 MS3에 대한 단리 너비는 3.0 m/z였다. 소프트웨어의 동적 배제 특징은 1의 반복 계측, 100의 배제 목록 크기, 및 30초의 배제 지속기간으로 가능하였다. ETD MS2 스캔의 수집을 위한 특이적 가교종을 표적으로 하는 포함 목록을 사용하였다. MS2 및 MS3 스캔을 위한 개별 데이터 파일은 ZSA 전하 상태 분석을 사용하는 바이오웍스(Bioworks) 3.3(Thermo Fisher Scientific)으로 생성시켰다. 펩타이드 서열에 대한 MS2 및 MS3 스캔의 일치는 시퀘스트(Sequest)(V27, Rev 12, Thermo Fisher Scientific)를 통해 수행하였다. 분석은 효소 특이성없이, 2.5의 부모 이온 질량 내성, 1.0의 단편 질량 내성, 및 산화된 메티오닌 잔기에 대한 +16의 가변 질량으로 수행하였다. 다음으로 결과는 95 및 99%의 최소 펩타이드 및 단백질 확률을 사용하여 프로그램 스캐폴드(V3_00_08, Proteome Software, 오리건주 포틀랜드 소재)를 이용해서 수행하였다. 데이터 해석을 위한 소프트웨어 도구는 다이설피네이터 노드가 구비된 프로테옴 디스커버러(Proteome Discoverer)(상표명) 2.0(Thermo Fisher Scientific)을 포함하였다. MS3 결과의 펩타이드는 스캔 번호에 의해 분류하였고, 시스테인 함유 펩타이드는 ETD MS2 스캔에서 관찰된 5 최고 강도 이온에서 생성된 MS3 스캔의 군에서 동정되었다. 이황화-연결종에 참여하는 시스테인 펩타이드의 정체는 점검 스캔 및 ETD MS2 스캔에서 관찰된 부모 이온 질량의 수동 조사에 의해 더욱 확인하였다.
실시예 10
박테리아 세포 주변세포질, 스페로플라스트, 및 전체 세포로부터 발현 생성물의 단리
본 발명의 유도성 발현 시스템은 세포의 상이한 구획, 예컨대 세포질 또는 주변세포질에 축적되는 유전자 산물을 발현시키는데 사용될 수 있다. 숙주 세포 예컨대 이. 콜라이 또는 에스. 세레비지아는 외부 세포막 또는 세포벽을 가지며, 외막 또는 벽이 제거되면 스페로플라스트를 형성할 수 있다. 이러한 숙주에서 만들어진 발현된 단백질은 하기 방법을 사용하여, 주변세포질, 또는 스페로플라스트, 또는 전체 세포로부터 특별히 정제될 수 있다(Schoenfeld, "Convenient, rapid enrichment of periplasmic and spheroplasmic protein fractions using the new PeriPreps™ Periplasting Kit", Epicentre Forum 1998 5(1): 5; www.epibio.com/newsletter/f5_1/f5_1pp.asp 참조). 페리프렙스(PeriPreps)(상표명) 페리플라스팅 키트(Epicentre® Biotechnologies, 위스콘신 매디슨 소재; www.epibio.com/pdftechlit/107pl0612.pdf에서 프로토콜 입수 가능)를 사용하는 이러한 방법은 이. 콜라이 미치 다른 그람 음성 박테리아에 대해 디자인되었지만, 일반적인 접근법을 다른 숙주 세포 예컨대 에스. 세레비지아에 대해 변형시킬 수 있다.
1. 정지기의 더 나이든 세포 배양물은 통상적으로 리소자임 처리에 일부 내성이 입증되어서, 박테리아 숙주 세포 배양은 오직 후기 대수기까지 성장시킨다. 재조합 단백질의 발현이 과도하면, 세포가 이르게 용해될 수 있으므로, 세포 배양은 과도한 단백질 합성이 유도될 수 있는 높은 성장 온도 또는 풍부 배지에서 성장시키지 않는다. 단백질 발현이 유도되면, 세포는 대수기 또는 초기 정지기여야 한다.
2. 세포 배양물을 실온에서 10분간 최소 1,000 x g에서 원심분리하여 펠렛화시킨다. 주: 세포는 신선해야만하고, 냉동시켜서는 안된다. 세포 펠렛의 습윤 무게는 이 프로토콜에 필요한 시약의 양을 계산하기 위해 결정된다.
3. 세포는 세포 현탁물이 균질할때까지 와류 혼합 또는 파이펫팅을 통해서, 세포 각 그램에 대해 최소 2mL의 페리프렙스 페리플라스팅 완충액(200mM Tris-HCl pH 7.5, 20% 수크로스, 1mM EDTA, 및 30 U/마이크로리터 용해 준비 리소자임)에 완전하게 재현탁된다. 주: 과도한 교반은 스페로플라스트의 이른 용해를 초래하여 세포질 단백질로 주변세포질 분획의 오염을 유발시킬 수 있다.
4. 실온에서 5분간 항온처리시킨다. 용해 준비 리소자입은 실온에서 최적으로 활성이 있다. 저온(0℃ 내지 4℃)에서 항온처리 시간을 필요로 하며, 그러한 온도에서 항온처리 시간은 2배 내지 4배로 연장된다.
5. 본래 세포 펠렛 무게(단계 2)의 각 그램 당 3mL의 정제수를 4℃에서 첨가하고 반전시켜 혼합한다.
6. 10분간 얼음에서 항온처리시킨다.
7. 용해된 세포를 최소 4,000 x g에서 15분간 실온에서 원심분리하여 펠렛화시킨다.
8. 주변세포질 분획을 함유하는 상청액을 깨끗한 튜브로 옮긴다.
9. 오염된 핵산을 분해시키기 위하여, 옴니클리브 엔도뉴클레아제를 선택적으로페리프렙스 용해 완충액에 첨가한다. 뉴클레아제의 포함은 일반적으로단백질의 수율 및 용해물의 취급 용이성을 개선시키지만, 뉴클레아제의 첨가가 일부 경우에 바람직하지 않을 수 있는데, 예를 들어 뉴클레아제 사용은 잔류 뉴클레아제 활성 또는 마그네슘 보조인자에 대한 일시적 노출이 후속 검정 또는 정제된 단백질의 사용을 방해하면 피해야 한다. 유사하게, 옴니클리브 엔도뉴클레아제를 불활성화시키기 위해 용해물에 EDTA의 첨가는 후속 검정 또는 정제된 단백질의 사용을 방해할 수 있다. 뉴클레아제가 첨가되면, 2 마이크로리터의 옴니클리브 엔도뉴클레아제 및 10 마이크로리터의 1.0M MgCl2는 단계 10에서 필요한 용해 완충액의 각 밀리리터에 대해 페리프렙스 용해 완충액(10mM Tris-HCl pH 7.5, 50mM KCl, 1mM EDTA, 및 0.1% 데옥시콜레이트)으로 최대 1mL까지 희석된다.
10. 펠렛을 본래 세포 펠렛 무게의 각 그램에 대해 5mL의 페리프렙스 용해 완충액에 재현탁시킨다.
11. 펠렛은 실온에서 10분간 항온처리시킨다(포함된다면, 옴니클리브 엔도뉴클레아제 활성은 점도의 상당한 감소를 야기시키게 되며, 항온처리는 세포 현탁물이 물의 경도를 가질때까지 계속됨).
12. 세포 찌꺼기는 최소 4,000 x g에서 15분간 4℃에서 원심분리하여 펠렛화시킨다.
13. 스페로플라스트 분획을 함유하는 상청액을 깨끗한 튜브로 옮긴다.
14. 옴니클리브 엔도뉴클레아제가 페리프렙스 용해 완충액에 첨가되었으면, 20 마이크로리터의 500mM EDTA가 마그네슘을 킬레이팅하기 위해 최종 스페로플라스트 분획의 각 밀리리터에 대해 첨가된다(용해물 중 EDTA의 최종 농도는 10mM임). 옴니클리브 엔도뉴클레아제로 핵산의 가수분해 후, 용해물은 실질량의 모노뉴클레오타이드 또는 올리고뉴클레오타이드를 함유할 수 있다. 이들 분해 생성물의 존재는 용해물의 후속 처리에 영향을 줄 수 있으며, 예를 들어, 뉴클레오타이드는 수지와 상호작용에 의한 음이온 교환 수지의 결합능을 감소시킬 수 있다.
상기 프로토콜은 하기의 변형으로 전체 세포 단백질을 제조하는데 사용될 수 있다. 단계 2에서 펠렛화시킨 세포는 신선하거나 또는 냉동될 수 있고, 단계 4에서, 세포는 15분간 항온처리되며, 단계 5 내지 8은 생략되고, 단계 10에서, 3mL의 페리프렙스 용해 완충액은 본래 세포 펠렛 무게의 각 그램 당 첨가된다.
주변세포질, 또는 스페로플라스트, 또는 전체 세포 단백질 샘플의 제조 후, 샘플은 임의의 수많은 단백질 특징규명 및/또는 정량 방법으로 분석될 수 있다. 일례에서, 주변세포질 및 스페로플라스트 단백질의 성공적인 분획화는 SDS-PAGE를 통해서 주변세포질 및 스페로플라스트 분획의 분취물을 분석하여 확인하였다(2 마이크로리터의 각 분획이 일반적으로 쿠마시 브릴리언트 블루 염색에 의한 시각화에 충분함). 소정 분획에 고유한 단백질의 존재 또는 특정 단백질의 농축은 성공적인 분획화를 의미한다. 예를 들어, 숙주 세포가 암피실린 내성 마커를 갖는 고카피수 플라스미드를 함유하면, 주로 주변세포질 분획 내 β-락타마제(31.5 kDa)의 존재는 성공적인 분획화를 의미한다. 주변세포질 공간에 존재하는 다른 이. 콜라이 단백질은 알칼리 포스파타제(50 kDa) 및 연장 인자 Tu(43 kDa)를 포함한다. 소정 분획에 존재하는 단백질의 양은 임의의 많은 방법(예컨대 다른 방법들 중에서도, SDS-PAGE 및 염색 또는 표지된 단백질 밴드의 밀도계 분석, 방사능표지된 단백질의 섬광 계측, 효소-연결 면역흡착 검정법(ELISA), 또는 섬광 근접 검정법)을 이용해서 정량할 수 있다. 스페로플라스트 분획과 비교하여 주변세포질 분획에 존재하는 단백질 양의 비교는 단백질이 세포질에서 주변세포질로 유출되는 정도를 의미한다.
실시예 11
폴리뉴클레오타이드 또는 아미노산 서열 유사성의 결정
폴리뉴클레오타이드 서열 또는 아미노산 서열 동일성의 백분율은 정렬된 심볼, 즉 양쪽의 정렬된 서열에서 동일한, 뉴클레오타이드 또는 아미노산의 개수를 갭을 포함하여, 2개 서열의 정렬에서 심볼의 총 개수로 나눈 것으로 정의된다. 2개 서열 간 유사성 정도(동일성 비율)은 웹사이트 blast.ncbi.nlm.nih.gov/Blast.cgi를 통해 이용할 수 있는 니들만-분치 글로벌 서열 정렬 도구(Needleman-Wunsch Global Sequence Alignment Tool)로 미국립 생명공학 정보 센터(NCBI)에서 실행하여, 니들만 및 분치의 글로벌 정렬 방법(J. Mol. Biol. 48:443, 1970)을 사용한 서열 정렬을 통해 결정할 수 있다. 일 실시형태에서, 니들만 및 분치 정렬 매개변수는 디폴트 값으로 설정된다(각각 2 및 -3의 일치/비일치 점수, 및 각각 5 및 2의 존재 및 연장에 대한 갭 비용). 서열 비교의 당업자가 사용하는 다른 프로그램을 또한 사용하여, 서열을 정렬시킬 수 있으며, 예컨대, 예를 들어 blast.ncbi.nlm.nih.gov/Blast.cgi 웹사이트에 기술된 디폴트 매개변수 설정을 이용해서, NCBI에서 실행하는, 기본 국소 정렬 검색 도구 또는 블라스트(BLAST)(등록상표) 프로그램(Altschul et al., "Basic local alignment search tool", J Mol Biol 1990 Oct 5; 215(3): 403-410)이 있다. 블라스트 알고리즘은 다음과 같이 사용할 수 있는 2가지를 포함한 다수 선택 매개변수를 갖는다: (A) 낮은 조성 복잡성을 갖는 문의 서열의 절편 또는 바람직하게 이용하지 않거나 또는 '오프'로 설정된, 짧은-주기성 내부 반복부로 이루어진 절편을 차폐하기 위한 필터의 포함, 및 (B) '예상치' 또는 E-점수라고 하는 데이터베이스 서열에 대한 일치를 보고하기 위한 통계적 유의성 한계치(예상되는 일치 확률이 단지 우연으로 존재하고, 일치에 할당된 통계적 유의성이 E-점수 한계치보다 크면, 그 일치는 보고되지 않음). 이러한 '예상치' 또는 E-점수값이 디폴트 값(10)으로부터 조정되면, 바람직한 한계치 값은 0.5, 또는 높은 선호도 순으로 0.25, 0.1, 0.05, 0.01, 0.001, 0.0001, 0.00001, 및 0.000001이다.
본 발명을 실시하는데 있어서, 분자 생물학, 미생물학, 및 재조합 DNA 기술의 많은 통상의 기술이 선택적으로 사용된다. 그러한 통상의 기술은 벡터, 숙주 세포, 및 재조합 방법에 관한 것이다. 이들 기술은 잘 알려져 있고, 예를 들어, 하기 문헌들에 잘 설명되어 있다: [Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Mc, San Diego, CA]; [Sambrook et al., Molecular Cloning-A Laboratory Manual(3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2000]; 및 [Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.,(supplemented through 2006)]. 예를 들어 세포 단리 및 배양 및 후속 핵산 또는 단백질 단리에 관해 유용한 다른 참고 문헌은 다음의 문헌들을 포함한다: [Freshney(1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York] 및 이에 인용된 참고 문헌; [Payne et al.(1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY]; [Gamborg and Phillips(Eds.)(1995) Plant Cell, Tissue and Organ Culture]; [Fundamental Methods Springer Lab Manual, Springer- Verlag(Berlin Heidelberg New York)]; 및 [Atlas and Parks(Eds.) The Handbook of Microbiological Media(1993) CRC Press, Boca Raton, FL]. 핵산 제조 방법(예를 들어, 시험관내 증폭, 세포로부터 정제, 또는 화학 합성), 핵산 조작 방법(예를 들어, 부위 지정 돌연변이유발법, 제한효소 분해, 결찰 등), 및 핵산의 조작 및 제조에 유용한 다양한 벡터, 세포주 등이 상기 참조문헌에 기술되어 있다. 또한, 본질적으로 임의의 폴리뉴클레오타이드(표지되거나 또는 바이오틴화된 폴리뉴클레오타이드 포함)는 다양한 상업적 공급처로부터 맞춤 또는 표준 주문할 수 있다.
본 발명은 본 발명의 실시를 위한 일정 방식을 포함하는 것으로 확인되거나 또는 제안된 특정 실시형태에 대해 기술되었다. 본원의 관점에서, 본 발명의 의도하는 범주를 벗어나지 않고 예시된 특정 실시형태에 많은 변형 및 변화가 가해질 수 있다는 것은 당업자가 이해할 것이다.
특허 공개를 포함하는, 모든 인용된 참조문헌은 그들 전체로 참고로 본 명세서에 편입된다. 공개된 게놈 위치 또는 다른 설명에서 언급된 뉴클레오타이드 및 다른 유전자 서열이 또한 명백하게 참고로 본 명세서에 편입된다.
서열목록에 표시된 서열
SEQUENCE LISTING
<110> AbSci, LLC
McClain, Sean
Valasek, Mark
Barish, Philip
Minshull, Jeremy
<120> VECTORS FOR USE IN AN INDUCIBLE COEXPRESSION SYSTEM
<130> AbSci-01PCT2
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> J23104 promoter
<400> 1
ttgacagcta gctcagtcct aggtattgtg ctagc 35
<210> 2
<211> 5883
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression vector pPRO43
<400> 2
atcgatttag cttttcagac gacgccaaaa ggtcgtacgt gaaataccca aatagttggc 60
cgcagccgtc ttgtcaccat taaacttctc aagcgcttgc tgcggggtca gcaaacgcgg 120
agccggcgtc tttgcgctct cacgcgccag ctccggcagc agcaactgca tgaattgcgg 180
agtcagatcc ggggtcggct caacggacag gaacagcgcc aggcgttcca tcatattacg 240
cagctcgcgg atgttacccg gccagtcata atgcagcagc accgtttcgc tcgcctgcag 300
accctggcgc agtgccgcag agaacggtgc gctcagggct gccagcgaga ctttcaggaa 360
agactccgcc agcggtaaaa tgtcggcgac acgttcacgc aacggcggga gctgcagacg 420
cagaatgctc aggcggtaga acaggtcgcg acgaaaacgg ccctgttgca tatcctcttc 480
cagattgcag tgggtcgcgc taatcacgcg cacgtctacc ggaaccggtt gatgaccacc 540
gacgcgggtc acttctttct cttccagcac acgcagcaga cgggtttgca atggcagcgg 600
catctcaccg atctcgtcca ggaacaaggt gccgccgtgg gcaatttcaa acaaaccagc 660
acggccaccg cgacggctac ccgtgaatgc gccctcttcg tagccaaaca gctcagcttc 720
cagcaggctt tccgcgattg caccgcaatt aactgccaca aacggatgag atttcttacc 780
ctggcgggca tcgtgacggg cgaaatactc acgatggatt gcttgcgcag ccagttcctt 840
acccgtacca gtctcgcctt cgatcagaac agccgcgctg ctacgtgcat acagcagaat 900
ggtctggcga acttgctcca tttgagggct ttggcccagc atatcaccca ggacataacg 960
ggtacgcagc gcattacgcg tcgcatcgtg ggtgttgtgg cgcaggctca ttctggtcat 1020
gtccagggcg tcgctgaacg cctgacgcac cgttgccgcg ctgtagataa agatgcccgt 1080
catgcccgct tcttcggcca agtccgtgat cagacccgca ccaaccacag cctcggtacc 1140
gttcgctttc agttcgttga tctggccacg tgcatcttcc tcggtaatgt agctgcgttg 1200
gtccaggcgc agattaaagg tcttttgaaa cgcgaccagc gcagggatcg tttcctggta 1260
ggtgacaacg ccaatcgagg aggtcagttt gcctgccttc gccagcgcct gcaagacatc 1320
gtaaccgctc ggcttaatca ggatcaccgg cacggacaga cgggatttca ggtaggcacc 1380
attgctaccc gctgcgataa tggcgtcaca acgctcgttg gccagctttt tgcgaatgta 1440
ggtaacggct ttctcgaaac ccagctgaat cggagtgatg ttcgccaggt gatcaaactc 1500
caggctaatg tcgcggaaca actcgaacag acgggtgacg ctaacggtcc aaataactgg 1560
tttatcatcg ttcaaacgcg gtgggtgtgc catggtgaat acctcctgtt aagaaaccga 1620
atattgggtt taaacttgtt tcataattgt tgcaatgaaa cgcggtgaaa cattgcctga 1680
aacgttaact gaaacgcata tttgcggatt agttcatgac tttatctcta acaaattgaa 1740
attaaacatt taattttatt aaggcaattg tggcacaccc cttgctttgt ctttatcaac 1800
gcaaataaca agttgataac aagctagcga attcgagctc ggtacccggg gatcctctag 1860
agtcgacctg caggcatgca agcttggctg ttttggcgga tgagagaaga ttttcagcct 1920
gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 1980
tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 2040
tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 2100
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 2160
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 2220
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 2280
cggatggcct ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat 2340
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 2400
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 2460
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 2520
gcagcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 2580
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 2640
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 2700
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 2760
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 2820
tgtcagacca agtttactca tatatacttt agattgattt acgcgccctg tagcggcgca 2880
ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 2940
gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 3000
caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 3060
cccaaaaaac ttgatttggg tgatggttca cgtagtgggc catcgccctg atagacggtt 3120
tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 3180
acaacactca accctatctc gggctattct tttgatttat aagggatttt gccgatttcg 3240
gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 3300
ttaacgttta caatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 3360
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 3420
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 3480
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 3540
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 3600
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 3660
caggcatttg agaagcacac ggtcacactg cttccggtag tcaataaacc ggtaaaccag 3720
caatagacat aagcggctat ttaacgaccc tgccctgaac cgacgaccgg gtcgaatttg 3780
ctttcgaatt tctgccattc atccgcttat tatcacttat tcaggcgtag caaccaggcg 3840
tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 3900
actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg gcatgatgaa 3960
cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 4020
aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 4080
cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 4140
ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 4200
cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 4260
aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cggaattccg 4320
gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 4380
ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 4440
attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 4500
cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 4560
ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 4620
ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 4680
cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgg 4740
cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga 4800
ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac tgacggggtg 4860
gtgcgtaacg gcaaaagcac cgccggacat cagcgctagt agcggagtgt atactggctt 4920
actatgttgg cactgatgag ggtgtcagtg aagtgcttca tgtggcagga gaaaaaaggc 4980
tgcaccggtg cgtcagcaga atatgtgata caggatatat tccgcttcct cgctcactga 5040
ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg gcttacgaac ggggcggaga 5100
tttcctggaa gatgccagga agatacttaa cagggaagtg agagggccgc ggcaaagccg 5160
tttttccata ggctccgccc ccctgacaag catcacgaaa tctgacgctc aaatcagtgg 5220
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggcgg ctccctcgtg 5280
cgctctcctg ttcctgcctt tcggtttacc ggtgtcattc cgctgttatg gccgcgtttg 5340
tctcattcca cgcctgacac tcagttccgg gtaggcagtt cgctccaagc tggactgtat 5400
gcacgaaccc cccgttcagt ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 5460
caacccggaa agacatgcaa aagcaccact ggcagcagcc actggtaatt gatttagagg 5520
agttagtctt gaagtcatgc gccggttaag gctaaactga aaggacaagt tttggtgact 5580
gcgctcctcc aagccagtta cctcggttca aagagttggt agctcagaga accttcgaaa 5640
aaccgccctg caaggcggtt ttttcgtttt cagagcaaga gattacgcgc agaccaaaac 5700
gatctcaaga agatcatctt attaatcaga taaaatattt gctcatgagc ccgaagtggc 5760
gagcccgatc ttccccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg 5820
cgccggtgat gccggccacg atgcgtccgg cgtagaggat ctgctcatgt ttgacagctt 5880
atc 5883
<210> 3
<211> 5882
<212> DNA
<213> Artificial Sequence
<220>
<223> pPRO33 vector
<400> 3
atcgattcag cttttcagcc gccgccagaa cgtcgtccgg ctgatgccta aataattcgc 60
cgctgctgtt ttatcgccat taaatttctc cagtgcctgt tgtggtgtca gtaagcgtgg 120
agcgggagtt ttcgccgact cgcgcgccag ttccggcagt agcagttgca taaactgcgg 180
cgttaaatcc ggcgtcggtt ccacacttaa aaacagcgcc agtcgttcca tcatattgcg 240
cagttcacga atattgcctg gccagtcgta gtgcagcagc acagtttcac ttgcctgtaa 300
cccctggcgt aatgcagcag aaaatggggc ggagagcgcc gccagagaca ctttcaaaaa 360
gctttccgcc agcggaagaa tatccgccac ccgctcgcgc agtggtggca attgcagacg 420
caaaatactc agccgataaa acagatcacg gcgaaaacgt ccttgctgca tatcttcttc 480
cagattgcag tgagtggcgc taatgacccg tacatctacc ggaacaggct gatgcccgcc 540
gacgcgggtg acctcttttt cttccagcac ccgcagcagc cgggtctgca aaggtagcgg 600
catttcgcca atctcatcca gaaacagcgt accgccgtgg gcaatttcga acagcccggc 660
gcgacctccg cgtcgcgagc cggtaaacgc cccttcctca tagccaaaca gttctgcttc 720
cagcagcgat tcggcaatcg ccccgcagtt gacggcaaca aacggatgcg actttttgcc 780
ctgtcgcgca tcgtggcggg caaaatattc ccgatgaatc gcctgggccg ccagctcttt 840
gcccgtcccc gtttccccct caatcaacac cgccgcactg gagcgggcat acagcaaaat 900
agtctgccgt acttgttcca tctgtggtga ttgaccgagc atatcgccca gcacgtaacg 960
agtacgcagg gcgttgcggg tggcatcgtg agtgttatgg cgtaacgaca tgcgcgtcat 1020
atccagcgca tcgctgaacg cctggcgcac ggtggcggcg gaatagataa aaattccggt 1080
cattccggct tcttctgcca aatcggtaat cagccctgcg ccgaccaccg cttcggtgcc 1140
gttagctttt agctcgttaa tctgcccgcg tgcgtcttcc tcggtaatgt agctacgttg 1200
gtcgaggcgc aaattaaagg ttttttgaaa cgccaccagc gctggaatgg tttcctgata 1260
ggtgacaacg ccgatagaag aggtgagttt tccggctttt gccagtgcct gtaacacatc 1320
gtagccgctc ggtttaatca aaataactgg cactgacagg cggcttttca ggtacgcgcc 1380
gttagagcca gccgcgatga tggcgtcaca gcgttcgttt gccagtttct tgcggatgta 1440
ggtcactgct ttttcaaagc caagctgaat aggggtaatg ttcgccaggt gatcaaactc 1500
gaggctgata tcgcgaaaca gctcgaacag gcgcgttaca gataccgtcc agataaccgg 1560
tttgtcgtca ttaagccgtg gtggatgtgc catagcgcac cgcaaagtta agaaaccgaa 1620
tattgggttt agtcttgttt cataattgtt gcaatgaaac gcggtgaaac attgcctgaa 1680
acgttaactg aaacgcatat ttgcggatta gttcatgact ttatctctaa caaattgaaa 1740
ttaaacattt aattttatta aggcaattgt ggcacacccc ttgctttgtc tttatcaacg 1800
caaataacaa gttgataaca agctagcgaa ttcgagctcg gtacccgggg atcctctaga 1860
gtcgacctgc aggcatgcaa gcttggctgt tttggcggat gagagaagat tttcagcctg 1920
atacagatta aatcagaacg cagaagcggt ctgataaaac agaatttgcc tggcggcagt 1980
agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 2040
ggtagtgtgg ggtctcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 2100
ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct 2160
gagtaggaca aatccgccgg gagcggattt gaacgttgcg aagcaacggc ccggagggtg 2220
gcgggcagga cgcccgccat aaactgccag gcatcaaatt aagcagaagg ccatcctgac 2280
ggatggcctt tttgcgtttc tacaaactct tttgtttatt tttctaaata cattcaaata 2340
tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 2400
gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 2460
ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 2520
cagcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 2580
gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 2640
tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 2700
gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 2760
ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 2820
gtcagaccaa gtttactcat atatacttta gattgattta cgcgccctgt agcggcgcat 2880
taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag 2940
cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc 3000
aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc 3060
ccaaaaaact tgatttgggt gatggttcac gtagtgggcc atcgccctga tagacggttt 3120
ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa 3180
caacactcaa ccctatctcg ggctattctt ttgatttata agggattttg ccgatttcgg 3240
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 3300
taacgtttac aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 3360
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 3420
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 3480
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 3540
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 3600
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtc 3660
aggcatttga gaagcacacg gtcacactgc ttccggtagt caataaaccg gtaaaccagc 3720
aatagacata agcggctatt taacgaccct gccctgaacc gacgaccggg tcgaatttgc 3780
tttcgaattt ctgccattca tccgcttatt atcacttatt caggcgtagc aaccaggcgt 3840
ttaagggcac caataactgc cttaaaaaaa ttacgccccg ccctgccact catcgcagta 3900
ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacaaacgg catgatgaac 3960
ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatggtgaa 4020
aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 4080
ccagggattg gctgagacga aaaacatatt ctcaataaac cctttaggga aataggccag 4140
gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 4200
gtggtattca ctccagagcg atgaaaacgt ttcagtttgc tcatggaaaa cggtgtaaca 4260
agggtgaaca ctatcccata tcaccagctc accgtctttc attgccatac ggaattccgg 4320
atgagcattc atcaggcggg caagaatgtg aataaaggcc ggataaaact tgtgcttatt 4380
tttctttacg gtctttaaaa aggccgtaat atccagctga acggtctggt tataggtaca 4440
ttgagcaact gactgaaatg cctcaaaatg ttctttacga tgccattggg atatatcaac 4500
ggtggtatat ccagtgattt ttttctccat tttagcttcc ttagctcctg aaaatctcga 4560
taactcaaaa aatacgcccg gtagtgatct tatttcatta tggtgaaagt tggaacctct 4620
tacgtgccga tcaacgtctc attttcgcca aaagttggcc cagggcttcc cggtatcaac 4680
agggacacca ggatttattt attctgcgaa gtgatcttcc gtcacaggta tttattcggc 4740
gcaaagtgcg tcgggtgatg ctgccaactt actgatttag tgtatgatgg tgtttttgag 4800
gtgctccagt ggcttctgtt tctatcagct gtccctcctg ttcagctact gacggggtgg 4860
tgcgtaacgg caaaagcacc gccggacatc agcgctagta gcggagtgta tactggctta 4920
ctatgttggc actgatgagg gtgtcagtga agtgcttcat gtggcaggag aaaaaaggct 4980
gcaccggtgc gtcagcagaa tatgtgatac aggatatatt ccgcttcctc gctcactgac 5040
tcgctacgct cggtcgttcg actgcggcga gcggaaatgg cttacgaacg gggcggagat 5100
ttcctggaag atgccaggaa gatacttaac agggaagtga gagggccgcg gcaaagccgt 5160
ttttccatag gctccgcccc cctgacaagc atcacgaaat ctgacgctca aatcagtggt 5220
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggcggc tccctcgtgc 5280
gctctcctgt tcctgccttt cggtttaccg gtgtcattcc gctgttatgg ccgcgtttgt 5340
ctcattccac gcctgacact cagttccggg taggcagttc gctccaagct ggactgtatg 5400
cacgaacccc ccgttcagtc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5460
aacccggaaa gacatgcaaa agcaccactg gcagcagcca ctggtaattg atttagagga 5520
gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa aggacaagtt ttggtgactg 5580
cgctcctcca agccagttac ctcggttcaa agagttggta gctcagagaa ccttcgaaaa 5640
accgccctgc aaggcggttt tttcgttttc agagcaagag attacgcgca gaccaaaacg 5700
atctcaagaa gatcatctta ttaatcagat aaaatatttg ctcatgagcc cgaagtggcg 5760
agcccgatct tccccatcgg tgatgtcggc gatataggcg ccagcaaccg cacctgtggc 5820
gccggtgatg ccggccacga tgcgtccggc gtagaggatc tgctcatgtt tgacagctta 5880
tc 5882
<210> 4
<211> 3698
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression vector pPRO430
<400> 4
ccccagaggc aggtctagcg gagtgtatac tggcttacta tgttggcact gatgagggtg 60
tcagtgaagt gcttcatgtg gcaggagaaa aaaggctgca ccggtgcgtc agcagaatat 120
gtgatacagg atatattccg cttcctcgct cactgactcg ctacgctcgg tcgttcgact 180
gcggcgagcg gaaatggctt acgaacgggg cggagatttc ctggaagatg ccaggaagat 240
acttaacagg gaagtgagag ggccgcggca aagccgtttt tccataggct ccgcccccct 300
gacaagcatc acgaaatctg acgctcaaat cagtggtggc gaaacccgac aggactataa 360
agataccagg cgtttccccc tggcggctcc ctcgtgcgct ctcctgttcc tgcctttcgg 420
tttaccggtg tcattccgct gttatggccg cgtttgtctc attccacgcc tgacactcag 480
ttccgggtag gcagttcgct ccaagctgga ctgtatgcac gaaccccccg ttcagtccga 540
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggaaagac atgcaaaagc 600
accactggca gcagccactg gtaattgatt tagaggagtt agtcttgaag tcatgcgccg 660
gttaaggcta aactgaaagg acaagttttg gtgactgcgc tcctccaagc cagttacctc 720
ggttcaaaga gttggtagct cagagaacct tcgaaaaacc gccctgcaag gcggtttttt 780
cgttttcaga gcaagagatt acgcgcagac caaaacgatc tcaagaagat catcttatta 840
aacctgcctc taaaaacttt tattacgccc cgccctgcca ctcatcgcag tactgttgta 900
attcattaag cattctgccg acatggaagc catcacagac ggcatgatga acctgaatcg 960
ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatagtg aaaacggggg 1020
cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc acccagggat 1080
tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc aggttttcac 1140
cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt 1200
cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa 1260
cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc ggatgagcat 1320
tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta 1380
cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 1440
ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 1500
atccagtgat ttttttctcc atcatattct tcctttttca atattattga agcatttatc 1560
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 1620
gggtcagtgt tacaaccaat taaccaattc tgatctcctg ttagtgaggg ttaatgcccg 1680
gaacgaagaa aggcccaccc gtgaaggtga gccagtgagt tggttacatt ttctcttgag 1740
ggtttagctt ttcagacgac gccaaaaggt cgtacgtgaa atacccaaat agttggccgc 1800
agccgtcttg tcaccattaa acttctcaag cgcttgctgc ggggtcagca aacgcggagc 1860
cggcgtcttt gcgctctcac gcgccagctc cggcagcagc aactgcatga attgcggagt 1920
cagatccggg gtcggctcaa cggacaggaa cagcgccagg cgttccatca tattacgcag 1980
ctcgcggatg ttacccggcc agtcataatg cagcagcacc gtttcgctcg cctgcagacc 2040
ctggcgcagt gccgcagaga acggtgcgct cagggctgcc agcgagactt tcaggaaaga 2100
ctccgccagc ggtaaaatgt cggcgacacg ttcacgcaac ggcgggagct gcagacgcag 2160
aatgctcagg cggtagaaca ggtcgcgacg aaaacggccc tgttgcatat cctcttccag 2220
attgcagtgg gtcgcgctaa tcacgcgcac gtctaccgga accggttgat gaccaccgac 2280
gcgggtcact tctttctctt ccagcacacg cagcagacgg gtttgcaatg gcagcggcat 2340
ctcaccgatc tcgtccagga acaaggtgcc gccgtgggca atttcaaaca aaccagcacg 2400
gccaccgcga cggctacccg tgaatgcgcc ctcttcgtag ccaaacagct cagcttccag 2460
caggctttcc gcgattgcac cgcaattaac tgccacaaac ggatgagatt tcttaccctg 2520
gcgggcatcg tgacgggcga aatactcacg atggattgct tgcgcagcca gttccttacc 2580
cgtaccagtc tcgccttcga tcagaacagc cgcgctgcta cgtgcataca gcagaatggt 2640
ctggcgaact tgctccattt gagggctttg gcccagcata tcacccagga cataacgggt 2700
acgcagcgca ttacgcgtcg catcgtgggt gttgtggcgc aggctcattc tggtcatgtc 2760
cagggcgtcg ctgaacgcct gacgcaccgt tgccgcgctg tagataaaga tgcccgtcat 2820
gcccgcttct tcggccaagt ccgtgatcag acccgcacca accacagcct cggtaccgtt 2880
cgctttcagt tcgttgatct ggccacgtgc atcttcctcg gtaatgtagc tgcgttggtc 2940
caggcgcaga ttaaaggtct tttgaaacgc gaccagcgca gggatcgttt cctggtaggt 3000
gacaacgcca atcgaggagg tcagtttgcc tgccttcgcc agcgcctgca agacatcgta 3060
accgctcggc ttaatcagga tcaccggcac ggacagacgg gatttcaggt aggcaccatt 3120
gctacccgct gcgataatgg cgtcacaacg ctcgttggcc agctttttgc gaatgtaggt 3180
aacggctttc tcgaaaccca gctgaatcgg agtgatgttc gccaggtgat caaactccag 3240
gctaatgtcg cggaacaact cgaacagacg ggtgacgcta acggtccaaa taactggttt 3300
atcatcgttc aaacgcggtg ggtgtgccat ggtgaatacc tcctgttaag aaaccgaata 3360
ttgggtttaa acttgtttca taattgttgc aatgaaacgc ggtgaaacat tgcctgaaac 3420
gttaactgaa acgcatattt gcggattagt tcatgacttt atctctaaca aattgaaatt 3480
aaacatttaa ttttattaag gcaattgtgg cacacccctt gctttgtctt tatcaacgca 3540
aataacaagt tgataacaaa agcttaggag gaaaacatag agaccggtct ctctcgagta 3600
actagttgat agagatcaag ccttaacgaa ctaagacccc cgcaccgaaa ggtccggggg 3660
ttttttttga ccttaaaaac ataaccgagg agcagaca 3698
<210> 5
<211> 3610
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression vector pPRO430(CloDF13)
<400> 5
ccccagaggc aggtgcgctg cggacacata caaagttacc cacagattcc gtggataagc 60
aggggactaa catgtgaggc aaaacagcag ggccgcgccg gtggcgtttt tccataggct 120
ccgccctcct gccagagttc acataaacag acgcttttcc ggtgcatctg tgggagccgt 180
gaggctcaac catgaatctg acagtacggg cgaaacccga caggacttaa agatccccac 240
cgtttccggc gggtcgctcc ctcttgcgct ctcctgttcc gaccctgccg tttaccggat 300
acctgttccg cctttctccc ttacgggaag tgtggcgctt tctcatagct cacacactgg 360
tatctcggct cggtgtaggt cgttcgctcc aagctgggct gtaagcaaga actccccgtt 420
cagcccgact gctgcgcctt atccggtaac tgttcacttg agtccaaccc ggaaaagcac 480
ggtaaaacgc cactggcagc agccattggt aactgggagt tcgcagagga tttgtttagc 540
taaacacgcg gttgctcttg aagtgtgcgc caaagtccgg ctacactgga aggacagatt 600
tggttgctgt gctctgcgaa agccagttac cacggttaag cagttcccca actgacttaa 660
ccttcgatca aaccacctcc ccaggtggtt ttttcgttta cagggcaaaa gattacgcgc 720
agaaaaaaag gatctcaaga agatcctttg atcacctgcc tctaaaaact tttattacgc 780
cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 840
gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 900
cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 960
taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 1020
aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 1080
gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 1140
ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 1200
tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 1260
ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 1320
ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 1380
acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccatcatatt 1440
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 1500
atttgaatgt atttagaaaa ataaacaaat aggggtcagt gttacaacca attaaccaat 1560
tctgatctcc tgttagtgag ggttaatgcc cggaacgaag aaaggcccac ccgtgaaggt 1620
gagccagtga gttggttaca ttttctcttg agggtttagc ttttcagacg acgccaaaag 1680
gtcgtacgtg aaatacccaa atagttggcc gcagccgtct tgtcaccatt aaacttctca 1740
agcgcttgct gcggggtcag caaacgcgga gccggcgtct ttgcgctctc acgcgccagc 1800
tccggcagca gcaactgcat gaattgcgga gtcagatccg gggtcggctc aacggacagg 1860
aacagcgcca ggcgttccat catattacgc agctcgcgga tgttacccgg ccagtcataa 1920
tgcagcagca ccgtttcgct cgcctgcaga ccctggcgca gtgccgcaga gaacggtgcg 1980
ctcagggctg ccagcgagac tttcaggaaa gactccgcca gcggtaaaat gtcggcgaca 2040
cgttcacgca acggcgggag ctgcagacgc agaatgctca ggcggtagaa caggtcgcga 2100
cgaaaacggc cctgttgcat atcctcttcc agattgcagt gggtcgcgct aatcacgcgc 2160
acgtctaccg gaaccggttg atgaccaccg acgcgggtca cttctttctc ttccagcaca 2220
cgcagcagac gggtttgcaa tggcagcggc atctcaccga tctcgtccag gaacaaggtg 2280
ccgccgtggg caatttcaaa caaaccagca cggccaccgc gacggctacc cgtgaatgcg 2340
ccctcttcgt agccaaacag ctcagcttcc agcaggcttt ccgcgattgc accgcaatta 2400
actgccacaa acggatgaga tttcttaccc tggcgggcat cgtgacgggc gaaatactca 2460
cgatggattg cttgcgcagc cagttcctta cccgtaccag tctcgccttc gatcagaaca 2520
gccgcgctgc tacgtgcata cagcagaatg gtctggcgaa cttgctccat ttgagggctt 2580
tggcccagca tatcacccag gacataacgg gtacgcagcg cattacgcgt cgcatcgtgg 2640
gtgttgtggc gcaggctcat tctggtcatg tccagggcgt cgctgaacgc ctgacgcacc 2700
gttgccgcgc tgtagataaa gatgcccgtc atgcccgctt cttcggccaa gtccgtgatc 2760
agacccgcac caaccacagc ctcggtaccg ttcgctttca gttcgttgat ctggccacgt 2820
gcatcttcct cggtaatgta gctgcgttgg tccaggcgca gattaaaggt cttttgaaac 2880
gcgaccagcg cagggatcgt ttcctggtag gtgacaacgc caatcgagga ggtcagtttg 2940
cctgccttcg ccagcgcctg caagacatcg taaccgctcg gcttaatcag gatcaccggc 3000
acggacagac gggatttcag gtaggcacca ttgctacccg ctgcgataat ggcgtcacaa 3060
cgctcgttgg ccagcttttt gcgaatgtag gtaacggctt tctcgaaacc cagctgaatc 3120
ggagtgatgt tcgccaggtg atcaaactcc aggctaatgt cgcggaacaa ctcgaacaga 3180
cgggtgacgc taacggtcca aataactggt ttatcatcgt tcaaacgcgg tgggtgtgcc 3240
atggtgaata cctcctgtta agaaaccgaa tattgggttt aaacttgttt cataattgtt 3300
gcaatgaaac gcggtgaaac attgcctgaa acgttaactg aaacgcatat ttgcggatta 3360
gttcatgact ttatctctaa caaattgaaa ttaaacattt aattttatta aggcaattgt 3420
ggcacacccc ttgctttgtc tttatcaacg caaataacaa gttgataaca aaagcttagg 3480
aggaaaacat agagaccggt ctctctcgag taactagttg atagagatca agccttaacg 3540
aactaagacc cccgcaccga aaggtccggg ggtttttttt gaccttaaaa acataaccga 3600
ggagcagaca 3610
<210> 6
<211> 3255
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression vector pBAD240
<400> 6
ggcctttctt cggtagaaac cccgagagca ggtatcaaag gatcttcttg agatcctttt 60
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 120
ttgccggatc aagagctacc aactcttttt ccgaggtaac tggcttcagc agagcgcaga 180
taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 240
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 300
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 360
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 420
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 480
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 540
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag catcgatttt 600
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgca gaaaggccca 660
cccgaaggtg agccaggtga ttacatttgg gccctcatca gaggttttca ccgtcatcac 720
cgaaacgcgc gaggcagctg cggtaaagct catcagcgtg gtcgtgaagc gattcacaga 780
tgtctgcctg ttcatccgcg tccagctcgt tgagtttctc cagaagcgtt aatgtctggc 840
ttctgataaa gcgggccatg ttaagggcgg ttttttcctg tttggtcata cctgcttaga 900
aaaactcatc gagcatcaag tgaaactgca atttattcat atcaggatta tcaataccat 960
atttttgaaa aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga 1020
tggcaagatc ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta 1080
atttcccctc gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat 1140
ccggtgagaa tggcaaaagc ttatgcattt ctttccagac ttgttcaaca ggccagccat 1200
tacgctcgtc atcaaaatca ctcgcaccaa ccaaaccgtt attcattcgt gattgcgcct 1260
gagcgagacg aaatacgcga tcgccgttaa aaggacaatt acaaacagga atcgaatgca 1320
accggcgcag gaacactgcc agcgcatcaa caatattttc acctgaatca ggatattctt 1380
ctaatacctg gaatgctgtt ttccctggga tcgcagtggt gagtaaccat gcatcatcag 1440
gagtacggat aaaatgcttg atggtcggaa gaggcataaa ttccgtcagc cagtttagcc 1500
tgaccatctc atctgtaaca tcattggcaa cgctaccttt gccatgtttc agaaacaact 1560
ctggcgcatc gggcttccca tacaatcgat agattgtcgc acctgattgc ccgacattat 1620
cgcgagccca tttataccca tataaatcag catccatgtt ggaatttaat cgcggcctcg 1680
agcaagacgt ttcccgttga atatggctca tagctcctga aaatctcgat aactcaaaaa 1740
atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat 1800
caagtcaaaa gcctccgcgg gagagtgttc accgacaaac aacagataaa acaaaaggcc 1860
cagtcttccg actgagcctt ttgttttatt tgatgtctgg cagttcccga gacgttatga 1920
caacttgacg gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct 1980
ggccccggtg cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt 2040
gcgaccgacg gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat 2100
acgttggtcc tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga 2160
cagacgcgac ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc 2220
tgccaggtga tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg 2280
gagcgactcg ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc 2340
cagcagctcc gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc 2400
gctgaaatgc ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga 2460
cggccagtta agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata 2520
ccattcgcga gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa 2580
aatatcaccc ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg 2640
aatggtgaga ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag 2700
ataaccgttg gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc 2760
cggcagcagg ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga 2820
agaaaccaat tgtccatatt gcatcagaca ttgccgtctc tgcgtctttt actggctctt 2880
ctcgctaacc aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa 2940
agccatgaca aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga 3000
ttatttgcac ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga 3060
tcctacctga cgctttttat cgcaactctc tactgtttct ccatacccgt ttttttgggc 3120
tagcaggagg taaaaaaaat gtgagaccgg tctcggtcta gataactagt tgatcggtca 3180
gtttcacctg atttacgtaa aaacccgctt cggcgggttt ttgcttttgg aggggcagaa 3240
agatgaatga ctgtc 3255
<210> 7
<211> 5802
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression vector pPRO44
<400> 7
atcgatttag cttttcagac gacgccaaaa ggtcgtacgt gaaataccca aatagttggc 60
cgcagccgtc ttgtcaccat taaacttctc aagcgcttgc tgcggggtca gcaaacgcgg 120
agccggcgtc tttgcgctct cacgcgccag ctccggcagc agcaactgca tgaattgcgg 180
agtcagatcc ggggtcggct caacggacag gaacagcgcc aggcgttcca tcatattacg 240
cagctcgcgg atgttacccg gccagtcata atgcagcagc accgtttcgc tcgcctgcag 300
accctggcgc agtgccgcag agaacggtgc gctcagggct gccagcgaga ctttcaggaa 360
agactccgcc agcggtaaaa tgtcggcgac acgttcacgc aacggcggga gctgcagacg 420
cagaatgctc aggcggtaga acaggtcgcg acgaaaacgg ccctgttgca tatcctcttc 480
cagattgcag tgggtcgcgc taatcacgcg cacgtctacc ggaaccggtt gatgaccacc 540
gacgcgggtc acttctttct cttccagcac acgcagcaga cgggtttgca atggcagcgg 600
catctcaccg atctcgtcca ggaacaaggt gccgccgtgg gcaatttcaa acaaaccagc 660
acggccaccg cgacggctac ccgtgaatgc gccctcttcg tagccaaaca gctcagcttc 720
cagcaggctt tccgcgattg caccgcaatt aactgccaca aacggatgag atttcttacc 780
ctggcgggca tcgtgacggg cgaaatactc acgatggatt gcttgcgcag ccagttcctt 840
acccgtacca gtctcgcctt cgatcagaac agccgcgctg ctacgtgcat acagcagaat 900
ggtctggcga acttgctcca tttgagggct ttggcccagc atatcaccca ggacataacg 960
ggtacgcagc gcattacgcg tcgcatcgtg ggtgttgtgg cgcaggctca ttctggtcat 1020
gtccagggcg tcgctgaacg cctgacgcac cgttgccgcg ctgtagataa agatgcccgt 1080
catgcccgct tcttcggcca agtccgtgat cagacccgca ccaaccacag cctcggtacc 1140
gttcgctttc agttcgttga tctggccacg tgcatcttcc tcggtaatgt agctgcgttg 1200
gtccaggcgc agattaaagg tcttttgaaa cgcgaccagc gcagggatcg tttcctggta 1260
ggtgacaacg ccaatcgagg aggtcagttt gcctgccttc gccagcgcct gcaagacatc 1320
gtaaccgctc ggcttaatca ggatcaccgg cacggacaga cgggatttca ggtaggcacc 1380
attgctaccc gctgcgataa tggcgtcaca acgctcgttg gccagctttt tgcgaatgta 1440
ggtaacggct ttctcgaaac ccagctgaat cggagtgatg ttcgccaggt gatcaaactc 1500
caggctaatg tcgcggaaca actcgaacag acgggtgacg ctaacggtcc aaataactgg 1560
tttatcatcg ttcaaacgcg gtgggtgtgc catggtgaat acctcctgtt aagaaaccga 1620
atattgggtt taaacttgtt tcataattgt tgcaatgaaa cgcggtgaaa cattgcctga 1680
aacgttaact gaaacgcata tttgcggatt agttcatgac tttatctcta acaaattgaa 1740
attaaacatt taattttatt aaggcaattg tggcacaccc cttgctttgt ctttatcaac 1800
gcaaataaca agttgataac aagctagcga attcgagctc ggtacccggg gatcctctag 1860
agtcgacctg caggcatgca agcttggctg ttttggcgga tgagagaaga ttttcagcct 1920
gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 1980
tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 2040
tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 2100
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 2160
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 2220
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 2280
cggatggcct ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat 2340
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 2400
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 2460
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 2520
gcagcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 2580
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 2640
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 2700
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 2760
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 2820
tgtcagacca agtttactca tatatacttt agattgattt acgcgccctg tagcggcgca 2880
ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 2940
gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 3000
caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 3060
cccaaaaaac ttgatttggg tgatggttca cgtagtgggc catcgccctg atagacggtt 3120
tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 3180
acaacactca accctatctc gggctattct tttgatttat aagggatttt gccgatttcg 3240
gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 3300
ttaacgttta caatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 3360
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 3420
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 3480
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 3540
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 3600
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 3660
caggcatttg agaagcacac ggtcacactg cttccggtag tcaataaacc ggtaaaccag 3720
caatagacat aagcggctat ttaacgaccc tgccctgaac cgacgaccgg gtcgaatttg 3780
ctttcgaatt tctgccattc atccgcttat tatcacttat tcaggcgtag caaccaggcg 3840
tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 3900
actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg gcatgatgaa 3960
cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 4020
aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 4080
cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 4140
ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 4200
cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 4260
aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cggaattccg 4320
gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 4380
ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 4440
attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 4500
cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 4560
ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 4620
ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 4680
cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgg 4740
cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga 4800
ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac tgacggggtg 4860
gtgcgtaacg gcaaaagcac cgccggacat caactagtct tccgcttcct cgctcactga 4920
ctcgctacgc tcggtcgttc gactgcggcg agcggtgtca gctcactcaa aagcggtaat 4980
acggttatcc acagaatcag gggataaagc cggaaagaac atgtgagcaa aaagcaaagc 5040
accggaagaa gccaacgccg caggcgtttt tccataggct ccgcccccct gacgagcatc 5100
acaaaaatcg acgctcaagc cagaggtggc gaaacccgac aggactataa agataccagg 5160
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 5220
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgttggt 5280
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 5340
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 5400
acttatcgcc actggcagca gccattggta actgatttag aggactttgt cttgaagtta 5460
tgcacctgtt aaggctaaac tgaaagaaca gattttggtg agtgcggtcc tccaacccac 5520
ttaccttggt tcaaagagtt ggtagctcag cgaaccttga gaaaaccacc gttggtagcg 5580
gtggtttttc tttatttatg agatgatgaa tcaatcggtc tatcaagtca acgaacagct 5640
attccgttga cgtctatttg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg 5700
tgatgtcggc gatataggcg ccagcaaccg cacctgtggc gccggtgatg ccggccacga 5760
tgcgtccggc gtagaggatc tgctcatgtt tgacagctta tc 5802
<210> 8
<211> 5791
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression vector pPRO45
<400> 8
atcgatttag cttttcagac gacgccaaaa ggtcgtacgt gaaataccca aatagttggc 60
cgcagccgtc ttgtcaccat taaacttctc aagcgcttgc tgcggggtca gcaaacgcgg 120
agccggcgtc tttgcgctct cacgcgccag ctccggcagc agcaactgca tgaattgcgg 180
agtcagatcc ggggtcggct caacggacag gaacagcgcc aggcgttcca tcatattacg 240
cagctcgcgg atgttacccg gccagtcata atgcagcagc accgtttcgc tcgcctgcag 300
accctggcgc agtgccgcag agaacggtgc gctcagggct gccagcgaga ctttcaggaa 360
agactccgcc agcggtaaaa tgtcggcgac acgttcacgc aacggcggga gctgcagacg 420
cagaatgctc aggcggtaga acaggtcgcg acgaaaacgg ccctgttgca tatcctcttc 480
cagattgcag tgggtcgcgc taatcacgcg cacgtctacc ggaaccggtt gatgaccacc 540
gacgcgggtc acttctttct cttccagcac acgcagcaga cgggtttgca atggcagcgg 600
catctcaccg atctcgtcca ggaacaaggt gccgccgtgg gcaatttcaa acaaaccagc 660
acggccaccg cgacggctac ccgtgaatgc gccctcttcg tagccaaaca gctcagcttc 720
cagcaggctt tccgcgattg caccgcaatt aactgccaca aacggatgag atttcttacc 780
ctggcgggca tcgtgacggg cgaaatactc acgatggatt gcttgcgcag ccagttcctt 840
acccgtacca gtctcgcctt cgatcagaac agccgcgctg ctacgtgcat acagcagaat 900
ggtctggcga acttgctcca tttgagggct ttggcccagc atatcaccca ggacataacg 960
ggtacgcagc gcattacgcg tcgcatcgtg ggtgttgtgg cgcaggctca ttctggtcat 1020
gtccagggcg tcgctgaacg cctgacgcac cgttgccgcg ctgtagataa agatgcccgt 1080
catgcccgct tcttcggcca agtccgtgat cagacccgca ccaaccacag cctcggtacc 1140
gttcgctttc agttcgttga tctggccacg tgcatcttcc tcggtaatgt agctgcgttg 1200
gtccaggcgc agattaaagg tcttttgaaa cgcgaccagc gcagggatcg tttcctggta 1260
ggtgacaacg ccaatcgagg aggtcagttt gcctgccttc gccagcgcct gcaagacatc 1320
gtaaccgctc ggcttaatca ggatcaccgg cacggacaga cgggatttca ggtaggcacc 1380
attgctaccc gctgcgataa tggcgtcaca acgctcgttg gccagctttt tgcgaatgta 1440
ggtaacggct ttctcgaaac ccagctgaat cggagtgatg ttcgccaggt gatcaaactc 1500
caggctaatg tcgcggaaca actcgaacag acgggtgacg ctaacggtcc aaataactgg 1560
tttatcatcg ttcaaacgcg gtgggtgtgc catggtgaat acctcctgtt aagaaaccga 1620
atattgggtt taaacttgtt tcataattgt tgcaatgaaa cgcggtgaaa cattgcctga 1680
aacgttaact gaaacgcata tttgcggatt agttcatgac tttatctcta acaaattgaa 1740
attaaacatt taattttatt aaggcaattg tggcacaccc cttgctttgt ctttatcaac 1800
gcaaataaca agttgataac aagctagcga attcgagctc ggtacccggg gatcctctag 1860
agtcgacctg caggcatgca agcttggctg ttttggcgga tgagagaaga ttttcagcct 1920
gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 1980
tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 2040
tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 2100
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 2160
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 2220
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 2280
cggatggcct ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat 2340
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 2400
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 2460
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 2520
gcagcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 2580
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 2640
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 2700
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 2760
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 2820
tgtcagacca agtttactca tatatacttt agattgattt acgcgccctg tagcggcgca 2880
ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 2940
gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 3000
caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 3060
cccaaaaaac ttgatttggg tgatggttca cgtagtgggc catcgccctg atagacggtt 3120
tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 3180
acaacactca accctatctc gggctattct tttgatttat aagggatttt gccgatttcg 3240
gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 3300
ttaacgttta caatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 3360
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 3420
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 3480
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 3540
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 3600
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 3660
caggcatttg agaagcacac ggtcacactg cttccggtag tcaataaacc ggtaaaccag 3720
caatagacat aagcggctat ttaacgaccc tgccctgaac cgacgaccgg gtcgaatttg 3780
ctttcgaatt tctgccattc atccgcttat tatcacttat tcaggcgtag caaccaggcg 3840
tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 3900
actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg gcatgatgaa 3960
cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 4020
aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 4080
cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 4140
ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 4200
cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 4260
aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cggaattccg 4320
gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 4380
ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 4440
attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 4500
cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 4560
ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 4620
ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 4680
cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgg 4740
cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga 4800
ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac tgacggggtg 4860
gtgcgtaacg gcaaaagcac cgccggacat caactagtgc gctgcggaca catacaaagt 4920
tacccacaga ttccgtggat aagcagggga ctaacatgtg aggcaaaaca gcagggccgc 4980
gccggtggcg tttttccata ggctccgccc tcctgccaga gttcacataa acagacgctt 5040
ttccggtgca tctgtgggag ccgtgaggct caaccatgaa tctgacagta cgggcgaaac 5100
ccgacaggac ttaaagatcc ccaccgtttc cggcgggtcg ctccctcttg cgctctcctg 5160
ttccgaccct gccgtttacc ggatacctgt tccgcctttc tcccttacgg gaagtgtggc 5220
gctttctcat agctcacaca ctggtatctc ggctcggtgt aggtcgttcg ctccaagctg 5280
ggctgtaagc aagaactccc cgttcagccc gactgctgcg ccttatccgg taactgttca 5340
cttgagtcca acccggaaaa gcacggtaaa acgccactgg cagcagccat tggtaactgg 5400
gagttcgcag aggatttgtt tagctaaaca cgcggttgct cttgaagtgt gcgccaaagt 5460
ccggctacac tggaaggaca gatttggttg ctgtgctctg cgaaagccag ttaccacggt 5520
taagcagttc cccaactgac ttaaccttcg atcaaaccac ctccccaggt ggttttttcg 5580
tttacagggc aaaagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcgac 5640
gtctatttgc tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg 5700
atataggcgc cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg 5760
tagaggatct gctcatgttt gacagcttat c 5791
<210> 9
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> pPRO_REV_SpeI primer
<400> 9
gactgactag ttgatgtccg gcggt 25
<210> 10
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> pPRO_FOR_AatII primer
<400> 10
tcagctgacg tctatttgct catgagcc 28
<210> 11
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> RSF1030_FOR_SpeI primer
<400> 11
gcaaaagcac cgccggacat caactagtct tccgcttcct cgctca 46
<210> 12
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> RSF1030_REV_AatII primer
<400> 12
gccacttcgg gctcatgagc aaatagacgt caacggaata gctgttcgtt ga 52
<210> 13
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> CloDF13_FOR_SpeI primer
<400> 13
gcaaaagcac cgccggacat caactagtgc gctgcggaca cataca 46
<210> 14
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> CloDF13_REV_AatII primer
<400> 14
gccacttcgg gctcatgagc aaatagacgt cgatcaaagg atcttcttga gatcct 56
<210> 15
<211> 5304
<212> DNA
<213> Artificial Sequence
<220>
<223> Dual-promoter vector, pSOL
<400> 15
ggcctttctt cggtagaagt cttcccccag aggcaggtat caaaggatct tcttgagatc 60
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 120
tttgtttgcc ggatcaagag ctaccaactc tttttccgag gtaactggct tcagcagagc 180
gcagatacca aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc 240
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 300
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 360
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 420
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 480
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 540
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcatcg 600
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcagaaag 660
gcccacccga aggtgagcca ggtgattaca tttgggccct catcagaggt tttcaccgtc 720
atcaccgaaa cgcgcgaggc agctgcggta aagctcatca gcgtggtcgt gaagcgattc 780
acagatgtct gcctgttcat ccgcgtccag ctcgttgagt ttctccagaa gcgttaatgt 840
ctggcttctg ataaagcggg ccatgttaag ggcggttttt tcctgtttgg tcatacctgc 900
ttagaaaaac tcatcgagca tcaaatgaaa ttgcaattta ttcatatcag gattatcaat 960
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 1020
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 1080
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 1140
tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 1200
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 1260
cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 1320
gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 1380
ttcttctaat acctggaacg ctgtttttcc ggggatcgca gtggtgagta accatgcatc 1440
atcaggagta cggataaaat gcttgatggt cggaagtggc ataaattccg tcagccagtt 1500
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 1560
caactctggc gcatcgggct tcccatacaa gcgatagatt gtcgcacctg attgcccgac 1620
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 1680
cctcgacgtt tcccgttgaa tatggctcat agctcctgaa aatctcgata actcaaaaaa 1740
tacgcccggt agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc 1800
aagaagacgg tcaaaagcct ccggtcggag gccgggagag tgttcaccga caaacaacag 1860
ataaaacaaa aggcccagtc ttccgactga gccttttgtt ttatttgatg tctggcagtt 1920
cccgagacgt tatgacaact tgacggctac atcattcact ttttcttcac aaccggcacg 1980
gaactcgctc gggctggccc cggtgcattt tttaaatacc cgcgagaaat agagttgatc 2040
gtcaaaacca acattgcgac cgacggtggc gataggcatc cgggtggtgc tcaaaagcag 2100
cttcgcctgg ctgatacgtt ggtcctcgcg ccagcttaag acgctaatcc ctaactgctg 2160
gcggaaaaga tgtgacagac gcgacggcga caagcaaaca tgctgtgcga cgctggcgat 2220
atcaaaattg ctgtctgcca ggtgatcgct gatgtactga caagcctcgc gtacccgatt 2280
atccatcggt ggatggagcg actcgttaat cgcttccatg cgccgcagta acaattgctc 2340
aagcagattt atcgccagca gctccgaata gcgcccttcc ccttgcccgg cgttaatgat 2400
ttgcccaaac aggtcgctga aatgcggctg gtgcgcttca tccgggcgaa agaaccccgt 2460
attggcaaat attgacggcc agttaagcca ttcatgccag taggcgcgcg gacgaaagta 2520
aacccactgg tgataccatt cgcgagcctc cggatgacga ccgtagtgat gaatctctcc 2580
tggcgggaac agcaaaatat cacccggtcg gcaaacaaat tctcgtccct gatttttcac 2640
caccccctga ccgcgaatgg tgagattgag aatataacct ttcattccca gcggtcggtc 2700
gataaaaaaa tcgagataac cgttggcctc aatcggcgtt aaacccgcca ccagatgggc 2760
attaaacgag tatcccggca gcaggggatc attttgcgct tcagccatac ttttcatact 2820
cccgccattc agagaagaaa ccaattgtcc atattgcatc agacattgcc gtctctgcgt 2880
cttttactgg ctcttctcgc taaccaaacc ggtaaccccg cttattaaaa gcattctgta 2940
acaaagcggg accaaagcca tgacaaaaac gcgtaacaaa agtgtctata atcacggcag 3000
aaaagtccac attgattatt tgcacggcgt cacactttgc tatgccatag catttttatc 3060
cataagatta gcggatccta cctgacgctt tttatcgcaa ctctctactg tttctccata 3120
cccgtttttt tgggctagca ggaggtaaaa aaaatgtgag accggtctcg gtctagatcg 3180
gtcagtttca cctgatttac gtaaaaaccc gcttcggcgg gtttttgctt ttggaggggc 3240
agaaagatga atgactgtct ctcctgttag tgagggttaa tgcccggaac gaagaaaggc 3300
ccacccgtga aggtgagcca gtgagttggt tacattttct cttgagggtt tagcttttca 3360
gacgacgcca aaaggtcgta cgtgaaatac ccaaatagtt ggccgcagcc gtcttgtcac 3420
cattaaactt ctcaagcgct tgctgcgggg tcagcaaacg cggagccggc gtctttgcgc 3480
tctcacgcgc cagctccggc agcagcaact gcatgaattg cggagtcaga tccggggtcg 3540
gctcaacgga caggaacagc gccaggcgtt ccatcatatt acgcagctcg cggatgttac 3600
ccggccagtc ataatgcagc agcaccgttt cgctcgcctg cagaccctgg cgcagtgccg 3660
cagagaacgg tgcgctcagg gctgccagcg agactttcag gaaagactcc gccagcggta 3720
aaatgtcggc gacacgttca cgcaacggcg ggagctgcag acgcagaatg ctcaggcggt 3780
agaacaggtc gcgacgaaaa cggccctgtt gcatatcctc ttccagattg cagtgggtcg 3840
cgctaatcac gcgcacgtct accggaaccg gttgatgacc accgacgcgg gtcacttctt 3900
tctcttccag cacacgcagc agacgggttt gcaatggcag cggcatctca ccgatctcgt 3960
ccaggaacaa ggtgccgccg tgggcaattt caaacaaacc agcacggcca ccgcgacggc 4020
tacccgtgaa tgcgccctct tcgtagccaa acagctcagc ttccagcagg ctttccgcga 4080
ttgcaccgca attaactgcc acaaacggat gagatttctt accctggcgg gcatcgtgac 4140
gggcgaaata ctcacgatgg attgcttgcg cagccagttc cttacccgta ccagtctcgc 4200
cttcgatcag aacagccgcg ctgctacgtg catacagcag aatggtctgg cgaacttgct 4260
ccatttgagg gctttggccc agcatatcac ccaggacata acgggtacgc agcgcattac 4320
gcgtcgcatc gtgggtgttg tggcgcaggc tcattctggt catgtccagg gcgtcgctga 4380
acgcctgacg caccgttgcc gcgctgtaga taaagatgcc cgtcatgccc gcttcttcgg 4440
ccaagtccgt gatcagaccc gcaccaacca cagcctcggt accgttcgct ttcagttcgt 4500
tgatctggcc acgtgcatct tcctcggtaa tgtagctgcg ttggtccagg cgcagattaa 4560
aggtcttttg aaacgcgacc agcgcaggga tcgtttcctg gtaggtgaca acgccaatcg 4620
aggaggtcag tttgcctgcc ttcgccagcg cctgcaagac atcgtaaccg ctcggcttaa 4680
tcaggatcac cggcacggac agacgggatt tcaggtaggc accattgcta cccgctgcga 4740
taatggcgtc acaacgctcg ttggccagct ttttgcgaat gtaggtaacg gctttctcga 4800
aacccagctg aatcggagtg atgttcgcca ggtgatcaaa ctccaggcta atgtcgcgga 4860
acaactcgaa cagacgggtg acgctaacgg tccaaataac tggtttatca tcgttcaaac 4920
gcggtgggtg tgccatggtg aatacctcct gttaagaaac cgaatattgg gtttaaactt 4980
gtttcataat tgttgcaatg aaacgcggtg aaacattgcc tgaaacgtta actgaaacgc 5040
atatttgcgg attagttcat gactttatct ctaacaaatt gaaattaaac atttaatttt 5100
attaaggcaa ttgtggcaca ccccttgctt tgtctttatc aacgcaaata acaagttgat 5160
aacaaaagct taggaggaaa acatagagac cggtctctct cgagtaacta gttgatagag 5220
atcaagcctt aacgaactaa gacccccgca ccgaaaggtc cgggggtttt ttttgacctt 5280
aaaaacataa ccgaggagca gaca 5304
<210> 16
<211> 451
<212> PRT
<213> Artificial Sequence
<220>
<223> Infliximab chimeric (murine variable doman, human constant
domain) heavy chain
<400> 16
Met Glu Val Lys Leu Glu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly
1 5 10 15
Gly Ser Met Lys Leu Ser Cys Val Ala Ser Gly Phe Ile Phe Ser Asn
20 25 30
His Trp Met Asn Trp Val Arg Gln Ser Pro Glu Lys Gly Leu Glu Trp
35 40 45
Val Ala Glu Ile Arg Ser Lys Ser Ile Asn Ser Ala Thr His Tyr Ala
50 55 60
Glu Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asp Ser Lys Ser
65 70 75 80
Ala Val Tyr Leu Gln Met Thr Asp Leu Arg Thr Glu Asp Thr Gly Val
85 90 95
Tyr Tyr Cys Ser Arg Asn Tyr Tyr Gly Ser Thr Tyr Asp Tyr Trp Gly
100 105 110
Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser
115 120 125
Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala
130 135 140
Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val
145 150 155 160
Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala
165 170 175
Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val
180 185 190
Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His
195 200 205
Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys
210 215 220
Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly
225 230 235 240
Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met
245 250 255
Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His
260 265 270
Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val
275 280 285
His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr
290 295 300
Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly
305 310 315 320
Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile
325 330 335
Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val
340 345 350
Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser
355 360 365
Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu
370 375 380
Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro
385 390 395 400
Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val
405 410 415
Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met
420 425 430
His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser
435 440 445
Pro Gly Lys
450
<210> 17
<211> 215
<212> PRT
<213> Artificial Sequence
<220>
<223> Infliximab chimeric (murine variable doman, human constant
domain) light chain
<400> 17
Met Asp Ile Leu Leu Thr Gln Ser Pro Ala Ile Leu Ser Val Ser Pro
1 5 10 15
Gly Glu Arg Val Ser Phe Ser Cys Arg Ala Ser Gln Phe Val Gly Ser
20 25 30
Ser Ile His Trp Tyr Gln Gln Arg Thr Asn Gly Ser Pro Arg Leu Leu
35 40 45
Ile Lys Tyr Ala Ser Glu Ser Met Ser Gly Ile Pro Ser Arg Phe Ser
50 55 60
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Ser Ile Asn Thr Val Glu
65 70 75 80
Ser Glu Asp Ile Ala Asp Tyr Tyr Cys Gln Gln Ser His Ser Trp Pro
85 90 95
Phe Thr Phe Gly Ser Gly Thr Asn Leu Glu Val Lys Arg Thr Val Ala
100 105 110
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
115 120 125
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
130 135 140
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
145 150 155 160
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
165 170 175
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
180 185 190
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
195 200 205
Ser Phe Asn Arg Gly Glu Cys
210 215
<210> 18
<211> 4594
<212> DNA
<213> Artificial Sequence
<220>
<223> pBAD240-Infliximab_HC expression construct
<400> 18
ggcctttctt cggtagaaac cccgagagca ggtatcaaag gatcttcttg agatcctttt 60
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 120
ttgccggatc aagagctacc aactcttttt ccgaggtaac tggcttcagc agagcgcaga 180
taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 240
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 300
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 360
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 420
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 480
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 540
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag catcgatttt 600
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgca gaaaggccca 660
cccgaaggtg agccaggtga ttacatttgg gccctcatca gaggttttca ccgtcatcac 720
cgaaacgcgc gaggcagctg cggtaaagct catcagcgtg gtcgtgaagc gattcacaga 780
tgtctgcctg ttcatccgcg tccagctcgt tgagtttctc cagaagcgtt aatgtctggc 840
ttctgataaa gcgggccatg ttaagggcgg ttttttcctg tttggtcata cctgcttaga 900
aaaactcatc gagcatcaag tgaaactgca atttattcat atcaggatta tcaataccat 960
atttttgaaa aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga 1020
tggcaagatc ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta 1080
atttcccctc gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat 1140
ccggtgagaa tggcaaaagc ttatgcattt ctttccagac ttgttcaaca ggccagccat 1200
tacgctcgtc atcaaaatca ctcgcaccaa ccaaaccgtt attcattcgt gattgcgcct 1260
gagcgagacg aaatacgcga tcgccgttaa aaggacaatt acaaacagga atcgaatgca 1320
accggcgcag gaacactgcc agcgcatcaa caatattttc acctgaatca ggatattctt 1380
ctaatacctg gaatgctgtt ttccctggga tcgcagtggt gagtaaccat gcatcatcag 1440
gagtacggat aaaatgcttg atggtcggaa gaggcataaa ttccgtcagc cagtttagcc 1500
tgaccatctc atctgtaaca tcattggcaa cgctaccttt gccatgtttc agaaacaact 1560
ctggcgcatc gggcttccca tacaatcgat agattgtcgc acctgattgc ccgacattat 1620
cgcgagccca tttataccca tataaatcag catccatgtt ggaatttaat cgcggcctcg 1680
agcaagacgt ttcccgttga atatggctca tagctcctga aaatctcgat aactcaaaaa 1740
atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat 1800
caagtcaaaa gcctccgcgg gagagtgttc accgacaaac aacagataaa acaaaaggcc 1860
cagtcttccg actgagcctt ttgttttatt tgatgtctgg cagttcccga gacgttatga 1920
caacttgacg gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct 1980
ggccccggtg cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt 2040
gcgaccgacg gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat 2100
acgttggtcc tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga 2160
cagacgcgac ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc 2220
tgccaggtga tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg 2280
gagcgactcg ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc 2340
cagcagctcc gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc 2400
gctgaaatgc ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga 2460
cggccagtta agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata 2520
ccattcgcga gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa 2580
aatatcaccc ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg 2640
aatggtgaga ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag 2700
ataaccgttg gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc 2760
cggcagcagg ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga 2820
agaaaccaat tgtccatatt gcatcagaca ttgccgtctc tgcgtctttt actggctctt 2880
ctcgctaacc aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa 2940
agccatgaca aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga 3000
ttatttgcac ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga 3060
tcctacctga cgctttttat cgcaactctc tactgtttct ccatacccgt ttttttgggc 3120
tagcaggagg taaaaaaaat ggaagttaaa ttagaagaaa gcggcggcgg tttggtgcaa 3180
cctggcggtt cgatgaagtt gagctgcgtc gcaagcggtt tcattttttc caaccactgg 3240
atgaactggg tgcgccagtc tccggaaaag ggtctggaat gggttgcgga gatccgtagc 3300
aagagcatca atagcgcgac gcattatgcc gagagcgtca aaggccgctt caccatttct 3360
cgtgacgaca gcaaaagcgc tgtgtatctg caaatgaccg acttgcgtac cgaggacacg 3420
ggcgtgtatt actgctcccg caactattac ggttccacct acgactactg gggccagggt 3480
acgaccctga ccgttagctc ggcgagcacc aagggtccga gcgtctttcc gctggcaccg 3540
agcagcaaaa gcaccagcgg tggtaccgcc gcactgggtt gcctggtgaa agattacttc 3600
ccggaaccgg ttactgtgag ctggaacagc ggcgcgctga cctctggcgt gcacacgttc 3660
ccggcagttc tgcaaagcag cggcctgtac tccctgtcca gcgtcgtcac cgtgccgagc 3720
agcagcctgg gtacgcaaac ctatatttgt aacgtcaatc acaagccgag caacaccaaa 3780
gtggacaaaa aagtcgaacc gaaaagctgc gataaaaccc atacttgtcc gccgtgcccg 3840
gccccggagc ttctgggtgg tccaagcgtt tttctgttcc cgccgaagcc gaaagacacc 3900
ctgatgatca gccgcacccc tgaggtgacc tgtgtggtag ttgacgtttc ccacgaagat 3960
ccagaggtca agtttaactg gtatgtggat ggcgtcgaag ttcacaatgc aaagaccaag 4020
ccgcgtgaag aacagtataa ctctacgtac cgtgtcgtga gcgttctgac tgttctgcac 4080
caggattggc tgaacggcaa agagtacaag tgcaaggtta gcaataaagc gctgccggct 4140
ccgatcgaga aaaccatttc taaggctaaa ggtcagccgc gtgagccgca agtttacacc 4200
ctgccaccga gccgtgatga gctgacgaaa aatcaagtat ctctgacctg tctggtcaaa 4260
ggtttttacc caagcgatat cgcggttgaa tgggagagca acggccagcc ggagaataat 4320
tacaagacga cgcctccggt gctggatagc gatggttcgt ttttcctgta cagcaagttg 4380
acggttgata aaagccgttg gcaacagggt aacgtgttct cctgttccgt catgcatgaa 4440
gcgctgcaca accattatac tcagaaaagc ctcagcctgt ccccgggtaa ataagtctag 4500
ataactagtt gatcggtcag tttcacctga tttacgtaaa aacccgcttc ggcgggtttt 4560
tgcttttgga ggggcagaaa gatgaatgac tgtc 4594
<210> 19
<211> 4332
<212> DNA
<213> Artificial Sequence
<220>
<223> pPRO430-Infliximab_LC expression construct
<400> 19
ccccagaggc aggtctagcg gagtgtatac tggcttacta tgttggcact gatgagggtg 60
tcagtgaagt gcttcatgtg gcaggagaaa aaaggctgca ccggtgcgtc agcagaatat 120
gtgatacagg atatattccg cttcctcgct cactgactcg ctacgctcgg tcgttcgact 180
gcggcgagcg gaaatggctt acgaacgggg cggagatttc ctggaagatg ccaggaagat 240
acttaacagg gaagtgagag ggccgcggca aagccgtttt tccataggct ccgcccccct 300
gacaagcatc acgaaatctg acgctcaaat cagtggtggc gaaacccgac aggactataa 360
agataccagg cgtttccccc tggcggctcc ctcgtgcgct ctcctgttcc tgcctttcgg 420
tttaccggtg tcattccgct gttatggccg cgtttgtctc attccacgcc tgacactcag 480
ttccgggtag gcagttcgct ccaagctgga ctgtatgcac gaaccccccg ttcagtccga 540
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggaaagac atgcaaaagc 600
accactggca gcagccactg gtaattgatt tagaggagtt agtcttgaag tcatgcgccg 660
gttaaggcta aactgaaagg acaagttttg gtgactgcgc tcctccaagc cagttacctc 720
ggttcaaaga gttggtagct cagagaacct tcgaaaaacc gccctgcaag gcggtttttt 780
cgttttcaga gcaagagatt acgcgcagac caaaacgatc tcaagaagat catcttatta 840
aacctgcctc taaaaacttt tattacgccc cgccctgcca ctcatcgcag tactgttgta 900
attcattaag cattctgccg acatggaagc catcacagac ggcatgatga acctgaatcg 960
ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatagtg aaaacggggg 1020
cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc acccagggat 1080
tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc aggttttcac 1140
cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt 1200
cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa 1260
cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc ggatgagcat 1320
tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta 1380
cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 1440
ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 1500
atccagtgat ttttttctcc atcatattct tcctttttca atattattga agcatttatc 1560
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 1620
gggtcagtgt tacaaccaat taaccaattc tgatctcctg ttagtgaggg ttaatgcccg 1680
gaacgaagaa aggcccaccc gtgaaggtga gccagtgagt tggttacatt ttctcttgag 1740
ggtttagctt ttcagacgac gccaaaaggt cgtacgtgaa atacccaaat agttggccgc 1800
agccgtcttg tcaccattaa acttctcaag cgcttgctgc ggggtcagca aacgcggagc 1860
cggcgtcttt gcgctctcac gcgccagctc cggcagcagc aactgcatga attgcggagt 1920
cagatccggg gtcggctcaa cggacaggaa cagcgccagg cgttccatca tattacgcag 1980
ctcgcggatg ttacccggcc agtcataatg cagcagcacc gtttcgctcg cctgcagacc 2040
ctggcgcagt gccgcagaga acggtgcgct cagggctgcc agcgagactt tcaggaaaga 2100
ctccgccagc ggtaaaatgt cggcgacacg ttcacgcaac ggcgggagct gcagacgcag 2160
aatgctcagg cggtagaaca ggtcgcgacg aaaacggccc tgttgcatat cctcttccag 2220
attgcagtgg gtcgcgctaa tcacgcgcac gtctaccgga accggttgat gaccaccgac 2280
gcgggtcact tctttctctt ccagcacacg cagcagacgg gtttgcaatg gcagcggcat 2340
ctcaccgatc tcgtccagga acaaggtgcc gccgtgggca atttcaaaca aaccagcacg 2400
gccaccgcga cggctacccg tgaatgcgcc ctcttcgtag ccaaacagct cagcttccag 2460
caggctttcc gcgattgcac cgcaattaac tgccacaaac ggatgagatt tcttaccctg 2520
gcgggcatcg tgacgggcga aatactcacg atggattgct tgcgcagcca gttccttacc 2580
cgtaccagtc tcgccttcga tcagaacagc cgcgctgcta cgtgcataca gcagaatggt 2640
ctggcgaact tgctccattt gagggctttg gcccagcata tcacccagga cataacgggt 2700
acgcagcgca ttacgcgtcg catcgtgggt gttgtggcgc aggctcattc tggtcatgtc 2760
cagggcgtcg ctgaacgcct gacgcaccgt tgccgcgctg tagataaaga tgcccgtcat 2820
gcccgcttct tcggccaagt ccgtgatcag acccgcacca accacagcct cggtaccgtt 2880
cgctttcagt tcgttgatct ggccacgtgc atcttcctcg gtaatgtagc tgcgttggtc 2940
caggcgcaga ttaaaggtct tttgaaacgc gaccagcgca gggatcgttt cctggtaggt 3000
gacaacgcca atcgaggagg tcagtttgcc tgccttcgcc agcgcctgca agacatcgta 3060
accgctcggc ttaatcagga tcaccggcac ggacagacgg gatttcaggt aggcaccatt 3120
gctacccgct gcgataatgg cgtcacaacg ctcgttggcc agctttttgc gaatgtaggt 3180
aacggctttc tcgaaaccca gctgaatcgg agtgatgttc gccaggtgat caaactccag 3240
gctaatgtcg cggaacaact cgaacagacg ggtgacgcta acggtccaaa taactggttt 3300
atcatcgttc aaacgcggtg ggtgtgccat ggtgaatacc tcctgttaag aaaccgaata 3360
ttgggtttaa acttgtttca taattgttgc aatgaaacgc ggtgaaacat tgcctgaaac 3420
gttaactgaa acgcatattt gcggattagt tcatgacttt atctctaaca aattgaaatt 3480
aaacatttaa ttttattaag gcaattgtgg cacacccctt gctttgtctt tatcaacgca 3540
aataacaagt tgataacaaa agcttaggag gaaaacatat ggatatttta ttgacccaaa 3600
gcccagccat tctgtctgtt tccccgggcg agcgtgtttc ttttagctgc cgtgcaagcc 3660
agttcgttgg ttcatcgatc cactggtacc aacagcgtac gaacggtagc ccgcgtctgc 3720
tgattaagta cgcgagcgaa agcatgagcg gtatcccgag ccgcttcagc ggtagcggca 3780
gcggcacgga cttcacgctg agcatcaata cggttgaaag cgaggacatc gcggactatt 3840
actgccagca gagccattct tggccgttta cctttggcag cggtaccaat ctggaagtta 3900
aacgcaccgt ggcagcgccg tccgttttca tttttcctcc gtccgatgag caactgaaat 3960
cgggcacggc cagcgtcgtg tgtctgttga acaacttcta cccgcgtgag gcgaaggtgc 4020
agtggaaagt ggacaacgcg ctgcaatccg gtaatagcca ggaaagcgtc accgaacaag 4080
atagcaagga cagcacctac agcctgagct ctactctgac cctgagcaag gctgattatg 4140
agaaacacaa ggtctatgca tgtgaggtga cccatcaggg tctgtccagc ccggtcacca 4200
aaagcttcaa tcgcggtgag tgctaactcg agtaactagt tgatagagat caagccttaa 4260
cgaactaaga cccccgcacc gaaaggtccg ggggtttttt ttgaccttaa aaacataacc 4320
gaggagcaga ca 4332
<210> 20
<211> 7288
<212> DNA
<213> Artificial Sequence
<220>
<223> pSOL-Infliximab expression construct
<400> 20
agctcctgaa aatctcgata actcaaaaaa tacgcccggt agtgatctta tttcattatg 60
gtgaaagttg gaacctctta cgtgccgatc aagaagacgg tcaaaagcct ccggtcggag 120
gccgggagag tgttcaccga caaacaacag ataaaacaaa aggcccagtc ttccgactga 180
gccttttgtt ttatttgatg tctggcagtt cccgagacgt tatgacaact tgacggctac 240
atcattcact ttttcttcac aaccggcacg gaactcgctc gggctggccc cggtgcattt 300
tttaaatacc cgcgagaaat agagttgatc gtcaaaacca acattgcgac cgacggtggc 360
gataggcatc cgggtggtgc tcaaaagcag cttcgcctgg ctgatacgtt ggtcctcgcg 420
ccagcttaag acgctaatcc ctaactgctg gcggaaaaga tgtgacagac gcgacggcga 480
caagcaaaca tgctgtgcga cgctggcgat atcaaaattg ctgtctgcca ggtgatcgct 540
gatgtactga caagcctcgc gtacccgatt atccatcggt ggatggagcg actcgttaat 600
cgcttccatg cgccgcagta acaattgctc aagcagattt atcgccagca gctccgaata 660
gcgcccttcc ccttgcccgg cgttaatgat ttgcccaaac aggtcgctga aatgcggctg 720
gtgcgcttca tccgggcgaa agaaccccgt attggcaaat attgacggcc agttaagcca 780
ttcatgccag taggcgcgcg gacgaaagta aacccactgg tgataccatt cgcgagcctc 840
cggatgacga ccgtagtgat gaatctctcc tggcgggaac agcaaaatat cacccggtcg 900
gcaaacaaat tctcgtccct gatttttcac caccccctga ccgcgaatgg tgagattgag 960
aatataacct ttcattccca gcggtcggtc gataaaaaaa tcgagataac cgttggcctc 1020
aatcggcgtt aaacccgcca ccagatgggc attaaacgag tatcccggca gcaggggatc 1080
attttgcgct tcagccatac ttttcatact cccgccattc agagaagaaa ccaattgtcc 1140
atattgcatc agacattgcc gtctctgcgt cttttactgg ctcttctcgc taaccaaacc 1200
ggtaaccccg cttattaaaa gcattctgta acaaagcggg accaaagcca tgacaaaaac 1260
gcgtaacaaa agtgtctata atcacggcag aaaagtccac attgattatt tgcacggcgt 1320
cacactttgc tatgccatag catttttatc cataagatta gcggatccta cctgacgctt 1380
tttatcgcaa ctctctactg tttctccata cccgtttttt tgggctagca ggaggtaaaa 1440
aaaatggaag ttaaattaga agaaagcggc ggcggtttgg tgcaacctgg cggttcgatg 1500
aagttgagct gcgtcgcaag cggtttcatt ttttccaacc actggatgaa ctgggtgcgc 1560
cagtctccgg aaaagggtct ggaatgggtt gcggagatcc gtagcaagag catcaatagc 1620
gcgacgcatt atgccgagag cgtcaaaggc cgcttcacca tttctcgtga cgacagcaaa 1680
agcgctgtgt atctgcaaat gaccgacttg cgtaccgagg acacgggcgt gtattactgc 1740
tcccgcaact attacggttc cacctacgac tactggggcc agggtacgac cctgaccgtt 1800
agctcggcga gcaccaaggg tccgagcgtc tttccgctgg caccgagcag caaaagcacc 1860
agcggtggta ccgccgcact gggttgcctg gtgaaagatt acttcccgga accggttact 1920
gtgagctgga acagcggcgc gctgacctct ggcgtgcaca cgttcccggc agttctgcaa 1980
agcagcggcc tgtactccct gtccagcgtc gtcaccgtgc cgagcagcag cctgggtacg 2040
caaacctata tttgtaacgt caatcacaag ccgagcaaca ccaaagtgga caaaaaagtc 2100
gaaccgaaaa gctgcgataa aacccatact tgtccgccgt gcccggcccc ggagcttctg 2160
ggtggtccaa gcgtttttct gttcccgccg aagccgaaag acaccctgat gatcagccgc 2220
acccctgagg tgacctgtgt ggtagttgac gtttcccacg aagatccaga ggtcaagttt 2280
aactggtatg tggatggcgt cgaagttcac aatgcaaaga ccaagccgcg tgaagaacag 2340
tataactcta cgtaccgtgt cgtgagcgtt ctgactgttc tgcaccagga ttggctgaac 2400
ggcaaagagt acaagtgcaa ggttagcaat aaagcgctgc cggctccgat cgagaaaacc 2460
atttctaagg ctaaaggtca gccgcgtgag ccgcaagttt acaccctgcc accgagccgt 2520
gatgagctga cgaaaaatca agtatctctg acctgtctgg tcaaaggttt ttacccaagc 2580
gatatcgcgg ttgaatggga gagcaacggc cagccggaga ataattacaa gacgacgcct 2640
ccggtgctgg atagcgatgg ttcgtttttc ctgtacagca agttgacggt tgataaaagc 2700
cgttggcaac agggtaacgt gttctcctgt tccgtcatgc atgaagcgct gcacaaccat 2760
tatactcaga aaagcctcag cctgtccccg ggtaaataag tctagataac tagttgatcg 2820
gtcagtttca cctgatttac gtaaaaaccc gcttcggcgg gtttttgctt ttggaggggc 2880
agaaagatga atgactgtct ctcctgttag tgagggttaa tgcccggaac gaagaaaggc 2940
ccacccgtga aggtgagcca gtgagttggt tacattttct cttgagggtt tagcttttca 3000
gacgacgcca aaaggtcgta cgtgaaatac ccaaatagtt ggccgcagcc gtcttgtcac 3060
cattaaactt ctcaagcgct tgctgcgggg tcagcaaacg cggagccggc gtctttgcgc 3120
tctcacgcgc cagctccggc agcagcaact gcatgaattg cggagtcaga tccggggtcg 3180
gctcaacgga caggaacagc gccaggcgtt ccatcatatt acgcagctcg cggatgttac 3240
ccggccagtc ataatgcagc agcaccgttt cgctcgcctg cagaccctgg cgcagtgccg 3300
cagagaacgg tgcgctcagg gctgccagcg agactttcag gaaagactcc gccagcggta 3360
aaatgtcggc gacacgttca cgcaacggcg ggagctgcag acgcagaatg ctcaggcggt 3420
agaacaggtc gcgacgaaaa cggccctgtt gcatatcctc ttccagattg cagtgggtcg 3480
cgctaatcac gcgcacgtct accggaaccg gttgatgacc accgacgcgg gtcacttctt 3540
tctcttccag cacacgcagc agacgggttt gcaatggcag cggcatctca ccgatctcgt 3600
ccaggaacaa ggtgccgccg tgggcaattt caaacaaacc agcacggcca ccgcgacggc 3660
tacccgtgaa tgcgccctct tcgtagccaa acagctcagc ttccagcagg ctttccgcga 3720
ttgcaccgca attaactgcc acaaacggat gagatttctt accctggcgg gcatcgtgac 3780
gggcgaaata ctcacgatgg attgcttgcg cagccagttc cttacccgta ccagtctcgc 3840
cttcgatcag aacagccgcg ctgctacgtg catacagcag aatggtctgg cgaacttgct 3900
ccatttgagg gctttggccc agcatatcac ccaggacata acgggtacgc agcgcattac 3960
gcgtcgcatc gtgggtgttg tggcgcaggc tcattctggt catgtccagg gcgtcgctga 4020
acgcctgacg caccgttgcc gcgctgtaga taaagatgcc cgtcatgccc gcttcttcgg 4080
ccaagtccgt gatcagaccc gcaccaacca cagcctcggt accgttcgct ttcagttcgt 4140
tgatctggcc acgtgcatct tcctcggtaa tgtagctgcg ttggtccagg cgcagattaa 4200
aggtcttttg aaacgcgacc agcgcaggga tcgtttcctg gtaggtgaca acgccaatcg 4260
aggaggtcag tttgcctgcc ttcgccagcg cctgcaagac atcgtaaccg ctcggcttaa 4320
tcaggatcac cggcacggac agacgggatt tcaggtaggc accattgcta cccgctgcga 4380
taatggcgtc acaacgctcg ttggccagct ttttgcgaat gtaggtaacg gctttctcga 4440
aacccagctg aatcggagtg atgttcgcca ggtgatcaaa ctccaggcta atgtcgcgga 4500
acaactcgaa cagacgggtg acgctaacgg tccaaataac tggtttatca tcgttcaaac 4560
gcggtgggtg tgccatggtg aatacctcct gttaagaaac cgaatattgg gtttaaactt 4620
gtttcataat tgttgcaatg aaacgcggtg aaacattgcc tgaaacgtta actgaaacgc 4680
atatttgcgg attagttcat gactttatct ctaacaaatt gaaattaaac atttaatttt 4740
attaaggcaa ttgtggcaca ccccttgctt tgtctttatc aacgcaaata acaagttgat 4800
aacaaaagct taggaggaaa acatatggat attttattga cccaaagccc agccattctg 4860
tctgtttccc cgggcgagcg tgtttctttt agctgccgtg caagccagtt cgttggttca 4920
tcgatccact ggtaccaaca gcgtacgaac ggtagcccgc gtctgctgat taagtacgcg 4980
agcgaaagca tgagcggtat cccgagccgc ttcagcggta gcggcagcgg cacggacttc 5040
acgctgagca tcaatacggt tgaaagcgag gacatcgcgg actattactg ccagcagagc 5100
cattcttggc cgtttacctt tggcagcggt accaatctgg aagttaaacg caccgtggca 5160
gcgccgtccg ttttcatttt tcctccgtcc gatgagcaac tgaaatcggg cacggccagc 5220
gtcgtgtgtc tgttgaacaa cttctacccg cgtgaggcga aggtgcagtg gaaagtggac 5280
aacgcgctgc aatccggtaa tagccaggaa agcgtcaccg aacaagatag caaggacagc 5340
acctacagcc tgagctctac tctgaccctg agcaaggctg attatgagaa acacaaggtc 5400
tatgcatgtg aggtgaccca tcagggtctg tccagcccgg tcaccaaaag cttcaatcgc 5460
ggtgagtgct aactcgagta actagttgat agagatcaag ccttaacgaa ctaagacccc 5520
cgcaccgaaa ggtccggggg ttttttttga ccttaaaaac ataaccgagg agcagacagg 5580
cctttcttcg gtagaagtct tcccccagag gcaggtatca aaggatcttc ttgagatcct 5640
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 5700
tgtttgccgg atcaagagct accaactctt tttccgaggt aactggcttc agcagagcgc 5760
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 5820
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 5880
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 5940
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 6000
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 6060
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 6120
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcatcgat 6180
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcagaaaggc 6240
ccacccgaag gtgagccagg tgattacatt tgggccctca tcagaggttt tcaccgtcat 6300
caccgaaacg cgcgaggcag ctgcggtaaa gctcatcagc gtggtcgtga agcgattcac 6360
agatgtctgc ctgttcatcc gcgtccagct cgttgagttt ctccagaagc gttaatgtct 6420
ggcttctgat aaagcgggcc atgttaaggg cggttttttc ctgtttggtc atacctgctt 6480
agaaaaactc atcgagcatc aaatgaaatt gcaatttatt catatcagga ttatcaatac 6540
catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 6600
ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 6660
ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 6720
aatccggtga gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc 6780
cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 6840
cctgagcgag gcgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgagt 6900
gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 6960
cttctaatac ctggaacgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat 7020
caggagtacg gataaaatgc ttgatggtcg gaagtggcat aaattccgtc agccagttta 7080
gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 7140
actctggcgc atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat 7200
tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 7260
tcgacgtttc ccgttgaata tggctcat 7288
Claims (61)
- 2종 이상의 유도성 프로모터를 포함하는 발현 작제물(expression construct)로서,
적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이며,
상기 발현 작제물은
(a) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3000개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3250개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(c) 서열번호 15의 적어도 3000개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(d) 서열번호 15의 적어도 3250개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(e) 서열번호 15의 적어도 3500개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(f) 서열번호 15의 적어도 4000개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열; 및
(g) 서열번호 15의 적어도 5000개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는, 발현 작제물. - 2종 이상의 유도성 프로모터를 포함하는 발현 작제물로서,
적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이며,
상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 2818 내지 3259와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 4937 내지 5304와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열; 및
(c) (a) 및 (b) 둘 다를 포함하는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는, 발현 작제물. - 제1항 또는 제2항에 있어서, 상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 2818 내지 3259의 적어도 425개의 인접한 염기와 적어도 87% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 2818 내지 3259의 적어도 400개의 인접한 염기와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열;
(c) 서열번호 15의 뉴클레오타이드 2818 내지 3259의 적어도 350개의 인접한 염기와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열;
(d) 서열번호 15의 뉴클레오타이드 4937 내지 5304의 적어도 350개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열; 및
(e) 서열번호 15의 뉴클레오타이드 4937 내지 5304의 적어도 300개의 인접한 염기와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 적어도 하나의 뉴클레오타이드 서열을 포함하는, 발현 작제물. - 제3항에 있어서, 상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 2818 내지 3259와 적어도 87% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 2818 내지 3259와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열;
(c) 서열번호 15의 뉴클레오타이드 2818 내지 3259와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열;
(d) 서열번호 15의 뉴클레오타이드 4937 내지 5304와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(e) 서열번호 15의 뉴클레오타이드 4937 내지 5304와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열; 및
(f) 서열번호 15의 뉴클레오타이드 4937 내지 5304와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 적어도 하나의 뉴클레오타이드 서열을 포함하는, 발현 작제물. - 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 3140 내지 3151 및 서열번호 15의 뉴클레오타이드 5172 내지 5185로 이루어진 군으로부터 선택된 적어도 하나의 뉴클레오타이드 서열을 포함하는, 발현 작제물.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 2818 내지 3259 및 서열번호 15의 뉴클레오타이드 4937 내지 5304로 이루어진 군으로부터 선택된 적어도 하나의 뉴클레오타이드 서열을 포함하는, 발현 작제물.
- 제6항에 있어서, 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 2818 내지 3259 및 서열번호 15의 뉴클레오타이드 4937 내지 5304를 포함하는, 발현 작제물.
- 2종 이상의 유도성 프로모터를 포함하는 발현 작제물로서,
적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이며,
상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3000개의 인접한 염기와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3250개의 인접한 염기와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열;
(c) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3250개의 인접한 염기와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열; 및
(d) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3250개의 인접한 염기와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는, 발현 작제물. - 2종 이상의 유도성 프로모터를 포함하는 발현 작제물로서,
적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이며,
상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 1833 내지 5304와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 1833 내지 5304와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열; 및
(c) 서열번호 15의 뉴클레오타이드 1833 내지 5304와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는, 발현 작제물. - 제8항 또는 제9항에 있어서, 상기 발현 작제물은 서열번호 15를 포함하는, 발현 작제물.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 발현 작제물은 염색체외(extrachromosomal)에 존재하는, 발현 작제물.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 람노스 유도성 프로모터, 자일로스 유도성 프로모터, 락토스 유도성 프로모터, 및 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택된 적어도 1종의 유도성 프로모터를 더 포함하는, 발현 작제물.
- 제12항에 있어서, 적어도 1종의 유도성 프로모터는 상기 rhaSR 프로모터, 상기 xlyA 프로모터, 상기 lacZYA 프로모터, 및 상기 phoA 프로모터로 이루어진 군으로부터 선택되는, 발현 작제물.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 유도성 프로모터에 결합하는 전사 조절인자를 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함하는, 발현 작제물.
- 제14항에 있어서, 상기 전사 조절인자는 AraC, PrpR, RhaR 및 XylR로 이루어진 군으로부터 선택되는, 발현 작제물.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함하는, 발현 작제물.
- 제1항 내지 제16항 중 어느 한 항의 발현 작제물을 포함하는, 키트.
- 제1항 내지 제16항 중 어느 한 항의 발현 작제물을 포함하는, 숙주 세포.
- 제18항에 있어서, 상기 숙주 세포는 원핵생물 세포인, 숙주 세포.
- 제19항에 있어서, 상기 숙주 세포는 이. 콜라이(E. coli)인, 숙주 세포.
- 제18항 내지 제20항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자에 대한 수송체 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 변경을 갖는, 숙주 세포.
- 제21항에 있어서, 상기 수송체 단백질을 코딩하는 상기 유전자는 araE, araF, araG, araH, rhaT, xylF, xylG 및 xylH로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제22항에 있어서, 상기 유전자 기능의 변경은 항시성 프로모터(constitutive promoter)로부터 araE의 발현인, 숙주 세포.
- 제18항 내지 제23항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자를 대사시키는(metabolize) 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는, 숙주 세포.
- 제24항에 있어서, 적어도 1종의 상기 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 상기 유전자는 araA, araB, prpB, prpD, rhaA, rhaB, rhaD, xylA 및 xylB로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는, 숙주 세포.
- 제26항에 있어서, 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 상기 유전자는 scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC 및 rmlD로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제18항 내지 제27항 중 어느 한 항에 있어서, 상기 숙주 세포는 티오레독신 환원효소 유전자의 유전자 기능의 감소된 수준을 갖는, 숙주 세포.
- 제28항에 있어서, 상기 티오레독신 환원효소 유전자는 trxB인, 숙주 세포.
- 제18항 내지 제29항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 글루타티온 합성효소 유전자의 유전자 기능의 감소된 수준을 갖는, 숙주 세포.
- 제30항에 있어서, 상기 글루타티온 합성효소 유전자는 gshA 및 gshB로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제18항 내지 제31항 중 어느 한 항에 있어서, 상기 숙주 세포는 AhpC의 적어도 하나의 돌연변이체 형태를 발현하는, 숙주 세포.
- 제18항 내지 제32항 중 어느 한 항에 있어서, 적어도 1종의 L-아라비노스 유도성 프로모터 및 AraC를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 L-아라비노스 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 가지며, 상기 유전자는 araA 및 araB로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제18항 내지 제32항 중 어느 한 항에 있어서, 적어도 1종의 프로피오네이트 유도성 프로모터 및 PrpR을 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 프로피오네이트 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 가지며, 상기 유전자는 prpB 및 prpD로 이루어진 군으로부터 선택되는, 숙주 세포.
- 제18항 내지 제34항 중 어느 한 항에 있어서, 상기 숙주 세포는, (a) 상기 araBAD 유전자의 결실; (b) 상기 araE 유전자의 변경된 유전자 기능; (c) lacY(A177C) 유전자; (d) 상기 prpB 유전자의 감소된 유전자 기능; (e) 상기 sbm/scpA-ygfD/argK-ygfGH/scpBC 유전자의 감소된 유전자 기능; (f) 상기 gor 및 trxB 유전자의 감소된 유전자 기능; (g) AhpC의 돌연변이체 형태를 코딩하는 폴리뉴클레오타이드; (h) 상기 AscG 유전자의 감소된 유전자 기능; (i) 신호 펩타이드가 결여된 DsbC의 형태를 코딩하는 폴리뉴클레오타이드; (j) Erv1p를 코딩하는 폴리뉴클레오타이드; 및 (k) 단백질 다이설파이드 아이소머라제를 코딩하는 폴리뉴클레오타이드 중 하나 이상을 포함하는, 숙주 세포.
- 제1항 내지 제16항 중 어느 한 항의 상기 발현 작제물 및 숙주 세포를 포함하는, 키트.
- 제36항에 있어서, 상기 숙주 세포는 원핵생물 세포인, 키트.
- 제37항에 있어서, 상기 숙주 세포는 이. 콜라이인, 키트.
- 제36항 내지 제38항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자에 대한 수송체 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 변경을 갖는, 키트.
- 제39항에 있어서, 상기 수송체 단백질을 코딩하는 상기 유전자는 araE, araF, araG, araH, rhaT, xylF, xylG 및 xylH로 이루어진 군으로부터 선택되는, 키트.
- 제40항에 있어서, 상기 유전자 기능의 변경은 항시성 프로모터로부터 araE 의 발현인, 키트.
- 제36항 내지 제41항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는, 키트.
- 제42항에 있어서, 적어도 1종의 상기 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 상기 유전자는 araA, araB, prpB, prpD, rhaA, rhaB, rhaD, xylA 및 xylB로 이루어진 군으로부터 선택되는, 키트.
- 제36항 내지 제43항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는, 키트.
- 제44항에 있어서, 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 상기 유전자는 scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC 및 rmlD로 이루어진 군으로부터 선택되는, 키트.
- 제36항 내지 제45항 중 어느 한 항에 있어서, 상기 숙주 세포는 티오레독신 환원효소 유전자의 유전자 기능의 감소된 수준을 갖는, 키트.
- 제46항에 있어서, 상기 티오레독신 환원효소 유전자는 trxB인, 키트.
- 제36항 내지 제47항 중 어느 한 항에 있어서, 상기 숙주 세포는 글루타티온 합성효소 유전자의 유전자 기능의 감소된 수준을 갖는, 키트.
- 제48항에 있어서, 상기 글루타티온 합성효소 유전자는 gshA 및 gshB로 이루어진 군으로부터 선택되는, 키트.
- 제36항 내지 제49항 중 어느 한 항에 있어서, 상기 숙주 세포는 AhpC의 돌연변이체 형태를 발현하는, 키트.
- 제36항 내지 제50항 중 어느 한 항에 있어서, 적어도 1종의 L-아라비노스 유도성 프로모터 및 AraC를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 L-아라비노스 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 가지며, 상기 유전자는 araA 및 araB로 이루어진 군으로부터 선택되는, 키트.
- 제36항 내지 제50항 중 어느 한 항에 있어서, 적어도 1종의 프로피오네이트 유도성 프로모터 및 PrpR을 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 프로피오네이트 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 가지며, 상기 유전자는 prpB 및 prpD로 이루어진 군으로부터 선택되는, 키트.
- 제36항 내지 제52항 중 어느 한 항에 있어서, 상기 숙주 세포는 (a) 상기 araBAD 유전자의 결실; (b) 상기 araE 유전자의 변경된 유전자 기능; (c) lacY(A177C) 유전자; (d) 상기 prpB 유전자의 감소된 유전자 기능; (e) 상기 sbm/scpA-ygfD/argK-ygfGH/scpBC 유전자의 감소된 유전자 기능; (f) 상기 gor 및 trxB 유전자의 감소된 유전자 기능; (g) AhpC의 돌연변이체 형태를 코딩하는 폴리뉴클레오타이드; (h) 상기 AscG 유전자의 감소된 유전자 기능; (i) 신호 펩타이드가 결여된 DsbC의 형태를 코딩하는 폴리뉴클레오타이드; (j) Erv1p를 코딩하는 폴리뉴클레오타이드; 및 (k) 단백질 다이설파이드 아이소머라제를 코딩하는 폴리뉴클레오타이드 중 하나 이상을 포함하는, 키트.
- (누락)
- 유전자 산물을 제조하는 방법으로서, 상기 방법은 제18항 내지 제35항 중 어느 한 항의 상기 숙주 세포의 배양물을 성장시키는 단계로서, 상기 숙주 세포는 각각의 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 포함하는 적어도 1종의 발현 작제물을 포함하는, 상기 숙주 세포의 배양물을 성장시키는 단계, 및 상기 배양물에 상기 유도성 프로모터의 각각에 대한 유도인자를 첨가하는 단계를 포함하는, 유전자 산물을 제조하는 방법.
- 제55항에 있어서, 상기 방법은 상기 배양물로부터 적어도 1종의 유전자 산물을 정제하는 단계를 더 포함하는, 유전자 산물을 제조하는 방법.
- 제55항 또는 제56항에 있어서, 상기 유전자 산물은 다량체 생성물의 일부인, 유전자 산물을 제조하는 방법.
- 제55항 내지 제57항 중 어느 한 항에 있어서, 상기 적어도 1종의 유전자 산물은 (a) 면역글로불린 중쇄; (b) 면역글로불린 경쇄; 및 (c) (a) 내지 (b) 중 어느 하나의 단편으로 이루어진 군으로부터 선택되는, 유전자 산물을 제조하는 방법.
- 제58항에 있어서, 상기 다량체 생성물은 항체인, 유전자 산물을 제조하는 방법.
- 제55항 또는 제56항에 있어서, 상기 유전자 산물은 프리프로인슐린인, 유전자 산물을 제조하는 방법.
- 제60항에 있어서, 상기 프리프로인슐린은 L-아라비노스 유도성 프로모터로부터 발현되는, 유전자 산물을 제조하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/740,475 | 2015-06-16 | ||
US14/740,475 US20150353940A1 (en) | 2013-08-05 | 2015-06-16 | Vectors for use in an inducible coexpression system |
PCT/US2016/037942 WO2016205570A1 (en) | 2015-06-16 | 2016-06-16 | Vectors for use in an inducible coexpression system |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180020213A true KR20180020213A (ko) | 2018-02-27 |
Family
ID=54769087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187000942A KR20180020213A (ko) | 2015-06-16 | 2016-06-16 | 유도성 공발현 시스템에 사용을 위한 벡터 |
Country Status (13)
Country | Link |
---|---|
US (2) | US20150353940A1 (ko) |
EP (2) | EP4039810A1 (ko) |
JP (2) | JP6976860B2 (ko) |
KR (1) | KR20180020213A (ko) |
CN (1) | CN107849572A (ko) |
AU (2) | AU2016278242B2 (ko) |
CA (1) | CA2986443A1 (ko) |
DK (1) | DK3310919T3 (ko) |
ES (1) | ES2906725T3 (ko) |
HK (1) | HK1253045A1 (ko) |
IL (2) | IL256094B2 (ko) |
MX (1) | MX2017016400A (ko) |
WO (1) | WO2016205570A1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017106583A1 (en) * | 2015-12-15 | 2017-06-22 | Absci, Llc | Cytoplasmic expression system |
EP3856760A1 (en) | 2018-09-25 | 2021-08-04 | AbSci, LLC | Protein purification methods |
CN113260626A (zh) | 2018-11-05 | 2021-08-13 | 豪夫迈·罗氏有限公司 | 在原核宿主细胞中产生双链蛋白质的方法 |
CN111269294B (zh) * | 2018-12-05 | 2023-03-28 | 广州中国科学院先进技术研究所 | 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用 |
CN111979206B (zh) * | 2019-05-24 | 2021-08-17 | 深圳瑞德林生物技术有限公司 | 固定化融合酶及用其制备谷胱甘肽的方法 |
CN113528410A (zh) * | 2021-06-23 | 2021-10-22 | 云舟生物科技(广州)有限公司 | 一种用于快速高效诱导表达外源蛋白的大肠杆菌工程菌及其制备方法与应用 |
WO2023114905A1 (en) | 2021-12-16 | 2023-06-22 | Absci Corporation | Membrane-associated fusion proteins to increase the competency of cells |
WO2023114452A1 (en) | 2021-12-17 | 2023-06-22 | Absci Corporation | Solid-phase screening for high-performing bacterial strains |
WO2023122567A1 (en) | 2021-12-21 | 2023-06-29 | Absci Corporation | Fola selection assay to identify strains with increased soluble target protein expression |
WO2023122448A1 (en) | 2021-12-23 | 2023-06-29 | Absci Corporation | Products and methods for heterologous expression of proteins in a host cell |
WO2023129881A1 (en) * | 2021-12-30 | 2023-07-06 | Absci Corporation | Knockout of ptsp gene elevates active gene expression |
US20230268026A1 (en) | 2022-01-07 | 2023-08-24 | Absci Corporation | Designing biomolecule sequence variants with pre-specified attributes |
WO2024006269A1 (en) | 2022-06-29 | 2024-01-04 | Absci Corporation | Affinity screening method |
WO2024040020A1 (en) | 2022-08-15 | 2024-02-22 | Absci Corporation | Quantitative affinity activity specific cell enrichment |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3344618B2 (ja) | 1997-06-20 | 2002-11-11 | 株式会社エイチ・エス・ピー研究所 | シャペロン発現プラスミド |
ATE242320T1 (de) * | 1997-12-05 | 2003-06-15 | Europ Lab Molekularbiolog | Neue methode zur klonierung dns unter anwendung des e. coli rece/rect rekombinationssystems |
US6780405B1 (en) | 2000-04-28 | 2004-08-24 | Avant Immunotherapeutics, Inc. | Regulated antigen delivery system (RADS) |
US6979556B2 (en) * | 2000-12-14 | 2005-12-27 | Genentech, Inc. | Separate-cistron contructs for secretion of aglycosylated antibodies from prokaryotes |
AU2002245142B2 (en) * | 2000-12-14 | 2007-07-05 | Genentech, Inc. | Prokaryotically produced antibodies and uses thereof |
MXPA04001566A (es) * | 2001-08-27 | 2004-05-17 | Genentech Inc | Un sistema para expresion y ensamblado de anticuerpos. |
WO2005040388A2 (en) * | 2003-08-22 | 2005-05-06 | Nucleonics Inc. | Eukariotic expression systems for expression of inhibitory rna in multiple intracellular compartments |
US8227241B2 (en) * | 2004-03-12 | 2012-07-24 | Unigene Laboratories, Inc. | Bacterial host cell for the direct expression of peptides |
DE102004061846A1 (de) * | 2004-12-22 | 2006-07-13 | Basf Ag | Mehrfachpromotoren |
EP1888763B1 (en) | 2005-06-06 | 2015-08-12 | Pfenex Inc. | Mannitol induced promoter systems in bacterial host cells |
US8178338B2 (en) | 2005-07-01 | 2012-05-15 | The Regents Of The University Of California | Inducible expression vectors and methods of use thereof |
EP2155789B1 (en) | 2007-05-01 | 2013-07-24 | Research Development Foundation | Immunoglobulin fc libraries |
CN107119095B (zh) | 2008-01-03 | 2022-07-05 | 康乃尔研究基金会有限公司 | 原核生物中的糖基化蛋白表达 |
KR100958096B1 (ko) * | 2008-02-11 | 2010-05-14 | 한국과학기술원 | 염색체 특정 부위 제거용 재조합 벡터 및 이를 이용한미생물 내 염색체 특정 부위의 제거방법 |
DK2379722T3 (da) * | 2008-12-16 | 2017-01-02 | C-Lecta Gmbh | Ekspressionsvektor |
CA2754928A1 (en) * | 2009-03-10 | 2010-09-16 | Athena Biotechnologies, Inc. | Reducing carbon dioxide production and increasing ethanol yield during microbial ethanol fermentation |
US8623652B2 (en) * | 2009-04-06 | 2014-01-07 | Lucigen Corporation | Host-vector system for cloning and expressing genes |
NO2501406T3 (ko) * | 2009-11-19 | 2018-05-19 | ||
US8603797B2 (en) * | 2010-03-17 | 2013-12-10 | Cornell University | Methods and compositions for targeted mutagenesis in bacteria |
EP2386641A1 (en) | 2010-05-11 | 2011-11-16 | Université Catholique De Louvain | Method for extracellular production of recombinant biomolecules in a microorganism |
EP3187586B1 (en) * | 2012-08-05 | 2019-09-25 | Absci, LLC | Inducible coexpression system |
WO2015020690A1 (en) * | 2013-08-05 | 2015-02-12 | Aronora, Inc. | Coordinated coexpression of thrombin |
-
2015
- 2015-06-16 US US14/740,475 patent/US20150353940A1/en not_active Abandoned
-
2016
- 2016-06-16 ES ES16812476T patent/ES2906725T3/es active Active
- 2016-06-16 EP EP21214179.0A patent/EP4039810A1/en active Pending
- 2016-06-16 KR KR1020187000942A patent/KR20180020213A/ko not_active Application Discontinuation
- 2016-06-16 EP EP16812476.6A patent/EP3310919B1/en active Active
- 2016-06-16 CN CN201680035423.4A patent/CN107849572A/zh active Pending
- 2016-06-16 IL IL256094A patent/IL256094B2/en unknown
- 2016-06-16 DK DK16812476.6T patent/DK3310919T3/da active
- 2016-06-16 IL IL307555A patent/IL307555A/en unknown
- 2016-06-16 MX MX2017016400A patent/MX2017016400A/es unknown
- 2016-06-16 JP JP2017565149A patent/JP6976860B2/ja active Active
- 2016-06-16 WO PCT/US2016/037942 patent/WO2016205570A1/en active Application Filing
- 2016-06-16 CA CA2986443A patent/CA2986443A1/en active Pending
- 2016-06-16 AU AU2016278242A patent/AU2016278242B2/en active Active
- 2016-09-11 US US15/261,984 patent/US11371048B2/en active Active
-
2018
- 2018-09-27 HK HK18112425.0A patent/HK1253045A1/zh unknown
-
2021
- 2021-06-28 JP JP2021106797A patent/JP2021153600A/ja active Pending
-
2022
- 2022-09-08 AU AU2022228166A patent/AU2022228166A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
IL256094A (en) | 2018-02-28 |
IL256094B2 (en) | 2024-03-01 |
EP4039810A1 (en) | 2022-08-10 |
JP6976860B2 (ja) | 2021-12-08 |
US20160376602A1 (en) | 2016-12-29 |
IL256094B1 (en) | 2023-11-01 |
WO2016205570A1 (en) | 2016-12-22 |
ES2906725T3 (es) | 2022-04-20 |
CN107849572A (zh) | 2018-03-27 |
MX2017016400A (es) | 2018-03-02 |
DK3310919T3 (da) | 2022-02-14 |
EP3310919B1 (en) | 2021-12-15 |
EP3310919A1 (en) | 2018-04-25 |
CA2986443A1 (en) | 2016-12-22 |
AU2016278242A1 (en) | 2018-01-18 |
HK1253045A1 (zh) | 2019-06-06 |
US11371048B2 (en) | 2022-06-28 |
IL307555A (en) | 2023-12-01 |
AU2016278242B2 (en) | 2022-06-09 |
JP2021153600A (ja) | 2021-10-07 |
JP2018518957A (ja) | 2018-07-19 |
AU2022228166A1 (en) | 2022-09-29 |
EP3310919A4 (en) | 2019-01-09 |
US20150353940A1 (en) | 2015-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20180020213A (ko) | 유도성 공발현 시스템에 사용을 위한 벡터 | |
AU2019202844B2 (en) | Inducible coexpression system | |
CN111757890A (zh) | 发酵工艺 | |
CN116083398B (zh) | 分离的Cas13蛋白及其应用 | |
US20220364104A1 (en) | Vectors for use in an inducible coexpression system | |
US20040235121A1 (en) | High copy number plasmids and their derivatives |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |