KR20220130719A - 엔벨로프 완전성이 변화된 유전자 변형 세균 및 이의 용도 - Google Patents
엔벨로프 완전성이 변화된 유전자 변형 세균 및 이의 용도 Download PDFInfo
- Publication number
- KR20220130719A KR20220130719A KR1020227027267A KR20227027267A KR20220130719A KR 20220130719 A KR20220130719 A KR 20220130719A KR 1020227027267 A KR1020227027267 A KR 1020227027267A KR 20227027267 A KR20227027267 A KR 20227027267A KR 20220130719 A KR20220130719 A KR 20220130719A
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- bacterium
- ompa
- lpp
- amino acid
- Prior art date
Links
- 241000894006 Bacteria Species 0.000 title claims abstract description 276
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 297
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 241
- 101150074251 lpp gene Proteins 0.000 claims abstract description 221
- 241000588724 Escherichia coli Species 0.000 claims abstract description 184
- 101150115693 ompA gene Proteins 0.000 claims abstract description 181
- 230000035772 mutation Effects 0.000 claims abstract description 158
- 101100082540 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) pcp gene Proteins 0.000 claims abstract description 153
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 153
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 153
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 140
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 136
- 229920001184 polypeptide Polymers 0.000 claims abstract description 134
- 101100295756 Acinetobacter baumannii (strain ATCC 19606 / DSM 30007 / JCM 6841 / CCUG 19606 / CIP 70.34 / NBRC 109757 / NCIMB 12457 / NCTC 12156 / 81) omp38 gene Proteins 0.000 claims abstract description 110
- 101150042295 arfA gene Proteins 0.000 claims abstract description 110
- 101150087557 omcB gene Proteins 0.000 claims abstract description 110
- 230000009089 cytolysis Effects 0.000 claims abstract description 69
- 101150080603 ybiS gene Proteins 0.000 claims abstract description 67
- 239000013612 plasmid Substances 0.000 claims abstract description 66
- 101150109137 erfK gene Proteins 0.000 claims abstract description 60
- 101150062871 ycfS gene Proteins 0.000 claims abstract description 29
- 206010020751 Hypersensitivity Diseases 0.000 claims abstract description 26
- 108020004705 Codon Proteins 0.000 claims description 175
- 238000012217 deletion Methods 0.000 claims description 154
- 230000037430 deletion Effects 0.000 claims description 154
- 102000004169 proteins and genes Human genes 0.000 claims description 142
- 235000018102 proteins Nutrition 0.000 claims description 141
- 230000001580 bacterial effect Effects 0.000 claims description 92
- 150000001413 amino acids Chemical class 0.000 claims description 85
- 235000001014 amino acid Nutrition 0.000 claims description 72
- 229940024606 amino acid Drugs 0.000 claims description 71
- 239000004475 Arginine Substances 0.000 claims description 68
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 68
- 238000000034 method Methods 0.000 claims description 65
- 108010079246 OMPA outer membrane proteins Proteins 0.000 claims description 46
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 44
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 37
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 35
- 239000004472 Lysine Substances 0.000 claims description 35
- 238000004519 manufacturing process Methods 0.000 claims description 35
- 101100105776 Escherichia coli (strain K12) ycfS gene Proteins 0.000 claims description 34
- 235000003704 aspartic acid Nutrition 0.000 claims description 34
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 34
- 235000013922 glutamic acid Nutrition 0.000 claims description 32
- 239000004220 glutamic acid Substances 0.000 claims description 32
- 210000004899 c-terminal region Anatomy 0.000 claims description 25
- 230000007935 neutral effect Effects 0.000 claims description 25
- 239000000203 mixture Substances 0.000 claims description 22
- 210000004436 artificial bacterial chromosome Anatomy 0.000 claims description 21
- 238000000746 purification Methods 0.000 claims description 20
- 230000001086 cytosolic effect Effects 0.000 claims description 18
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 17
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 17
- 235000009582 asparagine Nutrition 0.000 claims description 17
- 229960001230 asparagine Drugs 0.000 claims description 17
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 15
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 14
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 13
- 235000004279 alanine Nutrition 0.000 claims description 13
- 230000002934 lysing effect Effects 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 13
- 238000012258 culturing Methods 0.000 claims description 11
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 abstract description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 144
- 108091028043 Nucleic acid sequence Proteins 0.000 description 83
- 108020004414 DNA Proteins 0.000 description 62
- 102000053602 DNA Human genes 0.000 description 62
- 101150077062 pal gene Proteins 0.000 description 55
- 230000003204 osmotic effect Effects 0.000 description 53
- 230000035939 shock Effects 0.000 description 52
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 description 49
- 108010013639 Peptidoglycan Proteins 0.000 description 49
- 239000012528 membrane Substances 0.000 description 45
- 210000004027 cell Anatomy 0.000 description 39
- 101100203377 Bacillus subtilis (strain 168) slp gene Proteins 0.000 description 34
- 101100242529 Drosophila melanogaster Pal2 gene Proteins 0.000 description 34
- 101150012565 LRIT1 gene Proteins 0.000 description 34
- 101100477497 Mus musculus Shcbp1 gene Proteins 0.000 description 34
- 230000004083 survival effect Effects 0.000 description 27
- 241000660147 Escherichia coli str. K-12 substr. MG1655 Species 0.000 description 22
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 18
- 238000011084 recovery Methods 0.000 description 15
- 239000013598 vector Substances 0.000 description 14
- 230000003993 interaction Effects 0.000 description 13
- 239000001963 growth medium Substances 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 11
- 210000000805 cytoplasm Anatomy 0.000 description 11
- 238000004090 dissolution Methods 0.000 description 11
- 238000010790 dilution Methods 0.000 description 10
- 239000012895 dilution Substances 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 9
- 210000001322 periplasm Anatomy 0.000 description 9
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 238000001962 electrophoresis Methods 0.000 description 8
- 229930027917 kanamycin Natural products 0.000 description 8
- 229960000318 kanamycin Drugs 0.000 description 8
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 8
- 229930182823 kanamycin A Natural products 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 230000006798 recombination Effects 0.000 description 8
- 238000005215 recombination Methods 0.000 description 8
- 230000001225 therapeutic effect Effects 0.000 description 8
- 101150026268 yfiB gene Proteins 0.000 description 8
- 101150013150 yqhH gene Proteins 0.000 description 8
- 239000003242 anti bacterial agent Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 239000012139 lysis buffer Substances 0.000 description 7
- 230000001254 nonsecretory effect Effects 0.000 description 7
- 241001302160 Escherichia coli str. K-12 substr. DH10B Species 0.000 description 6
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 6
- 210000003578 bacterial chromosome Anatomy 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 210000000170 cell membrane Anatomy 0.000 description 6
- 230000004151 fermentation Effects 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 241000588921 Enterobacteriaceae Species 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 5
- 108090001030 Lipoproteins Proteins 0.000 description 5
- 102000004895 Lipoproteins Human genes 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 229940088710 antibiotic agent Drugs 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 238000000855 fermentation Methods 0.000 description 5
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 101150010361 yiaD gene Proteins 0.000 description 5
- 241000588722 Escherichia Species 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 241000192128 Gammaproteobacteria Species 0.000 description 4
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 4
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 4
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 101150025220 sacB gene Proteins 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 239000012137 tryptone Substances 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 3
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 3
- 101100138661 Bacillus subtilis (strain 168) malP gene Proteins 0.000 description 3
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 3
- 101100432255 Escherichia coli (strain K12) yiaD gene Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 3
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 3
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 3
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 3
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 3
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- RHTNTTODYGNRSP-UHFFFAOYSA-N Tolazoline hydrochloride Chemical compound Cl.C=1C=CC=CC=1CC1=NCCN1 RHTNTTODYGNRSP-UHFFFAOYSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 3
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 238000013019 agitation Methods 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000004132 cross linking Methods 0.000 description 3
- 239000003599 detergent Substances 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 2
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 2
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 2
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 2
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 2
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 2
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 2
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 2
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 2
- 241000588732 Atlantibacter hermannii Species 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- 241001135761 Deltaproteobacteria Species 0.000 description 2
- 241001240954 Escherichia albertii Species 0.000 description 2
- 101100207099 Escherichia coli (strain K12) tolA gene Proteins 0.000 description 2
- 241000588720 Escherichia fergusonii Species 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 2
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 2
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 2
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 238000003794 Gram staining Methods 0.000 description 2
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 2
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- 241001647841 Leclercia adecarboxylata Species 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 2
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 2
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 2
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000588771 Morganella <proteobacterium> Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 2
- 101710116435 Outer membrane protein Proteins 0.000 description 2
- 101710178358 Peptidoglycan-associated lipoprotein Proteins 0.000 description 2
- 108010090127 Periplasmic Proteins Proteins 0.000 description 2
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 2
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- 241000192142 Proteobacteria Species 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000588768 Providencia Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- 241000588717 Shimwellia blattae Species 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 2
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 2
- NSOMQRHZMJMZIE-GVARAGBVSA-N Tyr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NSOMQRHZMJMZIE-GVARAGBVSA-N 0.000 description 2
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 2
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 2
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 2
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000607734 Yersinia <bacteria> Species 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 230000006037 cell lysis Effects 0.000 description 2
- 238000000749 co-immunoprecipitation Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000001493 electron microscopy Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- -1 excD Proteins 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 101150086840 fumD gene Proteins 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000008826 genomic mutation Effects 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 101150023479 hsdS gene Proteins 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 101150020087 ilvG gene Proteins 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 2
- 101150066555 lacZ gene Proteins 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 101150093139 ompT gene Proteins 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000013077 scoring method Methods 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- DJXDNYKQOZYOFK-GUBZILKMSA-N (4s)-4-[[2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]-5-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-5-oxopentanoic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DJXDNYKQOZYOFK-GUBZILKMSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000290113 Acidithiobacillaceae Species 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 241001135756 Alphaproteobacteria Species 0.000 description 1
- 241001248480 Alteromonadaceae Species 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 1
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 1
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 1
- YLVGUOGAFAJMKP-JYJNAYRXSA-N Arg-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YLVGUOGAFAJMKP-JYJNAYRXSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- OWUCNXMFJRFOFI-BQBZGAKWSA-N Asn-Gly-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OWUCNXMFJRFOFI-BQBZGAKWSA-N 0.000 description 1
- XLHLPYFMXGOASD-CIUDSAMLSA-N Asn-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLHLPYFMXGOASD-CIUDSAMLSA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- ICDDSTLEMLGSTB-GUBZILKMSA-N Asn-Met-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ICDDSTLEMLGSTB-GUBZILKMSA-N 0.000 description 1
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 1
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- 241001135755 Betaproteobacteria Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000606007 Cardiobacteriaceae Species 0.000 description 1
- 241000190834 Chromatiaceae Species 0.000 description 1
- 241000588923 Citrobacter Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 238000011537 Coomassie blue staining Methods 0.000 description 1
- UWXFFVQPAMBETM-ZLUOBGJFSA-N Cys-Asp-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UWXFFVQPAMBETM-ZLUOBGJFSA-N 0.000 description 1
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 238000011238 DNA vaccination Methods 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241001148568 Epsilonproteobacteria Species 0.000 description 1
- 101100242561 Escherichia coli (strain K12) pal gene Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- SOIAHPSKKUYREP-CIUDSAMLSA-N Gln-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SOIAHPSKKUYREP-CIUDSAMLSA-N 0.000 description 1
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- DFRYZTUPVZNRLG-KKUMJFAQSA-N Gln-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DFRYZTUPVZNRLG-KKUMJFAQSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- BJVBMSTUUWGZKX-JYJNAYRXSA-N Gln-Tyr-His Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BJVBMSTUUWGZKX-JYJNAYRXSA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- VNBNZUAPOYGRDB-ZDLURKLDSA-N Gly-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)O VNBNZUAPOYGRDB-ZDLURKLDSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 1
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 1
- DFHVLUKTTVTCKY-PBCZWWQYSA-N His-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O DFHVLUKTTVTCKY-PBCZWWQYSA-N 0.000 description 1
- RXVOMIADLXPJGW-GUBZILKMSA-N His-Asp-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RXVOMIADLXPJGW-GUBZILKMSA-N 0.000 description 1
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 1
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 1
- OSZUPUINVNPCOE-SDDRHHMPSA-N His-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OSZUPUINVNPCOE-SDDRHHMPSA-N 0.000 description 1
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 1
- XVZJRZQIHJMUBG-TUBUOCAGSA-N His-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CN=CN1)N XVZJRZQIHJMUBG-TUBUOCAGSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- MCGOGXFMKHPMSQ-AVGNSLFASA-N His-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MCGOGXFMKHPMSQ-AVGNSLFASA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- XLDYDEDTGMHUCZ-GHCJXIJMSA-N Ile-Asp-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N XLDYDEDTGMHUCZ-GHCJXIJMSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- LWWILHPVAKKLQS-QXEWZRGKSA-N Ile-Gly-Met Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N LWWILHPVAKKLQS-QXEWZRGKSA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- JQEBITVYKUCBMC-SRVKXCTJSA-N Met-Arg-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JQEBITVYKUCBMC-SRVKXCTJSA-N 0.000 description 1
- DBOMZJOESVYERT-GUBZILKMSA-N Met-Asn-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N DBOMZJOESVYERT-GUBZILKMSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 1
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 1
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- YCUSPBPZVJDMII-YUMQZZPRSA-N Met-Gly-Glu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O YCUSPBPZVJDMII-YUMQZZPRSA-N 0.000 description 1
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 1
- CUICVBQQHMKBRJ-LSJOCFKGSA-N Met-His-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O CUICVBQQHMKBRJ-LSJOCFKGSA-N 0.000 description 1
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 1
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- SBFPAAPFKZPDCZ-JYJNAYRXSA-N Met-Pro-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SBFPAAPFKZPDCZ-JYJNAYRXSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 1
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 1
- 241000589330 Methylococcaceae Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 101100301239 Myxococcus xanthus recA1 gene Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 241000606752 Pasteurellaceae Species 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- UEXCHCYDPAIVDE-SRVKXCTJSA-N Phe-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- SPXWRYVHOZVYBU-ULQDDVLXSA-N Phe-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N SPXWRYVHOZVYBU-ULQDDVLXSA-N 0.000 description 1
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 1
- 241001674048 Phthiraptera Species 0.000 description 1
- 241000350158 Prioria balsamifera Species 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000588733 Pseudescherichia vulneris Species 0.000 description 1
- 241000947836 Pseudomonadaceae Species 0.000 description 1
- 108010052388 RGES peptide Proteins 0.000 description 1
- 101150019079 Rfk gene Proteins 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- CTLVSHXLRVEILB-UBHSHLNASA-N Ser-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N CTLVSHXLRVEILB-UBHSHLNASA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- SVWQEIRZHHNBIO-WHFBIAKZSA-N Ser-Gly-Cys Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CS)C(O)=O SVWQEIRZHHNBIO-WHFBIAKZSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- GUHLYMZJVXUIPO-RCWTZXSCSA-N Thr-Met-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GUHLYMZJVXUIPO-RCWTZXSCSA-N 0.000 description 1
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- FOAJSVIXYCLTSC-PJODQICGSA-N Trp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N FOAJSVIXYCLTSC-PJODQICGSA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 1
- HHPSUFUXXBOFQY-AQZXSJQPSA-N Trp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O HHPSUFUXXBOFQY-AQZXSJQPSA-N 0.000 description 1
- UPUNWAXSLPBMRK-XTWBLICNSA-N Trp-Thr-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UPUNWAXSLPBMRK-XTWBLICNSA-N 0.000 description 1
- YTHWAWACWGWBLE-MNSWYVGCSA-N Trp-Tyr-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 YTHWAWACWGWBLE-MNSWYVGCSA-N 0.000 description 1
- RWTFCAMQLFNPTK-UMPQAUOISA-N Trp-Val-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 RWTFCAMQLFNPTK-UMPQAUOISA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- FGJWNBBFAUHBEP-IHPCNDPISA-N Tyr-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FGJWNBBFAUHBEP-IHPCNDPISA-N 0.000 description 1
- PDKILSUYSUGCAO-JBACZVJFSA-N Tyr-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PDKILSUYSUGCAO-JBACZVJFSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- JXGWQYWDUOWQHA-DZKIICNBSA-N Val-Gln-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N JXGWQYWDUOWQHA-DZKIICNBSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- IEBGHUMBJXIXHM-AVGNSLFASA-N Val-Lys-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N IEBGHUMBJXIXHM-AVGNSLFASA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- HVRRJRMULCPNRO-BZSNNMDCSA-N Val-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 HVRRJRMULCPNRO-BZSNNMDCSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 241000607493 Vibrionaceae Species 0.000 description 1
- 241001453327 Xanthomonadaceae Species 0.000 description 1
- 241001561178 Zetaproteobacteria Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 108010047506 alanyl-glutaminyl-glycyl-valine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 239000002585 base Substances 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 238000010378 bimolecular fluorescence complementation Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000001332 colony forming effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerol Substances OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 101150095671 ldtA gene Proteins 0.000 description 1
- 101150055637 ldtB gene Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 101150038221 matP gene Proteins 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 101150058012 mrcA gene Proteins 0.000 description 1
- 101150116543 mrcB gene Proteins 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 101150034434 repE gene Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 101150078341 rop gene Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 101150115631 thiE1 gene Proteins 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 101150035767 trp gene Proteins 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/01—Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/06—Lysis of microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Mycology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 용해에 대해 과민성인 유전자 변형된 그람-음성 세균, 특히 이. 콜라이에 관한 것이다. 따라서, 이러한 세균은 핵산 추출, 바람직하게는 게놈외 핵산 추출(예: 플라스미드), 및/또는 바람직하게는 게놈외 핵산에 의해 코딩된 폴리펩티드의 수율을 개선하는 데 유용하다. 실제로, 본 발명자들은 엔벨로프 완전성을 변화시키는 적어도 2개의 돌연변이 유전자의 조합을 사용하여 이. 콜라이 균주를 조작했다. 보다 구체적으로, 적어도 하나의 돌연변이 유전자는 ompA이고, 적어도 하나의 돌연변이 유전자는, 예를 들면, lpp 유전자, ybiS 유전자, ycfS 유전자 및 erfK 유전자 등의 Lpp 기능성에 관여하는 유전자이다. 이러한 조합은 또한 ompA 유전자 및/또는 lpp 유전자와 상동성인 유전자의 돌연변이를 포함한다.
Description
본 발명은 유전자 변형된 미생물, 특히 변화된 엔벨로프 완전성(envelope integrity)을 갖는 유전자 변형된 세균의 분야에 관한 것이다. 보다 정확하게는, 야생형 균주와 비교하여, ompA 유전자 및 lpp 유전자, 또는 Lpp 기능에 관여하는 폴리펩티드를 코딩하는(encoding) 유전자에서 돌연변이의 조합을 갖는 조작된 이. 콜라이 균주는 세균 용해(bacterial lysis)에 과민성인 것으로 밝혀졌다. 따라서, 이들 세균 균주는 핵산 및 폴리펩티드의 생산 및 정제를 개선하는 방법에 유용하다.
일반적으로 게놈외 핵산(extra-genomic) 분자, 특히 플라스미드는 세균 염색체와는 독립적으로 세균 내에서 복제할 수 있는 유전자 요소이다. 플라스미드(plasmid) 및 플라스미드-코딩 단백질은 발효 프로세스에 의해 이. 콜라이 균주에서 산업적으로 유리하게 생산될 수 있고, 이어서 치료적 적용을 포함하는 다양한 적용을 위해 대규모로 정제될 수 있다. 실제로, 이. 콜라이는 발견 이래 충분히 특성화되었고, 이 세균 균주의 조작 용이성을 개선하기 위해 다수의 도구가 실행되었다. 그 결과, 이. 콜라이 균주는 핵산 및 폴리펩티드의 생산을 위해 선택 생산 플랜트(production plant of choice)로 전환되었다.
플라스미드의 치료상 이점의 예로서, 면역요법과 DNA 백신접종을 들 수 있고, 이를 위해, 하나 이상의 항원(들)을 코딩하는 유전자 조작된 DNA 플라스미드가 환자에게 주사되어, 세포가 보호 면역 반응을 부여하는 상기 항원을 직접 생산할 수 있도록 한다.
그러나, DNA 플라스미드 생산의 수율은 현재 이 신규한 치료 방법의 개발의 병목 현상이고, 향후 수요가 확대할 것이다. 세균 세포의 용해는 고품질의 플라스미드 생산 프로세스에서 중요한 단계이다. 이 단계는 대량의 용해 완충액을 수반하고, 다른 세포 파편 및 게놈 DNA로부터 플라스미드 DNA의 분리 및 정제에 비용이 많이 드는 하류 프로세스를 생성한다. 상기의 이유로 인해, 세포 용해시에 플라스미드 DNA의 방출을 증가시키는 솔루션은 수십 년에 걸쳐 업계의 주목을 불러일으켰다.
현재까지, 세포 용해의 최적화를 목적으로 하는 대부분의 연구 노력은 지금까지 용해 프로토콜에 초점을 맞추었다. 놀랍게도, 연구자들은, 본 출원인의 지식에 따르면, 세균 용해 감수성을 개선하기 위해 세균 세포를 변형시키는 것에 초점을 맞추지 않았다.
학술 연구자들로부터의 다수의 보고는 세균 엔벨로프 성분의 성분의 구조-기능 관계를 해명하는 것에 중점을 두었다[참조: 예를 들면, Asmar et al.; PLOS Biology; 2017; Vol. 15(12):e2004303]. 이. 콜라이 등의 그람-음성 세균에는 삼투압 쇼크(osmotic shock)에 의한 용해로부터 세포를 보호하는 엔벨로프가 함유되어 있다는 것이 수십 년 동안 공지되어 있다. 엔벨로프는 세포질과 접촉하는, 세포질 막(CM) 또는 내막(IM)과, 환경과의 경계면을 구성하는 외막(OM)으로 구분된다. CM/IM과 OM은 짧은 펩티드로 가교된 글리칸 가닥의 단일층 중합체인 펩티도글리칸(PG)을 포함하는 구획인 주변세포질에 의해 분리된다. 이. 콜라이에서, OM을 PG에 연결하는 것은 Lpp 단백질에 의해 수행된다. 이 단백질은 지질화된 N-말단을 통해 OM에 고정되고, C-말단 리신을 통해 PG에 함유된 짧은 펩티드에 부착된다. Lpp는 YbiS(LdtB라고도 지칭됨), YcfS(LdtC라고도 지칭됨) 및 ErfK(LdtA라고도 지칭됨)의 3개 주변세포질(periplasmic) 효소에 의해 매개되는 2개의 구조 사이의 유일한 공유 연결을 제공한다. 2개의 추가 OM 단백질은 이온 상호작용을 통해 OM-PG 연결에 참여한다. 하나는 Tol-Pal 수축 장치에 속하는 지단백질 Pal이다. 지단백질 Pal은 TolA, TolB 및 ompA와 독립적으로 상호작용한다[참조: Cascales et al.; Molecular Microbiology; 2004, Vol. 51(3):873-885]. 다른 하나는 가용성 도메인을 통해 주변세포질 내부로 확장되는 β-배럴 ompA 단백질이다. 양쪽 단백질 모두는 주변세포질 도메인을 통해 PG와 비공유적으로 상호작용한다. 문헌[참조: Sonntaget al. (Journal of Bacteriology; 1978; Vol. 136(1):280-285)]은 형태, 전해질의 성장 필요성, 소수성 항생물질 및 세제에 대한 민감성, 전자 현미경에 의한 외막의 토폴로지의 관점에서 l pp 및 ompA에 이중 결실 돌연변이를 갖는 이. 콜라이 균주를 특성화했다. 또한, 문헌[참조: Park et al. (The FASEB Journal; 2012; Vol. 26:219-228)]은 ompA가 세포벽 펩티도글리칸에 고정되는 메커니즘을 특정했다.
분비된 단백질 또는 세포외 배지로 방출되기 전에 주변세포질 구획에서 표적화되는 또는 단백질의 생산 및 정제에 대해 최첨단 기술에 대한 관심이 현저하다[참조: 특허에 대한 검토는 Yoon et al.; Recent patents on biotechnology; 2010; Vol. 4:23-29 참조]. 예를 들면, 문헌[참조: Chen et al. (Microbial Biotechnology; 2014; Vol. 7:360-370)]은 이. 콜라이의 mrcA , mrcB , pal 및 lpp 유전자가 녹아웃된 표적 단백질의 세포외 생산을 위한 누출 균주의 작제를 개시했다. WO 제2014044728호는 루멘 내에서 유리되어 있는 이종 단백질을 포함하는 외막 소포(OMV)를 제조하는 방법을 개시하고 있다. 외막 소포의 생성 메커니즘은 문헌[참조: Schwechheimer et al. (Biochemistry; 2013; Vol. 52:3031-3040; and BMC Microbiology; 2014; Vol. 14:324-335)]에 개시되어 있다. WO 제2016183531호는 외막을 펩티도글리칸 골격에 결합시키는 단백질을 코딩하는 하나 이상의 유전자의 돌연변이를 갖는 유전자 조작된 세균, 및 고-페닐알라닌혈증을 치료하는 방법을 개시하고 있다.
omp , tol , excC , excD , lpp , env 및 lky 등의 유전자에 돌연변이를 갖는 이. 콜라이의 누출 돌연변이체는 이러한 주변세포질 단백질을 세포외 배지로 방출하는 데 특별한 관심이 있는 것으로 보고되었다[참조: Kleiner-Grote et al.; Engineering in Life Sciences; 2018, Vol. 18:532-550].
마지막으로, WO 제2016210373호는 재조합 세균 세포가 외인성 환경 신호에 반응하여 이종 유전자를 발현하고, 최종적으로 재조합 세균 세포를 사멸하는 독소를 발현하도록 프로그래밍될 수 있음을 개시했다. 이 전략은 질환과 장애를 치료하기 위해 사용될 수 있다.
따라서, 세균 균주, 예를 들면, 증식 능력을 유지하면서, 세균 용해에 대해 과민성이고, 따라서 게놈외 핵산 분자 및/또는 재조합 폴리펩티드, 특히 재조합 세포질 폴리펩티드의 생산에서 수율을 개선시킬 수 있게 하는, 이. 콜라이 균주를 동정할 필요가 있다.
요약
본 발명의 제1 양태는, 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하는 유전자 변형된 에스케리키아 콜라이(Escherichia coli) 세균에 관한 것으로, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체(homologue)이고, 적어도 하나의 돌연변이된 유전자는 Lpp 기능성(functionality)에 관여하는 유전자이고, 단, 세균은 ompA 유전자의 완전한 결실 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는다.
일부 실시형태에서, Lpp 기능성에 관여하는 적어도 하나의 유전자는 lpp, ybiS, ycfS 및 erfK 유전자 및/또는 이들의 동족체, 및 이들의 임의의 조합을 포함하거나, 또는 이들로 이루어진 그룹으로부터 선택된다.
특정 실시형태에서, 상기 적어도 2개의 돌연변이된 유전자는 하기 조합 중 하나를 포함한다:
- ompA 및 lpp, 및/또는 이의 동족체;
- ompA 및 ybiS, 및/또는 ycfS 및/또는 erfK, 및/또는 이의 동족체;
- ompA, lpp, ybiS 및 erfK, 및/또는 이의 동족체;
- ompA, lpp, ycfS 및 erfK, 및/또는 이의 동족체; 또는
- ompA, lpp, ybiS 및 ycfS, 및/또는 이의 동족체.
일부 실시형태에서, 상기 돌연변이된 ompA 유전자는 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 ompA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실을 포함하고; 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다.
특정 실시형태에서, lpp 유전자의 돌연변이는 위치 58의 리신(K)을 코딩하는 코돈의 결실; 위치 57의 아르기닌(R)을 코딩하는 코돈을 또 다른 아미노산, 바람직하게는 중성으로 하전된 아미노산, 보다 바람직하게는 류신(L)을 코딩하는 코돈으로 치환하는 것; 위치 58의 리신(K)을 코딩하는 코돈을 아르기닌(R)을 코딩하는 코돈으로 치환하는 것; lpp 유전자의 완전한 결실; 및 이들의 조합을 포함하거나, 이들로 이루어진 그룹으로부터 선택되고; 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다.
일부 실시형태에서, 상기 돌연변이된 ybiS 유전자, ycfS 유전자 및/또는 erfK 유전자, 및/또는 이의 동족체는 각각 상기 ybiS, ycfS 및/또는 erfK 유전자 및/또는 이의 동족체의 결실로 이루어진다.
특정 실시형태에서, 상기 세균은 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다)를 갖는다.
일부 실시형태에서, 상기 세균은 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 ompA 단백질의 C-말단 부분의 결실(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다)를 갖는다.
특정 실시형태에서, 상기 세균은 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다)으로 이루어진 ompA 유전자의 돌연변이; ybiS 유전자의 완전한 결실; ycfS 유전자의 완전한 결실; 및 erfK 유전자의 완전한 결실을 갖는다.
일부 실시형태에서, 상기 세균은 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 위치 57의 아르기닌(R)을 코딩하는 코돈을 류신(L)을 코딩하는 코돈으로 치환하는 것(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다)으로 이루어진 lpp 유전자의 돌연변이; 각각의 ybiS 유전자의 결실; 및 ycfS 유전자의 완전한 결실을 갖는다.
특정 실시형태에서, 상기 세균은 위치 241의 아스파르트산(D)을 코딩하는 코돈을 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다)로 이루어진 ompA 유전자의 돌연변이; 및 lpp 유전자의 완전한 결실을 갖는다.
일부 실시형태에서, 상기 세균은, 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 추가로 포함한다.
특정 실시형태에서, 상기 게놈외 핵산 분자는 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 추가로 포함한다.
본 발명의 또 다른 양태는, 적어도 하나의 게놈외 핵산 분자의 생산 및 정제를 위한, 적어도 하나의 게놈외 핵산 분자를 포함하고 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이 유전자를 포함하는, 유전자 변형된 이. 콜라이 세균의 용도로서, 상기 세균은 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 변화된 엔벨로프 완전성을 갖고, 적어도 하나의 돌연변이 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자인, 용도에 관한 것이다.
일부 실시형태에서, 적어도 하나의 게놈외 핵산 분자는 플라스미드, 코스미드(cosmid) 및 세균 인공 염색체(BAC)를 포함하거나 이들로 이루어진 그룹으로부터 선택된다.
본 발명의 추가 양태는, 바람직하게는 적어도 하나의 게놈외 핵산 분자에 의해 코딩되는 적어도 하나의 폴리펩티드의 생산 및 정제를 위한, 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 포함하고 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균의 용도로서, 상기 세균은 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 변화된 엔벨로프 완전성을 갖고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자인, 용도에 관한 것이다.
특정 실시형태에서, 적어도 하나의 폴리펩티드는 적어도 하나의 세포질 폴리펩티드이다.
일부 실시형태에서, 적어도 돌연변이된 ompA 유전자는 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실로 이루어지고; 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다.
특정 실시형태에서, Lpp 기능성에 관여하는 적어도 돌연변이된 유전자는 위치 58의 리신(K)을 코딩하는 코돈의 결실(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다)로 이루어진 lpp 유전자의 돌연변이, 또는 ybiS 유전자의 완전한 결실, 및/또는 ycfS 유전자의 완전한 결실 및/또는 erfK 유전자의 완전한 결실로 이루어진다.
일부 실시형태에서, 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 적어도 하나의 돌연변이된 유전자가 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자가 Lpp 기능성에 관여하는 유전자이다.
특정 실시형태에서, 세균은 ompA 유전자의 완전한 결실 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는다.
일부 실시형태에서, 세균은 본 발명에서 정의된 바와 같다.
또 다른 양태에서, 본 발명은, 하기 단계를 포함하는, 적어도 하나의 게놈외 핵산 분자의 생산 및 정제 방법에 관한 것이다:
a) 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균을 배양하는 단계로서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이고, 상기 세균은 적어도 하나의 게놈외 핵산 분자를 포함하여 적어도 게놈외 핵산 분자를 증폭시키는, 단계;
b) 단계 a)에서 수득된 세균을 바람직하게는 화학적 용해에 의해 용해시켜 용해 혼합물을 수득하는 단계; 및
c) 단계 b)에서 수득된 용해 혼합물로부터 상기 증폭된 게놈외 핵산 분자를 정제하는 단계.
특정 실시형태에서, 적어도 하나의 게놈외 핵산 분자는 플라스미드, 코스미드 및 세균 인공 염색체(BAC)를 포함하거나 이들로 이루어진 그룹으로부터 선택된다.
본 발명의 또 다른 양태는, 하기 단계를 포함하는, 바람직하게는 게놈외 핵산 분자에 의해 코딩되는 적어도 하나의 폴리펩티드의 생산 및 정제 방법에 관한 것이다:
a) 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균을 배양하는 단계로서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 상기 적어도 하나의 돌연변이된 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이고, 상기 세균은 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 포함하여 적어도 하나의 폴리펩티드를 합성하는, 단계;
b) 단계 a)에서 수득된 세균을 용해시켜 용해 혼합물을 수득하는 단계; 및
c) 단계 b)에서 수득된 용해 혼합물로부터 상기 적어도 하나의 폴리펩티드를 정제하는 단계.
일부 실시형태에서, 적어도 하나의 폴리펩티드는 하나의 세포질 폴리펩티드이다.
특정 실시형태에서, 적어도 돌연변이된 ompA 유전자는 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실로 이루어지고; 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다.
일부 실시형태에서, Lpp 기능성에 관여하는 적어도 돌연변이된 유전자는 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다), 또는 ybiS 유전자의 완전한 결실, 및/또는 ycfS 유전자의 완전한 결실 및/또는 erfK 유전자의 완전한 결실로 이루어진다.
특정 실시형태에서, 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 상기 적어도 하나의 돌연변이된 유전자가 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자가 Lpp 기능성에 관여하는 유전자이다.
일부 실시형태에서, 세균은 ompA 유전자의 완전한 결실 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는다.
특정 실시형태에서, 세균은 본 개시에서 정의된 바와 같다.
본 발명의 한 가지 양태는, (i) 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균으로서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 적어도 하나의 돌연변이된 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자인, 세균; 및 (ii) 게놈외 핵산 분자로 상기 세균을 형질전환시키는 수단을 포함하는, 키트(kit)에 관한 것이다.
일부 실시형태에서, 유전자 변형된 에스케리키아 콜라이 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 적어도 하나의 돌연변이된 유전자가 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자가 Lpp 기능성에 관여하는 유전자이다.
정의
본 발명에서 이하의 용어는 하기와 같은 의미를 갖는다.
수치 앞의 "약"은 당해 수치 값의 플러스 또는 마이너스 10%에 이르는 범위를 포함한다. 용어 "약"이 지칭하는 값은 그 자체가 또한 구체적으로 및 바람직하게는 개시되어 있는 것으로 이해해야 한다.
"적어도 하나"는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상을 포함한다.
"적어도 2개"는 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상을 포함한다.
본 명세서에 사용된 "세균"은 하나의 세균 세포를 지칭한다. 따라서, 용어 "세균"은 세균 세포의 모집단을 지칭한다.
"Lpp 기능성에 관여하는 유전자"는 발현이 생리학적으로 기능적 Lpp 폴리펩티드를 생성하는 임의의 유전자를 지칭한다. 본 명세서에서, "생리학적으로 기능적 Lpp 폴리펩티드"는 세균 엔벨로프에 위치하고, 그람-음성 세균, 특히 이. 콜라이에서 엔벨로프 완전성에 관여하는 Lpp 폴리펩티드를 지칭하는 것으로 이해되어야 한다.
본 명세서에 사용된 "게놈외 핵산 분자"는 세균에 존재하지만, 세균 염색체 내에 또는 세균 염색체의 일부에 통합되지 않는 데옥시리보핵산(DNA) 분자를 지칭한다. 게놈외 핵산은 선형 또는 환상일 수 있다. 게놈외 핵산은, 예를 들면, 항생물질에 대한 숙주 세균 내성을 부여하는 서열, 또는 청색/백색 선택을 위한 β-갈락토시다제를 코딩하는 lacZ 서열 등의 선택 가능한 마커를 포함할 수 있다. 게놈외 핵산은 통상, 예를 들면, repE 유전자 또는 rop 유전자 등의 이들의 복제 및 세포당 카피 수의 조절을 가능하게 하는 서열(예: 복제 기점 pMB1, ColE1 또는 f1)을 포함한다. 게놈외 핵산은, 예를 들면, T7 프로모터 또는 SP6 프로모터 등의 하류 서열의 발현을 가능하게 하는 프로모터 서열을 포함할 수 있다. 표현 "게놈외 핵산"에는 플라스미드, 코스미드 및 세균 인공 염색체(BAC)가 포함되지만, 이들로 한정되지 않는다.
"플라스미드"는, 최대 약 15kb의 DNA 단편의 카피를 작성 및/또는 변형시키기 위해(즉, 15,000개 염기쌍), 분자 생물학에서 복제 벡터로서 사용될 수 있는 환상 이중 가닥 DNA 분자로서 가장 일반적으로 발견되는 작은 게놈외 DNA 분자를 지칭한다. 플라스미드는 또한, 프로모터 서열의 하류의 플라스미드에서 발견되는 핵산 서열에 의해 코딩되는 목적 단백질을 대량으로 생성하기 위한 발현 벡터로서 사용될 수 있다. 용어 "코스미드"는 람다 파지로부터의 cos 서열을 함유하는 하이브리드 플라스미드를 지칭하고, 이는 코스미드를 파지 헤드로 팩키징하고, 이어서 코스미드가 환화되어 플라스미드로서 복제될 수 있는 세균 세포의 감염을 가능하게 한다. 코스미드는 통상 약 32 내지 52kb 크기 범위의 DNA 단편에 대한 클로닝 벡터로 사용된다. "세균 인공 염색체" 또는 "BAC"는, 세균 세포의 분열 후에 상기 게놈외 DNA 분자를 균일하게 분할할 수 있는, 기능적 생식 플라스미드를 기반으로 하는 게놈외 핵산 분자를 지칭한다. BAC는 통상 약 150 내지 350kb 크기 범위의 DNA 단편에 대한 클로닝 벡터로서 사용된다.
본 명세서에 사용된 "유전자"는 특정 기능과 관련된 핵산 서열을 지칭한다. 유전자에 의해 코딩된 최종 산물의 예는 RNA와 단백질이다.
"유전자 변형된"은 미생물, 특히 본 발명의 문맥에서 그람-음성 세균과 관련하여 본 명세서에서 사용되고, 활발하게 생성 및/또는 선택되는 적어도 하나의 돌연변이를 포함한다.
본 명세서에 사용된 "그람-음성"은 세포질 내막과 외막 사이에 샌드위치된 얇은 펩티도글리칸 벽으로 구성되는 세포 엔벨로프를 특징으로 하는 세균을 지칭한다. 그람-음성균은 덴마크 세균학자 한스 크리스티안 그람(Hans Christian Gram)이 개발한 그람 염색법으로 용이하게 식별할 수 있다. 두꺼운 펩티도글리칸 벽으로 둘러싸여 있는 세포질 막을 갖는 그람 양성균은 그람 염색 후에 자색으로 염색되는 반면, 그람-음성균은 핑크/적색으로 염색된다.
"동일성"은, 2개 이상의 폴리펩티드 서열 또는 2개 이상의 핵산 서열 사이의 관계에서 사용되는 경우, 각각 2개 이상의 아미노산 잔기 또는 2개 이상의 뉴클레오티드의 스트링 사이의 정합 수에 의해 결정되는, 폴리펩티드 또는 핵산 서열(각각) 사이의 서열 관련성의 정도를 지칭한다. "동일성"은 특정 수학적 모델 또는 컴퓨터 프로그램(즉, "알고리즘")에 의해 처리되는 갭 정렬(존재하는 경우)을 갖는 2개 이상의 서열 중 더 작은 것 사이의 동일한 정합의 비율을 측정한다. 관련된 폴리펩티드 또는 핵산 서열의 동일성은 공지된 방법에 의해 용이하게 계산할 수 있다. 이러한 방법에는 문헌[참조: Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part 1, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M. Stockton Press, New York, 1991; and Carillo et al., SIAM J. Applied Math. 48, 1073 (1988)]에 기재된 것들이 포함되지만, 이들로 한정되지 않는다. 동일성을 결정하기 위해 바람직한 방법은 시험된 서열 사이에 최대 정합을 제공하도록 설계되었다. 동일성을 결정하는 방법은 공개적으로 사용 가능한 컴퓨터 프로그램에 설명되어 있다. 2개 서열 사이의 동일성을 결정하기 위한 바람직한 컴퓨터 프로그램 방법은 GAP[참조: Devereux et al., Nucl. Acid. Res. 2, 387 (1984); Genetics Computer Group, University of Wisconsin, Madison, Wis.], BLASTP, BLASTN, TBLASTN 및 FASTA[참조: Altschul et al., Nucl. Acid. Res. al., J. Mol. Biol. 215, 403-410(1990)]를 포함하는 GCG 프로그램 팩키지를 포함한다. BLASTX 프로그램은 미국 국립 바이오테크놀로지 정보 센터(National Center for Biotechnology Information; NCBI) 및 기타 정보원[참조: BLAST Manual, Altschul et al. NCB/NLM/NIH Bethesda, Md. 20894; Altschul et al., 상기 참조]으로부터 공개적으로 이용 가능하다. 공지된 스미스 워터맨(Smith Waterman) 알고리즘을 사용하여 동일성을 결정할 수 있다. 일 실시형태에서, 용어 동일성은 그것이 지칭하는 서열의 전체 길이에 걸쳐 측정된다.
"돌연변이"는 본 명세서에서 유전자와 관련하여 사용되고, 상기 유전자의 핵산 서열의 변경을 지칭한다. 돌연변이는 퓨린을 퓨린(A ↔ G)으로 또는 피리미딘을 피리미딘(C ↔ T)으로 교환하는 전이, 또는 퓨린을 피리미딘으로 또는 피리미딘을 퓨린으로 교환하는 전이(C/T ↔ A/G) 등의 유전자의 핵산 서열에서 하나 이상의 뉴클레오티드(들)의 치환을 포함할 수 있다. 돌연변이는 또한 유전자의 핵산 서열에서 하나 이상의 뉴클레오티드(들)의 결실 또는 삽입을 포함할 수 있다. 돌연변이는 최종적 유전자 산물(RNA 또는 단백질)을 코딩하는 서열과 관련될 수 있다. 돌연변이가 폴리펩티드의 코딩 서열에 영향을 미치고 상기 상응하는 폴리펩티드의 아미노산 서열의 변화를 초래하는 경우, 돌연변이는 상기 폴리펩티드의 아미노산 서열의 변형에 의해 정의될 수 있다. 당업자는 상기 폴리펩티드를 코딩하는 핵산 서열에서 목적 코돈(들)을 동정하고, 유전자 코드를 사용하여 핵산 서열 중의 적절한 변형(들)을 설계하여 전사 및 번역 후, 목적하는 돌연변이된 폴리펩티드 서열을 수득할 수 있다. 본 명세서에 사용된 용어 돌연변이는 또한 최종적 유전자 생성물(RNA 또는 폴리펩티드)을 코딩하는 전체 서열을 포함하는 유전자의 핵산 서열에서의 결실을 포함한다. 후자 유형의 돌연변이는 본 명세서에서 "완전한 결실"로 지칭된다. 일 실시형태에서, 용어 돌연변이는 본 명세서에서 "유전자 x에 돌연변이(들)를 포함하는 생물"이라는 문장에서 사용되는 경우, 상기 미생물에 존재하는, 세균 염색체 상의 또는 게놈외 핵산 분자 상의, 유전자 x의 임의의 카피(또는 카피들)가 상기 돌연변이(들)를 포함하는 것을 의미한다. 본 명세서에 사용된 바와 같이, 돌연변이는 돌연변이된 유전자의 상응하는 mRNA로의 전사에 영향을 미칠 수 있고; mRNA의 상응하는 폴리펩티드로의 번역에 영향을 미칠 수 있다. 일 실시형태에서, 돌연변이(들)를 갖는 핵산 서열은 세균의 세균 염색체에서 발견되는 핵산 서열의 경우와 같이 미생물의 자손에 의해 유전된다. 일 실시형태에서, 돌연변이(들)를 갖는 핵산 서열은 세균의 염색체외 DNA에서 발견된다.
"동족체"는, 참조 폴리펩티드 또는 핵산 서열(또한 "구조적 동족체"라고도 지칭됨)과 30% 내지 99.99% 서열 동일성을 공유하고/하거나, 참조 폴리펩티드 또는 핵산 서열과 동일하거나 유사한 생물학적 기능을 공유하는 폴리펩티드 또는 핵산 서열을 지칭할 수 있다. 서열 동일성은 상기 설명된 바와 같이 결정될 수 있다(또한 "기능적 동족체"로 지칭됨). 생물학적 기능은 당해 기술분야에 공지된 임의의 적합한 방법, 또는 이로부터 유래하는 방법에 의해 평가될 수 있다. 일부 실시형태에서, 동족체는 구조적 동족체이다. 대안적 실시형태에서, 동족체는 기능적 동족체이다.
"아미노산 보존"은, 2개 이상의 폴리펩티드의 서열 또는 2개 이상의 핵산 서열의 사이의 관계에서 사용되는 경우, 상기 폴리펩티드 또는 핵산 서열의 소정 영역 사이의 아미노산 서열 관련성의 정도를 지칭한다. 예를 들면, 소정 아미노산 위치에 대한 아미노산 보존은 고유한 아미노산 또는 관련 아미노산을 의미할 수 있다. 예시적으로, Leu, Ile, Val 등의 소수성 아미노산은 관련 아미노산으로 간주될 수 있다. 이는 양으로 하전된 아미노산 Lys, Arg, His 및 음으로 하전된 아미노산 Glu, Asp도 동일하다. 일부 실시형태에서, 2개 이상의 폴리펩티드로부터의 영역 내의 보존된 아미노산은 "컨센서스 서열"로 지칭될 수 있다.
"농도" 또는 "농축하다"는 목적 표적을 국소적으로 축적하는 작용을 지칭할 수 있다.
"정제" 또는 "정제하다"는 화합물의 혼합물로부터 목적의 순수한 또는 실질적으로 순수한 화합물을 수득하는 작용을 지칭할 수 있다.
"폴리펩티드"는 펩티드 결합에 의해 함께 연결된 적어도 50개의 아미노산의 선형 중합체를 지칭한다. 일부 실시형태에서, 폴리펩티드는 세포질 폴리펩티드, 및/또는 비-분비형 폴리펩티드, 즉 합성시에 세포질에 잔류하게 되는 폴리펩티드를 지칭한다. 일부 실시형태에서, 세포질 폴리펩티드는 폴딩되어 있고, 즉 2차원 또는 3차원 구조를 획득했다.
"단백질"은 하나 이상의 펩티드 또는 폴리펩티드, 및 임의로 비-폴리펩티드 보조인자(cofactor)로 형성된 기능적 실체를 지칭한다. 일부 실시형태에서, 단백질은 세포질 단백질, 또는 비-분비형 단백질, 즉 합성시에 세포질에 잔류하게 되는 단백질을 지칭한다. 일부 실시형태에서, 세포질 단백질은 폴딩되어 있고, 즉 2차원 또는 3차원 구조를 획득했다.
"세균 용해"는 세포질을 포함하여 세포로부터 가용성 물질의 방출을 지칭한다.
상세한 설명
본 발명은, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여, 변화된 엔벨로프 완전성을 갖고 세균 용해에 대해 과민성인 유전자 변형된 그람-음성 세균, 즉 에스케리키아 콜라이(Escherichia coli)에 관한 것이다. 본 발명자들은, 적합한 배양 조건에서 성장을 유지할 수 있고, 플라스미드 또는 플라스미드-코딩된 폴리펩티드의 고수율을 제공할 수 있는 이. 콜라이 유래의 세균 균주를 조작했다. 또한, 플라스미드 또는 플라스미드-코딩된 폴리펩티드, 특히 세포질 폴리펩티드는 조작된 이. 콜라이 균주의 세균 용해에 의해 고수율로 회수될 수 있다. 마지막으로, 본 명세서에 제공된 실험 데이터는 플라스미드 또는 플라스미드-코딩된 폴리펩티드(재조합 폴리펩티드) 등의 고수율의 세포질 분자가 게놈 핵산, 세균 세포질 단백질 및/또는 세포 파편의 오염을 감소시키면서 회수될 수 있음을 시사한다.
본 발명의 제1 양태는, 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이 유전자를 포함하는 유전자 변형된 그람-음성 세균에 관한 것으로, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이다.
본 명세서에 사용된 바와 같이, "적어도 2개"는 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상을 포함한다.
일부 실시형태에서, 상기 세균은 프로테오박테리움 문(Proteobacterium phylum), 바람직하게는 감마 프로테오세균(Gamma Proteobacteria) 부류, 바람직하게는 장내세균(Enterobacteriaceae) 과, 바람직하게는 에스케리키아(Escherichia) 속, 보다 바람직하게는 에스케리키아 콜라이(Escherichia coli) 종의 세균을 포함하는 그룹으로부터 선택된다.
일부 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균은 비-병원성 세균이다. 본 명세서에 사용된 바와 같이, 표현 "비-병원성"은 생물, 특히 동물 생물, 바람직하게는 인간 생물과 접촉할 때에 생물, 특히, 동물 생물, 바람직하게는 인간 생물에 해를 끼치지 않는 세균을 지칭한다. 특히, 표현 "해를 끼치지 않는다"은 세균이 감염, 장애 또는 질환을 일으키지 않는다는 것을 의미하는 것으로 의도된다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균은 프로테오 세균 문의 세균을 포함하는 그룹으로부터 선택된다. 본 명세서에서 사용된 바와 같이, 프로테오세균 문의 세균은 알파 프로테오박테리아(Alpha Proteobacteria) 클래스, 베타 프로테오박테리아(Beta Proteobacteria) 클래스, 감마 프로테오박테리 아(Gamma Proteobacteria) 클래스, 델타 프로테오박테리아(Delta Proteobacteria) 클래스, 엡실론 프로테오박테리아(Epsilon Proteobacteria) 클래스 및 제타 프로테오박테리아(Zeta Proteobacteria) 클래스를 포함한다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균은 감마 프로테오박테리아 클래스의 것이다. 본 명세서에서 사용된 바와 같이, 감마 프로테오박테리아 클래스의 세균은 아시디티오바실라세애 ( Acidithiobacillaceae ), 아에르모나 다세애(Aermonadaceae), 알테로모나다세애 ( Alteromonadaceae ), 카르디오박테리아세애 (Cardiobacteriaceae), 크로마티아세애 ( Chromatiaceae ), 엔테로박테리아세애 (Enterobacteriaceae), 레지오넬라애 ( Legionellae ), 메틸로코카세 애(Methylococcaceae), 오세아노스피릴라세애 ( Oceanospirillae ), 파스퇴렐라세 애(Pasteurellaceae), 슈도모나다세애 ( Pseudomonadaceae ), 티오트리카 애(Thiotrichaea), 비브리오나세애 ( Vibrionaceae ) 및 크산토모나다세 애(Xanthomonadaceae) 과의 세균을 포함한다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균은 엔테로박테리아세애 과의 것이다. 본 명세서에 사용된 용어 "엔테로박테리아세애"는 50개 이상의 속 및 200개 이상의 종을 포함하는 그람-음성 세균의 과를 지칭한다. 본 발명의 범위 내에서, 엔테로박테리아세애 과의 세균의 비제한적 예는 시트로박 터(Citrobacter), 엔테로박터( Enterobacter ), 에스케리키아( Escherichia ), 클렙시 엘라(Klebsiella), 모르가넬라 ( Morganella ), 프로테우스( Proteus ), 프로비덴시 아(Providencia), 살모넬라(Salmonella), 세라티아( Serratia ), 시겔라 ( Shigella ) 및 예르시니아(Yersinia) 속의 세균을 포함한다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균은 에스케리키아 속의 것이다. 본 발명의 범위 내에서, 에스케리키아 속의 세균의 비제한적 예는 이. 아데카복실라타 (E. adecarboxylata ), 이. 알베르티 (E. albertii ), 이. 블라 타에(E. blattae ), 이. 콜라이 (E. coli ), 이. 페르구소니 (E. fergusonii ), 이. 헤르만니 (E. hermannii ) 및 이. 불네리스 (E. vulneris ) 종의 세균을 포함한다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균은 에스케리키아 콜라이 종의 것이다. 본 명세서에 사용된 바와 같이, "에스케리키아 콜라이"("이. 콜라이"로도 지칭됨)는 다수의 포유동물 개체, 특히 인간 개체의 장내 세균총에서 자연적으로 발견되는 세균 종을 지칭한다. 이. 콜라이 종에 속하는 세균은 또한 다양한 생성물을 합성하기 위한 산업적 발효 프로세스에서 사용되고, 특히 본 발명의 문맥에서, 예를 들면, 폴리펩티드 및 핵산 분자 등의 생물학적 분자를 합성하기 위해 사용된다.
본 발명의 또 다른 양태는 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균에 관한 것으로, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자는 Lpp 기능성에 관여하는 유전자이고, 단, 세균은 ompA 유전자의 완전한 결실 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는다.
본 명세서에 사용된 바와 같이, "Lpp 기능성에 관여하는 유전자"는 발현이 생리학적으로 기능성인 Lpp 폴리펩티드를 생성하는 임의의 유전자를 지칭한다. 일부 실시형태에서, Lpp 기능성에 관여하는 유전자에는 Lpp 폴리펩티드를 코딩하는 lpp 유전자 자체가 포함된다. 일부 실시형태에서, Lpp 기능성에 관여하는 유전자는 각각 YbiS, YcfS 및 ErfK 폴리펩티드를 코딩하는 유전자 ybiS, ycfS 및 erfK 중 어느 하나를 포함한다.
일부 실시형태에서, Lpp 기능성에 관여하는 적어도 하나의 유전자는 lpp, ybiS, ycfS 및 erfK 유전자, 및/또는 이들의 동족체, 및 이들의 임의의 조합을 포함하거나, 이들로 이루어진 그룹으로부터 선택된다.
일 실시형태에서, 이. 콜라이 세균 균주는 BL21(DE3) 균주, DH5-알파 균주, DH10B 균주, INV110 균주, Mach1 균주, MG1655 균주, 로제타(Rosetta®) 균주 및 TOP10 균주를 포함하는 비제한적 그룹으로부터 선택된다.
실제로, BL21(DE3) 균주는 하기 유전자형: F- ompT hsdSB(rB -, mB -) gal dcm (DE3)을 갖고; DH5-알파 균주는 하기 유전자형: F- φ80lacZΔM15Δ(lacZYA-argF)U169 recA1 endA1 hsdR17(rK -,mK +) phoA supE44 λ- thi-1 gyrA96 relA1을 갖고; DH10B 균주는 하기 유전자형: F- mcrA Δ(mrr-hsdRMS-mcrBC) φ80lacZΔM15 ΔlacX74 recA1 endA1 araD139 Δ(ara-leu)7697 galU galK λ- rpsL(StrR) nupG를 갖고; INV110 균주는 하기 유전자형: F' [traD36 proAB lacIq lacZΔM15] rpsL (StrR) thr leu endA thi-1 lacY galK galT ara tonA tsx dam dcm supE44 Δ(lac-proAB) Δ(mcrC-mrr)102::Tn10(TetR)을 갖고; Mach1 균주는 하기 유전자형: F- φ80lacZΔM15 ΔlacX74 hsdR(rK -, mK +) ΔrecA1398 endA1 tonA를 갖고; MG1655 균주는 하기 유전자형: F- λ- ilvG - rfb-50 rph-1을 갖고; 로제타(Rosetta®) 균주는 하기 유전자형: F- ompT hsdS B(rB - mB -) gal dcm (DE3) pRARE (CamR)을 갖고; TOP10 균주는 하기 유전자형: F- mcrA Δ(mrr-hsdRMS-mcrBC) φ80lacZΔM15 ΔlacX74 recA1 araD139 Δ(ara-leu)7697 galU galK λ - rpsL(StrR) endA1 nupG를 갖는다.
본 발명의 범위 내에서, 표현 "엔벨로프 완전성에 관여하는 단백질"은 그람-음성 세균의 세균 엔벨로프의 구조적 요소로서 및/또는 세균 엔벨로프의 합성 및/또는 유지에 관여하는 요소로서 공지되어 있는 단백질을 지칭하는 것을 의미한다. 엔벨로프 완전성에 관여하는 단백질의 예에는 주변세포질 단백질, 외막 단백질, 주변세포질 펩티도글리칸에 대한 내막의 부착에 관여하는 단백질, 외막에 대한 주변세포질 펩티도글리칸의 부착에 관여하는 단백질, 및/또는 외막에 대한 내막의 부착에 관여하는 단백질이 포함되지만, 이들로 한정되지 않는다. 예시적으로, 본 발명에 따른 엔벨로프 완전성에 관여하는 단백질에는 외막 단백질 A(OmpA) 및/또는 이의 동족체; 주요 외막 프로-지단백질 Lpp(Lpp) 및/또는 이의 동족체; 펩티도글리칸 관련 지단백질(Pal) 등의 트랜스-엔벨로프 Tol-Pal 복합체의 단백질, 및 YbiS, YcfS 및 ErfK 등의 주변세포질 펩티도글리칸에 존재하는 짧은 펩티드 골격에 대한 Lpp의 가교에 관여하는 L,D-트랜스펩티다제가 포함되지만, 이들로 한정되지 않는다.
일부 실시형태에서, 엔벨로프 완전성에 관여하는 단백질을 코딩하는 유전자의 돌연변이는 엔벨로프 완전성을 변화시키는 돌연변이이다. 특정 실시형태에서, 엔벨로프 완전성의 변화는 엔벨로프 완전성의 손상 또는 파괴이다.
그람-음성 세균의 세균 엔벨로프의 완전성을 평가하는 기술은 당업자에게 공지되어 있고, 공지된 크기의 표지된 화합물(예: 표지된 덱스트란)에 대한 투과성의 시험, 삼투압 쇼크에 대한 내성의 시험을 포함하지만, 이들로 한정되지 않는다. 일부 실시형태에서, 세균 엔벨로프의 완전성은, 예를 들면, 문헌[참조: Ishikawa et al. (Mol Microbiol. 2016 Aug;101(3):394-410)]에 개시된 바와 같은 펩티도글리칸과 상호작용 단백질 사이의 상호작용을 평가함으로써 평가될 수 있다.
일부 실시형태에서, 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 유전자 각각에서의 돌연변이는 주변세포질 펩티도글리칸에 대한 내막의 부착, 외막에 대한 주변세포질 펩티도글리칸의 부착 또는 외막에 대한 내막의 부착을 파괴하는 돌연변이이다.
주변세포질 펩티도글리칸에 대한 외막의 부착을 평가하는 기술은 당업자에게 공지되어 있고, 전자 현미경에 의한 주변세포질의 두께 관찰, 외막 수포형성의 현미경 관찰, 상호작용 단백질의 공-면역침전, 상호작용 단백질의 가교를 포함하지만, 이들로 한정되지 않는다.
일부 실시형태에서, 상기 적어도 2개의 돌연변이된 유전자는 ompA, lpp, pal, ybiS, ycfS 및 erfK 유전자, 및/또는 이의 동족체를 포함하는 그룹으로부터 선택되고, 적어도 2개의 돌연변이된 유전자 중 적어도 하나는 ompA 유전자 또는 lpp 유전자, 또는 이의 동족체이다.
특정 실시형태에서, 상기 적어도 2개의 돌연변이된 유전자는 하기 조합 중 하나를 포함한다:
- ompA 및 lpp, 및/또는 이의 동족체;
- lpp 및 pal, 및/또는 이의 동족체;
- ompA 및 pal, 및/또는 이의 동족체;
- ompA, ybiS, ycfS 및 erfK, 및/또는 이의 동족체;
- ompA, lpp, ybiS 및 erfK, 및/또는 이의 동족체;
- ompA, lpp, ycfS 및 erfK, 및/또는 이의 동족체; 또는
- ompA, lpp, ybiS 및 ycfS, 및/또는 이의 동족체.
특정 실시형태에서, 상기 적어도 2개의 돌연변이된 유전자는 하기 조합 중 하나를 포함한다:
- ompA 및 lpp, 및/또는 이의 동족체;
- lpp, 및 pal, 및/또는 이의 동족체;
- ompA, pal, 및/또는 이의 동족체;
- ompA, ybiS, ycfS 및 erfK, 및/또는 이의 동족체;
- ompA, lpp, ybiS 및 erfK, 및/또는 이의 동족체;
- ompA, lpp, ycfS 및 erfK, 및/또는 이의 동족체; 또는
- ompA, lpp, ybiS 및 ycfS, 및/또는 이의 동족체.
일부 실시형태에서, 적어도 2개의 돌연변이된 유전자는 하기 조합 중 하나를 포함한다:
- ompA 및 lpp, 및/또는 이의 동족체;
- ompA 및 ybiS, 및/또는 ycfS 및/또는 erfK, 및/또는 이의 동족체;
- ompA, lpp, ybiS 및 erfK, 및/또는 이의 동족체;
- ompA, lpp, ycfS 및 erfK, 및/또는 이의 동족체; 또는
- ompA, lpp, ybiS 및 ycfS, 및/또는 이의 동족체.
세균 유전자에서 돌연변이를 생성하는 기술은 당업자에게 공지되어 있고, 파지 형질도입, 화학적 돌연변이유발, 상동 재조합, CRISPR-cas9에 의한 게놈 편집, 아연-핑거 도메인-뉴클레아제 융합을 포함하지만, 이들로 한정되지 않는다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 ompA 유전자 및/또는 이의 동족체에 적어도 하나의 돌연변이를 포함한다.
ompA 유전자는 외막 단백질 A를 코딩하는 이. 콜라이의 게놈에서 자연적으로 발견된다. OmpA 단백질은 이의 N-말단 β-배럴에 의해 그람-음성 세균의 세균 엔벨로프의 외막을 가로 질러 확장한다. 단백질의 가용성 C 말단 부분은 주변세포질 내부로 확장되고, 주변세포질 펩티도글리칸과 비-공유적으로 상호작용한다. ompA 유전자는 본 발명에 따른 그람-음성 세균의 엔벨로프 완전성에 관여하는 단백질을 코딩하는 것으로 이해된다. 보다 정확하게는, ompA 유전자는 주변세포질 펩티도글리칸에 대한 세균 엔벨로프의 부착에 관여하는 단백질을 코딩한다.
특정 실시형태에서, ompA 유전자는 EcoCyc 수탁번호 EG10669를 갖는 핵산을 지칭한다. 일부 실시형태에서, ompA 유전자는 서열번호 1에 대해 적어도 75% 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 본 발명의 범위 내에서, 표현 "적어도 75% 핵산 동일성"은 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 및 100%의 핵산 동일성을 포함한다.
2개의 핵산 서열의 동일성 수준은 최신 기술로부터 이용 가능한 공지된 알고리즘 중 임의의 하나를 사용하여 수행될 수 있다.
예시적으로, 핵산 동일성 백분율은 CLUSTAL W 소프트웨어(버전 1.83)를 사용하여 하기와 같이 설정되는 파라미터를 결정할 수 있다:
- 저속/정확한 정렬의 경우: (1) 갭 개방 페널티: 15; (2) 갭 연장 페널티: 6.66; (3) 중량 매트릭스: IUB;
- 고속/근사 정렬의 경우: (4) K-튜플(워드) 크기: 2; (5) 갭 페널티: 5; (6) 상단 대각선의 수: 5; (7) 윈도우 크기: 4; (8) 스코어링 방법: PERCENT.
일부 실시형태에서, ompA 유전자는 서열번호 1에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다.
일 실시형태에서, ompA 유전자는 서열번호 1로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, OmpA 단백질은 UniProtKB 수탁번호 P0A910을 갖는 프레단백질(preprotein)을 지칭한다. 일부 실시형태에서, ompA 프레단백질은 서열번호 2에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 본 발명의 범위 내에서, 표현 "적어도 75%의 아미노산 동일성"은 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 및 100%의 아미노산 동일성을 포함한다.
예시적으로, 아미노산 동일성 백분율은 또한 CLUSTAL W 소프트웨어(버전 1.83)를 사용하여 하기와 같이 설정되는 파라미터를 결정할 수 있다.
- 저속/정확한 정렬의 경우: (1) 갭 개방 페널티: 10.00; (2) 갭 연장 페널티: 0.1; (3) 단백질 중량 매트릭스: BLOSUM;
- 고속/근사 정렬의 경우: (4) 갭 패널티: 3; (5) K-튜플(단어) 크기: 1; (6) 상단 대각선의 수: 5; (7) 윈도우 크기: 5; (8) 스코어링 방법: PERCENT.
일부 실시형태에서, OmpA 프레단백질은 서열번호 2에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다.
일 실시형태에서, OmpA 프레단백질은 서열번호 2로 이루어진 아미노산 서열에 의해 표시된다.
일 실시형태에서, ompA 유전자의 돌연변이는 주변세포질 펩티도글리칸에 대한 OmpA의 결합의 파괴를 촉진하는 돌연변이이다. 본 명세서에 사용된 바와 같이, 표현 "주변세포질 펩티도글리칸에 대한 OmpA의 결합을 방해하는"은 변화되지 않은 엔벨로프 완전성을 갖는 세균에서 관찰된 공유 결합 수준의 최대 약 75%에 도달하는 주변세포질 펩티도글리칸에 대한 OmpA의 공유 결합 수준을 지칭한다. 본 발명의 범위 내에서, 표현 "최대 약 75%"는 약 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 1%, 0.5% 및 0.1%를 포함한다.
주변세포질 펩티도글리칸에 대한 OmpA의 결합을 평가하는 기술은 당업자에게 공지되어 있고, 이들로 한정되는 것은 아니지만, 예를 들면, 공-면역침전, GST 풀다운 등의 공-분리 기반 기술; 예를 들면, FRET, BiFC 등의 형광 기반 검정; 표면 플라즈몬 공명 기반 검정; 예를 들면, 효모-2-하이브리드, 파지 디스플레이 등의 유전자 리포터-기반 검정을 포함한다.
OmpA 프레단백질이 외막으로 자연적으로 어드레싱(addressing)되는 동안, OmpA 프레단백질은 이의 21개 aa 길이의 N-말단 신호 펩티드 및 325개 aa 길이의 성숙(mature) 단백질을 방출하도록 절단된다. 실제로, ompA 유전자에서 돌연변이의 위치는 서열번호 3의 아미노산 서열의 성숙 OmpA 단백질을 참조로 하여 소정 위치에서 아미노산을 코딩하는 상응하는 코돈과 관련하여 정의될 수 있다.
일 실시형태에서, OmpA 성숙 단백질은 서열번호 3에 대해 적어도 75%, 바람직하게는 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일 실시형태에서, OmpA 성숙 단백질은 서열번호 3으로 이루어진 아미노산 서열에 의해 표시된다.
일부 실시형태에서, 돌연변이된 ompA 유전자는 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실을 포함하고; 여기서 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다.
본 명세서에 사용된 바와 같이, 표현 "중성 하전된 아미노산"은 알라닌(A), 아스파라긴(N), 시스테인(C), 글루타민(Q), 글리신(G), 이소류신(I), 류신(L), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V)을 포함하거나 이들로 이루어진 그룹으로부터 선택된 아미노산을 지칭한다. 본 명세서에 사용된 바와 같이, 표현 "음으로 하전된 아미노산"은 글루탐산(E) 및 아스파르트산(D)을 포함하거나 이들로 이루어진 그룹으로부터 선택된 아미노산을 지칭한다. 본 명세서에 사용된 바와 같이, 표현 "양으로 하전된 아미노산"은 아르기닌(R), 히스티딘(H) 및 리신(K)을 포함하거나 이들로 이루어진 그룹으로부터 선택된 아미노산을 지칭한다.
일부 실시형태에서, OmpA 단백질의 C-말단 부분의 결실은 위치 241에서 아스파르트산(D)을 코딩하는 코돈에서 또는 그 이전에 개시하는 결실로 이루어지고, 여기서 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다.
특정 실시형태에서, OmpA 단백질의 C-말단 부분의 결실은 위치 256에서 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 결실로 이루어지고, 여기서 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다.
일부 실시형태에서, ompA 유전자의 동족체(들)는 yfiB 유전자 및 yiaD 유전자로 이루어진 그룹으로부터 선택된다. 특정 실시형태에서, OmpA 단백질의 동족체(들)는 YfiB 단백질 및 YiaD 단백질로 이루어진 그룹으로부터 선택된다.
실제로, yfiB 유전자는 EcoCyc 수탁번호 EG11152의 핵산을 지칭한다. 일부 실시형태에서, yfiB 유전자는 서열번호 16에 대해 적어도 75%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일부 실시형태에서, yfiB 유전자는 서열번호 16에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일 실시형태에서, yfiB 유전자는 서열번호 16으로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, YfiB 단백질은 UniProtKB 수탁번호 P07021을 갖는 폴리펩티드를 지칭한다. 일부 실시형태에서, YfiB 단백질은 서열번호 17에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일부 실시형태에서, YfiB 단백질은 서열번호 17에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일 실시형태에서, YfiB 단백질은 서열번호 17로 이루어진 아미노산 서열에 의해 표시된다.
예시적으로, YfiB의 아미노산 43에서 아미노산 160까지의 영역은 OmpA로 보존된다. YfiB와 OmpA 사이에 보존된 아미노산을 동정하면, YfiB 단백질 중의 OmpA 단백질로부터 상응하는 돌연변이를 취득할 수 있고, 해당되는 경우, 그 반대의 경우도 마찬가지이다.
실제로, yiaD 유전자는 EcoCyc 수탁번호 EG12271의 핵산을 지칭한다. 일부 실시형태에서, yiaD 유전자는 서열번호 18에 대해 적어도 75%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일부 실시형태에서, yiaD 유전자는 서열번호 18에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일 실시형태에서, yiaD 유전자는 서열번호 18로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, YiaD 단백질은 UniProtKB 수탁번호 P37665를 갖는 폴리펩티드를 지칭한다. 일부 실시형태에서, YiaD 단백질은 서열번호 19에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일부 실시형태에서, YiaD 단백질은 서열번호 19에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일 실시형태에서, YiaD 단백질은 서열번호 19로 이루어진 아미노산 서열에 의해 표시된다.
예시적으로, YiaD의 아미노산 103으로부터 아미노산 219까지의 영역은 OmpA로 보존된다. YiaD와 OmpA 사이의 보존된 아미노산을 동정하면, YiaD 단백질 중의 OmpA 단백질로부터 상응하는 돌연변이를 취득할 수 있고, 해당되는 경우, 그 반대의 경우도 마찬가지이다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 lpp 유전자 및/또는 이의 동족체에 적어도 하나의 돌연변이를 포함한다.
lpp 유전자는 주요 외막 프로-지단백질 Lpp를 코딩하는 이. 콜라이의 게놈에서 자연적으로 발견된다. Lpp 단백질은 주변세포질 펩티도글리칸에 세균 엔벨로프의 외막을 결합시킨다. Lpp 단백질은 지질화된 N-말단을 통해 외막에 고정되고, C-말단 리신을 통해 주변세포질 펩티도글리칸에 존재하는 짧은 펩티드 골격에 공유 부착된다. lpp 유전자는 본 발명에 따른 그람-음성 세균의 엔벨로프 완전성에 관여하는 단백질을 코딩하는 것으로 이해된다. 보다 정확하게는, lpp 유전자는 주변세포질 펩티도글리칸에 대한 세균 엔벨로프의 외막의 공유 부착에 관여하는 단백질을 코딩한다.
특정 실시형태에서, lpp 유전자는 EcoCyc 수탁번호 EG10544를 갖는 핵산을 지칭한다. 일부 실시형태에서, lpp 유전자는 서열번호 4에 대해 적어도 75%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다.
일부 실시형태에서, lpp 유전자는 서열번호 4에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다.
일 실시형태에서, lpp 유전자는 서열번호 4로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, Lpp 단백질은 UniProtKB 수탁번호 P69776을 갖는 프레단백질을 지칭한다. 일부 실시형태에서, Lpp 프레단백질은 서열번호 5에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다.
일부 실시형태에서, Lpp 프레단백질은 서열번호 5에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다.
일 실시형태에서, Lpp 프레단백질은 서열번호 5로 이루어진 아미노산 서열에 의해 표시된다.
일 실시형태에서, lpp 유전자의 돌연변이는 주변세포질 펩티도글리칸에 대한 Lpp의 결합을 파괴하는 돌연변이이다. 본 명세서에 사용된 바와 같이, 표현 "주변세포질 펩티도글리칸에 대한 Lpp의 결합을 파괴하는"은 주변세포질 펩티도글리칸에 대한 Lpp의 공유 결합 수준이, 변화되지 않은 엔벨로프 완전성을 갖는 세균에서 관찰된 공유 결합 수준의 최대 약 75%에 도달하는 것을 지칭한다. 일부 실시형태에서, 주변세포질 펩티도글리칸에 대한 Lpp의 공유 결합 수준은 Lpp 단백질에 특이적으로 결합하는 항체에 의해 평가될 수 있다.
주변세포질 펩티도글리칸에 대한 Lpp의 결합을 평가하는 기술은 당업자에게 공지되어 있고, 주변세포질 펩티도글리칸에 대한 OmpA의 결합을 평가하는 데 유용한 기술과 유사한 기술을 포함한다. 또한, 문헌[참조: Zhang et al. (J. Biol. Chem. 1992 Sept; 267(27):19560-4 and 19631-5); Ishikawa et al. (Mol Microbiol. 2016 Aug;101(3):394-410); Cowles et al. (Mol. Microbiol. 2011 Mar; 79(5):1168-81)]을 참조할 수 있다.
Lpp는 78 aa 길이의 프레단백질로서 자연적으로 합성되고, 이는 주변세포질에 대한 이의 어드레싱 중에 절단되어 20 aa 길이의 N-말단 신호 펩티드 및 58 aa 길이의 성숙 단백질을 방출한다. 실제로, lpp 유전자의 돌연변이 위치는 서열번호 6의 아미노산 서열의 성숙 Lpp 단백질을 참조로 하여 소정 위치에서 아미노산을 코딩하는 상응하는 코돈과 관련하여 정의된다.
일 실시형태에서, Lpp 성숙 단백질은 서열번호 6에 대해 적어도 75%, 바람직하게는 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일 실시형태에서, Lpp 성숙 단백질은 서열번호 6으로 이루어진 아미노산 서열에 의해 표시된다.
일 실시형태에서, lpp 유전자의 돌연변이는 위치 58의 리신(K)을 코딩하는 코돈의 결실; 위치 57의 아르기닌(R)을 코딩하는 코돈을 또 다른 아미노산, 바람직하게는 중성으로 하전된 아미노산, 보다 바람직하게는 류신(L)을 코딩하는 코돈으로 치환하는 것; 위치 58의 리신(K)을 코딩하는 코돈을 아르기닌(R)을 코딩하는 코돈으로 치환하는 것; lpp 유전자의 완전한 결실; 및 이들의 조합을 포함하거나 이들로 이루어진 그룹으로부터 선택되고, 여기서 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다.
일부 실시형태에서, lpp 유전자의 동족체는 yqhH 유전자이다. 특정 실시형태에서, Lpp 단백질의 동족체는 YqhH 단백질이다.
실제로, yqhH 유전자는 EcoCyc 수탁번호 G7567의 핵산을 지칭한다. 일부 실시형태에서, yqhH 유전자는 서열번호 20에 대해 적어도 75%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일부 실시형태에서, yqhH 유전자는 서열번호 20에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일 실시형태에서, yqhH 유전자는 서열번호 20으로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, YqhH 단백질은 UniProtKB 수탁번호 P65298을 갖는 폴리펩티드를 지칭한다. 일부 실시형태에서, YqhH 단백질은 서열번호 21에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일부 실시형태에서, YqhH 단백질은 서열번호 21에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일 실시형태에서, YqhH 단백질은 서열번호 21로 이루어진 아미노산 서열에 의해 표시된다.
예시적으로, YqhH의 아미노산 25로부터 아미노산 71까지의 영역은 Lpp로 보존된다. YqhH와 Lpp 사이의 보존된 아미노산을 동정하면, YqhH 단백질 중의 Lpp 단백질로부터 상응하는 돌연변이를 취득할 수 있고, 해당되는 경우, 그 반대의 경우도 마찬가지이다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 pal 유전자에 적어도 하나의 돌연변이를 포함한다.
pal 유전자는 펩티도글리칸 관련 지단백질을 코딩하는 이. 콜라이의 게놈에서 자연적으로 발견된다. Pal 단백질은 외막 완전성을 유지하는 데 중요하다. pal 유전자는 본 발명에 따른 그람-음성 세균의 엔벨로프 완전성에 관여하는 단백질을 코딩하는 것으로 이해된다. 보다 정확하게는, pal 유전자는 주변세포질 펩티도글리칸에 대한 세균 엔벨로프의 외막의 부착에 관여하는 단백질을 코딩한다.
특정 실시형태에서, pal 유전자는 EcoCyc 수탁번호 EG10684를 갖는 핵산을 지칭한다. 일부 실시형태에서, pal 유전자는 서열번호 7에 대해 적어도 75%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다.
일부 실시형태에서, pal 유전자는 서열번호 7에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다.
일 실시형태에서, pal 유전자는 서열번호 7로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, Pal 단백질은 UniProtKB 수탁번호 P0A912를 갖는 프레단백질을 지칭한다. 일부 실시형태에서, Pal 프레단백질은 서열번호 8에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다.
일부 실시형태에서, Pal 프레단백질은 서열번호 8에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다.
일 실시형태에서, Pal 프레단백질은 서열번호 8로 이루어진 아미노산 서열에 의해 표시된다.
일 실시형태에서, 유전자 pal의 돌연변이는 주변세포질 펩티도글리칸에 대한 Pal의 결합을 파괴하는 돌연변이이다. 본 명세서에 사용된 바와 같이, 표현 "주변세포질 펩티도글리칸에 대한 Pal의 결합을 파괴하는"은 주변세포질 펩티도글리칸에 대한 Pal의 결합 수준이, 변화되지 않은 엔벨로프 완전성을 갖는 세균에서 관찰된 결합 수준의 최대 약 75%에 도달하는 것을 지칭한다.
실제로, 주변세포질 펩티도글리칸에 대한 Pal의 결합을 평가하는 수단은 당업자에게 공지되어 있고, 주변세포질 펩티도글리칸에 대한 OmpA 또는 Lpp의 결합을 평가하는 것과 동일한 기술을 포함한다.
OmpA 및 Lpp와 유사하게, Pal은 173 aa 길이의 프레단백질로서 자연적으로 합성되고, 이는 주변세포질에 대한 어드레싱 중에 연속적으로 절단된다. 이 절단은 21 aa 길이의 N-말단 신호 펩티드와 152 aa 길이의 성숙 단백질을 방출한다. 실제로, pal 유전자에서 돌연변이의 위치는 서열번호 9의 아미노산 서열의 성숙 Pal 단백질을 참조로 하여, 소정 위치에서 아미노산을 코딩하는 상응하는 코돈과 관련하여 정의될 수 있다.
일 실시형태에서, pal 유전자의 돌연변이는 pal 유전자의 완전한 결실 및 위치 104의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E)을 코딩하는 코돈으로 치환하는 것을 포함하거나 이들로 이루어진 그룹으로부터 선택되고; 여기서 상기 위치는 서열번호 9의 아미노산 서열과 관련하여 정의된다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 ybiS(ldtB로도 지칭됨), ycfS(ldtC로도 지칭됨) 및/또는 erfK(ldtA로도 지칭됨) 유전자(들)에 적어도 하나의 돌연변이를 포함한다.
ybiS 유전자, ycfS 유전자 및 erfK 유전자는 각각 효소 YbiS(LdtB라고도 지칭됨), YcfS(LdtC라고도 지칭됨) 및 ErfK(LdtA라고도 지칭됨)를 코딩하여, C-말단 리신을 통한 주변세포질 펩티도글리칸에 대한 성숙 Lpp 단백질의 공유 결합을 촉매한다. ybiS 유전자, ycfS 유전자 및 erfK 유전자는 본 발명에 따른 그람-음성 세균의 엔벨로프 완전성에 관여하는 단백질을 코딩하는 것으로 이해된다. 보다 정확하게는, ybiS 유전자, ycfS 유전자 및 erfK 유전자는 주변세포질 펩티도글리칸에 대한 Lpp 외막 단백질의 부착에 관여하는 단백질을 코딩한다.
특정 실시형태에서, ybiS 유전자는 EcoCyc 수탁번호 G6422를 갖는 핵산을 지칭한다. 일부 실시형태에서, ybiS 유전자는 서열번호 10에 대해 적어도 75%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일부 실시형태에서, ybiS 유전자는 서열번호 10에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일 실시형태에서, ybiS 유전자는 서열번호 10으로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, YbiS 단백질은 UniProtKB 수탁번호 P0AAX8을 갖는 프레단백질을 지칭한다. 일부 실시형태에서, YbiS 프레단백질은 서열번호 11에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일부 실시형태에서, YbiS 프레단백질은 서열번호 11에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일 실시형태에서, YbiS 프레단백질은 서열번호 11로 이루어진 아미노산 서열에 의해 표시된다.
일부 실시형태에서, ybiS 유전자의 동족체, 특히 기능적 동족체는 ldtD , ldtE 또는 ldtF 유전자이다. 특정 실시형태에서, YbiS 단백질의 동족체, 특히 기능적 동족체는 LdtD, LdtE 또는 LdtF 단백질이다. 일부 실시형태에서, ldtD 유전자는 EcoCyc 수탁번호 EG11253을 갖는 핵산을 지칭한다. 특정 실시형태에서, ldtE 유전자는 EcoCyc 수탁번호 G6904를 갖는 핵산을 지칭한다. 일부 실시형태에서, ldtF 유전자는 EcoCyc 수탁번호 G6108을 갖는 핵산을 지칭한다.
특정 실시형태에서, ycfS 유전자는 EcoCyc 수탁번호 G6571을 갖는 핵산을 지칭한다. 일부 실시형태에서, ycfS 유전자는 서열번호 12에 대해 적어도 75%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일부 실시형태에서, ycfS 유전자는 서열번호 12에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일 실시형태에서, ycfS 유전자는 서열번호 12로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, YcfS 단백질은 UniProtKB 수탁번호 P75954를 갖는 프레단백질을 지칭한다. 일부 실시형태에서, YcfS 프레단백질은 서열번호 13에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일부 실시형태에서, YcfS 프레단백질은 서열번호 13에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일 실시형태에서, YcfS 프레단백질은 서열번호 13으로 이루어진 아미노산 서열에 의해 표시된다.
특정 실시형태에서, erfK 유전자는 EcoCyc 수탁번호 G7073을 갖는 핵산을 지칭한다. 일부 실시형태에서, erfK 유전자는 서열번호 14에 대해 적어도 75%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일부 실시형태에서, erfK 유전자는 서열번호 14에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 핵산 서열 동일성을 갖는 핵산 서열에 의해 표시된다. 일 실시형태에서, erfK 유전자는 서열번호 14로 이루어진 핵산 서열에 의해 표시된다.
특정 실시형태에서, ErfK 단백질은 UniProtKB 수탁번호 P39176을 갖는 프레단백질을 지칭한다. 일부 실시형태에서, ErfK 프레단백질은 서열번호 15에 대해 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다.
일부 실시형태에서, ErfK 프레단백질은 서열번호 15에 대해 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%의 아미노산 서열 동일성을 갖는 아미노산 서열에 의해 표시된다. 일 실시형태에서, ErfK 프레단백질은 서열번호 15로 이루어진 아미노산 서열에 의해 표시된다.
특정 실시형태에서, 돌연변이된 ybiS 유전자, ycfS 유전자 및/또는 erfK 유전자, 및/또는 이의 동족체는 각각 상기 ybiS, ycfS 및/또는 erfK 유전자, 및/또는 이의 동족체의 결실로 이루어진다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 돌연변이된 ybiS 및 ycfS 유전자, 및/또는 이의 동족체를 포함한다. 일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 돌연변이된 ybiS 및 erfK 유전자, 및/또는 이의 동족체를 포함한다. 일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 돌연변이된 ycfS 및 erfK 유전자, 및/또는 이의 동족체를 포함한다. 일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 돌연변이된 ybiS, ycfS 및 erfK 유전자, 및/또는 이의 동족체를 포함한다.
ybiS, ycfS 및/또는 erfK 유전자 중 임의의 하나, 및/또는 이의 동족체에서의 돌연변이는 주변세포질 펩티도글리칸에 대한 성숙 Lpp 폴리펩티드의 기능적 공유 결합의 부재를 초래할 수 있는 것으로 이해된다.
펩티도글리칸에 대한 Lpp의 결합을 측정하는 기술은 상기에 기재되어 있다.
일 실시형태에서, ybiS 유전자, ycfS 유전자 및/또는 erfK 유전자, 및/또는 이의 동족체에서의 돌연변이는 ybiS, ycfS 및/또는 erfK, /또는 이의 동족체의 완전한 결실, ybiS 및 erfK, 및/또는 이의 동족체의 완전한 결실, 및 ybiS 및 ycfS, 및/또는 이의 동족체의 완전한 결실을 포함하거나 이들로 이루어진 그룹으로부터 선택된다.
일 실시형태에서, ybiS 유전자, ycfS 유전자 및/또는 erfK 유전자, 및/또는 이의 동족체에서의 돌연변이는 이들 유전자에 의해 코딩되는 효소의 촉매 부위를 손상시키는 돌연변이를 포함하거나 이들로 이루어진다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 음으로 또는 중성으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실을 포함하는 ompA 유전자 및/또는 이의 동족체 내의 적어도 하나의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및
- 위치 58의 리신(K)을 코딩하는 코돈의 결실; 위치 57의 아르기닌(R)을 코딩하는 코돈을 또 다른 아미노산, 바람직하게는 중성으로 하전된 아미노산, 보다 바람직하게는 류신(L)을 코딩하는 코돈으로 치환하는 것; 위치 58의 리신(K)을 코딩하는 코돈을 아르기닌(R)을 코딩하는 코돈으로 치환하는 것; 또는 lpp 유전자의 완전한 결실을 포함하는, lpp 유전자 및/또는 이의 동족체 내의 적어도 하나의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다).
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 58의 리신(K)을 코딩하는 코돈의 결실; 위치 57의 아르기닌(R)을 코딩하는 코돈을 또 다른 아미노산, 바람직하게는 음으로 또는 중성으로 하전된 아미노산, 보다 바람직하게는 류신(L)을 코딩하는 코돈으로 치환하는 것; 위치 58의 리신(K)을 코딩하는 코돈을 아르기닌(R)을 코딩하는 코돈으로 치환하는 것; 또는 lpp 유전자의 완전한 결실을 포함하는, lpp 유전자 및/또는 이의 동족체 내의 적어도 하나의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다); 및
- pal 유전자의 완전한 결실 또는 위치 104의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E)을 코딩하는 코돈으로 치환하는 것을 포함하는 pal 유전자 내의 적어도 하나의 돌연변이(여기서, 상기 위치는 서열번호 9의 아미노산 서열과 관련하여 정의된다).
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균, 또는 이의 변이체는 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 음으로 또는 중성으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실을 포함하는 ompA 유전자 및/또는 이의 동족체 내의 적어도 하나의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및
- pal 유전자의 완전한 결실 또는 위치 104의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E)을 코딩하는 코돈으로 치환하는 것을 포함하는 pal 유전자의 돌연변이(여기서, 상기 위치는 서열번호 9의 아미노산 서열과 관련하여 정의된다).
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 음으로 또는 중성으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실을 포함하는 ompA 유전자 및/또는 이의 동족체 내의 적어도 하나의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및
- ybiS, ycfS 및 erfK 유전자, 및/또는 이의 동족체를 포함하는 유전자 그룹 중 적어도 하나, 바람직하게는 적어도 2개, 보다 바람직하게는 3개 각각에서 적어도 하나의 돌연변이(바람직하게는, 상기 돌연변이(들)는 상기 ybiS, ycfS 및 erfK 유전자, 및/또는 이의 동족체의 완전한 결실을 포함하거나 이들로 이루어진 그룹으로부터 선택된다).
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균, 또는 이의 변이체는 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 ompA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실을 포함하는 ompA 유전자 및/또는 이의 동족체 내의 적어도 하나의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다);
- 위치 58의 리신(K)을 코딩하는 코돈의 결실; 위치 57의 아르기닌(R)을 코딩하는 코돈을 또 다른 아미노산, 바람직하게는 중성으로 하전된 아미노산, 보다 바람직하게는 류신(L)을 코딩하는 코돈으로 치환하는 것; 위치 58의 리신(K)을 코딩하는 코돈을 아르기닌(R)을 코딩하는 코돈으로 치환하는 것; 또는 lpp 유전자의 완전한 결실을 포함하는, lpp 유전자 및/또는 이의 동족체 내의 적어도 하나의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다); 및
- ybiS 유전자, ycfS 유전자 및 erfK 유전자, 및/또는 이의 동족체를 포함하는 유전자 그룹 중 적어도 하나, 바람직하게는 적어도 2개, 보다 바람직하게는 적어도 3개 각각에서 적어도 하나의 돌연변이(바람직하게는, 상기 돌연변이(들)는 상기 ybiS, ycfS 및 erfK 유전자, 및/또는 이의 동족체의 완전한 결실을 포함하거나 이들로 이루어진 그룹으로부터 선택된다).
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- lpp 유전자 및/또는 이의 동족체의 완전한 결실; 및
- 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다).
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- lpp 유전자 및/또는 이의 동족체의 완전한 결실; 및
- ompA 유전자 및/또는 이의 동족체의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함하지 않는다:
- lpp 유전자 및/또는 이의 동족체의 완전한 결실; 및
- ompA 유전자 및/또는 이의 동족체의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및
- pal 유전자의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다); 및
- pal 유전자의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다), 및
- 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다).
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 ompA 단백질의 C-말단 부분의 결실(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다), 및
- 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다).
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 57의 아르기닌(R)을 코딩하는 코돈을 류신(L)을 코딩하는 코돈으로 치환하는 것으로 이루어진 lpp 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다);
- ybiS 유전자 및/또는 이의 동족체의 완전한 결실; 및
- ycfS 유전자 및/또는 이의 동족체의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다);
- 위치 57의 아르기닌(R)을 코딩하는 코돈을 류신(L)을 코딩하는 코돈으로 치환하는 것으로 이루어진 lpp 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다);
- ybiS 유전자 및/또는 이의 동족체의 완전한 결실; 및
- erfK 유전자 및/또는 이의 동족체의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다);
- 위치 57의 아르기닌(R)을 코딩하는 코돈을 류신(L)을 코딩하는 코돈으로 치환하는 것으로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다);
- ybiS 유전자의 완전한 결실; 및
- ycfS 유전자의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다),
- 위치 57의 아르기닌(R)을 코딩하는 코돈을 류신(L)을 코딩하는 코돈으로 치환하는 것으로 이루어진 lpp 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다);
- ycfS 유전자 및/또는 이의 동족체의 완전한 결실; 및
- erfK 유전자 및/또는 이의 동족체의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다),
- ybiS 유전자의 완전한 결실,
- ycfS 유전자의 완전한 결실,
- erfK 유전자의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 241의 아스파르트산(D)을 코딩하는 코돈을 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및
- lpp 유전자의 완전한 결실.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 적어도 하기 돌연변이를 포함한다:
- 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및
- 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자 및/또는 이의 동족체의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다).
특정 실시형태에서, 본 발명에 따른 세균은 (i) 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다), 및 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다); (ii) 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다) 및 pal 유전자의 완전한 결실; 또는 (iii) 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다) 및 pal 유전자의 완전한 결실을 갖는 세균의 그룹으로부터 선택된다.
일 실시형태에서, 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자 각각의 돌연변이는 게놈 돌연변이이다.
본 명세서에 사용된 바와 같이, 표현 "게놈 돌연변이"는 세균 염색체로부터의 핵산 서열의 돌연변이를 지칭한다. 이러한 실시형태에서, 돌연변이는 안정하고, 상기 돌연변이를 포함하는 세균 세포의 자손에게 전달된다.
특정 실시형태에서, 본 발명에 따른 세균은 적어도 하나의 게놈외 핵산 분자를 추가로 포함한다.
특정 실시형태에서, 본 발명에 따른 세균은, 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는, 적어도 하나의 게놈외 핵산 분자를 추가로 포함한다.
일 실시형태에서, 적어도 하나의 게놈외 핵산 분자는 플라스미드, 코스미드 또는 세균 인공 염색체(BAC)를 포함하거나 이들로 이루어진 그룹으로부터 선택된다.
실제로, 게놈외 핵산 분자는 플라스미드 형태일 수 있고, 특히 목적 핵산 분자를 핵산 벡터로 클로닝함으로써 생성될 수 있다. 일부 실시형태에서, 비제한적 적합한 핵산 벡터는 pBluescript 벡터, pET 벡터, pETduet 벡터, pGBM 벡터, pBAD 벡터, pUC 벡터이다. 일 실시형태에서, 플라스미드는 낮은 카피 플라스미드(low copy plasmid)이다. 일 실시형태에서, 플라스미드는 높은 카피 플라스미드(high copy plasmid)이다.
실제로, 게놈외 핵산 분자는, 예를 들면, 백신접종 또는 유전자 요법 등의 치료 목적의 핵산 분자를 포함할 수 있다.
실제로, 치료적 관심의 핵산 분자는, 예를 들면, 안티센스 올리고뉴클레오티드, 앱타머 또는 마이크로 RNA, 예를 들면, 짧은 간섭 RNA(siRNA)를 코딩할 수 있다.
일부 실시형태에서, 핵산 분자에 의해 코딩되는 폴리펩티드의 합성이 상정되는 경우, 핵산 벡터는 또한 유도성 프로모터, 특히 lacZ 유전자의 프로모터, trp 유전자의 프로모터 또는 β-락타마제 코딩 유전자의 프로모터를 포함할 수 있다. 실제로, 핵산 벡터는 또한 항생물질, 특히 암피실린, 카나마이신, 클로람페니콜, 테트라사이클린, 스펙티노마이신 또는 스트렙토마이신에 대한 내성을 코딩하는 핵산을 포함할 수 있다.
특정 실시형태에서, 핵산 분자에 의해 코딩되는 폴리펩티드는 치료적 관심 대상이다. 일부 실시형태에서, 폴리펩티드는 세포질 폴리펩티드이다. 일부 실시형태에서, 폴리펩티드는 비-분비형 폴리펩티드이다.
본 명세서에 사용된 바와 같이, "비-분비형 폴리펩티드"는 세균 세포질 내에서 합성되고, 그람-음성 세균, 특히 이. 콜라이의 세포질 막 및 외막을 포함하는 세균 막에 매립되거나 또는 교차되지 않는 것을 지칭한다. 다시 말해서, "비-분비형 폴리펩티드"는 세포질 막 내로 매립되지 않거나, 주변세포질 내로 표적화되지 않거나, 외막으로 매립되지 않거나, 또는 배양 배지 내로 표적화되지 않은 폴리펩티드를 지칭한다. 본 발명의 범위 내에서, 용어 "세포질 막" 및 "내막"은 동등한 것을 의미한다.
일 실시형태에서, 치료용 폴리펩티드는 효소 활성 또는 조절 활성을 갖는 단백질, 특별한 표적화 활성을 갖는 단백질, 백신 특성을 갖는 단백질 및 진단 특성을 갖는 단백질을 포함하는 그룹으로부터 선택된다.
실제로, 목적 핵산 분자에 의해 코딩된 치료용 폴리펩티드는, 예를 들면, 성장 인자, 항체, 호르몬, 사이토카인, 효소, 혈장 인자 등일 수 있다. 예시적으로, 본 발명에 따라 사용하기 위한 치료용 폴리펩티드는 장애 또는 질환, 예를 들면, 빈혈, 자가면역 질환, 암, 당뇨병, 혈우병, 감염성 질환 및 신경퇴행성 질환의 치료 및/또는 예방을 위한 방법으로 실시할 수 있다.
본 발명의 범위 내에서, 본 발명의 용도 및 방법은 생체내 또는 시험관내에서 수행될 수 있다.
본 발명에 따른 세균은 게놈외 핵산, 예를 들면, 상기 핵산에 의해 코딩된 플라스미드 및/또는 폴리펩티드의 공업적 생산 및 정제를 위해 실시될 수 있는 것으로 이해된다.
본 발명은, 적어도 하나의 게놈외 핵산 분자의 생산 및 정제를 위한, 적어도 하나의 게놈외 핵산 분자를 포함하고 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균의 용도에 관한 것으로, 상기 세균은 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 변화된 엔벨로프 완전성을 갖고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이다.
본 명세서에 사용된 바와 같이, "적어도 하나"는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상을 포함한다.
본 발명의 또 다른 양태는 적어도 하나의 게놈외 핵산 분자의 생산 및 정제를 위한 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 용도에 관한 것이다.
특정 실시형태에서, 적어도 하나의 게놈외 핵산 분자는 플라스미드, 코스미드 및 세균 인공 염색체(BAC)를 포함하거나 이들로 이루어진 그룹으로부터 선택된다.
본 발명의 추가 양태는, 바람직하게는 적어도 하나의 게놈외 핵산 분자에 의해 코딩되는 적어도 하나의 폴리펩티드의 생산 및 정제를 위한, 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 포함하고 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균의 용도에 관한 것으로, 상기 세균은 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 변화된 엔벨로프 완전성을 갖고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이다.
일부 실시형태에서, 세균은 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이다.
본 발명의 또 다른 양태는 바람직하게는 적어도 하나의 게놈외 핵산 분자에 의해 코딩되는, 적어도 하나의 폴리펩티드의 생산 및 정제를 위한, 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 용도에 관한 것이다.
특정 실시형태에서, 폴리펩티드는 게놈 핵산에 의해 코딩된다.
일부 실시형태에서, 적어도 하나의 폴리펩티드는 적어도 하나의 세포질 폴리펩티드이다.
특정 실시형태에서, 적어도 하나의 폴리펩티드는 적어도 하나의 비-분비형 폴리펩티드이다.
특정 실시형태에서, 적어도 하나의 돌연변이된 ompA 유전자는 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실로 이루어지고; 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다.
일부 실시형태에서, Lpp 기능성에 관여하는 돌연변이된 유전자는 위치 58의 리신(K)을 코딩하는 코돈의 결실(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다), 또는 ybiS 유전자의 완전한 결실, 및/또는 ycfS 유전자의 완전한 결실 및/또는 erfK 유전자의 완전한 결실로 이루어진 lpp 유전자의 돌연변이로 이루어진다.
일부 실시형태에서, 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함한다. 특정 실시형태에서, 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 여기서 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자는 Lpp 기능성에 관여하는 유전자이다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 ompA 유전자의 완전한 결실; 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는다.
특정 실시형태에서, 세균은 본 발명에서 정의된 바와 같다.
본 발명은 또한,
a) 적어도 하나의 게놈외 핵산 분자를 포함하는, 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이를 배양하여, 적어도 하나의 게놈외 핵산 분자를 증폭시키는 단계; 및
b) 단계 a)에서 수득된 세균을 바람직하게는 화학적 용해에 의해 용해시켜 용해 혼합물을 수득하는 단계
를 포함하는, 적어도 하나의 게놈외 핵산 분자의 생산 방법에 관한 것이다.
본 발명은 또한,
a) 적어도 하나의 게놈외 핵산 분자를 포함하는 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이를 배양하여, 적어도 하나의 게놈외 핵산 분자를 증폭시키는 단계;
b) 단계 a)에서 수득된 세균을 바람직하게는 화학적 용해에 의해 용해시켜 용해 혼합물을 수득하는 단계; 및
c) 단계 b)에서 수득된 용해 혼합물로부터 상기 게놈외 핵산 분자를 정제하는 단계
를 포함하는, 적어도 하나의 게놈외 핵산 분자의 생산 및 정제 방법에 관한 것이다.
본 발명은 또한,
a) 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균을 배양하여(여기서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이며, 적어도 하나의 돌연변이된 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이고, 상기 세균은 적어도 하나의 게놈외 핵산 분자를 포함한다), 적어도 게놈외 핵산 분자를 증폭시키는 단계;
b) 단계 a)에서 수득된 세균을 바람직하게는 화학적 용해에 의해 용해시켜 용해 혼합물을 수득하는 단계; 및
c) 단계 b)에서 수득된 용해 혼합물로부터 상기 증폭된 게놈외 핵산 분자를 정제하는 단계
를 포함하는, 적어도 하나의 게놈외 핵산 분자의 생산 및 정제 방법에 관한 것이다.
특정 실시형태에서, 적어도 하나의 게놈외 핵산 분자는 플라스미드, 코스미드 및 세균 인공 염색체(BAC)를 포함하거나 이들로 이루어진 그룹으로부터 선택된다.
또 다른 양태에서, 본 발명은
a) 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 포함하는 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이를 배양하여, 적어도 하나의 폴리펩티드를 합성하는 단계; 및
b) 단계 a)에서 수득된 세균을 용해시켜 용해 혼합물을 수득하는 단계
를 포함하는, 바람직하게는 게놈외 핵산 분자에 의해 코딩된 적어도 하나의 폴리펩티드의 생산 방법에 관한 것이다.
또 다른 양태에서, 본 발명은
a) 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 포함하는 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이를 배양하여, 적어도 하나의 폴리펩티드를 합성하는 단계;
b) 단계 a)에서 수득된 세균을 용해시켜 용해 혼합물을 수득하는 단계; 및
c) 단계 b)에서 수득된 용해 혼합물로부터 상기 적어도 하나의 폴리펩티드를 정제하는 단계
를 포함하는, 바람직하게는 게놈외 핵산 분자에 의해 코딩된 적어도 하나의 폴리펩티드의 생산 및 정제 방법에 관한 것이다.
본 발명의 하나의 추가 양태는
a) 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균을 배양하여(여기서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이며, 적어도 하나의 돌연변이된 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이고, 상기 세균은 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 포함한다), 적어도 하나의 폴리펩티드를 합성하는 단계;
b) 단계 a)에서 수득된 세균을 용해시켜 용해 혼합물을 수득하는 단계; 및
c) 단계 b)에서 수득된 용해 혼합물로부터 상기 적어도 하나의 폴리펩티드를 정제하는 단계
를 포함하는, 바람직하게는 게놈외 핵산 분자에 의해 코딩된 적어도 하나의 폴리펩티드의 생산 및 정제 방법에 관한 것이다.
특정 실시형태에서, 폴리펩티드는 게놈 핵산에 의해 코딩된다.
일부 실시형태에서, 적어도 하나의 폴리펩티드는 하나의 세포질 폴리펩티드이다.
특정 실시형태에서, 적어도 하나의 폴리펩티드는 하나의 비-분비형 폴리펩티드이다.
일부 실시형태에서, 상기 방법으로부터의 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함한다. 특정 실시형태에서, 상기 방법으로부터의 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 여기서 적어도 하나의 돌연변이된 유전자는 ompA이고, 적어도 하나의 돌연변이된 유전자는 Lpp 기능성에 관여하는 유전자이다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이 세균은 ompA 유전자의 완전한 결실; 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는다.
일부 실시형태에서, 본 발명의 방법은, 단계 a) 이전에, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이를 적어도 하나의 게놈외 핵산 분자로 형질전환시키는 것을 포함하거나 이들로 이루어지는 단계 a0)을 추가로 포함할 수 있다.
일 실시형태에서, 본 발명의 방법에 의해 생성된 폴리펩티드는 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이에 의해 분비되지 않는다. 따라서, 상기 폴리펩티드는 생성 세균으로부터 이의 방출을 필요로 한다.
용어 "형질전환"은 본 명세서에서 세균, 특히 이. 콜라이의 세포질 내로 게놈외 핵산 분자의 도입을 지칭하기 위해 사용된다. 세균, 특히 형질전환 단계 후에 세포질이 적어도 하나의 게놈외 핵산 분자를 포함하는 이. 콜라이는 "형질전환된 세균"으로서 인정된다. 세균의 형질전환은 전형적으로 상기 세포가, 형질전환시에 게놈외 핵산 분자가 세포질에 진입하는 데에 "적격"으로 되도록 사전에 처리되는 것을 필요로 한다. 본 명세서에 사용된 바와 같이, 용어 "적격"은 게놈외 핵산 분자를 이의 세포질로 흡수하는 능력이 증가된 세균을 지칭한다. 숙련된 기술자는 적격 세균을 제조하는 기술에 친숙하다. 예시적으로, 적격 세균의 제조, 형질전환, 형질전환된 세균의 선택 단계에 대해서는, 시판의 키트 또는 재료가 사용되는 경우, 제조업자의 지시를 참조할 수 있고/있거나, 예를 들면, 문헌[참조: J. Sambrook and D. Russell, Molecular Cloning: A Laboratory Manual, 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y. (2001)]에 기재된 프로토콜을 참조한다.
일부 실시형태에서, 적격 세균은 화학적으로 적격 세포, 특히 염화칼슘 처리된 세균일 수 있다. 일부 대안의 실시형태에서, 적격 세균은 전기적격 세균일 수 있다. 실제로, 화학적 적격 또는 전기적격 세균은 써모피셔(THERMOFISHER®), 시그마-알드리히(SIGMA-ALDRICH®) 또는 NEB®로부터 구입할 수 있다. 이. 콜라이 세균의 경우, 시판의 화학적 적격 세균의 비제한적 목록에는 BL21(DE3), DH10B, DH5α, Mach1, TOP10, INV110, SIG10이 포함된다. 상업적 이. 콜라이 전기적격 세균의 비제한적 목록에는 Mega DH10B T1R, ElectroMAX DH5α, One shot TOP10, SIG10 MAX가 포함된다.
일 양태에서, 본 발명은 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 적격 형태의 이. 콜라이에 관한 것이다. 다시 말해서, 본 발명은 본 발명에 따른 적격 유전자 변형된 그람-음성 세균, 특히 이. 콜라이에 관한 것이다. 적격 유전자 변형된 그람-음성 세균은 화학적으로 적격 또는 전기적격일 수 있다.
본 발명에 따른 세균은 게놈외 핵산 분자의 증폭을 달성하기 위해 및/또는 상기 핵산 분자에 의해 코딩된 폴리펩티드, 특히 세포질 폴리펩티드의 현저한 합성을 달성하기 위해 적절한 배양 배지에서 배양된다.
숙련된 기술자는 세균, 특히 이. 콜라이를 배양하는 기술에 친숙하다. 간략히 설명하기 위해, 적합한 배양 배지에 세균을 접종하고, 일정한 온도(약 20℃ 내지 약 40℃)에서, 최적으로는 이. 콜라이의 경우는 약 37℃의 온도에서 및 진탕하에 목적하는 세포 밀도가 수득될 때까지 인큐베이팅한다. 세포 밀도는 배양물의 광학 밀도를 측정하거나, 또는 현미경을 사용하여 세포를 계수함으로써 평가할 수 있다. 배양 배지는 통상, 세균에 대한 선택 압력을 유지하기 위해, 목적의 적어도 하나의 게놈외 핵산 분자의 존재에 의해 부여되는 항생물질 내성에 일치하는 항생물질로 보완된다. 실제로, 세균 성장에 적합한 배양 배지의 비제한적 예에는 LB 브로스, Terrific 브로스 및 M9 최소 배지가 포함된다. 상업적으로 이용 가능한 배양 배지는, 몇몇 회사를 열거하면, 예를 들면, 시그마-알드리히(SIGMA-ALDRICH®), 써모피셔(THERMOFISHER®)로부터 구입할 수 있다. 폴리펩티드의 생산을 목적으로 하는 본 발명의 방법에서, 배양 배지는 상기 폴리펩티드를 코딩하는 핵산 서열의 유도성 프로모터의 제어하에서 발현을 유발하는 유도 분자로 보완될 수 있다. 예시적으로, 이소프로필 β-D-1-티오갈락토피라노시드를 사용하여, lac 오퍼레이터의 제어하에서 핵산 서열의 발현을 유도할 수 있다.
특정 실시형태에서, 폴리펩티드는 정제를 용이하게 하기 위해 태그(tag)와 융합시킬 수 있다. 본 발명에 적합한 태그의 비제한적 예는 FLAG-태그, GST-태그, Halo-태그, His-태그, MBP-태그, Snap-태그, SUMO-태그 및 이들의 조합을 포함하는 그룹으로부터 선택될 수 있다.
실제로 및 산업적 목적을 위해, 본 발명에 따른 세균의 배양은 5L, 50L, 100L, 500L 또는 1,000L 발효기 등의 적절한 발효기(생물반응기)에서 수행될 수 있다. 발효기에서의 배양은 배치식(batch) 또는 유가식(fed batch) 조건에서 수행될 수 있다.
본 명세서에 사용된 바와 같이, 표현 "배치식 발효"는 기질 및 세균을 발효조에 배치 방식으로 로딩함으로써 달성되는 발효를 지칭하는 것을 의미한다. 본 명세서에 사용된 바와 같이, 표현 "유가식 발효"는 고농도의 소정 기질이 세균 배양에 대해 독성인 발효를 지칭하고; 기질 농도를 독성 수준 미만으로 유지하는 것을 목적으로, 기질이 배양에 의해 소비되는 느린 속도로 상기 기질을 서서히 첨가("유가")한다.
게놈외 핵산 분자의 증폭 및/또는 상기 핵산 분자에 의해 코딩된 폴리펩티드의 생산시에, 핵산 분자 및/또는 폴리펩티드가 세균으로부터 추출되는 것으로 이해된다. 상기 추출은 세균을 용해시키는 단계에 의해 수행된다. 본 발명의 범위 내에서, 용해는, 세균 염색체의 세균으로부터의 추출, 세균 및/또는 세균 파편의 단백질 함량을 회피하면서, 가능한 한 많은 핵산 분자 및/또는 상기 핵산 분자에 의해 코딩된 폴리펩티드를 회수하도록 달성된다.
본 명세서에 사용된 바와 같이, 용어 "용해(lysing)", "세균 용해" 및 "용해(lysis)"는 세포질의 내용물이 적어도 부분적으로 세균 외부로 방출되도록 세균 엔벨로프의 부분적 또는 완전한 파괴를 지칭하기 위해 사용된다. 숙련된 기술자는 세균을 용해시키는 기술에 친숙하다. 이러한 기술에는, 예를 들면, 고압 균질화기, 비드 밀 및 초음파 처리를 사용하는 기술 등의 기계적 용해 기술; 예를 들면, 리소자임 및/또는 프로테이나제 K를 사용하는 것 등의 효소 용해 기술; 예를 들면, 동결/해동 사이클을 사용하는 기술 등의 열 용해; 및 예를 들면, 삼투 충격, 알칼리성 용해 및 세제 용해 및 이들의 조합 등의 화학적 용해 기술이 포함된다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 용해는 화학적 용해, 바람직하게는 알칼리성 용해이다.
본 명세서에 사용된 바와 같이, 표현 "화학적 용해"는 일반적으로 이온 및/또는 세제 등의 특정 용질을 포함하는 용액(들) 중에서 세균의 인큐베이션에 기초하여 세균 막의 파괴를 유도하는 용해 기술을 지칭한다. 본 명세서에 사용된 바와 같이, 표현 "알칼리성 용해"는 OH- 이온 및 나트륨 도데실 설페이트(SDS)를 포함하는 용액 중에서 세균의 인큐베이션에 기초한 용해 방법을 지칭하는 것을 의미한다.
실제로, 용해 단계를 위한 OH- 이온의 최종 농도는 약 50mM 내지 약 500mM, 바람직하게는 약 75mM 내지 약 250mM이다. 본 발명의 범위 내에서, 표현 "약 50mM 내지 약 500mM"은 50mM, 55mM, 60mM, 65mM, 70mM, 75mM, 80mM, 85mM, 90mM, 95mM, 100mM, 110mM, 120mM, 125mM, 130mM, 140mM, 150mM, 160mM, 170mM, 175mM, 180mM, 190mM, 200mM, 220mM, 240mM, 260mM, 280mM, 300mM, 320mM, 340mM, 360mM, 380mM, 400mM, 420mM, 440mM, 460mM, 480mM 및 500mM을 포함한다.
실제로, OH- 이온의 공급원은 NaOH일 수 있다.
실제로, 용해 단계를 위한 SDS의 최종 농도는 약 0.1% 내지 약 5%, 바람직하게는 약 0.2% 내지 약 2%, 보다 바람직하게는 약 0.25% 내지 약 0.75%이다. 본 발명의 범위 내에서, 표현 "약 0.1% 내지 약 5%"는 0.1%, 0.2%, 0.25%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.75%, 0.8%, 0.9%, 1%, 1.2%, 1.4%, 1.6%, 1.8%, 2%, 2.2%, 2.4%, 2.6%, 2.8%, 3%, 3.2%, 3.4%, 3.6%, 3.8%, 4%, 4.2%, 4.4%, 4.6%, 4.8% 및 5%를 포함한다.
이론에 얽매이지 않고, OH- 이온은 세균 막과 반응하여 지방산-글리세롤 에스테르 결합을 절단하고, 후속적으로 세균 막을 SDS로 투과시킬 수 있으며, 이는 차례로 단백질 및 막을 가용화할 수 있다. 또한, NaOH는 세포 DNA를 변성시킬 수 있고, 이는 선형화되고 가닥이 분리되지만, 환상 플라스미드 DNA는 위상학적으로 구속된 상태로 잔류한다. 예시적으로, 알칼리 용해의 단계를 수행하는 것은 제조업자의 지시에 따라, 예를 들면, 퀴아겐(Qiagen®) 또는 마체레이-나겔(Macherey-Nagel®) 키트로부터의 미니, 미디 및 맥시 프렙 키트 등의 시판 키트로 달성할 수 있다. 대안적으로, 문헌[참조: J. Sambrook and D. Russell, Molecular Cloning: A Laboratory Manual, 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y. (2001)]에 기재된 상세한 프로토콜을 참조할 수 있다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 용해 단계는 상기 세균을 삼투압 쇼크로 처리하는 단계를 포함한다.
본 명세서에서 사용된 표현 "삼투압 쇼크"는 특히 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이를 포함하는 용액의 삼투압의 돌연한 변화(예를 들면, 약 5분 이하의 기간에 걸쳐)에 상응한다. 본 명세서에 사용된 바와 같이, 표현 "삼투압 농도"는 리터당 용질의 오스몰 수(Osm/L) 또는 용매 1킬로그램당 용질의 모스몰 수(Osm/kg)로 표현되는 용질 농도의 측정치를 지칭한다.
일 실시형태에서, 상기 삼투압 쇼크의 진폭은 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이를 포함하는 용액의 삼투압 농도가 약 0.9의 계수(factor) 이하, 바람직하게는 약 0.8, 0.7 또는 0.6의 계수 이하, 보다 바람직하게는 약 0.5, 0.4 또는 0.3의 계수 이하, 보다 더 바람직하게는 약 0.25, 0.2, 0.15 또는 0.1의 계수 이하, 보다 더 바람직하게는 약 0.095의 계수 이하로 감소하는 것에 상응한다.
일 실시형태에서, 상기 삼투압 쇼크의 진폭은 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이를 포함하는 용액의 삼투압 농도가 적어도 약 10%의 계수, 바람직하게는 적어도 약 15%, 20%, 25%의 계수, 보다 바람직하게는 적어도 약 30%, 40%, 50%, 60%, 70%, 80%, 90%의 계수로 감소하는 것에 상응한다. 일부 실시형태에서, 계수는 100%이다. 본 발명의 범위 내에서, 100%의 계수는 세균이 약 0 mOsm/L의 삼투압을 갖는 배지 또는 완충액에 현탁되는 것을 의미하는 것을 의도한다.
예시적으로, LB 배양 배지는 440 mOsm/L의 오스몰농도(osmolarity)를 갖는다. 삼투압 쇼크를 실시하기 위해 순수한 물을 사용하면, 오스몰농도는 440 mOsm/L에서 0 mOsm/L로 저하된다. 따라서, 오스몰농도의 감소는 100%이다.
일 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균을 삼투압 쇼크에 노출시키는 단계는 순수한 물에서 적어도 약 30초, 바람직하게는 적어도 약 45초, 60초, 75초, 100초, 125초, 150초, 175초, 200초, 225초, 250초 또는 275초, 보다 바람직하게는 적어도 약 300초 동안의 인큐베이션을 포함한다.
일 실시형태에서, 삼투압 쇼크에 대한 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 감수성이 증가된다. 상기 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이는, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여, 핵산 분자 또는 폴리펩티드 추출에 대해 과민성, 바람직하게는 게놈외 핵산 분자 또는 폴리펩티드 추출에 대해 과민성인 것으로 지칭된다.
삼투압 쇼크에 대한 세균의 감수성은 삼투압 쇼크시에 생존 세균(예: 증식 가능)의 비율을 정량화하여 평가할 수 있다.
삼투압 쇼크시 세균의 생존율은 [CFU/mL]OS/[CFU/mL]T0 비율을 측정함으로써 평가할 수 있고, 여기서 [CFU/mL]OS는 삼투압 쇼크 후의 1mL당 콜로니 형성 단위(CFU)의 수를 나타내고, [CFU/mL]T0은 삼투압 쇼크 전의 CFU/mL의 수를 나타낸다.
CFU/mL의 수는 당해 기술분야의 상식에 따라, 특히 새로운 배지에서 세균 샘플의 1:10 연속 희석 후, 상기 희석액의 샘플을 한천-함유 고체 배양 배지에 침착시키고, 적절한 상응하는 희석액에서 CFU를 계산함으로써 측정할 수 있다. 또는, CFU/mL는 약 600nm에서 광학 밀도를 측정함으로써 평가할 수 있다.
일 실시형태에서, 삼투압 쇼크에 대해 과민성인 유전자 변형된 그람-음성 세균은 약 1:101 내지 약 1:106, 바람직하게는 약 1:102 내지 약 1:105의 비율 [CFU/mL]OS/[CFU/mL]T0를 갖는다. 본 발명의 범위 내에서, 표현 "약 1:101 내지 약 1:106"은 1:101, 1:102, 1:103, 1:104, 1:105 및 1:106을 포함한다.
특정 실시형태에서, [CFU/mL]OS/[CFU/mL]T0 비율은 log(log10)로 표현될 수 있다. 2 로그의 차이는 1:102의 비율에 상응하는 반면, 5 로그의 차이는 1:105의 비율에 상응한다.
일 실시형태에서, 용해, 바람직하게는 화학적 용해, 보다 바람직하게는 알칼리 용해시 본 발명의 유전자 변형된 그람-음성 세균으로부터 방출된 적어도 하나의 게놈외 핵산 분자 및/또는 폴리펩티드의 세포당, 또는 배양물 mL당의 양은 동등한 조건에서 변화되지 않은 엔벨로프 완전성을 갖는 세균으로부터 방출된 양과 비교하여 증가된다. 상기 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이는 핵산 분자 및/또는 폴리펩티드 추출에 대해 과민성, 바람직하게는 게놈외 핵산 분자 및/또는 폴리펩티드 추출에 대해 과민성인 것으로 지칭된다.
일 실시형태에서, 수율은 비율 [AM/세포]BAI/[AM/세포]BR을 계산함으로써 평가될 수 있고, 여기서 [AM/세포]BAI는 본 명세서에 개시된 방법에 따라 본 발명에 따른 세균으로부터 회수된 핵산 분자 또는 폴리펩티드의 양을 나타내고, [AM/세포]BR은 동일한 방법에 따라 참조 세균, 즉 변화되지 않은 엔벨로프 완전성을 갖는 세균으로부터 회수된 핵산 분자 또는 폴리펩티드의 양을 나타낸다.
일 실시형태에서, 용해, 바람직하게는 화학적 용해, 보다 바람직하게는 알칼리 용해시에 본 발명의 유전자 변형된 그람-음성 세균으로부터 방출된 적어도 하나의 게놈외 핵산 분자 및/또는 폴리펩티드의 세포당 또는 배양물 1mL당의 양은, 참조 세균, 즉 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하는 경우, 약 또는 적어도 약 1.1의 계수, 바람직하게는 약 또는 적어도 약 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8 또는 1.9의 계수, 보다 바람직하게는 약 또는 적어도 약 1.9의 계수 이상 증가한다. 상기 실시형태에서, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이는 핵산 및/또는 폴리펩티드 추출에 대해 과민성, 바람직하게는 게놈외 핵산 또는 폴리펩티드 추출에 대해 과민성인 것으로 지칭된다.
일 실시형태에서, 용해, 바람직하게는 알칼리성 용해시 본 발명의 유전자 변형된 그람-음성 세균으로부터 방출된 게놈 DNA의 양에 대한 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이로부터 방출된 적어도 하나의 게놈외 핵산 분자 및/또는 폴리펩티드의 세포당 또는 배양물 1mL당의 양의 비율은 1:1, 2:1, 3:1; 4:1, 5:1, 6:1, 7:1, 8:1 9:1 및 10:1을 포함하여 적어도 약 1:1 내지 적어도 10:1이다.
일 실시형태에서, 용해, 바람직하게는 화학적 용해, 보다 바람직하게는 알칼리성 용해시에, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이로부터 방출된 적어도 하나의 폴리펩티드의 배양물의 세포당 또는 1mL당의 양은, 변화되지 않은 엔벨로프 완전성을 갖는 참조 그람-음성 세균, 특히 이. 콜라이와 비교하는 경우, 약 또는 적어도 약 1.1의 계수, 바람직하게는 약 또는 적어도 약 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8 또는 1.9의 계수, 바람직하게는 약 또는 적어도 약 2의 계수 이상 증가한다.
일 실시형태에서, 상기 열거된 적어도 하나의 폴리펩티드 및/또는 적어도 하나의 게놈외 핵산 분자의 세포당 또는 배양물 1mL당의 양은 정제 단계 후의 양에 상응한다.
일 실시형태에서, 상기 열거된 적어도 하나의 게놈외 핵산 분자의 세포당 또는 배양물 1mL당의 양은 슈퍼-코일 플라스미드의 양에 상응한다.
일 실시형태에서, 본 발명의 방법은, 용해 후, 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이에 의해 방출된 적어도 하나의 게놈외 핵산 분자를 정제하는 단계를 포함하고, 이 단계는 본 명세서에 개시된 방법의 단계 c)에 상응한다.
일 실시형태에서, 본 발명의 방법은 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이에 의해 방출된 적어도 하나의 폴리펩티드를 정제하는 단계를 포함한다.
당업자는 핵산 및/또는 단백질을 정제하는 기술에 익숙하다. 예시적으로, 핵산 및/또는 폴리펩티드의 정제 단계에 대해, 예를 들면, 퀴아겐(Qiagen)의 미니(mini), 미디(midi) 및 맥시(maxi) 프렙 키트 또는 마체레이-나겔(Macherey-Nagel) 키트 등의 시판 키트 또는 재료가 사용되는 경우, 제조원의 지침을 참조할 수 있고/있거나, 대안적으로 문헌[참조: J. Sambrook and D. Russell, Molecular Cloning: A Laboratory Manual, 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y. (2001)]에 의해 기재된 프로토콜을 참조한다.
일 실시형태에서, 생성된 게놈외 핵산 분자는 바람직하게는 용해 단계에 의해 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이로부터 방출된다.
본 발명은 또한 적어도 하나의 게놈외 핵산 분자의 생성 및 생성 세균으로부터의 방출을 위한 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 용도에 관한 것이다.
본 발명은 또한 적어도 하나의 게놈외 핵산 분자에 의해 코딩되는 적어도 하나의 폴리펩티드의 생산을 위한 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 용도에 관한 것이다.
일 실시형태에서, 생산된 폴리펩티드는 바람직하게는 세포 용해 단계에 의해 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 세포질로부터 방출된다.
본 발명은 또한 적어도 하나의 게놈외 핵산 분자에 의해 코딩된 적어도 하나의 폴리펩티드의 생산 및 생산 세포로부터의 방출을 위한 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 용도에 관한 것이다.
일부 실시형태에서, 본 발명에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라이는 외막 소포(OMV)를 생성하지 않는다. 특정 실시형태에서, 적어도 하나의 게놈외 핵산 분자 및/또는 적어도 하나의 게놈외 핵산 분자에 의해 코딩되는 적어도 하나의 폴리펩티드는 외막 소포(OMV)에 의해 방출되지 않는다.
본 발명은 또한 의도에 따른 유전자 변형된 그람-음성 세균, 특히 이. 콜라 이, 및 상기 세균을 게놈외 핵산 분자로 형질전환시키는 수단을 포함하는 키트에 관한 것이다.
본 발명은 추가로 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이 유전자를 포함하는 유전자 변형된 이. 콜라이 세균(여기서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 적어도 하나의 돌연변이 유전자는 ompA 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이다); 및 상기 세균을 게놈외 핵산 분자로 형질전환시키는 수단을 포함하는 키트에 관한 것이다.
일부 실시형태에서, 상기 키트로부터의 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함한다. 특정 실시형태에서, 상기 키트로부터의 세균은 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자는 Lpp 기능성에 관여하는 유전자이다.
일부 실시형태에서, 세균은 ompA 유전자의 완전한 결실 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는다.
일 실시형태에서, 본 발명에 따른 세균은 적격 세균이다.
일 실시형태에서, 본 발명의 키트는 본 발명의 유전자 변형된 그람-음성 세균, 특히 이. 콜라이의 형질전환 반응에서 양성 대조군으로서 사용하기 위한 플라스미드를 포함한다.
본 명세서에 사용된 서열
서열번호 | 설명 |
1 | ompA 핵산 서열 (1041 bp) |
2 | OmpA 프레단백질 아미노산 서열 (346 aa) |
3 | OmpA 성숙 단백질 아미노산 서열 (325 aa) |
4 | lpp 핵산 서열 (237 bp) |
5 | Lpp 프레단백질 아미노산 서열 (78 aa) |
6 | Lpp 성숙 단백질 아미노산 서열 (58 aa) |
7 | pal 핵산 서열 (522 bp) |
8 | Pal 프레단백질 아미노산 서열 (173 aa) |
9 | Pal 성숙 단백질 아미노산 서열 (152 aa) |
10 | ybiS 핵산 서열 (921 bp) |
11 | YbiS 단백질 아미노산 서열 (306 aa) |
12 | ycfS 핵산 서열 (963 bp) |
13 | YcfS 단백질 아미노산 서열 (320 aa) |
14 | erfK 핵산 서열 (933 bp) |
15 | ErfK 단백질 아미노산 서열 (310 aa) |
16 | yfiB 핵산 서열 (483 bp) |
17 | YfiB 단백질 아미노산 서열 (160 aa) |
18 | yiaD 핵산 서열 (660 bp) |
19 | YiaD 단백질 아미노산 서열 (219 aa) |
20 | yqhH 핵산 서열 (258 bp) |
21 | YqhH 단백질 아미노산 서열 (85 aa) |
서열번호 1(
ompA
핵산 서열, 1041 bp)
atgaaaaagacagctatcgcgattgcagtggcactggctggtttcgctaccgtagcgcaggccgctccgaaagataacacctggtacactggtgctaaactgggctggtcccagtaccatgacactggtttcatcaacaacaatggcccgacccatgaaaaccaactgggcgctggtgcttttggtggttaccaggttaacccgtatgttggctttgaaatgggttacgactggttaggtcgtatgccgtacaaaggcagcgttgaaaacggtgcatacaaagctcagggcgttcaactgaccgctaaactgggttacccaatcactgacgacctggacatctacactcgtctgggtggcatggtatggcgtgcagacactaaatccaacgtttatggtaaaaaccacgacaccggcgtttctccggtcttcgctggcggtgttgagtacgcgatcactcctgaaatcgctacccgtctggaataccagtggaccaacaacatcggtgacgcacacaccatcggcactcgtccggacaacggcatgctgagcctgggtgtttcctaccgtttcggtcagggcgaagcagctccagtagttgctccggctccagctccggcaccggaagtacagaccaagcacttcactctgaagtctgacgttctgttcaacttcaacaaagcaaccctgaaaccggaaggtcaggctgctctggatcagctgtacagccagctgagcaacctggatccgaaagacggttccgtagttgttctgggttacaccgaccgcatcggttctgacgcttacaaccagggtctgtccgagcgccgtgctcagtctgttgttgattacctgatctccaaaggtatcccggcagacaagatctccgcacgtggtatgggcgaatccaacccggttactggcaacacctgtgacaacgtgaaacagcgtgctgcactgatcgactgcctggctccggatcgtcgcgtagagatcgaag ttaaaggtatcaaagacgttgtaactcagccgcaggcttaa
서열번호 2(O
mpA
프레단백질
아미노산 서열, 346 aa)
MKKTAIAIAVALAGFATVAQAAPKDNTWYTGAKLGWSQYHDTGFINNNGPTHENQLGAGAFGGYQVNPYVGFEMGYDWLGRMPYKGSVENGAYKAQGVQLTAKLGYPITDDLDIYTRLGGMVWRADTKSNVYGKNHDTGVSPVFAGGVEYAITPEIATRLEYQWTNNIGDAHTIGTRPDNGMLSLGVSYRFGQGEAAPVVAPAPAPAPEVQTKHFTLKSDVLFNFNKATLKPEGQAALDQLYSQLSNLDPKDGSVVVLGYTDRIGSDAYNQGLSERRAQSVVDYLISKGIPADKISARGMGESNPVTGNTCDNVKQRAALIDCLAPDRRVEIEVKGIKDVVTQPQA
서열번호 3(O
mpA
성숙 단백질 아미노산 서열, 325 aa)
APKDNTWYTGAKLGWSQYHDTGFINNNGPTHENQLGAGAFGGYQVNPYVGFEMGYDWLGRMPYKGSVENGAYKAQGVQLTAKLGYPITDDLDIYTRLGGMVWRADTKSNVYGKNHDTGVSPVFAGGVEYAITPEIATRLEYQWTNNIGDAHTIGTRPDNGMLSLGVSYRFGQGEAAPVVAPAPAPAPEVQTKHFTLKSDVLFNFNKATLKPEGQAALDQLYSQLSNLDPKDGSVVVLGYTDRIGSDAYNQGLSERRAQSVVDYLISKGIPADKISARGMGESNPVTGNTCDNVKQRAALIDCLAPDRRVEIEVKGIKDVVTQPQA
서열번호 4(
1pp
핵산 서열,
237bp
)
atgaaagctactaaactggtactgggcgcggtaatcctgggttctactctgctggcaggttgctccagcaacgctaaaatcgatcagctgtcttctgacgttcagactctgaacgctaaagttgaccagctgagcaacgacgtgaacgcaatgcgttccgacgttcaggctgctaaagatgacgcagctcgtgctaaccagcgtctggacaacatggctactaaataccgcaagtaa
서열번호 5(
Lpp
프레단백질
아미노산 서열, 78 aa)
MKATKLVLGAVILGSTLLAGCSSNAKIDQLSSDVQTLNAKVDQLSNDVNAMRSDVQAAKDDAARANQRLDNMATKYRK
서열번호 6(
Lpp
성숙 단백질 아미노산 서열, 58 aa)
CSSNAKIDQLSSDVQTLNAKVDQLSNDVNAMRSDVQAAKDDAARANQRLDNMATKYRK
서열번호 7(
pal
핵산 서열, 522 bp)
atgcaactgaacaaagtgctgaaagggctgatgattgctctgcctgttatggcaattgcggcatgttcttccaacaagaacgccagcaatgacggcagcgaaggcatgctgggtgccggcactggtatggatgcgaacggcggcaacggcaacatgtcttccgaagagcaggctcgtctgcaaatgcaacagctgcagcagaacaacatcgtttacttcgatctggacaagtacgatatccgttctgacttcgctcaaatgctggatgcacatgcaaacttcctgcgtagcaacccgtcttacaaagtcaccgtagaaggtcacgcggacgaacgtggtactccggaatacaacatctccctgggtgaacgtcgtgcgaacgccgttaagatgtacctgcagggtaaaggcgtttctgcagaccagatctccatcgtttcttacggtaaagaaaaacctgcagtactgggtcatgacgaagcggcatactccaaaaaccgtcgtgcggtactggtttactaa
서열번호 8(Pal
프레단백질
아미노산 서열, 173 aa)
MQLNKVLKGLMIALPVMAIAACSSNKNASNDGSEGMLGAGTGMDANGGNGNMSSEEQARLQMQQLQQNNIVYFDLDKYDIRSDFAQMLDAHANFLRSNPSYKVTVEGHADERGTPEYNISLGERRANAVKMYLQGKGVSADQISIVSYGKEKPAVLGHDEAAYSKNRRAVLVY
서열번호 9(Pal 성숙 단백질 아미노산 서열, 152 aa)
CSSNKNASNDGSEGMLGAGTGMDANGGNGNMSEEQARLQMQQLQQNNIVYFDLDKYDIRSDFAQMLDAHANFLRSNPSYKVTVEGHADERGTPEYNISLGERRANAVKMYLQGKGVSADQISIVSYGKEKPAVLGHDEAAYSKNRRAVLVY
서열번호 10(
ybiS
핵산 서열, 921 bp)
atgaatatgaaattgaaaacattattcgcagcggccttcgctgttgtcggcttttgcagtaccgcctctgcggtaacttatcctctgccaaccgacgggagtcgcctggttggtcagaatcaggtgatcaccattcctgaaggtaacactcagccgctggagtattttgccgccgagtaccagatggggctttccaatatgatggaagcgaacccgggtgtggataccttcctgccgaaaggcggtactgtactgaacattccgcagcagctgatcctgccggataccgttcatgaaggcatcgtcattaacagtgctgagatgcgtctttattactatccgaaagggaccaacaccgttatcgtgctgccgatcggcattggtcagttaggcaaagatacgcctatcaactggaccaccaaagttgagcgtaaaaaagcaggcccgacctggacgccgaccgccaaaatgcacgcagagtaccgcgctgcgggcgaaccgcttccggctgtcgttccggcaggtccggataacccgatggggctgtatgcactctatatcggtcgcctgtatgctatccatggcaccaacgccaacttcggtatcggcctgcgtgtaagtcatggttgtgtgcgtctgcgtaacgaagacatcaaattcctgttcgagaaagtaccggtcggtacccgcgtacagtttattgatgagccggtaaaagcgaccaccgagccagacggcagccgttatattgaagtccataacccgctgtctaccaccgaagcccagtttgaaggtcaggaaattgtgccaattaccctgacgaagagcgtgcagacagtgaccggtcagccagatgttgaccaggttgttcttgatgaagcgattaaaaaccgctccgggatgccggttcgtctgaattaa
서열번호 11(
YbiS
단백질 아미노산 서열, 306 aa)
MNMKLKTLFAAAFAVVGFCSTASAVTYPLPTDGSRLVGQNQVITIPEGNTQPLEYFAAEYQMGLSNMMEANPGVDTFLPKGGTVLNIPQQLILPDTVHEGIVINSAEMRLYYYPKGTNTVIVLPIGIGQLGKDTPINWTTKVERKKAGPTWTPTAKMHAEYRAAGEPLPAVVPAGPDNPMGLYALYIGRLYAIHGTNANFGIGLRVSHGCVRLRNEDIKFLFEKVPVGTRVQFIDEPVKATTEPDGSRYIEVHNPLSTTEAQFEGQEIVPITLTKSVQTVTGQPDVDQVVLDEAIKNRSGMPVRLN
서열번호 12(
ycfS
핵산 서열, 963 bp)
gtgatgatcaaaacgcgtttttctcgctggctaacgttttttacgttcgccgctgccgtggcgctggcgctaccggcaaaagccaacacctggccgctgccgccagcgggcagtcgtctggttggcgaaaacaaatttcatgtggtggaaaatgacggtggttctctggaagccatcgccaaaaaatacaacgtcggctttctcgctctgttacaggctaaccccggcgttgatccttacgtaccgcgcgcgggcagcgtgttaacgatcccgttgcaaaccctacttccagatgcgccgcgcgaaggcattgtgatcaacattgcggagctgcgtctctattactacccgccgggtaaaaattcggtaaccgtgtatccaataggtattggtcagttaggtggtgacacgctgacaccgacaatggtgaccaccgtttcagacaaacgtgcaaacccaacctggacgccaacggcaaacatccgcgcccgttataaagcacagggaattgagttgcctgcggtagtgccggctggactggataacccaatgggccatcatgcgattcgtctggcggcctatggcggcgtttatttgcttcatggtacgaacgccgatttcggcattggcatgcgggtaagttctggctgtattcgtctgcgggatgacgatatcaaaacactctttagccaggtcaccccaggcaccaaagtgaatatcatcaacactccgataaaagtctctgccgaaccaaacggtgcgcgtctggttgaagtacatcagccgctgtcagagaagattgatgacgatccgcagctgctgccaattacgctgaatagcgcaatgcaatcatttaaagatgcagcacaaactgacgctgaagtgatgcaacatgtgatggatgtccgttccgggatgccggtggatgtccgccgtcatcaagtgagcccacaaacgctgtaa
서열번호 13(
YcfS
단백질 아미노산 서열, 320 aa)
VMIKTRFSRWLTFFTFAAAVALALPAKANTWPLPPAGSRLVGENKFHVVENDGGSLEAIAKKYNVGFLALLQANPGVDPYVPRAGSVLTIPLQTLLPDAPREGIVINIAELRLYYYPPGKNSVTVYPIGIGQLGGDTLTPTMVTTVSDKRANPTWTPTANIRARYKAQGIELPAVVPAGLDNPMGHHAIRLAAYGGVYLLHGTNADFGIGMRVSSGCIRLRDDDIKTLFSQVTPGTKVNIINTPIKVSAEPNGARLVEVHQPLSEKIDDDPQLLPITLNSAMQSFKDAAQTDAEVMQHVMDVRSGMPVDVRRHQVSPQTL
서열번호 14(
erfK
핵산 서열,
933bp
)
atgcgtcgtgtaaatattctttgctcatttgctctgctttttgccagccatactagcctggcggtaacttatccattacctccagagggtagccgtttagtggggcagtcgtttactgtaactgttcctgatcacaatacccagccgctggagacttttgccgcacaatacgggcaagggttaagtaacatgctggaagcgaacccgggcgctgatgtttttttgccgaagtctggctcgcaactcaccattccgcagcaactgattttgcccgacactgttcgtaaagggattgttgttaacgtcgctgagatgcgtctttattactacccaccagacagtaatactgtggaagtctttcctattggtatcggccaggctgggcgagaaaccccgcgtaactgggtgactaccgttgaacgtaaacaagaagctccaacctggacgccaacgccgaacactcggcgcgaatatgcgaaacgaggggagagtttgcccgcatttgttcctgcgggccccgataatcccatggggctgtacgcgatttatattggcaggttgtatgccatccatggtaccaatgccaattttggtattgggctccgggtaagtcagggctgtattcgtctgcgcaatgacgatatcaaatatctgtttgataatgttcctgttgggacgcgtgtgcaaattatcgaccagccagtaaaatacaccactgaaccagatggctcgaactggctggaagttcatgagccattgtcgcgcaatcgtgcagaatatgagtctgaccgaaaagtgccattgccggtaaccccatctttgcgggcgtttatcaacgggcaagaagttgatgtaaatcgcgcaaatgctgcgttgcaacgtcgatcgggaatgcctgtgcaaattagttctggttcaagacagatgttttaa
서열번호 15(
ErfK
단백질 아미노산 서열, 310 aa)
MRRVNILCSFALLFASHTSLAVTYPLPPEGSRLVGQSFTVTVPDHNTQPLETFAAQYGQGLSNMLEANPGADVFLPKSGSQLTIPQQLILPDTVRKGIVVNVAEMRLYYYPPDSNTVEVFPIGIGQAGRETPRNWVTTVERKQEAPTWTPTPNTRREYAKRGESLPAFVPAGPDNPMGLYAIYIGRLYAIHGTNANFGIGLRVSQGCIRLRNDDIKYLFDNVPVGTRVQIIDQPVKYTTEPDGSNWLEVHEPLSRNRAEYESDRKVPLPVTPSLRAFINGQEVDVNRANAALQRRSGMPVQISSGSRQMF
서열번호 16(
yfiB
핵산,
483bp
)
atgataaagcacctggtagcacccctggttttcacctcactaatactgactggctgccagtcccctcagggaaagtttactcctgagcaagtcgccgctatgcaatcttatggatttactgaatccgccggcgactggtcgctgggcttatcagatgccattctgttcgcaaaaaatgactacaaattgctcccggaaagccagcaacagatccaaaccatggcagctaaattggcctcgacagggctaacacatgcccgtatggatggacacaccgataactatggtgaagacagttacaacgaaggcttatcattgaaacgggcgaatgtcgtggccgatgcatgggctatgggtggacaaattccacgcagcaatctcaccacacagggtttaggaaaaaaatatcccatagccagtaacaagaccgcccagggccgcgccgagaaccgccgcgtcgcagtggtgattactaccccttaa
서열번호 17(
YfiB
단백질 아미노산 서열, 160 aa)
MIKHLVAPLVFTSLLTGCQSPQGKFTPEQVAAMQSYGFTESAGDWSSLGLSDAILFAKNDYKLLPESQQQIQTMAAKLASTGLTHARMDGHTDNYGEDSYNEGLSLKRANVADAWAMGGQIPRSNLTTQGLGKKYPIASNKTAQGRAENRRVAVVITTP
서열번호 18(
yiaD
핵산,
660bp
)
atgaagaaacgtgtttatcttattgccgccgtagtgagtggcgctctggcggtatctggctgcacaactaacccttacaccggcgaacgcgaagcaggtaaatctgctatcggcgcaggtctgggctctctcgtgggcgcgggtattggtgcgctctcttcttcgaagaaagatcgcggtaaaggcgcgctgattggcgcagcagcaggcgcagctctgggcggcggcgttggttattacatggatgtgcaggaagcgaagctgcgcgacaaaatgcgcggcactggtgttagcgtaacccgcagcggggataacattatcctcaatatgccgaacaatgtgaccttcgacagcagcagcgcgaccctgaaaccggcgggcgctaacaccctgaccggcgtggcaatggtactgaaagagtatccgaaaacggcggttaacgtgattggttataccgacagcacgggtggtcacgacctgaacatgcgtctctcccagcaacgtgcggattccgttgccagcgcgttgatcacccagggcgtggacgccagccgcatccgtactcagggccttggcccggctaacccaatcgccagcaacagcaccgcagaaggtaaggcgcaaaaccgccgtgtagaaattaccttaagcccgctgtaa
서열번호 19(
YiaD
단백질 아미노산 서열, 219 aa)
MKKRVYLIAAVVSGALAVSGCTTNPYTGEREAGKSAIGAGLGSLVGAGIGALSSSKKDRGKGALIGAAAGAALGGGVGYYMDVQEAKLRDKMRGTGVSVTRSGDNIILNMPNNVTFDSSSATLKPAGANTLTGVAMVLKEYPKTAVNVIGYTDSTGGHDLNMRLSQQRADSVASALITQGVDASRIRTQGLGPANPIASNSTAEGKAQNRRVEITLSPL
서열번호 20(
yqhH
핵산,
258bp
)
atgaaaacgattttcaccgtgggagctgttgttctggcaacctgcttgctcagtggctgcgtcaatgagcaaaaggtcaatcagctggcgagcaatgtgcaaacattaaatgccaaaatcgcccggcttgagcaggatatgaaagcactacgcccacaaatctatgctgccaaatccgaagctaacagagccaatacgcgtcttgatgctcaggactattttgattgcctgcgctgcttgcgtatgtacgcagaatga
서열번호 21(
YqhH
단백질 아미노산 서열, 85 aa)
MKTIFTVGAVVLATCLLSGCVNEQKVNQLASNVQTLNAKIARLEQDMKALRPQIYAAKSEANRANTRLDAQDYFDCLRCLRMYAE
도 1은 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), 및 하기 유전자형 ΔompA, Δlpp 또는 Δpal을 갖는 MG1655 이 . 콜라이 균주의 순수(pure water)에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 2는 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), 및 하기 유전자형 ompAR256E 또는 lppΔK58 또는 ompAR256E와 lppΔK58 둘 다를 갖는 MG1655 이 . 콜 라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 3은 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), 및 하기 유전자형 ompAD241N 또는 ompAD241N와 Δ lpp 둘 다를 갖는 MG1655 이 . 콜라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 4는 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), ompAR256E 및 lppΔK58 유전자형을 갖는 MG1655 이 . 콜라이 균주(대조군), 및 ompAR256E, ΔybiS, ΔycfS, ΔerfK 중 돌연변이의 조합을 갖는 MG1655 이 . 콜라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 5는 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), 및 lppR57L, ompAR256E, Δ ybiS, ΔycfS, Δ erfK 중 돌연변이의 조합을 갖는 MG1655 이 . 콜라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 6은 야생형 MG1655 이 . 콜라이 균주(대조군), 및 하기 유전자형 lppΔK58 또는 ompAR256E 또는 Δpal 또는 lppΔK58 ompAR256E 또는 lppΔK58 Δpal 또는 ompAR256E Δpal을 갖는 MG1655 이 . 콜라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 7은 야생형 MG1655 이 . 콜라이 균주(대조군) 및 하기 유전자형 Δlpp 또는 Δlpp ΔompA 또는 Δlpp ompAΔCter를 갖는 MG1655 이 . 콜라이 균주의 PBS 완충액(B) 또는 LB 밀러 배양 배지(C)에서 삼투압 쇼크 부재하에 물(A)에 의한 삼투압 쇼크시 세균의 생존을 나타내는 사진이다. 희석율(10-2 및 10-3)은 사진의 우측에 표시된다.
도 8은 비상업용 용해 완충액(자가 제조)을 사용한 제조 프로토콜 후에 야생형 MG1655 이 . 콜라이 균주(레인 1) 및 유전자형 ompAR256E lppΔK58의 MG1655 이 . 콜라이 균주(레인 2)로부터 회수된 플라스미드 DNA의 전기영동에 의한 분석을 나타내는 사진이다.
도 9는 P1, P2 및 P3 완충액의 권장 용적(레인 1 및 3)을 사용하거나 상기 용적을 4로 분할(레인 2 및 4)하는 퀴아겐(Qiagen®) Maxi 프렙 키트를 사용한 제조 프로토콜 후에 대조군 MG1655 이 . 콜라이 균주(레인 1 및 2) 및 유전자형 ompAR256E lppΔK58의 MG1655 이 . 콜라이 균주(레인 3 및 4)로부터 회수된 플라스미드 DNA의 전기영동에 의한 분석을 나타내는 사진이다.
도 10은 대조군 DH10B 이. 콜라이 균주(레인 1), 유전자형 ompAR256E lppΔ K58의 DH10B 이. 콜라이 균주(레인 2), 대조군 DH5α 이. 콜라이 균주(레인 3) 및 유전자형 ompAR256E lppΔK58의 DH5α 이. 콜라이 균주(레인 4)로부터 회수된 플라스미드 DNA의 전기영동에 의한 분석을 나타내는 사진이다. 화살표는 슈퍼-코일 형태에 상응하는 플라스미드의 모집단을 나타낸다.
도 2는 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), 및 하기 유전자형 ompAR256E 또는 lppΔK58 또는 ompAR256E와 lppΔK58 둘 다를 갖는 MG1655 이 . 콜 라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 3은 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), 및 하기 유전자형 ompAD241N 또는 ompAD241N와 Δ lpp 둘 다를 갖는 MG1655 이 . 콜라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 4는 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), ompAR256E 및 lppΔK58 유전자형을 갖는 MG1655 이 . 콜라이 균주(대조군), 및 ompAR256E, ΔybiS, ΔycfS, ΔerfK 중 돌연변이의 조합을 갖는 MG1655 이 . 콜라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 5는 야생형 MG1655 이 . 콜라이 균주(WT; 대조군), 및 lppR57L, ompAR256E, Δ ybiS, ΔycfS, Δ erfK 중 돌연변이의 조합을 갖는 MG1655 이 . 콜라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 6은 야생형 MG1655 이 . 콜라이 균주(대조군), 및 하기 유전자형 lppΔK58 또는 ompAR256E 또는 Δpal 또는 lppΔK58 ompAR256E 또는 lppΔK58 Δpal 또는 ompAR256E Δpal을 갖는 MG1655 이 . 콜라이 균주의 물에 의한 삼투압 쇼크시 세균 생존을 나타내는 사진이다. 세균 희석율은 도면의 하부에 표시된다.
도 7은 야생형 MG1655 이 . 콜라이 균주(대조군) 및 하기 유전자형 Δlpp 또는 Δlpp ΔompA 또는 Δlpp ompAΔCter를 갖는 MG1655 이 . 콜라이 균주의 PBS 완충액(B) 또는 LB 밀러 배양 배지(C)에서 삼투압 쇼크 부재하에 물(A)에 의한 삼투압 쇼크시 세균의 생존을 나타내는 사진이다. 희석율(10-2 및 10-3)은 사진의 우측에 표시된다.
도 8은 비상업용 용해 완충액(자가 제조)을 사용한 제조 프로토콜 후에 야생형 MG1655 이 . 콜라이 균주(레인 1) 및 유전자형 ompAR256E lppΔK58의 MG1655 이 . 콜라이 균주(레인 2)로부터 회수된 플라스미드 DNA의 전기영동에 의한 분석을 나타내는 사진이다.
도 9는 P1, P2 및 P3 완충액의 권장 용적(레인 1 및 3)을 사용하거나 상기 용적을 4로 분할(레인 2 및 4)하는 퀴아겐(Qiagen®) Maxi 프렙 키트를 사용한 제조 프로토콜 후에 대조군 MG1655 이 . 콜라이 균주(레인 1 및 2) 및 유전자형 ompAR256E lppΔK58의 MG1655 이 . 콜라이 균주(레인 3 및 4)로부터 회수된 플라스미드 DNA의 전기영동에 의한 분석을 나타내는 사진이다.
도 10은 대조군 DH10B 이. 콜라이 균주(레인 1), 유전자형 ompAR256E lppΔ K58의 DH10B 이. 콜라이 균주(레인 2), 대조군 DH5α 이. 콜라이 균주(레인 3) 및 유전자형 ompAR256E lppΔK58의 DH5α 이. 콜라이 균주(레인 4)로부터 회수된 플라스미드 DNA의 전기영동에 의한 분석을 나타내는 사진이다. 화살표는 슈퍼-코일 형태에 상응하는 플라스미드의 모집단을 나타낸다.
실시예
본 발명은 하기 실시예에 의해 추가로 설명된다.
실시예
1: 연구에 사용된 세균 균주
1- 재료 및 방법
1.1- 수용자 균주
돌연변이를 조작하기 위해 사용된 수용자 균주의 목록은 표 2에 제공되어 있다.
균주 (WT) | 유전자형 |
이. 콜라이 MG1655 | F- λ- ilvG - rfb-50 rph -1 |
이. 콜라이 DH5α | F-, Δ(argF-lac)169 , φ80dlacZ58 (M15), ΔphoA8 , glnX44 (AS), λ - , deoR481, rfbC1 ?, gyrA96 (NalR), recA1 , endA1 , thiE1 , hsdR17 |
이. 콜라이 DH10B | F- mcrA Δ(mrr-hsdRMS-mcrBC) φ80lacZΔM15 Δ lacX74 recA1 endA1 araD139 Δ(ara-leu)7697 galU galK λ - rpsL(StrR) nupG |
1.2- 결실
MG1655 이 . 콜라이 균주를 수용자 균주로서 사용했다. 케이오(Keio) 균주 컬렉션[참조: Baba et al., Mol Syst Biol. 2006;2:2006.0008]으로부터 수득된 ompA772(del)::kan 또는 lpp -752( del ):: kan 또는 pal-790( del ):: kan 또는 ybiS790(del)::kan 또는 ycfS775 ( del ):: kan 또는 erfK761 ( del ):: kan을 공여자로서 사용하고, 문헌[참조: Thomason et al. (Curr Protoc Mol Biol. 2007 Jul;Chapter 1:Unit 1.17)]에 기재된 수용자 균주에 형질도입했다. 카나마이신을 함유하는 LB/한천 플레이트에서 단순 돌연변이체를 선택했다. 이어서, 카나마이신 내성을 코딩하는 유전자를 FLP 리콤비나제에 의해 절단했다. 이어서, 다른 P1 형질도입을 제1 배경으로 수행하여 조합된 결실 균주를 생성했다.
1.3- 점 돌연변이 및 부분 결실
문헌[참조: Thomason et al. (Plasmid. 2007 Sep;58(2):148-58)]에 보고되어 있는 바와 같이, ds-DNA와의 재조합은 람다-레드 시스템을 사용하여 이. 콜라이 MG1655에서 수행되었다.
2단계 재조합 방법을 사용했고, 먼저, 목적하는 부위에 통합하여 클로람페니콜에서 선택된 cat- sacB를 사용하고, 이어서 제2 람다-레드(Lambda-Red) 재조합을 사용하여 주변 DNA를 수정하지 않고서 cat- sacB를 선택한 최종 돌연변이된 유전자좌로 치환했다.
ompA 돌연변이체의 경우, PCR 산물 ompA ::cat- sacB는 제1 람다-레드 재조합, 이어서 ompA :: ompAR256E 또는 ompA :: ompAD241N 또는 ompA :: ompAΔc와의 제2 람다-레드 재조합을 통해 통합되었다. lpp 돌연변이체의 경우, lpp ::cat- sacB는 먼저 통합되고, 이어서 lpp :: lppΔK58 또는 lpp :: lppK58R과의 재조합 후에 카운터-선택되었다.
1.4- 균주
플라스미드 추출 검정을 위해, lpp :: lppΔK58 균주의 fumD 및 pikF 유전자 사이의 람다-레드(Lambda-Red) 재조합에 의해 카나마이신 내성 유전자(KanR)를 통합했다. 또한, 균주 ompA :: ompAR256E의 유전자 ompA와 matP 사이에서 람다-레드 재조합에 의해 카나마이신 내성 유전자(KanR)를 통합했다.
서열 lpp :: lppΔK58 fumD - kanR - PikF(lppΔK58 - KanR) 및 ompA :: ompAR256E -ΔkanR-matP(ompaR256E-ΔKanR)를 이. 콜라이 DH5α 및 이. 콜라이 DH10B 균주에서 P1 형질도입을 사용하여 도입했다.
이 연구에 사용된 균주와 이의 유전자형은 표 3에 제시되어 있다.
돌연변이체 | 돌연변이 | 사용된 수용자 균주 |
ΔompA | ompA772 (del) | 이. 콜라이 MG1655 |
ompAR256E | ompA::ompAR256E | 이. 콜라이 MG1655 |
lppΔK58 | lpp::lppΔK58 | 이. 콜라이 MG1655 |
lppΔK58 ompAR256E | lpp::lppΔK58 ompA::ompAR256E | 이. 콜라이 MG1655 |
Δlpp ompAD241N | lpp-752(del) ompA::ompAD241N | 이. 콜라이 MG1655 |
ompAD241N | ompA::ompAD241N | 이. 콜라이 MG1655 |
ompAR256E ΔybiS | ompA::ompAR256E ybiS790(del) | 이. 콜라이 MG1655 |
ompAR256E ΔycfS | ompA::ompAR256E ycfS775(del) | 이. 콜라이 MG1655 |
ompAR256E ΔerfK | ompA::ompAR256E erfK761(del) | 이. 콜라이 MG1655 |
ompAR256E ΔybiS ΔycfS | ompA::ompAR256E ybiS790(del) ycfS775(del) | 이. 콜라이 MG1655 |
ompAR256E ΔybiS ΔerfK | ompA::ompAR256E ybiS790(del) erfK761(del) | 이. 콜라이 MG1655 |
ompAR256E ΔybiS ΔycfS ΔerfK | ompA::ompAR256E ybiS790(del) ycfS775(del) erfK761(del) | 이. 콜라이 MG1655 |
lppR57L | lpp::lppR57L | 이. 콜라이 MG1655 |
lppR57L ompAR256E | lpp::lppR57L ompA::ompAR256E | 이. 콜라이 MG1655 |
lppR57L ompAR256E ΔybiS | lpp::lppR57L ompA::ompAR256E ybiS790(del) | 이. 콜라이 MG1655 |
lppR57L ompAR256E ΔycfS | lpp::lppR57L ompA::ompAR256E ycfS775(del) | 이. 콜라이 MG1655 |
lppR57L ompAR256E ΔerfK | lpp::lppR57L ompA::ompAR256E erfK761(del) | 이. 콜라이 MG1655 |
lppR57L ompAR256E ΔybiS ΔerfK | lpp::lppR57L ompA::ompAR256E ybiS790(del) erfK761(del) | 이. 콜라이 MG1655 |
lppR57L ompAR256E ΔybiS ΔycfS | lpp::lppR57L ompA::ompAR256E ybiS790(del) ycfS775(del) | 이. 콜라이 MG1655 |
lppR57L ompAR256E ΔycfS ΔerfK | lpp::lppR57L ompA::ompAR256E ycfS775(del) erfK761(del) | 이. 콜라이 MG1655 |
lppR57L ompAR256E ΔybiS ΔycfS ΔerfK | lpp::lppR57L ompA::ompAR256E ybiS790(del) ycfS775(del) erfK761(del) | 이. 콜라이 MG1655 |
Δpal | pal-790(del) | 이. 콜라이 MG1655 |
lppΔK58 Δpal | lpp::lppΔK58 pal-790(del) | 이. 콜라이 MG1655 |
ompAR256E Δpal | ompA::ompAR256E pal-790(del) | 이. 콜라이 MG1655 |
Δlpp | lpp-752(del) | 이. 콜라이 MG1655 |
Δlpp ΔompA | lpp-752(del) ompA772(del) | 이. 콜라이 MG1655 |
Δlpp ompAΔCter | lpp-752(del) ompA::ompAΔCter | 이. 콜라이 MG1655 |
lppΔK58 ompAΔCter | lpp::lppΔK58-KanR ompA::ompAΔCter | 이. 콜라이 MG1655 |
lppΔK58 ompAR256E | lpp::lppΔK58-KanR ompA::ompAR256E-KanR | 이. 콜라이 DH5α |
lppΔK58 ompAR256E | lpp::lppΔK58-KanR ompA::ompAR256E-KanR | 이. 콜라이 DH10B |
ompAR256E | ompA::ompAR256E | 이. 콜라이 DH10B |
lppΔK58 | lpp::lppΔK58 | 이. 콜라이 DH10B |
lppΔK58 ompAR256E | lpp::lppΔK58 ompA::ompAR256E | 이. 콜라이 DH10B |
2- 결과
2.1-
ompA
돌연변이
OmpA 단백질은 이의 N-말단 ß-배럴 덕분에 그람-음성 세균의 세균 엔벨로프의 외막을 가로질러 확장된다. 단백질의 가용성 C-말단 부분은 주변세포질 내부로 확장되고, 주변세포질 펩티도글리칸과 비공유적으로 상호작용한다. 외막과 주변세포질 펩티도글리칸 사이의 상호작용을 방해하기 위해, 하기 ompA 돌연변이: (i) ompA 유전자의 완전한 결실(ΔompA 또는 ompA772 ( del )) - [참조: Baba et al., Mol Syst Biol. 2006;2:2006.0008], 및 (ii) ompA와 주변세포질 펩티도글리칸과의 상호작용을 매개하는 잔기의 점 돌연변이(point mutation)[참조: Ishida et al., Biochim Biophys Acta. 2014 Dec;1838(12):3014-24]가 사용되었고: 서열번호 3의 위치 256의 아르기닌(R)을 코딩하는 코돈은 글루탐산(E)을 코딩하는 코돈으로 치환되었고(ompA::ompAR256E); 서열번호 3의 위치 241의 아스파르트산(D)을 코딩하는 코돈은 아스파라긴(N)을 코딩하는 코돈으로 치환되었다(ompA::ompAD241N). 서열번호 3의 아미노산 171 내지 아미노산 325로 이루어진 C-말단 부분의 부분적 결실도 생성되었다(ompA :: ompAΔCter). ompA :: ompAR256E는 이전에 양으로 하전된 동안 잔기 256에서 음의 전하를 생성한다. 이것은 돌연변이된 OmpA 단백질과 펩티도글리칸 사이의 상호작용을 파괴하는 정전기적 반발을 생성한다. ompA :: ompAD241N은 잔기 241의 전하를 폐지하고, 따라서 펩티도글리칸과의 상호작용을 파괴한다.
2.2-
lpp
돌연변이
이. 콜라이의 Lpp 단백질은 주변세포질 펩티도글리칸에 세균 엔벨로프의 외막을 결합시킨다. 단백질은 지질화된 N-말단을 통해 외막에 고정되고, C-말단의 리신을 통해 주변세포질 펩티도글리칸에 존재하는 짧은 펩티드 골격에 부착된다. 외막과 주변세포질 펩티도글리칸 사이의 상호작용을 방해하기 위해, 하기 lpp 돌연변이: (i) lpp 유전자의 완전한 결실(lpp -752( del ))[참조: Baba et al., Mol Syst Biol. 2006;2:2006.0008], 및 (ii) Lpp와 주변세포질 펩티도글리칸과의 상호작용에 영향을 미치는 점 돌연변이[참조: Zhang et al., J Biol Chem. 1992 Sep 25:267(27):19560-4]가 사용되었다. Lpp와 주변세포질 펩티도글리칸과의 상호작용을 매개하는 서열번호 6의 Lpp 단백질의 위치 58의 리신(K)을 코딩하는 코돈의 결실은 결실되고(lpp::lppΔK58); 서열번호 6의 위치 57의 아르기닌(R)을 코딩하는 코돈은 류신(L)을 코딩하는 코돈으로 치환되었다(lpp :: lppR57L). lpp::lppR57L 돌연변이체에서, Lpp와 펩티도글리칸의 가교에 필수적인 리신은 여전히 존재하지만, 인접한 잔기가 변형되어 있었다. 이 변형은, 야생형 Lpp 단백질과 비교한 경우, 펩티도글리칸에 대한 Lpp의 결합을 70% 저하시킨다.
2.3-
ybiS
,
ycfS
및
erfK
돌연변이
이 3개의 유전자는 각각 C-말단 리신을 통해 주변세포질 펩티도글리칸에 대한 성숙 Lpp 단백질의 공유 결합을 촉매하는 효소를 코딩한다. 외막과 주변세포질 펩티도글리칸 사이의 상호작용을 방해하기 위해, 하기 돌연변이: ybiS 유전자의 완전한 결실(ybiS790(del)), ycfS 유전자의 완전한 결실(ycfS775(del)) 및 e rfK 유전자의 완전한 결실(erfK761 ( del ))이 사용되었다[참조: Baba et al., Mol Syst Biol. 2006;2:2006.0008].
2.4-
pal
돌연변이
Pal 단백질은 Tol-Pal 수축 장치에 속하는 지단백질이다. 이는 외막과 세균 엔벨로프 내의 주변세포질 펩티도글리칸 사이의 부착에 관여한다. 외막과 주변세포질 펩티도글리칸 사이의 상호작용을 방해하기 위해, 하기 돌연변이: pal 유전자의 완전한 결실(pal - 790(del))이 사용되었다[참조: Baba et al., Mol Syst Biol. 2006;2:2006.0008].
실시예
2.
삼투압
쇼크에 대한 생존에 대한
세균 세포벽에 영향을 미치는 돌연변이(들)의 효과
1- 재료 및 방법
1.1- 세균 배양
이. 콜라이 균주는 LB 배양 배지(1% 트립톤, 0.5% 효모 추출물, 1% NaCl, pH 7.0-7.2)에서 교반하에 37℃에서 성장시켰다. 필요에 따라, 항생물질을 25μg/ml(예: 카나마이신)로 사용했다.
1.2- 삼투압 쇼크 후의 생존의 정량화
지수관수적 또는 고정 배양기의 이. 콜라이 균주를 펠릿화(pelleted)하고, 초기 용적의 2배의 순수에 5분 동안 재현탁했다. 이어서, 이 재현탁물을 물에 연속 희석(10회차 희석)하고, 37℃에서 밤새 인큐베이팅한 LB/한천 플레이트에 직접 스폿팅(spotted)했다.
2- 결과
먼저, 삼투압 쇼크시에 ompA, lpp 또는 pal의 결실 돌연변이를 갖는 이. 콜라이 균주 MG1655의 생존을 평가하고, 야생형 MG1655 균주와 비교했다. 도 1은 삼투압 쇼크 후의 결실 돌연변이체의 생존이 야생형 균주와 거의 필적하다는 것을 나타낸다. 달리 말하면, ompA, lpp 또는 pal 유전자의 단일 돌연변이는 삼투압 쇼크에 대한 이. 콜라이 균주의 감수성에 약간만 영향을 미친다.
삼투압 쇼크 후, 돌연변이 ompAR256E를 갖는 이. 콜라이 균주 MG1655의 생존은 대조군에서 관찰된 것과 유사했다. 돌연변이 lppΔK58을 갖는 이. 콜라이 균주 MG1655의 삼투압 쇼크 후의 생존율은 대조군과 비교하여 약 10의 계수 감소했다.
따라서, 단일 돌연변이 ompAR256E 및 lppΔK58은 삼투압 쇼크에 대한 감수성과 관련하여 엔벨로프 완전성에 약간만 영향을 미친다.
대조적으로, 돌연변이 ompAR256E lppΔK58을 갖는 이. 콜라이 균주 MG1655의 삼투압 쇼크 후의 생존율은 대조군과 비교하여 105의 계수로 급격히 감소하고, lppΔK58 단일 돌연변이체와 비교하여 104의 계수 미만 감소했다(도 2).
유사하게, 단일 ompAD241N 돌연변이는, 대조군 세균과 비교한 경우, 삼투압 쇼크시의 세균 생존에 영향을 미치지 않은 반면, ompAD241N 돌연변이와 lpp 유전자 결실(Δlpp)의 조합은 삼투압 쇼크 후의 생존에 106 계수의 영향을 미쳤다(도 3). 돌연변이 ompAR256E ΔybiS ΔycfS ΔerfK를 갖는 이. 콜라이 균주 MG1655의 삼투압 쇼크 후의 생존율은, 대조군과 비교한 경우, 104 계수 미만 감소했다(도 4). 유전자형 lppR77L ompAR256E ΔybiS ΔerfK를 갖는 이. 콜라이 균주 MG1655의 삼투압 쇼크 후의 생존율은 대조군에 비해 약 103 계수 감소했다. 유전자형 lppR57L ompAR256E ΔybiS ΔycfS를 갖는 이. 콜라이 균주 MG1655의 삼투압 쇼크 후의 생존율은 대조군과 비교하여 약 105 계수 감소했다(도 5).
돌연변이 Δpal과 ompAR256E의 조합은, 대조군과 비교한 경우, 이. 콜라이 균주 MG1655의 삼투압 쇼크 후의 생존율을 약 105 계수 감소시킨다. 돌연변이 Δpal과 lppΔK58의 조합은, 대조군과 비교한 경우, 삼투압 쇼크 후의 생존율을 약 102 계수 감소시킨다. 이 관찰은 대조군과 유사한 단일 Δpal 돌연변이체의 삼투압 쇼크 후의 생존과 대조적이다(도 6). 돌연변이 Δlpp 돌연변이체를 갖는 이. 콜라이 균주 MG1655의 삼투압 쇼크 후의 생존은 대조군과 유사했다. 돌연변이 Δlpp ΔompA 또는 Δlpp ompAΔc를 갖는 이. 콜라이 균주 MG1655의 삼투압 쇼크 후의 생존은 단일 Δlpp 돌연변이체의 생존보다 낮았다. 주목할 것으로, 삼투압 쇼크 부재하의 조건은 유전자형 Δlpp ΔompA 또는 Δlpp ompAΔc를 갖는 이. 콜라이 균주 MG1655의 콜로니 밀도가 대조군 또는 단일 Δlpp 돌연변이체와 비교하여 더욱 약한 것을 나타냈다(도 7).
3- 결론
삼투압 쇼크 후의 생존율의 현저한 감소는 돌연변이 lppΔK58 ompAR256E ; Δlpp ompAD241N ; ompAR256E ΔybiS ΔycfS ΔerfK; lppR57L ompAR256E ΔybiS ΔycfS ; ompAR256E Δpal의 조합을 갖는 MG1655 이. 콜라이에서 관찰되었다. 따라서, 이러한 균주는 참조 세균과 비교하여 삼투압 쇼크에 과민성이다.
또한, 돌연변이 lppR57L ompAR256E ΔybiS ΔerfK 또는 lppΔK58 Δpal 또는 Δlpp ΔompA 또는 Δlpp ompAΔc의 조합을 갖는 MG1655 이. 콜라이 균주도, 단일 돌연변이체 또는 대조군과 비교한 경우, 삼투압 쇼크 후의 생존율의 저하를 나타냈지만, 이러한 감소는 상기 돌연변이체와 비교하여 더욱 완만했다.
외막과 주변세포질 펩티도글리칸 사이의 상호작용에 영향을 미치는 적어도 2개의 돌연변이를 조합하면, 삼투압 쇼크 후의 이. 콜라이 생존율의 상승적 저하를 초래한다.
실시예
3. 유전자형
lppΔK58
ompAR256E의
이. 콜라이 균주 MG1655의 사용은
염색체외
DNA의 회수율을
증가시킨다
1- 재료 및 방법
1.1- 세균 배양 및 적격 세균의 제조
LB(1% 트립톤, 0.5% 효모 추출물, 1% NaCl)에서 교반하에 37℃에서 성장한 지수 상 배양물을 소르비톨이 보충된 냉수에서 수회 세척하고, 전기천공(eletroporation) 전에 아이스 상에 보관했다. 필요에 따라, 항생물질을 25μg/mL(카나마이신, Kan), 15μg/mL(클로람페니콜, Cm) 또는 100μg/mL(암피실린, Amp)로 사용했다.
플라스미드 DNA의 회수:
낮은 카피 플라스미드 pBAD18-Cm(pBAD18-Cm(ATCC® 87396™)은 SDS에 의한 알칼리 용해(분자 클로닝: 실험 매뉴얼, Green and Sambrook)에 의해 플라스미드 DNA의 제조 프로토콜을 사용하여 MG1655 이. 콜라이 균주의 대조군 또는 돌연변이 lppΔK58 ompAR256E를 갖는 MG1655 이. 콜라이 균주로 형질전환시켰다.
소규모 제조를 위해, 1mL의 세균 배양물을 다음과 같이 추가로 처리했다.
· 배양물 1ml를 원심분리한다.
· 용해로 진행한다:
- 150μL의 P1(50mM 트리스-HCL, 80mM EDTA, 100μg/Ml RNase A, pH 8.0, 아이스 상에 보관)을 첨가한다;
- 150μL의 P2(100mM NaOH, 1% SDS)를 첨가한다;
- 튜브를 수회 반전시켜 충분히 혼합한다;
- 실온에서 5분 동안 인큐베이팅한다;
- 300μL의 P3(3M KAc, pH 8.0, 아이스 상에 보관)를 첨가한다.
· 아이스 상에서 10분 유지한다;
· 4℃에서 12,500rpm으로 15분간 원심분리한다;
· 상청액을 유지한다;
· 0,7용적의 이소프로판올(약 630μL)을 첨가하고, 튜브를 수회 온화하게 반전시킨다;
· 4℃에서 12,500rpm으로 15분간 원심분리한다;
· 상청액을 제거한다;
· 300μL의 에탄올 70%(-20℃)를 첨가한다;
· 4℃에서 12,500rpm으로 15분간 원심분리한다;
· 상청액을 온화하게 제거한다;
· 건조시킨다;
· 물 재현탁(약 20μL).
중간 규모 제조의 경우, 퀴아겐 맥시(maxi) 프렙 키트(QIAGEN®)를 사용하여, 제조원의 지시에 따라 또는 대안적으로 각 완충액의 용적을 4로 분할하여 동일한 수의 세포를 포함하는 각 배양물 100mL로부터 플라스미드 DNA를 제조했다. 모든 경우에, DNA의 제제를 500μL의 물에 재현탁시켰다.
회수된 핵산의 분석은 전기영동에 의해 수행했다.
2- 결과
삼투압 쇼크에 대한 감소된 내성의 저하가 표준 추출 프로토콜을 사용하여 회수된 추출물 염색체 DNA의 양과 상관관계가 있는지의 여부를 결정하기 위해, 소규모 제조 중의 플라스미드 DNA의 회수율은 MG1655 이. 콜라이 야생형 균주 또는 돌연변이 lppΔK58 ompAR256E의 조합을 갖는 균주에서 검정했다. 비상업적 조건(상기 참조)을 사용하여 사용된 제1 프로토콜은 대조군 이. 콜라이 균주로부터 플라스미드 DNA의 회수를 가능하게 하지 않았다. 대조적으로, 돌연변이 lppΔK58 ompAR256E를 갖는 이. 콜라이를 사용하는 경우, 플라스미드 DNA는 전기영동에 의해 검출되었다(도 8).
이어서, 이. 콜라이 MG1655 균주 및 lppΔK58 ompAR256E를 갖는 이. 콜라이 균주로부터 플라스미드 DNA의 중간 규모 제조는 권장 용적의 P1, P2 및 N3 완충액을 사용하거나, 이 용적을 4로 분할하여 시험하여, 보다 소량의 용해 완충액을 사용하여 플라스미드 DNA를 회수할 수 있는지의 여부를 결정했다. 제제를 정량화하고, 이들의 함량을 전기영동으로 분석했다(도 9). 권장량의 P1, P2 및 N3 완충액을 사용한 조건에서는, 이. 콜라이 균주 lppΔK58 ompAR256E(105ng/μL)를 사용한 경우, 대조군으로부터 회수된 양(70ng/μL)보다 플라스미드 DNA의 회수량이 더 많았다. 유사하게는, P1, P2 및 N3 완충액 용적의 1/4을 사용하는 조건에서는, 이. 콜라이 균주 lppΔK58 ompAR256E(110ng/μL)를 사용한 경우, 동일한 수의 대조군 세포(30ng/μL)보다 회수된 플라스미드 DNA의 양이 더 많았다. 권장 용적의 완충액을 사용한 경우, 이. 콜라이 균주 lppΔK58 ompAR256E로 회수된 플라스미드 DNA의 양은 대조군 MG1655 이. 콜라이 균주와 비교하여 1.5배 증가했다. 권장된 용적의 P1, P2, N3 완충액의 1/4을 사용한 경우, 이. 콜라이 균주 lppΔK58 ompAR256E로 회수된 플라스미드 DNA의 양의 증가는 대조군 이. 콜라이 MG1655 균주와 비교하여 3.66배였다. 주목할 것으로, 이. 콜라이 균주 lppΔK58 ompAR256E로부터 플라스미드를 제조할 때의 용해물은 보다 투명하고 점성이 낮으며, 이는 용해시에 세균 세포가 방출하는 게놈 DNA가 보다 적은 것을 시사한다.
3- 결론
대조군 야생형 MG1655 이. 콜라이 균주와 비교하여, 이. 콜라이 MG1655 균주 lppΔK58 ompAR256E를 사용은 소규모 제조 및 중간 규모 제조 모두에서 회수된 플라스미드 DNA의 양을 증가시킬 수 있다. 이 증가는 소량의 용해 완충액을 사용한 경우에 더 높았다. 후자의 관찰은, 유전자형 lppΔK58 ompAR256E의 이. 콜라이 균주가 필요한 용해 완충액의 양을 감소시킬 수 있기 때문에, 대규모 염색체외 DNA 제조에서 특히 유리한 것을 나타낸다.
실시예 4. 유전자형 lppΔK58 ompAR256E의 이. 콜라이 균주 DH10B 및 DH5α의 사용은 게놈외 DNA의 회수율을 증가시킨다
1- 재료 및 방법
1.1- 세균 배양 및 적격 세포의 제조
LB(1% 트립톤, 0.5% 효모 추출물, 1% NaCl)에서 교반하에 37℃에서 성장한 지수 상 배양물을 소르비톨이 보충된 냉수에서 수회 세척하고, 전기천공 전에 아이스 상에 보관했다. 필요에 따라, 항생물질을 25μg/mL(카나마이신, Kan), 15μg/mL(클로람페니콜, Cm) 또는 100μg/mL(암피실린, Amp)으로 사용했다.
1.2- 대규모 제조에서 플라스미드 DNA의 회수
플라스미드 pGWIZ gWiz™ 벡터는 마체레이-나겔(Macherey-Nagel) 뉴클레오본드(NucleoBond®) Xtra Midi에 기재된 방법을 사용하여 균주 DH10B의 유전자형 lppΔK58 ompAR256E의 이. 콜라이의 대조군 또는 DH5α로 형질전환시켰다.
2- 결과
이. 콜라이 MG1655 균주 lppΔK58 ompAR256E로부터의 제조로부터 회수된 게놈외 DNA의 양의 증가가 이. 콜라이 균주 DH10B 및 DH5α에서도 관찰되는지의 여부를 결정했다. 대조군 이. 콜라이 DH10B 및 DH5α 균주 및 돌연변이 lppΔK58 및 ompAR256E를 보유하는 이. 콜라이 DH10B 및 DH5α 균주로부터 플라스미드 DNA의 제조는 용해 완충액의 권장 용적을 8로 분할하여 측정했다. 제제를 전기영동에 의해 분석하고, 추가로 정량화했다(도 10). 이. 콜라이 DH10B 균주 lppΔK58 ompAR256E(521ng/μL)를 사용한 경우, 대조군 균주로부터 회수된 양(225ng/μL)보다 회수된 플라스미드 DNA의 양이 더 많았다. 유사하게는, 이. 콜라이 DHα 균주 lppΔK58 ompAR256E(643ng/μL)를 사용한 경우, 대조군 균주로부터 회수된 양(191ng/μL)보다 회수된 플라스미드 DNA의 양이 더 많았다. 이. 콜라이 균주 DH10B lppΔK58 ompAR256E로 회수된 플라스미드 DNA 양의 증가는 대조군 이. 콜라이 DH10B 균주와 비교하여 2.3배였다. 이. 콜라이 균주 DH5α lppΔK58 ompAR256E로 회수된 플라스미드 DNA 양의 증가는 대조군 이. 콜라이 DH5α 균주와 비교하여 3.36배였다.
3- 결론
DH10B 또는 DH5α 이. 콜라이 균주 lppΔK58 ompAR256E를 사용은, 용해 완충액의 권장 용적을 8로 분할한 경우에 대조군 이. 콜라이 DH10B 및 DH5α 균주와 비교하여 회수된 플라스미드 DNA의 양이 증가한다. 또한, 유사한 조건하에, 돌연변이된 DH5α 이. 콜라이 균주로부터 회수된 플라스미드 DNA의 양은 돌연변이된 DH10B 이. 콜라이로부터 회수된 양보다 우수했다.
실시예
5.
삼투압
쇼크 후의 단백질 방출에 대한 세균 세포벽에 영향을 미치는 돌연변이(들)의 효과
1- 재료 및 방법
1.1- 세균 배양
이. 콜라이 균주는 LB(1% 트립톤, 0.5% 효모 추출물, 1% NaCl)에서 교반하에 37℃에서 성장시켰다.
1.2- 삼투압 쇼크 후의 배양 배지 중의 단백질 방출의 정량화
지수관수적 또는 고정 배양기 이. 콜라이 균주를 펠릿화하고, 최초 용적의 2배의 순수로 5분 동안 재현탁했다. 이어서, 15μL의 재현탁물을 SDS-PAGE 전기영동으로 분석했다. 단백질은 쿠마시에 블루 염색에 의해 추가로 정량화되었다.
2- 결과
Δlpp 또는 ΔompA 또는 Δlpp ompAΔc 돌연변이를 갖는 세균 세포에 의해 삼투압 쇼크 후에 방출된 총 단백질의 양은 대조군 이. 콜라이 균주 MG1655의 동일한 수의 세균 세포에 의해 방출된 양보다 더 많았다. 유전자형 Δlpp ΔompA 또는 Δlpp ompAΔc를 갖는 세균 세포에 의해 방출된 세균 세포의 양은 또한 유전자형 Δlpp의 동일한 수의 세균 세포에 의해 방출된 양보다 더 많았다.
3- 결론
유전자형 Δlpp ΔompA 또는 Δlpp ompAΔc의 이. 콜라이 MG1655 균주의 사용은 대조군 이. 콜라이 MG1655 균주 또는 유전자형 Δlpp의 이. 콜라이 MG1655 균주와 비교하여 삼투압 쇼크 후에 세균 세포에 의해 방출되는 단백질의 양을 증가시킨다.
실시예
6. 유전자형
ompAR256E
, 유전자형
lppΔK58
및 유전자형
ompAR256E
lppΔK58의 이. 콜라이 균주
DH10B의
사용은 모두 게놈
외
DNA의 회수를 증가시킨다
1- 재료 및 방법
세균 균주 및 DNA 회수는 실시예 3에 기재된 바와 같이 수행했다.
2- 결과
표 4에서 볼 수 있는 바와 같이, 이중 돌연변이체 ompAR256E lppΔK58은 야생형 참조 균주(DH10B)와 비교하여 DNA 회수율의 현저한 증가를 초래한다.
놀랍게도, 단일 돌연변이 ompAR256E 및 단일 돌연변이 lppΔK58도 야생형 균주와 비교하여 DNA 회수 양의 증가를 초래했다(표 4 참조).
균주 | 최종 OD | 중량 (g) | EB(ml) |
회수된 DNA
(ng/μl) |
DH10B | 2.17±0.50 | 0.48±0.02 | 0.1 | 470±117 |
DH10B ompAR256E lppΔK58 | 1.43±0.40 | 0.41±0.06 | 0.1 | 781±66 |
DH10B ompAR256E | 1.83±0.58 | 0.43±0.02 | 0.1 | 670±114 |
DH10B lppΔK58 | 2.23±0.59 | 0.45±0.04 | 0.1 | 600±126 |
결과적으로, ompAR256E 돌연변이 및/또는 lppΔK58 돌연변이를 갖는 이. 콜라이 균주는 증가된 양의 게놈외 핵산을 수득하는 데 유용할 수 있다.
실시예
7. 유전자형
lppΔK58
ompAΔCt의
이. 콜라이 균주 MG1655의 사용은
게놈외
DNA의 회수율을
증가시킨다
1- 재료 및 방법
세균 균주 및 DNA 회수는 실시예 3에 기재된 바와 같이 수행했다.
2- 결과
하기 표 5에 나타낸 바와 같이, ompAΔCt lppΔK58 이중 돌연변이를 갖는 이. 콜라이 균주는 야생형 균주와 비교하여 회수된 핵산의 양의 현저한 증가를 초래한다.
균주 | 최종 OD | 중량 (g) | EB (ml) |
회수된 DNA
(ng/μl) |
MD243 (XL1 블루) | 3.53±1.40 | 0.54±0.02 | 0.1 | 115±12 |
MD1236 ompAΔCt lppΔK58 | 3.47±1.07 | 0.53±0.06 | 0.1 | 155±35 |
결과적으로, ompAΔCt lppΔK58 이중 돌연변이를 갖는 이. 콜라이 균주는 증가된 양의 게놈외 핵산을 수득하는 데 유용할 수 있다.
SEQUENCE LISTING
<110> UNIVERSITE CATHOLIQUE DE LOUVAIN
COLLET Jean-Francois
DEGHELT Michael
CHO Seung Hyun
<120> GENETICALLY MODIFIED BACTERIUM WITH ALTERED ENVELOP INTEGRITY AND USES THEREOF
<130> CV - 1290/PCT
<150> EP20152513.6
<151> 2020-01-17
<160> 21
<170> BiSSAP 1.3.6
<210> 1
<211> 1041
<212> DNA
<213> Escherichia coli
<220>
<223> ompA nucleic acid sequence, 1041 bp
<400> 1
atgaaaaaga cagctatcgc gattgcagtg gcactggctg gtttcgctac cgtagcgcag 60
gccgctccga aagataacac ctggtacact ggtgctaaac tgggctggtc ccagtaccat 120
gacactggtt tcatcaacaa caatggcccg acccatgaaa accaactggg cgctggtgct 180
tttggtggtt accaggttaa cccgtatgtt ggctttgaaa tgggttacga ctggttaggt 240
cgtatgccgt acaaaggcag cgttgaaaac ggtgcataca aagctcaggg cgttcaactg 300
accgctaaac tgggttaccc aatcactgac gacctggaca tctacactcg tctgggtggc 360
atggtatggc gtgcagacac taaatccaac gtttatggta aaaaccacga caccggcgtt 420
tctccggtct tcgctggcgg tgttgagtac gcgatcactc ctgaaatcgc tacccgtctg 480
gaataccagt ggaccaacaa catcggtgac gcacacacca tcggcactcg tccggacaac 540
ggcatgctga gcctgggtgt ttcctaccgt ttcggtcagg gcgaagcagc tccagtagtt 600
gctccggctc cagctccggc accggaagta cagaccaagc acttcactct gaagtctgac 660
gttctgttca acttcaacaa agcaaccctg aaaccggaag gtcaggctgc tctggatcag 720
ctgtacagcc agctgagcaa cctggatccg aaagacggtt ccgtagttgt tctgggttac 780
accgaccgca tcggttctga cgcttacaac cagggtctgt ccgagcgccg tgctcagtct 840
gttgttgatt acctgatctc caaaggtatc ccggcagaca agatctccgc acgtggtatg 900
ggcgaatcca acccggttac tggcaacacc tgtgacaacg tgaaacagcg tgctgcactg 960
atcgactgcc tggctccgga tcgtcgcgta gagatcgaag ttaaaggtat caaagacgtt 1020
gtaactcagc cgcaggctta a 1041
<210> 2
<211> 346
<212> PRT
<213> Escherichia coli
<220>
<223> OmpA preprotein amino acid sequence, 346 aa
<400> 2
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala Pro Lys Asp Asn Thr Trp Tyr Thr Gly Ala
20 25 30
Lys Leu Gly Trp Ser Gln Tyr His Asp Thr Gly Phe Ile Asn Asn Asn
35 40 45
Gly Pro Thr His Glu Asn Gln Leu Gly Ala Gly Ala Phe Gly Gly Tyr
50 55 60
Gln Val Asn Pro Tyr Val Gly Phe Glu Met Gly Tyr Asp Trp Leu Gly
65 70 75 80
Arg Met Pro Tyr Lys Gly Ser Val Glu Asn Gly Ala Tyr Lys Ala Gln
85 90 95
Gly Val Gln Leu Thr Ala Lys Leu Gly Tyr Pro Ile Thr Asp Asp Leu
100 105 110
Asp Ile Tyr Thr Arg Leu Gly Gly Met Val Trp Arg Ala Asp Thr Lys
115 120 125
Ser Asn Val Tyr Gly Lys Asn His Asp Thr Gly Val Ser Pro Val Phe
130 135 140
Ala Gly Gly Val Glu Tyr Ala Ile Thr Pro Glu Ile Ala Thr Arg Leu
145 150 155 160
Glu Tyr Gln Trp Thr Asn Asn Ile Gly Asp Ala His Thr Ile Gly Thr
165 170 175
Arg Pro Asp Asn Gly Met Leu Ser Leu Gly Val Ser Tyr Arg Phe Gly
180 185 190
Gln Gly Glu Ala Ala Pro Val Val Ala Pro Ala Pro Ala Pro Ala Pro
195 200 205
Glu Val Gln Thr Lys His Phe Thr Leu Lys Ser Asp Val Leu Phe Asn
210 215 220
Phe Asn Lys Ala Thr Leu Lys Pro Glu Gly Gln Ala Ala Leu Asp Gln
225 230 235 240
Leu Tyr Ser Gln Leu Ser Asn Leu Asp Pro Lys Asp Gly Ser Val Val
245 250 255
Val Leu Gly Tyr Thr Asp Arg Ile Gly Ser Asp Ala Tyr Asn Gln Gly
260 265 270
Leu Ser Glu Arg Arg Ala Gln Ser Val Val Asp Tyr Leu Ile Ser Lys
275 280 285
Gly Ile Pro Ala Asp Lys Ile Ser Ala Arg Gly Met Gly Glu Ser Asn
290 295 300
Pro Val Thr Gly Asn Thr Cys Asp Asn Val Lys Gln Arg Ala Ala Leu
305 310 315 320
Ile Asp Cys Leu Ala Pro Asp Arg Arg Val Glu Ile Glu Val Lys Gly
325 330 335
Ile Lys Asp Val Val Thr Gln Pro Gln Ala
340 345
<210> 3
<211> 325
<212> PRT
<213> Escherichia coli
<220>
<223> OmpA mature protein amino acid sequence, 325 aa
<400> 3
Ala Pro Lys Asp Asn Thr Trp Tyr Thr Gly Ala Lys Leu Gly Trp Ser
1 5 10 15
Gln Tyr His Asp Thr Gly Phe Ile Asn Asn Asn Gly Pro Thr His Glu
20 25 30
Asn Gln Leu Gly Ala Gly Ala Phe Gly Gly Tyr Gln Val Asn Pro Tyr
35 40 45
Val Gly Phe Glu Met Gly Tyr Asp Trp Leu Gly Arg Met Pro Tyr Lys
50 55 60
Gly Ser Val Glu Asn Gly Ala Tyr Lys Ala Gln Gly Val Gln Leu Thr
65 70 75 80
Ala Lys Leu Gly Tyr Pro Ile Thr Asp Asp Leu Asp Ile Tyr Thr Arg
85 90 95
Leu Gly Gly Met Val Trp Arg Ala Asp Thr Lys Ser Asn Val Tyr Gly
100 105 110
Lys Asn His Asp Thr Gly Val Ser Pro Val Phe Ala Gly Gly Val Glu
115 120 125
Tyr Ala Ile Thr Pro Glu Ile Ala Thr Arg Leu Glu Tyr Gln Trp Thr
130 135 140
Asn Asn Ile Gly Asp Ala His Thr Ile Gly Thr Arg Pro Asp Asn Gly
145 150 155 160
Met Leu Ser Leu Gly Val Ser Tyr Arg Phe Gly Gln Gly Glu Ala Ala
165 170 175
Pro Val Val Ala Pro Ala Pro Ala Pro Ala Pro Glu Val Gln Thr Lys
180 185 190
His Phe Thr Leu Lys Ser Asp Val Leu Phe Asn Phe Asn Lys Ala Thr
195 200 205
Leu Lys Pro Glu Gly Gln Ala Ala Leu Asp Gln Leu Tyr Ser Gln Leu
210 215 220
Ser Asn Leu Asp Pro Lys Asp Gly Ser Val Val Val Leu Gly Tyr Thr
225 230 235 240
Asp Arg Ile Gly Ser Asp Ala Tyr Asn Gln Gly Leu Ser Glu Arg Arg
245 250 255
Ala Gln Ser Val Val Asp Tyr Leu Ile Ser Lys Gly Ile Pro Ala Asp
260 265 270
Lys Ile Ser Ala Arg Gly Met Gly Glu Ser Asn Pro Val Thr Gly Asn
275 280 285
Thr Cys Asp Asn Val Lys Gln Arg Ala Ala Leu Ile Asp Cys Leu Ala
290 295 300
Pro Asp Arg Arg Val Glu Ile Glu Val Lys Gly Ile Lys Asp Val Val
305 310 315 320
Thr Gln Pro Gln Ala
325
<210> 4
<211> 237
<212> DNA
<213> Escherichia coli
<220>
<223> lpp nucleic acid sequence, 237 bp
<400> 4
atgaaagcta ctaaactggt actgggcgcg gtaatcctgg gttctactct gctggcaggt 60
tgctccagca acgctaaaat cgatcagctg tcttctgacg ttcagactct gaacgctaaa 120
gttgaccagc tgagcaacga cgtgaacgca atgcgttccg acgttcaggc tgctaaagat 180
gacgcagctc gtgctaacca gcgtctggac aacatggcta ctaaataccg caagtaa 237
<210> 5
<211> 78
<212> PRT
<213> Escherichia coli
<220>
<223> Lpp preprotein amino acid sequence, 78 aa
<400> 5
Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr
1 5 10 15
Leu Leu Ala Gly Cys Ser Ser Asn Ala Lys Ile Asp Gln Leu Ser Ser
20 25 30
Asp Val Gln Thr Leu Asn Ala Lys Val Asp Gln Leu Ser Asn Asp Val
35 40 45
Asn Ala Met Arg Ser Asp Val Gln Ala Ala Lys Asp Asp Ala Ala Arg
50 55 60
Ala Asn Gln Arg Leu Asp Asn Met Ala Thr Lys Tyr Arg Lys
65 70 75
<210> 6
<211> 58
<212> PRT
<213> Escherichia coli
<220>
<223> Lpp mature protein amino acid sequence, 58 aa
<400> 6
Cys Ser Ser Asn Ala Lys Ile Asp Gln Leu Ser Ser Asp Val Gln Thr
1 5 10 15
Leu Asn Ala Lys Val Asp Gln Leu Ser Asn Asp Val Asn Ala Met Arg
20 25 30
Ser Asp Val Gln Ala Ala Lys Asp Asp Ala Ala Arg Ala Asn Gln Arg
35 40 45
Leu Asp Asn Met Ala Thr Lys Tyr Arg Lys
50 55
<210> 7
<211> 522
<212> DNA
<213> Escherichia coli
<220>
<223> pal nucleic acid sequence, 522 bp
<400> 7
atgcaactga acaaagtgct gaaagggctg atgattgctc tgcctgttat ggcaattgcg 60
gcatgttctt ccaacaagaa cgccagcaat gacggcagcg aaggcatgct gggtgccggc 120
actggtatgg atgcgaacgg cggcaacggc aacatgtctt ccgaagagca ggctcgtctg 180
caaatgcaac agctgcagca gaacaacatc gtttacttcg atctggacaa gtacgatatc 240
cgttctgact tcgctcaaat gctggatgca catgcaaact tcctgcgtag caacccgtct 300
tacaaagtca ccgtagaagg tcacgcggac gaacgtggta ctccggaata caacatctcc 360
ctgggtgaac gtcgtgcgaa cgccgttaag atgtacctgc agggtaaagg cgtttctgca 420
gaccagatct ccatcgtttc ttacggtaaa gaaaaacctg cagtactggg tcatgacgaa 480
gcggcatact ccaaaaaccg tcgtgcggta ctggtttact aa 522
<210> 8
<211> 173
<212> PRT
<213> Escherichia coli
<220>
<223> Pal preprotein amino acid sequence, 173 aa
<400> 8
Met Gln Leu Asn Lys Val Leu Lys Gly Leu Met Ile Ala Leu Pro Val
1 5 10 15
Met Ala Ile Ala Ala Cys Ser Ser Asn Lys Asn Ala Ser Asn Asp Gly
20 25 30
Ser Glu Gly Met Leu Gly Ala Gly Thr Gly Met Asp Ala Asn Gly Gly
35 40 45
Asn Gly Asn Met Ser Ser Glu Glu Gln Ala Arg Leu Gln Met Gln Gln
50 55 60
Leu Gln Gln Asn Asn Ile Val Tyr Phe Asp Leu Asp Lys Tyr Asp Ile
65 70 75 80
Arg Ser Asp Phe Ala Gln Met Leu Asp Ala His Ala Asn Phe Leu Arg
85 90 95
Ser Asn Pro Ser Tyr Lys Val Thr Val Glu Gly His Ala Asp Glu Arg
100 105 110
Gly Thr Pro Glu Tyr Asn Ile Ser Leu Gly Glu Arg Arg Ala Asn Ala
115 120 125
Val Lys Met Tyr Leu Gln Gly Lys Gly Val Ser Ala Asp Gln Ile Ser
130 135 140
Ile Val Ser Tyr Gly Lys Glu Lys Pro Ala Val Leu Gly His Asp Glu
145 150 155 160
Ala Ala Tyr Ser Lys Asn Arg Arg Ala Val Leu Val Tyr
165 170
<210> 9
<211> 152
<212> PRT
<213> Escherichia coli
<220>
<223> Pal mature protein amino acid sequence, 152 aa
<400> 9
Cys Ser Ser Asn Lys Asn Ala Ser Asn Asp Gly Ser Glu Gly Met Leu
1 5 10 15
Gly Ala Gly Thr Gly Met Asp Ala Asn Gly Gly Asn Gly Asn Met Ser
20 25 30
Ser Glu Glu Gln Ala Arg Leu Gln Met Gln Gln Leu Gln Gln Asn Asn
35 40 45
Ile Val Tyr Phe Asp Leu Asp Lys Tyr Asp Ile Arg Ser Asp Phe Ala
50 55 60
Gln Met Leu Asp Ala His Ala Asn Phe Leu Arg Ser Asn Pro Ser Tyr
65 70 75 80
Lys Val Thr Val Glu Gly His Ala Asp Glu Arg Gly Thr Pro Glu Tyr
85 90 95
Asn Ile Ser Leu Gly Glu Arg Arg Ala Asn Ala Val Lys Met Tyr Leu
100 105 110
Gln Gly Lys Gly Val Ser Ala Asp Gln Ile Ser Ile Val Ser Tyr Gly
115 120 125
Lys Glu Lys Pro Ala Val Leu Gly His Asp Glu Ala Ala Tyr Ser Lys
130 135 140
Asn Arg Arg Ala Val Leu Val Tyr
145 150
<210> 10
<211> 921
<212> DNA
<213> Escherichia coli
<220>
<223> ybiS nucleic acid sequence, 921 bp
<400> 10
atgaatatga aattgaaaac attattcgca gcggccttcg ctgttgtcgg cttttgcagt 60
accgcctctg cggtaactta tcctctgcca accgacggga gtcgcctggt tggtcagaat 120
caggtgatca ccattcctga aggtaacact cagccgctgg agtattttgc cgccgagtac 180
cagatggggc tttccaatat gatggaagcg aacccgggtg tggatacctt cctgccgaaa 240
ggcggtactg tactgaacat tccgcagcag ctgatcctgc cggataccgt tcatgaaggc 300
atcgtcatta acagtgctga gatgcgtctt tattactatc cgaaagggac caacaccgtt 360
atcgtgctgc cgatcggcat tggtcagtta ggcaaagata cgcctatcaa ctggaccacc 420
aaagttgagc gtaaaaaagc aggcccgacc tggacgccga ccgccaaaat gcacgcagag 480
taccgcgctg cgggcgaacc gcttccggct gtcgttccgg caggtccgga taacccgatg 540
gggctgtatg cactctatat cggtcgcctg tatgctatcc atggcaccaa cgccaacttc 600
ggtatcggcc tgcgtgtaag tcatggttgt gtgcgtctgc gtaacgaaga catcaaattc 660
ctgttcgaga aagtaccggt cggtacccgc gtacagttta ttgatgagcc ggtaaaagcg 720
accaccgagc cagacggcag ccgttatatt gaagtccata acccgctgtc taccaccgaa 780
gcccagtttg aaggtcagga aattgtgcca attaccctga cgaagagcgt gcagacagtg 840
accggtcagc cagatgttga ccaggttgtt cttgatgaag cgattaaaaa ccgctccggg 900
atgccggttc gtctgaatta a 921
<210> 11
<211> 306
<212> PRT
<213> Escherichia coli
<220>
<223> YbiS protein amino acid sequence, 306 aa
<400> 11
Met Asn Met Lys Leu Lys Thr Leu Phe Ala Ala Ala Phe Ala Val Val
1 5 10 15
Gly Phe Cys Ser Thr Ala Ser Ala Val Thr Tyr Pro Leu Pro Thr Asp
20 25 30
Gly Ser Arg Leu Val Gly Gln Asn Gln Val Ile Thr Ile Pro Glu Gly
35 40 45
Asn Thr Gln Pro Leu Glu Tyr Phe Ala Ala Glu Tyr Gln Met Gly Leu
50 55 60
Ser Asn Met Met Glu Ala Asn Pro Gly Val Asp Thr Phe Leu Pro Lys
65 70 75 80
Gly Gly Thr Val Leu Asn Ile Pro Gln Gln Leu Ile Leu Pro Asp Thr
85 90 95
Val His Glu Gly Ile Val Ile Asn Ser Ala Glu Met Arg Leu Tyr Tyr
100 105 110
Tyr Pro Lys Gly Thr Asn Thr Val Ile Val Leu Pro Ile Gly Ile Gly
115 120 125
Gln Leu Gly Lys Asp Thr Pro Ile Asn Trp Thr Thr Lys Val Glu Arg
130 135 140
Lys Lys Ala Gly Pro Thr Trp Thr Pro Thr Ala Lys Met His Ala Glu
145 150 155 160
Tyr Arg Ala Ala Gly Glu Pro Leu Pro Ala Val Val Pro Ala Gly Pro
165 170 175
Asp Asn Pro Met Gly Leu Tyr Ala Leu Tyr Ile Gly Arg Leu Tyr Ala
180 185 190
Ile His Gly Thr Asn Ala Asn Phe Gly Ile Gly Leu Arg Val Ser His
195 200 205
Gly Cys Val Arg Leu Arg Asn Glu Asp Ile Lys Phe Leu Phe Glu Lys
210 215 220
Val Pro Val Gly Thr Arg Val Gln Phe Ile Asp Glu Pro Val Lys Ala
225 230 235 240
Thr Thr Glu Pro Asp Gly Ser Arg Tyr Ile Glu Val His Asn Pro Leu
245 250 255
Ser Thr Thr Glu Ala Gln Phe Glu Gly Gln Glu Ile Val Pro Ile Thr
260 265 270
Leu Thr Lys Ser Val Gln Thr Val Thr Gly Gln Pro Asp Val Asp Gln
275 280 285
Val Val Leu Asp Glu Ala Ile Lys Asn Arg Ser Gly Met Pro Val Arg
290 295 300
Leu Asn
305
<210> 12
<211> 963
<212> DNA
<213> Escherichia coli
<220>
<223> ycfS nucleic acid sequence, 963 bp
<400> 12
gtgatgatca aaacgcgttt ttctcgctgg ctaacgtttt ttacgttcgc cgctgccgtg 60
gcgctggcgc taccggcaaa agccaacacc tggccgctgc cgccagcggg cagtcgtctg 120
gttggcgaaa acaaatttca tgtggtggaa aatgacggtg gttctctgga agccatcgcc 180
aaaaaataca acgtcggctt tctcgctctg ttacaggcta accccggcgt tgatccttac 240
gtaccgcgcg cgggcagcgt gttaacgatc ccgttgcaaa ccctacttcc agatgcgccg 300
cgcgaaggca ttgtgatcaa cattgcggag ctgcgtctct attactaccc gccgggtaaa 360
aattcggtaa ccgtgtatcc aataggtatt ggtcagttag gtggtgacac gctgacaccg 420
acaatggtga ccaccgtttc agacaaacgt gcaaacccaa cctggacgcc aacggcaaac 480
atccgcgccc gttataaagc acagggaatt gagttgcctg cggtagtgcc ggctggactg 540
gataacccaa tgggccatca tgcgattcgt ctggcggcct atggcggcgt ttatttgctt 600
catggtacga acgccgattt cggcattggc atgcgggtaa gttctggctg tattcgtctg 660
cgggatgacg atatcaaaac actctttagc caggtcaccc caggcaccaa agtgaatatc 720
atcaacactc cgataaaagt ctctgccgaa ccaaacggtg cgcgtctggt tgaagtacat 780
cagccgctgt cagagaagat tgatgacgat ccgcagctgc tgccaattac gctgaatagc 840
gcaatgcaat catttaaaga tgcagcacaa actgacgctg aagtgatgca acatgtgatg 900
gatgtccgtt ccgggatgcc ggtggatgtc cgccgtcatc aagtgagccc acaaacgctg 960
taa 963
<210> 13
<211> 320
<212> PRT
<213> Escherichia coli
<220>
<223> YcfS protein amino acid sequence, 320 aa
<400> 13
Val Met Ile Lys Thr Arg Phe Ser Arg Trp Leu Thr Phe Phe Thr Phe
1 5 10 15
Ala Ala Ala Val Ala Leu Ala Leu Pro Ala Lys Ala Asn Thr Trp Pro
20 25 30
Leu Pro Pro Ala Gly Ser Arg Leu Val Gly Glu Asn Lys Phe His Val
35 40 45
Val Glu Asn Asp Gly Gly Ser Leu Glu Ala Ile Ala Lys Lys Tyr Asn
50 55 60
Val Gly Phe Leu Ala Leu Leu Gln Ala Asn Pro Gly Val Asp Pro Tyr
65 70 75 80
Val Pro Arg Ala Gly Ser Val Leu Thr Ile Pro Leu Gln Thr Leu Leu
85 90 95
Pro Asp Ala Pro Arg Glu Gly Ile Val Ile Asn Ile Ala Glu Leu Arg
100 105 110
Leu Tyr Tyr Tyr Pro Pro Gly Lys Asn Ser Val Thr Val Tyr Pro Ile
115 120 125
Gly Ile Gly Gln Leu Gly Gly Asp Thr Leu Thr Pro Thr Met Val Thr
130 135 140
Thr Val Ser Asp Lys Arg Ala Asn Pro Thr Trp Thr Pro Thr Ala Asn
145 150 155 160
Ile Arg Ala Arg Tyr Lys Ala Gln Gly Ile Glu Leu Pro Ala Val Val
165 170 175
Pro Ala Gly Leu Asp Asn Pro Met Gly His His Ala Ile Arg Leu Ala
180 185 190
Ala Tyr Gly Gly Val Tyr Leu Leu His Gly Thr Asn Ala Asp Phe Gly
195 200 205
Ile Gly Met Arg Val Ser Ser Gly Cys Ile Arg Leu Arg Asp Asp Asp
210 215 220
Ile Lys Thr Leu Phe Ser Gln Val Thr Pro Gly Thr Lys Val Asn Ile
225 230 235 240
Ile Asn Thr Pro Ile Lys Val Ser Ala Glu Pro Asn Gly Ala Arg Leu
245 250 255
Val Glu Val His Gln Pro Leu Ser Glu Lys Ile Asp Asp Asp Pro Gln
260 265 270
Leu Leu Pro Ile Thr Leu Asn Ser Ala Met Gln Ser Phe Lys Asp Ala
275 280 285
Ala Gln Thr Asp Ala Glu Val Met Gln His Val Met Asp Val Arg Ser
290 295 300
Gly Met Pro Val Asp Val Arg Arg His Gln Val Ser Pro Gln Thr Leu
305 310 315 320
<210> 14
<211> 933
<212> DNA
<213> Escherichia coli
<220>
<223> erfK nucleic acid sequence, 933 bp
<400> 14
atgcgtcgtg taaatattct ttgctcattt gctctgcttt ttgccagcca tactagcctg 60
gcggtaactt atccattacc tccagagggt agccgtttag tggggcagtc gtttactgta 120
actgttcctg atcacaatac ccagccgctg gagacttttg ccgcacaata cgggcaaggg 180
ttaagtaaca tgctggaagc gaacccgggc gctgatgttt ttttgccgaa gtctggctcg 240
caactcacca ttccgcagca actgattttg cccgacactg ttcgtaaagg gattgttgtt 300
aacgtcgctg agatgcgtct ttattactac ccaccagaca gtaatactgt ggaagtcttt 360
cctattggta tcggccaggc tgggcgagaa accccgcgta actgggtgac taccgttgaa 420
cgtaaacaag aagctccaac ctggacgcca acgccgaaca ctcggcgcga atatgcgaaa 480
cgaggggaga gtttgcccgc atttgttcct gcgggccccg ataatcccat ggggctgtac 540
gcgatttata ttggcaggtt gtatgccatc catggtacca atgccaattt tggtattggg 600
ctccgggtaa gtcagggctg tattcgtctg cgcaatgacg atatcaaata tctgtttgat 660
aatgttcctg ttgggacgcg tgtgcaaatt atcgaccagc cagtaaaata caccactgaa 720
ccagatggct cgaactggct ggaagttcat gagccattgt cgcgcaatcg tgcagaatat 780
gagtctgacc gaaaagtgcc attgccggta accccatctt tgcgggcgtt tatcaacggg 840
caagaagttg atgtaaatcg cgcaaatgct gcgttgcaac gtcgatcggg aatgcctgtg 900
caaattagtt ctggttcaag acagatgttt taa 933
<210> 15
<211> 310
<212> PRT
<213> Escherichia coli
<220>
<223> ErfK protein amino acid sequence, 310 aa
<400> 15
Met Arg Arg Val Asn Ile Leu Cys Ser Phe Ala Leu Leu Phe Ala Ser
1 5 10 15
His Thr Ser Leu Ala Val Thr Tyr Pro Leu Pro Pro Glu Gly Ser Arg
20 25 30
Leu Val Gly Gln Ser Phe Thr Val Thr Val Pro Asp His Asn Thr Gln
35 40 45
Pro Leu Glu Thr Phe Ala Ala Gln Tyr Gly Gln Gly Leu Ser Asn Met
50 55 60
Leu Glu Ala Asn Pro Gly Ala Asp Val Phe Leu Pro Lys Ser Gly Ser
65 70 75 80
Gln Leu Thr Ile Pro Gln Gln Leu Ile Leu Pro Asp Thr Val Arg Lys
85 90 95
Gly Ile Val Val Asn Val Ala Glu Met Arg Leu Tyr Tyr Tyr Pro Pro
100 105 110
Asp Ser Asn Thr Val Glu Val Phe Pro Ile Gly Ile Gly Gln Ala Gly
115 120 125
Arg Glu Thr Pro Arg Asn Trp Val Thr Thr Val Glu Arg Lys Gln Glu
130 135 140
Ala Pro Thr Trp Thr Pro Thr Pro Asn Thr Arg Arg Glu Tyr Ala Lys
145 150 155 160
Arg Gly Glu Ser Leu Pro Ala Phe Val Pro Ala Gly Pro Asp Asn Pro
165 170 175
Met Gly Leu Tyr Ala Ile Tyr Ile Gly Arg Leu Tyr Ala Ile His Gly
180 185 190
Thr Asn Ala Asn Phe Gly Ile Gly Leu Arg Val Ser Gln Gly Cys Ile
195 200 205
Arg Leu Arg Asn Asp Asp Ile Lys Tyr Leu Phe Asp Asn Val Pro Val
210 215 220
Gly Thr Arg Val Gln Ile Ile Asp Gln Pro Val Lys Tyr Thr Thr Glu
225 230 235 240
Pro Asp Gly Ser Asn Trp Leu Glu Val His Glu Pro Leu Ser Arg Asn
245 250 255
Arg Ala Glu Tyr Glu Ser Asp Arg Lys Val Pro Leu Pro Val Thr Pro
260 265 270
Ser Leu Arg Ala Phe Ile Asn Gly Gln Glu Val Asp Val Asn Arg Ala
275 280 285
Asn Ala Ala Leu Gln Arg Arg Ser Gly Met Pro Val Gln Ile Ser Ser
290 295 300
Gly Ser Arg Gln Met Phe
305 310
<210> 16
<211> 483
<212> DNA
<213> Escherichia coli
<220>
<223> yfiB nucleic acid, 483 bp
<400> 16
atgataaagc acctggtagc acccctggtt ttcacctcac taatactgac tggctgccag 60
tcccctcagg gaaagtttac tcctgagcaa gtcgccgcta tgcaatctta tggatttact 120
gaatccgccg gcgactggtc gctgggctta tcagatgcca ttctgttcgc aaaaaatgac 180
tacaaattgc tcccggaaag ccagcaacag atccaaacca tggcagctaa attggcctcg 240
acagggctaa cacatgcccg tatggatgga cacaccgata actatggtga agacagttac 300
aacgaaggct tatcattgaa acgggcgaat gtcgtggccg atgcatgggc tatgggtgga 360
caaattccac gcagcaatct caccacacag ggtttaggaa aaaaatatcc catagccagt 420
aacaagaccg cccagggccg cgccgagaac cgccgcgtcg cagtggtgat tactacccct 480
taa 483
<210> 17
<211> 160
<212> PRT
<213> Escherichia coli
<220>
<223> YfiB protein amino acid sequence, 160 aa
<400> 17
Met Ile Lys His Leu Val Ala Pro Leu Val Phe Thr Ser Leu Ile Leu
1 5 10 15
Thr Gly Cys Gln Ser Pro Gln Gly Lys Phe Thr Pro Glu Gln Val Ala
20 25 30
Ala Met Gln Ser Tyr Gly Phe Thr Glu Ser Ala Gly Asp Trp Ser Leu
35 40 45
Gly Leu Ser Asp Ala Ile Leu Phe Ala Lys Asn Asp Tyr Lys Leu Leu
50 55 60
Pro Glu Ser Gln Gln Gln Ile Gln Thr Met Ala Ala Lys Leu Ala Ser
65 70 75 80
Thr Gly Leu Thr His Ala Arg Met Asp Gly His Thr Asp Asn Tyr Gly
85 90 95
Glu Asp Ser Tyr Asn Glu Gly Leu Ser Leu Lys Arg Ala Asn Val Val
100 105 110
Ala Asp Ala Trp Ala Met Gly Gly Gln Ile Pro Arg Ser Asn Leu Thr
115 120 125
Thr Gln Gly Leu Gly Lys Lys Tyr Pro Ile Ala Ser Asn Lys Thr Ala
130 135 140
Gln Gly Arg Ala Glu Asn Arg Arg Val Ala Val Val Ile Thr Thr Pro
145 150 155 160
<210> 18
<211> 660
<212> DNA
<213> Escherichia coli
<220>
<223> yiaD nucleic acid, 660 bp
<400> 18
atgaagaaac gtgtttatct tattgccgcc gtagtgagtg gcgctctggc ggtatctggc 60
tgcacaacta acccttacac cggcgaacgc gaagcaggta aatctgctat cggcgcaggt 120
ctgggctctc tcgtgggcgc gggtattggt gcgctctctt cttcgaagaa agatcgcggt 180
aaaggcgcgc tgattggcgc agcagcaggc gcagctctgg gcggcggcgt tggttattac 240
atggatgtgc aggaagcgaa gctgcgcgac aaaatgcgcg gcactggtgt tagcgtaacc 300
cgcagcgggg ataacattat cctcaatatg ccgaacaatg tgaccttcga cagcagcagc 360
gcgaccctga aaccggcggg cgctaacacc ctgaccggcg tggcaatggt actgaaagag 420
tatccgaaaa cggcggttaa cgtgattggt tataccgaca gcacgggtgg tcacgacctg 480
aacatgcgtc tctcccagca acgtgcggat tccgttgcca gcgcgttgat cacccagggc 540
gtggacgcca gccgcatccg tactcagggc cttggcccgg ctaacccaat cgccagcaac 600
agcaccgcag aaggtaaggc gcaaaaccgc cgtgtagaaa ttaccttaag cccgctgtaa 660
<210> 19
<211> 219
<212> PRT
<213> Escherichia coli
<220>
<223> YiaD protein amino acid sequence, 219 aa
<400> 19
Met Lys Lys Arg Val Tyr Leu Ile Ala Ala Val Val Ser Gly Ala Leu
1 5 10 15
Ala Val Ser Gly Cys Thr Thr Asn Pro Tyr Thr Gly Glu Arg Glu Ala
20 25 30
Gly Lys Ser Ala Ile Gly Ala Gly Leu Gly Ser Leu Val Gly Ala Gly
35 40 45
Ile Gly Ala Leu Ser Ser Ser Lys Lys Asp Arg Gly Lys Gly Ala Leu
50 55 60
Ile Gly Ala Ala Ala Gly Ala Ala Leu Gly Gly Gly Val Gly Tyr Tyr
65 70 75 80
Met Asp Val Gln Glu Ala Lys Leu Arg Asp Lys Met Arg Gly Thr Gly
85 90 95
Val Ser Val Thr Arg Ser Gly Asp Asn Ile Ile Leu Asn Met Pro Asn
100 105 110
Asn Val Thr Phe Asp Ser Ser Ser Ala Thr Leu Lys Pro Ala Gly Ala
115 120 125
Asn Thr Leu Thr Gly Val Ala Met Val Leu Lys Glu Tyr Pro Lys Thr
130 135 140
Ala Val Asn Val Ile Gly Tyr Thr Asp Ser Thr Gly Gly His Asp Leu
145 150 155 160
Asn Met Arg Leu Ser Gln Gln Arg Ala Asp Ser Val Ala Ser Ala Leu
165 170 175
Ile Thr Gln Gly Val Asp Ala Ser Arg Ile Arg Thr Gln Gly Leu Gly
180 185 190
Pro Ala Asn Pro Ile Ala Ser Asn Ser Thr Ala Glu Gly Lys Ala Gln
195 200 205
Asn Arg Arg Val Glu Ile Thr Leu Ser Pro Leu
210 215
<210> 20
<211> 258
<212> DNA
<213> Escherichia coli
<220>
<223> yqhH nucleic acid, 258 bp
<400> 20
atgaaaacga ttttcaccgt gggagctgtt gttctggcaa cctgcttgct cagtggctgc 60
gtcaatgagc aaaaggtcaa tcagctggcg agcaatgtgc aaacattaaa tgccaaaatc 120
gcccggcttg agcaggatat gaaagcacta cgcccacaaa tctatgctgc caaatccgaa 180
gctaacagag ccaatacgcg tcttgatgct caggactatt ttgattgcct gcgctgcttg 240
cgtatgtacg cagaatga 258
<210> 21
<211> 85
<212> PRT
<213> Escherichia coli
<220>
<223> YqhH protein amino acid sequence, 85 aa
<400> 21
Met Lys Thr Ile Phe Thr Val Gly Ala Val Val Leu Ala Thr Cys Leu
1 5 10 15
Leu Ser Gly Cys Val Asn Glu Gln Lys Val Asn Gln Leu Ala Ser Asn
20 25 30
Val Gln Thr Leu Asn Ala Lys Ile Ala Arg Leu Glu Gln Asp Met Lys
35 40 45
Ala Leu Arg Pro Gln Ile Tyr Ala Ala Lys Ser Glu Ala Asn Arg Ala
50 55 60
Asn Thr Arg Leu Asp Ala Gln Asp Tyr Phe Asp Cys Leu Arg Cys Leu
65 70 75 80
Arg Met Tyr Ala Glu
85
Claims (33)
- 엔벨로프 완전성(envelope integrity)에 관여하는 단백질을 코딩하는(encoding) 적어도 2개의 돌연변이된 유전자(mutated gene)를 포함하는 유전자 변형된 에스케리키아 콜라이(Escherichia coli) 세균으로서,
상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해(bacterial lysis)에 대해 과민성이고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체(homologue)이고, 적어도 하나의 돌연변이된 유전자는 Lpp 기능성에 관여하는 유전자이고, 단, 세균은 ompA 유전자의 완전한 결실 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는, 에스케리카아 콜라이 세균. - 제1항에 있어서, Lpp 기능성에 관여하는 적어도 하나의 유전자가 lpp, ybiS, ycfS 및 erfK 유전자 및/또는 이들의 동족체, 및 이들의 임의의 조합을 포함하거나, 또는 이들로 이루어진 그룹으로부터 선택되는, 세균.
- 제1항 또는 제2항에 있어서, 상기 적어도 2개의 돌연변이된 유전자가 하기 조합 중 하나를 포함하는, 세균:
- ompA 및 lpp, 및/또는 이의 동족체;
- ompA 및 ybiS, 및/또는 ycfS 및/또는 erfK, 및/또는 이의 동족체;
- ompA, lpp, ybiS 및 erfK, 및/또는 이의 동족체;
- ompA, lpp, ycfS 및 erfK, 및/또는 이의 동족체; 또는
- ompA, lpp, ybiS 및 ycfS, 및/또는 이의 동족체. - 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 돌연변이된 ompA 유전자가 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실을 포함하고; 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의되는, 세균.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 lpp 유전자의 돌연변이가 위치 58의 리신(K)을 코딩하는 코돈의 결실; 위치 57의 아르기닌(R)을 코딩하는 코돈을 또 다른 아미노산, 바람직하게는 중성으로 하전된 아미노산, 보다 바람직하게는 류신(L)을 코딩하는 코돈으로 치환하는 것; 위치 58의 리신(K)을 코딩하는 코돈을 아르기닌(R)을 코딩하는 코돈으로 치환하는 것; lpp 유전자의 완전한 결실; 및 이들의 조합을 포함하거나, 이들로 이루어진 그룹으로부터 선택되고; 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의되는, 세균.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 돌연변이된 ybiS 유전자, ycfS 유전자 및/또는 erfK 유전자, 및/또는 이들의 동족체가 각각 상기 ybiS, ycfS 및/또는 erfK 유전자, 및/또는 이들의 동족체의 결실로 이루어지는, 세균.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 세균이 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다)를 갖는, 세균.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 세균이 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다)를 갖는, 세균.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 세균이 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); ybiS 유전자의 완전한 결실; ycfS 유전자의 완전한 결실; 및 erfK 유전자의 완전한 결실을 갖는, 세균.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 세균이 위치 256의 아르기닌(R)을 코딩하는 코돈을 글루탐산(E)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 위치 57의 아르기닌(R)을 코딩하는 코돈을 류신(L)을 코딩하는 코돈으로 치환하는 것으로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다); 각각의 ybiS 유전자의 결실; 및 ycfS 유전자의 완전한 결실을 갖는, 세균.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 세균이 위치 241의 아스파르트산(D)을 코딩하는 코돈을 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것으로 이루어진 ompA 유전자의 돌연변이(여기서, 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의된다); 및 lpp 유전자의 완전한 결실을 갖는, 세균.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 세균이, 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외(extra-genomic) 핵산 분자를 추가로 포함하는, 세균.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 게놈외 핵산 분자가 플라스미드(plasmid), 코스미드(cosmid) 및 세균 인공 염색체(BAC)를 포함하거나 이들로 이루어진 그룹으로부터 선택되는, 세균.
- 적어도 하나의 게놈외 핵산 분자의 생산 및 정제를 위한, 적어도 하나의 게놈외 핵산 분자를 포함하고 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는, 유전자 변형된 이. 콜라이 세균의 용도로서,
상기 세균은 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 변화된 엔벨로프 완전성을 갖고, 적어도 하나의 돌연변이된 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자인, 용도. - 제14항에 있어서, 적어도 하나의 게놈외 핵산 분자가 플라스미드, 코스미드 및 세균 인공 염색체(BAC)를 포함하거나 이들로 이루어진 그룹으로부터 선택되는, 용도.
- 바람직하게는 적어도 하나의 게놈외 핵산 분자에 의해 코딩되는, 적어도 하나의 폴리펩티드의 생산 및 정제를 위한, 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 포함하고 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균의 용도로서,
상기 세균은 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 변화된 엔벨로프 완전성을 갖고, 적어도 하나의 돌연변이된 유전자는 ompA 및/또는 이의 동족체, 또는 Lpp 기능성(functionality)에 관여하는 유전자인, 용도. - 제16항에 있어서, 상기 적어도 하나의 폴리펩티드가 적어도 하나의 세포질 폴리펩티드인, 용도.
- 제14항 내지 제17항 중 어느 한 항에 있어서, 상기 적어도 돌연변이된 ompA 유전자가 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실로 이루어지고; 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의되는, 용도.
- 제14항 내지 제17항 중 어느 한 항에 있어서, 상기 Lpp 기능성에 관여하는 적어도 돌연변이된 유전자가 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다), 또는 ybiS 유전자의 완전한 결실, 및/또는 ycfS 유전자의 완전한 결실 및/또는 erfK 유전자의 완전한 결실로 이루어지는, 용도.
- 제14항 내지 제17항 중 어느 한 항에 있어서, 상기 세균이 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 적어도 하나의 돌연변이된 유전자가 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자가 Lpp 기능성에 관여하는 유전자인, 용도.
- 제20항에 있어서, 상기 세균이 ompA 유전자의 완전한 결실 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는, 용도.
- 제21항에 있어서, 상기 세균이 제2항 내지 제11항 중 어느 한 항에 정의된 바와 같은, 용도.
- 하기 단계를 포함하는, 적어도 하나의 게놈외 핵산 분자의 생산 및 정제 방법:
a) 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균을 배양하는 단계로서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 적어도 하나의 돌연변이된 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이고, 상기 세균은 적어도 하나의 게놈외 핵산 분자를 포함하여, 적어도 게놈외 핵산 분자를 증폭시키는, 단계;
b) 단계 a)에서 수득된 세균을 바람직하게는 화학적 용해에 의해 용해시켜 용해 혼합물을 수득하는 단계; 및
c) 단계 b)에서 수득된 용해 혼합물로부터 상기 증폭된 게놈외 핵산 분자를 정제하는 단계. - 제23항에 있어서, 상기 적어도 하나의 게놈외 핵산 분자가 플라스미드, 코스미드 및 세균 인공 염색체(BAC)를 포함하거나 이들로 이루어진 그룹으로부터 선택되는, 방법.
- 하기 단계를 포함하는, 바람직하게는 게놈외 핵산 분자에 의해 코딩되는, 적어도 하나의 폴리펩티드의 생산 및 정제 방법:
a) 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균을 배양하는 단계로서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 상기 적어도 하나의 돌연변이된 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자이고, 상기 세균은 바람직하게는 적어도 하나의 폴리펩티드를 코딩하는 적어도 하나의 게놈외 핵산 분자를 포함하여, 적어도 하나의 폴리펩티드를 합성하는, 단계;
b) 단계 a)에서 수득된 세균을 용해시켜 용해 혼합물을 수득하는 단계; 및
c) 단계 b)에서 수득된 용해 혼합물로부터 상기 적어도 하나의 폴리펩티드를 정제하는 단계. - 제25항에 있어서, 상기 적어도 하나의 폴리펩티드가 하나의 세포질 폴리펩티드인, 방법.
- 제23항 내지 제26항 중 어느 한 항에 있어서, 상기 적어도 돌연변이된 ompA 유전자가 위치 256의 아르기닌(R)을 코딩하는 코돈을 중성 또는 음으로 하전된 아미노산, 바람직하게는 글루탐산(E) 또는 알라닌(A)으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D)을 코딩하는 코돈을 중성 또는 양으로 하전된 아미노산, 바람직하게는 아스파라긴(N)을 코딩하는 코돈으로 치환하는 것; 및/또는 위치 241의 아스파르트산(D) 또는 위치 256의 아르기닌(R)을 코딩하는 코돈에서 또는 그 이전에 개시하는 OmpA 단백질의 C-말단 부분의 결실; 또는 ompA 유전자의 완전한 결실로 이루어지고; 상기 위치는 서열번호 3의 아미노산 서열과 관련하여 정의되는, 방법.
- 제23항 내지 제26항 중 어느 한 항에 있어서, Lpp 기능성에 관여하는 상기 적어도 돌연변이된 유전자가 위치 58의 리신(K)을 코딩하는 코돈의 결실로 이루어진 lpp 유전자의 돌연변이(여기서, 상기 위치는 서열번호 6의 아미노산 서열과 관련하여 정의된다), 또는 ybiS 유전자의 완전한 결실, 및/또는 ycfS 유전자의 완전한 결실 및/또는 erfK 유전자의 완전한 결실로 이루어지는, 방법.
- 제23항 내지 제26항 중 어느 한 항에 있어서, 상기 세균이 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 상기 적어도 하나의 돌연변이된 유전자가 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자가 Lpp 기능성에 관여하는 유전자인, 방법.
- 제29항에 있어서, 상기 세균이 ompA 유전자의 완전한 결실 및 lpp 유전자의 완전한 결실을 동시에 포함하지 않는, 방법.
- 제30항에 있어서, 상기 세균이 제2항 내지 제11항 중 어느 한 항에 정의된 바와 같은, 방법.
- (i) 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 하나의 돌연변이된 유전자를 포함하는 유전자 변형된 이. 콜라이 세균으로서, 상기 세균은 변화된 엔벨로프 완전성을 갖고, 변화되지 않은 엔벨로프 완전성을 갖는 세균과 비교하여 세균 용해에 대해 과민성이고, 적어도 하나의 돌연변이된 유전자는 ompA, 및/또는 이의 동족체, 또는 Lpp 기능성에 관여하는 유전자인, 세균; 및 (ii) 게놈외 핵산 분자로 상기 세균을 형질전환시키는 수단을 포함하는, 키트(kit).
- 제32항에 있어서, 상기 유전자 변형된 이. 콜라이 세균이 엔벨로프 완전성에 관여하는 단백질을 코딩하는 적어도 2개의 돌연변이된 유전자를 포함하고, 적어도 하나의 돌연변이된 유전자가 ompA 및/또는 이의 동족체이고, 적어도 하나의 돌연변이된 유전자가 Lpp 기능성에 관여하는 유전자인, 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20152513 | 2020-01-17 | ||
EP20152513.6 | 2020-01-17 | ||
PCT/EP2021/050969 WO2021144473A2 (en) | 2020-01-17 | 2021-01-18 | Genetically modified bacterium with altered envelop integrity and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220130719A true KR20220130719A (ko) | 2022-09-27 |
Family
ID=69185312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227027267A KR20220130719A (ko) | 2020-01-17 | 2021-01-18 | 엔벨로프 완전성이 변화된 유전자 변형 세균 및 이의 용도 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230340035A1 (ko) |
EP (1) | EP4090773A2 (ko) |
JP (1) | JP2023511305A (ko) |
KR (1) | KR20220130719A (ko) |
CN (1) | CN115003790A (ko) |
AU (1) | AU2021208600A1 (ko) |
WO (1) | WO2021144473A2 (ko) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5747287A (en) * | 1995-04-28 | 1998-05-05 | North American Vaccine, Inc. | Method for the high level expression, purification and refolding of the outer membrane group B porin proteins from Neisseria meningitidis |
US6558677B2 (en) * | 1996-10-15 | 2003-05-06 | Wendell D. Zollinger | Vaccine against gram negative bacteria |
GB201009861D0 (en) * | 2010-06-11 | 2010-07-21 | Novartis Ag | OMV vaccines |
US9764027B2 (en) * | 2012-09-18 | 2017-09-19 | Glaxosmithkline Biologicals Sa | Outer membrane vesicles |
WO2016183531A1 (en) | 2015-05-13 | 2016-11-17 | Synlogic, Inc. | Bacteria engineered to reduce hyperphenylalaninemia |
EP3913052A1 (en) * | 2015-04-24 | 2021-11-24 | F. Hoffmann-La Roche AG | Methods of identifying bacteria comprising binding polypeptides |
WO2016210373A2 (en) | 2015-06-24 | 2016-12-29 | Synlogic, Inc. | Recombinant bacteria engineered for biosafety, pharmaceutical compositions, and methods of use thereof |
WO2017075485A1 (en) * | 2015-10-30 | 2017-05-04 | Synlogic, Inc. | Bacteria engineered to treat disorders in which trimethylamine (tma) is detrimental |
WO2017123592A1 (en) * | 2016-01-11 | 2017-07-20 | Synlogic, Inc. | Bacteria engineered to treat disorders associated with bile salts |
EP3725371A1 (en) * | 2019-04-18 | 2020-10-21 | BiOMVis Srl | Method for the production of outer membrane vesicles and immunogenic compositions thereof |
-
2021
- 2021-01-18 WO PCT/EP2021/050969 patent/WO2021144473A2/en unknown
- 2021-01-18 KR KR1020227027267A patent/KR20220130719A/ko unknown
- 2021-01-18 JP JP2022543176A patent/JP2023511305A/ja active Pending
- 2021-01-18 AU AU2021208600A patent/AU2021208600A1/en active Pending
- 2021-01-18 EP EP21701434.9A patent/EP4090773A2/en active Pending
- 2021-01-18 US US17/792,011 patent/US20230340035A1/en active Pending
- 2021-01-18 CN CN202180009629.0A patent/CN115003790A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021144473A2 (en) | 2021-07-22 |
CN115003790A (zh) | 2022-09-02 |
US20230340035A1 (en) | 2023-10-26 |
EP4090773A2 (en) | 2022-11-23 |
WO2021144473A3 (en) | 2021-09-16 |
AU2021208600A1 (en) | 2022-07-28 |
JP2023511305A (ja) | 2023-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102375732B1 (ko) | 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법 | |
Dueholm et al. | Expression of Fap amyloids in P seudomonas aeruginosa, P. fluorescens, and P. putida results in aggregation and increased biofilm formation | |
De Smet et al. | Alteration of a single amino acid residue reverses fosfomycin resistance of recombinant MurA from Mycobacterium tuberculosis | |
KR20190082318A (ko) | Crispr/cpf1 시스템 및 방법 | |
JPH07506240A (ja) | コレラトキシンの免疫原性無毒化変異体およびトキシンltの免疫原性無毒化変異体,それらの調製,ならびにワクチンの調製のためのそれらの使用 | |
CN110373404B (zh) | 一种酶突变体 | |
KR101739128B1 (ko) | 재조합 crm197의 고 수준 발현 | |
EP3262061B1 (en) | Peptides for facilitating secretion and uses thereof | |
Berger et al. | Membrane topology of conserved components of the type III secretion system from the plant pathogen Xanthomonas campestris pv. vesicatoria | |
Sichwart et al. | Maximized autotransporter-mediated expression (MATE) for surface display and secretion of recombinant proteins in Escherichia coli | |
KR20220029676A (ko) | 희토류 원소(ree) 결합 단백질 | |
KR101554762B1 (ko) | 미생물에 대하여 비특이적 부착성 및/또는 응집성을 부여 또는 증강하는 방법 및 유전자 | |
KR20240006496A (ko) | Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, 및 131-138 crispr 뉴클레아제 | |
KR20220130719A (ko) | 엔벨로프 완전성이 변화된 유전자 변형 세균 및 이의 용도 | |
US11293028B2 (en) | Compositions for adjustable ribosome translation speed and methods of use | |
Ulmke et al. | Identification of a new porin, RafY, encoded by raffinose plasmid pRSD2 of Escherichia coli | |
JP2708403B2 (ja) | 細菌株及びプラスミド | |
US20120277410A1 (en) | Dehydrin-based entropic bristle domain sequences and their use in recombinant protein production | |
Fuchs et al. | Precise amounts of a novel member of a phosphotransferase superfamily are essential for growth and normal morphology in Caulobacter crescentus | |
CN114891821B (zh) | 一种Bacillomycin D高活性菌株及其构建方法和应用 | |
Satheeshkumar et al. | Expression of Leptospira membrane proteins Signal Peptidase (SP) and Leptospira Endostatin like A (Len A) in BL-21 (DE3) is toxic to the host cells | |
CN111944027B (zh) | mclX基因在苏云金芽胞杆菌母细胞裂解中的应用 | |
RU2787047C1 (ru) | ПЛАЗМИДНЫЙ ВЕКТОР pESB ДЛЯ ОЦЕНКИ УСТОЙЧИВОСТИ NEISSERIA GONORRHOEAE К БЕТА-ЛАКТАМНЫМ АНТИБИОТИКАМ И СПОСОБ ЕГО КОНСТРУИРОВАНИЯ | |
JP2019527560A (ja) | リポタンパク質搬出シグナルおよびその使用 | |
JP5545562B2 (ja) | 自己溶菌耐性細胞及びこれを用いた物質生産方法 |