KR20230043157A - 다가 백신 조성물 및 이의 용도 - Google Patents
다가 백신 조성물 및 이의 용도 Download PDFInfo
- Publication number
- KR20230043157A KR20230043157A KR1020237006127A KR20237006127A KR20230043157A KR 20230043157 A KR20230043157 A KR 20230043157A KR 1020237006127 A KR1020237006127 A KR 1020237006127A KR 20237006127 A KR20237006127 A KR 20237006127A KR 20230043157 A KR20230043157 A KR 20230043157A
- Authority
- KR
- South Korea
- Prior art keywords
- coli
- antigen
- polysaccharide
- antigenic
- carrier protein
- Prior art date
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 291
- 229940031348 multivalent vaccine Drugs 0.000 title description 6
- 150000004676 glycans Chemical class 0.000 claims abstract description 771
- 229920001282 polysaccharide Polymers 0.000 claims abstract description 753
- 239000005017 polysaccharide Substances 0.000 claims abstract description 753
- 239000000427 antigen Substances 0.000 claims abstract description 629
- 108091007433 antigens Proteins 0.000 claims abstract description 625
- 102000036639 antigens Human genes 0.000 claims abstract description 625
- 241000588724 Escherichia coli Species 0.000 claims abstract description 399
- 102000014914 Carrier Proteins Human genes 0.000 claims abstract description 334
- 108010078791 Carrier Proteins Proteins 0.000 claims abstract description 334
- 238000000034 method Methods 0.000 claims abstract description 115
- 230000028993 immune response Effects 0.000 claims abstract description 60
- 201000010099 disease Diseases 0.000 claims abstract description 50
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 50
- 230000001717 pathogenic effect Effects 0.000 claims abstract description 27
- 230000000890 antigenic effect Effects 0.000 claims description 257
- 230000013595 glycosylation Effects 0.000 claims description 70
- 238000006206 glycosylation reaction Methods 0.000 claims description 69
- 241000059478 Escherichia coli O75 Species 0.000 claims description 57
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 51
- 208000015181 infectious disease Diseases 0.000 claims description 43
- 241000481005 Escherichia coli O1 Species 0.000 claims description 33
- 108091035707 Consensus sequence Proteins 0.000 claims description 32
- 230000001939 inductive effect Effects 0.000 claims description 29
- 208000031729 Bacteremia Diseases 0.000 claims description 23
- 230000021615 conjugation Effects 0.000 claims description 23
- 206010040047 Sepsis Diseases 0.000 claims description 22
- 241001455504 Escherichia coli O2 Species 0.000 claims description 20
- 239000000126 substance Substances 0.000 claims description 19
- 241000205834 Escherichia coli O16 Species 0.000 claims description 17
- 241001621104 Escherichia coli O6 Species 0.000 claims description 17
- 101710082714 Exotoxin A Proteins 0.000 claims description 17
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 241001455523 Escherichia coli O15 Species 0.000 claims description 15
- 230000001965 increasing effect Effects 0.000 claims description 11
- 241001543249 Escherichia coli O25 Species 0.000 claims description 10
- 241001543254 Escherichia coli O18 Species 0.000 claims description 6
- 241000589517 Pseudomonas aeruginosa Species 0.000 claims description 4
- 230000002265 prevention Effects 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 130
- 108090000623 proteins and genes Proteins 0.000 description 99
- 102100039364 Metalloproteinase inhibitor 1 Human genes 0.000 description 98
- 102000004169 proteins and genes Human genes 0.000 description 82
- 235000018102 proteins Nutrition 0.000 description 81
- 108010089072 Dolichyl-diphosphooligosaccharide-protein glycotransferase Proteins 0.000 description 61
- 101000702917 Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) CDP-abequose synthase Proteins 0.000 description 60
- 150000007523 nucleic acids Chemical class 0.000 description 44
- 108020004707 nucleic acids Proteins 0.000 description 41
- 102000039446 nucleic acids Human genes 0.000 description 41
- 229960005486 vaccine Drugs 0.000 description 33
- 239000002773 nucleotide Substances 0.000 description 31
- 238000004519 manufacturing process Methods 0.000 description 30
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 239000002671 adjuvant Substances 0.000 description 26
- 235000001014 amino acid Nutrition 0.000 description 24
- 229940024606 amino acid Drugs 0.000 description 23
- 150000001413 amino acids Chemical class 0.000 description 23
- 108091008053 gene clusters Proteins 0.000 description 22
- 230000035772 mutation Effects 0.000 description 22
- 102000009016 Cholera Toxin Human genes 0.000 description 20
- 108010049048 Cholera Toxin Proteins 0.000 description 20
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 20
- 208000019206 urinary tract infection Diseases 0.000 description 20
- -1 1-cyano-4-dimethylamino pyridinium tetrafluoroborate Chemical compound 0.000 description 18
- 230000002163 immunogen Effects 0.000 description 17
- 102000051366 Glycosyltransferases Human genes 0.000 description 16
- 108700023372 Glycosyltransferases Proteins 0.000 description 16
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 16
- 235000002639 sodium chloride Nutrition 0.000 description 14
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 13
- 150000001720 carbohydrates Chemical class 0.000 description 13
- 239000008194 pharmaceutical composition Substances 0.000 description 13
- 108010055629 Glucosyltransferases Proteins 0.000 description 12
- 102000000340 Glucosyltransferases Human genes 0.000 description 12
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 12
- 125000006850 spacer group Chemical group 0.000 description 12
- 235000000346 sugar Nutrition 0.000 description 12
- 241000589875 Campylobacter jejuni Species 0.000 description 11
- 101710146739 Enterotoxin Proteins 0.000 description 11
- 239000000147 enterotoxin Substances 0.000 description 11
- 231100000655 enterotoxin Toxicity 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 239000008103 glucose Substances 0.000 description 10
- 239000011780 sodium chloride Substances 0.000 description 10
- 208000024891 symptom Diseases 0.000 description 10
- BNAIICFZMLQZKW-CYAIWNQHSA-N (6e,10e,14e,18e,22e,26e,30e,34e,38e)-3,7,11,15,19,23,27,31,35,39,43-undecamethyltetratetraconta-6,10,14,18,22,26,30,34,38,42-decaen-1-ol Chemical compound OCCC(C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CCC=C(C)C BNAIICFZMLQZKW-CYAIWNQHSA-N 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- 238000013459 approach Methods 0.000 description 9
- 230000003053 immunization Effects 0.000 description 9
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 description 9
- 229920001542 oligosaccharide Polymers 0.000 description 9
- 150000002482 oligosaccharides Chemical class 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- 241000282412 Homo Species 0.000 description 8
- 241000124008 Mammalia Species 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 239000002158 endotoxin Substances 0.000 description 8
- 238000002649 immunization Methods 0.000 description 8
- 229920006008 lipopolysaccharide Polymers 0.000 description 8
- 201000007094 prostatitis Diseases 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 7
- 150000002632 lipids Chemical class 0.000 description 7
- 101150057996 rfaL gene Proteins 0.000 description 7
- 102200067350 rs118203990 Human genes 0.000 description 7
- 238000002255 vaccination Methods 0.000 description 7
- LMDZBCPBFSXMTL-UHFFFAOYSA-N 1-ethyl-3-(3-dimethylaminopropyl)carbodiimide Chemical compound CCN=C=NCCCN(C)C LMDZBCPBFSXMTL-UHFFFAOYSA-N 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 108010040721 Flagellin Proteins 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 101150052803 gtrS gene Proteins 0.000 description 6
- 230000036541 health Effects 0.000 description 6
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 6
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 6
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 6
- 239000007800 oxidant agent Substances 0.000 description 6
- KHIWWQKSHDUIBK-UHFFFAOYSA-N periodic acid Chemical compound OI(=O)(=O)=O KHIWWQKSHDUIBK-UHFFFAOYSA-N 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 238000006722 reduction reaction Methods 0.000 description 6
- 210000002966 serum Anatomy 0.000 description 6
- 208000035143 Bacterial infection Diseases 0.000 description 5
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 5
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 5
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 5
- 241000282693 Cercopithecidae Species 0.000 description 5
- 101710113946 Clotting factor B Proteins 0.000 description 5
- 102100037840 Dehydrogenase/reductase SDR family member 2, mitochondrial Human genes 0.000 description 5
- 241001646716 Escherichia coli K-12 Species 0.000 description 5
- 241000205840 Escherichia coli O8 Species 0.000 description 5
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 5
- 101000597577 Gluconacetobacter diazotrophicus (strain ATCC 49037 / DSM 5601 / CCUG 37298 / CIP 103539 / LMG 7603 / PAl5) Outer membrane protein Proteins 0.000 description 5
- 241000606768 Haemophilus influenzae Species 0.000 description 5
- 101710147195 Hemolysin A Proteins 0.000 description 5
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 5
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 5
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 5
- 241000283973 Oryctolagus cuniculus Species 0.000 description 5
- 101710116435 Outer membrane protein Proteins 0.000 description 5
- 101710188053 Protein D Proteins 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- 101710132893 Resolvase Proteins 0.000 description 5
- 101900032831 Streptococcus pneumoniae Pneumolysin Proteins 0.000 description 5
- 102000008233 Toll-Like Receptor 4 Human genes 0.000 description 5
- 108010060804 Toll-Like Receptor 4 Proteins 0.000 description 5
- 230000003187 abdominal effect Effects 0.000 description 5
- 208000022362 bacterial infectious disease Diseases 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 239000003114 blood coagulation factor Substances 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 229960003983 diphtheria toxoid Drugs 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 5
- 229940047650 haemophilus influenzae Drugs 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 229950006780 n-acetylglucosamine Drugs 0.000 description 5
- 238000007254 oxidation reaction Methods 0.000 description 5
- 238000006268 reductive amination reaction Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 150000008163 sugars Chemical class 0.000 description 5
- 229960000814 tetanus toxoid Drugs 0.000 description 5
- 238000002560 therapeutic procedure Methods 0.000 description 5
- 108010071134 CRM197 (non-toxic variant of diphtheria toxin) Proteins 0.000 description 4
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 4
- 102000016607 Diphtheria Toxin Human genes 0.000 description 4
- 108010053187 Diphtheria Toxin Proteins 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- 201000009906 Meningitis Diseases 0.000 description 4
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 4
- JRNVZBWKYDBUCA-UHFFFAOYSA-N N-chlorosuccinimide Chemical group ClN1C(=O)CCC1=O JRNVZBWKYDBUCA-UHFFFAOYSA-N 0.000 description 4
- 241000588650 Neisseria meningitidis Species 0.000 description 4
- 101710160107 Outer membrane protein A Proteins 0.000 description 4
- 101710167675 Outer membrane protein P5 Proteins 0.000 description 4
- 101710195197 Peptidoglycan-binding protein ArfA Proteins 0.000 description 4
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 101150049278 US20 gene Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 239000003638 chemical reducing agent Substances 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003205 genotyping method Methods 0.000 description 4
- 101150094414 gtrA gene Proteins 0.000 description 4
- 101150035941 gtrB gene Proteins 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 150000002772 monosaccharides Chemical class 0.000 description 4
- 230000003647 oxidation Effects 0.000 description 4
- 210000001322 periplasm Anatomy 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 150000004804 polysaccharides Polymers 0.000 description 4
- 210000002307 prostate Anatomy 0.000 description 4
- 102220319964 rs201657576 Human genes 0.000 description 4
- 102200089579 rs786202787 Human genes 0.000 description 4
- JQWHASGSAFIOCM-UHFFFAOYSA-M sodium periodate Chemical compound [Na+].[O-]I(=O)(=O)=O JQWHASGSAFIOCM-UHFFFAOYSA-M 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 150000003568 thioethers Chemical class 0.000 description 4
- 210000002700 urine Anatomy 0.000 description 4
- 206010056519 Abdominal infection Diseases 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 206010031252 Osteomyelitis Diseases 0.000 description 3
- 206010058674 Pelvic Infection Diseases 0.000 description 3
- 206010035664 Pneumonia Diseases 0.000 description 3
- 206010037596 Pyelonephritis Diseases 0.000 description 3
- 208000031650 Surgical Wound Infection Diseases 0.000 description 3
- 206010048038 Wound infection Diseases 0.000 description 3
- 238000006640 acetylation reaction Methods 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 230000004520 agglutination Effects 0.000 description 3
- 239000000556 agonist Substances 0.000 description 3
- 125000003277 amino group Chemical group 0.000 description 3
- 230000000844 anti-bacterial effect Effects 0.000 description 3
- 230000001851 biosynthetic effect Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000001784 detoxification Methods 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 238000003018 immunoassay Methods 0.000 description 3
- 229940027941 immunoglobulin g Drugs 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 230000002147 killing effect Effects 0.000 description 3
- 125000005647 linker group Chemical group 0.000 description 3
- 238000011587 new zealand white rabbit Methods 0.000 description 3
- ODUCDPQEXGNKDN-UHFFFAOYSA-N nitroxyl Chemical class O=N ODUCDPQEXGNKDN-UHFFFAOYSA-N 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000003656 tris buffered saline Substances 0.000 description 3
- VRDGQQTWSGDXCU-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 2-iodoacetate Chemical compound ICC(=O)ON1C(=O)CCC1=O VRDGQQTWSGDXCU-UHFFFAOYSA-N 0.000 description 2
- WGMMKWFUXPMTRW-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 3-[(2-bromoacetyl)amino]propanoate Chemical compound BrCC(=O)NCCC(=O)ON1C(=O)CCC1=O WGMMKWFUXPMTRW-UHFFFAOYSA-N 0.000 description 2
- BQWBEDSJTMWJAE-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 4-[(2-iodoacetyl)amino]benzoate Chemical compound C1=CC(NC(=O)CI)=CC=C1C(=O)ON1C(=O)CCC1=O BQWBEDSJTMWJAE-UHFFFAOYSA-N 0.000 description 2
- RMTFNDVZYPHUEF-DBRKOABJSA-N (2s,3s,4r,5r)-2,4,5,6-tetrahydroxy-3-methoxyhexanal Chemical compound O=C[C@@H](O)[C@@H](OC)[C@H](O)[C@H](O)CO RMTFNDVZYPHUEF-DBRKOABJSA-N 0.000 description 2
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 2
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 2
- 206010053555 Arthritis bacterial Diseases 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000700198 Cavia Species 0.000 description 2
- 206010007882 Cellulitis Diseases 0.000 description 2
- 108010060123 Conjugate Vaccines Proteins 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 101900251156 Escherichia coli Flagellin Proteins 0.000 description 2
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 229930186217 Glycolipid Natural products 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 208000004575 Infectious Arthritis Diseases 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 2
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 2
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 2
- 238000003657 Likelihood-ratio test Methods 0.000 description 2
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 2
- XOCCAGJZGBCJME-IANFNVNHSA-N N-Acetyl-D-fucosamine Chemical compound C[C@H]1OC(O)[C@H](NC(C)=O)[C@@H](O)[C@H]1O XOCCAGJZGBCJME-IANFNVNHSA-N 0.000 description 2
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 2
- PCLIMKBDDGJMGD-UHFFFAOYSA-N N-bromosuccinimide Chemical compound BrN1C(=O)CCC1=O PCLIMKBDDGJMGD-UHFFFAOYSA-N 0.000 description 2
- 230000004988 N-glycosylation Effects 0.000 description 2
- LQZMLBORDGWNPD-UHFFFAOYSA-N N-iodosuccinimide Chemical compound IN1C(=O)CCC1=O LQZMLBORDGWNPD-UHFFFAOYSA-N 0.000 description 2
- 206010028813 Nausea Diseases 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 206010053159 Organ failure Diseases 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 2
- 201000001177 Pyomyositis Diseases 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 2
- 206010062255 Soft tissue infection Diseases 0.000 description 2
- 101000870420 Streptococcus gordonii UDP-N-acetylglucosamine-peptide N-acetylglucosaminyltransferase GtfA subunit Proteins 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 206010051379 Systemic Inflammatory Response Syndrome Diseases 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 2
- 229940037003 alum Drugs 0.000 description 2
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 238000005349 anion exchange Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000005875 antibody response Effects 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- OWBTYPJTUOEWEK-UHFFFAOYSA-N butane-2,3-diol Chemical compound CC(O)C(C)O OWBTYPJTUOEWEK-UHFFFAOYSA-N 0.000 description 2
- 230000007073 chemical hydrolysis Effects 0.000 description 2
- 239000013626 chemical specie Substances 0.000 description 2
- 208000003167 cholangitis Diseases 0.000 description 2
- 238000004440 column chromatography Methods 0.000 description 2
- 229940031670 conjugate vaccine Drugs 0.000 description 2
- 239000004643 cyanate ester Substances 0.000 description 2
- OOTFVKOQINZBBF-UHFFFAOYSA-N cystamine Chemical group CCSSCCN OOTFVKOQINZBBF-UHFFFAOYSA-N 0.000 description 2
- 229940099500 cystamine Drugs 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- UFPHFKCTOZIAFY-NTDVEAECSA-N ditrans,polycis-undecaprenyl phosphate Chemical group CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/COP(O)(O)=O UFPHFKCTOZIAFY-NTDVEAECSA-N 0.000 description 2
- 206010014665 endocarditis Diseases 0.000 description 2
- 206010014801 endophthalmitis Diseases 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical group OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 229960001438 immunostimulant agent Drugs 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- ZFSLODLOARCGLH-UHFFFAOYSA-N isocyanuric acid Chemical compound OC1=NC(O)=NC(O)=N1 ZFSLODLOARCGLH-UHFFFAOYSA-N 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 210000005001 male reproductive tract Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- GDOPTJXRTPNYNR-UHFFFAOYSA-N methyl-cyclopentane Natural products CC1CCCC1 GDOPTJXRTPNYNR-UHFFFAOYSA-N 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000008693 nausea Effects 0.000 description 2
- 238000013188 needle biopsy Methods 0.000 description 2
- 230000000625 opsonophagocytic effect Effects 0.000 description 2
- 230000004768 organ dysfunction Effects 0.000 description 2
- KHIWWQKSHDUIBK-UHFFFAOYSA-M periodate Chemical compound [O-]I(=O)(=O)=O KHIWWQKSHDUIBK-UHFFFAOYSA-M 0.000 description 2
- 206010034674 peritonitis Diseases 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 2
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 229940068968 polysorbate 80 Drugs 0.000 description 2
- 229920000053 polysorbate 80 Polymers 0.000 description 2
- 230000002516 postimmunization Effects 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 230000002335 preservative effect Effects 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 238000010791 quenching Methods 0.000 description 2
- 230000000171 quenching effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 201000001223 septic arthritis Diseases 0.000 description 2
- 201000009890 sinusitis Diseases 0.000 description 2
- 238000004513 sizing Methods 0.000 description 2
- BEOOHQFXGBMRKU-UHFFFAOYSA-N sodium cyanoborohydride Chemical compound [Na+].[B-]C#N BEOOHQFXGBMRKU-UHFFFAOYSA-N 0.000 description 2
- HHSGWIABCIVPJT-UHFFFAOYSA-M sodium;1-[4-[(2-iodoacetyl)amino]benzoyl]oxy-2,5-dioxopyrrolidine-3-sulfonate Chemical compound [Na+].O=C1C(S(=O)(=O)[O-])CC(=O)N1OC(=O)C1=CC=C(NC(=O)CI)C=C1 HHSGWIABCIVPJT-UHFFFAOYSA-M 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 201000006489 suppurative thyroiditis Diseases 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 2
- 229940033663 thimerosal Drugs 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 230000002485 urinary effect Effects 0.000 description 2
- 210000001635 urinary tract Anatomy 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-SVZMEOIVSA-N (+)-Galactose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-SVZMEOIVSA-N 0.000 description 1
- NKUZQMZWTZAPSN-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 2-bromoacetate Chemical compound BrCC(=O)ON1C(=O)CCC1=O NKUZQMZWTZAPSN-UHFFFAOYSA-N 0.000 description 1
- PVGATNRYUYNBHO-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) 4-(2,5-dioxopyrrol-1-yl)butanoate Chemical compound O=C1CCC(=O)N1OC(=O)CCCN1C(=O)C=CC1=O PVGATNRYUYNBHO-UHFFFAOYSA-N 0.000 description 1
- MLIWQXBKMZNZNF-KUHOPJCQSA-N (2e)-2,6-bis[(4-azidophenyl)methylidene]-4-methylcyclohexan-1-one Chemical compound O=C1\C(=C\C=2C=CC(=CC=2)N=[N+]=[N-])CC(C)CC1=CC1=CC=C(N=[N+]=[N-])C=C1 MLIWQXBKMZNZNF-KUHOPJCQSA-N 0.000 description 1
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- 150000000179 1,2-aminoalcohols Chemical group 0.000 description 1
- YRIZYWQGELRKNT-UHFFFAOYSA-N 1,3,5-trichloro-1,3,5-triazinane-2,4,6-trione Chemical compound ClN1C(=O)N(Cl)C(=O)N(Cl)C1=O YRIZYWQGELRKNT-UHFFFAOYSA-N 0.000 description 1
- HTFVKMHFUBCIMH-UHFFFAOYSA-N 1,3,5-triiodo-1,3,5-triazinane-2,4,6-trione Chemical compound IN1C(=O)N(I)C(=O)N(I)C1=O HTFVKMHFUBCIMH-UHFFFAOYSA-N 0.000 description 1
- HHBCEKAWSILOOP-UHFFFAOYSA-N 1,3-dibromo-1,3,5-triazinane-2,4,6-trione Chemical compound BrN1C(=O)NC(=O)N(Br)C1=O HHBCEKAWSILOOP-UHFFFAOYSA-N 0.000 description 1
- SERLAGPUMNYUCK-DCUALPFSSA-N 1-O-alpha-D-glucopyranosyl-D-mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O SERLAGPUMNYUCK-DCUALPFSSA-N 0.000 description 1
- AWAFMFHOLVZLFG-UHFFFAOYSA-N 1-iodoaziridine-2,3-dione Chemical compound IN1C(=O)C1=O AWAFMFHOLVZLFG-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- QZTKDVCDBIDYMD-UHFFFAOYSA-N 2,2'-[(2-amino-2-oxoethyl)imino]diacetic acid Chemical compound NC(=O)CN(CC(O)=O)CC(O)=O QZTKDVCDBIDYMD-UHFFFAOYSA-N 0.000 description 1
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 1
- VSYZCLWRSNLQQZ-UHFFFAOYSA-N 2-(2-oxoethylsulfanyl)ethyl carbamate Chemical compound C(N)(OCCSCC=O)=O VSYZCLWRSNLQQZ-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- AJTVSSFTXWNIRG-UHFFFAOYSA-N 2-[bis(2-hydroxyethyl)amino]ethanesulfonic acid Chemical compound OCC[NH+](CCO)CCS([O-])(=O)=O AJTVSSFTXWNIRG-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- LVQFQZZGTZFUNF-UHFFFAOYSA-N 2-hydroxy-3-[4-(2-hydroxy-3-sulfonatopropyl)piperazine-1,4-diium-1-yl]propane-1-sulfonate Chemical compound OS(=O)(=O)CC(O)CN1CCN(CC(O)CS(O)(=O)=O)CC1 LVQFQZZGTZFUNF-UHFFFAOYSA-N 0.000 description 1
- WTLKTXIHIHFSGU-UHFFFAOYSA-N 2-nitrosoguanidine Chemical compound NC(N)=NN=O WTLKTXIHIHFSGU-UHFFFAOYSA-N 0.000 description 1
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 1
- NUFBIAUZAMHTSP-UHFFFAOYSA-N 3-(n-morpholino)-2-hydroxypropanesulfonic acid Chemical compound OS(=O)(=O)CC(O)CN1CCOCC1 NUFBIAUZAMHTSP-UHFFFAOYSA-N 0.000 description 1
- XCBLFURAFHFFJF-UHFFFAOYSA-N 3-[bis(2-hydroxyethyl)azaniumyl]-2-hydroxypropane-1-sulfonate Chemical compound OCCN(CCO)CC(O)CS(O)(=O)=O XCBLFURAFHFFJF-UHFFFAOYSA-N 0.000 description 1
- YELMWJNXDALKFE-UHFFFAOYSA-N 3h-imidazo[4,5-f]quinoxaline Chemical class N1=CC=NC2=C(NC=N3)C3=CC=C21 YELMWJNXDALKFE-UHFFFAOYSA-N 0.000 description 1
- WZRJTRPJURQBRM-UHFFFAOYSA-N 4-amino-n-(5-methyl-1,2-oxazol-3-yl)benzenesulfonamide;5-[(3,4,5-trimethoxyphenyl)methyl]pyrimidine-2,4-diamine Chemical compound O1C(C)=CC(NS(=O)(=O)C=2C=CC(N)=CC=2)=N1.COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 WZRJTRPJURQBRM-UHFFFAOYSA-N 0.000 description 1
- VTOWJTPBPWTSMK-UHFFFAOYSA-N 4-morpholin-4-ylbutane-1-sulfonic acid Chemical compound OS(=O)(=O)CCCCN1CCOCC1 VTOWJTPBPWTSMK-UHFFFAOYSA-N 0.000 description 1
- OTLNPYWUJOZPPA-UHFFFAOYSA-N 4-nitrobenzoic acid Chemical compound OC(=O)C1=CC=C([N+]([O-])=O)C=C1 OTLNPYWUJOZPPA-UHFFFAOYSA-N 0.000 description 1
- 239000007988 ADA buffer Substances 0.000 description 1
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-N Acrylic acid Chemical compound OC(=O)C=C NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 1
- 208000030090 Acute Disease Diseases 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 208000031295 Animal disease Diseases 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 208000008035 Back Pain Diseases 0.000 description 1
- 108020004256 Beta-lactamase Proteins 0.000 description 1
- 239000007848 Bronsted acid Substances 0.000 description 1
- PCBZRNYXXCIELG-WYFCWLEVSA-N COC1=CC=C(C[C@H](NC(=O)OC2CCCC3(C2)OOC2(O3)C3CC4CC(C3)CC2C4)C(=O)N[C@@H]2[C@@H](CO)O[C@H]([C@@H]2O)N2C=NC3=C2N=CN=C3N(C)C)C=C1 Chemical compound COC1=CC=C(C[C@H](NC(=O)OC2CCCC3(C2)OOC2(O3)C3CC4CC(C3)CC2C4)C(=O)N[C@@H]2[C@@H](CO)O[C@H]([C@@H]2O)N2C=NC3=C2N=CN=C3N(C)C)C=C1 PCBZRNYXXCIELG-WYFCWLEVSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000589986 Campylobacter lari Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241001432959 Chernes Species 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- 241000595586 Coryne Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241000702141 Corynephage beta Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- QWIZNVHXZXRPDR-UHFFFAOYSA-N D-melezitose Natural products O1C(CO)C(O)C(O)C(O)C1OC1C(O)C(CO)OC1(CO)OC1OC(CO)C(O)C(O)C1O QWIZNVHXZXRPDR-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 206010013975 Dyspnoeas Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 208000032163 Emerging Communicable disease Diseases 0.000 description 1
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 101100155531 Escherichia coli (strain K12) ispU gene Proteins 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 208000002633 Febrile Neutropenia Diseases 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108010024636 Glutathione Chemical group 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- OWXMKDGYPWMGEB-UHFFFAOYSA-N HEPPS Chemical compound OCCN1CCN(CCCS(O)(=O)=O)CC1 OWXMKDGYPWMGEB-UHFFFAOYSA-N 0.000 description 1
- GIZQLVPDAOBAFN-UHFFFAOYSA-N HEPPSO Chemical compound OCCN1CCN(CC(O)CS(O)(=O)=O)CC1 GIZQLVPDAOBAFN-UHFFFAOYSA-N 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 208000008745 Healthcare-Associated Pneumonia Diseases 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- WQZGKKKJIJFFOK-ZZWDRFIYSA-N L-glucose Chemical compound OC[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@H]1O WQZGKKKJIJFFOK-ZZWDRFIYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AAXCQFOXUJMCCW-PETQGJDISA-N LPS core Chemical group O([C@H]1[C@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@H]([C@@H]([C@@H](CO[C@]2(O[C@@H]([C@@H](OC3[C@H]([C@@H](OC4[C@H]([C@@H](OC5[C@@H]([C@@H](O[C@@H]6[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O6)OC6[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O6)O[C@H]6[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O6)NC(C)=O)[C@H](O)[C@@H](CO[C@@H]6[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O6)O)O5)O)[C@H](O)[C@@H]([C@@H](O)COC5[C@H]([C@@H](O)[C@H](OP(O)(O)=O)[C@@H]([C@@H](O)CO)O5)O)O4)O)[C@H](OP(O)(=O)OP(O)(=O)OCCN)[C@@H]([C@@H](O)CO)O3)O)[C@H](O[C@]3(O[C@@H]([C@@H](O)[C@H](O[C@]4(O[C@@H]([C@@H](O)[C@H](OP(O)(=O)OCCN)C4)[C@@H](O)CO)C(O)=O)C3)[C@@H](O)CO)C(O)=O)C2)[C@@H](O)CO)C(O)=O)O1)OP(O)(O)=O)OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)C[C@H]1O[C@H](OP(O)(O)=O)[C@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H]1O AAXCQFOXUJMCCW-PETQGJDISA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 239000002841 Lewis acid Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 206010058780 Meningitis neonatal Diseases 0.000 description 1
- 206010027566 Micturition urgency Diseases 0.000 description 1
- 241000582786 Monoplex Species 0.000 description 1
- 206010052904 Musculoskeletal stiffness Diseases 0.000 description 1
- 241000872931 Myoporum sandwicense Species 0.000 description 1
- FSVCELGFZIQNCK-UHFFFAOYSA-N N,N-bis(2-hydroxyethyl)glycine Chemical compound OCCN(CCO)CC(O)=O FSVCELGFZIQNCK-UHFFFAOYSA-N 0.000 description 1
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 241001644525 Nastus productus Species 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 108010044522 Nocardia aerocolonigenes N-glycosyltransferase Proteins 0.000 description 1
- 101710204495 O-antigen ligase Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- RPDUDBYMNGAHEM-UHFFFAOYSA-N PROXYL Chemical compound CC1(C)CCC(C)(C)N1[O] RPDUDBYMNGAHEM-UHFFFAOYSA-N 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 241000237988 Patellidae Species 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 208000000450 Pelvic Pain Diseases 0.000 description 1
- 206010034960 Photophobia Diseases 0.000 description 1
- 206010036018 Pollakiuria Diseases 0.000 description 1
- 239000004146 Propane-1,2-diol Substances 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 101100338058 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) gtrS gene Proteins 0.000 description 1
- 101900161471 Pseudomonas aeruginosa Exotoxin A Proteins 0.000 description 1
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 206010040070 Septic Shock Diseases 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 208000032140 Sleepiness Diseases 0.000 description 1
- 229920002125 Sokalan® Polymers 0.000 description 1
- 206010041349 Somnolence Diseases 0.000 description 1
- UQZIYBXSHAGNOE-USOSMYMVSA-N Stachyose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@H](CO[C@@H]2[C@@H](O)[C@@H](O)[C@@H](O)[C@H](CO)O2)O1 UQZIYBXSHAGNOE-USOSMYMVSA-N 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 101710196623 Stimulator of interferon genes protein Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical group OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 208000033809 Suppuration Diseases 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- QYTDEUPAUMOIOP-UHFFFAOYSA-N TEMPO Chemical group CC1(C)CCCC(C)(C)N1[O] QYTDEUPAUMOIOP-UHFFFAOYSA-N 0.000 description 1
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 101000980463 Treponema pallidum (strain Nichols) Chaperonin GroEL Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- DVKFVGVMPLXLKC-PUGXJXRHSA-N [(2s,3r,4s,5s,6r)-2-[(2s,3s,4s,5r)-3,4-dihydroxy-2,5-bis(hydroxymethyl)oxolan-2-yl]-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl] dihydrogen phosphate Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@]1(CO)[C@@]1(OP(O)(O)=O)[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 DVKFVGVMPLXLKC-PUGXJXRHSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- IBVAQQYNSHJXBV-UHFFFAOYSA-N adipic acid dihydrazide Chemical compound NNC(=O)CCCCC(=O)NN IBVAQQYNSHJXBV-UHFFFAOYSA-N 0.000 description 1
- 238000007818 agglutination assay Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 125000003172 aldehyde group Chemical group 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- DIZPMCHEQGEION-UHFFFAOYSA-H aluminium sulfate (anhydrous) Chemical compound [Al+3].[Al+3].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O DIZPMCHEQGEION-UHFFFAOYSA-H 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 229940035676 analgesics Drugs 0.000 description 1
- 239000000730 antalgic agent Substances 0.000 description 1
- 230000001754 anti-pyretic effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000002221 antipyretic Substances 0.000 description 1
- 229940125716 antipyretic agent Drugs 0.000 description 1
- 239000000010 aprotic solvent Substances 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 239000007998 bicine buffer Substances 0.000 description 1
- 230000008436 biogenesis Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- QHXLIQMGIGEHJP-UHFFFAOYSA-N boron;2-methylpyridine Chemical compound [B].CC1=CC=CC=N1 QHXLIQMGIGEHJP-UHFFFAOYSA-N 0.000 description 1
- VPEPQDBAIMZCGV-UHFFFAOYSA-N boron;5-ethyl-2-methylpyridine Chemical compound [B].CCC1=CC=C(C)N=C1 VPEPQDBAIMZCGV-UHFFFAOYSA-N 0.000 description 1
- RJTANRZEWTUVMA-UHFFFAOYSA-N boron;n-methylmethanamine Chemical compound [B].CNC RJTANRZEWTUVMA-UHFFFAOYSA-N 0.000 description 1
- NNTOJPXOCKCMKR-UHFFFAOYSA-N boron;pyridine Chemical compound [B].C1=CC=NC=C1 NNTOJPXOCKCMKR-UHFFFAOYSA-N 0.000 description 1
- BMRWNKZVCUKKSR-UHFFFAOYSA-N butane-1,2-diol Chemical compound CCC(O)CO BMRWNKZVCUKKSR-UHFFFAOYSA-N 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 150000001718 carbodiimides Chemical class 0.000 description 1
- 229960001631 carbomer Drugs 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- SQQXRXKYTKFFSM-UHFFFAOYSA-N chembl1992147 Chemical group OC1=C(OC)C(OC)=CC=C1C1=C(C)C(C(O)=O)=NC(C=2N=C3C4=NC(C)(C)N=C4C(OC)=C(O)C3=CC=2)=C1N SQQXRXKYTKFFSM-UHFFFAOYSA-N 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- 229940047766 co-trimoxazole Drugs 0.000 description 1
- 230000000112 colonic effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- UFULAYFCSOUIOV-UHFFFAOYSA-N cysteamine Chemical compound NCCS UFULAYFCSOUIOV-UHFFFAOYSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- CEJLBZWIKQJOAT-UHFFFAOYSA-N dichloroisocyanuric acid Chemical compound ClN1C(=O)NC(=O)N(Cl)C1=O CEJLBZWIKQJOAT-UHFFFAOYSA-N 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 150000002009 diols Chemical group 0.000 description 1
- WBZKQQHYRPRKNJ-UHFFFAOYSA-L disulfite Chemical group [O-]S(=O)S([O-])(=O)=O WBZKQQHYRPRKNJ-UHFFFAOYSA-L 0.000 description 1
- GRWZHXKQBITJKP-UHFFFAOYSA-L dithionite(2-) Chemical group [O-]S(=O)S([O-])=O GRWZHXKQBITJKP-UHFFFAOYSA-L 0.000 description 1
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- 229940088679 drug related substance Drugs 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 206010013990 dysuria Diseases 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 208000028208 end stage renal disease Diseases 0.000 description 1
- 201000000523 end stage renal failure Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- MXLOKFOWFPJWCW-UHFFFAOYSA-N ethylzingerone Chemical compound CCOC1=CC(CCC(C)=O)=CC=C1O MXLOKFOWFPJWCW-UHFFFAOYSA-N 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 229940124307 fluoroquinolone Drugs 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 150000002243 furanoses Chemical class 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- YQEMORVAKMFKLG-UHFFFAOYSA-N glycerine monostearate Natural products CCCCCCCCCCCCCCCCCC(=O)OC(CO)CO YQEMORVAKMFKLG-UHFFFAOYSA-N 0.000 description 1
- SVUQHVRAGMNPLW-UHFFFAOYSA-N glycerol monostearate Natural products CCCCCCCCCCCCCCCCC(=O)OCC(O)CO SVUQHVRAGMNPLW-UHFFFAOYSA-N 0.000 description 1
- 125000005179 haloacetyl group Chemical group 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 230000004217 heart function Effects 0.000 description 1
- 208000006750 hematuria Diseases 0.000 description 1
- 108060003552 hemocyanin Proteins 0.000 description 1
- SYECJBOWSGTPLU-UHFFFAOYSA-N hexane-1,1-diamine Chemical compound CCCCCC(N)N SYECJBOWSGTPLU-UHFFFAOYSA-N 0.000 description 1
- 208000021760 high fever Diseases 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-M hydrogensulfate Chemical group OS([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-M 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 125000004857 imidazopyridinyl group Chemical class N1C(=NC2=C1C=CC=N2)* 0.000 description 1
- 229940124669 imidazoquinoline Drugs 0.000 description 1
- 229960002751 imiquimod Drugs 0.000 description 1
- DOUYETYNHWVLEO-UHFFFAOYSA-N imiquimod Chemical compound C1=CC=CC2=C3N(CC(C)C)C=NC3=C(N)N=C21 DOUYETYNHWVLEO-UHFFFAOYSA-N 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 239000003022 immunostimulating agent Substances 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- FZWBNHMXJMCXLU-BLAUPYHCSA-N isomaltotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O)O1 FZWBNHMXJMCXLU-BLAUPYHCSA-N 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 239000000832 lactitol Substances 0.000 description 1
- VQHSOMBJVWLPSR-JVCRWLNRSA-N lactitol Chemical compound OC[C@H](O)[C@@H](O)[C@@H]([C@H](O)CO)O[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O VQHSOMBJVWLPSR-JVCRWLNRSA-N 0.000 description 1
- 235000010448 lactitol Nutrition 0.000 description 1
- 229960003451 lactitol Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 231100001231 less toxic Toxicity 0.000 description 1
- 150000007517 lewis acids Chemical class 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 208000013469 light sensitivity Diseases 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000001320 lysogenic effect Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- QWIZNVHXZXRPDR-WSCXOGSTSA-N melezitose Chemical compound O([C@@]1(O[C@@H]([C@H]([C@@H]1O[C@@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O)CO)CO)[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O QWIZNVHXZXRPDR-WSCXOGSTSA-N 0.000 description 1
- 229960003151 mercaptamine Drugs 0.000 description 1
- 150000002730 mercury Chemical class 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- OKKJLVBELUTLKV-UHFFFAOYSA-N methanol Substances OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 230000027939 micturition Effects 0.000 description 1
- LPUQAYUQRXPFSQ-DFWYDOINSA-M monosodium L-glutamate Chemical compound [Na+].[O-]C(=O)[C@@H](N)CCC(O)=O LPUQAYUQRXPFSQ-DFWYDOINSA-M 0.000 description 1
- 239000004223 monosodium glutamate Substances 0.000 description 1
- 235000013923 monosodium glutamate Nutrition 0.000 description 1
- 230000036457 multidrug resistance Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 125000002868 norbornyl group Chemical group C12(CCC(CC1)C2)* 0.000 description 1
- 230000001662 opsonic effect Effects 0.000 description 1
- TWNQGVIAIRXVLR-UHFFFAOYSA-N oxo(oxoalumanyloxy)alumane Chemical compound O=[Al]O[Al]=O TWNQGVIAIRXVLR-UHFFFAOYSA-N 0.000 description 1
- 230000000242 pagocytic effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 108010087558 pectate lyase Proteins 0.000 description 1
- 101150068826 pglB gene Proteins 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- ACVYVLVWPXVTIT-UHFFFAOYSA-M phosphinate Chemical group [O-][PH2]=O ACVYVLVWPXVTIT-UHFFFAOYSA-M 0.000 description 1
- OJMIONKXNSYLSR-UHFFFAOYSA-N phosphorous acid Chemical group OP(O)O OJMIONKXNSYLSR-UHFFFAOYSA-N 0.000 description 1
- 229940031999 pneumococcal conjugate vaccine Drugs 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- GRLPQNLYRHEGIJ-UHFFFAOYSA-J potassium aluminium sulfate Chemical compound [Al+3].[K+].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O GRLPQNLYRHEGIJ-UHFFFAOYSA-J 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000009021 pre-vaccination Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- QQONPFPTGQHPMA-UHFFFAOYSA-N propylene Natural products CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 1
- 229960004063 propylene glycol Drugs 0.000 description 1
- 235000013772 propylene glycol Nutrition 0.000 description 1
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 150000003214 pyranose derivatives Chemical class 0.000 description 1
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 230000036387 respiratory rate Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000036303 septic shock Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000012279 sodium borohydride Substances 0.000 description 1
- 229910000033 sodium borohydride Inorganic materials 0.000 description 1
- RYYKJJJTJZKILX-UHFFFAOYSA-M sodium octadecanoate Chemical compound [Na+].CCCCCCCCCCCCCCCCCC([O-])=O RYYKJJJTJZKILX-UHFFFAOYSA-M 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 235000011008 sodium phosphates Nutrition 0.000 description 1
- 239000012321 sodium triacetoxyborohydride Substances 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229940031439 squalene Drugs 0.000 description 1
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 1
- UQZIYBXSHAGNOE-XNSRJBNMSA-N stachyose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO[C@@H]3[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O3)O)O2)O)O1 UQZIYBXSHAGNOE-XNSRJBNMSA-N 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- ISIJQEHRDSCQIU-UHFFFAOYSA-N tert-butyl 2,7-diazaspiro[4.5]decane-7-carboxylate Chemical group C1N(C(=O)OC(C)(C)C)CCCC11CNCC1 ISIJQEHRDSCQIU-UHFFFAOYSA-N 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000009482 thermal adhesion granulation Methods 0.000 description 1
- DHCDFWKWKRSZHF-UHFFFAOYSA-L thiosulfate(2-) Chemical group [O-]S([S-])(=O)=O DHCDFWKWKRSZHF-UHFFFAOYSA-L 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000563 toxic property Toxicity 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- ZKWDCFPLNQTHSH-UHFFFAOYSA-N tribromoisocyanuric acid Chemical compound BrN1C(=O)N(Br)C(=O)N(Br)C1=O ZKWDCFPLNQTHSH-UHFFFAOYSA-N 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 101150103517 uppS gene Proteins 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 239000000304 virulence factor Substances 0.000 description 1
- 230000007923 virulence factor Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/025—Enterobacteriales, e.g. Enterobacter
- A61K39/0258—Escherichia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/715—Polysaccharides, i.e. having more than five saccharide radicals attached to each other by glycosidic linkages; Derivatives thereof, e.g. ethers, esters
- A61K31/739—Lipopolysaccharides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/64—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
- A61K47/6415—Toxins or lectins, e.g. clostridial toxins or Pseudomonas exotoxins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/64—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
- A61K47/646—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent the entire peptide or protein drug conjugate elicits an immune response, e.g. conjugate vaccines
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P13/00—Drugs for disorders of the urinary system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55583—Polysaccharides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/6037—Bacterial toxins, e.g. diphteria toxoid [DT], tetanus toxoid [TT]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/70—Multivalent vaccine
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Organic Chemistry (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Urology & Nephrology (AREA)
- Virology (AREA)
- Toxicology (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicinal Preparation (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
- Peptides Or Proteins (AREA)
Abstract
장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하여 ExPEC와 관련된 질환에 대한 면역 보호를 제공하는 조성물 및 방법이 기재되어 있다. 특히, 침습성 ExPEC 질환의 예방을 위해 담체 단백질에 공유 결합된 대장균 다당류 항원 O75의 접합체를 사용하기 위한 조성물 및 방법이 기재되어 있다.
Description
장외 병원성 대장균(extraintestinal pathogenic Escherichia coli, ExPEC)은 일반적으로 공생 대장균 균주와 함께 인간 장의 무해한 서식 생물이다. 그러나 ExPEC 균주는 다양하고 심각한 침습성 질환을 초래하여 매년 상당한 이환율, 사망률 및 비용을 발생시키는 위장관 외부 부위의 집락화 및 감염에 대한 독성 인자를 보유할 수 있다(예를 들어, 문헌[Johnson et al., J Lab Clin Med. 2002;139(3):155-162; Kohler et al., Int J Med Microbiol. 2011;301(8):642-647; Foxman, Am J Med. 2002;113 Suppl 1A:5S-13S; 및 Russo et al., Microbes Infect. 2003;5(5):449-456] 참조). ExPEC 균주는 요로 감염(UTI)의 가장 흔한 원인이다. 이들은 또한 복부 및 골반 감염 및 병원내 폐렴과 관련된 수술 부위 감염 및 신생아 수막염의 기여자이며(Johnson et al., 2002; 및 Russo et al., 2003), 때때로 다른 장외 감염, 예를 들어, 골수염, 연조직염 및 상처 감염과 관련된다. 이러한 모든 일차 감염 부위는 ExPEC 세균혈증을 초래할 수 있다(Russo et al., 2003). 신생아, 노인 및 면역 저하 환자는 침습성 ExPEC 질환(IED)을 포함한 ExPEC 감염에 특히 취약하다.
항생제에 대한 박테리아 내성은 박테리아 감염에 대한 저항에서 주요 관심사이며, 다중 약물 내성(MDR) 대장균 균주가 점차 우세해지고 있다(예를 들어, 문헌[Schito et al., 2009, Int. J. Antimicrob. Agents 34(5):407-413; 및 Pitout et al., 2012, Expert Rev. Anti. Infect. Ther. 10(10):1165-1176] 참조). ExPEC 서열 유형 131(ST131)의 출현 및 신속한 전세계적 전파는 다중 약물 내성을 포함한 증가된 약물 내성의 주요 동인으로 간주된다(Johnson et al., Antimicrob Agents Chemother. 2010; 54(1):546-550; Rogers et al., J Antimicrob Chemother. 2011; 66(1):1-14). 이 클론은 모든 ExPEC 임상 분리주의 12.5% 내지 30%에서 발견되며, 대부분 혈청형 O25b:H4를 나타내고, 플루오로퀴놀론에 대한 높은 수준의 내성을 보여주며, 이는 종종 트리메토프림/설파메톡사졸 내성, 및 세팔로스포린에 대한 내성을 부여하는 광범위 베타-락타마제를 동반한다(Rogers et al, 2011, and Banerjee et al., Antimicrob Agents Chemother. 2014; 58(9):4997-5004).
O 항원 혈청형은 그람 음성 박테리아에서 지질다당류(LPS)의 외막 부분인 O 다당류 항원의 화학 구조를 기초로 한다. 180개가 넘는 대장균 O 항원이 보고되었으나(Stenutz et al., FEMS Microbial Rev. 2006; 30: 382-403), ExPEC 분리주 대부분은 20개 미만의 O 항원 혈청형으로 분류된다. 전장 대장균 O 항원은 전형적으로 고도로 보존된 LPS 코어 구조에 부착된 약 10 내지 25개의 반복 당 단위를 포함하며, 각각의 구성요소는 각각 rfb 및 rfa 유전자 클러스터에서 주로 암호화되는 효소에 의해 개별적으로 합성되었다. O 항원의 중합 후, O 항원 다당류 백본은 전형적으로 아세틸 또는 글루코스 잔기의 첨가를 통해 변형될 수 있다. 이러한 변형은 공통 다당류 백본을 공유하지만 측 분지가 상이한, 항원적으로 구별되는 혈청형을 생성함으로써, 혈청형 다양성을 효과적으로 증가시킨다. O 항원 변형 효소를 암호화하는 유전자는 전형적으로 염색체의 rfb 클러스터 외부에 있으며, 어떤 경우에는 이러한 유전자는 용원성 박테리오파지 내에서 발견된다.
ExPEC 감염은 임의의 혈청형에 의해 발생할 수 있다. ExPEC 감염에서 특정 혈청형의 과잉표현이 존재하나, 그럼에도 ExPEC 분리주로부터의 표면 다당류는 상당한 항원 다양성을 나타내며, 이는 표면 다당류를 기초로 한 ExPEC 백신의 개발을 매우 어렵게 만든다(Russo et al., Vaccine. 2007; 25: 3859-3870). 또한, 특정 O 항원은 면역원성이 불충분할 수 있다. 또한, 폐렴구균 접합체 백신으로부터의 연구를 기초로 하여, 다수의 혈청형이 질환을 초래할 수 있는 경우, 백신에 포함시키기 위한 혈청형의 선택 및 포함되는 혈청형의 투여량 수준과 같은 백신 조성이 중요할 수 있는데, 이는 특정 혈청형에 대한 백신의 사용이 백신에 포함되지 않은 혈청형, 또는 심지어 백신에 포함되나 혈청형에 대한 면역화에서 오로지 약하게 효과가 있는 혈청형의 운반 및 이러한 혈청형으로부터의 질환을 잠재적으로 증가시킬 수 있기 때문이다(Lipsitch, Emerging Infectious Diseases; 1999, 5:336-345). 이상적으로, 백신은 비백신 혈청형의 증가된 운반으로부터의 추가 질환의 위험을 최소화하면서 백신에 포함된 혈청형에 의해 야기되는 질환의 예방에 있어서 이로운 효과를 극대화시켜야 한다.
ExPEC 감염을 예방하기 위한 백신 개발을 위한 노력은 O 항원 다당류 접합체에 집중되었다. 12가 O 항원 접합체 백신은 O 항원 다당류의 추출과 정제 및 탈독소화된 슈도모나스 애루기노사(Pseudomonas aeruginosa) 외독소 A에 대한 화학적 접합을 통해 합성되고, 1상 임상 연구에서 안전성 및 면역원성에 대해 테스트되었다(Cross et al., J. Infect. Dis. (1994) v.170, pp.834-40). 이 후보 백신은 임상 용도로 허가되지 않았다. 대장균의 생체접합 시스템은 최근에 개발되었는데, 다당류 항원과 담체 단백질이 모두 생체 내에서 합성된 후 대장균에서 발현되는 캄필로박터 제주니(Campylobacter jejuni) 효소인 올리고사카릴 트랜스퍼라제 PglB의 활성을 통해 생체 내에서 접합된다(Wacker et al., Proc. Nat. Acad. Sci. (2006) v. 103, pp. 7088-93). 이 N 결합된 단백질 글리코실화 시스템은 담체 단백질에 다양한 다당류를 전달할 수 있어, 접합체를 정제하는 간단한 방법을 가능하게 한다.
생체접합은 대장균 4가 O 항원 후보 백신을 위한 접합체 다당류를 생산하는 데 성공적으로 사용되었다(Poolman and Wacker, J. Infect. Dis. (2016) v.213(1), pp. 6-13). 그러나 성공적인 ExPEC 백신의 개발은 우세한 혈청형의 보급을 필요로 하며, ExPEC 분리주의 서브세트에서 추가 O 항원 변형의 존재는 비변형 및 변형 LPS를 나타내는 분리주를 커버하는 데 있어서 추가 과제를 제시한다. 더욱이, 다중 혈청형으로부터의 O 항원을 포함하는 백신 조성물에 대한 면역 반응은 혈청형 간에 상이할 수 있다. 따라서, ExPEC에 대한 백신의 지속적인 필요성이 당업계에 존재한다. 특히, ExPEC O75 혈청형 및 ExPEC 중에서 일반적인 다른 혈청형에 대한 효과적인 면역 보호를 제공하는 데 사용될 수 있는 표면 다당류를 기초로 한 ExPEC 백신의 필요성이 존재한다.
놀랍게도 임상 시험에서 동일한 농도의 다른 O 항원과의 조성물에서 담체 단백질에 각각 공유 결합된 O 항원의 접합체로서 테스트할 경우 대장균 O75 항원은 다른 대장균 O 항원(예를 들어, O1, O2 및 O6)보다 면역원성이 낮은 것으로 보인다. 대장균 O75 항원의 접합체 및 하나 이상의 추가 대장균 O 항원의 접합체를 적절한 용량 및 비율로 포함하는 조성물을 사용한 백신접종은 ExPEC O75 혈청형 및 하나 이상의 추가 ExPEC O 혈청형에 대한 개선된 면역 반응을 제공한다.
따라서, 제1 일반 양태에서 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물이 본원에 제공되며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 농도는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각의 농도에 비해 독립적으로 증가된다.
특정 구현예에서, O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 O75 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 2.5:1이다.
특정 구현예에서, O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 O75 항원 다당류 농도의 중량비는 약 2:1이다.
제2 일반 양태에서, 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물이 본원에 제공되며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1이다. 바람직하게는 O75 항원 다당류 대 O1, O2 및/또는 O6의 농도의 중량비는 약 2:1이다.
특정 구현예에서, O75 항원 다당류 대 O4, O15, O16 및/또는 O18 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1이다. 바람직하게는 O75 항원 다당류 대 O4, O15, O16 및/또는 O18 항원 다당류 농도의 중량비는 약 2:1이다.
제3의 일반 양태에서, 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물이 본원에 제공되며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 농도는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각의 농도에 비해 독립적으로 증가되며, O75 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1이다. 바람직하게는, O75 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도의 중량비는 약 2:1이다.
제1, 제2 및 제3의 일반 양태의 특정 구현예가 이제 설명된다.
특정 구현예에서, 조성물 중 O75 항원 다당류 대 O25 항원 다당류 농도의 중량비는 약 1:1이다.
특정 구현예에서, 대장균 항원 다당류 O1:O2:O4:O6:O15:O16:O18:O25:O75의 농도의 중량비는 1:1:1:1:1:1:1:2:2이다.
특정 구현예에서, O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고, 여기서:
(i)
대장균 O1 항원 다당류는 표 1에 제시된 화학식 (O1A)의 구조를 포함하고,
(ii)
대장균 O2 항원 다당류는 표 1에 제시된 화학식 (O2)의 구조를 포함하고,
(iii)
대장균 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고,
(iv)
대장균 O6 항원 다당류는 표 1에 제시된 화학식 (O6A)의 구조를 포함하고,
(v)
대장균 O15 항원 다당류는 표 1에 제시된 화학식 (O15)의 구조를 포함하고,
(vi)
대장균 O16 항원 다당류는 표 1에 제시된 화학식 (O16)의 구조를 포함하고,
(vii)
대장균 O18 항원 다당류는 표 1에 제시된 화학식 (O18A)의 구조를 포함하고,
(viii)
대장균 O25 항원 다당류는 표 1에 제시된 화학식 (O25B)의 구조를 포함하고,
(ix)
대장균 O75 항원 다당류는 표 1에 제시된 화학식 (O75)의 구조를 포함하고,
여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
특정 구현예에서, O75 항원 다당류의 농도는 약 8 내지 약 64 μg/mL, 바람직하게는 약 8 내지 약 50 μg/mL, 바람직하게는 약 12 내지 약 40 μg/mL, 바람직하게는 약 16 내지 약 32 μg/mL, 바람직하게는 약 28 내지 약 36 μg/mL, 바람직하게는 약 32 μg/mL이다.
특정 구현예에서, 조성물에 존재하는 대장균 O 항원 다당류는 O1, O2, O4, O15, O16, O18, O25, O75 및 O6으로 구성된다.
특정 구현예에서, 조성물은 담체 단백질에 공유 결합된 적어도 하나의 추가 대장균 항원 다당류를 추가로 포함하고, 바람직하게는 적어도 하나의 추가 대장균 항원 다당류는 표 1에 제시된 화학식 (O8)을 갖는 O8 항원 다당류를 포함하고, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
특정 구현예에서, 담체 단백질은 슈도모나스 애루기노사의 탈독소화된 외독소 A(EPA) 또는 CRM197, 바람직하게는 EPA이다. 바람직하게는 담체 단백질은 서열번호 1의 아미노산 서열을 갖는 1 내지 20개, 예컨대 1 내지 10개 또는 2 내지 4개의 글리코실화 공통 서열, 예컨대 서열번호 2의 아미노산 서열을 갖는 공통 서열을 포함한다. 더욱 바람직하게는 담체 단백질은 4개의 글리코실화 공통 서열을 포함한다. 가장 바람직하게는 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함하는 EPA이다.
특정 구현예에서, 대장균 항원 다당류는 생체접합 또는 화학적 접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 대장균 항원 다당류는 생체접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 다당류는 담체 단백질의 글리코실화 부위의 Asn 잔기에 공유 결합된다.
또 다른 양태에서, 대상체에게 본 발명의 조성물을 투여하는 단계를 포함하는, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 제공된다.
추가 양태에서 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 제공되며, 방법은 대상체에게 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류 각각의 유효량을 투여하는 단계를 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 유효량은 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 비해 독립적으로 증가된다.
본 발명의 방법에 따른 특정 구현예에서, 유효량의 O75 항원 다당류는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 약 1.5:1 내지 약 2.5:1, 바람직하게는 약 2:1의 중량비로 투여된다.
본 발명의 방법에 따른 특정 구현예에서, 유효량의 O75 항원 다당류는 O1, O2 및/또는 O6 항원 다당류에 대해 독립적으로 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1의 중량비로 투여되고, 바람직하게는 추가로 유효량의 O75 항원 다당류는 O25 항원 다당류에 대해 약 1:1의 중량비로 투여된다.
또 다른 양태에서 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 제공되며, 방법은 대상체에게 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류 각각의 유효량을 투여하는 단계를 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 유효량의 O75 항원 다당류는 O1, O2 및/또는 O6 항원 다당류에 대해 독립적으로 약 1.5:1 내지 약 4:1의 중량비로 투여된다. 유효량의 O75 항원 다당류는 바람직하게는 O25 항원 다당류에 대해 약 1:1의 중량비로 투여될 수 있다. 바람직하게는, 유효량의 O75 항원 다당류는 O1, O2 및/또는 O6 항원 다당류에 대해 독립적으로 약 2:1의 중량비로 투여된다.
본 발명의 임의의 방법 양태의 구현예가 아래에 제공된다.
본 발명의 방법에 따른 특정 구현예에서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 이를 예방하며, 바람직하게는 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.
본 발명의 방법에 따른 특정 구현예에서, O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, O75 항원 다당류 대 O6 항원 다당류의 중량비는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
본 발명의 방법에 따른 특정 구현예에서, 대상체에게 투여되는 대장균 O 항원 다당류는 O1, O2, O4, O15, O16, O18, O25, O75 및 O6으로 구성된다.
본 발명의 방법에 따른 특정 구현예에서, 대상체에게 투여되는 대장균 O 항원 다당류는 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 O 항원 다당류를 추가로 포함한다.
본 발명의 방법에 따른 특정 구현예에서, 대상체는 대장균(바람직하게는 ExPEC) 감염, 바람직하게는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.
본 발명의 방법에 따른 특정 구현예에서, 8~16 μg, 바람직하게는 약 16 μg의 O75 항원 다당류가 투여당 투여된다.
본 발명의 방법에 따른 특정 구현예에서, 유효량의 O1:O2:O4:O6:O15:O16:O18:O25:O75의 투여되는 대장균 항원 다당류는 1:1:1:1:1:1:1:2:2의 중량비로 투여된다.
전술한 요약과, 다음의 [발명을 실시하기 위한 구체적인 내용]은 첨부된 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명은 도면에 나타낸 정확한 구현예로 한정되지 않음이 이해될 것이다.
도 1은 뉴질랜드 백색 토끼에서 ExPEC10V 백신에 의해 유도된 항체 반응을 나타낸다. 동물은 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회의 근육내 면역화를 받았다. ExPEC10V 백신은 3가지의 상이한 농도로 투여되었고(군 1: 고용량, 군 2: 중간 용량 및 군 3: 저용량, 표 11), 대조군은 식염수(군 4, 0.9% (w/v) 염화나트륨 용액)만 받았다. 항체 수준은 0일(백신접종 전) 및 14일, 27일 및 42일(백신접종 후)에 ELISA에 의해 측정되었다. 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% CI가 제시되어 있다. 다중 비교를 위한 Bonferroni 보정을 사용한 Wilcoxon 순위 합계 검정. ExPEC10V 백신접종된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4)의 비교. *p ≤ 0.05, **p ≤ 0.01; ***p ≤ 0.001; ****p ≤ 0.0001. LOD: 검출 한계.
도 2는 ExPEC10V에 의해 유도된 항체 반응을 나타낸다. 뉴질랜드 백색 토끼는 ExPEC10V(총 다당류 105.6 μg) 또는 0.9% w/v 염화나트륨 용액(대조군)으로 3회의 근육내 면역화를 받았다. IgG 역가는 1일(면역화 전, n = 20/군), 31일(면역화 후, n = 20/군) 및 50일(면역화 후, n = 10/군)에 ELISA에 의해 결정되었다. 플롯은 각 군에 대한 개별 역가 및 기하 평균 ± 95% 신뢰 구간을 보여준다. ExPEC10V와 대조군 사이의 IgG 역가의 차이는 우도비 검정이 있는 Tobit 모델을 사용하여 분석되었다. P-값 ≤ 0.05는 유의한 것으로 간주되었다. *P ≤ 0.05, ****P ≤ 0.0001.
도 3a 내지 도 3b는 인간에서 ExPEC10V 백신을 사용한 1/2a상 임상 시험을 위한 전체 연구 설계를 보여준다. 도 3a는 코호트 1에 대한 전체 연구 설계를 나타내고, 도 3b는 코호트 2에 대한 전체 연구 설계를 나타낸다. 상세 내용은 실시예 7 참조.
도 4는 BAC1001 임상 시험에서 기준선(1일)으로부터 측정한, 백신접종 후 15일의 혈청 O 항원 특이적 항체 역가가 적어도 2배 증가한 참가자의 백분율을 보여준다(상세 내용은 실시예 7 참조). O 항원 특이적 혈청 항체 역가는 ECL 기반 면역분석법으로 측정했다.
도 5는 BAC1001 임상 시험에서 기준선(1일)으로부터 측정한, 백신접종 후 15일의 혈청 옵소닌 식세포 항체 역가가 적어도 2배 증가한 참가자의 백분율을 보여준다(상세 내용은 실시예 7 참조). 혈청 옵소닌 식세포 항체의 수준은 MOPA로 측정했다.
도 6은 뉴질랜드 백색 토끼에서 ExPEC 백신의 상이한 조성에 의해 유도된 혈청 항체 수준(총 IgG)을 나타낸다. 상세 내용은 실시예 8 참조. 그래프는 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% 신뢰 구간을 보여준다. 백신군 대 식염수 대조군 사이의 비교는 우도비 검정이 있는 Tobit 모델을 사용하여 통계적으로 평가되었고 다중 비교를 위한 Bonferroni 보정이 사용되었다. p 값 ≤ 0.05는 통계적으로 유의한 것으로 간주되었다. ****p ≤ 0.0001.
도 1은 뉴질랜드 백색 토끼에서 ExPEC10V 백신에 의해 유도된 항체 반응을 나타낸다. 동물은 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회의 근육내 면역화를 받았다. ExPEC10V 백신은 3가지의 상이한 농도로 투여되었고(군 1: 고용량, 군 2: 중간 용량 및 군 3: 저용량, 표 11), 대조군은 식염수(군 4, 0.9% (w/v) 염화나트륨 용액)만 받았다. 항체 수준은 0일(백신접종 전) 및 14일, 27일 및 42일(백신접종 후)에 ELISA에 의해 측정되었다. 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% CI가 제시되어 있다. 다중 비교를 위한 Bonferroni 보정을 사용한 Wilcoxon 순위 합계 검정. ExPEC10V 백신접종된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4)의 비교. *p ≤ 0.05, **p ≤ 0.01; ***p ≤ 0.001; ****p ≤ 0.0001. LOD: 검출 한계.
도 2는 ExPEC10V에 의해 유도된 항체 반응을 나타낸다. 뉴질랜드 백색 토끼는 ExPEC10V(총 다당류 105.6 μg) 또는 0.9% w/v 염화나트륨 용액(대조군)으로 3회의 근육내 면역화를 받았다. IgG 역가는 1일(면역화 전, n = 20/군), 31일(면역화 후, n = 20/군) 및 50일(면역화 후, n = 10/군)에 ELISA에 의해 결정되었다. 플롯은 각 군에 대한 개별 역가 및 기하 평균 ± 95% 신뢰 구간을 보여준다. ExPEC10V와 대조군 사이의 IgG 역가의 차이는 우도비 검정이 있는 Tobit 모델을 사용하여 분석되었다. P-값 ≤ 0.05는 유의한 것으로 간주되었다. *P ≤ 0.05, ****P ≤ 0.0001.
도 3a 내지 도 3b는 인간에서 ExPEC10V 백신을 사용한 1/2a상 임상 시험을 위한 전체 연구 설계를 보여준다. 도 3a는 코호트 1에 대한 전체 연구 설계를 나타내고, 도 3b는 코호트 2에 대한 전체 연구 설계를 나타낸다. 상세 내용은 실시예 7 참조.
도 4는 BAC1001 임상 시험에서 기준선(1일)으로부터 측정한, 백신접종 후 15일의 혈청 O 항원 특이적 항체 역가가 적어도 2배 증가한 참가자의 백분율을 보여준다(상세 내용은 실시예 7 참조). O 항원 특이적 혈청 항체 역가는 ECL 기반 면역분석법으로 측정했다.
도 5는 BAC1001 임상 시험에서 기준선(1일)으로부터 측정한, 백신접종 후 15일의 혈청 옵소닌 식세포 항체 역가가 적어도 2배 증가한 참가자의 백분율을 보여준다(상세 내용은 실시예 7 참조). 혈청 옵소닌 식세포 항체의 수준은 MOPA로 측정했다.
도 6은 뉴질랜드 백색 토끼에서 ExPEC 백신의 상이한 조성에 의해 유도된 혈청 항체 수준(총 IgG)을 나타낸다. 상세 내용은 실시예 8 참조. 그래프는 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% 신뢰 구간을 보여준다. 백신군 대 식염수 대조군 사이의 비교는 우도비 검정이 있는 Tobit 모델을 사용하여 통계적으로 평가되었고 다중 비교를 위한 Bonferroni 보정이 사용되었다. p 값 ≤ 0.05는 통계적으로 유의한 것으로 간주되었다. ****p ≤ 0.0001.
다양한 간행물, 논문 및 특허가 [배경기술] 및 명세서 전체에 걸쳐 인용되거나 기술되며; 각각의 이러한 참고문헌은 그 전체가 본원에 참고로 포함된다. 본 명세서에 포함된 문헌, 행위, 물질, 장치, 물품 등의 논의는 본 발명의 맥락을 제공하는 목적을 위한 것이다. 이러한 논의는 이들 사항 전부 또는 그 중 임의의 것이, 개시되거나 청구되는 임의의 발명에 대해 선행 기술의 일부를 형성한다고 인정하는 것이 아니다.
달리 정의되지 않는 한, 본원에서 사용된 모든 기술 및 과학 용어는 본 발명과 관련된 분야의 당업자가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 다른 경우, 본원에서 인용되는 특정 용어는 명세서에 제시된 바와 같은 의미를 갖는다. 본원에서 그리고 첨부된 청구범위에서 사용되는 단수 형태("a", "an" 및 "the")는 문맥상 명확히 달리 지시되지 않는 한 복수의 언급 대상을 포함한다는 것이 주목되어야 한다.
달리 나타내지 않는 한, 일련의 요소에 선행하는 용어 "적어도"는 그 시리즈 내의 모든 요소를 나타내는 것으로 이해되어야 한다.
숫자와 함께 사용될 때 “약”이라는 용어는 언급된 숫자의 ±10%, 예를 들어, ±5% 또는 ±1% 내의 임의의 숫자를 지칭한다.
당업자는 단지 일상적인 실험을 이용하여 본 명세서에 기재된 발명의 구체적 구현예에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 이러한 등가물은 본 발명에 포함되는 것으로 의도된다.
본 명세서 및 이후의 청구범위에 걸쳐서, 맥락상 달리 요구하지 않는 한, 단어 "포함하다", 및 "포함한다" 및 "포함하는"과 같은 변형은 명시된 정수 또는 단계 또는 정수 또는 단계의 군의 포함을 의미하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 군의 배제를 의미하지 않는 것으로 이해될 것이다. 본 명세서에서 사용될 때 용어 "포함하는"은 용어 "함유하는" 또는 "포함하고 있는"으로 치환될 수 있거나 또는 때때로, 본 명세서에서 사용될 때 용어 "갖는"으로 치환될 수 있다.
본 명세서에서 사용될 때 "구성되는"은 청구범위 요소에서 명시되지 않은 임의의 요소, 단계 또는 성분을 배제한다. 본 명세서에서 사용될 때 "본질적으로 구성되는"은 청구범위의 기본적이고 새로운 특징에 실질적으로 영향을 주지 않는 물질 또는 단계를 배제하지 않는다. 전술한 용어 “포함하는”, “함유하는”, “포함하고 있는” 및 “갖는” 중 임의의 것은, 본 발명의 양태 또는 구현예의 맥락에서 본 명세서에서 사용될 때마다, 용어 "구성되는" 또는 "본질적으로 구성되는"으로 대체되어 본 발명의 범주를 변경할 수 있다.
본원에서 사용된 바와 같이, 다수의 열거된 요소 사이의 접속 용어 "및/또는"은 개별 및 조합 옵션 둘 모두를 포괄하는 것으로 이해된다. 예를 들어, 두 요소가 "및/또는"에 의해 결합될 경우, 첫 번째 옵션은 제2 요소없이 제1 요소의 적용 가능성을 지칭한다. 두 번째 옵션은 제1 요소 없이 제2 요소의 적용 가능성을 나타낸다. 세 번째 옵션은 제1 및 제2 요소 둘 다의 적용 가능성을 나타낸다. 이들 옵션 중 어느 것이든 그 의미 내에 속하며 따라서 본원에서 사용되는 용어 "및/또는"의 요건을 충족하는 것으로 이해된다. 옵션 중 하나 초과의 동시 적용 가능성도 그 의미 내에 속하며 따라서 용어 "및/또는"의 요건을 충족하는 것으로 이해된다.
본원에서 사용되는 바와 같이, 용어 “O 다당류”, “O 항원”, “O 항원”, “O 항원 다당류”, “O 다당류 항원” 및 약어 “OPS”는 전부 그람 음성균의 O 항원을 지칭하는데, 이는 지질다당류(LPS)의 구성요소이고 그람 음성균의 각각의 혈청형 또는 혈청(아)형에 특이적이다. 대개, O 항원은 2개 내지 7개의 당 잔기의 반복 단위(RU)를 함유한다. 본원에서 사용되는 바와 같이, RU는 생물학적 반복 단위(BRU)와 같게 설정된다. BRU는 생체 내에서 합성되는 O 항원의 RU를 설명한다. 대장균의 서로 다른 혈청형은 서로 다른 O 항원을 발현한다. 대장균에서 O 항원 생물발생에 관여하는 유전자 산물은 rfb 유전자 클러스터에 의해 암호화된다. 본원에서 O 항원 다당류를 언급할 때마다, 각각의 대장균 혈청형의 O 항원 다당류 및 이의 임의의 기존 하위 혈청형은, 달리 지시되지 않는 한, 예를 들어, O1 항원 다당류를 지칭할 때, 이것이 대장균 하위 혈청형 O1A, O1A1, O1B, 또는 O1C의 O 항원 다당류일 수 있고, 한편, O25 항원 다당류는 O25A 또는 O25B 항원 다당류 등을 의미할 수 있음을 의미한다. 많은 대장균 혈청형과 하위 혈청형 및 이의 O 항원 다당류의 RU(모이어티 구조 또는 O 단위)의 상응하는 구조는 본원에 참고로 포함된 WO 2020/039359의 표 1에 제공되어 있다.
본원에서 사용되는 "rfb 클러스터" 및 "rfb 유전자 클러스터"는 O 항원 백본 구조를 합성할 수 있는 효소 기구를 암호화하는 유전자 클러스터를 의미한다. 용어 rfb 클러스터는 임의의 O 항원 생합성 클러스터에 적용될 수 있으며, 바람직하게는 에스케리키아 속, 특히 대장균으로부터의 유전자 클러스터를 지칭한다.
본원에서 사용되는 용어 "O1A"는 대장균의 O1A 항원(대장균 혈청형 O1의 하위 혈청형)을 의미한다. 용어 "O2"는 대장균의 O2 항원(대장균 혈청형 O2)을 의미한다. 용어 "O4"는 대장균의 O4 항원(대장균 혈청형 O4)을 의미한다. 용어 "O6A"는 대장균의 O6A 항원(대장균 혈청형 O6의 하위 혈청형)을 의미한다. 용어 "O8"는 대장균의 O8 항원(대장균 혈청형 O8)을 의미한다. 용어 "O15"는 대장균의 O15 항원(대장균 혈청형 O15)을 의미한다. 용어 "O16"는 대장균의 O16 항원(대장균 혈청형 O16)을 의미한다. 용어 "O18A"는 대장균의 O18A 항원(대장균 혈청형 O18의 하위 혈청형)을 의미한다. 용어 "O25B"는 대장균으로부터의 O25B 항원(대장균 혈청형 O25의 하위 혈청형)을 의미한다. 용어 "O75"는 대장균의 O75 항원(대장균 혈청형 O75)을 의미한다. 본원에서 사용되는 용어 "글루코실화된 O4", "글루코스 분지형 O4", "O4 Glc+" 및 "Glc+ O4" O 항원은 글루코스 측 분지를 갖는 대장균의 O4 O 항원(대장균 혈청형 O4)을 의미하고, "비글루코실화된 O4", "O4 Glc-" 및 "Glc- O4"는 글루코스 측 분지가 없는 O4 항원을 지칭한다.
본 출원 전반에 걸쳐 언급된 몇몇 대장균 O 항원 다당류의 구조는 하기 표 1에 제시되어 있다. 각 대장균 O 항원 다당류에 대한 단일 반복 단위가 제시되어 있다.
표 1: 대장균 O 항원 다당류의 구조
1 각 n은 독립적으로 1 내지 100, 예컨대 1 내지 50, 1 내지 40, 1 내지 30, 1 내지 20 및 1 내지 10, 3 내지 50, 3 내지 40, 5 내지 30, 예를 들어, 적어도 5, 예컨대, 5 내지 40, 예를 들어, 7 내지 30, 예를 들어, 7 내지 25, 예를 들어, 10 내지 20의 정수이지만, 일부 경우 1 또는 2일 수 있다.
본원에 기재된 모든 단당류는 당업계에 공지된 일반적인 의미를 갖는다. 단당류는 D 또는 L 구성을 가질 수 있다. D 또는 L이 지정되지 않은 경우 당류는 D 구성을 갖는 것으로 이해된다. 단당류는 전형적으로 당업계에서 일반적으로 알려지고 사용되는 약어로 지칭된다. 예를 들어, Glc는 글루코스를 지칭하고, D-Glc는 D-글루코스를 지칭하고, L-Glc는 L-글루코스를 지칭한다. 단당류에 대한 다른 일반적인 약어는 다음을 포함한다: Rha, 람노스; GlcNAc, N-아세틸글루코사민; GalNAc, N-아세틸갈락토사민; Fuc, 푸코스; Man, 만노스; Man3Me, 3-O-메틸-만노스; Gal, 갈락토스; FucNAc, N-아세틸푸코사민; 및 Rib, 리보스. 접미사 "f"는 푸라노스를 나타내고, 접미사 "p"는 피라노스를 나타낸다.
O 항원과 관련하여 사용된 용어 "RU", "반복 단위" 및 "반복하는 단위"는 생체 내에서 세포 기구(예를 들어, 글리코실트랜스퍼라제)에 의해 합성되는 것으로서 O 항원의 생물학적 반복 단위(BRU)를 나타낸다. O 항원의 RU의 수는 혈청형에 따라 다를 수 있으며, 본 발명의 구현예에서, 일반적으로 약 1 내지 100 RU, 바람직하게는 약 1 내지 50 RU, 예컨대 1 내지 50 RU, 1 내지 40 RU, 1 내지 30 RU, 1 내지 20 RU 및 1 내지 10 RU, 및 더욱 바람직하게는 적어도 3 RU, 적어도 4 RU, 적어도 5 RU, 예컨대 3 내지 50 RU, 바람직하게는 5 내지 40 RU, 예를 들어 7 내지 25 RU, 예를 들어 10 내지 20 RU로 다양하다. 그러나 어떤 경우에는 O 항원의 RU 수는 1 또는 2일 수 있다. 본원에 구체적으로 기재된 각 O 항원의 구조는 RU의 수를 지정하는 변수 "n"을 갖는 하나의 RU를 함유하는 것으로 나타난다. 본 발명의 생체접합체의 각각의 O 항원 다당류에서, n은 독립적으로 1 내지 100의 정수, 예컨대 1 내지 50, 1 내지 40, 1 내지 30, 1 내지 20, 1 내지 10, 바람직하게는 적어도 3, 더욱 바람직하게는 적어도 5, 예컨대 3 내지 50, 바람직하게는 5 내지 40의 정수(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40), 더욱 바람직하게는 5 내지 30의 정수이지만, 일부 경우 1 또는 2일 수 있다. 일부 구현예에서, n은 독립적으로 약 7 내지 25, 예를 들어 약 10 내지 20의 정수이다. 값은 조성물 중 개별 O 항원 다당류 간에 다를 수 있으며, 본원에서 평균값으로서 제공된다. 즉, 생체접합체가 독립적으로 5 내지 40의 정수인 n을 갖는 것으로 본원에 기재된 경우, 조성물은 5 내지 40개의 반복 단위를 갖는 O 항원 다당류를 대부분 함유하나, 또한 5개 미만의 반복 단위 또는 40개 초과의 반복 단위를 갖는 일부 O 항원 다당류를 함유할 수 있다.
본원에서 사용되는 용어 "접합체" 및 "당접합체"는 단백질, 펩티드, 지질 등을 포함하지만 이에 한정되지 않는 또 다른 화학 종에 연결된 당 또는 당류 항원(예를 들어, 올리고당 및 다당류)-단백질 접합체를 지칭한다. 당접합체는 예를 들어 단백질과 당 또는 당류 항원의 화학적 (합성) 연결에 의해 화학적으로 제조될 수 있다. 당접합체라는 용어는 또한 생체접합체를 포함한다.
본원에서 사용되는 용어 "유효량"은 본 발명의 구현예에 따른 방법에서 대상체에게 O 항원을 투여하는 것과 관련하여 대상체에서 원하는 면역 효과 또는 면역 반응을 유도하기에 충분한 O 항원의 양을 의미한다. 특정 구현예에서, "유효량"은 대상체에서 다음의 효과 중 하나 이상을 달성하기 위해 대상체에서 면역을 생성하기에 충분한 O 항원의 양을 지칭한다: (i) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 발달 또는 발생을 예방하고/하거나; (ii) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 재발을 예방하고/하거나; (iii) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 중증도를 예방, 감소 또는 개선하고/하거나; (iv) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 기간을 감소시키고/시키거나; (v) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 진행을 예방하고/하거나; (vi) ExPEC 감염 또는 이와 관련된 증상의 퇴행을 초래하고/하거나; (vii) ExPEC 감염과 관련된 장기 부전을 예방하거나 감소시키고/시키거나; (viii) ExPEC 감염이 있는 대상체의 입원 가능성 또는 빈도를 감소시키고/시키거나; (ix) ExPEC 감염이 있는 대상체의 입원 기간을 감소시키고/시키거나; (x) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환에 걸린 대상체의 생존을 증가시키고/시키거나; (xi) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환을 제거하고/하거나; (xii) ExPEC 복제를 억제 또는 감소시키고/시키거나; (xiii) 또 다른 요법의 예방 또는 치료 효과(들)를 증진시키거나 개선한다.
"유효량"은 다양한 요인, 예를 들어, 대상체의 신체 조건, 연령, 체중, 건강 등; 투여 경로, 예를 들어, 경구 또는 비경구; 투여되는 조성물, 예를 들어, 표적 O 항원, 다른 공동 투여되는 O 항원, 아쥬반트 등; 및 면역이 요망되는 특정 질환에 따라 달라질 수 있다. O 항원이 단백질 담체에 공유 결합되는 경우, O 항원에 대한 유효량은 접합체 내의 O 항원 다당류 모이어티만을 기초로 하여 계산된다. 본원에 기재된 바와 같은 생체접합체를 포함하는 접합체의 모든 농도, 양 및 비율은 또한 달리 명시되지 않는 한, 임의의 접합된 담체 단백질의 농도, 양 또는 비율과 관계 없이 접합체 내의 O 항원 다당류 모이어티의 중량만을 기초로 하여 계산된다. 예를 들어, 16 μg의 특정 생체접합체를 투여한다는 것은 투여되는 생체접합체가 16 μg의 특정 O 항원 다당류를 포함한다는 것을 의미하며, 접합된 담체 단백질의 양은 이 수치에 포함되지 않는다. 또 다른 예를 들어, 조성물이 혈청형 A 및 B로부터의 O 항원 다당류의 접합체를 2:1의 비율로 포함한다고 하면, 이는 조성물에서 접합된 담체 단백질의 중량은 무시하고, 접합된 O 항원 다당류의 중량을 기준으로 하여, 접합된 O 항원 다당류 B의 농도 또는 양의 2배의 접합된 O 항원 다당류 A의 농도 또는 양이 있음을 나타낸다.
본원에서 사용되는 용어 "침습성 장외 병원성 대장균(ExPEC) 질환(IED)"은 전신 박테리아 감염과 일치하는 급성 질환으로, 이는 혈액 또는 기타 정상적으로 멸균된 신체 부위로부터의 대장균의 분리 및 식별에 의해, 또는 침습성 질환(전신 염증 반응 증후군(SIRS), 패혈증 또는 패혈성 쇼크)의 징후 및 증상이 있고 식별 가능한 다른 감염원이 없는 환자의 소변으로부터의 대장균의 분리 및 식별에 의해 미생물학적으로 확인된다. 특정 구현예에서, IED는 전신 박테리아 감염과 일치하는 급성 질환이며, 이는 (i) 혈액 또는 기타 정상적으로 멸균된 신체 부위로부터의 대장균의 분리 및 식별에 의해, 또는 (ii) 요로 및/또는 남성 생식기에서 발생하는 감염에 대한 조절되지 않은 숙주 반응으로 인해 생명을 위협하는 기관 기능 장애가 있고 식별 가능한 다른 감염원이 없는 환자의 소변으로부터의 대장균의 분리 및 식별에 의해 미생물학적으로 확인된다.
IED는 요로 감염(UTI), 수술 부위 감염, 복부 또는 골반 감염, 폐렴, 골수염, 연조직염, 패혈증, 균혈증, 상처 감염, 신우신염, 전립선 생검 관련 감염(예를 들어, 경직장 초음파 유도 전립선 바늘 생검[TRUS-PNB] 관련 감염), 요로 패혈증, 수막염, 복막염, 담관염, 연조직 감염, 화농성 근염, 패혈성 관절염, 안내염, 화농성 갑상선염, 부비동염, 심내막염, 호중구 감소성 열 및 전립선염(급성 세균성 전립선염[ABP]을 포함하나 이에 한정되지 않음)을 포함할 수 있으나, 반드시 이에 한정되지는 않는다.
특정 바람직한 구현예에서, IED는 패혈증을 포함한다. 특정 바람직한 구현예에서, IED는 균혈증을 포함한다. 특정 구현예에서 본 발명은 대장균에 의해 유발된 패혈증을 예방하기 위한 본 발명에 따른 조성물을 제공한다. 특정 구현예에서 본 발명은 대장균에 의해 유발된 균혈증을 예방하기 위한 본 발명에 따른 조성물을 제공한다.
"패혈증에 대한 기준을 충족하는 IED 사건"이라는 용어는 감염에 대한 숙주 반응 조절 장애로 인해 생명을 위협하는 기관 기능 장애의 증거를 포함하는 IED 사례를 나타낸다. 순차적 장기 부전 평가(Sequential Organ Failure Assessment, SOFA) 총 점수가 기준선으로부터 2점 이상 급격하게 변화하고 IED에 이차적인 것으로 간주되는 경우 IED 사례는 패혈증 기준을 충족한다. 특정 구현예에서 본 발명은 패혈증에 대한 기준을 충족하는 IED를 예방하기 위한 본 발명에 따른 조성물을 제공한다. 본원에서 사용되는 "요로성 패혈증"이라는 용어는 비뇨생식관 및/또는 남성 생식기에서 기원하는 감염에 의해 발생하는 패혈증이다.
"세균성 IED"라는 용어는 혈액에서 대장균을 분리 및 식별하는 것을 포함하는 IED 사례이다. 특정 구현예에서 본 발명은 균혈증 IED를 예방하기 위한 본 발명에 따른 조성물을 제공한다.
본원에서 사용되는 바와 같이, 항원 또는 조성물에 대한 “면역학적 반응” 또는 “면역 반응”은 대상체에서 해당 항원 또는 조성물에 존재하는 항원에 대한 체액성 및/또는 세포성 면역 반응의 발생을 지칭한다.
본원에서 사용되는 바와 같이, 하나 초과의 대장균 항원 다당류를 포함하는 "조성물"은 동일한 제약 조성물에 하나 초과의 대장균 항원 다당류를 포함하는 단일 제약 조성물, 또는 개별 제약 조성물에 하나 초과의 대장균 항원 다당류를 포함하는 하나 초과의 제약 조성물의 조합일 수 있다. 바람직한 구현예에서, 조성물은 단일 제약 조성물이다. 대장균에 대한 면역 반응을 유도하는 방법에서, 하나 초과의 대장균 항원 다당류를 포함하는 "조성물"은 하나 초과의 대장균 항원 다당류를 포함하는 단일 제약 조성물과 함께 이를 필요로 하는 대상체에게 투여될 수 있거나, 또는 개별 제약 조성물로 조합하여 대상체에게 투여될 수 있다. 바람직한 구현예에서, 단일 제약 조성물이 대상체에게 투여된다.
본원에서 사용되는 바와 같이, 2개 이상의 O 항원 또는 조성물을 대상체에게 투여하는 맥락에서 "조합하여" 또는 "~의 조합"이라는 용어는 O 항원 또는 조성물이 대상체에게 투여되는 순서를 제한하지 않는다. 예를 들어, 제1 조성물은 대상체로의 제2 조성물의 투여 전(예를 들어, 5분, 15분, 30분, 45분, 1시간, 2시간, 4시간, 6시간, 12시간, 16시간, 24시간, 48시간, 72시간, 96시간, 1주, 2주, 3주, 4주, 5주, 6주, 8주 또는 12주 전), 투여와 동시에, 또는 투여 후(예를 들어, 5분, 15분, 30분, 45분, 1시간, 2시간, 4시간, 6시간, 12시간, 16시간, 24시간, 48시간, 72시간, 96시간, 1주, 2주, 3주, 4주, 5주, 6주, 8주 또는 12주 후)에 투여될 수 있다. 바람직하게는 2개 이상의 O 항원은 본질적으로 동시에, 예를 들어, 서로 5분 이내에, 대상체에게 투여되고, 더욱 바람직하게는 2개 이상의 O 항원은 동시에 적어도 2개의 조성물의 투여를 통해, 가장 바람직하게는 2개 이상의 O 항원을 포함하는 단일 조성물의 투여를 통해, 동시에 투여된다.
본원에서 사용되는 "대상체"는 본 발명의 구현예에 따른 방법 또는 조성물에 의해 백신접종될 또는 백신접종된 임의의 동물, 바람직하게는 포유류, 가장 바람직하게는 인간을 의미한다. 본원에서 사용되는 용어 "포유류"는 임의의 포유류를 포괄한다. 포유류의 예에는 비제한적으로 소, 말, 양, 돼지, 고양이, 개, 마우스, 래트, 토끼, 기니피그, 원숭이, 인간 등을 포함하고, 가장 바람직하게는 인간이다. “대상체” 및 “환자”라는 용어는 본원에서 상호교환가능하게 사용될 수 있다.
용어 “서열 동일성 퍼센트(%)” 또는 “동일성 %”는 전장의 아미노산 서열을 구성하는 아미노산 잔기의 수와 비교하여 둘 이상의 정렬된 아미노산 서열 중 동일한 아미노산의 매치(“히트(hit)”)의 수를 설명한다. 다른 말로 하면, 정렬을 이용하면, 둘 이상의 서열에 있어서, 서열들을 본 기술 분야에 공지된 바와 같은 서열 비교 알고리즘을 이용하여 측정할 경우 최대 상응도를 위하여 비교 및 정렬할 때, 또는 수동으로 정렬하고 시각적으로 점검할 때, 동일한 아미노산 잔기의 백분율(예를 들어 90%, 95%, 97% 또는 98%의 동일성)이 결정될 수 있다. 따라서 서열 동일성을 결정하기 위하여 비교되는 서열들은 아미노산의 치환(들), 부가(들) 또는 결실(들)에 의해 다를 수 있다. 단백질 서열 정렬에 적합한 프로그램은 당업자에게 공지되어 있다. 단백질 서열의 서열 동일성 백분율은 예를 들어 CLUSTALW, Clustal Omega, FASTA 또는 BLAST와 같은 프로그램을 이용하여, 예를 들어 NCBI BLAST 알고리즘을 이용하여 결정될 수 있다(Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402).
예를 들어, 아미노산 서열의 경우, 서열 동일성 및/또는 유사성은 비제한적으로 문헌[Smith and Waterman, 1981, Adv. Appl. Math. 2:482]의 국소 서열 동일성 알고리즘, 문헌[Needleman and Wunsch, 1970, J. Mol. Biol. 48:443]의 서열 동일성 정렬 알고리즘, 문헌[Pearson and Lipman, 1988, Proc. Nat. Acad. Sci. U.S.A. 85:2444]의 유사성 방법에 대한 조사, 이들 알고리즘의 컴퓨터 구현(위스콘신 제네틱스 소프트웨어 패키지의 GAP, BESTFIT, FASTA 및 TFASTA, 미국 위스콘신 주 매디슨, 사이언스 드라이브 575), 문헌[Devereux et al, 1984, Nucl. Acid Res. 12:387-395]에 기재된 Best Fit 서열 프로그램을 포함하는 당업계에 공지된 표준 기술을 이용하여, 바람직하게는 기본 설정을 사용하여, 또는 검사에 의해 결정될 수 있다. 특정 구현예에서, 퍼센트 동일성은 다음 파라미터에 기초하여 FastDB에 의해 계산된다: 1의 미스매치 패널티; 1의 갭 패널티; 0.33의 갭 크기 패널티; 및 30의 합류 패널티("Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149 (1988), Alan R. Liss, Inc.).
유용한 알고리즘의 또 다른 예는 하기 문헌에 기재된 BLAST 알고리즘이다: 문헌[Altschul et al, 1990, J. Mol. Biol. 215:403-410; Altschul et al, 1997, Nucleic Acids Res. 25:3389-3402; 및 Karin et al, 1993, Proc. Natl. Acad. Sci. U.S.A. 90:5873-5787]. 특히 유용한 BLAST 프로그램은 문헌[Altschul et al, 1996, Methods in Enzymology 266:460-480]에서 얻은 WU-BLAST-2 프로그램이다. WU-BLAST-2는 대부분 기본값으로 설정되는 여러 검색 파라미터를 사용한다.
추가의 유용한 알고리즘은 문헌[Altschul et al,1993, Nucl. Acids Res. 25:3389-3402]에 의해 보고된 바와 같은 갭핑된 BLAST이다.
대장균 O 항원
본 발명에서는 놀랍게도 담체 단백질에 접합된 대장균 O75 항원이 다가 백신 조성물의 동일한 다당류 농도의 담체 단백질에 접합된 다른 대장균 O 항원(예를 들어, O1A, O2, O4, O6A, O15, O16 및 O18A)보다 덜 면역원성인 것으로 나타난다는 점이 발견되었다. 이 발견은 대장균 O75 항원의 투여량과 다가 백신 내의 다양한 대장균 O 항원의 투여 비율에 대한 추가 조사로 이어졌으며, 이에 따라 ExPEC의 O75 혈청형 및 기타 혈청형에 대한 개선된 면역 반응을 위한 대장균 O 항원을 기반으로 한 다가 백신 및 면역화 방법이 개발되었다.
본 발명의 구현예는 대장균 O75 항원 다당류 및 하나 이상의 추가 대장균 O 항원 다당류에 관한 조성물 및 방법에 관한 것이다. 바람직하게는, 하나 이상의 추가 O 항원은 대장균의 임상 분리주 중에 널리 퍼져 있다. 본 발명에서 사용될 수 있는 이러한 대장균 항원의 예는 대장균 O1, O2, O4, O6, O8, O15, O16, O18 및 O25 항원을 포함하나 이에 한정되지 않는다. 필요에 따라, 조성물은 대장균 O75 혈청형 외에 다수의 대장균 혈청형에 대한 면역 보호를 제공하기 위해 하나 초과의 추가 대장균 O 항원, 예컨대, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개 또는 15개의 추가 대장균 O 항원을 포함할 수 있다. 일부 구현예에서, 추가 대장균 O 항원은 대장균 O1, O2, O4, O6, O15, O16, O18 및 O25 항원으로 구성된 군으로부터 선택된다. 바람직한 구현예에서, 추가 대장균 O 항원은 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A 및 O25B로 구성된 군으로부터 선택된다. 더욱 바람직하게는 조성물은 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A 및 O25B 대장균 O 항원을 모두 포함한다. 특정 구현예에서, 대장균 O 항원은 표 1에 제시된 바와 같은 구조를 포함하며, 여기서 n은 1 내지 100의 정수이다. 일부 구현예에서, n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.
일 구현예에서, 본 발명의 조성물은 대장균 O75 및 O6 항원 다당류를 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O6 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1, 예를 들어 약 1:5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1 또는 2.5:1이다. 일부 구현예에서, 조성물은 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다.
본 발명에 유용한 대장균 O 항원은 본 개시내용을 고려하여 당업계에 공지된 방법에 의해 생성될 수 있다. 예를 들어, 이들은 세포, 바람직하게는 O 항원의 생합성에 최적화된 재조합 세포로부터 생성될 수 있다. 예를 들어, WO 2006/119987, WO 2009/104074, 국제 특허 출원 제PCT/EP2015/053739호, 문헌[Ihssen et al., 2010, Microbial Cell Factories 9, 61](이의 개시내용은 전체가 본원에 참조로 포함됨)에서 대장균 O 항원 생합성을 위한 핵산, 단백질, 숙주 세포, 생산 방법 등에 대한 관련 개시내용 참조.
담체 단백질
본 발명의 구현예에 따르면, 각각의 대장균 O 항원은 바람직하게는 글리코시드 결합에 의해, 담체 단백질에 공유 결합된다. 본 개시를 고려하여 당업자에게 알려진 임의의 담체 단백질이 사용될 수 있다. 적합한 담체 단백질은 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), CRM197, 대장균 플라겔린(FliC), 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D를 포함한다. 요구되는 공통 글리코실화 서열을 함유하는 다양한 상이한 담체 단백질과의 생체접합이 설명되었으며, 이는 이 기술을 사용하여 광범위한 단백질이 글리코실화될 수 있음을 보여준다(예를 들어, WO 06/119987, WO 2015/124769, WO 2015/158403, WO 2015/82571, WO 2017/216286 및 WO 2017/67964 참조, 이들은 함께 생체접합에 성공적으로 사용된 광범위한 담체 단백질을 보여준다).
특정 구현예에서 담체 단백질은 변형된다. 예를 들어 단백질이 덜 독성이고/거나 글리코실화에 더 민감한 방식으로 변형된다. 특정 구현예에서, 본원에 사용된 담체 단백질은 더 낮은 농도의 단백질이 예를 들어, 면역원성 조성물 중에서 특히, 이의 생체접합체 형태로 투여되도록 하는 방식으로 담체 단백질의 글리코실화 부위의 수가 최대화되도록 변형된다.
따라서, 특정 구현예에서, 본원에 기재된 담체 단백질은 (예를 들어, 담체 단백질이 이의 천연/자연, 즉, "야생형" 상태에서 관련된 글리코실화 부위의 수와 비교하여) 일반적으로 담체 단백질과 관련된 것보다 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 글리코실화 부위를 포함하도록 변형된다. 담체 단백질 내로의 글리코실화 부위의 도입은, 예를 들어 글리코실화 부위가 완전히 또는 부분적으로 추가되도록 단백질의 일차 구조에 새로운 아미노산을 추가하여, 단백질의 일차 구조 임의의 곳에서 글리코실화 공통 서열을 삽입함으로써, 또는 글리코실화 부위를 생성하기 위해 단백질 내의 기존 아미노산을 돌연변이시킴으로써 달성될 수 있다. 당업자는 당업계에 공지된 접근법, 예를 들어 단백질을 암호화하는 핵산 서열의 변형을 포함하는 재조합 접근법을 이용하여 단백질의 아미노산 서열이 용이하게 변형될 수 있음을 인식할 것이다. 특정 구현예에서, 글리코실화 공통 서열은 담체 단백질의 특정 영역, 예를 들어 단백질의 표면 구조 내에 단백질의 N 또는 C 말단에 및/또는 단백질 염기의 이황화 가교에 의해 안정화되는 루프에 도입된다. 일부 구현예에서, 글리코실화 공통 서열은 더욱 효율적인 글리코실화를 위해 리신 잔기의 첨가에 의해 연장될 수 있다.
담체 단백질에 삽입되거나 생성될 수 있는 글리코실화 공통 서열의 예시적인 예는 Asn-X-Ser(Thr)(여기서, X는 Pro를 제외한 임의의 아미노산일 수 있음)(서열번호 1); 및 바람직하게는 Asp(Glu)-X-Asn-Z-Ser(Thr)(여기서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨)(서열번호 2)를 포함한다.
일부 구현예에서,대장균 O 항원 다당류는 담체 단백질 내의 아스파라긴(Asn) 잔기에 공유 결합되며(예를 들어, N-연결됨), 여기서 Asn 잔기는 서열번호 1, 더욱 바람직하게는 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 글리코실화 부위에 존재한다. 전형적으로, 담체 단백질은 1 내지 10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1 내지 10개, 바람직하게는 2 내지 4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 서열번호 1의 아미노산 서열, 더욱 바람직하게는 서열번호 2의 아미노산 서열을 갖는 글리코실화 공통 서열을 포함한다.
특정 구현예에서, 담체 단백질은 P. 애루기노사의 탈독소화된 외독소 A이다. EPA의 경우, 다양한 탈독소화된 단백질 변이체가 문헌에 설명되어 있으며 담체 단백질로 사용될 수 있었다. 예를 들어, 탈독소화는 문헌[Lukac et al., 1988, Infect Immun, 56: 3095-3098 및 Ho et al., 2006, Hum Vaccin, 289-98]에 따라 촉매적으로 필수적인 잔기 L552V 및 ΔE553을 돌연변이시키고 결실시킴으로써 달성될 수 있다. 본원에서 사용되는 바와 같은 "EPA"는 P. 애루기노사의 탈독소화된 외독소 A를 나타낸다. 담체 단백질이 EPA인 이러한 구현예에서, 대장균 항원 다당류는 서열번호 1을 갖는 글리코실화 공통 서열을 포함하는 글리코실화 부위의 Asn 잔기에 공유 결합될 수 있으며, 바람직하게는 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 글리코실화 부위의 Asn 잔기에 공유 결합될 수 있다. 바람직하게는,EPA 담체 단백질은 1 내지 10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1 내지 10개, 바람직하게는 2 내지 4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 서열번호 1의 아미노산 서열, 더욱 바람직하게는 서열번호 2의 아미노산 서열을 갖는 글리코실화 공통 서열을 포함한다.
일부 구현예에서, EPA 담체 단백질은 각각 글리코실화 공통 서열을 포함하는 4개의 글리코실화 부위, 예를 들어 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 글리코실화 부위를 포함한다. 본원에서 사용된 바와 같이, "EPA-4 담체 단백질" 및 "EPA-4"는 각각 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 4개의 글리코실화 부위를 포함하는 P. 애루기노사 담체 단백질의 탈독소화된 외독소 A를 지칭한다. EPA-4 담체 단백질의 예시적인 바람직한 예는 서열번호 3의 아미노산 서열을 포함하는 EPA 담체 단백질이다.
특정 구현예에서, EPA 담체 단백질은, 담체 단백질을 발현하는 숙주 세포의 주변 세포질 공간으로 담체 단백질을 표적화하는 신호 서열(예컨대, 대장균 DsbA, 대장균 외막 포린 A(OmpA), 대장균 말토스 결합 단백질(MalE) 등에 대한 신호 펩티드)과 함께 생성될 수 있다. EPA 담체 단백질은 또한 "태그", 즉 담체 단백질의 분리 및/또는 식별을 가능하게 하는 아미노산 서열로 변형될 수 있다.
본 발명에 유용한 EPA 담체 단백질은 본 개시내용을 고려하여 당업계에 공지된 방법에 의해 생성될 수 있다. 예를 들어, 문헌[Ihssen et al., 2010, Microbial Cell Factories 9, 61] 및 WO 2006/119987, WO 2009/104074 및 WO 2015/124769(이의 개시내용은 전체가 본원에 참조로 포함됨)의 관련 개시내용 참조.
다른 구현예에서, 담체 단백질은 CRM197이다. CRM197 단백질은 디프테리아 독소의 비독성 형태이지만, 면역학적으로 디프테리아 독소와 구별할 수 없다. CRM197은 독소 생성 코리네파지 베타의 니트로소구아니딘 돌연변이 생성에 의해 생성된 비독소 생성 파지 β197tox-에 의해 감염된 코리네박테리움 디프테리애(Corynebacterium diphtheriae)에 의해 생성된다(Uchida et al. (1971) Nature New Biology 233:8-11). CRM197 단백질은 디프테리아 독소와 분자량은 같지만 구조 유전자의 단일 염기 변화(구아닌에서 아데닌으로)에 의해 상이하다. 이 단일 염기 변화는 성숙한 단백질에서 아미노산 치환(글리신 대신 글루탐산)을 일으키고 디프테리아 독소의 독성 특성을 제거한다. CRM197 단백질은 당류에 대한 안전하고 효과적인 T 세포 의존성 담체이다. CRM197 단백질의 아미노산 서열은 서열번호 20에 제시되어 있다. CRM197 및 이의 생성에 대한 추가 상세 내용은 예를 들어, 미국 특허 제5,614,382호에서 찾을 수 있다. 일 구현예에서, 본 발명의 O 항원 다당류는 CRM197 단백질 또는 CRM197의 A 사슬에 접합된다(CN103495161 참조). 일 구현예에서, 본 발명의 O 항원 다당류는 유전자 재조합 대장균에 의한 발현을 통해 얻은 CRM197의 A 사슬에 접합된다(CN103495161 참조). 일 구현예에서, 본 발명의 O 항원 다당류는 각각 독립적으로 CRM197에 접합된다. 일 구현예에서, 본 발명의 O 항원 다당류는 각각 독립적으로 CRM197의 A 사슬에 접합된다.
접합체
용어 "생체접합체"는 숙주 세포 배경, 바람직하게는 박테리아 숙주 세포, 예를 들어, 대장균 숙주 세포에서 제조된 단백질(예를 들어, 담체 단백질)과 당 또는 당류 항원(예를 들어, 올리고당 및 다당류) 사이의 접합체를 지칭하며, 여기서 숙주 세포 기구는 항원을 단백질에 연결한다(예를 들어, N-연결). 바람직하게는, 용어 "생체접합체"는 숙주 세포 배경에서 제조된 단백질(예를 들어, 담체 단백질)과 O 항원, 바람직하게는 대장균 O 항원(예를 들어, O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B, O75 등) 사이의 접합체를 지칭하며, 여기서 숙주 세포 기구는 항원을 단백질에 연결한다(예를 들어, N-연결). 생체접합체는 숙주 세포 기구에 의해 숙주 세포에서 제조되기 때문에, 항원과 단백질은 생체접합체에서 글리코시드 연결 또는 결합을 통해 공유 결합된다. 생체접합체는 O 항원을 합성하고/하거나 O 항원을 표적 단백질에 연결하는 데 필요한 세포 기구를 발현하도록 조작된 재조합 숙주 세포에서 제조될 수 있다. 본원에 기재된 바와 같은 생체접합체는 글리칸이 박테리아 세포벽으로부터 정제되고 이어서 담체 단백질에 화학적으로 결합되는 화학적으로 제조된 당접합체에 비해 유리한 특성을 갖는다. 예를 들어, 생체접합체는 제조 시 더 적은 화학물질을 필요로 하고 생성된 최종 생성물의 관점에서 더 일관성이 있고, 유리(즉, 담체 단백질에 결합되지 않은) 글리칸을 더 적게 포함하거나 전혀 포함하지 않는다. 지질 A가 없는 O 항원의 정제 및 후속적인 담체 단백질에 대한 화학적 접합은 길고 힘든 과정이다. 또한, 정제, 지질 A 탈독소화 및 화학적 접합 과정은 접합된 다당류의 에피토프 손실, 항원 이질성 및 감소된 면역원성을 초래할 수 있다. 생체접합에 의한 당접합체의 합성은 고전적인 정제 및 화학적 접합의 이러한 한계를 극복할 수 있다. 따라서, 전형적인 구현예에서, 화학적으로 생성된 당접합체보다 생체접합체가 바람직하다.
특정 구현예에서, 숙주 세포는 대장균 O 항원 및 EPA 담체 단백질을 생산할 수 있고, O 항원을 EPA 담체 단백질에 공유 결합시켜 본 발명에 유용한 생체접합체를 형성할 수 있다. 예를 들어, 문헌[Ihssen et al., 2010, Microbial Cell Factories 9, 61] 및 WO 2006/119987, WO 2009/104074 및 WO 2015/124769(이의 개시내용은 전체가 본원에 참조로 포함됨)의 관련 개시내용 참조.
특정 구현예에서, 담체 단백질은 본 발명에 유용한 대장균 O 항원에 N-연결된다. 예를 들어, 대장균 O 항원은 담체 단백질의 글리코실화 서열, 예컨대, Asn-X-Ser(Thr)(여기서, X는 Pro를 제외한 임의의 아미노산일 수 있음)(서열번호 2), 바람직하게는 Asp(Glu)-X-Asn-Z-Ser(Thr)(여기서, X 및 Z는 Pro를 제외한 임의의 천연 아미노산으로부터 독립적으로 선택됨)(서열번호 3)의 Asn 잔기에 연결된다.
대안적으로, 당접합체는 화학적 합성에 의해 제조될 수 있다. 즉, 숙주 세포 외부에서(시험관 내) 제조될 수 있다. 예를 들어, 본원에 기재된 대장균 O 항원, 예를 들어 O75 항원은 다당류/올리고당에서 활성화 반응성 기 및 단백질 담체를 사용하는 것을 포함하여 당업자에게 공지된 방법을 사용하여 담체 단백질에 접합될 수 있다. 예를 들어, 문헌[Pawlowski et al., 2000, Vaccine 18:1873-1885; 및 Robbins et al., 2009, Proc Natl Acad Sci USA 106:7974-7978](이의 개시내용은 본원에 참조로 포함됨) 참조. 이러한 접근법은 숙주 세포로부터 항원성 다당류/올리고당의 추출, 다당류/올리고당의 정제, 다당류/올리고당의 화학적 활성화 및 다당류/올리고당의 담체 단백질로의 접합을 포함한다. 담체 단백질에 대한 화학적 접합을 사용하여 담체 단백질에 접합된 대장균 O 항원의 당접합체를 제조하는 방법 및 이러한 당접합체를 포함하는 조성물은 또한 WO 2020/039359에 기재되어 있다.
예를 들어 접합체는 CDAP 화학을 사용하여 제조할 수 있다. 이들 구현예에서, 다당류는 1-시아노-4-디메틸아미노 피리디늄 테트라플루오로보레이트(CDAP)로 활성화되어 시아네이트 에스테르를 형성한다. 그런 다음 활성화된 다당류는 직접 또는 스페이서(링커) 기를 통해 담체 단백질(예를 들어, EPA 또는 CRM197)의 아미노 기에 커플링된다. 예를 들어, 스페이서는 시스타민 또는 시스테아민일 수 있어 말레이미드-활성화된 담체 단백질(예를 들어 N-[γ-말레이미도부티릴록시]숙신이미드 에스테르(GMBS)를 사용) 또는 할로아세틸화된 담체 단백질(예를 들어 요오도아세트이미드, N-숙신이미딜 브로모아세테이트(SBA; SIB), N-숙신이미딜(4-요오도아세틸)아미노벤조에이트(SIAB), 설포숙신이미딜(4-요오도아세틸)아미노벤조에이트(설포-SIAB), N-숙신이미딜 요오도아세테이트(SIA) 또는 숙신이미딜 3-[브로모아세트아미도]프로피오네이트(SBAP)를 사용)와의 반응 후에 수득된 티오에테르 연결을 통해 담체에 커플링될 수 있는 티올화된 다당류를 제공할 수 있다. 바람직하게는, 시아네이트 에스테르(선택적으로 CDAP 화학에 의해 제조됨)는 헥산 디아민 또는 아디프산 디히드라지드(ADH)와 커플링되고, 아미노 유도체화된 당류는 단백질 담체 상의 카르복실 기를 통한 카르보디이미드(예를 들어, EDAC 또는 EDC) 화학을 이용하여 담체 단백질(예를 들어, EPA 또는 CRM197)에 접합된다. 이러한 접합체는 예를 들어 WO 93/15760, WO 95/08348 및 WO 96/129094에 기재되어 있다.
접합을 위한 다른 적합한 기술은 카르보디이미드, 히드라지드, 활성 에스테르, 노르보란, p-니트로벤조산, N-하이드록시숙신이미드, S-NHS, EDC, TSTU를 사용한다. 다수가 WO 98/42721에 기재되어 있다. 접합은 카르보닐 링커를 수반할 수 있으며, 이는 당류의 유리 하이드록실 기와 CDI의 반응에 의해 형성될 수 있고(문헌[Bethell et al. (1979) 1. Biol. Chern. 254:2572-2574; Hearn et al. (1981) J. Chromatogr. 218:509-518] 참조), 이어서 단백질과 반응하여 카바메이트 연결을 형성할 수 있다. 이는 아노머 말단의 1차 하이드록실 기로의 환원, 1차 하이드록실 기의 선택적 보호/탈보호, 1차 하이드록실 기와 CDI의 반응에 의한 CDI 카바메이트 중간체 형성 및 CDI 카바메이트 중간체의 단백질 상의 아미노 기와의 커플링을 수반할 수 있다.
다른 구현예에서, 접합체는 환원적 아민화를 사용하여 제조된다. 환원적 아민화는 두 단계, 즉 (1) 다당류의 산화, (2) 활성화된 다당류 및 담체 단백질의 환원에 의한 접합체 형성을 포함한다. 산화 전에 다당류는 선택적으로 가수분해된다. 기계적 또는 화학적 가수분해가 사용될 수 있다. 화학적 가수분해는 아세트산을 사용하여 수행할 수 있다.
산화 단계는 과요오드산염과의 반응을 수반할 수 있다. 본 발명의 목적을 위해, "과요오드산염"이라는 용어는 과요오드산염 및 과요오드산을 포함하고; 이 용어는 또한 메타과요오드산염(IO4 -)과 오르토과요오드산염(IO6 5-)을 포함하고 과요오드산염의 다양한 염(예를 들어, 과요오드산 나트륨 및 과요오드산 칼륨)을 포함한다. 일 구현예에서, 협막 다당류는 메타과요오드산염의 존재 하에, 바람직하게는 과요오드산 나트륨(NaIO4)의 존재 하에 산화된다. 또 다른 구현예에서 협막 다당류는 오르토과요오드산염의 존재 하에, 바람직하게는 과요오드산의 존재 하에 산화된다.
일 구현예에서, 산화제는 (WO 2014/097099에 기재된 바와 같이) 1차 하이드록실을 선택적으로 산화시키는 산화제의 존재 하에 피페리딘-N-옥시 또는 피롤리딘-N-옥시 화합물과 같은 안정한 니트록실 또는 니트록사이드 라디칼 화합물이다. 상기 반응에서, 실제 산화제는 촉매 순환에서 N-옥소암모늄 염이다. 일 양태에서, 상기 안정한 니트록실 또는 니트록사이드 라디칼 화합물은 피페리딘-N-옥시 또는 피롤리딘-N-옥시 화합물이다. 일 양태에서, 상기 안정한 니트록실 또는 니트록사이드 라디칼 화합물은 TEMPO(2,2,6,6-테트라메틸-1-피페리디닐옥시) 또는 PROXYL(2,2,5,5-테트라메틸-1-피롤리디닐옥시) 모이어티를 보유한다. 일 양태에서, 상기 안정한 니트록실 라디칼 화합물은 TEMPO 또는 이의 유도체이다. 일 양태에서, 상기 산화제는 N-할로 모이어티를 갖는 분자이다. 일 양태에서, 상기 산화제는 N-클로로숙신이미드, N-브로모숙신이미드, N-요오도숙신이미드, 디클로로이소시아누르산, 1,3,5-트리클로로-1,3,5-트리아지난-2,4,6-트리온, 디브로모이소시아누르산, 1,3,5-트리브로모-1,3,5-트리아지난-2,4,6-트리온, 디요오도이소시아누르산 및 1,3,5-트리요오도-1,3,5-트리아지난-2,4,6-트리온으로 구성된 군으로부터 선택된다. 바람직하게는 상기 산화제는 N-클로로숙신이미드이다.
선택적으로 산화 반응은 ??칭제의 첨가에 의해 ??칭된다. ??칭제는 인접한 디올, 1,2-아미노알코올, 아미노산, 글루타티온, 설파이트, 바이설페이트, 다이티오나이트, 메타바이설파이트, 티오설페이트, 포스파이트, 하이포포스파이트 또는 아인산(예를 들어, 글리세롤, 에틸렌 글리콜, 프로판-1,2-디올, 부탄-1,2-디올 또는 부탄-2,3-디올, 아스코르브산)으로부터 선택된다.
다당류의 산화 단계 후, 다당류는 활성화된다고 하며 이하에서 "활성화된 다당류"라고 한다. 활성화된 다당류 및 담체 단백질은 독립적으로(분리된 동결건조) 또는 함께(공동 동결건조) 동결건조(냉동 건조)될 수 있다. 일 구현예에서 활성화된 다당류 및 담체 단백질은 공동 동결건조된다. 또 다른 구현예에서 활성화된 다당류 및 담체 단백질은 독립적으로 동결건조된다.
일 구현예에서 동결건조는 비환원당의 존재 하에 발생하며, 가능한 비환원당은 수크로스, 트레할로스, 라피노스, 스타키오스, 멜레지토스, 덱스트란, 만니톨, 락티톨 및 팔라티니트를 포함한다.
접합 과정의 두 번째 단계는 환원제를 사용하여 활성화된 다당류와 담체 단백질의 환원을 통한 접합체 형성(소위 환원적 아민화)이다. 적합한 환원제는 시아노보로하이드라이드(예를 들어, 브뢴스테드 또는 루이스 산의 존재 하에 나트륨 시아노보로하이드라이드, 나트륨 트리아세톡시보로하이드라이드 또는 나트륨 또는 아연 보로하이드라이드), 아민 보란, 예컨대 피리딘 보란, 2-피콜린 보란, 2,6-디보란-메탄올, 디메틸아민-보란, t-BuMeiPrN-BH3, 벤질아민-BH3 또는 5-에틸-2-메틸피리딘 보란(PEMB) 또는 보로하이드라이드 교환 수지를 포함한다. 일 구현예에서 환원제는 나트륨 시아노보로하이드라이드이다.
일 구현예에서, 환원 반응은 수성 용매(예를 들어, PBS, MES, HEPES, Bis-tris, ADA, PIPES, MOPSO, BES, MOPS, DIPSO, MOBS, HEPPSO, POPSO, TEA, EPPS, Bicine 또는 HEPB로부터 선택됨, pH 6.0 내지 8.5, 7.0 내지 8.0, 또는 7.0 내지 7.5)에서 수행되고, 또 다른 구현예에서 반응은 비양성자성 용매에서 수행된다. 일 구현예에서, 환원 반응은 DMSO(디메틸설폭사이드) 또는 DMF(디메틸포름아미드) 용매에서 수행된다. DMSO 또는 DMF 용매는 동결건조된 활성화된 다당류 및 담체 단백질을 재구성하기 위해 사용될 수 있다.
환원 반응의 종료 시, 접합체에 미반응 알데히드 기가 남아 있을 수 있으며, 이들은 적절한 캡핑제를 사용하여 캡핑될 수 있다. 일 구현예에서 이 캡핑제는 나트륨 보로하이드라이드(NaBH4)이다.
다른 구현예에서, 접합체는 WO 2014/027302에 기재된 바와 같이 eTEC 접합을 사용하여 제조된다. 상기 당접합체는 하나 이상의 eTEC 스페이서를 통해 담체 단백질에 공유 접합된 당류를 포함하고, 여기서 당류는 카바메이트 연결을 통해 eTEC 스페이서에 공유 접합되고, 담체 단백질은 아미드 연결을 통해 eTEC 스페이서에 공유 접합된다. 본 발명의 eTEC 연결된 당접합체는 일반식 I로 표시될 수 있다:
[일반식 I]
여기서 eTEC 스페이서를 포함하는 원자는 중심 상자에 포함된다.
eTEC 스페이서는 7개의 선형 원자(즉, -C(O)NH(CH2)2SCH2C(O)-)를 포함하고 당류와 담체 단백질 사이에 안정한 티오에테르 및 아미드 결합을 제공한다. eTEC 연결된 당접합체의 합성은 당류의 활성화된 하이드록실 기와 티오알킬아민 시약, 예를 들어 시스타민 또는 시스테인아민 또는 이의 염의 아미노 기의 반응을 수반하여, 당류에 대한 카바메이트 연결을 형성하여 티올화된 당류를 제공한다. 하나 이상의 유리 설프하이드릴 기의 생성은 환원제와의 반응에 의해 달성되어 활성화된 티올화 당류를 제공한다. 아민 함유 잔기 상에 하나 이상의 α-할로아세트아미드 기를 갖는 활성화된 담체 단백질과 활성화된 티올화 당류의 유리 설프하이드릴 기와의 반응은 티오에테르 결합을 생성하여 접합체를 형성하며, 여기서 담체 단백질은 아미드 결합을 통해 eTEC 스페이서에 부착된다.
본원에 기재된 접합체는 단백질의 정제를 위해 당업계에 공지된 임의의 방법, 예를 들어 크로마토그래피(예를 들어, 이온 교환, 음이온 교환, 친화성 및 사이징 컬럼 크로마토그래피), 원심분리, 차등 용해도, 또는 단백질 정제를 위한 임의의 기타 표준 기술에 의해 정제할 수 있다. 예를 들어, 문헌[Saraswat et al., 2013, Biomed. Res. Int. ID#312709 (p. 1-18)] 참조; 또한, WO 2009/104074에 기재된 방법 참조. 특정 접합체를 정제하는 데 사용되는 실제 조건은 부분적으로 합성 전략(예를 들어, 합성 생산 대 재조합 생산) 및 생체접합체의 순 전하, 소수성 및/또는 친수성과 같은 요인에 따라 달라질 것이며, 당업자에게 명백할 것이다.
숙주 세포
대장균 O 항원 및 이러한 대장균 O 항원을 포함하는 생체접합체를 생산할 수 있는 숙주 세포, 예를 들어 원핵 숙주 세포가 본원에 기재되어 있다. 본원에 기재된 숙주 세포는 바람직하게는 대장균 O 항원 다당류 및/또는 이의 생체접합체를 생산하는 데 사용되는 숙주 세포 기구(예를 들어, 글리코실트랜스퍼라제)를 암호화하는 하나 이상의 핵산을 포함하도록 (예를 들어, 유전 공학을 통해) 변형된다.
고세균, 원핵 숙주 세포 및 진핵 숙주 세포를 포함하는 당업자에게 공지된 임의의 숙주 세포를 사용하여 본원에 기재된 대장균 O 항원 다당류(예를 들어, 대장균 O75 다당류) 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 생체접합체(예를 들어, 대장균 O75 항원 다당류의 생체접합체)를 생산할 수 있다. 바람직한 구현예에서, 숙주 세포는 원핵 숙주 세포이다. 본원에 기재된 대장균 O 항원 다당류 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 생체접합체의 생산에 사용하기 위한 예시적인 원핵 숙주 세포는 비제한적으로, 에스케리키아 종, 쉬겔라(Shigella) 종, 클레브시엘라(Klebsiella) 종, 잔토모나스(Xhantomonas) 종, 살모넬라(Salmonella) 종, 예르시니아(Yersinia) 종, 락토코커스(Lactococcus) 종, 락토바실러스(Lactobacillus) 종, 슈도모나스(Pseudomonas) 종, 코리네박테리움(Corynebacterium) 종, 스트렙토마이세스(Streptomyces) 종, 스트렙토코커스(Streptococcus) 종, 스타필로코커스(Staphylococcus) 종, 바실러스(Bacillus) 종 및 클로스트리듐(Clostridium) 종을 포함한다.
특정 구현예에서, 본원에 기재된 대장균 O 항원 다당류 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 생체접합체를 생산하는 데 사용되는 숙주 세포는 원핵 숙주 세포이고, 바람직하게는 대장균이다.
특정 구현예에서, 본원에 기재된 대장균 O 항원 다당류 및 생체접합체를 생산하는 데 사용되는 숙주 세포는 이종 핵산, 예를 들어 원하는 O 항원 혈청형의 rfb 유전자 클러스터를 포함하는 이종 핵산, 하나 이상의 담체 단백질 및/또는 글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하도록 조작된다. 특정 구현예에서, 이종 rfb 유전자 및/또는 글리코실화 경로(예를 들어, 원핵생물 및/또는 진핵생물 글리코실화 경로)에 관여하는 단백질을 암호화하는 이종 핵산은 본원에 기재된 숙주 세포 내로 도입될 수 있다. 이러한 핵산은 올리고사카릴 트랜스퍼라제 및/또는 글리코실트랜스퍼라제를 포함하지만 이에 한정되지 않는 단백질을 암호화할 수 있다.
예를 들어 대장균 O 항원 다당류 및 이의 생체접합체를 제조하는데 사용될 수 있는 재조합 숙주 세포를 만드는 데 유용한 글리코실트랜스퍼라제를 암호화하는 다양한 유전자 및 유전자 클러스터의 서열이 본원에 기재되어 있다. 당업자는 유전자 코드의 축퇴성으로 인해 특정 아미노산 서열을 갖는 단백질이 다수의 상이한 핵산에 의해 암호화될 수 있음을 인식할 것이다. 따라서, 당업자는 핵산에 의해 암호화되는 단백질의 아미노산 서열에 영향을 미치지 않으면서, 본원에서 제공되는 핵산의 서열이 본원에서 제공되는 서열과 상이한 방식으로 변경될 수 있음을 이해할 것이다.
대장균 O75 항원 다당류, O1A 항원 다당류, O2 항원 다당류, 글루코실화 또는 비글루코실화 O4 항원 다당류, O6A 항원 다당류, O8 항원 다당류, O15 항원 다당류, O16 항원 다당류, O18A 항원 다당류, 또는 O25B 항원 다당류의 생체접합체를 생산하기 위한 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 기재되어 있다. 본원에 기재된 숙주 세포는 대장균 O 항원 다당류를 생산할 수 있는 효소(예를 들어, 글리코실트랜스퍼라제)를 암호화하는 핵산을 포함한다. 본원에 기재된 숙주 세포는 관심 O 항원을 생성할 수 있는 핵산을 자연적으로 발현할 수 있거나, 숙주 세포는 이러한 핵산을 발현하도록 제조될 수 있다. 특정 구현예에서 핵산은 숙주 세포에 대해 이종이며 당업계에 공지된 유전적 접근법을 사용하여 숙주 세포에 도입된다. 예를 들어, 핵산은 유전자 조작에 의해 숙주 세포로 도입될 수 있다(예를 들어, 유전자 클러스터는 플라스미드 또는 플라스미드들에서 발현되거나 숙주 세포 게놈으로 통합된다(예를 들어, WO 2014/037585, WO 2014/057109, WO 2015/052344 참조).
또한, 담체 단백질에 공유 결합된 대장균 O1A, O2, 글루코실화 또는 비글루코실화 O4, O6A, O8, O15, O16, O18A, O25B, 또는 O75 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 기재되어 있다. 이러한 숙주 세포(예를 들어, 재조합 숙주 세포)는 O 항원 다당류에 특이적인 rfb 유전자 클러스터의 뉴클레오티드 서열을 포함한다. rfb 유전자 클러스터는 야생형 대장균 균주로부터 분리될 수 있고, 하나의 숙주 세포 내에서 올리고사카릴 트랜스퍼라제(예를 들어, PglB) 및 담체 단백질(예를 들어, EPA)을 암호화하는 핵산과 조합되어 관심 대장균 O 항원 또는 이의 생체접합체를 생산하는 재조합 숙주 세포를 얻을 수 있다. 예를 들어, 이러한 숙주 세포는 WO 2015/124769, WO 2014/037585, WO 2009/104074 및 WO 2009/089396에 기재된 것과 같은 생체접합 기술을 이용한 rfb 유전자 클러스터, 올리고사카릴 트랜스퍼라제(예를 들어, PglB) 및 담체 단백질(예를 들어, EPA)을 포함하는 하나 이상의 플라스미드를 포함하는 재조합 접근법을 사용하여 조작될 수 있다. 바람직하게는 숙주 세포는 이들의 게놈에 통합된 rfb 유전자 클러스터를 포함한다. 올리고사카릴 트랜스퍼라제, 담체 단백질 및 적용 가능한 경우 gtrS 유전자를 암호화하는 핵산은 특정 구현예에서 또한 숙주 세포의 게놈으로 통합된다. 이종 또는 상동 gtrA 및 gtrB 유전자는 특정 구현예에서 또한 숙주 세포의 게놈으로 통합된다.
O1A, O2, O6A 및 O25B 항원에 대한 생체접합체의 제조는 WO 2015/124769 및 WO 2017/035181에 상세히 기재되어 있다. 각각의 대장균 O 항원(rfb 유전자좌)에 대한 예시적인 유전자 클러스터는 문헌[Iguchi A, et al, DNA Research, 2014, 1-7] 및 문헌[DebRoy C, et al, PLoS One. 2016, 11(1):e0147434; correction in: Plos One. 2016, 11(4):e0154551)]에 기재되어 있다. rfb 클러스터에 대한 핵산 서열 및 그 안에 암호화된 단백질에 대한 아미노산 서열은 또한 GenBank와 같은 공개 데이터베이스에서 찾을 수 있다. 본원에 개시된 혈청형의 다당류 항원과의 생체접합체용 생산 균주에 사용될 수 있는 rfb 클러스터의 예시적인 서열은 또한 서열번호 9 및 11 내지 19에 제공된다. 따라서, 상기 언급된 각각의 원하는 생체접합체에 대해, 각각의 rfb 클러스터를 숙주 세포에 도입하여 원하는 O 항원에 대한 특정 rfb 클러스터를 가질 뿐만 아니라 올리고사카릴 트랜스퍼라제 및 담체 단백질을 암호화하는 핵산을 함유하는 숙주 세포를 얻을 수 있다. 전술한 이유로, 바람직하게는 숙주 세포는 재조합 숙주 세포이고, 바람직하게는 상대적으로 잘 알려진 특징을 갖는 균주, 예를 들어 대장균 실험실 또는 생산 균주, 예를 들어 대장균 K12 또는 대장균 BL21 등으로부터 유래된다. 바람직하게는, rfb 클러스터는 숙주 세포에 대해 이종성이며, 예를 들어 숙주 세포의 전구체 세포로 도입되고, 바람직하게는 이의 게놈으로 통합된다. 바람직하게는 원래의 rfb 유전자 클러스터가 전구체 세포에 존재하는 경우, 이는 숙주 세포에서 관심 O 항원에 대한 rfb 유전자 클러스터로 대체되어 관심 O 항원의 생체접합체의 생산을 가능하게 하였다. 바람직하게는 올리고사카릴 트랜스퍼라제는 숙주 세포에 대해 이종성이며, 특정 구현예에서 이러한 올리고사카릴 트랜스퍼라제를 암호화하는 핵산은 숙주 세포의 게놈에 통합된다.
본원에 기재된 임의의 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포)는 단백질의 N-글리코실화에서 활성인 추가 효소를 암호화하는 핵산을 포함하며, 예를 들어 본원에 기재된 숙주 세포는 올리고사카릴 트랜스퍼라제를 암호화하는 핵산 또는 다른 글리코실트랜스퍼라제를 암호화하는 핵산을 추가로 포함할 수 있다.
본원에 기재된 숙주 세포는 전형적으로 올리고사카릴 트랜스퍼라제를 암호화하는 핵산을 포함한다. 이러한 올리고사카릴 트랜스퍼라제는 N-글리코실화 공통 모티프를 포함하는 초기 폴리펩티드 사슬의 아스파라긴 잔기로 지질 연결된 올리고당을 전달한다. 올리고사카릴 트랜스퍼라제를 암호화하는 핵산은 숙주 세포 고유의 것일 수 있거나 유전적 접근법을 사용하여 숙주 세포에 도입될 수 있다. 바람직한 구현예에서, 올리고사카릴 트랜스퍼라제는 숙주 세포에 대해 이종이다. 대장균은 자연적으로 올리고사카릴 트랜스퍼라제를 포함하지 않으므로, 대장균이 생체접합체 생산을 위한 숙주 세포로 사용되는 경우, 이종 올리고사카릴 트랜스퍼라제가 예를 들어, 유전자 조작에 의해 도입 시, 이러한 숙주 세포에 포함된다. 올리고사카릴 트랜스퍼라제는 본 개시내용을 고려하여 당업계에 공지된 임의의 공급원으로부터 유래할 수 있다.
특정 구현예에서, O-글리코실트랜스퍼라제와 같은 N-글리코실트랜스퍼라제 활성을 갖는 올리고사카릴 트랜스퍼라제에 대한 대안, 예를 들어 비제한적 예로서 PglL은 예를 들어 WO 2016/82597 및 WO 2020/120569에 기재된 바와 같이 담체 단백질에서 자체의 상이한 글리코실화 공통 서열과 함께 사용될 수 있다. 따라서, O-글리코실트랜스퍼라제와 같은 다른 글리코실트랜스퍼라제도 본 발명에 따른 올리고사카릴 트랜스퍼라제로서 사용될 수 있다.
특정 바람직한 구현예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터로부터의 올리고사카릴 트랜스퍼라제이다. 예를 들어, 일 구현예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터 제주니로부터의 올리고사카릴 트랜스퍼라제(즉, pglB)이다(예를 들어, 문헌[Wacker et al., 2002, Science 298:1790-1793] 참조; 또한, 예를 들어, NCBI Gene ID: 3231775, UniProt Accession No. O86154 참조). 또 다른 구현예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터 라리(Campylobacter lari)로부터의 올리고사카릴 트랜스퍼라제이다(예를 들어, NCBI Gene ID: 7410986 참조).
특정 구현예에서, 올리고사카릴 트랜스퍼라제는 천연(야생형) 단백질 또는 이의 임의의 변이체, 예컨대 WO 2016/107818 및 WO 2016/107819에 기재된 것을 포함하는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제이다. PglB는 공통 서열인 서열번호 1 및 서열번호 2의 아스파라긴 잔기로 지질 연결된 올리고당을 전달할 수 있다. 특정 구현예에서, PglB 올리고사카릴 트랜스퍼라제는 서열번호 6 또는 이의 변이체를 포함한다. 특정 구현예에서, 야생형 PglB에서 하나 이상의 내인성 글리코실화 공통 서열은 돌연변이되어 PglB 자가글리코실화를 회피하였다. 예를 들어, 돌연변이 N534Q를 포함하는 서열번호 6. 본원에서 제공되는 재조합 숙주 세포에 사용하기에 적합한 변이체 PglB 올리고사카릴 트랜스퍼라제의 예는 N311V, K482R, D483H, A669V, Y77H, S80R, Q287P 및 K289R로 구성된 군으로부터 선택된 적어도 하나의 돌연변이를 포함하는 서열번호 6의 PglB 올리고사카릴 트랜스퍼라제를 포함한다. 일 특정 구현예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 N311V를 포함하는 서열번호 6을 갖는다. 또 다른 특정 구현예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H 및 N311V를 포함하는 서열번호 6을 갖는다. 또 다른 특정 구현예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 N311V, K482R, D483H 및 A669V를 포함하는 서열번호 6을 갖는다. 또 다른 특정 구현예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 포함하는 서열번호 6을 갖는다. 2020년 3월 18일에 출원된 PCT/US20/23415에서 특정 PglB 올리고사카릴 트랜스퍼라제 변이체가 특정 혈청형의 대장균 O 항원 생체접합체의 생산에서 놀라울 정도로 개선된 수율을 제공한다는 것이 밝혀지고 기재되었다. 주어진 대장균 O 항원에 대한 개선된 또는 최적의 PglB 변이체는 예측할 수 없었다. 따라서 특정 양태에서 본 발명은 또한 올리고사카릴 트랜스퍼라제로서 특정 PglB 변이체를 사용하여 특정 대장균 O 항원의 생체접합체를 생산하는 방법을 개시한다. 서열번호 6과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일하며, 여전히 올리고사카릴 트랜스퍼라제 활성을 가지며, 바람직하게는 본원에 조합하여 개시된 지시된 위치에 하나 이상의 특정 아미노산을 갖는 PglB의 추가 변이체(예를 들어, 77Y, 80S, 287Q, 289K, 311N, 482K, 483D, 669A; 또는 311V; 또는 311V, 482R, 483H, 669V; 또는 77H, 80R, 287P, 289R, 311V; 또는 77H, 311V; 등)도 생체접합체의 생산에 사용될 수 있다.
특정 구현예에서, 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열, 또는 바람직하게는 돌연변이 N311V를 포함하는 서열번호 6을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함한다.
다른 특정 구현예에서, 담체 단백질에 공유 결합된 대장균 O1A, O6A 또는 O15 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열, 또는 바람직하게는 돌연변이 N311V, K482R, D483H 및 A669V를 포함하는 서열번호 6을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함한다.
특정 구현예에서, 담체 단백질에 공유 결합된 대장균 글루코실화 O4 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열, 또는 바람직하게는 돌연변이 N311V를 포함하는 서열번호 6, 또는 더욱 바람직하게는 돌연변이 Y77H 및 N311V를 포함하는 서열번호 6을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함한다. 바람직하게는, 담체 단백질에 공유 결합된 대장균 글루코실화 O4 항원 다당류의 생체접합체 생산을 위한 재조합 숙주 세포는 서열번호 4의 아미노산 서열을 갖는 글루코실트랜스퍼라제 GtrS를 암호화하는 서열(또는 서열번호 4와 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한 이의 변이체)로서, 글루코스 첨가에 의해 대장균 O4 항원 다당류를 변형하여 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 서열, 및 각각 서열번호 7 및 8의 아미노산 서열을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 암호화하는 뉴클레오티드 서열(또는 각각 서열번호 7 및 8과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한 아미노산 서열을 갖는 이의 변이체)을 추가로 포함하고, 여기서 트랜스로카제는 박토프레놀 연결된 글루코스를 전위시킬 수 있고 글리코실트랜스퍼라제는 박토프레놀을 글루코실화할 수 있다. 담체 단백질에 공유 결합된 대장균 비글루코실화 O4 항원 다당류의 생체접합체 생산을 위해 세포는 GtrS, GtrA 및 GtrB 단백질을 암호화하는 이러한 서열을 필요로 하지 않는다. 대장균 O4 항원 다당류의 글루코실화에 특이적인 신규한 GtrS를 사용하여 담체 단백질에 공유 결합된 대장균 글루코실화 O4 항원 다당류의 생체접합체의 생산은 본원에 전체가 참조로 포함된, 2020년 3월 18일 출원된 PCT/US20/23404에 기재되어 있다.
특정 구현예에서, 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열, 또는 바람직하게는 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 포함하는 서열번호 6을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함한다.
특정 구현예에서, 담체 단백질에 공유 결합된 대장균 O8, O18A, O25B 또는 O2 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함하고, 바람직하게는 여기서 서열번호 6은 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.
일부 구현예에서, 본원에 기재된 임의의 숙주 세포는 담체 단백질, 예를 들어 숙주 세포 글리코실화 기구에 의해 생성된 O 항원 다당류(들)가 부착되어 생체접합체를 형성할 수 있는 단백질을 암호화하는 핵산을 포함한다. 숙주 세포는 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D를 포함하나 이에 한정되지 않는 본 개시를 고려하여 당업자에게 알려진 임의의 담체 단백질을 암호화하는 핵산을 포함할 수 있다.
바람직한 구현예에서, 숙주 세포는 P. 애루기노사의 탈독소화된 외독소 A(EPA)를 암호화하는 핵산을 추가로 포함한다. 바람직하게는,EPA 담체 단백질은 1 내지 10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1 내지 10개, 바람직하게는 2 내지 4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 서열번호 1의 아미노산 서열, 더욱 바람직하게는 서열번호 2의 아미노산 서열을 갖는 글리코실화 공통 서열을 포함한다. 특정 구현예에서, 숙주 세포는 서열번호 3을 포함하는 EPA-4 담체 단백질을 암호화하는 핵산을 추가로 포함한다.
특정 구현예에서, 본원에 기재된 숙주 세포에 의한 생체접합체의 생성에 사용되는 담체 단백질은 "태그", 즉 담체 단백질의 분리 및/또는 식별을 가능하게 하는 아미노산 서열을 포함한다. 예를 들어, 담체 단백질에 태그를 추가하는 것은 해당 단백질의 정제에 유용할 수 있으며, 따라서 태그가 부착된 담체 단백질을 포함하는 접합체 백신의 정제에 유용할 수 있다. 본원에서 사용될 수 있는 예시적인 태그는 히스티딘(HIS) 태그(예를 들어, 헥사-히스티딘-태그 또는 6XHis-Tag), FLAG-TAG 및 HA 태그를 제한 없이 포함한다. 특정 구현예에서, 본원에 사용된 태그는 제거 가능하며, 예를 들어 일단 태그가 더 이상 필요하지 않으면, 예를 들어 단백질이 정제된 후에 화학 작용제 또는 효소적 수단에 의해 제거할 수 있다. 다른 구현예에서, 담체 단백질은 태그를 포함하지 않는다.
특정 구현예에서, 본원에 기재된 담체 단백질은 담체 단백질을 발현하는 숙주 세포의 주변 세포질 공간으로 담체 단백질을 표적화하는 신호 서열을 포함한다. 특정 구현예에서, 신호 서열은 대장균 DsbA, 대장균 외막 포린 A(OmpA), 대장균 말토스 결합 단백질(MalE), 에르위니아 카로토보란스 펙테이트 리아제(Erwinia carotovorans pectate lyase)(PelB), FlgI, NikA, 또는 바실러스 종 엔독실라나제(XynA), 열 민감 대장균 장독소 LTIIB, 바실러스 엔독실라나제 XynA 또는 대장균 플라겔린(FlgI)으로부터 비롯된다. 일 구현예에서, 신호 서열은 서열번호 10을 포함한다. 신호 서열은 단백질이 주변 세포질로 전위된 후에 절단될 수 있고 따라서 생체접합체의 최종 담체 단백질에 더 이상 존재하지 않을 수 있다.
특정 구현예에서, 본원에 기재된 숙주 세포에 (예를 들어, 재조합 기술을 사용하여) 추가 변형이 도입될 수 있다. 예를 들어, 아마도 경쟁하거나 간섭하는 글리코실화 경로(예를 들어, 숙주 세포 내로 재조합으로 도입되는 글리코실화에 관련된 하나 이상의 이종 유전자와 경쟁하거나 이를 간섭함)의 일부를 형성하는 단백질을 암호화하는 숙주 세포 핵산(예를 들어, 유전자)은 이들을 불활성/기능 이상으로 만드는 방식으로(즉, 결실/변형되는 숙주 세포 핵산은 기능성 단백질을 암호화하지 않음) 숙주 세포 배경(게놈)에서 결실되거나 변형될 수 있다. 특정 구현예에서, 본원에 제공된 숙주 세포의 게놈으로부터 핵산이 결실될 때, 핵산은 바람직한 서열, 예를 들어 O 항원 다당류 또는 이의 생체접합체의 생산에 유용한 서열로 대체된다.
숙주 세포에서 결실될 수 있는 (일부 경우에, 다른 요망되는 핵산 서열로 대체될 수 있는) 예시적인 유전자 또는 유전자 클러스터는 waaL과 같은 당지질 생합성에 관여하는 숙주 세포의 유전자 또는 유전자 클러스터(예를 들어, 문헌 [Feldman et al., 2005, PNAS USA 102:3016-3021] 참조), 지질 A 코어 생합성 클러스터(waa), 갈락토스 클러스터(gal), 아라비노스 클러스터(ara), 콜론산 클러스터(wc), 협막 다당류 클러스터, 운데카프레놀-p 생합성 유전자(예를 들어, uppS, uppP), und-P 재순환 유전자, 뉴클레오티드 활성화된 당 생합성에 관여하는 대사 효소, 장내 세균 공통 항원 클러스터(eca) 및 프로파지 O 항원 변형 클러스터, 예를 들어, gtrABS 클러스터 또는 이의 영역을 포함한다. 특정 구현예에서, 본원에 기재된 숙주 세포는 원하는 O 항원 다당류, 예를 들어 글루코실화 O4 항원 다당류 이외의 임의의 O 항원 다당류를 생산하지 않도록 변형된다.
특정 구현예에서, waaL 유전자는 본원에 제공된 숙주 세포(예를 들어, 재조합 숙주 세포)의 게놈으로부터 결실되거나 기능적으로 불활성화된다. 용어 "waaL" 및 "waaL 유전자"는 주변 세포질에 위치한 활성 부위를 갖는 막 결합 효소를 암호화하는 O 항원 리가제 유전자를 지칭한다. 암호화된 효소는 운데카프레닐포스페이트(UPP)에 결합된 O 항원을 지질 A 코어로 전달하여 지질다당류를 형성한다. 내인성 waaL 유전자의 결실 또는 파괴(예를 들어, ΔwaaL 균주)는 O 항원의 지질 A로의 전달을 방해하고, 대신 O 항원의 다른 생체분자, 예컨대 담체 단백질로의 전달을 증진시킬 수 있다.
또 다른 특정 구현예에서, waaL 유전자, gtrA 유전자, gtrB 유전자, gtrS 유전자 및 rfb 유전자 클러스터 중 하나 이상이 본원에 제공된 원핵 숙주 세포의 원래 게놈으로부터 결실되거나 기능적으로 불활성화된다.
일 구현예에서, 본원에서 사용되는 숙주 세포는 글루코실화된 O4 항원 다당류의 생체접합체를 생산하는 대장균이고, 여기서 waaL 유전자는 숙주 세포의 게놈으로부터 결실되거나 기능적으로 불활성화되고, 대장균 O4 항원 다당류에 특이적인 gtrS 유전자가 삽입된다. 글루코실화된 O4 O 항원의 생체접합체를 위한 생산 균주에 대한 특정 구현예에서, 서열번호 4에 대해 적어도 80%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 암호화하는 gtrS 유전자가 모 균주의 gtrS 유전자를 O4 항원의 글루코실화를 담당하는 유전자로 대체하도록 해당 모 균주의 gtrS 유전자 대신에 삽입된다. 이러한 모 균주의 예는 대장균 K-12 균주 W3110이다. gtrA 및 gtrB 유전자는 모 균주에 대해 상동성일 수 있거나, 대안적으로 이들 유전자 중 하나 또는 둘 모두는 모 균주에 대해 이종성일 수 있다. 전형적으로 gtrS 유전자와 달리, 이러한 gtrA 및 gtrB 유전자는 O 항원 구조에 특이적이지 않다.
또한, 재조합 숙주 세포를 제조하는 방법이 본원에 기재되어 있다. 본원에 기재된 방법에 의해 생산된 재조합 숙주 세포는 대장균 O 항원의 생체접합체를 생산하는 데 사용될 수 있다. 방법은 하나 이상의 재조합 핵산 분자를 세포 내로 도입하여 재조합 숙주 세포를 생산하는 단계를 포함한다. 전형적으로, 재조합 핵산 분자는 이종성이다. 본 개시내용을 고려하여 당업계에 공지된 임의의 방법을 사용하여 재조합 핵산 분자를 숙주 세포에 도입할 수 있다. 재조합 핵산은 당업자에게 공지된 임의의 방법, 예를 들어 전기천공, 화학적 형질전환, 열 충격, 자연 형질전환, 파지 형질도입 및 접합을 사용하여 본원에 기재된 숙주 세포 내로 도입될 수 있다. 특정 구현예에서, 재조합 핵산은 플라스미드를 사용하여 본원에 기재된 숙주 세포에 도입된다. 예를 들어, 이종 핵산은 플라스미드(예를 들어, 발현 벡터)에 의해 숙주 세포에서 발현될 수 있다. 또 다른 특정 구현예에서, 이종 핵산은 예를 들어 WO 2014/037585, WO 2014/057109, 또는 WO 2015/052344에 기재된 바와 같은 게놈으로의 삽입 방법을 사용하여 본원에 기재된 숙주 세포로 도입된다.
도구 및 모델 유기체로서 분자 생물학에서 일상적으로 사용되는 대장균 균주는 예를 들어 특정 구현예에서 숙주 세포에 대한 부모로서 사용될 수 있다. 비제한적 예는 대장균 K12 균주(예를 들어, W1485, W2637, W3110, MG1655, DH1, DH5α, DH10 등), B 균주(예를 들어, BL-21, REL606 등), C 균주, 또는 W 균주를 포함한다. 일 특정 구현예에서, 숙주 계통은 모 계통 W3110으로부터 유래된다. 이 균주는 예를 들어 예일의 E. coli Genetic Stock Center에서 얻을 수 있다. 대장균에 대한 자세한 내용은 예를 들어, Ecoliwiki.net 참조.
일부 구현예에서, 본원에 기재된 숙주 세포는 담체 단백질에 공유 결합된 대장균 O 항원 다당류를 포함하는 생체접합체를 생산하는 데 사용될 수 있다. 숙주 세포를 사용하여 이러한 생체접합체를 생산하는 방법은 당업계에 공지되어 있다. 예를 들어, WO 2003/074687 및 WO 2006/119987 참조. 이러한 방법은 생체접합체의 생산을 위한 조건 하에서 본원에 기재된 임의의 재조합 숙주 세포를 배양하는 단계를 포함한다. 생체접합체는 본 개시내용을 고려하여 당업계에 공지된 임의의 방법을 사용하여 재조합 숙주 세포로부터 단리, 분리 및/또는 정제될 수 있다. 예를 들어, 생체접합체는 단백질의 정제를 위해 당업계에 공지된 임의의 방법, 예를 들어 크로마토그래피(예를 들어, 이온 교환, 음이온 교환, 친화성 및 사이징 컬럼 크로마토그래피), 원심분리, 차등 용해도, 또는 단백질 정제를 위한 임의의 기타 표준 기술에 의해 정제할 수 있다. 예를 들어, WO 2009/104074에 기재된 방법 참조. 또한, 생체접합체는 정제를 용이하게 하기 위해 이종 폴리펩티드 서열에 융합될 수 있다. 특정 생체접합체를 정제하는 데 사용되는 실제 조건은 부분적으로 생체접합체의 순 전하, 소수성 및/또는 친수성과 같은 요인에 따라 달라질 것이며, 당업자에게 명백할 것이다. O1A, O2, O6A 및 O25B에 대한 생체접합체 및 이들을 포함하는 백신 조성물의 제조는 예를 들어 WO 2015/124769 및 WO 2017/035181에 기재되어 있다.
또한, 본원에 기재된 방법, 즉 본원에 기재된 재조합 숙주 세포를 사용하여 생산된 생체접합체가 제공된다.
일부 구현예에서, 담체 단백질에 공유 결합된 대장균 O 항원 다당류의 생체접합체를 제조하는 방법은 다음을 포함한다: (i) (a) O 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열; (b) 서열번호 1, 바람직하게는 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하고, 더욱 바람직하게는 각각 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 4개의 글리코실화 부위를 포함하는 담체 단백질, 바람직하게는 EPA를 암호화하는 뉴클레오티드 서열; 및 (c) 올리고사카릴 트랜스퍼라제, 예를 들어 PglB 올리고사카릴 트랜스퍼라제 또는 이의 변이체를 암호화하는 뉴클레오티드 서열을 제공하는 단계.
특정 구현예에서, 대장균 O 항원 다당류는 특정 다당류 대 단백질 중량비(w/w)로 담체 단백질에 공유 결합된다. 담체 단백질에 공유 결합된 중량 기준의 O 항원 다당류의 양의 비율은 "글리칸/단백질 비율" 또는 "다당류/단백질 비율" 또는 "PS/단백질 비율"로 지칭된다. 일부 구현예에서, O 항원 다당류는 약 1:20 내지 20:1, 바람직하게는 1:10 내지 10:1, 더욱 바람직하게는 1:3 내지 3:1의 다당류 대 단백질(w/w) 비로 담체 단백질에 공유 결합된다. 본원에 기재된 생체접합체에 대한 특정 비제한적 구현예에서, 글리칸/단백질 비율은 약 0.1 내지 0.5, 예컨대 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45 또는 0.5이다. 이러한 구현예에서, O 항원 다당류:단백질의 중량비는 특정 O 항원 혈청형에 따라 약 1:10 내지 1:2, 예컨대 1:10: 1:9: 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 또는 1:2이다. 특정 구현예에서 글리칸/단백질 비율은 약 0.15 내지 약 0.45이다. 일반적으로, O 항원 다당류 대 담체 단백질의 더 높은 글리칸/단백질 비율이 바람직한데, 많은 양의 담체 단백질이 일부 경우에 면역학적 간섭을 유발할 수 있기 때문이다. 또한, 더 높은 글리칸/단백질 비율은 생체접합체 형태로 투여된 충분한 O 항원 다당류를 얻는 데 도움이 될 것이며, 담체 단백질의 양은 상대적으로 낮게 유지되며, 이는 다중 혈청형이 조성물, 예를 들어, 적어도 4개의 상이한 O 항원, 적어도 5개의 상이한 O 항원, 적어도 6개의 상이한 O 항원, 적어도 7개의 상이한 O 항원, 적어도 8개의 상이한 O 항원, 적어도 9개의 상이한 O 항원, 적어도 10개의 상이한 O 항원 등으로부터의 생체접합체를 포함하는 조성물에 의해 커버되어야 하는 다가 조성물에 특히 유리하다.
본 발명에 따른 접합체의 글리칸/단백질 비율은 단백질 양 및 글리칸 양을 결정함으로써 결정될 수 있다. 단백질 양은 280 nm에서의 UV 흡광도(A280)를 측정하여 결정할 수 있다. 글리칸 양은 (예를 들어, 표 1의 O8에 대한 Man, 및 표 1의 다른 글리칸에 대한 GlcNAc의) 반복 단위에서 당의 펄스 전류계 검출(IC-PAD)과 이온 크로마토그래피를 기반으로 결정될 수 있으며, 그 후 반복 단위의 구조 정보는 총 글리칸 양을 계산하는 데 사용될 수 있다(예를 들어, O1A의 반복 단위는 845 Da의 몰 질량을 가지며, 이러한 반복 단위 1몰은 1몰의 GlcNAc를 함유하며, 이는 GlcNAc의 양이 IC-PAD에 의해 결정될 때 총 글리칸 양의 계산을 가능하게 한다).
일부 구현예에서, 본원에 기재된 바와 같은 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체는 L-Rh 당의 위치 2에서 특정 정도의 아세틸화를 갖는다. (생체)접합체에서 O25B 항원 다당류의 O-아세틸화 정도는 바람직하게는 적어도 30%, 바람직하게는 적어도 50%, 예컨대 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%이다.
유사하게, (생체)접합체에서 대장균 O16 항원 다당류의 O-아세틸화 정도는 바람직하게는 적어도 30%, 바람직하게는 적어도 50%, 예컨대 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%이다.
특정 구현예에서, O 항원 다당류의 생체접합체를 제조하는 방법은 생산되는 O 항원 다당류 생체접합체에 따라 특정 올리고사카릴 트랜스퍼라제 효소, 특히 PglB 올리고사카릴 트랜스퍼라제 또는 이의 변이체를 암호화하는 핵산 서열을 포함하는 재조합 숙주 세포를 제공하는 단계를 포함한다. 특정 올리고사카릴 트랜스퍼라제 효소 변이체는 숙주 세포에 의해 생산된 생체접합체의 수율에 영향을 미칠 수 있다. 전형적으로, 수율이 특정 생체접합체를 생산하는 비용에 영향을 미치기 때문에 더 높은 수율이 바람직하며, 이는 여러 상이한 생체접합체를 포함하는 다가 조성물에 특히 중요하다.
일 특정 구현예에서, O 항원이 O75 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 N311V의 아미노산 돌연변이를 포함하고, 여기서 아미노산 돌연변이는 서열번호 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.
또 다른 특정 구현예에서, O 항원이 O1A, O6A, 또는 O15 항원 다당류일 때, PglB 올리고사카릴 트랜스퍼라제는 N311V, K482R, D483H, 및 A669V의 아미노산 돌연변이를 포함하고, 여기서 아미노산 돌연변이는 서열번호 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.
또 다른 특정 구현예에서, O 항원이 글루코실화된 O4 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 아미노산 돌연변이 N311V, 또는 Y77H 및 N311V의 아미노산 돌연변이를 포함하고, 여기서 아미노산 돌연변이는 서열번호 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.
또 다른 특정 구현예에서, O 항원이 O16 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하고, 여기서 아미노산 돌연변이는 서열번호 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.
또 다른 특정 구현예에서, O 항원이 O8, O18A, O25B, 또는 O2 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 서열번호 6의 아미노산 서열을 포함하고, 여기서 서열번호 6은 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다. 이의 특정 구현예에서, PglB 올리고사카릴 트랜스퍼라제는 서열번호 6의 아미노산 서열을 포함한다.
일부 구현예에서, 상기 지시된 O 항원/PglB 올리고사카릴 트랜스퍼라제 쌍당 올리고사카릴 트랜스퍼라제 효소를 암호화하는 재조합 숙주 세포에 의해 생산된 O 항원 다당류의 생체접합체는 바람직하게는 본원에 기재된 하나 이상의 바람직한 속성, 예를 들어 글리칸/단백질 비율 및/또는 다중-글리코실화된 담체 단백질의 백분율을 갖는다.
조성물 및 조합물
대장균 O75 및 O6 항원 다당류(여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다)를 포함하고, 선택적으로 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 전부(여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다)를 추가로 포함하는 조성물 및 조합물이 본원에 제공된다. O 항원 다당류 또는 접합체, 예를 들어 생체접합체의 조합물은 다수의 조성물을 포함할 수 있지만, O 항원 다당류 또는 접합체, 예를 들어 생체접합체의 조합물이 동일한 조성물에 존재하는 경우 이것이 바람직하다.
본원에 기재된 조성물 및 조합물은 대장균에 의한 대상체(예를 들어, 인간 대상체)의 감염의 치료 및 예방, 바람직하게는 침습성 ExPEC 질환의 예방에 유용하다. 일부 구현예에서, 조성물은 면역원성 조성물이다. 본원에서 사용되는 "면역원성 조성물"은 조성물이 투여되는 숙주 또는 대상체에서 면역 반응을 유도할 수 있는 조성물을 의미한다. 조성물 및 면역원성 조성물은 제약상 허용가능한 담체를 추가로 포함할 수 있다. 본원에서 사용되는 바와 같이, “제약상 허용가능한”이라는 용어는 동물에서의, 더 구체적으로 인간에서의 사용용으로 미국 약전 또는 다른 일반적 공인 약전에 열거되거나 미국 연방 정부 또는 주 정부의 규제 기관에 의해 승인된 것을 의미한다. 제약상 허용가능한 담체의 맥락에서 본원에서 사용되는 바와 같은 “담체”라는 용어는 희석제, 아쥬반트(adjuvant), 부형제, 또는 비히클(이와 함께 제약 조성물이 투여됨)을 지칭한다. 식염수 용액 및 수성 덱스트로스 및 글리세롤 용액도, 특히 주사제 용액을 위한 액체 담체로서 이용될 수 있다. 적합한 부형제에는 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 쌀, 밀가루, 석회분말, 실리카 겔, 나트륨 스테아레이트, 글리세롤 모노스테아레이트, 활석, 나트륨 클로라이드, 건조 탈지유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등이 포함된다. 적합한 제약 담체의 예는 문헌[“Remington's Pharmaceutical Sciences” by E.W. Martin]에 기재되어 있다.
일 구현예에서, 본 발명의 조성물은 Tris-완충 식염수(TBS) pH 7.4(예를 들어 각각 25 mM, 137 mM 및 2.7 mM의 Tris, NaCl 및 KCl을 함유함)에 본원에 기재된 바와 같은 (생체)접합체를 포함한다. 다른 구현예에서, 본 발명의 조성물은 약 7.0 pH의 약 10 mM KH2PO4/Na2HPO4 완충액, 약 5% (w/v) 소르비톨, 약 10 mM 메티오닌 및 약 0.02% (w/v) 폴리소르베이트 80에 본원에 기재된 바와 같은 생체접합체를 포함한다. 다른 구현예에서, 본 발명의 조성물은 약 7.0 pH의 약 10 mM KH2PO4/Na2HPO4 완충액, 약 8% (w/v) 수크로스, 약 1 mM EDTA, 및 약 0.02% (w/v) 폴리소르베이트 80(예를 들어, EPA 담체 단백질에 공유 결합된 대장균 O 항원의 생체접합체에 적합한 완충액에 대해서는 WO 2018/077853 참조)에 본원에 기재된 바와 같은 생체접합체를 포함한다. 다른 구현예에서, 본 발명의 조성물은 약 5 mM 숙시네이트/0.9% NaCl, pH 6.0에 본원에 기재된 바와 같은 (생체)접합체를 포함한다.
다가 조성물, 예를 들어 2가, 3가, 4가 등의 조성물인 조성물(예를 들어, 제약 및/또는 면역원성 조성물)이 본원에 제공된다. 예를 들어, 다가 조성물은 대장균 O 항원, 당접합체, 또는 이의 생체접합체와 같은 하나 초과의 항원을 포함한다. 특정 구현예에서, 본원에 제공된 다가 조성물은 대장균 O75 항원 다당류의 생체접합체 및 대장균 O6A 항원 다당류의 생체접합체를 포함한다. 일부 구현예에서, 본원에 제공된 다가 조성물은 적어도 하나의 추가 항원 또는 생체접합체를 포함한다.
전형적으로 본 발명의 조성물은 먼저 이들 O 항원 다당류를 담체 단백질에 독립적으로 공유 결합함으로써, 예를 들어, 화학적 접합 또는 생체접합에 의해, 본원에 기재된 각각의 대장균 O 항원 다당류에 대한 개별 당접합체를 수득하고, 후속적으로 본 발명에 따른 조성물을 얻기 위해 본원에 기재된 양 및 비율로 개별 당접합체를 혼합함으로써 제조될 수 있다.
일 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 본원에 기재된 바와 같은 담체 단백질에 공유 결합된 대장균 O75 항원 다당류 및 적어도 하나의 추가 항원을 포함하는 다가 조성물이다.
일부 구현예에서, 추가 항원은 항원 당류 또는 다당류, 더욱 바람직하게는 대장균 O 항원 다당류, 예를 들어 O1, O2, O4, O6, O8, O15, O16, O18 및 O25 혈청형 및 이의 하위 혈청형 중 하나 이상의 대장균 O 항원이고, 바람직하게는 각각 개별적으로 담체 단백질에 접합된 것이고, 여기서 각 혈청형에 대한 담체 단백질은 동일하거나, 또는 일부 또는 모든 혈청형 간에 상이할 수 있다. 바람직하게는, 대장균 O75 다당류의 (생체)접합체를 포함하는 다가 조성물은 각각의 O1, O2, O4, O6, O15, O16, O18 및 O25 혈청형 또는 이의 하위 혈청형의 대장균 O 항원을 추가로 포함한다. 일부 구현예에서, 각각의 추가 대장균 O 항원 다당류는 당접합체이며, 이는 대장균 O 항원 다당류가 또 다른 화학종, 예를 들어 단백질, 펩티드, 지질 등, 가장 바람직하게는 화학적 또는 효소적 방법과 같은 담체 단백질에 공유 결합됨을 의미한다. 바람직한 구현예에서, 각각의 추가 대장균 O 항원 다당류는 O 항원 다당류가 숙주 세포 기구에 의해 효소적으로 글리코시드 결합을 통해, 예를 들어, 담체 단백질에 공유 결합된 생체접합체이다. 특정 구현예에서, 다가 조성물은 O8 혈청형의 대장균 O 항원을, 바람직하게는 당접합체, 바람직하게는 생체접합체 형태로 추가로 포함한다. 특정 구현예에서 본원에 제공된 조성물은 1 내지 20개의 추가 당접합체, 더욱 바람직하게는 대장균 O 항원 다당류의 생체접합체, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 당접합체 또는 바람직하게는 대장균 O 항원 다당류의 생체접합체를 포함할 수 있다. 펩티드, 단백질 또는 지질 항원 등과 같은 다른 항원이 본원에 제공된 조성물에 포함될 수 있다.
일부 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 대장균 O75 항원 다당류의 (생체)접합체 및 대장균 O6 항원 다당류의 (생체)접합체, 및 대장균 O1 항원 다당류, 대장균 O2 항원 다당류, 대장균 글루코실화 O4 항원 다당류, 대장균 O8 항원 다당류, 대장균 O15 항원 다당류, 대장균 O16 항원 다당류, 대장균 O18 항원 다당류 및 대장균 O25 항원 다당류로 구성된 군으로부터 선택된 적어도 하나의 추가 항원 다당류, 바람직하게는 적어도 대장균 O1 항원 다당류, 대장균 O2 항원 다당류 및 대장균 O25 항원 다당류, 더욱 바람직하게는 적어도 대장균 O1 항원 다당류, 대장균 O2 항원 다당류, 대장균 O25 항원 다당류, 대장균 O4 항원 다당류, 대장균 O15 항원 다당류, 대장균 O16 항원 다당류 및 대장균 O18 항원 다당류를 포함한다. 바람직하게는 O1 항원 다당류는 O1A 항원 다당류이고, O6 항원 다당류는 O6A 항원 다당류이고, O4 항원 다당류는 글루코실화된 O4 항원 다당류이고, O18 항원 다당류는 O18A 항원 다당류이고, O25 항원 다당류는 O25B 항원 다당류이다. 바람직하게는, 각각의 추가 O 항원 다당류는 담체 단백질에 공유 결합되고, 더욱 바람직하게는 생체접합체이다.
일부 구현예에서, 조성물은 대장균 O75 및 대장균 O1, O2 또는 O6 항원 다당류 중 적어도 하나, 바람직하게는 대장균 O1 또는 O6 항원 다당류 중 적어도 하나를 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O1, O2, 및/또는 O6 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1, 예를 들어 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1 또는 2.5:1이다. 바람직한 구현예에서, 조성물은 담체 단백질에 공유 결합된 대장균 O25 항원 다당류, 바람직하게는 대장균 O25B 항원 다당류를 추가로 포함하고, O25 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도비는 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1이다. 이러한 구현예에서, 바람직하게는 O25 항원 다당류 대 O75 항원 다당류의 농도비는 약 2:1 내지 약 1:1, 바람직하게는 약 1.5:1, 더욱 바람직하게는 약 1:1이다. 이의 특정 구현예에서, O25 항원 다당류 대 O2 항원 다당류의 농도비는 약 4:1 내지 약 2:1이다. 특정 구현예에서, 조성물은 대장균 O75, O1, O2, O6 및 O25 항원 다당류를 포함하고, 바람직하게는 O1, O6 및 O25 항원 다당류는 각각 O1A, O6A 및 O25B 다당류이고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 항원 다당류 O75:O1:O2:O6:O25의 농도비는 약 2:1:1:1:2이다. 특정 구현예에서, O 항원은 생체접합에 의해, 예를 들어, 담체 단백질의 Asn-잔기에 대한 N-연결을 통해, 담체 단백질에 공유 결합된다. 특정 구현예에서, 조성물 중 O75 항원 다당류의 농도는 약 8 내지 64 μg/mL, 바람직하게는 약 16 내지 32 μg/mL, 바람직하게는 약 28 내지 36 μg/mL, 예를 들어, 약 32 μg/mL이다. 특정 구현예에서, 조성물은 대장균 O4, O15, O16, O18 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O4는 글루코실화되고, O18 항원은 O18A이다. 특정 구현예에서, 조성물은 담체 단백질에 공유 결합된 대장균 O8 항원 다당류를 추가로 포함한다. 특정 구현예에서, 이들 각각이 조성물에 존재하는 한 항원 다당류 O75:O4:O15:O16:O18:O8의 농도비는 약 2:1:1:1:1:1이다. 추가 구현예에서, 조성물은 하나 이상의 추가 대장균 O 항원 다당류를 포함할 수 있으며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다.
일 구현예에서, O1 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O1 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O1A)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O1 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O1 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.
일 구현예에서, O2 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O2 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O2)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O2 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O2 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.
일 구현예에서, O4 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O4 항원 다당류는 글루코실화 O4 항원 다당류이고, 특정 구현예에서 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O4 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O4 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.
일 구현예에서, O6 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O6 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O6A)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O6 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O6 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.
일 구현예에서, O8 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O8 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O8 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O8 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.
일 구현예에서, O15 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O15 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O15)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O15 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O15 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.
일 구현예에서, O16 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O16 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O16)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O16 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O16 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.
일 구현예에서, O18 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O18 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O18A)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O18 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O18 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.
일 구현예에서, O25 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O25 항원 다당류는 O25B 항원 다당류를 포함하고, 특정 구현예에서 표 1에 제시된 바와 같은 화학식 (O25B)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O25 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O25 항원 다당류 사이의 중량비는 약 1:4 내지 1:0.5, 바람직하게는 약 1:2 내지 1:1, 더욱 바람직하게는 약 1:1, 예를 들어, 약 1:1.5, 1:1.4, 1:1.3, 1:1.2, 1:1.1, 1:1.0, 1:0.9, 1:0.8, 1:0.7, 1:0.6, 또는 1:0.5이다.
또 다른 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 적어도 담체 단백질에 접합된 대장균 O75, O1, O2, O4, O6 및 O25 항원 다당류, 바람직하게는 담체 단백질, 예를 들어, EPA 또는 CRM197에 공유 결합된 O75, O1A, O2, 글루코실화된 O4, O6A 및 O25B 항원 다당류의 생체접합체를 포함한다(즉, 적어도 6가 조성물). 일 구현예에서, 조성물에서 및/또는 대상체에게 투여되는 O75:O1:O2:O4:O6:O25 항원 다당류 사이의 중량비는 약 2:1:1:1:1:2이다.
바람직한 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 적어도 담체 단백질에 접합된 대장균 O1, O2, O4, O6, O15, O16, O18, O25 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함한다(즉, 적어도 9가 조성물). 일 구현예에서, 조성물에서 및/또는 대상체에게 투여되는 O75:O1:O2:O4:O6:O15:O16:O18:O25 항원 다당류 사이의 중량비는 약 2:1:1:1:1:1:1:1:2이다.
또 다른 바람직한 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 적어도 담체 단백질에 접합된 대장균 O1, O2, O4, O6, O8, O15, O16, O18, O25 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함한다(즉, 적어도 10가 조성물). 일 구현예에서, 조성물에서 및/또는 대상체에게 투여되는 O75:O1:O2:O4:O6:O8:O15:O16:O18:O25 항원 다당류 사이의 중량비는 약 2:1:1:1:1:1:1:1:1:2이다.
또한, 선택적으로 다른 대장균 혈청형으로부터의 추가 O 항원을 (예를 들어, 단리된 형태로, 또는 당접합체 또는 생체접합체의 일부로서) 추가로 포함하는 조성물이 본원에서 고려된다. 일부 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 상기 기재된 바와 같은 적어도 6가, 9가 또는 10가 조성물을 포함하고, 1 내지 15개의 추가 대장균 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된 항원 다당류의 (생체)접합체, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개의 추가 대장균 항원 다당류를 추가로 포함한다. 특정 구현예에서, 상기 기재된 바와 같은 적어도 6가, 9가 또는 10가 조성물은 추가 대장균 항원 다당류 또는 이의 접합체를 포함하지 않는다. 즉, 이러한 조성물은 각각, 바람직하게는 접합체, 바람직하게는 생체접합체의 형태로, 6, 9 또는 10개의 대장균 항원 다당류를 포함하나, 이를 초과하여 포함하지 않는다. 따라서, 일 구현예는 9개의 접합체, 특히 담체 단백질에 접합된 대장균 O1, O2, O4, O6, O15, O16, O18, O25 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함하고(즉, 9가 조성물), 담체 단백질에 공유 결합된 대장균 O 항원 다당류의 추가 접합체를 포함하지 않는 조성물을 제공하는 것이다. 따라서, 또 다른 구현예는 10개의 접합체, 특히 담체 단백질에 접합된 대장균 O1, O2, O4, O6, O8, O15, O16, O18, O25 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM197에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함하고(즉, 10가 조성물), 담체 단백질에 공유 결합된 대장균 O 항원 다당류의 추가 접합체를 포함하지 않는 조성물을 제공하는 것이다.
일부 바람직한 구현예에서, 추가 대장균 O1, O2, O4, O6, O15, O16, O18 및/또는 O25 항원 다당류 각각은 담체 단백질에 공유 결합된다. O 항원 다당류는 화학적 또는 다른 합성 방법에 의해 담체 단백질에 연결될 수 있거나, O 항원 다당류는 생체접합체의 일부일 수 있으며, 바람직하게는 생체접합체의 일부이다. 바람직하게는 조성물에 의해 커버되는 혈청형당 O 항원은 각각 개별적으로 담체 단백질에 커플링된다. 즉, 특정 혈청형을 커버하는 각각의 당접합체 또는 생체접합체는 본 발명에 따른 조성물에서 혼합되기 전에 개별적으로 생산될 수 있다. 담체 단백질은 바람직하게는 조성물 내의 각각의 당접합체 또는 생체접합체에 대해 동일할 수 있거나, 대안적으로 대장균 O 항원의 일부 또는 전부에 대해 상이할 수 있다. 예를 들어, 상이한 혈청형의 O 항원은 또한 상이한 담체 단백질에 접합될 수 있다. 본 개시를 고려하여 당업자에게 알려진 임의의 담체 단백질이 사용될 수 있다. 적합한 담체 단백질은 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D를 포함한다. 바람직하게는 담체 단백질은 EPA 또는 CRM197이다.
일부 구현예에서, 추가의 대장균 O1(A), O2, (글루코실화된) O4, O6(A), O15, O16, O18(A), 및/또는 O25(B) 항원 다당류 각각은, 특히 생체접합체의 일부인 경우, 담체 단백질의 아스파라긴(Asn) 잔기에 공유 결합되며, 여기서 Asn 잔기는 글리코실화 공통 서열 Asn-X-Ser(Thr)(여기서, X는 Pro을 제외한 임의의 아미노산일 수 있음)(서열번호 1)을 포함하는 글리코실화 부위에 존재하고, 바람직하게는 Asn 잔기는 글리코실화 공통 서열 Asp(Glu)-X-Asn-Z-Ser(Thr)(여기서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨)(서열번호 2)을 포함하는 글리코실화 부위에 존재한다. 담체 단백질은 1 내지 10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위를 포함할 수 있으며, 각각은 글리코실화 공통 서열을 포함한다. 특정 구현예에서, 담체 단백질은 EPA-4 담체 단백질, 예를 들어 서열번호 3의 아미노산 서열을 포함하는 EPA-4 담체 단백질이다.
특정 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)이 본원에 제공되며, 조성물은 (i) 서열번호 3을 포함하는 P.애루기노사의 탈독소화된 외독소 A 담체 단백질(EPA-4 담체 단백질)에 공유 결합된 대장균 O75 항원 다당류의 생체접합체(여기서 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함한다); (ii) EPA-4 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체(여기서 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함한다); (iii) EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체(여기서 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함한다); (iv) EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체(여기서 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함한다); (v) EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체(여기서 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함한다); (vi) EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체(여기서 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함한다); (vii) EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체(여기서 대장균 O18A 항원 다당류는 화학식 (O18A)의 구조를 포함한다); (viii) EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체(여기서 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함한다); 및 (ix) EPA-4 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체(여기서 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함한다)를 포함하고, 여기서 각 화학식은 표 1에 제공되어 있고, 각 화합물에 대해 독립적으로 n은 1 내지 100, 예를 들어 1 내지 50, 바람직하게는 3 내지 50, 예를 들어, 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.
특정 구현예에서, 상기 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 추가로 (x) EPA-4 담체 단백질에 공유 결합된 대장균 O8 항원 다당류의 생체접합체(여기서 대장균 O8 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 포함한다)를 포함하고, 여기서 이 구조에 대해 n은 1 내지 100, 예를 들어 1 내지 50, 바람직하게는 3 내지 50, 예를 들어, 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.
일부 구현예에서, 본원에 제공된 조성물은 대장균 O75 항원 다당류의 접합체, 및 적어도 대장균 O6 항원 다당류, 바람직하게는 O6A 항원 다당류의 접합체를 포함하며, 여기서 대장균 O75 항원 다당류의 접합체는 조성물에 존재하는 O6 항원 다당류의 농도보다 약 1.2 내지 8배, 예를 들어 약 2 내지 4배, 예컨대, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 3, 4, 5, 6, 7, 또는 8배 높다(모든 농도는 O 항원 다당류의 중량을 기준으로 함). 바람직하게는 조성물 중 대장균 O75 항원 다당류는 조성물 중 O6 항원 다당류 농도의 약 1.5배 내지 2.5배, 예컨대 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 또는 2.5배의 농도로 존재한다.
특정 구현예에서, 조성물은 대장균 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18, O25B 및 O75 항원 다당류의 생체접합체를 포함하며, 여기서 O1A:O2:글루코실화된 O4:O6A:O15:O16:O18:O25B:O75의 생체접합체는 (O 항원 다당류 중량 기준) 1:1:1:1:1:1:1:2:2, 1:1:1:1:1:1:1:2:1.5, 2:1:1:2:1:1:1:4:3, 2:1:1:2:1:1:1:4:4, 2:1:2:2:2:2:2:4:4, 바람직하게는 약 1:1:1:1:1:1:1:2:2의 비로 존재한다.
특정 구현예에서, 조성물은 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함하며, 여기서 O1A:O2:글루코실화된 O4:O6A:O8:O15:O16:O18A:O25B:O75의 생체접합체는 (O 항원 다당류 중량 기준) 1:1:1:1:1:1:1:1:2:2, 2:1:2:2:2:2:2:2:4:4, 2:1:1:2:1:1:1:1:4:3, 또는 2:1:1:2:1:1:1:1:4:4, 바람직하게는 약 1:1:1:1:1:1:1:1:2:2의 비로 존재한다.
일부 구현예에서, 본원에 제공된 조성물은 대장균 O75 항원 다당류의 생체접합체 및 적어도 대장균 O6 항원 다당류의 생체접합체를 포함하며, 여기서 대장균 O75 항원 다당류의 생체접합체는 조성물에 약 8 내지 약 50 μg/mL, 바람직하게는 약 12 내지 약 40 μg/mL, 더욱 바람직하게는 약 16 내지 약 32 μg/mL, 예컨대 16, 18, 20, 22, 24, 26, 28, 30 또는 32 μg/mL, 바람직하게는 약 32 μg/mL의 농도로 존재한다. 대장균 O75 항원 다당류의 생체접합체의 농도는 바람직하게는 조성물에 존재하는 O6 생체접합체의 농도보다 약 1.2 내지 약 8배, 예를 들어 약 2 내지 4배, 예를 들어 1.5, 2, 3, 4, 5, 6, 7 또는 8배 높다.
일 특정 구현예에서, 제약 조성물이 제공되며, 이러한 조성물은
(i) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체;
(ii) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체;
(iii) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O4 항원 다당류의 생체접합체;
(iv) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체;
(v) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체;
(vi) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체;
(vii) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체;
(viii) 약 28 내지 36, 바람직하게는 약 32 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체; 및
(ix) 약 28 내지 36, 바람직하게는 약 32 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 포함하고,
여기서 EPA-4 담체 단백질은 서열번호 3의 아미노산 서열을 포함하고,
O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 더욱 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
특정 구현예에서, 이러한 조성물은 추가로
(x) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 포함하고,
O8 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 더욱 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.
일 구현예에서, 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 포함하는 조성물이 제공되며, 여기서 O75 항원 다당류는 적어도 약 32 μg/mL의 농도이다.
일 구현예에서, 조성물이 제공되며, 조성물은
(i) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체(여기서 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함한다);
(ii) 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체(여기서 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함한다);
(iii) 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체(여기서 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함한다);
(iv) 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체(여기서 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함한다);
(v) 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체(여기서 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함한다);
(vi) 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체(여기서 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함한다);
(vii) 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체(여기서 대장균 O18A 항원 다당류는 화학식 (O18A)의 구조를 포함한다);
(viii) 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체(여기서 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함한다); 및
(ix) 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체(여기서 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함한다)를 포함하고,
화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조 각각은 표 1에 제시되어 있고, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 더욱 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고,
조성물에 존재하는 대장균 항원 다당류는 O1A, O2, O4-Glc+, O6A, O15, O16, O18A, O25B 및 O75으로 구성된다. 바람직하게는, 담체 단백질은 P. 애루기노사의 탈독소화된 외독소 A(EPA-4)이고, 더욱 바람직하게는 EPA-4는 서열번호 3의 아미노산 서열을 포함한다. 바람직하게는, O75 항원 다당류 대 O1A, O2 및/또는 O6A 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다. 바람직하게는 조성물에 존재하는 대장균 항원 다당류는 1:1:1:1:1:1:1:2:2의 비의 O1A, O2, O4-Glc+, O6A, O15, O16, O18A, O25B 및 O75로 구성된다.
하나의 일반 양태에서, 대장균 O75 및 O6 항원 다당류를 포함하는 조성물이 본원에 제공되며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O6 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 1.5:1 내지 약 2.5:1, 더욱 바람직하게는 약 2:1이다.
특정 구현예에서, 조성물은 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고,
바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다.
특정 구현예에서,
대장균 O1 항원 다당류는 표 1에 제시된 화학식 (O1A)의 구조를 포함하고,
대장균 O2 항원 다당류는 표 1에 제시된 화학식 (O2)의 구조를 포함하고,
대장균 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고,
대장균 O6 항원 다당류는 표 1에 제시된 화학식 (O6A)의 구조를 포함하고,
대장균 O15 항원 다당류는 표 1에 제시된 화학식 (O15)의 구조를 포함하고,
대장균 O16 항원 다당류는 표 1에 제시된 화학식 (O16)의 구조를 포함하고,
대장균 O18 항원 다당류는 표 1에 제시된 화학식 (O18A)의 구조를 포함하고,
대장균 O25 항원 다당류는 표 1에 제시된 화학식 (O25B)의 구조를 포함하고,
대장균 O75 항원 다당류는 표 1에 제시된 화학식 (O75)의 구조를 포함하고,
여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
특정 구현예에서, O1:O2:O4:O6:O15:O16:O18:O25:O75의 대장균 항원 다당류의 중량비는 1:1:1:1:1:1:1:2:2이다.
특정 구현예에서, O75 항원 다당류의 농도는 약 8 내지 50 μg/mL, 바람직하게는 12 내지 40 μg/mL, 예를 들어, 16 내지 32 μg/mL, 바람직하게는 약 32 μg/mL이다.
특정 구현예에서, 조성물은 담체 단백질에 공유 결합된 적어도 하나의 추가 대장균 항원 다당류를 추가로 포함한다.
특정 구현예에서, 적어도 하나의 추가 대장균 항원 다당류는 표 1에 제시된 화학식 (O8)을 갖는 O8 항원 다당류를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.
특정 구현예에서, 각각의 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D로 구성된 군으로부터 독립적으로 선택된다.
특정 구현예에서, 담체 단백질은 슈도모나스 애루기노사의 탈독소화된 외독소 A(EPA) 또는 CRM197이다.
특정 구현예에서, 담체 단백질은 서열번호 1의 아미노산 서열을 갖는 1 내지 20개, 예컨대 1 내지 10개 또는 2 내지 4개의 글리코실화 공통 서열, 바람직하게는 서열번호 2의 아미노산 서열을 갖는 공통 서열을 포함하고, 가장 바람직하게는 담체 단백질은 4개의 글리코실화 공통 서열을 포함한다.
특정 구현예에서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함하는 EPA이다.
특정 구현예에서, 대장균 항원 다당류는 생체접합에 의해 또는 화학적 접합에 의해 담체 단백질에 공유 결합된다. 화학적 접합은 예를 들어 환원적 아민화 화학(RAC), 단일 말단 접합, (2-((2-옥소에틸)티오)에틸) 카바메이트(eTEC) 스페이서와의 접합, ADH 스페이서를 이용한 또는 ADH 스페이서 없는 시아닐화 화학(CNBr, CDAP), 티오에테르 화학(말레이미드/브로모아세틸 링커 기반), 또는 EDC-N-하이드록시 숙신이미드 제로 링커 화학을 포함한다.
특정 구현예에서, 대장균 항원 다당류는 생체접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 다당류는 담체 단백질의 글리코실화 부위의 Asn 잔기에 공유 결합된다.
또 다른 양태에서, 조성물이 본원에 제공되며, 조성물은 P.애루기노사의 탈독소화된 외독소 A(EPA-4) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체(여기서 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함한다);
EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체(여기서 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함한다);
EPA-4 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체(여기서 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함한다);
EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체(여기서 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함한다);
EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체(여기서 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함한다);
EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체(여기서 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함한다);
EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체(여기서 대장균 O18A 항원 다당류는 화학식 (O18A)의 구조를 포함한다);
EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체(여기서 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함한다); 및
EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체(여기서 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함한다)를 포함하고,
여기서 EPA-4는 서열번호 3의 아미노산 서열을 포함하고,
화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조 각각은 표 1에 제시되어 있고, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 더욱 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고,
O75 항원 다당류 대 O6A 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
특정 구현예에서, 조성물은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 추가로 포함한다.
특정 구현예에서, 조성물은 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체를 포함하며, 여기서 대장균 글루코실화된 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고, 여기서 n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체는 다음을 포함하는 대장균 세포에서 생산되었다:
(i) 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
(ii) 서열번호 4와 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 글루코실 트랜스퍼라제는 대장균 O4 항원을 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생산할 수 있다);
(iii) 서열번호 7 및 8과 각각 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 트랜스로카제 및 글리코실트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 트랜스로카제는 박토프레놀 연결된 글루코스를 전위시킬 수 있고 글리코실트랜스퍼라제는 박토프레놀을 글루코실화할 수 있다);
(iv) 담체 단백질을 암호화하는 뉴클레오티드 서열; 및
(v) 대장균 글루코실화된 O4 항원 다당류를 담체 단백질에 공유 결합시킬 수 있는 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(바람직하게는 올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터의 PglB이다).
특정 구현예에서, 본원에 기재된 조성물은 수은 유도체 티메로살과 같은 보존제를 추가로 포함한다. 특정 구현예에서, 본원에 기재된 제약 조성물은 0.001% 내지 0.01%의 티메로살을 포함한다. 다른 구현예에서, 본원에 기재된 제약 조성물은 보존제를 포함하지 않는다.
특정 구현예에서, 본원에 개시된 조성물(예를 들어, 면역원성 조성물)은 아쥬반트를 포함하거나, 아쥬반트와 조합하여 투여된다. 본원에 기재된 조성물과 조합하여 투여하기 위한 아쥬반트는 상기 조성물의 투여 전에(예를 들어, 72시간, 48시간, 24시간, 12시간, 6시간, 2시간, 1시간, 10분 이내), 동시에 또는 이후에(예를 들어, 72시간, 48시간, 24시간, 12시간, 6시간, 2시간, 1시간, 10분 이내) 투여될 수 있다. 일부 구현예에서, “아쥬반트”라는 용어는 본원에 기재된 조성물과 함께 또는 이의 일부로 투여되는 경우 생체접합체에 대한 면역 반응을 증강, 증진시키고/시키거나 촉진하지만, 아쥬반트 화합물이 단독으로 투여되는 경우에는 생체접합체에 대한 면역 반응을 생성하지 않는 화합물을 지칭한다. 일부 구현예에서, 아쥬반트는 생체접합체 펩티드에 대해 면역 반응을 일으키고 알레르기 또는 다른 부작용을 일으키지 않는다. 아쥬반트는 예를 들어 림프구 모집, B 및/또는 T 세포의 자극, 및 대식세포의 자극을 포함하는 몇몇 메커니즘에 의해 면역 반응을 증진시킬 수 있다. 특정 바람직한 구현예에서, 본원에 기재된 조성물은 생체접합체 이외의 아쥬반트를 포함하지 않고/않거나, 생체접합체 이외의 아쥬반트와 함께 투여되지 않는다(생체접합체가 일부 고유 아쥬반트 특성을 포함하는 경우, 이들은 무시되고 외인성 아쥬반트가 이러한 구현예에서 첨가될 것이다).
적합한 아쥬반트의 예에는 비제한적으로 알루미늄 염(알룸)(예컨대 알룸 또는 나노알룸 제형을 포함하는 나노입자를 포함하는, 알루미늄 하이드록사이드, 알루미늄 포스페이트, 알루미늄 설페이트, 및 알루미늄 옥사이드), 칼슘 포스페이트, 모노포스포릴 지질 A(MPL) 또는 3-데-O-아실화 모노포스포릴 지질 A(3D-MPL)(예를 들어, GB2220211, EP0971739, EP1194166, US6491919 참조), AS01, AS02, AS03 및 AS04(모두 GlaxoSmithKline; 예를 들어 AS04에 대해 EP1126876, US7357936, AS02에 대해 EP0671948, EP0761231, US5750110 참조), MF59(Novartis), 이미다조피리딘 화합물(WO2007/109812 참조), 이미다조퀴녹살린 화합물(WOWO2007/109813 참조), 델타-이눌린, STING-활성화 합성 사이클릭-디-뉴클레오타이드(예를 들어 US20150056224), 레시틴과 카보머 동종중합체의 조합(예를 들어 US6676958), 및 사포닌, 예컨대 QuilA 및 QS21(예를 들어, 문헌[Zhu D and W Tuo, 2016, Nat Prod Chem Res 3: e113] 참조), 선택적으로 QS7과 조합한 Matrix M, Iscoms, Iscomatrix 등(문헌[Kensil et al., in Vaccine Design: The Subunit and Adjuvant Approach (eds. Powell & Newman, Plenum Press, NY, 1995)]; 미국 특허 제5,057,540호 참조)을 포함한다. 일부 구현예에서, 아쥬반트는 프로인드 아쥬반트(완전 또는 불완전)이다. 다른 아쥬반트로는 수중유 에멀젼(예컨대 스쿠알렌 또는 땅콩유)(선택적으로 면역 자극제, 예컨대 모노포스포릴 지질 A와 조합됨)이 있다(문헌[Stoute et al., N. Engl. J. Med. 336, 86-91 (1997)] 참조). 또 다른 아쥬반트는 CpG이다. 아쥬반트의 추가 예는 면역 자극제, 예컨대 AS01E 및 AS01B에서와 같이 MPL 및 QS21을 함유하는 리포좀이다(예를 들어 US 2011/0206758). 아쥬반트의 다른 예는 이미다조퀴놀린(예컨대, 이미퀴모드 및 R848)이다. 예를 들어, 문헌[Reed G, et al., 2013, Nature Med, 19: 1597-1608] 참조. 특정 구현예에서, 아쥬반트는 톨(toll)-유사 수용체 4(TLR4) 효능제를 함유한다. TLR4 효능제는 당해 분야에 잘 알려져 있다. 예를 들어 문헌[Ireton GC and SG Reed, 2013, Expert Rev Vaccines 12: 793-807] 참조. 특정 구현예에서, 아쥬반트는 지질 A를 포함하는 TLR4 효능제, 또는 이의 유사체 또는 유도체, 예컨대 MPL, 3D-MPL, RC529(예를 들어, EP1385541), PET-지질 A, GLA(글리코피라노실 지질 아쥬번트, 합성 이당류 당지질; 예를 들어, US20100310602, US8722064), SLA(예를 들어, 문헌[Carter D et al, 2016, Clin Transl Immunology 5: e108 (doi: 10.1038/cti.2016.63)]으로서, 이는 인간 백신을 위한 TLR4 리간드를 최적화시키기 위한 구조-기능 접근법을 기술함), PHAD(포스포릴화된 헥사아실 이당류), 3D-PHAD(이의 구조는 GLA의 구조와 동일함), 3D-(6-아실)-PHAD (3D(6A)-PHAD) (PHAD, 3D-PHAD 및 3D(6A)PHAD는 합성 지질 A 변이체이며, 예를 들어, 이들 분자의 구조를 또한 제공하는 avantilipids.com/divisions/adjuvants 참조), E6020(CAS 번호 287180-63-6), ONO4007, OM-174 등을 포함한다.
특정 구현예에서, 본원에 기재된 조성물은 아쥬반트를 포함하지 않으며, 아쥬반트와 조합하여 투여되지 않는다.
특정 구현예에서, 본원에 기재된 조성물은 대상체로의 의도된 투여 경로에 적합하도록 제형화된다. 예를 들어, 본원에 기재된 조성물은 피하, 비경구, 경구, 피내, 경피, 결장직장, 복강내 및 직장 투여에 적합하도록 제형화될 수 있다. 특정 구현예에서, 제약 조성물은 정맥내, 경구, 복강내, 비강내, 기관내, 피하, 근육내, 국소, 피내, 경피 또는 폐 투여를 위해 제형화될 수 있다. 특정 구현예에서, 본원에 기재된 조성물은 근육내 주사에 의해 투여된다.
특정 구현예에서, 본원에 기재된 조성물은 하나 이상의 완충액, 예를 들어, Tris-완충 식염수, 인산염 완충액, 또는 수크로스 포스페이트 글루타메이트 완충액을 추가로 포함한다.
특정 구현예에서, 본원에 기재된 조성물은 하나 이상의 염, 예를 들어, 트리스-하이드로클로라이드, 나트륨 클로라이드, 칼슘 클로라이드, 칼륨 클로라이드, 나트륨 포스페이트, 모노나트륨 글루타메이트, 또는 알루미늄 염(예를 들어, 알루미늄 하이드록사이드, 알루미늄 포스페이트, 칼륨 알루미늄 설페이트, 또는 이러한 알루미늄 염의 혼합물)을 추가로 포함한다.
본원에 기재된 조성물은 투여 지침과 함께 용기, 팩, 또는 디스펜서에 포함될 수 있다.
본원에 기재된 조성물은 사용 전에 보관될 수 있다. 예를 들어, 조성물은 냉동 보관되거나(예를 들어, 약 -20℃ 또는 약 -70℃에서); 냉장 조건에서 보관되거나(예를 들어, 약 4℃에서); 실온에서 보관될 수 있다.
일 양태에서, 본 발명은 또한 본 발명에 따른 조성물을 제조하는 방법을 제공하며, 이는 필요한 O 항원 접합체 각각을 제공하고(예를 들어, 이들을, 예를 들어, 원료 의약품의 형태로 얻거나 제조함으로써), 본 발명의 조성물(예를 들어, 다가 대장균, 특히 ExPEC, 백신 조성물, 때때로 완제 의약품으로 지칭됨)을 얻기 위해 원하는 비율 및/또는 양으로 혼합하는 단계를 포함한다.
면역학적 반응의 유도 방법
본원에 제공된 생체접합체 및 조성물은 대상체에서 대장균 O 항원에 대한 항체를 유도하거나 대장균에 대해 대상체를 백신접종하는 데 사용될 수 있다. 본원에 기재된 대상체에서 면역 반응을 유도하는 방법은 O 항원이 조성물(들)에 존재하는 ExPEC 균주에 의한 감염에 대해 대상체를 백신접종하는 결과를 낳는다. O 항원 서브타입이 사용되는 경우, 본 발명의 방법은 또한 유사한 항원성을 갖는 또 다른 O 항원 서브타입에 대한 면역 반응을 유도할 수 있다. 예는 하위 혈청형 사이의 교차 반응성이다. 예를 들어, O25B 항원으로의 면역화는 O25B 및 O25A 혈청형의 O-LPS를 인식하는 항체를 유도하고, 글루코실화된 O4로의 면역화는 글루코실화된 O4 및 비글루코실화된 O4 혈청형의 O-LPS를 인식하는 항체를 유도하며, 또 다른 예에서는 서로 다른 O 항원을 갖지만 여전히 항원 구조에서 약간의 유사성을 공유하는 다른 혈청형에 대한 교차 면역화가 존재할 수도 있다(예를 들어, 일부 혈청은 혈청형 연구에서 교차 반응하는 것으로 나타남).
일부 구현예에서, 대상체는 인간이다. 일부 구현예에서, 대상체는 ExPEC 감염 또는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.
일부 구현예에서, 침습성 ExPEC 질환은 패혈증을 포함한다. 일부 구현예에서, 침습성 ExPEC 질환은 균혈증을 포함한다. 일부 구현예에서, 침습성 ExPEC 질환은 요로 감염, 수술 부위 감염, 복부 또는 골반 감염, 폐렴, 골수염, 연조직염, 패혈증, 균혈증, 상처 감염, 신우신염, 수막염, 복막염, 담관염, 연조직 감염, 화농성 근염, 패혈성 관절염, 안내염, 화농성 갑상선염, 부비동염, 심내막염 및 전립선염 중 하나 이상을 포함한다.
특정 구현예에서, 본원에 기재된 조성물의 투여 후 대상체에서 유도된 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다. 일 구현예에서, 대상체는 투여 시점에 대장균(예를 들어, ExPEC) 감염이 있다. 바람직한 구현예에서, 대상체는 투여 시점에 대장균(예를 들어, ExPEC) 감염이 없다.
특정 구현예에서, 본원에 기재된 조성물의 투여 후 대상체에서 유도된 면역 반응은 조성물이 투여된 대상체의 바람직하게는 적어도 30%, 더욱 바람직하게는 적어도 40%, 예컨대 적어도 50%에서 ExPEC 감염으로 인한 증상을 예방 또는 감소시키는 데 효과적이다. ExPEC 감염의 증상은 감염의 특성에 따라 달라질 수 있고, 배뇨장애, 증가된 소변 빈도 또는 절박, 고름뇨, 혈뇨, 요통, 골반통, 소변 동안의 통증, 열, 오한, 및/또는 구역(예를 들어, ExPEC에 의해 야기된 요로 감염을 갖는 대상체에서); 고열, 두통, 목 경직, 구역, 구토, 발작, 졸림, 및/또는 빛 민감성(예를 들어, ExPEC에 의해 야기된 수막염이 있는 대상체에서); 열, 증가된 심박수, 증가된 호흡률, 감소된 소변 배출량, 감소된 혈소판 수, 복통, 호흡 곤란, 및/또는 비정상적인 심장 기능(예를 들어, ExPEC에 의해 야기된 패혈증이 있는 대상체)을 포함할 수 있으나, 이에 한정되지 않는다.
특정 구현예에서, 본원에 기재된 조성물의 투여 후 대상체에서 유도된 면역 반응은 ExPEC 감염을 앓고 있는 대상체의 입원 가능성을 감소시키는 데 효과적이다. 일부 구현예에서, 본원에 기재된 조성물의 투여 후 대상체에서 유도된 면역 반응은 ExPEC 감염을 앓고 있는 대상체의 입원 기간을 감소시키는 데 효과적이다.
특정 구현예에서, 본 발명의 조성물을 사용한 백신접종은 침습성 ExPEC 질환(IED), 예를 들어 요로패혈증, 균혈증, 패혈증 등을 예방하기 위한 것이다. 특정 구현예에서, 백신접종은 요로 감염의 발생 또는 중증도를 예방하거나 감소시키기 위한 것이다. 특정 구현예에서, IED는 병원에서 획득할 수 있다. 예를 들어, 비뇨 생식기 및/또는 복부 시술 또는 수술을 받는 환자에서 획득할 수 있다. 특정 구현예에서, IED는 예를 들어 중심선, 카테터 등을 통해 다른 병태로 건강 관리를 받는 환자에서, 예를 들어, 병원, 외래 수술 센터, 말기 신장 질환 시설, 장기 요양 시설 등에서, 의료 관련된 것일 수 있다. 특정 구현예에서, IED는 예를 들어, 최근에 의료 위험에 노출되지 않은 환자에서, 지역사회에서 획득할 수 있다.
일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 본원에 기재된 조성물을 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 예를 들어 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 2.5:1, 더욱 바람직하게는 약 2:1이다. 일부 바람직한 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O6 항원 다당류는 하나의 조성물로서 투여된다. 일부 대안적인 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O6 항원 다당류는 개별 조성물의 조합물로서 투여된다.
일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다. 바람직하게는 O1 항원은 O1A이고, O4 항원은 글루코실화된 O4 항원 다당류이고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1-, O2-, O4-, O6-, O15-, O16-, O18-, O25- 및 O75-항원은 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 본 발명에 따르면, O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다. 일부 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다. 특정 구현예에서 이러한 추가 대장균 항원은 바람직하게는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 갖는 O8 항원 다당류를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, 담체 단백질에 공유 결합된 각각의 대장균 항원 다당류는 생체접합체이다. 일부 구현예에서, 생체접합체는 하나의 조성물로서 투여된다. 일부 구현예에서, 생체접합체는 2개 이상의 개별 조성물의 조합물로서 투여된다. 개별 투여 횟수를 제한하는 것이 바람직하므로 대부분 또는 모든 항원을 포함하는 단일 조성물을 사용하는 것이 바람직하다.
일 구현예에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하기 위한 조성물을 투여하는 방법으로서, 여기서 조성물은 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 포함하고, 투여되는 O75 항원 다당류의 농도는 용량당 적어도 16 μg이다.
일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O1 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 예를 들어 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 2.5:1, 더욱 바람직하게는 약 2:1이다. 일부 바람직한 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O1 항원 다당류는 하나의 조성물로서 투여된다. 일부 대안적인 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O1 항원 다당류는 조성물의 조합물로서 투여된다. 일부 구현예에서, 방법은 대장균 O2, O4, O6, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다. 바람직하게는 O1 항원은 O1A이고, O4 항원은 글루코실화된 O4 항원 다당류이고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1-, O2-, O4-, O6-, O15-, O16-, O18-, O25- 및 O75-항원은 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 본 발명에 따르면, O75 항원 다당류 대 O1 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다. 일부 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다. 특정 구현예에서 이러한 추가 대장균 항원은 바람직하게는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 갖는 O8 항원 다당류를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, 담체 단백질에 공유 결합된 각각의 대장균 항원 다당류는 생체접합체이다. 일부 구현예에서, 생체접합체는 하나의 조성물로서 투여된다. 일부 구현예에서, 생체접합체는 2개 이상의 개별 조성물의 조합물로서 투여된다. 개별 투여 횟수를 제한하는 것이 바람직하므로 대부분 또는 모든 항원을 포함하는 단일 조성물을 사용하는 것이 바람직하다.
일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O2 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 예를 들어 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 2.5:1, 더욱 바람직하게는 약 2:1이다. 일부 바람직한 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O2 항원 다당류는 하나의 조성물로서 투여된다. 일부 대안적인 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O2 항원 다당류는 조성물의 조합물로서 투여된다. 일부 구현예에서, 방법은 대장균 O1, O4, O6, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다. 바람직하게는 O1 항원은 O1A이고, O4 항원은 글루코실화된 O4 항원 다당류이고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1-, O2-, O4-, O6-, O15-, O16-, O18-, O25- 및 O75-항원은 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 본 발명에 따르면, O75 항원 다당류 대 O2 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다. 일부 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다. 바람직하게는, 담체 단백질에 공유 결합된 각각의 대장균 항원 다당류는 생체접합체이다. 일부 구현예에서, 생체접합체는 하나의 조성물로서 투여된다. 일부 구현예에서, 생체접합체는 2개 이상의 개별 조성물의 조합물로서 투여된다. 개별 투여 횟수를 제한하는 것이 바람직하므로 대부분 또는 모든 항원을 포함하는 단일 조성물을 사용하는 것이 바람직하다.
일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제1 유효량의 대장균 O25 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1:4 및 1:0.5이고, 바람직하게는 약 1:2 내지 1:1, 더욱 바람직하게는 약 1:1, 예를 들어, 약 1:1.5, 1:1.4, 1:1.3, 1:1.2, 1:1.1, 1:1.0, 1:0.9, 1:0.8, 1:0.7, 1:0.6, 또는 1:0.5이다. 일부 바람직한 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O25 항원 다당류는 하나의 조성물로서 투여된다. 일부 대안적인 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O25 항원 다당류는 조성물의 조합물로서 투여된다. 일부 구현예에서, 방법은 대장균 O1, O2, O4, O6, O15, O16, O18 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다. 바람직하게는 O1 항원은 O1A이고, O4 항원은 글루코실화된 O4 항원 다당류이고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1-, O2-, O4-, O6-, O15-, O16-, O18-, O25- 및 O75-항원은 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 본 발명에 따르면, O75 항원 다당류 대 O25 항원 다당류의 비는 약 1:4 내지 약 1:0.5, 바람직하게는 약 1:2 내지 1:1, 더욱 바람직하게는 약 1:1이다. 일부 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다. 특정 구현예에서 이러한 추가 대장균 항원은 바람직하게는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 갖는 O8 항원 다당류를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, 담체 단백질에 공유 결합된 각각의 대장균 항원 다당류는 생체접합체이다. 일부 구현예에서, 생체접합체는 하나의 조성물로서 투여된다. 일부 구현예에서, 생체접합체는 2개 이상의 개별 조성물의 조합물로서 투여된다. 개별 투여 횟수를 제한하는 것이 바람직하므로 대부분 또는 모든 항원을 포함하는 단일 조성물을 사용하는 것이 바람직하다.
특정 구현예에서, 본원에 기재된 조성물, 조합물 및 생체접합체는 항체, 바람직하게는 옵소닌 식세포 활성을 갖는 항체의 생성을 포함하는 면역 반응을 유도하기 위해 대상체에게 투여될 수 있다. 이러한 항체는 당업자에게 공지된 기술(예를 들어, 면역친화성 크로마토그래피, 원심분리, 침전 등)을 사용하여 단리될 수 있다.
대상체에서 면역 반응을 생성하는 본원에 기재된 생체접합체 및 조성물의 능력은 당업자에게 공지되거나 본원에 기재된 임의의 접근법을 사용하여 평가될 수 있다. 일부 구현예에서, 대상체에서 면역 반응을 생성하는 생체접합체의 능력은 본원에 기재된 생체접합체로 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이) 또는 일련의 대상체를 면역화하고 대조군(예컨대, PBS)으로 추가 대상체(예컨대, 마우스, 래트, 토끼 또는 원숭이) 또는 일련의 대상체를 면역화함으로써 평가될 수 있다. 대상체 또는 일련의 대상체는 후속적으로 ExPEC으로 챌린지될 수 있고 대상체 또는 일련의 대상체에서 질환(예컨대, UTI, 균혈증 또는 기타 질환)을 유발하는 ExPEC의 능력이 결정될 수 있다. 당업자는 대조군으로 면역화된 대상체 또는 일련의 대상체가 ExPEC으로 챌린지 후 질환에 걸리지만, 본원에 기재된 생체접합체(들) 또는 이의 조성물로 면역화된 대상체 또는 일련의 대상체는 질환을 덜 앓거나 앓지 않는 경우, 생체접합체가 대상체에서 면역 반응을 생성할 수 있음을 인식할 것이다. ExPEC으로부터의 O 항원과 교차 반응하는 항혈청을 유도하는 본원에 기재된 생체접합체(들) 또는 이의 조성물의 능력은 예를 들어, 면역분석법, 예컨대 ELISA(예를 들어, 문헌[Van den Dobbelsteen et al, 2016, Vaccine 34: 4152-4160] 참조) 또는 ECL 기반 면역분석법에 의해 테스트될 수 있다.
예를 들어, 대상체에서 면역 반응을 생성하는 본원에 기재된 생체접합체의 능력은 혈청 살균 분석(SBA) 또는 옵소닌 식세포 살상 분석(OPK 분석, 또는 OPKA)을 사용하여 평가될 수 있으며, 이는 당접합체 기반 백신의 승인을 얻는 데 사용된, 확립된 허용되는 방법을 대표한다. 이러한 분석법은 당업계에 잘 공지되어 있으며, 간략하게는 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이)에게 이러한 항체를 유발하는 화합물을 투여함으로써 관심 표적(예를 들어, O 항원 다당류, 예를 들어 대장균 O75 항원 다당류)에 대한 항체를 생성하고 단리하는 단계를 포함한다. 이어서, 항체의 살균 능력은 예를 들어, 항체 및 보체 및 - 분석법에 따라 - 호중구 세포의 존재 하에 문제의 박테리아(예를 들어, 관련 혈청형의 대장균)를 배양하고, 예를 들어, 표준 미생물학적 접근법을 사용하여 박테리아의 살상 및/또는 중화를 매개하는 항체의 능력을 분석함으로써 평가될 수 있다. 대장균 생체접합체 백신에 대한 OPK 분석법의 예는, 예를 들어, 문헌[Abbanat et al, 2017, Clin. Vaccine Immunol. 24: e00123-17] 참조. OPK 분석법은 모노플렉스 또는 멀티플렉스 형식으로 수행될 수 있으며, 이 중 멀티플렉스 형식(예를 들어, 동시에 다중 혈청형 테스트)이 전형적으로 선호된다. 멀티플렉스 OPK 분석법은 때때로 본원에서 "MOPA"로 지칭된다.
특정 구현예에서, 본원에서 제공된 조성물은 대장균 O75 항원 다당류의 생체접합체 및 적어도 대장균 O6A 항원 다당류의 생체접합체를 포함하며, 대장균 O75 항원 다당류의 유효량은 조성물에 존재하는 임의의 다른 생체접합체의 농도보다 약 1.2 내지 8배, 예를 들어, 약 2 내지 4배, 예컨대 1.5, 2, 3, 4, 5, 6, 7 또는 8배 높다. 이러한 구현예에서, 대장균 O75 항원 다당류의 유효량은 예를 들어 투여당 약 5 내지 18 μg, 예컨대 투여당 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 μg이다. 바람직하게는, 약 8 내지 16 μg의 O75 항원 다당류가 투여당 투여된다.
특정 구현예에서, 본원에 기재된 조성물은 하나 이상의 다른 치료법(예를 들어, 항균 또는 면역조절 요법)과 조합하여 대상체에게 투여된다. 하나 이상의 다른 치료법은 ExPEC 감염의 치료 또는 예방에 유익할 수 있거나, 또는 ExPEC 감염과 관련된 증상 또는 병태를 개선할 수 있다. 일부 구현예에서, 하나 이상의 다른 치료법은 진통제 또는 해열제이다. 특정 구현예에서, 치료법은 5분 미만 내지 1주 미만의 간격으로 투여된다. 당업자에게 공지된 임의의 항균제(예를 들어, 항생제)가 본원에 기재된 조성물과 조합하여 사용될 수 있다.
특정 구현예에서, 본 발명에 따른 생체접합체 또는 조성물은 대상체에게 1회 투여된다. 특정 구현예에서, 본 발명에 따른 생체접합체 또는 조성물은 대상체에게 1회 초과하여, 예를 들어 프라임-부스트 요법으로 투여된다. 특정 구현예에서, 2회 투여 사이의 시간은 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 6개월, 적어도 1년, 적어도 2년, 적어도 5년, 적어도 10년 또는 적어도 15년이다. 인간에서, 원하는 면역 반응은 전형적으로 본 발명에 따른 생체접합체 또는 조성물의 단일 투여에 의해 생성될 수 있다. 특정 구현예에서, 예를 들어 10년 후 반복 투여가 제공된다.
본원에 제공된 조성물은 대상체에서 대장균 O 항원에 대한 항체를 유도하고 대장균, 특히 장외 병원성 대장균(ExPEC)에 대해 대상체를 백신접종하는 데 사용될 수 있다. 본원에서 사용되는 "대상체"는 본원에 제공된 생체접합체 또는 조성물을 투여받게 될 또는 투여받은 임의의 동물, 바람직하게는 포유류를 의미한다. 본원에서 사용되는 용어 "포유류"는 임의의 포유류를 포괄한다. 포유류의 예로는 소, 말, 양, 돼지, 고양이, 개, 마우스, 래트, 토끼, 기니피그, 원숭이 또는 유인원과 같은 비인간 영장류(NHP), 인간 등이 포함되나 이에 한정되지 않는다. 특정 구현예에서, 대상체는 인간이다. 인간 대상체는 임의의 연령일 수 있다. 특정 구현예에서, 대상체는 약 2개월 내지 약 18세, 예를 들어 1세 내지 18세의 인간이다. 특정 구현예에서, 대상체는 적어도 18세의 인간이다. 특정 구현예에서, 대상체는 15세 내지 50세, 예를 들어, 18세 내지 45세, 예를 들어, 20세 내지 40세의 인간이다. 특정 구현예에서, 대상체는 인간 남성이다. 특정 구현예에서, 대상체는 인간 여성이다. 특정 구현예에서, 대상체는 면역저하자이다. 특정 구현예에서, 대상체는 적어도 50세, 적어도 55세, 적어도 60세, 적어도 65세의 인간이다. 특정 구현예에서, 대상체는 100세 이하, 95세 이하, 90세 이하, 85세 이하, 80세 이하 또는 75세 이하의 인간이다. 특정 구현예에서, 대상체는 60세 이상 85세 이하의 인간이다. 특정 구현예에서, 대상체는 안정적인 건강 상태의 인간이다. 특정 구현예에서, 대상체는 안정적인 건강 상태의 60세 이상 85세 이하의 인간 성인이다. 특정 구현예에서, 대상체는 요로 감염(UTI, 즉 요도, 방광, 요관 및/또는 신장에서의 박테리아 감염; 일부 구현예에서 이는 신우신염을 포함함)의 병력이 있는, 즉, 자신의 삶에서 적어도 1회의 UTI 에피소드가 있었던 인간이다. 특정 구현예에서, 대상체는 지난 20년, 15년, 12년, 10년, 9년, 8년, 7년, 6년, 5년, 4년, 3년, 2년 또는 1년 동안 UTI의 병력이 있는 인간이다. 특정 구현예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 인간이다. 특정 구현예에서, 대상체는 재발성 UTI의 병력이 있는, 즉 6개월 동안 적어도 2회의 UTI 또는 1년 동안 적어도 3회의 UTI가 있었던 인간 대상체이다. 특정 구현예에서, 대상체는 지난 2년 동안 재발성 UTI의 병력이 있는 인간 대상체이다. 특정 구현예에서, 대상체는 안정적인 건강 상태의 60세 이상의 인간이다. 특정 구현예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 60세 이상의 인간이다. 특정 구현예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 60세 이상 75세 미만의 인간이다. 특정 구현예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 75세 이상의 인간 대상체이다. 특정 구현예에서, 대상체는 선택적 비뇨생식기 및/또는 복부 시술 또는 수술, 예를 들어 경직장 초음파 유도 전립선 바늘 생검(TRUS-PNB)을 받도록 예정된 환자이다. 특정 구현예에서, 대상체는 급성 세균성 전립선염(ABP)을 포함하는 전립선염, 즉 전립선의 세균 감염의 병력이 있는, 즉, 자신의 삶에서, 예를 들어, 지난 10년, 9년, 8년, 7년, 6년, 5년, 4년, 3년, 2년 또는 1년 동안 적어도 1회의 전립선염 에피소드가 있었던 인간이다.
바람직한 구현예에서, 본 발명에 따른 면역 반응을 유도하는 조성물 또는 방법에 의해 유도된 면역 반응은 옵소닌 식세포 활성을 갖는 항체를 포함한다. 담체 단백질에 공유 결합된 대장균 O 항원 다당류(즉, 대장균 O 항원의 당접합체)를 포함하는 조성물이 인간에서 이러한 유형의 기능적 항체를 유도할 수 있는 것으로 나타났으며, 이러한 항체는 생체 내에서 세균성 살상을 매개하고 이 메커니즘을 통해 대장균 감염으로부터 보호할 수 있는 것으로 나타났다.
또 다른 양태에서, 대상체에게 본원에 기재된 바와 같은 조성물을 투여하는 단계를 포함하는, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 본원에 제공된다.
또 다른 양태에서, 대상체에게 본원에 기재된 바와 같은 조성물을 투여하는 단계를 포함하는, 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대해 대상체를 백신접종하는 방법이 본원에 제공된다. 특정 양태에서, 대장균, 바람직하게는 ExPEC에 대한 항체를 유도하는데 사용하기 위한, 본원에 기재된 바와 같은 조성물이 본원에 제공된다. 특정 양태에서, 대장균, 바람직하게는 ExPEC에 대한 백신접종에 사용하기 위한, 본원에 기재된 바와 같은 조성물이 본원에 제공된다. 특정 양태에서, 대상체에서 대장균, 바람직하게는 ExPEC에 대한 항체를 유도하기 위한 약제의 제조를 위한 본원에 기재된 바와 같은 조성물의 용도가 본원에 제공된다. 특정 양태에서, 대장균, 바람직하게는 ExPEC에 대해 대상체를 백신접종하기 위한 약제의 제조를 위한, 본원에 기재된 바와 같은 조성물의 용도가 본원에 제공된다.
특정 양태에서, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법에 사용하기 위한 본원에 기재된 바와 같은 조성물이 본원에 제공된다. 특정 양태에서, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하기 위한 약제의 제조에서 본원에 기재된 바와 같은 조성물의 용도가 본원에 제공된다.
또 다른 양태에서, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 본원에 제공되며, 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
특정 구현예에서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다.
특정 구현예에서, 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.
특정 구현예에서, 방법은 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고,
바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고,
더욱 바람직하게는 각각의 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고,
O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
특정 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다.
특정 구현예에서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함한다.
특정 구현예에서, 대상체는 대장균(바람직하게는 ExPEC) 감염, 바람직하게는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.
특정 구현예에서, 약 8~16 μg, 바람직하게는 약 16 μg의 O75 항원 다당류가 투여당 투여된다.
특정 구현예에서, O1:O2:O4:O6:O15:O16:O18:O25:O75의 투여되는 대장균 항원 다당류의 중량비는 1:1:1:1:1:1:1:2:2이다.
특정 구현예에서, 글루코실화된 O4는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체이고, 여기서 대장균 글루코실화된 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고, 여기서 n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체는 다음을 포함하는 대장균 세포에서 생산되었다:
(i) 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
(ii) 서열번호 4와 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 글루코실 트랜스퍼라제는 대장균 O4 항원을 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생산할 수 있다);
(iii) 서열번호 7 및 8과 각각 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 트랜스로카제 및 글리코실트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 트랜스로카제는 박토프레놀 연결된 글루코스를 전위시킬 수 있고 글리코실트랜스퍼라제는 박토프레놀을 글루코실화할 수 있다);
(iv) 담체 단백질을 암호화하는 뉴클레오티드 서열; 및
(v) 대장균 글루코실화된 O4 항원 다당류를 담체 단백질에 공유 결합시킬 수 있는 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(바람직하게는 올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터의 PglB이다).
일 양태에서, 본 발명은 또한 대장균 O1, O2, O4, O6, O15, O16, O18, O25 및 O75 항원 다당류(각각의 항원에 대해 각각 상기 표시된 바와 같은 구조를 가짐)를 포함하는 조성물을 제공하며, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되며, 이 조성물은 담체 단백질에 공유 결합된 다른 대장균 O 항원 다당류를 포함하지 않는다(즉, 9가 조성물). 이 양태의 특정 구현예에서, 담체 단백질은 EPA이다. 이 양태의 다른 구현예에서, 담체 단백질은 CRM197이다. 이 양태의 특정 구현예에서, 공유 결합은 화학적 접합의 결과이다. 다른 구현예에서, 공유 결합은 생체접합의 결과이다. 이 양태의 특정 구현예에서, 담체 단백질은 CRM197이고 공유 결합은 화학적 접합의 결과이다. 이 양태의 다른 구현예에서, 담체 단백질은 EPA이고 공유 결합은 생체접합의 결과이다. 이 양태의 바람직한 구현예에서, 조성물은 O1, O2 또는 O6 항원 다당류와 비교하여, 바람직하게는 O1, O2 및 O6 항원 다당류의 각각의 하나와 비교하여, 증가된 양의 대장균 O75 항원 다당류, 바람직하게는 약 1.5 내지 4배 증가된, 바람직하게는 약 2배 증가된 양을 포함한다.
구현예
구현예 1은 대장균 O75 항원 다당류 및, O1, O2, O4, O6, O15, O16 및 O18로 구성된 군으로부터 선택된 적어도 하나의 추가 대장균 O 항원 다당류를 포함하는 조성물로서, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 추가의 O 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 1.5:1 내지 약 2.5:1, 더욱 바람직하게는 약 2:1이다.
구현예 1a는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O1, 바람직하게는 O1A이다.
구현예 1a1은 구현예 1a의 조성물로서, O75 항원 다당류 대 O1 항원 다당류의 농도비는 2:1이다.
구현예 1b는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O2이다.
구현예 1b1은 구현예 1b의 조성물로서, O75 항원 다당류 대 O1 항원 다당류의 농도비는 2:1이다.
구현예 1c는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O4, 바람직하게는 글루코실화된 O4이다.
구현예 1c1은 구현예 1c의 조성물로서, O75 항원 다당류 대 O4 항원 다당류의 농도비는 2:1이다.
구현예 1d는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O6, 바람직하게는 O6A이다.
구현예 1d1은 구현예 1d의 조성물로서, O75 항원 다당류 대 O6 항원 다당류의 농도비는 2:1이다.
구현예 1e는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O15이다.
구현예 1e1은 구현예 1e의 조성물로서, O75 항원 다당류 대 O15 항원 다당류의 농도비는 2:1이다.
구현예 1f는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O16이다.
구현예 1f1은 구현예 1f의 조성물로서, O75 항원 다당류 대 O16 항원 다당류의 농도비는 2:1이다.
구현예 1g는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O18, 바람직하게는 O18A이다.
구현예 1g1은 구현예 1g의 조성물로서, O75 항원 다당류 대 O18 항원 다당류의 농도비는 2:1이다.
구현예 1h는 구현예 1의 조성물로서, 담체 단백질에 독립적으로 공유 결합된 O25 항원 다당류를 추가로 포함하고, 바람직하게는 O25 항원은 O25B이다.
구현예 1h1은 구현예 1h의 조성물로서, O75 항원 다당류 대 O25 항원 다당류의 농도비는 1:1이다.
구현예 2는 구현예 1의 조성물로서, 조성물은 대장균 O75 항원 다당류 및, 대장균 O1, O2, O4, O6, O15, O16, O18, O25 항원 다당류 중 2개 이상, 바람직하게는 모두를 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다.
구현예 3은 구현예 2의 조성물로서,
(i)
대장균 O1 항원 다당류는 화학식 (O1A)의 구조를 포함하고
[화학식 (O1A)]
(ii)
대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함하고
[화학식 (O2)]
(iii)
대장균 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함하고
[화학식 (O4-Glc+)]
(iv)
대장균 O6 항원 다당류는 화학식 (O6A)의 구조를 포함하고
[화학식 (O6A)]
(v)
대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함하고
[화학식 (O15)]
(vi)
대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함하고
[화학식 (O16)]
(vii)
대장균 O18 항원 다당류는 화학식 (O18A)의 구조를 포함하고
[화학식 (O18A)]
(viii)
대장균 O25 항원 다당류는 화학식 (O25B)의 구조를 포함하고
[화학식 (O25B)]
(ix)
대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함하고
[화학식 (O75)]
여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구현예 4는 구현예 2 또는 3의 조성물로서, O1:O2:O4:O6:O15:O16:O18:O25:O75의 대장균 항원 다당류의 중량비는 1:1:1:1:1:1:1:2:2이다.
구현예 5는 구현예 1 내지 4 중 어느 하나의 조성물로서, O75 항원 다당류의 농도는 약 8 내지 약 50 μg/mL, 바람직하게는 12 내지 40 μg/mL, 예를 들어, 16 내지 32 μg/mL, 바람직하게는 약 26 내지 38 μg/mL, 바람직하게는 약 32 μg/mL이다.
구현예 6은 구현예 1 내지 5 중 어느 하나의 조성물로서, 담체 단백질에 공유 결합된 적어도 하나의 다른 추가 대장균 항원 다당류를 추가로 포함한다.
구현예 7은 구현예 6의 조성물로서, 하나의 다른 추가 대장균 항원 다당류는 화학식 (O8)을 갖는 O8 항원 다당류를 포함하고
[화학식 (O8)]
여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구현예 8은 구현예 1 내지 7 중 어느 하나의 조성물로서, 각각의 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D로 구성된 군으로부터 독립적으로 선택된다.
구현예 9는 구현예 8의 조성물로서, 담체 단백질은 슈도모나스 애루기노사의 탈독소화된 외독소 A(EPA) 또는 CRM197이다.
구현예 10은 구현예 1 내지 9 중 어느 하나의 조성물로서, 담체 단백질은 서열번호 1의 아미노산 서열을 갖는 1 내지 20개, 예컨대 1 내지 10개 또는 2 내지 4개의 글리코실화 공통 서열, 예컨대 서열번호 2의 아미노산 서열을 갖는 공통 서열을 포함하고, 가장 바람직하게는 담체 단백질은 4개의 글리코실화 공통 서열을 포함한다.
구현예 11은 구현예 1 내지 10 중 어느 하나의 조성물로서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함하는 EPA이다.
구현예 12는 구현예 1 내지 11 중 어느 하나의 조성물로서, 대장균 항원 다당류는 생체접합 또는 화학적 접합, 예를 들어 환원적 아민화 화학(RAC), 단일 말단 접합, 또는 (2-((2-옥소에틸)티오)에틸) 카바메이트(eTEC) 스페이서와의 접합에 의해 담체 단백질에 공유 결합된다.
구현예 13은 구현예 12의 조성물로서, 대장균 항원 다당류는 생체접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 다당류는 담체 단백질의 글리코실화 부위의 Asn 잔기에 공유 결합된다.
구현예 14는 조성물로서,
(i)
P.애루기노사의 탈독소화된 외독소 A(EPA-4) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체(여기서 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함한다);
(ii)
EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체(여기서 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함한다);
(iii)
EPA-4 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체(여기서 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함한다);
(iv)
EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체(여기서 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함한다);
(v)
EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체(여기서 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함한다);
(vi)
EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체(여기서 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함한다);
(vii)
EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체(여기서 대장균 O18A 항원 다당류는 화학식 (O18A)의 구조를 포함한다);
(viii)
EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체(여기서 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함한다); 및
(ix)
EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체(여기서 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함한다)를 포함하고,
여기서 EPA-4는 서열번호 3의 아미노산 서열을 포함하고,
화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조 각각은 표 1에 제시되어 있고, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 더욱 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고,
O75 항원 다당류 대 O6A 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
구현예 15는 구현예 14의 조성물로서, 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 추가로 포함한다.
구현예 16은 구현예 2 내지 15 중 어느 하나의 조성물로서, 글루코실화된 O4는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체이고, 여기서 대장균 글루코실화된 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고, 여기서 n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체는 다음을 포함하는 대장균 세포에서 생산되었다:
(i)
대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
(ii)
서열번호 4와 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 글루코실 트랜스퍼라제는 대장균 O4 항원을 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생산할 수 있다);
(iii)
서열번호 7 및 8과 각각 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 트랜스로카제 및 글리코실트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 트랜스로카제는 박토프레놀 연결된 글루코스를 전위시킬 수 있고 글리코실트랜스퍼라제는 박토프레놀을 글루코실화할 수 있다);
(iv)
담체 단백질을 암호화하는 뉴클레오티드 서열; 및
(v)
대장균 글루코실화된 O4 항원 다당류를 담체 단백질에 공유 결합시킬 수 있는 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(바람직하게는 올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터의 PglB이다).
구현예 17은 대상체에게 구현예 1 내지 16 중 어느 하나의 조성물을 투여하는 단계를 포함하는, 대상체에서 대장균(바람직하게는 장외 병원성 대장균, ExPEC)에 대한 면역 반응을 유도하는 방법이다.
구현예 17a는 구현예 17의 방법으로서, 대상체는 상기 면역 반응을 필요로 한다.
구현예 18은 대상체에서 대장균(바람직하게는 장외 병원성 대장균, ExPEC)에 대한 면역 반응을 유도하는 방법으로, 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
구현예 18a는 구현예 18의 방법으로서, 대상체는 상기 면역 반응을 필요로 한다.
구현예 19는 구현예 17 내지 18a 중 어느 하나의 방법으로서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다.
구현예 20은 구현예 19의 방법으로서, 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.
구현예 20a는 구현예 20의 방법으로서, 침습성 ExPEC 질환은 패혈증을 포함한다.
구현예 20b는 구현예 20의 조성물로서, 침습성 ExPEC 질환은 균혈증을 포함한다.
구현예 21은 구현예 18 내지 20 중 어느 하나의 방법으로서, 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고,
바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고,
더욱 바람직하게는 각각의 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
구현예 22는 구현예 18 내지 21 중 어느 하나의 방법으로서, 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다.
구현예 23은 구현예 18 내지 22 중 어느 하나의 방법으로서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함한다.
구현예 24는 구현예 17 내지 23 중 어느 하나의 방법으로서, 대상체는 대장균(바람직하게는 ExPEC) 감염 또는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.
구현예 25는 구현예 17 내지 24 중 어느 하나의 방법으로서, 약 8~16 μg, 바람직하게는 약 16 μg의 O75 항원 다당류가 투여당 투여된다.
구현예 26은 구현예 21 내지 25 중 어느 하나의 방법으로서, O1:O2:O4:O6:O15:O16:O18:O25:O75의 투여되는 대장균 항원 다당류의 중량비는 1:1:1:1:1:1:1:2:2이다.
구현예 27은 구현예 21 내지 26 중 어느 하나의 방법으로서, 글루코실화된 O4는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체이고, 여기서 대장균 글루코실화된 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고, 여기서 n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체는 다음을 포함하는 대장균 세포에서 생산되었다:
(i) 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
(ii) 서열번호 4와 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 글루코실 트랜스퍼라제는 대장균 O4 항원을 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생산할 수 있다);
(iii) 서열번호 7 및 8과 각각 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 트랜스로카제 및 글리코실트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 트랜스로카제는 박토프레놀 연결된 글루코스를 전위시킬 수 있고 글리코실트랜스퍼라제는 박토프레놀을 글루코실화할 수 있다);
(iv) 담체 단백질을 암호화하는 뉴클레오티드 서열; 및
(v) 대장균 글루코실화된 O4 항원 다당류를 담체 단백질에 공유 결합시킬 수 있는 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(바람직하게는 올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터의 PglB이다).
구현예 27은 대상체에서 대장균(바람직하게는 장외 병원성 대장균, ExPEC)에 대한 면역 반응을 유도하는 방법에 사용하기 위한 구현예 1 내지 16 중 어느 하나의 조성물이다.
구현예 28은 대상체에서 대장균(바람직하게는 장외 병원성 대장균, ExPEC)에 대한 면역 반응을 유도하기 위한 약제의 제조에서 구현예 1 내지 16 중 어느 한 구현예의 조성물의 용도이다.
구현예 29는 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법에 사용하기 위한 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류의 조합물로서, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
구현예 29a는 구현예 29의 조합물로서, 제1 유효량 및 제2 유효량은 동일한 조성물에 존재한다.
구현예 29b는 구현예 29의 조합물로서, 제1 유효량 및 제2 유효량은 개별 조성물에 존재한다.
구현예 29c는 구현예 29 내지 29b 중 어느 하나의 조합물로서, 대상체는 상기 면역 반응을 필요로 한다.
구현예 30은 구현예 29 내지 29c 중 어느 하나의 조합물로서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다.
구현예 31은 구현예 30의 조합물로서, 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.
구현예 32는 구현예 29 내지 31 중 어느 하나의 조합물로서, 유효량의 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고, 바람직하게는 각각의 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
구현예 33은 구현예 29 내지 32 중 어느 하나의 조합물로서, 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류의 유효량을 추가로 포함한다.
구현예 34는 구현예 29 내지 33 중 어느 하나의 조합물로서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함한다.
구현예 35는 구현예 29 내지 34 중 어느 하나의 조합물로서, 대상체는 대장균(바람직하게는 ExPEC) 감염 또는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.
구현예 36은 구현예 29 내지 35 중 어느 하나의 조합물로서, 유효량의 O75 항원 다당류는 약 8 내지 16 μg, 바람직하게는 약 16 μg이다.
구현예 37은 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하기 위한 약제의 제조에서 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류의 조합물로서, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
구현예 37a는 구현예 37의 조합물로서, 대상체는 상기 면역 반응을 필요로 한다.
구현예 38은 구현예 37 또는 37a의 조합물로서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다.
구현예 39는 구현예 38의 조합물로서, 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.
구현예 40은 구현예 37 내지 39 중 어느 하나의 조합물로서, 약제의 제조에서 유효량의 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고, 바람직하게는 각각의 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.
구현예 41은 구현예 37 내지 40 중 어느 하나의 조합물로서, 약제의 제조에서 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류의 유효량을 추가로 포함한다.
구현예 42는 구현예 37 내지 41 중 어느 하나의 조합물로서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함한다.
구현예 43은 구현예 37 내지 42 중 어느 하나의 조합물로서, 대상체는 대장균(바람직하게는 ExPEC) 감염 또는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.
구현예 44는 구현예 37 내지 43 중 어느 하나의 조합물로서, 대상체에게 투여하기 위한 하나의 용량에서 유효량의 O75 항원 다당류는 약 8 내지 16 μg, 바람직하게는 약 16 μg이다.
실시예
실시예 1:
대장균 감염의 역학 데이터
균혈증 초래 대장균의 O 혈청형 분포를 결정하기 위해, 글로벌 감시 연구를 수행하였다. 2011년과 2017년 사이에 북미, 유럽, 아시아 태평양 지역 및 남미 국가에서 입원한 60세 이상의 환자로부터 3200개가 넘는 대장균 혈류 분리주를 수집하였다. 각 균주는 고전적 응집 기술 및 서열 기반 O 유전자형을 이용하여 O 항원 혈청형에 대해 분석되었다. 아래 표 2 참조.
분리된 인간 혈액 샘플을 분석하여 그 안의 병원체의 정체와 이들의 항생제 내성 패턴을 결정하였다. 대장균 분리주를 분석 후 샘플로부터 수득하였다. 대장균 정체를 MALDI-TOF MS에 의해 확인하였다. 대장균 분리주에 대한 추가 분석은 O 항원 혈청형을 결정하기 위해 항혈청 기반 응집 분석법을 사용하여 수행하였다(DebRoy et al. (2011) Animal health research reviews / Conference of Research Workers in Animal Diseases 12, 169-185). 응집 방법으로 유형화할 수 없는 분리주를 전체-게놈 시퀀싱에 이어서 O 혈청형 특이적 wzy 및 wzx 유전자 서열을 기반으로 하는 O 유전형 분석에 의해 추가로 분석하였다.
표 2.
응집에 의한 O 유전형 분석과 응집에 의해 유형화할 수 없는 분리주의 O 유전형 분석을 기반으로 한, 2011년에서 2017년 사이에 전 세계적으로 수집된 3217개 혈액 분리주의 컬렉션으로부터 가장 일반적인 균혈증 관련 대장균 O 혈청형의 분포 대상체는 다음 국가의 입원 대상체였다: 미국, 캐나다, 아르헨티나, 브라질, 영국, 독일, 스페인, 이탈리아, 네덜란드, 프랑스, 일본, 태국, 한국 및 호주.
전 세계의 균혈증 관련 대장균 세트에서 지리적 위치에 대한 계층화는 위치와 무관한 상위 10개 O 혈청형의 유병률을 보여주었으며, 이는 이들이 균혈증을 초래하는 대장균과 전 세계적으로 관련된 우세한 O 혈청형임을 시사한다.
전 세계의 균혈증 관련 다중 약물 내성 대장균 분리주(n=345), 즉 임상적으로 관련된 항미생물제의 적어도 3가지 부류에 내성이 있는 이러한 균주 세트에서, 상위 10개의 O 혈청형의 유병률은 75.4%이다.
역학 분석의 모든 정보를 종합하면, 유형화할 수 없는 균주의 하위부분을 내포한다고 가정할 경우 10개의 우세한 O 혈청형이 대장균 관련 균혈증 감염의 추정되는 60 내지 80%를 커버할 수 있다.
균혈증 초래 대장균 혈청형의 상당 부분을 커버하는 다가 백신은 매우 유용할 것이다. 따라서, 표 2의 O 혈청형은 O 항원 기반 다가 백신에 대한 좋은 후보가 될 것이다. 이러한 백신은 화학적 접합 또는 생체접합 기술을 사용하여 유리하게 제조될 수 있다.
실시예 2:
대장균 O 항원 생체접합체의 생산 및 생성된 생체접합체 제품.
대장균 O1A-EPA 생체접합체, O2-EPA 생체접합체, O4-Glc+-EPA 생체접합체(이하, 즉, 아래 실시예에서, O4-EPA라고도 함, O4 항원 다당류의 생체접합체는 O4가 글루코실화된 변이체로, 표 1에 제시된 글리칸 구조 (O4-Glc+)를 가짐; 대장균 글루코실화된 O4 항원을 생성하기 위한 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 특이적으로 변형할 수 있는 신규하고 지금까지 보고되지 않았으며 알려지지 않은 글루코실트랜스퍼라제 GtrS를 사용하여 이 변이체를 제조하는 것에 대한 설명은 본원에 참조로 포함된, 2020년 3월 18일 출원된 PCT/US20/23404에 자세히 제공되었다), O6A-EPA 생체접합체, O8-EPA 생체접합체, O15-EPA 생체접합체, O16-EPA 생체접합체, O18A-EPA 생체접합체, O25B-EPA 생체접합체 및 O75-EPA 생체접합체를 포함하는 10종의 생체접합체를 생산하였다. 이러한 접합체의 글리칸 구조는 표 1의 각각의 화학식에서 볼 수 있다. 10종의 생체접합체를 포함하는 조성물은 본원에서 'ExPEC10V'로 지칭된다. O1A-EPA, O2-EPA, O6A-EPA 및 O25B-EPA 생체접합체를 포함하는 조성물은 'ExPEC4V'로 지칭된다(이전에 예를 들어, WO 2015/124769 및 WO 2017/035181에 기재됨). 이들 10종의 생체접합체의 생산 및 이들 생체접합체에 대한 예시적인 생산 균주는 2020년 3월 18일에 출원된 PCT/US20/23404에 상세히 기술되어 있으며, 본원에 참조로 포함된다.
대장균 W3110 모 균주
비병원성 대장균 K12 균주 W3110을 모든 10종의 생산 균주의 구축을 위한 모 균주로서 사용하였다. 대장균 K12 균주 W3110은 Coli Genetic Stock Center(예일대학교, 미국 (코네티컷 주) 뉴헤이븐, 제품 번호 CGSC#4474)에서 입수하였다. 이의 관련 유전자형은 이전에 설명되었으며(대장균 W3110, F-, 람다-, IN(rrnD-rrnE)1, rph-1), 및 이의 게놈 서열은 이전에 공개되었다(Hayashi K, et al., 2006, Mol. Syst. Biol. 2006.0007 (doi:10.1038/msb4100049). 대장균 W3110 균주는 대장균 O 항원 생체접합체 각각의 생산을 가능하게 하도록 유전자 변형되었다(표 3).
생체접합체 생산 균주
"ExPEC4V" 및 "ExPEC10V" 조성물은 둘 다 동일한 생산 균주로부터의 O2-EPA 및 O25B-EPA 생체접합체를 포함한다. "ExPEC4V" 조성물은 stGVXN4411 또는 stLMTB10217 생산 균주로부터의 O1A-EPA 생체접합체를 포함하는 반면, "ExPEC10V" 조성물은 stLMTB10217 생산 균주로부터의 O1A-EPA 생체접합체를 포함한다. "ExPEC4V" 조성물은 stGVXN4112 생산 균주로부터의 O6A-EPA 생체접합체를 포함하는 반면, "ExPEC10V" 조성물은 stLMTB10923 생산 균주로부터의 O6A-EPA 생체접합체를 포함한다. 또한, "ExPEC10V" 조성물은 "ExPEC4V"에 사용되지 않는 생산 균주로부터의 O4-EPA(즉, (O4-Glc+)-EPA), O8-EPA, O15-EPA, O16-EPA, O18A-EPA 및 O75-EPA 생체접합체를 포함한다. 다양한 생산 균주는 아래에 지시된 바와 같이 EPA 담체 단백질 및/또는 올리고사카릴 트랜스퍼라제 PglB의 발현을 위한 플라스미드에서 다를 수 있다. 여러 예시적인 생산 균주의 개요가 아래 표 3에 제공되어 있다.
표 3. ExPEC4V 및 ExPEC10V 백신 조성물을 위한 O 항원 생체접합체에 대한 대장균 생산 균주의 유전자 공학 개요
예를 들어 개선된 수율 및/또는 생체접합체의 특정 특성의 변화를 가진 클론을 찾기 위해, 대체 생산 균주도 준비하여, 일부 생체접합체에 사용하였다.
O 항원 생합성(
rfb
) 유전자 클러스터
모든 대장균 O 항원 생산 균주에서, 자연 발생 대장균 W3110 게놈 O16::IS5 -항원 생합성(rfb) 유전자 클러스터는 선택된 혈청형의 대장균 균주로부터 선택된 O 항원 특이적 생합성 클러스터에 의해 대체되었으며, 이는 혈청형-특이적 O 항원 구조를 암호화한다(이러한 O 항원 구조에 대해서는 표 1 참조). 10개의 공여체 rfb 클러스터는 대장균 혈액 분리주의 전체-게놈 분석 후 선택하고 확인하였다. O 항원 생합성에 결함이 있는 W3110 O16::IS5 rfb 유전자 클러스터의 대체는 단일 상동 재조합 사건으로 달성되었다. O16 및 O18A rfb 유전자 클러스터의 경우, 공여체 DNA는 측접하는 gnd 및 rmlCA 유전자를 통해 재조합되는 반면, 다른 균주의 rfb 유전자 클러스터는 측접하는 gnd 및 galF 유전자를 통해 재조합되었다. 생산 균주에서 rfb 클러스터의 서열은 서열번호 9 및 11 내지 19로 제공된다.
O 항원 리가제(
waaL
) 유전자
모든 대장균 O 항원 생산 균주는 waaL 유전자에 의해 암호화된 대장균 W3110 게놈 O 항원 리가제의 인공적으로 도입된 결실을 보유한다. ΔwaaL 균주에서 지질 A로의 O 항원의 전달이 방해되고, 이는 대신에 O 항원의 담체 단백질로의 직접 전달을 유도하여 생성물 수율을 증가시킨다.
O 항원 글루코실화(
gtrABS
) 유전자
대장균 O8, O15, O16, O18A, O25B 및 O75 생산 균주에서, O16 O 항원 글루코실화를 담당하는 대장균 W3110 게놈 gtrABS 유전자가 결실되었다. 상이한 혈청형의 gtrA 및 gtrB 유전자는 고도로 상동성이고 상호교환가능하지만, gtrS 유전자는 혈청형-특이적 O 항원 글리코실 트랜스퍼라제를 암호화한다. 대장균 W3110에서 GtrS는 대장균 O16 O 항원의 α-L-Rha-(1→3)-D-GlcNAc 모티프에 있는 GlcNAc 당에 글루코스(Glc) 잔기를 전달할 수 있다. 대장균 O1A, O2 및 O6A 생산 균주에서는 gtrABS 유전자의 결실 또는 대체가 발생하지 않았다. 이러한 O 항원은 대장균 O16 gtrS의 천연 기질인 α-L-Rha-(1→3)-D-GlcNAc 모티프를 놓치게 된다. 대장균 O4 생산 균주에서, W3110 gtrS 유전자는 대장균 O4 gtrS 유전자로 대체되어 대장균 O4 O 항원의 적절한 글루코실화를 수용하였다(대장균 O4 gtrS 유전자의 암호화 서열은 본원에 서열번호 5로 제공되고, 대장균 O4 GtrS 단백질의 아미노산 서열은 본원에 서열번호 4로 제공된다; 예를 들어, 2020년 3월 18일 출원된 PCT/US20/23404도 참조).
올리고사카릴 트랜스퍼라제 PglB
모든 대장균 O 항원 생산 균주는 C. 제주니 글리코실 트랜스퍼라제 PglB의 변이체를 발현하였으며, 이는 N-글리코실화에 의해 담체 단백질 상의 아미노산 공통 서열 상으로 O 항원을 전달할 수 있다. PglB는 광범위한 기질 인식을 가졌으나, 낮은 생성물 수율로 인해, 변형된 기질 특이성을 갖는 PglB 변이체를 발현하는 여러 생산 균주를 제조하였으며, 이는 개선된 생성물 수율을 초래하였다(예를 들어, WO 2016/107818, WO 2016/107819 참조). pgIB 유전자는 플라스미드 상의 이소프로필 β-d-1-티오갈락토피라노시드(IPTG) 유도성 프로모터 뒤에 배치되었다. 아래 표 4는 상기 기재된 ExPEC4V 및 ExPEC10V 조성물을 위한 생체접합체에 대한 대장균 O 항원 생산 균주의 생산에 사용되는 플라스미드에 의해 암호화된 PglB 변이체를 나열한다. 벡터 백본, 항생제 내성 마커 및/또는 대안적 PglB 변이체에 변이가 있는 추가 플라스미드도 또한 생체접합체 생산에 대해 성공적으로 테스트되었다.
표 4. 대장균 O 항원 생산 균주에 사용되는 PglB 및 EPA 플라스미드
1 SpR, 스펙티노마이신 내성; AmpR, 암피실린 내성; KanR, 카나마이신 내성
ExPEC10V에서 10개의 대장균 O 항원의 각각의 생체접합체에 대한 최적의 PglB 변이체는 예를 들어, 전체가 본원에 참조로 포함된 2020년 3월 18일 출원된 PCT/US20/23415에 더욱 상세히 기재된 바와 같이 결정되었다.
담체 단백질 (EPA)
모든 대장균 O 항원 생산 균주는 O 항원에 대한 담체 단백질로서 유전적으로 탈독소화된 P. 애루기노사 AD-리보실트랜스퍼라제 톡소이드(EPA)를 발현하였다. EPA 톡소이드는 2개 잔기에서 야생형 EPA 독소와 상이하다: Leu552는 Val로 변경되었으며, (촉매 도메인에서) Glu553이 결실되었다. Glu553 결실은 독성을 현저하게 감소시키는 것으로 보고되었다. 탈독소화 돌연변이 외에도, 4개(EPA-4) 공통 N-글리코실화 부위 모티프를 도입하였다. epa 유전자는 플라스미드 상의 l-아라비노스(Ara) 유도성 프로모터 뒤에 위치하였다(표 4). 표 4는 상기 기재된 "ExPEC4V" 및 "ExPEC10V" 조성물에 사용된 생체접합체에 대한 생산 균주에 사용되는 플라스미드로 제한된다. 벡터 백본, 항생제 내성 마커 및/또는 EPA 변이체에서 변이를 갖는, 예를 들어 공통 N-글리코실화 부위 모티프의 수(예를 들어, 2개의 이러한 모티프를 가짐, EPA-2)가 변화하는 플라스미드도 생체접합체 생산에 대해 성공적으로 테스트되었다.
실시예 3: 대장균 O 항원의 생체접합체의 생성을 위한 올리고사카릴트랜스퍼라제 최적화
생체접합체 생산을 위한 수율 최적화는 C. 제주니 올리고사카릴 트랜스퍼라제 PglB의 변형에 의해 달성될 수 있으며, 이는 EPA 담체 단백질에 대한 관심 O 항원의 더욱 효율적인 또는 더 높은 정도의 N-글리코실화로 이어질 수 있다. 글루코실화된 O4(O4-Glc+) O 항원 다당류를 갖는 생체접합체의 생산을 위한 대장균 균주에서, 이러한 최적화 전략을 적용하였으며, 생체접합체 생성물 수율을 개선하는 (O4-Glc+) 특이적 최적화된 PglB 변이체를 발생시켰다.
이러한 접근법에서, EPA-발현 플라스미드를 함유하는 O4-Glc+ O 항원 다당류 생산 균주는 다양한 상이한 PglB 발현 플라스미드로 형질전환되었으며, 이들 각각은 PglB 단백질에 상이한 아미노산 치환을 함유하여 기질 특이성을 변경시켰다. 각 균주의 생체접합체 생산 수준 및 프로파일은 삼투압 충격 실험에서 진탕 플라스크 수준으로 평가하였으며, 판독은 O4-Glc+ 특이적 단클론 항체를 사용하여 주변 세포질 추출물에 대한 모세관 전기영동 면역분석법에 의해 수행하였다.
N311V 아미노산 치환을 함유하는 테스트한 PglB 변이체 중 하나는 글루코실화된 O4 생체접합체의 생성물 수율을 현저하게 개선하는 것으로 밝혀졌다(전체가 본원에 참조로 포함된 2020년 3월 18일 출원된 PCT/US20/23415 참조).
N311V PglB-변이체가 추가로 변형된 추가 개선에서, Y77H 아미노산 치환은 N311V PglB-변이체와 비교하여 O4-Glc+ 특이적 생성물 수율을 추가로 증진시켰으며, 증가된 정도의 디- 및 트리-글리코실화 생성물을 나타내었으며, 여기서 다른 변형은 중립적이거나 생성물 수율에 부정적인 영향을 미치는 것으로 밝혀졌다(전체가 본원에 참조로 포함된 2020년 3월 18일 출원된 PCT/US20/23415 참조). 플라스미드 pLMTB4008(SpR)은 돌연변이 Y77H 및 N311V가 있는, 대장균 코돈 사용 빈도 최적화되고 (O4-Glc+) 기질 최적화된 PglB 변이체를 암호화한다.
야생형 (wt) C. 제주니 글리코실 트랜스퍼라제 PglB와 비교해 N311V 및 Y77H 아미노산 치환을 함유하는 O4-Glc+ O 항원 다당류에 대한 최적화된 기질 특이성을 갖는 PglB 변이체는 1차 라운드 최적화된 PglB-N311V 변이체와 비교하여 생체접합체 수율이 두 배인 것으로 밝혀졌다.
유사하게 스크린을 사용하여, ExPEC10V 조성물 중 다른 9개 혈청형의 대장균 O 항원 생체접합체 생산에 대해 가장 최적의 수율을 갖는 PglB 변이체를 또한 결정하였다. 예를 들어, 전체가 본원에 참조로 포함된 2020년 3월 18일 출원된 PCT/US20/23415 참조.
O1A, O6A 또는 O15 항원 다당류를 갖는 생체접합체의 경우, 아미노산 돌연변이 N311V, K482R, D483H 및 A669V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.
O2, O8, O18A 또는 O25B 항원 다당류를 갖는 생체접합체의 경우, 야생형 PglB(즉, 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이가 없음)가 가장 높은 수율을 제공하는 것으로 밝혀졌다.
O16 항원 다당류를 갖는 생체접합체의 경우, 아미노산 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.
O75 항원 다당류를 갖는 생체접합체의 경우, 아미노산 돌연변이 N311V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.
이러한 결과는 최적의 PglB 변이체가 다양한 O 항원에 대해 상이하고, 주어진 O 항원 다당류를 갖는 생체접합체를 생성하기 위한 최적의 PglB 변이체는 예측할 수 없음을 보여주었다.
실시예 4: 10개의 대장균 혈청형으로부터의 O 항원의 생체접합체의 품질 속성.
표적 O 항원의 O-글리칸 잔기는 구조적으로 다양하고, 가변적인 반복 단위를 갖는다. 글리코실 트랜스퍼라제 PglB의 특이성 및 친화성은 글리칸 구조와 연결되어 있다. 따라서, 요망되는 품질 속성, 예를 들어 순도, 글리칸/단백질 비 등을 갖는 생체접합체를 만드는 것은 어렵고 간단하지 않은 작업이다. PglB와 EPA 담체 단백질의 올바른 조합은 수율을 결정하고, 글리코실화 효율에 영향을 미칠 수 있다. PglB 및 담체 단백질을 최적화함으로써, 요망되는 품질 속성을 갖는 생체접합체를 생성하였다. 매우 많은 양의 담체 단백질은 면역학적 간섭으로 이어질 수 있기 때문에, 특히 하나 이상의 O 항원 생체접합체가 함께 조합되어 단일 조성물 또는 백신으로 투여되는 경우, 총 담체 단백질의 더 낮은 역치 값을 유지하는 것이 또한 중요할 수 있다. 이러한 현상을 피하기 위해서 더 높은 글리칸/단백질 비율을 갖는 접합체가 바람직하다. 따라서, ExPEC10V 백신의 경우, (임상 시험으로 처리된 이전에 기재된 ExPEC4V 백신과) 적어도 유사한 글리코실화 비율을 갖는 생체접합체를 개발하였다.
생체접합체는 이전에 기재된 방법에 따라 생물반응기(10 L 및/또는 200 L 부피)에서 각 숙주 세포(실시예 2, 표 3)를 배양하고 생체접합체의 발현에 의해 각각 생성하였다. 각 원료 의약품은 박테리아 유가식 발효에 의해 배치식으로 제조되어 상응하는 다당류 혈청형의 발현된 생체접합체를 함유하는 바이오매스를 생성하였다. 세포를 배양하고, IPTG 및 아라비노스로 유도하였다. 삼투압 충격에 이어서 크로마토그래피 정제에 의해 생물반응기 배양물에서 세포의 주변세포질로부터 생체접합체를 분리하였다. 이러한 공정을 10개 생체접합체 각각에 대해 수행하였다.
ExPEC10V 및 ExPEC4V에 대한 원료 의약품(DS)인 이렇게 제조된 대장균 O 항원 생체접합체는 유사한 중요한 품질 속성을 나타내었다: (1) 공정-관련 순도(RH-HPLC에 의해 측정)는 95% 보다 높았음, (2) 약 0.1~0.5, 대부분 0.15 내지 0.45 범위의 다당류/단백질 비율, (3) 박테리아 내독소(Ph. Eur. 2.2.3)는 0.5 EU/μg 다당류 미만이었음. 개별 다당류 사슬의 평균 길이는 전형적으로 약 10~20 반복 단위였다(고해상도 SDS-PAGE를 사용하여 측정함).
다당류 반복 단위의 구조는 상기 기재된 ExPEC10V 조성물에 있어서 DS인 모든 10개의 생체접합체의 경우, 표 1에서 상응하는 혈청형에 대해 화학식으로 제시된 것으로 (온전한 또는 트립신-분해된 접합체의 NMR 및 MS/MS에 의해) 확인되었다.
ExPEC10V 완제 의약품(DP)은 상기 기재된 10개의 1가 DS의 혼합물을 포함한다.
실시예 5: ExPEC10V 백신의 독성학.
ExPEC10V를 사용한 단일-용량 파일럿 독성 및 국소 내성 연구(비-GLP)를 암컷 NZW 토끼에서 수행하였다. 하나의 군(n=2)은 대조군(식염수)의 근육내(IM) 주사(0일)를 받았고, 두 번째 군(n=4)은 0.6 mL의 투여 부피를 사용하여 105.6 μg의 총 다당류(PS)/용량(176 μg PS/mL)(각각 O 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75에 있어서 용량당 (9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 19.2: 9.6 μg PS)으로 ExPEC10V의 IM 주입을 받았다. 부검은 2일에 수행하였다.
사망은 관찰되지 않았다. 또한, 임상 관찰(Draize 스코어링을 사용한 주사 부위 효과 포함), 체중, 먹이 섭취 및 체온에 대해 언급된 백신 관련 효과는 없었다. 조직병리학적으로 투여 부위 또는 배액(장골) 림프절에서 백신과 관련된 변화는 관찰되지 않았다. 비장의 배 중심 형성의 최소 증가가 처리된 동물 4마리 중 한 마리에서 관찰되었으며(2일), 주사된 백신에 대한 정상적인 면역학적 반응으로 간주되었다. 전반적으로, 암컷 토끼에 대한 ExPEC10V의 단일 IM 용량의 투여는 내약성이 우수하였다.
실시예 6: 토끼에서 ExPEC10V 블렌딩된 제형의 면역원성.
ExPEC4V 백신(대장균 O1A, O2, O6A 및 O25B 혈청형의 생체접합체 포함)은 이전에 래트, 토끼 및 인간에서 이들 4가지 혈청형에 대해 면역원성인 것으로 나타났다(예를 들어, WO 2015/124769; WO 2017/035181; 문헌[Huttner et al, 2017, Lancet Infect Dis, http://dx.doi.org/10.1016/S1473-3099(17)30108-1; RW Frenck Jr, et al, 2019, Lancet Infect Dis 19(6): 631-640, http://dx.doi.org/10.1016/S1473-3099(18)30803-X] 참조). 대장균 혈청형 O4-Glu+, O8, O15, O16, O18A 및 O75의 생체접합체(모두 담체 단백질로서 EPA-2를 가짐)의 면역원성은 래트에게 개별적으로(1가) 투여될 경우 이들 생체접합체 각각이 또한 면역원성이라는 것을 확인시켜 주었는데, 이는 ELISA 데이터가 이들 생체접합체 각각이 높은 수준의 대장균 O 항원 특이적 항체를 유발시킬 수 있음(미제시됨)을 나타내었기 때문이다.
상기 기재된 바와 같은 10개의 생체접합체의 혼합물을 함유하는 10가 백신의 면역원성을 또한 테스트하였다. 뉴질랜드 화이트(NZW) 토끼(암컷, 12~16주령)는 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회의 근육내 면역화를 받았다(표 5; 0, 14 및 27일에 투여). 이러한 실험에 사용된 ExPEC10V의 일부인 10개의 다당류를 4개의 글리코실화 부위를 함유하는 EPA(EPA-4) 담체 단백질에 접합시켰다. 백신은 3개의 상이한 용량으로 제형화시켰다: 군 1 ('고용량'): 8 μg/용량의 O1A, O2, O6A, O4, O8, O15, O16, O18 및 O75 및 16 μg/용량의 O25B; 군 2 ('중간 용량'): 4 μg/용량의 O2, O4, O8, O15, O16, O18 및 O75, 8 ug/용량의 O1A 및 O6A 및 16 μg/용량의 O25B; 군 3 ('저용량'): 0.4 μg/용량의 O2, O4, O8, O15, O16, O18 및 O75, 0.8 μg/용량의 O1A 및 O6A 및 1.6 μg/용량의 O25B. 대조군(군 4)의 동물은 식염수(0.9% (w/v) 염화나트륨 용액)만 받았다(표 5).
항체 반응은 0일(면역화 전) 및 면역화 후 14, 27 및 42일에 평가하였다. 백신 및 담체 단백질 EPA에 포함된 각각의 생체접합체에 의해 유도된 혈청 항체 수준을 코팅 물질로서 유형 특이적 LPS를 사용하여 ELISA(총 IgG)에 의해 측정하였다. 항체 역가는 4-파라미터 로지스틱 비선형 회귀 모델에 플롯팅된 12-단계 적정 곡선의 중복을 기반으로 하는 최대 유효 농도 절반에 해당하는 EC50 값으로서 보고하였다. 기능적 활성은 OPK에 의해 결정되었다.
표 5. 실험군의 설명.
결과는 도 1에 제시되어 있고, 표 6에 요약되어 있다.
표 6. NZW 토끼에서 ExPEC10V에 의해 유도된 대장균 O 항원 특이적 항체 반응의 요약.
p 값이 통계적으로 유의한 혈청형 특이적 항체 반응은 별표로 표시된다. p 값이 통계적으로 유의하지 않은 혈청형 특이적 항체 반응은 ns로 표시된다. 다중 비교를 위한 Bonferroni 보정을 사용한 Wilcoxon 순위 합계 검정. ExPEC10V 백신접종된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4)의 비교. *p≤0.05, **p≤0.01. # P 값은 대조군에서 이상치 동물을 제외한 후 통계적으로 유의하였다(민감도 분석).
고용량의 ExPEC10V(군 1)은 O1A, O2, O4, O6A, O16, O18A 및 O25B에 대한 식염수 대조군과 비교할 경우 조사된 모든 시점(면역화 후 14, 27 및 42일)에서 유의하게 더 높은 IgG 항체 수준을 유도하였다(도 2, 표 6). 식염수 대조군과 비교할 경우 O8 및 O75 접합체에 의해 유도된 유의하게 더 높은 항체 역가가 면역화 후 27일 및 42일에 관찰되었다(도 1, 표 6).
중간 용량의 ExPEC10V(군 2) 및 저용량(군 3)은 O1A, O2, O4, O6A, O16 및 O25B에 대한 식염수 대조군과 비교할 경우 조사된 모든 시점(면역화 후 14, 27 및 42일)에서 유의하게 더 높은 항체 수준을 유도하였다(도 1, 표 6). 식염수 대조군과 비교할 경우 O8, O18A 및 O75 접합체에 의해 유도된 유의하게 더 높은 항체 역가가 면역화 후 27일 및 42일에 관찰되었으며, 이는 토끼에서의 부스트 용량이 이들 O 혈청형에 대한 반응을 증가시킴을 시사한다(도 1, 표 6).
O15 접합체의 경우, 대조군에서 이상치 동물을 생략한 민감도 분석은 ExPEC10V 백신의 3개 용량 모두가 면역화 후 14, 27 및 42일에 식염수 대조군과 비교하여 항체 반응의 유의한 증가를 유도함을 보여주었다(도 1, 표 6).
담체 단백질 EPA에 의해 유도된 항체는 조사된 모든 시점(14일, 27일 및 42일)에서 테스트된 3가지 용량의 ExPEC10V(고, 중간 및 저)에 대해 식염수 처리군(대조군)에서 EPA 항체 역가보다 유의하게 더 높았다(도 1).
용량간 비교(미제시됨)는 백신접종 후 14일에 고용량의 ExPEC10V가 테스트된 대부분의 접합체(O1A, O2, O4, O6A, O15, O16, O18A 및 O25B) 저용량과 비교할 때 유의하게 더 높은 항체 반응을 유도하였음을 보여주었다. 중간 용량의 ExPEC10V는 또한 O1A, O2, O4, O18A, O25B 및 O75에 대한 저용량과 비교하여 유의하게 더 높은 항체 반응을 유도하였다. O8 접합체의 경우, ExPEC10V의 세 가지 제형 모두는 백신접종 후 14일에 유사한 수준의 항체를 유도하였다.
저용량의 ExPEC10V는 O1A, O2, O4, O16, O25B 및 O75 접합체에 대한 고용량 및 중간 용량의 ExPEC10V과 비교할 경우 백신접종 후(프라임 및 2회 부스트 용량 후) 42일에 항체 반응의 유의한 증가를 유도하였다. 이러한 발견은 예를 들어, 폐렴구균 접합체 백신으로 백신접종된 유아에서 용량과 일차 백신접종에 대한 항체 반응의 규모 사이의 명확한 관계가 관찰되지 않았다는 접합체 백신으로의 다른 경험과 일치한다(Poolman JT, et al. Expert Rev Vaccines. 2013, 12(12):1379-94).
O6A, O8 및 O15 접합체에 대해 백신접종 후 42일에 테스트한 3가지 용량의 ExPEC10V 간에는 유의한 차이가 없었다. O18A 접합체의 경우, 백신접종 후 42일에 중간 용량과 비교하여 고용량의 ExPEC10V가 유의하게 더 높은 항체 반응을 유도하였다.
담체 단백질(EPA)에 있어서, 고용량 및 중간 용량의 ExPEC10V는 백신접종후 14일에 저용량과 비교하여 유의하게 더 높은 항체 반응을 유도하였다. 고용량의 백신은 또한 백신접종후 42일에 저용량과 비교하여 유의하게 더 높은 항체 반응을 유도하였다.
결론적으로, 0, 14, 27일에 근육내 주입을 통해 투여된 3가지 제형의 ExPEC10V(고, 중간 및 저)는 토끼에서 면역원성이다.
지금까지, 토끼에서 이 백신에 의해 유도된 대장균 균주를 살상할 수 있는 기능적 항체는 혈청형 O1A, O2, O4, O6A, O15, O16 및 O25B에 대해 나타났다.
추가 실험에서, ExPEC10V 백신의 GMP 배치(생산에 대해서는 상기 실시예 4 참조)를 제조하고, 독성학 연구의 일부로서 NZW 토끼에 주사하였다(표 7). 이 연구에서 NZW 토끼(수컷 및 암컷)는 ExPEC10V 백신(1일, 15일 및 29일)을 근육내 주사(0.6 mL)로 3회 받았고, 대조군은 0.9% (w/v) 염화나트륨 용액(식염수)를 받았다. 각 용량의 백신은 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A 및 O75에 대한 9.6 μg의 다당류(PS) 및 혈청형 O25B에 대한 19.2 μg의 PS를 함유하였으며, 이는 105.6 μg의 총 PS(176 μg 총 PS/mL) 및 382.8 μg의 총 EPA(638 μg EPA/mL)에 상응한다. O 항원 및 담체 단백질(EPA)에 대한 IgG 역가는 전처리 기간(1일) 및 면역화 후 31일 및 50일에 수집된 샘플로부터 결정하였다.
모든 O 항원 및 담체 단백질 EPA에 대한 항체 반응에서 유의한 증가는 단지 식염수만 받은 대조군과 비교할 경우 ExPEC10V를 받은 군에서 백신접종 후 31일 및 50일에 관찰되었다(도 2, 표 8). O1A 혈청형의 경우, 백신접종된 동물을 대조군과 비교할 때 유의하게 더 높은 항체 반응이 또한 1일(기준선)에 관찰되었다. 이러한 결과는 일부 동물이 대장균에 사전 노출되었거나, O1A-LPS와 교차 반응하는 항체를 가지고 있음을 시사한다.
표 7. NZW 토끼에 사용된 실험군 및 ExPEC10V 용량.
*각 용량(0.6 mL 투여 부피)은 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B, O75 각각에 대해 9.6:9.6:9.6:9.6:9.6:9.6:9.6:9.6:19.2:9.6 μg의 다당류(PS)를 함유한다(176 μg 총 PS/mL). 각 용량은 382.8 μg의 EPA 단백질을 함유한다(638 μg EPA/mL).
표 8. 독성학 연구의 일부로서 NZW 토끼에서의 ExPEC10V의 면역원성.
ExPEC10V에 의해 유도된 항체 반응. 대조군과 비교하여 백신군에서 항체 반응의 유의한 증가가 관찰된 혈청형은 별표로 표시된다. 우도비 검정이 있는 Tobit 모델. ****P ≤ 0.0001.
실시예 7: 인간에서 ExPEC10V 백신을 사용한 1/2a상 시험.
현재 IED를 예방하기 위해 이용 가능한 백신은 없다. ST131을 포함한 항균제 내성 IED를 유발하는 대부분의 ExPEC 분리주를 또한 대표하는 임상적으로 관련된 대다수의 ExPEC 균주로 인한 침습성 질환을 해결하기 위해 ExPEC10V 백신을 포함하는 혈청형(O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75)을 선택하였다. 선택된 혈청형은 노령 집단에서 혈류 감염을 일으키는 10종의 널리 퍼진 ExPEC O 혈청형을 대표하며, ExPEC으로 인한 혈류 감염의 약 70%를 차지한다.
침습성 질환 예방에 있어서 접합체 백신의 작용 메커니즘은 항생제 내성 메커니즘의 영향을 받지 않을 것으로 예상되기 때문에, ExPEC10V 백신은 약물 내성 및 약물 감수성 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75 혈청형에 의해 유발된 IED에 대한 보호를 제공하는 것으로 여겨진다.
ExPEC10V에서도 발견되는 4가지 대장균 O 항원 접합체(O1A, O2, O6A 및 O25B)의 서브세트를 포함하는 초기 백신 후보인 ExPEC4V에 대한 선행 임상 경험이 있다. 4건의 완료된 임상 연구(2건의 1상 연구, 2건의 2상 연구)의 결과에 기초하여, ExPEC4V는 연구 참가자들에 있어서 내약성이 우수하였으며, 혈청형(O1A, O2, O6A 및 O25B)당 최대 16 μg의 다당류(PS) 용량에서 백신 관련 안전성 신호가 관찰되지 않았다. 대부분의 유해 사건(AE)은 1등급 및 2등급이었고, 3등급 AE는 거의 보고되지 않았다. 후기 발병된 명시된 국소 AE(백신접종 후 5일 이후에 시작되는 AE)는 주로 더 높은 용량의 ExPEC4V로 관찰되었다. 각 연구에서, ExPEC4V 백신은 면역원성인 것으로 나타났으며, 효소 결합 면역흡착 분석법(ELISA)에 의해 측정된 바와 같이 용량 의존적 백신 면역 반응과 O 항원 특이적 면역글로불린 G(IgG) 역가 증가를 입증한다. 항체의 기능적 활성은 ExPEC4V-최적화된 옵소닌 식세포 살상 분석법(OPKA)으로 입증되었다. ELISA 및 OPKA 테스트 결과의 공동 분석은 분석법 반응 사이의 상관관계를 보여주었으며(2상 임상 시험[연구 4V-BAC2001]에서 각각 30일 및 360일에 대한 피어슨 상관 계수 ≥0.61 및 ≥0.48), 이는 ELISA를 ExPEC4V 항체 역가의 일차 척도로 사용하고, 기능적 항체 활성을 예측하는 데 사용함을 입증한다. 면역원성 데이터의 분석은 ExPEC4V로의 백신접종 후 3년에 걸쳐 면역 반응의 지속성을 입증하였다. 이제 ExPEC4V로 백신접종되고, 혈청형 특이적 옵소닌 식세포 항체의 역가가 높은 인간의 혈청은 이후에 O25B 또는 O2 혈청형의 대장균 균주로 복강내 챌린지한 마우스에 수동적으로 전달될 경우 혈액, 비장 및 간에서 대장균 콜로니 수(CFU)의 유의한 감소에 의해 입증된 생체 내 보호를 매개할 수 있었음이 또한 관찰되었다(데이터 미제시). 따라서, ExPEC4V 특이적 옵소닌 식세포 인간 항체는 생체 내에서 박테리아 살상을 매개하며, 이는 제안된 보호 메커니즘이 박테리아 살상을 매개하는 옵소닌 식세포 항체의 유도에 의한 것인 다른 접합체 백신과 일치한다.
ExPEC10V는 총 10개의 혈청형을 포함하며, 60세 이상 성인에서 ExPEC로 인한 혈류 감염의 약 50%(ExPEC4V) 내지 약 70%로 적용 범위를 늘린다. ExPEC4V에 대한 임상 경험과 상기 실시예에서 논의된 ExPEC10V에 대한 전임상 데이터를 기반으로 하여, ExPEC10V의 투여가 또한 인간에서 대장균 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75에 대한 면역 반응을 유도할 것으로 예상되었다. 각각의 O 항원 다당류(PS)는 슈도모나스 애루기노사에서 유래된 외독소 A(EPA)의 유전적으로 탈독소화된 형태인 담체 단백질에 개별적으로 생체접합되며, 이의 생산은 위에서 설명되었다. O4 PS는 표 1의 화학식 (O4-Glc+) 구조를 갖는 글루코실화된 형태이다.
ExPEC10V 백신의 3가지 다른 용량의 안전성, 반응원성 및 면역원성을 평가하기 위한 무작위, 관찰자 맹검, 인간 최초의 1/2a상 연구를 안정적인 건강 상태의 60세 내지 85세의 인간에서 수행한다(연구 10V- BAC1001). 연구 설계는 2개의 코호트를 포함한다: 코호트 1에서 안정적인 건강 상태의 60세 이상 85세 이하의 404명의 참가자(참가자 100명/ExPEC10V 용량) 및 코호트 2에서 지난 5년 내에 UTI 병력이 있는 안정적인 건강 상태의 60세 이상의 약 420명의 참가자(ExPEC10V군 280명, 위약군 140명)(원래 코호트 2에 600명의 참가자를 포함할 계획이었지만, 이 숫자는 프로토콜에 대한 일부 조정을 통해 연구 중에 약 420명으로 줄었다)의 총 824명의 참가자가 연구에 등록된다.
목적 및 종점
코호트 1 - 1/2a상 관찰자-맹검 기간과 공개 라벨의 장기 추적 기간(N=404):
코호트 2 - 이중 맹검 기간과 이중 맹검 장기 추적 기간(N = 420):
전반적인 설계
이는 2개의 코호트를 포함하는 무작위 배정, 다기관, 중재 연구이다.
코호트 1의 경우, 이 연구는 관찰자-맹검, 활성 대조 설계를 가지고 있으며, UTI 병력이 있거나 없는 안정적인 건강 상태의 60세 이상 85세 이하의 총 404명의 성인 참가자가 포함된다. 코호트 1에 대한 연구 설계는 3개의 기간을 포함한다: 최대 28일의 스크리닝 기간, 1일차에서의 백신접종을 통한 관찰자-맹검 181일의 추적 기간 및 백신접종 후 182일차부터 3년(1096일)까지 지속되는 공개 라벨의 LTFU 기간(도 3a). 단지 ExPEC10V 선택된 용량군으로부터의 참가자(약 100명의 참가자) 및 Prevnar 13군의 참가자만이 LTFU 기간으로 진행된다. 코호트 1의 종료는 마지막 참가자의 3년차 방문(1096일)이다.
코호트 2의 경우, 연구는 이중 맹검, 위약 대조 설계를 가지며, 지난 5년 동안 UTI 병력이 있는 안정적인 건강 상태의 60세 이상의 총 대략 420명의 성인 참가자가 포함되었다. 등록은 코호트 1로부터 1/2a상 1차 분석 및 ExPEC10V 용량 선택 완료 후 시작되었다. 코호트 2에 대한 연구 설계는 3개의 기간을 포함한다: 최대 28일의 스크리닝 기간, 1일차에서의 백신접종을 통한 이중 맹검 181일의 추적 기간 및 백신접종 후 182일차부터 3년(1096일)까지 지속되는 이중 맹검 LTFU 기간(도 3b). 코호트 2에서 모든 참가자는 LTFU 기간으로 진행된다. 연구 종료는 코호트 2에서 마지막 참가자의 3년차 방문(1096일)이다.
코호트 1: 1상
코호트 1의 1상에서, 총 84명의 참가자는 한 단계에서 다음 단계로 진행하기 전에 정위에서의 안전성 평가가 있는 단계적 용량 증량 절차에 따라 시차 접근 방식으로 등록되었다. 내부데이터검토위원회(DRC)는 이들 84명의 1상 참가자의 신체 검사 데이터(기준선 및 표적화), 기준선 인구 통계 데이터 및 백신접종 후 14일 안전성 데이터(명시된 국소 및 전신 AE, 명시되지 않은 AE, SAE, 임상 실험실 데이터 및 활력 징후 포함)를 검토하기 위해 이 연구를 위해 위임되었다. 연구의 이 상에서, 참가자가 등록되고 6 단계로 무작위 배정되었다:
단계 1: 4명의 센티널 참가자가 등록되고 무작위 배정되었다; 2명의 참가자는 ExPEC10V 저용량군(표 11), 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.
단계 2: 24명의 참가자가 등록되고 무작위 배정되었다; 18명의 참가자는 ExPEC10V 저용량군(표 11), 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.
단계 3: 4명의 센티널 참가자가 등록되고 무작위 배정되었다; 2명의 참가자는 ExPEC10V 중간 용량군(표 11), 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.
단계 4: 24명의 참가자가 등록되고 무작위 배정되었다; 18명의 참가자는 ExPEC10V 중간 용량군(표 11), 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.
단계 5: 4명의 센티널 참가자가 등록되고 무작위 배정되었다; 2명의 참가자는 ExPEC10V 고용량군(표 11), 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.
단계 6: 24명의 참가자가 등록되고 무작위 배정되었다; 18명의 참가자는 ExPEC10V 고용량군(표 11), 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.
모든 참가자는 배정된 연구 백신접종군에 따라 1일에 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13을 단일 근육내(IM) 주사로 투여받았다. 단계 1, 3 및 5 각각에서 4명의 센티널 참가자는 백신접종 후 24시간째에 전화로 연락하여 안전성 정보를 수집하였다. 4명의 센티널 참가자의 각 군에서 백신접종 후 24시간째의 맹검 안전성 데이터를 수석 연구원(PI), 연구 담당 의사(SRP) 및 후원 의료 책임자(SML)가 검토하였다. 다음 단계를 위한 추가 참가자의 무작위 배정은 이러한 2일의 센티널 안전성 평가가 완료될 때까지 중단되었다.
임의의 임상적으로 유의한 결과가 없는 경우, 추가로 24명의 참가자(단계 2, 4 및 6의 경우)를 등록시키고, 3개 연구 백신접종군(표 11) 중 하나로 무작위 배정하여 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13을 1일에 단일 IM 주사로 투여받게 하였다.
각 용량 수준(단계 2의 저용량, 단계 4의 중간 용량 및 단계 6의 고용량)에서 추가 24명의 참가자의 백신접종 후, 각 용량 수준에서 모든 28명(4+24) 참가자의 백신접종 후 14일의 안전성 데이터를 다음 용량 수준 또는 2a상으로 진행하기 전에 DRC에서 검토하였다.
코호트 1: 2a상
초기 84명의 참가자에 대한 백신접종 후 14일 안전성 데이터 검토 후 DRC에 의해 결정된 허용가능한 안전성 및 반응원성을 기반으로 하여(임의의 안전성 문제 또는 특정 연구 일시 중지 규칙을 충족하는 임의의 사건이 없는 경우), 코호트 1로부터의 나머지 320명의 참가자를 무작위 배정하고 연구의 2a상에서 투여하였다. 이들 추가의 320명의 참가자를 등록시키고 5개의 연구 백신접종군 중 하나로 2:2:2:1:1의 비로 병렬로 무작위 배정하여 1일에 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13의 단일 IM 주사를 투여받게 하였다(표 11). 초기 84명의 참가자에 대한 14일 안전성 검토를 수행하는 것 외에, DRC는 또한 연구 과정 동안 코호트 1의 안전성 데이터를 평가하며, 특정 연구 백신접종 일시 중지 규칙을 충족하는 임의의 사건 또는 발생할 수 있는 임의의 기타 안전성 문제를 검토한다.
코호트 1의 경우, 모든 참가자가 30일 방문(방문 4)을 완료하였거나 더 일찍 중단한 경우 1차 분석이 발생하였다. 모든 참가자가 181일 방문을 완료하였거나 더 일찍 중단한 경우 최종 분석이 발생한다. 공개 라벨의 장기 추적(LTFU) 기간으로 진행되는 참가자의 경우(ExPEC10V 선택된 용량군 및 Prevnar 13군), 연간 추적 분석은 백신접종 후 1년(366일), 2년(731일) 및 3년(1096일)차의 방문 시점까지 수집된 안전성 및 면역원성 데이터(멀티플렉스 ECL 기반 면역분석법 및 MOPA)를 포함한다.
코호트 2
코호트 2에서는 지난 5년 동안 UTI 병력이 있는 안정적인 건강 상태의 60세 이상의 참자가를 대상으로 선택된 용량의 ExPEC10V(코호트 1의 1차 분석 결과를 기반으로 하여 고용량이 선택되었다)의 안전성, 반응원성 및 면역원성을 평가한다. 코호트 2의 경우, 연구는 이중 맹검, 위약 대조 설계를 가지며, 총 약 420명의 참가자가 등록되었고, 2:1 비율(ExPEC10V군 약 280명 참가자 및 위약군 약 140명)로 병렬로 무작위 배정되었다.
모든 참가자는 배정된 연구 백신접종군에 따라 1일에 선택된 용량의 ExPEC10V 또는 위약의 단일 IM 주사를 투여받았다(표 12).
코호트 2의 경우, 1차 분석은 안전성 및 면역원성 데이터를 포함하며, 모든 참가자가 30일 방문(방문 4)을 완료했거나 더 일찍 중단하였을 경우 발생한다. 모든 참가자가 181일 방문을 완료하였거나 더 일찍 중단한 경우 최종 분석이 발생한다. 모든 참가자에 있어서, 연간 추적 분석은 백신접종 후 1년(366일), 2년(731일)(MOPA에 적용되지 않음) 및 3년(1096일)차의 방문 시점까지 수집된 안전성 및 면역원성 데이터(멀티플렉스 ECL 기반 면역분석법 및 MOPA)를 포함한다.
대변 샘플 분석은 균유전체학을 이용하여 장내 세균총의 병원체(예를 들어, 클로스트리듐 디피실리균)의 유병률 및 ExPec10v 혈청형에 미치는 ExPEC10V의 영향을 평가하기 위해 선택된 서브세트의 참가자에서 수행된다.
참가자 수
총 약 824명의 참가자가 연구에 등록되었다; 404명의 참가자가 코호트 1에, 약 420명의 참가자가 코호트 2에 등록되었다.
중재 군: 중재 설명
ExPEC10V: EPA 담체 단백질에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 PS를 함유하는 인산염 완충 용액 중 대장균 생체접합체 백신. 1일에 ExPEC10V의 3가지 용량 중 하나의 단일 0.5 mL의 IM(삼각근) 주사.
ExPEC4V: EPA 담체 단백질에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O6A, O25B(4:4:4:8 μg PS/ExPEC 혈청형)의 O 항원 PS를 함유하는 식염수 완충액 중 대장균 생체접합체 백신. 1일에 ExPEC4V의 단일 0.5 mL의 IM(삼각근) 주사.
Prevnar 13: 무독성 디프테리아 CRM197 단백질에 개별적으로 연결된 스트렙토코커스 뉴모니애 혈청형 1, 3, 4, 5, 6A, 6B, 7F, 9V, 14, 18C, 19A, 19F 및 23F의 캡슐 항원의 당류의 멸균 현탁액. 1일에 단일 0.5 mL의 IM(삼각근) 주사, 단일 용량의 사전 충전형 주사기로 제공됨.
위약: 생리식염수. 1일에 위약의 단일 0.5 mL의 IM(삼각근) 주사.
ExPEC 연구 중재 자료는 표 9에 설명되어 있다.
표 9. BAC1001MV ExPEC 연구 백신
EPA = 슈도모나스 애루기노사로부터 유래된 유전적으로 탈독소화된 형태의 외독소 A; PS=다당류
ExPEC4V는 EPA 담체 단백질에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O6A 및 O25B의 O 항원 다당류(PS)로 구성된다.
ExPEC10V는 EPA 담체 단백질에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 다당류(PS)로 구성된다.
용량은 PS만을 기준으로 한다. EPA(μg)는 측정값이다.
ExPEC10V는 10개의 1가 원료 의약품(DS)으로 구성된다. 이 임상 연구를 위해 2개의 상이한 농도(중간 및 고)의 완제 의약품(DP)을 생성한다(표 10). 세 번째(저) 농도는 제형 완충액과 동일한 희석 완충액으로 고농도를 1:1로 희석하여 클리닉에서 얻는다. 각 DP는 pH 7.0(0.02% [w/w] 폴리소르베이트 80, 5% [w/w] 소르비톨, 10 mM 메티오닌)의 인산나트륨/인산칼륨 완충액에서 제형화된다.
표 10: 1/2a 상 임상 연구를 위한 ExPEC10V 백신의 조성
EPA = 담체 단백질로 사용되는 유전적으로 탈독소화된 P. 애루기노사 외독소 A
a 활성 성분은 PS 항원 및 담체 단백질(EPA)로 구성된 생물학적으로 합성된 접합체이다; 용량은 PS 모이어티에 대해서만 계산된다.
b "저농도"는 "고농도"를 희석 완충액으로 1:1로 희석하여 클리닉에서 얻는다.
안전성 평가
주요 안전성 평가에는 명시된 국소 및 전신 AE, 명시되지 않은 AE, SAE, 신체 검사, 활력 징후 측정 및 임상 실험실 테스트가 포함된다.
면역원성 평가
수집된 혈청의 주요 면역원성 평가는, 멀티플렉스 ECL 기반 면역분석법에 의해 측정되는 백신에 의해 유발된 ExPEC10V 및 ExPEC4V 혈청형 특이적 총 IgG 항체 수준 및 멀티플렉스 포맷(MOPA)의 옵소닌 식세포 살상 분석법(OPKA)에 의해 측정되는 같은 ExPEC10V 및 ExPEC4V 혈청형 특이적 기능성 항체의 평가를 포함한다. Prevnar 13에 의해 유발된 폐렴구균 항체 역가의 면역원성 평가는 수행되지 않는다.
ExPEC10V에 의해 유도된 혈청 항체 수준은 멀티플렉스 전기화학발광(ECL) 기반 면역분석법에 의해 평가된다. 이 분석법은 상이한 대장균 O-LPS 항원 또는 담체 단백질 EPA로 코팅된 다중-스팟 96웰 포맷 마이크로플레이트에서 고결합 탄소 전극을 조합한다. 혈청 샘플에 존재하는 항원 특이적 항체의 수준은 SULFO-TAG로 표지된 2차 항체(항-인간 IgG)를 사용하여 검출된다. SULFO-TAG는 결합된 IgG 항체의 양에 비례하여 증가하는 강도로 전기 자극의 존재 하에 발광한다. 이 분석법은 ICH(International Conference on Harmonization) 권장 사항에 따라 검증되었다.
ExPEC10V에 의해 유도된 기능적 항체의 수준은 멀티플렉스 옵소닌 식세포 분석법(MOPA)으로 측정된다. 간단히 말해서, 열 불활성화된 혈청 샘플은 연속적으로 희석되고, 다양한 유형의 항생제에 특이적으로 내성이 있는 다른 대장균 균주와 함께 인큐베이션된다. 그 후, 인간 보체 및 식세포(HL60)를 반응물에 첨가하고, 두 번째 인큐베이션 기간 후, 반응 혼합물의 분취량을 선택적으로 특정 항생제에 내성인 균주의 성장을 허용하는 특정 항생제가 보충된 배지를 함유하는 다양한 PVDF 친수성 막 필터 플레이트에 옮긴다. 밤새 성장시킨 후, 생존 박테리아의 수를 결정하기 위해 콜로니 형성 단위(CFU)를 계산한다. 이 분석법은 ICH 권장 사항에 따라 검증되었다.
멀티플렉스 ECL 기반 면역분석법 및 MOPA에 의해 측정된 ExPEC10V 혈청형 항체 및 멀티플렉스 ECL 기반 면역분석법만으로 측정된 EPA의 경우, 모든 면역원성 시점에 대해 연구 백신접종군에 의해 면역원성의 다음 척도가 평가되고 표로 작성된다:
- 1일로부터 혈청 항체 역가가 2배 이상 및 4배 이상 증가한 참가자의 비율(백신접종 전)
- 기하 평균 역가(GMT)
- GMR: 기준선 이후/기준선 값으로부터 계산된 기준선으로부터의 배수 변화.
LTFU 기간 동안 각 혈청형에 있어서 면역원성에 대한 기술적 요약이 제공된다.
나중 상을 위한 용량 선택은 코호트 1(30일 결과)의 1차 분석 시점에 이용 가능한 증거 전체를 고려한다.
표 11:
코호트 1: 백신접종 일정
*ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 다당류(PS)로 구성된다.
** ExPEC4V는 담체 단백질인 슈도모나스 애루기노사로부터 유래한 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O6A 및 O25B의 O 항원 다당류(PS)로 구성된다.
*** Prevnar 13, 폐렴구균 13가 접합체 백신(디프테리아 CRM197 단백질)은 무독성 디프테리아 CRM197 단백질에 개별적으로 연결된 스트렙토코커스 뉴모니애 혈청형 1, 3, 4, 5, 6A, 6B, 7F, 9V, 14, 18C, 19A, 19F 및 23F의 캡슐 항원의 당류의 멸균 현탁액이다.
표 12:
코호트 2: 백신접종 일정
a ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 다당류(PS)로 구성된다.
연구의 코호트 2에 등록된 참가자의 무작위 배정 비율은 2:1(ExPEC10V:위약)이다. 코호트 2에 사용된 ExPEC10V 용량은 코호트 1의 1차 분석(30일) 결과를 기반으로 하였고, 이는 코호트 1에 사용된 고용량이다.
상태
전술한 연구의 코호트 1의 등록 및 백신접종이 완료되었다. 주요 안전성 문제는 확인되지 않았으며, ExPEC10V 백신은 허용가능한 안전성 프로파일을 갖는다.
코호트 1 임상 샘플의 면역원성의 분석이 수행되었고, 결과는 아래에 기재되어 있다.
코호트 2 백신접종은 ExPEC10V에 대한 고용량을 사용하여 시작되었고, 연구의 이 부분이 진행 중이다.
코호트 1 안전성 및 면역원성 결과
본원에 제시된 이러한 결과는 BAC1001 임상 연구(코호트 1)를 참조한다. 전체 분석 세트에는 416명의 참가자가 있었다. 각 참가자는 ExPEC10V의 단일 근육내 투여 용량 3개 중 1개 또는 ExPEC4V 또는 Prevnar의 활성 대조군 용량 2개 중 1개로 무작위 배정되었다; 104명은 ExPEC10V 저용량, 102명은 ExPEC10V 중간 용량, 104명은 ExPEC10V 고용량, 52명은 ExPEC4V(4:4:4:8 μg O1A, O2, O6A 및 O25B 다당류/용량), 54명은 Prevnar로 백신접종되었다. 총 413명의 참가자가 30일 방문을 완료했다. 392명(94.2%)의 참가자가 프로토콜 면역원성 분석에 따라 15일에 포함되었다.
안전성
전반적으로, 모든 ExPEC10V 용량은 내약성이 우수했다. 고용량에서 반응원성이 증가하는 경향이 있었고, ExPEC10V 고용량 반응원성은 홍반, 부기 및 구역을 제외하고는 Prevnar보다 낮거나 비슷했다. Prevnar와 대조적으로, ExPEC10V군에서 더 늦게 발병하는 국소 반응원성이 관찰되었고, 주사 부위 홍반 및 부기가 이러한 국소 사건을 경험한 참가자의 >90%에서 후기 발병 사건으로 보고되었다. 그러나 ExPEC10V의 반응원성 프로파일은 노인 집단에서 사용되는 다른 허가된 백신과 비교할 때 허용 가능하다.
면역원성
혈청형 특이적 혈청 항체(총 면역글로불린 G[IgG])의 수준을 측정하는 멀티플렉스 전기화학발광(ECL) 기반 면역분석법과 항체 매개 세균 옵소닌 식세포 살상을 측정하는 멀티플렉스 옵소닌 식세포 살상 분석법(MOPA)을 사용하여 기준선(백신접종 전 1일차)과 백신 접종 후 15일차에 백신 유발 면역 반응을 평가하였다.
항원 특이적 혈청 항체 수준(ECL)
O 항원 특이적 혈청 항체(총 IgG)의 수준은 테스트한 모든 ExPEC10V 용량 및 모든 백신 관련 혈청형에 대해 백신접종 후 15일차에 유의하게 증가했다. 고용량의 ExPEC10V 백신을 받은 대상체의 적어도 80%가 O25B, O6A, O2, O1A, O4, O15, O16 및 O18A를 포함하는 10개 혈청형 중 8개에 대해 백신접종 후 15일차까지 O 항원 특이적 항체 역가의 2배 이상의 증가를 나타냈음이 관찰되었다. ExPEC10V 중간 용량군의 경우, 대상체의 적어도 80%가 O25B, O2, O1A, O4 및 O15를 포함하는 10개 혈청형 중 5개에 대해 백신접종 후 15일차까지 O 항원 특이적 항체 역가의 2배 이상의 증가를 보여주고; ExPEC10V 저용량군의 경우, O25B, O2, O15 및 O16를 포함하는 10개 혈청형 중 4개에 대해 그러했다(도 4, 표 13). Prevnar 또는 ExPEC4V(비ExPEC4V 혈청형의 경우)를 투여받은 대상체 군에서 1일부터 15일까지 GMT의 최소 변화가 관찰되었다(도 4, 표 13).
ECL 분석의 경우, 모든 대상체를 분석하고 모든 면역원성 서브세트에 포함했다. 프로토콜 제외 기준에 따라 중대한 위반이 있는 대상체는 프로토콜별 분석에서 제외되었다. 기하 평균 역가(GMT), GMT FI(기하 평균 역가 배수 증가) 및 ECL 기반 면역분석에서 기준선으로부터 적어도 2배 및 4배 증가가 있는 참가자의 백분율이 하기 표 13에 요약되어 있다.
표 13. ECL 데이터 BAC1001 코호트 1
코호트 1: 1차 분석을 위한 출력
1= 기준선(1일)으로부터의 FI의 GM
2= 기준선(1일)으로부터 배수 증가가 있는 참가자의 백분율
CI=신뢰 구간; GM=기하 평균, GMT=기하 평균 역가; FI=배수 증가
GMT 및 GM FI에 대한 95% CI는 t-분포를 기반으로 한다.
Clopper-Pearson 방법을 사용하여 2배 및 4배 증가가 있는 참가자 백분율에 대한 95% CI를 얻는다.
데이터(도 4)에서 O75 다당류 항원에 대한 총 IgG 반응이 같은 양으로 투여된 다른 항원에 비해 더 낮음을 알 수 있는데(예를 들어, 1일 대비 15일에 적어도 2배의 증가가 있는 대상체의 비율이 더 낮음), 이는 놀라운 결과였다. 데이터는 또한 조성물 중 O75 다당류 항원의 양의 증가(즉, 고용량 8 μg 대 저용량 및 중간 용량 4 μg의 투여)가 O75 다당류 항원에 대한 유도된 면역 반응을 증가시켰음을 보여준다.
혈청 항체 기능성(MOPA)
부분 데이터는 코호트 1 MOPA 분석에 포함되었다. 표 14는 15일에서의 MOPA GMT 분석에 포함된 참가자 수를 보여준다. ExPEC10V에 의해 유도된 항체 반응의 기능성을 평가하기 위해 부분 데이터를 사용했지만 전체 데이터 세트를 사용할 수 있을 경우 분석 결론은 바뀌지 않았다.
표 14. MOPA GMT 분석에 포함된 참가자 수
MOPA에 의해 측정된 옵소닌 식세포 항체의 수준은 일반적으로 ECL 기반 면역분석법에 의해 측정된 O 항원 특이적 항체(총 IgG)의 수준과 일치했다. 기능적 항체의 증가된 수준은 테스트한 모든 용량군에서 10개의 ExPEC10V 혈청형 중 9개에 대해 15일에 관찰되었다(도 5).
다른 ExPEC10V 혈청형과 달리, 혈청형 O8의 경우, 검증된 MOPA 분석은 1일에 ExPEC10V 백신접종 후 15일차에 기능적 항체의 백신 매개 증가를 보여줄 수 없었지만(도 5), 혈청형 O8 총 IgG 역가의 증가가 관찰되었다(도 4). 검증된 분석이 기능적 O8 항체를 검출할 수 없는지를 구별하기 위한 연구가 시작되었다. 수정된 MOPA 분석법과 1일차 및 15일차 혈청을 사용한 후속 실험에서 성공적으로 2배 이상의 15일의 기능적 항체 증가를 나타냈으며(데이터 미제시), ExPEC10V 백신이 혈청형 O8에 대해서도 기능적 항체를 실제로 유도했음을 입증했다. 임상 개발을 위해, 수정된 O8 MOPA는 상당한 시간이 소요되는 분석법의 재검증과 임상 샘플의 재검사를 요하여, 처음에는 O8 다당류 항원을 포함하지 않는 백신 조성물 개발을 진행하기로 했다. 그러나 10가 ExPEC 백신 조성물의 O8 생체접합체가 대장균 O8 혈청형에 대한 기능적 항체를 유도한다는 것이 후속 실험으로부터 명백하며, 따라서 이러한 생체접합체는 아래 실시예에서 기재된 9가 백신 조성물에 성공적으로 첨가될 가능성이 있다.
최고 수준의 옵소닌 식세포 항체가 혈청형 O2에서 관찰되었다; 고용량의 해당 백신으로 백신접종한 대상체의 95%는 백신접종 후 15일차에 항-O2 옵소닌 항체 역가의 2배 이상의 증가를 보여주었다. 위에서 논의된 바와 같이 제한된 수준의 기능적 항체가 관찰된 O8 혈청형을 제외하고, 최저 수준의 옵소닌 식세포 항체가 혈청형 O75에서 관찰되었다; 고용량의 백신으로 백신접종한 대상체의 36%가 백신접종 후 15일차에 항-O75 옵소닌 항체 역가의 2배 이상의 증가를 보여주었다. 따라서 O75 혈청형에 대한 MOPA 데이터는 위에 기재된 이 혈청형에 대한 ECL 데이터와 일치하며, 이는 동일한 농도의 조성물 내의 몇몇 다른 접합체, 예를 들어, 대장균 O6, O1 또는 O2 접합체의 면역원성과 비교하여, 대장균 O75 항원 다당류의 접합체의 상대적으로 낮은 면역원성을 뒷받침한다. 또한, Prevnar 또는 ExPEC4V(비ExPEC4V 혈청형의 경우)를 투여받은 대상체 군에서 1일부터 15일까지 GMT의 최소 변화가 관찰되었는데(도 5), 이는 각각의 백신 조성물에 존재하지 않는 혈청형에 대한 예상과 일치한다.
기하 평균 역가(GMT), 기하 평균 배수 증가(GMR FI) 및 MOPA에서 기준선으로부터 적어도 2배 및 4배의 증가가 있는 참가자의 백분율은 10개의 혈청형 각각에 대해 표 15에 요약되어 있다.
표 15. MOPA 데이터 BAC1001 코호트 1
코호트 1: 1차 분석을 위한 출력
1= 기준선(1일)으로부터의 FI의 GM
2= 기준선(1일)으로부터 배수 증가가 있는 참가자의 백분율
CI=신뢰 구간; GM=기하 평균, GMT=기하 평균 역가; FI=배수 증가
GMT 및 GM FI에 대한 95% CI는 t-분포를 기반으로 한다.
Clopper-Pearson 방법을 사용하여 2배 및 4배 증가가 있는 참가자 백분율에 대한 95% CI를 얻는다.
용량 선택
각 용량군의 기준선으로부터 15일까지의 log10배 증가의 평균에 기반한 면역원성 용량 선택 알고리즘은, 2개의 분석 세트(PPI 및 FAS)와 2종의 분석법(ECL 및 MOPA)을 고려하는 이 시험의 코호트 2에 대한 ExPEC10V 고용량을 확인하였다.
혈청형 O2, O4, O15, O16 및 O18A의 경우, 고용량군은 두 분석법 모두에서 다른 2개의 ExPEC10V 용량과 비교하여 15일에 더 높은 GMT, GMR 및 2배 및 4배의 증가가 있는 참가자의 백분율을 나타냈다. 혈청형 O25B의 경우, 중간 용량군은 일반적으로 3개의 ExPEC10V 용량군 중에서 더 높은 GMT, GMR 및 2배 및 4배의 증가가 있는 참가자의 백분율을 나타냈다; 이 혈청형의 경우, O 항원 용량은 중간 및 높은 ExPEC10V 용량군 모두에 대해 동일했다(16 μg). 혈청형 O1A와 O6A 둘 다의 경우, 결과는 고용량과 중간 용량 사이에서 혼합되었다. 혈청형 O75에서, ExPEC10V 용량에 대해 측정 가능한 기능적 항체 반응이 있었다. 측정 가능한 기능적 항체 반응은 위에서 논의한 바와 같이 혈청형 O8에 대한 검증된 분석에서 검출되지 않았다. 비ExPEC4V 혈청형에서, 2개의 활성 대조군에서 낮은 기능적 항체 반응이 관찰되었다; 항체 반응은 백신 유발 반응이 아닌 기존 항체에서 나왔다. 이러한 결과를 바탕으로 BAC1001 임상시험의 코호트 2를 위해 ExPEC10V의 고용량을 선택하였다.
결론
ExPEC10V 백신은 강력한 항체 반응을 유도했으며 기준선 역가(1일)와 비교할 때 백신접종 후 15일에 모든 백신 관련 혈청형에 대해 O 항원 특이적 혈청 항체의 증가가 관찰되었다. 대장균 옵소닌 식세포 살상을 매개하는 ExPEC10V 유도 기능적 항체는 혈청형 O8을 제외한 모든 백신 관련 혈청형에 대해 검증된 MOPA에서 검출되었다. 혈청형 O8의 경우, 수정된 MOPA를 사용한 후속 연구에서 기능적 항체 반응을 측정했다. 특히, O75 반응은 같은 용량의 다른 혈청형보다 4 μg 및 8 μg 용량에서 더 약했으며, 이는 이 연구에서 놀랍고도 예측할 수 없는 발견이었다. 다가 당접합체 조성물에 의해 생성된 대장균 O75 혈청형에 대한 면역 반응을 개선하기 위해, 일 양태에서 본 발명은 혈청형 O75 항원 다당류의 용량을 예를 들어 일부 다른 혈청형의 용량의 약 1.2~8배, 예를 들어, 약 1.5~4배, 예를 들어 약 1.5~2.5배, 예를 들어, 일부 다른 혈청형, 예컨대, O6 또는 O1의 용량의 약 2배, 예를 들어, 약 16 μg까지 증가시키는데, 이는 가장 관련성이 높고 널리 퍼진 세 가지 혈청형 O1A, O2 및 O6A보다 높고 혈청형 O25B 항원 다당류와 유사하다. 초기 실험에서(예를 들어, 본 실시예의 위 및 실시예 5 및 6 참조, 즉, 본원에 개시된 ExPEC10V 백신을 사용한 임상 데이터가 이용 가능하기 전 참조) O75 항원 다당류의 용량은 기껏해야 O1A, O2 및 O6A 항원 다당류의 용량만큼 높았거나, 또는 실제로 특정 테스트한 군에서 O1A 및 O6A 항원 다당류보다 2배 더 낮았고, O25B 항원 다당류보다 2~4배 더 낮았다. 대조적으로, 본 발명의 특정 양태에서 O75의 용량은 따라서 O1, O2 및/또는 O6의 용량에 비해 실제로는 증가된다.
코호트 2 안전성 및 면역원성 결과
이 연구의 코호트 2에서 지난 5년 동안 UTI 병력이 있는 안정적인 건강 상태의 60세 이상의 참가자 총 약 420명이 등록되었고 2:1 비로 병렬로 무작위 배정되었다(전체 결과 분석이 수행된 세트에는 ExPEC10V(고용량)군의 참가자 278명과 위약군의 참가자 138명이 포함되었다).
안전성
전반적으로 ExPEC10V 백신은 내약성이 우수했다. 반응원성 프로파일은 코호트 1에서 ExPEC10V의 중간 및 고용량에서 관찰된 것과 일반적으로 비슷했다. 가장 빈번한 명시된 국소 AE는 통증/압통이었고 가장 빈번하게 보고된 전신 AE는 근육통, 두통 및 피로였다. 주사 부위 홍반 및 부기가 가장 흔한 후발성 사건이었다(최초 발병까지의 시간 > 백신접종 후 5일). ExPEC10V의 반응원성 프로파일은 노인 집단에서 사용되는 다른 허가된 백신과 비교할 때 허용 가능하다.
면역원성
혈청형 특이적 혈청 항체(총 IgG)의 수준을 측정하는 멀티플렉스 ECL 기반 면역분석법을 사용하여 기준선(백신접종 전 1일)과 백신접종 후 15일차 및 30일차에 백신 유발 항체 반응을 평가했다.
항원 특이적 혈청 항체 수준(ECL, 1일, 15일 및 30일)
ExPEC10V 백신은 증가하는 값의 GMT, GMT FI 및 1일부터 15일까지 기준선으로부터 역가의 적어도 2배의 증가가 있는 참가자의 백분율을 기준으로 모든 혈청형에 대해 면역원성이었다. 15일부터 30일까지 세 가지 측정치 모두에서 최소한의 변화가 있었다.
혈청형 O2, O4, O15 및 O16에서 가장 높은 항체 반응이 관찰되었는데, ExPEC10V로 백신접종한 참가자 중 적어도 80%가 백신접종 후 15일 및 30일까지 항체 반응의 2배 이상의 증가를 보여주었다. 혈청형 O1A, O6A 및 O25B의 경우, 참가자의 적어도 70%가 항체 반응의 2배 이상의 증가를 보여주고, 혈청형 O8 및 O18A의 경우, 참가자의 적어도 60%가 항체 반응의 2배 이상의 증가를 보여준다. 혈청형 O75의 경우, 더 낮은 항체 반응이 관찰되었으나, 참가자의 적어도 50%에서 항원 특이적 항체 반응의 2배 이상의 증가가 관찰되었다. 1일부터 15일 및 30일까지 GMT의 최소 변화가 위약을 받은 대상체 군에서 관찰되었다(표 16).
기하 평균 역가(GMT), GMT FI(기하 평균 역가 배수 증가) 및 ECL 기반 면역분석에서 기준선으로부터 적어도 2배 및 4배 증가가 있는 참가자의 백분율이 하기 표 16에 요약되어 있다.
표 16.
ECL 데이터 BAC1001 코호트 2(1일, 15일 및 30일)
코호트 2: 1차 분석을 위한 출력
1= 기준선(1일)으로부터의 FI의 GM
2= 기준선(1일)으로부터 배수 증가가 있는 참가자의 백분율
CI=신뢰 구간; GM=기하 평균, GMT=기하 평균 역가; FI=배수 증가
GMT 및 GM FI에 대한 95% CI는 t-분포를 기반으로 한다.
Clopper-Pearson 방법을 사용하여 2배 및 4배 증가가 있는 참가자 백분율에 대한 95% CI를 얻는다.
15일에서의 반응의 규모(GMT)는 모든 혈청형에 대해 코호트 1과 2 사이에서 유사했다.
실시예 8: 신규한 ExPEC 조성물 및 토끼에서의 면역원성
ExPEC 백신의 2개의 맞춤형 조성물(본원에서 맞춤형 제형이라고도 함)(ExPEC9V a 및 b, 표 17)을 포함하는 새로운 연구를 설계하였다. 이러한 맞춤형 제형은 혈청형 O8 다당류가 고갈되고 대장균 혈청형 O75에 대한 다당류 함량이 증가되었는데(ExPEC9V b), 이는 Ph1/2a 임상 시험에서 코호트 1을 분석하는 동안 이들 항원에 대해 낮은 면역원성이 관찰되었기 때문이다. 위에서 기재한 초기의 실험을 확인하기 위한 대조군으로서, ExPEC10V 조성물도 평가했다. 식염수 대조군(백신 미접종 군)도 포함되었다.
연구의 전반적인 목적은 상기 기재된 ExPEC10V와 비교하여 백신 조성의 변화(O8 다당류의 고갈 및 특히 O75 항원 다당류에 대한 용량 증가)가 백신 유발 면역 반응에 영향을 미치는지를 평가하는 것이었다. 특히, 다가 접합체 백신 조성물에서 예를 들어, 대장균 O6 항원 다당류의 접합체와 비교하여 대장균 O75 항원 다당류의 접합체의 양을 증가시키는 것이 실제로 혈청형 O75의 대장균에 대한 면역 반응을 선택적으로 개선하고, 따라서 구성 대장균 혈청형에 걸쳐 보다 균일하게 증가된 면역 반응을 초래하는지를 살펴보는 것이 목적이었다. 이를 위해, 다양한 제형의 ExPEC 백신에 의해 유도된 항체 반응을 뉴질랜드 백색 토끼(NZW)를 사용하여 확립된 면역원성의 전임상 모델에서 평가했다.
실험 설계
뉴질랜드 백색 토끼(NZW, 연구 시작 시 13주령)는 2주 간격으로 투여된 다양한 제형의 ExPEC 백신 또는 식염수로 3회의 근육내 면역화(500 μL/주사)를 받았다(표 17). 연구는 4개의 상이한 군을 포함하였다(표 18): 군 1(ExPEC10V)은 8 μg/용량의 O1A, O2, O6A, O4, O8, O15, O16, O18 및 O75 및 16 μg/용량의 O25B(즉, 각각 O1A, O2, O6A, O4-Glc+, O8, O15, O16, O18A 및 O75 항원 다당류 16 μg/mL 및 O25B 항원 다당류 32 μg/mL를 포함하는 조성물 0.5 mL, 각각의 항원 다당류는 EPA 담체 단백질에 개별적으로 생체접합됨, 상기 실시예 참조)를 투여받았다; 군 2(ExPEC9V a)는 8 μg/용량의 O1A, O2, O6A, O4, O15, O16, O18A 및 O75 및 16 μg/용량의 O25B(즉, 각각 O1A, O2, O6A, O4-Glc+, O15, O16, O18A 및 O75 항원 다당류 16 μg/mL 및 O25B 항원 다당류 32 μg/mL를 포함하는 조성물 0.5 mL, 각각의 항원 다당류는 EPA 담체 단백질에 개별적으로 생체접합됨, 상기 실시예 참조)를 투여받았다; 군 3(ExPEC9V b)은 8 μg/용량의 O1A, O2, O6A, O4, O15, O16 및 O18A 및 16 μg/용량의 O75 및 O25B(즉, 각각 O1A, O2, O6A, O4-Glc+, O15, O16 및 O18A 항원 다당류 16 μg/mL 및 O25B 및 O75 항원 다당류 32 μg/mL를 포함하는 조성물 0.5 mL, 각각의 항원 다당류는 EPA 담체 단백질에 개별적으로 생체접합됨, 상기 실시예 참조)를 투여받았다.
배합에 사용된 완충액은 6.19 mM KH2PO4, 3.81 mM Na2HPO4, 5% 소르비톨(w/w), 10 mM 메티오닌, 0.02% PS80 (w/w), pH 7.0을 함유하였다. 대조군(군 4)의 동물은 식염수(0.9% (w/v) 염화나트륨 용액)를 받았다. 각 실험군에는 10마리의 동물이 포함되었다. ELISA로 측정한 혈청 항체 수준(총 IgG)을 면역화 전(0일) 및 면역화 후(14일, 28일 및 42일) 평가했다.
표 17. 상이한 다가 ExPEC 백신 조성물.
표 18. 실험군.
잠재적인 주사 부위 반응을 각 용량 전, 각 투약일에 용량 후 약 6시간, 주사 후 7일 동안 매일 Draize 채점 시스템을 사용하여 모니터링했다. 증례 주사 부위 영향이 관찰되면 점수가 0이 될 때까지 매일 관찰을 계속했다.
개별적으로 전처리 동안 1회, 각 용량 후 3일 동안 매일, 그 후 매주 1회 동물의 체중을 쟀다(그램 단위). 건강이 좋지 않거나 바람직하지 않은 임상 효과에 대해 동물을 적어도 하루에 한 번 관찰했다. 투약일에 동물을 투약 전과 치료 약 6시간 후(주사 부위 검사와 동시에) 치료에 대한 반응에 대해 조사했다. 용량 전, 각 용량 후 6시간 및 24시간 후에 직장 디지털 온도계를 사용하여 체온을 모니터링하고 기록했다. 체온이 38~40℃의 토끼의 정상 범위를 벗어나는 경우, 체온이 이 값 이내로 돌아올 때까지 매일 추가 측정을 수행했다.
동물은 2주 간격으로 투여된 ExPEC10V, ExPEC9V a, ExPEC9V b 또는 식염수로 3회의 근육내 면역화를 받았다. 항체 수준은 0일(백신접종 전) 및 14일, 28일 및 42일(백신접종 후)에 ELISA에 의해 측정되었다.
ExPEC 백신 조성물에 포함된 각 O 항원에 의해 유도된 혈청 항체 수준을 Gen 5 소프트웨어를 사용하여 ELISA로 분석했다. 450 nm에서의 OD를 4 파라미터(4PL) 비선형 회귀 모델에서 분석하였다. 이중 12단계 적정 곡선을 기반으로 각 개별 샘플에 대해 최대 유효 농도의 절반(EC50)을 계산했다. 샘플 결과는 EC50 역가로 표시된다.
NZW 토끼에서 항원 특이적 혈청 항체 반응의 평가는 테스트한 모든 ExPEC 백신 조성물(ExPEC10V, ExPEC9V a 및 ExPEC9V b)이 식염수 대조군과 비교하여 백신접종 후 14일, 28일 및 42일에 모든 백신 항원에 대한 항체 반응의 유의한 증가를 유도함을 보여주었다(도 6). 테스트한 모든 ExPEC 백신 조성물의 두 번째 용량은 백신접종 후 14일부터 28일까지 항원 특이적 항체 반응의 유의한 증가에 의해 입증된 바와 같이 항체 반응을 부스트했다. ExPEC 백신의 세 번째 용량의 추가 부스트 효과는 특정 항원 및 조성물에 대해 명백했다.
O75 항원의 기하 평균 항체 역가(GMT)는 O75 다당류의 농도가 증가함에 따라 증가했다(도 6). 증가된 농도의 다당류 O75(16 μg)를 함유하는 ExPEC9V b 조성물은 단지 8 μg의 O75 다당류를 함유하는 ExPEC9V a 및 ExPEC10V 조성물과 비교하여 백신접종 후 14일, 28일 및 42일에 더 높은 O75 GMT 및 GMT 배수 증가를 유도하였다(표 19).
표 19. 다양한 ExPEC 백신 조성물에서 O75 항체 반응의 평가.
n.a.: 해당 없음; GMT: 기하 평균 항체 역가; CI: 신뢰 구간; 0일(백신접종 전 기준선)과 비교하여 GMT 배수 증가.
체중, 체온 및 주사 부위 반응의 평가는 테스트한 모든 ExPEC 백신 조성물이 동물에서 내약성이 우수하였음을 보여준다(데이터 미제시).
결론적으로, 테스트한 모든 ExPEC 백신 조성물은 NZW 토끼에서 면역원성이었으며, 식염수 대조군과 비교할 때 백신접종 후 14일, 28일 및 42일에 항원 특이적 혈청 항체 반응의 유의한 증가가 관찰되었다. 테스트한 모든 ExPEC 백신 조성물은 다당류 특이적 항체 반응을 부스트할 수 있었다. 또한, 테스트한 모든 ExPEC 백신 조성물은 동물에서 내약성이 우수하였고, 백신 관련 유해 사건은 관찰되지 않았다. 중요하게도, 증가된 농도의 O75 다당류를 함유하는 ExPEC9V b 조성물은 더 낮은 농도의 O75 다당류를 함유하는 조성물(ExPEC9Va 및 ExPEC10V)과 비교할 때 더 높은 O75 항체 반응(GMT 및 GMT 배수 증가)을 유도하였다. 따라서, ExPEC9V b 조성물에서 O75의 증가된 용량은 O75 혈청형에 대한 면역 반응을 개선하고, 따라서 이러한 조성물은 ExPEC9V b 조성물에서 혈청형에 걸쳐 보다 균일하게 증가된 면역 반응을 유도한다.
실시예 9. 신규한 ExPEC9V 조성물을 이용한 인간 대상 3상 효능 시험.
증가된 농도의 O75 항원 다당류를 갖는 9가 ExPEC 백신 조성물을 사용하여 인간에서의 효능 연구를 수행하였다. 연구 제목은 "과거 2년 동안 요로 감염의 병력이 있는 60세 이상 성인의 침습성 장외 병원성 대장균 질환 예방에서 ExPEC9V 백신접종의 효능, 안전성 및 면역원성을 평가하기 위한 무작위, 이중 맹검, 위약 대조, 다기관 3상 연구"이며, 본원에서는 'BAC3001' 연구로 지칭된다.
ExPEC9V는 60세 이상 성인의 침습성 장외 병원성 대장균(ExPEC) 질환(IED) 예방을 위해 개발 중인 9가 백신 후보이다. ExPEC9V는 이전 실시예에서 자세하게 기재된 바와 같이, 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75의 O 항원 다당류(PS)로 구성된다. ExPEC9V 백신은 모든 IED의 약 65%를 차지하는 ExPEC의 가장 널리 퍼진 O 혈청형 중에 있는 9개의 표시된 대장균 혈청형을 커버한다.
목적 및 종점
전반적인 설계
이는 지난 2년 동안 UTI 병력이 있는 60세 이상의 의학적으로 안정적인 성인 약 18,556명을 대상으로 실시되는 무작위, 이중 맹검, 위약 대조, 병렬군, 다기관, 중재적 3상 연구이다.
모든 참가자는 ExPEC9V 또는 위약에 대해 1:1 비로 병렬로 등록되고 무작위 배정되며 1일에 연구 백신(0.5 mL 근육내 주사(삼각근 내))을 받는다. 최초의 1차 종점(혈액, 기타 멸균 부위 또는 소변에서 미생물학적 확인 포함)에 대한 최종 분석은 연구에서 72건의 백신 혈청형 IED 사건이 관찰되었을 때 또는 늦어도 마지막 참가자가 백신접종 후 36개월 동안 추적 관찰되었을 때 발생한다. 두 번째 1차 종점(혈액 또는 기타 멸균 부위에서 미생물학적 확인 포함)은 최초의 1차 종점이 통계적 유의성을 보일 때 계층적 방식으로 테스트된다. 두 번째 1차 종점(혈액 또는 기타 멸균 부위에서 미생물학적 확인 포함)의 최종 분석의 경우, 두 번째 1차 종점에 따른 53건의 백신 혈청형 IED 사건을 관찰해야 한다. ExPEC9V 백신 조성물은 16 μg/mL의 각각의 O1A, O2, O6A, O4-Glc+, O15, O16 및 O18A 항원 다당류 및 32 μg/mL의 O25B 및 O75 항원 다당류를 포함하며, 각 항원 다당류는 EPA 담체 단백질에 개별적으로 생체접합된다. 예를 들어, 위 참조(예를 들어, 이는 위의 실시예 8의 토끼 면역화의 군 3에서 사용된 동일한 조성물임; 부형제는 실시예 7의 BAC1001 연구에서 사용된 ExPEC10V 백신에 대해 기술된 것과 동일하다). 위약은 0.9% w/v의 염화나트륨이다.
안전성 평가
주요 안전성 평가에는 SAE, 신체 검사 및 활력 징후가 포함된다. 또한, 명시된 국소 및 전신 AE 및 명시되지 않은 AE는 "안전성 서브세트"의 참가자, 즉 추가 평가를 위해 무작위화하기 전에 정보에 입각한 동의를 제공한 선택된 연구 현장의 약 4,000명의 참가자에 대해 기록된다.
면역원성 평가
면역원성의 평가의 경우, 각각의 9가지 백신 O 혈청형 및 담체 단백질 EPA에 대한 백신에 의해 유도된 IgG 항체 수준을 멀티플렉스 ECL 기반 면역분석으로 측정하고, 혈청형 특이적 기능적 항체를 MOPA로 측정한다. 면역원성 분석은 "면역원성 서브세트"의 참가자, 즉 추가 면역원성 평가를 위해 무작위화하기 전에 정보에 입각한 동의를 제공한 선택된 연구 현장의 약 1,200명의 참가자, 그리고 확인된 IED 사건이 있는 모든 참가자, 그리고 UTI 또는 급성 세균성 전립선염(ABP) 사건이 있는 면역원성 서브세트의 참가자에 대해 수행된다.
효능 평가
1차 목적은 ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75에 의해 유발된 최초의 IED 사건의 예방에서 위약과 비교하여 ExPEC9V의 효능을 입증하는 것이다. IED, UTI 또는 ABP로 정의된 사건은 전체 연구 기간(1,096일, 3년) 동안 모든 참가자에 대해 수집된다. 연구 추적관찰 동안 참가자는 UTI 또는 ABP의 임의의 징후 또는 증상을 경험하거나 전신 감염으로 인해 발생할 수 있는 증상의 임의의 새로운 발병 또는 악화를 경험하는 경우 가능한 한 빨리 연구 현장에 알릴 것이 기대된다. 또한, 모든 참가자는 과거의 입원 또는 UTI, ABP 또는 잠재적 IED였을 수 있고 현장에서 실시간으로 포착되지 않은 의료 사건에 대해 질문을 받게 될 것이다. IED(모든 참가자) 및 UTI 또는 ABP(면역원성 서브세트만)와 관련된 의료 접촉과 관련된 의료 자원 활용 데이터가 수집된다. 건강 관련 삶의 질을 측정하기 위해 SF-36 버전 2와 EQ-5D-5L의 두 가지 환자 보고 결과(PRO) 도구가 사용된다. 또한, 쇠약은 SPPB 및 쇠약 지수 점수를 사용하여 평가된다.
면역원성 평가
면역원성의 평가의 경우, 각각의 9가지 백신 O 혈청형 및 담체 단백질 EPA에 대한 백신에 의해 유도된 IgG 항체 수준을 멀티플렉스 ECL 기반 면역분석으로 측정하고, 혈청형 특이적 기능적 항체를 MOPA로 측정한다. 면역원성 분석은 "면역원성 서브세트"의 참가자, 즉 추가 면역원성 평가를 위해 무작위화하기 전에 정보에 입각한 동의를 제공한 선택된 연구 현장의 약 1,200명의 참가자, 그리고 확인된 IED가 있는 모든 참가자, 그리고 UTI 또는 ABP 사건이 있는 면역원성 서브세트의 참가자에 대해 수행된다. 1일 및 30일의 면역원성 혈액 샘플을 모든 참가자로부터 수집한다.
안전성 평가
주요 안전성 평가에는 SAE, 신체 검사 및 활력 징후가 포함된다. 또한, 명시된 국소 및 전신 AE 및 명시되지 않은 AE는 "안전성 서브세트"의 참가자, 즉 추가 평가를 위해 무작위화하기 전에 정보에 입각한 동의를 제공한 선택된 연구 현장의 약 4,000명의 참가자에 대해 기록된다.
효능 분석
첫 번째 1차 종점의 1차 분석은 ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75에 의해 유발되고 프로토콜별 효능(PPE) 모집단에서 위약군과 비교한 활성 백신(ExPEC9V)군에서 백신접종 후 적어도 29일 후에 발병한 적어도 1건의 IED 사건이 있는 참가자의 수를 평가한다. 두 번째 1차 종점의 1차 분석은 PPE 모집단에서 위약군과 비교하여 활성 백신(ExPEC9V)군에서 백신접종 후 적어도 29일 후에(30일부터) 발병한 ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75에 의해 유발된, 혈액 또는 기타 멸균 부위에서 미생물학적 확인을 통한 적어도 1회의 IED 사건이 있는 참가자 수를 평가한다. 추적관찰 시간도 고려된다. IED 사건이 있는 참가자의 경우, 추적관찰 시간은 백신접종과 최초의 사건 발생 사이의 시간으로 정의된다. IED 사건이 없는 참가자의 경우, 이는 백신접종과 마지막 방문(또는 연구를 중단한 참가자의 경우 마지막 접촉) 사이의 시간이다. VE ≤20%라는 귀무가설을 대립가설 VE >20%에 대해 검정한다.
단계적 계층적 테스트 전략이 다음의 종점에 적용된다:
일차:
-
ExPEC9V O 혈청형에 의해 유발된 혈액, 기타 멸균 부위 또는 소변의 미생물학적 확인을 통한 최초의 IED
-
ExPEC9V O 혈청형에 의해 유발된 혈액 또는 기타 멸균 부위의 미생물학적 확인을 통한 첫 번째 IED
이차:
-
ExPEC9V O 혈청형에 의해 유발된 모든 IED(참가자당 여러 IED 포함)
-
ExPEC9V O 혈청형에 의해 유발된 최초의 입원 IED 사건
-
ExPEC O 혈청형에 의해 유발된 패혈증에 대한 기준을 충족하는 최초의 IED 사건
-
ExPEC9V O 혈청형에 의해 유발된 최초의 균혈증 IED 사건
-
ExPEC9V O 혈청형에 의해 유발된 최초의 신우신염 사건
-
ExPEC9V O 혈청형에 의해 유발된 최초의 UTI
-
ExPEC9V O 혈청형에 의해 유발된 모든 UTI(참가자당 여러 UTI 포함)
-
임의의 ExPEC O 혈청형에 의해 유발된 최초의 IED 사건
-
임의의 ExPEC O 혈청형에 의해 유발된 최초의 신우신염 사건
-
임의의 ExPEC O 혈청형에 의해 유발된 최초의 UTI
이 테스트 전략에서, 두 번째 1차 종점은 첫 번째 1차 종점이 통계적 유의성을 보인 경우에만 테스트된다. 첫 번째 1차 종점이 72건의 사건으로 통계적 유의성을 보인 경우, 53건 미만의 사건이 해당 시점에 관찰되면 두 번째 1차 종점(혈액 또는 기타 멸균 부위에서 미생물학적 확인 포함)에 대한 중간 분석을 수행한다. 두 번째 1차 종점이 유의하지 않은 경우, 두 번째 1차 종점 정의에 따른 53건의 백신 혈청형 IED 사건이 관찰되었을 때 두 번째 1차 종점의 최종 분석이 수행된다. 또한 첫 번째 주요 2차 종점은 두 1차 종점이 모두 통계적 유의성을 보인 경우에만 테스트된다. 첫 번째 주요 2차 종점에는 추적관찰 기간이 끝날 때까지 백신접종 후 적어도 29일 후에 발병된 모든 ExPEC9V IED 사건(PPE)이 포함된다.
참가자는 아래 기준이 충족되고 독립적인 종점 심사 위원회(IEAC)에서 확인하는 경우 IED가 있는 것으로 간주된다.
IED 진단을 받은 성인 참가자는 다음이 있는 임의의 참가자이다:
* 다음 중 하나의 존재로 표시되는 전신 세균 감염의 징후 및 증상:
-
온도 <36.0℃(96.8℉) 또는 >38.0℃(100.4℉),
-
빈맥(HR) >90 bpm,
-
빈호흡(RR) >20회 호흡/분, 또는
-
WBC 수 <4 또는 >12 x 109/L 또는 10% 미성숙 (밴드) 형태,
그리고
* 다음의 배양에 의한 미생물학적 확인:
-
혈액 또는 임의의 기타 멸균 부위(예를 들어, 뇌척수액[CSF], 흉막)의 대장균,
및/또는
-
UTI 징후/증상이 있고 다른 식별 가능한 감염 부위가 없고 기준선으로부터 2점 이상의 순차적 장기 부전 평가(SOFA) 총 점수의 급성 변화가 있는 소변 내 대장균(콜로니 형성 단위/mL ≥105).
1차 및 2차 종점의 경우, 임의의 ExPEC9V O 혈청형(즉, O1A, O2, O4, O6A, O15, O16, O18A, O25B 또는 O75)에 의해 유발된 IED와 함께, O 혈청형 분석이 가능해야 하며 IED는 O1A, O2, O4, O6A, O15, O16, O18A, O25B 또는 O75 양성으로 확인되어야 한다. 임의의 ExPEC O 혈청형과 관련된 2차 종점의 경우, O 혈청형 분석을 사용할 수 없어야 한다. IEAC 판단에 따라 전신 감염이 대장균에만 기인할 수 없는 경우 배양 결과에 여러 병원체가 있는 증례는 1차 또는 2차 종점으로 간주되지 않는다. 혼합 병원체 및 대장균의 존재가 있는 증례는 민감도 분석에 포함된다.
참가자가 UTI의 징후 및 증상으로 의사 및/또는 연구 현장에 연락한 경우, 아래 기준을 충족하고 신우신염의 경우에 대해 IEC에서 확인하는 경우 참가자가 증상이 있는 UTI가 있는 것으로 정의된다.
문서화된 농뇨(백혈구(WBC) 수 ≥10개 세포/mm3)와 징후 및 증상에 대한 다음 정의 중 하나를 가진 소변 내 대장균 배양에 의한 미생물학적 확인(콜로니 형성 단위 ≥105/mL)이 있는 성인:
·
단순 UTI의 경우, 다음 징후 또는 증상 중 적어도 2개:
-
배뇨 장애,
-
빈뇨,
-
요절박, 또는
-
치골상부 통증.
·
복합 UTI(cUTI)의 경우:
-
다음 징후 또는 증상 중 적어도 2개:
o
오한, 경직 또는 열과 관련된 온기(예를 들어, 체온 ≥38.0℃),
o
배뇨 장애, 빈뇨 또는 요절박,
o
하복부 통증 또는 골반통, 또는
o
구역 또는 구토,
그리고,
-
다음 합병 요소 중 적어도 1개:
o
요폐력(남성 참가자),
o
현재 내재하는 요도 카테터,
o
폐쇄성 요로병증, 또는
o
임의의 관련된 기능적 또는 해부학적 이상.
·
다음 증상 중 적어도 2개를 동반하는 신우신염의 경우(요로의 근본적인 이상 여부에 관계없이):
-
오한, 경직 또는 열과 관련된 온기(예를 들어, 체온 ≥38.0℃), 또는
-
신체 검사에서 갈비척추각의 옆구리 통증 또는 압통, 또는
-
구역 또는 구토.
·
재발성 UTI(rUTI)의 경우:
-
지난 6개월 동안 2회의 UTI 빈도로 단순 및/또는 복합 UTI의 재발, 또는
-
1년에 적어도 3회의 빈도로 단순 및/또는 복합 UTI의 재발.
2차 종점의 경우, 임의의 ExPEC9V O 혈청형(즉, O1A, O2, O4, O6A, O15, O16, O18A, O25B 또는 O75)에 의해 유발된 UTI와 함께, O 혈청형 분석이 가능해야 하며 UTI는 O1A, O2, O4, O6A, O15, O16, O18A, O25B 또는 O75 양성으로 확인되어야 한다. 임의의 ExPEC O 혈청형과 관련된 2차 종점의 경우, O 혈청형 분석을 사용할 수 없어야 한다. 배양 결과에 여러 병원체가 있고 대장균의 존재가 있는 증례는 2차 종점에 대해 고려되지 않는다. 이러한 증례는 민감도 분석에 포함된다.
탐색적 종점으로서, IED(대장균의 미생물학적 확인 제외) 또는 UTI의 위의 정의를 충족하지만 P. 애루기노사에 대해 양성인 샘플(UTI의 경우 소변)이 있는 참가자는 각각 P. 애루기노사로 인한 침습성 질환 또는 P. 애루기노사 UTI가 있는 것으로 보고된다. P. 애루기노사에 대해서는 혈청형 분석을 수행하지 않는다. P. 애루기노사의 존재가 있는 혼합 병원체를 가진 샘플은 이 탐색적 종점에 대해 고려되지 않는다.
ABP에 대한 탐색적 효능 종점으로서, ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75에 의해 유발된 사건이 보고된다.
참가자가 ABP의 징후 및 증상으로 의사 및/또는 연구 현장에 연락하는 경우, 아래 기준을 충족하는 경우 참가자가 증상이 있는 ABP가 있는 것으로 정의된다.
문서화된 농뇨(WBC 수 ≥10개 세포/mm3)와 열 및 다음의 급성 발병을 수반한, 소변 내 대장균 배양에 의한 미생물학적 확인(콜로니 형성 단위 ≥105/mL)이 있는 성인:
·
자극성 배뇨 증상:
o
배뇨 장애,
o
빈뇨,
o
요절박, 또는
·
폐쇄성 배뇨 증상:
-
소변주저,
-
불완전 배뇨,
-
배뇨 힘주기,
-
약한 배뇨, 및
·
치골상부, 직장 또는 회음 통증.
당업자라면 광범위한 본 발명의 개념으로부터 벗어남이 없이, 상기에 기재된 구현예에 대한 변경이 이루어질 수 있음을 이해할 것이다. 따라서, 본 발명은 개시된 특정 구현예에 한정되지 않고, 본 설명에 의해 정의된 바와 같은 본 발명의 사상 및 범주 내에서의 변형을 포함하고자 함이 이해된다.
서열
서열번호 1
(글리코실화 공통 서열)
Asn-X-Ser(Thr), 여기서 X는 Pro을 제외한 임의의 아미노산일 수 있음
서열번호 2
(최적화된 글리코실화 공통 서열)
Asp(Glu)-X-Asn-Z-Ser(Thr), 여기서 X 및 Z는 Pro을 제외한 임의의 아미노산으로부터 독립적으로 선택됨
서열번호 3
(4개의 글리코실화 공통 서열을 포함하는 EPA 담체 단백질(EPA-4))
G SGGG DQNAT G SGGGKLAEEA FDLWNECAKA CVLDLKDGVR SSRMSVDPAI ADTNGQGVLH YSMVLEGGND ALKLAIDNAL SITSDGLTIR LEGGVEPNKP VRYSYTRQAR GSWSLNWLVP IGHEKPSNIK VFIHELNAGN QLSHMSPIYT IEMGDELLAK LARDATFFVR AHESNEMQPT LAISHAGVSV VMAQAQPRRE KRWSEWASGK VLCLLDPLDG VYNYLAQQRC NLDDTWEGKI YRVLAGNPAK HDLDIKDNNN STPTVISHRL HFPEGGSLAA LTAHQACHLP LEAFTRHRQP RGWEQLEQCG YPVQRLVALY LAARLSWNQV DQVIRNALAS PGSGGDLGEA IREQPEQARL ALTLAAAESE RFVRQGTGND EAGAASADVV SLTCPVAKDQ NRTKGECAGP ADSGDALLER NYPTGAEFLG DGGDVSFSTR GTQNWTVERL LQAHRQLEER GYVFVGYHGT FLEAAQSIVF GGVRARSQDL DAIWRGFYIA GDPALAYGYA QDQEPDARGR IRNGALLRVY VPRWSLPGFY RTGLTLAAPE AAGEVERLIG HPLPLRLDAI TGPEEEGGRV TILGWPLAER TVVIPSAIPT DPRNVGGDLD PSSIPDKEQA ISALPDYASQ PGKPPREDLK LGSGGG DQNA T
서열번호 4
(O4 GtrS 아미노산 서열)
MNNLIMNNWCKLSIFIIAFILLWLRRPDILTNAQFWAEDSVFWYKDAYENGFLSSLTTPRNGYFQTVSTFIVGLTALLNPDYAPFVSNFFGIMIRSVIIWFLFTERFNFLTLTTRIFLSIYFLCMPGLDEVHANITNAHWYLSLYVSMILIARNPSSKSWRFHDIFFILLSGLSGPFIIFILAASCFKFINNCKDHISVRSFINFYLRQPYALMIVCALIQGTSIILTFNGTRSSAPLGFSFDVISSIISSNIFLFTFVPWDIAKAGWDNLLLSYFLSVSILSCAAFVFVKGTWRMKVFATLPLLIIIFSMAKPQLTDSAPQLPTLINGQGSRYFVNIHIAIFSLLCVYLLECVRGKVATLFSKIYLTILLFVMGCLNFVITPLPNMNWREGATLINNAKTGDVISIQVLPPGLTLELRKK
서열번호 5
(예시적 O4
gtrS
핵산 서열)
ATGAATAATTTAATTATGAATAACTGGTGTAAATTATCTATATTTATTATTGCATTTATTTTGCTATGGCTTAGAAGGCCGGATATACTCACAAACGCACAATTTTGGGCAGAAGATTCCGTTTTCTGGTATAAGGACGCCTATGAGAACGGATTCTTAAGTTCACTAACAACGCCTAGGAATGGGTATTTCCAGACTGTTTCTACATTTATAGTTGGTCTGACTGCTTTATTAAATCCAGATTATGCACCTTTTGTTTCTAATTTTTTTGGCATAATGATTCGCTCAGTAATTATATGGTTTTTATTTACAGAAAGATTCAACTTCCTCACATTGACTACTAGGATTTTCTTATCTATTTATTTTCTATGCATGCCTGGATTGGATGAAGTTCATGCAAATATAACAAATGCACATTGGTATTTGTCATTATATGTATCAATGATCCTGATAGCTCGCAATCCAAGTTCAAAATCATGGAGGTTTCATGATATATTCTTTATCTTGCTATCCGGGCTCAGTGGCCCATTTATAATTTTCATTTTAGCAGCTTCATGCTTTAAATTTATAAATAATTGTAAAGATCATATTAGTGTAAGATCTTTCATAAATTTCTACTTGCGTCAGCCATACGCATTAATGATTGTTTGCGCTTTAATTCAAGGAACTTCTATAATTCTAACTTTCAATGGCACACGTTCCTCAGCACCGCTAGGATTCAGTTTTGATGTGATTTCGTCTATTATATCATCGAATATTTTTTTATTTACATTTGTCCCATGGGATATTGCAAAGGCTGGGTGGGATAATTTACTGTTATCTTATTTTTTGTCTGTTTCGATTTTGTCGTGTGCGGCCTTTGTTTTTGTTAAAGGTACGTGGCGAATGAAAGTATTTGCAACTTTACCATTGCTAATTATAATATTTTCAATGGCAAAACCACAATTGACAGACTCGGCACCTCAATTGCCAACACTTATTAATGGGCAAGGTTCAAGATACTTCGTAAATATACATATTGCGATATTCTCTTTGCTATGTGTTTACTTACTTGAGTGCGTCAGGGGGAAAGTGGCAACTTTATTTTCCAAAATATACTTAACAATTTTGCTATTCGTGATGGGATGTTTGAATTTTGTTATCACCCCACTCCCAAACATGAACTGGAGGGAAGGTGCTACTTTGATTAATAATGCAAAAACTGGTGATGTCATTTCGATTCAAGTGCTACCACCTGGCCTAACACTTGAACTAAGGAAAAAATAA
서열번호 6
(예시적 PglB 서열('야생형'))
MLKKEYLKNPYLVLFAMIILAYVFSVFCRFYWVWWASEFNEYFFNNQLMIISNDGYAFAEGARDMIAGFHQPNDLSYYGSSLSALTYWLYKITPFSFESIILYMSTFLSSLVVIPTILLANEYKRPLMGFVAALLASIANSYYNRTMSGYYDTDMLVIVLPMFILFFMVRMILKKDFFSLIALPLFIGIYLWWYPSSYTLNVALIGLFLIYTLIFHRKEKIFYIAVILSSLTLSNIAWFYQSAIIVILFALFALEQKRLNFMIIGILGSATLIFLILSGGVDPILYQLKFYIFRSDESANLTQGFMYFNVNQTIQEVENVDLSEFMRRISGSEIVFLFSLFGFVWLLRKHKSMIMALPILVLGFLALKGGLRFTIYSVPVMALGFGFLLSEFKAIMVKKYSQLTSNVCIVFATILTLAPVFIHIYNYKAPTVFSQNEASLLNQLKNIANREDYVVTWWDYGYPVRYYSDVKTLVDGGKHLGKDNFFPSFALSKDEQAAANMARLSVEYTEKSFYAPQNDILKTDILQAMMKDYNQSNVDLFLASLSKPDFKIDTPKTRDIYLYMPARMSLIFSTVASFSFINLDTGVLDKPFTFSTAYPLDVKNGEIYLSNGVVLSDDFRSFKIGDNVVSVNSIVEINSIKQGEYKITPIDDKAQFYIFYLKDSAIPYAQFILMDKTMFNSAYVQMFFLGNYDKNLFDLVINSRDAKVFKLKI
서열번호 7
(예시적 gtrA 아미노산 서열; 대장균 W3110 yfdG, GenBank: BAA16209.1)
MLKLFAKYTSIGVLNTLIHWVVFGVCIYVAHTNQALANFAGFVVAVSFSFFANAKFTFKASTTTMRYMLYVGFMGTLSATVGWAADRCALPPMITLVTFSAISLVCGFVYSKFIVFRDAK
서열번호 8
(예시적 gtrB 아미노산 서열 - 대장균 W3110 yfdH, GenBank: BAA16210.1)
MKISLVVPVFNEEEAIPIFYKTVREFEELKSYEVEIVFINDGSKDATESIINALAVSDPLVVPLSFTRNFGKEPALFAGLDHATGDAIIPIDVDLQDPIEVIPHLIEKWQAGADMVLAKRSDRSTDGRLKRKTAEWFYKLHNKISNPKIEENVGDFRLMSRDVVENIKLMPERNLFMKGILSWVGGKTDIVEYVRAERIAGDTKFNGWKLWNLALEGITSFSTFPLRIWTYIGLVVASVAFIYGAWMILDTIIFGNAVRGYPSLLVSILFLGGIQMIGIGVLGEYIGRTYIETKKRPKYIIKRVKK
서열번호 9
(예시적 O4
rfb
유전자좌 뉴클레오티드 서열 - O4-EPA 생산 균주 BVEC-L-00684f)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGTGAAAATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCAGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCGGGAATCACTTGCTGATGTTTCTGATTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCACCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCCGCTCGCAATTACTGGTCTGCTCTTGATAGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTATATGGTGATTTGCCTCATCCTGACGAGGTAAATAATACAGAAGAATTACCCTTATTTACTGAGACAACAGCTTACGCGCCAAGCAGCCCTTATTCCGCATCCAAAGCATCCAGCGATCATTTAGTCCGCGCGTGGAAACGTACCTATGGTTTACCGACCATTGTGACTAATTGCTCTAACAATTATGGTCCTTATCATTTCCCGGAAAAATTGATTCCATTGGTTATTCTCAATGCTCTGGAAGGTAAAGCATTACCTATTTATGGTAAAGGGGATCAAATTCGCGACTGGCTGTATGTTGAAGATCATGCGCGTGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGTGAAACTTATAACATTGGTGGGCACAACGAAAAGAAAAACATAGATGTAGTGCTCACTATTTGTGATTTGCTGGATGAGATTGTACCGAAAGAGAAATCTTATCGTGAGCAAATCACTTATGTTGCCGATCGTCCGGGACACGATCGCCGTTATGCGATTGATGCTGAGAATATTGGTCGCGAATTGGGATGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGGAAGACAGTGGAATGGTATCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAAGAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTCTGGGTAACTTGATTGCTCTTGATGTTCATTCCACTGATTATTGTGGCGATTTCAGTAACCCCGAAGGTGTGGCTGAAACCGTCAAAAAAATTCGCCCAGATGTTATTGTTAATGCTGCTGCTCATACCGCGGTAGATAAGGCTGAGTCAGAACCAGAATTTGCACAATTACTCAATGCGACCAGCGTTGAAGCAATTGCAAAAGCGGCTAATGAAGTTGGGGCTTGGGTAATTCATTACTCAACTGACTACGTCTTCCCTGGAAATGGCGACATGCCATGGCTCGAGACTGATGTAACCGCTCCGCTCAATGTTTATGGCAAAACCAAATTGGCTGGAGAAAGAGCATTACAAGAACATTGCGCAAAGCATCTTATTTTCCGTACCAGCTGGGTATATGCAGGTAAAGGAAATAACTTTGCCAAAACAATGTTACGTCTGGCAAAAGAGCGCGAAGAACTGGCTGTGATAAACGATCAGTTTGGCGCACCAACAGGTGCTGAATTGCTGGCTGATTGCACCGCTCATGCCATTCGCGTGGCATTAAAAAAACCAGAAGTTGCTGGCTTGTACCATCTGGTAGCAAATGGCACAACAACCTGGCACGATTACGCCGCGCTAGTATTCGAAGAAGCCCGTAAAGCAGGGATTGACCTTGCACTTAACAAACTCAACGCCGTACCAACAACGGCTTATCCTACTCCAGCCCGCCGTCCTCATAATTCTCGCCTCAATACCGAAAAGTTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTGGGCGTGAAACGTATGCTCAACGAATTATTTACGACTACGGCAATTTAACAAATTTTTGCATCTCGCTCATGATGCCAGAGCGGGATGAATTAAAAGGAATGGTGAAATGAAAACGCGTAAAGGTATTATTCTGGCTGGTGGTTCCGGCACTCGTCTTTATCCTGTGACGATGGCAGTGAGTAAACAACTGCTGCCGATTTATGATAAGCCGATGATTTATTATCCGCTTTCAACGCTTATGTTAGCGGGTATTCGCGATATTCTTATTATCAGTACGCCACAGGATACACCGCGTTTCCAACAATTGTTGGGGGACGGGAGTCAGTGGGGGCTTAATCTACAGTATAAAGTACAACCGAGTCCGGATGGCCTGGCGCAAGCGTTTATTATTGGTGAAGACTTTATTGGTGGTGATGATTGTGCACTCGTACTTGGCGATAATATCTTCTATGGACACGACTTGCCGAAATTAATGGAAGCTGCTGTTAACAAAGAAATCGGTGCAACGGTATTTGCTTATCACGTCAATGATCCTGAACGTTATGGTGTCGTGGAGTTTGATAATAACGGTACTGCAATTAGCCTGGAAGAAAAACCGCTGGAACCAAAAAGTAACTATGCGGTTACTGGGCTTTATTTCTATGACAATGATGTTGTAGAAATGGCGAAAAACCTTAAGCCTTCTGCCCGTGGCGAACTGGAAATTACCGATATTAACCGTATTTATATGGAGCAGGGACGTTTGTCTGTCGCTATGATGGGGCGTGGTTATGCCTGGTTGGATACTGGTACACATCAAAGTCTTATTGAAGCAAGTAACTTCATTGCCACCATTGAAGAGCGTCAGGGATTAAAGGTATCTTGCCCGGAAGAGATTGCTTACCGTAAAGGGTTTATTGATGCTGAGCAGGTGAAAGTATTAGCCGAACCGCTGAAGAAAAATGATTATGGTCAGTATCTGCTAAAAATGATTAAAGGTTATTAATAAAATGAACGTAATTAAAACTGAAATTCCTGATGTGCTGATTTTTGAACCAAAAGTTTTTGGTGATGAACGTGGCTTCTTTTTTGAGAGTTTTAACCAGAAAGTATTTGAAGAAGCTGTAGGACGGAAGGTTGAATTTGTTCAGGATAACCATTCTAAGTCTAAAATAAATGTATTGCGTGGGATGCATTATCAAACACAAAATACTCAAGGAAAACTGGTTCGGGTAATTTCTGGTTCAGTATATGATGTTGCCGTAGATTTAAGAGAAAAATCAAAGACATTTGGCAAATGGGTGGGTGTAGAATTATCTGGGAATAATAAAAGACAATTGTGGATCCCCGAAGGTTTTGCCCATGGTTTTTATGTGTTGGAGGAGAATACCGAATTTGTTTATAAATGTACCGATACTTATAACCCTGCTCATGAACACACATTGCTATGGAATGATCCAACTATCAATATAAGTTGGCCAATCATACAAAACTGCAAGCCAATTATTTCTGAAAAAGATGCTAATGGACATCTTTTTTCACATAAAACCTATTTCTGAAATGCAATATTATGAGTTTAATTAGAAACAGTTTCTATAATATTGCTGGTTTTGCTGTGCCGACATTAGTTGCAGTCCCTGCTTTGGGGATTCTTGCCAGGCTGCTTGGACCGGAGAATTTTGGACTTTTCACACTAGCATTCGCTTTGATAGGATATGCAAGTATTTTCGACGCCGGGATTAGTCGAGCTGTAATCAGAGAAATCGCTCTTTATCGAGAAAGTGAAAAAGAGCAAATACAAATTATTTCGACAGCAAGTGTAATCGTACTATTCTTAGGGGTGGTTGCAGCTTTGTTACTTTATTTTAGTAGTAATAAAGTTGTTGAGTTATTGAATGTTAGTTCCGTTTATATTGAAACAGCAGTGCGTGCATTCTCTGTTATTTCATTTATAATACCTGTGTATCTGATTAACCAGATTTGGCTTGGTTATCTGGAAGGGCTAGAAAAATTTGCAAATATAAATGTTCAGAGAATGATTTCTAGCACAAGCTTGGCTATATTACCAGTGATATTTTGTTATTACAATCCCTCGTTGCTTTATGCTATGTATGGGTTGGTGGTTGGGCGTGTGATTTCATTTTTGATTAGCGCAATAATTTGTCGAGATATTATTCTTAAAAGTAAACTTTACTTTAATGTGGCAACTTGCAATCGTCTTATCTCTTTTGGTGGATGGATAACAGTTAGTAATATCATAAGCCCAATCATGGCATATTTCGACCGCTTTATCATCTCTCATATTATGGGGGCTTCGAGAATTGCATTTTATACAGCGCCCTCAGAGGGTGTATCAAGGTTAATTAATATCCCATATGCTTTGGCAAGAGCTCTATTTCCTAAATTGGCATATAGCAATAATGATGATGAACGAAAAAAATTACAACTACAGAGCTACGCAATTATAAGCATTGTATGTCTACCCATAGTTGTTATTGGTGTCATTTTTGCCTCATTCATAATGACAACATGGATGGGACCTGATTATGCCTTAGAAGCAGCAACTATCATGAAAATACTTCTTGCTGGTTTTTTCTTTAACTCTTTAGCGCAAATACCTTATGCATACTTGCAATCTATCGGAAAGTCAAAAATTACCGCATTTGTGCATCTCATAGAACTTGCGCCATACTTATTATTATTGTATTACTTCACAATGCATTTCGGCATAATTGGCACGGCAATCGCTTGGTCACTTAGAACATTTTGTGATTTTGTTATACTACTTTCGATATCGAGAAGAAAATGATTGCGGTTGATATTGCGCTTGCAACCTACAATGGTGCTAATTTTATTCGGCAACAGATTGAATCTATCCAGAAACAAACTTATAGAAATTGGCGTCTTATAATAAGTGATGATAACTCGAGTGATGATACTGTTGATATTATTAAGGATATGATGTCTAACGACAGTCGTATCTATTTGGTAGGAAATAAAAGACAAGGAGGGGTTATTCAGAACTTTAATTATGCTCTTTCACAAACTACATCTGAAATTGTGTTACTATGTGACCAGGATGACATTTGGCCGGAGGAGCGTCTGGAAATTCTTATAGATAAATTTAAGGCCTTGCAGCGTAATGATTTTGTTCCGGCAATGATGTTTACTGATTTGAAATTAGTAGACGAAAATAATTGTTTGATTGCAGAAAGTTTTTATCGAACGAATAATATTAATCCACAAGATAATCTGAAAAATAATAATCTTCTCTGGCGTTCAACGGTATATGGCTGTACTTGCATCATGAATAAGAAACTTGTTGATATTGCATTGCCTATACCTACATATGCACATATGCATGATCAATGGTTGGCATTATTAGCGAAGCAATATGGTAACATTTTTTATTTCGACTATGCGTCTGTTCGTTATAGGCAACATTCTACAAATGTTGTTGGTGGTAGAAATAAAACGCCATTTCAAAAATTTAATTCCATACAAAAAAACCTAAAAAGGATTAATTTGCTAGTGGATAGAACTGTTGCTTTAATTAAATCAAATAACGATTTCTATCCAGGGAATAAAATGGAAAATAAAATTGATTACTTAAAATTTGGAGTGAATGAAGTATTACCTTATCTTTTTAAAGGAAACAAGAAAGTTTTTTCACTTTGTGTATTAATTAGTTTGGCATTACAAAAATGATATATTTATTATTTTTTTTTGCACTGTTTATGATCTGTACGTTTTTAACACACAGGCGACAGGCATTATATGTTGTATCTGCGTTAGTATTTCTTTTTTTGGCTTTAACCTATCCATCAGGAGGGGACTGGATAGGTTATTTTCTCCATTATGACTGCATGGTTAATGAGCAGTGTAATAATGGTTTTATAATGTTTGAACCTGGATATGAATTAATTGTTTCCTTATTTGGATATTTGGGATTTCAGACAATTATTATTTTTATAGCCGCTGTAAATGTAATTCTAATATTAAATTTTGCAAAGCATTTTGAAAACGGAAGTTTTGTTATTGTTGCGATAATGTGCATGTTCCTTTGGAGTGTTTATGTTGAGGCGATTAGACAGGCTCTGGCCTTATCTATAGTTATATTTGGGATTCATTCTCTTTTTTTGGGTAGAAAAAGGAAATTTATAACATTAGTATTATTTGCGTCAACTTTCCATATAACTGCTTTGATTTGTTTTCTTCTAATGACTCCTCTATTTTCAAAGAAATTAAGCAAGATAATAAGTTATAGCCTATTAATTTTCAGTAGCTTCTTTTTCGCTTTTTCTGAAACCATATTAAGTGCACTCCTTGCAATTTTGCCAGAAGGATCCATTGCCAGTGAAAAATTAAGTTTTTACTTAGCAACCGAGCAATACAGGCCACAGTTATCTATTGGGAGTGGCACTATTCTTGACATTATACTTATTTTTCTGATATGTGTAAGTTTTAAACGAATAAAGAAATATATGCTCGCTAATTATAATGCTGCAAATGAGATATTGCTTATTGGTTGCTGTCTTTATATTTCTTTCGGTATTTTTATCGGGAAAATGATGCCAGTTATGACTCGCATTGGTTGGTATGGTTTTCCATTTGTTATAGTACTTCTTTATATTAACTTGGGTTATTCAGAATATTTTAAGAGGTATATAAATAAAAGAGGGTGTGGGTATAGCAAATTATTAATTGCTTTTTATTTTTTGCTACAAATTTTGCGACCATTAACATATGATTATAGCTATTATAATATAATGCACCAGGATACTTTGCTGAATAGGTTTGATGCATTAGATGATGCATCATTAAGACAATCAGCGAAGAGAAAATGTTTCGATTTGGGAAAGATAGGATATGGTTTCTTATGTAGTATATAATATCCTGCATTCATTCGGATAATTTCCTATGGAAGTGTCCTTTGCTCTGTCTGTCCTCATTTGTTGAAATTTTATGTTAATAAGAAGCTTTAGATAACCACTTAGGAACTGTATGTTTGATCTGTCCAAAAATTATATTATTGTAAGTGCGACGGCGCTGGCTTCCGGAGGTGCATTAACTATATTAAAGCAATTTATAAAACATGCATCACAAAATTCAAATGACTATATTATGTTTGTATCTGCGGGATTGGAGTTGCCGGTCTGTGATAACATCATTTACATAGAAAACACACCAAAAGGATGGTTGAAAAGAATATATTGGGATTGGTTCGGTTGTCGGAAGTTTATCTCGGAACATAAGATTAACGTTAAGAAAGTAATTTCTCTACAAAATTCCAGTTTGAATGTTCCTTACGAACAGATTATTTACTTGCACCAGCCAATTCCTTTTAGTAAAGTTGATTCTTTTTTAAAAAATATCACATCCGATAACGTAAAGCTTTTTTTATATAAAAAGTTTTATTCCTATTTTATATTTAAATATGTGAATGCCAATACAACCATCGTAGTGCAAACGAATTGGATGAAAAAAGGAGTGCTGGAGCAATGTGATAAAATTAGTACCGAAAGGGTCCTTGTTATAAAACCTGATATCAAAGCATTTAATAATACTAATTTTGATGTAGATATGGATGTATCTGCAAAAACACTCTTATATCCAGCGACACCACTTACCTATAAAAATCATTTGGTCATTCTGAAGGCGTTGGTTATTTTAAAGAAAAAGTATTTTATAGATGATCTGAAATTCCAAGTGACTTTTGAAAAGAATAGGTACAAAAATTTTGATAAGTTTGTGCAATTAAATAACTTAAGCAAAAACGTTGATTATCTCGGCGTTCTTTCATACTCGAACTTGCAAAAAAAATATATGGCGGCATCTTTAATCGTTTTTCCTAGCTATATCGAATCATATGGGTTACCACTCATCGAAGCTGCTAGTTTAGGAAAAAAAATCATTAGTAGTGATCTTCCTTATGCCCGGGATGTTTTAAAGGATTATAGCGGCGTAGATTTTGTAATTTACAATAATGAAGATGGCTGGGCTAAGGCGTTGTTTAATGTTTTAAATGGCAATTCGAAGCTCAATTTTAGGCCTTATGAAAAAGATAGTCGTTCATCTTGGCCACAGTTCTTCTCTATTTTGAAATAAGGTGTATTATGTTTAATGGTAAAATATTGTTAATTACTGGTGGTACGGGGTCTTTCGGTAATGCTGTTCTAAGACGTTTTCTTGACACTGATATCAAAGAAATACGTATTTTTTCCCGGGATGAAAAAAAACAAGATGACATGAGGAAAAAATATAATAATCCGAAACTTAAGTTCTATATAGGTGATGTTCGCGACTATTCGAGTATCCTCAATGCTTCTCGAGGTGTTGATTTTATTTATCATGCTGCAGCTCTGAAGCAAGTACCTTCCTGCGAATTCCACCCAATGGAAGCTGTAAAAACGAATGTTTTAGGTACGGAAAACGTACTGGAAGCGGCAATAGCTAATGGAGTTAGGCGAATTGTATGTTTGAGTACAGATAAAGCTGTATATCCTATCAATGCAATGGGTATTTCCAAAGCGATGATGGAAAAAGTAATGGTAGCAAAATCGCGCAATGTTGACTGCTCTAAAACGGTTATTTGCGGTACACGTTATGGCAATGTAATGGCATCTCGTGGTTCAGTTATCCCATTATTTGTCGATCTGATTAAATCAGGTAGACCAATGACGATAACAGACCCTAATATGACTCGTTTCATGATGACTCTCGAAGACGCTGTTGATTTGGTTCTTTACGCATTTGAACATGGCAATAATGGTGATATTTTTGTCCAAAAGGCACCTGCGGCTACCATCGAAACGTTGGCTATTGCACTCAAAGAATTACTTAATGTAAACCAACACCCTGTAAATATAATCGGCACCCGACACGGGGAAAAACTGTACGAAGCGTTATTGAGCCGAGAGGAAATGATTGCAGCGGAGGATATGGGTGATTATTATCGTGTTCCACCAGATCTCCGCGATTTGAACTATGGAAAATATGTGGAACATGGTGACCGTCGTATCTCGGAAGTGGAAGATTATAACTCTCATAATACTGATAGGTTAGATGTTGAGGGAATGAAAAAATTACTGCTAAAACTTCCTTTTATCCGGGCACTTCGGTCTGGTGAAGATTATGAGTTGGATTCATAATATGAAAATTTTAGTTACTGGCGCTGCAGGGTTTATCGGTCGAAATTTGGTATTCCGGCTTAAGGAAGCTGGATATAACGAACTCATTACGATAGATCGTAACTCTTCTTTGGCGGATTTAGAGCAGGGACTTAAGCAGGCAGATTTTATTTTTCACCTTGCTGGGGTAAATCGTCCCGTGAAGGAGTGTGAATTTGAAGAGGGAAATAGTAATCTAACTCAACAGATTGTTGATATCCTGAAAAAAAACAATAAAAATACTCCTATCATGCTGAGTTCTTCCATCCAGGCTGAATGTGATAACGCTTATGGAAAGAGTAAAGCAGCTGCGGAAAAAATCATTCAGCAGTATGGGGAAACGACAAACGCTAAATATTATATTTATCGCTTGCCGAATGTATTCGGTAAGTGGTGTCGACCAAATTATAACTCCTTTATAGCAACTTTCTGCCATCGCATTGCAAATGATGAAGCTATTACAATTAATGATCCTTCAGCAGTTGTAAATCTGGTGTATATAGATGACTTTTGTTCTGACATATTAAAGCTATTAGAAGGAGCGAACGAAACTGGTTACAGGACATTTGGTCCAATTTATTCTGTTACTGTTGGTGAAGTGGCACAATTAATTTACCGGTTTAAAGAAAGTCGCCAAACATTAATCACCGAAGATGTAGGTAATGGATTTACACGTGCATTGTACTCAACATGGTTAAGTTACCTGTCTCCTGAACAGTTTGCGTATACGGTTCCTTCTTATAGTGATGACAGAGGGGTATTCTGTGAAGTATTGAAAACGAAAAACGCGGGCCAGTTTTCGTTCTTTACTGCGCATCCAGGAATTACTCGGGGTGGTCATTATCATCATTCCAAAAATGAGAAATTTATTGTCATCCGAGGAAGTGCTTGTTTCAAATTTGAAAATATTGTCACGAGTGAACGATATGAACTTAATGTTTCCTCTGATGATTTTAAAATTGTTGAAACAGTTCCGGGATGGACGCATAACATTACTAATAATGGCTCGGATGAGCTAGTTGTTATGCTTTGGGCAAATGAAATATTTAATCGTTCTGAACCAGATACTATAGCGAGAGTTTTATCGTGAAAAAATTGAAAGTCATGTCGGTTGTTGGGACTCGTCCAGAAATTATTCGACTCTCGCGTGTCCTTGCAAAATTAGATGAATATTGTGACCACCTTATTGTTCATACCGGGCAAAACTACGATTATGAACTGAATGAAGTTTTTTTCAAAGATTTGGGTGTTCGCAAACCTGATTATTTTCTTAATGCCGCAGGTAAAAATGCAGCAGAGACTATTGGACAAGTTATCATTAAAGTTGATGAGGTCCTTGAACAGGAAAAACCAGAAGCCATGTTAGTACTTGGCGATACTAACTCCTGTATTTCAGCAATACCAGCAAAGCGTCGAAGAATTCCGATCTTCCATATGGAGGCTGGGAATCGTTGTTTTGACCAACGCGTACCGGAAGAAACTAACAGAAAAATAGTTGATCATACCGCTGATATCAATATGACATATAGTGATATCGCGCGTGAATATCTTCTGGCTGAAGGTGTACCAGCCGATAGAATTATTAAAACCGGTAGCCCAATGTTTGAAGTACTCACTCATTATATGCCGCAGATTGATGGTTCCGATGTACTTTCTCGCCTGAATTTAACACCTGGGAATTTCTTTGTGGTAAGTGCCCACAGAGAAGAAAATGTTGATACCCCTAAACAACTTGTGAAACTGGCGAATATACTTAATACCGTGGCTGAAAAATATGATGTCCCGGTAGTTGTTTCTACTCATCCTCGCACTCGTAACCGCATCAACGAAAACGGTATTCAATTCCATAAAAATATCTTGCTTCTTAAGCCATTAGGATTTCACGATTACAACCATCTGCAAAAAAATGCACGTGCTGTTTTATCGGATAGTGGGACTATTACAGAAGAGTCCTCCATTATGAACTTCCCTGCACTCAATATACGAGAAGCGCACGAACGCCCGGAAGGCTTCGAAGAAGGGGCAGTAATGATGGTCGGTCTTGAATCTGATCGCGTTTTACAGGCATTAGAAATTATTGCAACACAGCCTCGTGGAGAAGTACGCTTACTTCGTCAGGTTAGTGACTATAGCATGCCAAATGTTTCAGATAAAGTTCTGCGTATTATCCATTCATATACTGACTACGTTAAACGGGTTGTCTGGAAGCAATACTAATGAAACTTGCATTAATCATTGATGATTATTTGCCCCATAGCACACGCGTTGGGGCTAAAATGTTTCATGAGTTAGGCCTTGAATTACTGAGCAGAGGCCATGATGTAACTGTAATTACGCCTGACATCTCATTACAAGCAATTTATTCTATTAGTATGATTGATGGTATAAAGGTTTGGCGTTTCAAAAGTGGACCTTTAAAGGATGTAGGTAAGGCTAAACGTGCCATAAATGAAACTCTTTTATCTTTTCGCGCATGGCGCGCATTTAAGCACCTCATTCAACATGATACATTTGATGGTATCGTTTATTATTCCCCCTCTATTTTTTGGGGCGACTTGGTTAAAAAAATAAAACAACGATGCCAGTGCCCAAGCTATCTGATCCTAAGGGATATGTTTCCACAGTGGGTCATTGATGCAGGTATGTTGAAAGCCGGTTCACCAATTGAAAAATATTTTAGGTATTTTGAAAAAAAGTCATATCAGCAGGCTGGCCGGATAGGGGTAATGTCTGATAAGAATCTTGAGATATTTCGCCAGACCAATAAAGGTTATCCGTGTGAAGTTTTACGTAATTGGGCCTCAATGACTCCTGTGTCTGCCAGCGATGATTATCATTCACTTCGTCAAAAATACGATCTAAAAGATAAAGTCATTTTTTTCTATGGCGGTAATATTGGGCATGCTCAGGATATGGCAAACTTAATGCGCCTTGCGCGTAATATGATGCGTTATCATGATGCTCATTTCCTGTTTATAGGGCAGGGTGATGAAGTTGAGCTGATAAAATCTCTTGCTGCAGAATGGAATTTAACTAATTTCACTCATCTACCTTCAGTGAACCAGGAAGAGTTTAAATTAATTTTATCTGAAGTTGATGTCGGCCTGTTCTCCCTTTCATCTCGCCATTCTTCACATAATTTCCCCGGAAAATTACTAGGGTATATGGTTCAATCAATCCCGATCCTTGGGAGTGTGAATGGCGGCAATGATTTAATGGATGTAATTAATAAGCACAGAGCCGGTTTCATTCATGTTAATGGTGAAGATGATAAACTGTTTGAATCTGCACAATTGCTTCTTAGTGATTCAGTTTTAAGAAAACAGCTAGGTCAGAACGCTAATGTGTTGTTAAAGTCTCAATTTTCGGTTGAATCGGCGGCACATACTATCGAAGTCCGACTGGAGGCTGGAGAATGCGTTTAGTTGATGACAATATTCTGGATGAACTTTTTCGCACTGCAGCAAATTCTGAACGTTTGCGCGCTCATTATTTATTGCACGCATCTCATCAGGAGAAGGTTCAACGTTTACTTATTGCATTTGTACGCGACAGCTATGTTGAACCCCATTGGCATGAGTTACCGCATCAGTGGGAAATGTTTGTCGTCATGCAAGGGCAATTAGAAGTTTGTTTGTATGAGCAAAATGGTGAGATCCAAAAACAGTTTGTTGTTGGAGACGGTACGGGAATAAGCGTCGTGGAATTTTCCCCAGGAGATATACATAGTGTCAAATGCCTGTCACCAAAAGCCCTTATGTTGGAGATAAAGGAGGGGCCATTTGACCCACTCAAAGCTAAGGCTTTTTCTAAGTGGTTATAGGGCGATACACCACCGTTTATTCTTCTATCTTATTCTATACATGCTGGGTTACCATCTTAGCTTCTTCAAGCCGCGCAACCCCGCGGTGACCACCCCTGACAGGAGTAGCTAGCATTTGACCACCCCTGACAGGATTAGCTAGCATATGAGCTCGAGGATATCTACTGTGGGTACCCGGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATAT
서열번호 10
(EPA 담체 단백질에 대한 예시적 신호 서열)
MKKIWLALAG LVLAFSASA
서열번호 11
(예시적 O1A
rfb
유전자좌 뉴클레오티드 서열 - O1A-EPA 생산 균주 stGVXN4411 및 stLMTB10217)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCGTGAAGATACTTGTTACTAGGGGCGCAGGATTTATTGGTTCTGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCTGGAATCACTTGCTGATGTTTCTGACTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCTGCTGCAATGGCGCGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTGGATCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCGGCTCGCAATTACTGGTCTGCTCTTGATGGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTCTATGGTGATTTGCCTCATCCTGACGAAGTAAATAATAAAGAACAATTACCCCTCTTTACTGAGACGACAGCTTACGCGCCTAGTAGTCCTTATTCCGCATCAAAAGCATCCAGCGATCATTTAGTCCGCGCGTGGAAACGTACCTATGGTTTACCGACTATTGTGACTAACTGTTCGAATAACTACGGTCCTTATCACTTTCCGGAAAAATTGATTCCACTAGTAATTCTTAATGCTCTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGGGATCAAATTCGTGACTGGCTGTATGTTGAAGATCATGCGCGTGCGTTATATACCGTAGTTACTGAAGGTCAAGCGGGTGAAACCTATAACATTGGCGGACACAACGAAAAGAAAAACATCGATGTTGTGCTGACTATTTGTGATTTGTTGGACGAGATAGTCCCGAAAGAGAAATCTTATCGTGAGCAAATTACTTATGTTGCTGATCGCCCAGGGCATGATCGCCGTTATGCGATTGATGCTGAGAAGATTGGTCGCGAATTGGGATGGAAACCACAGGAAACGTTTGAGAGTGGGATTCGTAAAACGGTGGAATGGTATTTGGCTAATGCAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTCTGGGTAATTTGATTGCTCTTGATGTTCACTCCACTGATTACTGTGGTGATTTTAGTAACCCTGAAGGTGTGGCTGAAACAGTCAAAAGAATTCGACCTGATGTTATTGTTAATGCTGCGGCTCACACCGCAGTAGATAAGGCTGAGTCAGAACCCGAATTTGCACAATTACTCAATGCGACTAGCGTTGAATCAATTGCAAAAGCGGCAAATGAAGTTGGGGCTTGGGTAATTCATTACTCAACTGACTACGTATTCCCTGGAAATGGCGACACGCCATGGCTGGAGATGGATGCAACCGCACCGCTAAATGTTTACGGTGAAACCAAGTTAGCTGGAGAAAAAGCATTACAAGAGCATTGTGCGAAGCACCTAATTTTCCGTACCAGCTGGGTCTATGCAGGTAAAGGAAATAATTTCGCCAAAACGATGTTGCGTCTGGCAAAAGAGCGTGAAGAACTAGCCGTTATTAATGATCAGTTTGGTGCGCCAACAGGTGCTGAACTGCTGGCTGATTGTACGGCACATGCCATTCGTGTCGCACTGAATAAACCGGATGTCGCAGGCTTGTACCATTTGGTAGCCAGTGGTACCACAACCTGGTACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAATGCAGGCATTCCTCTTGCACTCAACAAGCTCAACGCAGTACCAACAACTGCCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAATTTTGCGCTTGTATTGCCTGACTGGCAGGTTGGTGTGAAACGCATGCTCAACGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTGATGGTGGAGCAAGATGAATTAAAAGGAATGATGAAATGAAAACGCGTAAAGGTATTATTTTAGCGGGTGGTTCTGGTACTCGTCTTTATCCTGTGACTATGGTCGTCAGTAAACAGCTATTACCTATATATGATAAACCGATGATCTATTATCCGCTTTCTACACTGATGTTAGCGGGTATTCGCGATATTCTGATTATTAGTACGCCACAGGATACTCCTCGTTTTCAACAACTGCTGGGTGACGGTAGCCAGTGGGGCCTGAATCTTCAGTACAAAGTGCAACCGAGTCCGGATGGTCTTGCGCAGGCATTTATTATCGGTGAAGAGTTTATTGGTGGTGATGATTGTGCTTTGGTACTTGGTGATAATATCTTCTACGGTCACGACCTGCCTAAGTTAATGGATGCCGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCTGAACGCTATGGTGTCGTTGAGTTTGATAAAAACGGTACGGCGATCAGCCTGGAAGAAAAACCGCTACAACCAAAAAGTAATTATGCGGTAACCGGGCTTTATTTTTATGATAACGACGTTGTCGAAATGGCGAAAAATCTTAAGCCTTCTGCCCGCGGTGAACTGGAAATTACCGATATTAACCGTATCTATATGGAACAAGGGCGTTTATCTGTTGCCATGATGGGGCGTGGTTATGCGTGGTTAGACACGGGGACACATCAGAGCCTGATTGAGGCAAGCAACTTTATTGCAACAATTGAAGAGCGTCAGGGGCTGAAAGTTTCCTGCCCGGAAGAAATTGCTTACCGTAAAGGGTTTGTTGATGCTGAGCAGGTGAAAGTATTAGCTGAACCTCTGAAAAAAAATGCTTATGGTCAGTATCTGCTGAAAATGATTAAAGGTTATTAATAAAATGAACGTAATTAAAACAGAAATTCCTGATGTACTGATTTTTGAACCGAAAGTTTTTGGTGATGAGCGTGGTTTCTTTTTTGAGAGCTTTAACCAGAAGGTTTTTGAGGAAGCTGTAGGCCGCAAAGTTGAATTTGTTCAGGATAACCATTCGAAGTCTAGTAAAGGTGTTTTACGCGGGCTGCATTATCAGTTGGAACCTTATGCACAAGGAAAATTGGTGCGTTGCGTTGTCGGTGAAGTTTTTGACGTAGCTGTTGATATTCGTAAATCGTCATCGACTTTTGGCAAATGGGTTGGGGTGAATTTATCTGCTGAGAATAAGCGGCAATTGTGGATTCCTGAGGGATTTGCACATGGTTTTTTAGTGCTGAGTGAGACGGCGGAGTTTTTGTATAAGACGACAAATTATTATCATCCTCAGAGTGATAGAGGAATAAAATGGGATGATCCAAGCATCAATATTTCATGGCCAGTCGATTCACAAGTGCTGCTATCAGCTAAAGATAATAAGCATCCTCCATTAACAAAGATTGAAATGTATAGTTAAGATCACGATAAATCTTGGAAGGGTTGCAAAATTGAATAAAATAGTGAGCAAAAGTGAAATAAGGAACGTAATCCACAATGCTGGCTATATGATGATTACTCAGATAGCTTTATATGTTGCACCATTATTTATACTGAGTTATCTGTTAAAAACACTGGGGGTTGCACAGTTTGGTAATTATGCCTTAATACTATCAATCGTTGCATATTTACAGATTATAACGGATTATGGTTTTTCTTTTAGTGCAAGTCGTGCGATCTCACAGAATAGAGAGGACAAAGAATATATATCAAAAATTTATCTGTCAACTATGACTATCAAGTTGGCGATATGCGCTTTCTTATTCTTATTGCTCATGCTATTTTTAAATCTTTTGCCTGTGCAAGCTGAATTAAAACAAGGAATATTATATGGATATCTTCTTGTAATAGGAAATACTTTCCAACCACAATGGTTTTTCCAAGGTATCGAAAAATTAAAAATCATAGCCCTTTCTAATGTTATATCAAGATGCGCCGCGTGTTTACTTGTATTTATCTATGTGAGGAATAGCGAGGATTTACAAAAAGCACTTTTAGTACAGTCACTTCCATTAGTAATTTCTGCGATTGGATTAAATATATTTATATTGAAATATATCAATATTATTTTTCCGGAAAAAAAATTATTTAAGGTAATTTTAAAAGAAGGTAAGGATTTTTTTCTTGCATCACTTTATTCTGTTATTCTCAATAATAGTGGCATTTTTCTATTAGGGATTTTTACTAATCCTGTTATTGTTGGTGTATATGCCGCCGCTGAAAAGATAGTCAAGGCCGTATTGTCGCTATTTACACCACTGACGCAAGCTATATATCCTTATAATTGTCGTAAGTTTTCACTATCCGTATTTGACGGCATTGAGGCAGCAAAAAAAACTGGTATACCAATTATAATTTTAGCATTTATAGCTGCTGTTATCGTTGCAATTACCTTACCTGTTGCAATCGACTATCTTAATTTTCCAAAAGAAACAATTTTTGTAGGTCAAATATTAAGTGCATGGATCTTTTTTGGTGTTCTTAATAATGTATTCGGCATTCAGATATTGAGTGCATCAGGAAGAAGTAAAATATATAGTAGGATGGTATTCGTATCAGCGCTTATAACATTACTTTTGATTACTCTATTATTGCAGTTTTGTAACGCCACTGGAGTGGCATGTGCAATATTATTGGGTGAAATGTTCTTATCAATATTGTTACTTAAGCGATATAAAAAAATAATTTAAGGAATAGTTATGAAGAAGTTATTATTAGTGTTCGGTACTAGGCCTGAAGCAATAAAGATGGCCTCTATCATTGAATTATTAAAAAAAGATTGTAGATTCGAATATAAAATATGTGTGACAGGCCAACATAAAGAGATGCTTGATCAAGTTATGCAAGTATTTGATGTTAAACCTGATTATAATTTACGGATTATGCAGCCTGGGCAAACATTAGTATCTATAGCAACAAATATACTCTCACGGTTAAGTGAAGTTTTAATTATAGAAAAGCCAGATATTATACTTGTGCATGGGGATACAACGACTACCCTTGCTGCTACTTTAGCTGGGTATTACCACCAAATAAAAGTTTGTCATGTGGAAGCAGGATTAAGAACAGGGGATATTTACTCTCCTTGGCCTGAAGAGGGCAATCGTAAAGTTACAGGGGCATTAGCATGTATTCATTTCGCCCCAACAGAGAGATCAAAAGATAATCTCCTGAGGGAGGGGGTCAAAGTAAATAATATATTTGTAACGGGTAATACCGTCATCGACTCTTTATTTATTGCAAAAGATATCATAGATAATGACCCTAATATAAAGAACGCTTTACATAATAAATTTAATTTTCTTGATAAAAGCCGACGAGTAGTACTTATAACAGGTCATCGAAGAGAAAATTTCGGGAAAGGTTTTGAAGATATATGCTTTGCAATAAAGGAATTAGCTTTCATTTATCCTAATGTAGATTTTATTTATCCGGTGCATCTTAATCCCAATGTAATGGAACCAGTACATCGTATATTAGATAATATATGTAATATTTACCTTATTGAGCCCTTGGATTATTTGCCTTTTGTTTATTTAATGAATGAGTCATATTTAATATTGACTGATTCAGGGGGGATACAAGAAGAAGCGCCTTCGTTAGGTAAACCGGTTTTGGTTATGCGTGATACTACTGAACGCCCTGAGGCGGTTGAGGCTGGTACTGTTGTATTAGTGGGGACTTCTAAGATAAAAATAGTAAATAAAGTAACGGAGCTATTAAACAATGCTGATATCTACAATGCTATGTCTCTGTTACATAATCCATATGGCGATGGAACAGCTGCTCAAAAAATTCTTAATGTGCTCGCCCAAGAGCTAATTTAATTTAAGCTAAAAATATGTTATTAATTATTGCTGATTATCCAAACGAAATGAATATGCGCGAGGGAGCTATGCAACGAATAGATGCGATAGACTCTCTCATTCGAGATCGCAAGCGAGTGTATTTGAATATTTCATTCAAAAAGCATCTAGTTCGCTCAAATAGTTCCTTTAATAATGTTATAGTTGAAAATCTAAATGCAATTATTCACAGAAACATCATAAAACAGTACATGCAAAAATCAACAACTATATATGTTCATTCTGTTTATAATTTATTAAAGGTTATAACGCTCATTGATCTAAAAAAAACAATTCTTGATATACATGGTGTTGTACCGGAAGAACTTTTGGCAGATAATAAAAAATTACTTAGTAAAGTATATAACATGGTGGAAAAAAAAGGTGTCCTTGGATGCAAAAAATTAATACACGTCAGTACAGAAATGCAAAAACACTATGAAGCAAAATATGGAGTAAACTTGGCTGAAAGGTCAATAGTGCTCCCGATTTTTGAATATAAAAATATAACCCAATCGCAAAACAAATGGACAGAAAATAAAATACGAAGTATCTATCTTGGAGGATTACAAACATGGCAAAATATTGATAAAATGATTCAAGTTTGTGATGACACAGTGATAAACAATGAAGCAGGTAAGTATGAATTCAACTTTTTCATCCCACAGAGTAACTTGGAAGGGTTTATAGATAAATATTCGTTAAAATTACATAATATCAATGCTAATGCATCTACGCTATCACGTGATGAAGTAATTCCCTTTCTAAAAGAATGTCATATTGGTTTTGTATTGCGCGATGATATAATAGTAAACAGAGTTGCGTGCCCTACAAAATTGGTTGAATATTTAGAGTGTGGTGTCGTTCCAGTTGTGCTCTCCCCACTTATAGGTGATTTTTATTCGATGGGATATCAATACATTACTACAGAGGAAATGGCTAACAGAAGTATAAGTTTGTTGGATCTTGAAAAAATGGCTGCACATAATTTACAAATTTTGACTTCTTATCAGAAGAGAACCTACAAGGCACAGAAAGAACTTATTGCTCAACTGTGCTGAATTTTTTACATATATAAAATTATGTAAGCATATCGCGGGTCAGGTAATTGTATGCGTATCAAATATAAAGATAACGGTTATATATTATGTTTTCTATTATGTTTCATTTTGAGCTACTTAGTTTTACTCAAATCTGACTACTTTCCTGCTGATTTTCTGCCATATACAGAAATATACGATGGGACATACGGAGAAATCAATAATATTGAGCCTGCCTTTTTATATTTAACACGGTTGTTTCATTATTTAAATTTCCCCTATATATTTTTTGCAATGTTAGTTTGTGCCTTATGTTTAAGTTGGAAAATAAAATATGCAAGAAAAATAATTAAAGATAGTTATATATATTTGTTCTTGTATGTATATGTATCATTTTATGTGTTTTTGCATGAAATGACTCAATTGCGCATAGCAATTGCAGTCACTATGTGCTATGTGTCGGTTTATTATTACTTTTATAAAAATTGTATTAAACATGCACTGCCATGGATGGTGTTGGCTATTTTGTTTCATTACAGCGCCTTGCTTTTATTTATGTCATTATTTATATACAGTTATAGGAGGTTATTAATAGTAATTATAGGGTTTGTAATATGTATGAGCTTTTTAAACGTGTATGCAGATACAATTGCACTATATTTGCCAAATGAAAAAATAGTAAATTATTTATATAGTATTTCATCATCATTAGACAATAGAAATGATTTGGCAATATTCAACCTGAATAATATAATATTTTTATCAATATTTATTTTGATCTTTTATCTTAGCCGATATATAAAATTAAATGATAATGAGGCGAAGTTTATTAAGTATGTGCAATGTTCAGGAATATTAGCCTTTTGTATTTTCTTTCTGGCTAGTGGAGTCCCGGTCATTGCTTATCGAACTGCAGAGTTGCTGCGAATATTTTATCCGATGGCTTTAGTATTAATCCTTTCGCATATAAAAAATAATAATATGCGTTATTTTATTGCAGTCATTATAGTTATCCTTTCAGGCTTAATGTTGTTTATAACACTAAGGGCTGTATCAATAGTTGGTCAAGGATTATAAAATGAATGTTGCTATTTTGTTGTCTACGTATAATGGCGAAAAATATTTAGAGGAACAACTGGATTCATTGCTGCTTCAAAGTTATCAGGATTTTGTAGTGTATATCCGTGATGACGGATCATCTGATAGAACTGTAAATATAATAAACCAATACGTAATGAAAGATAACAGATTTATTAACGTGGGTAATTCAGAAAATCTTGGTTGTGCTGCTTCGTTTATTAATTTATTAAGAAATGCTTCAGCCGATATTTATATGTTTTGTGACCAAGATGATTATTGGCTTCCGAATAAATTACAGCGTGCTGTGGATTATTTTTCGGCTATTGATCCTTTACAACCTACCTTGTATCATTGCGATCTAAGCGTTGTTGATGAAAAACTTAATATTATACAAAATTCATTTTTGCAGCATCAGAAAATGTCAGCGTATGATTCAATGAGAAAAAATAATCTTTTCATACAAAATTTTGTTGTTGGTTGTTCATGTGCTGTTAATGCTTCACTTGCGGAATTTGTTCTTTCGCGAATTGGAGAGCAGCATGTAAAAATGATAGCTATGCATGACTGGTGGTTAGCCGTGACTGCAAAACTTTTTGGTCGAATCCATTTTGATAATACTCAAACGATTCTTTATCGACAACATCAGGGCAATGTATTAGGTGCAAAATCATCAGGTATGATGCGTTTTATTCGATTAGGATTAAATGGGCAAGGGATTTCGCGAGTAGTATCTTTTAGAAAAAAAGTTTGTGCGCAAAATAAGCTTCTTTTAGATGTCTATGATAAAGATTTAAATCTTGAGCAAAAAAAATCTATCAGGCTTGTAATTGAGGGCCTTAAAGAGAACTCTTCAATTGCTGACCTTTTAAAATGTTTCTATCATGGTAGCTATATGCAAGGTTTTAAACGTAATCTTGCCTTAATATATTCAGTTCTTTACACAAAAAAAAGAAGATAGTGTATCCTTATGAAAAAAATTGCTATTATCGGTACTGTTGGCATACCAGCATCATATGGCGGATTTGAAACATTAGTTGAAAATTTAACAAGATACAATTCCTCGGGAGTTGAATATAATGTTTTTTGTTCATCGTTTCACTACAAATCCCACCAAAAAAAACATAATGGGGCCCGTTTAATTTATATTCCGCTTAAAGCCAATGGATGGCAGAGCATTGCGTATGACATAATTTCGTTAGCATATTCTATTTTTTTGAAGCCTGATGTGATTCTGATTTTAGGGGTTTCTGGTTGTTCATTTTTGCCTTTCTTCAAACTCTTAACACGCGCTAAGTTTATTACTAATATTGATGGCCTGGAATGGCGAAGAGATAAATGGAATTCAAAAGTGAAACGTTTCTTAAAATTTTCAGAAAAAATCGCAGTTCAATATTCGGATGTCGTTATTACGGATAATGAGGCAATTTCTGAGTACGTTTTTAACGAGTATAATAAAGATAGCCGAGTTATTGCCTATGGAGGGGATCATGCATGGTTAAATACTGAGGATGTATTTACAACAAGAAATTATAAAAGCGATTACTACCTTTCTGTATGTCGTATCGAACCCGAAAACAATGTAGAATTAATTTTAAAAACATTTTCAAAGCTAAAATATAAAATAAAATTTATTGGAAATTGGAATGGCAGCGAGTTTGGAAAGAAACTTAGGCTGCATTATTCTAACTATCCAAATATTGAAATGATTGATCCGATTTATGATCTTCAACAATTATTTCACTTACGAAATAATTGCATAGGATATATACATGGTCATTCGGCTGGAGGAACAAACCCTTCTTTAGTCGAGGCAATGCATTTTAGTAAACCTATATTTGCATATGATTGTAAGTTTAATAGGTACACTACTGAAAATGAAGCATGTTATTTTTCTAATGAATCTGACCTCGCAGAGAAAATCATAATGCATTGTGAGCTATCATTAGGTGTCTCTGGCACGAAAATGAAAGAAATTGCTAACCAGAAATACACTTGGAGACGAATAGCAGAAATGTATGAGGATTGCTATTAACTCTGTTAAACTTCAAATCTTTTACAATATATGGCATGACTATAAGCGCATTAATTGTTTTTCAAGCCGCTCTCGCGGTGACCACCCCCTGACAGGGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATCGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 12
(예시적 O2
rfb
유전자좌 뉴클레오티드 서열 - O2-EPA 생산 균주 stGVXN4906)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGTGAAAATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCAGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCGGGAATCACTTGCTGATGTTTCTGATTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCACCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCCGCTCGCAATTACTGGTCTGCTCTTGATAGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTCTATGGTGATTTGCCTCATCCAGATGAAGTAAATAATACAGAAGAATTACCCTTATTTACTGAGACGACAGCTTACGCGCCAAGCAGCCCTTATTCCGCATCCAAAGCATCCAGCGATCATTTAGTCCGCGCATGGAAACGTACGTATGGTTTACCGACCATTGTGACTAATTGCTCGAACAACTATGGTCCGTATCACTTCCCGGAAAAGCTTATTCCATTGGTTATTCTTAATGCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGGGATCAAATTCGCGACTGGTTGTATGTAGAGGATCATGCTCGTGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGTGAAACTTATAACATTGGCGGACACAACGAAAAGAAAAACATCGATGTTGTGCTGACTATTTGTGATTTGTTGGATGAGATTGTACCGAAAGAGAAATCTTATCGTGAGCAAATTACTTATGTTGCTGATCGCCCAGGGCATGATCGCCGTTATGCAATTGATGCCGATAAAATTAGCCGCGAATTGGGCTGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGCAAAACGGTGGAATGGTATCTGGCTAATACAAATTGGGTTGAGAATGTGAAAAGCGGTGCTTATCAGTCATGGATCGAACAAAACTATGAGGGCCGTCAGTAATGAATATCCTGCTTTTCGGCAAAACAGGGCAGGTGGGTTGGGAACTGCAGCGTGCTCTGGCGCCGCTGGGTAATCTGATCGCTCTTGATGTTCACTCCACTAATTATTGTGGAGATTTCAGCAACCCCGAAGGTGTGGCAGAAACCGTCAAAAAAATTCGTCCTGACGTTATTGTTAATGCTGCTGCTCACACTGCAGTAGATAAAGCAGAATCAGAACCGGATTTCGCACAATTACTTAACGCGACAAGCGTCGAAGCGATTGCAAAAGCTGCTAATGAAGTCGGGGCCTGGGTTATACACTACTCTACTGATTATGTTTTCCCAGGCAGTGGTGACGCGCCATGGCTGGAAACGGATGCAACAGCACCGCTAAATGTTTACGGTGAAACAAAATTAGCTGGGGAAAAGGCATTACAAGAACATTGCGCAAAGCATCTTATTTTCCGTACCAGCTGGGTATACGCTGGTAAAGGAAATAACTTTGCTAAAACGATGTTGCGTTTGGCAAAAGAACGCGAAGAACTGGCTGTGATAAACGATCAGTTTGGCGCACCAACAGGTGCTGAATTGCTGGCTGATTGCACCGCTCATGCCATTCGCGTGGCATTAAAAAAACCAGAAGTCGCTGGCTTGTACCATCTGGTAGCAAGTGGCACAACAACCTGGCACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGGATTAATCTTGCACTTAACAAACTTAACGCCGTGCCAACAACGGCCTATCCCACACCAGCCCGTCGACCCCATAACTCTCGCCTCAATACAGAAAAGTTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTGGGCGTGAAACGTATGCTCAACGAATTATTTACGACTACGGCAATTTAACAAATTTTTGCATCTCGCTCATGATGCCAGAGCGGGATGAATTAAAAGGAATGGTGAAATGAAAACGCGTAAAGGTATTATTCTGGCTGGTGGTTCCGGCACTCGTCTTTATCCTGTGACGATGGCAGTGAGTAAACAATTGCTGCCGATTTATGATAAGCCGATGATTTATTATCCGCTTTCAACGCTTATGTTAGCGGGTATTCGCGATATTCTTATTATTAGTACGCCACAGGATACACCGCGTTTCCAACAATTATTGGGGGACGGGAGCCAGTGGGGTCTTAATCTACAGTATAAAGTACAACCGAGTCCGGATGGCCTGGCGCAAGCGTTTATTATTGGCGAAGACTTTATTGGTGGTGATGATTGTGCACTCGTACTTGGCGATAATATCTTCTATGGACACGACTTGCCGAAATTGATGGAAGCTGCTGTTAACAAAGAAAGCGGTGCAACGGTATTTGCTTATCACGTTAATGATCCTGAACGCTATGGTGTCGTGGAGTTTGATAATAACGGTACGGCAATTAGCCTGGAAGAAAAACCGCTGGAGCCAAAAAGCAACTATGCGGTTACTGGGCTTTATTTCTATGACAATGACGTTGTGGAAATGGCTAAAAACCTTAAGCCTTCTGCCCGTGGCGAACTGGAAATTACCGATATTAACCGTATTTATATGGAACAAGGACGTTTGTCTGTAGCCATGATGGGGCGTGGCTATGCATGGTTGGATACAGGGACGCATCAAAGCCTTATTGAAGCAAGTAACTTCATTGCAACAATTGAAGAGCGTCAGGGATTAAAGGTATCTTGCCCGGAAGAGATTGCTTACCGTAAAGGGTTTATTGATGCCGAGCAGGTGAAAGTATTAGCCGAACCGCTTATCAAGAATCAATATGGTCAATATTTGCTGAAAATGATCAGCGAATAGTATATGGGAACTCAATGATGGATATTAAATTAATCTCTTTGCAAAAACATGGGGATGAGCGCGGTGCATTAATTGCTCTTGAAGAGCAACGAAATATACCTTTCGAAGTCAAAAGAATATATTACATACTTGAGACTCTTAATGGAGTAAGACGCGGATTTCATGCGCACAAGGTTACTCGTCAGTTAGCTATTGTAGTCAAGGGAGCTTGTAAATTTCATCTGGATAATGGTAAAGAAACAAAGCAGGTGGAACTTAATGATCCAACAATTGCGTTGCTGATAGAACCCTATATATGGCATGAAATGTATGATTTTAGTGATGATTGTGTGCTGCTTGTAATTGCGGATGATTTCTATAAAGAGTCTGATTATATCCGCAATTATGATGATTTTATTAGAAGAGTAAATTCAATTGAGAATTCATAAGCTAAGTGACGTCCAGACAACATCAATTGGTGATGGAACAACTATCTGGCAGTTTGTTGTGATACTAAAAGGTGCTGTAATTGGTAATAATTGCAACATCTGTGCAAATACCTTAATTGAAAATAACGTTGTAATTGGTAACAATGTCACAGTCAAAAGCGGTGTGTATATTTGGGATGGCGTTAAAATAGAGGATAATGTTTTTATTGGTCCTTGTGTAGCATTTACAAATGATAAGTATCCTCGCTCTAAAGTCTATCCTGATGAATTTTTGCAAACAATAATACGCAAAGGAGCATCAATAGGTGCTAACGCAACCATCCTGCCAGGAATTGAAATTGGTGAAAAAGCAATCGTTGGTGCGGGGAGTGTTGTAACCAAAAATGTACCGCCATGCGCAATAGTAGTAGGTAATCCAGCTCGATTTATTAAATGGGTAGAGGATAATGAATAAAATTGATTTTTTAGATCTTTTTGCAATTAACCAGCGACAGCACAAAGAATTAGTCTCTGCGTTTAGTAGGGTGCTAGATTCTGGTTGGTATATCATGGGCGAAGAACTTGAGCAGTTCGAGAAAGAGTTCGCAGAATACTGTGGAGTTAAGTATTGCATTGGTGTAGCAAATGGCCTTGATGCGTTGATACTAGTATTGAGGGCATGGAAAGAACTTGGCTATCTTGAAGACGGTGACGAGGTATTAGTACCGGCAAATACATATATTGCTTCTATTCTTGCTATAACAGAGAACAAACTTGTTCCTGTTCTTGTTGAACCAGATATAGAAACTTATAATATTAATCCTGCTTTAATTGAAAATTACATTACGGAAAAAACTAAAGCAATATTACCGGTTCACTTATATGGTCTATTGTGCAATATGCCAGAAATTAGTGCAATCGCCAGAAAATATAATCTGTTGATTCTTGAAGATTGTGCACAAGCACATGGTGCAATACGTGATGGTCGCAAAGCTGGAGCTTGGGGGGATGCTGCAGGATTTAGTTTTTATCCAGGAAAAAACCTTGGAGCTTTGGGGGATGCGGGAGCTGTTACTACAAATAATGCAGAATTATCCTCAACTATAAAAGCTTTGCGAAATTATGGGTCACATAAGAAATATGAAAATATTTATCAGGGATTGAATAGTCGATTGGATGAACTGCAAGCAGCCTTATTGCGTGTAAAAATCCATACATTACCGGAAGATACTGCGATTCGGCAAAGGATTGCTGAAAAATATATTCGTGAAATAAAAAACCCTGCGATTACGTTACCAGTGTACGAAGGCCAAGGTGCGCATGTTTGGCATTTATTTGTAGTAAGAATCGCTAATCGTGAAAAATTCCAGTCATACTTATTAGAGAAGGGTATCAAAACCTTAATTCACTATCCATTACCACCCCATAAGCAGCAAGCATATCAAAATATGTCTAGCCTTAGCCTTCCAATTACTGAGCAAATTCATGATGAAGTCATTTCTTTACCTATAAGTCCGGTAATGAGTGAAGATGATGTCAATTATGTAATCAAAATGGTCAATGATTACAAGTAATGAAAAAATTTCTTCAGGTAACTATATTATCCGCTATCTATACATTCATTAAAATGATTGCGGGTTTTATCATCGGTAAGGTAGTAGCAATTTATACAGGGCCATCAGGGGTAGCAATGCTTGGCCAAGTGCAAAGTTTAATCACAATAGTTGCAGGTACTACCTCTGCACCTGTAAGCACAGGCCTTGTTCGATATACTGCGGAAAATTGGCAAGAAGGACAAGAAGCATGCGCGCCATGGTGGCGCGCATGCTTAAGGGTTACTCTGTTTTTATTCTTGCTTATTATTCCCGTTGTTATTATATTGTCGAAAAATATTAGTGAGTTACTTTTTAGCGATGGACAATACACATGGTTAATCATTTTCGCATGTTGTATATTGCCATTCTCCATTATAAATACATTGATCGCTTCAGTTTTAAATGGTCAACAATTTTATAAGCAATATATATTGGTTGGGATGTTTTCTGTATTCATTTCTACTATGTTTATGATTTTGTTGATTGTAGCTTATAATCTTAAAGGTGCATTGATTGCCACAGCTATAAATAGTGCTATTGCTGGTCTTGTATTGGTTTTATTTTGTCTCAATAAATCTTGGTTTAGATTTAAATATTGGTGGGGTAAAACGGATAAAGACAAAATTATAAAAATTATTCATTATACTCTGATGGCTCTGGTTTCTGTTATCTCCATGCCTACAGCATTGATGTGTATTAGAAAAATATTGATTGCTAAAACTGGTTGGGAGGATGCAGGGCAATGGCAGGCCGTATGGAAGATATCTGAGGTTTATCTTGGTGTTGTGACAATTGCTTTGTCAACATATTTCTTACCAAGATTGACAATTATAAAAACAAGTTTCCTTATAAAAAAAGAAGTAAATAGTACTATATTATACATAATATCTATTACTTCATTCATGGCGTTGAGTATCTATTTATTCCGCGATTTGGTAATAACAGTTTTATTTACTGAACAGTTTCGCTCAGCTCGTGAATTATTTTTATTACAACTTATAGGGGATGTAATAAAAATTGCTGGGTTTCTTTATGCATACCCTCTTCAAAGTCAGGGGCATACTAAACTATTCATCAGTTCAGAAGTGATTTTTTCTATGCTCTTTATCATTACCACCTATATTTTTGTTGTAAATTATGGAGTACATGGTGCTAACATAAGTTATGTCATTACATATAGTTTATATTTTGTGTTTGCATTTGTGTTTACTAATTTTATTAATGTTAGAAGAAATAATTAAAAACAGAGGTTGAATTTTGAAAATAATTATACCTGTCTTAGGATTTGGCAGGGCTGGTGGTGAAAGAGTTCTTTCTAAGCTGGCAACTGAATTGATGAATTATGGACATGATGTAAGTTTTGTTGTTCCAGATAATAGAACTAATCCATATTATGCTACCACAGCAAAAATTGTCACGAGTAAATCTAGTCAAAACCGTGTAAAAATATTGAGAATCATTAAAAATTACTATAATCTGTGGCGTAAATGCATAGAGTTAAATCCTGATGCTGTAGTTGCTAGTTTTCATTTGACTGCCTATCTTGTCGCATTATTACCAATCACCCGTCGTAAGAAATATTATTATATTCAGGCGTATGAAGTTAATTTTTTTGATAATATAATATGGAAATTAATAGCGGGTTTAACATATTATTTACCGCTTAAAAAAATACTAAATAGTCCTAATTTGCTTCCTCATAAACATGATGATTTTATAGGAGTAGTTCCTGCAGGAGTAGATTTAAACGTTTTCTATCCGAAACCATCAAATAGGTTATTAAATGGTCACACATCAATAGGGATTATTGGTAGAAAAGAGAAGCACAAAGGAACTAGCGAAATTATTTCAGTATTGTGTTCACTGGAAAATAAAGCTGGAATTATAATCAATATTGCGATCTATCTTGAAGAAGTTGATAAGCAGCGTTTAATCGCTGCCGGGTTTCAGGTTAATTTTTTTCCGATTACTTCTGATTTAGAATTGGCATCCTTTTATCGAAGCAATGACATCATGATTGCTGTTGGGTTAATTGAAGATGGCGCTTTCCATTATCCTTGTGCTGAATCAATGGCTTGTGGTTGTCTTGTTATTTCAAATTATGCGCCACTTACTGAAACTAACAGTGTACTTAAATTAGTCAAGTTTGATGCTTGCAAACTTGGTGAAGCAATTAATCTTTGTCTCAATCTTGACCTAGAAGAAAAAAGCAAAGAAATCCAATCTAATATTTCTGTGTTGAATAAATATGACTGGAAAATTGTTGGTGAAACTTTCAATAGTTTATTGTTAGATGCAAATAAATAGTATACGTTGATGGGGAAAATATGAATATTGTTAAAACTGATATTCCAGATCTGATCGTTCTTGAACCAAAAGTGTTTAGTGATGAACGCGGCTTTTTTATGGAGAGTTATAATCAGATTGAATTTGAGAAGGCAATAGGAAGGCACGTAAATTTTGTTCAGGATAATCATTCAAAATCTAGTAAAGGCGTACTACGTGGGTTGCATTATCAATTAGCACCGTATGCACAGGCTAAATTAGTTCGATGTGTTGTAGGTCAGGTATTTGATGTTGCTGTTGATCTTAGAAAAAATTCACCAACGTTCAAAAAATGGTTTGGAATAACCCTTTCCGCAGAAAATAAACGACAATTATGGATACCCGAAGGATTTGCTCATGGTTTCTTGGTGACCAGTGATGAAGCTGAGTTCATTTATAAGACAACTAACTACTATGCTCCTGGTCATCAGCAAGCAATTATTTACAATGATCCTATTTTAAACATCGATTGGCCTTTCTGCAGTAGTGCTCTGTCATTATCACAAAAAGATCAAGAAGCAAAATTATTTTCAGAATTATTGGACAGTGAACTGTTCTAATAAAGTGTGCCACCTTATCCGTCTGAAGGATAGGTGGTTGCTTATATTTTTTTGAGTATGTTTGTATAATGACAGAAAATAGTCCGAAATATAAACACGATAAAAGCTTAATAAGTTTTATCTACTTATTTTTTATATTTACACTTATTGTAGGCTTTATTATCGCAAATACCCAGTTTTTGGGGCGAAGTAGAGACTATGATAATTATATACAGATCTTTTCTGGTAAAGAAGGGGAGGGGGTTCTTGAATTATTTTATCGCGGATTGATGTTAATAACGACCAGCTATGAAACTATCATTTTTATAATTTTAACATGTTCTTTTTTTATAAAGGCAAGGTTTCTCGCTAACTATTCGCGTAATTTTTCAGGCTTGACCTTATTCTTTATTTATTATGCAAGCGTTGCACTTTGGGTTTTAGATTATACTCAATTCAGAAATGGTCTATGTATTTCCATTTTAATGTTTTCCGTATACTATTTATTTATAAATAAACCGACTTATTTTTATTTCTCGGTATTATGTGCAATTGCAACTCATTGGTCTGCTTTGCCTTTTTTGCTTTTATATCCTTTTGTCTATTCAACAAAAATAAGACGCCTTGGTTATTTTTGTTTCAGTATTCTTGTTTTGATTGCGATCTCAGGAGAAGGAAAAGAGATCATATCTTTTATAAGAAATTTTGGAGTGGGACAAAAAATAGGAAATGAAGCTGGTGTAAATTTAATAAATTCATTATCCCTTACCGCTATTTCCTGGTTTATTATTAGTTACATATCAAGCATTGGAAATGAAAGGAGAAATTTAAGGCTTTTCTTTTGTTATGGTGTCATGCAATACGTGACTTTTAGCCTTTTCTCTCTACCTGTTATGGCTTTCCGTATTTTGGAAATGTATTTTTTCCTTATGCTAACCATTGGGGTGTTTATTAAGCAAAAAAAGAATTATTATTTTATTTTTTGCAAAGTGTTAATTTTATTGTATCTAACATACTATTATCATATGGTCTTTGGAGTGATTAATGTGTAAGGCTAAGGTGTTGGCTATAATTGTTACTTACAACCCGGAAATTATTCGATTGACGGAATGTATTAACTCTTTAGCCCCACAAGTTGAGAGAATAATTCTTGTAGATAATGGCTCAAATAATAGTGATTTGATAAAAAATATCAGTATTAATAACCTTGAAATTATTTTACTTTCGGAAAACAAAGGCATTGCATTTGCTCAGAACCATGGTGTTAAGAAGGGCCTGGAAGCAAAAGAGTTTGACTATTTATTTTTCTCAGATCAGGATACTTGCTTTCCTAGCGATGTTATTGAAAAACTTAAGAGTACATTTACGAAAAATAATAAAAAAGGTAAAAATGTTGCTTGTGCTTCTCCTTTTTTTAAAGACCATCGTTCAAATTATATGCATCCGTCAGTCAGCCTAAATATTTTTACGAGTACAAAAGTTATATGTAGTGAAGTAGACGATGATCTTTATCCCTCGCATGTTATTGCTTCTGGGATGTTAATGTCTCGTGAAGCATGGCGCGTCGTCGGACCATTTTGTGAAAAACTCTTTATAGACTGGGTTGATACAGAATGGTGTTGGCGTGCATTAGCTAATAATATGATTATTGTTCAGACACCATCAGTCATCATTTCTCATGAACTTGGGTATGGGCAGAAAATTTTTGCTGGTCGATCTGTTACAATACATAATTCTTTCAGAAATTTTTATAAAATACGCAATGCAATATACTTAATGCTGCATTCAAATTATAGCTTCAAGTATCGTTATCATGCTTTTTTTCATGCGACAAAGAATGTTGTATTTGAAATTTTATATTCGAAAGAAAAATTAAATTCACTGAAGGTTTGTTTTAAAGCTGTACGTGATGGTATGTTCAATAATTTTTAATACGAAAATAGTTAGGCTCAAGGTGTTTAAATGGAAGAAAATAATATGAAGACGGTCGCTGTAGTTGGCACAGTGGGTGTTCCTGCTTGTTATGGTGGGTTCGAATCACTTGTTCAGAATCTAATTGATTATCAATCTGATGGTATACAATATCAGATATTTTGCTCTTCAAAAAAATATGATAAAAAATTTAAAAATTATAAAAATGCAGAATTAATCTATTTGCCGATAAATGCCAATGGCGTCTCTAGCATAATTTATGATATTATGTGTTTAATTATTTGTTTATTCAAAAGGCCAGATGTTGTTTTAATATTGGGGGTGTCTGGTTGTTTATTTCTACCAATTTATAAACTATTTTCAAAATCAAAGATTATTGTCAATATTGATGGGCTTGAATGGCGTAGAAATAAATGGGGAACGTTTGCTAAGAAATTTCTTAAAATATCTGAGGCGATATCTATTAGAATAGCTGATATTATCATTTCAGATAATCAAGCAATAGCTGATTATGTGGAAAATAAGTACAAGAAAAAAAGTGTAGTTATAGCTTATGGCGGAGATCATGCCACTAATCTTAGTACACCGATAGACAATGATCAAAAAAAAGAAGGTTATTATTTGGGGCTTTGTAGGATAGAGCCTGAGAATAATATAGAAATGATTCTGAATGCCTTCATTAATACAGATAAAAAAATTAAATTTATGGGTAATTGGGATAACAGCGAGTATGGACGCCAGCTAAAAAAATATTATTCAAACTATCCAAATATCACCCTACTAGAACCTAACTATAATATTGAAGAGCTTTATAAACTAAGAAAAAATTGTCTTGCATACATTCATGGACACTCGGCTGGTGGAACAAACCCTTCTTTAGTTGAAGCGATGCATTTTAATATTCCTATTTTTGCTTTCGATTGTGACTTTAATCGTTACACAACTAACAATTTAGCTCATTACTTTAATGATTCTGAACAACTTAGCTTATTAGCAGAAAGTTTGTCTTTTGGAAATCTTAAATGTCGAGTATTAGATTTAAAAAATTATGCTGAAGATATGTATAACTGGAGGCATATAGCTGCTATGTATGAATCTATTTATTAAACGCATTAACAATAATATAATTGACCTTATATAGCAGGGAAAGATCACGTAACGCTGCGGCGCGCCGATCCCCATATGAATATCCTCCTTAGTTCCTATTCCGAAGTTCCTATTCTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATCGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 13
(예시적 O6A
rfb
유전자좌 뉴클레오티드 서열 - O6A-EPA 생산 균주 stGVXN4112 및 stLMTB10923)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATTTGCCCGCCGGGCGTGACAATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTGGGCCACTCCATTTTATGTGCACGACCTGCCATTGGTGACAATCCATTTGTCGTGGTGCTGCCAGACGTTGTGATCGACGACGCCAGCGCCGACCCGCTGCGCTACAACCTTGCTGCCATGATTGCGCGCTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCTGTCATCCAGACCAAAGAGCCGCTGGACCGCGAAGGTAAAGTCAGCCGCATTGTTGAATTCATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTTGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTTGAACGCACTCAGCCTGGTGCATGGGGGCGTATTCAGCTGACTGATGCCATTGCCGAACTGGCGAAAAAACAGTCCGTTGATGCCATGCTGATGACCGGCGACAGCTACGACTGCGGTAAAAAAATGGGTTATATGCAAGCGTTCGTGAAGTATGGACTACGCAACCTCAAAGAAGGGGCGAAGTTCCGTAAAGGGATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAGATTAGCGGCGAAAGTAATTTGTTGCGAATTTTCCTGCCGTTGTTTTATATAAACAATCAGAATAACAACGACTTAGCAATAGGATTTTCGTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCATTTGAATTTTACGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCGTAGACATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCTGAAATTATAAAGTCATTCTTATAGAACATCGCATTTCAATAATATAATTACACCTAAATGAATAGGATACAACGTGTGCACAATTATTTAAGGCTTAAAGATAAAATAAAAAACGTATTTTTAGGGTTGTATATATTGCAGTTATTTAATTATATCGCGCCATTGGTAATTATCCCTATCCTGATAAAATATATTGGGTTGGGGGAATATGGGGAATTGGTCTATATTACATCTATTTATCAAATAGTGGCTTTGATTATTGATTTTGGCTTTACTTACACAGGACCTGTGGTTGCTGCGAGACATAGATGTGAGACCCAAAATTTACAGCGCTATTACTCAATAGTTGTTCTTTTAAAATCATTGCTTTTTATAATTGCATTAACATGTGTATTTTTATTGTGCAGATTAAATATAGTCCACTTGTCATTTTTTGGGTTTTTGTCAATTTTTCTATGCACTATTGGTAATATATTATCGCCCAATTGGTTTTTGCAGGGGATTGGTGATTTTAAAAAACTTTCATACTCACAAGTAATAGTGAGAATAACATTGTTTATCATACTTCTTGTTTATGTCTGTAGTGGCGGAGATAATGTTTTTATCCTAAGTTTTTTGCAAAATGCAACATTACTCATATGCTGTATATACTTATGGCCAAATATTCATATTAGCCATGTTGTTCATCTTAAACCTAATGAATGCATTGTGGAATTTAAGAAGGCAGGAAATGTTTTTATTGGCGTAATAGGTACGATTGGTTACAATGGTCTAATTCCTGTGTTAATTGGAAACCTTTGCGGTAATACGAGTCTTGGTGTTTTTTCAATCGTTCAAAAAATGACAACAGCATGTCAAAGTCTAATTAATCCAATATCACAGTATATGTTATCTCAAGTTTCAGAAATTAAACCTCAAGATAAACTGTTTTATTATAGAATTAAAAAAAGTTTTTTTGTGCATTTAACAATTAGCATAATTGCATGTTTATGTTATATGGGGTTAGGGCAATATGTGGCGACTTTTATAGGTAAAGTTGACGTTTCATTTGTTATTATTTTATTTGCGTCAATAATTACCATTTTTTCATCTTTAAATAATGTCCTTGGTATACAGTTTCTTATACCGACAGATAATGTAAAAATACTACGAAGTATAAATGTTATGGCGGGAATTATTGTTGTTAGTTTGTCCTGGCTGTTAATATCACGCTTTGACATTCTGGGGGGGGTTTTATTAAACCTAATTGGTGAGTTTCTTGTATTCAGTATGCTAGCTTTTATTGCCCATCGAAAGTGGGGAGCGAGAGTATAATGAAAGTGAAGGCGGTTCCTGCTATTACATTCTATTTAAGTTTAATGCTGACAATTTTAGTGTTACTGTTTGGTAATGAACCAAATAAATCACAATATATCCTTGTTATAGCAACGATAACAGTTTTTTATATCGCATATATCACTAATAAAATAACTTCTCCGGCCAGCCTTCTCGTTATATCATCTTTTGTGTTTTTAGGTTGTCGCCCTTTATTATCTTTGTTTGCAAACTATGATTATAGGATTGCCGATTGGTTTATTGAAGGATATATGGATGACGATGTGATTTTGGCTAACTATGCTATAACACTAATGTATTATGGTTATACATTGGGACTAATTCTATGCAAAAATACTGAAAAATTTTATCCGCATGGTCCTTATCCTGAAAAACAATTGCTAAAAATAAAGTTTCTTTTGACTTTATTTTTTCTGGGTTCGATAGGTATGGTTGTAAAAGGGATATTCTTTTTTAACTTTATAGAATCTAATAGTTATGTTGATATTTATCAATCAAATATAACAACGCCAATAGGTTATGATTTTCTATCTTATTTATTTTATTGTTCTTTTTTCCTTATATGTGCGTTTCATATACAGTTCAGAACAAATAAAAAATTTCTTTTTATTGCGATATGCATTGCTGCATTTAGCACCTTGAAGGGTAGTCGTAGTGAAGCTATAACGTTTCTTTTAACGGTTACATGTATATATTTTAATGAAGTAAAGACAAGAAACTTACGTCTGCTGATTACAATGATTTTTGTTTTTAGCGTCATTTTTGTGATTAGTGAATTTATCTCAATGTGGCGCACTGGAGGGAGTTTTTTTCAATTAATGCAGGGTAATAATCCTGTTATAAACTTTGTATACGGCATGGGAGTATCATATCTTTCCATTTATCAATCAGTAAAACTACAACTATTGTCAGGGGGATATAATGTTACCTATCTATTCAGCCAGTTAATAATAACTTGCTCGTCAATATTTAATGTCAAATTGAGCTTGCCGGAAATAAGCTATAGCCATTTGGCCTCATACACAGCAAACCCAGAACTATATAATCTTGGGTTCGGACTTGGGGGGAGTTATTTAGCAGAATCGTTTTTAGCATTTGGTCTGATTGGATGTTTCATTATACCCTTTTTACTTTTACTTAATTTAAATGTATTGGAAAAATATACAAAAAACAAACCAATTATATATTTTGTTTATTATAGTGTGTTGCCACCTATATTATTCACACCAAGAGAGACTTTGTTCTATTTCTTCCCCTATCTTGTCAAAAGTATATTTGTTGCTTTTTTAGTTACATTATACATCCAGTATAAAAAGGATTGACCAAAATGTCAGAAAAAAATGTCAGCATAATAATCCCAAGTTATAACAGGGCTCATATTCTTAAGGAGGTCATACCAAGTTATTTTCAGGATGAGACTTTAGAGGTTATAGTTATCAATGATGGATCAACAGATAATACAAATAGTGTATTAGCTGAACTGAAGGAAAAATATTCTCAGTTAGTTATTTTAGAAAATGAAACGAATAAAAAACAGATGTATTCTAAAAACCGAGGGATTGAAATAGCCAAAGGGAAATATATTTTTTTTGGTGATGATGACTCTTACCTCTTACCCGGTGTTATATCTCGGTTATTGGCTACAAAATATGAGACAGGCGCTGATGTAATCGGCGCAAGAATACTTTATATGAATAATAACGAGAAAACAATTGAAGATTGCATAAATCGACATAAAAAAGAGGGGCGTTTTGTTAGTGATCTAAATAGATTGGATTTTAGTTATACATGTGATTTGGACCATCCGATTGAATGTTTTTATGCACAGCCTTTTGTTCTAGCTGAAAGGGAACTAATATCGAAATATCGATTTGATATATCTTATACGGGAAACTGCTATCGTGAGGAAACTGATTTCATGCTATCTCTATTTATTAAAAATAAAAAATTTATATATGATTCAAAGGCTTTGTTAATAAATTTACCTCCAAGAAAAGCGACGGGAGGGGCAAGAACAGCTAATCGATTAAAATATCATTACGAAAGTTGCATAAATAATTATAGATTTTTAAAAAAATATAATGATAATTTGAATCTTCTTTCAGGACAAAAGCATGCTATATTTTACCGACAGTGTCAATTCGTTCTGCTAAAAATGAAGTCGTTTATCGGGAAGTTTTTAAAATGATTATATATATCGCCGCGTATAATGGTTCAGGAGGGCAAGGTGGGGTGGAAAGGGTTGTTGCCCAACAATGTAACATTCTTAAAAATTTGGGGGTTAAAGTCATTATACTTGATAAAACATACTTCAAAATTTCTAACAAAATTCGTAACAAAAAAATACAAGTAGCACTTTATCCAATATTAGTTTCTCTTTATTTAACCTTACAAAAATTACGTGGCGTGACGTTTAAAGTTATTGCACATGGCTATTGTTCTCCTTTTTATAGGAATGACATCTTAATAGCTCATGGCAATATGAAATGTTATTTTCAAACAGTCATGAATAAAAAACCTAATCGGTTGTCTGGCAGTGGTCTTTTATCTTTCTATGAGCGTTGGGCTGGAGCATTTTCAAAAAATATCTGGGCTGTTTCAAATAAGGTTAAAAGTGAATGGAATGAGCTTTACAATATTAATTCACATAAAATCAAAGTTGTTCGAAATTTTATAAATCTTGCACAATTTGATTACACTGATGTTAATGAAGCAGAATATGTGACATTTGTCGGGCGATTGGAAAAAGGAAAAGGAATAGATGATCTGTATTACATATGTAAAAATCTGCCAGATACTTCCTTCCATTTAGTTTCAAGTATTCCCGCCCCACAAAATTTTGCTTCGCTAAATAATGTTCTGACCAGCATTGCTGTCCCCTATGCGAAAATGCCAGAAATATTTAAGAAATCCAGAGTACTTATTTTACCGTCCTATTATGAAGGATATGAGCTGGTTACTATTGAAGCGCTATGCTGTGGTTGCCCTGTGATAGGCTATAATGTTGGTGCAATTAGAGAGTTGTATGCAGAAAGTTTTCCTGGCGTATTTATTGCCAATAATAAAGAAGATTTAGCACAAGTAGCCTACAAATTAATTAGTCTTGATAATGAAAAATATTATCATTTGAGACAAACTATTTATAGCAAGCGTGAGCTTTTTTCTGAAGAGAGATATGCGGAAATTTTAACGGCGGCATTTAATGAAAAAAAATAAGAAACTCTGTCTCATTTCAATTAACTCATATAATGAACTTACCGGAGGAGGAGTATATTTACGTACGCTTGTTAGTTTTCTACAAAAACAGAATGTTAATTTAACACTTATTGATAAAAAATCCTCAGGTAAACTATTCGAAGACAATACTTTTCAACATATATCATTTATTAAAGGTAAACGTCAGGATATAATATCCAGGCTTTTTTTTATACCATCATTTTATGTCCCTTATATTTTCTCAATAATTAAAATTTTACGGAAGCAAGATATTCTTGCTTTTCACAACTCTCGGCTTGGATTGTTATGTCTGCTTTTTAGAATACTCATGCCCCACAAAAAGATCATATTGTTTACGGATAACTTCGAATATGACTTAATAAGACAAAAAGATAAAAACATAACTACTTTTATTGAAAAATTAATTGTTTATCTCAATGAATTTATCGGGCTTAAGAATTCAGATTTAGTTAGCTATATTACCCGGCAAGATAAAAATGCAATGGATAAATTTTATGGGATTAAAAAAAGCAGAAATTTAATTCTCCCTGTGATATTTAGTAGAGAAAAACCAACTGATGTATTGTCAGCTCACTTTATTAATGAGTATAATCGATTGAATAATGATAATAGGAAAAAAGTAGTATTTACTGCATCTTTTGATTTTTTTCCAAATATAGATGCTGCCAACTATGTTTTAAATGCAGCAAAGTCTAATAATGATTATTGCTATATTTTGGCAGGTAGGAAAAGTACTACTTTGAATCTTCCTGATTTGGATAATTTATTTTTTTTCGATAATCTATCTAATAGTGAAATGTCATATTTATTATCTGCTTGTGATGTTTTTTATTCTCCTATAGTTTTAGGAAGTGGAATGAAAACAAAAATTGCAGAAGCACTATCATATGGATTATATATTTATGCGACAGAGCATTCCTTAATCGGCTATGATGAAATTATACACAATAAGGAGTGTGTTAAAAAAATCTCACATTTGGATGAGGAATTTCCTAAAGATTTCAAGATGAAAAGTATCAATAAACAGCTAATAATGTCTTATCAGCAAAAATATTATTCACATTATCGGTTTAATGGCCATGAACTTGATATAATAAATTTTGACGATTAGTTAGTGGAGATATAATATGAACATATTAGTAACTGGTGGTGCTGGATATATCGGATCTCATACGGCTATTGAATTACTGAATGCAGGTCATGAGATTATCGTTCTGGACAATTTCAGTAATGCTTCATACAAGTGTATCGAAAAAATAAAAGAAATTACTCGACGTGATTTTATAACAATTACTGGAGATGCTGGGTGTAGGAAGACACTCTCCGCTATTTTCGAGAAACACGCCATAGATATAGTTATTCATTTTGCTGGCTTTAAATCTGTTTCAGAGTCTAAAAGTGAACCCTTAAAGTATTACCAGAATAATGTTGGAGTGACCATTACTTTATTACAGGTAATGGAAGAGTACAGAATTAAAAAATTTATCTTTAGTTCATCTGCGACAGTCTATGGTGAACCAGAGATAATTCCAATTCCAGAAACAGCTAAAATTGGAGGAACTACGAATCCATATGGCACATCGAAGTATTTTGTTGAAAAAATTCTAGAGGATGTTAGTTCCACGGGAAAACTGGATATAATTTGCTTGAGATATTTTAATCCTGTCGGTGCTCATTCTAGTGGTAAAATAGGTGAGGCTCCATCTGGTATCCCTAATAATCTTGTTCCTTATTTATTGGATGTTGCGAGTGGTAAACGTGATAAATTATTTATTTATGGCAATGATTACCCTACTAATGATGGAACAGGTGTAAGGGATTTTATTCATGTTGTTGACTTAGCGAAAGGTCATTTGGCTGCAATGAATTATTTAAGTATCAATTCGGGATATAATATCTTTAATCTTGGTACAGGAAAAGGTTATTCGGTACTTGAATTAATCACTACATTTGAAAAATTAACAAACATTAAGGTCAATAAATCTTTTATAGAGAGAAGGGCAGGGGATGTTGCGTCTTGTTGGGCTGATGCAGATAAAGCTAATTCTTTATTGGACTGGCAAGCCGAACAAACTCTAGAACAGATGTTATTGGACTCGTGGCGTTGGAAAAAAAATTATCCAGACGGATTCTGAATATAAAAGGTTTCAGTTTTATGAATCAATCAGAGCAGAGAAAAAAAATACTGGTTCTTACACCTCGCTTTCCCTACCCTGTCATTGGAGGGGATAGATTAAGAGTCTATATGTTATGTAAAGAACTTTCCAAAAAATATGATCTTATTCTTCTGAGCTTATGTGATCAACCACTAGAACTTGAAATAAATATAAATGACTCGGTCTTCAAAGAAATTCATCGTGTCTATCTACCAAAATATAAATCATATTATAATGTATTAAAAGCTTTGGTTACGCAAAAACCGTTGCAAATTGCTTATTATCAATCGGACACATTTAAGAATAAATACAATAAATTAATTAAACAATGCGATGCAGTATTTTGTCATCTGATAAGAGTTGCTGATTATGTTAAGGATACAGACAAGTTCAAAATTCTTGATATGACAGATGCAATATCTTTGAATTACAGTCGCGTTAAAAAATTAGCAAGTAAAAAAAGTTTGCGTGCAATTATTTATTCTCTGGAACAAAAAAGATTAGAATCATATGAACGTTCTGTGGCGAATCTTTTTGATTTGACCACTTTTATTTCATCCGTAGACCGTGACTATCTCTACCCTAATCTGGGCAGTAATATCCATATAGTCAATAATGGGGTTGATACATCAGCCTTGAGATATATAAAAAGAGAAATAAAAATCGATAAGCCTGTGGAACTTATATTTATCGGAAATATGTATTCTTTACAAAATATGGATGCTGCAAAACATTTTGCTAAGAATATTTTACCTTGCTTGTATGATGAGTTTAATATTATTTTTAAAGTGATTGGTAAGATCTCAGAAACTAATAAAAATATATTAAATTCATTTAAAAATACAATTGCTTTAGGTACTGTTGATGATATCAATTCTTCCGCTTCTACAGGGCATATAGGTATATGTCCTGTTCGTCTTGGAGCAGGCGTACAAAATAAAATTCTTGAATACATGGCTTTAGGTTTACCATGTATTACATCTAGCATTGGTTATGAAGGTATTAATGCAAAATCAGGTAGCGAAATTTTTGTTGCAGATACAGTAGAGCAATATAAAAACGTACTAAGAGAAATAATTTACGATTATAATCGTTATACTGAAGTGGCTGAAAATGCCCGTAGTTTTGTAGAAAATAATTTTTCTTGGGAATCAAAAGTTGCCAATTTAATGAATACATTAGATGAGAAATTATATGAACAATAATAAAATTATTACACCTATCATTATGGCTGGTGGTTCAGGCAGTCGGTTGTGGCCACTATCAAGAATTCTCTATCCGAAACAATTTCTTAGCCTAATCGGTAGTCATACCATGCTTCAAACAACGGCTAATCGTCTGGATGGTTTGGATTGTACCAACCCTTATGTCATTTGTAATGAACAATACCGCTTTATAGTTGCTGAACAGCTTAGAAAAATCGATAGATTGACTTCAAAGAATATCATCCTTGAGCCTGTTGGGCGTAACACTGCCCCTGCAATTGCATTAGCGGCGTTGCTGATGTCTAAGTCTGATAAAAGTGCAGATGATCTTATGCTCGTACTGGCTGCAGATCACGTTATACACGATGAAGAAAAATTTTGTAACGCTGTTAGATCGGCAATTCCATACGCTGCTGATGGGAAATTGGTAACATTTGGTATAATTCCAGACAAAGCAGAAACTGGTTATGGTTATATACATCGAGGACAATATATTAATCAGGAAGATTCGGATGCATTTATAGTGTCATCATTTGTTGAAAAGCCAAATCATGAGACAGCCACTAAATATCTTGCTTCCGGTGAGTATTATTGGAATAGCGGTATGTTTTTGTTTAGTGCAAATCGTTATATAGAGGAACTTAAACAATTTCGGCCTGATATTTTATCCGCTTGTGAAAAAGCAATTGCTTCAGCGAACTTTGACCTTGATTTTGTGCGTTTAGATGAAAGTTCTTTCTCTAAGTGCCCTGAAGAATCAATTGATTACGCTGTAATGGAAAAAACAAAAGACGCAATTGTTATTCCAATGGATGCTGGCTGGAGTGATGTCGGTTCATGGTCTTCTCTTTGGGAAATTAATGATAAAGACTCAGACGGCAACGTAATAGTTGGGGATATTTTCTCTCATGAAACAAAGAATTCTTTCATATATGCCGAATCGGGAATTGTTGCTACAGTTGGAGTGGAAAATTTAGTTGTTGTCCAAACAAAGGATGCTGTTCTTGTCTCAGAGAGAAATAAAGTTCAGGATGTAAAGAAAATAGTAGAACAAATTAAAAATTCAGGTCGTAGCGAGCATTATGTTCATCGCGAAGTATATCGTCCTTGGGGTAAATATGATTCCATTGACACAGGGGAGCGTTATCAGGTCAAACGTATAACAGTAAATCCTGGTGAAGGACTTTCTTTACAAATGCACCATCATAGGGCAGAACATTGGATCATAGTTTCTGGAACTGCAAGGGTGACTATAGGTTCTGAAACTAAGATTCTTAGCGAAAATGAATCTGTTTACATACCTCTTGGTGTAATACACTGCTTGGAAAATCCAGGGAAAATTCCTCTTGATTTAATTGAAGTTCGTTCTGGATCTTATTTAGAAGAAGACGATGTTATCCGTTTTCAGGACCGATATGGTCGTAGCTAAATTTTTGATAATGTAACGTTAGTAGAAGAGCGCTAATATTTTTAGTTAATCTGTAATAAGTATTATTTGTTTAAGGTATATCATGTCGAGTTTACCCTGCTTTAAAGCCTATGATATTCGCGGGAAATTAGGCGAAGAACTGAATGAAGATATTGCCTGGCGCATTGGTCGCGCTTATGGCGAATTTCTCAAACCGAAAACCATTGTGTTAGGCGGTGACGTCCGACTCACCAGCGAAACCTTAAAACTGGCGCTGGCGAAGGGGTTACAGGATGCGGGCGTCGATGTGCTGGATATTGGCATGTCCGGCACCGAAGAGATCTATTTCGCCACGTTCCATCTCGGCGTGGATGGCGGCATCGAAGTTACCGCCAGCCATAACCCGATGGATTACAACGGCATGAAACTGGTGCGCGAAGGGGCTCGCCCGATCAGCGGTGATACCGGACTGCGCGACATCCAGCGTCTGGCAGAAGCCAACGACTTTCCTCCCGTTGATGAAACCAAACGCGGTCGCTATCAGCAAATCAATCTGCGTGACGCTTACGTTGATCACCTGTTCGGTTATATCAACGTCAAAAACCTCACGCCGCTCAAGCTGGTGATTAACTCCGGGAACGGCGCGGCGGGTCCGGTGGTGGACGCCATTGAAGCCCGCTTTAAAGCCCTCGGCGCACCCGTGGAATTAATCAAAGTGCACAACACGCCGGACGGCAATTTCCCCAACGGTATTCCTAACCCGCTACTGCCGGAATGTCGCGACGACACCCGCAATGCGGTCATCAAACACGGCGCGGATATGGGCATTGCCTTTGATGGCGATTTTGACCGCTGTTTCCTGTTTGACGAAAAAGGGCAGTTTATTGAGGGCTACTACATTGTCGGCCTGCTGGCAGAAGCGTTCCTCGAAAAAAATCCCGGCGCGAAGATCATCCACGATCCACGTCTCTCCTGGAACACCGTTGATGTGGTGACTGCCGCAGGCGGCACCCCGGTAATGTCGAAAACCGGACACGCCTTTATTAAAGAACGTATGCGCAAGGAAGACGCTATCTACGGTGGCGAAATGAGCGCCCACCATTACTTCCGTGATTTCGCTTACTGCGACAGCGGCATGATCCCGTGGCTGCTGGTCGCCGAACTGGTGTGCCTGAAAGGAAAAACGCTGGGCGAACTGGTGCGCGACCGGATGGCAGCGTTTCCGGCAAGCGGTGAGATCAACAGCAAACTGGCACACCCCGTTGAGGCGATTAACCGCGTGGAACAGCACTTTAGCCGCGAGGCGCTGGCGGTGGATCGCACCGATGGCATCAGCATGACCTTTGCCGACTGGCGCTTTAACCTGCGCTCCTCTAACACCGAACCGGTGGTGCGGTTGAATGTGGAATCGCGCGGCGATGTACCGCTGATGGAAGAAAAGACAAAACTTATCCTTGAGTTACTGAACAAGTAATTCAGTAATTTCATATAAATGGGTTTTAAAAAACGGAAAAGATGAGATATCCGGTGTGGTATATCCAAGGTAATGCTATTCAGTATCTCTATGAGTGAGTTAACATCTATACCACATTTAAGCCGCACACTTCGGGATCCCCATATGAATATCCTCCTTAGTTCCTATTCCGAAGTTCCTATTCTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATCGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 14
(예시적 O8
rfb
유전자좌 뉴클레오티드 서열 - O8-EPA 생산 균주 stLMTB11734)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCGATCGCTTAAGATCTAGGATTTCATTATGTTACTTCCTGTAATTATGGCTGGTGGTACCGGCAGTCGTCTCTGGCCGATGTCACGCGAGCTTTATCCGAAACAGTTCCTCCGCCTGTTCGGGCAGAACTCCATGCTGCAGGAAACCATCACCCGACTCTCGGGCCTTGAAATCCATGAACCGATGGTCATCTGTAACGAAGAGCACCGCTTCCTGGTGGCTGAACAGCTACGCCAGCTCAATAAGCTGTCGAATAATATTATTCTTGAGCCGGTCGGGCGCAACACCGCCCCGGCCATCGCCCTGGCAGCCCTTCAGGCCACCCGCGACGGCGACGACCCGCTGATGCTGGTTCTCGCCGCTGACCATATCATCAATAACCAGTCGGCCTTCCACGACGCCATCCGGGTCGCCGAGCAGTATGCTGATGAAGGTCATCTGGTCACCTTCGGTATCGTGCCGAATGCCCCGGAAACTGGCTACGGTTACATTCAGCGCGGCGTGGCGCTCACCGATAGTGCCCATTCCGCGTACCAGGTGGCCCGCTTTGTGGAGAAGCCGGATCGCGAGCGCGCCGAGGCTTACCTCGCCTCCGGGGAGTACTACTGGAACAGCGGCATGTTTATGTTCCGCGCCAAGAAATACCTCATCGAGCTGGCCAAATACCGTCCGGATATCCTGGAAGCCTGCCAGGCTGCGGTGAATGCCGCCGATAATGGCAGCGATTTCATCAATATCCCGCATGATATTTTCTGCGAGTGCCCGGATGAGTCCGTGGACTATGCCGTTATGGAGAAAACCGCCGATGCGGTGGTGGTCGGTCTCGATGCTGACTGGAGCGACGTCGGCTCCTGGTCCGCACTATGGGAGGTCAGCCCGAAAGACGAGCAGGGCAATGTCCTCAGCGGTGACGCGTGGGTACACAACAGCGAAAACTGCTACATCAACAGCGACGAGAAGCTAGTGGCGGCCATTGGCGTAGAGAATCTGGTGATTGTCAGCACTAAGGACGCCGTGCTGGTGATGAATCGCGAGCGTTCCCAGGACGTGAAGAAGGCGGTCGAGTTCCTCAAGCAGAACCAGCGCAGCGAGTACAAGCGCCACCGTGAGATTTACCGCCCCTGGGGCCGTTGCGACGTAGTGGTCCAGACCCCGCGCTTCAACGTCAACCGCATCACGGTGAAACCAGGCGGTGCCTTCTCGATGCAGATGCACCACCATCGCGCCGAGCATTGGGTTATTCTCGCCGGCACCGGTCAGGTGACTGTCAACGGTAAGCAGTTCCTGTTGTCCGAGAACCAGTCCACCTTTATTCCGATTGGCGCCGAGCACTGCCTGGAAAACCCTGGCTGTATTCCGCTGGAAGTGCTGGAGATCCAGTCGGGGGCGTACCTTGGCGAGGACGACATTATTCGTATTAAAGACCAGTATGGTCGTTGCTAATTATTTTCGGGACAAGACGCAGAATGACACAGTTAACTTGTTTTAAAGCTTATGACATCCGTGGTGAACTGGGTGAGGAACTGAACGAGGACATCGCCTACCGTATCGGTCGCGCCTACGGCGAATTTCTGAAACCCGGGAAGATAGTGGTGGGGGGCGATGTGCGCCTCACAAGCGAGTCGCTGAAGCTGGCGCTGGCCCGCGGGTTAATGGACGCCGGTACCGACGTGCTGGACATCGGCCTGAGCGGTACCGAAGAGATTTACTTTGCCACCTTCCACCTTGGGGTAGATGGTGGCATCGAGGTGACCGCGAGCCACAATCCTATGAACTACAACGGCATGAAGCTGGTGCGCGAGAATGCGAAGCCCATCAGCGGCGACACCGGCCTGCGGGATATCCAGCGCCTGGCGGAGGAAAACCAGTTCCCGCCAGTGGACCCGGCGCGTCGCGGGACCCTGAGCAAGATATCGGTACTGAAGGAGTATGTTGACCATCTGATGAGCTACGTGGACTTCTCGAACTTCACCCGTCCACTGAAGTTGGTGGTGAACTCCGGAAACGGGGCTGCGGGGCACGTGATTGATGAGGTGGAGAAACGCTTCGCGGCGGCTGGGGTGCCGGTAACCTTTATCAAGGTGCATCACCAGCCGGATGGCCATTTCCCTAACGGTATCCCGAATCCGCTGCTGCCGGAGTGCCGCCAGGATACCGCCGACGCGGTGCGCGAGCATCAGGCCGACATGGGGATTGCCTTTGACGGCGACTTCGATCGCTGCTTCCTGTTCGATGACGAAGCTTCGTTTATCGAGGGGTATTACATTGTCGGCCTGCTGGCTGAGGCGTTCCTGCAGAAGCAGCCGGGAGCGAAAATCATTCACGACCCGCGCTTGACGTGGAACACGGTAGACATCGTGACCCGCAACGGCGGCCAGCCGGTGATGTCGAAGACGGGGCATGCGTTCATCAAGGAGCGGATGCGTCAGGAAGACGCTATCTACGGCGGGGAGATGAGTGCGCACCATTACTTCCGCGATTTCGCCTACTGCGATAGCGGGATGATCCCGTGGCTGCTGGTGGCGGAGCTGCTGTGTCTGAAGAACAGCTCGCTGAAATCGCTGGTGGCGGACCGCCAGAAGGCGTTCCCTGCGTCGGGAGAGATCAACCGCAAGCTAAGTAATGCTGCTGAGGCGATCGCCCGCATCCGGGCGCAGTATGAGCCGGCGGCTGCACACATCGACACAACGGACGGGATCAGTATTGAATACCCTGAATGGCGCTTTAACCTGCGCACGTCTAACACCGAGCCGGTGGTGCGTCTGAACGTTGAGTCCAGAGCTGATGTGGCGCTTATGAATGAAAAAACGACCGAGCTGTTACACCTGTTAAGCGGGGAATAAGGTGAGAGATTTACTAACGACGATTTATCGTTATCGGGGATTTATCTGGAGCAGTGTTAAACGTGATTTTCAGGCACGCTATCAAACTAGTATGCTGGGCGCACTATGGCTCGTTTTACAACCGCTCTCTATGATTCTGGTCTATACCCTGGTTTTTTCCGAGGTGATGAAGGCAAGAATGCCCGATAATACCGGGTCGTTTGCCTATAGTATTTATCTCTGTTCCGGGGTACTGACCTGGGGATTATTTACTGAGATGCTGGATAAAGGTCAGAGCGTATTTATTAACAATGCTAATCTGATCAAGAAACTCAGTTTTCCGAAAATCTGTCTGCCGATCATCGTGACGTTATCGGCGGTGCTAAATTTCGCGATTATTTTCAGTCTGTTTCTAATTTTTATCATTGTCACCGGTAACTTCCCCGGCTGGCTCTTTCTCTCGGTGATACCGGTCCTGCTTTTGCAGATCCTGTTTGCCGGTGGGCTGGGGATGATCCTTGGTGTCATGAACGTCTTTTTCAGGGATGTGGGGCAACTGGTTGGCGTTGCGCTGCAATTCTGGTTTTGGTTCACACCCATTGTTTATGTACTGAATTCATTACCTGCATGGGCAAAAAATCTGATGATGTATAACCCGATGACTCGGATCATGCAATCTTATCAGTCCATCTTCGCCTATCATCTGGCCCCCAACTGGTATTCGCTATGGCCAGTATTGGCTCTCGCCATTATTTTCTGCGTCATCGGTTTCAGGATGTTCCGCAAGCATGCGGCGGATATGGTGGATGAATTATAATGAGTTATATCAGAGTAAATAATGTCGGTAAGGCGTATCGCCAGTATCACTCAAAGACCGGGAGACTGATCGAATGGTTATCCCCTCTGAATACCAAACGCCATAATTTGAAATGGATCCTCCGCGATATTAATTTCGAAGTCGCTCCGGGCGAGGCTGTCGGTATTATCGGTATCAACGGTGCAGGCAAGAGTACCCTGCTTAAACTCATAACCGGGACGTCCAGGCCGACGACTGGAGAAATTGAAATCTCCGGACGTGTCGCTGCATTACTCGAATTGGGGATGGGGTTTCATTCTGATTTCACTGGTCGGCAGAATGTTTATATGTCTGGGCAACTGTTGGGGTTATCGTCAGAGAAAATAACTGAACTGATGCCGCAAATTGAAGAGTTTGCTGAGATTGGGGACTATATCGATCAACCTGTGCGCGTCTACTCCAGTGGGATGCAAGTTCGATTAGCTTTTAGTGTAGCGACGGCTATCCGTCCTGATGTGCTAATTATCGATGAGGCATTATCTGTTGGGGATGCATATTTCCAGCATAAAAGCTTTGAGCGTATTCGAAAATTTCGTCAGGAAGGGACCACGCTGTTGCTGGTATCCCATGATAAACAAGCGATCCAAAGCATTTGCGACCGGGCCATTTTATTGAATAAAGGCCAAATTGAAATGGAAGGTGAACCTGAAGCAGTGATGGATTATTACAATGCTCTTCTGGCCGATAAACAAAATCAGTCCATTAAACAAGTTGAGCATAATGGTAAAACGCAAACTGTTTCAGGCACTGGTGAGGTGACTATCTCTGAGGTTCATCTTCTCGATGAACAGGGCAATGTGACTGAATTTGTTTCGGTAGGGCATCGTGTCAGCTTGCAGGTCAACGTTGAGGTCAAGGACGATATTCCTGAGCTTGTTGTCGGATATATGATTAAGGATCGACTTGGGCAGCCGATTTTCGGGACCAATACGTACCATCTCAATCAGACACTCACCTCCCTGAAAAAAGGAGAAAAGCGTTCGTTCTTATTTTCTTTCGATGCGAGATTGGGGGTTGGCTCCTATTCTGTCGCTGTCGCGTTGCATACTTCCAGTACGCACCTCGGCAAAAACTATGAATGGCGCGATCTGGCCGTGGTATTCAACGTCGTTAACACGGAACAACAAGAGTTTGTCGGCGTGTCCTGGTTGCCGCCTGAACTGGAGATTTCTTAATGGGTTCGTCGTTTTATCGTTCATTTGAAGAACGACACAGAGGTTCGGTTGAAGAAATCAAGCGCCGCTTGAGTTTTTATTTACCTTTTCTTGCAGGTCTGAAGGACATTTATCCTGATGGCGTGATTGCGGATATTGGTTGCGGACGTGGCGAATGGTTGGAGATCCTGACTGAAAATGGCATTGCGAACATCGGCGTCGATCTCGATGATGGCATGCTGGCGCGCGCCAGGGAGGCCGGACTGAATGTGCAGAAAATGGATTGTCTGCAGTTTTTGCAAAGTCAGGCGGATCAGAGCCTGATAGCGTTGACCGGTTTTCATATTGCTGAGCATTTGCCGTTTGAGGTCCTGCAGCAACTCGCCATGCATACCCTACGGGTGCTGAAACCAGGTGGTTTGCTGATCCTCGAAACGCCGAACCCGGAGAATGTAAGCGTCGGCACCTGTTCATTTTATATGGATCCAACGCATAATCATCCTCTGCCACCGCCACTGCTTGAGTTTTTACCTATTCATTATGGTTTTACCCGAGCAATTACCGTTCGTCTGCAGGAAAAAGAGGTTCTTCAATCTCCGGATGCAGCCGTTAATTTGGTCGATGTACTCAAAGGGGTGAGCCCCGACTACAGCATCATTGCTCAGAAAGCAGCGCCAACAGATATTCTTGAACGCTTTGACACCCTGTTTACCCAGCAGTACGGTCTGACGCTGGATGCTCTGAGCAACCGTTACGATGCGATTTTGCGCCAACAGTTTTCGTCCGTTGTCTCACGGCTGGAGACGTTGAACCAAACCTATATGCAACAGATAAGCCAAATGTCAGAGACTATTCAGACGTTGCAAGGTGAGGTTGACGATCTGAGTCATGTCATCGATCAGAACCATCAGCTTCATCAGCAAATGGCGGATTTACATAACAGTCGTTCATGGCGTATTACTCAACCACTACGCTGGTTGTCTTTGCAACGTCAATTATTACGTCAGGAAGGGGCTAAAGTGCGAGCCCGTAGGGCTGGGAAAAAAATATTGCGCAAAGGGATGGCGCTCTCGCTGGTCTTTTTCCATCGTTACCCTAAGTCTAAGGTTTATCTGTTTAAGGTTCTGAGAAAAACTGGCTGCTATACATTGCTACAACGTTTGTTCCAACGCGTAATGCTGGTGCAATCTGACACGATGATGATGCAGTCCAGAAGATATGATGTGGGTACTGAAGAAATGACAAGTCGCGCGATGAGTATTTATAACGAATTAAAAAATAAAAATACGGAGAAATAACGATGCGTATTGTCATAGATTTACAAGGCGCACAGACGGAAAGCCGCTTTCGTGGCATCGGTCGTTATAGTATCGCAATCGCCAGAGGCATAATCAGAAATAACAGCCGGCATGAGATTTTCATCGCGCTATCCGCCATGCTGGATGAGTCGATTGCAAATATTAAGGCGCAATTTGCCGATCTCCTGCCGGCAGAAAATATAGTCGTATGGCATGCCGTAGGCCCTGTTCGTGCGATGGACCAAGGTAATGAATGGCGTCGGGAGAGCGCAGAACTGATTCGGGAAGCGTTTCTTGAATCATTGTGTCCAGATGTCGTTTTCATTACGAGTTTGTTTGAAGGTCATGTCGACGATGCGGCTACATCGGTACACAAATTTAGTCGTCAGTATAAAGTAGCCGTACTGCACCACGATCTTATCCCCCTCGTGCAGGCGGAAACCTATCTGCAGGACGATGTATACAAACCCTACTATTTACAGAAAGTTGAGTGGTTAAAAAACGCTGACCTTTTGTTGACTAACTCTGCTTATACCGCACAGGAAGCGATCGAGCATCTGCATTTACAGGGCGATCATGTGCAGAATATTGCAGCCGCAGTCGATTCTCAGTTTTGTATGGCGGAGGTGGCAGCGAGCGAAAAAGAGACCGTCCTTGGCCATTACGGTATTCAGCGCGAGTTCATGTTGTATGCGCCCGGAGGATTTGACTCAAGGAAAAACTTTAAACGGTTGATTGAGGCCTATGCCGGGCTCAGTGATGCCTTACGTCGCAGTCATCAACTGGTCATCGTCAGTAAGCTTTCCATCGGTGATCGTCAGTATCTGGAATCCCTTGCGTCAGGTAATGGTTTACAGCAGGGCGAACTGGTACTCACTGGTTATGTGCCGGAAGATGAGCTGATCCAGCTCTATCGCCTATGTAAGCTGTTCATCTTTGCTTCACTACATGAAGGTTTTGGGTTGCCGGTTCTGGAAGCAATGTCGTGCGGTGCGCCGGTGATTGGCTCAAATGTCACCAGTATTCCTGAAGTCATCGGTAATCCTGAGGCATTATTCGACCCGTATTCTGTCTCTTCCATGAGGGATAAGATCGCGCAATGTTTGACTGATGATACCTTCCTCGCGCGTCTGAAAGAAATGGCGCAGCAGCAAGCGCGTAATTTCTCTTGGGATAAAGCTGCGGTGACTGCTCTGGAAGCTTTCGAAAAGATCGCGGTAGAAGACACCGGTACTGCGCAGGTTTTGCCTGAAGCTTTGATTCAGAAGATCCTTGCTATCTCACAAGGGCAGCCAGATGACCGCGATCTGCGCTTGTGCGCAACGGCCATTGATTACAATCTGAAAACGGCAGAACTTTATCAAATCGACGATAAATCGCTGAACTGGCGTGTGGAAGGCCCATTCGATAGCTCATATAGTCTGGCGTTGGTCAACCGCGAATTTGCCCGGGCACTCTCAGCCGATGGTGTAGAGGTTTTATTGCATTCCACTGAAGGACCAGGTGATTTTGCCCCAGATGCCTCGTTTATGGCACAGTCGGAAAATAGTGATCTTCTGGCATTTTATAATCAATGTCAGACCCGCAAGAGTAACGAAAAGATAGATATTATTAGCAGAAATATCTATCCACCGCGGGTTACCAAAATGGATGCCAAAGTAAAATTCCTTCATTGTTATGCTTGGGAAGAAACGGGCTTTCCGCAACCGTGGATCAATGAATTTAATCGGGAACTTGACGGAGTGCTGTGTACTTCGGAACATGTTCGTAAAATACTGATTGATAACGGACTGAATGTGCCCGCATTTGTTGTTGGCAATGGCTGTGACCATTGGCTCAATATCCCAGCCGAGACGACAAAAGATGTGGATCACGGAACATTCCGTTTCCTGCACGTCTCTTCTTGTTTCCCACGCAAAGGGATACAGGCAATGCTTCAGGCTTGGGGGAAGGCGTTCACTCGTCGTGACAATGTTATCTTAATCATTAAGACTTTTAACAATCCGCACAATGAAATTGACGCATGGCTGGCTCAGGCCCAGGCTCAATTCATAGACTATCCCAAAGTTGAAGTGATCAAAGAGGATATGTCAGCCACCGAGCTTAAAGGGCTTTATGAAAGCTGTGATGTTTTGGTTGCTCCAGGTTGCGCTGAAGGCTTTGGTTTACCTATTGCTGAAGCAATGCTGAGTGGGCTACCGGCTATCGTCACCAATTGGAGCGGGCAACTTGATTTTGTTAATTCACAAAATTCATGGCTGGTTGACTATCAGTTCACTCGGGTAAAAACGCACTTTGGTCTGTTTTCCTCAGCCTGGGCCAGTGTGGATATTGACAACTTAACAGATGCATTAAAAGCGGCAGCCTCAACCGATAAATCAGTGCTGCGTGACATGGCCAATGCTGGTCGCGAGCTTCTTCTGCAGCAGTTTACCTGGAAAGCGGTGGCTGATCGTTCTTGCCAGGCGGTCAAGACTCTGCGTGCGCATATTGATATTGCACAGCATCGGGCGCGCATTGGCTGGGTGACGACCTGGAACACGAAATGTGGGATCGCAACCTATTCCCAGCATCTGGTGGAAAGCGCACCTCATGGCGCGGATGTTGTTTTTGCTCCCCAGGTCAGCGCTGGCGATCTTGTGTGTGCAGACGAAGAGTTTGTACTTCGCAACTGGATTGTAGGTAAAGAGAGCAACTATCTGGAAAACCTCCAGCCACACATTGATGCTCTGAGACTCGATGTCATTGTGATCCAATTCAACTATGGATTCTTTAATCATCGAGAACTGTCGGCGTTTATTCGTCGCCAGCATGACGCCGGTCGTTCAGTTGTTATGACGATGCACTCAACTGTGGATCCGCTGGAAAAAGAGCCGAGCTGGAATTTCCGTCTTGCTGAAATGAAAGAGGCGCTGGCACTTTGCGACCGGTTGTTGGTGCATTCGATTGCCGATATGAACCGCCTTAAAGATTTAGGCTTAACTGCGAATGTTGCTTTATTCCCGCACGGTGTTATCAACTACTCCGCAGCGAGCGTCACACGTCAACAGCAGTCTTTACCGCTAATTGCGAGCTATGGCTTCTGCTTACCGCATAAGGGCCTGATGGAACTAGTAGAATCCGTCCATAGACTCAAGCAAGCCGGTAAACCGGTTCGTTTACGACTGGTGAACGCAGAGTATCCTGTTGGGGAGTCACGCGATCTGGTGGCAGAGCTTAAAGCTGCTGCTCAGCGGTTAGGTGTTACCGATCTGATTGAGATGCATAATGATTTCCTACCTGATGCGGAGAGTCTGCGGTTGCTTTCAGAAGCCGATCTTCTGATTTTTGCTTATCAGAATACTGGGGAGTCTGCTAGCGGGGCGGTACGTTATGGTATGGCGACTCAAAAACCTGTTGCGGTAACGCCCCTGGCGATATTTGATGATTTGGACGATGCCGTCTTTAAATTTGATGGATGCAGCGTCGATGATATCAGTCAGGGGATTGACCGGATCCTGAATTCCATCCGTGAACAGAACTCTTGGGCAACCAGGACTCAACAACGTGCCGATGCATGGCGGGAACAACATGATTATCAAGCTGTTTCACGCCGTCTGGTTAATATGTGTCAAGGCTTAGCTAAAGCTAAATATTTTAAATAAAAATATCTCTCTTGTATTTTTTGCCTTTGAATACAAGAGGGGTTAGATAATGTGTCATTTATTATGAAAATTATTTTTGCTACTGAGCCAATTAAATACCCATTAACGGGCATCGGTCGGTATTCCCTGGAGCTGGTTAAGCGGCTGGCGGTCGCCCGCGAAATTGAAGAATTAAAGCTATTTCACGGTGCGTCGTTTATAGAACAGATCCCTTTGGTGGAGAATAAAAGCGATACCAAAGCCAGCAATCATGGTCGTCTGTCGGCGTTTCTACGCCGACAGACGCTGTTGATTGAGGCTTATCGCTTGCTGCATCCGCGGCGCCAGGCGTGGGCATTGCGCGACTATAAGGATTATATCTACCATGGCCCCAATTTTTATCTGCCGCATAAACTGGAACGCGCCGTGACCACGTTTCATGACATATCCATTTTTACCTGCCCGGAATATCATCCAAAAGATCGGGTTCGCTATATGGAGAAGTCCCTGCATGAGAGTCTGGATTCGGCAAAGCTGATCCTGACCGTTTCTGATTTCTCGCGCAGTGAAATTATCCGCTTGTTCAACTATCCGGCGGAGCGGATCGTAACCACCAAGCTAGCCTGCAGCAGTGACTATATCCCACGCAGCCCGGCAGAGTGTCTGCCGGTACTGCAGAAATATCAGCTGGCGTGGCAGGCCTACGCGCTATATATCGGCACTATGGAGCCACGTAAAAATATCCGAGGCCTGCTGCATGCCTATCAGCTGCTACCGATGGAGATCCGCATGCGCTATCCGCTAATCCTTAGCGGCTATCGCGGCTGGGAAGACGATGTGCTGTGGCAGTTAGTCGAGCGCGGTACTCGGGAAGGCTGGATCCGTTACCTCGGATATGTTCCGGATGAAGACCTGCCGTATCTGTACGCAGCGGCCAGAGTCTTTGTTTATCCCTCCTTCTACGAGGGATTCGGTTTACCTATTCTTGAAGCGATGTCTTGCGGTGTGCCGGTAGTATGCTCCAATGTCACCTCTTTGCCTGAGGTTGTTGGCGATGCCGGCCTCGTTGCCGATCCTAATGATATAGACGCGATTAGCGCGCAAATTTTGCAGAGCCTGCAAGATGATAGCTGGCGGGAAATCGCCACCGCGCGCGGTCTTGCTCAGGCGAAACAGTTTTCGTGGGAGAACTGTGCGACACAGACCATTAACGCCTATAAATTACTCTAAGGGTGTCAGTTGAGAGTTCTACACGTCTATAAGACTTACTATCCCGATACCTACGGCGGTATTGAGCAGGTCATTTATCAGCTAAGTCAGGGCTGCGCCCGCCGGGGAATCGCAGCCGATGTTTTCACTTTTAGCCCGGACAAAGATACAGGTCCTGTCGCTTACGAAGATCATCGGGTCATTTATAATAAACAGCTTTTTGAAATTGCCTCCACGCCGTTTTCGCTGAAAGCGTTAAAGCGTTTTAAGCTGATTAAAGATGACTACGATATCATCAACTACCATTTTCCGTTTCCCTTTATGGATATGCTGCATCTTTCGGCGCGGCCTGACGCCAGGACTGTGGTGACCTATCACTCTGATATAGTGAAACAAAAACGGTTAATGAAGCTGTACCAGCCGCTGCAGGAGCGATTTCTCAGCGGCGTAGATTGCATCGTTGCCTCGTCGCCCAATTACGTGGCTTCCAGCCAGACCCTGAAAAAATATCTGGATAAAACGGTGGTGATCCCGTTTGGTCTGGAGCAGCAGGACGTGCAGCACGATCCGCAGAGGGTCGCGCACTGGCGGGAAACTGTCGGCGATAAGTTCTTTCTCTTCGTCGGCACTTTCCGCTACTACAAAGGGCTGCATATTCTGATGGATGCCGCTGAGCGTAGCCGACTGCCAGTGGTGGTTGTAGGGGGCGGGCCGCTGGAATCGGAAGTGCGGCGTGAAGCGCAGCAGCGCGGGCTGAGCAATGTGATGTTTACCGGCATGCTCAACGACGAAGATAAGTACATTCTCTTCCAGCTCTGCCGGGGCGTGGTATTCCCCTCGCATCTGCGCTCTGAGGCGTTTGGCATTACGTTATTGGAAGGCGCACGCTTTGCAAGGCCGCTGATCTCTTGCGAGATCGGTACAGGTACCTCTTTCATTAACCAGGACAAAGTGAGTGGTTGCGTGATTCCGCCGAATGATAGCCAGGCGCTGGTGGAGGCGATGAATGAGCTCTGGAATAACGAGGAAACCTCCAACCGCTATGGCGAAAACTCGCGTCGTCGTTTTGAAGAGATGTTTACTGCCGACCATATGATTGACGCCTATGTCAATCTCTACACTACATTGCTGGAAAGCAAATCCTGAGCGGCCGCGAGCTCGTCGACTCGAGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 15
(예시적 O15
rfb
유전자좌 뉴클레오티드 서열 - O15-EPA 생산 균주 stLMTB11738)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCATGAGCAAAACTAAACTAAATGTTCTTTACCTTGCAATAAGTCAGGGTGCCAATTACCTACTGCCATTATTAATTTTTCCTTATCTTGTTAGAGTCATTGGTGTATCGAATTTTGGTGATCTGAGTTTTTCATTGATAACTATACAAGTGTTGTTAATGGTTGTTGAATATGGTTTTGGATATAGTGGGACAAGAGAAATAGCACTAAATAACGATAAAAAATACCATTCTGAATTTTTTTGCGGTGTGGTGCTTGCTCGTTTTATATTAATGCTAATTGCAGCTATAATACTCATAATACTCTGTTTTTTTTATGTTTTTAACGACGTTAAGTCTTTGTTATGTGTTGGTTTTCTGTCCGTAATTGCAGGTGTTTTCAATCCAAATTGGTTTTTGCAAGGTAAGGAAATGATGAGTGTGATGGCTGTGCTGTCACTATTTTCACGAGGCATAGCAGTCGTTGCAGTTTATCTAATTATAAAACCCGCAACGCCGATGTACATCAGTGCCTTATTATTGAGCATGCCATATATTTTGTATTCATTCTGTGGCGTTGCCTACTTACTTATTATCAAGGAGATTTTTTTATGTAGGCCACCGATAAAGAAAATTCAAGTAATTTTAAAAAATGGATTTCATTTTTTTTGTTCAACACTTGCGACTAGTGCATACACAATGTTGACCCCTCTTGTATTGGGTGGCGTATCTGGAAAGTTTGATGTAGGCATCTTTAACTCAGCTAACATGATCAAACAAGGTTTGGCTGGACTTGCATCACCATTAGTCCAAGCTTTTTATCCAAGAATTAACATTTTGCAAAGAGAGAATCCATATATTGCAAACTTAAAATCTAGAATGATTCTTAAATACTTGCTTGTTTTTTACATGGCTTTAGCAATACCATTTTTACTTTTTGCCAACCAATTATCATTATTAATATTCGGCATGAAAGGTGAAGTAATTGCAGGTGCAATGCAATTAATGACATTGCTTCCTATATTCATAGGTTTTAATACAGTTGTCGGGTTACTTGTATTAGTACCTAATGGGATGCAAAAACAGTATTTCAAATCTATTTTCCTAGGAACTATTACTTGTTTAAGCATAGTTTATCCAGCATGTAAATATTATGGAGCAACGGGTGCGATTGTGAGTCTTATTGTAGCTGAAATTTTCGTTGGCATGGGAATGCTTAAACAATTCATTAAAGTAAATAAAACCGTATGTAGGCCTCATAAATTATGAATATCTCGGTAATAATATCTGTTTGGAAACGCCCAGTTCAATTAGAATTGATTCTCTCTGAGCTCGATTCTCAGGCTAAAGACAATAGTCTACACCTAGAAGTAATTGTTTCCGATAGTCATAGTGGTAAAGAAATTGATGATGTAGTTGCTGATAATATTCATAAAAAGAAAAATATTAATATTATCCATCAACATACTAAAAATATACTCTCCGCTAAGCGCAATTTCGGAGCATCCCTAGCCCATGGGGATTATTTAATATTTCTTGATGATGATTGTATACCCGCAAGTGGATATATATCATCGTTGCTGAACTATTTAAAAAAAATGAATAGTAAAAGCGTTTTATGTGGGGAAGTTAGATTCGAAAATGAACTCATTGAGACCAGCAATTACTATCGCTACAGGAACTCTTTACACCCTAAGTTTAGTGATAGTCCTGATATCTCTATGAATGCCTGGACTTTTGTCGCAATGAATTGTGTTCTTGATAGAAAGGCATTTTCATCAGGTATAGTTTCATATAATGAAAATTTTATTGGTTATGGTTGTGAAGATCATGAGTTTGGGTGGCAACTTGAAAAAAATGACTTCAAAATTATTTTTGCTGATTTTAAAATATTACATCACGAATACAGTGGCGATATAGAAGGATATACAAAAAAAATTCGTGCTACAGCACGTGATGGTATGAATGTATTAAGCAAAGTAAGGCCTGAAATGTTTTCTACTAATAAAAAATTATTCCTAGTTGAGAAAATATTTAGTAAACACAAAACGTTTAGTAAAATATGCCAATCAATATTTTTCAATAAATTTATTTTTAAAAAAATAATACAATTTTTAAAAAAAACAGATGCAAATAAAAAACTCTATTTCCCAATTCTTTACAGATATGTGTTGATTTCGGCATATATACATGGTATTGGAGAGCGTGGCACCTCAAAAACAGATGATTTGCTTAAGAACTGGTATATATAGATGATGCTATCTTCATTTATTAAGACATTTGTATGGAAGGTAAAAAACAATGAAGTATAATGCATTGATGGCTTTTTTATTATTTTTTGTTGTTTTTTTTAGATTGTCGCTGATAATACCTTTCTTATATTTGGCATTTATTCCTGCATTTTTTGGTATTATGTATTTAGTGCGTAATTTTATGATTACTATGGGCAATGGATTGGTATCTATAGATCGTAAAAATTTGTTGCTGTTATCTATATTCATAATTATTTTTTTATTTTGTTTGGTTTTCGATTTGTTTCAAAAAAGCCATTCTTTTCAAAGTTATTTTACCGTTAGATTATTTATGTTGTTTTTATTTTCATTTGTTCCTGCGTATTATTTAGTAAATAGATTCATAAAGGGTGACTTGAAATTAATGGAGCGAATATTAGTGTATTCTCTCTGGGTTCAAATAGTTATTTTTTTTGGTATGTATATAAGTCCAGAGTTAAAAAGATTGTTATATACTTTCTTTGGTATGTCTGACTCTGTTAATCTTTGGGAACAAAATGCTAAAGTAAGAGGATTTGGGTTGTCGGGTGAAATAAATTTCATGACACCATTTTTGATGATCTATATGTCATTTTTTATGATGAAAAGGCGTTATGCTTTAATTACTTTAATTTGTCTGACTCAAATCGTAAATTCTAACATGGCTGTGATTGCAGCCATTATTGGTATCGGTTGCTCTAGACTTAATATTAATATAAAAATTGCAACAGTATTGATTTTGGGAGTTTTAGTTTATAGCTTAGGAGCGGTGTTCTTTCCTCGATTTTATGATGAGTTCGTTTCTGGAGATGGCACAAGAACTCTGGATATCTTATTACAGCAACATGTGTTTGTTGTAGGTAATTTAGATTTTTTTAATATTATATTTGGATTACAGCAAAACATATCTTCATCAATCCCCGATATTAAACAAAGTTCGGATATGGGCTGGGTTATACTGTTTAATTACGGTGGGTTAACATTTATTACACTCTTTTTATTTTTAATCTTTACTATTTCTATTGCGACATTTGGAATGACATATCAAGCAATTATATGGATGTTAATTGGGATAATTTTCAATACCAAAGGTTTAGTTTTAGGATCTAACGGCTATTTCTTTCTATCTTTTATATATATGTTTTTGAATAGAGTAACACTTAGTGGACAGAGTTCAATTACTAATAAGTTAGGTCAAGTAAGTAAATAGCTTCCAGAGTATATTTGTCAATGATTTGAGGTTCGGTTATTATGTTTTCATCTAAAACACTGTTAATTACTGGTGGTACTGGCTCTTTCGGGAATGCTGTATTAAATAGATTTCTTGATACAGATATTGCAGAAATCCGTATATTTAGTCGTGATGAAAAAAAACAAGATGATATGCGGAAAAAATACAATAATCAAAAATTAAAGTTCTATATTGGTGATGTCAGAGATTACCGTAGTATTTTGAATGCGACTCGCGGTGTTGATTTTATATATCATGCAGCGGCACTTAAGCAAGTTCCATCATGTGAATTTCATCCTATGGAAGCCGTTAAAACTAATATCCTTGGTACGGAAAATGTTCTTGAAGCAGCTATAGCGAATGAAGTGAAGAGGGTTGTATGCCTAAGTACTGATAAAGCTGTATACCCGATTAACGCAATGGGTATTTCAAAAGCTATGATGGAAAAGGTCATGGTCGCGAAATCCCGTAATGTTGATCGCAATAAAACAGTAATATGTGGTACCCGTTATGGGAATGTTATGGCATCTCGCGGTTCAGTTATTCCATTATTTGTTGATCTTATTAGAGCGGGCAAGCCACTCACAATAACTGATCCTAATATGACCCGCTTTATGATGACTCTTGAGGATGCGGTAGATTTAGTTCTTTATGCGTTTGAACATGGTAATAATGGTGATATCTTTGTGCAAAAAGCACCTGCAGCAACTATTGACACATTAGCTATTGCTTTAAAGGAATTACTAAATGTTCCTGACCATCCGGTAAATGTCATTGGAACGCGTCATGGCGAGAAATTATATGAAGCTCTACTTAGTCGTGAGGAAATGATCGCTGCTATAGATATGGGCGATTATTACCGTGTCCCGCCAGATCTTCGTGACCTTAATTATGGCAAATATGTTGAGCAAGGTGATAGCCGAATATCTGAAATAGAAGATTATAACTCTCATAATACTCAACGGTTAGATGTTGAAGGCATGAAAGAGCTCTTGCTAAAATTAGCCTTTATTCGAGCAATTCGTGCTGGTGAAAAATATAATCTGGATTCATGATATGAAAATATTAGTTACTGGTGCAAATGGTTTTATTGGTCGTAATTTATGTTTGAGGCTTGAGGAACTTGGTTATAAAGATCTTATTAGAATTGATCGAGAATCAACGAAGCAAGATCTTGAACAAGGCTTACAGGATGCCGATTTTATTTATCACTTAGCTGGTATCAATAGACCTAAGACTGATGATGAGTTTATTTCTGGAAACAGTGATTTAACAAAGCATATAGTTGAGTATCTCCTTTCTATTGGTAAGAATACACCAATTATGCTAAGTTCTTCGATACAAGCTGAACTTAATAATGCTTATGGGGTTAGCAAAGCTGTAGCTGAAAGCTATGTCGAAAAATATGCTGCTGCTAGTGGTTCTTCGTATTATATTTTCAGATATCCAAACGTTTTTGGTAAATGGTGTAAGCCAAACTATAATTCTTTTATAGCAACTTTTTGCTACAATATTTCCAATGATATTGAGATTACTATCAATGATGCAGCAGCGCCAGTCAATCTGGTCTATATTGATGATGTTTGTACTGATGCTATAGCTCTTCTCTCTGGGACGGTTGAAAGTGGATATAAAGTTGTTGCACCAATTTATTCAACAACAGTTGGTGAAGTTGCAGAATTAATTTATAGCTTCAAAAATAGCCGTTCCACCCTGATCACAGAGGCTGTCGGGGCGGGATTTACCCGTGCATTGTATTCTACATGGCTGAGTTATTTACCAGCAGAGAAGTTTGCGTACAAGGTACCTTTTTATGGGGATGCCCGCGGAGTCTTTTGTGAGATGTTGAAAACGCCTTCAGCGGGGCAGTTTTCATTTTTTACTGCTCACCCTGGTATTACGCGTGGCGGACATTACCATCACAGTAAAAATGAGAAGTTTTTGGTCATTCGAGGTCAGGCATGCTTTAAATTTGAACATGTGATTACCGGTGAGCGATATGAACTGAAAGTTTCATCGGGTGAGTTTAAGATTGTTGAAACAGTTCCTGGTTGGACACATGACATTACAAATATTGGAACTGATGAATTAATAGTCATGCTCTGGGCAAATGAAATTTTCAACCGTGATGAGCCCGATACTATTGCGAGACCTCTATAATGAAAAAATTAAAAGTTATGTCTGTTGTTGGAACCCGTCCTGAGATTATCCGTTTGTCGAGGGTTCTTGCTAAGTTTGATGAATACTGCGAGCATATTATTGTCCATACTGGTCAAAATTATGATTACGAATTAAATGAAGTGTTCTTCAATGACTTGGGTGTTCGAAAACCTGATTATTTTTTAAATGCAGCGGGTAAAAATGCGGCGGAAACCATTGGTCAGGTTATTATTAAGGTAGATGAAGTATTAGAAATCGAAAAACCTGAAGCAATACTGGTATTGGGCGATACGAATTCATGTATTTCTGCCATTCCGGCCAAACGCCGTAAAGTGCCTATATTTCATATGGAAGCAGGTAACCGTTGTTTCGATCAACGCGTGCCTGAAGAAACCAACAGACGTATTGTTGACCATACGGCTGATATCAATATGACCTACAGTGATATTGCTCGTGAATATCTCTTGGCTGAAGGTATCCCAGCTGATCGGATCATAAAAACTGGTAGCCCTATGTTTGAGGTTCTTTCATATTATATGCCCCAAATTGATGGTTCAGATGTGCTATCGCGTTTGAATCTACAGTCTGGTGAGTTTTTTGTAGTAAGTGCGCATCGTGAAGAGAATGTTGATTCTCCAAAACAGCTCGTAAAGCTTGCGAACATTCTAAATACTGTTGCTGAAAAATATAATCTTCCAGTTATTGTCTCCACACACCCAAGGACACGTAACCGAATCCGTGAGCAAGGAATTGAATTTCATTCAAATATAAATCTACTGAAACCATTGGGTTTCCATGATTATAACCACTTGCAGAAGAACTCACGAGCTGTGCTTTCAGATAGCGGTACTATCACTGAAGAGTCATCCATCATGAATTTCCCAGCGGTAAACATCCGGGAAGCGCATGAGCGTCCGGAAGGCTTTGAGGAAGCATCCGTCATGATGGTGGGGTTAGAGTGTGAACGCGTATTACAAGCGCTGGATATTCTGGCAACACAACCGCGAGGTGAAGTCCGTCTTTTACGTCAGGTTAGTGATTACAGCATGCCAAATGTGTCGGATAAAGTTGTCAGAATTGTTCACTCTTACACAGATTATGTTAAGAGAGTCGTCTGGAAAGAATATTGATGAAACTTGCTTTAATCATAGATGATTACCTGCCCAACAGTACTCGTGTTGGTGCAAAAATGTTTCATGAACTTGCTCAAGAATTTATCCAGCGTGGGCACGATGTTACGGTAATTACTCCTGGTACGGGCATGCAAGAAGAGATTTCTTTTGATACCTTTCAGGGGGTAAAAACATGGCGTTTTAAAAGCGGGCCGCTCAAGGATGTAAGTAAAATTCAGCGAGCGGTCAATGAAACGCTTTTGTCCTATCGGGCGTGGAAAGCCATCAAAAAATGGGTAAAAAAAGAGACCTTTGAGGGGGTGATTTATTATTCACCTTCCATATTCTGGGGGCCTTTAGTTAAAAAAATTAAAGCTCGTTGCCAATGTCCTGCTTATCTTATTTTAAGAGATATGTTTCCACAATGGGTAATTGATGCAGGAATGCTTAATGCTGGTTCCCCAATAGAACGCTACTTTCGTCTTTTTGAAAAAATATCTTATCGTCAGGCAAATCGTATTGGACTTATGTCTGATAAGAATCTTGATGTTTTTCGGAAAGATAATAAAGGCTATCCGTGCGAAGTTTTGCGTAATTGGGCATCCCTAACACCAACGATCATACCCAAGGATTATATACCACTACGTAAGCGACTTGGCCTAGAGGATAAAACCATTTTCTTCTATGGTGGAAACATAGGTCATGCACAGGACATGACAAACTTGATGCGACTTGTGAGAAACATGGCAGCATATCCTCAAGCTCATTTCCTATTTATTGGCCAGGGGGATGAAGTTGAATTAATTAATTCATTAGCATCTGAGTGGGCATTGACGAATTTCACCTATTTGCCCTCGGTTAACCAAGATGAATTTAAGTTCATTTTGTCGGAAATGGATATCGGCTTGTTTTCTCTTTCCGCTAGACACTCTTCCCATAATTTTCCTGGTAAGTTATTAGGCTATATGGTTCAGTCGCTACCTATTTTAGGTAGCGTAAATGCCGGAAATGATTTGCTCGACATTGTCAATCAAAATAATGCGGGATTAATCCATGTCAATGGTGAGGACGATAAATTATGTCAATCTGCGCTATTAATGTTGCATGATATTGATGTGCGCCGGCAACTTGGTTCGGGGGCGAATATATTGTTGAAAGAACAATTCTCCGTTGAGTCTGCGGCACAGACGATAGAAATGAGGTTGGAGGCATGCAATGCGATTAATTGATAATGACCAACTCGACGAATTATATGATCAAGCCGGGCAATCGGAACGTTTACGTTCCCACCTTATGATGCACGGCTCGCATCAAGAAAAGGTACAGCGTTTACTTATTGCATTAGTAAAGGGCAGCTATGTTGAACCGCATTATCACGAACTTCCTCATCAGTGGGAAATGTTCATTGTTATGGAGGGGCAACTTCAGGTTTGTTTGTATGGTAGAAATGGTGAGGTTATAAAGCAATTTATAGCAGGAGATAATACTGGAATGAGCATTGTGGAGTTTTCTCCGGGCGATATACACAGTGTCGAATGCCTATCTCCGCGTGCTCTTATGGTGGAAGTTAAGGAGGGGCCATTTGACCCTTCTTTTGCAAAATCGTTCGTGTGAGCGGCCGCGAGCTCGTCGACTCGAGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 16
(예시적 O16
rfb
유전자좌 뉴클레오티드 서열 - O16-EPA 생산 균주 stLMTB11739)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGTGAAAATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCAGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCGGGAATCACTTGCTGATGTTTCTGATTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCACCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCCGCTCGCAATTACTGGTCTGCTCTTGATAGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTCTATGGTGATTTGCCTCATCCAGATGAAGTAAATAATACAGAAGAATTACCCTTATTTACTGAGACGACAGCTTACGCGCCAAGCAGCCCTTATTCCGCATCCAAAGCATCCAGCGATCATTTAGTCCGCGCGTGGAAACGTACATATGGTTTACCGACAATTGTGACTAATTGCTCGAACAACTATGGTCCTTATCATTTCCCGGAAAAGCTTATTCCACTGGTTATTCTTAATGCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGAGATCAGATCCGCGACTGGTTGTATGTTGAAGATCATGCGCGTGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGTGAAACTTATAACATTGGTGGGCACAACGAAAAGAAAAACATCGATGTAGTGCTCACTATTTGTGATTTGCTGGATGAGATTGTACCGAAAGAGAAATCTTATCGTGAGCAAATCACTTATGTTGCTGATCGTCCGGGACACGATCGCCGCTATGCTATTGATGCTGAGAAGATTGGTCGCGCATTGGGATGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGTAAAACGGTGGAATGGTACCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTTTGGGTAATTTGATTGCTTTTGATGTTCACTCTACTGATTATTGCGGTGATTTTAGTAATCCTGAAGGTGTAGCTGAAACCGTAAGAAGCATTCGGCCGGATATTATTGTCAATGCAGCCGCTCACACCGCAGTAGACAAAGCAGAATCAGAACCGGAGTTTGCACAATTAATTAACGCAACAAGTGTCGAAGCGATTGCGAAAGCAGCAAATGAAGTTGGAGCCTGGGTTATCCATTACTCGACTGATTACGTCTTCCCTGGAAATGGCGATATGCCATGGCTGGAGACGGATGCAACCGCACCACTAAATGTTTACGGTGAAACCAAGTTAGCCGGAGAAAAAGCGTTACAGGAATATTGCGCGAAGCATCTTATTTTCCGGACCAGCTGGGTCTATGCAGGAAAAGGAAATAACTTCGCCAAAACGATGTTACGTCTGGCAAAAGAGCGTGAAGAATTAGCGGTTATTAACGATCAGTTTGGTGCGCCAACAGGTGCTGAACTGCTGGCTGATTGTACAGCACATGCCATTCGTGTCGCACTGAATAAACCGGATGTCGCAGGCTTGTACCATTTGGTAGCCAGTGGTACCACAACCTGGTACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGCATTCCCCTTGCACTCAACAAGCTCAACGCAGTACCAACAACAGCCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTTGGCGTGAAACGAATGCTCAATGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTGATGGTGGAGCAAGATGAATTAAAAGGAATGATGAAATGAAAATGCGTAAAGGTATTATTTTAGCGGGTGGTTCTGGTACACGTCTTTATCCTGTGACTATGGCTGTCAGTAAACAGCTATTACCTATTTATGATAAACCGATGATCTATTACCCGCTCTCTACACTGATGTTGGCGGGTATTCGCGATATTTTGATTATCAGTACACCTCAGGATACTCCTCGTTTTCAACAATTGCTGGGTGACGGTAGCCAGTGGGGCCTGAATCTTCAGTACAAAGTGCAACCTAGCCCAGATGGCCTCGCGCAGGCATTTATCATCGGTGAAGAGTTTATTGGTGGTGATGATTGTGCTTTGGTTCTTGGTGATAATATCTTTTACGGTCACGATCTGCCGAAGCTAATGGAGGCCGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCAGAACGCTATGGTGTCGTTGAGTTTGATAAAAACGGTACGGCAATCAGTCTGGAAGAAAAACCGTTAGAACCAAAGAGTAATTACGCCGTTACAGGTCTGTACTTTTATGATAACGACGTGGTTCAGATGGCGAAAAACTTGAAGCCGTCTGCACGTGGTGAGTTAGAAATTACAGATATTAACCGTATTTATCTTGAGCAGGGACGTCTGTCTGTCGCGATGATGGGGCGTGGCTACGCGTGGCTGGACACGGGGACTCATCAGAGTCTGATAGAAGCAAGTAATTTTATTGCGACAATTGAAGAGCGCCAGGGATTGAAGGTTTCCTGTCCTGAAGAGATTGCATTTCGTAAAGGTTTTATTGATGTTGAGCAAGTAAGAAAATTAGCTGTACCACTAATAAAGAATAATTATGGGCAGTATCTTTATAAAATGACGAAGGATTCAAATTAATGAATGTGATTAGAACTGAAATTGAAGATGTGCTAATTCTGGAGCCAAGAGTATTTGGTGATGATAGAGGTTTCTTTTATGAGAGCTTTAATCAATCAGCATTTGAACATATTCTAGGCTATCCGGTCAGCTTTGTTCAAGACAATCACTCACGTTCATCAAAAAATGTACTCAGAGGCCTTCACTTTCAACGCGGCGAGTACGCACAAGATAAACTTGTACGCTGCACTCATGGAGCAGTTTTTGATGTTGCTGTTGATATTCGACCCAATTCGGTATCCTTTGGTAAATGGGTTGGTGTTCTGCTTTCAGCTGATAATAAGCAGCAGTTGTGGATACCAAAAGGGTTTGCTCATGGCTTTTTGGTTCTGTCTGATATCGCTGAATTTCAATATAAAACTACAAACTATTATCATCCTGAAAGCGATTGTGGAATATGTTGGAATGATGAACGCATTGCAATTGATTGGCCCCAAACATCAGGGTTAATCCTTTCGCCAAAAGATGAAAGGCTCTTTACGTTAGATGAGCTTATCAGATTAAAATTAATTGCATGAATACGAATAAATTATCTTTAAGAAGAAACGTTATATATCTGGCTGTCGTTCAAGGTAGCAATTATCTTTTACCATTGCTTACATTTCCATATCTTGTAAGAACACTTGGTCCTGAAAATTTCGGTATATTCGGTTTTTGCCAAGCGACTATGCTATATATGATAATGTTTGTTGAATATGGTTTCAATCTCACAGCAACTCAGAGTATTGCCAAAGCAGCAGATAGTAAAGATAAAGTAACGTCTATTTTTTGGGCGGTGATATTTTCAAAAATAGTTCTTATCGTCATTACATTGATTTTCTTAACGTCGATGACCTTGCTTGTTCCTGAATATAACAAGCATGCCGTAATTATATGGTCGTTTGTTCCTGCATTAGTCGGGAATTTAATCTACCCTATCTGGCTGTTTCAGGGAAAAGAAAAAATGAAATGGCTGACTTTAAGTAGTATTTTATCCCGCTTGGCTATTATCCCTCTAACATTTATTTTTGTGAACACAAAGTCAGATATAGCAATTGCCGGTTTTATTCAGTCAAGTGCAAATCTGGTTGCTGGAATTATTGCACTAGCTATCGTTGTTCATGAAGGTTGGATTGGTAAAGTTACGCTATCATTACATAATGTGCGTCGATCTTTAGCAGACGGTTTTCATGTTTTTATTTCCACATCTGCTATTAGTTTATATTCTACGGGAATAGTTATTATCCTGGGATTTATATCTGGACCAACGTCCGTAGGGAATTTTAATGCGGCCAATACTATAAGAAACGCGCTTCAAGGGCTATTAAATCCTATCACCCAAGCAATATACCCAAGAATATCAAGTACGCTTGTTCTTAATCGTGTGAAGGGTGTGATTTTAATTAAAAAATCATTGACCTGCTTGAGTTTGATTGGTGGTGCTTTTTCATTAATTCTGCTCTTGGGTGCATCTATACTAGTAAAAATAAGTATAGGGCCGGGATATGATAATGCAGTGATTGTGCTAATGATTATATCGCCTCTGCCTTTTCTTATTTCATTAAGTAATGTCTATGGCATTCAAGTTATGCTGACCCATAATTATAAGAAAGAATTCAGTAAGATTTTAATCGCTGCGGGTTTGTTGAGTTTGTTGTTGATTTTTCCGCTAACAACTCTTTTTAAAGAGATTGGTGCAGCAATAACATTGCTTGCAACAGAGTGCTTAGTTACGTCACTCATGCTGATGTTCGTAAGAAATAATAAATTACTGGTTTGCTGAGGATTTTATGTACGATTATATCATTGTTGGTTCTGGTTTGTTTGGTGCCGTTTGTGCGAATGAGTTAAAAAAGCTAAACAAAAAAGTTTTAGTGATTGAGAAAAGAAATCATATCGGTGGAAATGCGTACACAGAGGACTGTGAGGGTATCCAGATTCATAAATATGGTGCACATATTTTTCATACCAATGATAAATATATATGGGATTACGTTAATGATTTAGTAGAATTTAATCGTTTTACTAATTCTCCACTGGCGATTTATAAAGACAAATTATTCAACCTTCCTTTTAATATGAATACTTTCCACCAAATGTGGGGAGTTAAAGATCCTCAAGAAGCTCAAAATATCATTAATGCTCAGAAAAAAAAGTATGGTGACAAGGTACCTGAAAATTTGGAGGAGCAGGCGATTTCATTAGTTGGGGAGGACTTATACCAAGCATTGATAAAGGGTTATACGGAGAAGCAGTGGGGAAGAAGTGCAAAAGAATTGCCTGCATTTATTATTAAGCGAATCCCAGTGAGATTTACGTTTGATAACAATTATTTTTCCGATCGCTATCAAGGTATTCCGGTGGGAGGCTACACTAAGCTTATTGAAAAAATGCTTGAAGGTGTGGACGTAAAATTAGGCATTGATTTTTTGAAAGACAAAGATTCTCTAGCGAGTAAAGCCCATAGAATCATCTACACTGGACCCATTGATCAGTACTTCGACTATAGGTTTGGAGCGTTAGAATATCGCTCTTTAAAATTTGAGACGGAACGCCATGAATTTCCAAACTTCCAAGGGAATGCAGTAATAAATTTCACTGATGCTAATGTACCATATACCAGAATAATTGAGCATAAACATTTTGACTATGTTGAGACAAAGCATACGGTTGTTACAAAAGAATATCCATTAGAGTGGAAAGTTGGCGACGAACCCTACTATCCAGTTAATGATAATAAAAACATGGAGCTTTTTAAGAAATATAGAGAGTTAGCTAGCAGAGAAGACAAGGTTATATTTGGCGGGCGTTTGGCCGAGTATAAATATTATGATATGCATCAAGTGATATCTGCCGCTCTTTATCAAGTGAAAAATATAATGAGTACGGATTAATGATCTATCTTGTAATTAGTGTCTTTCTCATTACAGCATTTATCTGTTTATATCTTAAGAAGGATATATTTTATCCAGCCGTATGCGTTAATATCATCTTCGCACTGGTCTTATTGGGATATGAAATAACGTCAGATATATATGCTTTTCAGTTAAATGACGCTACGTTGATTTTTCTACTTTGCAATGTTTTGACATTTACCCTGTCATGTTTATTGACGGAAAGTGTATTAGATCTAAATATCAGAAAAGTCAATAATGCTATTTATAGCATACCATCGAAGAAAGTGCATAATGTAGGCTTGTTAGTTATTTCTTTTTCGATGATATATATATGCATGAGGTTAAGTAACTACCAGTTCGGGACTAGCTTACTTAGCTATATGAATTTGATAAGAGATGCTGATGTTGAAGACACATCAAGAAATTTCTCAGCATACATGCAGCCAATCATTCTAACTACTTTTGCTTTATTTATTTGGTCTAAAAAATTTACTAATACAAAGGTAAGTAAAACATTTACTTTACTTGTTTTTATTGTATTCATCTTTGCAATTATACTGAATACTGGTAAGCAAATTGTCTTTATGGTTATCATCTCTTATGCATTCATCGTAGGTGTTAATAGAGTAAAACATTATGTTTATCTTATTACAGCTGTAGGTGTTCTATTCTCCTTGTATATGCTCTTTTTACGTGGACTGCCTGGGGGGATGGCATATTATCTATCCATGTATTTGGTCAGCCCTATAATCGCGTTTCAGGAGTTTTATTTTCAGCAAGTATCTAACTCTGCCAGTTCTCATGTCTTTTGGTTTTTTGAAAGGCTGATGGGGCTATTAACAGGTGGAGTCTCTATGTCGTTGCATAAAGAATTTGTGTGGGTGGGTTTGCCAACAAATGTTTATACTGCTTTTTCGGATTATGTTTATATTTCCGCGGAGCTAAGCTATTTGATGATGGTTATTCATGGCTGTATTTCAGGTGTTTTATGGAGATTGTCTCGAAATTACATATCTGTGAAAATATTTTATTCATATTTTATTTATACCTTTTCTTTCATTTTTTATCATGAAAGCTTCATGACTAATATTAGCAGTTGGATACAAATAACTCTTTGTATCATAGTATTCTCTCAATTTCTTAAGGCCCAGAAAATAAAGTGAAAATGTATTTTTTGAATGATTTAAATTTCTCTAGACGCGATGCTGGATTTAAAGCAAGAAAAGATGCACTGGACATTGCTTCAGATTATGAAAACATTTCTGTTGTTAACATTCCTCTATGGGGTGGAGTAGTCCAGAGAATTATTAGTTCTGTTAAGCTTAGTACATTTCTCTGCGGTCTTGAAAATAAAGATGTTTTAATTTTCAATTTCCCGATGGCCAAACCATTTTGGCATATATTGTCATTCTTTCACCGCCTTCTAAAATTTAGAATAGTACCTCTGATTCATGATATTGATGAATTAAGAGGAGGAGGGGGTAGTGATTCTGTGCGGCTTGCTACCTGTGATATGGTCATAAGTCACAATCCACAAATGACAAAGTACCTTAGTAAATATATGTCTCAGGATAAAATCAAAGACATAAAAATATTTGATTACCTCGTCTCATCTGATGTGGAGCATCGAGATGTTACGGATAAGCAACGAGGGGTCATATATGCTGGCAACCTTTCTAGGCATAAATGTTCTTTCATATATACTGAAGGATGCGATTTTACTCTCTTTGGTGTCAACTATGAAAATAAAGATAATCCTAAATATCTTGGAAGTTTTGATGCTCAATCTCCGGAAAAGATTAACCTCCCAGGCATGCAATTTGGACTCATTTGGGATGGAGATTCTGTCGAAACCTGTAGTGGTGCCTTTGGCGACTATTTAAAGTTTAATAACCCTCATAAGACATCTCTTTATCTTTCAATGGAACTTCCAGTATTTATATGGGATAAAGCCGCCCTTGCGGATTTCATTGTAGATAATAGAATAGGATATGCAGTGGGATCAATCAAAGAAATGCAAGAGATTGTTGACTCCATGACAATAGAAACTTATAAGCAAATTAGTGAGAATACAAAAATTATTTCTCAGAAAATTCGAACAGGAAGTTACTTCAGGGATGTTCTTGAAGAGGTGATCGATGATCTTAAAACTCGCTAAACGATATGGTCTCTGTGGTTTTATTCGGCTTGTTAGAGATGTCTTATTGACTCGTGTATTTTACCGGAACTGTAGAATTATTCGATTTCCCTGCTATATTCGCAATGATGGTAGCATTAATTTTGGTGAAAATTTCACAAGTGGAGTCGGTCTCAGGCTGGATGCATTTGGACGTGGCGTGATTTTTTTTTCCGATAATGTGCAAGTTAACGACTATGTTCATATCGCCTCAATTGAGAGCGTTACGATAGGTCGGGATACGCTTATTGCAAGTAAAGTATTTATTACCGATCATAATCACGGTTCCTTTAAGCACTCTGATCCAATGAGTTCGCCAAATATACCTCCAGACATGCGCACGTTGGAATCTTCAGCTGTTGTAATTGGCCAGAGGGTTTGGTTGGGTGAGAATGTGACGGTTTTGCCTGGAACAATTATTGGTAATGGAGTCGTAGTCGGCGCCAATTCTGTTGTTAGAGGTTCTATTCCCGAAAATACTGTCATTGCGGGAGTACCAGCAAAAATCATAAAGAAATACAATCATGAGACCAAATTATGGGAAAAAGCATAGTCGTTGTTTCTGCGGTCAATTTTACCACTGGCGGTCCATTTACCATTTTGAAAAAATTTTTGGCAGCAACTAATAATAAAGAAAATGTCAGTTTTATCGCATTAGTCCATTCTGCTAAAGAGTTAAAAGAAAGTTATCCATGGGTTAAATTCATTGAGTTTCCTGAGGTTAAAGGGTCGTGGCTAAAACGTTTGCACTTTGAATATGTAGTTTGTAAAAAACTTTCAAAAGAGCTGAATGCTACGCATTGGATTTGTCTGCATGATATTACGGCCAATGTCGTCACTAAAAAAAGATATGTGTATTGTCATAACCCTGCCCCTTTTTATAAAGGAATTTTATTCCGTGAAATTCTTATGGAGCCTAGCTTTTTCTTATTTAAAATGCTATACGGGCTGATATATAAAATAAACATTAAAAAAAATACTGCAGTGTTTGTTCAACAATTCTGGATGAAAGAAAAATTTATCAAGAAATATTCTATAAATAACATCATTGTCAGTCGGCCAGAAATTAAATTATCTGATAAAAGCCAACTTACTGATGATGATTCTCAATTTAAGAATAACCCTTCTGAGTTGACAATATTTTACCCTGCTGTTCCACGAGTATTTAAAAATTACGAGCTTATTATTAGTGCAGCAAGGAAATTGAAAGAACAATCCAATATTAAATTTCTGCTTACTATCAGTGGTACAGAAAATGCGTATGCAAAATATATTATCAGTCTTGCAGAAGGACTGGATAATGTTCATTTCCTCGGGTACTTGGATAAAGAAAAAATCGATCATTGTTATAATATTTCAGATATAGTTTGTTTTCCCTCTAGGTTAGAAACATGGGGATTGCCGTTGTCTGAGGCTAAAGAGCGAGGTAAGTGGGTATTAGCATCAGATTTCCCATTTACTAGAGAAACTCTTGGTAGTTATGAAAAGAAAGCTTTTTTTGATTCTAATAACGATGACATGTTAGTTAAACTTATTATTGACTTCAAAAAAGGTAACCTCAAAAAAGATATCTCTGATGCAAATTTCATTTATCGTAATGAAAATGTATTAGTTGGGTTTGATGAACTAGTTAATTTTATTACTGAAGAACATTGAAATGGTATATATAATAATCGTTTCCCACGGACATGAAGACTACATCAAAAAATTACTCGAAAATCTTAATGCTGACGATGAGCACTACAAGATTATCGTACGCGACAACAAAGACTCTCTATTATTGAAACAAATATGCCAGCATTATGCAGGCCTGGACTATATTAGTGGAGGTGTATACGGCTTTGGTCATAATAATAATATTGCGGTGGCGTATGTAAAGGAAAAATATAGACCCGCAGATGATGATTACATTTTGTTTTTGAATCCCGATATCATCATGAAGCATGATGATTTGCTGACATATATTAAATATGTCGAAAGTAAGCGTTATGCTTTTAGTACATTATGCCTGTTCCGAGATGAAGCGAAATCTTTACATGATTATTCCGTAAGAAAATTTCCTGTGCTTTCTGATTTTATTGTGTCATTTATGTTAGGGATTAATAAAACAAAAATTCCTAAAGAAAGTATCTATTCTGATACGGTTGTTGATTGGTGCGCAGGATCATTTATGCTGGTACGTTTTTCAGATTTTGTGCGTGTAAATGGCTTCGATCAAGGTTACTTTATGTACTGTGAAGATATTGACCTGTGCTTGAGGCTTAGCCTGGCTGGTGTCAGACTTCATTATGTTCCCGCTTTTCATGCGATACATTATGCTCATCATGACAATCGAAGTTTTTTTTCAAAAGCCTTCAGATGGCACTTAAAAAGTACTTTTAGATATTTAGCCAGAAAACGTATTTTATCAAATCGCAACTTTGATCGAATTTCATCAGTTTTTCACCCGTAAGAGCTCGGTACCCGGGCCTAGGGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATCCGTCGACGGCGGCCGCCCTGCAGGCATGCAAGCTTGATCCATATGGATCGCTAGCTTAATTAAATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACGGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACGGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAAAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 17
(예시적 O18A
rfb
유전자좌 뉴클레오티드 서열 - O18A-EPA 생산 균주 BVEC-L-00559)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGTGAAAATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCAGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCGGGAATCACTTGCTGATGTTTCTGATTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCACCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCCGCTCGCAATTACTGGTCTGCTCTTGATAGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTCTATGGTGATTTGCCTCATCCAGATGAAGTAAATAATACAGAAGAATTACCCTTATTTACTGAGACGACAGCTTACGCGCCAAGCAGCCCTTATTCCGCATCCAAAGCATCCAGCGATCATTTAGTCCGCGCGTGGAAACGTACATATGGTTTACCGACAATTGTGACTAATTGCTCGAACAACTATGGTCCTTATCATTTCCCGGAAAAGCTTATTCCACTGGTTATTCTTAATGCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGAGATCAGATCCGCGACTGGTTGTATGTTGAAGATCATGCGCGTGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGTGAAACTTATAACATTGGTGGGCACAACGAAAAGAAAAACATCGATGTAGTGCTCACTATTTGTGATTTGCTGGATGAGATTGTACCGAAAGAGAAATCTTATCGTGAGCAAATCACTTATGTTGCTGATCGTCCGGGACACGATCGCCGCTATGCTATTGATGCTGAGAAGATTGGTCGCGCATTGGGATGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGTAAAACGGTGGAATGGTACCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTTTGGGTAATTTGATTGCTTTTGATGTTCACTCTACTGATTATTGCGGTGATTTTAGTAATCCTGAAGGTGTAGCTGAAACCGTAAGAAGCATTCGGCCGGATATTATTGTCAATGCAGCCGCTCACACCGCAGTAGACAAAGCAGAATCAGAACCGGAGTTTGCACAATTAATTAACGCAACAAGTGTCGAAGCGATTGCGAAAGCAGCAAATGAAGTTGGAGCCTGGGTTATCCATTACTCGACTGATTACGTCTTCCCTGGAAATGGCGATATGCCATGGCTGGAGACGGATGCAACCGCACCACTAAATGTTTACGGTGAAACCAAGTTAGCCGGAGAAAAAGCGTTACAGGAATATTGCGCGAAGCATCTTATTTTCCGGACCAGCTGGGTCTATGCAGGAAAAGGAAATAACTTCGCCAAAACGATGTTACGTCTGGCAAAAGAGCGTGAAGAATTAGCGGTTATTAACGATCAGTTTGGTGCGCCAACAGGTGCTGAACTGCTGGCTGATTGTACAGCACATGCCATTCGTGTCGCACTGAATAAACCGGATGTCGCAGGCTTGTACCATTTGGTAGCCAGTGGTACCACAACCTGGTACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGCATTCCCCTTGCACTCAACAAGCTCAACGCAGTACCAACAACAGCCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTTGGCGTGAAACGAATGCTCAATGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTGATGGTGGAGCAAGATGAATTAAAAGGAATGATGAAATGAAAATGCGTAAAGGTATTATTTTAGCGGGTGGTTCTGGTACACGTCTTTATCCTGTGACTATGGCTGTCAGTAAACAGCTATTACCTATTTATGATAAACCGATGATCTATTACCCGCTCTCTACACTGATGTTGGCGGGTATTCGCGATATTTTGATTATCAGTACACCTCAGGATACTCCTCGTTTTCAACAATTGCTGGGTGACGGTAGCCAGTGGGGCCTGAATCTTCAGTACAAAGTGCAACCTAGCCCAGATGGCCTCGCGCAGGCATTTATCATCGGTGAAGAGTTTATTGGTGGTGATGATTGTGCTTTGGTTCTTGGTGATAATATCTTTTACGGTCACGATCTGCCGAAGCTAATGGAGGCCGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCAGAACGCTATGGTGTCGTTGAGTTTGATAAAAACGGTACGGCAATCAGTCTGGAAGAAAAACCGTTAGAACCAAAGAGTAATTACGCCGTTACAGGTCTGTACTTTTATGATAACGACGTGGTTCAGATGGCGAAAAACTTGAAGCCGTCTGCACGTGGTGAGTTAGAAATTACAGATATTAACCGTATTTATCTTGAGCAGGGACGTCTGTCTGTCGCGATGATGGGGCGTGGCTACGCGTGGCTGGACACGGGGACTCATCAGAGTCTGATAGAAGCAAGTAATTTTATTGCGACAATTGAAGAGCGCCAGGGATTGAAGGTTTCCTGTCCTGAAGAGATTGCATTTCGTAAAGGTTTTATTGATGTTGAGCAAGTAAGAAAATTAGCTGTACCACTAATAAAGAATAATTATGGGCAGTATCTTTATAAAATGACGAAGGATTCAAATTAATGAATGTGATTAGAACTGAAATTGAAGATGTGCTAATTCTGGAGCCAAGAGTATTTGGTGATGATAGAGGTTTCTTTTATGAGAGCTTTAATCAATCAGCATTTGAACATATTCTAGGCTATCCGGTCAGCTTTGTTCAAGACAATCACTCACGTTCATCAAAAAATGTACTCAGAGGCCTTCACTTTCAACGCGGCGAGTACGCACAAGATAAACTTGTACGCTGCACTCATGGAGCAGTTTTTGATGTTGCTGTTGATATTCGACCCAATTCGGTATCCTTTGGTAAATGGGTTGGTGTTCTGCTTTCAGCTGATAATAAGCAGCAGTTGTGGATACCAAAAGGGTTTGCTCATGGCTTTTTGGTTCTGTCTGATATCGCTGAATTTCAATATAAAACTACAAACTATTATCATCCTGAAAGCGATTGTGGAATATGTTGGAATGATGAACGCATTGCAATTGATTGGCCCCAAACATCAGGGTTAATCCTTTCGCCAAAAGATGAAAGGCTCTTTACGTTAGATGAGCTTATCAGATTAAAATTAATTGCATGAGGCCGGCCTTAAGGAGGACTAGTCCCGGCGCGCCATGAGTTTAATCAAAAACAGTTTTTGGAACCTTTGCGGGTATGTACTTCCAGCTATTGTGACACTACCAGCTTTGGGTATTATGGGGCGAAAATTAGGCCCAGAATTATTTGGTGTATTCACTTTGGCATTAGCTGTTGTGGGTTATGCAAGCATTTTTGATGCAGGCCTTACTCGCGCAGTGATACGAGAAGTCGCAATTGAAAAAGATAATGAAGAAAATAAGTTGAAAATTATTTCTTCAGCGACAGTTGTAATTATTTATTTGAGTTTGGCCGCCTCACTCTTATTATTTTTTTTTAGTGGTCATATCGCATTGCTACTGAACATTAGTGAGACTTTTTTTCATAATGTAAGTGTCTCGCTTAAAATTCTCGCAGCATCCATACCATTATTTTTGATTACTCAAATATGGTTGTCAATTTTAGAAGGTGAAGAAAGATTTGGTTTACTTAATATCTACAAATCAATTACGGGAGTGATATTAGCAATCTCACCGGCATTATTTATACTTATTAAACCCTCTTTGATGTATGCGATAATAGGCTTAGTTCTAGCAAGGTTTTTATGTTTTATTTTGGCTTTTATAATTTGTCACGATAAAGTGCTTAAAGCTAAACTAACAATCGATATACCAACAATTAAAAGATTGTTTATGTTCGGTGGTTGGATTACAGTAAGTAATATCATCAGCCCTGTGCTATCATATTTTGATAGGTTTATTGTTTCAAATCAACTTGGGGCTGCTAATGTTGCTTTTTATACTGCACCATCAGAAATTATTTCTCGGCTTAGTATAATTCCAGGTGCGTTTTCAAGAGCCTTATTTCCAAGATTAGCTAATGCAAATAATTCCGCTGAAAGATATAAAACGAAAAGATTAATTACAATTTCACTTTTAATAATCATCACCCCTATTTTTTGTATTGGCGTGTTATTTTCAGAGAAGATAATGGTTTTATGGATGGGGGCATCATTTTTTGGTGAGCCTGGTTTGGTATTATCAATATTACTGATTGGCTTTATTTTTAATGGATTGGCACAAGTACCATTTGCCAGTATTCAATCCCGAGGTCATGCTAAGATAACTGCATTTGTTCATCTCTTAGAGTTGTTTCCTTATTTATTACTTTTATTTTACCTCATAAAAGCACATGGGGTTGTTGGCGCGGGTATTGCGTGGTCAGTGAGGATGATAGTAGATTATATAGCATTAAGTCTTTTGGACGGTAAGTATATTAATAAATAAAATTCAAAATGCAAGTTAATAACTCATGGCTTTATTTGGGTAGGTGACAATTTATAATGATATATATATTAACTTTAACTCTTCTTCTAGTTATAGCCATAATGTTTTCTCTTCTCGGCACAAAAAGTAGGATCACATCTCCATTACCTTTGCATTTTTTACCATGGTTACTAACTTTAATTGTCGGGATAAGTAATTACGATCAATTTTACGAGTTTAATGAAAGAAGCTTTTACTCTTTGTTGATTTGGTTTACAGTTATTTTTATATTTTATTTCATAGGGGAACTGGTTAATTATAAACGTGAAAATATAAATGTTTATTATGGTCTTTCACATATTAAATATGAATGTAAAAAATATTGGATCATTGTCATCCCAATTTCATTATATACCATTTTCGAAATATATATGGTTGGTATGGGGGGAGCAGATGGATTCTTTCTCAATTTACGTCTTGCAAATACATTGGAGGGCTATACGGGTAAAAAATTTATCTTAATGCCTGCTGTATATCCTCTAATGATGGCTATGTTCGCAATTGTTTGTCTAACAAAAACTTCCAAATTAAATAAATACTCCATTTATTTCTGGATGTTTTTGTATTGTATTGGCACAATGGGAAAATTTTCAATATTAACGCCAATATTGACATATTTAATTATTTATGACTTCAAACATAGATTAAAAGTAAAAAAAACAATAAAGTTTACATTGTTGATAATTATATTAGCTTTAACTTTGCATTTTACACGTATGGCTGAGAATGACCACTCAACATTTTTATCTATTTTAGGGCTCTATATTTATTCACCAATAATTGCTTTAGGCCAGTTGAATGAAGTAAATAGTAGTCATTTTGGTGAGTATACGTTTAGATTCATATATGCTATAACTAATAAAATTGGCCTTATTAAAGAATTGCCAGTAAATACTATTCTTGACTATTCATACGTTCCTGTACCAACAAATGTATATACTGCACTTCAACCATTTTACCAGGATTTTGGTTATACTGGCATCATATTTGGAGCAGTATTATACGGACTAATATATGTGAGTTTATACACGGCCGGTGTTCGTGGAAATAATACACAGGCATTACTGATTTACGCATTGTTTTCAGTTAGCAGTGCAACGGCTTTCTTCGCTGAAACGCTAGTAACGAATTTAGCTGGAAATGTGATGTTAGTATTATGTACCATCTTACTATGGCGATTTACAGTAATATGCAAACCAGTACAGTAACCATTCTAATGGCCACCTACAATGGCGAGGCCTTCATCAAAAATCAGATTTTGTCACTACAACAACAAACATTTTCTAACTGGCGGTTATTTATTCAGGATGATGGGTCTACAGACAATACTATATCTATAATAAAAAACTTCCAAAAATCTGACTCCAGAATTCGGCTAGTTGATGATAATTTGAAAGGTCAAGGTGCAGGAAAAAATTTTTTATCGCTGATAAAGTACAGCGAGACAGATTATACAATTTATTGTGACCAAGATGATATTTGGTTAGAAAACAAAATATTTGAATTAGTAAAGTATGCAAATGAAATTAAATTGAATGTATCAGATGCGCCTTCGCTAGTTTATGCTGATGGCTATGCTTATATGGATGGTGAGGGTACAATCGATTTTTCTGGGATATCTAACAATCATGCTGATCAATTAAAGGATTTTCTTTTTTTTAATGGTGGATACCAAGGATGTTCTATTATGTTCAATCGTGCAATGACCAAATTTCTTCTGAATTATCGAGGATTTGTATATCTACATGACGATATCACAACATTAGCTGCATACGCTCTTGGTAAAGTTTATTTTCTCCCGAAATACCTTATGTTATATAGACAGCACACGAATGCGGTAACTGGTATCAAAACATTCCGCAATGGATTGACTTCTAAATTTAAATCACCAGTAAACTATCTTTTATCACGAAAACATTATCAGGTAAAAAAATCTTTTTTTGAATGTAACAGCTCTATCTTATCAGAGACGAATAAAAAAGTTTTTTTGGATTTTATTTCATTTTGTGAATCAAATAATAAATTTACAGATTTTTTTAAGTTATGGCGAGGTGGGTTTAGATTAAATAACAGTAGAACTAAATTATTATTAAAATTCTTAATACGGAGAAAATTTAGCGAATGATTTCAATACTTACACCTACTTTTAATCGGCAACATACTTTATCAAGGCTATTCAATTCTCTTATATTACAAACTGATAAAGATTTTGAGTGGATAATAATTGATGATGGTAGTATAGATGCAACAGCGGTACTTGTAGAAGATTTTAGAAAAAAATGTGATTTTGACTTGATTTATTGCTATCAGGAAAATAATGGTAAGCCCATGGCTTTAAACGCTGGTGTTAAAGCTTGTAGAGGCGATTATATCTTTATTGTTGACAGTGATGATGCACTAACTCCCGATGCCATAAAATTAATTAAAGAATCAATACATGATTGCTTATCTGAGAAGGAAAGTTTCAGCGGAGTCGGTTTTAGAAAAGCATATATAAAAGGGGGGATTATTGGTAATGATTTAAATAATTCTTCAGAACATATATACTATTTAAATGCGACTGAGATTAGCAATTTAATAAATGGTGATGTTGCATATTGTTTTAAAAAAGAAAGTTTGGTAAAAAATCCATTCCCCCGTATAGAAGATGAAAAATTTGTTCCAGAATTATATATTTGGAATAAAATAACTGACAAGGCGAAGATTCGATTTAACATAAGCAAAGTTATATATCTTTGTGAGTATCTTGATGATGGTCTTTCTAAAAATTTCCATAACCAGCTTAAAAAATACCCAAAGGGGTTTAAGATTTATTACAAAGATCAAAGAAAACGAGAGAAAACTTATATAAAAAAAACAAAGATGCTAATTAGATATTTGCAATGTTGTTATTATGAGAAAATAAAATGAAAATACTATTTGTCATTACAGGTTTAGGCCTTGGAGGTGCTGAGAAGCAGGTTTGTCTTTTAGCTGATAAATTAAGTTTAAGCGGGCACCATGTAAAGATTATTTCACTTGGACATATGTCTAATAATAAAGTCTTTCCTAGCGAAAATAATGTTAATGTCATTAATGTAAATATGTCAAAAAACATTTCTGGAGTTATAAAAGGTTGTGTCAGAATTAGAGATGTTATAGCTAATTTCAAACCAGACATTGTACACAGTCATATGTTTCATGCAAACATTATCACTAGATTGTCTGTAATTGGAATCAAAAACAGACCTGGTATTATATCAACTGCACATAATAAAAATGAAGGTGGGTATTTCAGAATGCTCACATATAGAATAACCGATTGTTTAAGTGATTGTTGTACAAATGTTAGCAAAGAAGCAGTGGATGAGTTTTTACGGATAAAAGCCTTTAATCCCGCTAAAGCAATTACTATGTATAATGGGATAGATACCAATAAATTTAAATTTGATTTATTGGCAAGGAGGGAAATTCGAGACGGTATTAATATAAAAAATGATGATATATTATTACTTGCTGCAGGTCGTTTAACGTTAGCTAAAGATTATCCTAATTTATTGAATGCAATGACTCTGCTTCCTGAACACTTTAAACTTATTATTATTGGTGATGGTGAATTGCGTGACGAAATTAATATGCTTATAAAAAAATTGCAATTATCTAATAGGGTGTCCTTGTTGGGAGTTAAAAAAAATATTGCTCCCTATTTTTCTGCATGTGATATTTTTGTTCTCTCTTCTCGTTGGGAAGGATTTGGATTAGTCGTGGCAGAAGCTATGTCATGTGAGCGAATTGTTGTTGGCACGGATTCAGGGGGAGTAAGAGAAGTTATTGGTGACGATGATTTTCTTGTACCCATATCTGATTCAACACAACTTGCAAGCAAAATTGAAAAATTGTCTTTGAGCCAGATACGTGATCACATTGGTTTTCGGAATCGTGAGCGTATTTTAAAAAATTTCTCAATAGATACTATTATTATGCAGTGGCAAGAACTCTATGGAACTATAATTTGCTCAAAACATGAAAGGTAGATTTATATTTGGAACGTGTCTTTTGTTTGAATTTAATTCAATCTCAATTGAGATTTTTGTATTTCAAAAATACCATCATAGCTAACGATGATTGGTATTTATTTTAAGATGCTTTCTATAAATATATTGACGTTTTTAATGCGCCGAAACGATTGGGCTGGGAACAGAGAAGTAAAACTGTTTTGAGAATGAAGAGTTTTTGAGATGTTTATGGATATTAAAAATTGATCCAGTGAATTAATTATTTATAATAAATCAAGATTTAATGTTAATAAATGATAATCTTTTCTGACACTCATATTAATTATGAGTGGTACGTTTGGTAAACGGTAAACTATTATATGACAGCTAGAACAACTAAAGTTTTGCACTTACAATTACTCCCACTCTTAAGTGGCGTTCAAAGGGTAACATTAAACGAAATTAGTGCGTTATATACTGATTATGATTATACACTAGTTTGCTCAAAAAAAGGTCCACTAACAAAAGCATTGCTGGAATATGATGTCGATTGTCATTGTATCCCCGAACTTACGAGAGAAATTACCGTAAAGAATGATTTTAAAGCATTGTTCAAGCTTTATAAGTTCATAAAAAAAGAAAAATTTGACATTGTGCATACACATTCTTCAAAAACAGGTATTTTGGGGCGAGTTGCTGCCAAATTAGCACGTGTTGGAAAGGTGATCCACACTGTACATGGTTTTTCTTTTCCAGCCGCATCTAGTAAAAAAAGTTATTACCTTTATTTTTTCATGGAATGGATAGCAAAGTTCTTTACGGATAAGTTAATCGTCTTGAATGTAGATGATGAATATATAGCAATAAACAAATTAAAATTCAAGCGGGATAAAGTTTTTTTAATTCCTAATGGAGTAGACACTGATAAGTTTTCTCCTTTAGAAAATAAAATTTATAGTAGCACCTTGAATCTAGTAATGGTTGGTAGATTATCCAAGCAAAAAGATCCTGAGACATTATTGCTTGCTGTTGAAAAACTGCTGAATGAAAATGTTAATGTTAAGCTGACACTTGTAGGAGATGGTGAACTAAAAGAACAGTTAGAAAGCAGGTTCAAACGGCAAGATGGACGTATAATTTTTCATGGATGGTCAGATAACATTGTTAATATTTTAAAAGTTAATGATCTTTTTATATTACCTTCTCTTTGGGAGGGTATGCCATTAGCAATTTTAGAAGCATTGAGCTGTGGACTTCCATGTATAGTCACTAATATTCCAGGTAATAATAGCTTAATAGAAGATGGCTATAATGGTTGTTTGTTTGAAATTAGAGATTGTCAGTTATTATCTCAAAAAATCATGTCATATGTTGGTAAGCCAGAACTGATTGCACAGCAATCTACCAATGCACGATCATTTATTCTGAAAAATTATGGATTAGTTAAAAGAAATAATAAGGTCAGACAGCTATATGATAATTAAGAGCTCGGTACCCGGGCCTAGGGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATCCGTCGACGGCGGCCGCCCTGCAGGCATGCAAGCTTGATCCATATGGATCGCTAGCTTAATTAAATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACGGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAAAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 18
(예시적 O25B
rfb
유전자좌 뉴클레오티드 서열 - O25B-EPA 생산 균주 stGVXN4459)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCAGTGAAGATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCTGCTGTTGTTCGTCACATAATAAATAATACGCAAGATAGTGTTGTTAATGTCGATAAATTAACATACGCCGGAAACCTGGAATCACTTGCAGATGTTTCTGATTCTGAACGCTATTTCTTTGAACATGCGGATATTTGTGATGCAGCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCAGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTGGGTACTTATGTCCTTTTAGAAGCGGCTCGGAATTATTGGTCTGGTCTGGATGATGAAAAGAAAAAAAACTTCCGTTTTCATCATATTTCTACTGATGAGGTGTATGGTGACTTACCCCATCCGGATGAAGTAAATAGCAATGAAACGTTGCCGCTATTTACGGAAACGACAGCATACGCGCCAAGTAGTCCATATTCTGCTTCTAAAGCTTCCAGCGATCATTTGGTTCGCGCATGGAAACGTACTTATGGTTTACCGACCATTGTGACTAATTGCTCGAACAACTATGGTCCTTATCATTTCCCGGAAAAGCTTATTCCACTGGTTATTCTTAATTCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGAGATCAGATCCGCGACTGGTTGTATGTAGAGGATCATGCTCGAGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGCGAAACTTATAACATTGGTGGACACAACGAAAAGAAAAACATCGACGTAGTGTTCACTATTTGTGATTTGTTGGATGAGATAGTCCCGAAAGAGAAATCTTACCGCGAGCAAATTACTTATGTTACCGATCGTCCGGGACACGATCGCCGTTATGCGATTGATGCTGAGAAGATTGGTCGCGAATTGGGATGGAAACCACAGGAAACGTTTGAGAGTGGGATTCGTAAAACGGTGGAATGGTACCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTCTGGGTAATTTGATTGCTCTTGATGTTCACTCCACTGATTACTGTGGTGATTTTAGTAATCCTGAAGGTGTAGCTGAAACCGTAAGAAGCATTCGGCCTGATATTATTGTCAACGCAGCCGCTCACACCGCAGTAGACAAAGCAGAATCAGAACCGAAGTTTGCACAATTACTGAACGCGACGAGTGTCGAAGCGATCGCGAAAGCAGCCAATGAAGTCGGCGCCTGGGTTATTCACTACTCTACTGACTACGTATTTCCGGGGACCGGTGAAATACCATGGCAGGAGGAGGATGCAACCGCACCGCTAAATGTTTACGGTGAAACCAAGTTAGCGGGAGAAAAAGCATTACAAGAGCATTGTGCGAAGCACCTTATTTTCCGGACCAGCTGGGTCTATGCAGGTAAAGGAAATAACTTCGCCAAAACAATGTTGCGTCTGGCAAAAGAGCGTGAAGAATTAGCCGTTATTAATGATCAGTTTGGTGCGCCAACTGGCGCAGAGTTACTGGCTGATTGTACGGCACATGCTATTCGTGTGGCACTGAATAAACCGGAAGTCGCAGGCTTGTACCATCTGGTAGCTAGTGGTACCACAACGTGGCACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGCATTCCCCTTGCACTCAACAAGCTCAACGCAGTACCAACAACAGCCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTTGGCGTGAAACGAATGCTTAACGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTAATGGTGGAGCAAGATGTATTAAAAGGAATGATGAAATGAAAACGCGTAAAGGTATTATTTTGGCGGGTGGTTCTGGTACTCGTCTTTATCCTGTGACGATGGCCGTCAGTAAACAGCTGTTACCGATTTATGATAAACCGATGATCTATTACCCGCTCTCTACACTGATGTTAGCGGGTATTCGCGATATTCTGATTATCAGTACACCACAGGATACTCCTCGTTTTCAACAACTGCTGGGTGACGGGAGCCAGTGGGGCCTGAATCTTCAGTACAAAGTGCAACCGAGTCCGGATGGTCTTGCGCAGGCGTTTATTATCGGTGAAGAGTTTATTGGTGGTGATGATTGTGCTTTGGTACTTGGTGATAATATCTTCTACGGCCACGACCTGCCGAAGTTAATGGACGTAGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCTGAACGTTATGGTGTCGTGGAGTTTGATAATAACGGTACTGCAATTAGCCTGGAAGAAAAACCGCTGGAACCAAAAAGTAACTATGCGGTTACTGGGCTTTATTTCTATGACAATGACGTTGTGGAAATGGCGAAAAACCTTAAGCCTTCTGCCCGAGGTGAACTGGAAATTACCGATATTAACCGTATTTATATGGAACAAGGACGTTTGTCTGTCGCTATGATGGGGCGTGGCTATGCATGGCTGGATACAGGGACGCATCAAAGTCTTATTGAAGCAAGCAACTTCATTGCCACCATTGAAGAGCGCCAGGGACTAAAGGTTTCCTGTCCGGAAGAAATTGCTTATCGTAAAGGGTTTATTGATGCTGAGCAGGTAAAAGTATTAGCCGAACCGTTGAAGAAAAATGCTTATGGTCAGTATCTGCTCAAAATGATTAAAGGTTATTAATAAGATGAACGTAATTAAAACTGAAATTCCTGATGTGCTGATTTTTGAACCAAAAGTTTTTGGGGATGAACGTGGCTTCTTTTTTGAGAGTTTTAATCAGAGGATTTTTGAAGAAGCAGTAGGTCGTAAGGTTGAGTTTGTTCAGGATAACCATTCTAAGTCCAGTAAAGGTGTTTTACGTGGTCTTCATTATCAGTTAGAACCTTATGCTCAAGGAAAACTGGTGCGCTGTGTTGTTGGCGAGGTTTTTGATGTTGCGGTTGATATTCGTAAATCGTCACCTACATTTGGGAAATGGGTTGGGGTGAATTTGTCTGCTGAGAATAAGCGTCAGTTGTGGATTCCTGAGGGATTTGCACATGGTTTTTTGGTGCTGAGTGATTTAGCAGAAGTTTTATATAAAACGAATCAATATTATGCTCCATCACATGAAAAAAATATTATATGGAATGACCTCTTGCTTAATATTAAATGGCCGAGCACAGCACTGATCACTCTGTCTGATAAGGATGCAAATGGGGAAAGATTTGAACTAAGTGAGTTTTGAAATGTCTCTCTTAAAACATAGTATATGGAATGTTGCGGGCTACTTTATACCAACATTAATTGCAATTCCCGCCTTTGGATTAATTGCGAGGAAAATTGGTGTAGAACTATTTGGTTTGTATACGTTAGCAATGATTTTTATAGGGTATGCAAGTATATTTGATGCTGGGTTAACAAGAGCTGTTGTGCGTGAAATAGCATTACTAAAAAACAGAGTGGACGATTGTAATACGATAATAGTAACTTCTATTATCGCTGTGATATTTTTAGGGTTTATCGGAGGCGGGGGAGTGTTTCTGCTTAAAGGCGATATTATTGAACTGTTAAATATCTCACCAATATATTACGCCGATTCGATAAAGTCTCTAGTATTATTATCATCTCTGATACCTGTATTCTTAGTCACGCAAATACTATTAGCAGAGCTTGAGGGTCGGGAATATTTTGGGATTCTAAATATACAAAAAAGTGTAGGGAATTCTTTAATTGCAGGGTTACCTGCATTATTTGTTTTAATTAATCAAACGCTTTTTTCTGCAATTATTGGTGTAGCGATTGCAAGAGTTATATGCTTGTGGTTAAGCTACATTATGAGCAGGGAAAGAATAACTATCGATATCTCATTTTTTTCAATAACTGTTTTAAAGCGGTTATTTAGATATGGCGGGTGGGTAACTATAAGTAACATAATATCTCCTATATTAGCGAGTATGGATAGATTTATTCTATCCCATATCCAGGGAGCATCAAAAATATCATTCTATACAGTCCCTAATGAGCTGGTAACTAGGCTTGGAATAGTTCCAGGCTCTCTTGGGAAAGCTGTTTTTCCAAAATTAAGTCATGCAAGGAATTTTACAGCGTCATATGCAGAGCAAAAAAAAGCTTATATATTAATGACTGTCATTGTAATGCCTTTGGTTTTATTTGTATATTATTACGCAAAGTTTATTTTAACATTGTGGATGGGGGCTGAGTATGCAGGGATTTCGGTCGAAATATTACGGATTATGCTTATAGGGTATATTTTTAACTGTTATTCACAAATCTCTTTTGCCAACATACAGGCCTTTGGAAAAGCAAAATACACTGCATACATCCATATGATGGAATTTATTCCTTATTTGATAATGTTATATATAATTTCAAAGGAATATGGGGTTATTGGTGTTGCGTGGTTATGGACAATTCGAGTAATAATTGATTTTTTGATGCTTTTATATATGAGTTATCGTTGTAATAATCTTATGAAAAAAGGGTAGCCTGATGATATATATTGTGGTATTAAATTGGAATGGGGCTATAGATACCATTAATTGTGTTAAAAGTTTAATGGATTTAAATGTTAGCGATTATAAAATTATCATTGTTGATAACTGTTCTATGGATAACTCATATGATACTATAAAAGAAAATCTTAATTCATTATATATTGCTGATAAAAGTATCATTGAGGTGAAGTATGAGGATAGAAATAAATATAAAACCTTAGAAAACGATAAAATCATATTAATACAATCTCCGCAAAATAATGGGTACGCAAGTGGTAATAATATTGGCATAGAGTTCGCTCTTAATCAGGAGAATATGAAATACGTCTGGGTTCTGAATAATGATACTGAAGTGGATAAAGAGGCTTTAACTCATTTAATTAGTAAATGTGATTCAGATAAAAGTATAGGGATTTGCGGTTCTCGTTTAGTCTATTTTGCCGACAGAGAGATGCAGCAAGGACTAGGTGGGGTGCATAACAAATGGTTATGCACTACAAAAAATTATGAAATGGGAAGATTAGTTTCCAAAAAATATGATGATGAAGTCATTAGTAATGATATAGATTATATAATTGGCGCATCGATGTTTTTCTCTAGAGAATGTTTGGAAACAGTTGGATTGATGAATGAAGAATATTTTTTATACTATGAAGAGTTAGATATTTGCCTCAGAGCAAAAGCAAAGAACTTTAAATTAGGTATTTGCTCAGAAAGTTTGGTTTATCATAAAATAGGTGCAAGTACTGATGGGGGAAAGAGCATGATGGCTGATCTTTGCTCAATAAAAAATAGGCTGGTCATTACAGAAAGGTTTTATCCCCAATATTATTGGACGGTATGGTTGTCACTTTTTGTTGTAGCATTTAACCGTGCTAGAAGAGGTGAGTTTAATAAGATGAAAAGATGTTTGAATGTTATGTTTAACTTCAAACGAAACAAAGGTAGCAAATGCCATTAGAATATGCACTTAATCATGGTGTTAATAAATCTATAGTTTGATATGTTATTAAAGGGTATTTAATGAAAGTGGCTTTTTTATCTGCTTATGATCCACTATCTACATCCAGTTGGTCTGGCACACCTTATTATATGCTAAAGGCATTATCGAAGAGAAATATTTCCATTGAAATATTAGGACCGGTAAATAGCTATATGATATACATGTTAAAAGTATATAAATTAATATTAAGGTGTTTCGGAAAAGAATATGATTATAGTCATTCGAAGTTGCTTTCCAGGTATTACGGTAGAATATTCGGTAGGAAATTAAAAAAAATTGATGGTTTGGATTTTATTATCGCACCTGCAGGTTCCTCACAAATTGCTTTTTTAAAAACAACCATACCAATAATATATCTATCGGATACAACATATGATCAATTAAAAAGCTATTATCCGAATTTAAATAAAAAAACAATTATAAATGATGAGGATGCAAGTTTAATCGAACGCAAGGCTATTGAAAAAGCAACAGTAGTATCTTTCCCATCTAAATGGGCAATGGATTTTTGCAGGAATTATTACAGATTAGATTTTGATAAATTAGTTGAAATACCATGGGGGGCTAATTTATTTGATGATATTCACTTTGCTAATAAAAATATAATTCAAAAGAATAGTTATACTTGTCTTTTCTTGGGAGTTGATTGGGAAAGAAAAGGTGGGAAAACAGCCTTGAAAGCAATTGAATATGTAAGGCAGTTATATGGGATCGATGTTAGACTAAAAATTTGTGGATGTACTCCGAATCAAAAGATTTTACCTACTTGGGTTGAATTAATTGATAAAGTAGATAAAAATAACGTTGACGAATATCAGAAATTCATCGATGTGTTATCTAACGCTGATATACTTCTTTTACCAACCATTGCTGAATGTTATGGAATGGTATTTTGTGAAGCTGCTGCTTTTGGATTGCCTGTTGTCGCTACAGATACAGGTGGAGTCAGTTCTATAGTTATCAACGAAAGGACGGGGATATTAATTAAAGACCCGTTAGACTATAAGCACTTTGGAAATGCAATTCATAAAATAATTAGTTCCGTAGAGACTTATCAAAACTACTCCCAAAACGCAAGAATTAGATATAATAATATATTGCATTGGGACAATTGGGCTAAAAAGATAATTGAGATTATGTATGAGCATAAGAATAGAAGAATCAAATAGCACAAAAAGAATTATATGTTTATTTATACTTTTTCTTGTTTTCCCTGATTTTTTGTTTTATACATTAGGGGTTGATAATTTTAGCATTTCAACGATAATCTCAATTACATTGCTTTTTGTTTTTTTAAGAGCTAAAAATATTTGCAAAGATAATTTTCTAATAATAGTAGCGTTATTCATATTGTTGTGTTTTAACTGTTTGTTAAGTATGCTATTTAATATTGAACAGGCTTTAACATTTAAAGTTGTACTTTCAATATATAGCATCTTAATAATGGCATACGTCTCCTCTTGTTATGCACAGACGTTGTGGTTATGTTCTGAAGAAATACTTAAGAGATCCGTCTTTTATTTGTTCGCATTTCTTTGCCTTATTGGCATTATAAGTATTCTTTTACAGAAGACTGAGATTATACATGATAAAAGTATGATTCTTTTTCCTGAACCATCAGCATTTGCATTGGTTTTTATACCTATCTTTTCATTTTGTTTATACTATACAAGAGGGGGGGGGCTACTATTGCTCTATATATTATCTTTGGGTATTGCGTTAGGTATCCAGAATTTAACAATGTTGGTAGGCATTGTGATTAGTGTTTTTGTGATGAAAAAAATAACTATAAGGCAAACTATTGTTATACTTTTGGGGGCATGGATTTTTTCCATGATATTAAGTGATTTAGACATTTCTTACTATACATCGCGGCTTGATTTTAAAAATACTACGAACCTATCAGTGCTTGTATATCTTTCAGGAATTGAAAGAGCTTTCTTGAATTTTATTACAAGTTATGGTCTTGGTATTGGTTTTCAACAAATGGGAGTGAATGGGGAGATAGGAATATATCAACAAATTTTAGCTGAACTTGATGCCCCTATGTTAAATATATACGATGGCTCATTTATTTCTTCTAAGTTAATATCTGAGTTTGGGGTTATTGGTGCATTAATGTGTATTTTCTATTTTTTTTATTTTTCCCGATTTTATCTGCGTTTCAAAAAAAGTAAGAGATATTCACCGCAGTATATTTTAGCATATAGCTTCTACATGTGTTTCTTCATCCCTCTTTTTATACGTGGTGCTGGTTATATAAACCCCTATGTGTTTATGTTATTTTCATCAATATTTTTGTGCAAATATCACGCTAAAAATATCTTGATGAAATCTAATGTCCAGATAGCTATATAATAGTAGATTATATTATCATTATCACGTAAATTACATATTAATAGCATATATGATAACTAGGACATAAATAATGTGCATTAAAAAAAAACTTAAGTTAATTAAACGATATGGCCTTTATGGTGGTCTTAGGCTTCTTAAAGATATATTCTTAACAAAATTTTTATTTTGTTCAAATGTTAGGATTATTAGATTTCCATGTTATATTAGAAAAGATGGAAGTGTTAGTTTTGGAAAAGGTTTTACATCAGGTGTAGGATTACGAGTTGATGCATTTATGGATGCCGTAGTTTCCATTGGAGAAAATGTTCAAATTAATGACTATGTTCACATCGCGGCTATTAATAATGTCATTATTGGTAGAGATACATTAATAGCAAGTAAAGTATTTATTAGTGATCATAATCATGGTATTTTTTCTAAATCCGATATCCATAGTTCACCAACTATTATTCCTTCGTCTAGGCCCCTTGAATCTGCACCTGTGTATATTGGAGAGCGTGTGTGGATTGGCGAAAATGTGACAATATTACCAGGTGCGTGTATAGGTAATGGTGTAGTTATTGGCGCAAACAGTGTTGTTCGTGGTGAGATTCCTAATAATGTGATCATTGCTGGTGTTCCAGCTAAAATTGTTAAAAAATATAACTATGAGCGTATGCAATGGGAAAGAATATAGTTGTAATATCGGCTGTTAATTTTACAACCGGAGGCCCCTTTACCGTACTAAAAAATGTGCTTACAGCAACTAAAGATAGAGCCGAATGTAAATTTATTGCACTGGTTCATAGCTCTGCTGAACTAATGGAATTATTTCCGTGGGTTGAATTTATAGAGTATCCAGAAGTCAAGTCTTCGTGGGTTAAAAGATTATATTTCGAATATATAACTTGCAATAGATTATCTAAGGTGATTAAGGCAACTCATTGGGTATGCTTACATGATATTACAGCAAATGTTAGTGTACCCTATAGATTTGTTTATTGCCACAATCCTGCACCGTTCTATAAATATTTAAGCTATCGAGATATTATAGGAGAACCTAAATTTTATCTTTTTTATCTTTTTTATGGGCTTTTATACAATATCAATATAAAAAAGAACACAGCAGTTTTTGTTCAGCAGCAGTGGCTAAAAAAAGAATTCGAAAAAAAATATAAGTTAAAGAATGTTGTTGTTAGTCGCCCTGAAGATATTTGCCCTTTTGAAAGTGATGGTTTGGTAAGAAATAATAATAAAAAGGATGTGAGGATATTTTACCCAGCAGTGCCCCGTATATTTAAAAACTTTGAAGTTATCATACGTGCTGCACAAATATTACAAGATAAAAATATTCATTTTTATCTTACTTTTGATGGTACTGAAAATAAGTATGCAAAAAGAATATATAAATTAGCTTCCGAACTGAAAAATGTACATTTCCTCGGTTACCTTAATGCAACCGAGATGGTTAACTTTTATCAAGATTCAGATATTATTTGTTTCCCATCGAAACTAGAAACGTGGGGATTACCATTATCAGAAGCTAAAACATACAAAAAATGGATATTTGCGGCAGACTTACCTTATGCTCATGAAGTTTTATATAACTATTCAAAAACTAGATATTTTCCATTTGACGATGAGAAAATACTTGTTCGCTACATATTAGAGTACACAAGTAAAAATATGCATGAAGATATAAAAAATAGTAGGGTGAATTTTAATAATGATGCATTGACTGGTTTTGAACAGTTTATTGAATATATCCTCAAGGGGAACTGACGTGGTTTATATTATAATCGTTTCACATGGCCATGATGACTATATAGAAAATCTTTTATTAAATTTAAAGTTGCCCTCTGGAAGATTTAAAATAATAGTTCGTGATAACAAAAGTTCAATGGTTTTAAAAAAAACATGCGAAAAAAATTGCGTAACCTATTTGCATGGAGGGCAATATGGATTTGGACATAATAATAACATAGCAGTGTCATATATAATTAATAACTTCATGATTATGAATAATGATTATTTTCTCTTTCTTAACCCCGATGTATTCATAACCAGTGAAAGTTTGATTAATTATGTTGATTATATAATTAGTAATGATTATAAGTTTAGCACATTATGTCTTTATCGAGATTTTACTAAAAGCAAACATGATTATTCAATACGGAGTTTTCCAACTTTATATGATTTTCTTTGTTCTTTTTTATTGGGGGTGAATAAAAGTAAAATTAAGAAGGAAAATATACTTTCTGATACTGTAGTTGATTGGTGTGCTGGCTCATTTATGCTTATTCATGCTTTAAGTTTCTTAAATGTGAATGGTTTTGATCAAAAATATTTTATGTATTGTGAAGATATTGACCTTTGTATGCGTTTAAAATTAAGTGGAGTAGATCTTTACTATACTCCCCATTTTGATGCTATTCATTATGCGCAGCATGAAAATAGAAGAATATTTACTAAAGCATTTCGATGGCATATAAGGAGTATTACGCGCTACATATTACGGAAACCAATTCTTTCTTATAAAAACTATAGAAAAATTACATCCGAACTGGTAAAGTGATTAAGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 19
(예시적 O75
rfb
유전자좌 뉴클레오티드 서열 - O75-EPA 생산 균주 stLMTB11737)
ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCAGTGAAGATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCTGCTGTTGTTCGTCACATAATAAATAATACGCAAGATAGTGTTGTTAATGTCGATAAATTAACATACGCCGGAAACCTGGAATCGCTCGCTGAAATTTCTGATTCTGAACGTTATTCATTTGAGCATGCAGATATCTGCGATGCCGAAGCGATGGCTCGTATTTTCGCACAGCACCAGCCAGACGCGGTGATGCACCTGGCAGCAGAGAGCCACGTTGACCGCTCAATAACTGGCCCTGCGGCATTTATTGAAACCAATATTGTGGGTACTTATGTTCTTTTAGAAGCGGCGCGCAATTATTGGTCTGGTCTGGATGATGAAAAGAAAAAAAACTTCCGCTTTCATCATATTTCTACTGATGAGGTGTATGGTGACTTACCCCATCCGGATGAAGTAAATAGCAATGAAACGTTGCCGCTATTTACGGAAATGACAGCATACGCGCCAAGTAGTCCATATTCTGCTTCTAAAGCTTCCAGCGATCATTTGGTTCGCGCATGGAAACGTACTTATGGTTTACCGACCATTGTGACTAATTGCTCGAACAACTATGGTCCTTATCATTTCCCGGAAAAGCTTATTCCACTGGTTATTCTTAATGCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGAGATCAGATCCGCGACTGGTTGTATGTAGAGGATCATGCTCGAGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGCGAAACTTATAACATTGGTGGACACAACGAAAAGAAAAACATCGACGTAGTGTTCACTATTTGTGATTTGTTGGATGAGATAGTCCCGAAAGAGAAATCTTATCGTGAGCAAATTACCTATGTTGCTGATCGCCCAGGGCATGATCGCCGTTATGCAATTGATGCCGATAAAATTAGCCGCGAATTGGGCTGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGTAAAACTGTGGAATGGTATCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGGGGGCCGCCACTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTTGGTTGGGAACTACAGCGTGCTCTGGCACCTCTGGGTAATTTGATTGCTCTTGATGTTCACTCCACTGATTACTGTGGTGATTTTAGTAACCCTGAAGGTGTGGCTGAAACCGTTAGAAGCATTCGGCCTGATATTATTGTCAACGCAGCCGCTCACACCGCAGTAGACAAAGCAGAATCAGAACCGGAGTTTGCACAATTACTGAACGCGACGAGTGTCGAAGCGATCGCGAAAGCAGCCAATGAAGTCGGCGCTTGGGTTATTCACTACTCTACTGACTACGTATTTCCGGGGACCGGTGAAATACCATGGCAGGAGGAGGATGCAACCGCACCGCTAAATGTTTACGGTGAAACCAAGTTAGCAGGAGAAAAAGCATTACAAGAGCATTGTGCGAAGCACCTTATTTTCCGGACCAGCTGGGTCTATGCAGGTAAAGGAAATAACTTCGCCAAAACGATGTTGCGTCTGGCAAAAGAGCGTGAAGAATTAGCCGTTATTAATGATCAGTTTGGTGCGCCAACTGGCGCAGAGTTGCTGGCTGATTGTACGGCACATGCCATTCGTGTGGCACTGAATAAACCGGAAGTCGCAGGTTTGTACCATCTGGTAGCCAGTGGTACCACAACCTGGCACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGCATTCCCCTTGCACTCAACAAGCTCAACGCAGTACCAACAACAGTCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTTGGTGTGAAACGCATGCTCAACGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTGATGGTGGAACAAGATGAATTAAAAGGAATGATGGAATGAATACGCGTAAAGGTATTATTTTAGCGGGTGGTTCTGGTACACGTCTTTATCCTGTGACTATGGCTGTCAGTAAACAGCTGTTACCGATTTATGATAAACCGATGATCTATTACCCGCTCTCTACACTGATGTTGGCGGGTATTCGCGATATTTTGATTATCAGCACGCCACAGGATACTCCTCGTTTTCAACAACTGCTGGGTGATGGGAGCCAGTGGGGGCTAAATCTTCACTACAAAGTGCAACCGAGTCCGGATGGTCTTGCGCAGGCATTTATCATCGGTGAAGAGTTTATCGGTGGTGATGATTGTGCTTTGGTACTTGGTGATAATATCTTCTACGGTCACGACCTGCCTAAGTTAATGGATGCCGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCTGAACGCTATGGTGTCGTTGAGTTTGATAAAAACGGTACTGCAATCAGCCTGGAAGAAAAACCGTTACAACCAAAAAGTAATTATGCGGTAACCGGGCTTTATTTCTATGATAACTACGTTGTGGAAATGGCGAAAAATCTTAAGCCTTCTGCCCGCGGTGAACTGGAAATTACCGATATTAACCGTATCTATATGGAACAGGGGCATTTATCTGTTGCCATGATGGGACGTGGATATGCCTGGCTGGACACGGGGACACATCAAAGTCTTATTGAAGCAAGCAACTTCATTGCCACCATTGAAGAGCGCCAGGGCTTGAAAGTTTCCTGCCCGGAAGAAATTGCTTACCGTAAAGGGTTTATTGATGCTGAGCAGGTGAAAGTATTAGCTAAACCGCTGAAAAAAAATGCTTATGGTCAGTATCTGCTAAAAATGATTAAAGGTTATTAATAAAATGAATGTTATTAAAACAGAAATTCCAGATGTACTGATTTTTGAACCGAAAGTTTTTGGTGATGAGCGTGGTTTCTTTATGGAAAGCTTTAATCAGAAAGTTTTCGAAGAGGCTGTAGGGCGGAAGGTTGAATTTGTTCAGGATAATCATTCTAAATCGTGTAAAGGTGTACTTAGAGGTTTACACTTTCAGCTTCCTCCCTTTGAGCAGGCAAAATTAGTAAGGTGTATAGTTGGCGAGGTATTTGATGTTGCAGTAGACATTAGACCTAATTCTGAAACATTTGGTTCATGGGTTGGAGTAACTCTTTCGTCAGAAAATAAAAGGCAGCTATGGATTCCAGAAGGATTCGCCCATGGTTTTTTAACTTTAAGTGATATTGCAGAGTTTGTTTATAAAACTAACAACTATTATTCTTTAAATCATGAAAGGGGAGTCATTTGGAACGATGAGGAAATTAACATTGCCTGGCCCTCTCAATCAGAGAAGATTCTGTCACAGAAAGATATTAATTTACCATCATTTAGATTTGTTCAAATGTTTAGCAAGTAGTGTTATCTTTACACTGCACATAGTCATCATTTTTTATGCTTTAAGTAAATTATATTGCACATCTATAACACAAAGCGCAATAATATTTCGACCTGATGAAGGTTTGTGGTTATTTATCTTTCTAGGCGTTTTTTATGACTAAAATAGTTGTGGTTTCTACAGCTCCAATATTCCCGACAAATAATGGGTACAAAAGTTCTGTATTAGGAAGAATTGATGAGTTATTAAATGAGGATAATGAGGTCGTTTTGATTGAAATAAACCTTGAAAATGTTACGGAAAAGAAAGATGAATTAATACCAACAAGATTTAATAATATTCAAAGATATGAAGTAAAAAAAATATCTAGATCATTTATTGCCGAGTTACAAATATTATTTGATATCAGAACTCGGTATGAACAATTATTTTCTTCTGCTGACATTAGAGATAACATAAAAAAGATAATTGATTTAGAAAAACCTTCTATTATTATTGCTGAGTCTATATGGGCGTTGCAAGCATTGCCTATTGAAATTAGTGCGAGAATACACTGTGTTATTCATGATGTGGCAACTGATTTCTTTAAAGAAATGTTTGTATCTCATAATGAGGTTGTACGAAAAATTTTGTTTTTTAATGATTACCTAAAGTTGAAAATTACTGAAGAAAATATTATCAAACGTTTGAGAGTTGAGCAATTTATCTTTCTGACAGAAGAAGATAAATGTTGGTATAAAACAAGATACAATATTGATGAGGGTTGTTGTTCCTTAGCGAGCAATCATCTTTATGTAGAAAAGATTAAGAGAACTATCAATTTCCAAACCCCTTTCCTGCTTATTCCCGGTAGCATTGAATTTTCACAAAATTTTTACGGCTTAAATTGGTTTATAAAAAATATATATCCTGGATTAAATAGGAAAATAAGAATAGTTGTAACAGGAAAGGCATCAGATAAAAAAATAAAGATGTTAAACTGTGGAGAGGAAATTACCTTTACGGGAGAGCTTGACTTTTCCACATATAATAAACTTAGCTCAACATGCTTGTGTGTTATTGCACCGATTACAACGGGCACTGGAATTAAAATAAAAATATTAGAAGCTGTACAAAAAGGTATTCCTGTACTTACAACAAAATTTGCTTCAAAAGGAATATGTTCCGATTTATGTTTTTATTGCGAGGAGGATACTGACACAAACTTTGTCAATTTAATTAACAGTTTTCTTGAAACGACATTAAGAGTCCAAGAATGAATTTATTGCTTTTTTCAGTCCTTGCGTTTGGTTTAATATTGGCTTTGGCCCATAATAATAAAAGTGGAGATATTAACGCATACTTAATGTTTTTTCTCGTGGTCCTAATGGTATTAATATCAGGGCTGCGTATGAATGATAGTGATTATATCGAATACAGGAAAATGTATAATGAAGTGCCTATTTTATGTGACTTTAGTCTCGCATCTATAAGAGATATACATGGGGAGGTAGGCTATCTATTCTTATCATCAATCTTTAAAACTTTATGCTTGCCATTTCAATTATTTCTTTTTTTTATTGCTTTTTTATCACTCCTGCTTACATATTTTTCATTCAGAAAAATAAGTTTAATACCGATACTATCGTTAGTTTTTTATTTAAGCCATGCTTTTATAGTTAGAGATTTGATTCAAATTAGGGCAGGATTAGCTGTTAGCATATCATTATATTCAATAATTAAATTTAAAGGAAATAAAAGTATAATTACAGGAGTTTTATTTGCTTCTTTGATTCATTCTGGGGCGCTTATTATTGCTCTTTGTTATCCTTTTTTCAAAAAAAAATACATAACATTAAAAATGATGTTGTTTTTATTTTTAGTGTCAATTATTTTTTCTTATTTGAATGGGCTTAATTTATCGATACAACTCTTATCTCAATATAGTTTGCTTCCAACTGCAATTTCGAATTATGTTGGTTGGGAAGAATATGATTATCGGGTGAGTATATTTACTAATCCGGTTTTTATTAAAGGTGTTTTTTTAATTGTCTTAATGCACAAATATGTACTTTCAGATATTAAAAATGAGAAAATTATAGTGCTTTATAACTTATATGTTTTAGGTGTATTAGCTATGGTTGCATTGAGTGGGATGGCTATTCTTTCAGGCCGTCTTTCATCCTTTCTGACACTAGGTGAAAGCATTTTAATTGTATATGCTCTGTTCTACAAAAGAAATACACCTCTGGCGTTTCTAATTTTTTCTTTTTTAACAATTGTGCAATTAGGATATGATCTATTTATTTCTAATGTGCATCCTGAGCTTACTCTGATTATATTTGGGTGAATCTAAGTGAAAAATAATAAAATAGGCATACTTATCTCTAAAATACAAAATCTTGGACCTGTGAATGTAGTACGAGGATTGATAAAAGAAAATAAAAAATATGCTTTTACTGTTTTTTGTTTAACAAATAGCGTAGATAAAAATATATATGATGAGTTATGCTGTTTAGGAGCCAAGGTTATATTAATACCAGATGGTACTTGGTTCAGCAAAATTTTATTTGTGAGAAGTTTTTTAAAGGAACATCCACATAATATCTTACATTCACATGGGATCACGGCCGATATGTTTTCTTACTTTCTGAATGGCGTGAAAATATCTACTATTCACAATAGACTAGATGAGGATTATATCCCATTATTTGGCGCGGTTAAAGGGAATGCTATATATTATCTTCATCGTTTTATATTACGAAGATTTAATCATATCGTTGCTTGCTCAGCAGCGGTCCAATCAAAACTGAAACAATCGAAAGTAAAAACTAAAATAACCACCATCCAGAATGGGATTGATATAACTAGGTTTAAGACACTTGAGTCTGATAAAAAAAAATTATTGAGGGAAAAACACGGATTTGATAGTGAAAAAAGAATATTTATATATTGTGGCTCGTTATCATTAAGGAAAAATATTGCTTACCTCTTGGAACACTTAGCCATCGAAGAAAATGATATATTTTTAATTCTAGGTGATGGTGAACTTTTTAGATATTGTAAGGATAAATATTCTAAAGATTTACGGTATATATTTATGGGGAAAGTTGAATGCCCTCTTGAATATTATCAATTATCAGATATTTTTGTTTCCGCTTCTTTATCGGAAGGGCTCCCCTTGGCACTATTAGAAGCTGCCTCTACTGGGTGCTATTTATATGTTAGCGATATAGAGCCCCATAGAGAAATTGCATCTCTATTAGGAGAGGAAAATATTTCTATGTTTAAAATTAAGGATGGATCATATAATTATTTGCAACCTAAAATAAAAAAAGCTGACTATAACGCTCTTTCTGACGATAAACTTTACAATATATCCGATAAAAAAATGTCAAATCTTTATGACAAACTTTTTGTTTCTTTATTAGAGCAGAGGCACTAATATAATGATTTATGTTTCGGTAATTTCTCATGGTCATTTCAAAACTCTTAAGGAATTAGGAGCAGTATCAAAATTAAATAATCACAGCAGAATTAAAGTTATCATCAAAGATAATTTAGGAGAGAGCGAGCTTTTGGATTTTTGTCAGGAAAACAAAATAACTTATTTAAGGTCTAAAGAGAAAAAAGGATTTGGAGAGAATAATAATGAAGTTTTTTCCTCTATATCCTCCTTAATTACTAAGGAAGATTTTTTTGTGGTTATGAATCCTGATATATATATTGAGTGCTCTGATCTATTAGATGTCGTAGATGAGTGTGGTTCAGCGAATGTTAATCTAGCAACGATAAATTTATACAGGGATTTTGATAAAAAAACATATGATAACTCAGTAAGGAAATTTCCCTCGGCAATTGATTTTTTTATGTCATTTTTATTTAAGAAAAATGACTGTGTAGTAAATAAGAACAAAATAACGAAACCAACATATGTTGATTGGGCTGCAGGTTCTTTTCTAATATTTAATGCCTTCTTTTATTCAAAACTCAACGGATTCAACGAAAAGTATTTTATGTATTGCGAAGATATTGATATATGTTGGCGAGCTAAAAAACACTTCAATACTTCAGTTTTATACTATCCATGCTATGCAGCAATTCATTTGGCACAATTTAACAATCGTAGGATTTTTAGTAGACATTTCATTTGGCATATAAAAAGTATTATCCTTTTTTTATTATATAAAAATGGTATGCTGCGTTCTAGTAAGTTGCTTTAATGCTAATATTCTTTTAAGAGGTGAGAATGATACCTGTTATTTTGGCTGGTGGTTCGGGAAGTCGCTTGTGGCCACTTTCACGAGAAAAGTTCCCCAAGCAGTTTTTAAAGTTGACTGGCAGTTTGACAATGTTGCAGTCAACATTGTCACGTCTTAATAATTTAAATGCTGATGATTCAATAGTTATATGCAACGAAGAGCATAGATTTATTGTTGCAGAACAATTAAGAGAGTTAGGCAAACTTTCAAATAACATTATTCTTGAACCCAAAGGTCGTAATACAGCCCCTGCTATAACACTCGCAGCATTAGCAGCAAAAAGAAAATTCGCTGATGAAGATCCATTGATTCTTATTTTAGCTGCAGATCACAACATCCAAGACGAACATGTTTTCTGTGAGGCAATTAATAAGGCGTCATCTTTAGCTAGTTATGGAAAACTAGTGACTTTTGGTATCGTTCCATTCAAACCTGAAACTGGGTATGGCTATATTCGTCGCGGTGATGAAGTGCCTGTAGATGAGCAGCATGCGGTGGCCTTTGAAGTGGCGCAGTTTGTCGAAAAACCGAATCTGGAAACCGCGCAGGCCTATGTGGCAAGCGGCGAATATTACTGGAACAGCGGTATGTTCCTGTTCCGTGCCGGACGCTATCTCGAAGAACTGAAAAAGTATCGTCCGGATATTCTCGATGCCTGTGAAAAAGCGATGAGCGCCGTCGATCCGGATCTCGATTTTATTCGTGTGGATGAAGAGGCGTTTCTCGCTTGTCCGGAAGAGTCGGTGGATTACGCGGTCATGGAATGCACGGCAGATGCCGTTGTGGTGCCGATGGATGCGGGCTGGAGCGATGTCGGTTCCTGGTCTTCATTATGGGAGATCAGCGCCCACACCGCCGAGGGCAACGTTTGCCACGGCGATGTGATTAATCACAAAACTGAAAACAGCTATGTGTACGCCGAATCTGGCCTGGTCACCACCGTCGGGGTGAAAGATTTGGTGGTAGTGCAGACCAAAGATGCAGTGCTGATTGCCGACCGTAATGCGGTGCAGGATGTGAAGAAAGTGGTCGAGCAGATCAAAGCTGATGGTCGCCATGAGCATCGGGTGCATCGCGAAGTGTATCGTCCGTGGGGCAAATATGACTCTATCGACGCGGGCGACCGCTACCAGGTGAAACGCATCACCGTGAAACCGGGCGAAGGTTTGTCGGTACAGATGCATTATCATCGCGCGGAACACTGGGTGGTTGTCGCGGGAACGGCAAAAGTCACTATCAACGGTGATATCAAACTGCTTGGTGAAAACGAGTCCATTTATATTCCGCTGGGGGCGATGCACTGCCTGGAAAACCCGGGGAAAATAGATTTAGAATTAATTGAAGTTCGCTCTGGTGCATATCTTGAAGAAGATGATGTTATTAGATGTTATGATCGCTATGGACGAAAGTAATATATAATAATTATTTCAGAATTAGAAATGATAATTATAAGTTTTCGTCTGGATAAACAATAGATAGTATGGGTTGGAAAATATGAGTTCTTTAACTTGTTTTAAAGCTTACGACATTCGCGGGAAATTAGGTGAAGAACTGAATGAAGATATCGCCTGGCGCATTGGTCGCGCCTATGGCGAATTTCTCAAACCGAAAACCATTGTGTTAGGCGGTGATGTCCGTCTCACCAGCGAAACCTTAAAACTGGCGCTGGCAAAAGGTTTACAGGATGCGGGCGTCGATGTGCTGGATATTGGCATGTCCGGCACCGAAGAGATTTATTTCGCCACGTTCCATCTCGGCGTGGATGGCGGCATTGAAGTTACCGCCAGCCATAATCCGATGGATTACAACGGCATGAAGCTGGTGCGCGAAGGGGCTCGCCCGATCAGCGGTGATACCGGACTGCGCGACGTCCAGCGTCTGGCAGAAGCTAACGACTTTCCTCCCGTCGATGAAACCAAACGCGGTCGCTATCAGCAAATCAATCTGCGTGACGCTTACGTTGATCACCTGTTCGGTTATATCAATGTCAAAAACCTTACGCCGCTCAAGCTGGTGATCAACTCCGGGAATGGCGCAGCGGGTCCGGTGGTGGACGCTATCGAAGCCCGCTTTAAAGCCCTCGGCGCACCGGTGGAGTTAATCAAAGTGCATAACACGCCGGACGGCAATTTCCCCAACGGTATTCCTAACCCGTTGCTGCCGGAATGTCGCGACGACACCCGCAATGCGGTCATCAAACACGGCGCGGATATGGGCATTGCCTTTGATGGCGATTTTGACCGCTGTTTCCTGTTTGACGAAAAAGGGCAGTTTATTGAGGGCTACTACATTGTCGGCCTGCTGGCAGAAGCGTTCCTCGAAAAAAATCCCGGCGCGAAGATCATCCACGATCCACGTCTCTCCTGGAACACCATTGATGTGGTGACGGCCGCGGGCGGCACGCCGGTGATGTCGAAAACAGGACACGCCTTTATTAAAGAACGTATGCGCAAGGAAGACGCCATCTACGGTGGCGAAATGAGCGCTCACCATTACTTCCGCGATTTCGCTTACTGTGACAGCGGCATGATCCCGTGGCTGCTGGTCGCCGAACTGGTGTGCCTGAAAGGAAAAACGCTGGGCGAACTGGTGCGCGACCGGATGGCGGCGTTTCCGGCAAGCGGTGAGATCAACAGAAAACTGGCGCACCCTGTTGAGGCGATTAACCGCGTGGAACAGCATTTTAGCCGTGAGGTGCTGGCGGTGGATCGCACCGATGGCATCAGCATGACCTTTGCCGACTGGCGCTTTAACCTGCGCTCTTCCAACACCGAACCGGTGGTGCGCCTGAATGTGGAATCTCGCGGTGATGTTCAGGTTATGGTAATCCATACTCAAGAAATATTATCAATTTTGACGTCATAAAGAATAAGCCCTGACAAGTTAGGGCTTAATTAATATATATTTTTTTTGAATTGGGGATTTGTGGTAAGATTTTTAATATGTTATTTAATGTGGTTGAATTAATGTTGACTGGAAAATAATAATGAGAACGAAAAAAGCATTACACAACTTTAAAGTTGATTTATTAATTACTTTTTTATTGGTTTTGCTAGGGTTTTATATTCGAACTGTTTTTGTTTCAAAAATGGGAAGTGATATTACTGGAGTGATGTTACTATTCACACAGTTGACAGCATATCTCAATTTGGCAGAATTAGGTATTGGAATTGCAGCTGCCAGCGTATTATATAAACCGCTCAGCGAGAATGAATACAATAAAATAACTTACATAATATCTTTGCTCTCAGTCATATACAAATATATATTTGTGTTTGTTTTGATTCTTGGCGTTGTTATAGGTATCTGTATTTATTACTTTATTGATTCTGTAAAGGTTGTAAATGGCGTTTTTTTATATTGGGCTTTGTTCGTTTTTAATACATCGTTGACATATAGTTATGCTAAATACTCCACATTATTAACTGCTAATCAGCGGTACTCAGCAGTAAGAAAAATTCAAGGTGGCGGAAAAGTTATAATAATTGTATTTCAGATATTAATTTTGTGCTTTACGCAAAGTTTCATACTTTATTTGTTAGTTGAGACTTTAGGTATTTTTTCTCAATATTTGATTTTTAAAAAAATAATTGGGAACGGAAATCAATATCTCAGTAATGAGGTTTTACTTATTGAAAGCGATAAACTTTTGATAAAAAAAGAATTAAAAATAAGAATAAAAAATATGTTCTTCCATAAAATAGGTGCTGTGCTTGTCCTTAATACAGACTACCTGCTTGTATCAAAGTTTCTGACATTAAGTTATGTGACAATTTTTGGCAGCTATATGATGGTATTTCAGATAGTAACTGTTTTGATGTCAAGTTTTGTTAATGCTATTACTGCAGGAATGGGTAATTACTTAATTAATAAAAGTAATTTAGAAATTAAGGAAATTACACGTCAATTTTATGTGATATTTATCGCCTTTGCAACATTCATATCACTAAATATGTTTTTTCTTGTTAATGATTTTATCGCAAAATGGATAGGTGTTAATTATACATTAAGTAACACCCTAGTTGCATTAATGATTGTTAACGTATTCATTAGTGTTGTCAGGGTACCTTCTGATATATTAAAAAACGCAAGTGGACATTTTGGTGATATTTATTATCCATTATTAGAAGGTGTGCTGAATATTACGATATCCATCATTTTGGCTATCATTATTGGATTACCTGGCATTATTATAGGGACAATAGTATCTAACTTAATAGTAATAATGCTTGCGAAACCATTATATCTTTACTCTAAGTTATTTAATCTTAGAAATCCGACGAGGGTTTATTTTGAATTTATTTCTCGGCCTATGTTATATTCATTATGTGTGATTGGGGTGAGCTATTTATTGCGCGATGAAATATATTCATTTAAAGTAAGTACATGGTTGGATTTTATTAACAAGCTACTCTTAGTCTCTACTCCTAGCATATTGGTAATATGTGCTATTTTCTCTACGGATAGTGACTTTAGATTATTTTTCAGAAAAATTATATATGTGATTATGAAGAAATAAAAATTTCGAAAATGTATTAATCGAAATTATGCAACGAGCTTTATTTTTATAAATGATATGTGATCTTTTCGCGAATAGGAGTAAGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA
서열번호 20
(실시예 CRM197 서열)
GADDVVDSSKSFVMENFSSYHGTKPGYVDSIQKGIQKPKSGTQGNYDDDWKEFYSTDNKYDAAGYSVDNENPLSGKAGGVVKVTYPGLTKVLALKVDNAETIKKELGLSLTEPLMEQVGTEEFIKRFGDGASRVVLSLPFAEGSSSVEYINNWEQAKALSVELEINFETRGKRGQDAMYEYMAQACAGNRVRRSVGSSLSCINLDWDVIRDKTKTKIESLKEHGPIKNKMSESPNKTVSEEKAKQYLEEFHQTALEHPELSELKTVTGTNPVFAGANYAAWAVNVAQVIDSETADNLEKTTAALSILPGIGSVMGIADGAVHHNTEEIVAQSIALSSLMVAQAIPLVGELVDIGFAAYNFVESIINLFQVVHNSYNRPAYSPGHKTQPFLHDGYAVSWNTVEDSIIRTGFQGESGHDIKITAENTPLPIAGVLLPTIPGKLDVNKSKTHISVNGRKIRMRCRAIDGDVTFCRPKSPVYVGNGVHANLHVAFHRSSSEKIHSNEISSDSIGVLGYQKTVDHTKVNSKLSLFFEIKS
본원에 기재된 구현예는 단지 예시적인 것으로 의도되며, 당업자는 단지 일상적인 실험을 이용하여 본원에 기재된 구체적인 절차에 대한 다수의 등가물을 인식하거나 확인할 수 있을 것이다. 이러한 모든 등가물은 본 발명의 범위 내에 있는 것으로 간주되며 다음 청구범위에 포함된다.
본원에 인용된 모든 참고문헌(특허 출원, 특허 및 간행물 포함)은 마치 각 개별 간행물 또는 특허 또는 특허 출원이 모든 목적을 위하여 전체가 참고로 포함되는 것으로 구체적이고 개별적으로 표시된 것처럼 동일한 정도로 모든 목적을 위하여 전체가 참고로 본원에 포함된다.
SEQUENCE LISTING
<110> Janssen Pharmaceuticals, Inc.
<120> Multivalent Vaccine Compositions and Uses Thereof
<130> CRU6048WOPCT1
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 3
<212> PRT
<213> Artificial Sequence
<220>
<223> Glycosylation consensus sequence
<220>
<221> VARIANT
<222> (2)..(2)
<223> Any amino acid residue except Pro
<220>
<221> VARIANT
<222> (3)..(3)
<223> Ser or Thr
<400> 1
Asn Xaa Xaa
1
<210> 2
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Optimized glycosylation consensus sequence
<220>
<221> VARIANT
<222> (1)..(1)
<223> Asp or Glu
<220>
<221> VARIANT
<222> (2)..(2)
<223> Any amino acid residue except Pro
<220>
<221> VARIANT
<222> (4)..(4)
<223> Any amino acid residue except Pro
<220>
<221> VARIANT
<222> (5)..(5)
<223> Ser or Thr
<400> 2
Xaa Xaa Asn Xaa Xaa
1 5
<210> 3
<211> 652
<212> PRT
<213> Artificial Sequence
<220>
<223> EPA carrier protein comprising 4 glycosylation consensus
sequences (EPA-4)
<400> 3
Gly Ser Gly Gly Gly Asp Gln Asn Ala Thr Gly Ser Gly Gly Gly Lys
1 5 10 15
Leu Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys Ala Cys
20 25 30
Val Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser Val Asp
35 40 45
Pro Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr Ser Met
50 55 60
Val Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp Asn Ala
65 70 75 80
Leu Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly Gly Val
85 90 95
Glu Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala Arg Gly
100 105 110
Ser Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys Pro Ser
115 120 125
Asn Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln Leu Ser
130 135 140
His Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu Leu Ala
145 150 155 160
Lys Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu Ser Asn
165 170 175
Glu Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser Val Val
180 185 190
Met Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu Trp Ala
195 200 205
Ser Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val Tyr Asn
210 215 220
Tyr Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu Gly Lys
225 230 235 240
Ile Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu Asp Ile
245 250 255
Lys Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg Leu His
260 265 270
Phe Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys
275 280 285
His Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg Gly Trp
290 295 300
Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu
305 310 315 320
Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg
325 330 335
Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile
340 345 350
Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala
355 360 365
Glu Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly
370 375 380
Ala Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Lys Asp
385 390 395 400
Gln Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser Gly Asp
405 410 415
Ala Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu Gly Asp
420 425 430
Gly Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp Thr Val
435 440 445
Glu Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly Tyr Val
450 455 460
Phe Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser Ile Val
465 470 475 480
Phe Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile Trp Arg
485 490 495
Gly Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr Ala Gln
500 505 510
Asp Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala Leu Leu
515 520 525
Arg Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg Thr Gly
530 535 540
Leu Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg Leu Ile
545 550 555 560
Gly His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro Glu Glu
565 570 575
Glu Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu Arg Thr
580 585 590
Val Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val Gly Gly
595 600 605
Asp Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile Ser Ala
610 615 620
Leu Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu Asp Leu
625 630 635 640
Lys Leu Gly Ser Gly Gly Gly Asp Gln Asn Ala Thr
645 650
<210> 4
<211> 421
<212> PRT
<213> Artificial Sequence
<220>
<223> O4 GtrS amino acid sequence
<400> 4
Met Asn Asn Leu Ile Met Asn Asn Trp Cys Lys Leu Ser Ile Phe Ile
1 5 10 15
Ile Ala Phe Ile Leu Leu Trp Leu Arg Arg Pro Asp Ile Leu Thr Asn
20 25 30
Ala Gln Phe Trp Ala Glu Asp Ser Val Phe Trp Tyr Lys Asp Ala Tyr
35 40 45
Glu Asn Gly Phe Leu Ser Ser Leu Thr Thr Pro Arg Asn Gly Tyr Phe
50 55 60
Gln Thr Val Ser Thr Phe Ile Val Gly Leu Thr Ala Leu Leu Asn Pro
65 70 75 80
Asp Tyr Ala Pro Phe Val Ser Asn Phe Phe Gly Ile Met Ile Arg Ser
85 90 95
Val Ile Ile Trp Phe Leu Phe Thr Glu Arg Phe Asn Phe Leu Thr Leu
100 105 110
Thr Thr Arg Ile Phe Leu Ser Ile Tyr Phe Leu Cys Met Pro Gly Leu
115 120 125
Asp Glu Val His Ala Asn Ile Thr Asn Ala His Trp Tyr Leu Ser Leu
130 135 140
Tyr Val Ser Met Ile Leu Ile Ala Arg Asn Pro Ser Ser Lys Ser Trp
145 150 155 160
Arg Phe His Asp Ile Phe Phe Ile Leu Leu Ser Gly Leu Ser Gly Pro
165 170 175
Phe Ile Ile Phe Ile Leu Ala Ala Ser Cys Phe Lys Phe Ile Asn Asn
180 185 190
Cys Lys Asp His Ile Ser Val Arg Ser Phe Ile Asn Phe Tyr Leu Arg
195 200 205
Gln Pro Tyr Ala Leu Met Ile Val Cys Ala Leu Ile Gln Gly Thr Ser
210 215 220
Ile Ile Leu Thr Phe Asn Gly Thr Arg Ser Ser Ala Pro Leu Gly Phe
225 230 235 240
Ser Phe Asp Val Ile Ser Ser Ile Ile Ser Ser Asn Ile Phe Leu Phe
245 250 255
Thr Phe Val Pro Trp Asp Ile Ala Lys Ala Gly Trp Asp Asn Leu Leu
260 265 270
Leu Ser Tyr Phe Leu Ser Val Ser Ile Leu Ser Cys Ala Ala Phe Val
275 280 285
Phe Val Lys Gly Thr Trp Arg Met Lys Val Phe Ala Thr Leu Pro Leu
290 295 300
Leu Ile Ile Ile Phe Ser Met Ala Lys Pro Gln Leu Thr Asp Ser Ala
305 310 315 320
Pro Gln Leu Pro Thr Leu Ile Asn Gly Gln Gly Ser Arg Tyr Phe Val
325 330 335
Asn Ile His Ile Ala Ile Phe Ser Leu Leu Cys Val Tyr Leu Leu Glu
340 345 350
Cys Val Arg Gly Lys Val Ala Thr Leu Phe Ser Lys Ile Tyr Leu Thr
355 360 365
Ile Leu Leu Phe Val Met Gly Cys Leu Asn Phe Val Ile Thr Pro Leu
370 375 380
Pro Asn Met Asn Trp Arg Glu Gly Ala Thr Leu Ile Asn Asn Ala Lys
385 390 395 400
Thr Gly Asp Val Ile Ser Ile Gln Val Leu Pro Pro Gly Leu Thr Leu
405 410 415
Glu Leu Arg Lys Lys
420
<210> 5
<211> 1266
<212> PRT
<213> Artificial Sequence
<220>
<223> Example O4 gtrS nucleic acid sequence
<400> 5
Ala Thr Gly Ala Ala Thr Ala Ala Thr Thr Thr Ala Ala Thr Thr Ala
1 5 10 15
Thr Gly Ala Ala Thr Ala Ala Cys Thr Gly Gly Thr Gly Thr Ala Ala
20 25 30
Ala Thr Thr Ala Thr Cys Thr Ala Thr Ala Thr Thr Thr Ala Thr Thr
35 40 45
Ala Thr Thr Gly Cys Ala Thr Thr Thr Ala Thr Thr Thr Thr Gly Cys
50 55 60
Thr Ala Thr Gly Gly Cys Thr Thr Ala Gly Ala Ala Gly Gly Cys Cys
65 70 75 80
Gly Gly Ala Thr Ala Thr Ala Cys Thr Cys Ala Cys Ala Ala Ala Cys
85 90 95
Gly Cys Ala Cys Ala Ala Thr Thr Thr Thr Gly Gly Gly Cys Ala Gly
100 105 110
Ala Ala Gly Ala Thr Thr Cys Cys Gly Thr Thr Thr Thr Cys Thr Gly
115 120 125
Gly Thr Ala Thr Ala Ala Gly Gly Ala Cys Gly Cys Cys Thr Ala Thr
130 135 140
Gly Ala Gly Ala Ala Cys Gly Gly Ala Thr Thr Cys Thr Thr Ala Ala
145 150 155 160
Gly Thr Thr Cys Ala Cys Thr Ala Ala Cys Ala Ala Cys Gly Cys Cys
165 170 175
Thr Ala Gly Gly Ala Ala Thr Gly Gly Gly Thr Ala Thr Thr Thr Cys
180 185 190
Cys Ala Gly Ala Cys Thr Gly Thr Thr Thr Cys Thr Ala Cys Ala Thr
195 200 205
Thr Thr Ala Thr Ala Gly Thr Thr Gly Gly Thr Cys Thr Gly Ala Cys
210 215 220
Thr Gly Cys Thr Thr Thr Ala Thr Thr Ala Ala Ala Thr Cys Cys Ala
225 230 235 240
Gly Ala Thr Thr Ala Thr Gly Cys Ala Cys Cys Thr Thr Thr Thr Gly
245 250 255
Thr Thr Thr Cys Thr Ala Ala Thr Thr Thr Thr Thr Thr Thr Gly Gly
260 265 270
Cys Ala Thr Ala Ala Thr Gly Ala Thr Thr Cys Gly Cys Thr Cys Ala
275 280 285
Gly Thr Ala Ala Thr Thr Ala Thr Ala Thr Gly Gly Thr Thr Thr Thr
290 295 300
Thr Ala Thr Thr Thr Ala Cys Ala Gly Ala Ala Ala Gly Ala Thr Thr
305 310 315 320
Cys Ala Ala Cys Thr Thr Cys Cys Thr Cys Ala Cys Ala Thr Thr Gly
325 330 335
Ala Cys Thr Ala Cys Thr Ala Gly Gly Ala Thr Thr Thr Thr Cys Thr
340 345 350
Thr Ala Thr Cys Thr Ala Thr Thr Thr Ala Thr Thr Thr Thr Cys Thr
355 360 365
Ala Thr Gly Cys Ala Thr Gly Cys Cys Thr Gly Gly Ala Thr Thr Gly
370 375 380
Gly Ala Thr Gly Ala Ala Gly Thr Thr Cys Ala Thr Gly Cys Ala Ala
385 390 395 400
Ala Thr Ala Thr Ala Ala Cys Ala Ala Ala Thr Gly Cys Ala Cys Ala
405 410 415
Thr Thr Gly Gly Thr Ala Thr Thr Thr Gly Thr Cys Ala Thr Thr Ala
420 425 430
Thr Ala Thr Gly Thr Ala Thr Cys Ala Ala Thr Gly Ala Thr Cys Cys
435 440 445
Thr Gly Ala Thr Ala Gly Cys Thr Cys Gly Cys Ala Ala Thr Cys Cys
450 455 460
Ala Ala Gly Thr Thr Cys Ala Ala Ala Ala Thr Cys Ala Thr Gly Gly
465 470 475 480
Ala Gly Gly Thr Thr Thr Cys Ala Thr Gly Ala Thr Ala Thr Ala Thr
485 490 495
Thr Cys Thr Thr Thr Ala Thr Cys Thr Thr Gly Cys Thr Ala Thr Cys
500 505 510
Cys Gly Gly Gly Cys Thr Cys Ala Gly Thr Gly Gly Cys Cys Cys Ala
515 520 525
Thr Thr Thr Ala Thr Ala Ala Thr Thr Thr Thr Cys Ala Thr Thr Thr
530 535 540
Thr Ala Gly Cys Ala Gly Cys Thr Thr Cys Ala Thr Gly Cys Thr Thr
545 550 555 560
Thr Ala Ala Ala Thr Thr Thr Ala Thr Ala Ala Ala Thr Ala Ala Thr
565 570 575
Thr Gly Thr Ala Ala Ala Gly Ala Thr Cys Ala Thr Ala Thr Thr Ala
580 585 590
Gly Thr Gly Thr Ala Ala Gly Ala Thr Cys Thr Thr Thr Cys Ala Thr
595 600 605
Ala Ala Ala Thr Thr Thr Cys Thr Ala Cys Thr Thr Gly Cys Gly Thr
610 615 620
Cys Ala Gly Cys Cys Ala Thr Ala Cys Gly Cys Ala Thr Thr Ala Ala
625 630 635 640
Thr Gly Ala Thr Thr Gly Thr Thr Thr Gly Cys Gly Cys Thr Thr Thr
645 650 655
Ala Ala Thr Thr Cys Ala Ala Gly Gly Ala Ala Cys Thr Thr Cys Thr
660 665 670
Ala Thr Ala Ala Thr Thr Cys Thr Ala Ala Cys Thr Thr Thr Cys Ala
675 680 685
Ala Thr Gly Gly Cys Ala Cys Ala Cys Gly Thr Thr Cys Cys Thr Cys
690 695 700
Ala Gly Cys Ala Cys Cys Gly Cys Thr Ala Gly Gly Ala Thr Thr Cys
705 710 715 720
Ala Gly Thr Thr Thr Thr Gly Ala Thr Gly Thr Gly Ala Thr Thr Thr
725 730 735
Cys Gly Thr Cys Thr Ala Thr Thr Ala Thr Ala Thr Cys Ala Thr Cys
740 745 750
Gly Ala Ala Thr Ala Thr Thr Thr Thr Thr Thr Thr Ala Thr Thr Thr
755 760 765
Ala Cys Ala Thr Thr Thr Gly Thr Cys Cys Cys Ala Thr Gly Gly Gly
770 775 780
Ala Thr Ala Thr Thr Gly Cys Ala Ala Ala Gly Gly Cys Thr Gly Gly
785 790 795 800
Gly Thr Gly Gly Gly Ala Thr Ala Ala Thr Thr Thr Ala Cys Thr Gly
805 810 815
Thr Thr Ala Thr Cys Thr Thr Ala Thr Thr Thr Thr Thr Thr Gly Thr
820 825 830
Cys Thr Gly Thr Thr Thr Cys Gly Ala Thr Thr Thr Thr Gly Thr Cys
835 840 845
Gly Thr Gly Thr Gly Cys Gly Gly Cys Cys Thr Thr Thr Gly Thr Thr
850 855 860
Thr Thr Thr Gly Thr Thr Ala Ala Ala Gly Gly Thr Ala Cys Gly Thr
865 870 875 880
Gly Gly Cys Gly Ala Ala Thr Gly Ala Ala Ala Gly Thr Ala Thr Thr
885 890 895
Thr Gly Cys Ala Ala Cys Thr Thr Thr Ala Cys Cys Ala Thr Thr Gly
900 905 910
Cys Thr Ala Ala Thr Thr Ala Thr Ala Ala Thr Ala Thr Thr Thr Thr
915 920 925
Cys Ala Ala Thr Gly Gly Cys Ala Ala Ala Ala Cys Cys Ala Cys Ala
930 935 940
Ala Thr Thr Gly Ala Cys Ala Gly Ala Cys Thr Cys Gly Gly Cys Ala
945 950 955 960
Cys Cys Thr Cys Ala Ala Thr Thr Gly Cys Cys Ala Ala Cys Ala Cys
965 970 975
Thr Thr Ala Thr Thr Ala Ala Thr Gly Gly Gly Cys Ala Ala Gly Gly
980 985 990
Thr Thr Cys Ala Ala Gly Ala Thr Ala Cys Thr Thr Cys Gly Thr Ala
995 1000 1005
Ala Ala Thr Ala Thr Ala Cys Ala Thr Ala Thr Thr Gly Cys Gly
1010 1015 1020
Ala Thr Ala Thr Thr Cys Thr Cys Thr Thr Thr Gly Cys Thr Ala
1025 1030 1035
Thr Gly Thr Gly Thr Thr Thr Ala Cys Thr Thr Ala Cys Thr Thr
1040 1045 1050
Gly Ala Gly Thr Gly Cys Gly Thr Cys Ala Gly Gly Gly Gly Gly
1055 1060 1065
Ala Ala Ala Gly Thr Gly Gly Cys Ala Ala Cys Thr Thr Thr Ala
1070 1075 1080
Thr Thr Thr Thr Cys Cys Ala Ala Ala Ala Thr Ala Thr Ala Cys
1085 1090 1095
Thr Thr Ala Ala Cys Ala Ala Thr Thr Thr Thr Gly Cys Thr Ala
1100 1105 1110
Thr Thr Cys Gly Thr Gly Ala Thr Gly Gly Gly Ala Thr Gly Thr
1115 1120 1125
Thr Thr Gly Ala Ala Thr Thr Thr Thr Gly Thr Thr Ala Thr Cys
1130 1135 1140
Ala Cys Cys Cys Cys Ala Cys Thr Cys Cys Cys Ala Ala Ala Cys
1145 1150 1155
Ala Thr Gly Ala Ala Cys Thr Gly Gly Ala Gly Gly Gly Ala Ala
1160 1165 1170
Gly Gly Thr Gly Cys Thr Ala Cys Thr Thr Thr Gly Ala Thr Thr
1175 1180 1185
Ala Ala Thr Ala Ala Thr Gly Cys Ala Ala Ala Ala Ala Cys Thr
1190 1195 1200
Gly Gly Thr Gly Ala Thr Gly Thr Cys Ala Thr Thr Thr Cys Gly
1205 1210 1215
Ala Thr Thr Cys Ala Ala Gly Thr Gly Cys Thr Ala Cys Cys Ala
1220 1225 1230
Cys Cys Thr Gly Gly Cys Cys Thr Ala Ala Cys Ala Cys Thr Thr
1235 1240 1245
Gly Ala Ala Cys Thr Ala Ala Gly Gly Ala Ala Ala Ala Ala Ala
1250 1255 1260
Thr Ala Ala
1265
<210> 6
<211> 713
<212> PRT
<213> Artificial Sequence
<220>
<223> Example PglB sequence ('wild-type')
<400> 6
Met Leu Lys Lys Glu Tyr Leu Lys Asn Pro Tyr Leu Val Leu Phe Ala
1 5 10 15
Met Ile Ile Leu Ala Tyr Val Phe Ser Val Phe Cys Arg Phe Tyr Trp
20 25 30
Val Trp Trp Ala Ser Glu Phe Asn Glu Tyr Phe Phe Asn Asn Gln Leu
35 40 45
Met Ile Ile Ser Asn Asp Gly Tyr Ala Phe Ala Glu Gly Ala Arg Asp
50 55 60
Met Ile Ala Gly Phe His Gln Pro Asn Asp Leu Ser Tyr Tyr Gly Ser
65 70 75 80
Ser Leu Ser Ala Leu Thr Tyr Trp Leu Tyr Lys Ile Thr Pro Phe Ser
85 90 95
Phe Glu Ser Ile Ile Leu Tyr Met Ser Thr Phe Leu Ser Ser Leu Val
100 105 110
Val Ile Pro Thr Ile Leu Leu Ala Asn Glu Tyr Lys Arg Pro Leu Met
115 120 125
Gly Phe Val Ala Ala Leu Leu Ala Ser Ile Ala Asn Ser Tyr Tyr Asn
130 135 140
Arg Thr Met Ser Gly Tyr Tyr Asp Thr Asp Met Leu Val Ile Val Leu
145 150 155 160
Pro Met Phe Ile Leu Phe Phe Met Val Arg Met Ile Leu Lys Lys Asp
165 170 175
Phe Phe Ser Leu Ile Ala Leu Pro Leu Phe Ile Gly Ile Tyr Leu Trp
180 185 190
Trp Tyr Pro Ser Ser Tyr Thr Leu Asn Val Ala Leu Ile Gly Leu Phe
195 200 205
Leu Ile Tyr Thr Leu Ile Phe His Arg Lys Glu Lys Ile Phe Tyr Ile
210 215 220
Ala Val Ile Leu Ser Ser Leu Thr Leu Ser Asn Ile Ala Trp Phe Tyr
225 230 235 240
Gln Ser Ala Ile Ile Val Ile Leu Phe Ala Leu Phe Ala Leu Glu Gln
245 250 255
Lys Arg Leu Asn Phe Met Ile Ile Gly Ile Leu Gly Ser Ala Thr Leu
260 265 270
Ile Phe Leu Ile Leu Ser Gly Gly Val Asp Pro Ile Leu Tyr Gln Leu
275 280 285
Lys Phe Tyr Ile Phe Arg Ser Asp Glu Ser Ala Asn Leu Thr Gln Gly
290 295 300
Phe Met Tyr Phe Asn Val Asn Gln Thr Ile Gln Glu Val Glu Asn Val
305 310 315 320
Asp Leu Ser Glu Phe Met Arg Arg Ile Ser Gly Ser Glu Ile Val Phe
325 330 335
Leu Phe Ser Leu Phe Gly Phe Val Trp Leu Leu Arg Lys His Lys Ser
340 345 350
Met Ile Met Ala Leu Pro Ile Leu Val Leu Gly Phe Leu Ala Leu Lys
355 360 365
Gly Gly Leu Arg Phe Thr Ile Tyr Ser Val Pro Val Met Ala Leu Gly
370 375 380
Phe Gly Phe Leu Leu Ser Glu Phe Lys Ala Ile Met Val Lys Lys Tyr
385 390 395 400
Ser Gln Leu Thr Ser Asn Val Cys Ile Val Phe Ala Thr Ile Leu Thr
405 410 415
Leu Ala Pro Val Phe Ile His Ile Tyr Asn Tyr Lys Ala Pro Thr Val
420 425 430
Phe Ser Gln Asn Glu Ala Ser Leu Leu Asn Gln Leu Lys Asn Ile Ala
435 440 445
Asn Arg Glu Asp Tyr Val Val Thr Trp Trp Asp Tyr Gly Tyr Pro Val
450 455 460
Arg Tyr Tyr Ser Asp Val Lys Thr Leu Val Asp Gly Gly Lys His Leu
465 470 475 480
Gly Lys Asp Asn Phe Phe Pro Ser Phe Ala Leu Ser Lys Asp Glu Gln
485 490 495
Ala Ala Ala Asn Met Ala Arg Leu Ser Val Glu Tyr Thr Glu Lys Ser
500 505 510
Phe Tyr Ala Pro Gln Asn Asp Ile Leu Lys Thr Asp Ile Leu Gln Ala
515 520 525
Met Met Lys Asp Tyr Asn Gln Ser Asn Val Asp Leu Phe Leu Ala Ser
530 535 540
Leu Ser Lys Pro Asp Phe Lys Ile Asp Thr Pro Lys Thr Arg Asp Ile
545 550 555 560
Tyr Leu Tyr Met Pro Ala Arg Met Ser Leu Ile Phe Ser Thr Val Ala
565 570 575
Ser Phe Ser Phe Ile Asn Leu Asp Thr Gly Val Leu Asp Lys Pro Phe
580 585 590
Thr Phe Ser Thr Ala Tyr Pro Leu Asp Val Lys Asn Gly Glu Ile Tyr
595 600 605
Leu Ser Asn Gly Val Val Leu Ser Asp Asp Phe Arg Ser Phe Lys Ile
610 615 620
Gly Asp Asn Val Val Ser Val Asn Ser Ile Val Glu Ile Asn Ser Ile
625 630 635 640
Lys Gln Gly Glu Tyr Lys Ile Thr Pro Ile Asp Asp Lys Ala Gln Phe
645 650 655
Tyr Ile Phe Tyr Leu Lys Asp Ser Ala Ile Pro Tyr Ala Gln Phe Ile
660 665 670
Leu Met Asp Lys Thr Met Phe Asn Ser Ala Tyr Val Gln Met Phe Phe
675 680 685
Leu Gly Asn Tyr Asp Lys Asn Leu Phe Asp Leu Val Ile Asn Ser Arg
690 695 700
Asp Ala Lys Val Phe Lys Leu Lys Ile
705 710
<210> 7
<211> 120
<212> PRT
<213> Escherichia coli
<400> 7
Met Leu Lys Leu Phe Ala Lys Tyr Thr Ser Ile Gly Val Leu Asn Thr
1 5 10 15
Leu Ile His Trp Val Val Phe Gly Val Cys Ile Tyr Val Ala His Thr
20 25 30
Asn Gln Ala Leu Ala Asn Phe Ala Gly Phe Val Val Ala Val Ser Phe
35 40 45
Ser Phe Phe Ala Asn Ala Lys Phe Thr Phe Lys Ala Ser Thr Thr Thr
50 55 60
Met Arg Tyr Met Leu Tyr Val Gly Phe Met Gly Thr Leu Ser Ala Thr
65 70 75 80
Val Gly Trp Ala Ala Asp Arg Cys Ala Leu Pro Pro Met Ile Thr Leu
85 90 95
Val Thr Phe Ser Ala Ile Ser Leu Val Cys Gly Phe Val Tyr Ser Lys
100 105 110
Phe Ile Val Phe Arg Asp Ala Lys
115 120
<210> 8
<211> 306
<212> PRT
<213> Escherichia coli
<400> 8
Met Lys Ile Ser Leu Val Val Pro Val Phe Asn Glu Glu Glu Ala Ile
1 5 10 15
Pro Ile Phe Tyr Lys Thr Val Arg Glu Phe Glu Glu Leu Lys Ser Tyr
20 25 30
Glu Val Glu Ile Val Phe Ile Asn Asp Gly Ser Lys Asp Ala Thr Glu
35 40 45
Ser Ile Ile Asn Ala Leu Ala Val Ser Asp Pro Leu Val Val Pro Leu
50 55 60
Ser Phe Thr Arg Asn Phe Gly Lys Glu Pro Ala Leu Phe Ala Gly Leu
65 70 75 80
Asp His Ala Thr Gly Asp Ala Ile Ile Pro Ile Asp Val Asp Leu Gln
85 90 95
Asp Pro Ile Glu Val Ile Pro His Leu Ile Glu Lys Trp Gln Ala Gly
100 105 110
Ala Asp Met Val Leu Ala Lys Arg Ser Asp Arg Ser Thr Asp Gly Arg
115 120 125
Leu Lys Arg Lys Thr Ala Glu Trp Phe Tyr Lys Leu His Asn Lys Ile
130 135 140
Ser Asn Pro Lys Ile Glu Glu Asn Val Gly Asp Phe Arg Leu Met Ser
145 150 155 160
Arg Asp Val Val Glu Asn Ile Lys Leu Met Pro Glu Arg Asn Leu Phe
165 170 175
Met Lys Gly Ile Leu Ser Trp Val Gly Gly Lys Thr Asp Ile Val Glu
180 185 190
Tyr Val Arg Ala Glu Arg Ile Ala Gly Asp Thr Lys Phe Asn Gly Trp
195 200 205
Lys Leu Trp Asn Leu Ala Leu Glu Gly Ile Thr Ser Phe Ser Thr Phe
210 215 220
Pro Leu Arg Ile Trp Thr Tyr Ile Gly Leu Val Val Ala Ser Val Ala
225 230 235 240
Phe Ile Tyr Gly Ala Trp Met Ile Leu Asp Thr Ile Ile Phe Gly Asn
245 250 255
Ala Val Arg Gly Tyr Pro Ser Leu Leu Val Ser Ile Leu Phe Leu Gly
260 265 270
Gly Ile Gln Met Ile Gly Ile Gly Val Leu Gly Glu Tyr Ile Gly Arg
275 280 285
Thr Tyr Ile Glu Thr Lys Lys Arg Pro Lys Tyr Ile Ile Lys Arg Val
290 295 300
Lys Lys
305
<210> 9
<211> 14440
<212> DNA
<213> Artificial Sequence
<220>
<223> example O4 rfb locus nucleotide sequence - O4-EPA production
strain BVEC-L-00684f
<400> 9
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320
cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380
aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440
atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500
cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560
accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620
gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtatatggt 1680
gatttgcctc atcctgacga ggtaaataat acagaagaat tacccttatt tactgagaca 1740
acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800
cgcgcgtgga aacgtaccta tggtttaccg accattgtga ctaattgctc taacaattat 1860
ggtccttatc atttcccgga aaaattgatt ccattggtta ttctcaatgc tctggaaggt 1920
aaagcattac ctatttatgg taaaggggat caaattcgcg actggctgta tgttgaagat 1980
catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040
ggtgggcaca acgaaaagaa aaacatagat gtagtgctca ctatttgtga tttgctggat 2100
gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc cgatcgtccg 2160
ggacacgatc gccgttatgc gattgatgct gagaatattg gtcgcgaatt gggatggaaa 2220
ccacaggaaa cgtttgagag cgggattcgg aagacagtgg aatggtatct gtccaataca 2280
aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaga gaactatgag 2340
ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400
agcgtgctct ggcacctctg ggtaacttga ttgctcttga tgttcattcc actgattatt 2460
gtggcgattt cagtaacccc gaaggtgtgg ctgaaaccgt caaaaaaatt cgcccagatg 2520
ttattgttaa tgctgctgct cataccgcgg tagataaggc tgagtcagaa ccagaatttg 2580
cacaattact caatgcgacc agcgttgaag caattgcaaa agcggctaat gaagttgggg 2640
cttgggtaat tcattactca actgactacg tcttccctgg aaatggcgac atgccatggc 2700
tcgagactga tgtaaccgct ccgctcaatg tttatggcaa aaccaaattg gctggagaaa 2760
gagcattaca agaacattgc gcaaagcatc ttattttccg taccagctgg gtatatgcag 2820
gtaaaggaaa taactttgcc aaaacaatgt tacgtctggc aaaagagcgc gaagaactgg 2880
ctgtgataaa cgatcagttt ggcgcaccaa caggtgctga attgctggct gattgcaccg 2940
ctcatgccat tcgcgtggca ttaaaaaaac cagaagttgc tggcttgtac catctggtag 3000
caaatggcac aacaacctgg cacgattacg ccgcgctagt attcgaagaa gcccgtaaag 3060
cagggattga ccttgcactt aacaaactca acgccgtacc aacaacggct tatcctactc 3120
cagcccgccg tcctcataat tctcgcctca ataccgaaaa gtttcagcag aactttgcgc 3180
ttgtcttgcc tgactggcag gtgggcgtga aacgtatgct caacgaatta tttacgacta 3240
cggcaattta acaaattttt gcatctcgct catgatgcca gagcgggatg aattaaaagg 3300
aatggtgaaa tgaaaacgcg taaaggtatt attctggctg gtggttccgg cactcgtctt 3360
tatcctgtga cgatggcagt gagtaaacaa ctgctgccga tttatgataa gccgatgatt 3420
tattatccgc tttcaacgct tatgttagcg ggtattcgcg atattcttat tatcagtacg 3480
ccacaggata caccgcgttt ccaacaattg ttgggggacg ggagtcagtg ggggcttaat 3540
ctacagtata aagtacaacc gagtccggat ggcctggcgc aagcgtttat tattggtgaa 3600
gactttattg gtggtgatga ttgtgcactc gtacttggcg ataatatctt ctatggacac 3660
gacttgccga aattaatgga agctgctgtt aacaaagaaa tcggtgcaac ggtatttgct 3720
tatcacgtca atgatcctga acgttatggt gtcgtggagt ttgataataa cggtactgca 3780
attagcctgg aagaaaaacc gctggaacca aaaagtaact atgcggttac tgggctttat 3840
ttctatgaca atgatgttgt agaaatggcg aaaaacctta agccttctgc ccgtggcgaa 3900
ctggaaatta ccgatattaa ccgtatttat atggagcagg gacgtttgtc tgtcgctatg 3960
atggggcgtg gttatgcctg gttggatact ggtacacatc aaagtcttat tgaagcaagt 4020
aacttcattg ccaccattga agagcgtcag ggattaaagg tatcttgccc ggaagagatt 4080
gcttaccgta aagggtttat tgatgctgag caggtgaaag tattagccga accgctgaag 4140
aaaaatgatt atggtcagta tctgctaaaa atgattaaag gttattaata aaatgaacgt 4200
aattaaaact gaaattcctg atgtgctgat ttttgaacca aaagtttttg gtgatgaacg 4260
tggcttcttt tttgagagtt ttaaccagaa agtatttgaa gaagctgtag gacggaaggt 4320
tgaatttgtt caggataacc attctaagtc taaaataaat gtattgcgtg ggatgcatta 4380
tcaaacacaa aatactcaag gaaaactggt tcgggtaatt tctggttcag tatatgatgt 4440
tgccgtagat ttaagagaaa aatcaaagac atttggcaaa tgggtgggtg tagaattatc 4500
tgggaataat aaaagacaat tgtggatccc cgaaggtttt gcccatggtt tttatgtgtt 4560
ggaggagaat accgaatttg tttataaatg taccgatact tataaccctg ctcatgaaca 4620
cacattgcta tggaatgatc caactatcaa tataagttgg ccaatcatac aaaactgcaa 4680
gccaattatt tctgaaaaag atgctaatgg acatcttttt tcacataaaa cctatttctg 4740
aaatgcaata ttatgagttt aattagaaac agtttctata atattgctgg ttttgctgtg 4800
ccgacattag ttgcagtccc tgctttgggg attcttgcca ggctgcttgg accggagaat 4860
tttggacttt tcacactagc attcgctttg ataggatatg caagtatttt cgacgccggg 4920
attagtcgag ctgtaatcag agaaatcgct ctttatcgag aaagtgaaaa agagcaaata 4980
caaattattt cgacagcaag tgtaatcgta ctattcttag gggtggttgc agctttgtta 5040
ctttatttta gtagtaataa agttgttgag ttattgaatg ttagttccgt ttatattgaa 5100
acagcagtgc gtgcattctc tgttatttca tttataatac ctgtgtatct gattaaccag 5160
atttggcttg gttatctgga agggctagaa aaatttgcaa atataaatgt tcagagaatg 5220
atttctagca caagcttggc tatattacca gtgatatttt gttattacaa tccctcgttg 5280
ctttatgcta tgtatgggtt ggtggttggg cgtgtgattt catttttgat tagcgcaata 5340
atttgtcgag atattattct taaaagtaaa ctttacttta atgtggcaac ttgcaatcgt 5400
cttatctctt ttggtggatg gataacagtt agtaatatca taagcccaat catggcatat 5460
ttcgaccgct ttatcatctc tcatattatg ggggcttcga gaattgcatt ttatacagcg 5520
ccctcagagg gtgtatcaag gttaattaat atcccatatg ctttggcaag agctctattt 5580
cctaaattgg catatagcaa taatgatgat gaacgaaaaa aattacaact acagagctac 5640
gcaattataa gcattgtatg tctacccata gttgttattg gtgtcatttt tgcctcattc 5700
ataatgacaa catggatggg acctgattat gccttagaag cagcaactat catgaaaata 5760
cttcttgctg gttttttctt taactcttta gcgcaaatac cttatgcata cttgcaatct 5820
atcggaaagt caaaaattac cgcatttgtg catctcatag aacttgcgcc atacttatta 5880
ttattgtatt acttcacaat gcatttcggc ataattggca cggcaatcgc ttggtcactt 5940
agaacatttt gtgattttgt tatactactt tcgatatcga gaagaaaatg attgcggttg 6000
atattgcgct tgcaacctac aatggtgcta attttattcg gcaacagatt gaatctatcc 6060
agaaacaaac ttatagaaat tggcgtctta taataagtga tgataactcg agtgatgata 6120
ctgttgatat tattaaggat atgatgtcta acgacagtcg tatctatttg gtaggaaata 6180
aaagacaagg aggggttatt cagaacttta attatgctct ttcacaaact acatctgaaa 6240
ttgtgttact atgtgaccag gatgacattt ggccggagga gcgtctggaa attcttatag 6300
ataaatttaa ggccttgcag cgtaatgatt ttgttccggc aatgatgttt actgatttga 6360
aattagtaga cgaaaataat tgtttgattg cagaaagttt ttatcgaacg aataatatta 6420
atccacaaga taatctgaaa aataataatc ttctctggcg ttcaacggta tatggctgta 6480
cttgcatcat gaataagaaa cttgttgata ttgcattgcc tatacctaca tatgcacata 6540
tgcatgatca atggttggca ttattagcga agcaatatgg taacattttt tatttcgact 6600
atgcgtctgt tcgttatagg caacattcta caaatgttgt tggtggtaga aataaaacgc 6660
catttcaaaa atttaattcc atacaaaaaa acctaaaaag gattaatttg ctagtggata 6720
gaactgttgc tttaattaaa tcaaataacg atttctatcc agggaataaa atggaaaata 6780
aaattgatta cttaaaattt ggagtgaatg aagtattacc ttatcttttt aaaggaaaca 6840
agaaagtttt ttcactttgt gtattaatta gtttggcatt acaaaaatga tatatttatt 6900
attttttttt gcactgttta tgatctgtac gtttttaaca cacaggcgac aggcattata 6960
tgttgtatct gcgttagtat ttcttttttt ggctttaacc tatccatcag gaggggactg 7020
gataggttat tttctccatt atgactgcat ggttaatgag cagtgtaata atggttttat 7080
aatgtttgaa cctggatatg aattaattgt ttccttattt ggatatttgg gatttcagac 7140
aattattatt tttatagccg ctgtaaatgt aattctaata ttaaattttg caaagcattt 7200
tgaaaacgga agttttgtta ttgttgcgat aatgtgcatg ttcctttgga gtgtttatgt 7260
tgaggcgatt agacaggctc tggccttatc tatagttata tttgggattc attctctttt 7320
tttgggtaga aaaaggaaat ttataacatt agtattattt gcgtcaactt tccatataac 7380
tgctttgatt tgttttcttc taatgactcc tctattttca aagaaattaa gcaagataat 7440
aagttatagc ctattaattt tcagtagctt ctttttcgct ttttctgaaa ccatattaag 7500
tgcactcctt gcaattttgc cagaaggatc cattgccagt gaaaaattaa gtttttactt 7560
agcaaccgag caatacaggc cacagttatc tattgggagt ggcactattc ttgacattat 7620
acttattttt ctgatatgtg taagttttaa acgaataaag aaatatatgc tcgctaatta 7680
taatgctgca aatgagatat tgcttattgg ttgctgtctt tatatttctt tcggtatttt 7740
tatcgggaaa atgatgccag ttatgactcg cattggttgg tatggttttc catttgttat 7800
agtacttctt tatattaact tgggttattc agaatatttt aagaggtata taaataaaag 7860
agggtgtggg tatagcaaat tattaattgc tttttatttt ttgctacaaa ttttgcgacc 7920
attaacatat gattatagct attataatat aatgcaccag gatactttgc tgaataggtt 7980
tgatgcatta gatgatgcat cattaagaca atcagcgaag agaaaatgtt tcgatttggg 8040
aaagatagga tatggtttct tatgtagtat ataatatcct gcattcattc ggataatttc 8100
ctatggaagt gtcctttgct ctgtctgtcc tcatttgttg aaattttatg ttaataagaa 8160
gctttagata accacttagg aactgtatgt ttgatctgtc caaaaattat attattgtaa 8220
gtgcgacggc gctggcttcc ggaggtgcat taactatatt aaagcaattt ataaaacatg 8280
catcacaaaa ttcaaatgac tatattatgt ttgtatctgc gggattggag ttgccggtct 8340
gtgataacat catttacata gaaaacacac caaaaggatg gttgaaaaga atatattggg 8400
attggttcgg ttgtcggaag tttatctcgg aacataagat taacgttaag aaagtaattt 8460
ctctacaaaa ttccagtttg aatgttcctt acgaacagat tatttacttg caccagccaa 8520
ttccttttag taaagttgat tcttttttaa aaaatatcac atccgataac gtaaagcttt 8580
ttttatataa aaagttttat tcctatttta tatttaaata tgtgaatgcc aatacaacca 8640
tcgtagtgca aacgaattgg atgaaaaaag gagtgctgga gcaatgtgat aaaattagta 8700
ccgaaagggt ccttgttata aaacctgata tcaaagcatt taataatact aattttgatg 8760
tagatatgga tgtatctgca aaaacactct tatatccagc gacaccactt acctataaaa 8820
atcatttggt cattctgaag gcgttggtta ttttaaagaa aaagtatttt atagatgatc 8880
tgaaattcca agtgactttt gaaaagaata ggtacaaaaa ttttgataag tttgtgcaat 8940
taaataactt aagcaaaaac gttgattatc tcggcgttct ttcatactcg aacttgcaaa 9000
aaaaatatat ggcggcatct ttaatcgttt ttcctagcta tatcgaatca tatgggttac 9060
cactcatcga agctgctagt ttaggaaaaa aaatcattag tagtgatctt ccttatgccc 9120
gggatgtttt aaaggattat agcggcgtag attttgtaat ttacaataat gaagatggct 9180
gggctaaggc gttgtttaat gttttaaatg gcaattcgaa gctcaatttt aggccttatg 9240
aaaaagatag tcgttcatct tggccacagt tcttctctat tttgaaataa ggtgtattat 9300
gtttaatggt aaaatattgt taattactgg tggtacgggg tctttcggta atgctgttct 9360
aagacgtttt cttgacactg atatcaaaga aatacgtatt ttttcccggg atgaaaaaaa 9420
acaagatgac atgaggaaaa aatataataa tccgaaactt aagttctata taggtgatgt 9480
tcgcgactat tcgagtatcc tcaatgcttc tcgaggtgtt gattttattt atcatgctgc 9540
agctctgaag caagtacctt cctgcgaatt ccacccaatg gaagctgtaa aaacgaatgt 9600
tttaggtacg gaaaacgtac tggaagcggc aatagctaat ggagttaggc gaattgtatg 9660
tttgagtaca gataaagctg tatatcctat caatgcaatg ggtatttcca aagcgatgat 9720
ggaaaaagta atggtagcaa aatcgcgcaa tgttgactgc tctaaaacgg ttatttgcgg 9780
tacacgttat ggcaatgtaa tggcatctcg tggttcagtt atcccattat ttgtcgatct 9840
gattaaatca ggtagaccaa tgacgataac agaccctaat atgactcgtt tcatgatgac 9900
tctcgaagac gctgttgatt tggttcttta cgcatttgaa catggcaata atggtgatat 9960
ttttgtccaa aaggcacctg cggctaccat cgaaacgttg gctattgcac tcaaagaatt 10020
acttaatgta aaccaacacc ctgtaaatat aatcggcacc cgacacgggg aaaaactgta 10080
cgaagcgtta ttgagccgag aggaaatgat tgcagcggag gatatgggtg attattatcg 10140
tgttccacca gatctccgcg atttgaacta tggaaaatat gtggaacatg gtgaccgtcg 10200
tatctcggaa gtggaagatt ataactctca taatactgat aggttagatg ttgagggaat 10260
gaaaaaatta ctgctaaaac ttccttttat ccgggcactt cggtctggtg aagattatga 10320
gttggattca taatatgaaa attttagtta ctggcgctgc agggtttatc ggtcgaaatt 10380
tggtattccg gcttaaggaa gctggatata acgaactcat tacgatagat cgtaactctt 10440
ctttggcgga tttagagcag ggacttaagc aggcagattt tatttttcac cttgctgggg 10500
taaatcgtcc cgtgaaggag tgtgaatttg aagagggaaa tagtaatcta actcaacaga 10560
ttgttgatat cctgaaaaaa aacaataaaa atactcctat catgctgagt tcttccatcc 10620
aggctgaatg tgataacgct tatggaaaga gtaaagcagc tgcggaaaaa atcattcagc 10680
agtatgggga aacgacaaac gctaaatatt atatttatcg cttgccgaat gtattcggta 10740
agtggtgtcg accaaattat aactccttta tagcaacttt ctgccatcgc attgcaaatg 10800
atgaagctat tacaattaat gatccttcag cagttgtaaa tctggtgtat atagatgact 10860
tttgttctga catattaaag ctattagaag gagcgaacga aactggttac aggacatttg 10920
gtccaattta ttctgttact gttggtgaag tggcacaatt aatttaccgg tttaaagaaa 10980
gtcgccaaac attaatcacc gaagatgtag gtaatggatt tacacgtgca ttgtactcaa 11040
catggttaag ttacctgtct cctgaacagt ttgcgtatac ggttccttct tatagtgatg 11100
acagaggggt attctgtgaa gtattgaaaa cgaaaaacgc gggccagttt tcgttcttta 11160
ctgcgcatcc aggaattact cggggtggtc attatcatca ttccaaaaat gagaaattta 11220
ttgtcatccg aggaagtgct tgtttcaaat ttgaaaatat tgtcacgagt gaacgatatg 11280
aacttaatgt ttcctctgat gattttaaaa ttgttgaaac agttccggga tggacgcata 11340
acattactaa taatggctcg gatgagctag ttgttatgct ttgggcaaat gaaatattta 11400
atcgttctga accagatact atagcgagag ttttatcgtg aaaaaattga aagtcatgtc 11460
ggttgttggg actcgtccag aaattattcg actctcgcgt gtccttgcaa aattagatga 11520
atattgtgac caccttattg ttcataccgg gcaaaactac gattatgaac tgaatgaagt 11580
ttttttcaaa gatttgggtg ttcgcaaacc tgattatttt cttaatgccg caggtaaaaa 11640
tgcagcagag actattggac aagttatcat taaagttgat gaggtccttg aacaggaaaa 11700
accagaagcc atgttagtac ttggcgatac taactcctgt atttcagcaa taccagcaaa 11760
gcgtcgaaga attccgatct tccatatgga ggctgggaat cgttgttttg accaacgcgt 11820
accggaagaa actaacagaa aaatagttga tcataccgct gatatcaata tgacatatag 11880
tgatatcgcg cgtgaatatc ttctggctga aggtgtacca gccgatagaa ttattaaaac 11940
cggtagccca atgtttgaag tactcactca ttatatgccg cagattgatg gttccgatgt 12000
actttctcgc ctgaatttaa cacctgggaa tttctttgtg gtaagtgccc acagagaaga 12060
aaatgttgat acccctaaac aacttgtgaa actggcgaat atacttaata ccgtggctga 12120
aaaatatgat gtcccggtag ttgtttctac tcatcctcgc actcgtaacc gcatcaacga 12180
aaacggtatt caattccata aaaatatctt gcttcttaag ccattaggat ttcacgatta 12240
caaccatctg caaaaaaatg cacgtgctgt tttatcggat agtgggacta ttacagaaga 12300
gtcctccatt atgaacttcc ctgcactcaa tatacgagaa gcgcacgaac gcccggaagg 12360
cttcgaagaa ggggcagtaa tgatggtcgg tcttgaatct gatcgcgttt tacaggcatt 12420
agaaattatt gcaacacagc ctcgtggaga agtacgctta cttcgtcagg ttagtgacta 12480
tagcatgcca aatgtttcag ataaagttct gcgtattatc cattcatata ctgactacgt 12540
taaacgggtt gtctggaagc aatactaatg aaacttgcat taatcattga tgattatttg 12600
ccccatagca cacgcgttgg ggctaaaatg tttcatgagt taggccttga attactgagc 12660
agaggccatg atgtaactgt aattacgcct gacatctcat tacaagcaat ttattctatt 12720
agtatgattg atggtataaa ggtttggcgt ttcaaaagtg gacctttaaa ggatgtaggt 12780
aaggctaaac gtgccataaa tgaaactctt ttatcttttc gcgcatggcg cgcatttaag 12840
cacctcattc aacatgatac atttgatggt atcgtttatt attccccctc tattttttgg 12900
ggcgacttgg ttaaaaaaat aaaacaacga tgccagtgcc caagctatct gatcctaagg 12960
gatatgtttc cacagtgggt cattgatgca ggtatgttga aagccggttc accaattgaa 13020
aaatatttta ggtattttga aaaaaagtca tatcagcagg ctggccggat aggggtaatg 13080
tctgataaga atcttgagat atttcgccag accaataaag gttatccgtg tgaagtttta 13140
cgtaattggg cctcaatgac tcctgtgtct gccagcgatg attatcattc acttcgtcaa 13200
aaatacgatc taaaagataa agtcattttt ttctatggcg gtaatattgg gcatgctcag 13260
gatatggcaa acttaatgcg ccttgcgcgt aatatgatgc gttatcatga tgctcatttc 13320
ctgtttatag ggcagggtga tgaagttgag ctgataaaat ctcttgctgc agaatggaat 13380
ttaactaatt tcactcatct accttcagtg aaccaggaag agtttaaatt aattttatct 13440
gaagttgatg tcggcctgtt ctccctttca tctcgccatt cttcacataa tttccccgga 13500
aaattactag ggtatatggt tcaatcaatc ccgatccttg ggagtgtgaa tggcggcaat 13560
gatttaatgg atgtaattaa taagcacaga gccggtttca ttcatgttaa tggtgaagat 13620
gataaactgt ttgaatctgc acaattgctt cttagtgatt cagttttaag aaaacagcta 13680
ggtcagaacg ctaatgtgtt gttaaagtct caattttcgg ttgaatcggc ggcacatact 13740
atcgaagtcc gactggaggc tggagaatgc gtttagttga tgacaatatt ctggatgaac 13800
tttttcgcac tgcagcaaat tctgaacgtt tgcgcgctca ttatttattg cacgcatctc 13860
atcaggagaa ggttcaacgt ttacttattg catttgtacg cgacagctat gttgaacccc 13920
attggcatga gttaccgcat cagtgggaaa tgtttgtcgt catgcaaggg caattagaag 13980
tttgtttgta tgagcaaaat ggtgagatcc aaaaacagtt tgttgttgga gacggtacgg 14040
gaataagcgt cgtggaattt tccccaggag atatacatag tgtcaaatgc ctgtcaccaa 14100
aagcccttat gttggagata aaggaggggc catttgaccc actcaaagct aaggcttttt 14160
ctaagtggtt atagggcgat acaccaccgt ttattcttct atcttattct atacatgctg 14220
ggttaccatc ttagcttctt caagccgcgc aaccccgcgg tgaccacccc tgacaggagt 14280
agctagcatt tgaccacccc tgacaggatt agctagcata tgagctcgag gatatctact 14340
gtgggtaccc gggatccgtg taggctggag ctgcttcgaa gttcctatac tttctagaga 14400
ataggaactt cggaatagga actaaggagg atattcatat 14440
<210> 10
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> example signal sequence for EPA carrier protein
<400> 10
Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser
1 5 10 15
Ala Ser Ala
<210> 11
<211> 13043
<212> DNA
<213> Artificial Sequence
<220>
<223> example O1A rfb locus nucleotide sequence - O1A-EPA production
strain stGVXN4411 and stLMTB10217
<400> 11
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcgtgaagat acttgttact aggggcgcag gatttattgg ttctgctgta 1320
gttcgtcaca ttataaataa tacgcaggat agtgttgtta atgtcgataa attaacgtac 1380
gccggaaacc tggaatcact tgctgatgtt tctgactctg aacgctatgt ttttgaacat 1440
gcggatattt gcgatgctgc tgcaatggcg cggatttttg ctcagcatca gccggatgca 1500
gtgatgcacc tggctgctga aagccatgtg gatcgttcaa ttacaggccc tgcggcattt 1560
attgaaacca atattgttgg tacttatgtc cttttggaag cggctcgcaa ttactggtct 1620
gctcttgatg gcgacaagaa aaatagcttc cgttttcatc atatttctac tgacgaagtc 1680
tatggtgatt tgcctcatcc tgacgaagta aataataaag aacaattacc cctctttact 1740
gagacgacag cttacgcgcc tagtagtcct tattccgcat caaaagcatc cagcgatcat 1800
ttagtccgcg cgtggaaacg tacctatggt ttaccgacta ttgtgactaa ctgttcgaat 1860
aactacggtc cttatcactt tccggaaaaa ttgattccac tagtaattct taatgctctg 1920
gaaggtaagg cattacctat ttatggcaaa ggggatcaaa ttcgtgactg gctgtatgtt 1980
gaagatcatg cgcgtgcgtt atataccgta gttactgaag gtcaagcggg tgaaacctat 2040
aacattggcg gacacaacga aaagaaaaac atcgatgttg tgctgactat ttgtgatttg 2100
ttggacgaga tagtcccgaa agagaaatct tatcgtgagc aaattactta tgttgctgat 2160
cgcccagggc atgatcgccg ttatgcgatt gatgctgaga agattggtcg cgaattggga 2220
tggaaaccac aggaaacgtt tgagagtggg attcgtaaaa cggtggaatg gtatttggct 2280
aatgcaaaat gggttgataa tgtgaaaagt ggtgcctatc aatcgtggat tgaacagaac 2340
tatgagggcc gccagtaatg aatatcctcc tttttggcaa aacagggcag gtaggttggg 2400
aactacagcg tgctctggca cctctgggta atttgattgc tcttgatgtt cactccactg 2460
attactgtgg tgattttagt aaccctgaag gtgtggctga aacagtcaaa agaattcgac 2520
ctgatgttat tgttaatgct gcggctcaca ccgcagtaga taaggctgag tcagaacccg 2580
aatttgcaca attactcaat gcgactagcg ttgaatcaat tgcaaaagcg gcaaatgaag 2640
ttggggcttg ggtaattcat tactcaactg actacgtatt ccctggaaat ggcgacacgc 2700
catggctgga gatggatgca accgcaccgc taaatgttta cggtgaaacc aagttagctg 2760
gagaaaaagc attacaagag cattgtgcga agcacctaat tttccgtacc agctgggtct 2820
atgcaggtaa aggaaataat ttcgccaaaa cgatgttgcg tctggcaaaa gagcgtgaag 2880
aactagccgt tattaatgat cagtttggtg cgccaacagg tgctgaactg ctggctgatt 2940
gtacggcaca tgccattcgt gtcgcactga ataaaccgga tgtcgcaggc ttgtaccatt 3000
tggtagccag tggtaccaca acctggtacg attatgctgc gctggttttt gaagaggcgc 3060
gcaatgcagg cattcctctt gcactcaaca agctcaacgc agtaccaaca actgcctatc 3120
ctacaccagc tcgtcgtcca cataactctc gccttaatac agaaaaattt cagcagaatt 3180
ttgcgcttgt attgcctgac tggcaggttg gtgtgaaacg catgctcaac gaattattta 3240
cgactacagc aatttaatag tttttgcatc ttgttcgtga tggtggagca agatgaatta 3300
aaaggaatga tgaaatgaaa acgcgtaaag gtattatttt agcgggtggt tctggtactc 3360
gtctttatcc tgtgactatg gtcgtcagta aacagctatt acctatatat gataaaccga 3420
tgatctatta tccgctttct acactgatgt tagcgggtat tcgcgatatt ctgattatta 3480
gtacgccaca ggatactcct cgttttcaac aactgctggg tgacggtagc cagtggggcc 3540
tgaatcttca gtacaaagtg caaccgagtc cggatggtct tgcgcaggca tttattatcg 3600
gtgaagagtt tattggtggt gatgattgtg ctttggtact tggtgataat atcttctacg 3660
gtcacgacct gcctaagtta atggatgccg ctgttaacaa agaaagtggt gcaacggtat 3720
ttgcctatca cgttaatgat cctgaacgct atggtgtcgt tgagtttgat aaaaacggta 3780
cggcgatcag cctggaagaa aaaccgctac aaccaaaaag taattatgcg gtaaccgggc 3840
tttattttta tgataacgac gttgtcgaaa tggcgaaaaa tcttaagcct tctgcccgcg 3900
gtgaactgga aattaccgat attaaccgta tctatatgga acaagggcgt ttatctgttg 3960
ccatgatggg gcgtggttat gcgtggttag acacggggac acatcagagc ctgattgagg 4020
caagcaactt tattgcaaca attgaagagc gtcaggggct gaaagtttcc tgcccggaag 4080
aaattgctta ccgtaaaggg tttgttgatg ctgagcaggt gaaagtatta gctgaacctc 4140
tgaaaaaaaa tgcttatggt cagtatctgc tgaaaatgat taaaggttat taataaaatg 4200
aacgtaatta aaacagaaat tcctgatgta ctgatttttg aaccgaaagt ttttggtgat 4260
gagcgtggtt tcttttttga gagctttaac cagaaggttt ttgaggaagc tgtaggccgc 4320
aaagttgaat ttgttcagga taaccattcg aagtctagta aaggtgtttt acgcgggctg 4380
cattatcagt tggaacctta tgcacaagga aaattggtgc gttgcgttgt cggtgaagtt 4440
tttgacgtag ctgttgatat tcgtaaatcg tcatcgactt ttggcaaatg ggttggggtg 4500
aatttatctg ctgagaataa gcggcaattg tggattcctg agggatttgc acatggtttt 4560
ttagtgctga gtgagacggc ggagtttttg tataagacga caaattatta tcatcctcag 4620
agtgatagag gaataaaatg ggatgatcca agcatcaata tttcatggcc agtcgattca 4680
caagtgctgc tatcagctaa agataataag catcctccat taacaaagat tgaaatgtat 4740
agttaagatc acgataaatc ttggaagggt tgcaaaattg aataaaatag tgagcaaaag 4800
tgaaataagg aacgtaatcc acaatgctgg ctatatgatg attactcaga tagctttata 4860
tgttgcacca ttatttatac tgagttatct gttaaaaaca ctgggggttg cacagtttgg 4920
taattatgcc ttaatactat caatcgttgc atatttacag attataacgg attatggttt 4980
ttcttttagt gcaagtcgtg cgatctcaca gaatagagag gacaaagaat atatatcaaa 5040
aatttatctg tcaactatga ctatcaagtt ggcgatatgc gctttcttat tcttattgct 5100
catgctattt ttaaatcttt tgcctgtgca agctgaatta aaacaaggaa tattatatgg 5160
atatcttctt gtaataggaa atactttcca accacaatgg tttttccaag gtatcgaaaa 5220
attaaaaatc atagcccttt ctaatgttat atcaagatgc gccgcgtgtt tacttgtatt 5280
tatctatgtg aggaatagcg aggatttaca aaaagcactt ttagtacagt cacttccatt 5340
agtaatttct gcgattggat taaatatatt tatattgaaa tatatcaata ttatttttcc 5400
ggaaaaaaaa ttatttaagg taattttaaa agaaggtaag gatttttttc ttgcatcact 5460
ttattctgtt attctcaata atagtggcat ttttctatta gggattttta ctaatcctgt 5520
tattgttggt gtatatgccg ccgctgaaaa gatagtcaag gccgtattgt cgctatttac 5580
accactgacg caagctatat atccttataa ttgtcgtaag ttttcactat ccgtatttga 5640
cggcattgag gcagcaaaaa aaactggtat accaattata attttagcat ttatagctgc 5700
tgttatcgtt gcaattacct tacctgttgc aatcgactat cttaattttc caaaagaaac 5760
aatttttgta ggtcaaatat taagtgcatg gatctttttt ggtgttctta ataatgtatt 5820
cggcattcag atattgagtg catcaggaag aagtaaaata tatagtagga tggtattcgt 5880
atcagcgctt ataacattac ttttgattac tctattattg cagttttgta acgccactgg 5940
agtggcatgt gcaatattat tgggtgaaat gttcttatca atattgttac ttaagcgata 6000
taaaaaaata atttaaggaa tagttatgaa gaagttatta ttagtgttcg gtactaggcc 6060
tgaagcaata aagatggcct ctatcattga attattaaaa aaagattgta gattcgaata 6120
taaaatatgt gtgacaggcc aacataaaga gatgcttgat caagttatgc aagtatttga 6180
tgttaaacct gattataatt tacggattat gcagcctggg caaacattag tatctatagc 6240
aacaaatata ctctcacggt taagtgaagt tttaattata gaaaagccag atattatact 6300
tgtgcatggg gatacaacga ctacccttgc tgctacttta gctgggtatt accaccaaat 6360
aaaagtttgt catgtggaag caggattaag aacaggggat atttactctc cttggcctga 6420
agagggcaat cgtaaagtta caggggcatt agcatgtatt catttcgccc caacagagag 6480
atcaaaagat aatctcctga gggagggggt caaagtaaat aatatatttg taacgggtaa 6540
taccgtcatc gactctttat ttattgcaaa agatatcata gataatgacc ctaatataaa 6600
gaacgcttta cataataaat ttaattttct tgataaaagc cgacgagtag tacttataac 6660
aggtcatcga agagaaaatt tcgggaaagg ttttgaagat atatgctttg caataaagga 6720
attagctttc atttatccta atgtagattt tatttatccg gtgcatctta atcccaatgt 6780
aatggaacca gtacatcgta tattagataa tatatgtaat atttacctta ttgagccctt 6840
ggattatttg ccttttgttt atttaatgaa tgagtcatat ttaatattga ctgattcagg 6900
ggggatacaa gaagaagcgc cttcgttagg taaaccggtt ttggttatgc gtgatactac 6960
tgaacgccct gaggcggttg aggctggtac tgttgtatta gtggggactt ctaagataaa 7020
aatagtaaat aaagtaacgg agctattaaa caatgctgat atctacaatg ctatgtctct 7080
gttacataat ccatatggcg atggaacagc tgctcaaaaa attcttaatg tgctcgccca 7140
agagctaatt taatttaagc taaaaatatg ttattaatta ttgctgatta tccaaacgaa 7200
atgaatatgc gcgagggagc tatgcaacga atagatgcga tagactctct cattcgagat 7260
cgcaagcgag tgtatttgaa tatttcattc aaaaagcatc tagttcgctc aaatagttcc 7320
tttaataatg ttatagttga aaatctaaat gcaattattc acagaaacat cataaaacag 7380
tacatgcaaa aatcaacaac tatatatgtt cattctgttt ataatttatt aaaggttata 7440
acgctcattg atctaaaaaa aacaattctt gatatacatg gtgttgtacc ggaagaactt 7500
ttggcagata ataaaaaatt acttagtaaa gtatataaca tggtggaaaa aaaaggtgtc 7560
cttggatgca aaaaattaat acacgtcagt acagaaatgc aaaaacacta tgaagcaaaa 7620
tatggagtaa acttggctga aaggtcaata gtgctcccga tttttgaata taaaaatata 7680
acccaatcgc aaaacaaatg gacagaaaat aaaatacgaa gtatctatct tggaggatta 7740
caaacatggc aaaatattga taaaatgatt caagtttgtg atgacacagt gataaacaat 7800
gaagcaggta agtatgaatt caactttttc atcccacaga gtaacttgga agggtttata 7860
gataaatatt cgttaaaatt acataatatc aatgctaatg catctacgct atcacgtgat 7920
gaagtaattc cctttctaaa agaatgtcat attggttttg tattgcgcga tgatataata 7980
gtaaacagag ttgcgtgccc tacaaaattg gttgaatatt tagagtgtgg tgtcgttcca 8040
gttgtgctct ccccacttat aggtgatttt tattcgatgg gatatcaata cattactaca 8100
gaggaaatgg ctaacagaag tataagtttg ttggatcttg aaaaaatggc tgcacataat 8160
ttacaaattt tgacttctta tcagaagaga acctacaagg cacagaaaga acttattgct 8220
caactgtgct gaatttttta catatataaa attatgtaag catatcgcgg gtcaggtaat 8280
tgtatgcgta tcaaatataa agataacggt tatatattat gttttctatt atgtttcatt 8340
ttgagctact tagttttact caaatctgac tactttcctg ctgattttct gccatataca 8400
gaaatatacg atgggacata cggagaaatc aataatattg agcctgcctt tttatattta 8460
acacggttgt ttcattattt aaatttcccc tatatatttt ttgcaatgtt agtttgtgcc 8520
ttatgtttaa gttggaaaat aaaatatgca agaaaaataa ttaaagatag ttatatatat 8580
ttgttcttgt atgtatatgt atcattttat gtgtttttgc atgaaatgac tcaattgcgc 8640
atagcaattg cagtcactat gtgctatgtg tcggtttatt attactttta taaaaattgt 8700
attaaacatg cactgccatg gatggtgttg gctattttgt ttcattacag cgccttgctt 8760
ttatttatgt cattatttat atacagttat aggaggttat taatagtaat tatagggttt 8820
gtaatatgta tgagcttttt aaacgtgtat gcagatacaa ttgcactata tttgccaaat 8880
gaaaaaatag taaattattt atatagtatt tcatcatcat tagacaatag aaatgatttg 8940
gcaatattca acctgaataa tataatattt ttatcaatat ttattttgat cttttatctt 9000
agccgatata taaaattaaa tgataatgag gcgaagttta ttaagtatgt gcaatgttca 9060
ggaatattag ccttttgtat tttctttctg gctagtggag tcccggtcat tgcttatcga 9120
actgcagagt tgctgcgaat attttatccg atggctttag tattaatcct ttcgcatata 9180
aaaaataata atatgcgtta ttttattgca gtcattatag ttatcctttc aggcttaatg 9240
ttgtttataa cactaagggc tgtatcaata gttggtcaag gattataaaa tgaatgttgc 9300
tattttgttg tctacgtata atggcgaaaa atatttagag gaacaactgg attcattgct 9360
gcttcaaagt tatcaggatt ttgtagtgta tatccgtgat gacggatcat ctgatagaac 9420
tgtaaatata ataaaccaat acgtaatgaa agataacaga tttattaacg tgggtaattc 9480
agaaaatctt ggttgtgctg cttcgtttat taatttatta agaaatgctt cagccgatat 9540
ttatatgttt tgtgaccaag atgattattg gcttccgaat aaattacagc gtgctgtgga 9600
ttatttttcg gctattgatc ctttacaacc taccttgtat cattgcgatc taagcgttgt 9660
tgatgaaaaa cttaatatta tacaaaattc atttttgcag catcagaaaa tgtcagcgta 9720
tgattcaatg agaaaaaata atcttttcat acaaaatttt gttgttggtt gttcatgtgc 9780
tgttaatgct tcacttgcgg aatttgttct ttcgcgaatt ggagagcagc atgtaaaaat 9840
gatagctatg catgactggt ggttagccgt gactgcaaaa ctttttggtc gaatccattt 9900
tgataatact caaacgattc tttatcgaca acatcagggc aatgtattag gtgcaaaatc 9960
atcaggtatg atgcgtttta ttcgattagg attaaatggg caagggattt cgcgagtagt 10020
atcttttaga aaaaaagttt gtgcgcaaaa taagcttctt ttagatgtct atgataaaga 10080
tttaaatctt gagcaaaaaa aatctatcag gcttgtaatt gagggcctta aagagaactc 10140
ttcaattgct gaccttttaa aatgtttcta tcatggtagc tatatgcaag gttttaaacg 10200
taatcttgcc ttaatatatt cagttcttta cacaaaaaaa agaagatagt gtatccttat 10260
gaaaaaaatt gctattatcg gtactgttgg cataccagca tcatatggcg gatttgaaac 10320
attagttgaa aatttaacaa gatacaattc ctcgggagtt gaatataatg ttttttgttc 10380
atcgtttcac tacaaatccc accaaaaaaa acataatggg gcccgtttaa tttatattcc 10440
gcttaaagcc aatggatggc agagcattgc gtatgacata atttcgttag catattctat 10500
ttttttgaag cctgatgtga ttctgatttt aggggtttct ggttgttcat ttttgccttt 10560
cttcaaactc ttaacacgcg ctaagtttat tactaatatt gatggcctgg aatggcgaag 10620
agataaatgg aattcaaaag tgaaacgttt cttaaaattt tcagaaaaaa tcgcagttca 10680
atattcggat gtcgttatta cggataatga ggcaatttct gagtacgttt ttaacgagta 10740
taataaagat agccgagtta ttgcctatgg aggggatcat gcatggttaa atactgagga 10800
tgtatttaca acaagaaatt ataaaagcga ttactacctt tctgtatgtc gtatcgaacc 10860
cgaaaacaat gtagaattaa ttttaaaaac attttcaaag ctaaaatata aaataaaatt 10920
tattggaaat tggaatggca gcgagtttgg aaagaaactt aggctgcatt attctaacta 10980
tccaaatatt gaaatgattg atccgattta tgatcttcaa caattatttc acttacgaaa 11040
taattgcata ggatatatac atggtcattc ggctggagga acaaaccctt ctttagtcga 11100
ggcaatgcat tttagtaaac ctatatttgc atatgattgt aagtttaata ggtacactac 11160
tgaaaatgaa gcatgttatt tttctaatga atctgacctc gcagagaaaa tcataatgca 11220
ttgtgagcta tcattaggtg tctctggcac gaaaatgaaa gaaattgcta accagaaata 11280
cacttggaga cgaatagcag aaatgtatga ggattgctat taactctgtt aaacttcaaa 11340
tcttttacaa tatatggcat gactataagc gcattaattg tttttcaagc cgctctcgcg 11400
gtgaccaccc cctgacaggg gatccgtgta ggctggagct gcttcgaagt tcctatactt 11460
tctagagaat aggaacttcg gaataggaac taaggaggat attcatatgg ataaagccgt 11520
aagcatataa gcatggataa gctatttata ctttaataag tactttgtat acttatttgc 11580
gaacattcca ggccgcgagc attcagcgcg gtgatcacac ctgacaggag tatgtaatgt 11640
ccaagcaaca gatcggcgta gtcggtatgg cagtgatggg acgcaacctt gcgctcaaca 11700
tcgaaagccg tggttatacc gtctctattt tcaaccgttc ccgtgagaag acggaagaag 11760
tgattgccga aaatccaggc aagaaactgg ttccttacta tacggtgaaa gagtttgtcg 11820
aatctctgga aacgcctcgt cgcatcctgt taatggtgaa agcaggtgca ggcacggatg 11880
ctgctattga ttccctcaaa ccatatctcg ataaaggaga catcatcatt gatggtggta 11940
acaccttctt ccaggacact attcgtcgta atcgtgagct ttcagcagag ggctttaact 12000
tcatcggtac cggtgtttct ggcggtgaag agggggcgct gaaaggtcct tctattatgc 12060
ctggtggcca gaaagaagcc tatgaattgg tagcaccgat cctgaccaaa atcgccgccg 12120
tagctgaaga cggtgaacca tgcgttacct atattggtgc cgatggcgca ggtcactatg 12180
tgaagatggt tcacaacggt attgaatacg gcgatatgca gctgattgct gaagcctatt 12240
ctctgcttaa aggtggcctg aacctcacca acgaagaact ggcgcagacc tttaccgagt 12300
ggaataacgg tgaactgagc agttacctga tcgacatcac caaagatatc ttcaccaaaa 12360
aagatgaaga cggtaactac ctggttgatg tgatcctgga tgaagcggct aacaaaggta 12420
ccggtaaatg gaccagccag agcgcgctgg atctcggcga accgctgtcg ctgattaccg 12480
agtctgtgtt tgcacgttat atctcttctc tgaaagatca gcgtgttgcc gcatctaaag 12540
ttctctctgg tccgcaagca cagccagcag gcgacaaggc tgagttcatc gaaaaagttc 12600
gtcgtgcgct gtatctgggc aaaatcgttt cttacgccca gggcttctct cagctgcgtg 12660
ctgcgtctga agagtacaac tgggatctga actacggcga aatcgcgaag attttccgtg 12720
ctggctgcat catccgtgcg cagttcctgc agaaaatcac cgatgcttat gccgaaaatc 12780
cacagatcgc taacctgttg ctggctccgt acttcaagca aattgccgat gactaccagc 12840
aggcgctgcg tgatgtcgtt gcttatgcag tacagaacgg tattccggtt ccgaccttct 12900
ccgcagcggt tgcctattac gacagctacc gtgctgctgt tctgcctgcg aacctgatcc 12960
aggcacagcg tgactatttt ggtgcgcata cttataagcg tatcgataaa gaaggtgtgt 13020
tccataccga atggctggat taa 13043
<210> 12
<211> 13790
<212> DNA
<213> Artificial Sequence
<220>
<223> example O2 rfb locus nucleotide sequence - O2-EPA production
strain stGVXN4906
<400> 12
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320
cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380
aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440
atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500
cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560
accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620
gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680
gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740
acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800
cgcgcatgga aacgtacgta tggtttaccg accattgtga ctaattgctc gaacaactat 1860
ggtccgtatc acttcccgga aaagcttatt ccattggtta ttcttaatgc actggaaggt 1920
aaggcattac ctatttatgg caaaggggat caaattcgcg actggttgta tgtagaggat 1980
catgctcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040
ggcggacaca acgaaaagaa aaacatcgat gttgtgctga ctatttgtga tttgttggat 2100
gagattgtac cgaaagagaa atcttatcgt gagcaaatta cttatgttgc tgatcgccca 2160
gggcatgatc gccgttatgc aattgatgcc gataaaatta gccgcgaatt gggctggaaa 2220
ccacaggaaa cgtttgagag cgggattcgc aaaacggtgg aatggtatct ggctaataca 2280
aattgggttg agaatgtgaa aagcggtgct tatcagtcat ggatcgaaca aaactatgag 2340
ggccgtcagt aatgaatatc ctgcttttcg gcaaaacagg gcaggtgggt tgggaactgc 2400
agcgtgctct ggcgccgctg ggtaatctga tcgctcttga tgttcactcc actaattatt 2460
gtggagattt cagcaacccc gaaggtgtgg cagaaaccgt caaaaaaatt cgtcctgacg 2520
ttattgttaa tgctgctgct cacactgcag tagataaagc agaatcagaa ccggatttcg 2580
cacaattact taacgcgaca agcgtcgaag cgattgcaaa agctgctaat gaagtcgggg 2640
cctgggttat acactactct actgattatg ttttcccagg cagtggtgac gcgccatggc 2700
tggaaacgga tgcaacagca ccgctaaatg tttacggtga aacaaaatta gctggggaaa 2760
aggcattaca agaacattgc gcaaagcatc ttattttccg taccagctgg gtatacgctg 2820
gtaaaggaaa taactttgct aaaacgatgt tgcgtttggc aaaagaacgc gaagaactgg 2880
ctgtgataaa cgatcagttt ggcgcaccaa caggtgctga attgctggct gattgcaccg 2940
ctcatgccat tcgcgtggca ttaaaaaaac cagaagtcgc tggcttgtac catctggtag 3000
caagtggcac aacaacctgg cacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060
cagggattaa tcttgcactt aacaaactta acgccgtgcc aacaacggcc tatcccacac 3120
cagcccgtcg accccataac tctcgcctca atacagaaaa gtttcagcag aactttgcgc 3180
ttgtcttgcc tgactggcag gtgggcgtga aacgtatgct caacgaatta tttacgacta 3240
cggcaattta acaaattttt gcatctcgct catgatgcca gagcgggatg aattaaaagg 3300
aatggtgaaa tgaaaacgcg taaaggtatt attctggctg gtggttccgg cactcgtctt 3360
tatcctgtga cgatggcagt gagtaaacaa ttgctgccga tttatgataa gccgatgatt 3420
tattatccgc tttcaacgct tatgttagcg ggtattcgcg atattcttat tattagtacg 3480
ccacaggata caccgcgttt ccaacaatta ttgggggacg ggagccagtg gggtcttaat 3540
ctacagtata aagtacaacc gagtccggat ggcctggcgc aagcgtttat tattggcgaa 3600
gactttattg gtggtgatga ttgtgcactc gtacttggcg ataatatctt ctatggacac 3660
gacttgccga aattgatgga agctgctgtt aacaaagaaa gcggtgcaac ggtatttgct 3720
tatcacgtta atgatcctga acgctatggt gtcgtggagt ttgataataa cggtacggca 3780
attagcctgg aagaaaaacc gctggagcca aaaagcaact atgcggttac tgggctttat 3840
ttctatgaca atgacgttgt ggaaatggct aaaaacctta agccttctgc ccgtggcgaa 3900
ctggaaatta ccgatattaa ccgtatttat atggaacaag gacgtttgtc tgtagccatg 3960
atggggcgtg gctatgcatg gttggataca gggacgcatc aaagccttat tgaagcaagt 4020
aacttcattg caacaattga agagcgtcag ggattaaagg tatcttgccc ggaagagatt 4080
gcttaccgta aagggtttat tgatgccgag caggtgaaag tattagccga accgcttatc 4140
aagaatcaat atggtcaata tttgctgaaa atgatcagcg aatagtatat gggaactcaa 4200
tgatggatat taaattaatc tctttgcaaa aacatgggga tgagcgcggt gcattaattg 4260
ctcttgaaga gcaacgaaat atacctttcg aagtcaaaag aatatattac atacttgaga 4320
ctcttaatgg agtaagacgc ggatttcatg cgcacaaggt tactcgtcag ttagctattg 4380
tagtcaaggg agcttgtaaa tttcatctgg ataatggtaa agaaacaaag caggtggaac 4440
ttaatgatcc aacaattgcg ttgctgatag aaccctatat atggcatgaa atgtatgatt 4500
ttagtgatga ttgtgtgctg cttgtaattg cggatgattt ctataaagag tctgattata 4560
tccgcaatta tgatgatttt attagaagag taaattcaat tgagaattca taagctaagt 4620
gacgtccaga caacatcaat tggtgatgga acaactatct ggcagtttgt tgtgatacta 4680
aaaggtgctg taattggtaa taattgcaac atctgtgcaa ataccttaat tgaaaataac 4740
gttgtaattg gtaacaatgt cacagtcaaa agcggtgtgt atatttggga tggcgttaaa 4800
atagaggata atgtttttat tggtccttgt gtagcattta caaatgataa gtatcctcgc 4860
tctaaagtct atcctgatga atttttgcaa acaataatac gcaaaggagc atcaataggt 4920
gctaacgcaa ccatcctgcc aggaattgaa attggtgaaa aagcaatcgt tggtgcgggg 4980
agtgttgtaa ccaaaaatgt accgccatgc gcaatagtag taggtaatcc agctcgattt 5040
attaaatggg tagaggataa tgaataaaat tgatttttta gatctttttg caattaacca 5100
gcgacagcac aaagaattag tctctgcgtt tagtagggtg ctagattctg gttggtatat 5160
catgggcgaa gaacttgagc agttcgagaa agagttcgca gaatactgtg gagttaagta 5220
ttgcattggt gtagcaaatg gccttgatgc gttgatacta gtattgaggg catggaaaga 5280
acttggctat cttgaagacg gtgacgaggt attagtaccg gcaaatacat atattgcttc 5340
tattcttgct ataacagaga acaaacttgt tcctgttctt gttgaaccag atatagaaac 5400
ttataatatt aatcctgctt taattgaaaa ttacattacg gaaaaaacta aagcaatatt 5460
accggttcac ttatatggtc tattgtgcaa tatgccagaa attagtgcaa tcgccagaaa 5520
atataatctg ttgattcttg aagattgtgc acaagcacat ggtgcaatac gtgatggtcg 5580
caaagctgga gcttgggggg atgctgcagg atttagtttt tatccaggaa aaaaccttgg 5640
agctttgggg gatgcgggag ctgttactac aaataatgca gaattatcct caactataaa 5700
agctttgcga aattatgggt cacataagaa atatgaaaat atttatcagg gattgaatag 5760
tcgattggat gaactgcaag cagccttatt gcgtgtaaaa atccatacat taccggaaga 5820
tactgcgatt cggcaaagga ttgctgaaaa atatattcgt gaaataaaaa accctgcgat 5880
tacgttacca gtgtacgaag gccaaggtgc gcatgtttgg catttatttg tagtaagaat 5940
cgctaatcgt gaaaaattcc agtcatactt attagagaag ggtatcaaaa ccttaattca 6000
ctatccatta ccaccccata agcagcaagc atatcaaaat atgtctagcc ttagccttcc 6060
aattactgag caaattcatg atgaagtcat ttctttacct ataagtccgg taatgagtga 6120
agatgatgtc aattatgtaa tcaaaatggt caatgattac aagtaatgaa aaaatttctt 6180
caggtaacta tattatccgc tatctataca ttcattaaaa tgattgcggg ttttatcatc 6240
ggtaaggtag tagcaattta tacagggcca tcaggggtag caatgcttgg ccaagtgcaa 6300
agtttaatca caatagttgc aggtactacc tctgcacctg taagcacagg ccttgttcga 6360
tatactgcgg aaaattggca agaaggacaa gaagcatgcg cgccatggtg gcgcgcatgc 6420
ttaagggtta ctctgttttt attcttgctt attattcccg ttgttattat attgtcgaaa 6480
aatattagtg agttactttt tagcgatgga caatacacat ggttaatcat tttcgcatgt 6540
tgtatattgc cattctccat tataaataca ttgatcgctt cagttttaaa tggtcaacaa 6600
ttttataagc aatatatatt ggttgggatg ttttctgtat tcatttctac tatgtttatg 6660
attttgttga ttgtagctta taatcttaaa ggtgcattga ttgccacagc tataaatagt 6720
gctattgctg gtcttgtatt ggttttattt tgtctcaata aatcttggtt tagatttaaa 6780
tattggtggg gtaaaacgga taaagacaaa attataaaaa ttattcatta tactctgatg 6840
gctctggttt ctgttatctc catgcctaca gcattgatgt gtattagaaa aatattgatt 6900
gctaaaactg gttgggagga tgcagggcaa tggcaggccg tatggaagat atctgaggtt 6960
tatcttggtg ttgtgacaat tgctttgtca acatatttct taccaagatt gacaattata 7020
aaaacaagtt tccttataaa aaaagaagta aatagtacta tattatacat aatatctatt 7080
acttcattca tggcgttgag tatctattta ttccgcgatt tggtaataac agttttattt 7140
actgaacagt ttcgctcagc tcgtgaatta tttttattac aacttatagg ggatgtaata 7200
aaaattgctg ggtttcttta tgcataccct cttcaaagtc aggggcatac taaactattc 7260
atcagttcag aagtgatttt ttctatgctc tttatcatta ccacctatat ttttgttgta 7320
aattatggag tacatggtgc taacataagt tatgtcatta catatagttt atattttgtg 7380
tttgcatttg tgtttactaa ttttattaat gttagaagaa ataattaaaa acagaggttg 7440
aattttgaaa ataattatac ctgtcttagg atttggcagg gctggtggtg aaagagttct 7500
ttctaagctg gcaactgaat tgatgaatta tggacatgat gtaagttttg ttgttccaga 7560
taatagaact aatccatatt atgctaccac agcaaaaatt gtcacgagta aatctagtca 7620
aaaccgtgta aaaatattga gaatcattaa aaattactat aatctgtggc gtaaatgcat 7680
agagttaaat cctgatgctg tagttgctag ttttcatttg actgcctatc ttgtcgcatt 7740
attaccaatc acccgtcgta agaaatatta ttatattcag gcgtatgaag ttaatttttt 7800
tgataatata atatggaaat taatagcggg tttaacatat tatttaccgc ttaaaaaaat 7860
actaaatagt cctaatttgc ttcctcataa acatgatgat tttataggag tagttcctgc 7920
aggagtagat ttaaacgttt tctatccgaa accatcaaat aggttattaa atggtcacac 7980
atcaataggg attattggta gaaaagagaa gcacaaagga actagcgaaa ttatttcagt 8040
attgtgttca ctggaaaata aagctggaat tataatcaat attgcgatct atcttgaaga 8100
agttgataag cagcgtttaa tcgctgccgg gtttcaggtt aatttttttc cgattacttc 8160
tgatttagaa ttggcatcct tttatcgaag caatgacatc atgattgctg ttgggttaat 8220
tgaagatggc gctttccatt atccttgtgc tgaatcaatg gcttgtggtt gtcttgttat 8280
ttcaaattat gcgccactta ctgaaactaa cagtgtactt aaattagtca agtttgatgc 8340
ttgcaaactt ggtgaagcaa ttaatctttg tctcaatctt gacctagaag aaaaaagcaa 8400
agaaatccaa tctaatattt ctgtgttgaa taaatatgac tggaaaattg ttggtgaaac 8460
tttcaatagt ttattgttag atgcaaataa atagtatacg ttgatgggga aaatatgaat 8520
attgttaaaa ctgatattcc agatctgatc gttcttgaac caaaagtgtt tagtgatgaa 8580
cgcggctttt ttatggagag ttataatcag attgaatttg agaaggcaat aggaaggcac 8640
gtaaattttg ttcaggataa tcattcaaaa tctagtaaag gcgtactacg tgggttgcat 8700
tatcaattag caccgtatgc acaggctaaa ttagttcgat gtgttgtagg tcaggtattt 8760
gatgttgctg ttgatcttag aaaaaattca ccaacgttca aaaaatggtt tggaataacc 8820
ctttccgcag aaaataaacg acaattatgg atacccgaag gatttgctca tggtttcttg 8880
gtgaccagtg atgaagctga gttcatttat aagacaacta actactatgc tcctggtcat 8940
cagcaagcaa ttatttacaa tgatcctatt ttaaacatcg attggccttt ctgcagtagt 9000
gctctgtcat tatcacaaaa agatcaagaa gcaaaattat tttcagaatt attggacagt 9060
gaactgttct aataaagtgt gccaccttat ccgtctgaag gataggtggt tgcttatatt 9120
tttttgagta tgtttgtata atgacagaaa atagtccgaa atataaacac gataaaagct 9180
taataagttt tatctactta ttttttatat ttacacttat tgtaggcttt attatcgcaa 9240
atacccagtt tttggggcga agtagagact atgataatta tatacagatc ttttctggta 9300
aagaagggga gggggttctt gaattatttt atcgcggatt gatgttaata acgaccagct 9360
atgaaactat catttttata attttaacat gttctttttt tataaaggca aggtttctcg 9420
ctaactattc gcgtaatttt tcaggcttga ccttattctt tatttattat gcaagcgttg 9480
cactttgggt tttagattat actcaattca gaaatggtct atgtatttcc attttaatgt 9540
tttccgtata ctatttattt ataaataaac cgacttattt ttatttctcg gtattatgtg 9600
caattgcaac tcattggtct gctttgcctt ttttgctttt atatcctttt gtctattcaa 9660
caaaaataag acgccttggt tatttttgtt tcagtattct tgttttgatt gcgatctcag 9720
gagaaggaaa agagatcata tcttttataa gaaattttgg agtgggacaa aaaataggaa 9780
atgaagctgg tgtaaattta ataaattcat tatcccttac cgctatttcc tggtttatta 9840
ttagttacat atcaagcatt ggaaatgaaa ggagaaattt aaggcttttc ttttgttatg 9900
gtgtcatgca atacgtgact tttagccttt tctctctacc tgttatggct ttccgtattt 9960
tggaaatgta ttttttcctt atgctaacca ttggggtgtt tattaagcaa aaaaagaatt 10020
attattttat tttttgcaaa gtgttaattt tattgtatct aacatactat tatcatatgg 10080
tctttggagt gattaatgtg taaggctaag gtgttggcta taattgttac ttacaacccg 10140
gaaattattc gattgacgga atgtattaac tctttagccc cacaagttga gagaataatt 10200
cttgtagata atggctcaaa taatagtgat ttgataaaaa atatcagtat taataacctt 10260
gaaattattt tactttcgga aaacaaaggc attgcatttg ctcagaacca tggtgttaag 10320
aagggcctgg aagcaaaaga gtttgactat ttatttttct cagatcagga tacttgcttt 10380
cctagcgatg ttattgaaaa acttaagagt acatttacga aaaataataa aaaaggtaaa 10440
aatgttgctt gtgcttctcc tttttttaaa gaccatcgtt caaattatat gcatccgtca 10500
gtcagcctaa atatttttac gagtacaaaa gttatatgta gtgaagtaga cgatgatctt 10560
tatccctcgc atgttattgc ttctgggatg ttaatgtctc gtgaagcatg gcgcgtcgtc 10620
ggaccatttt gtgaaaaact ctttatagac tgggttgata cagaatggtg ttggcgtgca 10680
ttagctaata atatgattat tgttcagaca ccatcagtca tcatttctca tgaacttggg 10740
tatgggcaga aaatttttgc tggtcgatct gttacaatac ataattcttt cagaaatttt 10800
tataaaatac gcaatgcaat atacttaatg ctgcattcaa attatagctt caagtatcgt 10860
tatcatgctt tttttcatgc gacaaagaat gttgtatttg aaattttata ttcgaaagaa 10920
aaattaaatt cactgaaggt ttgttttaaa gctgtacgtg atggtatgtt caataatttt 10980
taatacgaaa atagttaggc tcaaggtgtt taaatggaag aaaataatat gaagacggtc 11040
gctgtagttg gcacagtggg tgttcctgct tgttatggtg ggttcgaatc acttgttcag 11100
aatctaattg attatcaatc tgatggtata caatatcaga tattttgctc ttcaaaaaaa 11160
tatgataaaa aatttaaaaa ttataaaaat gcagaattaa tctatttgcc gataaatgcc 11220
aatggcgtct ctagcataat ttatgatatt atgtgtttaa ttatttgttt attcaaaagg 11280
ccagatgttg ttttaatatt gggggtgtct ggttgtttat ttctaccaat ttataaacta 11340
ttttcaaaat caaagattat tgtcaatatt gatgggcttg aatggcgtag aaataaatgg 11400
ggaacgtttg ctaagaaatt tcttaaaata tctgaggcga tatctattag aatagctgat 11460
attatcattt cagataatca agcaatagct gattatgtgg aaaataagta caagaaaaaa 11520
agtgtagtta tagcttatgg cggagatcat gccactaatc ttagtacacc gatagacaat 11580
gatcaaaaaa aagaaggtta ttatttgggg ctttgtagga tagagcctga gaataatata 11640
gaaatgattc tgaatgcctt cattaataca gataaaaaaa ttaaatttat gggtaattgg 11700
gataacagcg agtatggacg ccagctaaaa aaatattatt caaactatcc aaatatcacc 11760
ctactagaac ctaactataa tattgaagag ctttataaac taagaaaaaa ttgtcttgca 11820
tacattcatg gacactcggc tggtggaaca aacccttctt tagttgaagc gatgcatttt 11880
aatattccta tttttgcttt cgattgtgac tttaatcgtt acacaactaa caatttagct 11940
cattacttta atgattctga acaacttagc ttattagcag aaagtttgtc ttttggaaat 12000
cttaaatgtc gagtattaga tttaaaaaat tatgctgaag atatgtataa ctggaggcat 12060
atagctgcta tgtatgaatc tatttattaa acgcattaac aataatataa ttgaccttat 12120
atagcaggga aagatcacgt aacgctgcgg cgcgccgatc cccatatgaa tatcctcctt 12180
agttcctatt ccgaagttcc tattctttct agagaatagg aacttcggaa taggaactaa 12240
ggaggatatt catatggata aagccgtaag catataagca tggataagct atttatactt 12300
taataagtac tttgtatact tatttgcgaa cattccaggc cgcgagcatt cagcgcggtg 12360
atcacacctg acaggagtat gtaatgtcca agcaacagat cggcgtagtc ggtatggcag 12420
tgatgggacg caaccttgcg ctcaacatcg aaagccgtgg ttataccgtc tctattttca 12480
accgttcccg tgagaagacg gaagaagtga ttgccgaaaa tccaggcaag aaactggttc 12540
cttactatac ggtgaaagag tttgtcgaat ctctggaaac gcctcgtcgc atcctgttaa 12600
tggtgaaagc aggtgcaggc acggatgctg ctattgattc cctcaaacca tatctcgata 12660
aaggagacat catcattgat ggtggtaaca ccttcttcca ggacactatt cgtcgtaatc 12720
gtgagctttc agcagagggc tttaacttca tcggtaccgg tgtttctggc ggtgaagagg 12780
gggcgctgaa aggtccttct attatgcctg gtggccagaa agaagcctat gaattggtag 12840
caccgatcct gaccaaaatc gccgccgtag ctgaagacgg tgaaccatgc gttacctata 12900
ttggtgccga tggcgcaggt cactatgtga agatggttca caacggtatt gaatacggcg 12960
atatgcagct gattgctgaa gcctattctc tgcttaaagg tggcctgaac ctcaccaacg 13020
aagaactggc gcagaccttt accgagtgga ataacggtga actgagcagt tacctgatcg 13080
acatcaccaa agatatcttc accaaaaaag atgaagacgg taactacctg gttgatgtga 13140
tcctggatga agcggctaac aaaggtaccg gtaaatggac cagccagagc gcgctggatc 13200
tcggcgaacc gctgtcgctg attaccgagt ctgtgtttgc acgttatatc tcttctctga 13260
aagatcagcg tgttgccgca tctaaagttc tctctggtcc gcaagcacag ccagcaggcg 13320
acaaggctga gttcatcgaa aaagttcgtc gtgcgctgta tctgggcaaa atcgtttctt 13380
acgcccaggg cttctctcag ctgcgtgctg cgtctgaaga gtacaactgg gatctgaact 13440
acggcgaaat cgcgaagatt ttccgtgctg gctgcatcat ccgtgcgcag ttcctgcaga 13500
aaatcaccga tgcttatgcc gaaaatccac agatcgctaa cctgttgctg gctccgtact 13560
tcaagcaaat tgccgatgac taccagcagg cgctgcgtga tgtcgttgct tatgcagtac 13620
agaacggtat tccggttccg accttctccg cagcggttgc ctattacgac agctaccgtg 13680
ctgctgttct gcctgcgaac ctgatccagg cacagcgtga ctattttggt gcgcatactt 13740
ataagcgtat cgataaagaa ggtgtgttcc ataccgaatg gctggattaa 13790
<210> 13
<211> 13777
<212> DNA
<213> Artificial Sequence
<220>
<223> example O6A rfb locus nucleotide sequence - O6A-EPA production
strain stGVXN4112 and stLMTB10923
<400> 13
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatttgcc cgccgggcgt gacaattatg 300
aacgtgcgtc agggcgaacc tttaggtttg ggccactcca ttttatgtgc acgacctgcc 360
attggtgaca atccatttgt cgtggtgctg ccagacgttg tgatcgacga cgccagcgcc 420
gacccgctgc gctacaacct tgctgccatg attgcgcgct tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actctgtcat ccagaccaaa 540
gagccgctgg accgcgaagg taaagtcagc cgcattgttg aattcatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgttggtc gctatgtgct ttctgccgat 660
atttggccgg aacttgaacg cactcagcct ggtgcatggg ggcgtattca gctgactgat 720
gccattgccg aactggcgaa aaaacagtcc gttgatgcca tgctgatgac cggcgacagc 780
tacgactgcg gtaaaaaaat gggttatatg caagcgttcg tgaagtatgg actacgcaac 840
ctcaaagaag gggcgaagtt ccgtaaaggg attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaagatt agcggcgaaa 960
gtaatttgtt gcgaattttc ctgccgttgt tttatataaa caatcagaat aacaacgact 1020
tagcaatagg attttcgtca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcatttgaat tttacgggtt tagcgcgagt gggtaacgct cgtcacatcg 1140
tagacatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gctgaaatta 1200
taaagtcatt cttatagaac atcgcatttc aataatataa ttacacctaa atgaatagga 1260
tacaacgtgt gcacaattat ttaaggctta aagataaaat aaaaaacgta tttttagggt 1320
tgtatatatt gcagttattt aattatatcg cgccattggt aattatccct atcctgataa 1380
aatatattgg gttgggggaa tatggggaat tggtctatat tacatctatt tatcaaatag 1440
tggctttgat tattgatttt ggctttactt acacaggacc tgtggttgct gcgagacata 1500
gatgtgagac ccaaaattta cagcgctatt actcaatagt tgttctttta aaatcattgc 1560
tttttataat tgcattaaca tgtgtatttt tattgtgcag attaaatata gtccacttgt 1620
cattttttgg gtttttgtca atttttctat gcactattgg taatatatta tcgcccaatt 1680
ggtttttgca ggggattggt gattttaaaa aactttcata ctcacaagta atagtgagaa 1740
taacattgtt tatcatactt cttgtttatg tctgtagtgg cggagataat gtttttatcc 1800
taagtttttt gcaaaatgca acattactca tatgctgtat atacttatgg ccaaatattc 1860
atattagcca tgttgttcat cttaaaccta atgaatgcat tgtggaattt aagaaggcag 1920
gaaatgtttt tattggcgta ataggtacga ttggttacaa tggtctaatt cctgtgttaa 1980
ttggaaacct ttgcggtaat acgagtcttg gtgttttttc aatcgttcaa aaaatgacaa 2040
cagcatgtca aagtctaatt aatccaatat cacagtatat gttatctcaa gtttcagaaa 2100
ttaaacctca agataaactg ttttattata gaattaaaaa aagttttttt gtgcatttaa 2160
caattagcat aattgcatgt ttatgttata tggggttagg gcaatatgtg gcgactttta 2220
taggtaaagt tgacgtttca tttgttatta ttttatttgc gtcaataatt accatttttt 2280
catctttaaa taatgtcctt ggtatacagt ttcttatacc gacagataat gtaaaaatac 2340
tacgaagtat aaatgttatg gcgggaatta ttgttgttag tttgtcctgg ctgttaatat 2400
cacgctttga cattctgggg ggggttttat taaacctaat tggtgagttt cttgtattca 2460
gtatgctagc ttttattgcc catcgaaagt ggggagcgag agtataatga aagtgaaggc 2520
ggttcctgct attacattct atttaagttt aatgctgaca attttagtgt tactgtttgg 2580
taatgaacca aataaatcac aatatatcct tgttatagca acgataacag ttttttatat 2640
cgcatatatc actaataaaa taacttctcc ggccagcctt ctcgttatat catcttttgt 2700
gtttttaggt tgtcgccctt tattatcttt gtttgcaaac tatgattata ggattgccga 2760
ttggtttatt gaaggatata tggatgacga tgtgattttg gctaactatg ctataacact 2820
aatgtattat ggttatacat tgggactaat tctatgcaaa aatactgaaa aattttatcc 2880
gcatggtcct tatcctgaaa aacaattgct aaaaataaag tttcttttga ctttattttt 2940
tctgggttcg ataggtatgg ttgtaaaagg gatattcttt tttaacttta tagaatctaa 3000
tagttatgtt gatatttatc aatcaaatat aacaacgcca ataggttatg attttctatc 3060
ttatttattt tattgttctt ttttccttat atgtgcgttt catatacagt tcagaacaaa 3120
taaaaaattt ctttttattg cgatatgcat tgctgcattt agcaccttga agggtagtcg 3180
tagtgaagct ataacgtttc ttttaacggt tacatgtata tattttaatg aagtaaagac 3240
aagaaactta cgtctgctga ttacaatgat ttttgttttt agcgtcattt ttgtgattag 3300
tgaatttatc tcaatgtggc gcactggagg gagttttttt caattaatgc agggtaataa 3360
tcctgttata aactttgtat acggcatggg agtatcatat ctttccattt atcaatcagt 3420
aaaactacaa ctattgtcag ggggatataa tgttacctat ctattcagcc agttaataat 3480
aacttgctcg tcaatattta atgtcaaatt gagcttgccg gaaataagct atagccattt 3540
ggcctcatac acagcaaacc cagaactata taatcttggg ttcggacttg gggggagtta 3600
tttagcagaa tcgtttttag catttggtct gattggatgt ttcattatac cctttttact 3660
tttacttaat ttaaatgtat tggaaaaata tacaaaaaac aaaccaatta tatattttgt 3720
ttattatagt gtgttgccac ctatattatt cacaccaaga gagactttgt tctatttctt 3780
cccctatctt gtcaaaagta tatttgttgc ttttttagtt acattataca tccagtataa 3840
aaaggattga ccaaaatgtc agaaaaaaat gtcagcataa taatcccaag ttataacagg 3900
gctcatattc ttaaggaggt cataccaagt tattttcagg atgagacttt agaggttata 3960
gttatcaatg atggatcaac agataataca aatagtgtat tagctgaact gaaggaaaaa 4020
tattctcagt tagttatttt agaaaatgaa acgaataaaa aacagatgta ttctaaaaac 4080
cgagggattg aaatagccaa agggaaatat attttttttg gtgatgatga ctcttacctc 4140
ttacccggtg ttatatctcg gttattggct acaaaatatg agacaggcgc tgatgtaatc 4200
ggcgcaagaa tactttatat gaataataac gagaaaacaa ttgaagattg cataaatcga 4260
cataaaaaag aggggcgttt tgttagtgat ctaaatagat tggattttag ttatacatgt 4320
gatttggacc atccgattga atgtttttat gcacagcctt ttgttctagc tgaaagggaa 4380
ctaatatcga aatatcgatt tgatatatct tatacgggaa actgctatcg tgaggaaact 4440
gatttcatgc tatctctatt tattaaaaat aaaaaattta tatatgattc aaaggctttg 4500
ttaataaatt tacctccaag aaaagcgacg ggaggggcaa gaacagctaa tcgattaaaa 4560
tatcattacg aaagttgcat aaataattat agatttttaa aaaaatataa tgataatttg 4620
aatcttcttt caggacaaaa gcatgctata ttttaccgac agtgtcaatt cgttctgcta 4680
aaaatgaagt cgtttatcgg gaagttttta aaatgattat atatatcgcc gcgtataatg 4740
gttcaggagg gcaaggtggg gtggaaaggg ttgttgccca acaatgtaac attcttaaaa 4800
atttgggggt taaagtcatt atacttgata aaacatactt caaaatttct aacaaaattc 4860
gtaacaaaaa aatacaagta gcactttatc caatattagt ttctctttat ttaaccttac 4920
aaaaattacg tggcgtgacg tttaaagtta ttgcacatgg ctattgttct cctttttata 4980
ggaatgacat cttaatagct catggcaata tgaaatgtta ttttcaaaca gtcatgaata 5040
aaaaacctaa tcggttgtct ggcagtggtc ttttatcttt ctatgagcgt tgggctggag 5100
cattttcaaa aaatatctgg gctgtttcaa ataaggttaa aagtgaatgg aatgagcttt 5160
acaatattaa ttcacataaa atcaaagttg ttcgaaattt tataaatctt gcacaatttg 5220
attacactga tgttaatgaa gcagaatatg tgacatttgt cgggcgattg gaaaaaggaa 5280
aaggaataga tgatctgtat tacatatgta aaaatctgcc agatacttcc ttccatttag 5340
tttcaagtat tcccgcccca caaaattttg cttcgctaaa taatgttctg accagcattg 5400
ctgtccccta tgcgaaaatg ccagaaatat ttaagaaatc cagagtactt attttaccgt 5460
cctattatga aggatatgag ctggttacta ttgaagcgct atgctgtggt tgccctgtga 5520
taggctataa tgttggtgca attagagagt tgtatgcaga aagttttcct ggcgtattta 5580
ttgccaataa taaagaagat ttagcacaag tagcctacaa attaattagt cttgataatg 5640
aaaaatatta tcatttgaga caaactattt atagcaagcg tgagcttttt tctgaagaga 5700
gatatgcgga aattttaacg gcggcattta atgaaaaaaa ataagaaact ctgtctcatt 5760
tcaattaact catataatga acttaccgga ggaggagtat atttacgtac gcttgttagt 5820
tttctacaaa aacagaatgt taatttaaca cttattgata aaaaatcctc aggtaaacta 5880
ttcgaagaca atacttttca acatatatca tttattaaag gtaaacgtca ggatataata 5940
tccaggcttt tttttatacc atcattttat gtcccttata ttttctcaat aattaaaatt 6000
ttacggaagc aagatattct tgcttttcac aactctcggc ttggattgtt atgtctgctt 6060
tttagaatac tcatgcccca caaaaagatc atattgttta cggataactt cgaatatgac 6120
ttaataagac aaaaagataa aaacataact acttttattg aaaaattaat tgtttatctc 6180
aatgaattta tcgggcttaa gaattcagat ttagttagct atattacccg gcaagataaa 6240
aatgcaatgg ataaatttta tgggattaaa aaaagcagaa atttaattct ccctgtgata 6300
tttagtagag aaaaaccaac tgatgtattg tcagctcact ttattaatga gtataatcga 6360
ttgaataatg ataataggaa aaaagtagta tttactgcat cttttgattt ttttccaaat 6420
atagatgctg ccaactatgt tttaaatgca gcaaagtcta ataatgatta ttgctatatt 6480
ttggcaggta ggaaaagtac tactttgaat cttcctgatt tggataattt attttttttc 6540
gataatctat ctaatagtga aatgtcatat ttattatctg cttgtgatgt tttttattct 6600
cctatagttt taggaagtgg aatgaaaaca aaaattgcag aagcactatc atatggatta 6660
tatatttatg cgacagagca ttccttaatc ggctatgatg aaattataca caataaggag 6720
tgtgttaaaa aaatctcaca tttggatgag gaatttccta aagatttcaa gatgaaaagt 6780
atcaataaac agctaataat gtcttatcag caaaaatatt attcacatta tcggtttaat 6840
ggccatgaac ttgatataat aaattttgac gattagttag tggagatata atatgaacat 6900
attagtaact ggtggtgctg gatatatcgg atctcatacg gctattgaat tactgaatgc 6960
aggtcatgag attatcgttc tggacaattt cagtaatgct tcatacaagt gtatcgaaaa 7020
aataaaagaa attactcgac gtgattttat aacaattact ggagatgctg ggtgtaggaa 7080
gacactctcc gctattttcg agaaacacgc catagatata gttattcatt ttgctggctt 7140
taaatctgtt tcagagtcta aaagtgaacc cttaaagtat taccagaata atgttggagt 7200
gaccattact ttattacagg taatggaaga gtacagaatt aaaaaattta tctttagttc 7260
atctgcgaca gtctatggtg aaccagagat aattccaatt ccagaaacag ctaaaattgg 7320
aggaactacg aatccatatg gcacatcgaa gtattttgtt gaaaaaattc tagaggatgt 7380
tagttccacg ggaaaactgg atataatttg cttgagatat tttaatcctg tcggtgctca 7440
ttctagtggt aaaataggtg aggctccatc tggtatccct aataatcttg ttccttattt 7500
attggatgtt gcgagtggta aacgtgataa attatttatt tatggcaatg attaccctac 7560
taatgatgga acaggtgtaa gggattttat tcatgttgtt gacttagcga aaggtcattt 7620
ggctgcaatg aattatttaa gtatcaattc gggatataat atctttaatc ttggtacagg 7680
aaaaggttat tcggtacttg aattaatcac tacatttgaa aaattaacaa acattaaggt 7740
caataaatct tttatagaga gaagggcagg ggatgttgcg tcttgttggg ctgatgcaga 7800
taaagctaat tctttattgg actggcaagc cgaacaaact ctagaacaga tgttattgga 7860
ctcgtggcgt tggaaaaaaa attatccaga cggattctga atataaaagg tttcagtttt 7920
atgaatcaat cagagcagag aaaaaaaata ctggttctta cacctcgctt tccctaccct 7980
gtcattggag gggatagatt aagagtctat atgttatgta aagaactttc caaaaaatat 8040
gatcttattc ttctgagctt atgtgatcaa ccactagaac ttgaaataaa tataaatgac 8100
tcggtcttca aagaaattca tcgtgtctat ctaccaaaat ataaatcata ttataatgta 8160
ttaaaagctt tggttacgca aaaaccgttg caaattgctt attatcaatc ggacacattt 8220
aagaataaat acaataaatt aattaaacaa tgcgatgcag tattttgtca tctgataaga 8280
gttgctgatt atgttaagga tacagacaag ttcaaaattc ttgatatgac agatgcaata 8340
tctttgaatt acagtcgcgt taaaaaatta gcaagtaaaa aaagtttgcg tgcaattatt 8400
tattctctgg aacaaaaaag attagaatca tatgaacgtt ctgtggcgaa tctttttgat 8460
ttgaccactt ttatttcatc cgtagaccgt gactatctct accctaatct gggcagtaat 8520
atccatatag tcaataatgg ggttgataca tcagccttga gatatataaa aagagaaata 8580
aaaatcgata agcctgtgga acttatattt atcggaaata tgtattcttt acaaaatatg 8640
gatgctgcaa aacattttgc taagaatatt ttaccttgct tgtatgatga gtttaatatt 8700
atttttaaag tgattggtaa gatctcagaa actaataaaa atatattaaa ttcatttaaa 8760
aatacaattg ctttaggtac tgttgatgat atcaattctt ccgcttctac agggcatata 8820
ggtatatgtc ctgttcgtct tggagcaggc gtacaaaata aaattcttga atacatggct 8880
ttaggtttac catgtattac atctagcatt ggttatgaag gtattaatgc aaaatcaggt 8940
agcgaaattt ttgttgcaga tacagtagag caatataaaa acgtactaag agaaataatt 9000
tacgattata atcgttatac tgaagtggct gaaaatgccc gtagttttgt agaaaataat 9060
ttttcttggg aatcaaaagt tgccaattta atgaatacat tagatgagaa attatatgaa 9120
caataataaa attattacac ctatcattat ggctggtggt tcaggcagtc ggttgtggcc 9180
actatcaaga attctctatc cgaaacaatt tcttagccta atcggtagtc ataccatgct 9240
tcaaacaacg gctaatcgtc tggatggttt ggattgtacc aacccttatg tcatttgtaa 9300
tgaacaatac cgctttatag ttgctgaaca gcttagaaaa atcgatagat tgacttcaaa 9360
gaatatcatc cttgagcctg ttgggcgtaa cactgcccct gcaattgcat tagcggcgtt 9420
gctgatgtct aagtctgata aaagtgcaga tgatcttatg ctcgtactgg ctgcagatca 9480
cgttatacac gatgaagaaa aattttgtaa cgctgttaga tcggcaattc catacgctgc 9540
tgatgggaaa ttggtaacat ttggtataat tccagacaaa gcagaaactg gttatggtta 9600
tatacatcga ggacaatata ttaatcagga agattcggat gcatttatag tgtcatcatt 9660
tgttgaaaag ccaaatcatg agacagccac taaatatctt gcttccggtg agtattattg 9720
gaatagcggt atgtttttgt ttagtgcaaa tcgttatata gaggaactta aacaatttcg 9780
gcctgatatt ttatccgctt gtgaaaaagc aattgcttca gcgaactttg accttgattt 9840
tgtgcgttta gatgaaagtt ctttctctaa gtgccctgaa gaatcaattg attacgctgt 9900
aatggaaaaa acaaaagacg caattgttat tccaatggat gctggctgga gtgatgtcgg 9960
ttcatggtct tctctttggg aaattaatga taaagactca gacggcaacg taatagttgg 10020
ggatattttc tctcatgaaa caaagaattc tttcatatat gccgaatcgg gaattgttgc 10080
tacagttgga gtggaaaatt tagttgttgt ccaaacaaag gatgctgttc ttgtctcaga 10140
gagaaataaa gttcaggatg taaagaaaat agtagaacaa attaaaaatt caggtcgtag 10200
cgagcattat gttcatcgcg aagtatatcg tccttggggt aaatatgatt ccattgacac 10260
aggggagcgt tatcaggtca aacgtataac agtaaatcct ggtgaaggac tttctttaca 10320
aatgcaccat catagggcag aacattggat catagtttct ggaactgcaa gggtgactat 10380
aggttctgaa actaagattc ttagcgaaaa tgaatctgtt tacatacctc ttggtgtaat 10440
acactgcttg gaaaatccag ggaaaattcc tcttgattta attgaagttc gttctggatc 10500
ttatttagaa gaagacgatg ttatccgttt tcaggaccga tatggtcgta gctaaatttt 10560
tgataatgta acgttagtag aagagcgcta atatttttag ttaatctgta ataagtatta 10620
tttgtttaag gtatatcatg tcgagtttac cctgctttaa agcctatgat attcgcggga 10680
aattaggcga agaactgaat gaagatattg cctggcgcat tggtcgcgct tatggcgaat 10740
ttctcaaacc gaaaaccatt gtgttaggcg gtgacgtccg actcaccagc gaaaccttaa 10800
aactggcgct ggcgaagggg ttacaggatg cgggcgtcga tgtgctggat attggcatgt 10860
ccggcaccga agagatctat ttcgccacgt tccatctcgg cgtggatggc ggcatcgaag 10920
ttaccgccag ccataacccg atggattaca acggcatgaa actggtgcgc gaaggggctc 10980
gcccgatcag cggtgatacc ggactgcgcg acatccagcg tctggcagaa gccaacgact 11040
ttcctcccgt tgatgaaacc aaacgcggtc gctatcagca aatcaatctg cgtgacgctt 11100
acgttgatca cctgttcggt tatatcaacg tcaaaaacct cacgccgctc aagctggtga 11160
ttaactccgg gaacggcgcg gcgggtccgg tggtggacgc cattgaagcc cgctttaaag 11220
ccctcggcgc acccgtggaa ttaatcaaag tgcacaacac gccggacggc aatttcccca 11280
acggtattcc taacccgcta ctgccggaat gtcgcgacga cacccgcaat gcggtcatca 11340
aacacggcgc ggatatgggc attgcctttg atggcgattt tgaccgctgt ttcctgtttg 11400
acgaaaaagg gcagtttatt gagggctact acattgtcgg cctgctggca gaagcgttcc 11460
tcgaaaaaaa tcccggcgcg aagatcatcc acgatccacg tctctcctgg aacaccgttg 11520
atgtggtgac tgccgcaggc ggcaccccgg taatgtcgaa aaccggacac gcctttatta 11580
aagaacgtat gcgcaaggaa gacgctatct acggtggcga aatgagcgcc caccattact 11640
tccgtgattt cgcttactgc gacagcggca tgatcccgtg gctgctggtc gccgaactgg 11700
tgtgcctgaa aggaaaaacg ctgggcgaac tggtgcgcga ccggatggca gcgtttccgg 11760
caagcggtga gatcaacagc aaactggcac accccgttga ggcgattaac cgcgtggaac 11820
agcactttag ccgcgaggcg ctggcggtgg atcgcaccga tggcatcagc atgacctttg 11880
ccgactggcg ctttaacctg cgctcctcta acaccgaacc ggtggtgcgg ttgaatgtgg 11940
aatcgcgcgg cgatgtaccg ctgatggaag aaaagacaaa acttatcctt gagttactga 12000
acaagtaatt cagtaatttc atataaatgg gttttaaaaa acggaaaaga tgagatatcc 12060
ggtgtggtat atccaaggta atgctattca gtatctctat gagtgagtta acatctatac 12120
cacatttaag ccgcacactt cgggatcccc atatgaatat cctccttagt tcctattccg 12180
aagttcctat tctttctaga gaataggaac ttcggaatag gaactaagga ggatattcat 12240
atggataaag ccgtaagcat ataagcatgg ataagctatt tatactttaa taagtacttt 12300
gtatacttat ttgcgaacat tccaggccgc gagcattcag cgcggtgatc acacctgaca 12360
ggagtatgta atgtccaagc aacagatcgg cgtagtcggt atggcagtga tgggacgcaa 12420
ccttgcgctc aacatcgaaa gccgtggtta taccgtctct attttcaacc gttcccgtga 12480
gaagacggaa gaagtgattg ccgaaaatcc aggcaagaaa ctggttcctt actatacggt 12540
gaaagagttt gtcgaatctc tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg 12600
tgcaggcacg gatgctgcta ttgattccct caaaccatat ctcgataaag gagacatcat 12660
cattgatggt ggtaacacct tcttccagga cactattcgt cgtaatcgtg agctttcagc 12720
agagggcttt aacttcatcg gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg 12780
tccttctatt atgcctggtg gccagaaaga agcctatgaa ttggtagcac cgatcctgac 12840
caaaatcgcc gccgtagctg aagacggtga accatgcgtt acctatattg gtgccgatgg 12900
cgcaggtcac tatgtgaaga tggttcacaa cggtattgaa tacggcgata tgcagctgat 12960
tgctgaagcc tattctctgc ttaaaggtgg cctgaacctc accaacgaag aactggcgca 13020
gacctttacc gagtggaata acggtgaact gagcagttac ctgatcgaca tcaccaaaga 13080
tatcttcacc aaaaaagatg aagacggtaa ctacctggtt gatgtgatcc tggatgaagc 13140
ggctaacaaa ggtaccggta aatggaccag ccagagcgcg ctggatctcg gcgaaccgct 13200
gtcgctgatt accgagtctg tgtttgcacg ttatatctct tctctgaaag atcagcgtgt 13260
tgccgcatct aaagttctct ctggtccgca agcacagcca gcaggcgaca aggctgagtt 13320
catcgaaaaa gttcgtcgtg cgctgtatct gggcaaaatc gtttcttacg cccagggctt 13380
ctctcagctg cgtgctgcgt ctgaagagta caactgggat ctgaactacg gcgaaatcgc 13440
gaagattttc cgtgctggct gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc 13500
ttatgccgaa aatccacaga tcgctaacct gttgctggct ccgtacttca agcaaattgc 13560
cgatgactac cagcaggcgc tgcgtgatgt cgttgcttat gcagtacaga acggtattcc 13620
ggttccgacc ttctccgcag cggttgccta ttacgacagc taccgtgctg ctgttctgcc 13680
tgcgaacctg atccaggcac agcgtgacta ttttggtgcg catacttata agcgtatcga 13740
taaagaaggt gtgttccata ccgaatggct ggattaa 13777
<210> 14
<211> 15027
<212> DNA
<213> Artificial Sequence
<220>
<223> example O8 rfb locus nucleotide sequence - O8-EPA production
strain stLMTB11734
<400> 14
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcgatcgctt aagatctagg atttcattat gttacttcct gtaattatgg 1320
ctggtggtac cggcagtcgt ctctggccga tgtcacgcga gctttatccg aaacagttcc 1380
tccgcctgtt cgggcagaac tccatgctgc aggaaaccat cacccgactc tcgggccttg 1440
aaatccatga accgatggtc atctgtaacg aagagcaccg cttcctggtg gctgaacagc 1500
tacgccagct caataagctg tcgaataata ttattcttga gccggtcggg cgcaacaccg 1560
ccccggccat cgccctggca gcccttcagg ccacccgcga cggcgacgac ccgctgatgc 1620
tggttctcgc cgctgaccat atcatcaata accagtcggc cttccacgac gccatccggg 1680
tcgccgagca gtatgctgat gaaggtcatc tggtcacctt cggtatcgtg ccgaatgccc 1740
cggaaactgg ctacggttac attcagcgcg gcgtggcgct caccgatagt gcccattccg 1800
cgtaccaggt ggcccgcttt gtggagaagc cggatcgcga gcgcgccgag gcttacctcg 1860
cctccgggga gtactactgg aacagcggca tgtttatgtt ccgcgccaag aaatacctca 1920
tcgagctggc caaataccgt ccggatatcc tggaagcctg ccaggctgcg gtgaatgccg 1980
ccgataatgg cagcgatttc atcaatatcc cgcatgatat tttctgcgag tgcccggatg 2040
agtccgtgga ctatgccgtt atggagaaaa ccgccgatgc ggtggtggtc ggtctcgatg 2100
ctgactggag cgacgtcggc tcctggtccg cactatggga ggtcagcccg aaagacgagc 2160
agggcaatgt cctcagcggt gacgcgtggg tacacaacag cgaaaactgc tacatcaaca 2220
gcgacgagaa gctagtggcg gccattggcg tagagaatct ggtgattgtc agcactaagg 2280
acgccgtgct ggtgatgaat cgcgagcgtt cccaggacgt gaagaaggcg gtcgagttcc 2340
tcaagcagaa ccagcgcagc gagtacaagc gccaccgtga gatttaccgc ccctggggcc 2400
gttgcgacgt agtggtccag accccgcgct tcaacgtcaa ccgcatcacg gtgaaaccag 2460
gcggtgcctt ctcgatgcag atgcaccacc atcgcgccga gcattgggtt attctcgccg 2520
gcaccggtca ggtgactgtc aacggtaagc agttcctgtt gtccgagaac cagtccacct 2580
ttattccgat tggcgccgag cactgcctgg aaaaccctgg ctgtattccg ctggaagtgc 2640
tggagatcca gtcgggggcg taccttggcg aggacgacat tattcgtatt aaagaccagt 2700
atggtcgttg ctaattattt tcgggacaag acgcagaatg acacagttaa cttgttttaa 2760
agcttatgac atccgtggtg aactgggtga ggaactgaac gaggacatcg cctaccgtat 2820
cggtcgcgcc tacggcgaat ttctgaaacc cgggaagata gtggtggggg gcgatgtgcg 2880
cctcacaagc gagtcgctga agctggcgct ggcccgcggg ttaatggacg ccggtaccga 2940
cgtgctggac atcggcctga gcggtaccga agagatttac tttgccacct tccaccttgg 3000
ggtagatggt ggcatcgagg tgaccgcgag ccacaatcct atgaactaca acggcatgaa 3060
gctggtgcgc gagaatgcga agcccatcag cggcgacacc ggcctgcggg atatccagcg 3120
cctggcggag gaaaaccagt tcccgccagt ggacccggcg cgtcgcggga ccctgagcaa 3180
gatatcggta ctgaaggagt atgttgacca tctgatgagc tacgtggact tctcgaactt 3240
cacccgtcca ctgaagttgg tggtgaactc cggaaacggg gctgcggggc acgtgattga 3300
tgaggtggag aaacgcttcg cggcggctgg ggtgccggta acctttatca aggtgcatca 3360
ccagccggat ggccatttcc ctaacggtat cccgaatccg ctgctgccgg agtgccgcca 3420
ggataccgcc gacgcggtgc gcgagcatca ggccgacatg gggattgcct ttgacggcga 3480
cttcgatcgc tgcttcctgt tcgatgacga agcttcgttt atcgaggggt attacattgt 3540
cggcctgctg gctgaggcgt tcctgcagaa gcagccggga gcgaaaatca ttcacgaccc 3600
gcgcttgacg tggaacacgg tagacatcgt gacccgcaac ggcggccagc cggtgatgtc 3660
gaagacgggg catgcgttca tcaaggagcg gatgcgtcag gaagacgcta tctacggcgg 3720
ggagatgagt gcgcaccatt acttccgcga tttcgcctac tgcgatagcg ggatgatccc 3780
gtggctgctg gtggcggagc tgctgtgtct gaagaacagc tcgctgaaat cgctggtggc 3840
ggaccgccag aaggcgttcc ctgcgtcggg agagatcaac cgcaagctaa gtaatgctgc 3900
tgaggcgatc gcccgcatcc gggcgcagta tgagccggcg gctgcacaca tcgacacaac 3960
ggacgggatc agtattgaat accctgaatg gcgctttaac ctgcgcacgt ctaacaccga 4020
gccggtggtg cgtctgaacg ttgagtccag agctgatgtg gcgcttatga atgaaaaaac 4080
gaccgagctg ttacacctgt taagcgggga ataaggtgag agatttacta acgacgattt 4140
atcgttatcg gggatttatc tggagcagtg ttaaacgtga ttttcaggca cgctatcaaa 4200
ctagtatgct gggcgcacta tggctcgttt tacaaccgct ctctatgatt ctggtctata 4260
ccctggtttt ttccgaggtg atgaaggcaa gaatgcccga taataccggg tcgtttgcct 4320
atagtattta tctctgttcc ggggtactga cctggggatt atttactgag atgctggata 4380
aaggtcagag cgtatttatt aacaatgcta atctgatcaa gaaactcagt tttccgaaaa 4440
tctgtctgcc gatcatcgtg acgttatcgg cggtgctaaa tttcgcgatt attttcagtc 4500
tgtttctaat ttttatcatt gtcaccggta acttccccgg ctggctcttt ctctcggtga 4560
taccggtcct gcttttgcag atcctgtttg ccggtgggct ggggatgatc cttggtgtca 4620
tgaacgtctt tttcagggat gtggggcaac tggttggcgt tgcgctgcaa ttctggtttt 4680
ggttcacacc cattgtttat gtactgaatt cattacctgc atgggcaaaa aatctgatga 4740
tgtataaccc gatgactcgg atcatgcaat cttatcagtc catcttcgcc tatcatctgg 4800
cccccaactg gtattcgcta tggccagtat tggctctcgc cattattttc tgcgtcatcg 4860
gtttcaggat gttccgcaag catgcggcgg atatggtgga tgaattataa tgagttatat 4920
cagagtaaat aatgtcggta aggcgtatcg ccagtatcac tcaaagaccg ggagactgat 4980
cgaatggtta tcccctctga ataccaaacg ccataatttg aaatggatcc tccgcgatat 5040
taatttcgaa gtcgctccgg gcgaggctgt cggtattatc ggtatcaacg gtgcaggcaa 5100
gagtaccctg cttaaactca taaccgggac gtccaggccg acgactggag aaattgaaat 5160
ctccggacgt gtcgctgcat tactcgaatt ggggatgggg tttcattctg atttcactgg 5220
tcggcagaat gtttatatgt ctgggcaact gttggggtta tcgtcagaga aaataactga 5280
actgatgccg caaattgaag agtttgctga gattggggac tatatcgatc aacctgtgcg 5340
cgtctactcc agtgggatgc aagttcgatt agcttttagt gtagcgacgg ctatccgtcc 5400
tgatgtgcta attatcgatg aggcattatc tgttggggat gcatatttcc agcataaaag 5460
ctttgagcgt attcgaaaat ttcgtcagga agggaccacg ctgttgctgg tatcccatga 5520
taaacaagcg atccaaagca tttgcgaccg ggccatttta ttgaataaag gccaaattga 5580
aatggaaggt gaacctgaag cagtgatgga ttattacaat gctcttctgg ccgataaaca 5640
aaatcagtcc attaaacaag ttgagcataa tggtaaaacg caaactgttt caggcactgg 5700
tgaggtgact atctctgagg ttcatcttct cgatgaacag ggcaatgtga ctgaatttgt 5760
ttcggtaggg catcgtgtca gcttgcaggt caacgttgag gtcaaggacg atattcctga 5820
gcttgttgtc ggatatatga ttaaggatcg acttgggcag ccgattttcg ggaccaatac 5880
gtaccatctc aatcagacac tcacctccct gaaaaaagga gaaaagcgtt cgttcttatt 5940
ttctttcgat gcgagattgg gggttggctc ctattctgtc gctgtcgcgt tgcatacttc 6000
cagtacgcac ctcggcaaaa actatgaatg gcgcgatctg gccgtggtat tcaacgtcgt 6060
taacacggaa caacaagagt ttgtcggcgt gtcctggttg ccgcctgaac tggagatttc 6120
ttaatgggtt cgtcgtttta tcgttcattt gaagaacgac acagaggttc ggttgaagaa 6180
atcaagcgcc gcttgagttt ttatttacct tttcttgcag gtctgaagga catttatcct 6240
gatggcgtga ttgcggatat tggttgcgga cgtggcgaat ggttggagat cctgactgaa 6300
aatggcattg cgaacatcgg cgtcgatctc gatgatggca tgctggcgcg cgccagggag 6360
gccggactga atgtgcagaa aatggattgt ctgcagtttt tgcaaagtca ggcggatcag 6420
agcctgatag cgttgaccgg ttttcatatt gctgagcatt tgccgtttga ggtcctgcag 6480
caactcgcca tgcataccct acgggtgctg aaaccaggtg gtttgctgat cctcgaaacg 6540
ccgaacccgg agaatgtaag cgtcggcacc tgttcatttt atatggatcc aacgcataat 6600
catcctctgc caccgccact gcttgagttt ttacctattc attatggttt tacccgagca 6660
attaccgttc gtctgcagga aaaagaggtt cttcaatctc cggatgcagc cgttaatttg 6720
gtcgatgtac tcaaaggggt gagccccgac tacagcatca ttgctcagaa agcagcgcca 6780
acagatattc ttgaacgctt tgacaccctg tttacccagc agtacggtct gacgctggat 6840
gctctgagca accgttacga tgcgattttg cgccaacagt tttcgtccgt tgtctcacgg 6900
ctggagacgt tgaaccaaac ctatatgcaa cagataagcc aaatgtcaga gactattcag 6960
acgttgcaag gtgaggttga cgatctgagt catgtcatcg atcagaacca tcagcttcat 7020
cagcaaatgg cggatttaca taacagtcgt tcatggcgta ttactcaacc actacgctgg 7080
ttgtctttgc aacgtcaatt attacgtcag gaaggggcta aagtgcgagc ccgtagggct 7140
gggaaaaaaa tattgcgcaa agggatggcg ctctcgctgg tctttttcca tcgttaccct 7200
aagtctaagg tttatctgtt taaggttctg agaaaaactg gctgctatac attgctacaa 7260
cgtttgttcc aacgcgtaat gctggtgcaa tctgacacga tgatgatgca gtccagaaga 7320
tatgatgtgg gtactgaaga aatgacaagt cgcgcgatga gtatttataa cgaattaaaa 7380
aataaaaata cggagaaata acgatgcgta ttgtcataga tttacaaggc gcacagacgg 7440
aaagccgctt tcgtggcatc ggtcgttata gtatcgcaat cgccagaggc ataatcagaa 7500
ataacagccg gcatgagatt ttcatcgcgc tatccgccat gctggatgag tcgattgcaa 7560
atattaaggc gcaatttgcc gatctcctgc cggcagaaaa tatagtcgta tggcatgccg 7620
taggccctgt tcgtgcgatg gaccaaggta atgaatggcg tcgggagagc gcagaactga 7680
ttcgggaagc gtttcttgaa tcattgtgtc cagatgtcgt tttcattacg agtttgtttg 7740
aaggtcatgt cgacgatgcg gctacatcgg tacacaaatt tagtcgtcag tataaagtag 7800
ccgtactgca ccacgatctt atccccctcg tgcaggcgga aacctatctg caggacgatg 7860
tatacaaacc ctactattta cagaaagttg agtggttaaa aaacgctgac cttttgttga 7920
ctaactctgc ttataccgca caggaagcga tcgagcatct gcatttacag ggcgatcatg 7980
tgcagaatat tgcagccgca gtcgattctc agttttgtat ggcggaggtg gcagcgagcg 8040
aaaaagagac cgtccttggc cattacggta ttcagcgcga gttcatgttg tatgcgcccg 8100
gaggatttga ctcaaggaaa aactttaaac ggttgattga ggcctatgcc gggctcagtg 8160
atgccttacg tcgcagtcat caactggtca tcgtcagtaa gctttccatc ggtgatcgtc 8220
agtatctgga atcccttgcg tcaggtaatg gtttacagca gggcgaactg gtactcactg 8280
gttatgtgcc ggaagatgag ctgatccagc tctatcgcct atgtaagctg ttcatctttg 8340
cttcactaca tgaaggtttt gggttgccgg ttctggaagc aatgtcgtgc ggtgcgccgg 8400
tgattggctc aaatgtcacc agtattcctg aagtcatcgg taatcctgag gcattattcg 8460
acccgtattc tgtctcttcc atgagggata agatcgcgca atgtttgact gatgatacct 8520
tcctcgcgcg tctgaaagaa atggcgcagc agcaagcgcg taatttctct tgggataaag 8580
ctgcggtgac tgctctggaa gctttcgaaa agatcgcggt agaagacacc ggtactgcgc 8640
aggttttgcc tgaagctttg attcagaaga tccttgctat ctcacaaggg cagccagatg 8700
accgcgatct gcgcttgtgc gcaacggcca ttgattacaa tctgaaaacg gcagaacttt 8760
atcaaatcga cgataaatcg ctgaactggc gtgtggaagg cccattcgat agctcatata 8820
gtctggcgtt ggtcaaccgc gaatttgccc gggcactctc agccgatggt gtagaggttt 8880
tattgcattc cactgaagga ccaggtgatt ttgccccaga tgcctcgttt atggcacagt 8940
cggaaaatag tgatcttctg gcattttata atcaatgtca gacccgcaag agtaacgaaa 9000
agatagatat tattagcaga aatatctatc caccgcgggt taccaaaatg gatgccaaag 9060
taaaattcct tcattgttat gcttgggaag aaacgggctt tccgcaaccg tggatcaatg 9120
aatttaatcg ggaacttgac ggagtgctgt gtacttcgga acatgttcgt aaaatactga 9180
ttgataacgg actgaatgtg cccgcatttg ttgttggcaa tggctgtgac cattggctca 9240
atatcccagc cgagacgaca aaagatgtgg atcacggaac attccgtttc ctgcacgtct 9300
cttcttgttt cccacgcaaa gggatacagg caatgcttca ggcttggggg aaggcgttca 9360
ctcgtcgtga caatgttatc ttaatcatta agacttttaa caatccgcac aatgaaattg 9420
acgcatggct ggctcaggcc caggctcaat tcatagacta tcccaaagtt gaagtgatca 9480
aagaggatat gtcagccacc gagcttaaag ggctttatga aagctgtgat gttttggttg 9540
ctccaggttg cgctgaaggc tttggtttac ctattgctga agcaatgctg agtgggctac 9600
cggctatcgt caccaattgg agcgggcaac ttgattttgt taattcacaa aattcatggc 9660
tggttgacta tcagttcact cgggtaaaaa cgcactttgg tctgttttcc tcagcctggg 9720
ccagtgtgga tattgacaac ttaacagatg cattaaaagc ggcagcctca accgataaat 9780
cagtgctgcg tgacatggcc aatgctggtc gcgagcttct tctgcagcag tttacctgga 9840
aagcggtggc tgatcgttct tgccaggcgg tcaagactct gcgtgcgcat attgatattg 9900
cacagcatcg ggcgcgcatt ggctgggtga cgacctggaa cacgaaatgt gggatcgcaa 9960
cctattccca gcatctggtg gaaagcgcac ctcatggcgc ggatgttgtt tttgctcccc 10020
aggtcagcgc tggcgatctt gtgtgtgcag acgaagagtt tgtacttcgc aactggattg 10080
taggtaaaga gagcaactat ctggaaaacc tccagccaca cattgatgct ctgagactcg 10140
atgtcattgt gatccaattc aactatggat tctttaatca tcgagaactg tcggcgttta 10200
ttcgtcgcca gcatgacgcc ggtcgttcag ttgttatgac gatgcactca actgtggatc 10260
cgctggaaaa agagccgagc tggaatttcc gtcttgctga aatgaaagag gcgctggcac 10320
tttgcgaccg gttgttggtg cattcgattg ccgatatgaa ccgccttaaa gatttaggct 10380
taactgcgaa tgttgcttta ttcccgcacg gtgttatcaa ctactccgca gcgagcgtca 10440
cacgtcaaca gcagtcttta ccgctaattg cgagctatgg cttctgctta ccgcataagg 10500
gcctgatgga actagtagaa tccgtccata gactcaagca agccggtaaa ccggttcgtt 10560
tacgactggt gaacgcagag tatcctgttg gggagtcacg cgatctggtg gcagagctta 10620
aagctgctgc tcagcggtta ggtgttaccg atctgattga gatgcataat gatttcctac 10680
ctgatgcgga gagtctgcgg ttgctttcag aagccgatct tctgattttt gcttatcaga 10740
atactgggga gtctgctagc ggggcggtac gttatggtat ggcgactcaa aaacctgttg 10800
cggtaacgcc cctggcgata tttgatgatt tggacgatgc cgtctttaaa tttgatggat 10860
gcagcgtcga tgatatcagt caggggattg accggatcct gaattccatc cgtgaacaga 10920
actcttgggc aaccaggact caacaacgtg ccgatgcatg gcgggaacaa catgattatc 10980
aagctgtttc acgccgtctg gttaatatgt gtcaaggctt agctaaagct aaatatttta 11040
aataaaaata tctctcttgt attttttgcc tttgaataca agaggggtta gataatgtgt 11100
catttattat gaaaattatt tttgctactg agccaattaa atacccatta acgggcatcg 11160
gtcggtattc cctggagctg gttaagcggc tggcggtcgc ccgcgaaatt gaagaattaa 11220
agctatttca cggtgcgtcg tttatagaac agatcccttt ggtggagaat aaaagcgata 11280
ccaaagccag caatcatggt cgtctgtcgg cgtttctacg ccgacagacg ctgttgattg 11340
aggcttatcg cttgctgcat ccgcggcgcc aggcgtgggc attgcgcgac tataaggatt 11400
atatctacca tggccccaat ttttatctgc cgcataaact ggaacgcgcc gtgaccacgt 11460
ttcatgacat atccattttt acctgcccgg aatatcatcc aaaagatcgg gttcgctata 11520
tggagaagtc cctgcatgag agtctggatt cggcaaagct gatcctgacc gtttctgatt 11580
tctcgcgcag tgaaattatc cgcttgttca actatccggc ggagcggatc gtaaccacca 11640
agctagcctg cagcagtgac tatatcccac gcagcccggc agagtgtctg ccggtactgc 11700
agaaatatca gctggcgtgg caggcctacg cgctatatat cggcactatg gagccacgta 11760
aaaatatccg aggcctgctg catgcctatc agctgctacc gatggagatc cgcatgcgct 11820
atccgctaat ccttagcggc tatcgcggct gggaagacga tgtgctgtgg cagttagtcg 11880
agcgcggtac tcgggaaggc tggatccgtt acctcggata tgttccggat gaagacctgc 11940
cgtatctgta cgcagcggcc agagtctttg tttatccctc cttctacgag ggattcggtt 12000
tacctattct tgaagcgatg tcttgcggtg tgccggtagt atgctccaat gtcacctctt 12060
tgcctgaggt tgttggcgat gccggcctcg ttgccgatcc taatgatata gacgcgatta 12120
gcgcgcaaat tttgcagagc ctgcaagatg atagctggcg ggaaatcgcc accgcgcgcg 12180
gtcttgctca ggcgaaacag ttttcgtggg agaactgtgc gacacagacc attaacgcct 12240
ataaattact ctaagggtgt cagttgagag ttctacacgt ctataagact tactatcccg 12300
atacctacgg cggtattgag caggtcattt atcagctaag tcagggctgc gcccgccggg 12360
gaatcgcagc cgatgttttc acttttagcc cggacaaaga tacaggtcct gtcgcttacg 12420
aagatcatcg ggtcatttat aataaacagc tttttgaaat tgcctccacg ccgttttcgc 12480
tgaaagcgtt aaagcgtttt aagctgatta aagatgacta cgatatcatc aactaccatt 12540
ttccgtttcc ctttatggat atgctgcatc tttcggcgcg gcctgacgcc aggactgtgg 12600
tgacctatca ctctgatata gtgaaacaaa aacggttaat gaagctgtac cagccgctgc 12660
aggagcgatt tctcagcggc gtagattgca tcgttgcctc gtcgcccaat tacgtggctt 12720
ccagccagac cctgaaaaaa tatctggata aaacggtggt gatcccgttt ggtctggagc 12780
agcaggacgt gcagcacgat ccgcagaggg tcgcgcactg gcgggaaact gtcggcgata 12840
agttctttct cttcgtcggc actttccgct actacaaagg gctgcatatt ctgatggatg 12900
ccgctgagcg tagccgactg ccagtggtgg ttgtaggggg cgggccgctg gaatcggaag 12960
tgcggcgtga agcgcagcag cgcgggctga gcaatgtgat gtttaccggc atgctcaacg 13020
acgaagataa gtacattctc ttccagctct gccggggcgt ggtattcccc tcgcatctgc 13080
gctctgaggc gtttggcatt acgttattgg aaggcgcacg ctttgcaagg ccgctgatct 13140
cttgcgagat cggtacaggt acctctttca ttaaccagga caaagtgagt ggttgcgtga 13200
ttccgccgaa tgatagccag gcgctggtgg aggcgatgaa tgagctctgg aataacgagg 13260
aaacctccaa ccgctatggc gaaaactcgc gtcgtcgttt tgaagagatg tttactgccg 13320
accatatgat tgacgcctat gtcaatctct acactacatt gctggaaagc aaatcctgag 13380
cggccgcgag ctcgtcgact cgaggatccg tgtaggctgg agctgcttcg aagttcctat 13440
actttctaga gaataggaac ttcggaatag gaactaagga ggatattcat atggataaag 13500
ccgtaagcat ataagcatgg ataagctatt tatactttaa taagtacttt gtatacttat 13560
ttgcgaacat tccaggccgc gagcattcag cgcggtgatc acacctgaca ggagtatgta 13620
atgtccaagc aacagatcgg cgtagtcggt atggcagtga tgggacgcaa ccttgcgctc 13680
aacatcgaaa gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa 13740
gaagtgattg ccgaaaatcc aggcaagaaa ctggttcctt actatacggt gaaagagttt 13800
gtcgaatctc tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg 13860
gatgctgcta ttgattccct caaaccatat ctcgataaag gagacatcat cattgatggt 13920
ggtaacacct tcttccagga cactattcgt cgtaatcgtg agctttcagc agagggcttt 13980
aacttcatcg gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg tccttctatt 14040
atgcctggtg gccagaaaga agcctatgaa ttggtagcac cgatcctgac caaaatcgcc 14100
gccgtagctg aagacggtga accatgcgtt acctatattg gtgccgatgg cgcaggtcac 14160
tatgtgaaga tggttcacaa cggtattgaa tacggcgata tgcagctgat tgctgaagcc 14220
tattctctgc ttaaaggtgg cctgaacctc accaacgaag aactggcgca gacctttacc 14280
gagtggaata acggtgaact gagcagttac ctgatcgaca tcaccaaaga tatcttcacc 14340
aaaaaagatg aagacggtaa ctacctggtt gatgtgatcc tggatgaagc ggctaacaaa 14400
ggtaccggta aatggaccag ccagagcgcg ctggatctcg gcgaaccgct gtcgctgatt 14460
accgagtctg tgtttgcacg ttatatctct tctctgaaag atcagcgtgt tgccgcatct 14520
aaagttctct ctggtccgca agcacagcca gcaggcgaca aggctgagtt catcgaaaaa 14580
gttcgtcgtg cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg 14640
cgtgctgcgt ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc 14700
cgtgctggct gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa 14760
aatccacaga tcgctaacct gttgctggct ccgtacttca agcaaattgc cgatgactac 14820
cagcaggcgc tgcgtgatgt cgttgcttat gcagtacaga acggtattcc ggttccgacc 14880
ttctccgcag cggttgccta ttacgacagc taccgtgctg ctgttctgcc tgcgaacctg 14940
atccaggcac agcgtgacta ttttggtgcg catacttata agcgtattga taaagaaggt 15000
gtgttccata ccgaatggct ggattaa 15027
<210> 15
<211> 11283
<212> DNA
<213> Artificial Sequence
<220>
<223> example O15 rfb locus nucleotide sequence - O15-EPA production
strain stLMTB11738
<400> 15
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcatgagcaa aactaaacta aatgttcttt accttgcaat aagtcagggt 1320
gccaattacc tactgccatt attaattttt ccttatcttg ttagagtcat tggtgtatcg 1380
aattttggtg atctgagttt ttcattgata actatacaag tgttgttaat ggttgttgaa 1440
tatggttttg gatatagtgg gacaagagaa atagcactaa ataacgataa aaaataccat 1500
tctgaatttt tttgcggtgt ggtgcttgct cgttttatat taatgctaat tgcagctata 1560
atactcataa tactctgttt tttttatgtt tttaacgacg ttaagtcttt gttatgtgtt 1620
ggttttctgt ccgtaattgc aggtgttttc aatccaaatt ggtttttgca aggtaaggaa 1680
atgatgagtg tgatggctgt gctgtcacta ttttcacgag gcatagcagt cgttgcagtt 1740
tatctaatta taaaacccgc aacgccgatg tacatcagtg ccttattatt gagcatgcca 1800
tatattttgt attcattctg tggcgttgcc tacttactta ttatcaagga gattttttta 1860
tgtaggccac cgataaagaa aattcaagta attttaaaaa atggatttca ttttttttgt 1920
tcaacacttg cgactagtgc atacacaatg ttgacccctc ttgtattggg tggcgtatct 1980
ggaaagtttg atgtaggcat ctttaactca gctaacatga tcaaacaagg tttggctgga 2040
cttgcatcac cattagtcca agctttttat ccaagaatta acattttgca aagagagaat 2100
ccatatattg caaacttaaa atctagaatg attcttaaat acttgcttgt tttttacatg 2160
gctttagcaa taccattttt actttttgcc aaccaattat cattattaat attcggcatg 2220
aaaggtgaag taattgcagg tgcaatgcaa ttaatgacat tgcttcctat attcataggt 2280
tttaatacag ttgtcgggtt acttgtatta gtacctaatg ggatgcaaaa acagtatttc 2340
aaatctattt tcctaggaac tattacttgt ttaagcatag tttatccagc atgtaaatat 2400
tatggagcaa cgggtgcgat tgtgagtctt attgtagctg aaattttcgt tggcatggga 2460
atgcttaaac aattcattaa agtaaataaa accgtatgta ggcctcataa attatgaata 2520
tctcggtaat aatatctgtt tggaaacgcc cagttcaatt agaattgatt ctctctgagc 2580
tcgattctca ggctaaagac aatagtctac acctagaagt aattgtttcc gatagtcata 2640
gtggtaaaga aattgatgat gtagttgctg ataatattca taaaaagaaa aatattaata 2700
ttatccatca acatactaaa aatatactct ccgctaagcg caatttcgga gcatccctag 2760
cccatgggga ttatttaata tttcttgatg atgattgtat acccgcaagt ggatatatat 2820
catcgttgct gaactattta aaaaaaatga atagtaaaag cgttttatgt ggggaagtta 2880
gattcgaaaa tgaactcatt gagaccagca attactatcg ctacaggaac tctttacacc 2940
ctaagtttag tgatagtcct gatatctcta tgaatgcctg gacttttgtc gcaatgaatt 3000
gtgttcttga tagaaaggca ttttcatcag gtatagtttc atataatgaa aattttattg 3060
gttatggttg tgaagatcat gagtttgggt ggcaacttga aaaaaatgac ttcaaaatta 3120
tttttgctga ttttaaaata ttacatcacg aatacagtgg cgatatagaa ggatatacaa 3180
aaaaaattcg tgctacagca cgtgatggta tgaatgtatt aagcaaagta aggcctgaaa 3240
tgttttctac taataaaaaa ttattcctag ttgagaaaat atttagtaaa cacaaaacgt 3300
ttagtaaaat atgccaatca atatttttca ataaatttat ttttaaaaaa ataatacaat 3360
ttttaaaaaa aacagatgca aataaaaaac tctatttccc aattctttac agatatgtgt 3420
tgatttcggc atatatacat ggtattggag agcgtggcac ctcaaaaaca gatgatttgc 3480
ttaagaactg gtatatatag atgatgctat cttcatttat taagacattt gtatggaagg 3540
taaaaaacaa tgaagtataa tgcattgatg gcttttttat tattttttgt tgtttttttt 3600
agattgtcgc tgataatacc tttcttatat ttggcattta ttcctgcatt ttttggtatt 3660
atgtatttag tgcgtaattt tatgattact atgggcaatg gattggtatc tatagatcgt 3720
aaaaatttgt tgctgttatc tatattcata attatttttt tattttgttt ggttttcgat 3780
ttgtttcaaa aaagccattc ttttcaaagt tattttaccg ttagattatt tatgttgttt 3840
ttattttcat ttgttcctgc gtattattta gtaaatagat tcataaaggg tgacttgaaa 3900
ttaatggagc gaatattagt gtattctctc tgggttcaaa tagttatttt ttttggtatg 3960
tatataagtc cagagttaaa aagattgtta tatactttct ttggtatgtc tgactctgtt 4020
aatctttggg aacaaaatgc taaagtaaga ggatttgggt tgtcgggtga aataaatttc 4080
atgacaccat ttttgatgat ctatatgtca ttttttatga tgaaaaggcg ttatgcttta 4140
attactttaa tttgtctgac tcaaatcgta aattctaaca tggctgtgat tgcagccatt 4200
attggtatcg gttgctctag acttaatatt aatataaaaa ttgcaacagt attgattttg 4260
ggagttttag tttatagctt aggagcggtg ttctttcctc gattttatga tgagttcgtt 4320
tctggagatg gcacaagaac tctggatatc ttattacagc aacatgtgtt tgttgtaggt 4380
aatttagatt tttttaatat tatatttgga ttacagcaaa acatatcttc atcaatcccc 4440
gatattaaac aaagttcgga tatgggctgg gttatactgt ttaattacgg tgggttaaca 4500
tttattacac tctttttatt tttaatcttt actatttcta ttgcgacatt tggaatgaca 4560
tatcaagcaa ttatatggat gttaattggg ataattttca ataccaaagg tttagtttta 4620
ggatctaacg gctatttctt tctatctttt atatatatgt ttttgaatag agtaacactt 4680
agtggacaga gttcaattac taataagtta ggtcaagtaa gtaaatagct tccagagtat 4740
atttgtcaat gatttgaggt tcggttatta tgttttcatc taaaacactg ttaattactg 4800
gtggtactgg ctctttcggg aatgctgtat taaatagatt tcttgataca gatattgcag 4860
aaatccgtat atttagtcgt gatgaaaaaa aacaagatga tatgcggaaa aaatacaata 4920
atcaaaaatt aaagttctat attggtgatg tcagagatta ccgtagtatt ttgaatgcga 4980
ctcgcggtgt tgattttata tatcatgcag cggcacttaa gcaagttcca tcatgtgaat 5040
ttcatcctat ggaagccgtt aaaactaata tccttggtac ggaaaatgtt cttgaagcag 5100
ctatagcgaa tgaagtgaag agggttgtat gcctaagtac tgataaagct gtatacccga 5160
ttaacgcaat gggtatttca aaagctatga tggaaaaggt catggtcgcg aaatcccgta 5220
atgttgatcg caataaaaca gtaatatgtg gtacccgtta tgggaatgtt atggcatctc 5280
gcggttcagt tattccatta tttgttgatc ttattagagc gggcaagcca ctcacaataa 5340
ctgatcctaa tatgacccgc tttatgatga ctcttgagga tgcggtagat ttagttcttt 5400
atgcgtttga acatggtaat aatggtgata tctttgtgca aaaagcacct gcagcaacta 5460
ttgacacatt agctattgct ttaaaggaat tactaaatgt tcctgaccat ccggtaaatg 5520
tcattggaac gcgtcatggc gagaaattat atgaagctct acttagtcgt gaggaaatga 5580
tcgctgctat agatatgggc gattattacc gtgtcccgcc agatcttcgt gaccttaatt 5640
atggcaaata tgttgagcaa ggtgatagcc gaatatctga aatagaagat tataactctc 5700
ataatactca acggttagat gttgaaggca tgaaagagct cttgctaaaa ttagccttta 5760
ttcgagcaat tcgtgctggt gaaaaatata atctggattc atgatatgaa aatattagtt 5820
actggtgcaa atggttttat tggtcgtaat ttatgtttga ggcttgagga acttggttat 5880
aaagatctta ttagaattga tcgagaatca acgaagcaag atcttgaaca aggcttacag 5940
gatgccgatt ttatttatca cttagctggt atcaatagac ctaagactga tgatgagttt 6000
atttctggaa acagtgattt aacaaagcat atagttgagt atctcctttc tattggtaag 6060
aatacaccaa ttatgctaag ttcttcgata caagctgaac ttaataatgc ttatggggtt 6120
agcaaagctg tagctgaaag ctatgtcgaa aaatatgctg ctgctagtgg ttcttcgtat 6180
tatattttca gatatccaaa cgtttttggt aaatggtgta agccaaacta taattctttt 6240
atagcaactt tttgctacaa tatttccaat gatattgaga ttactatcaa tgatgcagca 6300
gcgccagtca atctggtcta tattgatgat gtttgtactg atgctatagc tcttctctct 6360
gggacggttg aaagtggata taaagttgtt gcaccaattt attcaacaac agttggtgaa 6420
gttgcagaat taatttatag cttcaaaaat agccgttcca ccctgatcac agaggctgtc 6480
ggggcgggat ttacccgtgc attgtattct acatggctga gttatttacc agcagagaag 6540
tttgcgtaca aggtaccttt ttatggggat gcccgcggag tcttttgtga gatgttgaaa 6600
acgccttcag cggggcagtt ttcatttttt actgctcacc ctggtattac gcgtggcgga 6660
cattaccatc acagtaaaaa tgagaagttt ttggtcattc gaggtcaggc atgctttaaa 6720
tttgaacatg tgattaccgg tgagcgatat gaactgaaag tttcatcggg tgagtttaag 6780
attgttgaaa cagttcctgg ttggacacat gacattacaa atattggaac tgatgaatta 6840
atagtcatgc tctgggcaaa tgaaattttc aaccgtgatg agcccgatac tattgcgaga 6900
cctctataat gaaaaaatta aaagttatgt ctgttgttgg aacccgtcct gagattatcc 6960
gtttgtcgag ggttcttgct aagtttgatg aatactgcga gcatattatt gtccatactg 7020
gtcaaaatta tgattacgaa ttaaatgaag tgttcttcaa tgacttgggt gttcgaaaac 7080
ctgattattt tttaaatgca gcgggtaaaa atgcggcgga aaccattggt caggttatta 7140
ttaaggtaga tgaagtatta gaaatcgaaa aacctgaagc aatactggta ttgggcgata 7200
cgaattcatg tatttctgcc attccggcca aacgccgtaa agtgcctata tttcatatgg 7260
aagcaggtaa ccgttgtttc gatcaacgcg tgcctgaaga aaccaacaga cgtattgttg 7320
accatacggc tgatatcaat atgacctaca gtgatattgc tcgtgaatat ctcttggctg 7380
aaggtatccc agctgatcgg atcataaaaa ctggtagccc tatgtttgag gttctttcat 7440
attatatgcc ccaaattgat ggttcagatg tgctatcgcg tttgaatcta cagtctggtg 7500
agttttttgt agtaagtgcg catcgtgaag agaatgttga ttctccaaaa cagctcgtaa 7560
agcttgcgaa cattctaaat actgttgctg aaaaatataa tcttccagtt attgtctcca 7620
cacacccaag gacacgtaac cgaatccgtg agcaaggaat tgaatttcat tcaaatataa 7680
atctactgaa accattgggt ttccatgatt ataaccactt gcagaagaac tcacgagctg 7740
tgctttcaga tagcggtact atcactgaag agtcatccat catgaatttc ccagcggtaa 7800
acatccggga agcgcatgag cgtccggaag gctttgagga agcatccgtc atgatggtgg 7860
ggttagagtg tgaacgcgta ttacaagcgc tggatattct ggcaacacaa ccgcgaggtg 7920
aagtccgtct tttacgtcag gttagtgatt acagcatgcc aaatgtgtcg gataaagttg 7980
tcagaattgt tcactcttac acagattatg ttaagagagt cgtctggaaa gaatattgat 8040
gaaacttgct ttaatcatag atgattacct gcccaacagt actcgtgttg gtgcaaaaat 8100
gtttcatgaa cttgctcaag aatttatcca gcgtgggcac gatgttacgg taattactcc 8160
tggtacgggc atgcaagaag agatttcttt tgataccttt cagggggtaa aaacatggcg 8220
ttttaaaagc gggccgctca aggatgtaag taaaattcag cgagcggtca atgaaacgct 8280
tttgtcctat cgggcgtgga aagccatcaa aaaatgggta aaaaaagaga cctttgaggg 8340
ggtgatttat tattcacctt ccatattctg ggggccttta gttaaaaaaa ttaaagctcg 8400
ttgccaatgt cctgcttatc ttattttaag agatatgttt ccacaatggg taattgatgc 8460
aggaatgctt aatgctggtt ccccaataga acgctacttt cgtctttttg aaaaaatatc 8520
ttatcgtcag gcaaatcgta ttggacttat gtctgataag aatcttgatg tttttcggaa 8580
agataataaa ggctatccgt gcgaagtttt gcgtaattgg gcatccctaa caccaacgat 8640
catacccaag gattatatac cactacgtaa gcgacttggc ctagaggata aaaccatttt 8700
cttctatggt ggaaacatag gtcatgcaca ggacatgaca aacttgatgc gacttgtgag 8760
aaacatggca gcatatcctc aagctcattt cctatttatt ggccaggggg atgaagttga 8820
attaattaat tcattagcat ctgagtgggc attgacgaat ttcacctatt tgccctcggt 8880
taaccaagat gaatttaagt tcattttgtc ggaaatggat atcggcttgt tttctctttc 8940
cgctagacac tcttcccata attttcctgg taagttatta ggctatatgg ttcagtcgct 9000
acctatttta ggtagcgtaa atgccggaaa tgatttgctc gacattgtca atcaaaataa 9060
tgcgggatta atccatgtca atggtgagga cgataaatta tgtcaatctg cgctattaat 9120
gttgcatgat attgatgtgc gccggcaact tggttcgggg gcgaatatat tgttgaaaga 9180
acaattctcc gttgagtctg cggcacagac gatagaaatg aggttggagg catgcaatgc 9240
gattaattga taatgaccaa ctcgacgaat tatatgatca agccgggcaa tcggaacgtt 9300
tacgttccca ccttatgatg cacggctcgc atcaagaaaa ggtacagcgt ttacttattg 9360
cattagtaaa gggcagctat gttgaaccgc attatcacga acttcctcat cagtgggaaa 9420
tgttcattgt tatggagggg caacttcagg tttgtttgta tggtagaaat ggtgaggtta 9480
taaagcaatt tatagcagga gataatactg gaatgagcat tgtggagttt tctccgggcg 9540
atatacacag tgtcgaatgc ctatctccgc gtgctcttat ggtggaagtt aaggaggggc 9600
catttgaccc ttcttttgca aaatcgttcg tgtgagcggc cgcgagctcg tcgactcgag 9660
gatccgtgta ggctggagct gcttcgaagt tcctatactt tctagagaat aggaacttcg 9720
gaataggaac taaggaggat attcatatgg ataaagccgt aagcatataa gcatggataa 9780
gctatttata ctttaataag tactttgtat acttatttgc gaacattcca ggccgcgagc 9840
attcagcgcg gtgatcacac ctgacaggag tatgtaatgt ccaagcaaca gatcggcgta 9900
gtcggtatgg cagtgatggg acgcaacctt gcgctcaaca tcgaaagccg tggttatacc 9960
gtctctattt tcaaccgttc ccgtgagaag acggaagaag tgattgccga aaatccaggc 10020
aagaaactgg ttccttacta tacggtgaaa gagtttgtcg aatctctgga aacgcctcgt 10080
cgcatcctgt taatggtgaa agcaggtgca ggcacggatg ctgctattga ttccctcaaa 10140
ccatatctcg ataaaggaga catcatcatt gatggtggta acaccttctt ccaggacact 10200
attcgtcgta atcgtgagct ttcagcagag ggctttaact tcatcggtac cggtgtttct 10260
ggcggtgaag agggggcgct gaaaggtcct tctattatgc ctggtggcca gaaagaagcc 10320
tatgaattgg tagcaccgat cctgaccaaa atcgccgccg tagctgaaga cggtgaacca 10380
tgcgttacct atattggtgc cgatggcgca ggtcactatg tgaagatggt tcacaacggt 10440
attgaatacg gcgatatgca gctgattgct gaagcctatt ctctgcttaa aggtggcctg 10500
aacctcacca acgaagaact ggcgcagacc tttaccgagt ggaataacgg tgaactgagc 10560
agttacctga tcgacatcac caaagatatc ttcaccaaaa aagatgaaga cggtaactac 10620
ctggttgatg tgatcctgga tgaagcggct aacaaaggta ccggtaaatg gaccagccag 10680
agcgcgctgg atctcggcga accgctgtcg ctgattaccg agtctgtgtt tgcacgttat 10740
atctcttctc tgaaagatca gcgtgttgcc gcatctaaag ttctctctgg tccgcaagca 10800
cagccagcag gcgacaaggc tgagttcatc gaaaaagttc gtcgtgcgct gtatctgggc 10860
aaaatcgttt cttacgccca gggcttctct cagctgcgtg ctgcgtctga agagtacaac 10920
tgggatctga actacggcga aatcgcgaag attttccgtg ctggctgcat catccgtgcg 10980
cagttcctgc agaaaatcac cgatgcttat gccgaaaatc cacagatcgc taacctgttg 11040
ctggctccgt acttcaagca aattgccgat gactaccagc aggcgctgcg tgatgtcgtt 11100
gcttatgcag tacagaacgg tattccggtt ccgaccttct ccgcagcggt tgcctattac 11160
gacagctacc gtgctgctgt tctgcctgcg aacctgatcc aggcacagcg tgactatttt 11220
ggtgcgcata cttataagcg tattgataaa gaaggtgtgt tccataccga atggctggat 11280
taa 11283
<210> 16
<211> 13435
<212> DNA
<213> Artificial Sequence
<220>
<223> example O16 rfb locus nucleotide sequence - O16-EPA production
strain stLMTB11739
<400> 16
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320
cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380
aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440
atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500
cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560
accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620
gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680
gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740
acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800
cgcgcgtgga aacgtacata tggtttaccg acaattgtga ctaattgctc gaacaactat 1860
ggtccttatc atttcccgga aaagcttatt ccactggtta ttcttaatgc actggaaggt 1920
aaggcattac ctatttatgg caaaggagat cagatccgcg actggttgta tgttgaagat 1980
catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040
ggtgggcaca acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgctggat 2100
gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc tgatcgtccg 2160
ggacacgatc gccgctatgc tattgatgct gagaagattg gtcgcgcatt gggatggaaa 2220
ccacaggaaa cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca 2280
aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag 2340
ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400
agcgtgctct ggcacctttg ggtaatttga ttgcttttga tgttcactct actgattatt 2460
gcggtgattt tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggccggata 2520
ttattgtcaa tgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg 2580
cacaattaat taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag 2640
cctgggttat ccattactcg actgattacg tcttccctgg aaatggcgat atgccatggc 2700
tggagacgga tgcaaccgca ccactaaatg tttacggtga aaccaagtta gccggagaaa 2760
aagcgttaca ggaatattgc gcgaagcatc ttattttccg gaccagctgg gtctatgcag 2820
gaaaaggaaa taacttcgcc aaaacgatgt tacgtctggc aaaagagcgt gaagaattag 2880
cggttattaa cgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacag 2940
cacatgccat tcgtgtcgca ctgaataaac cggatgtcgc aggcttgtac catttggtag 3000
ccagtggtac cacaacctgg tacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060
caggcattcc ccttgcactc aacaagctca acgcagtacc aacaacagcc tatcctacac 3120
cagctcgtcg tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc 3180
ttgtcttgcc tgactggcag gttggcgtga aacgaatgct caatgaatta tttacgacta 3240
cagcaattta atagtttttg catcttgttc gtgatggtgg agcaagatga attaaaagga 3300
atgatgaaat gaaaatgcgt aaaggtatta ttttagcggg tggttctggt acacgtcttt 3360
atcctgtgac tatggctgtc agtaaacagc tattacctat ttatgataaa ccgatgatct 3420
attacccgct ctctacactg atgttggcgg gtattcgcga tattttgatt atcagtacac 3480
ctcaggatac tcctcgtttt caacaattgc tgggtgacgg tagccagtgg ggcctgaatc 3540
ttcagtacaa agtgcaacct agcccagatg gcctcgcgca ggcatttatc atcggtgaag 3600
agtttattgg tggtgatgat tgtgctttgg ttcttggtga taatatcttt tacggtcacg 3660
atctgccgaa gctaatggag gccgctgtta acaaagaaag tggtgcaacg gtatttgcct 3720
atcacgttaa tgatccagaa cgctatggtg tcgttgagtt tgataaaaac ggtacggcaa 3780
tcagtctgga agaaaaaccg ttagaaccaa agagtaatta cgccgttaca ggtctgtact 3840
tttatgataa cgacgtggtt cagatggcga aaaacttgaa gccgtctgca cgtggtgagt 3900
tagaaattac agatattaac cgtatttatc ttgagcaggg acgtctgtct gtcgcgatga 3960
tggggcgtgg ctacgcgtgg ctggacacgg ggactcatca gagtctgata gaagcaagta 4020
attttattgc gacaattgaa gagcgccagg gattgaaggt ttcctgtcct gaagagattg 4080
catttcgtaa aggttttatt gatgttgagc aagtaagaaa attagctgta ccactaataa 4140
agaataatta tgggcagtat ctttataaaa tgacgaagga ttcaaattaa tgaatgtgat 4200
tagaactgaa attgaagatg tgctaattct ggagccaaga gtatttggtg atgatagagg 4260
tttcttttat gagagcttta atcaatcagc atttgaacat attctaggct atccggtcag 4320
ctttgttcaa gacaatcact cacgttcatc aaaaaatgta ctcagaggcc ttcactttca 4380
acgcggcgag tacgcacaag ataaacttgt acgctgcact catggagcag tttttgatgt 4440
tgctgttgat attcgaccca attcggtatc ctttggtaaa tgggttggtg ttctgctttc 4500
agctgataat aagcagcagt tgtggatacc aaaagggttt gctcatggct ttttggttct 4560
gtctgatatc gctgaatttc aatataaaac tacaaactat tatcatcctg aaagcgattg 4620
tggaatatgt tggaatgatg aacgcattgc aattgattgg ccccaaacat cagggttaat 4680
cctttcgcca aaagatgaaa ggctctttac gttagatgag cttatcagat taaaattaat 4740
tgcatgaata cgaataaatt atctttaaga agaaacgtta tatatctggc tgtcgttcaa 4800
ggtagcaatt atcttttacc attgcttaca tttccatatc ttgtaagaac acttggtcct 4860
gaaaatttcg gtatattcgg tttttgccaa gcgactatgc tatatatgat aatgtttgtt 4920
gaatatggtt tcaatctcac agcaactcag agtattgcca aagcagcaga tagtaaagat 4980
aaagtaacgt ctattttttg ggcggtgata ttttcaaaaa tagttcttat cgtcattaca 5040
ttgattttct taacgtcgat gaccttgctt gttcctgaat ataacaagca tgccgtaatt 5100
atatggtcgt ttgttcctgc attagtcggg aatttaatct accctatctg gctgtttcag 5160
ggaaaagaaa aaatgaaatg gctgacttta agtagtattt tatcccgctt ggctattatc 5220
cctctaacat ttatttttgt gaacacaaag tcagatatag caattgccgg ttttattcag 5280
tcaagtgcaa atctggttgc tggaattatt gcactagcta tcgttgttca tgaaggttgg 5340
attggtaaag ttacgctatc attacataat gtgcgtcgat ctttagcaga cggttttcat 5400
gtttttattt ccacatctgc tattagttta tattctacgg gaatagttat tatcctggga 5460
tttatatctg gaccaacgtc cgtagggaat tttaatgcgg ccaatactat aagaaacgcg 5520
cttcaagggc tattaaatcc tatcacccaa gcaatatacc caagaatatc aagtacgctt 5580
gttcttaatc gtgtgaaggg tgtgatttta attaaaaaat cattgacctg cttgagtttg 5640
attggtggtg ctttttcatt aattctgctc ttgggtgcat ctatactagt aaaaataagt 5700
atagggccgg gatatgataa tgcagtgatt gtgctaatga ttatatcgcc tctgcctttt 5760
cttatttcat taagtaatgt ctatggcatt caagttatgc tgacccataa ttataagaaa 5820
gaattcagta agattttaat cgctgcgggt ttgttgagtt tgttgttgat ttttccgcta 5880
acaactcttt ttaaagagat tggtgcagca ataacattgc ttgcaacaga gtgcttagtt 5940
acgtcactca tgctgatgtt cgtaagaaat aataaattac tggtttgctg aggattttat 6000
gtacgattat atcattgttg gttctggttt gtttggtgcc gtttgtgcga atgagttaaa 6060
aaagctaaac aaaaaagttt tagtgattga gaaaagaaat catatcggtg gaaatgcgta 6120
cacagaggac tgtgagggta tccagattca taaatatggt gcacatattt ttcataccaa 6180
tgataaatat atatgggatt acgttaatga tttagtagaa tttaatcgtt ttactaattc 6240
tccactggcg atttataaag acaaattatt caaccttcct tttaatatga atactttcca 6300
ccaaatgtgg ggagttaaag atcctcaaga agctcaaaat atcattaatg ctcagaaaaa 6360
aaagtatggt gacaaggtac ctgaaaattt ggaggagcag gcgatttcat tagttgggga 6420
ggacttatac caagcattga taaagggtta tacggagaag cagtggggaa gaagtgcaaa 6480
agaattgcct gcatttatta ttaagcgaat cccagtgaga tttacgtttg ataacaatta 6540
tttttccgat cgctatcaag gtattccggt gggaggctac actaagctta ttgaaaaaat 6600
gcttgaaggt gtggacgtaa aattaggcat tgattttttg aaagacaaag attctctagc 6660
gagtaaagcc catagaatca tctacactgg acccattgat cagtacttcg actataggtt 6720
tggagcgtta gaatatcgct ctttaaaatt tgagacggaa cgccatgaat ttccaaactt 6780
ccaagggaat gcagtaataa atttcactga tgctaatgta ccatatacca gaataattga 6840
gcataaacat tttgactatg ttgagacaaa gcatacggtt gttacaaaag aatatccatt 6900
agagtggaaa gttggcgacg aaccctacta tccagttaat gataataaaa acatggagct 6960
ttttaagaaa tatagagagt tagctagcag agaagacaag gttatatttg gcgggcgttt 7020
ggccgagtat aaatattatg atatgcatca agtgatatct gccgctcttt atcaagtgaa 7080
aaatataatg agtacggatt aatgatctat cttgtaatta gtgtctttct cattacagca 7140
tttatctgtt tatatcttaa gaaggatata ttttatccag ccgtatgcgt taatatcatc 7200
ttcgcactgg tcttattggg atatgaaata acgtcagata tatatgcttt tcagttaaat 7260
gacgctacgt tgatttttct actttgcaat gttttgacat ttaccctgtc atgtttattg 7320
acggaaagtg tattagatct aaatatcaga aaagtcaata atgctattta tagcatacca 7380
tcgaagaaag tgcataatgt aggcttgtta gttatttctt tttcgatgat atatatatgc 7440
atgaggttaa gtaactacca gttcgggact agcttactta gctatatgaa tttgataaga 7500
gatgctgatg ttgaagacac atcaagaaat ttctcagcat acatgcagcc aatcattcta 7560
actacttttg ctttatttat ttggtctaaa aaatttacta atacaaaggt aagtaaaaca 7620
tttactttac ttgtttttat tgtattcatc tttgcaatta tactgaatac tggtaagcaa 7680
attgtcttta tggttatcat ctcttatgca ttcatcgtag gtgttaatag agtaaaacat 7740
tatgtttatc ttattacagc tgtaggtgtt ctattctcct tgtatatgct ctttttacgt 7800
ggactgcctg gggggatggc atattatcta tccatgtatt tggtcagccc tataatcgcg 7860
tttcaggagt tttattttca gcaagtatct aactctgcca gttctcatgt cttttggttt 7920
tttgaaaggc tgatggggct attaacaggt ggagtctcta tgtcgttgca taaagaattt 7980
gtgtgggtgg gtttgccaac aaatgtttat actgcttttt cggattatgt ttatatttcc 8040
gcggagctaa gctatttgat gatggttatt catggctgta tttcaggtgt tttatggaga 8100
ttgtctcgaa attacatatc tgtgaaaata ttttattcat attttattta taccttttct 8160
ttcatttttt atcatgaaag cttcatgact aatattagca gttggataca aataactctt 8220
tgtatcatag tattctctca atttcttaag gcccagaaaa taaagtgaaa atgtattttt 8280
tgaatgattt aaatttctct agacgcgatg ctggatttaa agcaagaaaa gatgcactgg 8340
acattgcttc agattatgaa aacatttctg ttgttaacat tcctctatgg ggtggagtag 8400
tccagagaat tattagttct gttaagctta gtacatttct ctgcggtctt gaaaataaag 8460
atgttttaat tttcaatttc ccgatggcca aaccattttg gcatatattg tcattctttc 8520
accgccttct aaaatttaga atagtacctc tgattcatga tattgatgaa ttaagaggag 8580
gagggggtag tgattctgtg cggcttgcta cctgtgatat ggtcataagt cacaatccac 8640
aaatgacaaa gtaccttagt aaatatatgt ctcaggataa aatcaaagac ataaaaatat 8700
ttgattacct cgtctcatct gatgtggagc atcgagatgt tacggataag caacgagggg 8760
tcatatatgc tggcaacctt tctaggcata aatgttcttt catatatact gaaggatgcg 8820
attttactct ctttggtgtc aactatgaaa ataaagataa tcctaaatat cttggaagtt 8880
ttgatgctca atctccggaa aagattaacc tcccaggcat gcaatttgga ctcatttggg 8940
atggagattc tgtcgaaacc tgtagtggtg cctttggcga ctatttaaag tttaataacc 9000
ctcataagac atctctttat ctttcaatgg aacttccagt atttatatgg gataaagccg 9060
cccttgcgga tttcattgta gataatagaa taggatatgc agtgggatca atcaaagaaa 9120
tgcaagagat tgttgactcc atgacaatag aaacttataa gcaaattagt gagaatacaa 9180
aaattatttc tcagaaaatt cgaacaggaa gttacttcag ggatgttctt gaagaggtga 9240
tcgatgatct taaaactcgc taaacgatat ggtctctgtg gttttattcg gcttgttaga 9300
gatgtcttat tgactcgtgt attttaccgg aactgtagaa ttattcgatt tccctgctat 9360
attcgcaatg atggtagcat taattttggt gaaaatttca caagtggagt cggtctcagg 9420
ctggatgcat ttggacgtgg cgtgattttt ttttccgata atgtgcaagt taacgactat 9480
gttcatatcg cctcaattga gagcgttacg ataggtcggg atacgcttat tgcaagtaaa 9540
gtatttatta ccgatcataa tcacggttcc tttaagcact ctgatccaat gagttcgcca 9600
aatatacctc cagacatgcg cacgttggaa tcttcagctg ttgtaattgg ccagagggtt 9660
tggttgggtg agaatgtgac ggttttgcct ggaacaatta ttggtaatgg agtcgtagtc 9720
ggcgccaatt ctgttgttag aggttctatt cccgaaaata ctgtcattgc gggagtacca 9780
gcaaaaatca taaagaaata caatcatgag accaaattat gggaaaaagc atagtcgttg 9840
tttctgcggt caattttacc actggcggtc catttaccat tttgaaaaaa tttttggcag 9900
caactaataa taaagaaaat gtcagtttta tcgcattagt ccattctgct aaagagttaa 9960
aagaaagtta tccatgggtt aaattcattg agtttcctga ggttaaaggg tcgtggctaa 10020
aacgtttgca ctttgaatat gtagtttgta aaaaactttc aaaagagctg aatgctacgc 10080
attggatttg tctgcatgat attacggcca atgtcgtcac taaaaaaaga tatgtgtatt 10140
gtcataaccc tgcccctttt tataaaggaa ttttattccg tgaaattctt atggagccta 10200
gctttttctt atttaaaatg ctatacgggc tgatatataa aataaacatt aaaaaaaata 10260
ctgcagtgtt tgttcaacaa ttctggatga aagaaaaatt tatcaagaaa tattctataa 10320
ataacatcat tgtcagtcgg ccagaaatta aattatctga taaaagccaa cttactgatg 10380
atgattctca atttaagaat aacccttctg agttgacaat attttaccct gctgttccac 10440
gagtatttaa aaattacgag cttattatta gtgcagcaag gaaattgaaa gaacaatcca 10500
atattaaatt tctgcttact atcagtggta cagaaaatgc gtatgcaaaa tatattatca 10560
gtcttgcaga aggactggat aatgttcatt tcctcgggta cttggataaa gaaaaaatcg 10620
atcattgtta taatatttca gatatagttt gttttccctc taggttagaa acatggggat 10680
tgccgttgtc tgaggctaaa gagcgaggta agtgggtatt agcatcagat ttcccattta 10740
ctagagaaac tcttggtagt tatgaaaaga aagctttttt tgattctaat aacgatgaca 10800
tgttagttaa acttattatt gacttcaaaa aaggtaacct caaaaaagat atctctgatg 10860
caaatttcat ttatcgtaat gaaaatgtat tagttgggtt tgatgaacta gttaatttta 10920
ttactgaaga acattgaaat ggtatatata ataatcgttt cccacggaca tgaagactac 10980
atcaaaaaat tactcgaaaa tcttaatgct gacgatgagc actacaagat tatcgtacgc 11040
gacaacaaag actctctatt attgaaacaa atatgccagc attatgcagg cctggactat 11100
attagtggag gtgtatacgg ctttggtcat aataataata ttgcggtggc gtatgtaaag 11160
gaaaaatata gacccgcaga tgatgattac attttgtttt tgaatcccga tatcatcatg 11220
aagcatgatg atttgctgac atatattaaa tatgtcgaaa gtaagcgtta tgcttttagt 11280
acattatgcc tgttccgaga tgaagcgaaa tctttacatg attattccgt aagaaaattt 11340
cctgtgcttt ctgattttat tgtgtcattt atgttaggga ttaataaaac aaaaattcct 11400
aaagaaagta tctattctga tacggttgtt gattggtgcg caggatcatt tatgctggta 11460
cgtttttcag attttgtgcg tgtaaatggc ttcgatcaag gttactttat gtactgtgaa 11520
gatattgacc tgtgcttgag gcttagcctg gctggtgtca gacttcatta tgttcccgct 11580
tttcatgcga tacattatgc tcatcatgac aatcgaagtt ttttttcaaa agccttcaga 11640
tggcacttaa aaagtacttt tagatattta gccagaaaac gtattttatc aaatcgcaac 11700
tttgatcgaa tttcatcagt ttttcacccg taagagctcg gtacccgggc ctagggtgta 11760
ggctggagct gcttcgaagt tcctatactt tctagagaat aggaacttcg gaataggaac 11820
taaggaggat attcatatcc gtcgacggcg gccgccctgc aggcatgcaa gcttgatcca 11880
tatggatcgc tagcttaatt aaataaagcc gtaagcatat aagcatggat aagctattta 11940
tactttaata agtactttgt atacttattt gcgaacattc caggccgcga gcattcagcg 12000
cggtgatcac acctgacagg agtatgtaat gtccaagcaa cagatcggcg tagtcggtat 12060
ggcagtgatg ggacgcaacc ttgcgctcaa catcgaaagc cgtggttata ccgtctctat 12120
tttcaaccgt tcccgtgaga agacggaaga agtgattgcc gaaaatccag gcaagaaact 12180
ggttccttac tatacggtga aagagtttgt cgaatctctg gaaacgcctc gtcgcatcct 12240
gttaatggtg aaagcaggtg caggcacgga tgctgctatt gattccctca aaccatatct 12300
cgataaagga gacatcatca ttgatggtgg taacaccttc ttccaggaca ctattcgtcg 12360
taatcgtgag ctttcagcag agggctttaa cttcatcggt acgggtgttt ctggcggtga 12420
agagggggcg ctgaaaggtc cttctattat gcctggtggc cagaaagaag cctatgaatt 12480
ggtagcaccg atcctgacca aaatcgccgc cgtagctgaa gacggtgaac catgcgttac 12540
ctatattggt gccgatggcg caggtcacta tgtgaagatg gttcacaacg gtattgaata 12600
cggcgatatg cagctgattg ctgaagccta ttctctgctt aaaggtggcc tgaacctcac 12660
caacgaagaa ctggcgcaga cctttaccga gtggaataac ggtgaactga gcagttacct 12720
gatcgacatc accaaagata tcttcaccaa aaaagatgaa gacggtaact acctggttga 12780
tgtgatcctg gatgaagcgg ctaacaaagg tacgggtaaa tggaccagcc agagcgcgct 12840
ggatctcggc gaaccgctgt cgctgattac cgagtctgtg tttgcacgtt atatctcttc 12900
tctgaaagat cagcgtgttg ccgcatctaa agttctctct ggtccgcaag cacagccagc 12960
aggcgacaag gctgagttca tcgaaaaagt tcgtcgtgcg ctgtatctgg gcaaaatcgt 13020
ttcttacgcc cagggcttct ctcagctgcg tgctgcgtct gaagagtaca actgggatct 13080
gaactacggc gaaatcgcga agattttccg tgctggctgc atcatccgtg cgcagttcct 13140
gcaaaaaatc accgatgctt atgccgaaaa tccacagatc gctaacctgt tgctggctcc 13200
gtacttcaag caaattgccg atgactacca gcaggcgctg cgtgatgtcg ttgcttatgc 13260
agtacagaac ggtattccgg ttccgacctt ctccgcagcg gttgcctatt acgacagcta 13320
ccgtgctgct gttctgcctg cgaacctgat ccaggcacag cgtgactatt ttggtgcgca 13380
tacttataag cgtattgata aagaaggtgt gttccatacc gaatggctgg attaa 13435
<210> 17
<211> 13228
<212> DNA
<213> Artificial Sequence
<220>
<223> example O18A rfb locus nucleotide sequence - O18A-EPA production
strain BVEC-L-00559
<400> 17
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320
cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380
aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440
atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500
cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560
accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620
gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680
gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740
acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800
cgcgcgtgga aacgtacata tggtttaccg acaattgtga ctaattgctc gaacaactat 1860
ggtccttatc atttcccgga aaagcttatt ccactggtta ttcttaatgc actggaaggt 1920
aaggcattac ctatttatgg caaaggagat cagatccgcg actggttgta tgttgaagat 1980
catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040
ggtgggcaca acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgctggat 2100
gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc tgatcgtccg 2160
ggacacgatc gccgctatgc tattgatgct gagaagattg gtcgcgcatt gggatggaaa 2220
ccacaggaaa cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca 2280
aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag 2340
ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400
agcgtgctct ggcacctttg ggtaatttga ttgcttttga tgttcactct actgattatt 2460
gcggtgattt tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggccggata 2520
ttattgtcaa tgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg 2580
cacaattaat taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag 2640
cctgggttat ccattactcg actgattacg tcttccctgg aaatggcgat atgccatggc 2700
tggagacgga tgcaaccgca ccactaaatg tttacggtga aaccaagtta gccggagaaa 2760
aagcgttaca ggaatattgc gcgaagcatc ttattttccg gaccagctgg gtctatgcag 2820
gaaaaggaaa taacttcgcc aaaacgatgt tacgtctggc aaaagagcgt gaagaattag 2880
cggttattaa cgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacag 2940
cacatgccat tcgtgtcgca ctgaataaac cggatgtcgc aggcttgtac catttggtag 3000
ccagtggtac cacaacctgg tacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060
caggcattcc ccttgcactc aacaagctca acgcagtacc aacaacagcc tatcctacac 3120
cagctcgtcg tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc 3180
ttgtcttgcc tgactggcag gttggcgtga aacgaatgct caatgaatta tttacgacta 3240
cagcaattta atagtttttg catcttgttc gtgatggtgg agcaagatga attaaaagga 3300
atgatgaaat gaaaatgcgt aaaggtatta ttttagcggg tggttctggt acacgtcttt 3360
atcctgtgac tatggctgtc agtaaacagc tattacctat ttatgataaa ccgatgatct 3420
attacccgct ctctacactg atgttggcgg gtattcgcga tattttgatt atcagtacac 3480
ctcaggatac tcctcgtttt caacaattgc tgggtgacgg tagccagtgg ggcctgaatc 3540
ttcagtacaa agtgcaacct agcccagatg gcctcgcgca ggcatttatc atcggtgaag 3600
agtttattgg tggtgatgat tgtgctttgg ttcttggtga taatatcttt tacggtcacg 3660
atctgccgaa gctaatggag gccgctgtta acaaagaaag tggtgcaacg gtatttgcct 3720
atcacgttaa tgatccagaa cgctatggtg tcgttgagtt tgataaaaac ggtacggcaa 3780
tcagtctgga agaaaaaccg ttagaaccaa agagtaatta cgccgttaca ggtctgtact 3840
tttatgataa cgacgtggtt cagatggcga aaaacttgaa gccgtctgca cgtggtgagt 3900
tagaaattac agatattaac cgtatttatc ttgagcaggg acgtctgtct gtcgcgatga 3960
tggggcgtgg ctacgcgtgg ctggacacgg ggactcatca gagtctgata gaagcaagta 4020
attttattgc gacaattgaa gagcgccagg gattgaaggt ttcctgtcct gaagagattg 4080
catttcgtaa aggttttatt gatgttgagc aagtaagaaa attagctgta ccactaataa 4140
agaataatta tgggcagtat ctttataaaa tgacgaagga ttcaaattaa tgaatgtgat 4200
tagaactgaa attgaagatg tgctaattct ggagccaaga gtatttggtg atgatagagg 4260
tttcttttat gagagcttta atcaatcagc atttgaacat attctaggct atccggtcag 4320
ctttgttcaa gacaatcact cacgttcatc aaaaaatgta ctcagaggcc ttcactttca 4380
acgcggcgag tacgcacaag ataaacttgt acgctgcact catggagcag tttttgatgt 4440
tgctgttgat attcgaccca attcggtatc ctttggtaaa tgggttggtg ttctgctttc 4500
agctgataat aagcagcagt tgtggatacc aaaagggttt gctcatggct ttttggttct 4560
gtctgatatc gctgaatttc aatataaaac tacaaactat tatcatcctg aaagcgattg 4620
tggaatatgt tggaatgatg aacgcattgc aattgattgg ccccaaacat cagggttaat 4680
cctttcgcca aaagatgaaa ggctctttac gttagatgag cttatcagat taaaattaat 4740
tgcatgaggc cggccttaag gaggactagt cccggcgcgc catgagttta atcaaaaaca 4800
gtttttggaa cctttgcggg tatgtacttc cagctattgt gacactacca gctttgggta 4860
ttatggggcg aaaattaggc ccagaattat ttggtgtatt cactttggca ttagctgttg 4920
tgggttatgc aagcattttt gatgcaggcc ttactcgcgc agtgatacga gaagtcgcaa 4980
ttgaaaaaga taatgaagaa aataagttga aaattatttc ttcagcgaca gttgtaatta 5040
tttatttgag tttggccgcc tcactcttat tatttttttt tagtggtcat atcgcattgc 5100
tactgaacat tagtgagact ttttttcata atgtaagtgt ctcgcttaaa attctcgcag 5160
catccatacc attatttttg attactcaaa tatggttgtc aattttagaa ggtgaagaaa 5220
gatttggttt acttaatatc tacaaatcaa ttacgggagt gatattagca atctcaccgg 5280
cattatttat acttattaaa ccctctttga tgtatgcgat aataggctta gttctagcaa 5340
ggtttttatg ttttattttg gcttttataa tttgtcacga taaagtgctt aaagctaaac 5400
taacaatcga tataccaaca attaaaagat tgtttatgtt cggtggttgg attacagtaa 5460
gtaatatcat cagccctgtg ctatcatatt ttgataggtt tattgtttca aatcaacttg 5520
gggctgctaa tgttgctttt tatactgcac catcagaaat tatttctcgg cttagtataa 5580
ttccaggtgc gttttcaaga gccttatttc caagattagc taatgcaaat aattccgctg 5640
aaagatataa aacgaaaaga ttaattacaa tttcactttt aataatcatc acccctattt 5700
tttgtattgg cgtgttattt tcagagaaga taatggtttt atggatgggg gcatcatttt 5760
ttggtgagcc tggtttggta ttatcaatat tactgattgg ctttattttt aatggattgg 5820
cacaagtacc atttgccagt attcaatccc gaggtcatgc taagataact gcatttgttc 5880
atctcttaga gttgtttcct tatttattac ttttatttta cctcataaaa gcacatgggg 5940
ttgttggcgc gggtattgcg tggtcagtga ggatgatagt agattatata gcattaagtc 6000
ttttggacgg taagtatatt aataaataaa attcaaaatg caagttaata actcatggct 6060
ttatttgggt aggtgacaat ttataatgat atatatatta actttaactc ttcttctagt 6120
tatagccata atgttttctc ttctcggcac aaaaagtagg atcacatctc cattaccttt 6180
gcatttttta ccatggttac taactttaat tgtcgggata agtaattacg atcaatttta 6240
cgagtttaat gaaagaagct tttactcttt gttgatttgg tttacagtta tttttatatt 6300
ttatttcata ggggaactgg ttaattataa acgtgaaaat ataaatgttt attatggtct 6360
ttcacatatt aaatatgaat gtaaaaaata ttggatcatt gtcatcccaa tttcattata 6420
taccattttc gaaatatata tggttggtat ggggggagca gatggattct ttctcaattt 6480
acgtcttgca aatacattgg agggctatac gggtaaaaaa tttatcttaa tgcctgctgt 6540
atatcctcta atgatggcta tgttcgcaat tgtttgtcta acaaaaactt ccaaattaaa 6600
taaatactcc atttatttct ggatgttttt gtattgtatt ggcacaatgg gaaaattttc 6660
aatattaacg ccaatattga catatttaat tatttatgac ttcaaacata gattaaaagt 6720
aaaaaaaaca ataaagttta cattgttgat aattatatta gctttaactt tgcattttac 6780
acgtatggct gagaatgacc actcaacatt tttatctatt ttagggctct atatttattc 6840
accaataatt gctttaggcc agttgaatga agtaaatagt agtcattttg gtgagtatac 6900
gtttagattc atatatgcta taactaataa aattggcctt attaaagaat tgccagtaaa 6960
tactattctt gactattcat acgttcctgt accaacaaat gtatatactg cacttcaacc 7020
attttaccag gattttggtt atactggcat catatttgga gcagtattat acggactaat 7080
atatgtgagt ttatacacgg ccggtgttcg tggaaataat acacaggcat tactgattta 7140
cgcattgttt tcagttagca gtgcaacggc tttcttcgct gaaacgctag taacgaattt 7200
agctggaaat gtgatgttag tattatgtac catcttacta tggcgattta cagtaatatg 7260
caaaccagta cagtaaccat tctaatggcc acctacaatg gcgaggcctt catcaaaaat 7320
cagattttgt cactacaaca acaaacattt tctaactggc ggttatttat tcaggatgat 7380
gggtctacag acaatactat atctataata aaaaacttcc aaaaatctga ctccagaatt 7440
cggctagttg atgataattt gaaaggtcaa ggtgcaggaa aaaatttttt atcgctgata 7500
aagtacagcg agacagatta tacaatttat tgtgaccaag atgatatttg gttagaaaac 7560
aaaatatttg aattagtaaa gtatgcaaat gaaattaaat tgaatgtatc agatgcgcct 7620
tcgctagttt atgctgatgg ctatgcttat atggatggtg agggtacaat cgatttttct 7680
gggatatcta acaatcatgc tgatcaatta aaggattttc ttttttttaa tggtggatac 7740
caaggatgtt ctattatgtt caatcgtgca atgaccaaat ttcttctgaa ttatcgagga 7800
tttgtatatc tacatgacga tatcacaaca ttagctgcat acgctcttgg taaagtttat 7860
tttctcccga aataccttat gttatataga cagcacacga atgcggtaac tggtatcaaa 7920
acattccgca atggattgac ttctaaattt aaatcaccag taaactatct tttatcacga 7980
aaacattatc aggtaaaaaa atcttttttt gaatgtaaca gctctatctt atcagagacg 8040
aataaaaaag tttttttgga ttttatttca ttttgtgaat caaataataa atttacagat 8100
ttttttaagt tatggcgagg tgggtttaga ttaaataaca gtagaactaa attattatta 8160
aaattcttaa tacggagaaa atttagcgaa tgatttcaat acttacacct acttttaatc 8220
ggcaacatac tttatcaagg ctattcaatt ctcttatatt acaaactgat aaagattttg 8280
agtggataat aattgatgat ggtagtatag atgcaacagc ggtacttgta gaagatttta 8340
gaaaaaaatg tgattttgac ttgatttatt gctatcagga aaataatggt aagcccatgg 8400
ctttaaacgc tggtgttaaa gcttgtagag gcgattatat ctttattgtt gacagtgatg 8460
atgcactaac tcccgatgcc ataaaattaa ttaaagaatc aatacatgat tgcttatctg 8520
agaaggaaag tttcagcgga gtcggtttta gaaaagcata tataaaaggg gggattattg 8580
gtaatgattt aaataattct tcagaacata tatactattt aaatgcgact gagattagca 8640
atttaataaa tggtgatgtt gcatattgtt ttaaaaaaga aagtttggta aaaaatccat 8700
tcccccgtat agaagatgaa aaatttgttc cagaattata tatttggaat aaaataactg 8760
acaaggcgaa gattcgattt aacataagca aagttatata tctttgtgag tatcttgatg 8820
atggtctttc taaaaatttc cataaccagc ttaaaaaata cccaaagggg tttaagattt 8880
attacaaaga tcaaagaaaa cgagagaaaa cttatataaa aaaaacaaag atgctaatta 8940
gatatttgca atgttgttat tatgagaaaa taaaatgaaa atactatttg tcattacagg 9000
tttaggcctt ggaggtgctg agaagcaggt ttgtctttta gctgataaat taagtttaag 9060
cgggcaccat gtaaagatta tttcacttgg acatatgtct aataataaag tctttcctag 9120
cgaaaataat gttaatgtca ttaatgtaaa tatgtcaaaa aacatttctg gagttataaa 9180
aggttgtgtc agaattagag atgttatagc taatttcaaa ccagacattg tacacagtca 9240
tatgtttcat gcaaacatta tcactagatt gtctgtaatt ggaatcaaaa acagacctgg 9300
tattatatca actgcacata ataaaaatga aggtgggtat ttcagaatgc tcacatatag 9360
aataaccgat tgtttaagtg attgttgtac aaatgttagc aaagaagcag tggatgagtt 9420
tttacggata aaagccttta atcccgctaa agcaattact atgtataatg ggatagatac 9480
caataaattt aaatttgatt tattggcaag gagggaaatt cgagacggta ttaatataaa 9540
aaatgatgat atattattac ttgctgcagg tcgtttaacg ttagctaaag attatcctaa 9600
tttattgaat gcaatgactc tgcttcctga acactttaaa cttattatta ttggtgatgg 9660
tgaattgcgt gacgaaatta atatgcttat aaaaaaattg caattatcta atagggtgtc 9720
cttgttggga gttaaaaaaa atattgctcc ctatttttct gcatgtgata tttttgttct 9780
ctcttctcgt tgggaaggat ttggattagt cgtggcagaa gctatgtcat gtgagcgaat 9840
tgttgttggc acggattcag ggggagtaag agaagttatt ggtgacgatg attttcttgt 9900
acccatatct gattcaacac aacttgcaag caaaattgaa aaattgtctt tgagccagat 9960
acgtgatcac attggttttc ggaatcgtga gcgtatttta aaaaatttct caatagatac 10020
tattattatg cagtggcaag aactctatgg aactataatt tgctcaaaac atgaaaggta 10080
gatttatatt tggaacgtgt cttttgtttg aatttaattc aatctcaatt gagatttttg 10140
tatttcaaaa ataccatcat agctaacgat gattggtatt tattttaaga tgctttctat 10200
aaatatattg acgtttttaa tgcgccgaaa cgattgggct gggaacagag aagtaaaact 10260
gttttgagaa tgaagagttt ttgagatgtt tatggatatt aaaaattgat ccagtgaatt 10320
aattatttat aataaatcaa gatttaatgt taataaatga taatcttttc tgacactcat 10380
attaattatg agtggtacgt ttggtaaacg gtaaactatt atatgacagc tagaacaact 10440
aaagttttgc acttacaatt actcccactc ttaagtggcg ttcaaagggt aacattaaac 10500
gaaattagtg cgttatatac tgattatgat tatacactag tttgctcaaa aaaaggtcca 10560
ctaacaaaag cattgctgga atatgatgtc gattgtcatt gtatccccga acttacgaga 10620
gaaattaccg taaagaatga ttttaaagca ttgttcaagc tttataagtt cataaaaaaa 10680
gaaaaatttg acattgtgca tacacattct tcaaaaacag gtattttggg gcgagttgct 10740
gccaaattag cacgtgttgg aaaggtgatc cacactgtac atggtttttc ttttccagcc 10800
gcatctagta aaaaaagtta ttacctttat tttttcatgg aatggatagc aaagttcttt 10860
acggataagt taatcgtctt gaatgtagat gatgaatata tagcaataaa caaattaaaa 10920
ttcaagcggg ataaagtttt tttaattcct aatggagtag acactgataa gttttctcct 10980
ttagaaaata aaatttatag tagcaccttg aatctagtaa tggttggtag attatccaag 11040
caaaaagatc ctgagacatt attgcttgct gttgaaaaac tgctgaatga aaatgttaat 11100
gttaagctga cacttgtagg agatggtgaa ctaaaagaac agttagaaag caggttcaaa 11160
cggcaagatg gacgtataat ttttcatgga tggtcagata acattgttaa tattttaaaa 11220
gttaatgatc tttttatatt accttctctt tgggagggta tgccattagc aattttagaa 11280
gcattgagct gtggacttcc atgtatagtc actaatattc caggtaataa tagcttaata 11340
gaagatggct ataatggttg tttgtttgaa attagagatt gtcagttatt atctcaaaaa 11400
atcatgtcat atgttggtaa gccagaactg attgcacagc aatctaccaa tgcacgatca 11460
tttattctga aaaattatgg attagttaaa agaaataata aggtcagaca gctatatgat 11520
aattaagagc tcggtacccg ggcctagggt gtaggctgga gctgcttcga agttcctata 11580
ctttctagag aataggaact tcggaatagg aactaaggag gatattcata tccgtcgacg 11640
gcggccgccc tgcaggcatg caagcttgat ccatatggat cgctagctta attaaataaa 11700
gccgtaagca tataagcatg gataagctat ttatacttta ataagtactt tgtatactta 11760
tttgcgaaca ttccaggccg cgagcattca gcgcggtgat cacacctgac aggagtatgt 11820
aatgtccaag caacagatcg gcgtagtcgg tatggcagtg atgggacgca accttgcgct 11880
caacatcgaa agccgtggtt ataccgtctc tattttcaac cgttcccgtg agaagacgga 11940
agaagtgatt gccgaaaatc caggcaagaa actggttcct tactatacgg tgaaagagtt 12000
tgtcgaatct ctggaaacgc ctcgtcgcat cctgttaatg gtgaaagcag gtgcaggcac 12060
ggatgctgct attgattccc tcaaaccata tctcgataaa ggagacatca tcattgatgg 12120
tggtaacacc ttcttccagg acactattcg tcgtaatcgt gagctttcag cagagggctt 12180
taacttcatc ggtaccggtg tttctggcgg tgaagagggg gcgctgaaag gtccttctat 12240
tatgcctggt ggccagaaag aagcctatga attggtagca ccgatcctga ccaaaatcgc 12300
cgccgtagct gaagacggtg aaccatgcgt tacctatatt ggtgccgatg gcgcaggtca 12360
ctatgtgaag atggttcaca acggtattga atacggcgat atgcagctga ttgctgaagc 12420
ctattctctg cttaaaggtg gcctgaacct caccaacgaa gaactggcgc agacctttac 12480
cgagtggaat aacggtgaac tgagcagtta cctgatcgac atcaccaaag atatcttcac 12540
caaaaaagat gaagacggta actacctggt tgatgtgatc ctggatgaag cggctaacaa 12600
aggtacgggt aaatggacca gccagagcgc gctggatctc ggcgaaccgc tgtcgctgat 12660
taccgagtct gtgtttgcac gttatatctc ttctctgaaa gatcagcgtg ttgccgcatc 12720
taaagttctc tctggtccgc aagcacagcc agcaggcgac aaggctgagt tcatcgaaaa 12780
agttcgtcgt gcgctgtatc tgggcaaaat cgtttcttac gcccagggct tctctcagct 12840
gcgtgctgcg tctgaagagt acaactggga tctgaactac ggcgaaatcg cgaagatttt 12900
ccgtgctggc tgcatcatcc gtgcgcagtt cctgcaaaaa atcaccgatg cttatgccga 12960
aaatccacag atcgctaacc tgttgctggc tccgtacttc aagcaaattg ccgatgacta 13020
ccagcaggcg ctgcgtgatg tcgttgctta tgcagtacag aacggtattc cggttccgac 13080
cttctccgca gcggttgcct attacgacag ctaccgtgct gctgttctgc ctgcgaacct 13140
gatccaggca cagcgtgact attttggtgc gcatacttat aagcgtattg ataaagaagg 13200
tgtgttccat accgaatggc tggattaa 13228
<210> 18
<211> 13554
<212> DNA
<213> Artificial Sequence
<220>
<223> example O25B rfb locus nucleotide sequence - O25B-EPA production
strain stGVXN4459
<400> 18
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcagtgaaga tacttgttac tggtggcgca ggatttattg gttctgctgt 1320
tgttcgtcac ataataaata atacgcaaga tagtgttgtt aatgtcgata aattaacata 1380
cgccggaaac ctggaatcac ttgcagatgt ttctgattct gaacgctatt tctttgaaca 1440
tgcggatatt tgtgatgcag ctgcaatggc acggattttt gctcagcatc agccggatgc 1500
agtgatgcac ctggcagctg aaagccatgt tgaccgttca attacaggcc ctgcggcatt 1560
tattgaaacc aatattgtgg gtacttatgt ccttttagaa gcggctcgga attattggtc 1620
tggtctggat gatgaaaaga aaaaaaactt ccgttttcat catatttcta ctgatgaggt 1680
gtatggtgac ttaccccatc cggatgaagt aaatagcaat gaaacgttgc cgctatttac 1740
ggaaacgaca gcatacgcgc caagtagtcc atattctgct tctaaagctt ccagcgatca 1800
tttggttcgc gcatggaaac gtacttatgg tttaccgacc attgtgacta attgctcgaa 1860
caactatggt ccttatcatt tcccggaaaa gcttattcca ctggttattc ttaattcact 1920
ggaaggtaag gcattaccta tttatggcaa aggagatcag atccgcgact ggttgtatgt 1980
agaggatcat gctcgagcgt tatataccgt cgtaaccgaa ggtaaagcgg gcgaaactta 2040
taacattggt ggacacaacg aaaagaaaaa catcgacgta gtgttcacta tttgtgattt 2100
gttggatgag atagtcccga aagagaaatc ttaccgcgag caaattactt atgttaccga 2160
tcgtccggga cacgatcgcc gttatgcgat tgatgctgag aagattggtc gcgaattggg 2220
atggaaacca caggaaacgt ttgagagtgg gattcgtaaa acggtggaat ggtacctgtc 2280
caatacaaaa tgggttgata atgtgaaaag tggtgcctat caatcgtgga ttgaacagaa 2340
ctatgagggc cgccagtaat gaatatcctc ctttttggca aaacagggca ggtaggttgg 2400
gaactacagc gtgctctggc acctctgggt aatttgattg ctcttgatgt tcactccact 2460
gattactgtg gtgattttag taatcctgaa ggtgtagctg aaaccgtaag aagcattcgg 2520
cctgatatta ttgtcaacgc agccgctcac accgcagtag acaaagcaga atcagaaccg 2580
aagtttgcac aattactgaa cgcgacgagt gtcgaagcga tcgcgaaagc agccaatgaa 2640
gtcggcgcct gggttattca ctactctact gactacgtat ttccggggac cggtgaaata 2700
ccatggcagg aggaggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagcg 2760
ggagaaaaag cattacaaga gcattgtgcg aagcacctta ttttccggac cagctgggtc 2820
tatgcaggta aaggaaataa cttcgccaaa acaatgttgc gtctggcaaa agagcgtgaa 2880
gaattagccg ttattaatga tcagtttggt gcgccaactg gcgcagagtt actggctgat 2940
tgtacggcac atgctattcg tgtggcactg aataaaccgg aagtcgcagg cttgtaccat 3000
ctggtagcta gtggtaccac aacgtggcac gattatgctg cgctggtttt tgaagaggcg 3060
cgcaaagcag gcattcccct tgcactcaac aagctcaacg cagtaccaac aacagcctat 3120
cctacaccag ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac 3180
tttgcgcttg tcttgcctga ctggcaggtt ggcgtgaaac gaatgcttaa cgaattattt 3240
acgactacag caatttaata gtttttgcat cttgttcgta atggtggagc aagatgtatt 3300
aaaaggaatg atgaaatgaa aacgcgtaaa ggtattattt tggcgggtgg ttctggtact 3360
cgtctttatc ctgtgacgat ggccgtcagt aaacagctgt taccgattta tgataaaccg 3420
atgatctatt acccgctctc tacactgatg ttagcgggta ttcgcgatat tctgattatc 3480
agtacaccac aggatactcc tcgttttcaa caactgctgg gtgacgggag ccagtggggc 3540
ctgaatcttc agtacaaagt gcaaccgagt ccggatggtc ttgcgcaggc gtttattatc 3600
ggtgaagagt ttattggtgg tgatgattgt gctttggtac ttggtgataa tatcttctac 3660
ggccacgacc tgccgaagtt aatggacgta gctgttaaca aagaaagtgg tgcaacggta 3720
tttgcctatc acgttaatga tcctgaacgt tatggtgtcg tggagtttga taataacggt 3780
actgcaatta gcctggaaga aaaaccgctg gaaccaaaaa gtaactatgc ggttactggg 3840
ctttatttct atgacaatga cgttgtggaa atggcgaaaa accttaagcc ttctgcccga 3900
ggtgaactgg aaattaccga tattaaccgt atttatatgg aacaaggacg tttgtctgtc 3960
gctatgatgg ggcgtggcta tgcatggctg gatacaggga cgcatcaaag tcttattgaa 4020
gcaagcaact tcattgccac cattgaagag cgccagggac taaaggtttc ctgtccggaa 4080
gaaattgctt atcgtaaagg gtttattgat gctgagcagg taaaagtatt agccgaaccg 4140
ttgaagaaaa atgcttatgg tcagtatctg ctcaaaatga ttaaaggtta ttaataagat 4200
gaacgtaatt aaaactgaaa ttcctgatgt gctgattttt gaaccaaaag tttttgggga 4260
tgaacgtggc ttcttttttg agagttttaa tcagaggatt tttgaagaag cagtaggtcg 4320
taaggttgag tttgttcagg ataaccattc taagtccagt aaaggtgttt tacgtggtct 4380
tcattatcag ttagaacctt atgctcaagg aaaactggtg cgctgtgttg ttggcgaggt 4440
ttttgatgtt gcggttgata ttcgtaaatc gtcacctaca tttgggaaat gggttggggt 4500
gaatttgtct gctgagaata agcgtcagtt gtggattcct gagggatttg cacatggttt 4560
tttggtgctg agtgatttag cagaagtttt atataaaacg aatcaatatt atgctccatc 4620
acatgaaaaa aatattatat ggaatgacct cttgcttaat attaaatggc cgagcacagc 4680
actgatcact ctgtctgata aggatgcaaa tggggaaaga tttgaactaa gtgagttttg 4740
aaatgtctct cttaaaacat agtatatgga atgttgcggg ctactttata ccaacattaa 4800
ttgcaattcc cgcctttgga ttaattgcga ggaaaattgg tgtagaacta tttggtttgt 4860
atacgttagc aatgattttt atagggtatg caagtatatt tgatgctggg ttaacaagag 4920
ctgttgtgcg tgaaatagca ttactaaaaa acagagtgga cgattgtaat acgataatag 4980
taacttctat tatcgctgtg atatttttag ggtttatcgg aggcggggga gtgtttctgc 5040
ttaaaggcga tattattgaa ctgttaaata tctcaccaat atattacgcc gattcgataa 5100
agtctctagt attattatca tctctgatac ctgtattctt agtcacgcaa atactattag 5160
cagagcttga gggtcgggaa tattttggga ttctaaatat acaaaaaagt gtagggaatt 5220
ctttaattgc agggttacct gcattatttg ttttaattaa tcaaacgctt ttttctgcaa 5280
ttattggtgt agcgattgca agagttatat gcttgtggtt aagctacatt atgagcaggg 5340
aaagaataac tatcgatatc tcattttttt caataactgt tttaaagcgg ttatttagat 5400
atggcgggtg ggtaactata agtaacataa tatctcctat attagcgagt atggatagat 5460
ttattctatc ccatatccag ggagcatcaa aaatatcatt ctatacagtc cctaatgagc 5520
tggtaactag gcttggaata gttccaggct ctcttgggaa agctgttttt ccaaaattaa 5580
gtcatgcaag gaattttaca gcgtcatatg cagagcaaaa aaaagcttat atattaatga 5640
ctgtcattgt aatgcctttg gttttatttg tatattatta cgcaaagttt attttaacat 5700
tgtggatggg ggctgagtat gcagggattt cggtcgaaat attacggatt atgcttatag 5760
ggtatatttt taactgttat tcacaaatct cttttgccaa catacaggcc tttggaaaag 5820
caaaatacac tgcatacatc catatgatgg aatttattcc ttatttgata atgttatata 5880
taatttcaaa ggaatatggg gttattggtg ttgcgtggtt atggacaatt cgagtaataa 5940
ttgatttttt gatgctttta tatatgagtt atcgttgtaa taatcttatg aaaaaagggt 6000
agcctgatga tatatattgt ggtattaaat tggaatgggg ctatagatac cattaattgt 6060
gttaaaagtt taatggattt aaatgttagc gattataaaa ttatcattgt tgataactgt 6120
tctatggata actcatatga tactataaaa gaaaatctta attcattata tattgctgat 6180
aaaagtatca ttgaggtgaa gtatgaggat agaaataaat ataaaacctt agaaaacgat 6240
aaaatcatat taatacaatc tccgcaaaat aatgggtacg caagtggtaa taatattggc 6300
atagagttcg ctcttaatca ggagaatatg aaatacgtct gggttctgaa taatgatact 6360
gaagtggata aagaggcttt aactcattta attagtaaat gtgattcaga taaaagtata 6420
gggatttgcg gttctcgttt agtctatttt gccgacagag agatgcagca aggactaggt 6480
ggggtgcata acaaatggtt atgcactaca aaaaattatg aaatgggaag attagtttcc 6540
aaaaaatatg atgatgaagt cattagtaat gatatagatt atataattgg cgcatcgatg 6600
tttttctcta gagaatgttt ggaaacagtt ggattgatga atgaagaata ttttttatac 6660
tatgaagagt tagatatttg cctcagagca aaagcaaaga actttaaatt aggtatttgc 6720
tcagaaagtt tggtttatca taaaataggt gcaagtactg atgggggaaa gagcatgatg 6780
gctgatcttt gctcaataaa aaataggctg gtcattacag aaaggtttta tccccaatat 6840
tattggacgg tatggttgtc actttttgtt gtagcattta accgtgctag aagaggtgag 6900
tttaataaga tgaaaagatg tttgaatgtt atgtttaact tcaaacgaaa caaaggtagc 6960
aaatgccatt agaatatgca cttaatcatg gtgttaataa atctatagtt tgatatgtta 7020
ttaaagggta tttaatgaaa gtggcttttt tatctgctta tgatccacta tctacatcca 7080
gttggtctgg cacaccttat tatatgctaa aggcattatc gaagagaaat atttccattg 7140
aaatattagg accggtaaat agctatatga tatacatgtt aaaagtatat aaattaatat 7200
taaggtgttt cggaaaagaa tatgattata gtcattcgaa gttgctttcc aggtattacg 7260
gtagaatatt cggtaggaaa ttaaaaaaaa ttgatggttt ggattttatt atcgcacctg 7320
caggttcctc acaaattgct tttttaaaaa caaccatacc aataatatat ctatcggata 7380
caacatatga tcaattaaaa agctattatc cgaatttaaa taaaaaaaca attataaatg 7440
atgaggatgc aagtttaatc gaacgcaagg ctattgaaaa agcaacagta gtatctttcc 7500
catctaaatg ggcaatggat ttttgcagga attattacag attagatttt gataaattag 7560
ttgaaatacc atggggggct aatttatttg atgatattca ctttgctaat aaaaatataa 7620
ttcaaaagaa tagttatact tgtcttttct tgggagttga ttgggaaaga aaaggtggga 7680
aaacagcctt gaaagcaatt gaatatgtaa ggcagttata tgggatcgat gttagactaa 7740
aaatttgtgg atgtactccg aatcaaaaga ttttacctac ttgggttgaa ttaattgata 7800
aagtagataa aaataacgtt gacgaatatc agaaattcat cgatgtgtta tctaacgctg 7860
atatacttct tttaccaacc attgctgaat gttatggaat ggtattttgt gaagctgctg 7920
cttttggatt gcctgttgtc gctacagata caggtggagt cagttctata gttatcaacg 7980
aaaggacggg gatattaatt aaagacccgt tagactataa gcactttgga aatgcaattc 8040
ataaaataat tagttccgta gagacttatc aaaactactc ccaaaacgca agaattagat 8100
ataataatat attgcattgg gacaattggg ctaaaaagat aattgagatt atgtatgagc 8160
ataagaatag aagaatcaaa tagcacaaaa agaattatat gtttatttat actttttctt 8220
gttttccctg attttttgtt ttatacatta ggggttgata attttagcat ttcaacgata 8280
atctcaatta cattgctttt tgttttttta agagctaaaa atatttgcaa agataatttt 8340
ctaataatag tagcgttatt catattgttg tgttttaact gtttgttaag tatgctattt 8400
aatattgaac aggctttaac atttaaagtt gtactttcaa tatatagcat cttaataatg 8460
gcatacgtct cctcttgtta tgcacagacg ttgtggttat gttctgaaga aatacttaag 8520
agatccgtct tttatttgtt cgcatttctt tgccttattg gcattataag tattctttta 8580
cagaagactg agattataca tgataaaagt atgattcttt ttcctgaacc atcagcattt 8640
gcattggttt ttatacctat cttttcattt tgtttatact atacaagagg gggggggcta 8700
ctattgctct atatattatc tttgggtatt gcgttaggta tccagaattt aacaatgttg 8760
gtaggcattg tgattagtgt ttttgtgatg aaaaaaataa ctataaggca aactattgtt 8820
atacttttgg gggcatggat tttttccatg atattaagtg atttagacat ttcttactat 8880
acatcgcggc ttgattttaa aaatactacg aacctatcag tgcttgtata tctttcagga 8940
attgaaagag ctttcttgaa ttttattaca agttatggtc ttggtattgg ttttcaacaa 9000
atgggagtga atggggagat aggaatatat caacaaattt tagctgaact tgatgcccct 9060
atgttaaata tatacgatgg ctcatttatt tcttctaagt taatatctga gtttggggtt 9120
attggtgcat taatgtgtat tttctatttt ttttattttt cccgatttta tctgcgtttc 9180
aaaaaaagta agagatattc accgcagtat attttagcat atagcttcta catgtgtttc 9240
ttcatccctc tttttatacg tggtgctggt tatataaacc cctatgtgtt tatgttattt 9300
tcatcaatat ttttgtgcaa atatcacgct aaaaatatct tgatgaaatc taatgtccag 9360
atagctatat aatagtagat tatattatca ttatcacgta aattacatat taatagcata 9420
tatgataact aggacataaa taatgtgcat taaaaaaaaa cttaagttaa ttaaacgata 9480
tggcctttat ggtggtctta ggcttcttaa agatatattc ttaacaaaat ttttattttg 9540
ttcaaatgtt aggattatta gatttccatg ttatattaga aaagatggaa gtgttagttt 9600
tggaaaaggt tttacatcag gtgtaggatt acgagttgat gcatttatgg atgccgtagt 9660
ttccattgga gaaaatgttc aaattaatga ctatgttcac atcgcggcta ttaataatgt 9720
cattattggt agagatacat taatagcaag taaagtattt attagtgatc ataatcatgg 9780
tattttttct aaatccgata tccatagttc accaactatt attccttcgt ctaggcccct 9840
tgaatctgca cctgtgtata ttggagagcg tgtgtggatt ggcgaaaatg tgacaatatt 9900
accaggtgcg tgtataggta atggtgtagt tattggcgca aacagtgttg ttcgtggtga 9960
gattcctaat aatgtgatca ttgctggtgt tccagctaaa attgttaaaa aatataacta 10020
tgagcgtatg caatgggaaa gaatatagtt gtaatatcgg ctgttaattt tacaaccgga 10080
ggccccttta ccgtactaaa aaatgtgctt acagcaacta aagatagagc cgaatgtaaa 10140
tttattgcac tggttcatag ctctgctgaa ctaatggaat tatttccgtg ggttgaattt 10200
atagagtatc cagaagtcaa gtcttcgtgg gttaaaagat tatatttcga atatataact 10260
tgcaatagat tatctaaggt gattaaggca actcattggg tatgcttaca tgatattaca 10320
gcaaatgtta gtgtacccta tagatttgtt tattgccaca atcctgcacc gttctataaa 10380
tatttaagct atcgagatat tataggagaa cctaaatttt atctttttta tcttttttat 10440
gggcttttat acaatatcaa tataaaaaag aacacagcag tttttgttca gcagcagtgg 10500
ctaaaaaaag aattcgaaaa aaaatataag ttaaagaatg ttgttgttag tcgccctgaa 10560
gatatttgcc cttttgaaag tgatggtttg gtaagaaata ataataaaaa ggatgtgagg 10620
atattttacc cagcagtgcc ccgtatattt aaaaactttg aagttatcat acgtgctgca 10680
caaatattac aagataaaaa tattcatttt tatcttactt ttgatggtac tgaaaataag 10740
tatgcaaaaa gaatatataa attagcttcc gaactgaaaa atgtacattt cctcggttac 10800
cttaatgcaa ccgagatggt taacttttat caagattcag atattatttg tttcccatcg 10860
aaactagaaa cgtggggatt accattatca gaagctaaaa catacaaaaa atggatattt 10920
gcggcagact taccttatgc tcatgaagtt ttatataact attcaaaaac tagatatttt 10980
ccatttgacg atgagaaaat acttgttcgc tacatattag agtacacaag taaaaatatg 11040
catgaagata taaaaaatag tagggtgaat tttaataatg atgcattgac tggttttgaa 11100
cagtttattg aatatatcct caaggggaac tgacgtggtt tatattataa tcgtttcaca 11160
tggccatgat gactatatag aaaatctttt attaaattta aagttgccct ctggaagatt 11220
taaaataata gttcgtgata acaaaagttc aatggtttta aaaaaaacat gcgaaaaaaa 11280
ttgcgtaacc tatttgcatg gagggcaata tggatttgga cataataata acatagcagt 11340
gtcatatata attaataact tcatgattat gaataatgat tattttctct ttcttaaccc 11400
cgatgtattc ataaccagtg aaagtttgat taattatgtt gattatataa ttagtaatga 11460
ttataagttt agcacattat gtctttatcg agattttact aaaagcaaac atgattattc 11520
aatacggagt tttccaactt tatatgattt tctttgttct tttttattgg gggtgaataa 11580
aagtaaaatt aagaaggaaa atatactttc tgatactgta gttgattggt gtgctggctc 11640
atttatgctt attcatgctt taagtttctt aaatgtgaat ggttttgatc aaaaatattt 11700
tatgtattgt gaagatattg acctttgtat gcgtttaaaa ttaagtggag tagatcttta 11760
ctatactccc cattttgatg ctattcatta tgcgcagcat gaaaatagaa gaatatttac 11820
taaagcattt cgatggcata taaggagtat tacgcgctac atattacgga aaccaattct 11880
ttcttataaa aactatagaa aaattacatc cgaactggta aagtgattaa ggatccgtgt 11940
aggctggagc tgcttcgaag ttcctatact ttctagagaa taggaacttc ggaataggaa 12000
ctaaggagga tattcatatg gataaagccg taagcatata agcatggata agctatttat 12060
actttaataa gtactttgta tacttatttg cgaacattcc aggccgcgag cattcagcgc 12120
ggtgatcaca cctgacagga gtatgtaatg tccaagcaac agatcggcgt agtcggtatg 12180
gcagtgatgg gacgcaacct tgcgctcaac atcgaaagcc gtggttatac cgtctctatt 12240
ttcaaccgtt cccgtgagaa gacggaagaa gtgattgccg aaaatccagg caagaaactg 12300
gttccttact atacggtgaa agagtttgtc gaatctctgg aaacgcctcg tcgcatcctg 12360
ttaatggtga aagcaggtgc aggcacggat gctgctattg attccctcaa accatatctc 12420
gataaaggag acatcatcat tgatggtggt aacaccttct tccaggacac tattcgtcgt 12480
aatcgtgagc tttcagcaga gggctttaac ttcatcggta ccggtgtttc tggcggtgaa 12540
gagggggcgc tgaaaggtcc ttctattatg cctggtggcc agaaagaagc ctatgaattg 12600
gtagcaccga tcctgaccaa aatcgccgcc gtagctgaag acggtgaacc atgcgttacc 12660
tatattggtg ccgatggcgc aggtcactat gtgaagatgg ttcacaacgg tattgaatac 12720
ggcgatatgc agctgattgc tgaagcctat tctctgctta aaggtggcct gaacctcacc 12780
aacgaagaac tggcgcagac ctttaccgag tggaataacg gtgaactgag cagttacctg 12840
atcgacatca ccaaagatat cttcaccaaa aaagatgaag acggtaacta cctggttgat 12900
gtgatcctgg atgaagcggc taacaaaggt accggtaaat ggaccagcca gagcgcgctg 12960
gatctcggcg aaccgctgtc gctgattacc gagtctgtgt ttgcacgtta tatctcttct 13020
ctgaaagatc agcgtgttgc cgcatctaaa gttctctctg gtccgcaagc acagccagca 13080
ggcgacaagg ctgagttcat cgaaaaagtt cgtcgtgcgc tgtatctggg caaaatcgtt 13140
tcttacgccc agggcttctc tcagctgcgt gctgcgtctg aagagtacaa ctgggatctg 13200
aactacggcg aaatcgcgaa gattttccgt gctggctgca tcatccgtgc gcagttcctg 13260
cagaaaatca ccgatgctta tgccgaaaat ccacagatcg ctaacctgtt gctggctccg 13320
tacttcaagc aaattgccga tgactaccag caggcgctgc gtgatgtcgt tgcttatgca 13380
gtacagaacg gtattccggt tccgaccttc tccgcagcgg ttgcctatta cgacagctac 13440
cgtgctgctg ttctgcctgc gaacctgatc caggcacagc gtgactattt tggtgcgcat 13500
acttataagc gtattgataa agaaggtgtg ttccataccg aatggctgga ttaa 13554
<210> 19
<211> 15197
<212> DNA
<213> Artificial Sequence
<220>
<223> example O75 rfb locus nucleotide sequence - O75-EPA production
strain stLMTB11737
<400> 19
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcagtgaaga tacttgttac tggtggcgca ggatttattg gttctgctgt 1320
tgttcgtcac ataataaata atacgcaaga tagtgttgtt aatgtcgata aattaacata 1380
cgccggaaac ctggaatcgc tcgctgaaat ttctgattct gaacgttatt catttgagca 1440
tgcagatatc tgcgatgccg aagcgatggc tcgtattttc gcacagcacc agccagacgc 1500
ggtgatgcac ctggcagcag agagccacgt tgaccgctca ataactggcc ctgcggcatt 1560
tattgaaacc aatattgtgg gtacttatgt tcttttagaa gcggcgcgca attattggtc 1620
tggtctggat gatgaaaaga aaaaaaactt ccgctttcat catatttcta ctgatgaggt 1680
gtatggtgac ttaccccatc cggatgaagt aaatagcaat gaaacgttgc cgctatttac 1740
ggaaatgaca gcatacgcgc caagtagtcc atattctgct tctaaagctt ccagcgatca 1800
tttggttcgc gcatggaaac gtacttatgg tttaccgacc attgtgacta attgctcgaa 1860
caactatggt ccttatcatt tcccggaaaa gcttattcca ctggttattc ttaatgcact 1920
ggaaggtaag gcattaccta tttatggcaa aggagatcag atccgcgact ggttgtatgt 1980
agaggatcat gctcgagcgt tatataccgt cgtaaccgaa ggtaaagcgg gcgaaactta 2040
taacattggt ggacacaacg aaaagaaaaa catcgacgta gtgttcacta tttgtgattt 2100
gttggatgag atagtcccga aagagaaatc ttatcgtgag caaattacct atgttgctga 2160
tcgcccaggg catgatcgcc gttatgcaat tgatgccgat aaaattagcc gcgaattggg 2220
ctggaaacca caggaaacgt ttgagagcgg gattcgtaaa actgtggaat ggtatctgtc 2280
caatacaaaa tgggttgata atgtgaaaag tggtgcctat caatcgtgga ttgaacagaa 2340
ctatgggggc cgccactaat gaatatcctc ctttttggca aaacagggca ggttggttgg 2400
gaactacagc gtgctctggc acctctgggt aatttgattg ctcttgatgt tcactccact 2460
gattactgtg gtgattttag taaccctgaa ggtgtggctg aaaccgttag aagcattcgg 2520
cctgatatta ttgtcaacgc agccgctcac accgcagtag acaaagcaga atcagaaccg 2580
gagtttgcac aattactgaa cgcgacgagt gtcgaagcga tcgcgaaagc agccaatgaa 2640
gtcggcgctt gggttattca ctactctact gactacgtat ttccggggac cggtgaaata 2700
ccatggcagg aggaggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagca 2760
ggagaaaaag cattacaaga gcattgtgcg aagcacctta ttttccggac cagctgggtc 2820
tatgcaggta aaggaaataa cttcgccaaa acgatgttgc gtctggcaaa agagcgtgaa 2880
gaattagccg ttattaatga tcagtttggt gcgccaactg gcgcagagtt gctggctgat 2940
tgtacggcac atgccattcg tgtggcactg aataaaccgg aagtcgcagg tttgtaccat 3000
ctggtagcca gtggtaccac aacctggcac gattatgctg cgctggtttt tgaagaggcg 3060
cgcaaagcag gcattcccct tgcactcaac aagctcaacg cagtaccaac aacagtctat 3120
cctacaccag ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac 3180
tttgcgcttg tcttgcctga ctggcaggtt ggtgtgaaac gcatgctcaa cgaattattt 3240
acgactacag caatttaata gtttttgcat cttgttcgtg atggtggaac aagatgaatt 3300
aaaaggaatg atggaatgaa tacgcgtaaa ggtattattt tagcgggtgg ttctggtaca 3360
cgtctttatc ctgtgactat ggctgtcagt aaacagctgt taccgattta tgataaaccg 3420
atgatctatt acccgctctc tacactgatg ttggcgggta ttcgcgatat tttgattatc 3480
agcacgccac aggatactcc tcgttttcaa caactgctgg gtgatgggag ccagtggggg 3540
ctaaatcttc actacaaagt gcaaccgagt ccggatggtc ttgcgcaggc atttatcatc 3600
ggtgaagagt ttatcggtgg tgatgattgt gctttggtac ttggtgataa tatcttctac 3660
ggtcacgacc tgcctaagtt aatggatgcc gctgttaaca aagaaagtgg tgcaacggta 3720
tttgcctatc acgttaatga tcctgaacgc tatggtgtcg ttgagtttga taaaaacggt 3780
actgcaatca gcctggaaga aaaaccgtta caaccaaaaa gtaattatgc ggtaaccggg 3840
ctttatttct atgataacta cgttgtggaa atggcgaaaa atcttaagcc ttctgcccgc 3900
ggtgaactgg aaattaccga tattaaccgt atctatatgg aacaggggca tttatctgtt 3960
gccatgatgg gacgtggata tgcctggctg gacacgggga cacatcaaag tcttattgaa 4020
gcaagcaact tcattgccac cattgaagag cgccagggct tgaaagtttc ctgcccggaa 4080
gaaattgctt accgtaaagg gtttattgat gctgagcagg tgaaagtatt agctaaaccg 4140
ctgaaaaaaa atgcttatgg tcagtatctg ctaaaaatga ttaaaggtta ttaataaaat 4200
gaatgttatt aaaacagaaa ttccagatgt actgattttt gaaccgaaag tttttggtga 4260
tgagcgtggt ttctttatgg aaagctttaa tcagaaagtt ttcgaagagg ctgtagggcg 4320
gaaggttgaa tttgttcagg ataatcattc taaatcgtgt aaaggtgtac ttagaggttt 4380
acactttcag cttcctccct ttgagcaggc aaaattagta aggtgtatag ttggcgaggt 4440
atttgatgtt gcagtagaca ttagacctaa ttctgaaaca tttggttcat gggttggagt 4500
aactctttcg tcagaaaata aaaggcagct atggattcca gaaggattcg cccatggttt 4560
tttaacttta agtgatattg cagagtttgt ttataaaact aacaactatt attctttaaa 4620
tcatgaaagg ggagtcattt ggaacgatga ggaaattaac attgcctggc cctctcaatc 4680
agagaagatt ctgtcacaga aagatattaa tttaccatca tttagatttg ttcaaatgtt 4740
tagcaagtag tgttatcttt acactgcaca tagtcatcat tttttatgct ttaagtaaat 4800
tatattgcac atctataaca caaagcgcaa taatatttcg acctgatgaa ggtttgtggt 4860
tatttatctt tctaggcgtt ttttatgact aaaatagttg tggtttctac agctccaata 4920
ttcccgacaa ataatgggta caaaagttct gtattaggaa gaattgatga gttattaaat 4980
gaggataatg aggtcgtttt gattgaaata aaccttgaaa atgttacgga aaagaaagat 5040
gaattaatac caacaagatt taataatatt caaagatatg aagtaaaaaa aatatctaga 5100
tcatttattg ccgagttaca aatattattt gatatcagaa ctcggtatga acaattattt 5160
tcttctgctg acattagaga taacataaaa aagataattg atttagaaaa accttctatt 5220
attattgctg agtctatatg ggcgttgcaa gcattgccta ttgaaattag tgcgagaata 5280
cactgtgtta ttcatgatgt ggcaactgat ttctttaaag aaatgtttgt atctcataat 5340
gaggttgtac gaaaaatttt gttttttaat gattacctaa agttgaaaat tactgaagaa 5400
aatattatca aacgtttgag agttgagcaa tttatctttc tgacagaaga agataaatgt 5460
tggtataaaa caagatacaa tattgatgag ggttgttgtt ccttagcgag caatcatctt 5520
tatgtagaaa agattaagag aactatcaat ttccaaaccc ctttcctgct tattcccggt 5580
agcattgaat tttcacaaaa tttttacggc ttaaattggt ttataaaaaa tatatatcct 5640
ggattaaata ggaaaataag aatagttgta acaggaaagg catcagataa aaaaataaag 5700
atgttaaact gtggagagga aattaccttt acgggagagc ttgacttttc cacatataat 5760
aaacttagct caacatgctt gtgtgttatt gcaccgatta caacgggcac tggaattaaa 5820
ataaaaatat tagaagctgt acaaaaaggt attcctgtac ttacaacaaa atttgcttca 5880
aaaggaatat gttccgattt atgtttttat tgcgaggagg atactgacac aaactttgtc 5940
aatttaatta acagttttct tgaaacgaca ttaagagtcc aagaatgaat ttattgcttt 6000
tttcagtcct tgcgtttggt ttaatattgg ctttggccca taataataaa agtggagata 6060
ttaacgcata cttaatgttt tttctcgtgg tcctaatggt attaatatca gggctgcgta 6120
tgaatgatag tgattatatc gaatacagga aaatgtataa tgaagtgcct attttatgtg 6180
actttagtct cgcatctata agagatatac atggggaggt aggctatcta ttcttatcat 6240
caatctttaa aactttatgc ttgccatttc aattatttct tttttttatt gcttttttat 6300
cactcctgct tacatatttt tcattcagaa aaataagttt aataccgata ctatcgttag 6360
ttttttattt aagccatgct tttatagtta gagatttgat tcaaattagg gcaggattag 6420
ctgttagcat atcattatat tcaataatta aatttaaagg aaataaaagt ataattacag 6480
gagttttatt tgcttctttg attcattctg gggcgcttat tattgctctt tgttatcctt 6540
ttttcaaaaa aaaatacata acattaaaaa tgatgttgtt tttattttta gtgtcaatta 6600
ttttttctta tttgaatggg cttaatttat cgatacaact cttatctcaa tatagtttgc 6660
ttccaactgc aatttcgaat tatgttggtt gggaagaata tgattatcgg gtgagtatat 6720
ttactaatcc ggtttttatt aaaggtgttt ttttaattgt cttaatgcac aaatatgtac 6780
tttcagatat taaaaatgag aaaattatag tgctttataa cttatatgtt ttaggtgtat 6840
tagctatggt tgcattgagt gggatggcta ttctttcagg ccgtctttca tcctttctga 6900
cactaggtga aagcatttta attgtatatg ctctgttcta caaaagaaat acacctctgg 6960
cgtttctaat tttttctttt ttaacaattg tgcaattagg atatgatcta tttatttcta 7020
atgtgcatcc tgagcttact ctgattatat ttgggtgaat ctaagtgaaa aataataaaa 7080
taggcatact tatctctaaa atacaaaatc ttggacctgt gaatgtagta cgaggattga 7140
taaaagaaaa taaaaaatat gcttttactg ttttttgttt aacaaatagc gtagataaaa 7200
atatatatga tgagttatgc tgtttaggag ccaaggttat attaatacca gatggtactt 7260
ggttcagcaa aattttattt gtgagaagtt ttttaaagga acatccacat aatatcttac 7320
attcacatgg gatcacggcc gatatgtttt cttactttct gaatggcgtg aaaatatcta 7380
ctattcacaa tagactagat gaggattata tcccattatt tggcgcggtt aaagggaatg 7440
ctatatatta tcttcatcgt tttatattac gaagatttaa tcatatcgtt gcttgctcag 7500
cagcggtcca atcaaaactg aaacaatcga aagtaaaaac taaaataacc accatccaga 7560
atgggattga tataactagg tttaagacac ttgagtctga taaaaaaaaa ttattgaggg 7620
aaaaacacgg atttgatagt gaaaaaagaa tatttatata ttgtggctcg ttatcattaa 7680
ggaaaaatat tgcttacctc ttggaacact tagccatcga agaaaatgat atatttttaa 7740
ttctaggtga tggtgaactt tttagatatt gtaaggataa atattctaaa gatttacggt 7800
atatatttat ggggaaagtt gaatgccctc ttgaatatta tcaattatca gatatttttg 7860
tttccgcttc tttatcggaa gggctcccct tggcactatt agaagctgcc tctactgggt 7920
gctatttata tgttagcgat atagagcccc atagagaaat tgcatctcta ttaggagagg 7980
aaaatatttc tatgtttaaa attaaggatg gatcatataa ttatttgcaa cctaaaataa 8040
aaaaagctga ctataacgct ctttctgacg ataaacttta caatatatcc gataaaaaaa 8100
tgtcaaatct ttatgacaaa ctttttgttt ctttattaga gcagaggcac taatataatg 8160
atttatgttt cggtaatttc tcatggtcat ttcaaaactc ttaaggaatt aggagcagta 8220
tcaaaattaa ataatcacag cagaattaaa gttatcatca aagataattt aggagagagc 8280
gagcttttgg atttttgtca ggaaaacaaa ataacttatt taaggtctaa agagaaaaaa 8340
ggatttggag agaataataa tgaagttttt tcctctatat cctccttaat tactaaggaa 8400
gatttttttg tggttatgaa tcctgatata tatattgagt gctctgatct attagatgtc 8460
gtagatgagt gtggttcagc gaatgttaat ctagcaacga taaatttata cagggatttt 8520
gataaaaaaa catatgataa ctcagtaagg aaatttccct cggcaattga tttttttatg 8580
tcatttttat ttaagaaaaa tgactgtgta gtaaataaga acaaaataac gaaaccaaca 8640
tatgttgatt gggctgcagg ttcttttcta atatttaatg ccttctttta ttcaaaactc 8700
aacggattca acgaaaagta ttttatgtat tgcgaagata ttgatatatg ttggcgagct 8760
aaaaaacact tcaatacttc agttttatac tatccatgct atgcagcaat tcatttggca 8820
caatttaaca atcgtaggat ttttagtaga catttcattt ggcatataaa aagtattatc 8880
ctttttttat tatataaaaa tggtatgctg cgttctagta agttgcttta atgctaatat 8940
tcttttaaga ggtgagaatg atacctgtta ttttggctgg tggttcggga agtcgcttgt 9000
ggccactttc acgagaaaag ttccccaagc agtttttaaa gttgactggc agtttgacaa 9060
tgttgcagtc aacattgtca cgtcttaata atttaaatgc tgatgattca atagttatat 9120
gcaacgaaga gcatagattt attgttgcag aacaattaag agagttaggc aaactttcaa 9180
ataacattat tcttgaaccc aaaggtcgta atacagcccc tgctataaca ctcgcagcat 9240
tagcagcaaa aagaaaattc gctgatgaag atccattgat tcttatttta gctgcagatc 9300
acaacatcca agacgaacat gttttctgtg aggcaattaa taaggcgtca tctttagcta 9360
gttatggaaa actagtgact tttggtatcg ttccattcaa acctgaaact gggtatggct 9420
atattcgtcg cggtgatgaa gtgcctgtag atgagcagca tgcggtggcc tttgaagtgg 9480
cgcagtttgt cgaaaaaccg aatctggaaa ccgcgcaggc ctatgtggca agcggcgaat 9540
attactggaa cagcggtatg ttcctgttcc gtgccggacg ctatctcgaa gaactgaaaa 9600
agtatcgtcc ggatattctc gatgcctgtg aaaaagcgat gagcgccgtc gatccggatc 9660
tcgattttat tcgtgtggat gaagaggcgt ttctcgcttg tccggaagag tcggtggatt 9720
acgcggtcat ggaatgcacg gcagatgccg ttgtggtgcc gatggatgcg ggctggagcg 9780
atgtcggttc ctggtcttca ttatgggaga tcagcgccca caccgccgag ggcaacgttt 9840
gccacggcga tgtgattaat cacaaaactg aaaacagcta tgtgtacgcc gaatctggcc 9900
tggtcaccac cgtcggggtg aaagatttgg tggtagtgca gaccaaagat gcagtgctga 9960
ttgccgaccg taatgcggtg caggatgtga agaaagtggt cgagcagatc aaagctgatg 10020
gtcgccatga gcatcgggtg catcgcgaag tgtatcgtcc gtggggcaaa tatgactcta 10080
tcgacgcggg cgaccgctac caggtgaaac gcatcaccgt gaaaccgggc gaaggtttgt 10140
cggtacagat gcattatcat cgcgcggaac actgggtggt tgtcgcggga acggcaaaag 10200
tcactatcaa cggtgatatc aaactgcttg gtgaaaacga gtccatttat attccgctgg 10260
gggcgatgca ctgcctggaa aacccgggga aaatagattt agaattaatt gaagttcgct 10320
ctggtgcata tcttgaagaa gatgatgtta ttagatgtta tgatcgctat ggacgaaagt 10380
aatatataat aattatttca gaattagaaa tgataattat aagttttcgt ctggataaac 10440
aatagatagt atgggttgga aaatatgagt tctttaactt gttttaaagc ttacgacatt 10500
cgcgggaaat taggtgaaga actgaatgaa gatatcgcct ggcgcattgg tcgcgcctat 10560
ggcgaatttc tcaaaccgaa aaccattgtg ttaggcggtg atgtccgtct caccagcgaa 10620
accttaaaac tggcgctggc aaaaggttta caggatgcgg gcgtcgatgt gctggatatt 10680
ggcatgtccg gcaccgaaga gatttatttc gccacgttcc atctcggcgt ggatggcggc 10740
attgaagtta ccgccagcca taatccgatg gattacaacg gcatgaagct ggtgcgcgaa 10800
ggggctcgcc cgatcagcgg tgataccgga ctgcgcgacg tccagcgtct ggcagaagct 10860
aacgactttc ctcccgtcga tgaaaccaaa cgcggtcgct atcagcaaat caatctgcgt 10920
gacgcttacg ttgatcacct gttcggttat atcaatgtca aaaaccttac gccgctcaag 10980
ctggtgatca actccgggaa tggcgcagcg ggtccggtgg tggacgctat cgaagcccgc 11040
tttaaagccc tcggcgcacc ggtggagtta atcaaagtgc ataacacgcc ggacggcaat 11100
ttccccaacg gtattcctaa cccgttgctg ccggaatgtc gcgacgacac ccgcaatgcg 11160
gtcatcaaac acggcgcgga tatgggcatt gcctttgatg gcgattttga ccgctgtttc 11220
ctgtttgacg aaaaagggca gtttattgag ggctactaca ttgtcggcct gctggcagaa 11280
gcgttcctcg aaaaaaatcc cggcgcgaag atcatccacg atccacgtct ctcctggaac 11340
accattgatg tggtgacggc cgcgggcggc acgccggtga tgtcgaaaac aggacacgcc 11400
tttattaaag aacgtatgcg caaggaagac gccatctacg gtggcgaaat gagcgctcac 11460
cattacttcc gcgatttcgc ttactgtgac agcggcatga tcccgtggct gctggtcgcc 11520
gaactggtgt gcctgaaagg aaaaacgctg ggcgaactgg tgcgcgaccg gatggcggcg 11580
tttccggcaa gcggtgagat caacagaaaa ctggcgcacc ctgttgaggc gattaaccgc 11640
gtggaacagc attttagccg tgaggtgctg gcggtggatc gcaccgatgg catcagcatg 11700
acctttgccg actggcgctt taacctgcgc tcttccaaca ccgaaccggt ggtgcgcctg 11760
aatgtggaat ctcgcggtga tgttcaggtt atggtaatcc atactcaaga aatattatca 11820
attttgacgt cataaagaat aagccctgac aagttagggc ttaattaata tatatttttt 11880
ttgaattggg gatttgtggt aagattttta atatgttatt taatgtggtt gaattaatgt 11940
tgactggaaa ataataatga gaacgaaaaa agcattacac aactttaaag ttgatttatt 12000
aattactttt ttattggttt tgctagggtt ttatattcga actgtttttg tttcaaaaat 12060
gggaagtgat attactggag tgatgttact attcacacag ttgacagcat atctcaattt 12120
ggcagaatta ggtattggaa ttgcagctgc cagcgtatta tataaaccgc tcagcgagaa 12180
tgaatacaat aaaataactt acataatatc tttgctctca gtcatataca aatatatatt 12240
tgtgtttgtt ttgattcttg gcgttgttat aggtatctgt atttattact ttattgattc 12300
tgtaaaggtt gtaaatggcg tttttttata ttgggctttg ttcgttttta atacatcgtt 12360
gacatatagt tatgctaaat actccacatt attaactgct aatcagcggt actcagcagt 12420
aagaaaaatt caaggtggcg gaaaagttat aataattgta tttcagatat taattttgtg 12480
ctttacgcaa agtttcatac tttatttgtt agttgagact ttaggtattt tttctcaata 12540
tttgattttt aaaaaaataa ttgggaacgg aaatcaatat ctcagtaatg aggttttact 12600
tattgaaagc gataaacttt tgataaaaaa agaattaaaa ataagaataa aaaatatgtt 12660
cttccataaa ataggtgctg tgcttgtcct taatacagac tacctgcttg tatcaaagtt 12720
tctgacatta agttatgtga caatttttgg cagctatatg atggtatttc agatagtaac 12780
tgttttgatg tcaagttttg ttaatgctat tactgcagga atgggtaatt acttaattaa 12840
taaaagtaat ttagaaatta aggaaattac acgtcaattt tatgtgatat ttatcgcctt 12900
tgcaacattc atatcactaa atatgttttt tcttgttaat gattttatcg caaaatggat 12960
aggtgttaat tatacattaa gtaacaccct agttgcatta atgattgtta acgtattcat 13020
tagtgttgtc agggtacctt ctgatatatt aaaaaacgca agtggacatt ttggtgatat 13080
ttattatcca ttattagaag gtgtgctgaa tattacgata tccatcattt tggctatcat 13140
tattggatta cctggcatta ttatagggac aatagtatct aacttaatag taataatgct 13200
tgcgaaacca ttatatcttt actctaagtt atttaatctt agaaatccga cgagggttta 13260
ttttgaattt atttctcggc ctatgttata ttcattatgt gtgattgggg tgagctattt 13320
attgcgcgat gaaatatatt catttaaagt aagtacatgg ttggatttta ttaacaagct 13380
actcttagtc tctactccta gcatattggt aatatgtgct attttctcta cggatagtga 13440
ctttagatta tttttcagaa aaattatata tgtgattatg aagaaataaa aatttcgaaa 13500
atgtattaat cgaaattatg caacgagctt tatttttata aatgatatgt gatcttttcg 13560
cgaataggag taaggatccg tgtaggctgg agctgcttcg aagttcctat actttctaga 13620
gaataggaac ttcggaatag gaactaagga ggatattcat atggataaag ccgtaagcat 13680
ataagcatgg ataagctatt tatactttaa taagtacttt gtatacttat ttgcgaacat 13740
tccaggccgc gagcattcag cgcggtgatc acacctgaca ggagtatgta atgtccaagc 13800
aacagatcgg cgtagtcggt atggcagtga tgggacgcaa ccttgcgctc aacatcgaaa 13860
gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa gaagtgattg 13920
ccgaaaatcc aggcaagaaa ctggttcctt actatacggt gaaagagttt gtcgaatctc 13980
tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg gatgctgcta 14040
ttgattccct caaaccatat ctcgataaag gagacatcat cattgatggt ggtaacacct 14100
tcttccagga cactattcgt cgtaatcgtg agctttcagc agagggcttt aacttcatcg 14160
gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg tccttctatt atgcctggtg 14220
gccagaaaga agcctatgaa ttggtagcac cgatcctgac caaaatcgcc gccgtagctg 14280
aagacggtga accatgcgtt acctatattg gtgccgatgg cgcaggtcac tatgtgaaga 14340
tggttcacaa cggtattgaa tacggcgata tgcagctgat tgctgaagcc tattctctgc 14400
ttaaaggtgg cctgaacctc accaacgaag aactggcgca gacctttacc gagtggaata 14460
acggtgaact gagcagttac ctgatcgaca tcaccaaaga tatcttcacc aaaaaagatg 14520
aagacggtaa ctacctggtt gatgtgatcc tggatgaagc ggctaacaaa ggtaccggta 14580
aatggaccag ccagagcgcg ctggatctcg gcgaaccgct gtcgctgatt accgagtctg 14640
tgtttgcacg ttatatctct tctctgaaag atcagcgtgt tgccgcatct aaagttctct 14700
ctggtccgca agcacagcca gcaggcgaca aggctgagtt catcgaaaaa gttcgtcgtg 14760
cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg cgtgctgcgt 14820
ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc cgtgctggct 14880
gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa aatccacaga 14940
tcgctaacct gttgctggct ccgtacttca agcaaattgc cgatgactac cagcaggcgc 15000
tgcgtgatgt cgttgcttat gcagtacaga acggtattcc ggttccgacc ttctccgcag 15060
cggttgccta ttacgacagc taccgtgctg ctgttctgcc tgcgaacctg atccaggcac 15120
agcgtgacta ttttggtgcg catacttata agcgtattga taaagaaggt gtgttccata 15180
ccgaatggct ggattaa 15197
<210> 20
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> Example CRM197 sequence
<400> 20
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Val Arg
180 185 190
Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp Trp Asp Val
195 200 205
Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu Lys Glu His Gly
210 215 220
Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys Thr Val Ser Glu
225 230 235 240
Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln Thr Ala Leu Glu
245 250 255
His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly Thr Asn Pro Val
260 265 270
Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn Val Ala Gln Val
275 280 285
Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr Thr Ala Ala Leu
290 295 300
Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile Ala Asp Gly Ala
305 310 315 320
Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser
325 330 335
Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp
340 345 350
Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe
355 360 365
Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His
370 375 380
Lys Thr Gln Pro Phe Leu His Asp Gly Tyr Ala Val Ser Trp Asn Thr
385 390 395 400
Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln Gly Glu Ser Gly His
405 410 415
Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu Pro Ile Ala Gly Val
420 425 430
Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val Asn Lys Ser Lys Thr
435 440 445
His Ile Ser Val Asn Gly Arg Lys Ile Arg Met Arg Cys Arg Ala Ile
450 455 460
Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser Pro Val Tyr Val Gly
465 470 475 480
Asn Gly Val His Ala Asn Leu His Val Ala Phe His Arg Ser Ser Ser
485 490 495
Glu Lys Ile His Ser Asn Glu Ile Ser Ser Asp Ser Ile Gly Val Leu
500 505 510
Gly Tyr Gln Lys Thr Val Asp His Thr Lys Val Asn Ser Lys Leu Ser
515 520 525
Leu Phe Phe Glu Ile Lys Ser
530 535
Claims (22)
- 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물로서, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 농도는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각의 농도에 비해 독립적으로 증가되는 것인, 조성물.
- 제1항에 있어서, O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 O75 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 2.5:1인, 조성물.
- 제1항 또는 제2항에 있어서, O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 O75 항원 다당류 농도의 중량비는 약 2:1인, 조성물.
- 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물로서, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1인, 조성물.
- 제4항에 있어서, O75 항원 다당류 대 O4, O15, O16 및/또는 O18 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1인, 조성물.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 조성물 중 O75 항원 다당류 대 O25 항원 다당류 농도의 중량비는 약 1:1인, 조성물.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 대장균 항원 다당류 O1:O2:O4:O6:O15:O16:O18:O25:O75의 농도의 중량비는 1:1:1:1:1:1:1:2:2인, 조성물.
- 제1항 내지 제7항 중 어느 한 항에 있어서, O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고,
(i) 대장균 O1 항원 다당류는 화학식 (O1A)의 구조를 포함하고
[화학식 (O1A)]
,
(ii) 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함하고
[화학식 (O2)]
,
(iii) 대장균 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함하고
[화학식 (O4-Glc+)]
,
(iv) 대장균 O6 항원 다당류는 화학식 (O6A)의 구조를 포함하고
[화학식 (O6A)]
,
(v) 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함하고,
[화학식 (O15)]
,
(vi) 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함하고
[화학식 (O16)]
,
(vii) 대장균 O18 항원 다당류는 화학식 (O18A)의 구조를 포함하고
[화학식 (O18A)]
,
(viii) 대장균 O25 항원 다당류는 화학식 (O25B)의 구조를 포함하고
[화학식 (O25B)]
, 및
(ix) 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함하고
[화학식 (O75)]
,
여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수인, 조성물. - 제1항 내지 제8항 중 어느 한 항에 있어서, O75 항원 다당류의 농도는 약 8 내지 약 64 μg/mL, 바람직하게는 약 8 내지 약 50 μg/mL, 바람직하게는 약 12 내지 약 40 μg/mL, 바람직하게는 약 16 내지 약 32 μg/mL, 바람직하게는 약 28 내지 약 36 μg/mL, 바람직하게는 약 32 μg/mL인, 조성물.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 조성물에 존재하는 대장균 O 항원 다당류는 O1, O2, O4, O15, O16, O18, O25, O75 및 O6으로 구성되는 것인, 조성물.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 담체 단백질은 슈도모나스 애루기노사의 탈독소화된 외독소 A(EPA) 또는 CRM197, 바람직하게는 EPA이고, 바람직하게는 담체 단백질은 서열번호 1의 아미노산 서열을 갖는 1 내지 20개, 예컨대 1 내지 10개 또는 2 내지 4개의 글리코실화 공통 서열, 예컨대 서열번호 2의 아미노산 서열을 갖는 공통 서열을 포함하고, 더욱 바람직하게는 담체 단백질은 4개의 글리코실화 공통 서열을 포함하고, 가장 바람직하게는 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함하는 EPA인, 조성물.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 대장균 항원 다당류는 생체접합 또는 화학적 접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 대장균 항원 다당류는 생체접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 다당류는 담체 단백질의 글리코실화 부위의 Asn 잔기에 공유 결합되는 것인, 조성물.
- 대상체에게 제1항 내지 제13항 중 어느 한 항의 조성물을 투여하는 단계를 포함하는, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법.
- 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법으로서, 대상체에게 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류 각각의 유효량을 투여하는 단계를 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 유효량은 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 비해 독립적으로 증가되는 것인, 방법.
- 제15항에 있어서,
a) 유효량의 O75 항원 다당류는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 약 1.5:1 내지 약 2.5:1, 바람직하게는 약 2:1의 중량비로 투여되거나; 또는
b) 유효량의 O75 항원 다당류는 O1, O2 및/또는 O6 항원 다당류에 대해 독립적으로 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1의 중량비로 투여되고, 추가로 유효량의 O75 항원 다당류는 O25 항원 다당류에 대해 1:1의 중량비로 투여되는 것인, 방법. - 제14항 내지 제16항 중 어느 한 항에 있어서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 이를 예방하며, 바람직하게는 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함하는 것인, 방법.
- 제15항 내지 제17항 중 어느 한 항에 있어서, O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고,
바람직하게는 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고,
O75 항원 다당류 대 O6 항원 다당류의 중량비는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1인, 방법. - 제15항 내지 제18항 중 어느 한 항에 있어서, 대상체에게 투여되는 대장균 O 항원 다당류는
a) O1, O2, O4, O15, O16, O18, O25, O75 및 O6으로 구성되거나; 또는
b) 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 O 항원 다당류를 추가로 포함하는 것인, 방법. - 제14항 내지 제19항 중 어느 한 항에 있어서, 대상체는 대장균(바람직하게는 ExPEC) 감염, 바람직하게는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간인, 방법.
- 제14항 내지 제20항 중 어느 한 항에 있어서, 약 8~16 μg, 바람직하게는 약 16 μg의 O75 항원 다당류가 투여당 투여되는 것인, 방법.
- 제14항 내지 제21항 중 어느 한 항에 있어서, 유효량의 O1:O2:O4:O6:O15:O16:O18:O25:O75의 투여되는 대장균 항원 다당류는 1:1:1:1:1:1:1:2:2의 중량비로 투여되는 것인, 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063079734P | 2020-09-17 | 2020-09-17 | |
US63/079,734 | 2020-09-17 | ||
EP21154782 | 2021-02-02 | ||
EP21154782.3 | 2021-02-02 | ||
US202163191471P | 2021-05-21 | 2021-05-21 | |
US63/191,471 | 2021-05-21 | ||
PCT/IB2021/058485 WO2022058945A1 (en) | 2020-09-17 | 2021-09-17 | Multivalent vaccine compositions and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230043157A true KR20230043157A (ko) | 2023-03-30 |
Family
ID=77801756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237006127A KR20230043157A (ko) | 2020-09-17 | 2021-09-17 | 다가 백신 조성물 및 이의 용도 |
Country Status (17)
Country | Link |
---|---|
US (1) | US20220088165A1 (ko) |
EP (1) | EP4213870A1 (ko) |
JP (2) | JP7481585B2 (ko) |
KR (1) | KR20230043157A (ko) |
CN (1) | CN115803087A (ko) |
AU (1) | AU2021342797B2 (ko) |
BR (1) | BR112023004819A2 (ko) |
CA (1) | CA3190820A1 (ko) |
CL (1) | CL2023000740A1 (ko) |
CO (1) | CO2023002114A2 (ko) |
EC (1) | ECSP23019295A (ko) |
IL (2) | IL301248B2 (ko) |
MX (1) | MX2023003169A (ko) |
PE (1) | PE20231385A1 (ko) |
TW (1) | TW202227128A (ko) |
UY (1) | UY39428A (ko) |
WO (1) | WO2022058945A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113950524A (zh) | 2019-03-18 | 2022-01-18 | 杨森制药公司 | 生产大肠杆菌o-抗原多糖的生物缀合物的方法、其组合物及其使用方法 |
CN113924112A (zh) | 2019-03-18 | 2022-01-11 | 杨森制药公司 | 大肠杆菌o-抗原多糖的生物缀合物、其生产方法及其使用方法 |
WO2024107729A2 (en) * | 2022-11-15 | 2024-05-23 | Janssen Pharmaceuticals, Inc. | Multivalent vaccine compositions and uses thereof |
WO2024146325A1 (zh) * | 2023-01-06 | 2024-07-11 | 中国人民解放军军事科学院军事医学研究院 | 用于生产抗原多糖-载体蛋白生物偶联产物的工程菌及其应用 |
GB202302579D0 (en) * | 2023-02-23 | 2023-04-12 | Glaxosmithkline Biologicals Sa | Immunogenic composition |
WO2024186262A1 (en) * | 2023-03-03 | 2024-09-12 | Agency For Science, Technology And Research | Use of o-antigens for treating bacterial infections |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5057540A (en) | 1987-05-29 | 1991-10-15 | Cambridge Biotech Corporation | Saponin adjuvant |
US4912094B1 (en) | 1988-06-29 | 1994-02-15 | Ribi Immunochem Research Inc. | Modified lipopolysaccharides and process of preparation |
AU685047B2 (en) | 1992-02-11 | 1998-01-15 | Henry M. Jackson Foundation For The Advancement Of Military Medicine | Dual carrier immunogenic construct |
SK279188B6 (sk) | 1992-06-25 | 1998-07-08 | Smithkline Beecham Biologicals S.A. | Vakcínová kompozícia spôsob jej prípravy a použiti |
PT616034E (pt) | 1993-03-05 | 2005-02-28 | Wyeth Corp | Plasmideo para a producao de proteina crm e toxina da difteria |
AU678613B2 (en) | 1993-09-22 | 1997-06-05 | Henry M. Jackson Foundation For The Advancement Of Military Medicine | Method of activating soluble carbohydrate using novel cyanylating reagents for the production of immunogenic constructs |
EP0814833B1 (en) | 1995-03-22 | 2003-05-28 | Henry M. Jackson Foundation For The Advancement Of Military Medicine | Producing immunogenic constructs using soluble carbohydrates activated via organic cyanylating reagents |
US6299881B1 (en) | 1997-03-24 | 2001-10-09 | Henry M. Jackson Foundation For The Advancement Of Military Medicine | Uronium salts for activating hydroxyls, carboxyls, and polysaccharides, and conjugate vaccines, immunogens, and other useful immunological reagents produced using uronium salts |
IL132126A0 (en) | 1997-04-01 | 2001-03-19 | Ribi Immunochem Research Inc | Aqueous immunologic adjuvant compositions of monophosphoryl lipid a |
US6491919B2 (en) | 1997-04-01 | 2002-12-10 | Corixa Corporation | Aqueous immunologic adjuvant compostions of monophosphoryl lipid A |
KR100629028B1 (ko) | 1998-10-16 | 2006-09-26 | 글락소스미스클라인 바이오로지칼즈 에스.에이. | 애쥬번트 시스템 및 백신 |
DE60134499D1 (de) | 2000-04-13 | 2008-07-31 | Corixa Corp | Immunostimulierende zusammnensetzungen die aminoalkyl glucosaminidephosphat und qs-21 enthalten |
US6676958B2 (en) | 2001-06-19 | 2004-01-13 | Advanced Bioadjuvants, Llc | Adjuvant composition for mucosal and injection delivered vaccines |
EP1481057B1 (en) | 2002-03-07 | 2006-02-15 | Eidgenössische Technische Hochschule Zürich | System and method for the production of recombinant glycosylated proteins in a prokaryotic host |
PT2311972E (pt) | 2005-05-11 | 2015-05-13 | Eth Zuerich | Proteínas n-glicosiladas recombinantes de células procarióticas |
TWI457133B (zh) | 2005-12-13 | 2014-10-21 | Glaxosmithkline Biolog Sa | 新穎組合物 |
EP2357184B1 (en) | 2006-03-23 | 2015-02-25 | Novartis AG | Imidazoquinoxaline compounds as immunomodulators |
ES2388556T3 (es) | 2006-03-23 | 2012-10-16 | Novartis Ag | Compuestos inmunopotenciadores |
CA2711503A1 (en) | 2008-01-08 | 2009-07-16 | Biogenerix Ag | Glycoconjugation of polypeptides using oligosaccharyltransferases |
EP2257307B1 (en) | 2008-02-20 | 2018-06-06 | GlaxoSmithKline Biologicals S.A. | Bioconjugates made from recombinant n-glycosylated proteins from procaryotic cells |
CN102481312B (zh) | 2009-06-05 | 2015-07-15 | 传染性疾病研究院 | 合成的吡喃葡萄糖脂佐剂 |
PL2885007T3 (pl) | 2012-08-16 | 2019-02-28 | Pfizer Inc. | Sposoby glikokoniugacji i kompozycje |
AU2013311534A1 (en) | 2012-09-10 | 2015-03-12 | Glycovaxyn Ag | Bioconjugates comprising modified antigens and uses thereof |
SG10201800777PA (en) | 2012-10-12 | 2018-02-27 | Glycovaxyn Ag | Methods of host cell modification |
PT2935299T (pt) | 2012-12-20 | 2019-11-19 | Pfizer | Processo de glicoconjugação |
ES2754269T3 (es) | 2013-05-18 | 2020-04-16 | Aduro Biotech Inc | Composiciones y métodos de activación de la señalización dependiente del "estimulador de los genes de interferón |
CN103495161B (zh) | 2013-10-08 | 2019-06-18 | 江苏康泰生物医学技术有限公司 | 一种多元肺炎球菌荚膜多糖-蛋白质结合物的混合物及其制备方法 |
MX371513B (es) | 2013-10-11 | 2020-01-31 | Glaxosmithkline Biologicals Sa | Metodos de modificacion de celulas huespedes. |
BR112016012599A2 (pt) | 2013-12-04 | 2017-09-26 | Glycovaxyn Ag | composição, e, método para tratamento ou prevenção de uma infecção por staphylococcus aureus |
AR100859A1 (es) | 2014-02-24 | 2016-11-09 | Glycovaxyn Ag | Polisacáridos y sus usos |
ES2939470T3 (es) | 2014-04-17 | 2023-04-24 | Glaxosmithkline Biologicals Sa | Células hospedadoras modificadas y usos de las mismas |
CN105695497B (zh) | 2014-11-27 | 2019-09-24 | 中国人民解放军军事医学科学院生物工程研究所 | 一种细菌多糖修饰的重组融合蛋白的制备方法及其应用 |
PT3240895T (pt) | 2014-12-30 | 2022-03-02 | Glaxosmithkline Biologicals Sa | Composições e métodos para glicosilação de proteínas |
TWI715617B (zh) | 2015-08-24 | 2021-01-11 | 比利時商葛蘭素史密斯克藍生物品公司 | 對抗腸道外病原性大腸桿菌之免疫保護之方法及組合物 |
GB201518668D0 (en) | 2015-10-21 | 2015-12-02 | Glaxosmithkline Biolog Sa | Immunogenic Comosition |
GB201610599D0 (en) | 2016-06-17 | 2016-08-03 | Glaxosmithkline Biologicals Sa | Immunogenic Composition |
AR109621A1 (es) * | 2016-10-24 | 2018-12-26 | Janssen Pharmaceuticals Inc | Formulaciones de vacunas contra glucoconjugados de expec |
US11260119B2 (en) | 2018-08-24 | 2022-03-01 | Pfizer Inc. | Escherichia coli compositions and methods thereof |
JP7551618B2 (ja) | 2018-12-12 | 2024-09-17 | グラクソスミスクライン バイオロジカルズ ソシエテ アノニム | O-結合型グリコシル化のための修飾キャリアタンパク質 |
CN113950524A (zh) * | 2019-03-18 | 2022-01-18 | 杨森制药公司 | 生产大肠杆菌o-抗原多糖的生物缀合物的方法、其组合物及其使用方法 |
CN113924112A (zh) * | 2019-03-18 | 2022-01-11 | 杨森制药公司 | 大肠杆菌o-抗原多糖的生物缀合物、其生产方法及其使用方法 |
WO2022208430A1 (en) * | 2021-04-01 | 2022-10-06 | Janssen Pharmaceuticals, Inc. | Production of e. coli o18 bioconjugates |
-
2021
- 2021-09-17 EP EP21772844.3A patent/EP4213870A1/en active Pending
- 2021-09-17 BR BR112023004819A patent/BR112023004819A2/pt unknown
- 2021-09-17 MX MX2023003169A patent/MX2023003169A/es unknown
- 2021-09-17 JP JP2023517329A patent/JP7481585B2/ja active Active
- 2021-09-17 AU AU2021342797A patent/AU2021342797B2/en active Active
- 2021-09-17 WO PCT/IB2021/058485 patent/WO2022058945A1/en active Application Filing
- 2021-09-17 US US17/478,584 patent/US20220088165A1/en active Pending
- 2021-09-17 KR KR1020237006127A patent/KR20230043157A/ko active Search and Examination
- 2021-09-17 UY UY0001039428A patent/UY39428A/es unknown
- 2021-09-17 TW TW110135002A patent/TW202227128A/zh unknown
- 2021-09-17 CA CA3190820A patent/CA3190820A1/en active Pending
- 2021-09-17 PE PE2023001175A patent/PE20231385A1/es unknown
- 2021-09-17 IL IL301248A patent/IL301248B2/en unknown
- 2021-09-17 CN CN202180049038.6A patent/CN115803087A/zh active Pending
- 2021-09-17 IL IL308201A patent/IL308201A/en unknown
-
2023
- 2023-02-27 CO CONC2023/0002114A patent/CO2023002114A2/es unknown
- 2023-03-15 CL CL2023000740A patent/CL2023000740A1/es unknown
- 2023-03-17 EC ECSENADI202319295A patent/ECSP23019295A/es unknown
-
2024
- 2024-04-25 JP JP2024071024A patent/JP2024099716A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2023003169A (es) | 2023-03-27 |
US20220088165A1 (en) | 2022-03-24 |
TW202227128A (zh) | 2022-07-16 |
AU2021342797A1 (en) | 2023-02-16 |
PE20231385A1 (es) | 2023-09-12 |
IL308201A (en) | 2024-01-01 |
IL301248B1 (en) | 2023-12-01 |
CL2023000740A1 (es) | 2023-09-29 |
JP2024099716A (ja) | 2024-07-25 |
CO2023002114A2 (es) | 2023-03-07 |
ECSP23019295A (es) | 2023-04-28 |
EP4213870A1 (en) | 2023-07-26 |
CN115803087A (zh) | 2023-03-14 |
IL301248B2 (en) | 2024-04-01 |
WO2022058945A1 (en) | 2022-03-24 |
JP7481585B2 (ja) | 2024-05-10 |
IL301248A (en) | 2023-05-01 |
CA3190820A1 (en) | 2022-03-24 |
BR112023004819A2 (pt) | 2023-04-18 |
AU2021342797B2 (en) | 2024-02-08 |
UY39428A (es) | 2022-03-31 |
JP2023539943A (ja) | 2023-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102532707B1 (ko) | 대장균 o-항원 다당류의 바이오컨쥬게이트, 이의 제조 방법, 및 이의 사용 방법 | |
KR102574882B1 (ko) | 대장균 o-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법 | |
AU2020230248B2 (en) | Compositions relating to a mutant Clostridium difficile toxin and methods thereof | |
KR20230043157A (ko) | 다가 백신 조성물 및 이의 용도 | |
KR101916290B1 (ko) | 캡슐형 그람-양성 세균 생체접합체 백신 | |
KR101541383B1 (ko) | 면역원성 조성물 | |
AU2017201193B2 (en) | Compositions and methods relating to a mutant clostridium difficile toxin | |
CA2341268C (en) | Streptococcus suis vaccines and diagnostic tests | |
KR20140101835A (ko) | 클로스트리듐 디피실레 톡신-기반 백신 | |
KR102625114B1 (ko) | 클로스트리디움 디피실레에 대항한 면역 반응을 도출하기 위한 조성물 및 방법 | |
KR20150056540A (ko) | 백신으로서의 클로스트리듐 디피실 폴리펩티드 | |
AU2021240230B2 (en) | Vaccines and vaccine components for inhibition of microbial cells | |
RU2773917C2 (ru) | Композиции и способы для вызывания иммунного ответа против clostridium difficile | |
RU2773880C1 (ru) | Композиции, относящиеся к мутантному токсину CLOSTRIDIUM DIFFICILE, и способы их применения | |
JP2024517754A (ja) | O-結合型グリコシル化に十分な最小シークオン | |
EA046206B1 (ru) | Биоконъюгаты полисахаридных о-антигенов e.coli, способы их получения и способы их применения |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination |