KR20230043157A

KR20230043157A - 다가 백신 조성물 및 이의 용도

Info

Publication number: KR20230043157A
Application number: KR1020237006127A
Authority: KR
Inventors: 잔 테우니스 풀만; 켈렌 크리스티나 파; 미첼 사네키; 제로엔 게르첸; 다렌 로버트 아바낫; 바트 구스타프 엠. 스피센즈; 프랑크 저마인 에프. 스트루프
Original assignee: 얀센 파마슈티칼즈, 인코포레이티드
Priority date: 2020-09-17
Filing date: 2021-09-17
Publication date: 2023-03-30
Also published as: MX2023003169A; US20220088165A1; TW202227128A; AU2021342797A1; PE20231385A1; IL308201A; IL301248B1; CL2023000740A1; JP2024099716A; CO2023002114A2; ECSP23019295A; EP4213870A1; CN115803087A; IL301248B2; WO2022058945A1; JP7481585B2; IL301248A; CA3190820A1; BR112023004819A2; AU2021342797B2

Abstract

장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하여 ExPEC와 관련된 질환에 대한 면역 보호를 제공하는 조성물 및 방법이 기재되어 있다. 특히, 침습성 ExPEC 질환의 예방을 위해 담체 단백질에 공유 결합된 대장균 다당류 항원 O75의 접합체를 사용하기 위한 조성물 및 방법이 기재되어 있다.

Description

다가 백신 조성물 및 이의 용도

장외 병원성 대장균(extraintestinal pathogenic Escherichia coli, ExPEC)은 일반적으로 공생 대장균 균주와 함께 인간 장의 무해한 서식 생물이다. 그러나 ExPEC 균주는 다양하고 심각한 침습성 질환을 초래하여 매년 상당한 이환율, 사망률 및 비용을 발생시키는 위장관 외부 부위의 집락화 및 감염에 대한 독성 인자를 보유할 수 있다(예를 들어, 문헌[Johnson et al., J Lab Clin Med. 2002;139(3):155-162; Kohler et al., Int J Med Microbiol. 2011;301(8):642-647; Foxman, Am J Med. 2002;113 Suppl 1A:5S-13S; 및 Russo et al., Microbes Infect. 2003;5(5):449-456] 참조). ExPEC 균주는 요로 감염(UTI)의 가장 흔한 원인이다. 이들은 또한 복부 및 골반 감염 및 병원내 폐렴과 관련된 수술 부위 감염 및 신생아 수막염의 기여자이며(Johnson et al., 2002; 및 Russo et al., 2003), 때때로 다른 장외 감염, 예를 들어, 골수염, 연조직염 및 상처 감염과 관련된다. 이러한 모든 일차 감염 부위는 ExPEC 세균혈증을 초래할 수 있다(Russo et al., 2003). 신생아, 노인 및 면역 저하 환자는 침습성 ExPEC 질환(IED)을 포함한 ExPEC 감염에 특히 취약하다.

항생제에 대한 박테리아 내성은 박테리아 감염에 대한 저항에서 주요 관심사이며, 다중 약물 내성(MDR) 대장균 균주가 점차 우세해지고 있다(예를 들어, 문헌[Schito et al., 2009, Int. J. Antimicrob. Agents 34(5):407-413; 및 Pitout et al., 2012, Expert Rev. Anti. Infect. Ther. 10(10):1165-1176] 참조). ExPEC 서열 유형 131(ST131)의 출현 및 신속한 전세계적 전파는 다중 약물 내성을 포함한 증가된 약물 내성의 주요 동인으로 간주된다(Johnson et al., Antimicrob Agents Chemother. 2010; 54(1):546-550; Rogers et al., J Antimicrob Chemother. 2011; 66(1):1-14). 이 클론은 모든 ExPEC 임상 분리주의 12.5% 내지 30%에서 발견되며, 대부분 혈청형 O25b:H4를 나타내고, 플루오로퀴놀론에 대한 높은 수준의 내성을 보여주며, 이는 종종 트리메토프림/설파메톡사졸 내성, 및 세팔로스포린에 대한 내성을 부여하는 광범위 베타-락타마제를 동반한다(Rogers et al, 2011, and Banerjee et al., Antimicrob Agents Chemother. 2014; 58(9):4997-5004).

O 항원 혈청형은 그람 음성 박테리아에서 지질다당류(LPS)의 외막 부분인 O 다당류 항원의 화학 구조를 기초로 한다. 180개가 넘는 대장균 O 항원이 보고되었으나(Stenutz et al., FEMS Microbial Rev. 2006; 30: 382-403), ExPEC 분리주 대부분은 20개 미만의 O 항원 혈청형으로 분류된다. 전장 대장균 O 항원은 전형적으로 고도로 보존된 LPS 코어 구조에 부착된 약 10 내지 25개의 반복 당 단위를 포함하며, 각각의 구성요소는 각각 rfb 및 rfa 유전자 클러스터에서 주로 암호화되는 효소에 의해 개별적으로 합성되었다. O 항원의 중합 후, O 항원 다당류 백본은 전형적으로 아세틸 또는 글루코스 잔기의 첨가를 통해 변형될 수 있다. 이러한 변형은 공통 다당류 백본을 공유하지만 측 분지가 상이한, 항원적으로 구별되는 혈청형을 생성함으로써, 혈청형 다양성을 효과적으로 증가시킨다. O 항원 변형 효소를 암호화하는 유전자는 전형적으로 염색체의 rfb 클러스터 외부에 있으며, 어떤 경우에는 이러한 유전자는 용원성 박테리오파지 내에서 발견된다.

ExPEC 감염은 임의의 혈청형에 의해 발생할 수 있다. ExPEC 감염에서 특정 혈청형의 과잉표현이 존재하나, 그럼에도 ExPEC 분리주로부터의 표면 다당류는 상당한 항원 다양성을 나타내며, 이는 표면 다당류를 기초로 한 ExPEC 백신의 개발을 매우 어렵게 만든다(Russo et al., Vaccine. 2007; 25: 3859-3870). 또한, 특정 O 항원은 면역원성이 불충분할 수 있다. 또한, 폐렴구균 접합체 백신으로부터의 연구를 기초로 하여, 다수의 혈청형이 질환을 초래할 수 있는 경우, 백신에 포함시키기 위한 혈청형의 선택 및 포함되는 혈청형의 투여량 수준과 같은 백신 조성이 중요할 수 있는데, 이는 특정 혈청형에 대한 백신의 사용이 백신에 포함되지 않은 혈청형, 또는 심지어 백신에 포함되나 혈청형에 대한 면역화에서 오로지 약하게 효과가 있는 혈청형의 운반 및 이러한 혈청형으로부터의 질환을 잠재적으로 증가시킬 수 있기 때문이다(Lipsitch, Emerging Infectious Diseases; 1999, 5:336-345). 이상적으로, 백신은 비백신 혈청형의 증가된 운반으로부터의 추가 질환의 위험을 최소화하면서 백신에 포함된 혈청형에 의해 야기되는 질환의 예방에 있어서 이로운 효과를 극대화시켜야 한다.

ExPEC 감염을 예방하기 위한 백신 개발을 위한 노력은 O 항원 다당류 접합체에 집중되었다. 12가 O 항원 접합체 백신은 O 항원 다당류의 추출과 정제 및 탈독소화된 슈도모나스 애루기노사(Pseudomonas aeruginosa) 외독소 A에 대한 화학적 접합을 통해 합성되고, 1상 임상 연구에서 안전성 및 면역원성에 대해 테스트되었다(Cross et al., J. Infect. Dis. (1994) v.170, pp.834-40). 이 후보 백신은 임상 용도로 허가되지 않았다. 대장균의 생체접합 시스템은 최근에 개발되었는데, 다당류 항원과 담체 단백질이 모두 생체 내에서 합성된 후 대장균에서 발현되는 캄필로박터 제주니(Campylobacter jejuni) 효소인 올리고사카릴 트랜스퍼라제 PglB의 활성을 통해 생체 내에서 접합된다(Wacker et al., Proc. Nat. Acad. Sci. (2006) v. 103, pp. 7088-93). 이 N 결합된 단백질 글리코실화 시스템은 담체 단백질에 다양한 다당류를 전달할 수 있어, 접합체를 정제하는 간단한 방법을 가능하게 한다.

생체접합은 대장균 4가 O 항원 후보 백신을 위한 접합체 다당류를 생산하는 데 성공적으로 사용되었다(Poolman and Wacker, J. Infect. Dis. (2016) v.213(1), pp. 6-13). 그러나 성공적인 ExPEC 백신의 개발은 우세한 혈청형의 보급을 필요로 하며, ExPEC 분리주의 서브세트에서 추가 O 항원 변형의 존재는 비변형 및 변형 LPS를 나타내는 분리주를 커버하는 데 있어서 추가 과제를 제시한다. 더욱이, 다중 혈청형으로부터의 O 항원을 포함하는 백신 조성물에 대한 면역 반응은 혈청형 간에 상이할 수 있다. 따라서, ExPEC에 대한 백신의 지속적인 필요성이 당업계에 존재한다. 특히, ExPEC O75 혈청형 및 ExPEC 중에서 일반적인 다른 혈청형에 대한 효과적인 면역 보호를 제공하는 데 사용될 수 있는 표면 다당류를 기초로 한 ExPEC 백신의 필요성이 존재한다.

놀랍게도 임상 시험에서 동일한 농도의 다른 O 항원과의 조성물에서 담체 단백질에 각각 공유 결합된 O 항원의 접합체로서 테스트할 경우 대장균 O75 항원은 다른 대장균 O 항원(예를 들어, O1, O2 및 O6)보다 면역원성이 낮은 것으로 보인다. 대장균 O75 항원의 접합체 및 하나 이상의 추가 대장균 O 항원의 접합체를 적절한 용량 및 비율로 포함하는 조성물을 사용한 백신접종은 ExPEC O75 혈청형 및 하나 이상의 추가 ExPEC O 혈청형에 대한 개선된 면역 반응을 제공한다.

따라서, 제1 일반 양태에서 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물이 본원에 제공되며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 농도는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각의 농도에 비해 독립적으로 증가된다.

특정 구현예에서, O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 O75 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 2.5:1이다.

특정 구현예에서, O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 O75 항원 다당류 농도의 중량비는 약 2:1이다.

제2 일반 양태에서, 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물이 본원에 제공되며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1이다. 바람직하게는 O75 항원 다당류 대 O1, O2 및/또는 O6의 농도의 중량비는 약 2:1이다.

특정 구현예에서, O75 항원 다당류 대 O4, O15, O16 및/또는 O18 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1이다. 바람직하게는 O75 항원 다당류 대 O4, O15, O16 및/또는 O18 항원 다당류 농도의 중량비는 약 2:1이다.

제3의 일반 양태에서, 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물이 본원에 제공되며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 농도는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각의 농도에 비해 독립적으로 증가되며, O75 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1이다. 바람직하게는, O75 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도의 중량비는 약 2:1이다.

제1, 제2 및 제3의 일반 양태의 특정 구현예가 이제 설명된다.

특정 구현예에서, 조성물 중 O75 항원 다당류 대 O25 항원 다당류 농도의 중량비는 약 1:1이다.

특정 구현예에서, 대장균 항원 다당류 O1:O2:O4:O6:O15:O16:O18:O25:O75의 농도의 중량비는 1:1:1:1:1:1:1:2:2이다.

특정 구현예에서, O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고, 여기서:

(i) 대장균 O1 항원 다당류는 표 1에 제시된 화학식 (O1A)의 구조를 포함하고,

(ii) 대장균 O2 항원 다당류는 표 1에 제시된 화학식 (O2)의 구조를 포함하고,

(iii) 대장균 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고,

(iv) 대장균 O6 항원 다당류는 표 1에 제시된 화학식 (O6A)의 구조를 포함하고,

(v) 대장균 O15 항원 다당류는 표 1에 제시된 화학식 (O15)의 구조를 포함하고,

(vi) 대장균 O16 항원 다당류는 표 1에 제시된 화학식 (O16)의 구조를 포함하고,

(vii) 대장균 O18 항원 다당류는 표 1에 제시된 화학식 (O18A)의 구조를 포함하고,

(viii) 대장균 O25 항원 다당류는 표 1에 제시된 화학식 (O25B)의 구조를 포함하고,

(ix) 대장균 O75 항원 다당류는 표 1에 제시된 화학식 (O75)의 구조를 포함하고,

여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

특정 구현예에서, O75 항원 다당류의 농도는 약 8 내지 약 64 μg/mL, 바람직하게는 약 8 내지 약 50 μg/mL, 바람직하게는 약 12 내지 약 40 μg/mL, 바람직하게는 약 16 내지 약 32 μg/mL, 바람직하게는 약 28 내지 약 36 μg/mL, 바람직하게는 약 32 μg/mL이다.

특정 구현예에서, 조성물에 존재하는 대장균 O 항원 다당류는 O1, O2, O4, O15, O16, O18, O25, O75 및 O6으로 구성된다.

특정 구현예에서, 조성물은 담체 단백질에 공유 결합된 적어도 하나의 추가 대장균 항원 다당류를 추가로 포함하고, 바람직하게는 적어도 하나의 추가 대장균 항원 다당류는 표 1에 제시된 화학식 (O8)을 갖는 O8 항원 다당류를 포함하고, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

특정 구현예에서, 담체 단백질은 슈도모나스 애루기노사의 탈독소화된 외독소 A(EPA) 또는 CRM₁₉₇, 바람직하게는 EPA이다. 바람직하게는 담체 단백질은 서열번호 1의 아미노산 서열을 갖는 1 내지 20개, 예컨대 1 내지 10개 또는 2 내지 4개의 글리코실화 공통 서열, 예컨대 서열번호 2의 아미노산 서열을 갖는 공통 서열을 포함한다. 더욱 바람직하게는 담체 단백질은 4개의 글리코실화 공통 서열을 포함한다. 가장 바람직하게는 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함하는 EPA이다.

특정 구현예에서, 대장균 항원 다당류는 생체접합 또는 화학적 접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 대장균 항원 다당류는 생체접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 다당류는 담체 단백질의 글리코실화 부위의 Asn 잔기에 공유 결합된다.

또 다른 양태에서, 대상체에게 본 발명의 조성물을 투여하는 단계를 포함하는, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 제공된다.

추가 양태에서 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 제공되며, 방법은 대상체에게 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류 각각의 유효량을 투여하는 단계를 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 유효량은 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 비해 독립적으로 증가된다.

본 발명의 방법에 따른 특정 구현예에서, 유효량의 O75 항원 다당류는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 약 1.5:1 내지 약 2.5:1, 바람직하게는 약 2:1의 중량비로 투여된다.

본 발명의 방법에 따른 특정 구현예에서, 유효량의 O75 항원 다당류는 O1, O2 및/또는 O6 항원 다당류에 대해 독립적으로 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1의 중량비로 투여되고, 바람직하게는 추가로 유효량의 O75 항원 다당류는 O25 항원 다당류에 대해 약 1:1의 중량비로 투여된다.

또 다른 양태에서 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 제공되며, 방법은 대상체에게 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류 각각의 유효량을 투여하는 단계를 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 유효량의 O75 항원 다당류는 O1, O2 및/또는 O6 항원 다당류에 대해 독립적으로 약 1.5:1 내지 약 4:1의 중량비로 투여된다. 유효량의 O75 항원 다당류는 바람직하게는 O25 항원 다당류에 대해 약 1:1의 중량비로 투여될 수 있다. 바람직하게는, 유효량의 O75 항원 다당류는 O1, O2 및/또는 O6 항원 다당류에 대해 독립적으로 약 2:1의 중량비로 투여된다.

본 발명의 임의의 방법 양태의 구현예가 아래에 제공된다.

본 발명의 방법에 따른 특정 구현예에서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 이를 예방하며, 바람직하게는 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.

본 발명의 방법에 따른 특정 구현예에서, O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, O75 항원 다당류 대 O6 항원 다당류의 중량비는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

본 발명의 방법에 따른 특정 구현예에서, 대상체에게 투여되는 대장균 O 항원 다당류는 O1, O2, O4, O15, O16, O18, O25, O75 및 O6으로 구성된다.

본 발명의 방법에 따른 특정 구현예에서, 대상체에게 투여되는 대장균 O 항원 다당류는 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 O 항원 다당류를 추가로 포함한다.

본 발명의 방법에 따른 특정 구현예에서, 대상체는 대장균(바람직하게는 ExPEC) 감염, 바람직하게는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.

본 발명의 방법에 따른 특정 구현예에서, 8~16 μg, 바람직하게는 약 16 μg의 O75 항원 다당류가 투여당 투여된다.

본 발명의 방법에 따른 특정 구현예에서, 유효량의 O1:O2:O4:O6:O15:O16:O18:O25:O75의 투여되는 대장균 항원 다당류는 1:1:1:1:1:1:1:2:2의 중량비로 투여된다.

전술한 요약과, 다음의 [발명을 실시하기 위한 구체적인 내용]은 첨부된 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명은 도면에 나타낸 정확한 구현예로 한정되지 않음이 이해될 것이다.
도 1은 뉴질랜드 백색 토끼에서 ExPEC10V 백신에 의해 유도된 항체 반응을 나타낸다. 동물은 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회의 근육내 면역화를 받았다. ExPEC10V 백신은 3가지의 상이한 농도로 투여되었고(군 1: 고용량, 군 2: 중간 용량 및 군 3: 저용량, 표 11), 대조군은 식염수(군 4, 0.9% (w/v) 염화나트륨 용액)만 받았다. 항체 수준은 0일(백신접종 전) 및 14일, 27일 및 42일(백신접종 후)에 ELISA에 의해 측정되었다. 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% CI가 제시되어 있다. 다중 비교를 위한 Bonferroni 보정을 사용한 Wilcoxon 순위 합계 검정. ExPEC10V 백신접종된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4)의 비교. *p ≤ 0.05, **p ≤ 0.01; ***p ≤ 0.001; ****p ≤ 0.0001. LOD: 검출 한계.
도 2는 ExPEC10V에 의해 유도된 항체 반응을 나타낸다. 뉴질랜드 백색 토끼는 ExPEC10V(총 다당류 105.6 μg) 또는 0.9% w/v 염화나트륨 용액(대조군)으로 3회의 근육내 면역화를 받았다. IgG 역가는 1일(면역화 전, n = 20/군), 31일(면역화 후, n = 20/군) 및 50일(면역화 후, n = 10/군)에 ELISA에 의해 결정되었다. 플롯은 각 군에 대한 개별 역가 및 기하 평균 ± 95% 신뢰 구간을 보여준다. ExPEC10V와 대조군 사이의 IgG 역가의 차이는 우도비 검정이 있는 Tobit 모델을 사용하여 분석되었다. P-값 ≤ 0.05는 유의한 것으로 간주되었다. *P ≤ 0.05, ****P ≤ 0.0001.
도 3a 내지 도 3b는 인간에서 ExPEC10V 백신을 사용한 1/2a상 임상 시험을 위한 전체 연구 설계를 보여준다. 도 3a는 코호트 1에 대한 전체 연구 설계를 나타내고, 도 3b는 코호트 2에 대한 전체 연구 설계를 나타낸다. 상세 내용은 실시예 7 참조.
도 4는 BAC1001 임상 시험에서 기준선(1일)으로부터 측정한, 백신접종 후 15일의 혈청 O 항원 특이적 항체 역가가 적어도 2배 증가한 참가자의 백분율을 보여준다(상세 내용은 실시예 7 참조). O 항원 특이적 혈청 항체 역가는 ECL 기반 면역분석법으로 측정했다.
도 5는 BAC1001 임상 시험에서 기준선(1일)으로부터 측정한, 백신접종 후 15일의 혈청 옵소닌 식세포 항체 역가가 적어도 2배 증가한 참가자의 백분율을 보여준다(상세 내용은 실시예 7 참조). 혈청 옵소닌 식세포 항체의 수준은 MOPA로 측정했다.
도 6은 뉴질랜드 백색 토끼에서 ExPEC 백신의 상이한 조성에 의해 유도된 혈청 항체 수준(총 IgG)을 나타낸다. 상세 내용은 실시예 8 참조. 그래프는 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% 신뢰 구간을 보여준다. 백신군 대 식염수 대조군 사이의 비교는 우도비 검정이 있는 Tobit 모델을 사용하여 통계적으로 평가되었고 다중 비교를 위한 Bonferroni 보정이 사용되었다. p 값 ≤ 0.05는 통계적으로 유의한 것으로 간주되었다. ****p ≤ 0.0001.

다양한 간행물, 논문 및 특허가 [배경기술] 및 명세서 전체에 걸쳐 인용되거나 기술되며; 각각의 이러한 참고문헌은 그 전체가 본원에 참고로 포함된다. 본 명세서에 포함된 문헌, 행위, 물질, 장치, 물품 등의 논의는 본 발명의 맥락을 제공하는 목적을 위한 것이다. 이러한 논의는 이들 사항 전부 또는 그 중 임의의 것이, 개시되거나 청구되는 임의의 발명에 대해 선행 기술의 일부를 형성한다고 인정하는 것이 아니다.

달리 정의되지 않는 한, 본원에서 사용된 모든 기술 및 과학 용어는 본 발명과 관련된 분야의 당업자가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 다른 경우, 본원에서 인용되는 특정 용어는 명세서에 제시된 바와 같은 의미를 갖는다. 본원에서 그리고 첨부된 청구범위에서 사용되는 단수 형태("a", "an" 및 "the")는 문맥상 명확히 달리 지시되지 않는 한 복수의 언급 대상을 포함한다는 것이 주목되어야 한다.

달리 나타내지 않는 한, 일련의 요소에 선행하는 용어 "적어도"는 그 시리즈 내의 모든 요소를 나타내는 것으로 이해되어야 한다.

숫자와 함께 사용될 때 “약”이라는 용어는 언급된 숫자의 ±10%, 예를 들어, ±5% 또는 ±1% 내의 임의의 숫자를 지칭한다.

당업자는 단지 일상적인 실험을 이용하여 본 명세서에 기재된 발명의 구체적 구현예에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 이러한 등가물은 본 발명에 포함되는 것으로 의도된다.

본 명세서 및 이후의 청구범위에 걸쳐서, 맥락상 달리 요구하지 않는 한, 단어 "포함하다", 및 "포함한다" 및 "포함하는"과 같은 변형은 명시된 정수 또는 단계 또는 정수 또는 단계의 군의 포함을 의미하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 군의 배제를 의미하지 않는 것으로 이해될 것이다. 본 명세서에서 사용될 때 용어 "포함하는"은 용어 "함유하는" 또는 "포함하고 있는"으로 치환될 수 있거나 또는 때때로, 본 명세서에서 사용될 때 용어 "갖는"으로 치환될 수 있다.

본 명세서에서 사용될 때 "구성되는"은 청구범위 요소에서 명시되지 않은 임의의 요소, 단계 또는 성분을 배제한다. 본 명세서에서 사용될 때 "본질적으로 구성되는"은 청구범위의 기본적이고 새로운 특징에 실질적으로 영향을 주지 않는 물질 또는 단계를 배제하지 않는다. 전술한 용어 “포함하는”, “함유하는”, “포함하고 있는” 및 “갖는” 중 임의의 것은, 본 발명의 양태 또는 구현예의 맥락에서 본 명세서에서 사용될 때마다, 용어 "구성되는" 또는 "본질적으로 구성되는"으로 대체되어 본 발명의 범주를 변경할 수 있다.

본원에서 사용된 바와 같이, 다수의 열거된 요소 사이의 접속 용어 "및/또는"은 개별 및 조합 옵션 둘 모두를 포괄하는 것으로 이해된다. 예를 들어, 두 요소가 "및/또는"에 의해 결합될 경우, 첫 번째 옵션은 제2 요소없이 제1 요소의 적용 가능성을 지칭한다. 두 번째 옵션은 제1 요소 없이 제2 요소의 적용 가능성을 나타낸다. 세 번째 옵션은 제1 및 제2 요소 둘 다의 적용 가능성을 나타낸다. 이들 옵션 중 어느 것이든 그 의미 내에 속하며 따라서 본원에서 사용되는 용어 "및/또는"의 요건을 충족하는 것으로 이해된다. 옵션 중 하나 초과의 동시 적용 가능성도 그 의미 내에 속하며 따라서 용어 "및/또는"의 요건을 충족하는 것으로 이해된다.

본원에서 사용되는 바와 같이, 용어 “O 다당류”, “O 항원”, “O 항원”, “O 항원 다당류”, “O 다당류 항원” 및 약어 “OPS”는 전부 그람 음성균의 O 항원을 지칭하는데, 이는 지질다당류(LPS)의 구성요소이고 그람 음성균의 각각의 혈청형 또는 혈청(아)형에 특이적이다. 대개, O 항원은 2개 내지 7개의 당 잔기의 반복 단위(RU)를 함유한다. 본원에서 사용되는 바와 같이, RU는 생물학적 반복 단위(BRU)와 같게 설정된다. BRU는 생체 내에서 합성되는 O 항원의 RU를 설명한다. 대장균의 서로 다른 혈청형은 서로 다른 O 항원을 발현한다. 대장균에서 O 항원 생물발생에 관여하는 유전자 산물은 rfb 유전자 클러스터에 의해 암호화된다. 본원에서 O 항원 다당류를 언급할 때마다, 각각의 대장균 혈청형의 O 항원 다당류 및 이의 임의의 기존 하위 혈청형은, 달리 지시되지 않는 한, 예를 들어, O1 항원 다당류를 지칭할 때, 이것이 대장균 하위 혈청형 O1A, O1A1, O1B, 또는 O1C의 O 항원 다당류일 수 있고, 한편, O25 항원 다당류는 O25A 또는 O25B 항원 다당류 등을 의미할 수 있음을 의미한다. 많은 대장균 혈청형과 하위 혈청형 및 이의 O 항원 다당류의 RU(모이어티 구조 또는 O 단위)의 상응하는 구조는 본원에 참고로 포함된 WO 2020/039359의 표 1에 제공되어 있다.

본원에서 사용되는 "rfb 클러스터" 및 "rfb 유전자 클러스터"는 O 항원 백본 구조를 합성할 수 있는 효소 기구를 암호화하는 유전자 클러스터를 의미한다. 용어 rfb 클러스터는 임의의 O 항원 생합성 클러스터에 적용될 수 있으며, 바람직하게는 에스케리키아 속, 특히 대장균으로부터의 유전자 클러스터를 지칭한다.

본원에서 사용되는 용어 "O1A"는 대장균의 O1A 항원(대장균 혈청형 O1의 하위 혈청형)을 의미한다. 용어 "O2"는 대장균의 O2 항원(대장균 혈청형 O2)을 의미한다. 용어 "O4"는 대장균의 O4 항원(대장균 혈청형 O4)을 의미한다. 용어 "O6A"는 대장균의 O6A 항원(대장균 혈청형 O6의 하위 혈청형)을 의미한다. 용어 "O8"는 대장균의 O8 항원(대장균 혈청형 O8)을 의미한다. 용어 "O15"는 대장균의 O15 항원(대장균 혈청형 O15)을 의미한다. 용어 "O16"는 대장균의 O16 항원(대장균 혈청형 O16)을 의미한다. 용어 "O18A"는 대장균의 O18A 항원(대장균 혈청형 O18의 하위 혈청형)을 의미한다. 용어 "O25B"는 대장균으로부터의 O25B 항원(대장균 혈청형 O25의 하위 혈청형)을 의미한다. 용어 "O75"는 대장균의 O75 항원(대장균 혈청형 O75)을 의미한다. 본원에서 사용되는 용어 "글루코실화된 O4", "글루코스 분지형 O4", "O4 Glc+" 및 "Glc+ O4" O 항원은 글루코스 측 분지를 갖는 대장균의 O4 O 항원(대장균 혈청형 O4)을 의미하고, "비글루코실화된 O4", "O4 Glc-" 및 "Glc- O4"는 글루코스 측 분지가 없는 O4 항원을 지칭한다.

본 출원 전반에 걸쳐 언급된 몇몇 대장균 O 항원 다당류의 구조는 하기 표 1에 제시되어 있다. 각 대장균 O 항원 다당류에 대한 단일 반복 단위가 제시되어 있다.

표 1: 대장균 O 항원 다당류의 구조

¹ 각 n은 독립적으로 1 내지 100, 예컨대 1 내지 50, 1 내지 40, 1 내지 30, 1 내지 20 및 1 내지 10, 3 내지 50, 3 내지 40, 5 내지 30, 예를 들어, 적어도 5, 예컨대, 5 내지 40, 예를 들어, 7 내지 30, 예를 들어, 7 내지 25, 예를 들어, 10 내지 20의 정수이지만, 일부 경우 1 또는 2일 수 있다.

본원에 기재된 모든 단당류는 당업계에 공지된 일반적인 의미를 갖는다. 단당류는 D 또는 L 구성을 가질 수 있다. D 또는 L이 지정되지 않은 경우 당류는 D 구성을 갖는 것으로 이해된다. 단당류는 전형적으로 당업계에서 일반적으로 알려지고 사용되는 약어로 지칭된다. 예를 들어, Glc는 글루코스를 지칭하고, D-Glc는 D-글루코스를 지칭하고, L-Glc는 L-글루코스를 지칭한다. 단당류에 대한 다른 일반적인 약어는 다음을 포함한다: Rha, 람노스; GlcNAc, N-아세틸글루코사민; GalNAc, N-아세틸갈락토사민; Fuc, 푸코스; Man, 만노스; Man3Me, 3-O-메틸-만노스; Gal, 갈락토스; FucNAc, N-아세틸푸코사민; 및 Rib, 리보스. 접미사 "f"는 푸라노스를 나타내고, 접미사 "p"는 피라노스를 나타낸다.

O 항원과 관련하여 사용된 용어 "RU", "반복 단위" 및 "반복하는 단위"는 생체 내에서 세포 기구(예를 들어, 글리코실트랜스퍼라제)에 의해 합성되는 것으로서 O 항원의 생물학적 반복 단위(BRU)를 나타낸다. O 항원의 RU의 수는 혈청형에 따라 다를 수 있으며, 본 발명의 구현예에서, 일반적으로 약 1 내지 100 RU, 바람직하게는 약 1 내지 50 RU, 예컨대 1 내지 50 RU, 1 내지 40 RU, 1 내지 30 RU, 1 내지 20 RU 및 1 내지 10 RU, 및 더욱 바람직하게는 적어도 3 RU, 적어도 4 RU, 적어도 5 RU, 예컨대 3 내지 50 RU, 바람직하게는 5 내지 40 RU, 예를 들어 7 내지 25 RU, 예를 들어 10 내지 20 RU로 다양하다. 그러나 어떤 경우에는 O 항원의 RU 수는 1 또는 2일 수 있다. 본원에 구체적으로 기재된 각 O 항원의 구조는 RU의 수를 지정하는 변수 "n"을 갖는 하나의 RU를 함유하는 것으로 나타난다. 본 발명의 생체접합체의 각각의 O 항원 다당류에서, n은 독립적으로 1 내지 100의 정수, 예컨대 1 내지 50, 1 내지 40, 1 내지 30, 1 내지 20, 1 내지 10, 바람직하게는 적어도 3, 더욱 바람직하게는 적어도 5, 예컨대 3 내지 50, 바람직하게는 5 내지 40의 정수(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40), 더욱 바람직하게는 5 내지 30의 정수이지만, 일부 경우 1 또는 2일 수 있다. 일부 구현예에서, n은 독립적으로 약 7 내지 25, 예를 들어 약 10 내지 20의 정수이다. 값은 조성물 중 개별 O 항원 다당류 간에 다를 수 있으며, 본원에서 평균값으로서 제공된다. 즉, 생체접합체가 독립적으로 5 내지 40의 정수인 n을 갖는 것으로 본원에 기재된 경우, 조성물은 5 내지 40개의 반복 단위를 갖는 O 항원 다당류를 대부분 함유하나, 또한 5개 미만의 반복 단위 또는 40개 초과의 반복 단위를 갖는 일부 O 항원 다당류를 함유할 수 있다.

본원에서 사용되는 용어 "접합체" 및 "당접합체"는 단백질, 펩티드, 지질 등을 포함하지만 이에 한정되지 않는 또 다른 화학 종에 연결된 당 또는 당류 항원(예를 들어, 올리고당 및 다당류)-단백질 접합체를 지칭한다. 당접합체는 예를 들어 단백질과 당 또는 당류 항원의 화학적 (합성) 연결에 의해 화학적으로 제조될 수 있다. 당접합체라는 용어는 또한 생체접합체를 포함한다.

본원에서 사용되는 용어 "유효량"은 본 발명의 구현예에 따른 방법에서 대상체에게 O 항원을 투여하는 것과 관련하여 대상체에서 원하는 면역 효과 또는 면역 반응을 유도하기에 충분한 O 항원의 양을 의미한다. 특정 구현예에서, "유효량"은 대상체에서 다음의 효과 중 하나 이상을 달성하기 위해 대상체에서 면역을 생성하기에 충분한 O 항원의 양을 지칭한다: (i) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 발달 또는 발생을 예방하고/하거나; (ii) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 재발을 예방하고/하거나; (iii) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 중증도를 예방, 감소 또는 개선하고/하거나; (iv) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 기간을 감소시키고/시키거나; (v) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환, 또는 이와 관련된 증상의 진행을 예방하고/하거나; (vi) ExPEC 감염 또는 이와 관련된 증상의 퇴행을 초래하고/하거나; (vii) ExPEC 감염과 관련된 장기 부전을 예방하거나 감소시키고/시키거나; (viii) ExPEC 감염이 있는 대상체의 입원 가능성 또는 빈도를 감소시키고/시키거나; (ix) ExPEC 감염이 있는 대상체의 입원 기간을 감소시키고/시키거나; (x) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환에 걸린 대상체의 생존을 증가시키고/시키거나; (xi) ExPEC 감염, 바람직하게는 침습성 ExPEC 질환을 제거하고/하거나; (xii) ExPEC 복제를 억제 또는 감소시키고/시키거나; (xiii) 또 다른 요법의 예방 또는 치료 효과(들)를 증진시키거나 개선한다.

"유효량"은 다양한 요인, 예를 들어, 대상체의 신체 조건, 연령, 체중, 건강 등; 투여 경로, 예를 들어, 경구 또는 비경구; 투여되는 조성물, 예를 들어, 표적 O 항원, 다른 공동 투여되는 O 항원, 아쥬반트 등; 및 면역이 요망되는 특정 질환에 따라 달라질 수 있다. O 항원이 단백질 담체에 공유 결합되는 경우, O 항원에 대한 유효량은 접합체 내의 O 항원 다당류 모이어티만을 기초로 하여 계산된다. 본원에 기재된 바와 같은 생체접합체를 포함하는 접합체의 모든 농도, 양 및 비율은 또한 달리 명시되지 않는 한, 임의의 접합된 담체 단백질의 농도, 양 또는 비율과 관계 없이 접합체 내의 O 항원 다당류 모이어티의 중량만을 기초로 하여 계산된다. 예를 들어, 16 μg의 특정 생체접합체를 투여한다는 것은 투여되는 생체접합체가 16 μg의 특정 O 항원 다당류를 포함한다는 것을 의미하며, 접합된 담체 단백질의 양은 이 수치에 포함되지 않는다. 또 다른 예를 들어, 조성물이 혈청형 A 및 B로부터의 O 항원 다당류의 접합체를 2:1의 비율로 포함한다고 하면, 이는 조성물에서 접합된 담체 단백질의 중량은 무시하고, 접합된 O 항원 다당류의 중량을 기준으로 하여, 접합된 O 항원 다당류 B의 농도 또는 양의 2배의 접합된 O 항원 다당류 A의 농도 또는 양이 있음을 나타낸다.

본원에서 사용되는 용어 "침습성 장외 병원성 대장균(ExPEC) 질환(IED)"은 전신 박테리아 감염과 일치하는 급성 질환으로, 이는 혈액 또는 기타 정상적으로 멸균된 신체 부위로부터의 대장균의 분리 및 식별에 의해, 또는 침습성 질환(전신 염증 반응 증후군(SIRS), 패혈증 또는 패혈성 쇼크)의 징후 및 증상이 있고 식별 가능한 다른 감염원이 없는 환자의 소변으로부터의 대장균의 분리 및 식별에 의해 미생물학적으로 확인된다. 특정 구현예에서, IED는 전신 박테리아 감염과 일치하는 급성 질환이며, 이는 (i) 혈액 또는 기타 정상적으로 멸균된 신체 부위로부터의 대장균의 분리 및 식별에 의해, 또는 (ii) 요로 및/또는 남성 생식기에서 발생하는 감염에 대한 조절되지 않은 숙주 반응으로 인해 생명을 위협하는 기관 기능 장애가 있고 식별 가능한 다른 감염원이 없는 환자의 소변으로부터의 대장균의 분리 및 식별에 의해 미생물학적으로 확인된다.

IED는 요로 감염(UTI), 수술 부위 감염, 복부 또는 골반 감염, 폐렴, 골수염, 연조직염, 패혈증, 균혈증, 상처 감염, 신우신염, 전립선 생검 관련 감염(예를 들어, 경직장 초음파 유도 전립선 바늘 생검[TRUS-PNB] 관련 감염), 요로 패혈증, 수막염, 복막염, 담관염, 연조직 감염, 화농성 근염, 패혈성 관절염, 안내염, 화농성 갑상선염, 부비동염, 심내막염, 호중구 감소성 열 및 전립선염(급성 세균성 전립선염[ABP]을 포함하나 이에 한정되지 않음)을 포함할 수 있으나, 반드시 이에 한정되지는 않는다.

특정 바람직한 구현예에서, IED는 패혈증을 포함한다. 특정 바람직한 구현예에서, IED는 균혈증을 포함한다. 특정 구현예에서 본 발명은 대장균에 의해 유발된 패혈증을 예방하기 위한 본 발명에 따른 조성물을 제공한다. 특정 구현예에서 본 발명은 대장균에 의해 유발된 균혈증을 예방하기 위한 본 발명에 따른 조성물을 제공한다.

"패혈증에 대한 기준을 충족하는 IED 사건"이라는 용어는 감염에 대한 숙주 반응 조절 장애로 인해 생명을 위협하는 기관 기능 장애의 증거를 포함하는 IED 사례를 나타낸다. 순차적 장기 부전 평가(Sequential Organ Failure Assessment, SOFA) 총 점수가 기준선으로부터 2점 이상 급격하게 변화하고 IED에 이차적인 것으로 간주되는 경우 IED 사례는 패혈증 기준을 충족한다. 특정 구현예에서 본 발명은 패혈증에 대한 기준을 충족하는 IED를 예방하기 위한 본 발명에 따른 조성물을 제공한다. 본원에서 사용되는 "요로성 패혈증"이라는 용어는 비뇨생식관 및/또는 남성 생식기에서 기원하는 감염에 의해 발생하는 패혈증이다.

"세균성 IED"라는 용어는 혈액에서 대장균을 분리 및 식별하는 것을 포함하는 IED 사례이다. 특정 구현예에서 본 발명은 균혈증 IED를 예방하기 위한 본 발명에 따른 조성물을 제공한다.

본원에서 사용되는 바와 같이, 항원 또는 조성물에 대한 “면역학적 반응” 또는 “면역 반응”은 대상체에서 해당 항원 또는 조성물에 존재하는 항원에 대한 체액성 및/또는 세포성 면역 반응의 발생을 지칭한다.

본원에서 사용되는 바와 같이, 하나 초과의 대장균 항원 다당류를 포함하는 "조성물"은 동일한 제약 조성물에 하나 초과의 대장균 항원 다당류를 포함하는 단일 제약 조성물, 또는 개별 제약 조성물에 하나 초과의 대장균 항원 다당류를 포함하는 하나 초과의 제약 조성물의 조합일 수 있다. 바람직한 구현예에서, 조성물은 단일 제약 조성물이다. 대장균에 대한 면역 반응을 유도하는 방법에서, 하나 초과의 대장균 항원 다당류를 포함하는 "조성물"은 하나 초과의 대장균 항원 다당류를 포함하는 단일 제약 조성물과 함께 이를 필요로 하는 대상체에게 투여될 수 있거나, 또는 개별 제약 조성물로 조합하여 대상체에게 투여될 수 있다. 바람직한 구현예에서, 단일 제약 조성물이 대상체에게 투여된다.

본원에서 사용되는 바와 같이, 2개 이상의 O 항원 또는 조성물을 대상체에게 투여하는 맥락에서 "조합하여" 또는 "~의 조합"이라는 용어는 O 항원 또는 조성물이 대상체에게 투여되는 순서를 제한하지 않는다. 예를 들어, 제1 조성물은 대상체로의 제2 조성물의 투여 전(예를 들어, 5분, 15분, 30분, 45분, 1시간, 2시간, 4시간, 6시간, 12시간, 16시간, 24시간, 48시간, 72시간, 96시간, 1주, 2주, 3주, 4주, 5주, 6주, 8주 또는 12주 전), 투여와 동시에, 또는 투여 후(예를 들어, 5분, 15분, 30분, 45분, 1시간, 2시간, 4시간, 6시간, 12시간, 16시간, 24시간, 48시간, 72시간, 96시간, 1주, 2주, 3주, 4주, 5주, 6주, 8주 또는 12주 후)에 투여될 수 있다. 바람직하게는 2개 이상의 O 항원은 본질적으로 동시에, 예를 들어, 서로 5분 이내에, 대상체에게 투여되고, 더욱 바람직하게는 2개 이상의 O 항원은 동시에 적어도 2개의 조성물의 투여를 통해, 가장 바람직하게는 2개 이상의 O 항원을 포함하는 단일 조성물의 투여를 통해, 동시에 투여된다.

본원에서 사용되는 "대상체"는 본 발명의 구현예에 따른 방법 또는 조성물에 의해 백신접종될 또는 백신접종된 임의의 동물, 바람직하게는 포유류, 가장 바람직하게는 인간을 의미한다. 본원에서 사용되는 용어 "포유류"는 임의의 포유류를 포괄한다. 포유류의 예에는 비제한적으로 소, 말, 양, 돼지, 고양이, 개, 마우스, 래트, 토끼, 기니피그, 원숭이, 인간 등을 포함하고, 가장 바람직하게는 인간이다. “대상체” 및 “환자”라는 용어는 본원에서 상호교환가능하게 사용될 수 있다.

용어 “서열 동일성 퍼센트(%)” 또는 “동일성 %”는 전장의 아미노산 서열을 구성하는 아미노산 잔기의 수와 비교하여 둘 이상의 정렬된 아미노산 서열 중 동일한 아미노산의 매치(“히트(hit)”)의 수를 설명한다. 다른 말로 하면, 정렬을 이용하면, 둘 이상의 서열에 있어서, 서열들을 본 기술 분야에 공지된 바와 같은 서열 비교 알고리즘을 이용하여 측정할 경우 최대 상응도를 위하여 비교 및 정렬할 때, 또는 수동으로 정렬하고 시각적으로 점검할 때, 동일한 아미노산 잔기의 백분율(예를 들어 90%, 95%, 97% 또는 98%의 동일성)이 결정될 수 있다. 따라서 서열 동일성을 결정하기 위하여 비교되는 서열들은 아미노산의 치환(들), 부가(들) 또는 결실(들)에 의해 다를 수 있다. 단백질 서열 정렬에 적합한 프로그램은 당업자에게 공지되어 있다. 단백질 서열의 서열 동일성 백분율은 예를 들어 CLUSTALW, Clustal Omega, FASTA 또는 BLAST와 같은 프로그램을 이용하여, 예를 들어 NCBI BLAST 알고리즘을 이용하여 결정될 수 있다(Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402).

예를 들어, 아미노산 서열의 경우, 서열 동일성 및/또는 유사성은 비제한적으로 문헌[Smith and Waterman, 1981, Adv. Appl. Math. 2:482]의 국소 서열 동일성 알고리즘, 문헌[Needleman and Wunsch, 1970, J. Mol. Biol. 48:443]의 서열 동일성 정렬 알고리즘, 문헌[Pearson and Lipman, 1988, Proc. Nat. Acad. Sci. U.S.A. 85:2444]의 유사성 방법에 대한 조사, 이들 알고리즘의 컴퓨터 구현(위스콘신 제네틱스 소프트웨어 패키지의 GAP, BESTFIT, FASTA 및 TFASTA, 미국 위스콘신 주 매디슨, 사이언스 드라이브 575), 문헌[Devereux et al, 1984, Nucl. Acid Res. 12:387-395]에 기재된 Best Fit 서열 프로그램을 포함하는 당업계에 공지된 표준 기술을 이용하여, 바람직하게는 기본 설정을 사용하여, 또는 검사에 의해 결정될 수 있다. 특정 구현예에서, 퍼센트 동일성은 다음 파라미터에 기초하여 FastDB에 의해 계산된다: 1의 미스매치 패널티; 1의 갭 패널티; 0.33의 갭 크기 패널티; 및 30의 합류 패널티("Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149 (1988), Alan R. Liss, Inc.).

유용한 알고리즘의 또 다른 예는 하기 문헌에 기재된 BLAST 알고리즘이다: 문헌[Altschul et al, 1990, J. Mol. Biol. 215:403-410; Altschul et al, 1997, Nucleic Acids Res. 25:3389-3402; 및 Karin et al, 1993, Proc. Natl. Acad. Sci. U.S.A. 90:5873-5787]. 특히 유용한 BLAST 프로그램은 문헌[Altschul et al, 1996, Methods in Enzymology 266:460-480]에서 얻은 WU-BLAST-2 프로그램이다. WU-BLAST-2는 대부분 기본값으로 설정되는 여러 검색 파라미터를 사용한다.

추가의 유용한 알고리즘은 문헌[Altschul et al,1993, Nucl. Acids Res. 25:3389-3402]에 의해 보고된 바와 같은 갭핑된 BLAST이다.

대장균 O 항원

본 발명에서는 놀랍게도 담체 단백질에 접합된 대장균 O75 항원이 다가 백신 조성물의 동일한 다당류 농도의 담체 단백질에 접합된 다른 대장균 O 항원(예를 들어, O1A, O2, O4, O6A, O15, O16 및 O18A)보다 덜 면역원성인 것으로 나타난다는 점이 발견되었다. 이 발견은 대장균 O75 항원의 투여량과 다가 백신 내의 다양한 대장균 O 항원의 투여 비율에 대한 추가 조사로 이어졌으며, 이에 따라 ExPEC의 O75 혈청형 및 기타 혈청형에 대한 개선된 면역 반응을 위한 대장균 O 항원을 기반으로 한 다가 백신 및 면역화 방법이 개발되었다.

본 발명의 구현예는 대장균 O75 항원 다당류 및 하나 이상의 추가 대장균 O 항원 다당류에 관한 조성물 및 방법에 관한 것이다. 바람직하게는, 하나 이상의 추가 O 항원은 대장균의 임상 분리주 중에 널리 퍼져 있다. 본 발명에서 사용될 수 있는 이러한 대장균 항원의 예는 대장균 O1, O2, O4, O6, O8, O15, O16, O18 및 O25 항원을 포함하나 이에 한정되지 않는다. 필요에 따라, 조성물은 대장균 O75 혈청형 외에 다수의 대장균 혈청형에 대한 면역 보호를 제공하기 위해 하나 초과의 추가 대장균 O 항원, 예컨대, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개 또는 15개의 추가 대장균 O 항원을 포함할 수 있다. 일부 구현예에서, 추가 대장균 O 항원은 대장균 O1, O2, O4, O6, O15, O16, O18 및 O25 항원으로 구성된 군으로부터 선택된다. 바람직한 구현예에서, 추가 대장균 O 항원은 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A 및 O25B로 구성된 군으로부터 선택된다. 더욱 바람직하게는 조성물은 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A 및 O25B 대장균 O 항원을 모두 포함한다. 특정 구현예에서, 대장균 O 항원은 표 1에 제시된 바와 같은 구조를 포함하며, 여기서 n은 1 내지 100의 정수이다. 일부 구현예에서, n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.

일 구현예에서, 본 발명의 조성물은 대장균 O75 및 O6 항원 다당류를 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O6 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1, 예를 들어 약 1:5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1 또는 2.5:1이다. 일부 구현예에서, 조성물은 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다.

본 발명에 유용한 대장균 O 항원은 본 개시내용을 고려하여 당업계에 공지된 방법에 의해 생성될 수 있다. 예를 들어, 이들은 세포, 바람직하게는 O 항원의 생합성에 최적화된 재조합 세포로부터 생성될 수 있다. 예를 들어, WO 2006/119987, WO 2009/104074, 국제 특허 출원 제PCT/EP2015/053739호, 문헌[Ihssen et al., 2010, Microbial Cell Factories 9, 61](이의 개시내용은 전체가 본원에 참조로 포함됨)에서 대장균 O 항원 생합성을 위한 핵산, 단백질, 숙주 세포, 생산 방법 등에 대한 관련 개시내용 참조.

담체 단백질

본 발명의 구현예에 따르면, 각각의 대장균 O 항원은 바람직하게는 글리코시드 결합에 의해, 담체 단백질에 공유 결합된다. 본 개시를 고려하여 당업자에게 알려진 임의의 담체 단백질이 사용될 수 있다. 적합한 담체 단백질은 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), CRM₁₉₇, 대장균 플라겔린(FliC), 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D를 포함한다. 요구되는 공통 글리코실화 서열을 함유하는 다양한 상이한 담체 단백질과의 생체접합이 설명되었으며, 이는 이 기술을 사용하여 광범위한 단백질이 글리코실화될 수 있음을 보여준다(예를 들어, WO 06/119987, WO 2015/124769, WO 2015/158403, WO 2015/82571, WO 2017/216286 및 WO 2017/67964 참조, 이들은 함께 생체접합에 성공적으로 사용된 광범위한 담체 단백질을 보여준다).

특정 구현예에서 담체 단백질은 변형된다. 예를 들어 단백질이 덜 독성이고/거나 글리코실화에 더 민감한 방식으로 변형된다. 특정 구현예에서, 본원에 사용된 담체 단백질은 더 낮은 농도의 단백질이 예를 들어, 면역원성 조성물 중에서 특히, 이의 생체접합체 형태로 투여되도록 하는 방식으로 담체 단백질의 글리코실화 부위의 수가 최대화되도록 변형된다.

따라서, 특정 구현예에서, 본원에 기재된 담체 단백질은 (예를 들어, 담체 단백질이 이의 천연/자연, 즉, "야생형" 상태에서 관련된 글리코실화 부위의 수와 비교하여) 일반적으로 담체 단백질과 관련된 것보다 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 글리코실화 부위를 포함하도록 변형된다. 담체 단백질 내로의 글리코실화 부위의 도입은, 예를 들어 글리코실화 부위가 완전히 또는 부분적으로 추가되도록 단백질의 일차 구조에 새로운 아미노산을 추가하여, 단백질의 일차 구조 임의의 곳에서 글리코실화 공통 서열을 삽입함으로써, 또는 글리코실화 부위를 생성하기 위해 단백질 내의 기존 아미노산을 돌연변이시킴으로써 달성될 수 있다. 당업자는 당업계에 공지된 접근법, 예를 들어 단백질을 암호화하는 핵산 서열의 변형을 포함하는 재조합 접근법을 이용하여 단백질의 아미노산 서열이 용이하게 변형될 수 있음을 인식할 것이다. 특정 구현예에서, 글리코실화 공통 서열은 담체 단백질의 특정 영역, 예를 들어 단백질의 표면 구조 내에 단백질의 N 또는 C 말단에 및/또는 단백질 염기의 이황화 가교에 의해 안정화되는 루프에 도입된다. 일부 구현예에서, 글리코실화 공통 서열은 더욱 효율적인 글리코실화를 위해 리신 잔기의 첨가에 의해 연장될 수 있다.

담체 단백질에 삽입되거나 생성될 수 있는 글리코실화 공통 서열의 예시적인 예는 Asn-X-Ser(Thr)(여기서, X는 Pro를 제외한 임의의 아미노산일 수 있음)(서열번호 1); 및 바람직하게는 Asp(Glu)-X-Asn-Z-Ser(Thr)(여기서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨)(서열번호 2)를 포함한다.

일부 구현예에서,대장균 O 항원 다당류는 담체 단백질 내의 아스파라긴(Asn) 잔기에 공유 결합되며(예를 들어, N-연결됨), 여기서 Asn 잔기는 서열번호 1, 더욱 바람직하게는 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 글리코실화 부위에 존재한다. 전형적으로, 담체 단백질은 1 내지 10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1 내지 10개, 바람직하게는 2 내지 4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 서열번호 1의 아미노산 서열, 더욱 바람직하게는 서열번호 2의 아미노산 서열을 갖는 글리코실화 공통 서열을 포함한다.

특정 구현예에서, 담체 단백질은 P. 애루기노사의 탈독소화된 외독소 A이다. EPA의 경우, 다양한 탈독소화된 단백질 변이체가 문헌에 설명되어 있으며 담체 단백질로 사용될 수 있었다. 예를 들어, 탈독소화는 문헌[Lukac et al., 1988, Infect Immun, 56: 3095-3098 및 Ho et al., 2006, Hum Vaccin, 289-98]에 따라 촉매적으로 필수적인 잔기 L552V 및 ΔE553을 돌연변이시키고 결실시킴으로써 달성될 수 있다. 본원에서 사용되는 바와 같은 "EPA"는 P. 애루기노사의 탈독소화된 외독소 A를 나타낸다. 담체 단백질이 EPA인 이러한 구현예에서, 대장균 항원 다당류는 서열번호 1을 갖는 글리코실화 공통 서열을 포함하는 글리코실화 부위의 Asn 잔기에 공유 결합될 수 있으며, 바람직하게는 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 글리코실화 부위의 Asn 잔기에 공유 결합될 수 있다. 바람직하게는,EPA 담체 단백질은 1 내지 10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1 내지 10개, 바람직하게는 2 내지 4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 서열번호 1의 아미노산 서열, 더욱 바람직하게는 서열번호 2의 아미노산 서열을 갖는 글리코실화 공통 서열을 포함한다.

일부 구현예에서, EPA 담체 단백질은 각각 글리코실화 공통 서열을 포함하는 4개의 글리코실화 부위, 예를 들어 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 글리코실화 부위를 포함한다. 본원에서 사용된 바와 같이, "EPA-4 담체 단백질" 및 "EPA-4"는 각각 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 4개의 글리코실화 부위를 포함하는 P. 애루기노사 담체 단백질의 탈독소화된 외독소 A를 지칭한다. EPA-4 담체 단백질의 예시적인 바람직한 예는 서열번호 3의 아미노산 서열을 포함하는 EPA 담체 단백질이다.

특정 구현예에서, EPA 담체 단백질은, 담체 단백질을 발현하는 숙주 세포의 주변 세포질 공간으로 담체 단백질을 표적화하는 신호 서열(예컨대, 대장균 DsbA, 대장균 외막 포린 A(OmpA), 대장균 말토스 결합 단백질(MalE) 등에 대한 신호 펩티드)과 함께 생성될 수 있다. EPA 담체 단백질은 또한 "태그", 즉 담체 단백질의 분리 및/또는 식별을 가능하게 하는 아미노산 서열로 변형될 수 있다.

본 발명에 유용한 EPA 담체 단백질은 본 개시내용을 고려하여 당업계에 공지된 방법에 의해 생성될 수 있다. 예를 들어, 문헌[Ihssen et al., 2010, Microbial Cell Factories 9, 61] 및 WO 2006/119987, WO 2009/104074 및 WO 2015/124769(이의 개시내용은 전체가 본원에 참조로 포함됨)의 관련 개시내용 참조.

다른 구현예에서, 담체 단백질은 CRM₁₉₇이다. CRM₁₉₇ 단백질은 디프테리아 독소의 비독성 형태이지만, 면역학적으로 디프테리아 독소와 구별할 수 없다. CRM₁₉₇은 독소 생성 코리네파지 베타의 니트로소구아니딘 돌연변이 생성에 의해 생성된 비독소 생성 파지 β197^tox-에 의해 감염된 코리네박테리움 디프테리애(Corynebacterium diphtheriae)에 의해 생성된다(Uchida et al. (1971) Nature New Biology 233:8-11). CRM₁₉₇ 단백질은 디프테리아 독소와 분자량은 같지만 구조 유전자의 단일 염기 변화(구아닌에서 아데닌으로)에 의해 상이하다. 이 단일 염기 변화는 성숙한 단백질에서 아미노산 치환(글리신 대신 글루탐산)을 일으키고 디프테리아 독소의 독성 특성을 제거한다. CRM₁₉₇ 단백질은 당류에 대한 안전하고 효과적인 T 세포 의존성 담체이다. CRM₁₉₇ 단백질의 아미노산 서열은 서열번호 20에 제시되어 있다. CRM₁₉₇ 및 이의 생성에 대한 추가 상세 내용은 예를 들어, 미국 특허 제5,614,382호에서 찾을 수 있다. 일 구현예에서, 본 발명의 O 항원 다당류는 CRM₁₉₇ 단백질 또는 CRM₁₉₇의 A 사슬에 접합된다(CN103495161 참조). 일 구현예에서, 본 발명의 O 항원 다당류는 유전자 재조합 대장균에 의한 발현을 통해 얻은 CRM₁₉₇의 A 사슬에 접합된다(CN103495161 참조). 일 구현예에서, 본 발명의 O 항원 다당류는 각각 독립적으로 CRM₁₉₇에 접합된다. 일 구현예에서, 본 발명의 O 항원 다당류는 각각 독립적으로 CRM₁₉₇의 A 사슬에 접합된다.

접합체

용어 "생체접합체"는 숙주 세포 배경, 바람직하게는 박테리아 숙주 세포, 예를 들어, 대장균 숙주 세포에서 제조된 단백질(예를 들어, 담체 단백질)과 당 또는 당류 항원(예를 들어, 올리고당 및 다당류) 사이의 접합체를 지칭하며, 여기서 숙주 세포 기구는 항원을 단백질에 연결한다(예를 들어, N-연결). 바람직하게는, 용어 "생체접합체"는 숙주 세포 배경에서 제조된 단백질(예를 들어, 담체 단백질)과 O 항원, 바람직하게는 대장균 O 항원(예를 들어, O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B, O75 등) 사이의 접합체를 지칭하며, 여기서 숙주 세포 기구는 항원을 단백질에 연결한다(예를 들어, N-연결). 생체접합체는 숙주 세포 기구에 의해 숙주 세포에서 제조되기 때문에, 항원과 단백질은 생체접합체에서 글리코시드 연결 또는 결합을 통해 공유 결합된다. 생체접합체는 O 항원을 합성하고/하거나 O 항원을 표적 단백질에 연결하는 데 필요한 세포 기구를 발현하도록 조작된 재조합 숙주 세포에서 제조될 수 있다. 본원에 기재된 바와 같은 생체접합체는 글리칸이 박테리아 세포벽으로부터 정제되고 이어서 담체 단백질에 화학적으로 결합되는 화학적으로 제조된 당접합체에 비해 유리한 특성을 갖는다. 예를 들어, 생체접합체는 제조 시 더 적은 화학물질을 필요로 하고 생성된 최종 생성물의 관점에서 더 일관성이 있고, 유리(즉, 담체 단백질에 결합되지 않은) 글리칸을 더 적게 포함하거나 전혀 포함하지 않는다. 지질 A가 없는 O 항원의 정제 및 후속적인 담체 단백질에 대한 화학적 접합은 길고 힘든 과정이다. 또한, 정제, 지질 A 탈독소화 및 화학적 접합 과정은 접합된 다당류의 에피토프 손실, 항원 이질성 및 감소된 면역원성을 초래할 수 있다. 생체접합에 의한 당접합체의 합성은 고전적인 정제 및 화학적 접합의 이러한 한계를 극복할 수 있다. 따라서, 전형적인 구현예에서, 화학적으로 생성된 당접합체보다 생체접합체가 바람직하다.

특정 구현예에서, 숙주 세포는 대장균 O 항원 및 EPA 담체 단백질을 생산할 수 있고, O 항원을 EPA 담체 단백질에 공유 결합시켜 본 발명에 유용한 생체접합체를 형성할 수 있다. 예를 들어, 문헌[Ihssen et al., 2010, Microbial Cell Factories 9, 61] 및 WO 2006/119987, WO 2009/104074 및 WO 2015/124769(이의 개시내용은 전체가 본원에 참조로 포함됨)의 관련 개시내용 참조.

특정 구현예에서, 담체 단백질은 본 발명에 유용한 대장균 O 항원에 N-연결된다. 예를 들어, 대장균 O 항원은 담체 단백질의 글리코실화 서열, 예컨대, Asn-X-Ser(Thr)(여기서, X는 Pro를 제외한 임의의 아미노산일 수 있음)(서열번호 2), 바람직하게는 Asp(Glu)-X-Asn-Z-Ser(Thr)(여기서, X 및 Z는 Pro를 제외한 임의의 천연 아미노산으로부터 독립적으로 선택됨)(서열번호 3)의 Asn 잔기에 연결된다.

대안적으로, 당접합체는 화학적 합성에 의해 제조될 수 있다. 즉, 숙주 세포 외부에서(시험관 내) 제조될 수 있다. 예를 들어, 본원에 기재된 대장균 O 항원, 예를 들어 O75 항원은 다당류/올리고당에서 활성화 반응성 기 및 단백질 담체를 사용하는 것을 포함하여 당업자에게 공지된 방법을 사용하여 담체 단백질에 접합될 수 있다. 예를 들어, 문헌[Pawlowski et al., 2000, Vaccine 18:1873-1885; 및 Robbins et al., 2009, Proc Natl Acad Sci USA 106:7974-7978](이의 개시내용은 본원에 참조로 포함됨) 참조. 이러한 접근법은 숙주 세포로부터 항원성 다당류/올리고당의 추출, 다당류/올리고당의 정제, 다당류/올리고당의 화학적 활성화 및 다당류/올리고당의 담체 단백질로의 접합을 포함한다. 담체 단백질에 대한 화학적 접합을 사용하여 담체 단백질에 접합된 대장균 O 항원의 당접합체를 제조하는 방법 및 이러한 당접합체를 포함하는 조성물은 또한 WO 2020/039359에 기재되어 있다.

예를 들어 접합체는 CDAP 화학을 사용하여 제조할 수 있다. 이들 구현예에서, 다당류는 1-시아노-4-디메틸아미노 피리디늄 테트라플루오로보레이트(CDAP)로 활성화되어 시아네이트 에스테르를 형성한다. 그런 다음 활성화된 다당류는 직접 또는 스페이서(링커) 기를 통해 담체 단백질(예를 들어, EPA 또는 CRM₁₉₇)의 아미노 기에 커플링된다. 예를 들어, 스페이서는 시스타민 또는 시스테아민일 수 있어 말레이미드-활성화된 담체 단백질(예를 들어 N-[γ-말레이미도부티릴록시]숙신이미드 에스테르(GMBS)를 사용) 또는 할로아세틸화된 담체 단백질(예를 들어 요오도아세트이미드, N-숙신이미딜 브로모아세테이트(SBA; SIB), N-숙신이미딜(4-요오도아세틸)아미노벤조에이트(SIAB), 설포숙신이미딜(4-요오도아세틸)아미노벤조에이트(설포-SIAB), N-숙신이미딜 요오도아세테이트(SIA) 또는 숙신이미딜 3-[브로모아세트아미도]프로피오네이트(SBAP)를 사용)와의 반응 후에 수득된 티오에테르 연결을 통해 담체에 커플링될 수 있는 티올화된 다당류를 제공할 수 있다. 바람직하게는, 시아네이트 에스테르(선택적으로 CDAP 화학에 의해 제조됨)는 헥산 디아민 또는 아디프산 디히드라지드(ADH)와 커플링되고, 아미노 유도체화된 당류는 단백질 담체 상의 카르복실 기를 통한 카르보디이미드(예를 들어, EDAC 또는 EDC) 화학을 이용하여 담체 단백질(예를 들어, EPA 또는 CRM₁₉₇)에 접합된다. 이러한 접합체는 예를 들어 WO 93/15760, WO 95/08348 및 WO 96/129094에 기재되어 있다.

접합을 위한 다른 적합한 기술은 카르보디이미드, 히드라지드, 활성 에스테르, 노르보란, p-니트로벤조산, N-하이드록시숙신이미드, S-NHS, EDC, TSTU를 사용한다. 다수가 WO 98/42721에 기재되어 있다. 접합은 카르보닐 링커를 수반할 수 있으며, 이는 당류의 유리 하이드록실 기와 CDI의 반응에 의해 형성될 수 있고(문헌[Bethell et al. (1979) 1. Biol. Chern. 254:2572-2574; Hearn et al. (1981) J. Chromatogr. 218:509-518] 참조), 이어서 단백질과 반응하여 카바메이트 연결을 형성할 수 있다. 이는 아노머 말단의 1차 하이드록실 기로의 환원, 1차 하이드록실 기의 선택적 보호/탈보호, 1차 하이드록실 기와 CDI의 반응에 의한 CDI 카바메이트 중간체 형성 및 CDI 카바메이트 중간체의 단백질 상의 아미노 기와의 커플링을 수반할 수 있다.

다른 구현예에서, 접합체는 환원적 아민화를 사용하여 제조된다. 환원적 아민화는 두 단계, 즉 (1) 다당류의 산화, (2) 활성화된 다당류 및 담체 단백질의 환원에 의한 접합체 형성을 포함한다. 산화 전에 다당류는 선택적으로 가수분해된다. 기계적 또는 화학적 가수분해가 사용될 수 있다. 화학적 가수분해는 아세트산을 사용하여 수행할 수 있다.

산화 단계는 과요오드산염과의 반응을 수반할 수 있다. 본 발명의 목적을 위해, "과요오드산염"이라는 용어는 과요오드산염 및 과요오드산을 포함하고; 이 용어는 또한 메타과요오드산염(IO₄ ^-)과 오르토과요오드산염(IO₆ ^5-)을 포함하고 과요오드산염의 다양한 염(예를 들어, 과요오드산 나트륨 및 과요오드산 칼륨)을 포함한다. 일 구현예에서, 협막 다당류는 메타과요오드산염의 존재 하에, 바람직하게는 과요오드산 나트륨(NaIO₄)의 존재 하에 산화된다. 또 다른 구현예에서 협막 다당류는 오르토과요오드산염의 존재 하에, 바람직하게는 과요오드산의 존재 하에 산화된다.

일 구현예에서, 산화제는 (WO 2014/097099에 기재된 바와 같이) 1차 하이드록실을 선택적으로 산화시키는 산화제의 존재 하에 피페리딘-N-옥시 또는 피롤리딘-N-옥시 화합물과 같은 안정한 니트록실 또는 니트록사이드 라디칼 화합물이다. 상기 반응에서, 실제 산화제는 촉매 순환에서 N-옥소암모늄 염이다. 일 양태에서, 상기 안정한 니트록실 또는 니트록사이드 라디칼 화합물은 피페리딘-N-옥시 또는 피롤리딘-N-옥시 화합물이다. 일 양태에서, 상기 안정한 니트록실 또는 니트록사이드 라디칼 화합물은 TEMPO(2,2,6,6-테트라메틸-1-피페리디닐옥시) 또는 PROXYL(2,2,5,5-테트라메틸-1-피롤리디닐옥시) 모이어티를 보유한다. 일 양태에서, 상기 안정한 니트록실 라디칼 화합물은 TEMPO 또는 이의 유도체이다. 일 양태에서, 상기 산화제는 N-할로 모이어티를 갖는 분자이다. 일 양태에서, 상기 산화제는 N-클로로숙신이미드, N-브로모숙신이미드, N-요오도숙신이미드, 디클로로이소시아누르산, 1,3,5-트리클로로-1,3,5-트리아지난-2,4,6-트리온, 디브로모이소시아누르산, 1,3,5-트리브로모-1,3,5-트리아지난-2,4,6-트리온, 디요오도이소시아누르산 및 1,3,5-트리요오도-1,3,5-트리아지난-2,4,6-트리온으로 구성된 군으로부터 선택된다. 바람직하게는 상기 산화제는 N-클로로숙신이미드이다.

선택적으로 산화 반응은 ??칭제의 첨가에 의해 ??칭된다. ??칭제는 인접한 디올, 1,2-아미노알코올, 아미노산, 글루타티온, 설파이트, 바이설페이트, 다이티오나이트, 메타바이설파이트, 티오설페이트, 포스파이트, 하이포포스파이트 또는 아인산(예를 들어, 글리세롤, 에틸렌 글리콜, 프로판-1,2-디올, 부탄-1,2-디올 또는 부탄-2,3-디올, 아스코르브산)으로부터 선택된다.

다당류의 산화 단계 후, 다당류는 활성화된다고 하며 이하에서 "활성화된 다당류"라고 한다. 활성화된 다당류 및 담체 단백질은 독립적으로(분리된 동결건조) 또는 함께(공동 동결건조) 동결건조(냉동 건조)될 수 있다. 일 구현예에서 활성화된 다당류 및 담체 단백질은 공동 동결건조된다. 또 다른 구현예에서 활성화된 다당류 및 담체 단백질은 독립적으로 동결건조된다.

일 구현예에서 동결건조는 비환원당의 존재 하에 발생하며, 가능한 비환원당은 수크로스, 트레할로스, 라피노스, 스타키오스, 멜레지토스, 덱스트란, 만니톨, 락티톨 및 팔라티니트를 포함한다.

접합 과정의 두 번째 단계는 환원제를 사용하여 활성화된 다당류와 담체 단백질의 환원을 통한 접합체 형성(소위 환원적 아민화)이다. 적합한 환원제는 시아노보로하이드라이드(예를 들어, 브뢴스테드 또는 루이스 산의 존재 하에 나트륨 시아노보로하이드라이드, 나트륨 트리아세톡시보로하이드라이드 또는 나트륨 또는 아연 보로하이드라이드), 아민 보란, 예컨대 피리딘 보란, 2-피콜린 보란, 2,6-디보란-메탄올, 디메틸아민-보란, t-BuMeⁱPrN-BH₃, 벤질아민-BH₃ 또는 5-에틸-2-메틸피리딘 보란(PEMB) 또는 보로하이드라이드 교환 수지를 포함한다. 일 구현예에서 환원제는 나트륨 시아노보로하이드라이드이다.

일 구현예에서, 환원 반응은 수성 용매(예를 들어, PBS, MES, HEPES, Bis-tris, ADA, PIPES, MOPSO, BES, MOPS, DIPSO, MOBS, HEPPSO, POPSO, TEA, EPPS, Bicine 또는 HEPB로부터 선택됨, pH 6.0 내지 8.5, 7.0 내지 8.0, 또는 7.0 내지 7.5)에서 수행되고, 또 다른 구현예에서 반응은 비양성자성 용매에서 수행된다. 일 구현예에서, 환원 반응은 DMSO(디메틸설폭사이드) 또는 DMF(디메틸포름아미드) 용매에서 수행된다. DMSO 또는 DMF 용매는 동결건조된 활성화된 다당류 및 담체 단백질을 재구성하기 위해 사용될 수 있다.

환원 반응의 종료 시, 접합체에 미반응 알데히드 기가 남아 있을 수 있으며, 이들은 적절한 캡핑제를 사용하여 캡핑될 수 있다. 일 구현예에서 이 캡핑제는 나트륨 보로하이드라이드(NaBH₄)이다.

다른 구현예에서, 접합체는 WO 2014/027302에 기재된 바와 같이 eTEC 접합을 사용하여 제조된다. 상기 당접합체는 하나 이상의 eTEC 스페이서를 통해 담체 단백질에 공유 접합된 당류를 포함하고, 여기서 당류는 카바메이트 연결을 통해 eTEC 스페이서에 공유 접합되고, 담체 단백질은 아미드 연결을 통해 eTEC 스페이서에 공유 접합된다. 본 발명의 eTEC 연결된 당접합체는 일반식 I로 표시될 수 있다:

[일반식 I]

여기서 eTEC 스페이서를 포함하는 원자는 중심 상자에 포함된다.

eTEC 스페이서는 7개의 선형 원자(즉, -C(O)NH(CH₂)₂SCH₂C(O)-)를 포함하고 당류와 담체 단백질 사이에 안정한 티오에테르 및 아미드 결합을 제공한다. eTEC 연결된 당접합체의 합성은 당류의 활성화된 하이드록실 기와 티오알킬아민 시약, 예를 들어 시스타민 또는 시스테인아민 또는 이의 염의 아미노 기의 반응을 수반하여, 당류에 대한 카바메이트 연결을 형성하여 티올화된 당류를 제공한다. 하나 이상의 유리 설프하이드릴 기의 생성은 환원제와의 반응에 의해 달성되어 활성화된 티올화 당류를 제공한다. 아민 함유 잔기 상에 하나 이상의 α-할로아세트아미드 기를 갖는 활성화된 담체 단백질과 활성화된 티올화 당류의 유리 설프하이드릴 기와의 반응은 티오에테르 결합을 생성하여 접합체를 형성하며, 여기서 담체 단백질은 아미드 결합을 통해 eTEC 스페이서에 부착된다.

본원에 기재된 접합체는 단백질의 정제를 위해 당업계에 공지된 임의의 방법, 예를 들어 크로마토그래피(예를 들어, 이온 교환, 음이온 교환, 친화성 및 사이징 컬럼 크로마토그래피), 원심분리, 차등 용해도, 또는 단백질 정제를 위한 임의의 기타 표준 기술에 의해 정제할 수 있다. 예를 들어, 문헌[Saraswat et al., 2013, Biomed. Res. Int. ID#312709 (p. 1-18)] 참조; 또한, WO 2009/104074에 기재된 방법 참조. 특정 접합체를 정제하는 데 사용되는 실제 조건은 부분적으로 합성 전략(예를 들어, 합성 생산 대 재조합 생산) 및 생체접합체의 순 전하, 소수성 및/또는 친수성과 같은 요인에 따라 달라질 것이며, 당업자에게 명백할 것이다.

숙주 세포

대장균 O 항원 및 이러한 대장균 O 항원을 포함하는 생체접합체를 생산할 수 있는 숙주 세포, 예를 들어 원핵 숙주 세포가 본원에 기재되어 있다. 본원에 기재된 숙주 세포는 바람직하게는 대장균 O 항원 다당류 및/또는 이의 생체접합체를 생산하는 데 사용되는 숙주 세포 기구(예를 들어, 글리코실트랜스퍼라제)를 암호화하는 하나 이상의 핵산을 포함하도록 (예를 들어, 유전 공학을 통해) 변형된다.

고세균, 원핵 숙주 세포 및 진핵 숙주 세포를 포함하는 당업자에게 공지된 임의의 숙주 세포를 사용하여 본원에 기재된 대장균 O 항원 다당류(예를 들어, 대장균 O75 다당류) 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 생체접합체(예를 들어, 대장균 O75 항원 다당류의 생체접합체)를 생산할 수 있다. 바람직한 구현예에서, 숙주 세포는 원핵 숙주 세포이다. 본원에 기재된 대장균 O 항원 다당류 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 생체접합체의 생산에 사용하기 위한 예시적인 원핵 숙주 세포는 비제한적으로, 에스케리키아 종, 쉬겔라(Shigella) 종, 클레브시엘라(Klebsiella) 종, 잔토모나스(Xhantomonas) 종, 살모넬라(Salmonella) 종, 예르시니아(Yersinia) 종, 락토코커스(Lactococcus) 종, 락토바실러스(Lactobacillus) 종, 슈도모나스(Pseudomonas) 종, 코리네박테리움(Corynebacterium) 종, 스트렙토마이세스(Streptomyces) 종, 스트렙토코커스(Streptococcus) 종, 스타필로코커스(Staphylococcus) 종, 바실러스(Bacillus) 종 및 클로스트리듐(Clostridium) 종을 포함한다.

특정 구현예에서, 본원에 기재된 대장균 O 항원 다당류 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 생체접합체를 생산하는 데 사용되는 숙주 세포는 원핵 숙주 세포이고, 바람직하게는 대장균이다.

특정 구현예에서, 본원에 기재된 대장균 O 항원 다당류 및 생체접합체를 생산하는 데 사용되는 숙주 세포는 이종 핵산, 예를 들어 원하는 O 항원 혈청형의 rfb 유전자 클러스터를 포함하는 이종 핵산, 하나 이상의 담체 단백질 및/또는 글리코실트랜스퍼라제를 암호화하는 이종 핵산을 포함하도록 조작된다. 특정 구현예에서, 이종 rfb 유전자 및/또는 글리코실화 경로(예를 들어, 원핵생물 및/또는 진핵생물 글리코실화 경로)에 관여하는 단백질을 암호화하는 이종 핵산은 본원에 기재된 숙주 세포 내로 도입될 수 있다. 이러한 핵산은 올리고사카릴 트랜스퍼라제 및/또는 글리코실트랜스퍼라제를 포함하지만 이에 한정되지 않는 단백질을 암호화할 수 있다.

예를 들어 대장균 O 항원 다당류 및 이의 생체접합체를 제조하는데 사용될 수 있는 재조합 숙주 세포를 만드는 데 유용한 글리코실트랜스퍼라제를 암호화하는 다양한 유전자 및 유전자 클러스터의 서열이 본원에 기재되어 있다. 당업자는 유전자 코드의 축퇴성으로 인해 특정 아미노산 서열을 갖는 단백질이 다수의 상이한 핵산에 의해 암호화될 수 있음을 인식할 것이다. 따라서, 당업자는 핵산에 의해 암호화되는 단백질의 아미노산 서열에 영향을 미치지 않으면서, 본원에서 제공되는 핵산의 서열이 본원에서 제공되는 서열과 상이한 방식으로 변경될 수 있음을 이해할 것이다.

대장균 O75 항원 다당류, O1A 항원 다당류, O2 항원 다당류, 글루코실화 또는 비글루코실화 O4 항원 다당류, O6A 항원 다당류, O8 항원 다당류, O15 항원 다당류, O16 항원 다당류, O18A 항원 다당류, 또는 O25B 항원 다당류의 생체접합체를 생산하기 위한 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 기재되어 있다. 본원에 기재된 숙주 세포는 대장균 O 항원 다당류를 생산할 수 있는 효소(예를 들어, 글리코실트랜스퍼라제)를 암호화하는 핵산을 포함한다. 본원에 기재된 숙주 세포는 관심 O 항원을 생성할 수 있는 핵산을 자연적으로 발현할 수 있거나, 숙주 세포는 이러한 핵산을 발현하도록 제조될 수 있다. 특정 구현예에서 핵산은 숙주 세포에 대해 이종이며 당업계에 공지된 유전적 접근법을 사용하여 숙주 세포에 도입된다. 예를 들어, 핵산은 유전자 조작에 의해 숙주 세포로 도입될 수 있다(예를 들어, 유전자 클러스터는 플라스미드 또는 플라스미드들에서 발현되거나 숙주 세포 게놈으로 통합된다(예를 들어, WO 2014/037585, WO 2014/057109, WO 2015/052344 참조).

또한, 담체 단백질에 공유 결합된 대장균 O1A, O2, 글루코실화 또는 비글루코실화 O4, O6A, O8, O15, O16, O18A, O25B, 또는 O75 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 기재되어 있다. 이러한 숙주 세포(예를 들어, 재조합 숙주 세포)는 O 항원 다당류에 특이적인 rfb 유전자 클러스터의 뉴클레오티드 서열을 포함한다. rfb 유전자 클러스터는 야생형 대장균 균주로부터 분리될 수 있고, 하나의 숙주 세포 내에서 올리고사카릴 트랜스퍼라제(예를 들어, PglB) 및 담체 단백질(예를 들어, EPA)을 암호화하는 핵산과 조합되어 관심 대장균 O 항원 또는 이의 생체접합체를 생산하는 재조합 숙주 세포를 얻을 수 있다. 예를 들어, 이러한 숙주 세포는 WO 2015/124769, WO 2014/037585, WO 2009/104074 및 WO 2009/089396에 기재된 것과 같은 생체접합 기술을 이용한 rfb 유전자 클러스터, 올리고사카릴 트랜스퍼라제(예를 들어, PglB) 및 담체 단백질(예를 들어, EPA)을 포함하는 하나 이상의 플라스미드를 포함하는 재조합 접근법을 사용하여 조작될 수 있다. 바람직하게는 숙주 세포는 이들의 게놈에 통합된 rfb 유전자 클러스터를 포함한다. 올리고사카릴 트랜스퍼라제, 담체 단백질 및 적용 가능한 경우 gtrS 유전자를 암호화하는 핵산은 특정 구현예에서 또한 숙주 세포의 게놈으로 통합된다. 이종 또는 상동 gtrA 및 gtrB 유전자는 특정 구현예에서 또한 숙주 세포의 게놈으로 통합된다.

O1A, O2, O6A 및 O25B 항원에 대한 생체접합체의 제조는 WO 2015/124769 및 WO 2017/035181에 상세히 기재되어 있다. 각각의 대장균 O 항원(rfb 유전자좌)에 대한 예시적인 유전자 클러스터는 문헌[Iguchi A, et al, DNA Research, 2014, 1-7] 및 문헌[DebRoy C, et al, PLoS One. 2016, 11(1):e0147434; correction in: Plos One. 2016, 11(4):e0154551)]에 기재되어 있다. rfb 클러스터에 대한 핵산 서열 및 그 안에 암호화된 단백질에 대한 아미노산 서열은 또한 GenBank와 같은 공개 데이터베이스에서 찾을 수 있다. 본원에 개시된 혈청형의 다당류 항원과의 생체접합체용 생산 균주에 사용될 수 있는 rfb 클러스터의 예시적인 서열은 또한 서열번호 9 및 11 내지 19에 제공된다. 따라서, 상기 언급된 각각의 원하는 생체접합체에 대해, 각각의 rfb 클러스터를 숙주 세포에 도입하여 원하는 O 항원에 대한 특정 rfb 클러스터를 가질 뿐만 아니라 올리고사카릴 트랜스퍼라제 및 담체 단백질을 암호화하는 핵산을 함유하는 숙주 세포를 얻을 수 있다. 전술한 이유로, 바람직하게는 숙주 세포는 재조합 숙주 세포이고, 바람직하게는 상대적으로 잘 알려진 특징을 갖는 균주, 예를 들어 대장균 실험실 또는 생산 균주, 예를 들어 대장균 K12 또는 대장균 BL21 등으로부터 유래된다. 바람직하게는, rfb 클러스터는 숙주 세포에 대해 이종성이며, 예를 들어 숙주 세포의 전구체 세포로 도입되고, 바람직하게는 이의 게놈으로 통합된다. 바람직하게는 원래의 rfb 유전자 클러스터가 전구체 세포에 존재하는 경우, 이는 숙주 세포에서 관심 O 항원에 대한 rfb 유전자 클러스터로 대체되어 관심 O 항원의 생체접합체의 생산을 가능하게 하였다. 바람직하게는 올리고사카릴 트랜스퍼라제는 숙주 세포에 대해 이종성이며, 특정 구현예에서 이러한 올리고사카릴 트랜스퍼라제를 암호화하는 핵산은 숙주 세포의 게놈에 통합된다.

본원에 기재된 임의의 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포)는 단백질의 N-글리코실화에서 활성인 추가 효소를 암호화하는 핵산을 포함하며, 예를 들어 본원에 기재된 숙주 세포는 올리고사카릴 트랜스퍼라제를 암호화하는 핵산 또는 다른 글리코실트랜스퍼라제를 암호화하는 핵산을 추가로 포함할 수 있다.

본원에 기재된 숙주 세포는 전형적으로 올리고사카릴 트랜스퍼라제를 암호화하는 핵산을 포함한다. 이러한 올리고사카릴 트랜스퍼라제는 N-글리코실화 공통 모티프를 포함하는 초기 폴리펩티드 사슬의 아스파라긴 잔기로 지질 연결된 올리고당을 전달한다. 올리고사카릴 트랜스퍼라제를 암호화하는 핵산은 숙주 세포 고유의 것일 수 있거나 유전적 접근법을 사용하여 숙주 세포에 도입될 수 있다. 바람직한 구현예에서, 올리고사카릴 트랜스퍼라제는 숙주 세포에 대해 이종이다. 대장균은 자연적으로 올리고사카릴 트랜스퍼라제를 포함하지 않으므로, 대장균이 생체접합체 생산을 위한 숙주 세포로 사용되는 경우, 이종 올리고사카릴 트랜스퍼라제가 예를 들어, 유전자 조작에 의해 도입 시, 이러한 숙주 세포에 포함된다. 올리고사카릴 트랜스퍼라제는 본 개시내용을 고려하여 당업계에 공지된 임의의 공급원으로부터 유래할 수 있다.

특정 구현예에서, O-글리코실트랜스퍼라제와 같은 N-글리코실트랜스퍼라제 활성을 갖는 올리고사카릴 트랜스퍼라제에 대한 대안, 예를 들어 비제한적 예로서 PglL은 예를 들어 WO 2016/82597 및 WO 2020/120569에 기재된 바와 같이 담체 단백질에서 자체의 상이한 글리코실화 공통 서열과 함께 사용될 수 있다. 따라서, O-글리코실트랜스퍼라제와 같은 다른 글리코실트랜스퍼라제도 본 발명에 따른 올리고사카릴 트랜스퍼라제로서 사용될 수 있다.

특정 바람직한 구현예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터로부터의 올리고사카릴 트랜스퍼라제이다. 예를 들어, 일 구현예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터 제주니로부터의 올리고사카릴 트랜스퍼라제(즉, pglB)이다(예를 들어, 문헌[Wacker et al., 2002, Science 298:1790-1793] 참조; 또한, 예를 들어, NCBI Gene ID: 3231775, UniProt Accession No. O86154 참조). 또 다른 구현예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터 라리(Campylobacter lari)로부터의 올리고사카릴 트랜스퍼라제이다(예를 들어, NCBI Gene ID: 7410986 참조).

특정 구현예에서, 올리고사카릴 트랜스퍼라제는 천연(야생형) 단백질 또는 이의 임의의 변이체, 예컨대 WO 2016/107818 및 WO 2016/107819에 기재된 것을 포함하는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제이다. PglB는 공통 서열인 서열번호 1 및 서열번호 2의 아스파라긴 잔기로 지질 연결된 올리고당을 전달할 수 있다. 특정 구현예에서, PglB 올리고사카릴 트랜스퍼라제는 서열번호 6 또는 이의 변이체를 포함한다. 특정 구현예에서, 야생형 PglB에서 하나 이상의 내인성 글리코실화 공통 서열은 돌연변이되어 PglB 자가글리코실화를 회피하였다. 예를 들어, 돌연변이 N534Q를 포함하는 서열번호 6. 본원에서 제공되는 재조합 숙주 세포에 사용하기에 적합한 변이체 PglB 올리고사카릴 트랜스퍼라제의 예는 N311V, K482R, D483H, A669V, Y77H, S80R, Q287P 및 K289R로 구성된 군으로부터 선택된 적어도 하나의 돌연변이를 포함하는 서열번호 6의 PglB 올리고사카릴 트랜스퍼라제를 포함한다. 일 특정 구현예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 N311V를 포함하는 서열번호 6을 갖는다. 또 다른 특정 구현예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H 및 N311V를 포함하는 서열번호 6을 갖는다. 또 다른 특정 구현예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 N311V, K482R, D483H 및 A669V를 포함하는 서열번호 6을 갖는다. 또 다른 특정 구현예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 포함하는 서열번호 6을 갖는다. 2020년 3월 18일에 출원된 PCT/US20/23415에서 특정 PglB 올리고사카릴 트랜스퍼라제 변이체가 특정 혈청형의 대장균 O 항원 생체접합체의 생산에서 놀라울 정도로 개선된 수율을 제공한다는 것이 밝혀지고 기재되었다. 주어진 대장균 O 항원에 대한 개선된 또는 최적의 PglB 변이체는 예측할 수 없었다. 따라서 특정 양태에서 본 발명은 또한 올리고사카릴 트랜스퍼라제로서 특정 PglB 변이체를 사용하여 특정 대장균 O 항원의 생체접합체를 생산하는 방법을 개시한다. 서열번호 6과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일하며, 여전히 올리고사카릴 트랜스퍼라제 활성을 가지며, 바람직하게는 본원에 조합하여 개시된 지시된 위치에 하나 이상의 특정 아미노산을 갖는 PglB의 추가 변이체(예를 들어, 77Y, 80S, 287Q, 289K, 311N, 482K, 483D, 669A; 또는 311V; 또는 311V, 482R, 483H, 669V; 또는 77H, 80R, 287P, 289R, 311V; 또는 77H, 311V; 등)도 생체접합체의 생산에 사용될 수 있다.

특정 구현예에서, 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열, 또는 바람직하게는 돌연변이 N311V를 포함하는 서열번호 6을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함한다.

다른 특정 구현예에서, 담체 단백질에 공유 결합된 대장균 O1A, O6A 또는 O15 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열, 또는 바람직하게는 돌연변이 N311V, K482R, D483H 및 A669V를 포함하는 서열번호 6을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함한다.

특정 구현예에서, 담체 단백질에 공유 결합된 대장균 글루코실화 O4 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열, 또는 바람직하게는 돌연변이 N311V를 포함하는 서열번호 6, 또는 더욱 바람직하게는 돌연변이 Y77H 및 N311V를 포함하는 서열번호 6을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함한다. 바람직하게는, 담체 단백질에 공유 결합된 대장균 글루코실화 O4 항원 다당류의 생체접합체 생산을 위한 재조합 숙주 세포는 서열번호 4의 아미노산 서열을 갖는 글루코실트랜스퍼라제 GtrS를 암호화하는 서열(또는 서열번호 4와 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한 이의 변이체)로서, 글루코스 첨가에 의해 대장균 O4 항원 다당류를 변형하여 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 서열, 및 각각 서열번호 7 및 8의 아미노산 서열을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 암호화하는 뉴클레오티드 서열(또는 각각 서열번호 7 및 8과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한 아미노산 서열을 갖는 이의 변이체)을 추가로 포함하고, 여기서 트랜스로카제는 박토프레놀 연결된 글루코스를 전위시킬 수 있고 글리코실트랜스퍼라제는 박토프레놀을 글루코실화할 수 있다. 담체 단백질에 공유 결합된 대장균 비글루코실화 O4 항원 다당류의 생체접합체 생산을 위해 세포는 GtrS, GtrA 및 GtrB 단백질을 암호화하는 이러한 서열을 필요로 하지 않는다. 대장균 O4 항원 다당류의 글루코실화에 특이적인 신규한 GtrS를 사용하여 담체 단백질에 공유 결합된 대장균 글루코실화 O4 항원 다당류의 생체접합체의 생산은 본원에 전체가 참조로 포함된, 2020년 3월 18일 출원된 PCT/US20/23404에 기재되어 있다.

특정 구현예에서, 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열, 또는 바람직하게는 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 포함하는 서열번호 6을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함한다.

특정 구현예에서, 담체 단백질에 공유 결합된 대장균 O8, O18A, O25B 또는 O2 항원 다당류의 생체접합체를 생산할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 서열번호 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열을 추가로 포함하고, 바람직하게는 여기서 서열번호 6은 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.

일부 구현예에서, 본원에 기재된 임의의 숙주 세포는 담체 단백질, 예를 들어 숙주 세포 글리코실화 기구에 의해 생성된 O 항원 다당류(들)가 부착되어 생체접합체를 형성할 수 있는 단백질을 암호화하는 핵산을 포함한다. 숙주 세포는 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D를 포함하나 이에 한정되지 않는 본 개시를 고려하여 당업자에게 알려진 임의의 담체 단백질을 암호화하는 핵산을 포함할 수 있다.

바람직한 구현예에서, 숙주 세포는 P. 애루기노사의 탈독소화된 외독소 A(EPA)를 암호화하는 핵산을 추가로 포함한다. 바람직하게는,EPA 담체 단백질은 1 내지 10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1 내지 10개, 바람직하게는 2 내지 4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 서열번호 1의 아미노산 서열, 더욱 바람직하게는 서열번호 2의 아미노산 서열을 갖는 글리코실화 공통 서열을 포함한다. 특정 구현예에서, 숙주 세포는 서열번호 3을 포함하는 EPA-4 담체 단백질을 암호화하는 핵산을 추가로 포함한다.

특정 구현예에서, 본원에 기재된 숙주 세포에 의한 생체접합체의 생성에 사용되는 담체 단백질은 "태그", 즉 담체 단백질의 분리 및/또는 식별을 가능하게 하는 아미노산 서열을 포함한다. 예를 들어, 담체 단백질에 태그를 추가하는 것은 해당 단백질의 정제에 유용할 수 있으며, 따라서 태그가 부착된 담체 단백질을 포함하는 접합체 백신의 정제에 유용할 수 있다. 본원에서 사용될 수 있는 예시적인 태그는 히스티딘(HIS) 태그(예를 들어, 헥사-히스티딘-태그 또는 6XHis-Tag), FLAG-TAG 및 HA 태그를 제한 없이 포함한다. 특정 구현예에서, 본원에 사용된 태그는 제거 가능하며, 예를 들어 일단 태그가 더 이상 필요하지 않으면, 예를 들어 단백질이 정제된 후에 화학 작용제 또는 효소적 수단에 의해 제거할 수 있다. 다른 구현예에서, 담체 단백질은 태그를 포함하지 않는다.

특정 구현예에서, 본원에 기재된 담체 단백질은 담체 단백질을 발현하는 숙주 세포의 주변 세포질 공간으로 담체 단백질을 표적화하는 신호 서열을 포함한다. 특정 구현예에서, 신호 서열은 대장균 DsbA, 대장균 외막 포린 A(OmpA), 대장균 말토스 결합 단백질(MalE), 에르위니아 카로토보란스 펙테이트 리아제(Erwinia carotovorans pectate lyase)(PelB), FlgI, NikA, 또는 바실러스 종 엔독실라나제(XynA), 열 민감 대장균 장독소 LTIIB, 바실러스 엔독실라나제 XynA 또는 대장균 플라겔린(FlgI)으로부터 비롯된다. 일 구현예에서, 신호 서열은 서열번호 10을 포함한다. 신호 서열은 단백질이 주변 세포질로 전위된 후에 절단될 수 있고 따라서 생체접합체의 최종 담체 단백질에 더 이상 존재하지 않을 수 있다.

특정 구현예에서, 본원에 기재된 숙주 세포에 (예를 들어, 재조합 기술을 사용하여) 추가 변형이 도입될 수 있다. 예를 들어, 아마도 경쟁하거나 간섭하는 글리코실화 경로(예를 들어, 숙주 세포 내로 재조합으로 도입되는 글리코실화에 관련된 하나 이상의 이종 유전자와 경쟁하거나 이를 간섭함)의 일부를 형성하는 단백질을 암호화하는 숙주 세포 핵산(예를 들어, 유전자)은 이들을 불활성/기능 이상으로 만드는 방식으로(즉, 결실/변형되는 숙주 세포 핵산은 기능성 단백질을 암호화하지 않음) 숙주 세포 배경(게놈)에서 결실되거나 변형될 수 있다. 특정 구현예에서, 본원에 제공된 숙주 세포의 게놈으로부터 핵산이 결실될 때, 핵산은 바람직한 서열, 예를 들어 O 항원 다당류 또는 이의 생체접합체의 생산에 유용한 서열로 대체된다.

숙주 세포에서 결실될 수 있는 (일부 경우에, 다른 요망되는 핵산 서열로 대체될 수 있는) 예시적인 유전자 또는 유전자 클러스터는 waaL과 같은 당지질 생합성에 관여하는 숙주 세포의 유전자 또는 유전자 클러스터(예를 들어, 문헌 [Feldman et al., 2005, PNAS USA 102:3016-3021] 참조), 지질 A 코어 생합성 클러스터(waa), 갈락토스 클러스터(gal), 아라비노스 클러스터(ara), 콜론산 클러스터(wc), 협막 다당류 클러스터, 운데카프레놀-p 생합성 유전자(예를 들어, uppS, uppP), und-P 재순환 유전자, 뉴클레오티드 활성화된 당 생합성에 관여하는 대사 효소, 장내 세균 공통 항원 클러스터(eca) 및 프로파지 O 항원 변형 클러스터, 예를 들어, gtrABS 클러스터 또는 이의 영역을 포함한다. 특정 구현예에서, 본원에 기재된 숙주 세포는 원하는 O 항원 다당류, 예를 들어 글루코실화 O4 항원 다당류 이외의 임의의 O 항원 다당류를 생산하지 않도록 변형된다.

특정 구현예에서, waaL 유전자는 본원에 제공된 숙주 세포(예를 들어, 재조합 숙주 세포)의 게놈으로부터 결실되거나 기능적으로 불활성화된다. 용어 "waaL" 및 "waaL 유전자"는 주변 세포질에 위치한 활성 부위를 갖는 막 결합 효소를 암호화하는 O 항원 리가제 유전자를 지칭한다. 암호화된 효소는 운데카프레닐포스페이트(UPP)에 결합된 O 항원을 지질 A 코어로 전달하여 지질다당류를 형성한다. 내인성 waaL 유전자의 결실 또는 파괴(예를 들어, ΔwaaL 균주)는 O 항원의 지질 A로의 전달을 방해하고, 대신 O 항원의 다른 생체분자, 예컨대 담체 단백질로의 전달을 증진시킬 수 있다.

또 다른 특정 구현예에서, waaL 유전자, gtrA 유전자, gtrB 유전자, gtrS 유전자 및 rfb 유전자 클러스터 중 하나 이상이 본원에 제공된 원핵 숙주 세포의 원래 게놈으로부터 결실되거나 기능적으로 불활성화된다.

일 구현예에서, 본원에서 사용되는 숙주 세포는 글루코실화된 O4 항원 다당류의 생체접합체를 생산하는 대장균이고, 여기서 waaL 유전자는 숙주 세포의 게놈으로부터 결실되거나 기능적으로 불활성화되고, 대장균 O4 항원 다당류에 특이적인 gtrS 유전자가 삽입된다. 글루코실화된 O4 O 항원의 생체접합체를 위한 생산 균주에 대한 특정 구현예에서, 서열번호 4에 대해 적어도 80%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 암호화하는 gtrS 유전자가 모 균주의 gtrS 유전자를 O4 항원의 글루코실화를 담당하는 유전자로 대체하도록 해당 모 균주의 gtrS 유전자 대신에 삽입된다. 이러한 모 균주의 예는 대장균 K-12 균주 W3110이다. gtrA 및 gtrB 유전자는 모 균주에 대해 상동성일 수 있거나, 대안적으로 이들 유전자 중 하나 또는 둘 모두는 모 균주에 대해 이종성일 수 있다. 전형적으로 gtrS 유전자와 달리, 이러한 gtrA 및 gtrB 유전자는 O 항원 구조에 특이적이지 않다.

또한, 재조합 숙주 세포를 제조하는 방법이 본원에 기재되어 있다. 본원에 기재된 방법에 의해 생산된 재조합 숙주 세포는 대장균 O 항원의 생체접합체를 생산하는 데 사용될 수 있다. 방법은 하나 이상의 재조합 핵산 분자를 세포 내로 도입하여 재조합 숙주 세포를 생산하는 단계를 포함한다. 전형적으로, 재조합 핵산 분자는 이종성이다. 본 개시내용을 고려하여 당업계에 공지된 임의의 방법을 사용하여 재조합 핵산 분자를 숙주 세포에 도입할 수 있다. 재조합 핵산은 당업자에게 공지된 임의의 방법, 예를 들어 전기천공, 화학적 형질전환, 열 충격, 자연 형질전환, 파지 형질도입 및 접합을 사용하여 본원에 기재된 숙주 세포 내로 도입될 수 있다. 특정 구현예에서, 재조합 핵산은 플라스미드를 사용하여 본원에 기재된 숙주 세포에 도입된다. 예를 들어, 이종 핵산은 플라스미드(예를 들어, 발현 벡터)에 의해 숙주 세포에서 발현될 수 있다. 또 다른 특정 구현예에서, 이종 핵산은 예를 들어 WO 2014/037585, WO 2014/057109, 또는 WO 2015/052344에 기재된 바와 같은 게놈으로의 삽입 방법을 사용하여 본원에 기재된 숙주 세포로 도입된다.

도구 및 모델 유기체로서 분자 생물학에서 일상적으로 사용되는 대장균 균주는 예를 들어 특정 구현예에서 숙주 세포에 대한 부모로서 사용될 수 있다. 비제한적 예는 대장균 K12 균주(예를 들어, W1485, W2637, W3110, MG1655, DH1, DH5α, DH10 등), B 균주(예를 들어, BL-21, REL606 등), C 균주, 또는 W 균주를 포함한다. 일 특정 구현예에서, 숙주 계통은 모 계통 W3110으로부터 유래된다. 이 균주는 예를 들어 예일의 E. coli Genetic Stock Center에서 얻을 수 있다. 대장균에 대한 자세한 내용은 예를 들어, Ecoliwiki.net 참조.

일부 구현예에서, 본원에 기재된 숙주 세포는 담체 단백질에 공유 결합된 대장균 O 항원 다당류를 포함하는 생체접합체를 생산하는 데 사용될 수 있다. 숙주 세포를 사용하여 이러한 생체접합체를 생산하는 방법은 당업계에 공지되어 있다. 예를 들어, WO 2003/074687 및 WO 2006/119987 참조. 이러한 방법은 생체접합체의 생산을 위한 조건 하에서 본원에 기재된 임의의 재조합 숙주 세포를 배양하는 단계를 포함한다. 생체접합체는 본 개시내용을 고려하여 당업계에 공지된 임의의 방법을 사용하여 재조합 숙주 세포로부터 단리, 분리 및/또는 정제될 수 있다. 예를 들어, 생체접합체는 단백질의 정제를 위해 당업계에 공지된 임의의 방법, 예를 들어 크로마토그래피(예를 들어, 이온 교환, 음이온 교환, 친화성 및 사이징 컬럼 크로마토그래피), 원심분리, 차등 용해도, 또는 단백질 정제를 위한 임의의 기타 표준 기술에 의해 정제할 수 있다. 예를 들어, WO 2009/104074에 기재된 방법 참조. 또한, 생체접합체는 정제를 용이하게 하기 위해 이종 폴리펩티드 서열에 융합될 수 있다. 특정 생체접합체를 정제하는 데 사용되는 실제 조건은 부분적으로 생체접합체의 순 전하, 소수성 및/또는 친수성과 같은 요인에 따라 달라질 것이며, 당업자에게 명백할 것이다. O1A, O2, O6A 및 O25B에 대한 생체접합체 및 이들을 포함하는 백신 조성물의 제조는 예를 들어 WO 2015/124769 및 WO 2017/035181에 기재되어 있다.

또한, 본원에 기재된 방법, 즉 본원에 기재된 재조합 숙주 세포를 사용하여 생산된 생체접합체가 제공된다.

일부 구현예에서, 담체 단백질에 공유 결합된 대장균 O 항원 다당류의 생체접합체를 제조하는 방법은 다음을 포함한다: (i) (a) O 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열; (b) 서열번호 1, 바람직하게는 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하고, 더욱 바람직하게는 각각 서열번호 2를 갖는 글리코실화 공통 서열을 포함하는 4개의 글리코실화 부위를 포함하는 담체 단백질, 바람직하게는 EPA를 암호화하는 뉴클레오티드 서열; 및 (c) 올리고사카릴 트랜스퍼라제, 예를 들어 PglB 올리고사카릴 트랜스퍼라제 또는 이의 변이체를 암호화하는 뉴클레오티드 서열을 제공하는 단계.

특정 구현예에서, 대장균 O 항원 다당류는 특정 다당류 대 단백질 중량비(w/w)로 담체 단백질에 공유 결합된다. 담체 단백질에 공유 결합된 중량 기준의 O 항원 다당류의 양의 비율은 "글리칸/단백질 비율" 또는 "다당류/단백질 비율" 또는 "PS/단백질 비율"로 지칭된다. 일부 구현예에서, O 항원 다당류는 약 1:20 내지 20:1, 바람직하게는 1:10 내지 10:1, 더욱 바람직하게는 1:3 내지 3:1의 다당류 대 단백질(w/w) 비로 담체 단백질에 공유 결합된다. 본원에 기재된 생체접합체에 대한 특정 비제한적 구현예에서, 글리칸/단백질 비율은 약 0.1 내지 0.5, 예컨대 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45 또는 0.5이다. 이러한 구현예에서, O 항원 다당류:단백질의 중량비는 특정 O 항원 혈청형에 따라 약 1:10 내지 1:2, 예컨대 1:10: 1:9: 1:8, 1:7, 1:6, 1:5, 1:4, 1:3, 또는 1:2이다. 특정 구현예에서 글리칸/단백질 비율은 약 0.15 내지 약 0.45이다. 일반적으로, O 항원 다당류 대 담체 단백질의 더 높은 글리칸/단백질 비율이 바람직한데, 많은 양의 담체 단백질이 일부 경우에 면역학적 간섭을 유발할 수 있기 때문이다. 또한, 더 높은 글리칸/단백질 비율은 생체접합체 형태로 투여된 충분한 O 항원 다당류를 얻는 데 도움이 될 것이며, 담체 단백질의 양은 상대적으로 낮게 유지되며, 이는 다중 혈청형이 조성물, 예를 들어, 적어도 4개의 상이한 O 항원, 적어도 5개의 상이한 O 항원, 적어도 6개의 상이한 O 항원, 적어도 7개의 상이한 O 항원, 적어도 8개의 상이한 O 항원, 적어도 9개의 상이한 O 항원, 적어도 10개의 상이한 O 항원 등으로부터의 생체접합체를 포함하는 조성물에 의해 커버되어야 하는 다가 조성물에 특히 유리하다.

본 발명에 따른 접합체의 글리칸/단백질 비율은 단백질 양 및 글리칸 양을 결정함으로써 결정될 수 있다. 단백질 양은 280 nm에서의 UV 흡광도(A280)를 측정하여 결정할 수 있다. 글리칸 양은 (예를 들어, 표 1의 O8에 대한 Man, 및 표 1의 다른 글리칸에 대한 GlcNAc의) 반복 단위에서 당의 펄스 전류계 검출(IC-PAD)과 이온 크로마토그래피를 기반으로 결정될 수 있으며, 그 후 반복 단위의 구조 정보는 총 글리칸 양을 계산하는 데 사용될 수 있다(예를 들어, O1A의 반복 단위는 845 Da의 몰 질량을 가지며, 이러한 반복 단위 1몰은 1몰의 GlcNAc를 함유하며, 이는 GlcNAc의 양이 IC-PAD에 의해 결정될 때 총 글리칸 양의 계산을 가능하게 한다).

일부 구현예에서, 본원에 기재된 바와 같은 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체는 L-Rh 당의 위치 2에서 특정 정도의 아세틸화를 갖는다. (생체)접합체에서 O25B 항원 다당류의 O-아세틸화 정도는 바람직하게는 적어도 30%, 바람직하게는 적어도 50%, 예컨대 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%이다.

유사하게, (생체)접합체에서 대장균 O16 항원 다당류의 O-아세틸화 정도는 바람직하게는 적어도 30%, 바람직하게는 적어도 50%, 예컨대 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%이다.

특정 구현예에서, O 항원 다당류의 생체접합체를 제조하는 방법은 생산되는 O 항원 다당류 생체접합체에 따라 특정 올리고사카릴 트랜스퍼라제 효소, 특히 PglB 올리고사카릴 트랜스퍼라제 또는 이의 변이체를 암호화하는 핵산 서열을 포함하는 재조합 숙주 세포를 제공하는 단계를 포함한다. 특정 올리고사카릴 트랜스퍼라제 효소 변이체는 숙주 세포에 의해 생산된 생체접합체의 수율에 영향을 미칠 수 있다. 전형적으로, 수율이 특정 생체접합체를 생산하는 비용에 영향을 미치기 때문에 더 높은 수율이 바람직하며, 이는 여러 상이한 생체접합체를 포함하는 다가 조성물에 특히 중요하다.

일 특정 구현예에서, O 항원이 O75 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 N311V의 아미노산 돌연변이를 포함하고, 여기서 아미노산 돌연변이는 서열번호 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.

또 다른 특정 구현예에서, O 항원이 O1A, O6A, 또는 O15 항원 다당류일 때, PglB 올리고사카릴 트랜스퍼라제는 N311V, K482R, D483H, 및 A669V의 아미노산 돌연변이를 포함하고, 여기서 아미노산 돌연변이는 서열번호 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.

또 다른 특정 구현예에서, O 항원이 글루코실화된 O4 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 아미노산 돌연변이 N311V, 또는 Y77H 및 N311V의 아미노산 돌연변이를 포함하고, 여기서 아미노산 돌연변이는 서열번호 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.

또 다른 특정 구현예에서, O 항원이 O16 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하고, 여기서 아미노산 돌연변이는 서열번호 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.

또 다른 특정 구현예에서, O 항원이 O8, O18A, O25B, 또는 O2 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 서열번호 6의 아미노산 서열을 포함하고, 여기서 서열번호 6은 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다. 이의 특정 구현예에서, PglB 올리고사카릴 트랜스퍼라제는 서열번호 6의 아미노산 서열을 포함한다.

일부 구현예에서, 상기 지시된 O 항원/PglB 올리고사카릴 트랜스퍼라제 쌍당 올리고사카릴 트랜스퍼라제 효소를 암호화하는 재조합 숙주 세포에 의해 생산된 O 항원 다당류의 생체접합체는 바람직하게는 본원에 기재된 하나 이상의 바람직한 속성, 예를 들어 글리칸/단백질 비율 및/또는 다중-글리코실화된 담체 단백질의 백분율을 갖는다.

조성물 및 조합물

대장균 O75 및 O6 항원 다당류(여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다)를 포함하고, 선택적으로 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 전부(여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다)를 추가로 포함하는 조성물 및 조합물이 본원에 제공된다. O 항원 다당류 또는 접합체, 예를 들어 생체접합체의 조합물은 다수의 조성물을 포함할 수 있지만, O 항원 다당류 또는 접합체, 예를 들어 생체접합체의 조합물이 동일한 조성물에 존재하는 경우 이것이 바람직하다.

본원에 기재된 조성물 및 조합물은 대장균에 의한 대상체(예를 들어, 인간 대상체)의 감염의 치료 및 예방, 바람직하게는 침습성 ExPEC 질환의 예방에 유용하다. 일부 구현예에서, 조성물은 면역원성 조성물이다. 본원에서 사용되는 "면역원성 조성물"은 조성물이 투여되는 숙주 또는 대상체에서 면역 반응을 유도할 수 있는 조성물을 의미한다. 조성물 및 면역원성 조성물은 제약상 허용가능한 담체를 추가로 포함할 수 있다. 본원에서 사용되는 바와 같이, “제약상 허용가능한”이라는 용어는 동물에서의, 더 구체적으로 인간에서의 사용용으로 미국 약전 또는 다른 일반적 공인 약전에 열거되거나 미국 연방 정부 또는 주 정부의 규제 기관에 의해 승인된 것을 의미한다. 제약상 허용가능한 담체의 맥락에서 본원에서 사용되는 바와 같은 “담체”라는 용어는 희석제, 아쥬반트(adjuvant), 부형제, 또는 비히클(이와 함께 제약 조성물이 투여됨)을 지칭한다. 식염수 용액 및 수성 덱스트로스 및 글리세롤 용액도, 특히 주사제 용액을 위한 액체 담체로서 이용될 수 있다. 적합한 부형제에는 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 쌀, 밀가루, 석회분말, 실리카 겔, 나트륨 스테아레이트, 글리세롤 모노스테아레이트, 활석, 나트륨 클로라이드, 건조 탈지유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등이 포함된다. 적합한 제약 담체의 예는 문헌[“Remington's Pharmaceutical Sciences” by E.W. Martin]에 기재되어 있다.

일 구현예에서, 본 발명의 조성물은 Tris-완충 식염수(TBS) pH 7.4(예를 들어 각각 25 mM, 137 mM 및 2.7 mM의 Tris, NaCl 및 KCl을 함유함)에 본원에 기재된 바와 같은 (생체)접합체를 포함한다. 다른 구현예에서, 본 발명의 조성물은 약 7.0 pH의 약 10 mM KH₂PO₄/Na₂HPO₄ 완충액, 약 5% (w/v) 소르비톨, 약 10 mM 메티오닌 및 약 0.02% (w/v) 폴리소르베이트 80에 본원에 기재된 바와 같은 생체접합체를 포함한다. 다른 구현예에서, 본 발명의 조성물은 약 7.0 pH의 약 10 mM KH₂PO₄/Na₂HPO₄ 완충액, 약 8% (w/v) 수크로스, 약 1 mM EDTA, 및 약 0.02% (w/v) 폴리소르베이트 80(예를 들어, EPA 담체 단백질에 공유 결합된 대장균 O 항원의 생체접합체에 적합한 완충액에 대해서는 WO 2018/077853 참조)에 본원에 기재된 바와 같은 생체접합체를 포함한다. 다른 구현예에서, 본 발명의 조성물은 약 5 mM 숙시네이트/0.9% NaCl, pH 6.0에 본원에 기재된 바와 같은 (생체)접합체를 포함한다.

다가 조성물, 예를 들어 2가, 3가, 4가 등의 조성물인 조성물(예를 들어, 제약 및/또는 면역원성 조성물)이 본원에 제공된다. 예를 들어, 다가 조성물은 대장균 O 항원, 당접합체, 또는 이의 생체접합체와 같은 하나 초과의 항원을 포함한다. 특정 구현예에서, 본원에 제공된 다가 조성물은 대장균 O75 항원 다당류의 생체접합체 및 대장균 O6A 항원 다당류의 생체접합체를 포함한다. 일부 구현예에서, 본원에 제공된 다가 조성물은 적어도 하나의 추가 항원 또는 생체접합체를 포함한다.

전형적으로 본 발명의 조성물은 먼저 이들 O 항원 다당류를 담체 단백질에 독립적으로 공유 결합함으로써, 예를 들어, 화학적 접합 또는 생체접합에 의해, 본원에 기재된 각각의 대장균 O 항원 다당류에 대한 개별 당접합체를 수득하고, 후속적으로 본 발명에 따른 조성물을 얻기 위해 본원에 기재된 양 및 비율로 개별 당접합체를 혼합함으로써 제조될 수 있다.

일 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 본원에 기재된 바와 같은 담체 단백질에 공유 결합된 대장균 O75 항원 다당류 및 적어도 하나의 추가 항원을 포함하는 다가 조성물이다.

일부 구현예에서, 추가 항원은 항원 당류 또는 다당류, 더욱 바람직하게는 대장균 O 항원 다당류, 예를 들어 O1, O2, O4, O6, O8, O15, O16, O18 및 O25 혈청형 및 이의 하위 혈청형 중 하나 이상의 대장균 O 항원이고, 바람직하게는 각각 개별적으로 담체 단백질에 접합된 것이고, 여기서 각 혈청형에 대한 담체 단백질은 동일하거나, 또는 일부 또는 모든 혈청형 간에 상이할 수 있다. 바람직하게는, 대장균 O75 다당류의 (생체)접합체를 포함하는 다가 조성물은 각각의 O1, O2, O4, O6, O15, O16, O18 및 O25 혈청형 또는 이의 하위 혈청형의 대장균 O 항원을 추가로 포함한다. 일부 구현예에서, 각각의 추가 대장균 O 항원 다당류는 당접합체이며, 이는 대장균 O 항원 다당류가 또 다른 화학종, 예를 들어 단백질, 펩티드, 지질 등, 가장 바람직하게는 화학적 또는 효소적 방법과 같은 담체 단백질에 공유 결합됨을 의미한다. 바람직한 구현예에서, 각각의 추가 대장균 O 항원 다당류는 O 항원 다당류가 숙주 세포 기구에 의해 효소적으로 글리코시드 결합을 통해, 예를 들어, 담체 단백질에 공유 결합된 생체접합체이다. 특정 구현예에서, 다가 조성물은 O8 혈청형의 대장균 O 항원을, 바람직하게는 당접합체, 바람직하게는 생체접합체 형태로 추가로 포함한다. 특정 구현예에서 본원에 제공된 조성물은 1 내지 20개의 추가 당접합체, 더욱 바람직하게는 대장균 O 항원 다당류의 생체접합체, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 추가 당접합체 또는 바람직하게는 대장균 O 항원 다당류의 생체접합체를 포함할 수 있다. 펩티드, 단백질 또는 지질 항원 등과 같은 다른 항원이 본원에 제공된 조성물에 포함될 수 있다.

일부 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 대장균 O75 항원 다당류의 (생체)접합체 및 대장균 O6 항원 다당류의 (생체)접합체, 및 대장균 O1 항원 다당류, 대장균 O2 항원 다당류, 대장균 글루코실화 O4 항원 다당류, 대장균 O8 항원 다당류, 대장균 O15 항원 다당류, 대장균 O16 항원 다당류, 대장균 O18 항원 다당류 및 대장균 O25 항원 다당류로 구성된 군으로부터 선택된 적어도 하나의 추가 항원 다당류, 바람직하게는 적어도 대장균 O1 항원 다당류, 대장균 O2 항원 다당류 및 대장균 O25 항원 다당류, 더욱 바람직하게는 적어도 대장균 O1 항원 다당류, 대장균 O2 항원 다당류, 대장균 O25 항원 다당류, 대장균 O4 항원 다당류, 대장균 O15 항원 다당류, 대장균 O16 항원 다당류 및 대장균 O18 항원 다당류를 포함한다. 바람직하게는 O1 항원 다당류는 O1A 항원 다당류이고, O6 항원 다당류는 O6A 항원 다당류이고, O4 항원 다당류는 글루코실화된 O4 항원 다당류이고, O18 항원 다당류는 O18A 항원 다당류이고, O25 항원 다당류는 O25B 항원 다당류이다. 바람직하게는, 각각의 추가 O 항원 다당류는 담체 단백질에 공유 결합되고, 더욱 바람직하게는 생체접합체이다.

일부 구현예에서, 조성물은 대장균 O75 및 대장균 O1, O2 또는 O6 항원 다당류 중 적어도 하나, 바람직하게는 대장균 O1 또는 O6 항원 다당류 중 적어도 하나를 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O1, O2, 및/또는 O6 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1, 예를 들어 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1 또는 2.5:1이다. 바람직한 구현예에서, 조성물은 담체 단백질에 공유 결합된 대장균 O25 항원 다당류, 바람직하게는 대장균 O25B 항원 다당류를 추가로 포함하고, O25 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도비는 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1이다. 이러한 구현예에서, 바람직하게는 O25 항원 다당류 대 O75 항원 다당류의 농도비는 약 2:1 내지 약 1:1, 바람직하게는 약 1.5:1, 더욱 바람직하게는 약 1:1이다. 이의 특정 구현예에서, O25 항원 다당류 대 O2 항원 다당류의 농도비는 약 4:1 내지 약 2:1이다. 특정 구현예에서, 조성물은 대장균 O75, O1, O2, O6 및 O25 항원 다당류를 포함하고, 바람직하게는 O1, O6 및 O25 항원 다당류는 각각 O1A, O6A 및 O25B 다당류이고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 항원 다당류 O75:O1:O2:O6:O25의 농도비는 약 2:1:1:1:2이다. 특정 구현예에서, O 항원은 생체접합에 의해, 예를 들어, 담체 단백질의 Asn-잔기에 대한 N-연결을 통해, 담체 단백질에 공유 결합된다. 특정 구현예에서, 조성물 중 O75 항원 다당류의 농도는 약 8 내지 64 μg/mL, 바람직하게는 약 16 내지 32 μg/mL, 바람직하게는 약 28 내지 36 μg/mL, 예를 들어, 약 32 μg/mL이다. 특정 구현예에서, 조성물은 대장균 O4, O15, O16, O18 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O4는 글루코실화되고, O18 항원은 O18A이다. 특정 구현예에서, 조성물은 담체 단백질에 공유 결합된 대장균 O8 항원 다당류를 추가로 포함한다. 특정 구현예에서, 이들 각각이 조성물에 존재하는 한 항원 다당류 O75:O4:O15:O16:O18:O8의 농도비는 약 2:1:1:1:1:1이다. 추가 구현예에서, 조성물은 하나 이상의 추가 대장균 O 항원 다당류를 포함할 수 있으며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다.

일 구현예에서, O1 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O1 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O1A)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O1 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O1 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.

일 구현예에서, O2 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O2 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O2)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O2 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O2 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.

일 구현예에서, O4 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O4 항원 다당류는 글루코실화 O4 항원 다당류이고, 특정 구현예에서 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O4 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O4 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.

일 구현예에서, O6 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O6 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O6A)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O6 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O6 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.

일 구현예에서, O8 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O8 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O8 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O8 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.

일 구현예에서, O15 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O15 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O15)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O15 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O15 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.

일 구현예에서, O16 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O16 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O16)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O16 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O16 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.

일 구현예에서, O18 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O18 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O18A)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O18 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O18 항원 다당류 사이의 중량비는 약 1.2:1 내지 8:1, 바람직하게는 약 1.5:1 내지 4:1, 더욱 바람직하게는 약 2:1, 예를 들어, 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 또는 2.5:1이다.

일 구현예에서, O25 항원 다당류(예를 들어, 단리된 형태로 또는 당접합체 또는 생체접합체의 일부로서)는 본원에서 제공되는 조성물에 사용된다(예를 들어, O75 항원 다당류 또는 이의 생체접합체와 조합하여). 특정 구현예에서, O25 항원 다당류는 O25B 항원 다당류를 포함하고, 특정 구현예에서 표 1에 제시된 바와 같은 화학식 (O25B)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, O25 항원 다당류는 생체접합체의 일부이고 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된다. 특정 구현예에서 조성물에서 및/또는 대상체에게 투여되는 O75:O25 항원 다당류 사이의 중량비는 약 1:4 내지 1:0.5, 바람직하게는 약 1:2 내지 1:1, 더욱 바람직하게는 약 1:1, 예를 들어, 약 1:1.5, 1:1.4, 1:1.3, 1:1.2, 1:1.1, 1:1.0, 1:0.9, 1:0.8, 1:0.7, 1:0.6, 또는 1:0.5이다.

또 다른 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 적어도 담체 단백질에 접합된 대장균 O75, O1, O2, O4, O6 및 O25 항원 다당류, 바람직하게는 담체 단백질, 예를 들어, EPA 또는 CRM₁₉₇에 공유 결합된 O75, O1A, O2, 글루코실화된 O4, O6A 및 O25B 항원 다당류의 생체접합체를 포함한다(즉, 적어도 6가 조성물). 일 구현예에서, 조성물에서 및/또는 대상체에게 투여되는 O75:O1:O2:O4:O6:O25 항원 다당류 사이의 중량비는 약 2:1:1:1:1:2이다.

바람직한 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 적어도 담체 단백질에 접합된 대장균 O1, O2, O4, O6, O15, O16, O18, O25 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함한다(즉, 적어도 9가 조성물). 일 구현예에서, 조성물에서 및/또는 대상체에게 투여되는 O75:O1:O2:O4:O6:O15:O16:O18:O25 항원 다당류 사이의 중량비는 약 2:1:1:1:1:1:1:1:2이다.

또 다른 바람직한 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 적어도 담체 단백질에 접합된 대장균 O1, O2, O4, O6, O8, O15, O16, O18, O25 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함한다(즉, 적어도 10가 조성물). 일 구현예에서, 조성물에서 및/또는 대상체에게 투여되는 O75:O1:O2:O4:O6:O8:O15:O16:O18:O25 항원 다당류 사이의 중량비는 약 2:1:1:1:1:1:1:1:1:2이다.

또한, 선택적으로 다른 대장균 혈청형으로부터의 추가 O 항원을 (예를 들어, 단리된 형태로, 또는 당접합체 또는 생체접합체의 일부로서) 추가로 포함하는 조성물이 본원에서 고려된다. 일부 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 상기 기재된 바와 같은 적어도 6가, 9가 또는 10가 조성물을 포함하고, 1 내지 15개의 추가 대장균 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된 항원 다당류의 (생체)접합체, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개의 추가 대장균 항원 다당류를 추가로 포함한다. 특정 구현예에서, 상기 기재된 바와 같은 적어도 6가, 9가 또는 10가 조성물은 추가 대장균 항원 다당류 또는 이의 접합체를 포함하지 않는다. 즉, 이러한 조성물은 각각, 바람직하게는 접합체, 바람직하게는 생체접합체의 형태로, 6, 9 또는 10개의 대장균 항원 다당류를 포함하나, 이를 초과하여 포함하지 않는다. 따라서, 일 구현예는 9개의 접합체, 특히 담체 단백질에 접합된 대장균 O1, O2, O4, O6, O15, O16, O18, O25 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함하고(즉, 9가 조성물), 담체 단백질에 공유 결합된 대장균 O 항원 다당류의 추가 접합체를 포함하지 않는 조성물을 제공하는 것이다. 따라서, 또 다른 구현예는 10개의 접합체, 특히 담체 단백질에 접합된 대장균 O1, O2, O4, O6, O8, O15, O16, O18, O25 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA 또는 CRM₁₉₇에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함하고(즉, 10가 조성물), 담체 단백질에 공유 결합된 대장균 O 항원 다당류의 추가 접합체를 포함하지 않는 조성물을 제공하는 것이다.

일부 바람직한 구현예에서, 추가 대장균 O1, O2, O4, O6, O15, O16, O18 및/또는 O25 항원 다당류 각각은 담체 단백질에 공유 결합된다. O 항원 다당류는 화학적 또는 다른 합성 방법에 의해 담체 단백질에 연결될 수 있거나, O 항원 다당류는 생체접합체의 일부일 수 있으며, 바람직하게는 생체접합체의 일부이다. 바람직하게는 조성물에 의해 커버되는 혈청형당 O 항원은 각각 개별적으로 담체 단백질에 커플링된다. 즉, 특정 혈청형을 커버하는 각각의 당접합체 또는 생체접합체는 본 발명에 따른 조성물에서 혼합되기 전에 개별적으로 생산될 수 있다. 담체 단백질은 바람직하게는 조성물 내의 각각의 당접합체 또는 생체접합체에 대해 동일할 수 있거나, 대안적으로 대장균 O 항원의 일부 또는 전부에 대해 상이할 수 있다. 예를 들어, 상이한 혈청형의 O 항원은 또한 상이한 담체 단백질에 접합될 수 있다. 본 개시를 고려하여 당업자에게 알려진 임의의 담체 단백질이 사용될 수 있다. 적합한 담체 단백질은 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D를 포함한다. 바람직하게는 담체 단백질은 EPA 또는 CRM₁₉₇이다.

일부 구현예에서, 추가의 대장균 O1(A), O2, (글루코실화된) O4, O6(A), O15, O16, O18(A), 및/또는 O25(B) 항원 다당류 각각은, 특히 생체접합체의 일부인 경우, 담체 단백질의 아스파라긴(Asn) 잔기에 공유 결합되며, 여기서 Asn 잔기는 글리코실화 공통 서열 Asn-X-Ser(Thr)(여기서, X는 Pro을 제외한 임의의 아미노산일 수 있음)(서열번호 1)을 포함하는 글리코실화 부위에 존재하고, 바람직하게는 Asn 잔기는 글리코실화 공통 서열 Asp(Glu)-X-Asn-Z-Ser(Thr)(여기서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨)(서열번호 2)을 포함하는 글리코실화 부위에 존재한다. 담체 단백질은 1 내지 10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위를 포함할 수 있으며, 각각은 글리코실화 공통 서열을 포함한다. 특정 구현예에서, 담체 단백질은 EPA-4 담체 단백질, 예를 들어 서열번호 3의 아미노산 서열을 포함하는 EPA-4 담체 단백질이다.

특정 구현예에서, 조성물(예를 들어, 제약 및/또는 면역원성 조성물)이 본원에 제공되며, 조성물은 (i) 서열번호 3을 포함하는 P.애루기노사의 탈독소화된 외독소 A 담체 단백질(EPA-4 담체 단백질)에 공유 결합된 대장균 O75 항원 다당류의 생체접합체(여기서 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함한다); (ii) EPA-4 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체(여기서 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함한다); (iii) EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체(여기서 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함한다); (iv) EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체(여기서 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함한다); (v) EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체(여기서 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함한다); (vi) EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체(여기서 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함한다); (vii) EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체(여기서 대장균 O18A 항원 다당류는 화학식 (O18A)의 구조를 포함한다); (viii) EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체(여기서 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함한다); 및 (ix) EPA-4 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체(여기서 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함한다)를 포함하고, 여기서 각 화학식은 표 1에 제공되어 있고, 각 화합물에 대해 독립적으로 n은 1 내지 100, 예를 들어 1 내지 50, 바람직하게는 3 내지 50, 예를 들어, 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.

특정 구현예에서, 상기 조성물(예를 들어, 제약 및/또는 면역원성 조성물)은 추가로 (x) EPA-4 담체 단백질에 공유 결합된 대장균 O8 항원 다당류의 생체접합체(여기서 대장균 O8 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 포함한다)를 포함하고, 여기서 이 구조에 대해 n은 1 내지 100, 예를 들어 1 내지 50, 바람직하게는 3 내지 50, 예를 들어, 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.

일부 구현예에서, 본원에 제공된 조성물은 대장균 O75 항원 다당류의 접합체, 및 적어도 대장균 O6 항원 다당류, 바람직하게는 O6A 항원 다당류의 접합체를 포함하며, 여기서 대장균 O75 항원 다당류의 접합체는 조성물에 존재하는 O6 항원 다당류의 농도보다 약 1.2 내지 8배, 예를 들어 약 2 내지 4배, 예컨대, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 3, 4, 5, 6, 7, 또는 8배 높다(모든 농도는 O 항원 다당류의 중량을 기준으로 함). 바람직하게는 조성물 중 대장균 O75 항원 다당류는 조성물 중 O6 항원 다당류 농도의 약 1.5배 내지 2.5배, 예컨대 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 또는 2.5배의 농도로 존재한다.

특정 구현예에서, 조성물은 대장균 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18, O25B 및 O75 항원 다당류의 생체접합체를 포함하며, 여기서 O1A:O2:글루코실화된 O4:O6A:O15:O16:O18:O25B:O75의 생체접합체는 (O 항원 다당류 중량 기준) 1:1:1:1:1:1:1:2:2, 1:1:1:1:1:1:1:2:1.5, 2:1:1:2:1:1:1:4:3, 2:1:1:2:1:1:1:4:4, 2:1:2:2:2:2:2:4:4, 바람직하게는 약 1:1:1:1:1:1:1:2:2의 비로 존재한다.

특정 구현예에서, 조성물은 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 생체접합체를 포함하며, 여기서 O1A:O2:글루코실화된 O4:O6A:O8:O15:O16:O18A:O25B:O75의 생체접합체는 (O 항원 다당류 중량 기준) 1:1:1:1:1:1:1:1:2:2, 2:1:2:2:2:2:2:2:4:4, 2:1:1:2:1:1:1:1:4:3, 또는 2:1:1:2:1:1:1:1:4:4, 바람직하게는 약 1:1:1:1:1:1:1:1:2:2의 비로 존재한다.

일부 구현예에서, 본원에 제공된 조성물은 대장균 O75 항원 다당류의 생체접합체 및 적어도 대장균 O6 항원 다당류의 생체접합체를 포함하며, 여기서 대장균 O75 항원 다당류의 생체접합체는 조성물에 약 8 내지 약 50 μg/mL, 바람직하게는 약 12 내지 약 40 μg/mL, 더욱 바람직하게는 약 16 내지 약 32 μg/mL, 예컨대 16, 18, 20, 22, 24, 26, 28, 30 또는 32 μg/mL, 바람직하게는 약 32 μg/mL의 농도로 존재한다. 대장균 O75 항원 다당류의 생체접합체의 농도는 바람직하게는 조성물에 존재하는 O6 생체접합체의 농도보다 약 1.2 내지 약 8배, 예를 들어 약 2 내지 4배, 예를 들어 1.5, 2, 3, 4, 5, 6, 7 또는 8배 높다.

일 특정 구현예에서, 제약 조성물이 제공되며, 이러한 조성물은

(i) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체;

(ii) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체;

(iii) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O4 항원 다당류의 생체접합체;

(iv) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체;

(v) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체;

(vi) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체;

(vii) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체;

(viii) 약 28 내지 36, 바람직하게는 약 32 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체; 및

(ix) 약 28 내지 36, 바람직하게는 약 32 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 포함하고,

여기서 EPA-4 담체 단백질은 서열번호 3의 아미노산 서열을 포함하고,

O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 더욱 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

특정 구현예에서, 이러한 조성물은 추가로

(x) 약 12 내지 20, 바람직하게는 약 16 μg/mL의 다당류 농도의, EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 포함하고,

O8 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 더욱 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.

일 구현예에서, 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 포함하는 조성물이 제공되며, 여기서 O75 항원 다당류는 적어도 약 32 μg/mL의 농도이다.

일 구현예에서, 조성물이 제공되며, 조성물은

(i) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체(여기서 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함한다);

(ii) 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체(여기서 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함한다);

(iii) 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체(여기서 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함한다);

(iv) 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체(여기서 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함한다);

(v) 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체(여기서 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함한다);

(vi) 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체(여기서 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함한다);

(vii) 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체(여기서 대장균 O18A 항원 다당류는 화학식 (O18A)의 구조를 포함한다);

(viii) 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체(여기서 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함한다); 및

(ix) 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체(여기서 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함한다)를 포함하고,

화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조 각각은 표 1에 제시되어 있고, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 더욱 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고,

조성물에 존재하는 대장균 항원 다당류는 O1A, O2, O4-Glc+, O6A, O15, O16, O18A, O25B 및 O75으로 구성된다. 바람직하게는, 담체 단백질은 P. 애루기노사의 탈독소화된 외독소 A(EPA-4)이고, 더욱 바람직하게는 EPA-4는 서열번호 3의 아미노산 서열을 포함한다. 바람직하게는, O75 항원 다당류 대 O1A, O2 및/또는 O6A 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다. 바람직하게는 조성물에 존재하는 대장균 항원 다당류는 1:1:1:1:1:1:1:2:2의 비의 O1A, O2, O4-Glc+, O6A, O15, O16, O18A, O25B 및 O75로 구성된다.

하나의 일반 양태에서, 대장균 O75 및 O6 항원 다당류를 포함하는 조성물이 본원에 제공되며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O6 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 1.5:1 내지 약 2.5:1, 더욱 바람직하게는 약 2:1이다.

특정 구현예에서, 조성물은 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고,

바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다.

특정 구현예에서,

대장균 O1 항원 다당류는 표 1에 제시된 화학식 (O1A)의 구조를 포함하고,

대장균 O2 항원 다당류는 표 1에 제시된 화학식 (O2)의 구조를 포함하고,

대장균 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고,

대장균 O6 항원 다당류는 표 1에 제시된 화학식 (O6A)의 구조를 포함하고,

대장균 O15 항원 다당류는 표 1에 제시된 화학식 (O15)의 구조를 포함하고,

대장균 O16 항원 다당류는 표 1에 제시된 화학식 (O16)의 구조를 포함하고,

대장균 O18 항원 다당류는 표 1에 제시된 화학식 (O18A)의 구조를 포함하고,

대장균 O25 항원 다당류는 표 1에 제시된 화학식 (O25B)의 구조를 포함하고,

대장균 O75 항원 다당류는 표 1에 제시된 화학식 (O75)의 구조를 포함하고,

특정 구현예에서, O1:O2:O4:O6:O15:O16:O18:O25:O75의 대장균 항원 다당류의 중량비는 1:1:1:1:1:1:1:2:2이다.

특정 구현예에서, O75 항원 다당류의 농도는 약 8 내지 50 μg/mL, 바람직하게는 12 내지 40 μg/mL, 예를 들어, 16 내지 32 μg/mL, 바람직하게는 약 32 μg/mL이다.

특정 구현예에서, 조성물은 담체 단백질에 공유 결합된 적어도 하나의 추가 대장균 항원 다당류를 추가로 포함한다.

특정 구현예에서, 적어도 하나의 추가 대장균 항원 다당류는 표 1에 제시된 화학식 (O8)을 갖는 O8 항원 다당류를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다.

특정 구현예에서, 각각의 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D로 구성된 군으로부터 독립적으로 선택된다.

특정 구현예에서, 담체 단백질은 슈도모나스 애루기노사의 탈독소화된 외독소 A(EPA) 또는 CRM197이다.

특정 구현예에서, 담체 단백질은 서열번호 1의 아미노산 서열을 갖는 1 내지 20개, 예컨대 1 내지 10개 또는 2 내지 4개의 글리코실화 공통 서열, 바람직하게는 서열번호 2의 아미노산 서열을 갖는 공통 서열을 포함하고, 가장 바람직하게는 담체 단백질은 4개의 글리코실화 공통 서열을 포함한다.

특정 구현예에서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함하는 EPA이다.

특정 구현예에서, 대장균 항원 다당류는 생체접합에 의해 또는 화학적 접합에 의해 담체 단백질에 공유 결합된다. 화학적 접합은 예를 들어 환원적 아민화 화학(RAC), 단일 말단 접합, (2-((2-옥소에틸)티오)에틸) 카바메이트(eTEC) 스페이서와의 접합, ADH 스페이서를 이용한 또는 ADH 스페이서 없는 시아닐화 화학(CNBr, CDAP), 티오에테르 화학(말레이미드/브로모아세틸 링커 기반), 또는 EDC-N-하이드록시 숙신이미드 제로 링커 화학을 포함한다.

특정 구현예에서, 대장균 항원 다당류는 생체접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 다당류는 담체 단백질의 글리코실화 부위의 Asn 잔기에 공유 결합된다.

또 다른 양태에서, 조성물이 본원에 제공되며, 조성물은 P.애루기노사의 탈독소화된 외독소 A(EPA-4) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체(여기서 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함한다);

EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체(여기서 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함한다);

EPA-4 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체(여기서 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함한다);

EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체(여기서 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함한다);

EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체(여기서 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함한다);

EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체(여기서 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함한다);

EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체(여기서 대장균 O18A 항원 다당류는 화학식 (O18A)의 구조를 포함한다);

EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체(여기서 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함한다); 및

EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체(여기서 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함한다)를 포함하고,

여기서 EPA-4는 서열번호 3의 아미노산 서열을 포함하고,

O75 항원 다당류 대 O6A 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

특정 구현예에서, 조성물은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 추가로 포함한다.

특정 구현예에서, 조성물은 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체를 포함하며, 여기서 대장균 글루코실화된 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고, 여기서 n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체는 다음을 포함하는 대장균 세포에서 생산되었다:

(i) 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;

(ii) 서열번호 4와 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 글루코실 트랜스퍼라제는 대장균 O4 항원을 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생산할 수 있다);

(iii) 서열번호 7 및 8과 각각 적어도 80%, 바람직하게는 적어도 90%, 바람직하게는 적어도 95%의 서열 동일성을 갖는 트랜스로카제 및 글리코실트랜스퍼라제를 암호화하는 뉴클레오티드 서열(여기서 트랜스로카제는 박토프레놀 연결된 글루코스를 전위시킬 수 있고 글리코실트랜스퍼라제는 박토프레놀을 글루코실화할 수 있다);

(iv) 담체 단백질을 암호화하는 뉴클레오티드 서열; 및

(v) 대장균 글루코실화된 O4 항원 다당류를 담체 단백질에 공유 결합시킬 수 있는 올리고사카릴 트랜스퍼라제를 암호화하는 뉴클레오티드 서열(바람직하게는 올리고사카릴 트랜스퍼라제가 캄필로박터 제주니로부터의 PglB이다).

특정 구현예에서, 본원에 기재된 조성물은 수은 유도체 티메로살과 같은 보존제를 추가로 포함한다. 특정 구현예에서, 본원에 기재된 제약 조성물은 0.001% 내지 0.01%의 티메로살을 포함한다. 다른 구현예에서, 본원에 기재된 제약 조성물은 보존제를 포함하지 않는다.

특정 구현예에서, 본원에 개시된 조성물(예를 들어, 면역원성 조성물)은 아쥬반트를 포함하거나, 아쥬반트와 조합하여 투여된다. 본원에 기재된 조성물과 조합하여 투여하기 위한 아쥬반트는 상기 조성물의 투여 전에(예를 들어, 72시간, 48시간, 24시간, 12시간, 6시간, 2시간, 1시간, 10분 이내), 동시에 또는 이후에(예를 들어, 72시간, 48시간, 24시간, 12시간, 6시간, 2시간, 1시간, 10분 이내) 투여될 수 있다. 일부 구현예에서, “아쥬반트”라는 용어는 본원에 기재된 조성물과 함께 또는 이의 일부로 투여되는 경우 생체접합체에 대한 면역 반응을 증강, 증진시키고/시키거나 촉진하지만, 아쥬반트 화합물이 단독으로 투여되는 경우에는 생체접합체에 대한 면역 반응을 생성하지 않는 화합물을 지칭한다. 일부 구현예에서, 아쥬반트는 생체접합체 펩티드에 대해 면역 반응을 일으키고 알레르기 또는 다른 부작용을 일으키지 않는다. 아쥬반트는 예를 들어 림프구 모집, B 및/또는 T 세포의 자극, 및 대식세포의 자극을 포함하는 몇몇 메커니즘에 의해 면역 반응을 증진시킬 수 있다. 특정 바람직한 구현예에서, 본원에 기재된 조성물은 생체접합체 이외의 아쥬반트를 포함하지 않고/않거나, 생체접합체 이외의 아쥬반트와 함께 투여되지 않는다(생체접합체가 일부 고유 아쥬반트 특성을 포함하는 경우, 이들은 무시되고 외인성 아쥬반트가 이러한 구현예에서 첨가될 것이다).

적합한 아쥬반트의 예에는 비제한적으로 알루미늄 염(알룸)(예컨대 알룸 또는 나노알룸 제형을 포함하는 나노입자를 포함하는, 알루미늄 하이드록사이드, 알루미늄 포스페이트, 알루미늄 설페이트, 및 알루미늄 옥사이드), 칼슘 포스페이트, 모노포스포릴 지질 A(MPL) 또는 3-데-O-아실화 모노포스포릴 지질 A(3D-MPL)(예를 들어, GB2220211, EP0971739, EP1194166, US6491919 참조), AS01, AS02, AS03 및 AS04(모두 GlaxoSmithKline; 예를 들어 AS04에 대해 EP1126876, US7357936, AS02에 대해 EP0671948, EP0761231, US5750110 참조), MF59(Novartis), 이미다조피리딘 화합물(WO2007/109812 참조), 이미다조퀴녹살린 화합물(WOWO2007/109813 참조), 델타-이눌린, STING-활성화 합성 사이클릭-디-뉴클레오타이드(예를 들어 US20150056224), 레시틴과 카보머 동종중합체의 조합(예를 들어 US6676958), 및 사포닌, 예컨대 QuilA 및 QS21(예를 들어, 문헌[Zhu D and W Tuo, 2016, Nat Prod Chem Res 3: e113] 참조), 선택적으로 QS7과 조합한 Matrix M, Iscoms, Iscomatrix 등(문헌[Kensil et al., in Vaccine Design: The Subunit and Adjuvant Approach (eds. Powell & Newman, Plenum Press, NY, 1995)]; 미국 특허 제5,057,540호 참조)을 포함한다. 일부 구현예에서, 아쥬반트는 프로인드 아쥬반트(완전 또는 불완전)이다. 다른 아쥬반트로는 수중유 에멀젼(예컨대 스쿠알렌 또는 땅콩유)(선택적으로 면역 자극제, 예컨대 모노포스포릴 지질 A와 조합됨)이 있다(문헌[Stoute et al., N. Engl. J. Med. 336, 86-91 (1997)] 참조). 또 다른 아쥬반트는 CpG이다. 아쥬반트의 추가 예는 면역 자극제, 예컨대 AS01E 및 AS01B에서와 같이 MPL 및 QS21을 함유하는 리포좀이다(예를 들어 US 2011/0206758). 아쥬반트의 다른 예는 이미다조퀴놀린(예컨대, 이미퀴모드 및 R848)이다. 예를 들어, 문헌[Reed G, et al., 2013, Nature Med, 19: 1597-1608] 참조. 특정 구현예에서, 아쥬반트는 톨(toll)-유사 수용체 4(TLR4) 효능제를 함유한다. TLR4 효능제는 당해 분야에 잘 알려져 있다. 예를 들어 문헌[Ireton GC and SG Reed, 2013, Expert Rev Vaccines 12: 793-807] 참조. 특정 구현예에서, 아쥬반트는 지질 A를 포함하는 TLR4 효능제, 또는 이의 유사체 또는 유도체, 예컨대 MPL, 3D-MPL, RC529(예를 들어, EP1385541), PET-지질 A, GLA(글리코피라노실 지질 아쥬번트, 합성 이당류 당지질; 예를 들어, US20100310602, US8722064), SLA(예를 들어, 문헌[Carter D et al, 2016, Clin Transl Immunology 5: e108 (doi: 10.1038/cti.2016.63)]으로서, 이는 인간 백신을 위한 TLR4 리간드를 최적화시키기 위한 구조-기능 접근법을 기술함), PHAD(포스포릴화된 헥사아실 이당류), 3D-PHAD(이의 구조는 GLA의 구조와 동일함), 3D-(6-아실)-PHAD (3D(6A)-PHAD) (PHAD, 3D-PHAD 및 3D(6A)PHAD는 합성 지질 A 변이체이며, 예를 들어, 이들 분자의 구조를 또한 제공하는 avantilipids.com/divisions/adjuvants 참조), E6020(CAS 번호 287180-63-6), ONO4007, OM-174 등을 포함한다.

특정 구현예에서, 본원에 기재된 조성물은 아쥬반트를 포함하지 않으며, 아쥬반트와 조합하여 투여되지 않는다.

특정 구현예에서, 본원에 기재된 조성물은 대상체로의 의도된 투여 경로에 적합하도록 제형화된다. 예를 들어, 본원에 기재된 조성물은 피하, 비경구, 경구, 피내, 경피, 결장직장, 복강내 및 직장 투여에 적합하도록 제형화될 수 있다. 특정 구현예에서, 제약 조성물은 정맥내, 경구, 복강내, 비강내, 기관내, 피하, 근육내, 국소, 피내, 경피 또는 폐 투여를 위해 제형화될 수 있다. 특정 구현예에서, 본원에 기재된 조성물은 근육내 주사에 의해 투여된다.

특정 구현예에서, 본원에 기재된 조성물은 하나 이상의 완충액, 예를 들어, Tris-완충 식염수, 인산염 완충액, 또는 수크로스 포스페이트 글루타메이트 완충액을 추가로 포함한다.

특정 구현예에서, 본원에 기재된 조성물은 하나 이상의 염, 예를 들어, 트리스-하이드로클로라이드, 나트륨 클로라이드, 칼슘 클로라이드, 칼륨 클로라이드, 나트륨 포스페이트, 모노나트륨 글루타메이트, 또는 알루미늄 염(예를 들어, 알루미늄 하이드록사이드, 알루미늄 포스페이트, 칼륨 알루미늄 설페이트, 또는 이러한 알루미늄 염의 혼합물)을 추가로 포함한다.

본원에 기재된 조성물은 투여 지침과 함께 용기, 팩, 또는 디스펜서에 포함될 수 있다.

본원에 기재된 조성물은 사용 전에 보관될 수 있다. 예를 들어, 조성물은 냉동 보관되거나(예를 들어, 약 -20℃ 또는 약 -70℃에서); 냉장 조건에서 보관되거나(예를 들어, 약 4℃에서); 실온에서 보관될 수 있다.

일 양태에서, 본 발명은 또한 본 발명에 따른 조성물을 제조하는 방법을 제공하며, 이는 필요한 O 항원 접합체 각각을 제공하고(예를 들어, 이들을, 예를 들어, 원료 의약품의 형태로 얻거나 제조함으로써), 본 발명의 조성물(예를 들어, 다가 대장균, 특히 ExPEC, 백신 조성물, 때때로 완제 의약품으로 지칭됨)을 얻기 위해 원하는 비율 및/또는 양으로 혼합하는 단계를 포함한다.

면역학적 반응의 유도 방법

본원에 제공된 생체접합체 및 조성물은 대상체에서 대장균 O 항원에 대한 항체를 유도하거나 대장균에 대해 대상체를 백신접종하는 데 사용될 수 있다. 본원에 기재된 대상체에서 면역 반응을 유도하는 방법은 O 항원이 조성물(들)에 존재하는 ExPEC 균주에 의한 감염에 대해 대상체를 백신접종하는 결과를 낳는다. O 항원 서브타입이 사용되는 경우, 본 발명의 방법은 또한 유사한 항원성을 갖는 또 다른 O 항원 서브타입에 대한 면역 반응을 유도할 수 있다. 예는 하위 혈청형 사이의 교차 반응성이다. 예를 들어, O25B 항원으로의 면역화는 O25B 및 O25A 혈청형의 O-LPS를 인식하는 항체를 유도하고, 글루코실화된 O4로의 면역화는 글루코실화된 O4 및 비글루코실화된 O4 혈청형의 O-LPS를 인식하는 항체를 유도하며, 또 다른 예에서는 서로 다른 O 항원을 갖지만 여전히 항원 구조에서 약간의 유사성을 공유하는 다른 혈청형에 대한 교차 면역화가 존재할 수도 있다(예를 들어, 일부 혈청은 혈청형 연구에서 교차 반응하는 것으로 나타남).

일부 구현예에서, 대상체는 인간이다. 일부 구현예에서, 대상체는 ExPEC 감염 또는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.

일부 구현예에서, 침습성 ExPEC 질환은 패혈증을 포함한다. 일부 구현예에서, 침습성 ExPEC 질환은 균혈증을 포함한다. 일부 구현예에서, 침습성 ExPEC 질환은 요로 감염, 수술 부위 감염, 복부 또는 골반 감염, 폐렴, 골수염, 연조직염, 패혈증, 균혈증, 상처 감염, 신우신염, 수막염, 복막염, 담관염, 연조직 감염, 화농성 근염, 패혈성 관절염, 안내염, 화농성 갑상선염, 부비동염, 심내막염 및 전립선염 중 하나 이상을 포함한다.

특정 구현예에서, 본원에 기재된 조성물의 투여 후 대상체에서 유도된 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다. 일 구현예에서, 대상체는 투여 시점에 대장균(예를 들어, ExPEC) 감염이 있다. 바람직한 구현예에서, 대상체는 투여 시점에 대장균(예를 들어, ExPEC) 감염이 없다.

특정 구현예에서, 본원에 기재된 조성물의 투여 후 대상체에서 유도된 면역 반응은 조성물이 투여된 대상체의 바람직하게는 적어도 30%, 더욱 바람직하게는 적어도 40%, 예컨대 적어도 50%에서 ExPEC 감염으로 인한 증상을 예방 또는 감소시키는 데 효과적이다. ExPEC 감염의 증상은 감염의 특성에 따라 달라질 수 있고, 배뇨장애, 증가된 소변 빈도 또는 절박, 고름뇨, 혈뇨, 요통, 골반통, 소변 동안의 통증, 열, 오한, 및/또는 구역(예를 들어, ExPEC에 의해 야기된 요로 감염을 갖는 대상체에서); 고열, 두통, 목 경직, 구역, 구토, 발작, 졸림, 및/또는 빛 민감성(예를 들어, ExPEC에 의해 야기된 수막염이 있는 대상체에서); 열, 증가된 심박수, 증가된 호흡률, 감소된 소변 배출량, 감소된 혈소판 수, 복통, 호흡 곤란, 및/또는 비정상적인 심장 기능(예를 들어, ExPEC에 의해 야기된 패혈증이 있는 대상체)을 포함할 수 있으나, 이에 한정되지 않는다.

특정 구현예에서, 본원에 기재된 조성물의 투여 후 대상체에서 유도된 면역 반응은 ExPEC 감염을 앓고 있는 대상체의 입원 가능성을 감소시키는 데 효과적이다. 일부 구현예에서, 본원에 기재된 조성물의 투여 후 대상체에서 유도된 면역 반응은 ExPEC 감염을 앓고 있는 대상체의 입원 기간을 감소시키는 데 효과적이다.

특정 구현예에서, 본 발명의 조성물을 사용한 백신접종은 침습성 ExPEC 질환(IED), 예를 들어 요로패혈증, 균혈증, 패혈증 등을 예방하기 위한 것이다. 특정 구현예에서, 백신접종은 요로 감염의 발생 또는 중증도를 예방하거나 감소시키기 위한 것이다. 특정 구현예에서, IED는 병원에서 획득할 수 있다. 예를 들어, 비뇨 생식기 및/또는 복부 시술 또는 수술을 받는 환자에서 획득할 수 있다. 특정 구현예에서, IED는 예를 들어 중심선, 카테터 등을 통해 다른 병태로 건강 관리를 받는 환자에서, 예를 들어, 병원, 외래 수술 센터, 말기 신장 질환 시설, 장기 요양 시설 등에서, 의료 관련된 것일 수 있다. 특정 구현예에서, IED는 예를 들어, 최근에 의료 위험에 노출되지 않은 환자에서, 지역사회에서 획득할 수 있다.

일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 본원에 기재된 조성물을 대상체에게 투여하는 단계를 포함한다.

일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 예를 들어 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 2.5:1, 더욱 바람직하게는 약 2:1이다. 일부 바람직한 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O6 항원 다당류는 하나의 조성물로서 투여된다. 일부 대안적인 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O6 항원 다당류는 개별 조성물의 조합물로서 투여된다.

일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다. 바람직하게는 O1 항원은 O1A이고, O4 항원은 글루코실화된 O4 항원 다당류이고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1-, O2-, O4-, O6-, O15-, O16-, O18-, O25- 및 O75-항원은 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 본 발명에 따르면, O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다. 일부 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다. 특정 구현예에서 이러한 추가 대장균 항원은 바람직하게는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 갖는 O8 항원 다당류를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, 담체 단백질에 공유 결합된 각각의 대장균 항원 다당류는 생체접합체이다. 일부 구현예에서, 생체접합체는 하나의 조성물로서 투여된다. 일부 구현예에서, 생체접합체는 2개 이상의 개별 조성물의 조합물로서 투여된다. 개별 투여 횟수를 제한하는 것이 바람직하므로 대부분 또는 모든 항원을 포함하는 단일 조성물을 사용하는 것이 바람직하다.

일 구현예에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하기 위한 조성물을 투여하는 방법으로서, 여기서 조성물은 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체를 포함하고, 투여되는 O75 항원 다당류의 농도는 용량당 적어도 16 μg이다.

일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O1 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 예를 들어 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 2.5:1, 더욱 바람직하게는 약 2:1이다. 일부 바람직한 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O1 항원 다당류는 하나의 조성물로서 투여된다. 일부 대안적인 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O1 항원 다당류는 조성물의 조합물로서 투여된다. 일부 구현예에서, 방법은 대장균 O2, O4, O6, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다. 바람직하게는 O1 항원은 O1A이고, O4 항원은 글루코실화된 O4 항원 다당류이고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1-, O2-, O4-, O6-, O15-, O16-, O18-, O25- 및 O75-항원은 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 본 발명에 따르면, O75 항원 다당류 대 O1 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다. 일부 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다. 특정 구현예에서 이러한 추가 대장균 항원은 바람직하게는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 갖는 O8 항원 다당류를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, 담체 단백질에 공유 결합된 각각의 대장균 항원 다당류는 생체접합체이다. 일부 구현예에서, 생체접합체는 하나의 조성물로서 투여된다. 일부 구현예에서, 생체접합체는 2개 이상의 개별 조성물의 조합물로서 투여된다. 개별 투여 횟수를 제한하는 것이 바람직하므로 대부분 또는 모든 항원을 포함하는 단일 조성물을 사용하는 것이 바람직하다.

일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O2 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 예를 들어 약 1.5:1, 1.6:1, 1.7:1, 1.8:1, 1.9:1, 2.0:1, 2.1:1, 2.2:1, 2.3:1, 2.4:1, 2.5:1, 더욱 바람직하게는 약 2:1이다. 일부 바람직한 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O2 항원 다당류는 하나의 조성물로서 투여된다. 일부 대안적인 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O2 항원 다당류는 조성물의 조합물로서 투여된다. 일부 구현예에서, 방법은 대장균 O1, O4, O6, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다. 바람직하게는 O1 항원은 O1A이고, O4 항원은 글루코실화된 O4 항원 다당류이고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1-, O2-, O4-, O6-, O15-, O16-, O18-, O25- 및 O75-항원은 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 본 발명에 따르면, O75 항원 다당류 대 O2 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다. 일부 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다. 바람직하게는, 담체 단백질에 공유 결합된 각각의 대장균 항원 다당류는 생체접합체이다. 일부 구현예에서, 생체접합체는 하나의 조성물로서 투여된다. 일부 구현예에서, 생체접합체는 2개 이상의 개별 조성물의 조합물로서 투여된다. 개별 투여 횟수를 제한하는 것이 바람직하므로 대부분 또는 모든 항원을 포함하는 단일 조성물을 사용하는 것이 바람직하다.

일부 구현예에서, 대상체에서 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제1 유효량의 대장균 O25 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1:4 및 1:0.5이고, 바람직하게는 약 1:2 내지 1:1, 더욱 바람직하게는 약 1:1, 예를 들어, 약 1:1.5, 1:1.4, 1:1.3, 1:1.2, 1:1.1, 1:1.0, 1:0.9, 1:0.8, 1:0.7, 1:0.6, 또는 1:0.5이다. 일부 바람직한 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O25 항원 다당류는 하나의 조성물로서 투여된다. 일부 대안적인 구현예에서, 담체 단백질에 공유 결합된 O75 항원 다당류 및 담체 단백질에 공유 결합된 O25 항원 다당류는 조성물의 조합물로서 투여된다. 일부 구현예에서, 방법은 대장균 O1, O2, O4, O6, O15, O16, O18 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합된다. 바람직하게는 O1 항원은 O1A이고, O4 항원은 글루코실화된 O4 항원 다당류이고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다. 바람직하게는 O1-, O2-, O4-, O6-, O15-, O16-, O18-, O25- 및 O75-항원은 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 본 발명에 따르면, O75 항원 다당류 대 O25 항원 다당류의 비는 약 1:4 내지 약 1:0.5, 바람직하게는 약 1:2 내지 1:1, 더욱 바람직하게는 약 1:1이다. 일부 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다. 특정 구현예에서 이러한 추가 대장균 항원은 바람직하게는 표 1에 제시된 바와 같은 화학식 (O8)의 구조를 갖는 O8 항원 다당류를 포함하며, 여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어, 10 내지 20의 정수이다. 바람직하게는, 담체 단백질에 공유 결합된 각각의 대장균 항원 다당류는 생체접합체이다. 일부 구현예에서, 생체접합체는 하나의 조성물로서 투여된다. 일부 구현예에서, 생체접합체는 2개 이상의 개별 조성물의 조합물로서 투여된다. 개별 투여 횟수를 제한하는 것이 바람직하므로 대부분 또는 모든 항원을 포함하는 단일 조성물을 사용하는 것이 바람직하다.

특정 구현예에서, 본원에 기재된 조성물, 조합물 및 생체접합체는 항체, 바람직하게는 옵소닌 식세포 활성을 갖는 항체의 생성을 포함하는 면역 반응을 유도하기 위해 대상체에게 투여될 수 있다. 이러한 항체는 당업자에게 공지된 기술(예를 들어, 면역친화성 크로마토그래피, 원심분리, 침전 등)을 사용하여 단리될 수 있다.

대상체에서 면역 반응을 생성하는 본원에 기재된 생체접합체 및 조성물의 능력은 당업자에게 공지되거나 본원에 기재된 임의의 접근법을 사용하여 평가될 수 있다. 일부 구현예에서, 대상체에서 면역 반응을 생성하는 생체접합체의 능력은 본원에 기재된 생체접합체로 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이) 또는 일련의 대상체를 면역화하고 대조군(예컨대, PBS)으로 추가 대상체(예컨대, 마우스, 래트, 토끼 또는 원숭이) 또는 일련의 대상체를 면역화함으로써 평가될 수 있다. 대상체 또는 일련의 대상체는 후속적으로 ExPEC으로 챌린지될 수 있고 대상체 또는 일련의 대상체에서 질환(예컨대, UTI, 균혈증 또는 기타 질환)을 유발하는 ExPEC의 능력이 결정될 수 있다. 당업자는 대조군으로 면역화된 대상체 또는 일련의 대상체가 ExPEC으로 챌린지 후 질환에 걸리지만, 본원에 기재된 생체접합체(들) 또는 이의 조성물로 면역화된 대상체 또는 일련의 대상체는 질환을 덜 앓거나 앓지 않는 경우, 생체접합체가 대상체에서 면역 반응을 생성할 수 있음을 인식할 것이다. ExPEC으로부터의 O 항원과 교차 반응하는 항혈청을 유도하는 본원에 기재된 생체접합체(들) 또는 이의 조성물의 능력은 예를 들어, 면역분석법, 예컨대 ELISA(예를 들어, 문헌[Van den Dobbelsteen et al, 2016, Vaccine 34: 4152-4160] 참조) 또는 ECL 기반 면역분석법에 의해 테스트될 수 있다.

예를 들어, 대상체에서 면역 반응을 생성하는 본원에 기재된 생체접합체의 능력은 혈청 살균 분석(SBA) 또는 옵소닌 식세포 살상 분석(OPK 분석, 또는 OPKA)을 사용하여 평가될 수 있으며, 이는 당접합체 기반 백신의 승인을 얻는 데 사용된, 확립된 허용되는 방법을 대표한다. 이러한 분석법은 당업계에 잘 공지되어 있으며, 간략하게는 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이)에게 이러한 항체를 유발하는 화합물을 투여함으로써 관심 표적(예를 들어, O 항원 다당류, 예를 들어 대장균 O75 항원 다당류)에 대한 항체를 생성하고 단리하는 단계를 포함한다. 이어서, 항체의 살균 능력은 예를 들어, 항체 및 보체 및 - 분석법에 따라 - 호중구 세포의 존재 하에 문제의 박테리아(예를 들어, 관련 혈청형의 대장균)를 배양하고, 예를 들어, 표준 미생물학적 접근법을 사용하여 박테리아의 살상 및/또는 중화를 매개하는 항체의 능력을 분석함으로써 평가될 수 있다. 대장균 생체접합체 백신에 대한 OPK 분석법의 예는, 예를 들어, 문헌[Abbanat et al, 2017, Clin. Vaccine Immunol. 24: e00123-17] 참조. OPK 분석법은 모노플렉스 또는 멀티플렉스 형식으로 수행될 수 있으며, 이 중 멀티플렉스 형식(예를 들어, 동시에 다중 혈청형 테스트)이 전형적으로 선호된다. 멀티플렉스 OPK 분석법은 때때로 본원에서 "MOPA"로 지칭된다.

특정 구현예에서, 본원에서 제공된 조성물은 대장균 O75 항원 다당류의 생체접합체 및 적어도 대장균 O6A 항원 다당류의 생체접합체를 포함하며, 대장균 O75 항원 다당류의 유효량은 조성물에 존재하는 임의의 다른 생체접합체의 농도보다 약 1.2 내지 8배, 예를 들어, 약 2 내지 4배, 예컨대 1.5, 2, 3, 4, 5, 6, 7 또는 8배 높다. 이러한 구현예에서, 대장균 O75 항원 다당류의 유효량은 예를 들어 투여당 약 5 내지 18 μg, 예컨대 투여당 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 μg이다. 바람직하게는, 약 8 내지 16 μg의 O75 항원 다당류가 투여당 투여된다.

특정 구현예에서, 본원에 기재된 조성물은 하나 이상의 다른 치료법(예를 들어, 항균 또는 면역조절 요법)과 조합하여 대상체에게 투여된다. 하나 이상의 다른 치료법은 ExPEC 감염의 치료 또는 예방에 유익할 수 있거나, 또는 ExPEC 감염과 관련된 증상 또는 병태를 개선할 수 있다. 일부 구현예에서, 하나 이상의 다른 치료법은 진통제 또는 해열제이다. 특정 구현예에서, 치료법은 5분 미만 내지 1주 미만의 간격으로 투여된다. 당업자에게 공지된 임의의 항균제(예를 들어, 항생제)가 본원에 기재된 조성물과 조합하여 사용될 수 있다.

특정 구현예에서, 본 발명에 따른 생체접합체 또는 조성물은 대상체에게 1회 투여된다. 특정 구현예에서, 본 발명에 따른 생체접합체 또는 조성물은 대상체에게 1회 초과하여, 예를 들어 프라임-부스트 요법으로 투여된다. 특정 구현예에서, 2회 투여 사이의 시간은 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 6개월, 적어도 1년, 적어도 2년, 적어도 5년, 적어도 10년 또는 적어도 15년이다. 인간에서, 원하는 면역 반응은 전형적으로 본 발명에 따른 생체접합체 또는 조성물의 단일 투여에 의해 생성될 수 있다. 특정 구현예에서, 예를 들어 10년 후 반복 투여가 제공된다.

본원에 제공된 조성물은 대상체에서 대장균 O 항원에 대한 항체를 유도하고 대장균, 특히 장외 병원성 대장균(ExPEC)에 대해 대상체를 백신접종하는 데 사용될 수 있다. 본원에서 사용되는 "대상체"는 본원에 제공된 생체접합체 또는 조성물을 투여받게 될 또는 투여받은 임의의 동물, 바람직하게는 포유류를 의미한다. 본원에서 사용되는 용어 "포유류"는 임의의 포유류를 포괄한다. 포유류의 예로는 소, 말, 양, 돼지, 고양이, 개, 마우스, 래트, 토끼, 기니피그, 원숭이 또는 유인원과 같은 비인간 영장류(NHP), 인간 등이 포함되나 이에 한정되지 않는다. 특정 구현예에서, 대상체는 인간이다. 인간 대상체는 임의의 연령일 수 있다. 특정 구현예에서, 대상체는 약 2개월 내지 약 18세, 예를 들어 1세 내지 18세의 인간이다. 특정 구현예에서, 대상체는 적어도 18세의 인간이다. 특정 구현예에서, 대상체는 15세 내지 50세, 예를 들어, 18세 내지 45세, 예를 들어, 20세 내지 40세의 인간이다. 특정 구현예에서, 대상체는 인간 남성이다. 특정 구현예에서, 대상체는 인간 여성이다. 특정 구현예에서, 대상체는 면역저하자이다. 특정 구현예에서, 대상체는 적어도 50세, 적어도 55세, 적어도 60세, 적어도 65세의 인간이다. 특정 구현예에서, 대상체는 100세 이하, 95세 이하, 90세 이하, 85세 이하, 80세 이하 또는 75세 이하의 인간이다. 특정 구현예에서, 대상체는 60세 이상 85세 이하의 인간이다. 특정 구현예에서, 대상체는 안정적인 건강 상태의 인간이다. 특정 구현예에서, 대상체는 안정적인 건강 상태의 60세 이상 85세 이하의 인간 성인이다. 특정 구현예에서, 대상체는 요로 감염(UTI, 즉 요도, 방광, 요관 및/또는 신장에서의 박테리아 감염; 일부 구현예에서 이는 신우신염을 포함함)의 병력이 있는, 즉, 자신의 삶에서 적어도 1회의 UTI 에피소드가 있었던 인간이다. 특정 구현예에서, 대상체는 지난 20년, 15년, 12년, 10년, 9년, 8년, 7년, 6년, 5년, 4년, 3년, 2년 또는 1년 동안 UTI의 병력이 있는 인간이다. 특정 구현예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 인간이다. 특정 구현예에서, 대상체는 재발성 UTI의 병력이 있는, 즉 6개월 동안 적어도 2회의 UTI 또는 1년 동안 적어도 3회의 UTI가 있었던 인간 대상체이다. 특정 구현예에서, 대상체는 지난 2년 동안 재발성 UTI의 병력이 있는 인간 대상체이다. 특정 구현예에서, 대상체는 안정적인 건강 상태의 60세 이상의 인간이다. 특정 구현예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 60세 이상의 인간이다. 특정 구현예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 60세 이상 75세 미만의 인간이다. 특정 구현예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 75세 이상의 인간 대상체이다. 특정 구현예에서, 대상체는 선택적 비뇨생식기 및/또는 복부 시술 또는 수술, 예를 들어 경직장 초음파 유도 전립선 바늘 생검(TRUS-PNB)을 받도록 예정된 환자이다. 특정 구현예에서, 대상체는 급성 세균성 전립선염(ABP)을 포함하는 전립선염, 즉 전립선의 세균 감염의 병력이 있는, 즉, 자신의 삶에서, 예를 들어, 지난 10년, 9년, 8년, 7년, 6년, 5년, 4년, 3년, 2년 또는 1년 동안 적어도 1회의 전립선염 에피소드가 있었던 인간이다.

바람직한 구현예에서, 본 발명에 따른 면역 반응을 유도하는 조성물 또는 방법에 의해 유도된 면역 반응은 옵소닌 식세포 활성을 갖는 항체를 포함한다. 담체 단백질에 공유 결합된 대장균 O 항원 다당류(즉, 대장균 O 항원의 당접합체)를 포함하는 조성물이 인간에서 이러한 유형의 기능적 항체를 유도할 수 있는 것으로 나타났으며, 이러한 항체는 생체 내에서 세균성 살상을 매개하고 이 메커니즘을 통해 대장균 감염으로부터 보호할 수 있는 것으로 나타났다.

또 다른 양태에서, 대상체에게 본원에 기재된 바와 같은 조성물을 투여하는 단계를 포함하는, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 본원에 제공된다.

또 다른 양태에서, 대상체에게 본원에 기재된 바와 같은 조성물을 투여하는 단계를 포함하는, 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대해 대상체를 백신접종하는 방법이 본원에 제공된다. 특정 양태에서, 대장균, 바람직하게는 ExPEC에 대한 항체를 유도하는데 사용하기 위한, 본원에 기재된 바와 같은 조성물이 본원에 제공된다. 특정 양태에서, 대장균, 바람직하게는 ExPEC에 대한 백신접종에 사용하기 위한, 본원에 기재된 바와 같은 조성물이 본원에 제공된다. 특정 양태에서, 대상체에서 대장균, 바람직하게는 ExPEC에 대한 항체를 유도하기 위한 약제의 제조를 위한 본원에 기재된 바와 같은 조성물의 용도가 본원에 제공된다. 특정 양태에서, 대장균, 바람직하게는 ExPEC에 대해 대상체를 백신접종하기 위한 약제의 제조를 위한, 본원에 기재된 바와 같은 조성물의 용도가 본원에 제공된다.

특정 양태에서, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법에 사용하기 위한 본원에 기재된 바와 같은 조성물이 본원에 제공된다. 특정 양태에서, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하기 위한 약제의 제조에서 본원에 기재된 바와 같은 조성물의 용도가 본원에 제공된다.

또 다른 양태에서, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법이 본원에 제공되며, 방법은 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

특정 구현예에서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다.

특정 구현예에서, 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.

특정 구현예에서, 방법은 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고,

바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고,

더욱 바람직하게는 각각의 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고,

O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

특정 구현예에서, 방법은 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다.

특정 구현예에서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함한다.

특정 구현예에서, 대상체는 대장균(바람직하게는 ExPEC) 감염, 바람직하게는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.

특정 구현예에서, 약 8~16 μg, 바람직하게는 약 16 μg의 O75 항원 다당류가 투여당 투여된다.

특정 구현예에서, O1:O2:O4:O6:O15:O16:O18:O25:O75의 투여되는 대장균 항원 다당류의 중량비는 1:1:1:1:1:1:1:2:2이다.

특정 구현예에서, 글루코실화된 O4는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체이고, 여기서 대장균 글루코실화된 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고, 여기서 n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체는 다음을 포함하는 대장균 세포에서 생산되었다:

(iv) 담체 단백질을 암호화하는 뉴클레오티드 서열; 및

일 양태에서, 본 발명은 또한 대장균 O1, O2, O4, O6, O15, O16, O18, O25 및 O75 항원 다당류(각각의 항원에 대해 각각 상기 표시된 바와 같은 구조를 가짐)를 포함하는 조성물을 제공하며, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되며, 이 조성물은 담체 단백질에 공유 결합된 다른 대장균 O 항원 다당류를 포함하지 않는다(즉, 9가 조성물). 이 양태의 특정 구현예에서, 담체 단백질은 EPA이다. 이 양태의 다른 구현예에서, 담체 단백질은 CRM₁₉₇이다. 이 양태의 특정 구현예에서, 공유 결합은 화학적 접합의 결과이다. 다른 구현예에서, 공유 결합은 생체접합의 결과이다. 이 양태의 특정 구현예에서, 담체 단백질은 CRM₁₉₇이고 공유 결합은 화학적 접합의 결과이다. 이 양태의 다른 구현예에서, 담체 단백질은 EPA이고 공유 결합은 생체접합의 결과이다. 이 양태의 바람직한 구현예에서, 조성물은 O1, O2 또는 O6 항원 다당류와 비교하여, 바람직하게는 O1, O2 및 O6 항원 다당류의 각각의 하나와 비교하여, 증가된 양의 대장균 O75 항원 다당류, 바람직하게는 약 1.5 내지 4배 증가된, 바람직하게는 약 2배 증가된 양을 포함한다.

구현예

구현예 1은 대장균 O75 항원 다당류 및, O1, O2, O4, O6, O15, O16 및 O18로 구성된 군으로부터 선택된 적어도 하나의 추가 대장균 O 항원 다당류를 포함하는 조성물로서, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 추가의 O 항원 다당류의 농도비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 1.5:1 내지 약 2.5:1, 더욱 바람직하게는 약 2:1이다.

구현예 1a는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O1, 바람직하게는 O1A이다.

구현예 1a1은 구현예 1a의 조성물로서, O75 항원 다당류 대 O1 항원 다당류의 농도비는 2:1이다.

구현예 1b는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O2이다.

구현예 1b1은 구현예 1b의 조성물로서, O75 항원 다당류 대 O1 항원 다당류의 농도비는 2:1이다.

구현예 1c는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O4, 바람직하게는 글루코실화된 O4이다.

구현예 1c1은 구현예 1c의 조성물로서, O75 항원 다당류 대 O4 항원 다당류의 농도비는 2:1이다.

구현예 1d는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O6, 바람직하게는 O6A이다.

구현예 1d1은 구현예 1d의 조성물로서, O75 항원 다당류 대 O6 항원 다당류의 농도비는 2:1이다.

구현예 1e는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O15이다.

구현예 1e1은 구현예 1e의 조성물로서, O75 항원 다당류 대 O15 항원 다당류의 농도비는 2:1이다.

구현예 1f는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O16이다.

구현예 1f1은 구현예 1f의 조성물로서, O75 항원 다당류 대 O16 항원 다당류의 농도비는 2:1이다.

구현예 1g는 구현예 1의 조성물로서, 적어도 하나의 추가 O 항원 다당류는 O18, 바람직하게는 O18A이다.

구현예 1g1은 구현예 1g의 조성물로서, O75 항원 다당류 대 O18 항원 다당류의 농도비는 2:1이다.

구현예 1h는 구현예 1의 조성물로서, 담체 단백질에 독립적으로 공유 결합된 O25 항원 다당류를 추가로 포함하고, 바람직하게는 O25 항원은 O25B이다.

구현예 1h1은 구현예 1h의 조성물로서, O75 항원 다당류 대 O25 항원 다당류의 농도비는 1:1이다.

구현예 2는 구현예 1의 조성물로서, 조성물은 대장균 O75 항원 다당류 및, 대장균 O1, O2, O4, O6, O15, O16, O18, O25 항원 다당류 중 2개 이상, 바람직하게는 모두를 포함하며, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이다.

구현예 3은 구현예 2의 조성물로서,

(i) 대장균 O1 항원 다당류는 화학식 (O1A)의 구조를 포함하고

[화학식 (O1A)]

,

(ii) 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함하고

[화학식 (O2)]

,

(iii) 대장균 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함하고

[화학식 (O4-Glc+)]

,

(iv) 대장균 O6 항원 다당류는 화학식 (O6A)의 구조를 포함하고

[화학식 (O6A)]

,

(v) 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함하고

[화학식 (O15)]

,

(vi) 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함하고

[화학식 (O16)]

,

(vii) 대장균 O18 항원 다당류는 화학식 (O18A)의 구조를 포함하고

[화학식 (O18A)]

,

(viii) 대장균 O25 항원 다당류는 화학식 (O25B)의 구조를 포함하고

[화학식 (O25B)]

, 및

(ix) 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함하고

[화학식 (O75)]

,

구현예 4는 구현예 2 또는 3의 조성물로서, O1:O2:O4:O6:O15:O16:O18:O25:O75의 대장균 항원 다당류의 중량비는 1:1:1:1:1:1:1:2:2이다.

구현예 5는 구현예 1 내지 4 중 어느 하나의 조성물로서, O75 항원 다당류의 농도는 약 8 내지 약 50 μg/mL, 바람직하게는 12 내지 40 μg/mL, 예를 들어, 16 내지 32 μg/mL, 바람직하게는 약 26 내지 38 μg/mL, 바람직하게는 약 32 μg/mL이다.

구현예 6은 구현예 1 내지 5 중 어느 하나의 조성물로서, 담체 단백질에 공유 결합된 적어도 하나의 다른 추가 대장균 항원 다당류를 추가로 포함한다.

구현예 7은 구현예 6의 조성물로서, 하나의 다른 추가 대장균 항원 다당류는 화학식 (O8)을 갖는 O8 항원 다당류를 포함하고

[화학식 (O8)]

,

여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

구현예 8은 구현예 1 내지 7 중 어느 하나의 조성물로서, 각각의 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM₁₉₇, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, S. 아우레우스의 탈독소화된 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 대장균 열 민감 장독소의 탈독소화된 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 콜레라 독소의 탈독소화된 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D로 구성된 군으로부터 독립적으로 선택된다.

구현예 9는 구현예 8의 조성물로서, 담체 단백질은 슈도모나스 애루기노사의 탈독소화된 외독소 A(EPA) 또는 CRM₁₉₇이다.

구현예 10은 구현예 1 내지 9 중 어느 하나의 조성물로서, 담체 단백질은 서열번호 1의 아미노산 서열을 갖는 1 내지 20개, 예컨대 1 내지 10개 또는 2 내지 4개의 글리코실화 공통 서열, 예컨대 서열번호 2의 아미노산 서열을 갖는 공통 서열을 포함하고, 가장 바람직하게는 담체 단백질은 4개의 글리코실화 공통 서열을 포함한다.

구현예 11은 구현예 1 내지 10 중 어느 하나의 조성물로서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함하는 EPA이다.

구현예 12는 구현예 1 내지 11 중 어느 하나의 조성물로서, 대장균 항원 다당류는 생체접합 또는 화학적 접합, 예를 들어 환원적 아민화 화학(RAC), 단일 말단 접합, 또는 (2-((2-옥소에틸)티오)에틸) 카바메이트(eTEC) 스페이서와의 접합에 의해 담체 단백질에 공유 결합된다.

구현예 13은 구현예 12의 조성물로서, 대장균 항원 다당류는 생체접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 다당류는 담체 단백질의 글리코실화 부위의 Asn 잔기에 공유 결합된다.

구현예 14는 조성물로서,

(i) P.애루기노사의 탈독소화된 외독소 A(EPA-4) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 생체접합체(여기서 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함한다);

(ii) EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 생체접합체(여기서 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함한다);

(iii) EPA-4 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체(여기서 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함한다);

(iv) EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 생체접합체(여기서 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함한다);

(v) EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 생체접합체(여기서 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함한다);

(vi) EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 생체접합체(여기서 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함한다);

(vii) EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 생체접합체(여기서 대장균 O18A 항원 다당류는 화학식 (O18A)의 구조를 포함한다);

(viii) EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 생체접합체(여기서 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함한다); 및

(ix) EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 생체접합체(여기서 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함한다)를 포함하고,

여기서 EPA-4는 서열번호 3의 아미노산 서열을 포함하고,

구현예 15는 구현예 14의 조성물로서, 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 추가로 포함한다.

구현예 16은 구현예 2 내지 15 중 어느 하나의 조성물로서, 글루코실화된 O4는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체이고, 여기서 대장균 글루코실화된 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고, 여기서 n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체는 다음을 포함하는 대장균 세포에서 생산되었다:

(iv) 담체 단백질을 암호화하는 뉴클레오티드 서열; 및

구현예 17은 대상체에게 구현예 1 내지 16 중 어느 하나의 조성물을 투여하는 단계를 포함하는, 대상체에서 대장균(바람직하게는 장외 병원성 대장균, ExPEC)에 대한 면역 반응을 유도하는 방법이다.

구현예 17a는 구현예 17의 방법으로서, 대상체는 상기 면역 반응을 필요로 한다.

구현예 18은 대상체에서 대장균(바람직하게는 장외 병원성 대장균, ExPEC)에 대한 면역 반응을 유도하는 방법으로, 대상체에게 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류를 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

구현예 18a는 구현예 18의 방법으로서, 대상체는 상기 면역 반응을 필요로 한다.

구현예 19는 구현예 17 내지 18a 중 어느 하나의 방법으로서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다.

구현예 20은 구현예 19의 방법으로서, 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.

구현예 20a는 구현예 20의 방법으로서, 침습성 ExPEC 질환은 패혈증을 포함한다.

구현예 20b는 구현예 20의 조성물로서, 침습성 ExPEC 질환은 균혈증을 포함한다.

구현예 21은 구현예 18 내지 20 중 어느 하나의 방법으로서, 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 대상체에게 투여하는 단계를 포함하고, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고,

더욱 바람직하게는 각각의 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

구현예 22는 구현예 18 내지 21 중 어느 하나의 방법으로서, 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류를 대상체에게 투여하는 단계를 추가로 포함한다.

구현예 23은 구현예 18 내지 22 중 어느 하나의 방법으로서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함한다.

구현예 24는 구현예 17 내지 23 중 어느 하나의 방법으로서, 대상체는 대장균(바람직하게는 ExPEC) 감염 또는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.

구현예 25는 구현예 17 내지 24 중 어느 하나의 방법으로서, 약 8~16 μg, 바람직하게는 약 16 μg의 O75 항원 다당류가 투여당 투여된다.

구현예 26은 구현예 21 내지 25 중 어느 하나의 방법으로서, O1:O2:O4:O6:O15:O16:O18:O25:O75의 투여되는 대장균 항원 다당류의 중량비는 1:1:1:1:1:1:1:2:2이다.

구현예 27은 구현예 21 내지 26 중 어느 하나의 방법으로서, 글루코실화된 O4는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체이고, 여기서 대장균 글루코실화된 O4 항원 다당류는 표 1에 제시된 화학식 (O4-Glc+)의 구조를 포함하고, 여기서 n은 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 생체접합체는 다음을 포함하는 대장균 세포에서 생산되었다:

(iv) 담체 단백질을 암호화하는 뉴클레오티드 서열; 및

구현예 27은 대상체에서 대장균(바람직하게는 장외 병원성 대장균, ExPEC)에 대한 면역 반응을 유도하는 방법에 사용하기 위한 구현예 1 내지 16 중 어느 하나의 조성물이다.

구현예 28은 대상체에서 대장균(바람직하게는 장외 병원성 대장균, ExPEC)에 대한 면역 반응을 유도하기 위한 약제의 제조에서 구현예 1 내지 16 중 어느 한 구현예의 조성물의 용도이다.

구현예 29는 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법에 사용하기 위한 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류의 조합물로서, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

구현예 29a는 구현예 29의 조합물로서, 제1 유효량 및 제2 유효량은 동일한 조성물에 존재한다.

구현예 29b는 구현예 29의 조합물로서, 제1 유효량 및 제2 유효량은 개별 조성물에 존재한다.

구현예 29c는 구현예 29 내지 29b 중 어느 하나의 조합물로서, 대상체는 상기 면역 반응을 필요로 한다.

구현예 30은 구현예 29 내지 29c 중 어느 하나의 조합물로서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다.

구현예 31은 구현예 30의 조합물로서, 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.

구현예 32는 구현예 29 내지 31 중 어느 하나의 조합물로서, 유효량의 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고, 바람직하게는 각각의 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

구현예 33은 구현예 29 내지 32 중 어느 하나의 조합물로서, 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류의 유효량을 추가로 포함한다.

구현예 34는 구현예 29 내지 33 중 어느 하나의 조합물로서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함한다.

구현예 35는 구현예 29 내지 34 중 어느 하나의 조합물로서, 대상체는 대장균(바람직하게는 ExPEC) 감염 또는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.

구현예 36은 구현예 29 내지 35 중 어느 하나의 조합물로서, 유효량의 O75 항원 다당류는 약 8 내지 16 μg, 바람직하게는 약 16 μg이다.

구현예 37은 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하기 위한 약제의 제조에서 제1 유효량의 대장균 O75 항원 다당류 및 제2 유효량의 대장균 O6 항원 다당류의 조합물로서, 여기서 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 제1 유효량 대 제2 유효량의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

구현예 37a는 구현예 37의 조합물로서, 대상체는 상기 면역 반응을 필요로 한다.

구현예 38은 구현예 37 또는 37a의 조합물로서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 침습성 ExPEC 질환을 예방한다.

구현예 39는 구현예 38의 조합물로서, 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함한다.

구현예 40은 구현예 37 내지 39 중 어느 하나의 조합물로서, 약제의 제조에서 유효량의 대장균 O1, O2, O4, O15, O16, O18, O25 항원 다당류 중 하나 이상, 바람직하게는 모두를 추가로 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, 바람직하게는 O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고, 바람직하게는 각각의 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고, O75 항원 다당류 대 O6 항원 다당류의 비는 약 1.2:1 내지 약 8:1, 바람직하게는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1이다.

구현예 41은 구현예 37 내지 40 중 어느 하나의 조합물로서, 약제의 제조에서 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 항원 다당류의 유효량을 추가로 포함한다.

구현예 42는 구현예 37 내지 41 중 어느 하나의 조합물로서, 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함한다.

구현예 43은 구현예 37 내지 42 중 어느 하나의 조합물로서, 대상체는 대장균(바람직하게는 ExPEC) 감염 또는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간이다.

구현예 44는 구현예 37 내지 43 중 어느 하나의 조합물로서, 대상체에게 투여하기 위한 하나의 용량에서 유효량의 O75 항원 다당류는 약 8 내지 16 μg, 바람직하게는 약 16 μg이다.

실시예

실시예 1: 대장균 감염의 역학 데이터

균혈증 초래 대장균의 O 혈청형 분포를 결정하기 위해, 글로벌 감시 연구를 수행하였다. 2011년과 2017년 사이에 북미, 유럽, 아시아 태평양 지역 및 남미 국가에서 입원한 60세 이상의 환자로부터 3200개가 넘는 대장균 혈류 분리주를 수집하였다. 각 균주는 고전적 응집 기술 및 서열 기반 O 유전자형을 이용하여 O 항원 혈청형에 대해 분석되었다. 아래 표 2 참조.

분리된 인간 혈액 샘플을 분석하여 그 안의 병원체의 정체와 이들의 항생제 내성 패턴을 결정하였다. 대장균 분리주를 분석 후 샘플로부터 수득하였다. 대장균 정체를 MALDI-TOF MS에 의해 확인하였다. 대장균 분리주에 대한 추가 분석은 O 항원 혈청형을 결정하기 위해 항혈청 기반 응집 분석법을 사용하여 수행하였다(DebRoy et al. (2011) Animal health research reviews / Conference of Research Workers in Animal Diseases 12, 169-185). 응집 방법으로 유형화할 수 없는 분리주를 전체-게놈 시퀀싱에 이어서 O 혈청형 특이적 wzy 및 wzx 유전자 서열을 기반으로 하는 O 유전형 분석에 의해 추가로 분석하였다.

표 2.

응집에 의한 O 유전형 분석과 응집에 의해 유형화할 수 없는 분리주의 O 유전형 분석을 기반으로 한, 2011년에서 2017년 사이에 전 세계적으로 수집된 3217개 혈액 분리주의 컬렉션으로부터 가장 일반적인 균혈증 관련 대장균 O 혈청형의 분포 대상체는 다음 국가의 입원 대상체였다: 미국, 캐나다, 아르헨티나, 브라질, 영국, 독일, 스페인, 이탈리아, 네덜란드, 프랑스, 일본, 태국, 한국 및 호주.

전 세계의 균혈증 관련 대장균 세트에서 지리적 위치에 대한 계층화는 위치와 무관한 상위 10개 O 혈청형의 유병률을 보여주었으며, 이는 이들이 균혈증을 초래하는 대장균과 전 세계적으로 관련된 우세한 O 혈청형임을 시사한다.

전 세계의 균혈증 관련 다중 약물 내성 대장균 분리주(n=345), 즉 임상적으로 관련된 항미생물제의 적어도 3가지 부류에 내성이 있는 이러한 균주 세트에서, 상위 10개의 O 혈청형의 유병률은 75.4%이다.

역학 분석의 모든 정보를 종합하면, 유형화할 수 없는 균주의 하위부분을 내포한다고 가정할 경우 10개의 우세한 O 혈청형이 대장균 관련 균혈증 감염의 추정되는 60 내지 80%를 커버할 수 있다.

균혈증 초래 대장균 혈청형의 상당 부분을 커버하는 다가 백신은 매우 유용할 것이다. 따라서, 표 2의 O 혈청형은 O 항원 기반 다가 백신에 대한 좋은 후보가 될 것이다. 이러한 백신은 화학적 접합 또는 생체접합 기술을 사용하여 유리하게 제조될 수 있다.

실시예 2: 대장균 O 항원 생체접합체의 생산 및 생성된 생체접합체 제품.

대장균 O1A-EPA 생체접합체, O2-EPA 생체접합체, O4-Glc+-EPA 생체접합체(이하, 즉, 아래 실시예에서, O4-EPA라고도 함, O4 항원 다당류의 생체접합체는 O4가 글루코실화된 변이체로, 표 1에 제시된 글리칸 구조 (O4-Glc+)를 가짐; 대장균 글루코실화된 O4 항원을 생성하기 위한 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 특이적으로 변형할 수 있는 신규하고 지금까지 보고되지 않았으며 알려지지 않은 글루코실트랜스퍼라제 GtrS를 사용하여 이 변이체를 제조하는 것에 대한 설명은 본원에 참조로 포함된, 2020년 3월 18일 출원된 PCT/US20/23404에 자세히 제공되었다), O6A-EPA 생체접합체, O8-EPA 생체접합체, O15-EPA 생체접합체, O16-EPA 생체접합체, O18A-EPA 생체접합체, O25B-EPA 생체접합체 및 O75-EPA 생체접합체를 포함하는 10종의 생체접합체를 생산하였다. 이러한 접합체의 글리칸 구조는 표 1의 각각의 화학식에서 볼 수 있다. 10종의 생체접합체를 포함하는 조성물은 본원에서 'ExPEC10V'로 지칭된다. O1A-EPA, O2-EPA, O6A-EPA 및 O25B-EPA 생체접합체를 포함하는 조성물은 'ExPEC4V'로 지칭된다(이전에 예를 들어, WO 2015/124769 및 WO 2017/035181에 기재됨). 이들 10종의 생체접합체의 생산 및 이들 생체접합체에 대한 예시적인 생산 균주는 2020년 3월 18일에 출원된 PCT/US20/23404에 상세히 기술되어 있으며, 본원에 참조로 포함된다.

대장균 W3110 모 균주

비병원성 대장균 K12 균주 W3110을 모든 10종의 생산 균주의 구축을 위한 모 균주로서 사용하였다. 대장균 K12 균주 W3110은 Coli Genetic Stock Center(예일대학교, 미국 (코네티컷 주) 뉴헤이븐, 제품 번호 CGSC#4474)에서 입수하였다. 이의 관련 유전자형은 이전에 설명되었으며(대장균 W3110, F-, 람다-, IN(rrnD-rrnE)1, rph-1), 및 이의 게놈 서열은 이전에 공개되었다(Hayashi K, et al., 2006, Mol. Syst. Biol. 2006.0007 (doi:10.1038/msb4100049). 대장균 W3110 균주는 대장균 O 항원 생체접합체 각각의 생산을 가능하게 하도록 유전자 변형되었다(표 3).

생체접합체 생산 균주

"ExPEC4V" 및 "ExPEC10V" 조성물은 둘 다 동일한 생산 균주로부터의 O2-EPA 및 O25B-EPA 생체접합체를 포함한다. "ExPEC4V" 조성물은 stGVXN4411 또는 stLMTB10217 생산 균주로부터의 O1A-EPA 생체접합체를 포함하는 반면, "ExPEC10V" 조성물은 stLMTB10217 생산 균주로부터의 O1A-EPA 생체접합체를 포함한다. "ExPEC4V" 조성물은 stGVXN4112 생산 균주로부터의 O6A-EPA 생체접합체를 포함하는 반면, "ExPEC10V" 조성물은 stLMTB10923 생산 균주로부터의 O6A-EPA 생체접합체를 포함한다. 또한, "ExPEC10V" 조성물은 "ExPEC4V"에 사용되지 않는 생산 균주로부터의 O4-EPA(즉, (O4-Glc+)-EPA), O8-EPA, O15-EPA, O16-EPA, O18A-EPA 및 O75-EPA 생체접합체를 포함한다. 다양한 생산 균주는 아래에 지시된 바와 같이 EPA 담체 단백질 및/또는 올리고사카릴 트랜스퍼라제 PglB의 발현을 위한 플라스미드에서 다를 수 있다. 여러 예시적인 생산 균주의 개요가 아래 표 3에 제공되어 있다.

표 3. ExPEC4V 및 ExPEC10V 백신 조성물을 위한 O 항원 생체접합체에 대한 대장균 생산 균주의 유전자 공학 개요

예를 들어 개선된 수율 및/또는 생체접합체의 특정 특성의 변화를 가진 클론을 찾기 위해, 대체 생산 균주도 준비하여, 일부 생체접합체에 사용하였다.

O 항원 생합성( rfb ) 유전자 클러스터

모든 대장균 O 항원 생산 균주에서, 자연 발생 대장균 W3110 게놈 O16::IS5 -항원 생합성(rfb) 유전자 클러스터는 선택된 혈청형의 대장균 균주로부터 선택된 O 항원 특이적 생합성 클러스터에 의해 대체되었으며, 이는 혈청형-특이적 O 항원 구조를 암호화한다(이러한 O 항원 구조에 대해서는 표 1 참조). 10개의 공여체 rfb 클러스터는 대장균 혈액 분리주의 전체-게놈 분석 후 선택하고 확인하였다. O 항원 생합성에 결함이 있는 W3110 O16::IS5 rfb 유전자 클러스터의 대체는 단일 상동 재조합 사건으로 달성되었다. O16 및 O18A rfb 유전자 클러스터의 경우, 공여체 DNA는 측접하는 gnd 및 rmlCA 유전자를 통해 재조합되는 반면, 다른 균주의 rfb 유전자 클러스터는 측접하는 gnd 및 galF 유전자를 통해 재조합되었다. 생산 균주에서 rfb 클러스터의 서열은 서열번호 9 및 11 내지 19로 제공된다.

O 항원 리가제( waaL ) 유전자

모든 대장균 O 항원 생산 균주는 waaL 유전자에 의해 암호화된 대장균 W3110 게놈 O 항원 리가제의 인공적으로 도입된 결실을 보유한다. ΔwaaL 균주에서 지질 A로의 O 항원의 전달이 방해되고, 이는 대신에 O 항원의 담체 단백질로의 직접 전달을 유도하여 생성물 수율을 증가시킨다.

O 항원 글루코실화( gtrABS ) 유전자

대장균 O8, O15, O16, O18A, O25B 및 O75 생산 균주에서, O16 O 항원 글루코실화를 담당하는 대장균 W3110 게놈 gtrABS 유전자가 결실되었다. 상이한 혈청형의 gtrA 및 gtrB 유전자는 고도로 상동성이고 상호교환가능하지만, gtrS 유전자는 혈청형-특이적 O 항원 글리코실 트랜스퍼라제를 암호화한다. 대장균 W3110에서 GtrS는 대장균 O16 O 항원의 α-L-Rha-(1→3)-D-GlcNAc 모티프에 있는 GlcNAc 당에 글루코스(Glc) 잔기를 전달할 수 있다. 대장균 O1A, O2 및 O6A 생산 균주에서는 gtrABS 유전자의 결실 또는 대체가 발생하지 않았다. 이러한 O 항원은 대장균 O16 gtrS의 천연 기질인 α-L-Rha-(1→3)-D-GlcNAc 모티프를 놓치게 된다. 대장균 O4 생산 균주에서, W3110 gtrS 유전자는 대장균 O4 gtrS 유전자로 대체되어 대장균 O4 O 항원의 적절한 글루코실화를 수용하였다(대장균 O4 gtrS 유전자의 암호화 서열은 본원에 서열번호 5로 제공되고, 대장균 O4 GtrS 단백질의 아미노산 서열은 본원에 서열번호 4로 제공된다; 예를 들어, 2020년 3월 18일 출원된 PCT/US20/23404도 참조).

올리고사카릴 트랜스퍼라제 PglB

모든 대장균 O 항원 생산 균주는 C. 제주니 글리코실 트랜스퍼라제 PglB의 변이체를 발현하였으며, 이는 N-글리코실화에 의해 담체 단백질 상의 아미노산 공통 서열 상으로 O 항원을 전달할 수 있다. PglB는 광범위한 기질 인식을 가졌으나, 낮은 생성물 수율로 인해, 변형된 기질 특이성을 갖는 PglB 변이체를 발현하는 여러 생산 균주를 제조하였으며, 이는 개선된 생성물 수율을 초래하였다(예를 들어, WO 2016/107818, WO 2016/107819 참조). pgIB 유전자는 플라스미드 상의 이소프로필 β-d-1-티오갈락토피라노시드(IPTG) 유도성 프로모터 뒤에 배치되었다. 아래 표 4는 상기 기재된 ExPEC4V 및 ExPEC10V 조성물을 위한 생체접합체에 대한 대장균 O 항원 생산 균주의 생산에 사용되는 플라스미드에 의해 암호화된 PglB 변이체를 나열한다. 벡터 백본, 항생제 내성 마커 및/또는 대안적 PglB 변이체에 변이가 있는 추가 플라스미드도 또한 생체접합체 생산에 대해 성공적으로 테스트되었다.

표 4. 대장균 O 항원 생산 균주에 사용되는 PglB 및 EPA 플라스미드

¹ SpR, 스펙티노마이신 내성; AmpR, 암피실린 내성; KanR, 카나마이신 내성

ExPEC10V에서 10개의 대장균 O 항원의 각각의 생체접합체에 대한 최적의 PglB 변이체는 예를 들어, 전체가 본원에 참조로 포함된 2020년 3월 18일 출원된 PCT/US20/23415에 더욱 상세히 기재된 바와 같이 결정되었다.

담체 단백질 (EPA)

모든 대장균 O 항원 생산 균주는 O 항원에 대한 담체 단백질로서 유전적으로 탈독소화된 P. 애루기노사 AD-리보실트랜스퍼라제 톡소이드(EPA)를 발현하였다. EPA 톡소이드는 2개 잔기에서 야생형 EPA 독소와 상이하다: Leu552는 Val로 변경되었으며, (촉매 도메인에서) Glu553이 결실되었다. Glu553 결실은 독성을 현저하게 감소시키는 것으로 보고되었다. 탈독소화 돌연변이 외에도, 4개(EPA-4) 공통 N-글리코실화 부위 모티프를 도입하였다. epa 유전자는 플라스미드 상의 l-아라비노스(Ara) 유도성 프로모터 뒤에 위치하였다(표 4). 표 4는 상기 기재된 "ExPEC4V" 및 "ExPEC10V" 조성물에 사용된 생체접합체에 대한 생산 균주에 사용되는 플라스미드로 제한된다. 벡터 백본, 항생제 내성 마커 및/또는 EPA 변이체에서 변이를 갖는, 예를 들어 공통 N-글리코실화 부위 모티프의 수(예를 들어, 2개의 이러한 모티프를 가짐, EPA-2)가 변화하는 플라스미드도 생체접합체 생산에 대해 성공적으로 테스트되었다.

실시예 3: 대장균 O 항원의 생체접합체의 생성을 위한 올리고사카릴트랜스퍼라제 최적화

생체접합체 생산을 위한 수율 최적화는 C. 제주니 올리고사카릴 트랜스퍼라제 PglB의 변형에 의해 달성될 수 있으며, 이는 EPA 담체 단백질에 대한 관심 O 항원의 더욱 효율적인 또는 더 높은 정도의 N-글리코실화로 이어질 수 있다. 글루코실화된 O4(O4-Glc+) O 항원 다당류를 갖는 생체접합체의 생산을 위한 대장균 균주에서, 이러한 최적화 전략을 적용하였으며, 생체접합체 생성물 수율을 개선하는 (O4-Glc+) 특이적 최적화된 PglB 변이체를 발생시켰다.

이러한 접근법에서, EPA-발현 플라스미드를 함유하는 O4-Glc+ O 항원 다당류 생산 균주는 다양한 상이한 PglB 발현 플라스미드로 형질전환되었으며, 이들 각각은 PglB 단백질에 상이한 아미노산 치환을 함유하여 기질 특이성을 변경시켰다. 각 균주의 생체접합체 생산 수준 및 프로파일은 삼투압 충격 실험에서 진탕 플라스크 수준으로 평가하였으며, 판독은 O4-Glc+ 특이적 단클론 항체를 사용하여 주변 세포질 추출물에 대한 모세관 전기영동 면역분석법에 의해 수행하였다.

N311V 아미노산 치환을 함유하는 테스트한 PglB 변이체 중 하나는 글루코실화된 O4 생체접합체의 생성물 수율을 현저하게 개선하는 것으로 밝혀졌다(전체가 본원에 참조로 포함된 2020년 3월 18일 출원된 PCT/US20/23415 참조).

N311V PglB-변이체가 추가로 변형된 추가 개선에서, Y77H 아미노산 치환은 N311V PglB-변이체와 비교하여 O4-Glc+ 특이적 생성물 수율을 추가로 증진시켰으며, 증가된 정도의 디- 및 트리-글리코실화 생성물을 나타내었으며, 여기서 다른 변형은 중립적이거나 생성물 수율에 부정적인 영향을 미치는 것으로 밝혀졌다(전체가 본원에 참조로 포함된 2020년 3월 18일 출원된 PCT/US20/23415 참조). 플라스미드 pLMTB4008(SpR)은 돌연변이 Y77H 및 N311V가 있는, 대장균 코돈 사용 빈도 최적화되고 (O4-Glc+) 기질 최적화된 PglB 변이체를 암호화한다.

야생형 (wt) C. 제주니 글리코실 트랜스퍼라제 PglB와 비교해 N311V 및 Y77H 아미노산 치환을 함유하는 O4-Glc+ O 항원 다당류에 대한 최적화된 기질 특이성을 갖는 PglB 변이체는 1차 라운드 최적화된 PglB-N311V 변이체와 비교하여 생체접합체 수율이 두 배인 것으로 밝혀졌다.

유사하게 스크린을 사용하여, ExPEC10V 조성물 중 다른 9개 혈청형의 대장균 O 항원 생체접합체 생산에 대해 가장 최적의 수율을 갖는 PglB 변이체를 또한 결정하였다. 예를 들어, 전체가 본원에 참조로 포함된 2020년 3월 18일 출원된 PCT/US20/23415 참조.

O1A, O6A 또는 O15 항원 다당류를 갖는 생체접합체의 경우, 아미노산 돌연변이 N311V, K482R, D483H 및 A669V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.

O2, O8, O18A 또는 O25B 항원 다당류를 갖는 생체접합체의 경우, 야생형 PglB(즉, 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이가 없음)가 가장 높은 수율을 제공하는 것으로 밝혀졌다.

O16 항원 다당류를 갖는 생체접합체의 경우, 아미노산 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.

O75 항원 다당류를 갖는 생체접합체의 경우, 아미노산 돌연변이 N311V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.

이러한 결과는 최적의 PglB 변이체가 다양한 O 항원에 대해 상이하고, 주어진 O 항원 다당류를 갖는 생체접합체를 생성하기 위한 최적의 PglB 변이체는 예측할 수 없음을 보여주었다.

실시예 4: 10개의 대장균 혈청형으로부터의 O 항원의 생체접합체의 품질 속성.

표적 O 항원의 O-글리칸 잔기는 구조적으로 다양하고, 가변적인 반복 단위를 갖는다. 글리코실 트랜스퍼라제 PglB의 특이성 및 친화성은 글리칸 구조와 연결되어 있다. 따라서, 요망되는 품질 속성, 예를 들어 순도, 글리칸/단백질 비 등을 갖는 생체접합체를 만드는 것은 어렵고 간단하지 않은 작업이다. PglB와 EPA 담체 단백질의 올바른 조합은 수율을 결정하고, 글리코실화 효율에 영향을 미칠 수 있다. PglB 및 담체 단백질을 최적화함으로써, 요망되는 품질 속성을 갖는 생체접합체를 생성하였다. 매우 많은 양의 담체 단백질은 면역학적 간섭으로 이어질 수 있기 때문에, 특히 하나 이상의 O 항원 생체접합체가 함께 조합되어 단일 조성물 또는 백신으로 투여되는 경우, 총 담체 단백질의 더 낮은 역치 값을 유지하는 것이 또한 중요할 수 있다. 이러한 현상을 피하기 위해서 더 높은 글리칸/단백질 비율을 갖는 접합체가 바람직하다. 따라서, ExPEC10V 백신의 경우, (임상 시험으로 처리된 이전에 기재된 ExPEC4V 백신과) 적어도 유사한 글리코실화 비율을 갖는 생체접합체를 개발하였다.

생체접합체는 이전에 기재된 방법에 따라 생물반응기(10 L 및/또는 200 L 부피)에서 각 숙주 세포(실시예 2, 표 3)를 배양하고 생체접합체의 발현에 의해 각각 생성하였다. 각 원료 의약품은 박테리아 유가식 발효에 의해 배치식으로 제조되어 상응하는 다당류 혈청형의 발현된 생체접합체를 함유하는 바이오매스를 생성하였다. 세포를 배양하고, IPTG 및 아라비노스로 유도하였다. 삼투압 충격에 이어서 크로마토그래피 정제에 의해 생물반응기 배양물에서 세포의 주변세포질로부터 생체접합체를 분리하였다. 이러한 공정을 10개 생체접합체 각각에 대해 수행하였다.

ExPEC10V 및 ExPEC4V에 대한 원료 의약품(DS)인 이렇게 제조된 대장균 O 항원 생체접합체는 유사한 중요한 품질 속성을 나타내었다: (1) 공정-관련 순도(RH-HPLC에 의해 측정)는 95% 보다 높았음, (2) 약 0.1~0.5, 대부분 0.15 내지 0.45 범위의 다당류/단백질 비율, (3) 박테리아 내독소(Ph. Eur. 2.2.3)는 0.5 EU/μg 다당류 미만이었음. 개별 다당류 사슬의 평균 길이는 전형적으로 약 10~20 반복 단위였다(고해상도 SDS-PAGE를 사용하여 측정함).

다당류 반복 단위의 구조는 상기 기재된 ExPEC10V 조성물에 있어서 DS인 모든 10개의 생체접합체의 경우, 표 1에서 상응하는 혈청형에 대해 화학식으로 제시된 것으로 (온전한 또는 트립신-분해된 접합체의 NMR 및 MS/MS에 의해) 확인되었다.

ExPEC10V 완제 의약품(DP)은 상기 기재된 10개의 1가 DS의 혼합물을 포함한다.

실시예 5: ExPEC10V 백신의 독성학.

ExPEC10V를 사용한 단일-용량 파일럿 독성 및 국소 내성 연구(비-GLP)를 암컷 NZW 토끼에서 수행하였다. 하나의 군(n=2)은 대조군(식염수)의 근육내(IM) 주사(0일)를 받았고, 두 번째 군(n=4)은 0.6 mL의 투여 부피를 사용하여 105.6 μg의 총 다당류(PS)/용량(176 μg PS/mL)(각각 O 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75에 있어서 용량당 (9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 19.2: 9.6 μg PS)으로 ExPEC10V의 IM 주입을 받았다. 부검은 2일에 수행하였다.

사망은 관찰되지 않았다. 또한, 임상 관찰(Draize 스코어링을 사용한 주사 부위 효과 포함), 체중, 먹이 섭취 및 체온에 대해 언급된 백신 관련 효과는 없었다. 조직병리학적으로 투여 부위 또는 배액(장골) 림프절에서 백신과 관련된 변화는 관찰되지 않았다. 비장의 배 중심 형성의 최소 증가가 처리된 동물 4마리 중 한 마리에서 관찰되었으며(2일), 주사된 백신에 대한 정상적인 면역학적 반응으로 간주되었다. 전반적으로, 암컷 토끼에 대한 ExPEC10V의 단일 IM 용량의 투여는 내약성이 우수하였다.

실시예 6: 토끼에서 ExPEC10V 블렌딩된 제형의 면역원성.

ExPEC4V 백신(대장균 O1A, O2, O6A 및 O25B 혈청형의 생체접합체 포함)은 이전에 래트, 토끼 및 인간에서 이들 4가지 혈청형에 대해 면역원성인 것으로 나타났다(예를 들어, WO 2015/124769; WO 2017/035181; 문헌[Huttner et al, 2017, Lancet Infect Dis, http://dx.doi.org/10.1016/S1473-3099(17)30108-1; RW Frenck Jr, et al, 2019, Lancet Infect Dis 19(6): 631-640, http://dx.doi.org/10.1016/S1473-3099(18)30803-X] 참조). 대장균 혈청형 O4-Glu+, O8, O15, O16, O18A 및 O75의 생체접합체(모두 담체 단백질로서 EPA-2를 가짐)의 면역원성은 래트에게 개별적으로(1가) 투여될 경우 이들 생체접합체 각각이 또한 면역원성이라는 것을 확인시켜 주었는데, 이는 ELISA 데이터가 이들 생체접합체 각각이 높은 수준의 대장균 O 항원 특이적 항체를 유발시킬 수 있음(미제시됨)을 나타내었기 때문이다.

상기 기재된 바와 같은 10개의 생체접합체의 혼합물을 함유하는 10가 백신의 면역원성을 또한 테스트하였다. 뉴질랜드 화이트(NZW) 토끼(암컷, 12~16주령)는 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회의 근육내 면역화를 받았다(표 5; 0, 14 및 27일에 투여). 이러한 실험에 사용된 ExPEC10V의 일부인 10개의 다당류를 4개의 글리코실화 부위를 함유하는 EPA(EPA-4) 담체 단백질에 접합시켰다. 백신은 3개의 상이한 용량으로 제형화시켰다: 군 1 ('고용량'): 8 μg/용량의 O1A, O2, O6A, O4, O8, O15, O16, O18 및 O75 및 16 μg/용량의 O25B; 군 2 ('중간 용량'): 4 μg/용량의 O2, O4, O8, O15, O16, O18 및 O75, 8 ug/용량의 O1A 및 O6A 및 16 μg/용량의 O25B; 군 3 ('저용량'): 0.4 μg/용량의 O2, O4, O8, O15, O16, O18 및 O75, 0.8 μg/용량의 O1A 및 O6A 및 1.6 μg/용량의 O25B. 대조군(군 4)의 동물은 식염수(0.9% (w/v) 염화나트륨 용액)만 받았다(표 5).

항체 반응은 0일(면역화 전) 및 면역화 후 14, 27 및 42일에 평가하였다. 백신 및 담체 단백질 EPA에 포함된 각각의 생체접합체에 의해 유도된 혈청 항체 수준을 코팅 물질로서 유형 특이적 LPS를 사용하여 ELISA(총 IgG)에 의해 측정하였다. 항체 역가는 4-파라미터 로지스틱 비선형 회귀 모델에 플롯팅된 12-단계 적정 곡선의 중복을 기반으로 하는 최대 유효 농도 절반에 해당하는 EC50 값으로서 보고하였다. 기능적 활성은 OPK에 의해 결정되었다.

표 5. 실험군의 설명.

결과는 도 1에 제시되어 있고, 표 6에 요약되어 있다.

표 6. NZW 토끼에서 ExPEC10V에 의해 유도된 대장균 O 항원 특이적 항체 반응의 요약.

p 값이 통계적으로 유의한 혈청형 특이적 항체 반응은 별표로 표시된다. p 값이 통계적으로 유의하지 않은 혈청형 특이적 항체 반응은 ns로 표시된다. 다중 비교를 위한 Bonferroni 보정을 사용한 Wilcoxon 순위 합계 검정. ExPEC10V 백신접종된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4)의 비교. *p≤0.05, **p≤0.01. # P 값은 대조군에서 이상치 동물을 제외한 후 통계적으로 유의하였다(민감도 분석).

고용량의 ExPEC10V(군 1)은 O1A, O2, O4, O6A, O16, O18A 및 O25B에 대한 식염수 대조군과 비교할 경우 조사된 모든 시점(면역화 후 14, 27 및 42일)에서 유의하게 더 높은 IgG 항체 수준을 유도하였다(도 2, 표 6). 식염수 대조군과 비교할 경우 O8 및 O75 접합체에 의해 유도된 유의하게 더 높은 항체 역가가 면역화 후 27일 및 42일에 관찰되었다(도 1, 표 6).

중간 용량의 ExPEC10V(군 2) 및 저용량(군 3)은 O1A, O2, O4, O6A, O16 및 O25B에 대한 식염수 대조군과 비교할 경우 조사된 모든 시점(면역화 후 14, 27 및 42일)에서 유의하게 더 높은 항체 수준을 유도하였다(도 1, 표 6). 식염수 대조군과 비교할 경우 O8, O18A 및 O75 접합체에 의해 유도된 유의하게 더 높은 항체 역가가 면역화 후 27일 및 42일에 관찰되었으며, 이는 토끼에서의 부스트 용량이 이들 O 혈청형에 대한 반응을 증가시킴을 시사한다(도 1, 표 6).

O15 접합체의 경우, 대조군에서 이상치 동물을 생략한 민감도 분석은 ExPEC10V 백신의 3개 용량 모두가 면역화 후 14, 27 및 42일에 식염수 대조군과 비교하여 항체 반응의 유의한 증가를 유도함을 보여주었다(도 1, 표 6).

담체 단백질 EPA에 의해 유도된 항체는 조사된 모든 시점(14일, 27일 및 42일)에서 테스트된 3가지 용량의 ExPEC10V(고, 중간 및 저)에 대해 식염수 처리군(대조군)에서 EPA 항체 역가보다 유의하게 더 높았다(도 1).

용량간 비교(미제시됨)는 백신접종 후 14일에 고용량의 ExPEC10V가 테스트된 대부분의 접합체(O1A, O2, O4, O6A, O15, O16, O18A 및 O25B) 저용량과 비교할 때 유의하게 더 높은 항체 반응을 유도하였음을 보여주었다. 중간 용량의 ExPEC10V는 또한 O1A, O2, O4, O18A, O25B 및 O75에 대한 저용량과 비교하여 유의하게 더 높은 항체 반응을 유도하였다. O8 접합체의 경우, ExPEC10V의 세 가지 제형 모두는 백신접종 후 14일에 유사한 수준의 항체를 유도하였다.

저용량의 ExPEC10V는 O1A, O2, O4, O16, O25B 및 O75 접합체에 대한 고용량 및 중간 용량의 ExPEC10V과 비교할 경우 백신접종 후(프라임 및 2회 부스트 용량 후) 42일에 항체 반응의 유의한 증가를 유도하였다. 이러한 발견은 예를 들어, 폐렴구균 접합체 백신으로 백신접종된 유아에서 용량과 일차 백신접종에 대한 항체 반응의 규모 사이의 명확한 관계가 관찰되지 않았다는 접합체 백신으로의 다른 경험과 일치한다(Poolman JT, et al. Expert Rev Vaccines. 2013, 12(12):1379-94).

O6A, O8 및 O15 접합체에 대해 백신접종 후 42일에 테스트한 3가지 용량의 ExPEC10V 간에는 유의한 차이가 없었다. O18A 접합체의 경우, 백신접종 후 42일에 중간 용량과 비교하여 고용량의 ExPEC10V가 유의하게 더 높은 항체 반응을 유도하였다.

담체 단백질(EPA)에 있어서, 고용량 및 중간 용량의 ExPEC10V는 백신접종후 14일에 저용량과 비교하여 유의하게 더 높은 항체 반응을 유도하였다. 고용량의 백신은 또한 백신접종후 42일에 저용량과 비교하여 유의하게 더 높은 항체 반응을 유도하였다.

결론적으로, 0, 14, 27일에 근육내 주입을 통해 투여된 3가지 제형의 ExPEC10V(고, 중간 및 저)는 토끼에서 면역원성이다.

지금까지, 토끼에서 이 백신에 의해 유도된 대장균 균주를 살상할 수 있는 기능적 항체는 혈청형 O1A, O2, O4, O6A, O15, O16 및 O25B에 대해 나타났다.

추가 실험에서, ExPEC10V 백신의 GMP 배치(생산에 대해서는 상기 실시예 4 참조)를 제조하고, 독성학 연구의 일부로서 NZW 토끼에 주사하였다(표 7). 이 연구에서 NZW 토끼(수컷 및 암컷)는 ExPEC10V 백신(1일, 15일 및 29일)을 근육내 주사(0.6 mL)로 3회 받았고, 대조군은 0.9% (w/v) 염화나트륨 용액(식염수)를 받았다. 각 용량의 백신은 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A 및 O75에 대한 9.6 μg의 다당류(PS) 및 혈청형 O25B에 대한 19.2 μg의 PS를 함유하였으며, 이는 105.6 μg의 총 PS(176 μg 총 PS/mL) 및 382.8 μg의 총 EPA(638 μg EPA/mL)에 상응한다. O 항원 및 담체 단백질(EPA)에 대한 IgG 역가는 전처리 기간(1일) 및 면역화 후 31일 및 50일에 수집된 샘플로부터 결정하였다.

모든 O 항원 및 담체 단백질 EPA에 대한 항체 반응에서 유의한 증가는 단지 식염수만 받은 대조군과 비교할 경우 ExPEC10V를 받은 군에서 백신접종 후 31일 및 50일에 관찰되었다(도 2, 표 8). O1A 혈청형의 경우, 백신접종된 동물을 대조군과 비교할 때 유의하게 더 높은 항체 반응이 또한 1일(기준선)에 관찰되었다. 이러한 결과는 일부 동물이 대장균에 사전 노출되었거나, O1A-LPS와 교차 반응하는 항체를 가지고 있음을 시사한다.

표 7. NZW 토끼에 사용된 실험군 및 ExPEC10V 용량.

*각 용량(0.6 mL 투여 부피)은 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B, O75 각각에 대해 9.6:9.6:9.6:9.6:9.6:9.6:9.6:9.6:19.2:9.6 μg의 다당류(PS)를 함유한다(176 μg 총 PS/mL). 각 용량은 382.8 μg의 EPA 단백질을 함유한다(638 μg EPA/mL).

표 8. 독성학 연구의 일부로서 NZW 토끼에서의 ExPEC10V의 면역원성.

ExPEC10V에 의해 유도된 항체 반응. 대조군과 비교하여 백신군에서 항체 반응의 유의한 증가가 관찰된 혈청형은 별표로 표시된다. 우도비 검정이 있는 Tobit 모델. ****P ≤ 0.0001.

실시예 7: 인간에서 ExPEC10V 백신을 사용한 1/2a상 시험.

현재 IED를 예방하기 위해 이용 가능한 백신은 없다. ST131을 포함한 항균제 내성 IED를 유발하는 대부분의 ExPEC 분리주를 또한 대표하는 임상적으로 관련된 대다수의 ExPEC 균주로 인한 침습성 질환을 해결하기 위해 ExPEC10V 백신을 포함하는 혈청형(O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75)을 선택하였다. 선택된 혈청형은 노령 집단에서 혈류 감염을 일으키는 10종의 널리 퍼진 ExPEC O 혈청형을 대표하며, ExPEC으로 인한 혈류 감염의 약 70%를 차지한다.

침습성 질환 예방에 있어서 접합체 백신의 작용 메커니즘은 항생제 내성 메커니즘의 영향을 받지 않을 것으로 예상되기 때문에, ExPEC10V 백신은 약물 내성 및 약물 감수성 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75 혈청형에 의해 유발된 IED에 대한 보호를 제공하는 것으로 여겨진다.

ExPEC10V에서도 발견되는 4가지 대장균 O 항원 접합체(O1A, O2, O6A 및 O25B)의 서브세트를 포함하는 초기 백신 후보인 ExPEC4V에 대한 선행 임상 경험이 있다. 4건의 완료된 임상 연구(2건의 1상 연구, 2건의 2상 연구)의 결과에 기초하여, ExPEC4V는 연구 참가자들에 있어서 내약성이 우수하였으며, 혈청형(O1A, O2, O6A 및 O25B)당 최대 16 μg의 다당류(PS) 용량에서 백신 관련 안전성 신호가 관찰되지 않았다. 대부분의 유해 사건(AE)은 1등급 및 2등급이었고, 3등급 AE는 거의 보고되지 않았다. 후기 발병된 명시된 국소 AE(백신접종 후 5일 이후에 시작되는 AE)는 주로 더 높은 용량의 ExPEC4V로 관찰되었다. 각 연구에서, ExPEC4V 백신은 면역원성인 것으로 나타났으며, 효소 결합 면역흡착 분석법(ELISA)에 의해 측정된 바와 같이 용량 의존적 백신 면역 반응과 O 항원 특이적 면역글로불린 G(IgG) 역가 증가를 입증한다. 항체의 기능적 활성은 ExPEC4V-최적화된 옵소닌 식세포 살상 분석법(OPKA)으로 입증되었다. ELISA 및 OPKA 테스트 결과의 공동 분석은 분석법 반응 사이의 상관관계를 보여주었으며(2상 임상 시험[연구 4V-BAC2001]에서 각각 30일 및 360일에 대한 피어슨 상관 계수 ≥0.61 및 ≥0.48), 이는 ELISA를 ExPEC4V 항체 역가의 일차 척도로 사용하고, 기능적 항체 활성을 예측하는 데 사용함을 입증한다. 면역원성 데이터의 분석은 ExPEC4V로의 백신접종 후 3년에 걸쳐 면역 반응의 지속성을 입증하였다. 이제 ExPEC4V로 백신접종되고, 혈청형 특이적 옵소닌 식세포 항체의 역가가 높은 인간의 혈청은 이후에 O25B 또는 O2 혈청형의 대장균 균주로 복강내 챌린지한 마우스에 수동적으로 전달될 경우 혈액, 비장 및 간에서 대장균 콜로니 수(CFU)의 유의한 감소에 의해 입증된 생체 내 보호를 매개할 수 있었음이 또한 관찰되었다(데이터 미제시). 따라서, ExPEC4V 특이적 옵소닌 식세포 인간 항체는 생체 내에서 박테리아 살상을 매개하며, 이는 제안된 보호 메커니즘이 박테리아 살상을 매개하는 옵소닌 식세포 항체의 유도에 의한 것인 다른 접합체 백신과 일치한다.

ExPEC10V는 총 10개의 혈청형을 포함하며, 60세 이상 성인에서 ExPEC로 인한 혈류 감염의 약 50%(ExPEC4V) 내지 약 70%로 적용 범위를 늘린다. ExPEC4V에 대한 임상 경험과 상기 실시예에서 논의된 ExPEC10V에 대한 전임상 데이터를 기반으로 하여, ExPEC10V의 투여가 또한 인간에서 대장균 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75에 대한 면역 반응을 유도할 것으로 예상되었다. 각각의 O 항원 다당류(PS)는 슈도모나스 애루기노사에서 유래된 외독소 A(EPA)의 유전적으로 탈독소화된 형태인 담체 단백질에 개별적으로 생체접합되며, 이의 생산은 위에서 설명되었다. O4 PS는 표 1의 화학식 (O4-Glc+) 구조를 갖는 글루코실화된 형태이다.

ExPEC10V 백신의 3가지 다른 용량의 안전성, 반응원성 및 면역원성을 평가하기 위한 무작위, 관찰자 맹검, 인간 최초의 1/2a상 연구를 안정적인 건강 상태의 60세 내지 85세의 인간에서 수행한다(연구 10V- BAC1001). 연구 설계는 2개의 코호트를 포함한다: 코호트 1에서 안정적인 건강 상태의 60세 이상 85세 이하의 404명의 참가자(참가자 100명/ExPEC10V 용량) 및 코호트 2에서 지난 5년 내에 UTI 병력이 있는 안정적인 건강 상태의 60세 이상의 약 420명의 참가자(ExPEC10V군 280명, 위약군 140명)(원래 코호트 2에 600명의 참가자를 포함할 계획이었지만, 이 숫자는 프로토콜에 대한 일부 조정을 통해 연구 중에 약 420명으로 줄었다)의 총 824명의 참가자가 연구에 등록된다.

목적 및 종점

코호트 1 - 1/2a상 관찰자-맹검 기간과 공개 라벨의 장기 추적 기간(N=404):

코호트 2 - 이중 맹검 기간과 이중 맹검 장기 추적 기간(N = 420):

전반적인 설계

이는 2개의 코호트를 포함하는 무작위 배정, 다기관, 중재 연구이다.

코호트 1의 경우, 이 연구는 관찰자-맹검, 활성 대조 설계를 가지고 있으며, UTI 병력이 있거나 없는 안정적인 건강 상태의 60세 이상 85세 이하의 총 404명의 성인 참가자가 포함된다. 코호트 1에 대한 연구 설계는 3개의 기간을 포함한다: 최대 28일의 스크리닝 기간, 1일차에서의 백신접종을 통한 관찰자-맹검 181일의 추적 기간 및 백신접종 후 182일차부터 3년(1096일)까지 지속되는 공개 라벨의 LTFU 기간(도 3a). 단지 ExPEC10V 선택된 용량군으로부터의 참가자(약 100명의 참가자) 및 Prevnar 13군의 참가자만이 LTFU 기간으로 진행된다. 코호트 1의 종료는 마지막 참가자의 3년차 방문(1096일)이다.

코호트 2의 경우, 연구는 이중 맹검, 위약 대조 설계를 가지며, 지난 5년 동안 UTI 병력이 있는 안정적인 건강 상태의 60세 이상의 총 대략 420명의 성인 참가자가 포함되었다. 등록은 코호트 1로부터 1/2a상 1차 분석 및 ExPEC10V 용량 선택 완료 후 시작되었다. 코호트 2에 대한 연구 설계는 3개의 기간을 포함한다: 최대 28일의 스크리닝 기간, 1일차에서의 백신접종을 통한 이중 맹검 181일의 추적 기간 및 백신접종 후 182일차부터 3년(1096일)까지 지속되는 이중 맹검 LTFU 기간(도 3b). 코호트 2에서 모든 참가자는 LTFU 기간으로 진행된다. 연구 종료는 코호트 2에서 마지막 참가자의 3년차 방문(1096일)이다.

코호트 1: 1상

코호트 1의 1상에서, 총 84명의 참가자는 한 단계에서 다음 단계로 진행하기 전에 정위에서의 안전성 평가가 있는 단계적 용량 증량 절차에 따라 시차 접근 방식으로 등록되었다. 내부데이터검토위원회(DRC)는 이들 84명의 1상 참가자의 신체 검사 데이터(기준선 및 표적화), 기준선 인구 통계 데이터 및 백신접종 후 14일 안전성 데이터(명시된 국소 및 전신 AE, 명시되지 않은 AE, SAE, 임상 실험실 데이터 및 활력 징후 포함)를 검토하기 위해 이 연구를 위해 위임되었다. 연구의 이 상에서, 참가자가 등록되고 6 단계로 무작위 배정되었다:

단계 1: 4명의 센티널 참가자가 등록되고 무작위 배정되었다; 2명의 참가자는 ExPEC10V 저용량군(표 11), 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.

단계 2: 24명의 참가자가 등록되고 무작위 배정되었다; 18명의 참가자는 ExPEC10V 저용량군(표 11), 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.

단계 3: 4명의 센티널 참가자가 등록되고 무작위 배정되었다; 2명의 참가자는 ExPEC10V 중간 용량군(표 11), 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.

단계 4: 24명의 참가자가 등록되고 무작위 배정되었다; 18명의 참가자는 ExPEC10V 중간 용량군(표 11), 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.

단계 5: 4명의 센티널 참가자가 등록되고 무작위 배정되었다; 2명의 참가자는 ExPEC10V 고용량군(표 11), 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.

단계 6: 24명의 참가자가 등록되고 무작위 배정되었다; 18명의 참가자는 ExPEC10V 고용량군(표 11), 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13군이었다.

모든 참가자는 배정된 연구 백신접종군에 따라 1일에 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13을 단일 근육내(IM) 주사로 투여받았다. 단계 1, 3 및 5 각각에서 4명의 센티널 참가자는 백신접종 후 24시간째에 전화로 연락하여 안전성 정보를 수집하였다. 4명의 센티널 참가자의 각 군에서 백신접종 후 24시간째의 맹검 안전성 데이터를 수석 연구원(PI), 연구 담당 의사(SRP) 및 후원 의료 책임자(SML)가 검토하였다. 다음 단계를 위한 추가 참가자의 무작위 배정은 이러한 2일의 센티널 안전성 평가가 완료될 때까지 중단되었다.

임의의 임상적으로 유의한 결과가 없는 경우, 추가로 24명의 참가자(단계 2, 4 및 6의 경우)를 등록시키고, 3개 연구 백신접종군(표 11) 중 하나로 무작위 배정하여 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13을 1일에 단일 IM 주사로 투여받게 하였다.

각 용량 수준(단계 2의 저용량, 단계 4의 중간 용량 및 단계 6의 고용량)에서 추가 24명의 참가자의 백신접종 후, 각 용량 수준에서 모든 28명(4+24) 참가자의 백신접종 후 14일의 안전성 데이터를 다음 용량 수준 또는 2a상으로 진행하기 전에 DRC에서 검토하였다.

코호트 1: 2a상

초기 84명의 참가자에 대한 백신접종 후 14일 안전성 데이터 검토 후 DRC에 의해 결정된 허용가능한 안전성 및 반응원성을 기반으로 하여(임의의 안전성 문제 또는 특정 연구 일시 중지 규칙을 충족하는 임의의 사건이 없는 경우), 코호트 1로부터의 나머지 320명의 참가자를 무작위 배정하고 연구의 2a상에서 투여하였다. 이들 추가의 320명의 참가자를 등록시키고 5개의 연구 백신접종군 중 하나로 2:2:2:1:1의 비로 병렬로 무작위 배정하여 1일에 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13의 단일 IM 주사를 투여받게 하였다(표 11). 초기 84명의 참가자에 대한 14일 안전성 검토를 수행하는 것 외에, DRC는 또한 연구 과정 동안 코호트 1의 안전성 데이터를 평가하며, 특정 연구 백신접종 일시 중지 규칙을 충족하는 임의의 사건 또는 발생할 수 있는 임의의 기타 안전성 문제를 검토한다.

코호트 1의 경우, 모든 참가자가 30일 방문(방문 4)을 완료하였거나 더 일찍 중단한 경우 1차 분석이 발생하였다. 모든 참가자가 181일 방문을 완료하였거나 더 일찍 중단한 경우 최종 분석이 발생한다. 공개 라벨의 장기 추적(LTFU) 기간으로 진행되는 참가자의 경우(ExPEC10V 선택된 용량군 및 Prevnar 13군), 연간 추적 분석은 백신접종 후 1년(366일), 2년(731일) 및 3년(1096일)차의 방문 시점까지 수집된 안전성 및 면역원성 데이터(멀티플렉스 ECL 기반 면역분석법 및 MOPA)를 포함한다.

코호트 2

코호트 2에서는 지난 5년 동안 UTI 병력이 있는 안정적인 건강 상태의 60세 이상의 참자가를 대상으로 선택된 용량의 ExPEC10V(코호트 1의 1차 분석 결과를 기반으로 하여 고용량이 선택되었다)의 안전성, 반응원성 및 면역원성을 평가한다. 코호트 2의 경우, 연구는 이중 맹검, 위약 대조 설계를 가지며, 총 약 420명의 참가자가 등록되었고, 2:1 비율(ExPEC10V군 약 280명 참가자 및 위약군 약 140명)로 병렬로 무작위 배정되었다.

모든 참가자는 배정된 연구 백신접종군에 따라 1일에 선택된 용량의 ExPEC10V 또는 위약의 단일 IM 주사를 투여받았다(표 12).

코호트 2의 경우, 1차 분석은 안전성 및 면역원성 데이터를 포함하며, 모든 참가자가 30일 방문(방문 4)을 완료했거나 더 일찍 중단하였을 경우 발생한다. 모든 참가자가 181일 방문을 완료하였거나 더 일찍 중단한 경우 최종 분석이 발생한다. 모든 참가자에 있어서, 연간 추적 분석은 백신접종 후 1년(366일), 2년(731일)(MOPA에 적용되지 않음) 및 3년(1096일)차의 방문 시점까지 수집된 안전성 및 면역원성 데이터(멀티플렉스 ECL 기반 면역분석법 및 MOPA)를 포함한다.

대변 샘플 분석은 균유전체학을 이용하여 장내 세균총의 병원체(예를 들어, 클로스트리듐 디피실리균)의 유병률 및 ExPec10v 혈청형에 미치는 ExPEC10V의 영향을 평가하기 위해 선택된 서브세트의 참가자에서 수행된다.

참가자 수

총 약 824명의 참가자가 연구에 등록되었다; 404명의 참가자가 코호트 1에, 약 420명의 참가자가 코호트 2에 등록되었다.

중재 군: 중재 설명

ExPEC10V: EPA 담체 단백질에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 PS를 함유하는 인산염 완충 용액 중 대장균 생체접합체 백신. 1일에 ExPEC10V의 3가지 용량 중 하나의 단일 0.5 mL의 IM(삼각근) 주사.

ExPEC4V: EPA 담체 단백질에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O6A, O25B(4:4:4:8 μg PS/ExPEC 혈청형)의 O 항원 PS를 함유하는 식염수 완충액 중 대장균 생체접합체 백신. 1일에 ExPEC4V의 단일 0.5 mL의 IM(삼각근) 주사.

Prevnar 13: 무독성 디프테리아 CRM197 단백질에 개별적으로 연결된 스트렙토코커스 뉴모니애 혈청형 1, 3, 4, 5, 6A, 6B, 7F, 9V, 14, 18C, 19A, 19F 및 23F의 캡슐 항원의 당류의 멸균 현탁액. 1일에 단일 0.5 mL의 IM(삼각근) 주사, 단일 용량의 사전 충전형 주사기로 제공됨.

위약: 생리식염수. 1일에 위약의 단일 0.5 mL의 IM(삼각근) 주사.

ExPEC 연구 중재 자료는 표 9에 설명되어 있다.

표 9. BAC1001MV ExPEC 연구 백신

EPA = 슈도모나스 애루기노사로부터 유래된 유전적으로 탈독소화된 형태의 외독소 A; PS=다당류

ExPEC4V는 EPA 담체 단백질에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O6A 및 O25B의 O 항원 다당류(PS)로 구성된다.

ExPEC10V는 EPA 담체 단백질에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 다당류(PS)로 구성된다.

용량은 PS만을 기준으로 한다. EPA(μg)는 측정값이다.

ExPEC10V는 10개의 1가 원료 의약품(DS)으로 구성된다. 이 임상 연구를 위해 2개의 상이한 농도(중간 및 고)의 완제 의약품(DP)을 생성한다(표 10). 세 번째(저) 농도는 제형 완충액과 동일한 희석 완충액으로 고농도를 1:1로 희석하여 클리닉에서 얻는다. 각 DP는 pH 7.0(0.02% [w/w] 폴리소르베이트 80, 5% [w/w] 소르비톨, 10 mM 메티오닌)의 인산나트륨/인산칼륨 완충액에서 제형화된다.

표 10: 1/2a 상 임상 연구를 위한 ExPEC10V 백신의 조성

EPA = 담체 단백질로 사용되는 유전적으로 탈독소화된 P. 애루기노사 외독소 A

^a 활성 성분은 PS 항원 및 담체 단백질(EPA)로 구성된 생물학적으로 합성된 접합체이다; 용량은 PS 모이어티에 대해서만 계산된다.

^b "저농도"는 "고농도"를 희석 완충액으로 1:1로 희석하여 클리닉에서 얻는다.

안전성 평가

주요 안전성 평가에는 명시된 국소 및 전신 AE, 명시되지 않은 AE, SAE, 신체 검사, 활력 징후 측정 및 임상 실험실 테스트가 포함된다.

면역원성 평가

수집된 혈청의 주요 면역원성 평가는, 멀티플렉스 ECL 기반 면역분석법에 의해 측정되는 백신에 의해 유발된 ExPEC10V 및 ExPEC4V 혈청형 특이적 총 IgG 항체 수준 및 멀티플렉스 포맷(MOPA)의 옵소닌 식세포 살상 분석법(OPKA)에 의해 측정되는 같은 ExPEC10V 및 ExPEC4V 혈청형 특이적 기능성 항체의 평가를 포함한다. Prevnar 13에 의해 유발된 폐렴구균 항체 역가의 면역원성 평가는 수행되지 않는다.

ExPEC10V에 의해 유도된 혈청 항체 수준은 멀티플렉스 전기화학발광(ECL) 기반 면역분석법에 의해 평가된다. 이 분석법은 상이한 대장균 O-LPS 항원 또는 담체 단백질 EPA로 코팅된 다중-스팟 96웰 포맷 마이크로플레이트에서 고결합 탄소 전극을 조합한다. 혈청 샘플에 존재하는 항원 특이적 항체의 수준은 SULFO-TAG로 표지된 2차 항체(항-인간 IgG)를 사용하여 검출된다. SULFO-TAG는 결합된 IgG 항체의 양에 비례하여 증가하는 강도로 전기 자극의 존재 하에 발광한다. 이 분석법은 ICH(International Conference on Harmonization) 권장 사항에 따라 검증되었다.

ExPEC10V에 의해 유도된 기능적 항체의 수준은 멀티플렉스 옵소닌 식세포 분석법(MOPA)으로 측정된다. 간단히 말해서, 열 불활성화된 혈청 샘플은 연속적으로 희석되고, 다양한 유형의 항생제에 특이적으로 내성이 있는 다른 대장균 균주와 함께 인큐베이션된다. 그 후, 인간 보체 및 식세포(HL60)를 반응물에 첨가하고, 두 번째 인큐베이션 기간 후, 반응 혼합물의 분취량을 선택적으로 특정 항생제에 내성인 균주의 성장을 허용하는 특정 항생제가 보충된 배지를 함유하는 다양한 PVDF 친수성 막 필터 플레이트에 옮긴다. 밤새 성장시킨 후, 생존 박테리아의 수를 결정하기 위해 콜로니 형성 단위(CFU)를 계산한다. 이 분석법은 ICH 권장 사항에 따라 검증되었다.

멀티플렉스 ECL 기반 면역분석법 및 MOPA에 의해 측정된 ExPEC10V 혈청형 항체 및 멀티플렉스 ECL 기반 면역분석법만으로 측정된 EPA의 경우, 모든 면역원성 시점에 대해 연구 백신접종군에 의해 면역원성의 다음 척도가 평가되고 표로 작성된다:

- 1일로부터 혈청 항체 역가가 2배 이상 및 4배 이상 증가한 참가자의 비율(백신접종 전)

- 기하 평균 역가(GMT)

- GMR: 기준선 이후/기준선 값으로부터 계산된 기준선으로부터의 배수 변화.

LTFU 기간 동안 각 혈청형에 있어서 면역원성에 대한 기술적 요약이 제공된다.

나중 상을 위한 용량 선택은 코호트 1(30일 결과)의 1차 분석 시점에 이용 가능한 증거 전체를 고려한다.

표 11: 코호트 1: 백신접종 일정

*ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 다당류(PS)로 구성된다.

** ExPEC4V는 담체 단백질인 슈도모나스 애루기노사로부터 유래한 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O6A 및 O25B의 O 항원 다당류(PS)로 구성된다.

*** Prevnar 13, 폐렴구균 13가 접합체 백신(디프테리아 CRM197 단백질)은 무독성 디프테리아 CRM197 단백질에 개별적으로 연결된 스트렙토코커스 뉴모니애 혈청형 1, 3, 4, 5, 6A, 6B, 7F, 9V, 14, 18C, 19A, 19F 및 23F의 캡슐 항원의 당류의 멸균 현탁액이다.

표 12: 코호트 2: 백신접종 일정

^a ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 다당류(PS)로 구성된다.

연구의 코호트 2에 등록된 참가자의 무작위 배정 비율은 2:1(ExPEC10V:위약)이다. 코호트 2에 사용된 ExPEC10V 용량은 코호트 1의 1차 분석(30일) 결과를 기반으로 하였고, 이는 코호트 1에 사용된 고용량이다.

상태

전술한 연구의 코호트 1의 등록 및 백신접종이 완료되었다. 주요 안전성 문제는 확인되지 않았으며, ExPEC10V 백신은 허용가능한 안전성 프로파일을 갖는다.

코호트 1 임상 샘플의 면역원성의 분석이 수행되었고, 결과는 아래에 기재되어 있다.

코호트 2 백신접종은 ExPEC10V에 대한 고용량을 사용하여 시작되었고, 연구의 이 부분이 진행 중이다.

코호트 1 안전성 및 면역원성 결과

본원에 제시된 이러한 결과는 BAC1001 임상 연구(코호트 1)를 참조한다. 전체 분석 세트에는 416명의 참가자가 있었다. 각 참가자는 ExPEC10V의 단일 근육내 투여 용량 3개 중 1개 또는 ExPEC4V 또는 Prevnar의 활성 대조군 용량 2개 중 1개로 무작위 배정되었다; 104명은 ExPEC10V 저용량, 102명은 ExPEC10V 중간 용량, 104명은 ExPEC10V 고용량, 52명은 ExPEC4V(4:4:4:8 μg O1A, O2, O6A 및 O25B 다당류/용량), 54명은 Prevnar로 백신접종되었다. 총 413명의 참가자가 30일 방문을 완료했다. 392명(94.2%)의 참가자가 프로토콜 면역원성 분석에 따라 15일에 포함되었다.

안전성

전반적으로, 모든 ExPEC10V 용량은 내약성이 우수했다. 고용량에서 반응원성이 증가하는 경향이 있었고, ExPEC10V 고용량 반응원성은 홍반, 부기 및 구역을 제외하고는 Prevnar보다 낮거나 비슷했다. Prevnar와 대조적으로, ExPEC10V군에서 더 늦게 발병하는 국소 반응원성이 관찰되었고, 주사 부위 홍반 및 부기가 이러한 국소 사건을 경험한 참가자의 >90%에서 후기 발병 사건으로 보고되었다. 그러나 ExPEC10V의 반응원성 프로파일은 노인 집단에서 사용되는 다른 허가된 백신과 비교할 때 허용 가능하다.

면역원성

혈청형 특이적 혈청 항체(총 면역글로불린 G[IgG])의 수준을 측정하는 멀티플렉스 전기화학발광(ECL) 기반 면역분석법과 항체 매개 세균 옵소닌 식세포 살상을 측정하는 멀티플렉스 옵소닌 식세포 살상 분석법(MOPA)을 사용하여 기준선(백신접종 전 1일차)과 백신 접종 후 15일차에 백신 유발 면역 반응을 평가하였다.

항원 특이적 혈청 항체 수준(ECL)

O 항원 특이적 혈청 항체(총 IgG)의 수준은 테스트한 모든 ExPEC10V 용량 및 모든 백신 관련 혈청형에 대해 백신접종 후 15일차에 유의하게 증가했다. 고용량의 ExPEC10V 백신을 받은 대상체의 적어도 80%가 O25B, O6A, O2, O1A, O4, O15, O16 및 O18A를 포함하는 10개 혈청형 중 8개에 대해 백신접종 후 15일차까지 O 항원 특이적 항체 역가의 2배 이상의 증가를 나타냈음이 관찰되었다. ExPEC10V 중간 용량군의 경우, 대상체의 적어도 80%가 O25B, O2, O1A, O4 및 O15를 포함하는 10개 혈청형 중 5개에 대해 백신접종 후 15일차까지 O 항원 특이적 항체 역가의 2배 이상의 증가를 보여주고; ExPEC10V 저용량군의 경우, O25B, O2, O15 및 O16를 포함하는 10개 혈청형 중 4개에 대해 그러했다(도 4, 표 13). Prevnar 또는 ExPEC4V(비ExPEC4V 혈청형의 경우)를 투여받은 대상체 군에서 1일부터 15일까지 GMT의 최소 변화가 관찰되었다(도 4, 표 13).

ECL 분석의 경우, 모든 대상체를 분석하고 모든 면역원성 서브세트에 포함했다. 프로토콜 제외 기준에 따라 중대한 위반이 있는 대상체는 프로토콜별 분석에서 제외되었다. 기하 평균 역가(GMT), GMT FI(기하 평균 역가 배수 증가) 및 ECL 기반 면역분석에서 기준선으로부터 적어도 2배 및 4배 증가가 있는 참가자의 백분율이 하기 표 13에 요약되어 있다.

표 13. ECL 데이터 BAC1001 코호트 1

코호트 1: 1차 분석을 위한 출력

¹= 기준선(1일)으로부터의 FI의 GM

²= 기준선(1일)으로부터 배수 증가가 있는 참가자의 백분율

CI=신뢰 구간; GM=기하 평균, GMT=기하 평균 역가; FI=배수 증가

GMT 및 GM FI에 대한 95% CI는 t-분포를 기반으로 한다.

Clopper-Pearson 방법을 사용하여 2배 및 4배 증가가 있는 참가자 백분율에 대한 95% CI를 얻는다.

데이터(도 4)에서 O75 다당류 항원에 대한 총 IgG 반응이 같은 양으로 투여된 다른 항원에 비해 더 낮음을 알 수 있는데(예를 들어, 1일 대비 15일에 적어도 2배의 증가가 있는 대상체의 비율이 더 낮음), 이는 놀라운 결과였다. 데이터는 또한 조성물 중 O75 다당류 항원의 양의 증가(즉, 고용량 8 μg 대 저용량 및 중간 용량 4 μg의 투여)가 O75 다당류 항원에 대한 유도된 면역 반응을 증가시켰음을 보여준다.

혈청 항체 기능성(MOPA)

부분 데이터는 코호트 1 MOPA 분석에 포함되었다. 표 14는 15일에서의 MOPA GMT 분석에 포함된 참가자 수를 보여준다. ExPEC10V에 의해 유도된 항체 반응의 기능성을 평가하기 위해 부분 데이터를 사용했지만 전체 데이터 세트를 사용할 수 있을 경우 분석 결론은 바뀌지 않았다.

표 14. MOPA GMT 분석에 포함된 참가자 수

MOPA에 의해 측정된 옵소닌 식세포 항체의 수준은 일반적으로 ECL 기반 면역분석법에 의해 측정된 O 항원 특이적 항체(총 IgG)의 수준과 일치했다. 기능적 항체의 증가된 수준은 테스트한 모든 용량군에서 10개의 ExPEC10V 혈청형 중 9개에 대해 15일에 관찰되었다(도 5).

다른 ExPEC10V 혈청형과 달리, 혈청형 O8의 경우, 검증된 MOPA 분석은 1일에 ExPEC10V 백신접종 후 15일차에 기능적 항체의 백신 매개 증가를 보여줄 수 없었지만(도 5), 혈청형 O8 총 IgG 역가의 증가가 관찰되었다(도 4). 검증된 분석이 기능적 O8 항체를 검출할 수 없는지를 구별하기 위한 연구가 시작되었다. 수정된 MOPA 분석법과 1일차 및 15일차 혈청을 사용한 후속 실험에서 성공적으로 2배 이상의 15일의 기능적 항체 증가를 나타냈으며(데이터 미제시), ExPEC10V 백신이 혈청형 O8에 대해서도 기능적 항체를 실제로 유도했음을 입증했다. 임상 개발을 위해, 수정된 O8 MOPA는 상당한 시간이 소요되는 분석법의 재검증과 임상 샘플의 재검사를 요하여, 처음에는 O8 다당류 항원을 포함하지 않는 백신 조성물 개발을 진행하기로 했다. 그러나 10가 ExPEC 백신 조성물의 O8 생체접합체가 대장균 O8 혈청형에 대한 기능적 항체를 유도한다는 것이 후속 실험으로부터 명백하며, 따라서 이러한 생체접합체는 아래 실시예에서 기재된 9가 백신 조성물에 성공적으로 첨가될 가능성이 있다.

최고 수준의 옵소닌 식세포 항체가 혈청형 O2에서 관찰되었다; 고용량의 해당 백신으로 백신접종한 대상체의 95%는 백신접종 후 15일차에 항-O2 옵소닌 항체 역가의 2배 이상의 증가를 보여주었다. 위에서 논의된 바와 같이 제한된 수준의 기능적 항체가 관찰된 O8 혈청형을 제외하고, 최저 수준의 옵소닌 식세포 항체가 혈청형 O75에서 관찰되었다; 고용량의 백신으로 백신접종한 대상체의 36%가 백신접종 후 15일차에 항-O75 옵소닌 항체 역가의 2배 이상의 증가를 보여주었다. 따라서 O75 혈청형에 대한 MOPA 데이터는 위에 기재된 이 혈청형에 대한 ECL 데이터와 일치하며, 이는 동일한 농도의 조성물 내의 몇몇 다른 접합체, 예를 들어, 대장균 O6, O1 또는 O2 접합체의 면역원성과 비교하여, 대장균 O75 항원 다당류의 접합체의 상대적으로 낮은 면역원성을 뒷받침한다. 또한, Prevnar 또는 ExPEC4V(비ExPEC4V 혈청형의 경우)를 투여받은 대상체 군에서 1일부터 15일까지 GMT의 최소 변화가 관찰되었는데(도 5), 이는 각각의 백신 조성물에 존재하지 않는 혈청형에 대한 예상과 일치한다.

기하 평균 역가(GMT), 기하 평균 배수 증가(GMR FI) 및 MOPA에서 기준선으로부터 적어도 2배 및 4배의 증가가 있는 참가자의 백분율은 10개의 혈청형 각각에 대해 표 15에 요약되어 있다.

표 15. MOPA 데이터 BAC1001 코호트 1

코호트 1: 1차 분석을 위한 출력

¹= 기준선(1일)으로부터의 FI의 GM

²= 기준선(1일)으로부터 배수 증가가 있는 참가자의 백분율

CI=신뢰 구간; GM=기하 평균, GMT=기하 평균 역가; FI=배수 증가

GMT 및 GM FI에 대한 95% CI는 t-분포를 기반으로 한다.

용량 선택

각 용량군의 기준선으로부터 15일까지의 log10배 증가의 평균에 기반한 면역원성 용량 선택 알고리즘은, 2개의 분석 세트(PPI 및 FAS)와 2종의 분석법(ECL 및 MOPA)을 고려하는 이 시험의 코호트 2에 대한 ExPEC10V 고용량을 확인하였다.

혈청형 O2, O4, O15, O16 및 O18A의 경우, 고용량군은 두 분석법 모두에서 다른 2개의 ExPEC10V 용량과 비교하여 15일에 더 높은 GMT, GMR 및 2배 및 4배의 증가가 있는 참가자의 백분율을 나타냈다. 혈청형 O25B의 경우, 중간 용량군은 일반적으로 3개의 ExPEC10V 용량군 중에서 더 높은 GMT, GMR 및 2배 및 4배의 증가가 있는 참가자의 백분율을 나타냈다; 이 혈청형의 경우, O 항원 용량은 중간 및 높은 ExPEC10V 용량군 모두에 대해 동일했다(16 μg). 혈청형 O1A와 O6A 둘 다의 경우, 결과는 고용량과 중간 용량 사이에서 혼합되었다. 혈청형 O75에서, ExPEC10V 용량에 대해 측정 가능한 기능적 항체 반응이 있었다. 측정 가능한 기능적 항체 반응은 위에서 논의한 바와 같이 혈청형 O8에 대한 검증된 분석에서 검출되지 않았다. 비ExPEC4V 혈청형에서, 2개의 활성 대조군에서 낮은 기능적 항체 반응이 관찰되었다; 항체 반응은 백신 유발 반응이 아닌 기존 항체에서 나왔다. 이러한 결과를 바탕으로 BAC1001 임상시험의 코호트 2를 위해 ExPEC10V의 고용량을 선택하였다.

결론

ExPEC10V 백신은 강력한 항체 반응을 유도했으며 기준선 역가(1일)와 비교할 때 백신접종 후 15일에 모든 백신 관련 혈청형에 대해 O 항원 특이적 혈청 항체의 증가가 관찰되었다. 대장균 옵소닌 식세포 살상을 매개하는 ExPEC10V 유도 기능적 항체는 혈청형 O8을 제외한 모든 백신 관련 혈청형에 대해 검증된 MOPA에서 검출되었다. 혈청형 O8의 경우, 수정된 MOPA를 사용한 후속 연구에서 기능적 항체 반응을 측정했다. 특히, O75 반응은 같은 용량의 다른 혈청형보다 4 μg 및 8 μg 용량에서 더 약했으며, 이는 이 연구에서 놀랍고도 예측할 수 없는 발견이었다. 다가 당접합체 조성물에 의해 생성된 대장균 O75 혈청형에 대한 면역 반응을 개선하기 위해, 일 양태에서 본 발명은 혈청형 O75 항원 다당류의 용량을 예를 들어 일부 다른 혈청형의 용량의 약 1.2~8배, 예를 들어, 약 1.5~4배, 예를 들어 약 1.5~2.5배, 예를 들어, 일부 다른 혈청형, 예컨대, O6 또는 O1의 용량의 약 2배, 예를 들어, 약 16 μg까지 증가시키는데, 이는 가장 관련성이 높고 널리 퍼진 세 가지 혈청형 O1A, O2 및 O6A보다 높고 혈청형 O25B 항원 다당류와 유사하다. 초기 실험에서(예를 들어, 본 실시예의 위 및 실시예 5 및 6 참조, 즉, 본원에 개시된 ExPEC10V 백신을 사용한 임상 데이터가 이용 가능하기 전 참조) O75 항원 다당류의 용량은 기껏해야 O1A, O2 및 O6A 항원 다당류의 용량만큼 높았거나, 또는 실제로 특정 테스트한 군에서 O1A 및 O6A 항원 다당류보다 2배 더 낮았고, O25B 항원 다당류보다 2~4배 더 낮았다. 대조적으로, 본 발명의 특정 양태에서 O75의 용량은 따라서 O1, O2 및/또는 O6의 용량에 비해 실제로는 증가된다.

코호트 2 안전성 및 면역원성 결과

이 연구의 코호트 2에서 지난 5년 동안 UTI 병력이 있는 안정적인 건강 상태의 60세 이상의 참가자 총 약 420명이 등록되었고 2:1 비로 병렬로 무작위 배정되었다(전체 결과 분석이 수행된 세트에는 ExPEC10V(고용량)군의 참가자 278명과 위약군의 참가자 138명이 포함되었다).

안전성

전반적으로 ExPEC10V 백신은 내약성이 우수했다. 반응원성 프로파일은 코호트 1에서 ExPEC10V의 중간 및 고용량에서 관찰된 것과 일반적으로 비슷했다. 가장 빈번한 명시된 국소 AE는 통증/압통이었고 가장 빈번하게 보고된 전신 AE는 근육통, 두통 및 피로였다. 주사 부위 홍반 및 부기가 가장 흔한 후발성 사건이었다(최초 발병까지의 시간 > 백신접종 후 5일). ExPEC10V의 반응원성 프로파일은 노인 집단에서 사용되는 다른 허가된 백신과 비교할 때 허용 가능하다.

면역원성

혈청형 특이적 혈청 항체(총 IgG)의 수준을 측정하는 멀티플렉스 ECL 기반 면역분석법을 사용하여 기준선(백신접종 전 1일)과 백신접종 후 15일차 및 30일차에 백신 유발 항체 반응을 평가했다.

항원 특이적 혈청 항체 수준(ECL, 1일, 15일 및 30일)

ExPEC10V 백신은 증가하는 값의 GMT, GMT FI 및 1일부터 15일까지 기준선으로부터 역가의 적어도 2배의 증가가 있는 참가자의 백분율을 기준으로 모든 혈청형에 대해 면역원성이었다. 15일부터 30일까지 세 가지 측정치 모두에서 최소한의 변화가 있었다.

혈청형 O2, O4, O15 및 O16에서 가장 높은 항체 반응이 관찰되었는데, ExPEC10V로 백신접종한 참가자 중 적어도 80%가 백신접종 후 15일 및 30일까지 항체 반응의 2배 이상의 증가를 보여주었다. 혈청형 O1A, O6A 및 O25B의 경우, 참가자의 적어도 70%가 항체 반응의 2배 이상의 증가를 보여주고, 혈청형 O8 및 O18A의 경우, 참가자의 적어도 60%가 항체 반응의 2배 이상의 증가를 보여준다. 혈청형 O75의 경우, 더 낮은 항체 반응이 관찰되었으나, 참가자의 적어도 50%에서 항원 특이적 항체 반응의 2배 이상의 증가가 관찰되었다. 1일부터 15일 및 30일까지 GMT의 최소 변화가 위약을 받은 대상체 군에서 관찰되었다(표 16).

기하 평균 역가(GMT), GMT FI(기하 평균 역가 배수 증가) 및 ECL 기반 면역분석에서 기준선으로부터 적어도 2배 및 4배 증가가 있는 참가자의 백분율이 하기 표 16에 요약되어 있다.

표 16. ECL 데이터 BAC1001 코호트 2(1일, 15일 및 30일)

코호트 2: 1차 분석을 위한 출력

¹= 기준선(1일)으로부터의 FI의 GM

²= 기준선(1일)으로부터 배수 증가가 있는 참가자의 백분율

CI=신뢰 구간; GM=기하 평균, GMT=기하 평균 역가; FI=배수 증가

GMT 및 GM FI에 대한 95% CI는 t-분포를 기반으로 한다.

15일에서의 반응의 규모(GMT)는 모든 혈청형에 대해 코호트 1과 2 사이에서 유사했다.

실시예 8: 신규한 ExPEC 조성물 및 토끼에서의 면역원성

ExPEC 백신의 2개의 맞춤형 조성물(본원에서 맞춤형 제형이라고도 함)(ExPEC9V a 및 b, 표 17)을 포함하는 새로운 연구를 설계하였다. 이러한 맞춤형 제형은 혈청형 O8 다당류가 고갈되고 대장균 혈청형 O75에 대한 다당류 함량이 증가되었는데(ExPEC9V b), 이는 Ph1/2a 임상 시험에서 코호트 1을 분석하는 동안 이들 항원에 대해 낮은 면역원성이 관찰되었기 때문이다. 위에서 기재한 초기의 실험을 확인하기 위한 대조군으로서, ExPEC10V 조성물도 평가했다. 식염수 대조군(백신 미접종 군)도 포함되었다.

연구의 전반적인 목적은 상기 기재된 ExPEC10V와 비교하여 백신 조성의 변화(O8 다당류의 고갈 및 특히 O75 항원 다당류에 대한 용량 증가)가 백신 유발 면역 반응에 영향을 미치는지를 평가하는 것이었다. 특히, 다가 접합체 백신 조성물에서 예를 들어, 대장균 O6 항원 다당류의 접합체와 비교하여 대장균 O75 항원 다당류의 접합체의 양을 증가시키는 것이 실제로 혈청형 O75의 대장균에 대한 면역 반응을 선택적으로 개선하고, 따라서 구성 대장균 혈청형에 걸쳐 보다 균일하게 증가된 면역 반응을 초래하는지를 살펴보는 것이 목적이었다. 이를 위해, 다양한 제형의 ExPEC 백신에 의해 유도된 항체 반응을 뉴질랜드 백색 토끼(NZW)를 사용하여 확립된 면역원성의 전임상 모델에서 평가했다.

실험 설계

뉴질랜드 백색 토끼(NZW, 연구 시작 시 13주령)는 2주 간격으로 투여된 다양한 제형의 ExPEC 백신 또는 식염수로 3회의 근육내 면역화(500 μL/주사)를 받았다(표 17). 연구는 4개의 상이한 군을 포함하였다(표 18): 군 1(ExPEC10V)은 8 μg/용량의 O1A, O2, O6A, O4, O8, O15, O16, O18 및 O75 및 16 μg/용량의 O25B(즉, 각각 O1A, O2, O6A, O4-Glc+, O8, O15, O16, O18A 및 O75 항원 다당류 16 μg/mL 및 O25B 항원 다당류 32 μg/mL를 포함하는 조성물 0.5 mL, 각각의 항원 다당류는 EPA 담체 단백질에 개별적으로 생체접합됨, 상기 실시예 참조)를 투여받았다; 군 2(ExPEC9V a)는 8 μg/용량의 O1A, O2, O6A, O4, O15, O16, O18A 및 O75 및 16 μg/용량의 O25B(즉, 각각 O1A, O2, O6A, O4-Glc+, O15, O16, O18A 및 O75 항원 다당류 16 μg/mL 및 O25B 항원 다당류 32 μg/mL를 포함하는 조성물 0.5 mL, 각각의 항원 다당류는 EPA 담체 단백질에 개별적으로 생체접합됨, 상기 실시예 참조)를 투여받았다; 군 3(ExPEC9V b)은 8 μg/용량의 O1A, O2, O6A, O4, O15, O16 및 O18A 및 16 μg/용량의 O75 및 O25B(즉, 각각 O1A, O2, O6A, O4-Glc+, O15, O16 및 O18A 항원 다당류 16 μg/mL 및 O25B 및 O75 항원 다당류 32 μg/mL를 포함하는 조성물 0.5 mL, 각각의 항원 다당류는 EPA 담체 단백질에 개별적으로 생체접합됨, 상기 실시예 참조)를 투여받았다.

배합에 사용된 완충액은 6.19 mM KH2PO4, 3.81 mM Na2HPO4, 5% 소르비톨(w/w), 10 mM 메티오닌, 0.02% PS80 (w/w), pH 7.0을 함유하였다. 대조군(군 4)의 동물은 식염수(0.9% (w/v) 염화나트륨 용액)를 받았다. 각 실험군에는 10마리의 동물이 포함되었다. ELISA로 측정한 혈청 항체 수준(총 IgG)을 면역화 전(0일) 및 면역화 후(14일, 28일 및 42일) 평가했다.

표 17. 상이한 다가 ExPEC 백신 조성물.

표 18. 실험군.

잠재적인 주사 부위 반응을 각 용량 전, 각 투약일에 용량 후 약 6시간, 주사 후 7일 동안 매일 Draize 채점 시스템을 사용하여 모니터링했다. 증례 주사 부위 영향이 관찰되면 점수가 0이 될 때까지 매일 관찰을 계속했다.

개별적으로 전처리 동안 1회, 각 용량 후 3일 동안 매일, 그 후 매주 1회 동물의 체중을 쟀다(그램 단위). 건강이 좋지 않거나 바람직하지 않은 임상 효과에 대해 동물을 적어도 하루에 한 번 관찰했다. 투약일에 동물을 투약 전과 치료 약 6시간 후(주사 부위 검사와 동시에) 치료에 대한 반응에 대해 조사했다. 용량 전, 각 용량 후 6시간 및 24시간 후에 직장 디지털 온도계를 사용하여 체온을 모니터링하고 기록했다. 체온이 38~40℃의 토끼의 정상 범위를 벗어나는 경우, 체온이 이 값 이내로 돌아올 때까지 매일 추가 측정을 수행했다.

동물은 2주 간격으로 투여된 ExPEC10V, ExPEC9V a, ExPEC9V b 또는 식염수로 3회의 근육내 면역화를 받았다. 항체 수준은 0일(백신접종 전) 및 14일, 28일 및 42일(백신접종 후)에 ELISA에 의해 측정되었다.

ExPEC 백신 조성물에 포함된 각 O 항원에 의해 유도된 혈청 항체 수준을 Gen 5 소프트웨어를 사용하여 ELISA로 분석했다. 450 nm에서의 OD를 4 파라미터(4PL) 비선형 회귀 모델에서 분석하였다. 이중 12단계 적정 곡선을 기반으로 각 개별 샘플에 대해 최대 유효 농도의 절반(EC50)을 계산했다. 샘플 결과는 EC50 역가로 표시된다.

NZW 토끼에서 항원 특이적 혈청 항체 반응의 평가는 테스트한 모든 ExPEC 백신 조성물(ExPEC10V, ExPEC9V a 및 ExPEC9V b)이 식염수 대조군과 비교하여 백신접종 후 14일, 28일 및 42일에 모든 백신 항원에 대한 항체 반응의 유의한 증가를 유도함을 보여주었다(도 6). 테스트한 모든 ExPEC 백신 조성물의 두 번째 용량은 백신접종 후 14일부터 28일까지 항원 특이적 항체 반응의 유의한 증가에 의해 입증된 바와 같이 항체 반응을 부스트했다. ExPEC 백신의 세 번째 용량의 추가 부스트 효과는 특정 항원 및 조성물에 대해 명백했다.

O75 항원의 기하 평균 항체 역가(GMT)는 O75 다당류의 농도가 증가함에 따라 증가했다(도 6). 증가된 농도의 다당류 O75(16 μg)를 함유하는 ExPEC9V b 조성물은 단지 8 μg의 O75 다당류를 함유하는 ExPEC9V a 및 ExPEC10V 조성물과 비교하여 백신접종 후 14일, 28일 및 42일에 더 높은 O75 GMT 및 GMT 배수 증가를 유도하였다(표 19).

표 19. 다양한 ExPEC 백신 조성물에서 O75 항체 반응의 평가.

n.a.: 해당 없음; GMT: 기하 평균 항체 역가; CI: 신뢰 구간; 0일(백신접종 전 기준선)과 비교하여 GMT 배수 증가.

체중, 체온 및 주사 부위 반응의 평가는 테스트한 모든 ExPEC 백신 조성물이 동물에서 내약성이 우수하였음을 보여준다(데이터 미제시).

결론적으로, 테스트한 모든 ExPEC 백신 조성물은 NZW 토끼에서 면역원성이었으며, 식염수 대조군과 비교할 때 백신접종 후 14일, 28일 및 42일에 항원 특이적 혈청 항체 반응의 유의한 증가가 관찰되었다. 테스트한 모든 ExPEC 백신 조성물은 다당류 특이적 항체 반응을 부스트할 수 있었다. 또한, 테스트한 모든 ExPEC 백신 조성물은 동물에서 내약성이 우수하였고, 백신 관련 유해 사건은 관찰되지 않았다. 중요하게도, 증가된 농도의 O75 다당류를 함유하는 ExPEC9V b 조성물은 더 낮은 농도의 O75 다당류를 함유하는 조성물(ExPEC9Va 및 ExPEC10V)과 비교할 때 더 높은 O75 항체 반응(GMT 및 GMT 배수 증가)을 유도하였다. 따라서, ExPEC9V b 조성물에서 O75의 증가된 용량은 O75 혈청형에 대한 면역 반응을 개선하고, 따라서 이러한 조성물은 ExPEC9V b 조성물에서 혈청형에 걸쳐 보다 균일하게 증가된 면역 반응을 유도한다.

실시예 9. 신규한 ExPEC9V 조성물을 이용한 인간 대상 3상 효능 시험.

증가된 농도의 O75 항원 다당류를 갖는 9가 ExPEC 백신 조성물을 사용하여 인간에서의 효능 연구를 수행하였다. 연구 제목은 "과거 2년 동안 요로 감염의 병력이 있는 60세 이상 성인의 침습성 장외 병원성 대장균 질환 예방에서 ExPEC9V 백신접종의 효능, 안전성 및 면역원성을 평가하기 위한 무작위, 이중 맹검, 위약 대조, 다기관 3상 연구"이며, 본원에서는 'BAC3001' 연구로 지칭된다.

ExPEC9V는 60세 이상 성인의 침습성 장외 병원성 대장균(ExPEC) 질환(IED) 예방을 위해 개발 중인 9가 백신 후보이다. ExPEC9V는 이전 실시예에서 자세하게 기재된 바와 같이, 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 생체접합된 ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75의 O 항원 다당류(PS)로 구성된다. ExPEC9V 백신은 모든 IED의 약 65%를 차지하는 ExPEC의 가장 널리 퍼진 O 혈청형 중에 있는 9개의 표시된 대장균 혈청형을 커버한다.

목적 및 종점

전반적인 설계

이는 지난 2년 동안 UTI 병력이 있는 60세 이상의 의학적으로 안정적인 성인 약 18,556명을 대상으로 실시되는 무작위, 이중 맹검, 위약 대조, 병렬군, 다기관, 중재적 3상 연구이다.

모든 참가자는 ExPEC9V 또는 위약에 대해 1:1 비로 병렬로 등록되고 무작위 배정되며 1일에 연구 백신(0.5 mL 근육내 주사(삼각근 내))을 받는다. 최초의 1차 종점(혈액, 기타 멸균 부위 또는 소변에서 미생물학적 확인 포함)에 대한 최종 분석은 연구에서 72건의 백신 혈청형 IED 사건이 관찰되었을 때 또는 늦어도 마지막 참가자가 백신접종 후 36개월 동안 추적 관찰되었을 때 발생한다. 두 번째 1차 종점(혈액 또는 기타 멸균 부위에서 미생물학적 확인 포함)은 최초의 1차 종점이 통계적 유의성을 보일 때 계층적 방식으로 테스트된다. 두 번째 1차 종점(혈액 또는 기타 멸균 부위에서 미생물학적 확인 포함)의 최종 분석의 경우, 두 번째 1차 종점에 따른 53건의 백신 혈청형 IED 사건을 관찰해야 한다. ExPEC9V 백신 조성물은 16 μg/mL의 각각의 O1A, O2, O6A, O4-Glc+, O15, O16 및 O18A 항원 다당류 및 32 μg/mL의 O25B 및 O75 항원 다당류를 포함하며, 각 항원 다당류는 EPA 담체 단백질에 개별적으로 생체접합된다. 예를 들어, 위 참조(예를 들어, 이는 위의 실시예 8의 토끼 면역화의 군 3에서 사용된 동일한 조성물임; 부형제는 실시예 7의 BAC1001 연구에서 사용된 ExPEC10V 백신에 대해 기술된 것과 동일하다). 위약은 0.9% w/v의 염화나트륨이다.

안전성 평가

주요 안전성 평가에는 SAE, 신체 검사 및 활력 징후가 포함된다. 또한, 명시된 국소 및 전신 AE 및 명시되지 않은 AE는 "안전성 서브세트"의 참가자, 즉 추가 평가를 위해 무작위화하기 전에 정보에 입각한 동의를 제공한 선택된 연구 현장의 약 4,000명의 참가자에 대해 기록된다.

면역원성 평가

면역원성의 평가의 경우, 각각의 9가지 백신 O 혈청형 및 담체 단백질 EPA에 대한 백신에 의해 유도된 IgG 항체 수준을 멀티플렉스 ECL 기반 면역분석으로 측정하고, 혈청형 특이적 기능적 항체를 MOPA로 측정한다. 면역원성 분석은 "면역원성 서브세트"의 참가자, 즉 추가 면역원성 평가를 위해 무작위화하기 전에 정보에 입각한 동의를 제공한 선택된 연구 현장의 약 1,200명의 참가자, 그리고 확인된 IED 사건이 있는 모든 참가자, 그리고 UTI 또는 급성 세균성 전립선염(ABP) 사건이 있는 면역원성 서브세트의 참가자에 대해 수행된다.

효능 평가

1차 목적은 ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75에 의해 유발된 최초의 IED 사건의 예방에서 위약과 비교하여 ExPEC9V의 효능을 입증하는 것이다. IED, UTI 또는 ABP로 정의된 사건은 전체 연구 기간(1,096일, 3년) 동안 모든 참가자에 대해 수집된다. 연구 추적관찰 동안 참가자는 UTI 또는 ABP의 임의의 징후 또는 증상을 경험하거나 전신 감염으로 인해 발생할 수 있는 증상의 임의의 새로운 발병 또는 악화를 경험하는 경우 가능한 한 빨리 연구 현장에 알릴 것이 기대된다. 또한, 모든 참가자는 과거의 입원 또는 UTI, ABP 또는 잠재적 IED였을 수 있고 현장에서 실시간으로 포착되지 않은 의료 사건에 대해 질문을 받게 될 것이다. IED(모든 참가자) 및 UTI 또는 ABP(면역원성 서브세트만)와 관련된 의료 접촉과 관련된 의료 자원 활용 데이터가 수집된다. 건강 관련 삶의 질을 측정하기 위해 SF-36 버전 2와 EQ-5D-5L의 두 가지 환자 보고 결과(PRO) 도구가 사용된다. 또한, 쇠약은 SPPB 및 쇠약 지수 점수를 사용하여 평가된다.

면역원성 평가

면역원성의 평가의 경우, 각각의 9가지 백신 O 혈청형 및 담체 단백질 EPA에 대한 백신에 의해 유도된 IgG 항체 수준을 멀티플렉스 ECL 기반 면역분석으로 측정하고, 혈청형 특이적 기능적 항체를 MOPA로 측정한다. 면역원성 분석은 "면역원성 서브세트"의 참가자, 즉 추가 면역원성 평가를 위해 무작위화하기 전에 정보에 입각한 동의를 제공한 선택된 연구 현장의 약 1,200명의 참가자, 그리고 확인된 IED가 있는 모든 참가자, 그리고 UTI 또는 ABP 사건이 있는 면역원성 서브세트의 참가자에 대해 수행된다. 1일 및 30일의 면역원성 혈액 샘플을 모든 참가자로부터 수집한다.

안전성 평가

효능 분석

첫 번째 1차 종점의 1차 분석은 ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75에 의해 유발되고 프로토콜별 효능(PPE) 모집단에서 위약군과 비교한 활성 백신(ExPEC9V)군에서 백신접종 후 적어도 29일 후에 발병한 적어도 1건의 IED 사건이 있는 참가자의 수를 평가한다. 두 번째 1차 종점의 1차 분석은 PPE 모집단에서 위약군과 비교하여 활성 백신(ExPEC9V)군에서 백신접종 후 적어도 29일 후에(30일부터) 발병한 ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75에 의해 유발된, 혈액 또는 기타 멸균 부위에서 미생물학적 확인을 통한 적어도 1회의 IED 사건이 있는 참가자 수를 평가한다. 추적관찰 시간도 고려된다. IED 사건이 있는 참가자의 경우, 추적관찰 시간은 백신접종과 최초의 사건 발생 사이의 시간으로 정의된다. IED 사건이 없는 참가자의 경우, 이는 백신접종과 마지막 방문(또는 연구를 중단한 참가자의 경우 마지막 접촉) 사이의 시간이다. VE ≤20%라는 귀무가설을 대립가설 VE >20%에 대해 검정한다.

단계적 계층적 테스트 전략이 다음의 종점에 적용된다:

일차:

- ExPEC9V O 혈청형에 의해 유발된 혈액, 기타 멸균 부위 또는 소변의 미생물학적 확인을 통한 최초의 IED

- ExPEC9V O 혈청형에 의해 유발된 혈액 또는 기타 멸균 부위의 미생물학적 확인을 통한 첫 번째 IED

이차:

- ExPEC9V O 혈청형에 의해 유발된 모든 IED(참가자당 여러 IED 포함)

- ExPEC9V O 혈청형에 의해 유발된 최초의 입원 IED 사건

- ExPEC O 혈청형에 의해 유발된 패혈증에 대한 기준을 충족하는 최초의 IED 사건

- ExPEC9V O 혈청형에 의해 유발된 최초의 균혈증 IED 사건

- ExPEC9V O 혈청형에 의해 유발된 최초의 신우신염 사건

- ExPEC9V O 혈청형에 의해 유발된 최초의 UTI

- ExPEC9V O 혈청형에 의해 유발된 모든 UTI(참가자당 여러 UTI 포함)

- 임의의 ExPEC O 혈청형에 의해 유발된 최초의 IED 사건

- 임의의 ExPEC O 혈청형에 의해 유발된 최초의 신우신염 사건

- 임의의 ExPEC O 혈청형에 의해 유발된 최초의 UTI

이 테스트 전략에서, 두 번째 1차 종점은 첫 번째 1차 종점이 통계적 유의성을 보인 경우에만 테스트된다. 첫 번째 1차 종점이 72건의 사건으로 통계적 유의성을 보인 경우, 53건 미만의 사건이 해당 시점에 관찰되면 두 번째 1차 종점(혈액 또는 기타 멸균 부위에서 미생물학적 확인 포함)에 대한 중간 분석을 수행한다. 두 번째 1차 종점이 유의하지 않은 경우, 두 번째 1차 종점 정의에 따른 53건의 백신 혈청형 IED 사건이 관찰되었을 때 두 번째 1차 종점의 최종 분석이 수행된다. 또한 첫 번째 주요 2차 종점은 두 1차 종점이 모두 통계적 유의성을 보인 경우에만 테스트된다. 첫 번째 주요 2차 종점에는 추적관찰 기간이 끝날 때까지 백신접종 후 적어도 29일 후에 발병된 모든 ExPEC9V IED 사건(PPE)이 포함된다.

참가자는 아래 기준이 충족되고 독립적인 종점 심사 위원회(IEAC)에서 확인하는 경우 IED가 있는 것으로 간주된다.

IED 진단을 받은 성인 참가자는 다음이 있는 임의의 참가자이다:

* 다음 중 하나의 존재로 표시되는 전신 세균 감염의 징후 및 증상:

- 온도 <36.0℃(96.8℉) 또는 >38.0℃(100.4℉),

- 빈맥(HR) >90 bpm,

- 빈호흡(RR) >20회 호흡/분, 또는

- WBC 수 <4 또는 >12 x 10⁹/L 또는 10% 미성숙 (밴드) 형태,

그리고

* 다음의 배양에 의한 미생물학적 확인:

- 혈액 또는 임의의 기타 멸균 부위(예를 들어, 뇌척수액[CSF], 흉막)의 대장균,

및/또는

- UTI 징후/증상이 있고 다른 식별 가능한 감염 부위가 없고 기준선으로부터 2점 이상의 순차적 장기 부전 평가(SOFA) 총 점수의 급성 변화가 있는 소변 내 대장균(콜로니 형성 단위/mL ≥10⁵).

1차 및 2차 종점의 경우, 임의의 ExPEC9V O 혈청형(즉, O1A, O2, O4, O6A, O15, O16, O18A, O25B 또는 O75)에 의해 유발된 IED와 함께, O 혈청형 분석이 가능해야 하며 IED는 O1A, O2, O4, O6A, O15, O16, O18A, O25B 또는 O75 양성으로 확인되어야 한다. 임의의 ExPEC O 혈청형과 관련된 2차 종점의 경우, O 혈청형 분석을 사용할 수 없어야 한다. IEAC 판단에 따라 전신 감염이 대장균에만 기인할 수 없는 경우 배양 결과에 여러 병원체가 있는 증례는 1차 또는 2차 종점으로 간주되지 않는다. 혼합 병원체 및 대장균의 존재가 있는 증례는 민감도 분석에 포함된다.

참가자가 UTI의 징후 및 증상으로 의사 및/또는 연구 현장에 연락한 경우, 아래 기준을 충족하고 신우신염의 경우에 대해 IEC에서 확인하는 경우 참가자가 증상이 있는 UTI가 있는 것으로 정의된다.

문서화된 농뇨(백혈구(WBC) 수 ≥10개 세포/mm³)와 징후 및 증상에 대한 다음 정의 중 하나를 가진 소변 내 대장균 배양에 의한 미생물학적 확인(콜로니 형성 단위 ≥10⁵/mL)이 있는 성인:

· 단순 UTI의 경우, 다음 징후 또는 증상 중 적어도 2개:

- 배뇨 장애,

- 빈뇨,

- 요절박, 또는

- 치골상부 통증.

· 복합 UTI(cUTI)의 경우:

- 다음 징후 또는 증상 중 적어도 2개:

o 오한, 경직 또는 열과 관련된 온기(예를 들어, 체온 ≥38.0℃),

o 배뇨 장애, 빈뇨 또는 요절박,

o 하복부 통증 또는 골반통, 또는

o 구역 또는 구토,

그리고,

- 다음 합병 요소 중 적어도 1개:

o 요폐력(남성 참가자),

o 현재 내재하는 요도 카테터,

o 폐쇄성 요로병증, 또는

o 임의의 관련된 기능적 또는 해부학적 이상.

· 다음 증상 중 적어도 2개를 동반하는 신우신염의 경우(요로의 근본적인 이상 여부에 관계없이):

- 오한, 경직 또는 열과 관련된 온기(예를 들어, 체온 ≥38.0℃), 또는

- 신체 검사에서 갈비척추각의 옆구리 통증 또는 압통, 또는

- 구역 또는 구토.

· 재발성 UTI(rUTI)의 경우:

- 지난 6개월 동안 2회의 UTI 빈도로 단순 및/또는 복합 UTI의 재발, 또는

- 1년에 적어도 3회의 빈도로 단순 및/또는 복합 UTI의 재발.

2차 종점의 경우, 임의의 ExPEC9V O 혈청형(즉, O1A, O2, O4, O6A, O15, O16, O18A, O25B 또는 O75)에 의해 유발된 UTI와 함께, O 혈청형 분석이 가능해야 하며 UTI는 O1A, O2, O4, O6A, O15, O16, O18A, O25B 또는 O75 양성으로 확인되어야 한다. 임의의 ExPEC O 혈청형과 관련된 2차 종점의 경우, O 혈청형 분석을 사용할 수 없어야 한다. 배양 결과에 여러 병원체가 있고 대장균의 존재가 있는 증례는 2차 종점에 대해 고려되지 않는다. 이러한 증례는 민감도 분석에 포함된다.

탐색적 종점으로서, IED(대장균의 미생물학적 확인 제외) 또는 UTI의 위의 정의를 충족하지만 P. 애루기노사에 대해 양성인 샘플(UTI의 경우 소변)이 있는 참가자는 각각 P. 애루기노사로 인한 침습성 질환 또는 P. 애루기노사 UTI가 있는 것으로 보고된다. P. 애루기노사에 대해서는 혈청형 분석을 수행하지 않는다. P. 애루기노사의 존재가 있는 혼합 병원체를 가진 샘플은 이 탐색적 종점에 대해 고려되지 않는다.

ABP에 대한 탐색적 효능 종점으로서, ExPEC 혈청형 O1A, O2, O4, O6A, O15, O16, O18A, O25B 및 O75에 의해 유발된 사건이 보고된다.

참가자가 ABP의 징후 및 증상으로 의사 및/또는 연구 현장에 연락하는 경우, 아래 기준을 충족하는 경우 참가자가 증상이 있는 ABP가 있는 것으로 정의된다.

문서화된 농뇨(WBC 수 ≥10개 세포/mm³)와 열 및 다음의 급성 발병을 수반한, 소변 내 대장균 배양에 의한 미생물학적 확인(콜로니 형성 단위 ≥10⁵/mL)이 있는 성인:

· 자극성 배뇨 증상:

o 배뇨 장애,

o 빈뇨,

o 요절박, 또는

· 폐쇄성 배뇨 증상:

- 소변주저,

- 불완전 배뇨,

- 배뇨 힘주기,

- 약한 배뇨, 및

· 치골상부, 직장 또는 회음 통증.

당업자라면 광범위한 본 발명의 개념으로부터 벗어남이 없이, 상기에 기재된 구현예에 대한 변경이 이루어질 수 있음을 이해할 것이다. 따라서, 본 발명은 개시된 특정 구현예에 한정되지 않고, 본 설명에 의해 정의된 바와 같은 본 발명의 사상 및 범주 내에서의 변형을 포함하고자 함이 이해된다.

서열

서열번호 1 (글리코실화 공통 서열)

Asn-X-Ser(Thr), 여기서 X는 Pro을 제외한 임의의 아미노산일 수 있음

서열번호 2 (최적화된 글리코실화 공통 서열)

Asp(Glu)-X-Asn-Z-Ser(Thr), 여기서 X 및 Z는 Pro을 제외한 임의의 아미노산으로부터 독립적으로 선택됨

서열번호 3 (4개의 글리코실화 공통 서열을 포함하는 EPA 담체 단백질(EPA-4))

G SGGG DQNAT G SGGGKLAEEA FDLWNECAKA CVLDLKDGVR SSRMSVDPAI ADTNGQGVLH YSMVLEGGND ALKLAIDNAL SITSDGLTIR LEGGVEPNKP VRYSYTRQAR GSWSLNWLVP IGHEKPSNIK VFIHELNAGN QLSHMSPIYT IEMGDELLAK LARDATFFVR AHESNEMQPT LAISHAGVSV VMAQAQPRRE KRWSEWASGK VLCLLDPLDG VYNYLAQQRC NLDDTWEGKI YRVLAGNPAK HDLDIKDNNN STPTVISHRL HFPEGGSLAA LTAHQACHLP LEAFTRHRQP RGWEQLEQCG YPVQRLVALY LAARLSWNQV DQVIRNALAS PGSGGDLGEA IREQPEQARL ALTLAAAESE RFVRQGTGND EAGAASADVV SLTCPVAKDQ NRTKGECAGP ADSGDALLER NYPTGAEFLG DGGDVSFSTR GTQNWTVERL LQAHRQLEER GYVFVGYHGT FLEAAQSIVF GGVRARSQDL DAIWRGFYIA GDPALAYGYA QDQEPDARGR IRNGALLRVY VPRWSLPGFY RTGLTLAAPE AAGEVERLIG HPLPLRLDAI TGPEEEGGRV TILGWPLAER TVVIPSAIPT DPRNVGGDLD PSSIPDKEQA ISALPDYASQ PGKPPREDLK LGSGGG DQNA T

서열번호 4 (O4 GtrS 아미노산 서열)

MNNLIMNNWCKLSIFIIAFILLWLRRPDILTNAQFWAEDSVFWYKDAYENGFLSSLTTPRNGYFQTVSTFIVGLTALLNPDYAPFVSNFFGIMIRSVIIWFLFTERFNFLTLTTRIFLSIYFLCMPGLDEVHANITNAHWYLSLYVSMILIARNPSSKSWRFHDIFFILLSGLSGPFIIFILAASCFKFINNCKDHISVRSFINFYLRQPYALMIVCALIQGTSIILTFNGTRSSAPLGFSFDVISSIISSNIFLFTFVPWDIAKAGWDNLLLSYFLSVSILSCAAFVFVKGTWRMKVFATLPLLIIIFSMAKPQLTDSAPQLPTLINGQGSRYFVNIHIAIFSLLCVYLLECVRGKVATLFSKIYLTILLFVMGCLNFVITPLPNMNWREGATLINNAKTGDVISIQVLPPGLTLELRKK

서열번호 5 (예시적 O4 gtrS 핵산 서열)

ATGAATAATTTAATTATGAATAACTGGTGTAAATTATCTATATTTATTATTGCATTTATTTTGCTATGGCTTAGAAGGCCGGATATACTCACAAACGCACAATTTTGGGCAGAAGATTCCGTTTTCTGGTATAAGGACGCCTATGAGAACGGATTCTTAAGTTCACTAACAACGCCTAGGAATGGGTATTTCCAGACTGTTTCTACATTTATAGTTGGTCTGACTGCTTTATTAAATCCAGATTATGCACCTTTTGTTTCTAATTTTTTTGGCATAATGATTCGCTCAGTAATTATATGGTTTTTATTTACAGAAAGATTCAACTTCCTCACATTGACTACTAGGATTTTCTTATCTATTTATTTTCTATGCATGCCTGGATTGGATGAAGTTCATGCAAATATAACAAATGCACATTGGTATTTGTCATTATATGTATCAATGATCCTGATAGCTCGCAATCCAAGTTCAAAATCATGGAGGTTTCATGATATATTCTTTATCTTGCTATCCGGGCTCAGTGGCCCATTTATAATTTTCATTTTAGCAGCTTCATGCTTTAAATTTATAAATAATTGTAAAGATCATATTAGTGTAAGATCTTTCATAAATTTCTACTTGCGTCAGCCATACGCATTAATGATTGTTTGCGCTTTAATTCAAGGAACTTCTATAATTCTAACTTTCAATGGCACACGTTCCTCAGCACCGCTAGGATTCAGTTTTGATGTGATTTCGTCTATTATATCATCGAATATTTTTTTATTTACATTTGTCCCATGGGATATTGCAAAGGCTGGGTGGGATAATTTACTGTTATCTTATTTTTTGTCTGTTTCGATTTTGTCGTGTGCGGCCTTTGTTTTTGTTAAAGGTACGTGGCGAATGAAAGTATTTGCAACTTTACCATTGCTAATTATAATATTTTCAATGGCAAAACCACAATTGACAGACTCGGCACCTCAATTGCCAACACTTATTAATGGGCAAGGTTCAAGATACTTCGTAAATATACATATTGCGATATTCTCTTTGCTATGTGTTTACTTACTTGAGTGCGTCAGGGGGAAAGTGGCAACTTTATTTTCCAAAATATACTTAACAATTTTGCTATTCGTGATGGGATGTTTGAATTTTGTTATCACCCCACTCCCAAACATGAACTGGAGGGAAGGTGCTACTTTGATTAATAATGCAAAAACTGGTGATGTCATTTCGATTCAAGTGCTACCACCTGGCCTAACACTTGAACTAAGGAAAAAATAA

서열번호 6 (예시적 PglB 서열('야생형'))

MLKKEYLKNPYLVLFAMIILAYVFSVFCRFYWVWWASEFNEYFFNNQLMIISNDGYAFAEGARDMIAGFHQPNDLSYYGSSLSALTYWLYKITPFSFESIILYMSTFLSSLVVIPTILLANEYKRPLMGFVAALLASIANSYYNRTMSGYYDTDMLVIVLPMFILFFMVRMILKKDFFSLIALPLFIGIYLWWYPSSYTLNVALIGLFLIYTLIFHRKEKIFYIAVILSSLTLSNIAWFYQSAIIVILFALFALEQKRLNFMIIGILGSATLIFLILSGGVDPILYQLKFYIFRSDESANLTQGFMYFNVNQTIQEVENVDLSEFMRRISGSEIVFLFSLFGFVWLLRKHKSMIMALPILVLGFLALKGGLRFTIYSVPVMALGFGFLLSEFKAIMVKKYSQLTSNVCIVFATILTLAPVFIHIYNYKAPTVFSQNEASLLNQLKNIANREDYVVTWWDYGYPVRYYSDVKTLVDGGKHLGKDNFFPSFALSKDEQAAANMARLSVEYTEKSFYAPQNDILKTDILQAMMKDYNQSNVDLFLASLSKPDFKIDTPKTRDIYLYMPARMSLIFSTVASFSFINLDTGVLDKPFTFSTAYPLDVKNGEIYLSNGVVLSDDFRSFKIGDNVVSVNSIVEINSIKQGEYKITPIDDKAQFYIFYLKDSAIPYAQFILMDKTMFNSAYVQMFFLGNYDKNLFDLVINSRDAKVFKLKI

서열번호 7 (예시적 gtrA 아미노산 서열; 대장균 W3110 yfdG, GenBank: BAA16209.1)

MLKLFAKYTSIGVLNTLIHWVVFGVCIYVAHTNQALANFAGFVVAVSFSFFANAKFTFKASTTTMRYMLYVGFMGTLSATVGWAADRCALPPMITLVTFSAISLVCGFVYSKFIVFRDAK

서열번호 8 (예시적 gtrB 아미노산 서열 - 대장균 W3110 yfdH, GenBank: BAA16210.1)

MKISLVVPVFNEEEAIPIFYKTVREFEELKSYEVEIVFINDGSKDATESIINALAVSDPLVVPLSFTRNFGKEPALFAGLDHATGDAIIPIDVDLQDPIEVIPHLIEKWQAGADMVLAKRSDRSTDGRLKRKTAEWFYKLHNKISNPKIEENVGDFRLMSRDVVENIKLMPERNLFMKGILSWVGGKTDIVEYVRAERIAGDTKFNGWKLWNLALEGITSFSTFPLRIWTYIGLVVASVAFIYGAWMILDTIIFGNAVRGYPSLLVSILFLGGIQMIGIGVLGEYIGRTYIETKKRPKYIIKRVKK

서열번호 9 (예시적 O4 rfb 유전자좌 뉴클레오티드 서열 - O4-EPA 생산 균주 BVEC-L-00684f)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGTGAAAATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCAGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCGGGAATCACTTGCTGATGTTTCTGATTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCACCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCCGCTCGCAATTACTGGTCTGCTCTTGATAGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTATATGGTGATTTGCCTCATCCTGACGAGGTAAATAATACAGAAGAATTACCCTTATTTACTGAGACAACAGCTTACGCGCCAAGCAGCCCTTATTCCGCATCCAAAGCATCCAGCGATCATTTAGTCCGCGCGTGGAAACGTACCTATGGTTTACCGACCATTGTGACTAATTGCTCTAACAATTATGGTCCTTATCATTTCCCGGAAAAATTGATTCCATTGGTTATTCTCAATGCTCTGGAAGGTAAAGCATTACCTATTTATGGTAAAGGGGATCAAATTCGCGACTGGCTGTATGTTGAAGATCATGCGCGTGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGTGAAACTTATAACATTGGTGGGCACAACGAAAAGAAAAACATAGATGTAGTGCTCACTATTTGTGATTTGCTGGATGAGATTGTACCGAAAGAGAAATCTTATCGTGAGCAAATCACTTATGTTGCCGATCGTCCGGGACACGATCGCCGTTATGCGATTGATGCTGAGAATATTGGTCGCGAATTGGGATGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGGAAGACAGTGGAATGGTATCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAAGAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTCTGGGTAACTTGATTGCTCTTGATGTTCATTCCACTGATTATTGTGGCGATTTCAGTAACCCCGAAGGTGTGGCTGAAACCGTCAAAAAAATTCGCCCAGATGTTATTGTTAATGCTGCTGCTCATACCGCGGTAGATAAGGCTGAGTCAGAACCAGAATTTGCACAATTACTCAATGCGACCAGCGTTGAAGCAATTGCAAAAGCGGCTAATGAAGTTGGGGCTTGGGTAATTCATTACTCAACTGACTACGTCTTCCCTGGAAATGGCGACATGCCATGGCTCGAGACTGATGTAACCGCTCCGCTCAATGTTTATGGCAAAACCAAATTGGCTGGAGAAAGAGCATTACAAGAACATTGCGCAAAGCATCTTATTTTCCGTACCAGCTGGGTATATGCAGGTAAAGGAAATAACTTTGCCAAAACAATGTTACGTCTGGCAAAAGAGCGCGAAGAACTGGCTGTGATAAACGATCAGTTTGGCGCACCAACAGGTGCTGAATTGCTGGCTGATTGCACCGCTCATGCCATTCGCGTGGCATTAAAAAAACCAGAAGTTGCTGGCTTGTACCATCTGGTAGCAAATGGCACAACAACCTGGCACGATTACGCCGCGCTAGTATTCGAAGAAGCCCGTAAAGCAGGGATTGACCTTGCACTTAACAAACTCAACGCCGTACCAACAACGGCTTATCCTACTCCAGCCCGCCGTCCTCATAATTCTCGCCTCAATACCGAAAAGTTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTGGGCGTGAAACGTATGCTCAACGAATTATTTACGACTACGGCAATTTAACAAATTTTTGCATCTCGCTCATGATGCCAGAGCGGGATGAATTAAAAGGAATGGTGAAATGAAAACGCGTAAAGGTATTATTCTGGCTGGTGGTTCCGGCACTCGTCTTTATCCTGTGACGATGGCAGTGAGTAAACAACTGCTGCCGATTTATGATAAGCCGATGATTTATTATCCGCTTTCAACGCTTATGTTAGCGGGTATTCGCGATATTCTTATTATCAGTACGCCACAGGATACACCGCGTTTCCAACAATTGTTGGGGGACGGGAGTCAGTGGGGGCTTAATCTACAGTATAAAGTACAACCGAGTCCGGATGGCCTGGCGCAAGCGTTTATTATTGGTGAAGACTTTATTGGTGGTGATGATTGTGCACTCGTACTTGGCGATAATATCTTCTATGGACACGACTTGCCGAAATTAATGGAAGCTGCTGTTAACAAAGAAATCGGTGCAACGGTATTTGCTTATCACGTCAATGATCCTGAACGTTATGGTGTCGTGGAGTTTGATAATAACGGTACTGCAATTAGCCTGGAAGAAAAACCGCTGGAACCAAAAAGTAACTATGCGGTTACTGGGCTTTATTTCTATGACAATGATGTTGTAGAAATGGCGAAAAACCTTAAGCCTTCTGCCCGTGGCGAACTGGAAATTACCGATATTAACCGTATTTATATGGAGCAGGGACGTTTGTCTGTCGCTATGATGGGGCGTGGTTATGCCTGGTTGGATACTGGTACACATCAAAGTCTTATTGAAGCAAGTAACTTCATTGCCACCATTGAAGAGCGTCAGGGATTAAAGGTATCTTGCCCGGAAGAGATTGCTTACCGTAAAGGGTTTATTGATGCTGAGCAGGTGAAAGTATTAGCCGAACCGCTGAAGAAAAATGATTATGGTCAGTATCTGCTAAAAATGATTAAAGGTTATTAATAAAATGAACGTAATTAAAACTGAAATTCCTGATGTGCTGATTTTTGAACCAAAAGTTTTTGGTGATGAACGTGGCTTCTTTTTTGAGAGTTTTAACCAGAAAGTATTTGAAGAAGCTGTAGGACGGAAGGTTGAATTTGTTCAGGATAACCATTCTAAGTCTAAAATAAATGTATTGCGTGGGATGCATTATCAAACACAAAATACTCAAGGAAAACTGGTTCGGGTAATTTCTGGTTCAGTATATGATGTTGCCGTAGATTTAAGAGAAAAATCAAAGACATTTGGCAAATGGGTGGGTGTAGAATTATCTGGGAATAATAAAAGACAATTGTGGATCCCCGAAGGTTTTGCCCATGGTTTTTATGTGTTGGAGGAGAATACCGAATTTGTTTATAAATGTACCGATACTTATAACCCTGCTCATGAACACACATTGCTATGGAATGATCCAACTATCAATATAAGTTGGCCAATCATACAAAACTGCAAGCCAATTATTTCTGAAAAAGATGCTAATGGACATCTTTTTTCACATAAAACCTATTTCTGAAATGCAATATTATGAGTTTAATTAGAAACAGTTTCTATAATATTGCTGGTTTTGCTGTGCCGACATTAGTTGCAGTCCCTGCTTTGGGGATTCTTGCCAGGCTGCTTGGACCGGAGAATTTTGGACTTTTCACACTAGCATTCGCTTTGATAGGATATGCAAGTATTTTCGACGCCGGGATTAGTCGAGCTGTAATCAGAGAAATCGCTCTTTATCGAGAAAGTGAAAAAGAGCAAATACAAATTATTTCGACAGCAAGTGTAATCGTACTATTCTTAGGGGTGGTTGCAGCTTTGTTACTTTATTTTAGTAGTAATAAAGTTGTTGAGTTATTGAATGTTAGTTCCGTTTATATTGAAACAGCAGTGCGTGCATTCTCTGTTATTTCATTTATAATACCTGTGTATCTGATTAACCAGATTTGGCTTGGTTATCTGGAAGGGCTAGAAAAATTTGCAAATATAAATGTTCAGAGAATGATTTCTAGCACAAGCTTGGCTATATTACCAGTGATATTTTGTTATTACAATCCCTCGTTGCTTTATGCTATGTATGGGTTGGTGGTTGGGCGTGTGATTTCATTTTTGATTAGCGCAATAATTTGTCGAGATATTATTCTTAAAAGTAAACTTTACTTTAATGTGGCAACTTGCAATCGTCTTATCTCTTTTGGTGGATGGATAACAGTTAGTAATATCATAAGCCCAATCATGGCATATTTCGACCGCTTTATCATCTCTCATATTATGGGGGCTTCGAGAATTGCATTTTATACAGCGCCCTCAGAGGGTGTATCAAGGTTAATTAATATCCCATATGCTTTGGCAAGAGCTCTATTTCCTAAATTGGCATATAGCAATAATGATGATGAACGAAAAAAATTACAACTACAGAGCTACGCAATTATAAGCATTGTATGTCTACCCATAGTTGTTATTGGTGTCATTTTTGCCTCATTCATAATGACAACATGGATGGGACCTGATTATGCCTTAGAAGCAGCAACTATCATGAAAATACTTCTTGCTGGTTTTTTCTTTAACTCTTTAGCGCAAATACCTTATGCATACTTGCAATCTATCGGAAAGTCAAAAATTACCGCATTTGTGCATCTCATAGAACTTGCGCCATACTTATTATTATTGTATTACTTCACAATGCATTTCGGCATAATTGGCACGGCAATCGCTTGGTCACTTAGAACATTTTGTGATTTTGTTATACTACTTTCGATATCGAGAAGAAAATGATTGCGGTTGATATTGCGCTTGCAACCTACAATGGTGCTAATTTTATTCGGCAACAGATTGAATCTATCCAGAAACAAACTTATAGAAATTGGCGTCTTATAATAAGTGATGATAACTCGAGTGATGATACTGTTGATATTATTAAGGATATGATGTCTAACGACAGTCGTATCTATTTGGTAGGAAATAAAAGACAAGGAGGGGTTATTCAGAACTTTAATTATGCTCTTTCACAAACTACATCTGAAATTGTGTTACTATGTGACCAGGATGACATTTGGCCGGAGGAGCGTCTGGAAATTCTTATAGATAAATTTAAGGCCTTGCAGCGTAATGATTTTGTTCCGGCAATGATGTTTACTGATTTGAAATTAGTAGACGAAAATAATTGTTTGATTGCAGAAAGTTTTTATCGAACGAATAATATTAATCCACAAGATAATCTGAAAAATAATAATCTTCTCTGGCGTTCAACGGTATATGGCTGTACTTGCATCATGAATAAGAAACTTGTTGATATTGCATTGCCTATACCTACATATGCACATATGCATGATCAATGGTTGGCATTATTAGCGAAGCAATATGGTAACATTTTTTATTTCGACTATGCGTCTGTTCGTTATAGGCAACATTCTACAAATGTTGTTGGTGGTAGAAATAAAACGCCATTTCAAAAATTTAATTCCATACAAAAAAACCTAAAAAGGATTAATTTGCTAGTGGATAGAACTGTTGCTTTAATTAAATCAAATAACGATTTCTATCCAGGGAATAAAATGGAAAATAAAATTGATTACTTAAAATTTGGAGTGAATGAAGTATTACCTTATCTTTTTAAAGGAAACAAGAAAGTTTTTTCACTTTGTGTATTAATTAGTTTGGCATTACAAAAATGATATATTTATTATTTTTTTTTGCACTGTTTATGATCTGTACGTTTTTAACACACAGGCGACAGGCATTATATGTTGTATCTGCGTTAGTATTTCTTTTTTTGGCTTTAACCTATCCATCAGGAGGGGACTGGATAGGTTATTTTCTCCATTATGACTGCATGGTTAATGAGCAGTGTAATAATGGTTTTATAATGTTTGAACCTGGATATGAATTAATTGTTTCCTTATTTGGATATTTGGGATTTCAGACAATTATTATTTTTATAGCCGCTGTAAATGTAATTCTAATATTAAATTTTGCAAAGCATTTTGAAAACGGAAGTTTTGTTATTGTTGCGATAATGTGCATGTTCCTTTGGAGTGTTTATGTTGAGGCGATTAGACAGGCTCTGGCCTTATCTATAGTTATATTTGGGATTCATTCTCTTTTTTTGGGTAGAAAAAGGAAATTTATAACATTAGTATTATTTGCGTCAACTTTCCATATAACTGCTTTGATTTGTTTTCTTCTAATGACTCCTCTATTTTCAAAGAAATTAAGCAAGATAATAAGTTATAGCCTATTAATTTTCAGTAGCTTCTTTTTCGCTTTTTCTGAAACCATATTAAGTGCACTCCTTGCAATTTTGCCAGAAGGATCCATTGCCAGTGAAAAATTAAGTTTTTACTTAGCAACCGAGCAATACAGGCCACAGTTATCTATTGGGAGTGGCACTATTCTTGACATTATACTTATTTTTCTGATATGTGTAAGTTTTAAACGAATAAAGAAATATATGCTCGCTAATTATAATGCTGCAAATGAGATATTGCTTATTGGTTGCTGTCTTTATATTTCTTTCGGTATTTTTATCGGGAAAATGATGCCAGTTATGACTCGCATTGGTTGGTATGGTTTTCCATTTGTTATAGTACTTCTTTATATTAACTTGGGTTATTCAGAATATTTTAAGAGGTATATAAATAAAAGAGGGTGTGGGTATAGCAAATTATTAATTGCTTTTTATTTTTTGCTACAAATTTTGCGACCATTAACATATGATTATAGCTATTATAATATAATGCACCAGGATACTTTGCTGAATAGGTTTGATGCATTAGATGATGCATCATTAAGACAATCAGCGAAGAGAAAATGTTTCGATTTGGGAAAGATAGGATATGGTTTCTTATGTAGTATATAATATCCTGCATTCATTCGGATAATTTCCTATGGAAGTGTCCTTTGCTCTGTCTGTCCTCATTTGTTGAAATTTTATGTTAATAAGAAGCTTTAGATAACCACTTAGGAACTGTATGTTTGATCTGTCCAAAAATTATATTATTGTAAGTGCGACGGCGCTGGCTTCCGGAGGTGCATTAACTATATTAAAGCAATTTATAAAACATGCATCACAAAATTCAAATGACTATATTATGTTTGTATCTGCGGGATTGGAGTTGCCGGTCTGTGATAACATCATTTACATAGAAAACACACCAAAAGGATGGTTGAAAAGAATATATTGGGATTGGTTCGGTTGTCGGAAGTTTATCTCGGAACATAAGATTAACGTTAAGAAAGTAATTTCTCTACAAAATTCCAGTTTGAATGTTCCTTACGAACAGATTATTTACTTGCACCAGCCAATTCCTTTTAGTAAAGTTGATTCTTTTTTAAAAAATATCACATCCGATAACGTAAAGCTTTTTTTATATAAAAAGTTTTATTCCTATTTTATATTTAAATATGTGAATGCCAATACAACCATCGTAGTGCAAACGAATTGGATGAAAAAAGGAGTGCTGGAGCAATGTGATAAAATTAGTACCGAAAGGGTCCTTGTTATAAAACCTGATATCAAAGCATTTAATAATACTAATTTTGATGTAGATATGGATGTATCTGCAAAAACACTCTTATATCCAGCGACACCACTTACCTATAAAAATCATTTGGTCATTCTGAAGGCGTTGGTTATTTTAAAGAAAAAGTATTTTATAGATGATCTGAAATTCCAAGTGACTTTTGAAAAGAATAGGTACAAAAATTTTGATAAGTTTGTGCAATTAAATAACTTAAGCAAAAACGTTGATTATCTCGGCGTTCTTTCATACTCGAACTTGCAAAAAAAATATATGGCGGCATCTTTAATCGTTTTTCCTAGCTATATCGAATCATATGGGTTACCACTCATCGAAGCTGCTAGTTTAGGAAAAAAAATCATTAGTAGTGATCTTCCTTATGCCCGGGATGTTTTAAAGGATTATAGCGGCGTAGATTTTGTAATTTACAATAATGAAGATGGCTGGGCTAAGGCGTTGTTTAATGTTTTAAATGGCAATTCGAAGCTCAATTTTAGGCCTTATGAAAAAGATAGTCGTTCATCTTGGCCACAGTTCTTCTCTATTTTGAAATAAGGTGTATTATGTTTAATGGTAAAATATTGTTAATTACTGGTGGTACGGGGTCTTTCGGTAATGCTGTTCTAAGACGTTTTCTTGACACTGATATCAAAGAAATACGTATTTTTTCCCGGGATGAAAAAAAACAAGATGACATGAGGAAAAAATATAATAATCCGAAACTTAAGTTCTATATAGGTGATGTTCGCGACTATTCGAGTATCCTCAATGCTTCTCGAGGTGTTGATTTTATTTATCATGCTGCAGCTCTGAAGCAAGTACCTTCCTGCGAATTCCACCCAATGGAAGCTGTAAAAACGAATGTTTTAGGTACGGAAAACGTACTGGAAGCGGCAATAGCTAATGGAGTTAGGCGAATTGTATGTTTGAGTACAGATAAAGCTGTATATCCTATCAATGCAATGGGTATTTCCAAAGCGATGATGGAAAAAGTAATGGTAGCAAAATCGCGCAATGTTGACTGCTCTAAAACGGTTATTTGCGGTACACGTTATGGCAATGTAATGGCATCTCGTGGTTCAGTTATCCCATTATTTGTCGATCTGATTAAATCAGGTAGACCAATGACGATAACAGACCCTAATATGACTCGTTTCATGATGACTCTCGAAGACGCTGTTGATTTGGTTCTTTACGCATTTGAACATGGCAATAATGGTGATATTTTTGTCCAAAAGGCACCTGCGGCTACCATCGAAACGTTGGCTATTGCACTCAAAGAATTACTTAATGTAAACCAACACCCTGTAAATATAATCGGCACCCGACACGGGGAAAAACTGTACGAAGCGTTATTGAGCCGAGAGGAAATGATTGCAGCGGAGGATATGGGTGATTATTATCGTGTTCCACCAGATCTCCGCGATTTGAACTATGGAAAATATGTGGAACATGGTGACCGTCGTATCTCGGAAGTGGAAGATTATAACTCTCATAATACTGATAGGTTAGATGTTGAGGGAATGAAAAAATTACTGCTAAAACTTCCTTTTATCCGGGCACTTCGGTCTGGTGAAGATTATGAGTTGGATTCATAATATGAAAATTTTAGTTACTGGCGCTGCAGGGTTTATCGGTCGAAATTTGGTATTCCGGCTTAAGGAAGCTGGATATAACGAACTCATTACGATAGATCGTAACTCTTCTTTGGCGGATTTAGAGCAGGGACTTAAGCAGGCAGATTTTATTTTTCACCTTGCTGGGGTAAATCGTCCCGTGAAGGAGTGTGAATTTGAAGAGGGAAATAGTAATCTAACTCAACAGATTGTTGATATCCTGAAAAAAAACAATAAAAATACTCCTATCATGCTGAGTTCTTCCATCCAGGCTGAATGTGATAACGCTTATGGAAAGAGTAAAGCAGCTGCGGAAAAAATCATTCAGCAGTATGGGGAAACGACAAACGCTAAATATTATATTTATCGCTTGCCGAATGTATTCGGTAAGTGGTGTCGACCAAATTATAACTCCTTTATAGCAACTTTCTGCCATCGCATTGCAAATGATGAAGCTATTACAATTAATGATCCTTCAGCAGTTGTAAATCTGGTGTATATAGATGACTTTTGTTCTGACATATTAAAGCTATTAGAAGGAGCGAACGAAACTGGTTACAGGACATTTGGTCCAATTTATTCTGTTACTGTTGGTGAAGTGGCACAATTAATTTACCGGTTTAAAGAAAGTCGCCAAACATTAATCACCGAAGATGTAGGTAATGGATTTACACGTGCATTGTACTCAACATGGTTAAGTTACCTGTCTCCTGAACAGTTTGCGTATACGGTTCCTTCTTATAGTGATGACAGAGGGGTATTCTGTGAAGTATTGAAAACGAAAAACGCGGGCCAGTTTTCGTTCTTTACTGCGCATCCAGGAATTACTCGGGGTGGTCATTATCATCATTCCAAAAATGAGAAATTTATTGTCATCCGAGGAAGTGCTTGTTTCAAATTTGAAAATATTGTCACGAGTGAACGATATGAACTTAATGTTTCCTCTGATGATTTTAAAATTGTTGAAACAGTTCCGGGATGGACGCATAACATTACTAATAATGGCTCGGATGAGCTAGTTGTTATGCTTTGGGCAAATGAAATATTTAATCGTTCTGAACCAGATACTATAGCGAGAGTTTTATCGTGAAAAAATTGAAAGTCATGTCGGTTGTTGGGACTCGTCCAGAAATTATTCGACTCTCGCGTGTCCTTGCAAAATTAGATGAATATTGTGACCACCTTATTGTTCATACCGGGCAAAACTACGATTATGAACTGAATGAAGTTTTTTTCAAAGATTTGGGTGTTCGCAAACCTGATTATTTTCTTAATGCCGCAGGTAAAAATGCAGCAGAGACTATTGGACAAGTTATCATTAAAGTTGATGAGGTCCTTGAACAGGAAAAACCAGAAGCCATGTTAGTACTTGGCGATACTAACTCCTGTATTTCAGCAATACCAGCAAAGCGTCGAAGAATTCCGATCTTCCATATGGAGGCTGGGAATCGTTGTTTTGACCAACGCGTACCGGAAGAAACTAACAGAAAAATAGTTGATCATACCGCTGATATCAATATGACATATAGTGATATCGCGCGTGAATATCTTCTGGCTGAAGGTGTACCAGCCGATAGAATTATTAAAACCGGTAGCCCAATGTTTGAAGTACTCACTCATTATATGCCGCAGATTGATGGTTCCGATGTACTTTCTCGCCTGAATTTAACACCTGGGAATTTCTTTGTGGTAAGTGCCCACAGAGAAGAAAATGTTGATACCCCTAAACAACTTGTGAAACTGGCGAATATACTTAATACCGTGGCTGAAAAATATGATGTCCCGGTAGTTGTTTCTACTCATCCTCGCACTCGTAACCGCATCAACGAAAACGGTATTCAATTCCATAAAAATATCTTGCTTCTTAAGCCATTAGGATTTCACGATTACAACCATCTGCAAAAAAATGCACGTGCTGTTTTATCGGATAGTGGGACTATTACAGAAGAGTCCTCCATTATGAACTTCCCTGCACTCAATATACGAGAAGCGCACGAACGCCCGGAAGGCTTCGAAGAAGGGGCAGTAATGATGGTCGGTCTTGAATCTGATCGCGTTTTACAGGCATTAGAAATTATTGCAACACAGCCTCGTGGAGAAGTACGCTTACTTCGTCAGGTTAGTGACTATAGCATGCCAAATGTTTCAGATAAAGTTCTGCGTATTATCCATTCATATACTGACTACGTTAAACGGGTTGTCTGGAAGCAATACTAATGAAACTTGCATTAATCATTGATGATTATTTGCCCCATAGCACACGCGTTGGGGCTAAAATGTTTCATGAGTTAGGCCTTGAATTACTGAGCAGAGGCCATGATGTAACTGTAATTACGCCTGACATCTCATTACAAGCAATTTATTCTATTAGTATGATTGATGGTATAAAGGTTTGGCGTTTCAAAAGTGGACCTTTAAAGGATGTAGGTAAGGCTAAACGTGCCATAAATGAAACTCTTTTATCTTTTCGCGCATGGCGCGCATTTAAGCACCTCATTCAACATGATACATTTGATGGTATCGTTTATTATTCCCCCTCTATTTTTTGGGGCGACTTGGTTAAAAAAATAAAACAACGATGCCAGTGCCCAAGCTATCTGATCCTAAGGGATATGTTTCCACAGTGGGTCATTGATGCAGGTATGTTGAAAGCCGGTTCACCAATTGAAAAATATTTTAGGTATTTTGAAAAAAAGTCATATCAGCAGGCTGGCCGGATAGGGGTAATGTCTGATAAGAATCTTGAGATATTTCGCCAGACCAATAAAGGTTATCCGTGTGAAGTTTTACGTAATTGGGCCTCAATGACTCCTGTGTCTGCCAGCGATGATTATCATTCACTTCGTCAAAAATACGATCTAAAAGATAAAGTCATTTTTTTCTATGGCGGTAATATTGGGCATGCTCAGGATATGGCAAACTTAATGCGCCTTGCGCGTAATATGATGCGTTATCATGATGCTCATTTCCTGTTTATAGGGCAGGGTGATGAAGTTGAGCTGATAAAATCTCTTGCTGCAGAATGGAATTTAACTAATTTCACTCATCTACCTTCAGTGAACCAGGAAGAGTTTAAATTAATTTTATCTGAAGTTGATGTCGGCCTGTTCTCCCTTTCATCTCGCCATTCTTCACATAATTTCCCCGGAAAATTACTAGGGTATATGGTTCAATCAATCCCGATCCTTGGGAGTGTGAATGGCGGCAATGATTTAATGGATGTAATTAATAAGCACAGAGCCGGTTTCATTCATGTTAATGGTGAAGATGATAAACTGTTTGAATCTGCACAATTGCTTCTTAGTGATTCAGTTTTAAGAAAACAGCTAGGTCAGAACGCTAATGTGTTGTTAAAGTCTCAATTTTCGGTTGAATCGGCGGCACATACTATCGAAGTCCGACTGGAGGCTGGAGAATGCGTTTAGTTGATGACAATATTCTGGATGAACTTTTTCGCACTGCAGCAAATTCTGAACGTTTGCGCGCTCATTATTTATTGCACGCATCTCATCAGGAGAAGGTTCAACGTTTACTTATTGCATTTGTACGCGACAGCTATGTTGAACCCCATTGGCATGAGTTACCGCATCAGTGGGAAATGTTTGTCGTCATGCAAGGGCAATTAGAAGTTTGTTTGTATGAGCAAAATGGTGAGATCCAAAAACAGTTTGTTGTTGGAGACGGTACGGGAATAAGCGTCGTGGAATTTTCCCCAGGAGATATACATAGTGTCAAATGCCTGTCACCAAAAGCCCTTATGTTGGAGATAAAGGAGGGGCCATTTGACCCACTCAAAGCTAAGGCTTTTTCTAAGTGGTTATAGGGCGATACACCACCGTTTATTCTTCTATCTTATTCTATACATGCTGGGTTACCATCTTAGCTTCTTCAAGCCGCGCAACCCCGCGGTGACCACCCCTGACAGGAGTAGCTAGCATTTGACCACCCCTGACAGGATTAGCTAGCATATGAGCTCGAGGATATCTACTGTGGGTACCCGGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATAT

서열번호 10 (EPA 담체 단백질에 대한 예시적 신호 서열)

MKKIWLALAG LVLAFSASA

서열번호 11 (예시적 O1A rfb 유전자좌 뉴클레오티드 서열 - O1A-EPA 생산 균주 stGVXN4411 및 stLMTB10217)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCGTGAAGATACTTGTTACTAGGGGCGCAGGATTTATTGGTTCTGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCTGGAATCACTTGCTGATGTTTCTGACTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCTGCTGCAATGGCGCGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTGGATCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCGGCTCGCAATTACTGGTCTGCTCTTGATGGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTCTATGGTGATTTGCCTCATCCTGACGAAGTAAATAATAAAGAACAATTACCCCTCTTTACTGAGACGACAGCTTACGCGCCTAGTAGTCCTTATTCCGCATCAAAAGCATCCAGCGATCATTTAGTCCGCGCGTGGAAACGTACCTATGGTTTACCGACTATTGTGACTAACTGTTCGAATAACTACGGTCCTTATCACTTTCCGGAAAAATTGATTCCACTAGTAATTCTTAATGCTCTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGGGATCAAATTCGTGACTGGCTGTATGTTGAAGATCATGCGCGTGCGTTATATACCGTAGTTACTGAAGGTCAAGCGGGTGAAACCTATAACATTGGCGGACACAACGAAAAGAAAAACATCGATGTTGTGCTGACTATTTGTGATTTGTTGGACGAGATAGTCCCGAAAGAGAAATCTTATCGTGAGCAAATTACTTATGTTGCTGATCGCCCAGGGCATGATCGCCGTTATGCGATTGATGCTGAGAAGATTGGTCGCGAATTGGGATGGAAACCACAGGAAACGTTTGAGAGTGGGATTCGTAAAACGGTGGAATGGTATTTGGCTAATGCAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTCTGGGTAATTTGATTGCTCTTGATGTTCACTCCACTGATTACTGTGGTGATTTTAGTAACCCTGAAGGTGTGGCTGAAACAGTCAAAAGAATTCGACCTGATGTTATTGTTAATGCTGCGGCTCACACCGCAGTAGATAAGGCTGAGTCAGAACCCGAATTTGCACAATTACTCAATGCGACTAGCGTTGAATCAATTGCAAAAGCGGCAAATGAAGTTGGGGCTTGGGTAATTCATTACTCAACTGACTACGTATTCCCTGGAAATGGCGACACGCCATGGCTGGAGATGGATGCAACCGCACCGCTAAATGTTTACGGTGAAACCAAGTTAGCTGGAGAAAAAGCATTACAAGAGCATTGTGCGAAGCACCTAATTTTCCGTACCAGCTGGGTCTATGCAGGTAAAGGAAATAATTTCGCCAAAACGATGTTGCGTCTGGCAAAAGAGCGTGAAGAACTAGCCGTTATTAATGATCAGTTTGGTGCGCCAACAGGTGCTGAACTGCTGGCTGATTGTACGGCACATGCCATTCGTGTCGCACTGAATAAACCGGATGTCGCAGGCTTGTACCATTTGGTAGCCAGTGGTACCACAACCTGGTACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAATGCAGGCATTCCTCTTGCACTCAACAAGCTCAACGCAGTACCAACAACTGCCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAATTTTGCGCTTGTATTGCCTGACTGGCAGGTTGGTGTGAAACGCATGCTCAACGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTGATGGTGGAGCAAGATGAATTAAAAGGAATGATGAAATGAAAACGCGTAAAGGTATTATTTTAGCGGGTGGTTCTGGTACTCGTCTTTATCCTGTGACTATGGTCGTCAGTAAACAGCTATTACCTATATATGATAAACCGATGATCTATTATCCGCTTTCTACACTGATGTTAGCGGGTATTCGCGATATTCTGATTATTAGTACGCCACAGGATACTCCTCGTTTTCAACAACTGCTGGGTGACGGTAGCCAGTGGGGCCTGAATCTTCAGTACAAAGTGCAACCGAGTCCGGATGGTCTTGCGCAGGCATTTATTATCGGTGAAGAGTTTATTGGTGGTGATGATTGTGCTTTGGTACTTGGTGATAATATCTTCTACGGTCACGACCTGCCTAAGTTAATGGATGCCGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCTGAACGCTATGGTGTCGTTGAGTTTGATAAAAACGGTACGGCGATCAGCCTGGAAGAAAAACCGCTACAACCAAAAAGTAATTATGCGGTAACCGGGCTTTATTTTTATGATAACGACGTTGTCGAAATGGCGAAAAATCTTAAGCCTTCTGCCCGCGGTGAACTGGAAATTACCGATATTAACCGTATCTATATGGAACAAGGGCGTTTATCTGTTGCCATGATGGGGCGTGGTTATGCGTGGTTAGACACGGGGACACATCAGAGCCTGATTGAGGCAAGCAACTTTATTGCAACAATTGAAGAGCGTCAGGGGCTGAAAGTTTCCTGCCCGGAAGAAATTGCTTACCGTAAAGGGTTTGTTGATGCTGAGCAGGTGAAAGTATTAGCTGAACCTCTGAAAAAAAATGCTTATGGTCAGTATCTGCTGAAAATGATTAAAGGTTATTAATAAAATGAACGTAATTAAAACAGAAATTCCTGATGTACTGATTTTTGAACCGAAAGTTTTTGGTGATGAGCGTGGTTTCTTTTTTGAGAGCTTTAACCAGAAGGTTTTTGAGGAAGCTGTAGGCCGCAAAGTTGAATTTGTTCAGGATAACCATTCGAAGTCTAGTAAAGGTGTTTTACGCGGGCTGCATTATCAGTTGGAACCTTATGCACAAGGAAAATTGGTGCGTTGCGTTGTCGGTGAAGTTTTTGACGTAGCTGTTGATATTCGTAAATCGTCATCGACTTTTGGCAAATGGGTTGGGGTGAATTTATCTGCTGAGAATAAGCGGCAATTGTGGATTCCTGAGGGATTTGCACATGGTTTTTTAGTGCTGAGTGAGACGGCGGAGTTTTTGTATAAGACGACAAATTATTATCATCCTCAGAGTGATAGAGGAATAAAATGGGATGATCCAAGCATCAATATTTCATGGCCAGTCGATTCACAAGTGCTGCTATCAGCTAAAGATAATAAGCATCCTCCATTAACAAAGATTGAAATGTATAGTTAAGATCACGATAAATCTTGGAAGGGTTGCAAAATTGAATAAAATAGTGAGCAAAAGTGAAATAAGGAACGTAATCCACAATGCTGGCTATATGATGATTACTCAGATAGCTTTATATGTTGCACCATTATTTATACTGAGTTATCTGTTAAAAACACTGGGGGTTGCACAGTTTGGTAATTATGCCTTAATACTATCAATCGTTGCATATTTACAGATTATAACGGATTATGGTTTTTCTTTTAGTGCAAGTCGTGCGATCTCACAGAATAGAGAGGACAAAGAATATATATCAAAAATTTATCTGTCAACTATGACTATCAAGTTGGCGATATGCGCTTTCTTATTCTTATTGCTCATGCTATTTTTAAATCTTTTGCCTGTGCAAGCTGAATTAAAACAAGGAATATTATATGGATATCTTCTTGTAATAGGAAATACTTTCCAACCACAATGGTTTTTCCAAGGTATCGAAAAATTAAAAATCATAGCCCTTTCTAATGTTATATCAAGATGCGCCGCGTGTTTACTTGTATTTATCTATGTGAGGAATAGCGAGGATTTACAAAAAGCACTTTTAGTACAGTCACTTCCATTAGTAATTTCTGCGATTGGATTAAATATATTTATATTGAAATATATCAATATTATTTTTCCGGAAAAAAAATTATTTAAGGTAATTTTAAAAGAAGGTAAGGATTTTTTTCTTGCATCACTTTATTCTGTTATTCTCAATAATAGTGGCATTTTTCTATTAGGGATTTTTACTAATCCTGTTATTGTTGGTGTATATGCCGCCGCTGAAAAGATAGTCAAGGCCGTATTGTCGCTATTTACACCACTGACGCAAGCTATATATCCTTATAATTGTCGTAAGTTTTCACTATCCGTATTTGACGGCATTGAGGCAGCAAAAAAAACTGGTATACCAATTATAATTTTAGCATTTATAGCTGCTGTTATCGTTGCAATTACCTTACCTGTTGCAATCGACTATCTTAATTTTCCAAAAGAAACAATTTTTGTAGGTCAAATATTAAGTGCATGGATCTTTTTTGGTGTTCTTAATAATGTATTCGGCATTCAGATATTGAGTGCATCAGGAAGAAGTAAAATATATAGTAGGATGGTATTCGTATCAGCGCTTATAACATTACTTTTGATTACTCTATTATTGCAGTTTTGTAACGCCACTGGAGTGGCATGTGCAATATTATTGGGTGAAATGTTCTTATCAATATTGTTACTTAAGCGATATAAAAAAATAATTTAAGGAATAGTTATGAAGAAGTTATTATTAGTGTTCGGTACTAGGCCTGAAGCAATAAAGATGGCCTCTATCATTGAATTATTAAAAAAAGATTGTAGATTCGAATATAAAATATGTGTGACAGGCCAACATAAAGAGATGCTTGATCAAGTTATGCAAGTATTTGATGTTAAACCTGATTATAATTTACGGATTATGCAGCCTGGGCAAACATTAGTATCTATAGCAACAAATATACTCTCACGGTTAAGTGAAGTTTTAATTATAGAAAAGCCAGATATTATACTTGTGCATGGGGATACAACGACTACCCTTGCTGCTACTTTAGCTGGGTATTACCACCAAATAAAAGTTTGTCATGTGGAAGCAGGATTAAGAACAGGGGATATTTACTCTCCTTGGCCTGAAGAGGGCAATCGTAAAGTTACAGGGGCATTAGCATGTATTCATTTCGCCCCAACAGAGAGATCAAAAGATAATCTCCTGAGGGAGGGGGTCAAAGTAAATAATATATTTGTAACGGGTAATACCGTCATCGACTCTTTATTTATTGCAAAAGATATCATAGATAATGACCCTAATATAAAGAACGCTTTACATAATAAATTTAATTTTCTTGATAAAAGCCGACGAGTAGTACTTATAACAGGTCATCGAAGAGAAAATTTCGGGAAAGGTTTTGAAGATATATGCTTTGCAATAAAGGAATTAGCTTTCATTTATCCTAATGTAGATTTTATTTATCCGGTGCATCTTAATCCCAATGTAATGGAACCAGTACATCGTATATTAGATAATATATGTAATATTTACCTTATTGAGCCCTTGGATTATTTGCCTTTTGTTTATTTAATGAATGAGTCATATTTAATATTGACTGATTCAGGGGGGATACAAGAAGAAGCGCCTTCGTTAGGTAAACCGGTTTTGGTTATGCGTGATACTACTGAACGCCCTGAGGCGGTTGAGGCTGGTACTGTTGTATTAGTGGGGACTTCTAAGATAAAAATAGTAAATAAAGTAACGGAGCTATTAAACAATGCTGATATCTACAATGCTATGTCTCTGTTACATAATCCATATGGCGATGGAACAGCTGCTCAAAAAATTCTTAATGTGCTCGCCCAAGAGCTAATTTAATTTAAGCTAAAAATATGTTATTAATTATTGCTGATTATCCAAACGAAATGAATATGCGCGAGGGAGCTATGCAACGAATAGATGCGATAGACTCTCTCATTCGAGATCGCAAGCGAGTGTATTTGAATATTTCATTCAAAAAGCATCTAGTTCGCTCAAATAGTTCCTTTAATAATGTTATAGTTGAAAATCTAAATGCAATTATTCACAGAAACATCATAAAACAGTACATGCAAAAATCAACAACTATATATGTTCATTCTGTTTATAATTTATTAAAGGTTATAACGCTCATTGATCTAAAAAAAACAATTCTTGATATACATGGTGTTGTACCGGAAGAACTTTTGGCAGATAATAAAAAATTACTTAGTAAAGTATATAACATGGTGGAAAAAAAAGGTGTCCTTGGATGCAAAAAATTAATACACGTCAGTACAGAAATGCAAAAACACTATGAAGCAAAATATGGAGTAAACTTGGCTGAAAGGTCAATAGTGCTCCCGATTTTTGAATATAAAAATATAACCCAATCGCAAAACAAATGGACAGAAAATAAAATACGAAGTATCTATCTTGGAGGATTACAAACATGGCAAAATATTGATAAAATGATTCAAGTTTGTGATGACACAGTGATAAACAATGAAGCAGGTAAGTATGAATTCAACTTTTTCATCCCACAGAGTAACTTGGAAGGGTTTATAGATAAATATTCGTTAAAATTACATAATATCAATGCTAATGCATCTACGCTATCACGTGATGAAGTAATTCCCTTTCTAAAAGAATGTCATATTGGTTTTGTATTGCGCGATGATATAATAGTAAACAGAGTTGCGTGCCCTACAAAATTGGTTGAATATTTAGAGTGTGGTGTCGTTCCAGTTGTGCTCTCCCCACTTATAGGTGATTTTTATTCGATGGGATATCAATACATTACTACAGAGGAAATGGCTAACAGAAGTATAAGTTTGTTGGATCTTGAAAAAATGGCTGCACATAATTTACAAATTTTGACTTCTTATCAGAAGAGAACCTACAAGGCACAGAAAGAACTTATTGCTCAACTGTGCTGAATTTTTTACATATATAAAATTATGTAAGCATATCGCGGGTCAGGTAATTGTATGCGTATCAAATATAAAGATAACGGTTATATATTATGTTTTCTATTATGTTTCATTTTGAGCTACTTAGTTTTACTCAAATCTGACTACTTTCCTGCTGATTTTCTGCCATATACAGAAATATACGATGGGACATACGGAGAAATCAATAATATTGAGCCTGCCTTTTTATATTTAACACGGTTGTTTCATTATTTAAATTTCCCCTATATATTTTTTGCAATGTTAGTTTGTGCCTTATGTTTAAGTTGGAAAATAAAATATGCAAGAAAAATAATTAAAGATAGTTATATATATTTGTTCTTGTATGTATATGTATCATTTTATGTGTTTTTGCATGAAATGACTCAATTGCGCATAGCAATTGCAGTCACTATGTGCTATGTGTCGGTTTATTATTACTTTTATAAAAATTGTATTAAACATGCACTGCCATGGATGGTGTTGGCTATTTTGTTTCATTACAGCGCCTTGCTTTTATTTATGTCATTATTTATATACAGTTATAGGAGGTTATTAATAGTAATTATAGGGTTTGTAATATGTATGAGCTTTTTAAACGTGTATGCAGATACAATTGCACTATATTTGCCAAATGAAAAAATAGTAAATTATTTATATAGTATTTCATCATCATTAGACAATAGAAATGATTTGGCAATATTCAACCTGAATAATATAATATTTTTATCAATATTTATTTTGATCTTTTATCTTAGCCGATATATAAAATTAAATGATAATGAGGCGAAGTTTATTAAGTATGTGCAATGTTCAGGAATATTAGCCTTTTGTATTTTCTTTCTGGCTAGTGGAGTCCCGGTCATTGCTTATCGAACTGCAGAGTTGCTGCGAATATTTTATCCGATGGCTTTAGTATTAATCCTTTCGCATATAAAAAATAATAATATGCGTTATTTTATTGCAGTCATTATAGTTATCCTTTCAGGCTTAATGTTGTTTATAACACTAAGGGCTGTATCAATAGTTGGTCAAGGATTATAAAATGAATGTTGCTATTTTGTTGTCTACGTATAATGGCGAAAAATATTTAGAGGAACAACTGGATTCATTGCTGCTTCAAAGTTATCAGGATTTTGTAGTGTATATCCGTGATGACGGATCATCTGATAGAACTGTAAATATAATAAACCAATACGTAATGAAAGATAACAGATTTATTAACGTGGGTAATTCAGAAAATCTTGGTTGTGCTGCTTCGTTTATTAATTTATTAAGAAATGCTTCAGCCGATATTTATATGTTTTGTGACCAAGATGATTATTGGCTTCCGAATAAATTACAGCGTGCTGTGGATTATTTTTCGGCTATTGATCCTTTACAACCTACCTTGTATCATTGCGATCTAAGCGTTGTTGATGAAAAACTTAATATTATACAAAATTCATTTTTGCAGCATCAGAAAATGTCAGCGTATGATTCAATGAGAAAAAATAATCTTTTCATACAAAATTTTGTTGTTGGTTGTTCATGTGCTGTTAATGCTTCACTTGCGGAATTTGTTCTTTCGCGAATTGGAGAGCAGCATGTAAAAATGATAGCTATGCATGACTGGTGGTTAGCCGTGACTGCAAAACTTTTTGGTCGAATCCATTTTGATAATACTCAAACGATTCTTTATCGACAACATCAGGGCAATGTATTAGGTGCAAAATCATCAGGTATGATGCGTTTTATTCGATTAGGATTAAATGGGCAAGGGATTTCGCGAGTAGTATCTTTTAGAAAAAAAGTTTGTGCGCAAAATAAGCTTCTTTTAGATGTCTATGATAAAGATTTAAATCTTGAGCAAAAAAAATCTATCAGGCTTGTAATTGAGGGCCTTAAAGAGAACTCTTCAATTGCTGACCTTTTAAAATGTTTCTATCATGGTAGCTATATGCAAGGTTTTAAACGTAATCTTGCCTTAATATATTCAGTTCTTTACACAAAAAAAAGAAGATAGTGTATCCTTATGAAAAAAATTGCTATTATCGGTACTGTTGGCATACCAGCATCATATGGCGGATTTGAAACATTAGTTGAAAATTTAACAAGATACAATTCCTCGGGAGTTGAATATAATGTTTTTTGTTCATCGTTTCACTACAAATCCCACCAAAAAAAACATAATGGGGCCCGTTTAATTTATATTCCGCTTAAAGCCAATGGATGGCAGAGCATTGCGTATGACATAATTTCGTTAGCATATTCTATTTTTTTGAAGCCTGATGTGATTCTGATTTTAGGGGTTTCTGGTTGTTCATTTTTGCCTTTCTTCAAACTCTTAACACGCGCTAAGTTTATTACTAATATTGATGGCCTGGAATGGCGAAGAGATAAATGGAATTCAAAAGTGAAACGTTTCTTAAAATTTTCAGAAAAAATCGCAGTTCAATATTCGGATGTCGTTATTACGGATAATGAGGCAATTTCTGAGTACGTTTTTAACGAGTATAATAAAGATAGCCGAGTTATTGCCTATGGAGGGGATCATGCATGGTTAAATACTGAGGATGTATTTACAACAAGAAATTATAAAAGCGATTACTACCTTTCTGTATGTCGTATCGAACCCGAAAACAATGTAGAATTAATTTTAAAAACATTTTCAAAGCTAAAATATAAAATAAAATTTATTGGAAATTGGAATGGCAGCGAGTTTGGAAAGAAACTTAGGCTGCATTATTCTAACTATCCAAATATTGAAATGATTGATCCGATTTATGATCTTCAACAATTATTTCACTTACGAAATAATTGCATAGGATATATACATGGTCATTCGGCTGGAGGAACAAACCCTTCTTTAGTCGAGGCAATGCATTTTAGTAAACCTATATTTGCATATGATTGTAAGTTTAATAGGTACACTACTGAAAATGAAGCATGTTATTTTTCTAATGAATCTGACCTCGCAGAGAAAATCATAATGCATTGTGAGCTATCATTAGGTGTCTCTGGCACGAAAATGAAAGAAATTGCTAACCAGAAATACACTTGGAGACGAATAGCAGAAATGTATGAGGATTGCTATTAACTCTGTTAAACTTCAAATCTTTTACAATATATGGCATGACTATAAGCGCATTAATTGTTTTTCAAGCCGCTCTCGCGGTGACCACCCCCTGACAGGGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATCGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 12 (예시적 O2 rfb 유전자좌 뉴클레오티드 서열 - O2-EPA 생산 균주 stGVXN4906)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGTGAAAATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCAGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCGGGAATCACTTGCTGATGTTTCTGATTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCACCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCCGCTCGCAATTACTGGTCTGCTCTTGATAGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTCTATGGTGATTTGCCTCATCCAGATGAAGTAAATAATACAGAAGAATTACCCTTATTTACTGAGACGACAGCTTACGCGCCAAGCAGCCCTTATTCCGCATCCAAAGCATCCAGCGATCATTTAGTCCGCGCATGGAAACGTACGTATGGTTTACCGACCATTGTGACTAATTGCTCGAACAACTATGGTCCGTATCACTTCCCGGAAAAGCTTATTCCATTGGTTATTCTTAATGCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGGGATCAAATTCGCGACTGGTTGTATGTAGAGGATCATGCTCGTGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGTGAAACTTATAACATTGGCGGACACAACGAAAAGAAAAACATCGATGTTGTGCTGACTATTTGTGATTTGTTGGATGAGATTGTACCGAAAGAGAAATCTTATCGTGAGCAAATTACTTATGTTGCTGATCGCCCAGGGCATGATCGCCGTTATGCAATTGATGCCGATAAAATTAGCCGCGAATTGGGCTGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGCAAAACGGTGGAATGGTATCTGGCTAATACAAATTGGGTTGAGAATGTGAAAAGCGGTGCTTATCAGTCATGGATCGAACAAAACTATGAGGGCCGTCAGTAATGAATATCCTGCTTTTCGGCAAAACAGGGCAGGTGGGTTGGGAACTGCAGCGTGCTCTGGCGCCGCTGGGTAATCTGATCGCTCTTGATGTTCACTCCACTAATTATTGTGGAGATTTCAGCAACCCCGAAGGTGTGGCAGAAACCGTCAAAAAAATTCGTCCTGACGTTATTGTTAATGCTGCTGCTCACACTGCAGTAGATAAAGCAGAATCAGAACCGGATTTCGCACAATTACTTAACGCGACAAGCGTCGAAGCGATTGCAAAAGCTGCTAATGAAGTCGGGGCCTGGGTTATACACTACTCTACTGATTATGTTTTCCCAGGCAGTGGTGACGCGCCATGGCTGGAAACGGATGCAACAGCACCGCTAAATGTTTACGGTGAAACAAAATTAGCTGGGGAAAAGGCATTACAAGAACATTGCGCAAAGCATCTTATTTTCCGTACCAGCTGGGTATACGCTGGTAAAGGAAATAACTTTGCTAAAACGATGTTGCGTTTGGCAAAAGAACGCGAAGAACTGGCTGTGATAAACGATCAGTTTGGCGCACCAACAGGTGCTGAATTGCTGGCTGATTGCACCGCTCATGCCATTCGCGTGGCATTAAAAAAACCAGAAGTCGCTGGCTTGTACCATCTGGTAGCAAGTGGCACAACAACCTGGCACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGGATTAATCTTGCACTTAACAAACTTAACGCCGTGCCAACAACGGCCTATCCCACACCAGCCCGTCGACCCCATAACTCTCGCCTCAATACAGAAAAGTTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTGGGCGTGAAACGTATGCTCAACGAATTATTTACGACTACGGCAATTTAACAAATTTTTGCATCTCGCTCATGATGCCAGAGCGGGATGAATTAAAAGGAATGGTGAAATGAAAACGCGTAAAGGTATTATTCTGGCTGGTGGTTCCGGCACTCGTCTTTATCCTGTGACGATGGCAGTGAGTAAACAATTGCTGCCGATTTATGATAAGCCGATGATTTATTATCCGCTTTCAACGCTTATGTTAGCGGGTATTCGCGATATTCTTATTATTAGTACGCCACAGGATACACCGCGTTTCCAACAATTATTGGGGGACGGGAGCCAGTGGGGTCTTAATCTACAGTATAAAGTACAACCGAGTCCGGATGGCCTGGCGCAAGCGTTTATTATTGGCGAAGACTTTATTGGTGGTGATGATTGTGCACTCGTACTTGGCGATAATATCTTCTATGGACACGACTTGCCGAAATTGATGGAAGCTGCTGTTAACAAAGAAAGCGGTGCAACGGTATTTGCTTATCACGTTAATGATCCTGAACGCTATGGTGTCGTGGAGTTTGATAATAACGGTACGGCAATTAGCCTGGAAGAAAAACCGCTGGAGCCAAAAAGCAACTATGCGGTTACTGGGCTTTATTTCTATGACAATGACGTTGTGGAAATGGCTAAAAACCTTAAGCCTTCTGCCCGTGGCGAACTGGAAATTACCGATATTAACCGTATTTATATGGAACAAGGACGTTTGTCTGTAGCCATGATGGGGCGTGGCTATGCATGGTTGGATACAGGGACGCATCAAAGCCTTATTGAAGCAAGTAACTTCATTGCAACAATTGAAGAGCGTCAGGGATTAAAGGTATCTTGCCCGGAAGAGATTGCTTACCGTAAAGGGTTTATTGATGCCGAGCAGGTGAAAGTATTAGCCGAACCGCTTATCAAGAATCAATATGGTCAATATTTGCTGAAAATGATCAGCGAATAGTATATGGGAACTCAATGATGGATATTAAATTAATCTCTTTGCAAAAACATGGGGATGAGCGCGGTGCATTAATTGCTCTTGAAGAGCAACGAAATATACCTTTCGAAGTCAAAAGAATATATTACATACTTGAGACTCTTAATGGAGTAAGACGCGGATTTCATGCGCACAAGGTTACTCGTCAGTTAGCTATTGTAGTCAAGGGAGCTTGTAAATTTCATCTGGATAATGGTAAAGAAACAAAGCAGGTGGAACTTAATGATCCAACAATTGCGTTGCTGATAGAACCCTATATATGGCATGAAATGTATGATTTTAGTGATGATTGTGTGCTGCTTGTAATTGCGGATGATTTCTATAAAGAGTCTGATTATATCCGCAATTATGATGATTTTATTAGAAGAGTAAATTCAATTGAGAATTCATAAGCTAAGTGACGTCCAGACAACATCAATTGGTGATGGAACAACTATCTGGCAGTTTGTTGTGATACTAAAAGGTGCTGTAATTGGTAATAATTGCAACATCTGTGCAAATACCTTAATTGAAAATAACGTTGTAATTGGTAACAATGTCACAGTCAAAAGCGGTGTGTATATTTGGGATGGCGTTAAAATAGAGGATAATGTTTTTATTGGTCCTTGTGTAGCATTTACAAATGATAAGTATCCTCGCTCTAAAGTCTATCCTGATGAATTTTTGCAAACAATAATACGCAAAGGAGCATCAATAGGTGCTAACGCAACCATCCTGCCAGGAATTGAAATTGGTGAAAAAGCAATCGTTGGTGCGGGGAGTGTTGTAACCAAAAATGTACCGCCATGCGCAATAGTAGTAGGTAATCCAGCTCGATTTATTAAATGGGTAGAGGATAATGAATAAAATTGATTTTTTAGATCTTTTTGCAATTAACCAGCGACAGCACAAAGAATTAGTCTCTGCGTTTAGTAGGGTGCTAGATTCTGGTTGGTATATCATGGGCGAAGAACTTGAGCAGTTCGAGAAAGAGTTCGCAGAATACTGTGGAGTTAAGTATTGCATTGGTGTAGCAAATGGCCTTGATGCGTTGATACTAGTATTGAGGGCATGGAAAGAACTTGGCTATCTTGAAGACGGTGACGAGGTATTAGTACCGGCAAATACATATATTGCTTCTATTCTTGCTATAACAGAGAACAAACTTGTTCCTGTTCTTGTTGAACCAGATATAGAAACTTATAATATTAATCCTGCTTTAATTGAAAATTACATTACGGAAAAAACTAAAGCAATATTACCGGTTCACTTATATGGTCTATTGTGCAATATGCCAGAAATTAGTGCAATCGCCAGAAAATATAATCTGTTGATTCTTGAAGATTGTGCACAAGCACATGGTGCAATACGTGATGGTCGCAAAGCTGGAGCTTGGGGGGATGCTGCAGGATTTAGTTTTTATCCAGGAAAAAACCTTGGAGCTTTGGGGGATGCGGGAGCTGTTACTACAAATAATGCAGAATTATCCTCAACTATAAAAGCTTTGCGAAATTATGGGTCACATAAGAAATATGAAAATATTTATCAGGGATTGAATAGTCGATTGGATGAACTGCAAGCAGCCTTATTGCGTGTAAAAATCCATACATTACCGGAAGATACTGCGATTCGGCAAAGGATTGCTGAAAAATATATTCGTGAAATAAAAAACCCTGCGATTACGTTACCAGTGTACGAAGGCCAAGGTGCGCATGTTTGGCATTTATTTGTAGTAAGAATCGCTAATCGTGAAAAATTCCAGTCATACTTATTAGAGAAGGGTATCAAAACCTTAATTCACTATCCATTACCACCCCATAAGCAGCAAGCATATCAAAATATGTCTAGCCTTAGCCTTCCAATTACTGAGCAAATTCATGATGAAGTCATTTCTTTACCTATAAGTCCGGTAATGAGTGAAGATGATGTCAATTATGTAATCAAAATGGTCAATGATTACAAGTAATGAAAAAATTTCTTCAGGTAACTATATTATCCGCTATCTATACATTCATTAAAATGATTGCGGGTTTTATCATCGGTAAGGTAGTAGCAATTTATACAGGGCCATCAGGGGTAGCAATGCTTGGCCAAGTGCAAAGTTTAATCACAATAGTTGCAGGTACTACCTCTGCACCTGTAAGCACAGGCCTTGTTCGATATACTGCGGAAAATTGGCAAGAAGGACAAGAAGCATGCGCGCCATGGTGGCGCGCATGCTTAAGGGTTACTCTGTTTTTATTCTTGCTTATTATTCCCGTTGTTATTATATTGTCGAAAAATATTAGTGAGTTACTTTTTAGCGATGGACAATACACATGGTTAATCATTTTCGCATGTTGTATATTGCCATTCTCCATTATAAATACATTGATCGCTTCAGTTTTAAATGGTCAACAATTTTATAAGCAATATATATTGGTTGGGATGTTTTCTGTATTCATTTCTACTATGTTTATGATTTTGTTGATTGTAGCTTATAATCTTAAAGGTGCATTGATTGCCACAGCTATAAATAGTGCTATTGCTGGTCTTGTATTGGTTTTATTTTGTCTCAATAAATCTTGGTTTAGATTTAAATATTGGTGGGGTAAAACGGATAAAGACAAAATTATAAAAATTATTCATTATACTCTGATGGCTCTGGTTTCTGTTATCTCCATGCCTACAGCATTGATGTGTATTAGAAAAATATTGATTGCTAAAACTGGTTGGGAGGATGCAGGGCAATGGCAGGCCGTATGGAAGATATCTGAGGTTTATCTTGGTGTTGTGACAATTGCTTTGTCAACATATTTCTTACCAAGATTGACAATTATAAAAACAAGTTTCCTTATAAAAAAAGAAGTAAATAGTACTATATTATACATAATATCTATTACTTCATTCATGGCGTTGAGTATCTATTTATTCCGCGATTTGGTAATAACAGTTTTATTTACTGAACAGTTTCGCTCAGCTCGTGAATTATTTTTATTACAACTTATAGGGGATGTAATAAAAATTGCTGGGTTTCTTTATGCATACCCTCTTCAAAGTCAGGGGCATACTAAACTATTCATCAGTTCAGAAGTGATTTTTTCTATGCTCTTTATCATTACCACCTATATTTTTGTTGTAAATTATGGAGTACATGGTGCTAACATAAGTTATGTCATTACATATAGTTTATATTTTGTGTTTGCATTTGTGTTTACTAATTTTATTAATGTTAGAAGAAATAATTAAAAACAGAGGTTGAATTTTGAAAATAATTATACCTGTCTTAGGATTTGGCAGGGCTGGTGGTGAAAGAGTTCTTTCTAAGCTGGCAACTGAATTGATGAATTATGGACATGATGTAAGTTTTGTTGTTCCAGATAATAGAACTAATCCATATTATGCTACCACAGCAAAAATTGTCACGAGTAAATCTAGTCAAAACCGTGTAAAAATATTGAGAATCATTAAAAATTACTATAATCTGTGGCGTAAATGCATAGAGTTAAATCCTGATGCTGTAGTTGCTAGTTTTCATTTGACTGCCTATCTTGTCGCATTATTACCAATCACCCGTCGTAAGAAATATTATTATATTCAGGCGTATGAAGTTAATTTTTTTGATAATATAATATGGAAATTAATAGCGGGTTTAACATATTATTTACCGCTTAAAAAAATACTAAATAGTCCTAATTTGCTTCCTCATAAACATGATGATTTTATAGGAGTAGTTCCTGCAGGAGTAGATTTAAACGTTTTCTATCCGAAACCATCAAATAGGTTATTAAATGGTCACACATCAATAGGGATTATTGGTAGAAAAGAGAAGCACAAAGGAACTAGCGAAATTATTTCAGTATTGTGTTCACTGGAAAATAAAGCTGGAATTATAATCAATATTGCGATCTATCTTGAAGAAGTTGATAAGCAGCGTTTAATCGCTGCCGGGTTTCAGGTTAATTTTTTTCCGATTACTTCTGATTTAGAATTGGCATCCTTTTATCGAAGCAATGACATCATGATTGCTGTTGGGTTAATTGAAGATGGCGCTTTCCATTATCCTTGTGCTGAATCAATGGCTTGTGGTTGTCTTGTTATTTCAAATTATGCGCCACTTACTGAAACTAACAGTGTACTTAAATTAGTCAAGTTTGATGCTTGCAAACTTGGTGAAGCAATTAATCTTTGTCTCAATCTTGACCTAGAAGAAAAAAGCAAAGAAATCCAATCTAATATTTCTGTGTTGAATAAATATGACTGGAAAATTGTTGGTGAAACTTTCAATAGTTTATTGTTAGATGCAAATAAATAGTATACGTTGATGGGGAAAATATGAATATTGTTAAAACTGATATTCCAGATCTGATCGTTCTTGAACCAAAAGTGTTTAGTGATGAACGCGGCTTTTTTATGGAGAGTTATAATCAGATTGAATTTGAGAAGGCAATAGGAAGGCACGTAAATTTTGTTCAGGATAATCATTCAAAATCTAGTAAAGGCGTACTACGTGGGTTGCATTATCAATTAGCACCGTATGCACAGGCTAAATTAGTTCGATGTGTTGTAGGTCAGGTATTTGATGTTGCTGTTGATCTTAGAAAAAATTCACCAACGTTCAAAAAATGGTTTGGAATAACCCTTTCCGCAGAAAATAAACGACAATTATGGATACCCGAAGGATTTGCTCATGGTTTCTTGGTGACCAGTGATGAAGCTGAGTTCATTTATAAGACAACTAACTACTATGCTCCTGGTCATCAGCAAGCAATTATTTACAATGATCCTATTTTAAACATCGATTGGCCTTTCTGCAGTAGTGCTCTGTCATTATCACAAAAAGATCAAGAAGCAAAATTATTTTCAGAATTATTGGACAGTGAACTGTTCTAATAAAGTGTGCCACCTTATCCGTCTGAAGGATAGGTGGTTGCTTATATTTTTTTGAGTATGTTTGTATAATGACAGAAAATAGTCCGAAATATAAACACGATAAAAGCTTAATAAGTTTTATCTACTTATTTTTTATATTTACACTTATTGTAGGCTTTATTATCGCAAATACCCAGTTTTTGGGGCGAAGTAGAGACTATGATAATTATATACAGATCTTTTCTGGTAAAGAAGGGGAGGGGGTTCTTGAATTATTTTATCGCGGATTGATGTTAATAACGACCAGCTATGAAACTATCATTTTTATAATTTTAACATGTTCTTTTTTTATAAAGGCAAGGTTTCTCGCTAACTATTCGCGTAATTTTTCAGGCTTGACCTTATTCTTTATTTATTATGCAAGCGTTGCACTTTGGGTTTTAGATTATACTCAATTCAGAAATGGTCTATGTATTTCCATTTTAATGTTTTCCGTATACTATTTATTTATAAATAAACCGACTTATTTTTATTTCTCGGTATTATGTGCAATTGCAACTCATTGGTCTGCTTTGCCTTTTTTGCTTTTATATCCTTTTGTCTATTCAACAAAAATAAGACGCCTTGGTTATTTTTGTTTCAGTATTCTTGTTTTGATTGCGATCTCAGGAGAAGGAAAAGAGATCATATCTTTTATAAGAAATTTTGGAGTGGGACAAAAAATAGGAAATGAAGCTGGTGTAAATTTAATAAATTCATTATCCCTTACCGCTATTTCCTGGTTTATTATTAGTTACATATCAAGCATTGGAAATGAAAGGAGAAATTTAAGGCTTTTCTTTTGTTATGGTGTCATGCAATACGTGACTTTTAGCCTTTTCTCTCTACCTGTTATGGCTTTCCGTATTTTGGAAATGTATTTTTTCCTTATGCTAACCATTGGGGTGTTTATTAAGCAAAAAAAGAATTATTATTTTATTTTTTGCAAAGTGTTAATTTTATTGTATCTAACATACTATTATCATATGGTCTTTGGAGTGATTAATGTGTAAGGCTAAGGTGTTGGCTATAATTGTTACTTACAACCCGGAAATTATTCGATTGACGGAATGTATTAACTCTTTAGCCCCACAAGTTGAGAGAATAATTCTTGTAGATAATGGCTCAAATAATAGTGATTTGATAAAAAATATCAGTATTAATAACCTTGAAATTATTTTACTTTCGGAAAACAAAGGCATTGCATTTGCTCAGAACCATGGTGTTAAGAAGGGCCTGGAAGCAAAAGAGTTTGACTATTTATTTTTCTCAGATCAGGATACTTGCTTTCCTAGCGATGTTATTGAAAAACTTAAGAGTACATTTACGAAAAATAATAAAAAAGGTAAAAATGTTGCTTGTGCTTCTCCTTTTTTTAAAGACCATCGTTCAAATTATATGCATCCGTCAGTCAGCCTAAATATTTTTACGAGTACAAAAGTTATATGTAGTGAAGTAGACGATGATCTTTATCCCTCGCATGTTATTGCTTCTGGGATGTTAATGTCTCGTGAAGCATGGCGCGTCGTCGGACCATTTTGTGAAAAACTCTTTATAGACTGGGTTGATACAGAATGGTGTTGGCGTGCATTAGCTAATAATATGATTATTGTTCAGACACCATCAGTCATCATTTCTCATGAACTTGGGTATGGGCAGAAAATTTTTGCTGGTCGATCTGTTACAATACATAATTCTTTCAGAAATTTTTATAAAATACGCAATGCAATATACTTAATGCTGCATTCAAATTATAGCTTCAAGTATCGTTATCATGCTTTTTTTCATGCGACAAAGAATGTTGTATTTGAAATTTTATATTCGAAAGAAAAATTAAATTCACTGAAGGTTTGTTTTAAAGCTGTACGTGATGGTATGTTCAATAATTTTTAATACGAAAATAGTTAGGCTCAAGGTGTTTAAATGGAAGAAAATAATATGAAGACGGTCGCTGTAGTTGGCACAGTGGGTGTTCCTGCTTGTTATGGTGGGTTCGAATCACTTGTTCAGAATCTAATTGATTATCAATCTGATGGTATACAATATCAGATATTTTGCTCTTCAAAAAAATATGATAAAAAATTTAAAAATTATAAAAATGCAGAATTAATCTATTTGCCGATAAATGCCAATGGCGTCTCTAGCATAATTTATGATATTATGTGTTTAATTATTTGTTTATTCAAAAGGCCAGATGTTGTTTTAATATTGGGGGTGTCTGGTTGTTTATTTCTACCAATTTATAAACTATTTTCAAAATCAAAGATTATTGTCAATATTGATGGGCTTGAATGGCGTAGAAATAAATGGGGAACGTTTGCTAAGAAATTTCTTAAAATATCTGAGGCGATATCTATTAGAATAGCTGATATTATCATTTCAGATAATCAAGCAATAGCTGATTATGTGGAAAATAAGTACAAGAAAAAAAGTGTAGTTATAGCTTATGGCGGAGATCATGCCACTAATCTTAGTACACCGATAGACAATGATCAAAAAAAAGAAGGTTATTATTTGGGGCTTTGTAGGATAGAGCCTGAGAATAATATAGAAATGATTCTGAATGCCTTCATTAATACAGATAAAAAAATTAAATTTATGGGTAATTGGGATAACAGCGAGTATGGACGCCAGCTAAAAAAATATTATTCAAACTATCCAAATATCACCCTACTAGAACCTAACTATAATATTGAAGAGCTTTATAAACTAAGAAAAAATTGTCTTGCATACATTCATGGACACTCGGCTGGTGGAACAAACCCTTCTTTAGTTGAAGCGATGCATTTTAATATTCCTATTTTTGCTTTCGATTGTGACTTTAATCGTTACACAACTAACAATTTAGCTCATTACTTTAATGATTCTGAACAACTTAGCTTATTAGCAGAAAGTTTGTCTTTTGGAAATCTTAAATGTCGAGTATTAGATTTAAAAAATTATGCTGAAGATATGTATAACTGGAGGCATATAGCTGCTATGTATGAATCTATTTATTAAACGCATTAACAATAATATAATTGACCTTATATAGCAGGGAAAGATCACGTAACGCTGCGGCGCGCCGATCCCCATATGAATATCCTCCTTAGTTCCTATTCCGAAGTTCCTATTCTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATCGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 13 (예시적 O6A rfb 유전자좌 뉴클레오티드 서열 - O6A-EPA 생산 균주 stGVXN4112 및 stLMTB10923)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATTTGCCCGCCGGGCGTGACAATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTGGGCCACTCCATTTTATGTGCACGACCTGCCATTGGTGACAATCCATTTGTCGTGGTGCTGCCAGACGTTGTGATCGACGACGCCAGCGCCGACCCGCTGCGCTACAACCTTGCTGCCATGATTGCGCGCTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCTGTCATCCAGACCAAAGAGCCGCTGGACCGCGAAGGTAAAGTCAGCCGCATTGTTGAATTCATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTTGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTTGAACGCACTCAGCCTGGTGCATGGGGGCGTATTCAGCTGACTGATGCCATTGCCGAACTGGCGAAAAAACAGTCCGTTGATGCCATGCTGATGACCGGCGACAGCTACGACTGCGGTAAAAAAATGGGTTATATGCAAGCGTTCGTGAAGTATGGACTACGCAACCTCAAAGAAGGGGCGAAGTTCCGTAAAGGGATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAGATTAGCGGCGAAAGTAATTTGTTGCGAATTTTCCTGCCGTTGTTTTATATAAACAATCAGAATAACAACGACTTAGCAATAGGATTTTCGTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCATTTGAATTTTACGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCGTAGACATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCTGAAATTATAAAGTCATTCTTATAGAACATCGCATTTCAATAATATAATTACACCTAAATGAATAGGATACAACGTGTGCACAATTATTTAAGGCTTAAAGATAAAATAAAAAACGTATTTTTAGGGTTGTATATATTGCAGTTATTTAATTATATCGCGCCATTGGTAATTATCCCTATCCTGATAAAATATATTGGGTTGGGGGAATATGGGGAATTGGTCTATATTACATCTATTTATCAAATAGTGGCTTTGATTATTGATTTTGGCTTTACTTACACAGGACCTGTGGTTGCTGCGAGACATAGATGTGAGACCCAAAATTTACAGCGCTATTACTCAATAGTTGTTCTTTTAAAATCATTGCTTTTTATAATTGCATTAACATGTGTATTTTTATTGTGCAGATTAAATATAGTCCACTTGTCATTTTTTGGGTTTTTGTCAATTTTTCTATGCACTATTGGTAATATATTATCGCCCAATTGGTTTTTGCAGGGGATTGGTGATTTTAAAAAACTTTCATACTCACAAGTAATAGTGAGAATAACATTGTTTATCATACTTCTTGTTTATGTCTGTAGTGGCGGAGATAATGTTTTTATCCTAAGTTTTTTGCAAAATGCAACATTACTCATATGCTGTATATACTTATGGCCAAATATTCATATTAGCCATGTTGTTCATCTTAAACCTAATGAATGCATTGTGGAATTTAAGAAGGCAGGAAATGTTTTTATTGGCGTAATAGGTACGATTGGTTACAATGGTCTAATTCCTGTGTTAATTGGAAACCTTTGCGGTAATACGAGTCTTGGTGTTTTTTCAATCGTTCAAAAAATGACAACAGCATGTCAAAGTCTAATTAATCCAATATCACAGTATATGTTATCTCAAGTTTCAGAAATTAAACCTCAAGATAAACTGTTTTATTATAGAATTAAAAAAAGTTTTTTTGTGCATTTAACAATTAGCATAATTGCATGTTTATGTTATATGGGGTTAGGGCAATATGTGGCGACTTTTATAGGTAAAGTTGACGTTTCATTTGTTATTATTTTATTTGCGTCAATAATTACCATTTTTTCATCTTTAAATAATGTCCTTGGTATACAGTTTCTTATACCGACAGATAATGTAAAAATACTACGAAGTATAAATGTTATGGCGGGAATTATTGTTGTTAGTTTGTCCTGGCTGTTAATATCACGCTTTGACATTCTGGGGGGGGTTTTATTAAACCTAATTGGTGAGTTTCTTGTATTCAGTATGCTAGCTTTTATTGCCCATCGAAAGTGGGGAGCGAGAGTATAATGAAAGTGAAGGCGGTTCCTGCTATTACATTCTATTTAAGTTTAATGCTGACAATTTTAGTGTTACTGTTTGGTAATGAACCAAATAAATCACAATATATCCTTGTTATAGCAACGATAACAGTTTTTTATATCGCATATATCACTAATAAAATAACTTCTCCGGCCAGCCTTCTCGTTATATCATCTTTTGTGTTTTTAGGTTGTCGCCCTTTATTATCTTTGTTTGCAAACTATGATTATAGGATTGCCGATTGGTTTATTGAAGGATATATGGATGACGATGTGATTTTGGCTAACTATGCTATAACACTAATGTATTATGGTTATACATTGGGACTAATTCTATGCAAAAATACTGAAAAATTTTATCCGCATGGTCCTTATCCTGAAAAACAATTGCTAAAAATAAAGTTTCTTTTGACTTTATTTTTTCTGGGTTCGATAGGTATGGTTGTAAAAGGGATATTCTTTTTTAACTTTATAGAATCTAATAGTTATGTTGATATTTATCAATCAAATATAACAACGCCAATAGGTTATGATTTTCTATCTTATTTATTTTATTGTTCTTTTTTCCTTATATGTGCGTTTCATATACAGTTCAGAACAAATAAAAAATTTCTTTTTATTGCGATATGCATTGCTGCATTTAGCACCTTGAAGGGTAGTCGTAGTGAAGCTATAACGTTTCTTTTAACGGTTACATGTATATATTTTAATGAAGTAAAGACAAGAAACTTACGTCTGCTGATTACAATGATTTTTGTTTTTAGCGTCATTTTTGTGATTAGTGAATTTATCTCAATGTGGCGCACTGGAGGGAGTTTTTTTCAATTAATGCAGGGTAATAATCCTGTTATAAACTTTGTATACGGCATGGGAGTATCATATCTTTCCATTTATCAATCAGTAAAACTACAACTATTGTCAGGGGGATATAATGTTACCTATCTATTCAGCCAGTTAATAATAACTTGCTCGTCAATATTTAATGTCAAATTGAGCTTGCCGGAAATAAGCTATAGCCATTTGGCCTCATACACAGCAAACCCAGAACTATATAATCTTGGGTTCGGACTTGGGGGGAGTTATTTAGCAGAATCGTTTTTAGCATTTGGTCTGATTGGATGTTTCATTATACCCTTTTTACTTTTACTTAATTTAAATGTATTGGAAAAATATACAAAAAACAAACCAATTATATATTTTGTTTATTATAGTGTGTTGCCACCTATATTATTCACACCAAGAGAGACTTTGTTCTATTTCTTCCCCTATCTTGTCAAAAGTATATTTGTTGCTTTTTTAGTTACATTATACATCCAGTATAAAAAGGATTGACCAAAATGTCAGAAAAAAATGTCAGCATAATAATCCCAAGTTATAACAGGGCTCATATTCTTAAGGAGGTCATACCAAGTTATTTTCAGGATGAGACTTTAGAGGTTATAGTTATCAATGATGGATCAACAGATAATACAAATAGTGTATTAGCTGAACTGAAGGAAAAATATTCTCAGTTAGTTATTTTAGAAAATGAAACGAATAAAAAACAGATGTATTCTAAAAACCGAGGGATTGAAATAGCCAAAGGGAAATATATTTTTTTTGGTGATGATGACTCTTACCTCTTACCCGGTGTTATATCTCGGTTATTGGCTACAAAATATGAGACAGGCGCTGATGTAATCGGCGCAAGAATACTTTATATGAATAATAACGAGAAAACAATTGAAGATTGCATAAATCGACATAAAAAAGAGGGGCGTTTTGTTAGTGATCTAAATAGATTGGATTTTAGTTATACATGTGATTTGGACCATCCGATTGAATGTTTTTATGCACAGCCTTTTGTTCTAGCTGAAAGGGAACTAATATCGAAATATCGATTTGATATATCTTATACGGGAAACTGCTATCGTGAGGAAACTGATTTCATGCTATCTCTATTTATTAAAAATAAAAAATTTATATATGATTCAAAGGCTTTGTTAATAAATTTACCTCCAAGAAAAGCGACGGGAGGGGCAAGAACAGCTAATCGATTAAAATATCATTACGAAAGTTGCATAAATAATTATAGATTTTTAAAAAAATATAATGATAATTTGAATCTTCTTTCAGGACAAAAGCATGCTATATTTTACCGACAGTGTCAATTCGTTCTGCTAAAAATGAAGTCGTTTATCGGGAAGTTTTTAAAATGATTATATATATCGCCGCGTATAATGGTTCAGGAGGGCAAGGTGGGGTGGAAAGGGTTGTTGCCCAACAATGTAACATTCTTAAAAATTTGGGGGTTAAAGTCATTATACTTGATAAAACATACTTCAAAATTTCTAACAAAATTCGTAACAAAAAAATACAAGTAGCACTTTATCCAATATTAGTTTCTCTTTATTTAACCTTACAAAAATTACGTGGCGTGACGTTTAAAGTTATTGCACATGGCTATTGTTCTCCTTTTTATAGGAATGACATCTTAATAGCTCATGGCAATATGAAATGTTATTTTCAAACAGTCATGAATAAAAAACCTAATCGGTTGTCTGGCAGTGGTCTTTTATCTTTCTATGAGCGTTGGGCTGGAGCATTTTCAAAAAATATCTGGGCTGTTTCAAATAAGGTTAAAAGTGAATGGAATGAGCTTTACAATATTAATTCACATAAAATCAAAGTTGTTCGAAATTTTATAAATCTTGCACAATTTGATTACACTGATGTTAATGAAGCAGAATATGTGACATTTGTCGGGCGATTGGAAAAAGGAAAAGGAATAGATGATCTGTATTACATATGTAAAAATCTGCCAGATACTTCCTTCCATTTAGTTTCAAGTATTCCCGCCCCACAAAATTTTGCTTCGCTAAATAATGTTCTGACCAGCATTGCTGTCCCCTATGCGAAAATGCCAGAAATATTTAAGAAATCCAGAGTACTTATTTTACCGTCCTATTATGAAGGATATGAGCTGGTTACTATTGAAGCGCTATGCTGTGGTTGCCCTGTGATAGGCTATAATGTTGGTGCAATTAGAGAGTTGTATGCAGAAAGTTTTCCTGGCGTATTTATTGCCAATAATAAAGAAGATTTAGCACAAGTAGCCTACAAATTAATTAGTCTTGATAATGAAAAATATTATCATTTGAGACAAACTATTTATAGCAAGCGTGAGCTTTTTTCTGAAGAGAGATATGCGGAAATTTTAACGGCGGCATTTAATGAAAAAAAATAAGAAACTCTGTCTCATTTCAATTAACTCATATAATGAACTTACCGGAGGAGGAGTATATTTACGTACGCTTGTTAGTTTTCTACAAAAACAGAATGTTAATTTAACACTTATTGATAAAAAATCCTCAGGTAAACTATTCGAAGACAATACTTTTCAACATATATCATTTATTAAAGGTAAACGTCAGGATATAATATCCAGGCTTTTTTTTATACCATCATTTTATGTCCCTTATATTTTCTCAATAATTAAAATTTTACGGAAGCAAGATATTCTTGCTTTTCACAACTCTCGGCTTGGATTGTTATGTCTGCTTTTTAGAATACTCATGCCCCACAAAAAGATCATATTGTTTACGGATAACTTCGAATATGACTTAATAAGACAAAAAGATAAAAACATAACTACTTTTATTGAAAAATTAATTGTTTATCTCAATGAATTTATCGGGCTTAAGAATTCAGATTTAGTTAGCTATATTACCCGGCAAGATAAAAATGCAATGGATAAATTTTATGGGATTAAAAAAAGCAGAAATTTAATTCTCCCTGTGATATTTAGTAGAGAAAAACCAACTGATGTATTGTCAGCTCACTTTATTAATGAGTATAATCGATTGAATAATGATAATAGGAAAAAAGTAGTATTTACTGCATCTTTTGATTTTTTTCCAAATATAGATGCTGCCAACTATGTTTTAAATGCAGCAAAGTCTAATAATGATTATTGCTATATTTTGGCAGGTAGGAAAAGTACTACTTTGAATCTTCCTGATTTGGATAATTTATTTTTTTTCGATAATCTATCTAATAGTGAAATGTCATATTTATTATCTGCTTGTGATGTTTTTTATTCTCCTATAGTTTTAGGAAGTGGAATGAAAACAAAAATTGCAGAAGCACTATCATATGGATTATATATTTATGCGACAGAGCATTCCTTAATCGGCTATGATGAAATTATACACAATAAGGAGTGTGTTAAAAAAATCTCACATTTGGATGAGGAATTTCCTAAAGATTTCAAGATGAAAAGTATCAATAAACAGCTAATAATGTCTTATCAGCAAAAATATTATTCACATTATCGGTTTAATGGCCATGAACTTGATATAATAAATTTTGACGATTAGTTAGTGGAGATATAATATGAACATATTAGTAACTGGTGGTGCTGGATATATCGGATCTCATACGGCTATTGAATTACTGAATGCAGGTCATGAGATTATCGTTCTGGACAATTTCAGTAATGCTTCATACAAGTGTATCGAAAAAATAAAAGAAATTACTCGACGTGATTTTATAACAATTACTGGAGATGCTGGGTGTAGGAAGACACTCTCCGCTATTTTCGAGAAACACGCCATAGATATAGTTATTCATTTTGCTGGCTTTAAATCTGTTTCAGAGTCTAAAAGTGAACCCTTAAAGTATTACCAGAATAATGTTGGAGTGACCATTACTTTATTACAGGTAATGGAAGAGTACAGAATTAAAAAATTTATCTTTAGTTCATCTGCGACAGTCTATGGTGAACCAGAGATAATTCCAATTCCAGAAACAGCTAAAATTGGAGGAACTACGAATCCATATGGCACATCGAAGTATTTTGTTGAAAAAATTCTAGAGGATGTTAGTTCCACGGGAAAACTGGATATAATTTGCTTGAGATATTTTAATCCTGTCGGTGCTCATTCTAGTGGTAAAATAGGTGAGGCTCCATCTGGTATCCCTAATAATCTTGTTCCTTATTTATTGGATGTTGCGAGTGGTAAACGTGATAAATTATTTATTTATGGCAATGATTACCCTACTAATGATGGAACAGGTGTAAGGGATTTTATTCATGTTGTTGACTTAGCGAAAGGTCATTTGGCTGCAATGAATTATTTAAGTATCAATTCGGGATATAATATCTTTAATCTTGGTACAGGAAAAGGTTATTCGGTACTTGAATTAATCACTACATTTGAAAAATTAACAAACATTAAGGTCAATAAATCTTTTATAGAGAGAAGGGCAGGGGATGTTGCGTCTTGTTGGGCTGATGCAGATAAAGCTAATTCTTTATTGGACTGGCAAGCCGAACAAACTCTAGAACAGATGTTATTGGACTCGTGGCGTTGGAAAAAAAATTATCCAGACGGATTCTGAATATAAAAGGTTTCAGTTTTATGAATCAATCAGAGCAGAGAAAAAAAATACTGGTTCTTACACCTCGCTTTCCCTACCCTGTCATTGGAGGGGATAGATTAAGAGTCTATATGTTATGTAAAGAACTTTCCAAAAAATATGATCTTATTCTTCTGAGCTTATGTGATCAACCACTAGAACTTGAAATAAATATAAATGACTCGGTCTTCAAAGAAATTCATCGTGTCTATCTACCAAAATATAAATCATATTATAATGTATTAAAAGCTTTGGTTACGCAAAAACCGTTGCAAATTGCTTATTATCAATCGGACACATTTAAGAATAAATACAATAAATTAATTAAACAATGCGATGCAGTATTTTGTCATCTGATAAGAGTTGCTGATTATGTTAAGGATACAGACAAGTTCAAAATTCTTGATATGACAGATGCAATATCTTTGAATTACAGTCGCGTTAAAAAATTAGCAAGTAAAAAAAGTTTGCGTGCAATTATTTATTCTCTGGAACAAAAAAGATTAGAATCATATGAACGTTCTGTGGCGAATCTTTTTGATTTGACCACTTTTATTTCATCCGTAGACCGTGACTATCTCTACCCTAATCTGGGCAGTAATATCCATATAGTCAATAATGGGGTTGATACATCAGCCTTGAGATATATAAAAAGAGAAATAAAAATCGATAAGCCTGTGGAACTTATATTTATCGGAAATATGTATTCTTTACAAAATATGGATGCTGCAAAACATTTTGCTAAGAATATTTTACCTTGCTTGTATGATGAGTTTAATATTATTTTTAAAGTGATTGGTAAGATCTCAGAAACTAATAAAAATATATTAAATTCATTTAAAAATACAATTGCTTTAGGTACTGTTGATGATATCAATTCTTCCGCTTCTACAGGGCATATAGGTATATGTCCTGTTCGTCTTGGAGCAGGCGTACAAAATAAAATTCTTGAATACATGGCTTTAGGTTTACCATGTATTACATCTAGCATTGGTTATGAAGGTATTAATGCAAAATCAGGTAGCGAAATTTTTGTTGCAGATACAGTAGAGCAATATAAAAACGTACTAAGAGAAATAATTTACGATTATAATCGTTATACTGAAGTGGCTGAAAATGCCCGTAGTTTTGTAGAAAATAATTTTTCTTGGGAATCAAAAGTTGCCAATTTAATGAATACATTAGATGAGAAATTATATGAACAATAATAAAATTATTACACCTATCATTATGGCTGGTGGTTCAGGCAGTCGGTTGTGGCCACTATCAAGAATTCTCTATCCGAAACAATTTCTTAGCCTAATCGGTAGTCATACCATGCTTCAAACAACGGCTAATCGTCTGGATGGTTTGGATTGTACCAACCCTTATGTCATTTGTAATGAACAATACCGCTTTATAGTTGCTGAACAGCTTAGAAAAATCGATAGATTGACTTCAAAGAATATCATCCTTGAGCCTGTTGGGCGTAACACTGCCCCTGCAATTGCATTAGCGGCGTTGCTGATGTCTAAGTCTGATAAAAGTGCAGATGATCTTATGCTCGTACTGGCTGCAGATCACGTTATACACGATGAAGAAAAATTTTGTAACGCTGTTAGATCGGCAATTCCATACGCTGCTGATGGGAAATTGGTAACATTTGGTATAATTCCAGACAAAGCAGAAACTGGTTATGGTTATATACATCGAGGACAATATATTAATCAGGAAGATTCGGATGCATTTATAGTGTCATCATTTGTTGAAAAGCCAAATCATGAGACAGCCACTAAATATCTTGCTTCCGGTGAGTATTATTGGAATAGCGGTATGTTTTTGTTTAGTGCAAATCGTTATATAGAGGAACTTAAACAATTTCGGCCTGATATTTTATCCGCTTGTGAAAAAGCAATTGCTTCAGCGAACTTTGACCTTGATTTTGTGCGTTTAGATGAAAGTTCTTTCTCTAAGTGCCCTGAAGAATCAATTGATTACGCTGTAATGGAAAAAACAAAAGACGCAATTGTTATTCCAATGGATGCTGGCTGGAGTGATGTCGGTTCATGGTCTTCTCTTTGGGAAATTAATGATAAAGACTCAGACGGCAACGTAATAGTTGGGGATATTTTCTCTCATGAAACAAAGAATTCTTTCATATATGCCGAATCGGGAATTGTTGCTACAGTTGGAGTGGAAAATTTAGTTGTTGTCCAAACAAAGGATGCTGTTCTTGTCTCAGAGAGAAATAAAGTTCAGGATGTAAAGAAAATAGTAGAACAAATTAAAAATTCAGGTCGTAGCGAGCATTATGTTCATCGCGAAGTATATCGTCCTTGGGGTAAATATGATTCCATTGACACAGGGGAGCGTTATCAGGTCAAACGTATAACAGTAAATCCTGGTGAAGGACTTTCTTTACAAATGCACCATCATAGGGCAGAACATTGGATCATAGTTTCTGGAACTGCAAGGGTGACTATAGGTTCTGAAACTAAGATTCTTAGCGAAAATGAATCTGTTTACATACCTCTTGGTGTAATACACTGCTTGGAAAATCCAGGGAAAATTCCTCTTGATTTAATTGAAGTTCGTTCTGGATCTTATTTAGAAGAAGACGATGTTATCCGTTTTCAGGACCGATATGGTCGTAGCTAAATTTTTGATAATGTAACGTTAGTAGAAGAGCGCTAATATTTTTAGTTAATCTGTAATAAGTATTATTTGTTTAAGGTATATCATGTCGAGTTTACCCTGCTTTAAAGCCTATGATATTCGCGGGAAATTAGGCGAAGAACTGAATGAAGATATTGCCTGGCGCATTGGTCGCGCTTATGGCGAATTTCTCAAACCGAAAACCATTGTGTTAGGCGGTGACGTCCGACTCACCAGCGAAACCTTAAAACTGGCGCTGGCGAAGGGGTTACAGGATGCGGGCGTCGATGTGCTGGATATTGGCATGTCCGGCACCGAAGAGATCTATTTCGCCACGTTCCATCTCGGCGTGGATGGCGGCATCGAAGTTACCGCCAGCCATAACCCGATGGATTACAACGGCATGAAACTGGTGCGCGAAGGGGCTCGCCCGATCAGCGGTGATACCGGACTGCGCGACATCCAGCGTCTGGCAGAAGCCAACGACTTTCCTCCCGTTGATGAAACCAAACGCGGTCGCTATCAGCAAATCAATCTGCGTGACGCTTACGTTGATCACCTGTTCGGTTATATCAACGTCAAAAACCTCACGCCGCTCAAGCTGGTGATTAACTCCGGGAACGGCGCGGCGGGTCCGGTGGTGGACGCCATTGAAGCCCGCTTTAAAGCCCTCGGCGCACCCGTGGAATTAATCAAAGTGCACAACACGCCGGACGGCAATTTCCCCAACGGTATTCCTAACCCGCTACTGCCGGAATGTCGCGACGACACCCGCAATGCGGTCATCAAACACGGCGCGGATATGGGCATTGCCTTTGATGGCGATTTTGACCGCTGTTTCCTGTTTGACGAAAAAGGGCAGTTTATTGAGGGCTACTACATTGTCGGCCTGCTGGCAGAAGCGTTCCTCGAAAAAAATCCCGGCGCGAAGATCATCCACGATCCACGTCTCTCCTGGAACACCGTTGATGTGGTGACTGCCGCAGGCGGCACCCCGGTAATGTCGAAAACCGGACACGCCTTTATTAAAGAACGTATGCGCAAGGAAGACGCTATCTACGGTGGCGAAATGAGCGCCCACCATTACTTCCGTGATTTCGCTTACTGCGACAGCGGCATGATCCCGTGGCTGCTGGTCGCCGAACTGGTGTGCCTGAAAGGAAAAACGCTGGGCGAACTGGTGCGCGACCGGATGGCAGCGTTTCCGGCAAGCGGTGAGATCAACAGCAAACTGGCACACCCCGTTGAGGCGATTAACCGCGTGGAACAGCACTTTAGCCGCGAGGCGCTGGCGGTGGATCGCACCGATGGCATCAGCATGACCTTTGCCGACTGGCGCTTTAACCTGCGCTCCTCTAACACCGAACCGGTGGTGCGGTTGAATGTGGAATCGCGCGGCGATGTACCGCTGATGGAAGAAAAGACAAAACTTATCCTTGAGTTACTGAACAAGTAATTCAGTAATTTCATATAAATGGGTTTTAAAAAACGGAAAAGATGAGATATCCGGTGTGGTATATCCAAGGTAATGCTATTCAGTATCTCTATGAGTGAGTTAACATCTATACCACATTTAAGCCGCACACTTCGGGATCCCCATATGAATATCCTCCTTAGTTCCTATTCCGAAGTTCCTATTCTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATCGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 14 (예시적 O8 rfb 유전자좌 뉴클레오티드 서열 - O8-EPA 생산 균주 stLMTB11734)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCGATCGCTTAAGATCTAGGATTTCATTATGTTACTTCCTGTAATTATGGCTGGTGGTACCGGCAGTCGTCTCTGGCCGATGTCACGCGAGCTTTATCCGAAACAGTTCCTCCGCCTGTTCGGGCAGAACTCCATGCTGCAGGAAACCATCACCCGACTCTCGGGCCTTGAAATCCATGAACCGATGGTCATCTGTAACGAAGAGCACCGCTTCCTGGTGGCTGAACAGCTACGCCAGCTCAATAAGCTGTCGAATAATATTATTCTTGAGCCGGTCGGGCGCAACACCGCCCCGGCCATCGCCCTGGCAGCCCTTCAGGCCACCCGCGACGGCGACGACCCGCTGATGCTGGTTCTCGCCGCTGACCATATCATCAATAACCAGTCGGCCTTCCACGACGCCATCCGGGTCGCCGAGCAGTATGCTGATGAAGGTCATCTGGTCACCTTCGGTATCGTGCCGAATGCCCCGGAAACTGGCTACGGTTACATTCAGCGCGGCGTGGCGCTCACCGATAGTGCCCATTCCGCGTACCAGGTGGCCCGCTTTGTGGAGAAGCCGGATCGCGAGCGCGCCGAGGCTTACCTCGCCTCCGGGGAGTACTACTGGAACAGCGGCATGTTTATGTTCCGCGCCAAGAAATACCTCATCGAGCTGGCCAAATACCGTCCGGATATCCTGGAAGCCTGCCAGGCTGCGGTGAATGCCGCCGATAATGGCAGCGATTTCATCAATATCCCGCATGATATTTTCTGCGAGTGCCCGGATGAGTCCGTGGACTATGCCGTTATGGAGAAAACCGCCGATGCGGTGGTGGTCGGTCTCGATGCTGACTGGAGCGACGTCGGCTCCTGGTCCGCACTATGGGAGGTCAGCCCGAAAGACGAGCAGGGCAATGTCCTCAGCGGTGACGCGTGGGTACACAACAGCGAAAACTGCTACATCAACAGCGACGAGAAGCTAGTGGCGGCCATTGGCGTAGAGAATCTGGTGATTGTCAGCACTAAGGACGCCGTGCTGGTGATGAATCGCGAGCGTTCCCAGGACGTGAAGAAGGCGGTCGAGTTCCTCAAGCAGAACCAGCGCAGCGAGTACAAGCGCCACCGTGAGATTTACCGCCCCTGGGGCCGTTGCGACGTAGTGGTCCAGACCCCGCGCTTCAACGTCAACCGCATCACGGTGAAACCAGGCGGTGCCTTCTCGATGCAGATGCACCACCATCGCGCCGAGCATTGGGTTATTCTCGCCGGCACCGGTCAGGTGACTGTCAACGGTAAGCAGTTCCTGTTGTCCGAGAACCAGTCCACCTTTATTCCGATTGGCGCCGAGCACTGCCTGGAAAACCCTGGCTGTATTCCGCTGGAAGTGCTGGAGATCCAGTCGGGGGCGTACCTTGGCGAGGACGACATTATTCGTATTAAAGACCAGTATGGTCGTTGCTAATTATTTTCGGGACAAGACGCAGAATGACACAGTTAACTTGTTTTAAAGCTTATGACATCCGTGGTGAACTGGGTGAGGAACTGAACGAGGACATCGCCTACCGTATCGGTCGCGCCTACGGCGAATTTCTGAAACCCGGGAAGATAGTGGTGGGGGGCGATGTGCGCCTCACAAGCGAGTCGCTGAAGCTGGCGCTGGCCCGCGGGTTAATGGACGCCGGTACCGACGTGCTGGACATCGGCCTGAGCGGTACCGAAGAGATTTACTTTGCCACCTTCCACCTTGGGGTAGATGGTGGCATCGAGGTGACCGCGAGCCACAATCCTATGAACTACAACGGCATGAAGCTGGTGCGCGAGAATGCGAAGCCCATCAGCGGCGACACCGGCCTGCGGGATATCCAGCGCCTGGCGGAGGAAAACCAGTTCCCGCCAGTGGACCCGGCGCGTCGCGGGACCCTGAGCAAGATATCGGTACTGAAGGAGTATGTTGACCATCTGATGAGCTACGTGGACTTCTCGAACTTCACCCGTCCACTGAAGTTGGTGGTGAACTCCGGAAACGGGGCTGCGGGGCACGTGATTGATGAGGTGGAGAAACGCTTCGCGGCGGCTGGGGTGCCGGTAACCTTTATCAAGGTGCATCACCAGCCGGATGGCCATTTCCCTAACGGTATCCCGAATCCGCTGCTGCCGGAGTGCCGCCAGGATACCGCCGACGCGGTGCGCGAGCATCAGGCCGACATGGGGATTGCCTTTGACGGCGACTTCGATCGCTGCTTCCTGTTCGATGACGAAGCTTCGTTTATCGAGGGGTATTACATTGTCGGCCTGCTGGCTGAGGCGTTCCTGCAGAAGCAGCCGGGAGCGAAAATCATTCACGACCCGCGCTTGACGTGGAACACGGTAGACATCGTGACCCGCAACGGCGGCCAGCCGGTGATGTCGAAGACGGGGCATGCGTTCATCAAGGAGCGGATGCGTCAGGAAGACGCTATCTACGGCGGGGAGATGAGTGCGCACCATTACTTCCGCGATTTCGCCTACTGCGATAGCGGGATGATCCCGTGGCTGCTGGTGGCGGAGCTGCTGTGTCTGAAGAACAGCTCGCTGAAATCGCTGGTGGCGGACCGCCAGAAGGCGTTCCCTGCGTCGGGAGAGATCAACCGCAAGCTAAGTAATGCTGCTGAGGCGATCGCCCGCATCCGGGCGCAGTATGAGCCGGCGGCTGCACACATCGACACAACGGACGGGATCAGTATTGAATACCCTGAATGGCGCTTTAACCTGCGCACGTCTAACACCGAGCCGGTGGTGCGTCTGAACGTTGAGTCCAGAGCTGATGTGGCGCTTATGAATGAAAAAACGACCGAGCTGTTACACCTGTTAAGCGGGGAATAAGGTGAGAGATTTACTAACGACGATTTATCGTTATCGGGGATTTATCTGGAGCAGTGTTAAACGTGATTTTCAGGCACGCTATCAAACTAGTATGCTGGGCGCACTATGGCTCGTTTTACAACCGCTCTCTATGATTCTGGTCTATACCCTGGTTTTTTCCGAGGTGATGAAGGCAAGAATGCCCGATAATACCGGGTCGTTTGCCTATAGTATTTATCTCTGTTCCGGGGTACTGACCTGGGGATTATTTACTGAGATGCTGGATAAAGGTCAGAGCGTATTTATTAACAATGCTAATCTGATCAAGAAACTCAGTTTTCCGAAAATCTGTCTGCCGATCATCGTGACGTTATCGGCGGTGCTAAATTTCGCGATTATTTTCAGTCTGTTTCTAATTTTTATCATTGTCACCGGTAACTTCCCCGGCTGGCTCTTTCTCTCGGTGATACCGGTCCTGCTTTTGCAGATCCTGTTTGCCGGTGGGCTGGGGATGATCCTTGGTGTCATGAACGTCTTTTTCAGGGATGTGGGGCAACTGGTTGGCGTTGCGCTGCAATTCTGGTTTTGGTTCACACCCATTGTTTATGTACTGAATTCATTACCTGCATGGGCAAAAAATCTGATGATGTATAACCCGATGACTCGGATCATGCAATCTTATCAGTCCATCTTCGCCTATCATCTGGCCCCCAACTGGTATTCGCTATGGCCAGTATTGGCTCTCGCCATTATTTTCTGCGTCATCGGTTTCAGGATGTTCCGCAAGCATGCGGCGGATATGGTGGATGAATTATAATGAGTTATATCAGAGTAAATAATGTCGGTAAGGCGTATCGCCAGTATCACTCAAAGACCGGGAGACTGATCGAATGGTTATCCCCTCTGAATACCAAACGCCATAATTTGAAATGGATCCTCCGCGATATTAATTTCGAAGTCGCTCCGGGCGAGGCTGTCGGTATTATCGGTATCAACGGTGCAGGCAAGAGTACCCTGCTTAAACTCATAACCGGGACGTCCAGGCCGACGACTGGAGAAATTGAAATCTCCGGACGTGTCGCTGCATTACTCGAATTGGGGATGGGGTTTCATTCTGATTTCACTGGTCGGCAGAATGTTTATATGTCTGGGCAACTGTTGGGGTTATCGTCAGAGAAAATAACTGAACTGATGCCGCAAATTGAAGAGTTTGCTGAGATTGGGGACTATATCGATCAACCTGTGCGCGTCTACTCCAGTGGGATGCAAGTTCGATTAGCTTTTAGTGTAGCGACGGCTATCCGTCCTGATGTGCTAATTATCGATGAGGCATTATCTGTTGGGGATGCATATTTCCAGCATAAAAGCTTTGAGCGTATTCGAAAATTTCGTCAGGAAGGGACCACGCTGTTGCTGGTATCCCATGATAAACAAGCGATCCAAAGCATTTGCGACCGGGCCATTTTATTGAATAAAGGCCAAATTGAAATGGAAGGTGAACCTGAAGCAGTGATGGATTATTACAATGCTCTTCTGGCCGATAAACAAAATCAGTCCATTAAACAAGTTGAGCATAATGGTAAAACGCAAACTGTTTCAGGCACTGGTGAGGTGACTATCTCTGAGGTTCATCTTCTCGATGAACAGGGCAATGTGACTGAATTTGTTTCGGTAGGGCATCGTGTCAGCTTGCAGGTCAACGTTGAGGTCAAGGACGATATTCCTGAGCTTGTTGTCGGATATATGATTAAGGATCGACTTGGGCAGCCGATTTTCGGGACCAATACGTACCATCTCAATCAGACACTCACCTCCCTGAAAAAAGGAGAAAAGCGTTCGTTCTTATTTTCTTTCGATGCGAGATTGGGGGTTGGCTCCTATTCTGTCGCTGTCGCGTTGCATACTTCCAGTACGCACCTCGGCAAAAACTATGAATGGCGCGATCTGGCCGTGGTATTCAACGTCGTTAACACGGAACAACAAGAGTTTGTCGGCGTGTCCTGGTTGCCGCCTGAACTGGAGATTTCTTAATGGGTTCGTCGTTTTATCGTTCATTTGAAGAACGACACAGAGGTTCGGTTGAAGAAATCAAGCGCCGCTTGAGTTTTTATTTACCTTTTCTTGCAGGTCTGAAGGACATTTATCCTGATGGCGTGATTGCGGATATTGGTTGCGGACGTGGCGAATGGTTGGAGATCCTGACTGAAAATGGCATTGCGAACATCGGCGTCGATCTCGATGATGGCATGCTGGCGCGCGCCAGGGAGGCCGGACTGAATGTGCAGAAAATGGATTGTCTGCAGTTTTTGCAAAGTCAGGCGGATCAGAGCCTGATAGCGTTGACCGGTTTTCATATTGCTGAGCATTTGCCGTTTGAGGTCCTGCAGCAACTCGCCATGCATACCCTACGGGTGCTGAAACCAGGTGGTTTGCTGATCCTCGAAACGCCGAACCCGGAGAATGTAAGCGTCGGCACCTGTTCATTTTATATGGATCCAACGCATAATCATCCTCTGCCACCGCCACTGCTTGAGTTTTTACCTATTCATTATGGTTTTACCCGAGCAATTACCGTTCGTCTGCAGGAAAAAGAGGTTCTTCAATCTCCGGATGCAGCCGTTAATTTGGTCGATGTACTCAAAGGGGTGAGCCCCGACTACAGCATCATTGCTCAGAAAGCAGCGCCAACAGATATTCTTGAACGCTTTGACACCCTGTTTACCCAGCAGTACGGTCTGACGCTGGATGCTCTGAGCAACCGTTACGATGCGATTTTGCGCCAACAGTTTTCGTCCGTTGTCTCACGGCTGGAGACGTTGAACCAAACCTATATGCAACAGATAAGCCAAATGTCAGAGACTATTCAGACGTTGCAAGGTGAGGTTGACGATCTGAGTCATGTCATCGATCAGAACCATCAGCTTCATCAGCAAATGGCGGATTTACATAACAGTCGTTCATGGCGTATTACTCAACCACTACGCTGGTTGTCTTTGCAACGTCAATTATTACGTCAGGAAGGGGCTAAAGTGCGAGCCCGTAGGGCTGGGAAAAAAATATTGCGCAAAGGGATGGCGCTCTCGCTGGTCTTTTTCCATCGTTACCCTAAGTCTAAGGTTTATCTGTTTAAGGTTCTGAGAAAAACTGGCTGCTATACATTGCTACAACGTTTGTTCCAACGCGTAATGCTGGTGCAATCTGACACGATGATGATGCAGTCCAGAAGATATGATGTGGGTACTGAAGAAATGACAAGTCGCGCGATGAGTATTTATAACGAATTAAAAAATAAAAATACGGAGAAATAACGATGCGTATTGTCATAGATTTACAAGGCGCACAGACGGAAAGCCGCTTTCGTGGCATCGGTCGTTATAGTATCGCAATCGCCAGAGGCATAATCAGAAATAACAGCCGGCATGAGATTTTCATCGCGCTATCCGCCATGCTGGATGAGTCGATTGCAAATATTAAGGCGCAATTTGCCGATCTCCTGCCGGCAGAAAATATAGTCGTATGGCATGCCGTAGGCCCTGTTCGTGCGATGGACCAAGGTAATGAATGGCGTCGGGAGAGCGCAGAACTGATTCGGGAAGCGTTTCTTGAATCATTGTGTCCAGATGTCGTTTTCATTACGAGTTTGTTTGAAGGTCATGTCGACGATGCGGCTACATCGGTACACAAATTTAGTCGTCAGTATAAAGTAGCCGTACTGCACCACGATCTTATCCCCCTCGTGCAGGCGGAAACCTATCTGCAGGACGATGTATACAAACCCTACTATTTACAGAAAGTTGAGTGGTTAAAAAACGCTGACCTTTTGTTGACTAACTCTGCTTATACCGCACAGGAAGCGATCGAGCATCTGCATTTACAGGGCGATCATGTGCAGAATATTGCAGCCGCAGTCGATTCTCAGTTTTGTATGGCGGAGGTGGCAGCGAGCGAAAAAGAGACCGTCCTTGGCCATTACGGTATTCAGCGCGAGTTCATGTTGTATGCGCCCGGAGGATTTGACTCAAGGAAAAACTTTAAACGGTTGATTGAGGCCTATGCCGGGCTCAGTGATGCCTTACGTCGCAGTCATCAACTGGTCATCGTCAGTAAGCTTTCCATCGGTGATCGTCAGTATCTGGAATCCCTTGCGTCAGGTAATGGTTTACAGCAGGGCGAACTGGTACTCACTGGTTATGTGCCGGAAGATGAGCTGATCCAGCTCTATCGCCTATGTAAGCTGTTCATCTTTGCTTCACTACATGAAGGTTTTGGGTTGCCGGTTCTGGAAGCAATGTCGTGCGGTGCGCCGGTGATTGGCTCAAATGTCACCAGTATTCCTGAAGTCATCGGTAATCCTGAGGCATTATTCGACCCGTATTCTGTCTCTTCCATGAGGGATAAGATCGCGCAATGTTTGACTGATGATACCTTCCTCGCGCGTCTGAAAGAAATGGCGCAGCAGCAAGCGCGTAATTTCTCTTGGGATAAAGCTGCGGTGACTGCTCTGGAAGCTTTCGAAAAGATCGCGGTAGAAGACACCGGTACTGCGCAGGTTTTGCCTGAAGCTTTGATTCAGAAGATCCTTGCTATCTCACAAGGGCAGCCAGATGACCGCGATCTGCGCTTGTGCGCAACGGCCATTGATTACAATCTGAAAACGGCAGAACTTTATCAAATCGACGATAAATCGCTGAACTGGCGTGTGGAAGGCCCATTCGATAGCTCATATAGTCTGGCGTTGGTCAACCGCGAATTTGCCCGGGCACTCTCAGCCGATGGTGTAGAGGTTTTATTGCATTCCACTGAAGGACCAGGTGATTTTGCCCCAGATGCCTCGTTTATGGCACAGTCGGAAAATAGTGATCTTCTGGCATTTTATAATCAATGTCAGACCCGCAAGAGTAACGAAAAGATAGATATTATTAGCAGAAATATCTATCCACCGCGGGTTACCAAAATGGATGCCAAAGTAAAATTCCTTCATTGTTATGCTTGGGAAGAAACGGGCTTTCCGCAACCGTGGATCAATGAATTTAATCGGGAACTTGACGGAGTGCTGTGTACTTCGGAACATGTTCGTAAAATACTGATTGATAACGGACTGAATGTGCCCGCATTTGTTGTTGGCAATGGCTGTGACCATTGGCTCAATATCCCAGCCGAGACGACAAAAGATGTGGATCACGGAACATTCCGTTTCCTGCACGTCTCTTCTTGTTTCCCACGCAAAGGGATACAGGCAATGCTTCAGGCTTGGGGGAAGGCGTTCACTCGTCGTGACAATGTTATCTTAATCATTAAGACTTTTAACAATCCGCACAATGAAATTGACGCATGGCTGGCTCAGGCCCAGGCTCAATTCATAGACTATCCCAAAGTTGAAGTGATCAAAGAGGATATGTCAGCCACCGAGCTTAAAGGGCTTTATGAAAGCTGTGATGTTTTGGTTGCTCCAGGTTGCGCTGAAGGCTTTGGTTTACCTATTGCTGAAGCAATGCTGAGTGGGCTACCGGCTATCGTCACCAATTGGAGCGGGCAACTTGATTTTGTTAATTCACAAAATTCATGGCTGGTTGACTATCAGTTCACTCGGGTAAAAACGCACTTTGGTCTGTTTTCCTCAGCCTGGGCCAGTGTGGATATTGACAACTTAACAGATGCATTAAAAGCGGCAGCCTCAACCGATAAATCAGTGCTGCGTGACATGGCCAATGCTGGTCGCGAGCTTCTTCTGCAGCAGTTTACCTGGAAAGCGGTGGCTGATCGTTCTTGCCAGGCGGTCAAGACTCTGCGTGCGCATATTGATATTGCACAGCATCGGGCGCGCATTGGCTGGGTGACGACCTGGAACACGAAATGTGGGATCGCAACCTATTCCCAGCATCTGGTGGAAAGCGCACCTCATGGCGCGGATGTTGTTTTTGCTCCCCAGGTCAGCGCTGGCGATCTTGTGTGTGCAGACGAAGAGTTTGTACTTCGCAACTGGATTGTAGGTAAAGAGAGCAACTATCTGGAAAACCTCCAGCCACACATTGATGCTCTGAGACTCGATGTCATTGTGATCCAATTCAACTATGGATTCTTTAATCATCGAGAACTGTCGGCGTTTATTCGTCGCCAGCATGACGCCGGTCGTTCAGTTGTTATGACGATGCACTCAACTGTGGATCCGCTGGAAAAAGAGCCGAGCTGGAATTTCCGTCTTGCTGAAATGAAAGAGGCGCTGGCACTTTGCGACCGGTTGTTGGTGCATTCGATTGCCGATATGAACCGCCTTAAAGATTTAGGCTTAACTGCGAATGTTGCTTTATTCCCGCACGGTGTTATCAACTACTCCGCAGCGAGCGTCACACGTCAACAGCAGTCTTTACCGCTAATTGCGAGCTATGGCTTCTGCTTACCGCATAAGGGCCTGATGGAACTAGTAGAATCCGTCCATAGACTCAAGCAAGCCGGTAAACCGGTTCGTTTACGACTGGTGAACGCAGAGTATCCTGTTGGGGAGTCACGCGATCTGGTGGCAGAGCTTAAAGCTGCTGCTCAGCGGTTAGGTGTTACCGATCTGATTGAGATGCATAATGATTTCCTACCTGATGCGGAGAGTCTGCGGTTGCTTTCAGAAGCCGATCTTCTGATTTTTGCTTATCAGAATACTGGGGAGTCTGCTAGCGGGGCGGTACGTTATGGTATGGCGACTCAAAAACCTGTTGCGGTAACGCCCCTGGCGATATTTGATGATTTGGACGATGCCGTCTTTAAATTTGATGGATGCAGCGTCGATGATATCAGTCAGGGGATTGACCGGATCCTGAATTCCATCCGTGAACAGAACTCTTGGGCAACCAGGACTCAACAACGTGCCGATGCATGGCGGGAACAACATGATTATCAAGCTGTTTCACGCCGTCTGGTTAATATGTGTCAAGGCTTAGCTAAAGCTAAATATTTTAAATAAAAATATCTCTCTTGTATTTTTTGCCTTTGAATACAAGAGGGGTTAGATAATGTGTCATTTATTATGAAAATTATTTTTGCTACTGAGCCAATTAAATACCCATTAACGGGCATCGGTCGGTATTCCCTGGAGCTGGTTAAGCGGCTGGCGGTCGCCCGCGAAATTGAAGAATTAAAGCTATTTCACGGTGCGTCGTTTATAGAACAGATCCCTTTGGTGGAGAATAAAAGCGATACCAAAGCCAGCAATCATGGTCGTCTGTCGGCGTTTCTACGCCGACAGACGCTGTTGATTGAGGCTTATCGCTTGCTGCATCCGCGGCGCCAGGCGTGGGCATTGCGCGACTATAAGGATTATATCTACCATGGCCCCAATTTTTATCTGCCGCATAAACTGGAACGCGCCGTGACCACGTTTCATGACATATCCATTTTTACCTGCCCGGAATATCATCCAAAAGATCGGGTTCGCTATATGGAGAAGTCCCTGCATGAGAGTCTGGATTCGGCAAAGCTGATCCTGACCGTTTCTGATTTCTCGCGCAGTGAAATTATCCGCTTGTTCAACTATCCGGCGGAGCGGATCGTAACCACCAAGCTAGCCTGCAGCAGTGACTATATCCCACGCAGCCCGGCAGAGTGTCTGCCGGTACTGCAGAAATATCAGCTGGCGTGGCAGGCCTACGCGCTATATATCGGCACTATGGAGCCACGTAAAAATATCCGAGGCCTGCTGCATGCCTATCAGCTGCTACCGATGGAGATCCGCATGCGCTATCCGCTAATCCTTAGCGGCTATCGCGGCTGGGAAGACGATGTGCTGTGGCAGTTAGTCGAGCGCGGTACTCGGGAAGGCTGGATCCGTTACCTCGGATATGTTCCGGATGAAGACCTGCCGTATCTGTACGCAGCGGCCAGAGTCTTTGTTTATCCCTCCTTCTACGAGGGATTCGGTTTACCTATTCTTGAAGCGATGTCTTGCGGTGTGCCGGTAGTATGCTCCAATGTCACCTCTTTGCCTGAGGTTGTTGGCGATGCCGGCCTCGTTGCCGATCCTAATGATATAGACGCGATTAGCGCGCAAATTTTGCAGAGCCTGCAAGATGATAGCTGGCGGGAAATCGCCACCGCGCGCGGTCTTGCTCAGGCGAAACAGTTTTCGTGGGAGAACTGTGCGACACAGACCATTAACGCCTATAAATTACTCTAAGGGTGTCAGTTGAGAGTTCTACACGTCTATAAGACTTACTATCCCGATACCTACGGCGGTATTGAGCAGGTCATTTATCAGCTAAGTCAGGGCTGCGCCCGCCGGGGAATCGCAGCCGATGTTTTCACTTTTAGCCCGGACAAAGATACAGGTCCTGTCGCTTACGAAGATCATCGGGTCATTTATAATAAACAGCTTTTTGAAATTGCCTCCACGCCGTTTTCGCTGAAAGCGTTAAAGCGTTTTAAGCTGATTAAAGATGACTACGATATCATCAACTACCATTTTCCGTTTCCCTTTATGGATATGCTGCATCTTTCGGCGCGGCCTGACGCCAGGACTGTGGTGACCTATCACTCTGATATAGTGAAACAAAAACGGTTAATGAAGCTGTACCAGCCGCTGCAGGAGCGATTTCTCAGCGGCGTAGATTGCATCGTTGCCTCGTCGCCCAATTACGTGGCTTCCAGCCAGACCCTGAAAAAATATCTGGATAAAACGGTGGTGATCCCGTTTGGTCTGGAGCAGCAGGACGTGCAGCACGATCCGCAGAGGGTCGCGCACTGGCGGGAAACTGTCGGCGATAAGTTCTTTCTCTTCGTCGGCACTTTCCGCTACTACAAAGGGCTGCATATTCTGATGGATGCCGCTGAGCGTAGCCGACTGCCAGTGGTGGTTGTAGGGGGCGGGCCGCTGGAATCGGAAGTGCGGCGTGAAGCGCAGCAGCGCGGGCTGAGCAATGTGATGTTTACCGGCATGCTCAACGACGAAGATAAGTACATTCTCTTCCAGCTCTGCCGGGGCGTGGTATTCCCCTCGCATCTGCGCTCTGAGGCGTTTGGCATTACGTTATTGGAAGGCGCACGCTTTGCAAGGCCGCTGATCTCTTGCGAGATCGGTACAGGTACCTCTTTCATTAACCAGGACAAAGTGAGTGGTTGCGTGATTCCGCCGAATGATAGCCAGGCGCTGGTGGAGGCGATGAATGAGCTCTGGAATAACGAGGAAACCTCCAACCGCTATGGCGAAAACTCGCGTCGTCGTTTTGAAGAGATGTTTACTGCCGACCATATGATTGACGCCTATGTCAATCTCTACACTACATTGCTGGAAAGCAAATCCTGAGCGGCCGCGAGCTCGTCGACTCGAGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 15 (예시적 O15 rfb 유전자좌 뉴클레오티드 서열 - O15-EPA 생산 균주 stLMTB11738)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCATGAGCAAAACTAAACTAAATGTTCTTTACCTTGCAATAAGTCAGGGTGCCAATTACCTACTGCCATTATTAATTTTTCCTTATCTTGTTAGAGTCATTGGTGTATCGAATTTTGGTGATCTGAGTTTTTCATTGATAACTATACAAGTGTTGTTAATGGTTGTTGAATATGGTTTTGGATATAGTGGGACAAGAGAAATAGCACTAAATAACGATAAAAAATACCATTCTGAATTTTTTTGCGGTGTGGTGCTTGCTCGTTTTATATTAATGCTAATTGCAGCTATAATACTCATAATACTCTGTTTTTTTTATGTTTTTAACGACGTTAAGTCTTTGTTATGTGTTGGTTTTCTGTCCGTAATTGCAGGTGTTTTCAATCCAAATTGGTTTTTGCAAGGTAAGGAAATGATGAGTGTGATGGCTGTGCTGTCACTATTTTCACGAGGCATAGCAGTCGTTGCAGTTTATCTAATTATAAAACCCGCAACGCCGATGTACATCAGTGCCTTATTATTGAGCATGCCATATATTTTGTATTCATTCTGTGGCGTTGCCTACTTACTTATTATCAAGGAGATTTTTTTATGTAGGCCACCGATAAAGAAAATTCAAGTAATTTTAAAAAATGGATTTCATTTTTTTTGTTCAACACTTGCGACTAGTGCATACACAATGTTGACCCCTCTTGTATTGGGTGGCGTATCTGGAAAGTTTGATGTAGGCATCTTTAACTCAGCTAACATGATCAAACAAGGTTTGGCTGGACTTGCATCACCATTAGTCCAAGCTTTTTATCCAAGAATTAACATTTTGCAAAGAGAGAATCCATATATTGCAAACTTAAAATCTAGAATGATTCTTAAATACTTGCTTGTTTTTTACATGGCTTTAGCAATACCATTTTTACTTTTTGCCAACCAATTATCATTATTAATATTCGGCATGAAAGGTGAAGTAATTGCAGGTGCAATGCAATTAATGACATTGCTTCCTATATTCATAGGTTTTAATACAGTTGTCGGGTTACTTGTATTAGTACCTAATGGGATGCAAAAACAGTATTTCAAATCTATTTTCCTAGGAACTATTACTTGTTTAAGCATAGTTTATCCAGCATGTAAATATTATGGAGCAACGGGTGCGATTGTGAGTCTTATTGTAGCTGAAATTTTCGTTGGCATGGGAATGCTTAAACAATTCATTAAAGTAAATAAAACCGTATGTAGGCCTCATAAATTATGAATATCTCGGTAATAATATCTGTTTGGAAACGCCCAGTTCAATTAGAATTGATTCTCTCTGAGCTCGATTCTCAGGCTAAAGACAATAGTCTACACCTAGAAGTAATTGTTTCCGATAGTCATAGTGGTAAAGAAATTGATGATGTAGTTGCTGATAATATTCATAAAAAGAAAAATATTAATATTATCCATCAACATACTAAAAATATACTCTCCGCTAAGCGCAATTTCGGAGCATCCCTAGCCCATGGGGATTATTTAATATTTCTTGATGATGATTGTATACCCGCAAGTGGATATATATCATCGTTGCTGAACTATTTAAAAAAAATGAATAGTAAAAGCGTTTTATGTGGGGAAGTTAGATTCGAAAATGAACTCATTGAGACCAGCAATTACTATCGCTACAGGAACTCTTTACACCCTAAGTTTAGTGATAGTCCTGATATCTCTATGAATGCCTGGACTTTTGTCGCAATGAATTGTGTTCTTGATAGAAAGGCATTTTCATCAGGTATAGTTTCATATAATGAAAATTTTATTGGTTATGGTTGTGAAGATCATGAGTTTGGGTGGCAACTTGAAAAAAATGACTTCAAAATTATTTTTGCTGATTTTAAAATATTACATCACGAATACAGTGGCGATATAGAAGGATATACAAAAAAAATTCGTGCTACAGCACGTGATGGTATGAATGTATTAAGCAAAGTAAGGCCTGAAATGTTTTCTACTAATAAAAAATTATTCCTAGTTGAGAAAATATTTAGTAAACACAAAACGTTTAGTAAAATATGCCAATCAATATTTTTCAATAAATTTATTTTTAAAAAAATAATACAATTTTTAAAAAAAACAGATGCAAATAAAAAACTCTATTTCCCAATTCTTTACAGATATGTGTTGATTTCGGCATATATACATGGTATTGGAGAGCGTGGCACCTCAAAAACAGATGATTTGCTTAAGAACTGGTATATATAGATGATGCTATCTTCATTTATTAAGACATTTGTATGGAAGGTAAAAAACAATGAAGTATAATGCATTGATGGCTTTTTTATTATTTTTTGTTGTTTTTTTTAGATTGTCGCTGATAATACCTTTCTTATATTTGGCATTTATTCCTGCATTTTTTGGTATTATGTATTTAGTGCGTAATTTTATGATTACTATGGGCAATGGATTGGTATCTATAGATCGTAAAAATTTGTTGCTGTTATCTATATTCATAATTATTTTTTTATTTTGTTTGGTTTTCGATTTGTTTCAAAAAAGCCATTCTTTTCAAAGTTATTTTACCGTTAGATTATTTATGTTGTTTTTATTTTCATTTGTTCCTGCGTATTATTTAGTAAATAGATTCATAAAGGGTGACTTGAAATTAATGGAGCGAATATTAGTGTATTCTCTCTGGGTTCAAATAGTTATTTTTTTTGGTATGTATATAAGTCCAGAGTTAAAAAGATTGTTATATACTTTCTTTGGTATGTCTGACTCTGTTAATCTTTGGGAACAAAATGCTAAAGTAAGAGGATTTGGGTTGTCGGGTGAAATAAATTTCATGACACCATTTTTGATGATCTATATGTCATTTTTTATGATGAAAAGGCGTTATGCTTTAATTACTTTAATTTGTCTGACTCAAATCGTAAATTCTAACATGGCTGTGATTGCAGCCATTATTGGTATCGGTTGCTCTAGACTTAATATTAATATAAAAATTGCAACAGTATTGATTTTGGGAGTTTTAGTTTATAGCTTAGGAGCGGTGTTCTTTCCTCGATTTTATGATGAGTTCGTTTCTGGAGATGGCACAAGAACTCTGGATATCTTATTACAGCAACATGTGTTTGTTGTAGGTAATTTAGATTTTTTTAATATTATATTTGGATTACAGCAAAACATATCTTCATCAATCCCCGATATTAAACAAAGTTCGGATATGGGCTGGGTTATACTGTTTAATTACGGTGGGTTAACATTTATTACACTCTTTTTATTTTTAATCTTTACTATTTCTATTGCGACATTTGGAATGACATATCAAGCAATTATATGGATGTTAATTGGGATAATTTTCAATACCAAAGGTTTAGTTTTAGGATCTAACGGCTATTTCTTTCTATCTTTTATATATATGTTTTTGAATAGAGTAACACTTAGTGGACAGAGTTCAATTACTAATAAGTTAGGTCAAGTAAGTAAATAGCTTCCAGAGTATATTTGTCAATGATTTGAGGTTCGGTTATTATGTTTTCATCTAAAACACTGTTAATTACTGGTGGTACTGGCTCTTTCGGGAATGCTGTATTAAATAGATTTCTTGATACAGATATTGCAGAAATCCGTATATTTAGTCGTGATGAAAAAAAACAAGATGATATGCGGAAAAAATACAATAATCAAAAATTAAAGTTCTATATTGGTGATGTCAGAGATTACCGTAGTATTTTGAATGCGACTCGCGGTGTTGATTTTATATATCATGCAGCGGCACTTAAGCAAGTTCCATCATGTGAATTTCATCCTATGGAAGCCGTTAAAACTAATATCCTTGGTACGGAAAATGTTCTTGAAGCAGCTATAGCGAATGAAGTGAAGAGGGTTGTATGCCTAAGTACTGATAAAGCTGTATACCCGATTAACGCAATGGGTATTTCAAAAGCTATGATGGAAAAGGTCATGGTCGCGAAATCCCGTAATGTTGATCGCAATAAAACAGTAATATGTGGTACCCGTTATGGGAATGTTATGGCATCTCGCGGTTCAGTTATTCCATTATTTGTTGATCTTATTAGAGCGGGCAAGCCACTCACAATAACTGATCCTAATATGACCCGCTTTATGATGACTCTTGAGGATGCGGTAGATTTAGTTCTTTATGCGTTTGAACATGGTAATAATGGTGATATCTTTGTGCAAAAAGCACCTGCAGCAACTATTGACACATTAGCTATTGCTTTAAAGGAATTACTAAATGTTCCTGACCATCCGGTAAATGTCATTGGAACGCGTCATGGCGAGAAATTATATGAAGCTCTACTTAGTCGTGAGGAAATGATCGCTGCTATAGATATGGGCGATTATTACCGTGTCCCGCCAGATCTTCGTGACCTTAATTATGGCAAATATGTTGAGCAAGGTGATAGCCGAATATCTGAAATAGAAGATTATAACTCTCATAATACTCAACGGTTAGATGTTGAAGGCATGAAAGAGCTCTTGCTAAAATTAGCCTTTATTCGAGCAATTCGTGCTGGTGAAAAATATAATCTGGATTCATGATATGAAAATATTAGTTACTGGTGCAAATGGTTTTATTGGTCGTAATTTATGTTTGAGGCTTGAGGAACTTGGTTATAAAGATCTTATTAGAATTGATCGAGAATCAACGAAGCAAGATCTTGAACAAGGCTTACAGGATGCCGATTTTATTTATCACTTAGCTGGTATCAATAGACCTAAGACTGATGATGAGTTTATTTCTGGAAACAGTGATTTAACAAAGCATATAGTTGAGTATCTCCTTTCTATTGGTAAGAATACACCAATTATGCTAAGTTCTTCGATACAAGCTGAACTTAATAATGCTTATGGGGTTAGCAAAGCTGTAGCTGAAAGCTATGTCGAAAAATATGCTGCTGCTAGTGGTTCTTCGTATTATATTTTCAGATATCCAAACGTTTTTGGTAAATGGTGTAAGCCAAACTATAATTCTTTTATAGCAACTTTTTGCTACAATATTTCCAATGATATTGAGATTACTATCAATGATGCAGCAGCGCCAGTCAATCTGGTCTATATTGATGATGTTTGTACTGATGCTATAGCTCTTCTCTCTGGGACGGTTGAAAGTGGATATAAAGTTGTTGCACCAATTTATTCAACAACAGTTGGTGAAGTTGCAGAATTAATTTATAGCTTCAAAAATAGCCGTTCCACCCTGATCACAGAGGCTGTCGGGGCGGGATTTACCCGTGCATTGTATTCTACATGGCTGAGTTATTTACCAGCAGAGAAGTTTGCGTACAAGGTACCTTTTTATGGGGATGCCCGCGGAGTCTTTTGTGAGATGTTGAAAACGCCTTCAGCGGGGCAGTTTTCATTTTTTACTGCTCACCCTGGTATTACGCGTGGCGGACATTACCATCACAGTAAAAATGAGAAGTTTTTGGTCATTCGAGGTCAGGCATGCTTTAAATTTGAACATGTGATTACCGGTGAGCGATATGAACTGAAAGTTTCATCGGGTGAGTTTAAGATTGTTGAAACAGTTCCTGGTTGGACACATGACATTACAAATATTGGAACTGATGAATTAATAGTCATGCTCTGGGCAAATGAAATTTTCAACCGTGATGAGCCCGATACTATTGCGAGACCTCTATAATGAAAAAATTAAAAGTTATGTCTGTTGTTGGAACCCGTCCTGAGATTATCCGTTTGTCGAGGGTTCTTGCTAAGTTTGATGAATACTGCGAGCATATTATTGTCCATACTGGTCAAAATTATGATTACGAATTAAATGAAGTGTTCTTCAATGACTTGGGTGTTCGAAAACCTGATTATTTTTTAAATGCAGCGGGTAAAAATGCGGCGGAAACCATTGGTCAGGTTATTATTAAGGTAGATGAAGTATTAGAAATCGAAAAACCTGAAGCAATACTGGTATTGGGCGATACGAATTCATGTATTTCTGCCATTCCGGCCAAACGCCGTAAAGTGCCTATATTTCATATGGAAGCAGGTAACCGTTGTTTCGATCAACGCGTGCCTGAAGAAACCAACAGACGTATTGTTGACCATACGGCTGATATCAATATGACCTACAGTGATATTGCTCGTGAATATCTCTTGGCTGAAGGTATCCCAGCTGATCGGATCATAAAAACTGGTAGCCCTATGTTTGAGGTTCTTTCATATTATATGCCCCAAATTGATGGTTCAGATGTGCTATCGCGTTTGAATCTACAGTCTGGTGAGTTTTTTGTAGTAAGTGCGCATCGTGAAGAGAATGTTGATTCTCCAAAACAGCTCGTAAAGCTTGCGAACATTCTAAATACTGTTGCTGAAAAATATAATCTTCCAGTTATTGTCTCCACACACCCAAGGACACGTAACCGAATCCGTGAGCAAGGAATTGAATTTCATTCAAATATAAATCTACTGAAACCATTGGGTTTCCATGATTATAACCACTTGCAGAAGAACTCACGAGCTGTGCTTTCAGATAGCGGTACTATCACTGAAGAGTCATCCATCATGAATTTCCCAGCGGTAAACATCCGGGAAGCGCATGAGCGTCCGGAAGGCTTTGAGGAAGCATCCGTCATGATGGTGGGGTTAGAGTGTGAACGCGTATTACAAGCGCTGGATATTCTGGCAACACAACCGCGAGGTGAAGTCCGTCTTTTACGTCAGGTTAGTGATTACAGCATGCCAAATGTGTCGGATAAAGTTGTCAGAATTGTTCACTCTTACACAGATTATGTTAAGAGAGTCGTCTGGAAAGAATATTGATGAAACTTGCTTTAATCATAGATGATTACCTGCCCAACAGTACTCGTGTTGGTGCAAAAATGTTTCATGAACTTGCTCAAGAATTTATCCAGCGTGGGCACGATGTTACGGTAATTACTCCTGGTACGGGCATGCAAGAAGAGATTTCTTTTGATACCTTTCAGGGGGTAAAAACATGGCGTTTTAAAAGCGGGCCGCTCAAGGATGTAAGTAAAATTCAGCGAGCGGTCAATGAAACGCTTTTGTCCTATCGGGCGTGGAAAGCCATCAAAAAATGGGTAAAAAAAGAGACCTTTGAGGGGGTGATTTATTATTCACCTTCCATATTCTGGGGGCCTTTAGTTAAAAAAATTAAAGCTCGTTGCCAATGTCCTGCTTATCTTATTTTAAGAGATATGTTTCCACAATGGGTAATTGATGCAGGAATGCTTAATGCTGGTTCCCCAATAGAACGCTACTTTCGTCTTTTTGAAAAAATATCTTATCGTCAGGCAAATCGTATTGGACTTATGTCTGATAAGAATCTTGATGTTTTTCGGAAAGATAATAAAGGCTATCCGTGCGAAGTTTTGCGTAATTGGGCATCCCTAACACCAACGATCATACCCAAGGATTATATACCACTACGTAAGCGACTTGGCCTAGAGGATAAAACCATTTTCTTCTATGGTGGAAACATAGGTCATGCACAGGACATGACAAACTTGATGCGACTTGTGAGAAACATGGCAGCATATCCTCAAGCTCATTTCCTATTTATTGGCCAGGGGGATGAAGTTGAATTAATTAATTCATTAGCATCTGAGTGGGCATTGACGAATTTCACCTATTTGCCCTCGGTTAACCAAGATGAATTTAAGTTCATTTTGTCGGAAATGGATATCGGCTTGTTTTCTCTTTCCGCTAGACACTCTTCCCATAATTTTCCTGGTAAGTTATTAGGCTATATGGTTCAGTCGCTACCTATTTTAGGTAGCGTAAATGCCGGAAATGATTTGCTCGACATTGTCAATCAAAATAATGCGGGATTAATCCATGTCAATGGTGAGGACGATAAATTATGTCAATCTGCGCTATTAATGTTGCATGATATTGATGTGCGCCGGCAACTTGGTTCGGGGGCGAATATATTGTTGAAAGAACAATTCTCCGTTGAGTCTGCGGCACAGACGATAGAAATGAGGTTGGAGGCATGCAATGCGATTAATTGATAATGACCAACTCGACGAATTATATGATCAAGCCGGGCAATCGGAACGTTTACGTTCCCACCTTATGATGCACGGCTCGCATCAAGAAAAGGTACAGCGTTTACTTATTGCATTAGTAAAGGGCAGCTATGTTGAACCGCATTATCACGAACTTCCTCATCAGTGGGAAATGTTCATTGTTATGGAGGGGCAACTTCAGGTTTGTTTGTATGGTAGAAATGGTGAGGTTATAAAGCAATTTATAGCAGGAGATAATACTGGAATGAGCATTGTGGAGTTTTCTCCGGGCGATATACACAGTGTCGAATGCCTATCTCCGCGTGCTCTTATGGTGGAAGTTAAGGAGGGGCCATTTGACCCTTCTTTTGCAAAATCGTTCGTGTGAGCGGCCGCGAGCTCGTCGACTCGAGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 16 (예시적 O16 rfb 유전자좌 뉴클레오티드 서열 - O16-EPA 생산 균주 stLMTB11739)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGTGAAAATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCAGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCGGGAATCACTTGCTGATGTTTCTGATTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCACCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCCGCTCGCAATTACTGGTCTGCTCTTGATAGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTCTATGGTGATTTGCCTCATCCAGATGAAGTAAATAATACAGAAGAATTACCCTTATTTACTGAGACGACAGCTTACGCGCCAAGCAGCCCTTATTCCGCATCCAAAGCATCCAGCGATCATTTAGTCCGCGCGTGGAAACGTACATATGGTTTACCGACAATTGTGACTAATTGCTCGAACAACTATGGTCCTTATCATTTCCCGGAAAAGCTTATTCCACTGGTTATTCTTAATGCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGAGATCAGATCCGCGACTGGTTGTATGTTGAAGATCATGCGCGTGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGTGAAACTTATAACATTGGTGGGCACAACGAAAAGAAAAACATCGATGTAGTGCTCACTATTTGTGATTTGCTGGATGAGATTGTACCGAAAGAGAAATCTTATCGTGAGCAAATCACTTATGTTGCTGATCGTCCGGGACACGATCGCCGCTATGCTATTGATGCTGAGAAGATTGGTCGCGCATTGGGATGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGTAAAACGGTGGAATGGTACCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTTTGGGTAATTTGATTGCTTTTGATGTTCACTCTACTGATTATTGCGGTGATTTTAGTAATCCTGAAGGTGTAGCTGAAACCGTAAGAAGCATTCGGCCGGATATTATTGTCAATGCAGCCGCTCACACCGCAGTAGACAAAGCAGAATCAGAACCGGAGTTTGCACAATTAATTAACGCAACAAGTGTCGAAGCGATTGCGAAAGCAGCAAATGAAGTTGGAGCCTGGGTTATCCATTACTCGACTGATTACGTCTTCCCTGGAAATGGCGATATGCCATGGCTGGAGACGGATGCAACCGCACCACTAAATGTTTACGGTGAAACCAAGTTAGCCGGAGAAAAAGCGTTACAGGAATATTGCGCGAAGCATCTTATTTTCCGGACCAGCTGGGTCTATGCAGGAAAAGGAAATAACTTCGCCAAAACGATGTTACGTCTGGCAAAAGAGCGTGAAGAATTAGCGGTTATTAACGATCAGTTTGGTGCGCCAACAGGTGCTGAACTGCTGGCTGATTGTACAGCACATGCCATTCGTGTCGCACTGAATAAACCGGATGTCGCAGGCTTGTACCATTTGGTAGCCAGTGGTACCACAACCTGGTACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGCATTCCCCTTGCACTCAACAAGCTCAACGCAGTACCAACAACAGCCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTTGGCGTGAAACGAATGCTCAATGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTGATGGTGGAGCAAGATGAATTAAAAGGAATGATGAAATGAAAATGCGTAAAGGTATTATTTTAGCGGGTGGTTCTGGTACACGTCTTTATCCTGTGACTATGGCTGTCAGTAAACAGCTATTACCTATTTATGATAAACCGATGATCTATTACCCGCTCTCTACACTGATGTTGGCGGGTATTCGCGATATTTTGATTATCAGTACACCTCAGGATACTCCTCGTTTTCAACAATTGCTGGGTGACGGTAGCCAGTGGGGCCTGAATCTTCAGTACAAAGTGCAACCTAGCCCAGATGGCCTCGCGCAGGCATTTATCATCGGTGAAGAGTTTATTGGTGGTGATGATTGTGCTTTGGTTCTTGGTGATAATATCTTTTACGGTCACGATCTGCCGAAGCTAATGGAGGCCGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCAGAACGCTATGGTGTCGTTGAGTTTGATAAAAACGGTACGGCAATCAGTCTGGAAGAAAAACCGTTAGAACCAAAGAGTAATTACGCCGTTACAGGTCTGTACTTTTATGATAACGACGTGGTTCAGATGGCGAAAAACTTGAAGCCGTCTGCACGTGGTGAGTTAGAAATTACAGATATTAACCGTATTTATCTTGAGCAGGGACGTCTGTCTGTCGCGATGATGGGGCGTGGCTACGCGTGGCTGGACACGGGGACTCATCAGAGTCTGATAGAAGCAAGTAATTTTATTGCGACAATTGAAGAGCGCCAGGGATTGAAGGTTTCCTGTCCTGAAGAGATTGCATTTCGTAAAGGTTTTATTGATGTTGAGCAAGTAAGAAAATTAGCTGTACCACTAATAAAGAATAATTATGGGCAGTATCTTTATAAAATGACGAAGGATTCAAATTAATGAATGTGATTAGAACTGAAATTGAAGATGTGCTAATTCTGGAGCCAAGAGTATTTGGTGATGATAGAGGTTTCTTTTATGAGAGCTTTAATCAATCAGCATTTGAACATATTCTAGGCTATCCGGTCAGCTTTGTTCAAGACAATCACTCACGTTCATCAAAAAATGTACTCAGAGGCCTTCACTTTCAACGCGGCGAGTACGCACAAGATAAACTTGTACGCTGCACTCATGGAGCAGTTTTTGATGTTGCTGTTGATATTCGACCCAATTCGGTATCCTTTGGTAAATGGGTTGGTGTTCTGCTTTCAGCTGATAATAAGCAGCAGTTGTGGATACCAAAAGGGTTTGCTCATGGCTTTTTGGTTCTGTCTGATATCGCTGAATTTCAATATAAAACTACAAACTATTATCATCCTGAAAGCGATTGTGGAATATGTTGGAATGATGAACGCATTGCAATTGATTGGCCCCAAACATCAGGGTTAATCCTTTCGCCAAAAGATGAAAGGCTCTTTACGTTAGATGAGCTTATCAGATTAAAATTAATTGCATGAATACGAATAAATTATCTTTAAGAAGAAACGTTATATATCTGGCTGTCGTTCAAGGTAGCAATTATCTTTTACCATTGCTTACATTTCCATATCTTGTAAGAACACTTGGTCCTGAAAATTTCGGTATATTCGGTTTTTGCCAAGCGACTATGCTATATATGATAATGTTTGTTGAATATGGTTTCAATCTCACAGCAACTCAGAGTATTGCCAAAGCAGCAGATAGTAAAGATAAAGTAACGTCTATTTTTTGGGCGGTGATATTTTCAAAAATAGTTCTTATCGTCATTACATTGATTTTCTTAACGTCGATGACCTTGCTTGTTCCTGAATATAACAAGCATGCCGTAATTATATGGTCGTTTGTTCCTGCATTAGTCGGGAATTTAATCTACCCTATCTGGCTGTTTCAGGGAAAAGAAAAAATGAAATGGCTGACTTTAAGTAGTATTTTATCCCGCTTGGCTATTATCCCTCTAACATTTATTTTTGTGAACACAAAGTCAGATATAGCAATTGCCGGTTTTATTCAGTCAAGTGCAAATCTGGTTGCTGGAATTATTGCACTAGCTATCGTTGTTCATGAAGGTTGGATTGGTAAAGTTACGCTATCATTACATAATGTGCGTCGATCTTTAGCAGACGGTTTTCATGTTTTTATTTCCACATCTGCTATTAGTTTATATTCTACGGGAATAGTTATTATCCTGGGATTTATATCTGGACCAACGTCCGTAGGGAATTTTAATGCGGCCAATACTATAAGAAACGCGCTTCAAGGGCTATTAAATCCTATCACCCAAGCAATATACCCAAGAATATCAAGTACGCTTGTTCTTAATCGTGTGAAGGGTGTGATTTTAATTAAAAAATCATTGACCTGCTTGAGTTTGATTGGTGGTGCTTTTTCATTAATTCTGCTCTTGGGTGCATCTATACTAGTAAAAATAAGTATAGGGCCGGGATATGATAATGCAGTGATTGTGCTAATGATTATATCGCCTCTGCCTTTTCTTATTTCATTAAGTAATGTCTATGGCATTCAAGTTATGCTGACCCATAATTATAAGAAAGAATTCAGTAAGATTTTAATCGCTGCGGGTTTGTTGAGTTTGTTGTTGATTTTTCCGCTAACAACTCTTTTTAAAGAGATTGGTGCAGCAATAACATTGCTTGCAACAGAGTGCTTAGTTACGTCACTCATGCTGATGTTCGTAAGAAATAATAAATTACTGGTTTGCTGAGGATTTTATGTACGATTATATCATTGTTGGTTCTGGTTTGTTTGGTGCCGTTTGTGCGAATGAGTTAAAAAAGCTAAACAAAAAAGTTTTAGTGATTGAGAAAAGAAATCATATCGGTGGAAATGCGTACACAGAGGACTGTGAGGGTATCCAGATTCATAAATATGGTGCACATATTTTTCATACCAATGATAAATATATATGGGATTACGTTAATGATTTAGTAGAATTTAATCGTTTTACTAATTCTCCACTGGCGATTTATAAAGACAAATTATTCAACCTTCCTTTTAATATGAATACTTTCCACCAAATGTGGGGAGTTAAAGATCCTCAAGAAGCTCAAAATATCATTAATGCTCAGAAAAAAAAGTATGGTGACAAGGTACCTGAAAATTTGGAGGAGCAGGCGATTTCATTAGTTGGGGAGGACTTATACCAAGCATTGATAAAGGGTTATACGGAGAAGCAGTGGGGAAGAAGTGCAAAAGAATTGCCTGCATTTATTATTAAGCGAATCCCAGTGAGATTTACGTTTGATAACAATTATTTTTCCGATCGCTATCAAGGTATTCCGGTGGGAGGCTACACTAAGCTTATTGAAAAAATGCTTGAAGGTGTGGACGTAAAATTAGGCATTGATTTTTTGAAAGACAAAGATTCTCTAGCGAGTAAAGCCCATAGAATCATCTACACTGGACCCATTGATCAGTACTTCGACTATAGGTTTGGAGCGTTAGAATATCGCTCTTTAAAATTTGAGACGGAACGCCATGAATTTCCAAACTTCCAAGGGAATGCAGTAATAAATTTCACTGATGCTAATGTACCATATACCAGAATAATTGAGCATAAACATTTTGACTATGTTGAGACAAAGCATACGGTTGTTACAAAAGAATATCCATTAGAGTGGAAAGTTGGCGACGAACCCTACTATCCAGTTAATGATAATAAAAACATGGAGCTTTTTAAGAAATATAGAGAGTTAGCTAGCAGAGAAGACAAGGTTATATTTGGCGGGCGTTTGGCCGAGTATAAATATTATGATATGCATCAAGTGATATCTGCCGCTCTTTATCAAGTGAAAAATATAATGAGTACGGATTAATGATCTATCTTGTAATTAGTGTCTTTCTCATTACAGCATTTATCTGTTTATATCTTAAGAAGGATATATTTTATCCAGCCGTATGCGTTAATATCATCTTCGCACTGGTCTTATTGGGATATGAAATAACGTCAGATATATATGCTTTTCAGTTAAATGACGCTACGTTGATTTTTCTACTTTGCAATGTTTTGACATTTACCCTGTCATGTTTATTGACGGAAAGTGTATTAGATCTAAATATCAGAAAAGTCAATAATGCTATTTATAGCATACCATCGAAGAAAGTGCATAATGTAGGCTTGTTAGTTATTTCTTTTTCGATGATATATATATGCATGAGGTTAAGTAACTACCAGTTCGGGACTAGCTTACTTAGCTATATGAATTTGATAAGAGATGCTGATGTTGAAGACACATCAAGAAATTTCTCAGCATACATGCAGCCAATCATTCTAACTACTTTTGCTTTATTTATTTGGTCTAAAAAATTTACTAATACAAAGGTAAGTAAAACATTTACTTTACTTGTTTTTATTGTATTCATCTTTGCAATTATACTGAATACTGGTAAGCAAATTGTCTTTATGGTTATCATCTCTTATGCATTCATCGTAGGTGTTAATAGAGTAAAACATTATGTTTATCTTATTACAGCTGTAGGTGTTCTATTCTCCTTGTATATGCTCTTTTTACGTGGACTGCCTGGGGGGATGGCATATTATCTATCCATGTATTTGGTCAGCCCTATAATCGCGTTTCAGGAGTTTTATTTTCAGCAAGTATCTAACTCTGCCAGTTCTCATGTCTTTTGGTTTTTTGAAAGGCTGATGGGGCTATTAACAGGTGGAGTCTCTATGTCGTTGCATAAAGAATTTGTGTGGGTGGGTTTGCCAACAAATGTTTATACTGCTTTTTCGGATTATGTTTATATTTCCGCGGAGCTAAGCTATTTGATGATGGTTATTCATGGCTGTATTTCAGGTGTTTTATGGAGATTGTCTCGAAATTACATATCTGTGAAAATATTTTATTCATATTTTATTTATACCTTTTCTTTCATTTTTTATCATGAAAGCTTCATGACTAATATTAGCAGTTGGATACAAATAACTCTTTGTATCATAGTATTCTCTCAATTTCTTAAGGCCCAGAAAATAAAGTGAAAATGTATTTTTTGAATGATTTAAATTTCTCTAGACGCGATGCTGGATTTAAAGCAAGAAAAGATGCACTGGACATTGCTTCAGATTATGAAAACATTTCTGTTGTTAACATTCCTCTATGGGGTGGAGTAGTCCAGAGAATTATTAGTTCTGTTAAGCTTAGTACATTTCTCTGCGGTCTTGAAAATAAAGATGTTTTAATTTTCAATTTCCCGATGGCCAAACCATTTTGGCATATATTGTCATTCTTTCACCGCCTTCTAAAATTTAGAATAGTACCTCTGATTCATGATATTGATGAATTAAGAGGAGGAGGGGGTAGTGATTCTGTGCGGCTTGCTACCTGTGATATGGTCATAAGTCACAATCCACAAATGACAAAGTACCTTAGTAAATATATGTCTCAGGATAAAATCAAAGACATAAAAATATTTGATTACCTCGTCTCATCTGATGTGGAGCATCGAGATGTTACGGATAAGCAACGAGGGGTCATATATGCTGGCAACCTTTCTAGGCATAAATGTTCTTTCATATATACTGAAGGATGCGATTTTACTCTCTTTGGTGTCAACTATGAAAATAAAGATAATCCTAAATATCTTGGAAGTTTTGATGCTCAATCTCCGGAAAAGATTAACCTCCCAGGCATGCAATTTGGACTCATTTGGGATGGAGATTCTGTCGAAACCTGTAGTGGTGCCTTTGGCGACTATTTAAAGTTTAATAACCCTCATAAGACATCTCTTTATCTTTCAATGGAACTTCCAGTATTTATATGGGATAAAGCCGCCCTTGCGGATTTCATTGTAGATAATAGAATAGGATATGCAGTGGGATCAATCAAAGAAATGCAAGAGATTGTTGACTCCATGACAATAGAAACTTATAAGCAAATTAGTGAGAATACAAAAATTATTTCTCAGAAAATTCGAACAGGAAGTTACTTCAGGGATGTTCTTGAAGAGGTGATCGATGATCTTAAAACTCGCTAAACGATATGGTCTCTGTGGTTTTATTCGGCTTGTTAGAGATGTCTTATTGACTCGTGTATTTTACCGGAACTGTAGAATTATTCGATTTCCCTGCTATATTCGCAATGATGGTAGCATTAATTTTGGTGAAAATTTCACAAGTGGAGTCGGTCTCAGGCTGGATGCATTTGGACGTGGCGTGATTTTTTTTTCCGATAATGTGCAAGTTAACGACTATGTTCATATCGCCTCAATTGAGAGCGTTACGATAGGTCGGGATACGCTTATTGCAAGTAAAGTATTTATTACCGATCATAATCACGGTTCCTTTAAGCACTCTGATCCAATGAGTTCGCCAAATATACCTCCAGACATGCGCACGTTGGAATCTTCAGCTGTTGTAATTGGCCAGAGGGTTTGGTTGGGTGAGAATGTGACGGTTTTGCCTGGAACAATTATTGGTAATGGAGTCGTAGTCGGCGCCAATTCTGTTGTTAGAGGTTCTATTCCCGAAAATACTGTCATTGCGGGAGTACCAGCAAAAATCATAAAGAAATACAATCATGAGACCAAATTATGGGAAAAAGCATAGTCGTTGTTTCTGCGGTCAATTTTACCACTGGCGGTCCATTTACCATTTTGAAAAAATTTTTGGCAGCAACTAATAATAAAGAAAATGTCAGTTTTATCGCATTAGTCCATTCTGCTAAAGAGTTAAAAGAAAGTTATCCATGGGTTAAATTCATTGAGTTTCCTGAGGTTAAAGGGTCGTGGCTAAAACGTTTGCACTTTGAATATGTAGTTTGTAAAAAACTTTCAAAAGAGCTGAATGCTACGCATTGGATTTGTCTGCATGATATTACGGCCAATGTCGTCACTAAAAAAAGATATGTGTATTGTCATAACCCTGCCCCTTTTTATAAAGGAATTTTATTCCGTGAAATTCTTATGGAGCCTAGCTTTTTCTTATTTAAAATGCTATACGGGCTGATATATAAAATAAACATTAAAAAAAATACTGCAGTGTTTGTTCAACAATTCTGGATGAAAGAAAAATTTATCAAGAAATATTCTATAAATAACATCATTGTCAGTCGGCCAGAAATTAAATTATCTGATAAAAGCCAACTTACTGATGATGATTCTCAATTTAAGAATAACCCTTCTGAGTTGACAATATTTTACCCTGCTGTTCCACGAGTATTTAAAAATTACGAGCTTATTATTAGTGCAGCAAGGAAATTGAAAGAACAATCCAATATTAAATTTCTGCTTACTATCAGTGGTACAGAAAATGCGTATGCAAAATATATTATCAGTCTTGCAGAAGGACTGGATAATGTTCATTTCCTCGGGTACTTGGATAAAGAAAAAATCGATCATTGTTATAATATTTCAGATATAGTTTGTTTTCCCTCTAGGTTAGAAACATGGGGATTGCCGTTGTCTGAGGCTAAAGAGCGAGGTAAGTGGGTATTAGCATCAGATTTCCCATTTACTAGAGAAACTCTTGGTAGTTATGAAAAGAAAGCTTTTTTTGATTCTAATAACGATGACATGTTAGTTAAACTTATTATTGACTTCAAAAAAGGTAACCTCAAAAAAGATATCTCTGATGCAAATTTCATTTATCGTAATGAAAATGTATTAGTTGGGTTTGATGAACTAGTTAATTTTATTACTGAAGAACATTGAAATGGTATATATAATAATCGTTTCCCACGGACATGAAGACTACATCAAAAAATTACTCGAAAATCTTAATGCTGACGATGAGCACTACAAGATTATCGTACGCGACAACAAAGACTCTCTATTATTGAAACAAATATGCCAGCATTATGCAGGCCTGGACTATATTAGTGGAGGTGTATACGGCTTTGGTCATAATAATAATATTGCGGTGGCGTATGTAAAGGAAAAATATAGACCCGCAGATGATGATTACATTTTGTTTTTGAATCCCGATATCATCATGAAGCATGATGATTTGCTGACATATATTAAATATGTCGAAAGTAAGCGTTATGCTTTTAGTACATTATGCCTGTTCCGAGATGAAGCGAAATCTTTACATGATTATTCCGTAAGAAAATTTCCTGTGCTTTCTGATTTTATTGTGTCATTTATGTTAGGGATTAATAAAACAAAAATTCCTAAAGAAAGTATCTATTCTGATACGGTTGTTGATTGGTGCGCAGGATCATTTATGCTGGTACGTTTTTCAGATTTTGTGCGTGTAAATGGCTTCGATCAAGGTTACTTTATGTACTGTGAAGATATTGACCTGTGCTTGAGGCTTAGCCTGGCTGGTGTCAGACTTCATTATGTTCCCGCTTTTCATGCGATACATTATGCTCATCATGACAATCGAAGTTTTTTTTCAAAAGCCTTCAGATGGCACTTAAAAAGTACTTTTAGATATTTAGCCAGAAAACGTATTTTATCAAATCGCAACTTTGATCGAATTTCATCAGTTTTTCACCCGTAAGAGCTCGGTACCCGGGCCTAGGGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATCCGTCGACGGCGGCCGCCCTGCAGGCATGCAAGCTTGATCCATATGGATCGCTAGCTTAATTAAATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACGGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACGGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAAAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 17 (예시적 O18A rfb 유전자좌 뉴클레오티드 서열 - O18A-EPA 생산 균주 BVEC-L-00559)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGTGAAAATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCAGCTGTAGTTCGTCACATTATAAATAATACGCAGGATAGTGTTGTTAATGTCGATAAATTAACGTACGCCGGAAACCGGGAATCACTTGCTGATGTTTCTGATTCTGAACGCTATGTTTTTGAACATGCGGATATTTGCGATGCACCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCTGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTTGGTACTTATGTCCTTTTGGAAGCCGCTCGCAATTACTGGTCTGCTCTTGATAGCGACAAGAAAAATAGCTTCCGTTTTCATCATATTTCTACTGACGAAGTCTATGGTGATTTGCCTCATCCAGATGAAGTAAATAATACAGAAGAATTACCCTTATTTACTGAGACGACAGCTTACGCGCCAAGCAGCCCTTATTCCGCATCCAAAGCATCCAGCGATCATTTAGTCCGCGCGTGGAAACGTACATATGGTTTACCGACAATTGTGACTAATTGCTCGAACAACTATGGTCCTTATCATTTCCCGGAAAAGCTTATTCCACTGGTTATTCTTAATGCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGAGATCAGATCCGCGACTGGTTGTATGTTGAAGATCATGCGCGTGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGTGAAACTTATAACATTGGTGGGCACAACGAAAAGAAAAACATCGATGTAGTGCTCACTATTTGTGATTTGCTGGATGAGATTGTACCGAAAGAGAAATCTTATCGTGAGCAAATCACTTATGTTGCTGATCGTCCGGGACACGATCGCCGCTATGCTATTGATGCTGAGAAGATTGGTCGCGCATTGGGATGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGTAAAACGGTGGAATGGTACCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTTTGGGTAATTTGATTGCTTTTGATGTTCACTCTACTGATTATTGCGGTGATTTTAGTAATCCTGAAGGTGTAGCTGAAACCGTAAGAAGCATTCGGCCGGATATTATTGTCAATGCAGCCGCTCACACCGCAGTAGACAAAGCAGAATCAGAACCGGAGTTTGCACAATTAATTAACGCAACAAGTGTCGAAGCGATTGCGAAAGCAGCAAATGAAGTTGGAGCCTGGGTTATCCATTACTCGACTGATTACGTCTTCCCTGGAAATGGCGATATGCCATGGCTGGAGACGGATGCAACCGCACCACTAAATGTTTACGGTGAAACCAAGTTAGCCGGAGAAAAAGCGTTACAGGAATATTGCGCGAAGCATCTTATTTTCCGGACCAGCTGGGTCTATGCAGGAAAAGGAAATAACTTCGCCAAAACGATGTTACGTCTGGCAAAAGAGCGTGAAGAATTAGCGGTTATTAACGATCAGTTTGGTGCGCCAACAGGTGCTGAACTGCTGGCTGATTGTACAGCACATGCCATTCGTGTCGCACTGAATAAACCGGATGTCGCAGGCTTGTACCATTTGGTAGCCAGTGGTACCACAACCTGGTACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGCATTCCCCTTGCACTCAACAAGCTCAACGCAGTACCAACAACAGCCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTTGGCGTGAAACGAATGCTCAATGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTGATGGTGGAGCAAGATGAATTAAAAGGAATGATGAAATGAAAATGCGTAAAGGTATTATTTTAGCGGGTGGTTCTGGTACACGTCTTTATCCTGTGACTATGGCTGTCAGTAAACAGCTATTACCTATTTATGATAAACCGATGATCTATTACCCGCTCTCTACACTGATGTTGGCGGGTATTCGCGATATTTTGATTATCAGTACACCTCAGGATACTCCTCGTTTTCAACAATTGCTGGGTGACGGTAGCCAGTGGGGCCTGAATCTTCAGTACAAAGTGCAACCTAGCCCAGATGGCCTCGCGCAGGCATTTATCATCGGTGAAGAGTTTATTGGTGGTGATGATTGTGCTTTGGTTCTTGGTGATAATATCTTTTACGGTCACGATCTGCCGAAGCTAATGGAGGCCGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCAGAACGCTATGGTGTCGTTGAGTTTGATAAAAACGGTACGGCAATCAGTCTGGAAGAAAAACCGTTAGAACCAAAGAGTAATTACGCCGTTACAGGTCTGTACTTTTATGATAACGACGTGGTTCAGATGGCGAAAAACTTGAAGCCGTCTGCACGTGGTGAGTTAGAAATTACAGATATTAACCGTATTTATCTTGAGCAGGGACGTCTGTCTGTCGCGATGATGGGGCGTGGCTACGCGTGGCTGGACACGGGGACTCATCAGAGTCTGATAGAAGCAAGTAATTTTATTGCGACAATTGAAGAGCGCCAGGGATTGAAGGTTTCCTGTCCTGAAGAGATTGCATTTCGTAAAGGTTTTATTGATGTTGAGCAAGTAAGAAAATTAGCTGTACCACTAATAAAGAATAATTATGGGCAGTATCTTTATAAAATGACGAAGGATTCAAATTAATGAATGTGATTAGAACTGAAATTGAAGATGTGCTAATTCTGGAGCCAAGAGTATTTGGTGATGATAGAGGTTTCTTTTATGAGAGCTTTAATCAATCAGCATTTGAACATATTCTAGGCTATCCGGTCAGCTTTGTTCAAGACAATCACTCACGTTCATCAAAAAATGTACTCAGAGGCCTTCACTTTCAACGCGGCGAGTACGCACAAGATAAACTTGTACGCTGCACTCATGGAGCAGTTTTTGATGTTGCTGTTGATATTCGACCCAATTCGGTATCCTTTGGTAAATGGGTTGGTGTTCTGCTTTCAGCTGATAATAAGCAGCAGTTGTGGATACCAAAAGGGTTTGCTCATGGCTTTTTGGTTCTGTCTGATATCGCTGAATTTCAATATAAAACTACAAACTATTATCATCCTGAAAGCGATTGTGGAATATGTTGGAATGATGAACGCATTGCAATTGATTGGCCCCAAACATCAGGGTTAATCCTTTCGCCAAAAGATGAAAGGCTCTTTACGTTAGATGAGCTTATCAGATTAAAATTAATTGCATGAGGCCGGCCTTAAGGAGGACTAGTCCCGGCGCGCCATGAGTTTAATCAAAAACAGTTTTTGGAACCTTTGCGGGTATGTACTTCCAGCTATTGTGACACTACCAGCTTTGGGTATTATGGGGCGAAAATTAGGCCCAGAATTATTTGGTGTATTCACTTTGGCATTAGCTGTTGTGGGTTATGCAAGCATTTTTGATGCAGGCCTTACTCGCGCAGTGATACGAGAAGTCGCAATTGAAAAAGATAATGAAGAAAATAAGTTGAAAATTATTTCTTCAGCGACAGTTGTAATTATTTATTTGAGTTTGGCCGCCTCACTCTTATTATTTTTTTTTAGTGGTCATATCGCATTGCTACTGAACATTAGTGAGACTTTTTTTCATAATGTAAGTGTCTCGCTTAAAATTCTCGCAGCATCCATACCATTATTTTTGATTACTCAAATATGGTTGTCAATTTTAGAAGGTGAAGAAAGATTTGGTTTACTTAATATCTACAAATCAATTACGGGAGTGATATTAGCAATCTCACCGGCATTATTTATACTTATTAAACCCTCTTTGATGTATGCGATAATAGGCTTAGTTCTAGCAAGGTTTTTATGTTTTATTTTGGCTTTTATAATTTGTCACGATAAAGTGCTTAAAGCTAAACTAACAATCGATATACCAACAATTAAAAGATTGTTTATGTTCGGTGGTTGGATTACAGTAAGTAATATCATCAGCCCTGTGCTATCATATTTTGATAGGTTTATTGTTTCAAATCAACTTGGGGCTGCTAATGTTGCTTTTTATACTGCACCATCAGAAATTATTTCTCGGCTTAGTATAATTCCAGGTGCGTTTTCAAGAGCCTTATTTCCAAGATTAGCTAATGCAAATAATTCCGCTGAAAGATATAAAACGAAAAGATTAATTACAATTTCACTTTTAATAATCATCACCCCTATTTTTTGTATTGGCGTGTTATTTTCAGAGAAGATAATGGTTTTATGGATGGGGGCATCATTTTTTGGTGAGCCTGGTTTGGTATTATCAATATTACTGATTGGCTTTATTTTTAATGGATTGGCACAAGTACCATTTGCCAGTATTCAATCCCGAGGTCATGCTAAGATAACTGCATTTGTTCATCTCTTAGAGTTGTTTCCTTATTTATTACTTTTATTTTACCTCATAAAAGCACATGGGGTTGTTGGCGCGGGTATTGCGTGGTCAGTGAGGATGATAGTAGATTATATAGCATTAAGTCTTTTGGACGGTAAGTATATTAATAAATAAAATTCAAAATGCAAGTTAATAACTCATGGCTTTATTTGGGTAGGTGACAATTTATAATGATATATATATTAACTTTAACTCTTCTTCTAGTTATAGCCATAATGTTTTCTCTTCTCGGCACAAAAAGTAGGATCACATCTCCATTACCTTTGCATTTTTTACCATGGTTACTAACTTTAATTGTCGGGATAAGTAATTACGATCAATTTTACGAGTTTAATGAAAGAAGCTTTTACTCTTTGTTGATTTGGTTTACAGTTATTTTTATATTTTATTTCATAGGGGAACTGGTTAATTATAAACGTGAAAATATAAATGTTTATTATGGTCTTTCACATATTAAATATGAATGTAAAAAATATTGGATCATTGTCATCCCAATTTCATTATATACCATTTTCGAAATATATATGGTTGGTATGGGGGGAGCAGATGGATTCTTTCTCAATTTACGTCTTGCAAATACATTGGAGGGCTATACGGGTAAAAAATTTATCTTAATGCCTGCTGTATATCCTCTAATGATGGCTATGTTCGCAATTGTTTGTCTAACAAAAACTTCCAAATTAAATAAATACTCCATTTATTTCTGGATGTTTTTGTATTGTATTGGCACAATGGGAAAATTTTCAATATTAACGCCAATATTGACATATTTAATTATTTATGACTTCAAACATAGATTAAAAGTAAAAAAAACAATAAAGTTTACATTGTTGATAATTATATTAGCTTTAACTTTGCATTTTACACGTATGGCTGAGAATGACCACTCAACATTTTTATCTATTTTAGGGCTCTATATTTATTCACCAATAATTGCTTTAGGCCAGTTGAATGAAGTAAATAGTAGTCATTTTGGTGAGTATACGTTTAGATTCATATATGCTATAACTAATAAAATTGGCCTTATTAAAGAATTGCCAGTAAATACTATTCTTGACTATTCATACGTTCCTGTACCAACAAATGTATATACTGCACTTCAACCATTTTACCAGGATTTTGGTTATACTGGCATCATATTTGGAGCAGTATTATACGGACTAATATATGTGAGTTTATACACGGCCGGTGTTCGTGGAAATAATACACAGGCATTACTGATTTACGCATTGTTTTCAGTTAGCAGTGCAACGGCTTTCTTCGCTGAAACGCTAGTAACGAATTTAGCTGGAAATGTGATGTTAGTATTATGTACCATCTTACTATGGCGATTTACAGTAATATGCAAACCAGTACAGTAACCATTCTAATGGCCACCTACAATGGCGAGGCCTTCATCAAAAATCAGATTTTGTCACTACAACAACAAACATTTTCTAACTGGCGGTTATTTATTCAGGATGATGGGTCTACAGACAATACTATATCTATAATAAAAAACTTCCAAAAATCTGACTCCAGAATTCGGCTAGTTGATGATAATTTGAAAGGTCAAGGTGCAGGAAAAAATTTTTTATCGCTGATAAAGTACAGCGAGACAGATTATACAATTTATTGTGACCAAGATGATATTTGGTTAGAAAACAAAATATTTGAATTAGTAAAGTATGCAAATGAAATTAAATTGAATGTATCAGATGCGCCTTCGCTAGTTTATGCTGATGGCTATGCTTATATGGATGGTGAGGGTACAATCGATTTTTCTGGGATATCTAACAATCATGCTGATCAATTAAAGGATTTTCTTTTTTTTAATGGTGGATACCAAGGATGTTCTATTATGTTCAATCGTGCAATGACCAAATTTCTTCTGAATTATCGAGGATTTGTATATCTACATGACGATATCACAACATTAGCTGCATACGCTCTTGGTAAAGTTTATTTTCTCCCGAAATACCTTATGTTATATAGACAGCACACGAATGCGGTAACTGGTATCAAAACATTCCGCAATGGATTGACTTCTAAATTTAAATCACCAGTAAACTATCTTTTATCACGAAAACATTATCAGGTAAAAAAATCTTTTTTTGAATGTAACAGCTCTATCTTATCAGAGACGAATAAAAAAGTTTTTTTGGATTTTATTTCATTTTGTGAATCAAATAATAAATTTACAGATTTTTTTAAGTTATGGCGAGGTGGGTTTAGATTAAATAACAGTAGAACTAAATTATTATTAAAATTCTTAATACGGAGAAAATTTAGCGAATGATTTCAATACTTACACCTACTTTTAATCGGCAACATACTTTATCAAGGCTATTCAATTCTCTTATATTACAAACTGATAAAGATTTTGAGTGGATAATAATTGATGATGGTAGTATAGATGCAACAGCGGTACTTGTAGAAGATTTTAGAAAAAAATGTGATTTTGACTTGATTTATTGCTATCAGGAAAATAATGGTAAGCCCATGGCTTTAAACGCTGGTGTTAAAGCTTGTAGAGGCGATTATATCTTTATTGTTGACAGTGATGATGCACTAACTCCCGATGCCATAAAATTAATTAAAGAATCAATACATGATTGCTTATCTGAGAAGGAAAGTTTCAGCGGAGTCGGTTTTAGAAAAGCATATATAAAAGGGGGGATTATTGGTAATGATTTAAATAATTCTTCAGAACATATATACTATTTAAATGCGACTGAGATTAGCAATTTAATAAATGGTGATGTTGCATATTGTTTTAAAAAAGAAAGTTTGGTAAAAAATCCATTCCCCCGTATAGAAGATGAAAAATTTGTTCCAGAATTATATATTTGGAATAAAATAACTGACAAGGCGAAGATTCGATTTAACATAAGCAAAGTTATATATCTTTGTGAGTATCTTGATGATGGTCTTTCTAAAAATTTCCATAACCAGCTTAAAAAATACCCAAAGGGGTTTAAGATTTATTACAAAGATCAAAGAAAACGAGAGAAAACTTATATAAAAAAAACAAAGATGCTAATTAGATATTTGCAATGTTGTTATTATGAGAAAATAAAATGAAAATACTATTTGTCATTACAGGTTTAGGCCTTGGAGGTGCTGAGAAGCAGGTTTGTCTTTTAGCTGATAAATTAAGTTTAAGCGGGCACCATGTAAAGATTATTTCACTTGGACATATGTCTAATAATAAAGTCTTTCCTAGCGAAAATAATGTTAATGTCATTAATGTAAATATGTCAAAAAACATTTCTGGAGTTATAAAAGGTTGTGTCAGAATTAGAGATGTTATAGCTAATTTCAAACCAGACATTGTACACAGTCATATGTTTCATGCAAACATTATCACTAGATTGTCTGTAATTGGAATCAAAAACAGACCTGGTATTATATCAACTGCACATAATAAAAATGAAGGTGGGTATTTCAGAATGCTCACATATAGAATAACCGATTGTTTAAGTGATTGTTGTACAAATGTTAGCAAAGAAGCAGTGGATGAGTTTTTACGGATAAAAGCCTTTAATCCCGCTAAAGCAATTACTATGTATAATGGGATAGATACCAATAAATTTAAATTTGATTTATTGGCAAGGAGGGAAATTCGAGACGGTATTAATATAAAAAATGATGATATATTATTACTTGCTGCAGGTCGTTTAACGTTAGCTAAAGATTATCCTAATTTATTGAATGCAATGACTCTGCTTCCTGAACACTTTAAACTTATTATTATTGGTGATGGTGAATTGCGTGACGAAATTAATATGCTTATAAAAAAATTGCAATTATCTAATAGGGTGTCCTTGTTGGGAGTTAAAAAAAATATTGCTCCCTATTTTTCTGCATGTGATATTTTTGTTCTCTCTTCTCGTTGGGAAGGATTTGGATTAGTCGTGGCAGAAGCTATGTCATGTGAGCGAATTGTTGTTGGCACGGATTCAGGGGGAGTAAGAGAAGTTATTGGTGACGATGATTTTCTTGTACCCATATCTGATTCAACACAACTTGCAAGCAAAATTGAAAAATTGTCTTTGAGCCAGATACGTGATCACATTGGTTTTCGGAATCGTGAGCGTATTTTAAAAAATTTCTCAATAGATACTATTATTATGCAGTGGCAAGAACTCTATGGAACTATAATTTGCTCAAAACATGAAAGGTAGATTTATATTTGGAACGTGTCTTTTGTTTGAATTTAATTCAATCTCAATTGAGATTTTTGTATTTCAAAAATACCATCATAGCTAACGATGATTGGTATTTATTTTAAGATGCTTTCTATAAATATATTGACGTTTTTAATGCGCCGAAACGATTGGGCTGGGAACAGAGAAGTAAAACTGTTTTGAGAATGAAGAGTTTTTGAGATGTTTATGGATATTAAAAATTGATCCAGTGAATTAATTATTTATAATAAATCAAGATTTAATGTTAATAAATGATAATCTTTTCTGACACTCATATTAATTATGAGTGGTACGTTTGGTAAACGGTAAACTATTATATGACAGCTAGAACAACTAAAGTTTTGCACTTACAATTACTCCCACTCTTAAGTGGCGTTCAAAGGGTAACATTAAACGAAATTAGTGCGTTATATACTGATTATGATTATACACTAGTTTGCTCAAAAAAAGGTCCACTAACAAAAGCATTGCTGGAATATGATGTCGATTGTCATTGTATCCCCGAACTTACGAGAGAAATTACCGTAAAGAATGATTTTAAAGCATTGTTCAAGCTTTATAAGTTCATAAAAAAAGAAAAATTTGACATTGTGCATACACATTCTTCAAAAACAGGTATTTTGGGGCGAGTTGCTGCCAAATTAGCACGTGTTGGAAAGGTGATCCACACTGTACATGGTTTTTCTTTTCCAGCCGCATCTAGTAAAAAAAGTTATTACCTTTATTTTTTCATGGAATGGATAGCAAAGTTCTTTACGGATAAGTTAATCGTCTTGAATGTAGATGATGAATATATAGCAATAAACAAATTAAAATTCAAGCGGGATAAAGTTTTTTTAATTCCTAATGGAGTAGACACTGATAAGTTTTCTCCTTTAGAAAATAAAATTTATAGTAGCACCTTGAATCTAGTAATGGTTGGTAGATTATCCAAGCAAAAAGATCCTGAGACATTATTGCTTGCTGTTGAAAAACTGCTGAATGAAAATGTTAATGTTAAGCTGACACTTGTAGGAGATGGTGAACTAAAAGAACAGTTAGAAAGCAGGTTCAAACGGCAAGATGGACGTATAATTTTTCATGGATGGTCAGATAACATTGTTAATATTTTAAAAGTTAATGATCTTTTTATATTACCTTCTCTTTGGGAGGGTATGCCATTAGCAATTTTAGAAGCATTGAGCTGTGGACTTCCATGTATAGTCACTAATATTCCAGGTAATAATAGCTTAATAGAAGATGGCTATAATGGTTGTTTGTTTGAAATTAGAGATTGTCAGTTATTATCTCAAAAAATCATGTCATATGTTGGTAAGCCAGAACTGATTGCACAGCAATCTACCAATGCACGATCATTTATTCTGAAAAATTATGGATTAGTTAAAAGAAATAATAAGGTCAGACAGCTATATGATAATTAAGAGCTCGGTACCCGGGCCTAGGGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATCCGTCGACGGCGGCCGCCCTGCAGGCATGCAAGCTTGATCCATATGGATCGCTAGCTTAATTAAATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACGGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAAAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 18 (예시적 O25B rfb 유전자좌 뉴클레오티드 서열 - O25B-EPA 생산 균주 stGVXN4459)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCAGTGAAGATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCTGCTGTTGTTCGTCACATAATAAATAATACGCAAGATAGTGTTGTTAATGTCGATAAATTAACATACGCCGGAAACCTGGAATCACTTGCAGATGTTTCTGATTCTGAACGCTATTTCTTTGAACATGCGGATATTTGTGATGCAGCTGCAATGGCACGGATTTTTGCTCAGCATCAGCCGGATGCAGTGATGCACCTGGCAGCTGAAAGCCATGTTGACCGTTCAATTACAGGCCCTGCGGCATTTATTGAAACCAATATTGTGGGTACTTATGTCCTTTTAGAAGCGGCTCGGAATTATTGGTCTGGTCTGGATGATGAAAAGAAAAAAAACTTCCGTTTTCATCATATTTCTACTGATGAGGTGTATGGTGACTTACCCCATCCGGATGAAGTAAATAGCAATGAAACGTTGCCGCTATTTACGGAAACGACAGCATACGCGCCAAGTAGTCCATATTCTGCTTCTAAAGCTTCCAGCGATCATTTGGTTCGCGCATGGAAACGTACTTATGGTTTACCGACCATTGTGACTAATTGCTCGAACAACTATGGTCCTTATCATTTCCCGGAAAAGCTTATTCCACTGGTTATTCTTAATTCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGAGATCAGATCCGCGACTGGTTGTATGTAGAGGATCATGCTCGAGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGCGAAACTTATAACATTGGTGGACACAACGAAAAGAAAAACATCGACGTAGTGTTCACTATTTGTGATTTGTTGGATGAGATAGTCCCGAAAGAGAAATCTTACCGCGAGCAAATTACTTATGTTACCGATCGTCCGGGACACGATCGCCGTTATGCGATTGATGCTGAGAAGATTGGTCGCGAATTGGGATGGAAACCACAGGAAACGTTTGAGAGTGGGATTCGTAAAACGGTGGAATGGTACCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGAGGGCCGCCAGTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTAGGTTGGGAACTACAGCGTGCTCTGGCACCTCTGGGTAATTTGATTGCTCTTGATGTTCACTCCACTGATTACTGTGGTGATTTTAGTAATCCTGAAGGTGTAGCTGAAACCGTAAGAAGCATTCGGCCTGATATTATTGTCAACGCAGCCGCTCACACCGCAGTAGACAAAGCAGAATCAGAACCGAAGTTTGCACAATTACTGAACGCGACGAGTGTCGAAGCGATCGCGAAAGCAGCCAATGAAGTCGGCGCCTGGGTTATTCACTACTCTACTGACTACGTATTTCCGGGGACCGGTGAAATACCATGGCAGGAGGAGGATGCAACCGCACCGCTAAATGTTTACGGTGAAACCAAGTTAGCGGGAGAAAAAGCATTACAAGAGCATTGTGCGAAGCACCTTATTTTCCGGACCAGCTGGGTCTATGCAGGTAAAGGAAATAACTTCGCCAAAACAATGTTGCGTCTGGCAAAAGAGCGTGAAGAATTAGCCGTTATTAATGATCAGTTTGGTGCGCCAACTGGCGCAGAGTTACTGGCTGATTGTACGGCACATGCTATTCGTGTGGCACTGAATAAACCGGAAGTCGCAGGCTTGTACCATCTGGTAGCTAGTGGTACCACAACGTGGCACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGCATTCCCCTTGCACTCAACAAGCTCAACGCAGTACCAACAACAGCCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTTGGCGTGAAACGAATGCTTAACGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTAATGGTGGAGCAAGATGTATTAAAAGGAATGATGAAATGAAAACGCGTAAAGGTATTATTTTGGCGGGTGGTTCTGGTACTCGTCTTTATCCTGTGACGATGGCCGTCAGTAAACAGCTGTTACCGATTTATGATAAACCGATGATCTATTACCCGCTCTCTACACTGATGTTAGCGGGTATTCGCGATATTCTGATTATCAGTACACCACAGGATACTCCTCGTTTTCAACAACTGCTGGGTGACGGGAGCCAGTGGGGCCTGAATCTTCAGTACAAAGTGCAACCGAGTCCGGATGGTCTTGCGCAGGCGTTTATTATCGGTGAAGAGTTTATTGGTGGTGATGATTGTGCTTTGGTACTTGGTGATAATATCTTCTACGGCCACGACCTGCCGAAGTTAATGGACGTAGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCTGAACGTTATGGTGTCGTGGAGTTTGATAATAACGGTACTGCAATTAGCCTGGAAGAAAAACCGCTGGAACCAAAAAGTAACTATGCGGTTACTGGGCTTTATTTCTATGACAATGACGTTGTGGAAATGGCGAAAAACCTTAAGCCTTCTGCCCGAGGTGAACTGGAAATTACCGATATTAACCGTATTTATATGGAACAAGGACGTTTGTCTGTCGCTATGATGGGGCGTGGCTATGCATGGCTGGATACAGGGACGCATCAAAGTCTTATTGAAGCAAGCAACTTCATTGCCACCATTGAAGAGCGCCAGGGACTAAAGGTTTCCTGTCCGGAAGAAATTGCTTATCGTAAAGGGTTTATTGATGCTGAGCAGGTAAAAGTATTAGCCGAACCGTTGAAGAAAAATGCTTATGGTCAGTATCTGCTCAAAATGATTAAAGGTTATTAATAAGATGAACGTAATTAAAACTGAAATTCCTGATGTGCTGATTTTTGAACCAAAAGTTTTTGGGGATGAACGTGGCTTCTTTTTTGAGAGTTTTAATCAGAGGATTTTTGAAGAAGCAGTAGGTCGTAAGGTTGAGTTTGTTCAGGATAACCATTCTAAGTCCAGTAAAGGTGTTTTACGTGGTCTTCATTATCAGTTAGAACCTTATGCTCAAGGAAAACTGGTGCGCTGTGTTGTTGGCGAGGTTTTTGATGTTGCGGTTGATATTCGTAAATCGTCACCTACATTTGGGAAATGGGTTGGGGTGAATTTGTCTGCTGAGAATAAGCGTCAGTTGTGGATTCCTGAGGGATTTGCACATGGTTTTTTGGTGCTGAGTGATTTAGCAGAAGTTTTATATAAAACGAATCAATATTATGCTCCATCACATGAAAAAAATATTATATGGAATGACCTCTTGCTTAATATTAAATGGCCGAGCACAGCACTGATCACTCTGTCTGATAAGGATGCAAATGGGGAAAGATTTGAACTAAGTGAGTTTTGAAATGTCTCTCTTAAAACATAGTATATGGAATGTTGCGGGCTACTTTATACCAACATTAATTGCAATTCCCGCCTTTGGATTAATTGCGAGGAAAATTGGTGTAGAACTATTTGGTTTGTATACGTTAGCAATGATTTTTATAGGGTATGCAAGTATATTTGATGCTGGGTTAACAAGAGCTGTTGTGCGTGAAATAGCATTACTAAAAAACAGAGTGGACGATTGTAATACGATAATAGTAACTTCTATTATCGCTGTGATATTTTTAGGGTTTATCGGAGGCGGGGGAGTGTTTCTGCTTAAAGGCGATATTATTGAACTGTTAAATATCTCACCAATATATTACGCCGATTCGATAAAGTCTCTAGTATTATTATCATCTCTGATACCTGTATTCTTAGTCACGCAAATACTATTAGCAGAGCTTGAGGGTCGGGAATATTTTGGGATTCTAAATATACAAAAAAGTGTAGGGAATTCTTTAATTGCAGGGTTACCTGCATTATTTGTTTTAATTAATCAAACGCTTTTTTCTGCAATTATTGGTGTAGCGATTGCAAGAGTTATATGCTTGTGGTTAAGCTACATTATGAGCAGGGAAAGAATAACTATCGATATCTCATTTTTTTCAATAACTGTTTTAAAGCGGTTATTTAGATATGGCGGGTGGGTAACTATAAGTAACATAATATCTCCTATATTAGCGAGTATGGATAGATTTATTCTATCCCATATCCAGGGAGCATCAAAAATATCATTCTATACAGTCCCTAATGAGCTGGTAACTAGGCTTGGAATAGTTCCAGGCTCTCTTGGGAAAGCTGTTTTTCCAAAATTAAGTCATGCAAGGAATTTTACAGCGTCATATGCAGAGCAAAAAAAAGCTTATATATTAATGACTGTCATTGTAATGCCTTTGGTTTTATTTGTATATTATTACGCAAAGTTTATTTTAACATTGTGGATGGGGGCTGAGTATGCAGGGATTTCGGTCGAAATATTACGGATTATGCTTATAGGGTATATTTTTAACTGTTATTCACAAATCTCTTTTGCCAACATACAGGCCTTTGGAAAAGCAAAATACACTGCATACATCCATATGATGGAATTTATTCCTTATTTGATAATGTTATATATAATTTCAAAGGAATATGGGGTTATTGGTGTTGCGTGGTTATGGACAATTCGAGTAATAATTGATTTTTTGATGCTTTTATATATGAGTTATCGTTGTAATAATCTTATGAAAAAAGGGTAGCCTGATGATATATATTGTGGTATTAAATTGGAATGGGGCTATAGATACCATTAATTGTGTTAAAAGTTTAATGGATTTAAATGTTAGCGATTATAAAATTATCATTGTTGATAACTGTTCTATGGATAACTCATATGATACTATAAAAGAAAATCTTAATTCATTATATATTGCTGATAAAAGTATCATTGAGGTGAAGTATGAGGATAGAAATAAATATAAAACCTTAGAAAACGATAAAATCATATTAATACAATCTCCGCAAAATAATGGGTACGCAAGTGGTAATAATATTGGCATAGAGTTCGCTCTTAATCAGGAGAATATGAAATACGTCTGGGTTCTGAATAATGATACTGAAGTGGATAAAGAGGCTTTAACTCATTTAATTAGTAAATGTGATTCAGATAAAAGTATAGGGATTTGCGGTTCTCGTTTAGTCTATTTTGCCGACAGAGAGATGCAGCAAGGACTAGGTGGGGTGCATAACAAATGGTTATGCACTACAAAAAATTATGAAATGGGAAGATTAGTTTCCAAAAAATATGATGATGAAGTCATTAGTAATGATATAGATTATATAATTGGCGCATCGATGTTTTTCTCTAGAGAATGTTTGGAAACAGTTGGATTGATGAATGAAGAATATTTTTTATACTATGAAGAGTTAGATATTTGCCTCAGAGCAAAAGCAAAGAACTTTAAATTAGGTATTTGCTCAGAAAGTTTGGTTTATCATAAAATAGGTGCAAGTACTGATGGGGGAAAGAGCATGATGGCTGATCTTTGCTCAATAAAAAATAGGCTGGTCATTACAGAAAGGTTTTATCCCCAATATTATTGGACGGTATGGTTGTCACTTTTTGTTGTAGCATTTAACCGTGCTAGAAGAGGTGAGTTTAATAAGATGAAAAGATGTTTGAATGTTATGTTTAACTTCAAACGAAACAAAGGTAGCAAATGCCATTAGAATATGCACTTAATCATGGTGTTAATAAATCTATAGTTTGATATGTTATTAAAGGGTATTTAATGAAAGTGGCTTTTTTATCTGCTTATGATCCACTATCTACATCCAGTTGGTCTGGCACACCTTATTATATGCTAAAGGCATTATCGAAGAGAAATATTTCCATTGAAATATTAGGACCGGTAAATAGCTATATGATATACATGTTAAAAGTATATAAATTAATATTAAGGTGTTTCGGAAAAGAATATGATTATAGTCATTCGAAGTTGCTTTCCAGGTATTACGGTAGAATATTCGGTAGGAAATTAAAAAAAATTGATGGTTTGGATTTTATTATCGCACCTGCAGGTTCCTCACAAATTGCTTTTTTAAAAACAACCATACCAATAATATATCTATCGGATACAACATATGATCAATTAAAAAGCTATTATCCGAATTTAAATAAAAAAACAATTATAAATGATGAGGATGCAAGTTTAATCGAACGCAAGGCTATTGAAAAAGCAACAGTAGTATCTTTCCCATCTAAATGGGCAATGGATTTTTGCAGGAATTATTACAGATTAGATTTTGATAAATTAGTTGAAATACCATGGGGGGCTAATTTATTTGATGATATTCACTTTGCTAATAAAAATATAATTCAAAAGAATAGTTATACTTGTCTTTTCTTGGGAGTTGATTGGGAAAGAAAAGGTGGGAAAACAGCCTTGAAAGCAATTGAATATGTAAGGCAGTTATATGGGATCGATGTTAGACTAAAAATTTGTGGATGTACTCCGAATCAAAAGATTTTACCTACTTGGGTTGAATTAATTGATAAAGTAGATAAAAATAACGTTGACGAATATCAGAAATTCATCGATGTGTTATCTAACGCTGATATACTTCTTTTACCAACCATTGCTGAATGTTATGGAATGGTATTTTGTGAAGCTGCTGCTTTTGGATTGCCTGTTGTCGCTACAGATACAGGTGGAGTCAGTTCTATAGTTATCAACGAAAGGACGGGGATATTAATTAAAGACCCGTTAGACTATAAGCACTTTGGAAATGCAATTCATAAAATAATTAGTTCCGTAGAGACTTATCAAAACTACTCCCAAAACGCAAGAATTAGATATAATAATATATTGCATTGGGACAATTGGGCTAAAAAGATAATTGAGATTATGTATGAGCATAAGAATAGAAGAATCAAATAGCACAAAAAGAATTATATGTTTATTTATACTTTTTCTTGTTTTCCCTGATTTTTTGTTTTATACATTAGGGGTTGATAATTTTAGCATTTCAACGATAATCTCAATTACATTGCTTTTTGTTTTTTTAAGAGCTAAAAATATTTGCAAAGATAATTTTCTAATAATAGTAGCGTTATTCATATTGTTGTGTTTTAACTGTTTGTTAAGTATGCTATTTAATATTGAACAGGCTTTAACATTTAAAGTTGTACTTTCAATATATAGCATCTTAATAATGGCATACGTCTCCTCTTGTTATGCACAGACGTTGTGGTTATGTTCTGAAGAAATACTTAAGAGATCCGTCTTTTATTTGTTCGCATTTCTTTGCCTTATTGGCATTATAAGTATTCTTTTACAGAAGACTGAGATTATACATGATAAAAGTATGATTCTTTTTCCTGAACCATCAGCATTTGCATTGGTTTTTATACCTATCTTTTCATTTTGTTTATACTATACAAGAGGGGGGGGGCTACTATTGCTCTATATATTATCTTTGGGTATTGCGTTAGGTATCCAGAATTTAACAATGTTGGTAGGCATTGTGATTAGTGTTTTTGTGATGAAAAAAATAACTATAAGGCAAACTATTGTTATACTTTTGGGGGCATGGATTTTTTCCATGATATTAAGTGATTTAGACATTTCTTACTATACATCGCGGCTTGATTTTAAAAATACTACGAACCTATCAGTGCTTGTATATCTTTCAGGAATTGAAAGAGCTTTCTTGAATTTTATTACAAGTTATGGTCTTGGTATTGGTTTTCAACAAATGGGAGTGAATGGGGAGATAGGAATATATCAACAAATTTTAGCTGAACTTGATGCCCCTATGTTAAATATATACGATGGCTCATTTATTTCTTCTAAGTTAATATCTGAGTTTGGGGTTATTGGTGCATTAATGTGTATTTTCTATTTTTTTTATTTTTCCCGATTTTATCTGCGTTTCAAAAAAAGTAAGAGATATTCACCGCAGTATATTTTAGCATATAGCTTCTACATGTGTTTCTTCATCCCTCTTTTTATACGTGGTGCTGGTTATATAAACCCCTATGTGTTTATGTTATTTTCATCAATATTTTTGTGCAAATATCACGCTAAAAATATCTTGATGAAATCTAATGTCCAGATAGCTATATAATAGTAGATTATATTATCATTATCACGTAAATTACATATTAATAGCATATATGATAACTAGGACATAAATAATGTGCATTAAAAAAAAACTTAAGTTAATTAAACGATATGGCCTTTATGGTGGTCTTAGGCTTCTTAAAGATATATTCTTAACAAAATTTTTATTTTGTTCAAATGTTAGGATTATTAGATTTCCATGTTATATTAGAAAAGATGGAAGTGTTAGTTTTGGAAAAGGTTTTACATCAGGTGTAGGATTACGAGTTGATGCATTTATGGATGCCGTAGTTTCCATTGGAGAAAATGTTCAAATTAATGACTATGTTCACATCGCGGCTATTAATAATGTCATTATTGGTAGAGATACATTAATAGCAAGTAAAGTATTTATTAGTGATCATAATCATGGTATTTTTTCTAAATCCGATATCCATAGTTCACCAACTATTATTCCTTCGTCTAGGCCCCTTGAATCTGCACCTGTGTATATTGGAGAGCGTGTGTGGATTGGCGAAAATGTGACAATATTACCAGGTGCGTGTATAGGTAATGGTGTAGTTATTGGCGCAAACAGTGTTGTTCGTGGTGAGATTCCTAATAATGTGATCATTGCTGGTGTTCCAGCTAAAATTGTTAAAAAATATAACTATGAGCGTATGCAATGGGAAAGAATATAGTTGTAATATCGGCTGTTAATTTTACAACCGGAGGCCCCTTTACCGTACTAAAAAATGTGCTTACAGCAACTAAAGATAGAGCCGAATGTAAATTTATTGCACTGGTTCATAGCTCTGCTGAACTAATGGAATTATTTCCGTGGGTTGAATTTATAGAGTATCCAGAAGTCAAGTCTTCGTGGGTTAAAAGATTATATTTCGAATATATAACTTGCAATAGATTATCTAAGGTGATTAAGGCAACTCATTGGGTATGCTTACATGATATTACAGCAAATGTTAGTGTACCCTATAGATTTGTTTATTGCCACAATCCTGCACCGTTCTATAAATATTTAAGCTATCGAGATATTATAGGAGAACCTAAATTTTATCTTTTTTATCTTTTTTATGGGCTTTTATACAATATCAATATAAAAAAGAACACAGCAGTTTTTGTTCAGCAGCAGTGGCTAAAAAAAGAATTCGAAAAAAAATATAAGTTAAAGAATGTTGTTGTTAGTCGCCCTGAAGATATTTGCCCTTTTGAAAGTGATGGTTTGGTAAGAAATAATAATAAAAAGGATGTGAGGATATTTTACCCAGCAGTGCCCCGTATATTTAAAAACTTTGAAGTTATCATACGTGCTGCACAAATATTACAAGATAAAAATATTCATTTTTATCTTACTTTTGATGGTACTGAAAATAAGTATGCAAAAAGAATATATAAATTAGCTTCCGAACTGAAAAATGTACATTTCCTCGGTTACCTTAATGCAACCGAGATGGTTAACTTTTATCAAGATTCAGATATTATTTGTTTCCCATCGAAACTAGAAACGTGGGGATTACCATTATCAGAAGCTAAAACATACAAAAAATGGATATTTGCGGCAGACTTACCTTATGCTCATGAAGTTTTATATAACTATTCAAAAACTAGATATTTTCCATTTGACGATGAGAAAATACTTGTTCGCTACATATTAGAGTACACAAGTAAAAATATGCATGAAGATATAAAAAATAGTAGGGTGAATTTTAATAATGATGCATTGACTGGTTTTGAACAGTTTATTGAATATATCCTCAAGGGGAACTGACGTGGTTTATATTATAATCGTTTCACATGGCCATGATGACTATATAGAAAATCTTTTATTAAATTTAAAGTTGCCCTCTGGAAGATTTAAAATAATAGTTCGTGATAACAAAAGTTCAATGGTTTTAAAAAAAACATGCGAAAAAAATTGCGTAACCTATTTGCATGGAGGGCAATATGGATTTGGACATAATAATAACATAGCAGTGTCATATATAATTAATAACTTCATGATTATGAATAATGATTATTTTCTCTTTCTTAACCCCGATGTATTCATAACCAGTGAAAGTTTGATTAATTATGTTGATTATATAATTAGTAATGATTATAAGTTTAGCACATTATGTCTTTATCGAGATTTTACTAAAAGCAAACATGATTATTCAATACGGAGTTTTCCAACTTTATATGATTTTCTTTGTTCTTTTTTATTGGGGGTGAATAAAAGTAAAATTAAGAAGGAAAATATACTTTCTGATACTGTAGTTGATTGGTGTGCTGGCTCATTTATGCTTATTCATGCTTTAAGTTTCTTAAATGTGAATGGTTTTGATCAAAAATATTTTATGTATTGTGAAGATATTGACCTTTGTATGCGTTTAAAATTAAGTGGAGTAGATCTTTACTATACTCCCCATTTTGATGCTATTCATTATGCGCAGCATGAAAATAGAAGAATATTTACTAAAGCATTTCGATGGCATATAAGGAGTATTACGCGCTACATATTACGGAAACCAATTCTTTCTTATAAAAACTATAGAAAAATTACATCCGAACTGGTAAAGTGATTAAGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 19 (예시적 O75 rfb 유전자좌 뉴클레오티드 서열 - O75-EPA 생산 균주 stLMTB11737)

ATGACGAATTTAAAAGCAGTTATTCCTGTAGCGGGTCTCGGGATGCATATGTTGCCTGCCACTAAGGCGATACCCAAAGAGATGCTACCAATCGTCGACAAGCCAATGATTCAGTACATTGTTGACGAGATTGTGGCTGCAGGGATCAAAGAAATCCTCCTGGTAACTCACGCGTCCAAGAACGCGGTCGAAAACCACTTCGACACCTCTTATGAGTTAGAATCACTCCTTGAGCAGCGCGTGAAGCGTCAACTGCTGGCGGAAGTACAGTCCATCTGTCCGCCGGGCGTGACCATTATGAACGTGCGTCAGGGCGAACCTTTAGGTTTAGGCCACTCCATTTTGTGTGCGCGACCTGCCATTGGTGACAACCCATTTGTCGTGGTACTGCCAGACGTTGTGATCGACGATGCCAGCGCCGACCCGCTACGTTACAACCTTGCTGCCATGATTGCACGTTTCAACGAAACGGGCCGCAGCCAGGTGCTGGCAAAACGTATGCCGGGTGACCTCTCTGAATACTCCGTCATCCAGACTAAAGAGCCGCTGGACCGTGAGGGTAAAGTCAGCCGCATTGTTGAATTTATCGAAAAACCGGATCAGCCGCAGACGCTGGACTCAGACATCATGGCCGTAGGTCGCTATGTGCTTTCTGCCGATATTTGGCCGGAACTGGAACGTACTCAGCCTGGTGCATGGGGACGTATTCAGCTGACTGATGCTATTGCCGAGCTGGCGAAAAAACAATCCGTTGATGCAATGCTGATGACCGGCGACAGTTACGACTGCGGCAAAAAAATGGGCTATATGCAGGCGTTTGTGAAGTATGGCCTACGCAACCTGAAAGAAGGGGCGAAGTTCCGTAAAGGTATTGAGAAGCTGTTAAGCGAATAATGAAAATCTGACCGGATGTAACGGTTGATAAGAAAATTATAACGGCAGTGAAAATTCGCAGCAAAAGTAATTTGTTGCGAATCTTCCTGCCGTTGTTTTATATAAACCATCAGAATAACAACGAGTTAGCAGTAGGGTTTTATTCAAAGTTTTCCAGGATTTTCCTTGTTTCCAGAGCGGATTGGTAAGACAATTAGCGTTTGAATTTTTCGGGTTTAGCGCGAGTGGGTAACGCTCGTCACATCATAGGCATGCATGCAGTGCTCTGGTAGCTGTAAAGCCAGGGGCGGTAGCGTGCATTAATACCTCTATTAATCAAACTGAGAGCCGCTTATTTCACAGCATGCTCTGAAGTAATATGGAATAAATTAAGCTAGCAGTGAAGATACTTGTTACTGGTGGCGCAGGATTTATTGGTTCTGCTGTTGTTCGTCACATAATAAATAATACGCAAGATAGTGTTGTTAATGTCGATAAATTAACATACGCCGGAAACCTGGAATCGCTCGCTGAAATTTCTGATTCTGAACGTTATTCATTTGAGCATGCAGATATCTGCGATGCCGAAGCGATGGCTCGTATTTTCGCACAGCACCAGCCAGACGCGGTGATGCACCTGGCAGCAGAGAGCCACGTTGACCGCTCAATAACTGGCCCTGCGGCATTTATTGAAACCAATATTGTGGGTACTTATGTTCTTTTAGAAGCGGCGCGCAATTATTGGTCTGGTCTGGATGATGAAAAGAAAAAAAACTTCCGCTTTCATCATATTTCTACTGATGAGGTGTATGGTGACTTACCCCATCCGGATGAAGTAAATAGCAATGAAACGTTGCCGCTATTTACGGAAATGACAGCATACGCGCCAAGTAGTCCATATTCTGCTTCTAAAGCTTCCAGCGATCATTTGGTTCGCGCATGGAAACGTACTTATGGTTTACCGACCATTGTGACTAATTGCTCGAACAACTATGGTCCTTATCATTTCCCGGAAAAGCTTATTCCACTGGTTATTCTTAATGCACTGGAAGGTAAGGCATTACCTATTTATGGCAAAGGAGATCAGATCCGCGACTGGTTGTATGTAGAGGATCATGCTCGAGCGTTATATACCGTCGTAACCGAAGGTAAAGCGGGCGAAACTTATAACATTGGTGGACACAACGAAAAGAAAAACATCGACGTAGTGTTCACTATTTGTGATTTGTTGGATGAGATAGTCCCGAAAGAGAAATCTTATCGTGAGCAAATTACCTATGTTGCTGATCGCCCAGGGCATGATCGCCGTTATGCAATTGATGCCGATAAAATTAGCCGCGAATTGGGCTGGAAACCACAGGAAACGTTTGAGAGCGGGATTCGTAAAACTGTGGAATGGTATCTGTCCAATACAAAATGGGTTGATAATGTGAAAAGTGGTGCCTATCAATCGTGGATTGAACAGAACTATGGGGGCCGCCACTAATGAATATCCTCCTTTTTGGCAAAACAGGGCAGGTTGGTTGGGAACTACAGCGTGCTCTGGCACCTCTGGGTAATTTGATTGCTCTTGATGTTCACTCCACTGATTACTGTGGTGATTTTAGTAACCCTGAAGGTGTGGCTGAAACCGTTAGAAGCATTCGGCCTGATATTATTGTCAACGCAGCCGCTCACACCGCAGTAGACAAAGCAGAATCAGAACCGGAGTTTGCACAATTACTGAACGCGACGAGTGTCGAAGCGATCGCGAAAGCAGCCAATGAAGTCGGCGCTTGGGTTATTCACTACTCTACTGACTACGTATTTCCGGGGACCGGTGAAATACCATGGCAGGAGGAGGATGCAACCGCACCGCTAAATGTTTACGGTGAAACCAAGTTAGCAGGAGAAAAAGCATTACAAGAGCATTGTGCGAAGCACCTTATTTTCCGGACCAGCTGGGTCTATGCAGGTAAAGGAAATAACTTCGCCAAAACGATGTTGCGTCTGGCAAAAGAGCGTGAAGAATTAGCCGTTATTAATGATCAGTTTGGTGCGCCAACTGGCGCAGAGTTGCTGGCTGATTGTACGGCACATGCCATTCGTGTGGCACTGAATAAACCGGAAGTCGCAGGTTTGTACCATCTGGTAGCCAGTGGTACCACAACCTGGCACGATTATGCTGCGCTGGTTTTTGAAGAGGCGCGCAAAGCAGGCATTCCCCTTGCACTCAACAAGCTCAACGCAGTACCAACAACAGTCTATCCTACACCAGCTCGTCGTCCACATAACTCTCGCCTTAATACAGAAAAATTTCAGCAGAACTTTGCGCTTGTCTTGCCTGACTGGCAGGTTGGTGTGAAACGCATGCTCAACGAATTATTTACGACTACAGCAATTTAATAGTTTTTGCATCTTGTTCGTGATGGTGGAACAAGATGAATTAAAAGGAATGATGGAATGAATACGCGTAAAGGTATTATTTTAGCGGGTGGTTCTGGTACACGTCTTTATCCTGTGACTATGGCTGTCAGTAAACAGCTGTTACCGATTTATGATAAACCGATGATCTATTACCCGCTCTCTACACTGATGTTGGCGGGTATTCGCGATATTTTGATTATCAGCACGCCACAGGATACTCCTCGTTTTCAACAACTGCTGGGTGATGGGAGCCAGTGGGGGCTAAATCTTCACTACAAAGTGCAACCGAGTCCGGATGGTCTTGCGCAGGCATTTATCATCGGTGAAGAGTTTATCGGTGGTGATGATTGTGCTTTGGTACTTGGTGATAATATCTTCTACGGTCACGACCTGCCTAAGTTAATGGATGCCGCTGTTAACAAAGAAAGTGGTGCAACGGTATTTGCCTATCACGTTAATGATCCTGAACGCTATGGTGTCGTTGAGTTTGATAAAAACGGTACTGCAATCAGCCTGGAAGAAAAACCGTTACAACCAAAAAGTAATTATGCGGTAACCGGGCTTTATTTCTATGATAACTACGTTGTGGAAATGGCGAAAAATCTTAAGCCTTCTGCCCGCGGTGAACTGGAAATTACCGATATTAACCGTATCTATATGGAACAGGGGCATTTATCTGTTGCCATGATGGGACGTGGATATGCCTGGCTGGACACGGGGACACATCAAAGTCTTATTGAAGCAAGCAACTTCATTGCCACCATTGAAGAGCGCCAGGGCTTGAAAGTTTCCTGCCCGGAAGAAATTGCTTACCGTAAAGGGTTTATTGATGCTGAGCAGGTGAAAGTATTAGCTAAACCGCTGAAAAAAAATGCTTATGGTCAGTATCTGCTAAAAATGATTAAAGGTTATTAATAAAATGAATGTTATTAAAACAGAAATTCCAGATGTACTGATTTTTGAACCGAAAGTTTTTGGTGATGAGCGTGGTTTCTTTATGGAAAGCTTTAATCAGAAAGTTTTCGAAGAGGCTGTAGGGCGGAAGGTTGAATTTGTTCAGGATAATCATTCTAAATCGTGTAAAGGTGTACTTAGAGGTTTACACTTTCAGCTTCCTCCCTTTGAGCAGGCAAAATTAGTAAGGTGTATAGTTGGCGAGGTATTTGATGTTGCAGTAGACATTAGACCTAATTCTGAAACATTTGGTTCATGGGTTGGAGTAACTCTTTCGTCAGAAAATAAAAGGCAGCTATGGATTCCAGAAGGATTCGCCCATGGTTTTTTAACTTTAAGTGATATTGCAGAGTTTGTTTATAAAACTAACAACTATTATTCTTTAAATCATGAAAGGGGAGTCATTTGGAACGATGAGGAAATTAACATTGCCTGGCCCTCTCAATCAGAGAAGATTCTGTCACAGAAAGATATTAATTTACCATCATTTAGATTTGTTCAAATGTTTAGCAAGTAGTGTTATCTTTACACTGCACATAGTCATCATTTTTTATGCTTTAAGTAAATTATATTGCACATCTATAACACAAAGCGCAATAATATTTCGACCTGATGAAGGTTTGTGGTTATTTATCTTTCTAGGCGTTTTTTATGACTAAAATAGTTGTGGTTTCTACAGCTCCAATATTCCCGACAAATAATGGGTACAAAAGTTCTGTATTAGGAAGAATTGATGAGTTATTAAATGAGGATAATGAGGTCGTTTTGATTGAAATAAACCTTGAAAATGTTACGGAAAAGAAAGATGAATTAATACCAACAAGATTTAATAATATTCAAAGATATGAAGTAAAAAAAATATCTAGATCATTTATTGCCGAGTTACAAATATTATTTGATATCAGAACTCGGTATGAACAATTATTTTCTTCTGCTGACATTAGAGATAACATAAAAAAGATAATTGATTTAGAAAAACCTTCTATTATTATTGCTGAGTCTATATGGGCGTTGCAAGCATTGCCTATTGAAATTAGTGCGAGAATACACTGTGTTATTCATGATGTGGCAACTGATTTCTTTAAAGAAATGTTTGTATCTCATAATGAGGTTGTACGAAAAATTTTGTTTTTTAATGATTACCTAAAGTTGAAAATTACTGAAGAAAATATTATCAAACGTTTGAGAGTTGAGCAATTTATCTTTCTGACAGAAGAAGATAAATGTTGGTATAAAACAAGATACAATATTGATGAGGGTTGTTGTTCCTTAGCGAGCAATCATCTTTATGTAGAAAAGATTAAGAGAACTATCAATTTCCAAACCCCTTTCCTGCTTATTCCCGGTAGCATTGAATTTTCACAAAATTTTTACGGCTTAAATTGGTTTATAAAAAATATATATCCTGGATTAAATAGGAAAATAAGAATAGTTGTAACAGGAAAGGCATCAGATAAAAAAATAAAGATGTTAAACTGTGGAGAGGAAATTACCTTTACGGGAGAGCTTGACTTTTCCACATATAATAAACTTAGCTCAACATGCTTGTGTGTTATTGCACCGATTACAACGGGCACTGGAATTAAAATAAAAATATTAGAAGCTGTACAAAAAGGTATTCCTGTACTTACAACAAAATTTGCTTCAAAAGGAATATGTTCCGATTTATGTTTTTATTGCGAGGAGGATACTGACACAAACTTTGTCAATTTAATTAACAGTTTTCTTGAAACGACATTAAGAGTCCAAGAATGAATTTATTGCTTTTTTCAGTCCTTGCGTTTGGTTTAATATTGGCTTTGGCCCATAATAATAAAAGTGGAGATATTAACGCATACTTAATGTTTTTTCTCGTGGTCCTAATGGTATTAATATCAGGGCTGCGTATGAATGATAGTGATTATATCGAATACAGGAAAATGTATAATGAAGTGCCTATTTTATGTGACTTTAGTCTCGCATCTATAAGAGATATACATGGGGAGGTAGGCTATCTATTCTTATCATCAATCTTTAAAACTTTATGCTTGCCATTTCAATTATTTCTTTTTTTTATTGCTTTTTTATCACTCCTGCTTACATATTTTTCATTCAGAAAAATAAGTTTAATACCGATACTATCGTTAGTTTTTTATTTAAGCCATGCTTTTATAGTTAGAGATTTGATTCAAATTAGGGCAGGATTAGCTGTTAGCATATCATTATATTCAATAATTAAATTTAAAGGAAATAAAAGTATAATTACAGGAGTTTTATTTGCTTCTTTGATTCATTCTGGGGCGCTTATTATTGCTCTTTGTTATCCTTTTTTCAAAAAAAAATACATAACATTAAAAATGATGTTGTTTTTATTTTTAGTGTCAATTATTTTTTCTTATTTGAATGGGCTTAATTTATCGATACAACTCTTATCTCAATATAGTTTGCTTCCAACTGCAATTTCGAATTATGTTGGTTGGGAAGAATATGATTATCGGGTGAGTATATTTACTAATCCGGTTTTTATTAAAGGTGTTTTTTTAATTGTCTTAATGCACAAATATGTACTTTCAGATATTAAAAATGAGAAAATTATAGTGCTTTATAACTTATATGTTTTAGGTGTATTAGCTATGGTTGCATTGAGTGGGATGGCTATTCTTTCAGGCCGTCTTTCATCCTTTCTGACACTAGGTGAAAGCATTTTAATTGTATATGCTCTGTTCTACAAAAGAAATACACCTCTGGCGTTTCTAATTTTTTCTTTTTTAACAATTGTGCAATTAGGATATGATCTATTTATTTCTAATGTGCATCCTGAGCTTACTCTGATTATATTTGGGTGAATCTAAGTGAAAAATAATAAAATAGGCATACTTATCTCTAAAATACAAAATCTTGGACCTGTGAATGTAGTACGAGGATTGATAAAAGAAAATAAAAAATATGCTTTTACTGTTTTTTGTTTAACAAATAGCGTAGATAAAAATATATATGATGAGTTATGCTGTTTAGGAGCCAAGGTTATATTAATACCAGATGGTACTTGGTTCAGCAAAATTTTATTTGTGAGAAGTTTTTTAAAGGAACATCCACATAATATCTTACATTCACATGGGATCACGGCCGATATGTTTTCTTACTTTCTGAATGGCGTGAAAATATCTACTATTCACAATAGACTAGATGAGGATTATATCCCATTATTTGGCGCGGTTAAAGGGAATGCTATATATTATCTTCATCGTTTTATATTACGAAGATTTAATCATATCGTTGCTTGCTCAGCAGCGGTCCAATCAAAACTGAAACAATCGAAAGTAAAAACTAAAATAACCACCATCCAGAATGGGATTGATATAACTAGGTTTAAGACACTTGAGTCTGATAAAAAAAAATTATTGAGGGAAAAACACGGATTTGATAGTGAAAAAAGAATATTTATATATTGTGGCTCGTTATCATTAAGGAAAAATATTGCTTACCTCTTGGAACACTTAGCCATCGAAGAAAATGATATATTTTTAATTCTAGGTGATGGTGAACTTTTTAGATATTGTAAGGATAAATATTCTAAAGATTTACGGTATATATTTATGGGGAAAGTTGAATGCCCTCTTGAATATTATCAATTATCAGATATTTTTGTTTCCGCTTCTTTATCGGAAGGGCTCCCCTTGGCACTATTAGAAGCTGCCTCTACTGGGTGCTATTTATATGTTAGCGATATAGAGCCCCATAGAGAAATTGCATCTCTATTAGGAGAGGAAAATATTTCTATGTTTAAAATTAAGGATGGATCATATAATTATTTGCAACCTAAAATAAAAAAAGCTGACTATAACGCTCTTTCTGACGATAAACTTTACAATATATCCGATAAAAAAATGTCAAATCTTTATGACAAACTTTTTGTTTCTTTATTAGAGCAGAGGCACTAATATAATGATTTATGTTTCGGTAATTTCTCATGGTCATTTCAAAACTCTTAAGGAATTAGGAGCAGTATCAAAATTAAATAATCACAGCAGAATTAAAGTTATCATCAAAGATAATTTAGGAGAGAGCGAGCTTTTGGATTTTTGTCAGGAAAACAAAATAACTTATTTAAGGTCTAAAGAGAAAAAAGGATTTGGAGAGAATAATAATGAAGTTTTTTCCTCTATATCCTCCTTAATTACTAAGGAAGATTTTTTTGTGGTTATGAATCCTGATATATATATTGAGTGCTCTGATCTATTAGATGTCGTAGATGAGTGTGGTTCAGCGAATGTTAATCTAGCAACGATAAATTTATACAGGGATTTTGATAAAAAAACATATGATAACTCAGTAAGGAAATTTCCCTCGGCAATTGATTTTTTTATGTCATTTTTATTTAAGAAAAATGACTGTGTAGTAAATAAGAACAAAATAACGAAACCAACATATGTTGATTGGGCTGCAGGTTCTTTTCTAATATTTAATGCCTTCTTTTATTCAAAACTCAACGGATTCAACGAAAAGTATTTTATGTATTGCGAAGATATTGATATATGTTGGCGAGCTAAAAAACACTTCAATACTTCAGTTTTATACTATCCATGCTATGCAGCAATTCATTTGGCACAATTTAACAATCGTAGGATTTTTAGTAGACATTTCATTTGGCATATAAAAAGTATTATCCTTTTTTTATTATATAAAAATGGTATGCTGCGTTCTAGTAAGTTGCTTTAATGCTAATATTCTTTTAAGAGGTGAGAATGATACCTGTTATTTTGGCTGGTGGTTCGGGAAGTCGCTTGTGGCCACTTTCACGAGAAAAGTTCCCCAAGCAGTTTTTAAAGTTGACTGGCAGTTTGACAATGTTGCAGTCAACATTGTCACGTCTTAATAATTTAAATGCTGATGATTCAATAGTTATATGCAACGAAGAGCATAGATTTATTGTTGCAGAACAATTAAGAGAGTTAGGCAAACTTTCAAATAACATTATTCTTGAACCCAAAGGTCGTAATACAGCCCCTGCTATAACACTCGCAGCATTAGCAGCAAAAAGAAAATTCGCTGATGAAGATCCATTGATTCTTATTTTAGCTGCAGATCACAACATCCAAGACGAACATGTTTTCTGTGAGGCAATTAATAAGGCGTCATCTTTAGCTAGTTATGGAAAACTAGTGACTTTTGGTATCGTTCCATTCAAACCTGAAACTGGGTATGGCTATATTCGTCGCGGTGATGAAGTGCCTGTAGATGAGCAGCATGCGGTGGCCTTTGAAGTGGCGCAGTTTGTCGAAAAACCGAATCTGGAAACCGCGCAGGCCTATGTGGCAAGCGGCGAATATTACTGGAACAGCGGTATGTTCCTGTTCCGTGCCGGACGCTATCTCGAAGAACTGAAAAAGTATCGTCCGGATATTCTCGATGCCTGTGAAAAAGCGATGAGCGCCGTCGATCCGGATCTCGATTTTATTCGTGTGGATGAAGAGGCGTTTCTCGCTTGTCCGGAAGAGTCGGTGGATTACGCGGTCATGGAATGCACGGCAGATGCCGTTGTGGTGCCGATGGATGCGGGCTGGAGCGATGTCGGTTCCTGGTCTTCATTATGGGAGATCAGCGCCCACACCGCCGAGGGCAACGTTTGCCACGGCGATGTGATTAATCACAAAACTGAAAACAGCTATGTGTACGCCGAATCTGGCCTGGTCACCACCGTCGGGGTGAAAGATTTGGTGGTAGTGCAGACCAAAGATGCAGTGCTGATTGCCGACCGTAATGCGGTGCAGGATGTGAAGAAAGTGGTCGAGCAGATCAAAGCTGATGGTCGCCATGAGCATCGGGTGCATCGCGAAGTGTATCGTCCGTGGGGCAAATATGACTCTATCGACGCGGGCGACCGCTACCAGGTGAAACGCATCACCGTGAAACCGGGCGAAGGTTTGTCGGTACAGATGCATTATCATCGCGCGGAACACTGGGTGGTTGTCGCGGGAACGGCAAAAGTCACTATCAACGGTGATATCAAACTGCTTGGTGAAAACGAGTCCATTTATATTCCGCTGGGGGCGATGCACTGCCTGGAAAACCCGGGGAAAATAGATTTAGAATTAATTGAAGTTCGCTCTGGTGCATATCTTGAAGAAGATGATGTTATTAGATGTTATGATCGCTATGGACGAAAGTAATATATAATAATTATTTCAGAATTAGAAATGATAATTATAAGTTTTCGTCTGGATAAACAATAGATAGTATGGGTTGGAAAATATGAGTTCTTTAACTTGTTTTAAAGCTTACGACATTCGCGGGAAATTAGGTGAAGAACTGAATGAAGATATCGCCTGGCGCATTGGTCGCGCCTATGGCGAATTTCTCAAACCGAAAACCATTGTGTTAGGCGGTGATGTCCGTCTCACCAGCGAAACCTTAAAACTGGCGCTGGCAAAAGGTTTACAGGATGCGGGCGTCGATGTGCTGGATATTGGCATGTCCGGCACCGAAGAGATTTATTTCGCCACGTTCCATCTCGGCGTGGATGGCGGCATTGAAGTTACCGCCAGCCATAATCCGATGGATTACAACGGCATGAAGCTGGTGCGCGAAGGGGCTCGCCCGATCAGCGGTGATACCGGACTGCGCGACGTCCAGCGTCTGGCAGAAGCTAACGACTTTCCTCCCGTCGATGAAACCAAACGCGGTCGCTATCAGCAAATCAATCTGCGTGACGCTTACGTTGATCACCTGTTCGGTTATATCAATGTCAAAAACCTTACGCCGCTCAAGCTGGTGATCAACTCCGGGAATGGCGCAGCGGGTCCGGTGGTGGACGCTATCGAAGCCCGCTTTAAAGCCCTCGGCGCACCGGTGGAGTTAATCAAAGTGCATAACACGCCGGACGGCAATTTCCCCAACGGTATTCCTAACCCGTTGCTGCCGGAATGTCGCGACGACACCCGCAATGCGGTCATCAAACACGGCGCGGATATGGGCATTGCCTTTGATGGCGATTTTGACCGCTGTTTCCTGTTTGACGAAAAAGGGCAGTTTATTGAGGGCTACTACATTGTCGGCCTGCTGGCAGAAGCGTTCCTCGAAAAAAATCCCGGCGCGAAGATCATCCACGATCCACGTCTCTCCTGGAACACCATTGATGTGGTGACGGCCGCGGGCGGCACGCCGGTGATGTCGAAAACAGGACACGCCTTTATTAAAGAACGTATGCGCAAGGAAGACGCCATCTACGGTGGCGAAATGAGCGCTCACCATTACTTCCGCGATTTCGCTTACTGTGACAGCGGCATGATCCCGTGGCTGCTGGTCGCCGAACTGGTGTGCCTGAAAGGAAAAACGCTGGGCGAACTGGTGCGCGACCGGATGGCGGCGTTTCCGGCAAGCGGTGAGATCAACAGAAAACTGGCGCACCCTGTTGAGGCGATTAACCGCGTGGAACAGCATTTTAGCCGTGAGGTGCTGGCGGTGGATCGCACCGATGGCATCAGCATGACCTTTGCCGACTGGCGCTTTAACCTGCGCTCTTCCAACACCGAACCGGTGGTGCGCCTGAATGTGGAATCTCGCGGTGATGTTCAGGTTATGGTAATCCATACTCAAGAAATATTATCAATTTTGACGTCATAAAGAATAAGCCCTGACAAGTTAGGGCTTAATTAATATATATTTTTTTTGAATTGGGGATTTGTGGTAAGATTTTTAATATGTTATTTAATGTGGTTGAATTAATGTTGACTGGAAAATAATAATGAGAACGAAAAAAGCATTACACAACTTTAAAGTTGATTTATTAATTACTTTTTTATTGGTTTTGCTAGGGTTTTATATTCGAACTGTTTTTGTTTCAAAAATGGGAAGTGATATTACTGGAGTGATGTTACTATTCACACAGTTGACAGCATATCTCAATTTGGCAGAATTAGGTATTGGAATTGCAGCTGCCAGCGTATTATATAAACCGCTCAGCGAGAATGAATACAATAAAATAACTTACATAATATCTTTGCTCTCAGTCATATACAAATATATATTTGTGTTTGTTTTGATTCTTGGCGTTGTTATAGGTATCTGTATTTATTACTTTATTGATTCTGTAAAGGTTGTAAATGGCGTTTTTTTATATTGGGCTTTGTTCGTTTTTAATACATCGTTGACATATAGTTATGCTAAATACTCCACATTATTAACTGCTAATCAGCGGTACTCAGCAGTAAGAAAAATTCAAGGTGGCGGAAAAGTTATAATAATTGTATTTCAGATATTAATTTTGTGCTTTACGCAAAGTTTCATACTTTATTTGTTAGTTGAGACTTTAGGTATTTTTTCTCAATATTTGATTTTTAAAAAAATAATTGGGAACGGAAATCAATATCTCAGTAATGAGGTTTTACTTATTGAAAGCGATAAACTTTTGATAAAAAAAGAATTAAAAATAAGAATAAAAAATATGTTCTTCCATAAAATAGGTGCTGTGCTTGTCCTTAATACAGACTACCTGCTTGTATCAAAGTTTCTGACATTAAGTTATGTGACAATTTTTGGCAGCTATATGATGGTATTTCAGATAGTAACTGTTTTGATGTCAAGTTTTGTTAATGCTATTACTGCAGGAATGGGTAATTACTTAATTAATAAAAGTAATTTAGAAATTAAGGAAATTACACGTCAATTTTATGTGATATTTATCGCCTTTGCAACATTCATATCACTAAATATGTTTTTTCTTGTTAATGATTTTATCGCAAAATGGATAGGTGTTAATTATACATTAAGTAACACCCTAGTTGCATTAATGATTGTTAACGTATTCATTAGTGTTGTCAGGGTACCTTCTGATATATTAAAAAACGCAAGTGGACATTTTGGTGATATTTATTATCCATTATTAGAAGGTGTGCTGAATATTACGATATCCATCATTTTGGCTATCATTATTGGATTACCTGGCATTATTATAGGGACAATAGTATCTAACTTAATAGTAATAATGCTTGCGAAACCATTATATCTTTACTCTAAGTTATTTAATCTTAGAAATCCGACGAGGGTTTATTTTGAATTTATTTCTCGGCCTATGTTATATTCATTATGTGTGATTGGGGTGAGCTATTTATTGCGCGATGAAATATATTCATTTAAAGTAAGTACATGGTTGGATTTTATTAACAAGCTACTCTTAGTCTCTACTCCTAGCATATTGGTAATATGTGCTATTTTCTCTACGGATAGTGACTTTAGATTATTTTTCAGAAAAATTATATATGTGATTATGAAGAAATAAAAATTTCGAAAATGTATTAATCGAAATTATGCAACGAGCTTTATTTTTATAAATGATATGTGATCTTTTCGCGAATAGGAGTAAGGATCCGTGTAGGCTGGAGCTGCTTCGAAGTTCCTATACTTTCTAGAGAATAGGAACTTCGGAATAGGAACTAAGGAGGATATTCATATGGATAAAGCCGTAAGCATATAAGCATGGATAAGCTATTTATACTTTAATAAGTACTTTGTATACTTATTTGCGAACATTCCAGGCCGCGAGCATTCAGCGCGGTGATCACACCTGACAGGAGTATGTAATGTCCAAGCAACAGATCGGCGTAGTCGGTATGGCAGTGATGGGACGCAACCTTGCGCTCAACATCGAAAGCCGTGGTTATACCGTCTCTATTTTCAACCGTTCCCGTGAGAAGACGGAAGAAGTGATTGCCGAAAATCCAGGCAAGAAACTGGTTCCTTACTATACGGTGAAAGAGTTTGTCGAATCTCTGGAAACGCCTCGTCGCATCCTGTTAATGGTGAAAGCAGGTGCAGGCACGGATGCTGCTATTGATTCCCTCAAACCATATCTCGATAAAGGAGACATCATCATTGATGGTGGTAACACCTTCTTCCAGGACACTATTCGTCGTAATCGTGAGCTTTCAGCAGAGGGCTTTAACTTCATCGGTACCGGTGTTTCTGGCGGTGAAGAGGGGGCGCTGAAAGGTCCTTCTATTATGCCTGGTGGCCAGAAAGAAGCCTATGAATTGGTAGCACCGATCCTGACCAAAATCGCCGCCGTAGCTGAAGACGGTGAACCATGCGTTACCTATATTGGTGCCGATGGCGCAGGTCACTATGTGAAGATGGTTCACAACGGTATTGAATACGGCGATATGCAGCTGATTGCTGAAGCCTATTCTCTGCTTAAAGGTGGCCTGAACCTCACCAACGAAGAACTGGCGCAGACCTTTACCGAGTGGAATAACGGTGAACTGAGCAGTTACCTGATCGACATCACCAAAGATATCTTCACCAAAAAAGATGAAGACGGTAACTACCTGGTTGATGTGATCCTGGATGAAGCGGCTAACAAAGGTACCGGTAAATGGACCAGCCAGAGCGCGCTGGATCTCGGCGAACCGCTGTCGCTGATTACCGAGTCTGTGTTTGCACGTTATATCTCTTCTCTGAAAGATCAGCGTGTTGCCGCATCTAAAGTTCTCTCTGGTCCGCAAGCACAGCCAGCAGGCGACAAGGCTGAGTTCATCGAAAAAGTTCGTCGTGCGCTGTATCTGGGCAAAATCGTTTCTTACGCCCAGGGCTTCTCTCAGCTGCGTGCTGCGTCTGAAGAGTACAACTGGGATCTGAACTACGGCGAAATCGCGAAGATTTTCCGTGCTGGCTGCATCATCCGTGCGCAGTTCCTGCAGAAAATCACCGATGCTTATGCCGAAAATCCACAGATCGCTAACCTGTTGCTGGCTCCGTACTTCAAGCAAATTGCCGATGACTACCAGCAGGCGCTGCGTGATGTCGTTGCTTATGCAGTACAGAACGGTATTCCGGTTCCGACCTTCTCCGCAGCGGTTGCCTATTACGACAGCTACCGTGCTGCTGTTCTGCCTGCGAACCTGATCCAGGCACAGCGTGACTATTTTGGTGCGCATACTTATAAGCGTATTGATAAAGAAGGTGTGTTCCATACCGAATGGCTGGATTAA

서열번호 20 (실시예 CRM197 서열)

GADDVVDSSKSFVMENFSSYHGTKPGYVDSIQKGIQKPKSGTQGNYDDDWKEFYSTDNKYDAAGYSVDNENPLSGKAGGVVKVTYPGLTKVLALKVDNAETIKKELGLSLTEPLMEQVGTEEFIKRFGDGASRVVLSLPFAEGSSSVEYINNWEQAKALSVELEINFETRGKRGQDAMYEYMAQACAGNRVRRSVGSSLSCINLDWDVIRDKTKTKIESLKEHGPIKNKMSESPNKTVSEEKAKQYLEEFHQTALEHPELSELKTVTGTNPVFAGANYAAWAVNVAQVIDSETADNLEKTTAALSILPGIGSVMGIADGAVHHNTEEIVAQSIALSSLMVAQAIPLVGELVDIGFAAYNFVESIINLFQVVHNSYNRPAYSPGHKTQPFLHDGYAVSWNTVEDSIIRTGFQGESGHDIKITAENTPLPIAGVLLPTIPGKLDVNKSKTHISVNGRKIRMRCRAIDGDVTFCRPKSPVYVGNGVHANLHVAFHRSSSEKIHSNEISSDSIGVLGYQKTVDHTKVNSKLSLFFEIKS

본원에 기재된 구현예는 단지 예시적인 것으로 의도되며, 당업자는 단지 일상적인 실험을 이용하여 본원에 기재된 구체적인 절차에 대한 다수의 등가물을 인식하거나 확인할 수 있을 것이다. 이러한 모든 등가물은 본 발명의 범위 내에 있는 것으로 간주되며 다음 청구범위에 포함된다.

본원에 인용된 모든 참고문헌(특허 출원, 특허 및 간행물 포함)은 마치 각 개별 간행물 또는 특허 또는 특허 출원이 모든 목적을 위하여 전체가 참고로 포함되는 것으로 구체적이고 개별적으로 표시된 것처럼 동일한 정도로 모든 목적을 위하여 전체가 참고로 본원에 포함된다.

SEQUENCE LISTING <110> Janssen Pharmaceuticals, Inc. <120> Multivalent Vaccine Compositions and Uses Thereof <130> CRU6048WOPCT1 <160> 20 <170> PatentIn version 3.5 <210> 1 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Glycosylation consensus sequence <220> <221> VARIANT <222> (2)..(2) <223> Any amino acid residue except Pro <220> <221> VARIANT <222> (3)..(3) <223> Ser or Thr <400> 1 Asn Xaa Xaa 1 <210> 2 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Optimized glycosylation consensus sequence <220> <221> VARIANT <222> (1)..(1) <223> Asp or Glu <220> <221> VARIANT <222> (2)..(2) <223> Any amino acid residue except Pro <220> <221> VARIANT <222> (4)..(4) <223> Any amino acid residue except Pro <220> <221> VARIANT <222> (5)..(5) <223> Ser or Thr <400> 2 Xaa Xaa Asn Xaa Xaa 1 5 <210> 3 <211> 652 <212> PRT <213> Artificial Sequence <220> <223> EPA carrier protein comprising 4 glycosylation consensus sequences (EPA-4) <400> 3 Gly Ser Gly Gly Gly Asp Gln Asn Ala Thr Gly Ser Gly Gly Gly Lys 1 5 10 15 Leu Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys Ala Cys 20 25 30 Val Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser Val Asp 35 40 45 Pro Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr Ser Met 50 55 60 Val Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp Asn Ala 65 70 75 80 Leu Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly Gly Val 85 90 95 Glu Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala Arg Gly 100 105 110 Ser Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys Pro Ser 115 120 125 Asn Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln Leu Ser 130 135 140 His Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu Leu Ala 145 150 155 160 Lys Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu Ser Asn 165 170 175 Glu Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser Val Val 180 185 190 Met Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu Trp Ala 195 200 205 Ser Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val Tyr Asn 210 215 220 Tyr Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu Gly Lys 225 230 235 240 Ile Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu Asp Ile 245 250 255 Lys Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg Leu His 260 265 270 Phe Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys 275 280 285 His Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg Gly Trp 290 295 300 Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu 305 310 315 320 Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg 325 330 335 Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile 340 345 350 Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala 355 360 365 Glu Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly 370 375 380 Ala Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Lys Asp 385 390 395 400 Gln Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser Gly Asp 405 410 415 Ala Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu Gly Asp 420 425 430 Gly Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp Thr Val 435 440 445 Glu Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly Tyr Val 450 455 460 Phe Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser Ile Val 465 470 475 480 Phe Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile Trp Arg 485 490 495 Gly Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr Ala Gln 500 505 510 Asp Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala Leu Leu 515 520 525 Arg Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg Thr Gly 530 535 540 Leu Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg Leu Ile 545 550 555 560 Gly His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro Glu Glu 565 570 575 Glu Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu Arg Thr 580 585 590 Val Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val Gly Gly 595 600 605 Asp Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile Ser Ala 610 615 620 Leu Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu Asp Leu 625 630 635 640 Lys Leu Gly Ser Gly Gly Gly Asp Gln Asn Ala Thr 645 650 <210> 4 <211> 421 <212> PRT <213> Artificial Sequence <220> <223> O4 GtrS amino acid sequence <400> 4 Met Asn Asn Leu Ile Met Asn Asn Trp Cys Lys Leu Ser Ile Phe Ile 1 5 10 15 Ile Ala Phe Ile Leu Leu Trp Leu Arg Arg Pro Asp Ile Leu Thr Asn 20 25 30 Ala Gln Phe Trp Ala Glu Asp Ser Val Phe Trp Tyr Lys Asp Ala Tyr 35 40 45 Glu Asn Gly Phe Leu Ser Ser Leu Thr Thr Pro Arg Asn Gly Tyr Phe 50 55 60 Gln Thr Val Ser Thr Phe Ile Val Gly Leu Thr Ala Leu Leu Asn Pro 65 70 75 80 Asp Tyr Ala Pro Phe Val Ser Asn Phe Phe Gly Ile Met Ile Arg Ser 85 90 95 Val Ile Ile Trp Phe Leu Phe Thr Glu Arg Phe Asn Phe Leu Thr Leu 100 105 110 Thr Thr Arg Ile Phe Leu Ser Ile Tyr Phe Leu Cys Met Pro Gly Leu 115 120 125 Asp Glu Val His Ala Asn Ile Thr Asn Ala His Trp Tyr Leu Ser Leu 130 135 140 Tyr Val Ser Met Ile Leu Ile Ala Arg Asn Pro Ser Ser Lys Ser Trp 145 150 155 160 Arg Phe His Asp Ile Phe Phe Ile Leu Leu Ser Gly Leu Ser Gly Pro 165 170 175 Phe Ile Ile Phe Ile Leu Ala Ala Ser Cys Phe Lys Phe Ile Asn Asn 180 185 190 Cys Lys Asp His Ile Ser Val Arg Ser Phe Ile Asn Phe Tyr Leu Arg 195 200 205 Gln Pro Tyr Ala Leu Met Ile Val Cys Ala Leu Ile Gln Gly Thr Ser 210 215 220 Ile Ile Leu Thr Phe Asn Gly Thr Arg Ser Ser Ala Pro Leu Gly Phe 225 230 235 240 Ser Phe Asp Val Ile Ser Ser Ile Ile Ser Ser Asn Ile Phe Leu Phe 245 250 255 Thr Phe Val Pro Trp Asp Ile Ala Lys Ala Gly Trp Asp Asn Leu Leu 260 265 270 Leu Ser Tyr Phe Leu Ser Val Ser Ile Leu Ser Cys Ala Ala Phe Val 275 280 285 Phe Val Lys Gly Thr Trp Arg Met Lys Val Phe Ala Thr Leu Pro Leu 290 295 300 Leu Ile Ile Ile Phe Ser Met Ala Lys Pro Gln Leu Thr Asp Ser Ala 305 310 315 320 Pro Gln Leu Pro Thr Leu Ile Asn Gly Gln Gly Ser Arg Tyr Phe Val 325 330 335 Asn Ile His Ile Ala Ile Phe Ser Leu Leu Cys Val Tyr Leu Leu Glu 340 345 350 Cys Val Arg Gly Lys Val Ala Thr Leu Phe Ser Lys Ile Tyr Leu Thr 355 360 365 Ile Leu Leu Phe Val Met Gly Cys Leu Asn Phe Val Ile Thr Pro Leu 370 375 380 Pro Asn Met Asn Trp Arg Glu Gly Ala Thr Leu Ile Asn Asn Ala Lys 385 390 395 400 Thr Gly Asp Val Ile Ser Ile Gln Val Leu Pro Pro Gly Leu Thr Leu 405 410 415 Glu Leu Arg Lys Lys 420 <210> 5 <211> 1266 <212> PRT <213> Artificial Sequence <220> <223> Example O4 gtrS nucleic acid sequence <400> 5 Ala Thr Gly Ala Ala Thr Ala Ala Thr Thr Thr Ala Ala Thr Thr Ala 1 5 10 15 Thr Gly Ala Ala Thr Ala Ala Cys Thr Gly Gly Thr Gly Thr Ala Ala 20 25 30 Ala Thr Thr Ala Thr Cys Thr Ala Thr Ala Thr Thr Thr Ala Thr Thr 35 40 45 Ala Thr Thr Gly Cys Ala Thr Thr Thr Ala Thr Thr Thr Thr Gly Cys 50 55 60 Thr Ala Thr Gly Gly Cys Thr Thr Ala Gly Ala Ala Gly Gly Cys Cys 65 70 75 80 Gly Gly Ala Thr Ala Thr Ala Cys Thr Cys Ala Cys Ala Ala Ala Cys 85 90 95 Gly Cys Ala Cys Ala Ala Thr Thr Thr Thr Gly Gly Gly Cys Ala Gly 100 105 110 Ala Ala Gly Ala Thr Thr Cys Cys Gly Thr Thr Thr Thr Cys Thr Gly 115 120 125 Gly Thr Ala Thr Ala Ala Gly Gly Ala Cys Gly Cys Cys Thr Ala Thr 130 135 140 Gly Ala Gly Ala Ala Cys Gly Gly Ala Thr Thr Cys Thr Thr Ala Ala 145 150 155 160 Gly Thr Thr Cys Ala Cys Thr Ala Ala Cys Ala Ala Cys Gly Cys Cys 165 170 175 Thr Ala Gly Gly Ala Ala Thr Gly Gly Gly Thr Ala Thr Thr Thr Cys 180 185 190 Cys Ala Gly Ala Cys Thr Gly Thr Thr Thr Cys Thr Ala Cys Ala Thr 195 200 205 Thr Thr Ala Thr Ala Gly Thr Thr Gly Gly Thr Cys Thr Gly Ala Cys 210 215 220 Thr Gly Cys Thr Thr Thr Ala Thr Thr Ala Ala Ala Thr Cys Cys Ala 225 230 235 240 Gly Ala Thr Thr Ala Thr Gly Cys Ala Cys Cys Thr Thr Thr Thr Gly 245 250 255 Thr Thr Thr Cys Thr Ala Ala Thr Thr Thr Thr Thr Thr Thr Gly Gly 260 265 270 Cys Ala Thr Ala Ala Thr Gly Ala Thr Thr Cys Gly Cys Thr Cys Ala 275 280 285 Gly Thr Ala Ala Thr Thr Ala Thr Ala Thr Gly Gly Thr Thr Thr Thr 290 295 300 Thr Ala Thr Thr Thr Ala Cys Ala Gly Ala Ala Ala Gly Ala Thr Thr 305 310 315 320 Cys Ala Ala Cys Thr Thr Cys Cys Thr Cys Ala Cys Ala Thr Thr Gly 325 330 335 Ala Cys Thr Ala Cys Thr Ala Gly Gly Ala Thr Thr Thr Thr Cys Thr 340 345 350 Thr Ala Thr Cys Thr Ala Thr Thr Thr Ala Thr Thr Thr Thr Cys Thr 355 360 365 Ala Thr Gly Cys Ala Thr Gly Cys Cys Thr Gly Gly Ala Thr Thr Gly 370 375 380 Gly Ala Thr Gly Ala Ala Gly Thr Thr Cys Ala Thr Gly Cys Ala Ala 385 390 395 400 Ala Thr Ala Thr Ala Ala Cys Ala Ala Ala Thr Gly Cys Ala Cys Ala 405 410 415 Thr Thr Gly Gly Thr Ala Thr Thr Thr Gly Thr Cys Ala Thr Thr Ala 420 425 430 Thr Ala Thr Gly Thr Ala Thr Cys Ala Ala Thr Gly Ala Thr Cys Cys 435 440 445 Thr Gly Ala Thr Ala Gly Cys Thr Cys Gly Cys Ala Ala Thr Cys Cys 450 455 460 Ala Ala Gly Thr Thr Cys Ala Ala Ala Ala Thr Cys Ala Thr Gly Gly 465 470 475 480 Ala Gly Gly Thr Thr Thr Cys Ala Thr Gly Ala Thr Ala Thr Ala Thr 485 490 495 Thr Cys Thr Thr Thr Ala Thr Cys Thr Thr Gly Cys Thr Ala Thr Cys 500 505 510 Cys Gly Gly Gly Cys Thr Cys Ala Gly Thr Gly Gly Cys Cys Cys Ala 515 520 525 Thr Thr Thr Ala Thr Ala Ala Thr Thr Thr Thr Cys Ala Thr Thr Thr 530 535 540 Thr Ala Gly Cys Ala Gly Cys Thr Thr Cys Ala Thr Gly Cys Thr Thr 545 550 555 560 Thr Ala Ala Ala Thr Thr Thr Ala Thr Ala Ala Ala Thr Ala Ala Thr 565 570 575 Thr Gly Thr Ala Ala Ala Gly Ala Thr Cys Ala Thr Ala Thr Thr Ala 580 585 590 Gly Thr Gly Thr Ala Ala Gly Ala Thr Cys Thr Thr Thr Cys Ala Thr 595 600 605 Ala Ala Ala Thr Thr Thr Cys Thr Ala Cys Thr Thr Gly Cys Gly Thr 610 615 620 Cys Ala Gly Cys Cys Ala Thr Ala Cys Gly Cys Ala Thr Thr Ala Ala 625 630 635 640 Thr Gly Ala Thr Thr Gly Thr Thr Thr Gly Cys Gly Cys Thr Thr Thr 645 650 655 Ala Ala Thr Thr Cys Ala Ala Gly Gly Ala Ala Cys Thr Thr Cys Thr 660 665 670 Ala Thr Ala Ala Thr Thr Cys Thr Ala Ala Cys Thr Thr Thr Cys Ala 675 680 685 Ala Thr Gly Gly Cys Ala Cys Ala Cys Gly Thr Thr Cys Cys Thr Cys 690 695 700 Ala Gly Cys Ala Cys Cys Gly Cys Thr Ala Gly Gly Ala Thr Thr Cys 705 710 715 720 Ala Gly Thr Thr Thr Thr Gly Ala Thr Gly Thr Gly Ala Thr Thr Thr 725 730 735 Cys Gly Thr Cys Thr Ala Thr Thr Ala Thr Ala Thr Cys Ala Thr Cys 740 745 750 Gly Ala Ala Thr Ala Thr Thr Thr Thr Thr Thr Thr Ala Thr Thr Thr 755 760 765 Ala Cys Ala Thr Thr Thr Gly Thr Cys Cys Cys Ala Thr Gly Gly Gly 770 775 780 Ala Thr Ala Thr Thr Gly Cys Ala Ala Ala Gly Gly Cys Thr Gly Gly 785 790 795 800 Gly Thr Gly Gly Gly Ala Thr Ala Ala Thr Thr Thr Ala Cys Thr Gly 805 810 815 Thr Thr Ala Thr Cys Thr Thr Ala Thr Thr Thr Thr Thr Thr Gly Thr 820 825 830 Cys Thr Gly Thr Thr Thr Cys Gly Ala Thr Thr Thr Thr Gly Thr Cys 835 840 845 Gly Thr Gly Thr Gly Cys Gly Gly Cys Cys Thr Thr Thr Gly Thr Thr 850 855 860 Thr Thr Thr Gly Thr Thr Ala Ala Ala Gly Gly Thr Ala Cys Gly Thr 865 870 875 880 Gly Gly Cys Gly Ala Ala Thr Gly Ala Ala Ala Gly Thr Ala Thr Thr 885 890 895 Thr Gly Cys Ala Ala Cys Thr Thr Thr Ala Cys Cys Ala Thr Thr Gly 900 905 910 Cys Thr Ala Ala Thr Thr Ala Thr Ala Ala Thr Ala Thr Thr Thr Thr 915 920 925 Cys Ala Ala Thr Gly Gly Cys Ala Ala Ala Ala Cys Cys Ala Cys Ala 930 935 940 Ala Thr Thr Gly Ala Cys Ala Gly Ala Cys Thr Cys Gly Gly Cys Ala 945 950 955 960 Cys Cys Thr Cys Ala Ala Thr Thr Gly Cys Cys Ala Ala Cys Ala Cys 965 970 975 Thr Thr Ala Thr Thr Ala Ala Thr Gly Gly Gly Cys Ala Ala Gly Gly 980 985 990 Thr Thr Cys Ala Ala Gly Ala Thr Ala Cys Thr Thr Cys Gly Thr Ala 995 1000 1005 Ala Ala Thr Ala Thr Ala Cys Ala Thr Ala Thr Thr Gly Cys Gly 1010 1015 1020 Ala Thr Ala Thr Thr Cys Thr Cys Thr Thr Thr Gly Cys Thr Ala 1025 1030 1035 Thr Gly Thr Gly Thr Thr Thr Ala Cys Thr Thr Ala Cys Thr Thr 1040 1045 1050 Gly Ala Gly Thr Gly Cys Gly Thr Cys Ala Gly Gly Gly Gly Gly 1055 1060 1065 Ala Ala Ala Gly Thr Gly Gly Cys Ala Ala Cys Thr Thr Thr Ala 1070 1075 1080 Thr Thr Thr Thr Cys Cys Ala Ala Ala Ala Thr Ala Thr Ala Cys 1085 1090 1095 Thr Thr Ala Ala Cys Ala Ala Thr Thr Thr Thr Gly Cys Thr Ala 1100 1105 1110 Thr Thr Cys Gly Thr Gly Ala Thr Gly Gly Gly Ala Thr Gly Thr 1115 1120 1125 Thr Thr Gly Ala Ala Thr Thr Thr Thr Gly Thr Thr Ala Thr Cys 1130 1135 1140 Ala Cys Cys Cys Cys Ala Cys Thr Cys Cys Cys Ala Ala Ala Cys 1145 1150 1155 Ala Thr Gly Ala Ala Cys Thr Gly Gly Ala Gly Gly Gly Ala Ala 1160 1165 1170 Gly Gly Thr Gly Cys Thr Ala Cys Thr Thr Thr Gly Ala Thr Thr 1175 1180 1185 Ala Ala Thr Ala Ala Thr Gly Cys Ala Ala Ala Ala Ala Cys Thr 1190 1195 1200 Gly Gly Thr Gly Ala Thr Gly Thr Cys Ala Thr Thr Thr Cys Gly 1205 1210 1215 Ala Thr Thr Cys Ala Ala Gly Thr Gly Cys Thr Ala Cys Cys Ala 1220 1225 1230 Cys Cys Thr Gly Gly Cys Cys Thr Ala Ala Cys Ala Cys Thr Thr 1235 1240 1245 Gly Ala Ala Cys Thr Ala Ala Gly Gly Ala Ala Ala Ala Ala Ala 1250 1255 1260 Thr Ala Ala 1265 <210> 6 <211> 713 <212> PRT <213> Artificial Sequence <220> <223> Example PglB sequence ('wild-type') <400> 6 Met Leu Lys Lys Glu Tyr Leu Lys Asn Pro Tyr Leu Val Leu Phe Ala 1 5 10 15 Met Ile Ile Leu Ala Tyr Val Phe Ser Val Phe Cys Arg Phe Tyr Trp 20 25 30 Val Trp Trp Ala Ser Glu Phe Asn Glu Tyr Phe Phe Asn Asn Gln Leu 35 40 45 Met Ile Ile Ser Asn Asp Gly Tyr Ala Phe Ala Glu Gly Ala Arg Asp 50 55 60 Met Ile Ala Gly Phe His Gln Pro Asn Asp Leu Ser Tyr Tyr Gly Ser 65 70 75 80 Ser Leu Ser Ala Leu Thr Tyr Trp Leu Tyr Lys Ile Thr Pro Phe Ser 85 90 95 Phe Glu Ser Ile Ile Leu Tyr Met Ser Thr Phe Leu Ser Ser Leu Val 100 105 110 Val Ile Pro Thr Ile Leu Leu Ala Asn Glu Tyr Lys Arg Pro Leu Met 115 120 125 Gly Phe Val Ala Ala Leu Leu Ala Ser Ile Ala Asn Ser Tyr Tyr Asn 130 135 140 Arg Thr Met Ser Gly Tyr Tyr Asp Thr Asp Met Leu Val Ile Val Leu 145 150 155 160 Pro Met Phe Ile Leu Phe Phe Met Val Arg Met Ile Leu Lys Lys Asp 165 170 175 Phe Phe Ser Leu Ile Ala Leu Pro Leu Phe Ile Gly Ile Tyr Leu Trp 180 185 190 Trp Tyr Pro Ser Ser Tyr Thr Leu Asn Val Ala Leu Ile Gly Leu Phe 195 200 205 Leu Ile Tyr Thr Leu Ile Phe His Arg Lys Glu Lys Ile Phe Tyr Ile 210 215 220 Ala Val Ile Leu Ser Ser Leu Thr Leu Ser Asn Ile Ala Trp Phe Tyr 225 230 235 240 Gln Ser Ala Ile Ile Val Ile Leu Phe Ala Leu Phe Ala Leu Glu Gln 245 250 255 Lys Arg Leu Asn Phe Met Ile Ile Gly Ile Leu Gly Ser Ala Thr Leu 260 265 270 Ile Phe Leu Ile Leu Ser Gly Gly Val Asp Pro Ile Leu Tyr Gln Leu 275 280 285 Lys Phe Tyr Ile Phe Arg Ser Asp Glu Ser Ala Asn Leu Thr Gln Gly 290 295 300 Phe Met Tyr Phe Asn Val Asn Gln Thr Ile Gln Glu Val Glu Asn Val 305 310 315 320 Asp Leu Ser Glu Phe Met Arg Arg Ile Ser Gly Ser Glu Ile Val Phe 325 330 335 Leu Phe Ser Leu Phe Gly Phe Val Trp Leu Leu Arg Lys His Lys Ser 340 345 350 Met Ile Met Ala Leu Pro Ile Leu Val Leu Gly Phe Leu Ala Leu Lys 355 360 365 Gly Gly Leu Arg Phe Thr Ile Tyr Ser Val Pro Val Met Ala Leu Gly 370 375 380 Phe Gly Phe Leu Leu Ser Glu Phe Lys Ala Ile Met Val Lys Lys Tyr 385 390 395 400 Ser Gln Leu Thr Ser Asn Val Cys Ile Val Phe Ala Thr Ile Leu Thr 405 410 415 Leu Ala Pro Val Phe Ile His Ile Tyr Asn Tyr Lys Ala Pro Thr Val 420 425 430 Phe Ser Gln Asn Glu Ala Ser Leu Leu Asn Gln Leu Lys Asn Ile Ala 435 440 445 Asn Arg Glu Asp Tyr Val Val Thr Trp Trp Asp Tyr Gly Tyr Pro Val 450 455 460 Arg Tyr Tyr Ser Asp Val Lys Thr Leu Val Asp Gly Gly Lys His Leu 465 470 475 480 Gly Lys Asp Asn Phe Phe Pro Ser Phe Ala Leu Ser Lys Asp Glu Gln 485 490 495 Ala Ala Ala Asn Met Ala Arg Leu Ser Val Glu Tyr Thr Glu Lys Ser 500 505 510 Phe Tyr Ala Pro Gln Asn Asp Ile Leu Lys Thr Asp Ile Leu Gln Ala 515 520 525 Met Met Lys Asp Tyr Asn Gln Ser Asn Val Asp Leu Phe Leu Ala Ser 530 535 540 Leu Ser Lys Pro Asp Phe Lys Ile Asp Thr Pro Lys Thr Arg Asp Ile 545 550 555 560 Tyr Leu Tyr Met Pro Ala Arg Met Ser Leu Ile Phe Ser Thr Val Ala 565 570 575 Ser Phe Ser Phe Ile Asn Leu Asp Thr Gly Val Leu Asp Lys Pro Phe 580 585 590 Thr Phe Ser Thr Ala Tyr Pro Leu Asp Val Lys Asn Gly Glu Ile Tyr 595 600 605 Leu Ser Asn Gly Val Val Leu Ser Asp Asp Phe Arg Ser Phe Lys Ile 610 615 620 Gly Asp Asn Val Val Ser Val Asn Ser Ile Val Glu Ile Asn Ser Ile 625 630 635 640 Lys Gln Gly Glu Tyr Lys Ile Thr Pro Ile Asp Asp Lys Ala Gln Phe 645 650 655 Tyr Ile Phe Tyr Leu Lys Asp Ser Ala Ile Pro Tyr Ala Gln Phe Ile 660 665 670 Leu Met Asp Lys Thr Met Phe Asn Ser Ala Tyr Val Gln Met Phe Phe 675 680 685 Leu Gly Asn Tyr Asp Lys Asn Leu Phe Asp Leu Val Ile Asn Ser Arg 690 695 700 Asp Ala Lys Val Phe Lys Leu Lys Ile 705 710 <210> 7 <211> 120 <212> PRT <213> Escherichia coli <400> 7 Met Leu Lys Leu Phe Ala Lys Tyr Thr Ser Ile Gly Val Leu Asn Thr 1 5 10 15 Leu Ile His Trp Val Val Phe Gly Val Cys Ile Tyr Val Ala His Thr 20 25 30 Asn Gln Ala Leu Ala Asn Phe Ala Gly Phe Val Val Ala Val Ser Phe 35 40 45 Ser Phe Phe Ala Asn Ala Lys Phe Thr Phe Lys Ala Ser Thr Thr Thr 50 55 60 Met Arg Tyr Met Leu Tyr Val Gly Phe Met Gly Thr Leu Ser Ala Thr 65 70 75 80 Val Gly Trp Ala Ala Asp Arg Cys Ala Leu Pro Pro Met Ile Thr Leu 85 90 95 Val Thr Phe Ser Ala Ile Ser Leu Val Cys Gly Phe Val Tyr Ser Lys 100 105 110 Phe Ile Val Phe Arg Asp Ala Lys 115 120 <210> 8 <211> 306 <212> PRT <213> Escherichia coli <400> 8 Met Lys Ile Ser Leu Val Val Pro Val Phe Asn Glu Glu Glu Ala Ile 1 5 10 15 Pro Ile Phe Tyr Lys Thr Val Arg Glu Phe Glu Glu Leu Lys Ser Tyr 20 25 30 Glu Val Glu Ile Val Phe Ile Asn Asp Gly Ser Lys Asp Ala Thr Glu 35 40 45 Ser Ile Ile Asn Ala Leu Ala Val Ser Asp Pro Leu Val Val Pro Leu 50 55 60 Ser Phe Thr Arg Asn Phe Gly Lys Glu Pro Ala Leu Phe Ala Gly Leu 65 70 75 80 Asp His Ala Thr Gly Asp Ala Ile Ile Pro Ile Asp Val Asp Leu Gln 85 90 95 Asp Pro Ile Glu Val Ile Pro His Leu Ile Glu Lys Trp Gln Ala Gly 100 105 110 Ala Asp Met Val Leu Ala Lys Arg Ser Asp Arg Ser Thr Asp Gly Arg 115 120 125 Leu Lys Arg Lys Thr Ala Glu Trp Phe Tyr Lys Leu His Asn Lys Ile 130 135 140 Ser Asn Pro Lys Ile Glu Glu Asn Val Gly Asp Phe Arg Leu Met Ser 145 150 155 160 Arg Asp Val Val Glu Asn Ile Lys Leu Met Pro Glu Arg Asn Leu Phe 165 170 175 Met Lys Gly Ile Leu Ser Trp Val Gly Gly Lys Thr Asp Ile Val Glu 180 185 190 Tyr Val Arg Ala Glu Arg Ile Ala Gly Asp Thr Lys Phe Asn Gly Trp 195 200 205 Lys Leu Trp Asn Leu Ala Leu Glu Gly Ile Thr Ser Phe Ser Thr Phe 210 215 220 Pro Leu Arg Ile Trp Thr Tyr Ile Gly Leu Val Val Ala Ser Val Ala 225 230 235 240 Phe Ile Tyr Gly Ala Trp Met Ile Leu Asp Thr Ile Ile Phe Gly Asn 245 250 255 Ala Val Arg Gly Tyr Pro Ser Leu Leu Val Ser Ile Leu Phe Leu Gly 260 265 270 Gly Ile Gln Met Ile Gly Ile Gly Val Leu Gly Glu Tyr Ile Gly Arg 275 280 285 Thr Tyr Ile Glu Thr Lys Lys Arg Pro Lys Tyr Ile Ile Lys Arg Val 290 295 300 Lys Lys 305 <210> 9 <211> 14440 <212> DNA <213> Artificial Sequence <220> <223> example O4 rfb locus nucleotide sequence - O4-EPA production strain BVEC-L-00684f <400> 9 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320 cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380 aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440 atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500 cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560 accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620 gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtatatggt 1680 gatttgcctc atcctgacga ggtaaataat acagaagaat tacccttatt tactgagaca 1740 acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800 cgcgcgtgga aacgtaccta tggtttaccg accattgtga ctaattgctc taacaattat 1860 ggtccttatc atttcccgga aaaattgatt ccattggtta ttctcaatgc tctggaaggt 1920 aaagcattac ctatttatgg taaaggggat caaattcgcg actggctgta tgttgaagat 1980 catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040 ggtgggcaca acgaaaagaa aaacatagat gtagtgctca ctatttgtga tttgctggat 2100 gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc cgatcgtccg 2160 ggacacgatc gccgttatgc gattgatgct gagaatattg gtcgcgaatt gggatggaaa 2220 ccacaggaaa cgtttgagag cgggattcgg aagacagtgg aatggtatct gtccaataca 2280 aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaga gaactatgag 2340 ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400 agcgtgctct ggcacctctg ggtaacttga ttgctcttga tgttcattcc actgattatt 2460 gtggcgattt cagtaacccc gaaggtgtgg ctgaaaccgt caaaaaaatt cgcccagatg 2520 ttattgttaa tgctgctgct cataccgcgg tagataaggc tgagtcagaa ccagaatttg 2580 cacaattact caatgcgacc agcgttgaag caattgcaaa agcggctaat gaagttgggg 2640 cttgggtaat tcattactca actgactacg tcttccctgg aaatggcgac atgccatggc 2700 tcgagactga tgtaaccgct ccgctcaatg tttatggcaa aaccaaattg gctggagaaa 2760 gagcattaca agaacattgc gcaaagcatc ttattttccg taccagctgg gtatatgcag 2820 gtaaaggaaa taactttgcc aaaacaatgt tacgtctggc aaaagagcgc gaagaactgg 2880 ctgtgataaa cgatcagttt ggcgcaccaa caggtgctga attgctggct gattgcaccg 2940 ctcatgccat tcgcgtggca ttaaaaaaac cagaagttgc tggcttgtac catctggtag 3000 caaatggcac aacaacctgg cacgattacg ccgcgctagt attcgaagaa gcccgtaaag 3060 cagggattga ccttgcactt aacaaactca acgccgtacc aacaacggct tatcctactc 3120 cagcccgccg tcctcataat tctcgcctca ataccgaaaa gtttcagcag aactttgcgc 3180 ttgtcttgcc tgactggcag gtgggcgtga aacgtatgct caacgaatta tttacgacta 3240 cggcaattta acaaattttt gcatctcgct catgatgcca gagcgggatg aattaaaagg 3300 aatggtgaaa tgaaaacgcg taaaggtatt attctggctg gtggttccgg cactcgtctt 3360 tatcctgtga cgatggcagt gagtaaacaa ctgctgccga tttatgataa gccgatgatt 3420 tattatccgc tttcaacgct tatgttagcg ggtattcgcg atattcttat tatcagtacg 3480 ccacaggata caccgcgttt ccaacaattg ttgggggacg ggagtcagtg ggggcttaat 3540 ctacagtata aagtacaacc gagtccggat ggcctggcgc aagcgtttat tattggtgaa 3600 gactttattg gtggtgatga ttgtgcactc gtacttggcg ataatatctt ctatggacac 3660 gacttgccga aattaatgga agctgctgtt aacaaagaaa tcggtgcaac ggtatttgct 3720 tatcacgtca atgatcctga acgttatggt gtcgtggagt ttgataataa cggtactgca 3780 attagcctgg aagaaaaacc gctggaacca aaaagtaact atgcggttac tgggctttat 3840 ttctatgaca atgatgttgt agaaatggcg aaaaacctta agccttctgc ccgtggcgaa 3900 ctggaaatta ccgatattaa ccgtatttat atggagcagg gacgtttgtc tgtcgctatg 3960 atggggcgtg gttatgcctg gttggatact ggtacacatc aaagtcttat tgaagcaagt 4020 aacttcattg ccaccattga agagcgtcag ggattaaagg tatcttgccc ggaagagatt 4080 gcttaccgta aagggtttat tgatgctgag caggtgaaag tattagccga accgctgaag 4140 aaaaatgatt atggtcagta tctgctaaaa atgattaaag gttattaata aaatgaacgt 4200 aattaaaact gaaattcctg atgtgctgat ttttgaacca aaagtttttg gtgatgaacg 4260 tggcttcttt tttgagagtt ttaaccagaa agtatttgaa gaagctgtag gacggaaggt 4320 tgaatttgtt caggataacc attctaagtc taaaataaat gtattgcgtg ggatgcatta 4380 tcaaacacaa aatactcaag gaaaactggt tcgggtaatt tctggttcag tatatgatgt 4440 tgccgtagat ttaagagaaa aatcaaagac atttggcaaa tgggtgggtg tagaattatc 4500 tgggaataat aaaagacaat tgtggatccc cgaaggtttt gcccatggtt tttatgtgtt 4560 ggaggagaat accgaatttg tttataaatg taccgatact tataaccctg ctcatgaaca 4620 cacattgcta tggaatgatc caactatcaa tataagttgg ccaatcatac aaaactgcaa 4680 gccaattatt tctgaaaaag atgctaatgg acatcttttt tcacataaaa cctatttctg 4740 aaatgcaata ttatgagttt aattagaaac agtttctata atattgctgg ttttgctgtg 4800 ccgacattag ttgcagtccc tgctttgggg attcttgcca ggctgcttgg accggagaat 4860 tttggacttt tcacactagc attcgctttg ataggatatg caagtatttt cgacgccggg 4920 attagtcgag ctgtaatcag agaaatcgct ctttatcgag aaagtgaaaa agagcaaata 4980 caaattattt cgacagcaag tgtaatcgta ctattcttag gggtggttgc agctttgtta 5040 ctttatttta gtagtaataa agttgttgag ttattgaatg ttagttccgt ttatattgaa 5100 acagcagtgc gtgcattctc tgttatttca tttataatac ctgtgtatct gattaaccag 5160 atttggcttg gttatctgga agggctagaa aaatttgcaa atataaatgt tcagagaatg 5220 atttctagca caagcttggc tatattacca gtgatatttt gttattacaa tccctcgttg 5280 ctttatgcta tgtatgggtt ggtggttggg cgtgtgattt catttttgat tagcgcaata 5340 atttgtcgag atattattct taaaagtaaa ctttacttta atgtggcaac ttgcaatcgt 5400 cttatctctt ttggtggatg gataacagtt agtaatatca taagcccaat catggcatat 5460 ttcgaccgct ttatcatctc tcatattatg ggggcttcga gaattgcatt ttatacagcg 5520 ccctcagagg gtgtatcaag gttaattaat atcccatatg ctttggcaag agctctattt 5580 cctaaattgg catatagcaa taatgatgat gaacgaaaaa aattacaact acagagctac 5640 gcaattataa gcattgtatg tctacccata gttgttattg gtgtcatttt tgcctcattc 5700 ataatgacaa catggatggg acctgattat gccttagaag cagcaactat catgaaaata 5760 cttcttgctg gttttttctt taactcttta gcgcaaatac cttatgcata cttgcaatct 5820 atcggaaagt caaaaattac cgcatttgtg catctcatag aacttgcgcc atacttatta 5880 ttattgtatt acttcacaat gcatttcggc ataattggca cggcaatcgc ttggtcactt 5940 agaacatttt gtgattttgt tatactactt tcgatatcga gaagaaaatg attgcggttg 6000 atattgcgct tgcaacctac aatggtgcta attttattcg gcaacagatt gaatctatcc 6060 agaaacaaac ttatagaaat tggcgtctta taataagtga tgataactcg agtgatgata 6120 ctgttgatat tattaaggat atgatgtcta acgacagtcg tatctatttg gtaggaaata 6180 aaagacaagg aggggttatt cagaacttta attatgctct ttcacaaact acatctgaaa 6240 ttgtgttact atgtgaccag gatgacattt ggccggagga gcgtctggaa attcttatag 6300 ataaatttaa ggccttgcag cgtaatgatt ttgttccggc aatgatgttt actgatttga 6360 aattagtaga cgaaaataat tgtttgattg cagaaagttt ttatcgaacg aataatatta 6420 atccacaaga taatctgaaa aataataatc ttctctggcg ttcaacggta tatggctgta 6480 cttgcatcat gaataagaaa cttgttgata ttgcattgcc tatacctaca tatgcacata 6540 tgcatgatca atggttggca ttattagcga agcaatatgg taacattttt tatttcgact 6600 atgcgtctgt tcgttatagg caacattcta caaatgttgt tggtggtaga aataaaacgc 6660 catttcaaaa atttaattcc atacaaaaaa acctaaaaag gattaatttg ctagtggata 6720 gaactgttgc tttaattaaa tcaaataacg atttctatcc agggaataaa atggaaaata 6780 aaattgatta cttaaaattt ggagtgaatg aagtattacc ttatcttttt aaaggaaaca 6840 agaaagtttt ttcactttgt gtattaatta gtttggcatt acaaaaatga tatatttatt 6900 attttttttt gcactgttta tgatctgtac gtttttaaca cacaggcgac aggcattata 6960 tgttgtatct gcgttagtat ttcttttttt ggctttaacc tatccatcag gaggggactg 7020 gataggttat tttctccatt atgactgcat ggttaatgag cagtgtaata atggttttat 7080 aatgtttgaa cctggatatg aattaattgt ttccttattt ggatatttgg gatttcagac 7140 aattattatt tttatagccg ctgtaaatgt aattctaata ttaaattttg caaagcattt 7200 tgaaaacgga agttttgtta ttgttgcgat aatgtgcatg ttcctttgga gtgtttatgt 7260 tgaggcgatt agacaggctc tggccttatc tatagttata tttgggattc attctctttt 7320 tttgggtaga aaaaggaaat ttataacatt agtattattt gcgtcaactt tccatataac 7380 tgctttgatt tgttttcttc taatgactcc tctattttca aagaaattaa gcaagataat 7440 aagttatagc ctattaattt tcagtagctt ctttttcgct ttttctgaaa ccatattaag 7500 tgcactcctt gcaattttgc cagaaggatc cattgccagt gaaaaattaa gtttttactt 7560 agcaaccgag caatacaggc cacagttatc tattgggagt ggcactattc ttgacattat 7620 acttattttt ctgatatgtg taagttttaa acgaataaag aaatatatgc tcgctaatta 7680 taatgctgca aatgagatat tgcttattgg ttgctgtctt tatatttctt tcggtatttt 7740 tatcgggaaa atgatgccag ttatgactcg cattggttgg tatggttttc catttgttat 7800 agtacttctt tatattaact tgggttattc agaatatttt aagaggtata taaataaaag 7860 agggtgtggg tatagcaaat tattaattgc tttttatttt ttgctacaaa ttttgcgacc 7920 attaacatat gattatagct attataatat aatgcaccag gatactttgc tgaataggtt 7980 tgatgcatta gatgatgcat cattaagaca atcagcgaag agaaaatgtt tcgatttggg 8040 aaagatagga tatggtttct tatgtagtat ataatatcct gcattcattc ggataatttc 8100 ctatggaagt gtcctttgct ctgtctgtcc tcatttgttg aaattttatg ttaataagaa 8160 gctttagata accacttagg aactgtatgt ttgatctgtc caaaaattat attattgtaa 8220 gtgcgacggc gctggcttcc ggaggtgcat taactatatt aaagcaattt ataaaacatg 8280 catcacaaaa ttcaaatgac tatattatgt ttgtatctgc gggattggag ttgccggtct 8340 gtgataacat catttacata gaaaacacac caaaaggatg gttgaaaaga atatattggg 8400 attggttcgg ttgtcggaag tttatctcgg aacataagat taacgttaag aaagtaattt 8460 ctctacaaaa ttccagtttg aatgttcctt acgaacagat tatttacttg caccagccaa 8520 ttccttttag taaagttgat tcttttttaa aaaatatcac atccgataac gtaaagcttt 8580 ttttatataa aaagttttat tcctatttta tatttaaata tgtgaatgcc aatacaacca 8640 tcgtagtgca aacgaattgg atgaaaaaag gagtgctgga gcaatgtgat aaaattagta 8700 ccgaaagggt ccttgttata aaacctgata tcaaagcatt taataatact aattttgatg 8760 tagatatgga tgtatctgca aaaacactct tatatccagc gacaccactt acctataaaa 8820 atcatttggt cattctgaag gcgttggtta ttttaaagaa aaagtatttt atagatgatc 8880 tgaaattcca agtgactttt gaaaagaata ggtacaaaaa ttttgataag tttgtgcaat 8940 taaataactt aagcaaaaac gttgattatc tcggcgttct ttcatactcg aacttgcaaa 9000 aaaaatatat ggcggcatct ttaatcgttt ttcctagcta tatcgaatca tatgggttac 9060 cactcatcga agctgctagt ttaggaaaaa aaatcattag tagtgatctt ccttatgccc 9120 gggatgtttt aaaggattat agcggcgtag attttgtaat ttacaataat gaagatggct 9180 gggctaaggc gttgtttaat gttttaaatg gcaattcgaa gctcaatttt aggccttatg 9240 aaaaagatag tcgttcatct tggccacagt tcttctctat tttgaaataa ggtgtattat 9300 gtttaatggt aaaatattgt taattactgg tggtacgggg tctttcggta atgctgttct 9360 aagacgtttt cttgacactg atatcaaaga aatacgtatt ttttcccggg atgaaaaaaa 9420 acaagatgac atgaggaaaa aatataataa tccgaaactt aagttctata taggtgatgt 9480 tcgcgactat tcgagtatcc tcaatgcttc tcgaggtgtt gattttattt atcatgctgc 9540 agctctgaag caagtacctt cctgcgaatt ccacccaatg gaagctgtaa aaacgaatgt 9600 tttaggtacg gaaaacgtac tggaagcggc aatagctaat ggagttaggc gaattgtatg 9660 tttgagtaca gataaagctg tatatcctat caatgcaatg ggtatttcca aagcgatgat 9720 ggaaaaagta atggtagcaa aatcgcgcaa tgttgactgc tctaaaacgg ttatttgcgg 9780 tacacgttat ggcaatgtaa tggcatctcg tggttcagtt atcccattat ttgtcgatct 9840 gattaaatca ggtagaccaa tgacgataac agaccctaat atgactcgtt tcatgatgac 9900 tctcgaagac gctgttgatt tggttcttta cgcatttgaa catggcaata atggtgatat 9960 ttttgtccaa aaggcacctg cggctaccat cgaaacgttg gctattgcac tcaaagaatt 10020 acttaatgta aaccaacacc ctgtaaatat aatcggcacc cgacacgggg aaaaactgta 10080 cgaagcgtta ttgagccgag aggaaatgat tgcagcggag gatatgggtg attattatcg 10140 tgttccacca gatctccgcg atttgaacta tggaaaatat gtggaacatg gtgaccgtcg 10200 tatctcggaa gtggaagatt ataactctca taatactgat aggttagatg ttgagggaat 10260 gaaaaaatta ctgctaaaac ttccttttat ccgggcactt cggtctggtg aagattatga 10320 gttggattca taatatgaaa attttagtta ctggcgctgc agggtttatc ggtcgaaatt 10380 tggtattccg gcttaaggaa gctggatata acgaactcat tacgatagat cgtaactctt 10440 ctttggcgga tttagagcag ggacttaagc aggcagattt tatttttcac cttgctgggg 10500 taaatcgtcc cgtgaaggag tgtgaatttg aagagggaaa tagtaatcta actcaacaga 10560 ttgttgatat cctgaaaaaa aacaataaaa atactcctat catgctgagt tcttccatcc 10620 aggctgaatg tgataacgct tatggaaaga gtaaagcagc tgcggaaaaa atcattcagc 10680 agtatgggga aacgacaaac gctaaatatt atatttatcg cttgccgaat gtattcggta 10740 agtggtgtcg accaaattat aactccttta tagcaacttt ctgccatcgc attgcaaatg 10800 atgaagctat tacaattaat gatccttcag cagttgtaaa tctggtgtat atagatgact 10860 tttgttctga catattaaag ctattagaag gagcgaacga aactggttac aggacatttg 10920 gtccaattta ttctgttact gttggtgaag tggcacaatt aatttaccgg tttaaagaaa 10980 gtcgccaaac attaatcacc gaagatgtag gtaatggatt tacacgtgca ttgtactcaa 11040 catggttaag ttacctgtct cctgaacagt ttgcgtatac ggttccttct tatagtgatg 11100 acagaggggt attctgtgaa gtattgaaaa cgaaaaacgc gggccagttt tcgttcttta 11160 ctgcgcatcc aggaattact cggggtggtc attatcatca ttccaaaaat gagaaattta 11220 ttgtcatccg aggaagtgct tgtttcaaat ttgaaaatat tgtcacgagt gaacgatatg 11280 aacttaatgt ttcctctgat gattttaaaa ttgttgaaac agttccggga tggacgcata 11340 acattactaa taatggctcg gatgagctag ttgttatgct ttgggcaaat gaaatattta 11400 atcgttctga accagatact atagcgagag ttttatcgtg aaaaaattga aagtcatgtc 11460 ggttgttggg actcgtccag aaattattcg actctcgcgt gtccttgcaa aattagatga 11520 atattgtgac caccttattg ttcataccgg gcaaaactac gattatgaac tgaatgaagt 11580 ttttttcaaa gatttgggtg ttcgcaaacc tgattatttt cttaatgccg caggtaaaaa 11640 tgcagcagag actattggac aagttatcat taaagttgat gaggtccttg aacaggaaaa 11700 accagaagcc atgttagtac ttggcgatac taactcctgt atttcagcaa taccagcaaa 11760 gcgtcgaaga attccgatct tccatatgga ggctgggaat cgttgttttg accaacgcgt 11820 accggaagaa actaacagaa aaatagttga tcataccgct gatatcaata tgacatatag 11880 tgatatcgcg cgtgaatatc ttctggctga aggtgtacca gccgatagaa ttattaaaac 11940 cggtagccca atgtttgaag tactcactca ttatatgccg cagattgatg gttccgatgt 12000 actttctcgc ctgaatttaa cacctgggaa tttctttgtg gtaagtgccc acagagaaga 12060 aaatgttgat acccctaaac aacttgtgaa actggcgaat atacttaata ccgtggctga 12120 aaaatatgat gtcccggtag ttgtttctac tcatcctcgc actcgtaacc gcatcaacga 12180 aaacggtatt caattccata aaaatatctt gcttcttaag ccattaggat ttcacgatta 12240 caaccatctg caaaaaaatg cacgtgctgt tttatcggat agtgggacta ttacagaaga 12300 gtcctccatt atgaacttcc ctgcactcaa tatacgagaa gcgcacgaac gcccggaagg 12360 cttcgaagaa ggggcagtaa tgatggtcgg tcttgaatct gatcgcgttt tacaggcatt 12420 agaaattatt gcaacacagc ctcgtggaga agtacgctta cttcgtcagg ttagtgacta 12480 tagcatgcca aatgtttcag ataaagttct gcgtattatc cattcatata ctgactacgt 12540 taaacgggtt gtctggaagc aatactaatg aaacttgcat taatcattga tgattatttg 12600 ccccatagca cacgcgttgg ggctaaaatg tttcatgagt taggccttga attactgagc 12660 agaggccatg atgtaactgt aattacgcct gacatctcat tacaagcaat ttattctatt 12720 agtatgattg atggtataaa ggtttggcgt ttcaaaagtg gacctttaaa ggatgtaggt 12780 aaggctaaac gtgccataaa tgaaactctt ttatcttttc gcgcatggcg cgcatttaag 12840 cacctcattc aacatgatac atttgatggt atcgtttatt attccccctc tattttttgg 12900 ggcgacttgg ttaaaaaaat aaaacaacga tgccagtgcc caagctatct gatcctaagg 12960 gatatgtttc cacagtgggt cattgatgca ggtatgttga aagccggttc accaattgaa 13020 aaatatttta ggtattttga aaaaaagtca tatcagcagg ctggccggat aggggtaatg 13080 tctgataaga atcttgagat atttcgccag accaataaag gttatccgtg tgaagtttta 13140 cgtaattggg cctcaatgac tcctgtgtct gccagcgatg attatcattc acttcgtcaa 13200 aaatacgatc taaaagataa agtcattttt ttctatggcg gtaatattgg gcatgctcag 13260 gatatggcaa acttaatgcg ccttgcgcgt aatatgatgc gttatcatga tgctcatttc 13320 ctgtttatag ggcagggtga tgaagttgag ctgataaaat ctcttgctgc agaatggaat 13380 ttaactaatt tcactcatct accttcagtg aaccaggaag agtttaaatt aattttatct 13440 gaagttgatg tcggcctgtt ctccctttca tctcgccatt cttcacataa tttccccgga 13500 aaattactag ggtatatggt tcaatcaatc ccgatccttg ggagtgtgaa tggcggcaat 13560 gatttaatgg atgtaattaa taagcacaga gccggtttca ttcatgttaa tggtgaagat 13620 gataaactgt ttgaatctgc acaattgctt cttagtgatt cagttttaag aaaacagcta 13680 ggtcagaacg ctaatgtgtt gttaaagtct caattttcgg ttgaatcggc ggcacatact 13740 atcgaagtcc gactggaggc tggagaatgc gtttagttga tgacaatatt ctggatgaac 13800 tttttcgcac tgcagcaaat tctgaacgtt tgcgcgctca ttatttattg cacgcatctc 13860 atcaggagaa ggttcaacgt ttacttattg catttgtacg cgacagctat gttgaacccc 13920 attggcatga gttaccgcat cagtgggaaa tgtttgtcgt catgcaaggg caattagaag 13980 tttgtttgta tgagcaaaat ggtgagatcc aaaaacagtt tgttgttgga gacggtacgg 14040 gaataagcgt cgtggaattt tccccaggag atatacatag tgtcaaatgc ctgtcaccaa 14100 aagcccttat gttggagata aaggaggggc catttgaccc actcaaagct aaggcttttt 14160 ctaagtggtt atagggcgat acaccaccgt ttattcttct atcttattct atacatgctg 14220 ggttaccatc ttagcttctt caagccgcgc aaccccgcgg tgaccacccc tgacaggagt 14280 agctagcatt tgaccacccc tgacaggatt agctagcata tgagctcgag gatatctact 14340 gtgggtaccc gggatccgtg taggctggag ctgcttcgaa gttcctatac tttctagaga 14400 ataggaactt cggaatagga actaaggagg atattcatat 14440 <210> 10 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> example signal sequence for EPA carrier protein <400> 10 Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser 1 5 10 15 Ala Ser Ala <210> 11 <211> 13043 <212> DNA <213> Artificial Sequence <220> <223> example O1A rfb locus nucleotide sequence - O1A-EPA production strain stGVXN4411 and stLMTB10217 <400> 11 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcgtgaagat acttgttact aggggcgcag gatttattgg ttctgctgta 1320 gttcgtcaca ttataaataa tacgcaggat agtgttgtta atgtcgataa attaacgtac 1380 gccggaaacc tggaatcact tgctgatgtt tctgactctg aacgctatgt ttttgaacat 1440 gcggatattt gcgatgctgc tgcaatggcg cggatttttg ctcagcatca gccggatgca 1500 gtgatgcacc tggctgctga aagccatgtg gatcgttcaa ttacaggccc tgcggcattt 1560 attgaaacca atattgttgg tacttatgtc cttttggaag cggctcgcaa ttactggtct 1620 gctcttgatg gcgacaagaa aaatagcttc cgttttcatc atatttctac tgacgaagtc 1680 tatggtgatt tgcctcatcc tgacgaagta aataataaag aacaattacc cctctttact 1740 gagacgacag cttacgcgcc tagtagtcct tattccgcat caaaagcatc cagcgatcat 1800 ttagtccgcg cgtggaaacg tacctatggt ttaccgacta ttgtgactaa ctgttcgaat 1860 aactacggtc cttatcactt tccggaaaaa ttgattccac tagtaattct taatgctctg 1920 gaaggtaagg cattacctat ttatggcaaa ggggatcaaa ttcgtgactg gctgtatgtt 1980 gaagatcatg cgcgtgcgtt atataccgta gttactgaag gtcaagcggg tgaaacctat 2040 aacattggcg gacacaacga aaagaaaaac atcgatgttg tgctgactat ttgtgatttg 2100 ttggacgaga tagtcccgaa agagaaatct tatcgtgagc aaattactta tgttgctgat 2160 cgcccagggc atgatcgccg ttatgcgatt gatgctgaga agattggtcg cgaattggga 2220 tggaaaccac aggaaacgtt tgagagtggg attcgtaaaa cggtggaatg gtatttggct 2280 aatgcaaaat gggttgataa tgtgaaaagt ggtgcctatc aatcgtggat tgaacagaac 2340 tatgagggcc gccagtaatg aatatcctcc tttttggcaa aacagggcag gtaggttggg 2400 aactacagcg tgctctggca cctctgggta atttgattgc tcttgatgtt cactccactg 2460 attactgtgg tgattttagt aaccctgaag gtgtggctga aacagtcaaa agaattcgac 2520 ctgatgttat tgttaatgct gcggctcaca ccgcagtaga taaggctgag tcagaacccg 2580 aatttgcaca attactcaat gcgactagcg ttgaatcaat tgcaaaagcg gcaaatgaag 2640 ttggggcttg ggtaattcat tactcaactg actacgtatt ccctggaaat ggcgacacgc 2700 catggctgga gatggatgca accgcaccgc taaatgttta cggtgaaacc aagttagctg 2760 gagaaaaagc attacaagag cattgtgcga agcacctaat tttccgtacc agctgggtct 2820 atgcaggtaa aggaaataat ttcgccaaaa cgatgttgcg tctggcaaaa gagcgtgaag 2880 aactagccgt tattaatgat cagtttggtg cgccaacagg tgctgaactg ctggctgatt 2940 gtacggcaca tgccattcgt gtcgcactga ataaaccgga tgtcgcaggc ttgtaccatt 3000 tggtagccag tggtaccaca acctggtacg attatgctgc gctggttttt gaagaggcgc 3060 gcaatgcagg cattcctctt gcactcaaca agctcaacgc agtaccaaca actgcctatc 3120 ctacaccagc tcgtcgtcca cataactctc gccttaatac agaaaaattt cagcagaatt 3180 ttgcgcttgt attgcctgac tggcaggttg gtgtgaaacg catgctcaac gaattattta 3240 cgactacagc aatttaatag tttttgcatc ttgttcgtga tggtggagca agatgaatta 3300 aaaggaatga tgaaatgaaa acgcgtaaag gtattatttt agcgggtggt tctggtactc 3360 gtctttatcc tgtgactatg gtcgtcagta aacagctatt acctatatat gataaaccga 3420 tgatctatta tccgctttct acactgatgt tagcgggtat tcgcgatatt ctgattatta 3480 gtacgccaca ggatactcct cgttttcaac aactgctggg tgacggtagc cagtggggcc 3540 tgaatcttca gtacaaagtg caaccgagtc cggatggtct tgcgcaggca tttattatcg 3600 gtgaagagtt tattggtggt gatgattgtg ctttggtact tggtgataat atcttctacg 3660 gtcacgacct gcctaagtta atggatgccg ctgttaacaa agaaagtggt gcaacggtat 3720 ttgcctatca cgttaatgat cctgaacgct atggtgtcgt tgagtttgat aaaaacggta 3780 cggcgatcag cctggaagaa aaaccgctac aaccaaaaag taattatgcg gtaaccgggc 3840 tttattttta tgataacgac gttgtcgaaa tggcgaaaaa tcttaagcct tctgcccgcg 3900 gtgaactgga aattaccgat attaaccgta tctatatgga acaagggcgt ttatctgttg 3960 ccatgatggg gcgtggttat gcgtggttag acacggggac acatcagagc ctgattgagg 4020 caagcaactt tattgcaaca attgaagagc gtcaggggct gaaagtttcc tgcccggaag 4080 aaattgctta ccgtaaaggg tttgttgatg ctgagcaggt gaaagtatta gctgaacctc 4140 tgaaaaaaaa tgcttatggt cagtatctgc tgaaaatgat taaaggttat taataaaatg 4200 aacgtaatta aaacagaaat tcctgatgta ctgatttttg aaccgaaagt ttttggtgat 4260 gagcgtggtt tcttttttga gagctttaac cagaaggttt ttgaggaagc tgtaggccgc 4320 aaagttgaat ttgttcagga taaccattcg aagtctagta aaggtgtttt acgcgggctg 4380 cattatcagt tggaacctta tgcacaagga aaattggtgc gttgcgttgt cggtgaagtt 4440 tttgacgtag ctgttgatat tcgtaaatcg tcatcgactt ttggcaaatg ggttggggtg 4500 aatttatctg ctgagaataa gcggcaattg tggattcctg agggatttgc acatggtttt 4560 ttagtgctga gtgagacggc ggagtttttg tataagacga caaattatta tcatcctcag 4620 agtgatagag gaataaaatg ggatgatcca agcatcaata tttcatggcc agtcgattca 4680 caagtgctgc tatcagctaa agataataag catcctccat taacaaagat tgaaatgtat 4740 agttaagatc acgataaatc ttggaagggt tgcaaaattg aataaaatag tgagcaaaag 4800 tgaaataagg aacgtaatcc acaatgctgg ctatatgatg attactcaga tagctttata 4860 tgttgcacca ttatttatac tgagttatct gttaaaaaca ctgggggttg cacagtttgg 4920 taattatgcc ttaatactat caatcgttgc atatttacag attataacgg attatggttt 4980 ttcttttagt gcaagtcgtg cgatctcaca gaatagagag gacaaagaat atatatcaaa 5040 aatttatctg tcaactatga ctatcaagtt ggcgatatgc gctttcttat tcttattgct 5100 catgctattt ttaaatcttt tgcctgtgca agctgaatta aaacaaggaa tattatatgg 5160 atatcttctt gtaataggaa atactttcca accacaatgg tttttccaag gtatcgaaaa 5220 attaaaaatc atagcccttt ctaatgttat atcaagatgc gccgcgtgtt tacttgtatt 5280 tatctatgtg aggaatagcg aggatttaca aaaagcactt ttagtacagt cacttccatt 5340 agtaatttct gcgattggat taaatatatt tatattgaaa tatatcaata ttatttttcc 5400 ggaaaaaaaa ttatttaagg taattttaaa agaaggtaag gatttttttc ttgcatcact 5460 ttattctgtt attctcaata atagtggcat ttttctatta gggattttta ctaatcctgt 5520 tattgttggt gtatatgccg ccgctgaaaa gatagtcaag gccgtattgt cgctatttac 5580 accactgacg caagctatat atccttataa ttgtcgtaag ttttcactat ccgtatttga 5640 cggcattgag gcagcaaaaa aaactggtat accaattata attttagcat ttatagctgc 5700 tgttatcgtt gcaattacct tacctgttgc aatcgactat cttaattttc caaaagaaac 5760 aatttttgta ggtcaaatat taagtgcatg gatctttttt ggtgttctta ataatgtatt 5820 cggcattcag atattgagtg catcaggaag aagtaaaata tatagtagga tggtattcgt 5880 atcagcgctt ataacattac ttttgattac tctattattg cagttttgta acgccactgg 5940 agtggcatgt gcaatattat tgggtgaaat gttcttatca atattgttac ttaagcgata 6000 taaaaaaata atttaaggaa tagttatgaa gaagttatta ttagtgttcg gtactaggcc 6060 tgaagcaata aagatggcct ctatcattga attattaaaa aaagattgta gattcgaata 6120 taaaatatgt gtgacaggcc aacataaaga gatgcttgat caagttatgc aagtatttga 6180 tgttaaacct gattataatt tacggattat gcagcctggg caaacattag tatctatagc 6240 aacaaatata ctctcacggt taagtgaagt tttaattata gaaaagccag atattatact 6300 tgtgcatggg gatacaacga ctacccttgc tgctacttta gctgggtatt accaccaaat 6360 aaaagtttgt catgtggaag caggattaag aacaggggat atttactctc cttggcctga 6420 agagggcaat cgtaaagtta caggggcatt agcatgtatt catttcgccc caacagagag 6480 atcaaaagat aatctcctga gggagggggt caaagtaaat aatatatttg taacgggtaa 6540 taccgtcatc gactctttat ttattgcaaa agatatcata gataatgacc ctaatataaa 6600 gaacgcttta cataataaat ttaattttct tgataaaagc cgacgagtag tacttataac 6660 aggtcatcga agagaaaatt tcgggaaagg ttttgaagat atatgctttg caataaagga 6720 attagctttc atttatccta atgtagattt tatttatccg gtgcatctta atcccaatgt 6780 aatggaacca gtacatcgta tattagataa tatatgtaat atttacctta ttgagccctt 6840 ggattatttg ccttttgttt atttaatgaa tgagtcatat ttaatattga ctgattcagg 6900 ggggatacaa gaagaagcgc cttcgttagg taaaccggtt ttggttatgc gtgatactac 6960 tgaacgccct gaggcggttg aggctggtac tgttgtatta gtggggactt ctaagataaa 7020 aatagtaaat aaagtaacgg agctattaaa caatgctgat atctacaatg ctatgtctct 7080 gttacataat ccatatggcg atggaacagc tgctcaaaaa attcttaatg tgctcgccca 7140 agagctaatt taatttaagc taaaaatatg ttattaatta ttgctgatta tccaaacgaa 7200 atgaatatgc gcgagggagc tatgcaacga atagatgcga tagactctct cattcgagat 7260 cgcaagcgag tgtatttgaa tatttcattc aaaaagcatc tagttcgctc aaatagttcc 7320 tttaataatg ttatagttga aaatctaaat gcaattattc acagaaacat cataaaacag 7380 tacatgcaaa aatcaacaac tatatatgtt cattctgttt ataatttatt aaaggttata 7440 acgctcattg atctaaaaaa aacaattctt gatatacatg gtgttgtacc ggaagaactt 7500 ttggcagata ataaaaaatt acttagtaaa gtatataaca tggtggaaaa aaaaggtgtc 7560 cttggatgca aaaaattaat acacgtcagt acagaaatgc aaaaacacta tgaagcaaaa 7620 tatggagtaa acttggctga aaggtcaata gtgctcccga tttttgaata taaaaatata 7680 acccaatcgc aaaacaaatg gacagaaaat aaaatacgaa gtatctatct tggaggatta 7740 caaacatggc aaaatattga taaaatgatt caagtttgtg atgacacagt gataaacaat 7800 gaagcaggta agtatgaatt caactttttc atcccacaga gtaacttgga agggtttata 7860 gataaatatt cgttaaaatt acataatatc aatgctaatg catctacgct atcacgtgat 7920 gaagtaattc cctttctaaa agaatgtcat attggttttg tattgcgcga tgatataata 7980 gtaaacagag ttgcgtgccc tacaaaattg gttgaatatt tagagtgtgg tgtcgttcca 8040 gttgtgctct ccccacttat aggtgatttt tattcgatgg gatatcaata cattactaca 8100 gaggaaatgg ctaacagaag tataagtttg ttggatcttg aaaaaatggc tgcacataat 8160 ttacaaattt tgacttctta tcagaagaga acctacaagg cacagaaaga acttattgct 8220 caactgtgct gaatttttta catatataaa attatgtaag catatcgcgg gtcaggtaat 8280 tgtatgcgta tcaaatataa agataacggt tatatattat gttttctatt atgtttcatt 8340 ttgagctact tagttttact caaatctgac tactttcctg ctgattttct gccatataca 8400 gaaatatacg atgggacata cggagaaatc aataatattg agcctgcctt tttatattta 8460 acacggttgt ttcattattt aaatttcccc tatatatttt ttgcaatgtt agtttgtgcc 8520 ttatgtttaa gttggaaaat aaaatatgca agaaaaataa ttaaagatag ttatatatat 8580 ttgttcttgt atgtatatgt atcattttat gtgtttttgc atgaaatgac tcaattgcgc 8640 atagcaattg cagtcactat gtgctatgtg tcggtttatt attactttta taaaaattgt 8700 attaaacatg cactgccatg gatggtgttg gctattttgt ttcattacag cgccttgctt 8760 ttatttatgt cattatttat atacagttat aggaggttat taatagtaat tatagggttt 8820 gtaatatgta tgagcttttt aaacgtgtat gcagatacaa ttgcactata tttgccaaat 8880 gaaaaaatag taaattattt atatagtatt tcatcatcat tagacaatag aaatgatttg 8940 gcaatattca acctgaataa tataatattt ttatcaatat ttattttgat cttttatctt 9000 agccgatata taaaattaaa tgataatgag gcgaagttta ttaagtatgt gcaatgttca 9060 ggaatattag ccttttgtat tttctttctg gctagtggag tcccggtcat tgcttatcga 9120 actgcagagt tgctgcgaat attttatccg atggctttag tattaatcct ttcgcatata 9180 aaaaataata atatgcgtta ttttattgca gtcattatag ttatcctttc aggcttaatg 9240 ttgtttataa cactaagggc tgtatcaata gttggtcaag gattataaaa tgaatgttgc 9300 tattttgttg tctacgtata atggcgaaaa atatttagag gaacaactgg attcattgct 9360 gcttcaaagt tatcaggatt ttgtagtgta tatccgtgat gacggatcat ctgatagaac 9420 tgtaaatata ataaaccaat acgtaatgaa agataacaga tttattaacg tgggtaattc 9480 agaaaatctt ggttgtgctg cttcgtttat taatttatta agaaatgctt cagccgatat 9540 ttatatgttt tgtgaccaag atgattattg gcttccgaat aaattacagc gtgctgtgga 9600 ttatttttcg gctattgatc ctttacaacc taccttgtat cattgcgatc taagcgttgt 9660 tgatgaaaaa cttaatatta tacaaaattc atttttgcag catcagaaaa tgtcagcgta 9720 tgattcaatg agaaaaaata atcttttcat acaaaatttt gttgttggtt gttcatgtgc 9780 tgttaatgct tcacttgcgg aatttgttct ttcgcgaatt ggagagcagc atgtaaaaat 9840 gatagctatg catgactggt ggttagccgt gactgcaaaa ctttttggtc gaatccattt 9900 tgataatact caaacgattc tttatcgaca acatcagggc aatgtattag gtgcaaaatc 9960 atcaggtatg atgcgtttta ttcgattagg attaaatggg caagggattt cgcgagtagt 10020 atcttttaga aaaaaagttt gtgcgcaaaa taagcttctt ttagatgtct atgataaaga 10080 tttaaatctt gagcaaaaaa aatctatcag gcttgtaatt gagggcctta aagagaactc 10140 ttcaattgct gaccttttaa aatgtttcta tcatggtagc tatatgcaag gttttaaacg 10200 taatcttgcc ttaatatatt cagttcttta cacaaaaaaa agaagatagt gtatccttat 10260 gaaaaaaatt gctattatcg gtactgttgg cataccagca tcatatggcg gatttgaaac 10320 attagttgaa aatttaacaa gatacaattc ctcgggagtt gaatataatg ttttttgttc 10380 atcgtttcac tacaaatccc accaaaaaaa acataatggg gcccgtttaa tttatattcc 10440 gcttaaagcc aatggatggc agagcattgc gtatgacata atttcgttag catattctat 10500 ttttttgaag cctgatgtga ttctgatttt aggggtttct ggttgttcat ttttgccttt 10560 cttcaaactc ttaacacgcg ctaagtttat tactaatatt gatggcctgg aatggcgaag 10620 agataaatgg aattcaaaag tgaaacgttt cttaaaattt tcagaaaaaa tcgcagttca 10680 atattcggat gtcgttatta cggataatga ggcaatttct gagtacgttt ttaacgagta 10740 taataaagat agccgagtta ttgcctatgg aggggatcat gcatggttaa atactgagga 10800 tgtatttaca acaagaaatt ataaaagcga ttactacctt tctgtatgtc gtatcgaacc 10860 cgaaaacaat gtagaattaa ttttaaaaac attttcaaag ctaaaatata aaataaaatt 10920 tattggaaat tggaatggca gcgagtttgg aaagaaactt aggctgcatt attctaacta 10980 tccaaatatt gaaatgattg atccgattta tgatcttcaa caattatttc acttacgaaa 11040 taattgcata ggatatatac atggtcattc ggctggagga acaaaccctt ctttagtcga 11100 ggcaatgcat tttagtaaac ctatatttgc atatgattgt aagtttaata ggtacactac 11160 tgaaaatgaa gcatgttatt tttctaatga atctgacctc gcagagaaaa tcataatgca 11220 ttgtgagcta tcattaggtg tctctggcac gaaaatgaaa gaaattgcta accagaaata 11280 cacttggaga cgaatagcag aaatgtatga ggattgctat taactctgtt aaacttcaaa 11340 tcttttacaa tatatggcat gactataagc gcattaattg tttttcaagc cgctctcgcg 11400 gtgaccaccc cctgacaggg gatccgtgta ggctggagct gcttcgaagt tcctatactt 11460 tctagagaat aggaacttcg gaataggaac taaggaggat attcatatgg ataaagccgt 11520 aagcatataa gcatggataa gctatttata ctttaataag tactttgtat acttatttgc 11580 gaacattcca ggccgcgagc attcagcgcg gtgatcacac ctgacaggag tatgtaatgt 11640 ccaagcaaca gatcggcgta gtcggtatgg cagtgatggg acgcaacctt gcgctcaaca 11700 tcgaaagccg tggttatacc gtctctattt tcaaccgttc ccgtgagaag acggaagaag 11760 tgattgccga aaatccaggc aagaaactgg ttccttacta tacggtgaaa gagtttgtcg 11820 aatctctgga aacgcctcgt cgcatcctgt taatggtgaa agcaggtgca ggcacggatg 11880 ctgctattga ttccctcaaa ccatatctcg ataaaggaga catcatcatt gatggtggta 11940 acaccttctt ccaggacact attcgtcgta atcgtgagct ttcagcagag ggctttaact 12000 tcatcggtac cggtgtttct ggcggtgaag agggggcgct gaaaggtcct tctattatgc 12060 ctggtggcca gaaagaagcc tatgaattgg tagcaccgat cctgaccaaa atcgccgccg 12120 tagctgaaga cggtgaacca tgcgttacct atattggtgc cgatggcgca ggtcactatg 12180 tgaagatggt tcacaacggt attgaatacg gcgatatgca gctgattgct gaagcctatt 12240 ctctgcttaa aggtggcctg aacctcacca acgaagaact ggcgcagacc tttaccgagt 12300 ggaataacgg tgaactgagc agttacctga tcgacatcac caaagatatc ttcaccaaaa 12360 aagatgaaga cggtaactac ctggttgatg tgatcctgga tgaagcggct aacaaaggta 12420 ccggtaaatg gaccagccag agcgcgctgg atctcggcga accgctgtcg ctgattaccg 12480 agtctgtgtt tgcacgttat atctcttctc tgaaagatca gcgtgttgcc gcatctaaag 12540 ttctctctgg tccgcaagca cagccagcag gcgacaaggc tgagttcatc gaaaaagttc 12600 gtcgtgcgct gtatctgggc aaaatcgttt cttacgccca gggcttctct cagctgcgtg 12660 ctgcgtctga agagtacaac tgggatctga actacggcga aatcgcgaag attttccgtg 12720 ctggctgcat catccgtgcg cagttcctgc agaaaatcac cgatgcttat gccgaaaatc 12780 cacagatcgc taacctgttg ctggctccgt acttcaagca aattgccgat gactaccagc 12840 aggcgctgcg tgatgtcgtt gcttatgcag tacagaacgg tattccggtt ccgaccttct 12900 ccgcagcggt tgcctattac gacagctacc gtgctgctgt tctgcctgcg aacctgatcc 12960 aggcacagcg tgactatttt ggtgcgcata cttataagcg tatcgataaa gaaggtgtgt 13020 tccataccga atggctggat taa 13043 <210> 12 <211> 13790 <212> DNA <213> Artificial Sequence <220> <223> example O2 rfb locus nucleotide sequence - O2-EPA production strain stGVXN4906 <400> 12 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320 cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380 aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440 atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500 cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560 accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620 gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680 gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740 acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800 cgcgcatgga aacgtacgta tggtttaccg accattgtga ctaattgctc gaacaactat 1860 ggtccgtatc acttcccgga aaagcttatt ccattggtta ttcttaatgc actggaaggt 1920 aaggcattac ctatttatgg caaaggggat caaattcgcg actggttgta tgtagaggat 1980 catgctcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040 ggcggacaca acgaaaagaa aaacatcgat gttgtgctga ctatttgtga tttgttggat 2100 gagattgtac cgaaagagaa atcttatcgt gagcaaatta cttatgttgc tgatcgccca 2160 gggcatgatc gccgttatgc aattgatgcc gataaaatta gccgcgaatt gggctggaaa 2220 ccacaggaaa cgtttgagag cgggattcgc aaaacggtgg aatggtatct ggctaataca 2280 aattgggttg agaatgtgaa aagcggtgct tatcagtcat ggatcgaaca aaactatgag 2340 ggccgtcagt aatgaatatc ctgcttttcg gcaaaacagg gcaggtgggt tgggaactgc 2400 agcgtgctct ggcgccgctg ggtaatctga tcgctcttga tgttcactcc actaattatt 2460 gtggagattt cagcaacccc gaaggtgtgg cagaaaccgt caaaaaaatt cgtcctgacg 2520 ttattgttaa tgctgctgct cacactgcag tagataaagc agaatcagaa ccggatttcg 2580 cacaattact taacgcgaca agcgtcgaag cgattgcaaa agctgctaat gaagtcgggg 2640 cctgggttat acactactct actgattatg ttttcccagg cagtggtgac gcgccatggc 2700 tggaaacgga tgcaacagca ccgctaaatg tttacggtga aacaaaatta gctggggaaa 2760 aggcattaca agaacattgc gcaaagcatc ttattttccg taccagctgg gtatacgctg 2820 gtaaaggaaa taactttgct aaaacgatgt tgcgtttggc aaaagaacgc gaagaactgg 2880 ctgtgataaa cgatcagttt ggcgcaccaa caggtgctga attgctggct gattgcaccg 2940 ctcatgccat tcgcgtggca ttaaaaaaac cagaagtcgc tggcttgtac catctggtag 3000 caagtggcac aacaacctgg cacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060 cagggattaa tcttgcactt aacaaactta acgccgtgcc aacaacggcc tatcccacac 3120 cagcccgtcg accccataac tctcgcctca atacagaaaa gtttcagcag aactttgcgc 3180 ttgtcttgcc tgactggcag gtgggcgtga aacgtatgct caacgaatta tttacgacta 3240 cggcaattta acaaattttt gcatctcgct catgatgcca gagcgggatg aattaaaagg 3300 aatggtgaaa tgaaaacgcg taaaggtatt attctggctg gtggttccgg cactcgtctt 3360 tatcctgtga cgatggcagt gagtaaacaa ttgctgccga tttatgataa gccgatgatt 3420 tattatccgc tttcaacgct tatgttagcg ggtattcgcg atattcttat tattagtacg 3480 ccacaggata caccgcgttt ccaacaatta ttgggggacg ggagccagtg gggtcttaat 3540 ctacagtata aagtacaacc gagtccggat ggcctggcgc aagcgtttat tattggcgaa 3600 gactttattg gtggtgatga ttgtgcactc gtacttggcg ataatatctt ctatggacac 3660 gacttgccga aattgatgga agctgctgtt aacaaagaaa gcggtgcaac ggtatttgct 3720 tatcacgtta atgatcctga acgctatggt gtcgtggagt ttgataataa cggtacggca 3780 attagcctgg aagaaaaacc gctggagcca aaaagcaact atgcggttac tgggctttat 3840 ttctatgaca atgacgttgt ggaaatggct aaaaacctta agccttctgc ccgtggcgaa 3900 ctggaaatta ccgatattaa ccgtatttat atggaacaag gacgtttgtc tgtagccatg 3960 atggggcgtg gctatgcatg gttggataca gggacgcatc aaagccttat tgaagcaagt 4020 aacttcattg caacaattga agagcgtcag ggattaaagg tatcttgccc ggaagagatt 4080 gcttaccgta aagggtttat tgatgccgag caggtgaaag tattagccga accgcttatc 4140 aagaatcaat atggtcaata tttgctgaaa atgatcagcg aatagtatat gggaactcaa 4200 tgatggatat taaattaatc tctttgcaaa aacatgggga tgagcgcggt gcattaattg 4260 ctcttgaaga gcaacgaaat atacctttcg aagtcaaaag aatatattac atacttgaga 4320 ctcttaatgg agtaagacgc ggatttcatg cgcacaaggt tactcgtcag ttagctattg 4380 tagtcaaggg agcttgtaaa tttcatctgg ataatggtaa agaaacaaag caggtggaac 4440 ttaatgatcc aacaattgcg ttgctgatag aaccctatat atggcatgaa atgtatgatt 4500 ttagtgatga ttgtgtgctg cttgtaattg cggatgattt ctataaagag tctgattata 4560 tccgcaatta tgatgatttt attagaagag taaattcaat tgagaattca taagctaagt 4620 gacgtccaga caacatcaat tggtgatgga acaactatct ggcagtttgt tgtgatacta 4680 aaaggtgctg taattggtaa taattgcaac atctgtgcaa ataccttaat tgaaaataac 4740 gttgtaattg gtaacaatgt cacagtcaaa agcggtgtgt atatttggga tggcgttaaa 4800 atagaggata atgtttttat tggtccttgt gtagcattta caaatgataa gtatcctcgc 4860 tctaaagtct atcctgatga atttttgcaa acaataatac gcaaaggagc atcaataggt 4920 gctaacgcaa ccatcctgcc aggaattgaa attggtgaaa aagcaatcgt tggtgcgggg 4980 agtgttgtaa ccaaaaatgt accgccatgc gcaatagtag taggtaatcc agctcgattt 5040 attaaatggg tagaggataa tgaataaaat tgatttttta gatctttttg caattaacca 5100 gcgacagcac aaagaattag tctctgcgtt tagtagggtg ctagattctg gttggtatat 5160 catgggcgaa gaacttgagc agttcgagaa agagttcgca gaatactgtg gagttaagta 5220 ttgcattggt gtagcaaatg gccttgatgc gttgatacta gtattgaggg catggaaaga 5280 acttggctat cttgaagacg gtgacgaggt attagtaccg gcaaatacat atattgcttc 5340 tattcttgct ataacagaga acaaacttgt tcctgttctt gttgaaccag atatagaaac 5400 ttataatatt aatcctgctt taattgaaaa ttacattacg gaaaaaacta aagcaatatt 5460 accggttcac ttatatggtc tattgtgcaa tatgccagaa attagtgcaa tcgccagaaa 5520 atataatctg ttgattcttg aagattgtgc acaagcacat ggtgcaatac gtgatggtcg 5580 caaagctgga gcttgggggg atgctgcagg atttagtttt tatccaggaa aaaaccttgg 5640 agctttgggg gatgcgggag ctgttactac aaataatgca gaattatcct caactataaa 5700 agctttgcga aattatgggt cacataagaa atatgaaaat atttatcagg gattgaatag 5760 tcgattggat gaactgcaag cagccttatt gcgtgtaaaa atccatacat taccggaaga 5820 tactgcgatt cggcaaagga ttgctgaaaa atatattcgt gaaataaaaa accctgcgat 5880 tacgttacca gtgtacgaag gccaaggtgc gcatgtttgg catttatttg tagtaagaat 5940 cgctaatcgt gaaaaattcc agtcatactt attagagaag ggtatcaaaa ccttaattca 6000 ctatccatta ccaccccata agcagcaagc atatcaaaat atgtctagcc ttagccttcc 6060 aattactgag caaattcatg atgaagtcat ttctttacct ataagtccgg taatgagtga 6120 agatgatgtc aattatgtaa tcaaaatggt caatgattac aagtaatgaa aaaatttctt 6180 caggtaacta tattatccgc tatctataca ttcattaaaa tgattgcggg ttttatcatc 6240 ggtaaggtag tagcaattta tacagggcca tcaggggtag caatgcttgg ccaagtgcaa 6300 agtttaatca caatagttgc aggtactacc tctgcacctg taagcacagg ccttgttcga 6360 tatactgcgg aaaattggca agaaggacaa gaagcatgcg cgccatggtg gcgcgcatgc 6420 ttaagggtta ctctgttttt attcttgctt attattcccg ttgttattat attgtcgaaa 6480 aatattagtg agttactttt tagcgatgga caatacacat ggttaatcat tttcgcatgt 6540 tgtatattgc cattctccat tataaataca ttgatcgctt cagttttaaa tggtcaacaa 6600 ttttataagc aatatatatt ggttgggatg ttttctgtat tcatttctac tatgtttatg 6660 attttgttga ttgtagctta taatcttaaa ggtgcattga ttgccacagc tataaatagt 6720 gctattgctg gtcttgtatt ggttttattt tgtctcaata aatcttggtt tagatttaaa 6780 tattggtggg gtaaaacgga taaagacaaa attataaaaa ttattcatta tactctgatg 6840 gctctggttt ctgttatctc catgcctaca gcattgatgt gtattagaaa aatattgatt 6900 gctaaaactg gttgggagga tgcagggcaa tggcaggccg tatggaagat atctgaggtt 6960 tatcttggtg ttgtgacaat tgctttgtca acatatttct taccaagatt gacaattata 7020 aaaacaagtt tccttataaa aaaagaagta aatagtacta tattatacat aatatctatt 7080 acttcattca tggcgttgag tatctattta ttccgcgatt tggtaataac agttttattt 7140 actgaacagt ttcgctcagc tcgtgaatta tttttattac aacttatagg ggatgtaata 7200 aaaattgctg ggtttcttta tgcataccct cttcaaagtc aggggcatac taaactattc 7260 atcagttcag aagtgatttt ttctatgctc tttatcatta ccacctatat ttttgttgta 7320 aattatggag tacatggtgc taacataagt tatgtcatta catatagttt atattttgtg 7380 tttgcatttg tgtttactaa ttttattaat gttagaagaa ataattaaaa acagaggttg 7440 aattttgaaa ataattatac ctgtcttagg atttggcagg gctggtggtg aaagagttct 7500 ttctaagctg gcaactgaat tgatgaatta tggacatgat gtaagttttg ttgttccaga 7560 taatagaact aatccatatt atgctaccac agcaaaaatt gtcacgagta aatctagtca 7620 aaaccgtgta aaaatattga gaatcattaa aaattactat aatctgtggc gtaaatgcat 7680 agagttaaat cctgatgctg tagttgctag ttttcatttg actgcctatc ttgtcgcatt 7740 attaccaatc acccgtcgta agaaatatta ttatattcag gcgtatgaag ttaatttttt 7800 tgataatata atatggaaat taatagcggg tttaacatat tatttaccgc ttaaaaaaat 7860 actaaatagt cctaatttgc ttcctcataa acatgatgat tttataggag tagttcctgc 7920 aggagtagat ttaaacgttt tctatccgaa accatcaaat aggttattaa atggtcacac 7980 atcaataggg attattggta gaaaagagaa gcacaaagga actagcgaaa ttatttcagt 8040 attgtgttca ctggaaaata aagctggaat tataatcaat attgcgatct atcttgaaga 8100 agttgataag cagcgtttaa tcgctgccgg gtttcaggtt aatttttttc cgattacttc 8160 tgatttagaa ttggcatcct tttatcgaag caatgacatc atgattgctg ttgggttaat 8220 tgaagatggc gctttccatt atccttgtgc tgaatcaatg gcttgtggtt gtcttgttat 8280 ttcaaattat gcgccactta ctgaaactaa cagtgtactt aaattagtca agtttgatgc 8340 ttgcaaactt ggtgaagcaa ttaatctttg tctcaatctt gacctagaag aaaaaagcaa 8400 agaaatccaa tctaatattt ctgtgttgaa taaatatgac tggaaaattg ttggtgaaac 8460 tttcaatagt ttattgttag atgcaaataa atagtatacg ttgatgggga aaatatgaat 8520 attgttaaaa ctgatattcc agatctgatc gttcttgaac caaaagtgtt tagtgatgaa 8580 cgcggctttt ttatggagag ttataatcag attgaatttg agaaggcaat aggaaggcac 8640 gtaaattttg ttcaggataa tcattcaaaa tctagtaaag gcgtactacg tgggttgcat 8700 tatcaattag caccgtatgc acaggctaaa ttagttcgat gtgttgtagg tcaggtattt 8760 gatgttgctg ttgatcttag aaaaaattca ccaacgttca aaaaatggtt tggaataacc 8820 ctttccgcag aaaataaacg acaattatgg atacccgaag gatttgctca tggtttcttg 8880 gtgaccagtg atgaagctga gttcatttat aagacaacta actactatgc tcctggtcat 8940 cagcaagcaa ttatttacaa tgatcctatt ttaaacatcg attggccttt ctgcagtagt 9000 gctctgtcat tatcacaaaa agatcaagaa gcaaaattat tttcagaatt attggacagt 9060 gaactgttct aataaagtgt gccaccttat ccgtctgaag gataggtggt tgcttatatt 9120 tttttgagta tgtttgtata atgacagaaa atagtccgaa atataaacac gataaaagct 9180 taataagttt tatctactta ttttttatat ttacacttat tgtaggcttt attatcgcaa 9240 atacccagtt tttggggcga agtagagact atgataatta tatacagatc ttttctggta 9300 aagaagggga gggggttctt gaattatttt atcgcggatt gatgttaata acgaccagct 9360 atgaaactat catttttata attttaacat gttctttttt tataaaggca aggtttctcg 9420 ctaactattc gcgtaatttt tcaggcttga ccttattctt tatttattat gcaagcgttg 9480 cactttgggt tttagattat actcaattca gaaatggtct atgtatttcc attttaatgt 9540 tttccgtata ctatttattt ataaataaac cgacttattt ttatttctcg gtattatgtg 9600 caattgcaac tcattggtct gctttgcctt ttttgctttt atatcctttt gtctattcaa 9660 caaaaataag acgccttggt tatttttgtt tcagtattct tgttttgatt gcgatctcag 9720 gagaaggaaa agagatcata tcttttataa gaaattttgg agtgggacaa aaaataggaa 9780 atgaagctgg tgtaaattta ataaattcat tatcccttac cgctatttcc tggtttatta 9840 ttagttacat atcaagcatt ggaaatgaaa ggagaaattt aaggcttttc ttttgttatg 9900 gtgtcatgca atacgtgact tttagccttt tctctctacc tgttatggct ttccgtattt 9960 tggaaatgta ttttttcctt atgctaacca ttggggtgtt tattaagcaa aaaaagaatt 10020 attattttat tttttgcaaa gtgttaattt tattgtatct aacatactat tatcatatgg 10080 tctttggagt gattaatgtg taaggctaag gtgttggcta taattgttac ttacaacccg 10140 gaaattattc gattgacgga atgtattaac tctttagccc cacaagttga gagaataatt 10200 cttgtagata atggctcaaa taatagtgat ttgataaaaa atatcagtat taataacctt 10260 gaaattattt tactttcgga aaacaaaggc attgcatttg ctcagaacca tggtgttaag 10320 aagggcctgg aagcaaaaga gtttgactat ttatttttct cagatcagga tacttgcttt 10380 cctagcgatg ttattgaaaa acttaagagt acatttacga aaaataataa aaaaggtaaa 10440 aatgttgctt gtgcttctcc tttttttaaa gaccatcgtt caaattatat gcatccgtca 10500 gtcagcctaa atatttttac gagtacaaaa gttatatgta gtgaagtaga cgatgatctt 10560 tatccctcgc atgttattgc ttctgggatg ttaatgtctc gtgaagcatg gcgcgtcgtc 10620 ggaccatttt gtgaaaaact ctttatagac tgggttgata cagaatggtg ttggcgtgca 10680 ttagctaata atatgattat tgttcagaca ccatcagtca tcatttctca tgaacttggg 10740 tatgggcaga aaatttttgc tggtcgatct gttacaatac ataattcttt cagaaatttt 10800 tataaaatac gcaatgcaat atacttaatg ctgcattcaa attatagctt caagtatcgt 10860 tatcatgctt tttttcatgc gacaaagaat gttgtatttg aaattttata ttcgaaagaa 10920 aaattaaatt cactgaaggt ttgttttaaa gctgtacgtg atggtatgtt caataatttt 10980 taatacgaaa atagttaggc tcaaggtgtt taaatggaag aaaataatat gaagacggtc 11040 gctgtagttg gcacagtggg tgttcctgct tgttatggtg ggttcgaatc acttgttcag 11100 aatctaattg attatcaatc tgatggtata caatatcaga tattttgctc ttcaaaaaaa 11160 tatgataaaa aatttaaaaa ttataaaaat gcagaattaa tctatttgcc gataaatgcc 11220 aatggcgtct ctagcataat ttatgatatt atgtgtttaa ttatttgttt attcaaaagg 11280 ccagatgttg ttttaatatt gggggtgtct ggttgtttat ttctaccaat ttataaacta 11340 ttttcaaaat caaagattat tgtcaatatt gatgggcttg aatggcgtag aaataaatgg 11400 ggaacgtttg ctaagaaatt tcttaaaata tctgaggcga tatctattag aatagctgat 11460 attatcattt cagataatca agcaatagct gattatgtgg aaaataagta caagaaaaaa 11520 agtgtagtta tagcttatgg cggagatcat gccactaatc ttagtacacc gatagacaat 11580 gatcaaaaaa aagaaggtta ttatttgggg ctttgtagga tagagcctga gaataatata 11640 gaaatgattc tgaatgcctt cattaataca gataaaaaaa ttaaatttat gggtaattgg 11700 gataacagcg agtatggacg ccagctaaaa aaatattatt caaactatcc aaatatcacc 11760 ctactagaac ctaactataa tattgaagag ctttataaac taagaaaaaa ttgtcttgca 11820 tacattcatg gacactcggc tggtggaaca aacccttctt tagttgaagc gatgcatttt 11880 aatattccta tttttgcttt cgattgtgac tttaatcgtt acacaactaa caatttagct 11940 cattacttta atgattctga acaacttagc ttattagcag aaagtttgtc ttttggaaat 12000 cttaaatgtc gagtattaga tttaaaaaat tatgctgaag atatgtataa ctggaggcat 12060 atagctgcta tgtatgaatc tatttattaa acgcattaac aataatataa ttgaccttat 12120 atagcaggga aagatcacgt aacgctgcgg cgcgccgatc cccatatgaa tatcctcctt 12180 agttcctatt ccgaagttcc tattctttct agagaatagg aacttcggaa taggaactaa 12240 ggaggatatt catatggata aagccgtaag catataagca tggataagct atttatactt 12300 taataagtac tttgtatact tatttgcgaa cattccaggc cgcgagcatt cagcgcggtg 12360 atcacacctg acaggagtat gtaatgtcca agcaacagat cggcgtagtc ggtatggcag 12420 tgatgggacg caaccttgcg ctcaacatcg aaagccgtgg ttataccgtc tctattttca 12480 accgttcccg tgagaagacg gaagaagtga ttgccgaaaa tccaggcaag aaactggttc 12540 cttactatac ggtgaaagag tttgtcgaat ctctggaaac gcctcgtcgc atcctgttaa 12600 tggtgaaagc aggtgcaggc acggatgctg ctattgattc cctcaaacca tatctcgata 12660 aaggagacat catcattgat ggtggtaaca ccttcttcca ggacactatt cgtcgtaatc 12720 gtgagctttc agcagagggc tttaacttca tcggtaccgg tgtttctggc ggtgaagagg 12780 gggcgctgaa aggtccttct attatgcctg gtggccagaa agaagcctat gaattggtag 12840 caccgatcct gaccaaaatc gccgccgtag ctgaagacgg tgaaccatgc gttacctata 12900 ttggtgccga tggcgcaggt cactatgtga agatggttca caacggtatt gaatacggcg 12960 atatgcagct gattgctgaa gcctattctc tgcttaaagg tggcctgaac ctcaccaacg 13020 aagaactggc gcagaccttt accgagtgga ataacggtga actgagcagt tacctgatcg 13080 acatcaccaa agatatcttc accaaaaaag atgaagacgg taactacctg gttgatgtga 13140 tcctggatga agcggctaac aaaggtaccg gtaaatggac cagccagagc gcgctggatc 13200 tcggcgaacc gctgtcgctg attaccgagt ctgtgtttgc acgttatatc tcttctctga 13260 aagatcagcg tgttgccgca tctaaagttc tctctggtcc gcaagcacag ccagcaggcg 13320 acaaggctga gttcatcgaa aaagttcgtc gtgcgctgta tctgggcaaa atcgtttctt 13380 acgcccaggg cttctctcag ctgcgtgctg cgtctgaaga gtacaactgg gatctgaact 13440 acggcgaaat cgcgaagatt ttccgtgctg gctgcatcat ccgtgcgcag ttcctgcaga 13500 aaatcaccga tgcttatgcc gaaaatccac agatcgctaa cctgttgctg gctccgtact 13560 tcaagcaaat tgccgatgac taccagcagg cgctgcgtga tgtcgttgct tatgcagtac 13620 agaacggtat tccggttccg accttctccg cagcggttgc ctattacgac agctaccgtg 13680 ctgctgttct gcctgcgaac ctgatccagg cacagcgtga ctattttggt gcgcatactt 13740 ataagcgtat cgataaagaa ggtgtgttcc ataccgaatg gctggattaa 13790 <210> 13 <211> 13777 <212> DNA <213> Artificial Sequence <220> <223> example O6A rfb locus nucleotide sequence - O6A-EPA production strain stGVXN4112 and stLMTB10923 <400> 13 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatttgcc cgccgggcgt gacaattatg 300 aacgtgcgtc agggcgaacc tttaggtttg ggccactcca ttttatgtgc acgacctgcc 360 attggtgaca atccatttgt cgtggtgctg ccagacgttg tgatcgacga cgccagcgcc 420 gacccgctgc gctacaacct tgctgccatg attgcgcgct tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actctgtcat ccagaccaaa 540 gagccgctgg accgcgaagg taaagtcagc cgcattgttg aattcatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgttggtc gctatgtgct ttctgccgat 660 atttggccgg aacttgaacg cactcagcct ggtgcatggg ggcgtattca gctgactgat 720 gccattgccg aactggcgaa aaaacagtcc gttgatgcca tgctgatgac cggcgacagc 780 tacgactgcg gtaaaaaaat gggttatatg caagcgttcg tgaagtatgg actacgcaac 840 ctcaaagaag gggcgaagtt ccgtaaaggg attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaagatt agcggcgaaa 960 gtaatttgtt gcgaattttc ctgccgttgt tttatataaa caatcagaat aacaacgact 1020 tagcaatagg attttcgtca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcatttgaat tttacgggtt tagcgcgagt gggtaacgct cgtcacatcg 1140 tagacatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gctgaaatta 1200 taaagtcatt cttatagaac atcgcatttc aataatataa ttacacctaa atgaatagga 1260 tacaacgtgt gcacaattat ttaaggctta aagataaaat aaaaaacgta tttttagggt 1320 tgtatatatt gcagttattt aattatatcg cgccattggt aattatccct atcctgataa 1380 aatatattgg gttgggggaa tatggggaat tggtctatat tacatctatt tatcaaatag 1440 tggctttgat tattgatttt ggctttactt acacaggacc tgtggttgct gcgagacata 1500 gatgtgagac ccaaaattta cagcgctatt actcaatagt tgttctttta aaatcattgc 1560 tttttataat tgcattaaca tgtgtatttt tattgtgcag attaaatata gtccacttgt 1620 cattttttgg gtttttgtca atttttctat gcactattgg taatatatta tcgcccaatt 1680 ggtttttgca ggggattggt gattttaaaa aactttcata ctcacaagta atagtgagaa 1740 taacattgtt tatcatactt cttgtttatg tctgtagtgg cggagataat gtttttatcc 1800 taagtttttt gcaaaatgca acattactca tatgctgtat atacttatgg ccaaatattc 1860 atattagcca tgttgttcat cttaaaccta atgaatgcat tgtggaattt aagaaggcag 1920 gaaatgtttt tattggcgta ataggtacga ttggttacaa tggtctaatt cctgtgttaa 1980 ttggaaacct ttgcggtaat acgagtcttg gtgttttttc aatcgttcaa aaaatgacaa 2040 cagcatgtca aagtctaatt aatccaatat cacagtatat gttatctcaa gtttcagaaa 2100 ttaaacctca agataaactg ttttattata gaattaaaaa aagttttttt gtgcatttaa 2160 caattagcat aattgcatgt ttatgttata tggggttagg gcaatatgtg gcgactttta 2220 taggtaaagt tgacgtttca tttgttatta ttttatttgc gtcaataatt accatttttt 2280 catctttaaa taatgtcctt ggtatacagt ttcttatacc gacagataat gtaaaaatac 2340 tacgaagtat aaatgttatg gcgggaatta ttgttgttag tttgtcctgg ctgttaatat 2400 cacgctttga cattctgggg ggggttttat taaacctaat tggtgagttt cttgtattca 2460 gtatgctagc ttttattgcc catcgaaagt ggggagcgag agtataatga aagtgaaggc 2520 ggttcctgct attacattct atttaagttt aatgctgaca attttagtgt tactgtttgg 2580 taatgaacca aataaatcac aatatatcct tgttatagca acgataacag ttttttatat 2640 cgcatatatc actaataaaa taacttctcc ggccagcctt ctcgttatat catcttttgt 2700 gtttttaggt tgtcgccctt tattatcttt gtttgcaaac tatgattata ggattgccga 2760 ttggtttatt gaaggatata tggatgacga tgtgattttg gctaactatg ctataacact 2820 aatgtattat ggttatacat tgggactaat tctatgcaaa aatactgaaa aattttatcc 2880 gcatggtcct tatcctgaaa aacaattgct aaaaataaag tttcttttga ctttattttt 2940 tctgggttcg ataggtatgg ttgtaaaagg gatattcttt tttaacttta tagaatctaa 3000 tagttatgtt gatatttatc aatcaaatat aacaacgcca ataggttatg attttctatc 3060 ttatttattt tattgttctt ttttccttat atgtgcgttt catatacagt tcagaacaaa 3120 taaaaaattt ctttttattg cgatatgcat tgctgcattt agcaccttga agggtagtcg 3180 tagtgaagct ataacgtttc ttttaacggt tacatgtata tattttaatg aagtaaagac 3240 aagaaactta cgtctgctga ttacaatgat ttttgttttt agcgtcattt ttgtgattag 3300 tgaatttatc tcaatgtggc gcactggagg gagttttttt caattaatgc agggtaataa 3360 tcctgttata aactttgtat acggcatggg agtatcatat ctttccattt atcaatcagt 3420 aaaactacaa ctattgtcag ggggatataa tgttacctat ctattcagcc agttaataat 3480 aacttgctcg tcaatattta atgtcaaatt gagcttgccg gaaataagct atagccattt 3540 ggcctcatac acagcaaacc cagaactata taatcttggg ttcggacttg gggggagtta 3600 tttagcagaa tcgtttttag catttggtct gattggatgt ttcattatac cctttttact 3660 tttacttaat ttaaatgtat tggaaaaata tacaaaaaac aaaccaatta tatattttgt 3720 ttattatagt gtgttgccac ctatattatt cacaccaaga gagactttgt tctatttctt 3780 cccctatctt gtcaaaagta tatttgttgc ttttttagtt acattataca tccagtataa 3840 aaaggattga ccaaaatgtc agaaaaaaat gtcagcataa taatcccaag ttataacagg 3900 gctcatattc ttaaggaggt cataccaagt tattttcagg atgagacttt agaggttata 3960 gttatcaatg atggatcaac agataataca aatagtgtat tagctgaact gaaggaaaaa 4020 tattctcagt tagttatttt agaaaatgaa acgaataaaa aacagatgta ttctaaaaac 4080 cgagggattg aaatagccaa agggaaatat attttttttg gtgatgatga ctcttacctc 4140 ttacccggtg ttatatctcg gttattggct acaaaatatg agacaggcgc tgatgtaatc 4200 ggcgcaagaa tactttatat gaataataac gagaaaacaa ttgaagattg cataaatcga 4260 cataaaaaag aggggcgttt tgttagtgat ctaaatagat tggattttag ttatacatgt 4320 gatttggacc atccgattga atgtttttat gcacagcctt ttgttctagc tgaaagggaa 4380 ctaatatcga aatatcgatt tgatatatct tatacgggaa actgctatcg tgaggaaact 4440 gatttcatgc tatctctatt tattaaaaat aaaaaattta tatatgattc aaaggctttg 4500 ttaataaatt tacctccaag aaaagcgacg ggaggggcaa gaacagctaa tcgattaaaa 4560 tatcattacg aaagttgcat aaataattat agatttttaa aaaaatataa tgataatttg 4620 aatcttcttt caggacaaaa gcatgctata ttttaccgac agtgtcaatt cgttctgcta 4680 aaaatgaagt cgtttatcgg gaagttttta aaatgattat atatatcgcc gcgtataatg 4740 gttcaggagg gcaaggtggg gtggaaaggg ttgttgccca acaatgtaac attcttaaaa 4800 atttgggggt taaagtcatt atacttgata aaacatactt caaaatttct aacaaaattc 4860 gtaacaaaaa aatacaagta gcactttatc caatattagt ttctctttat ttaaccttac 4920 aaaaattacg tggcgtgacg tttaaagtta ttgcacatgg ctattgttct cctttttata 4980 ggaatgacat cttaatagct catggcaata tgaaatgtta ttttcaaaca gtcatgaata 5040 aaaaacctaa tcggttgtct ggcagtggtc ttttatcttt ctatgagcgt tgggctggag 5100 cattttcaaa aaatatctgg gctgtttcaa ataaggttaa aagtgaatgg aatgagcttt 5160 acaatattaa ttcacataaa atcaaagttg ttcgaaattt tataaatctt gcacaatttg 5220 attacactga tgttaatgaa gcagaatatg tgacatttgt cgggcgattg gaaaaaggaa 5280 aaggaataga tgatctgtat tacatatgta aaaatctgcc agatacttcc ttccatttag 5340 tttcaagtat tcccgcccca caaaattttg cttcgctaaa taatgttctg accagcattg 5400 ctgtccccta tgcgaaaatg ccagaaatat ttaagaaatc cagagtactt attttaccgt 5460 cctattatga aggatatgag ctggttacta ttgaagcgct atgctgtggt tgccctgtga 5520 taggctataa tgttggtgca attagagagt tgtatgcaga aagttttcct ggcgtattta 5580 ttgccaataa taaagaagat ttagcacaag tagcctacaa attaattagt cttgataatg 5640 aaaaatatta tcatttgaga caaactattt atagcaagcg tgagcttttt tctgaagaga 5700 gatatgcgga aattttaacg gcggcattta atgaaaaaaa ataagaaact ctgtctcatt 5760 tcaattaact catataatga acttaccgga ggaggagtat atttacgtac gcttgttagt 5820 tttctacaaa aacagaatgt taatttaaca cttattgata aaaaatcctc aggtaaacta 5880 ttcgaagaca atacttttca acatatatca tttattaaag gtaaacgtca ggatataata 5940 tccaggcttt tttttatacc atcattttat gtcccttata ttttctcaat aattaaaatt 6000 ttacggaagc aagatattct tgcttttcac aactctcggc ttggattgtt atgtctgctt 6060 tttagaatac tcatgcccca caaaaagatc atattgttta cggataactt cgaatatgac 6120 ttaataagac aaaaagataa aaacataact acttttattg aaaaattaat tgtttatctc 6180 aatgaattta tcgggcttaa gaattcagat ttagttagct atattacccg gcaagataaa 6240 aatgcaatgg ataaatttta tgggattaaa aaaagcagaa atttaattct ccctgtgata 6300 tttagtagag aaaaaccaac tgatgtattg tcagctcact ttattaatga gtataatcga 6360 ttgaataatg ataataggaa aaaagtagta tttactgcat cttttgattt ttttccaaat 6420 atagatgctg ccaactatgt tttaaatgca gcaaagtcta ataatgatta ttgctatatt 6480 ttggcaggta ggaaaagtac tactttgaat cttcctgatt tggataattt attttttttc 6540 gataatctat ctaatagtga aatgtcatat ttattatctg cttgtgatgt tttttattct 6600 cctatagttt taggaagtgg aatgaaaaca aaaattgcag aagcactatc atatggatta 6660 tatatttatg cgacagagca ttccttaatc ggctatgatg aaattataca caataaggag 6720 tgtgttaaaa aaatctcaca tttggatgag gaatttccta aagatttcaa gatgaaaagt 6780 atcaataaac agctaataat gtcttatcag caaaaatatt attcacatta tcggtttaat 6840 ggccatgaac ttgatataat aaattttgac gattagttag tggagatata atatgaacat 6900 attagtaact ggtggtgctg gatatatcgg atctcatacg gctattgaat tactgaatgc 6960 aggtcatgag attatcgttc tggacaattt cagtaatgct tcatacaagt gtatcgaaaa 7020 aataaaagaa attactcgac gtgattttat aacaattact ggagatgctg ggtgtaggaa 7080 gacactctcc gctattttcg agaaacacgc catagatata gttattcatt ttgctggctt 7140 taaatctgtt tcagagtcta aaagtgaacc cttaaagtat taccagaata atgttggagt 7200 gaccattact ttattacagg taatggaaga gtacagaatt aaaaaattta tctttagttc 7260 atctgcgaca gtctatggtg aaccagagat aattccaatt ccagaaacag ctaaaattgg 7320 aggaactacg aatccatatg gcacatcgaa gtattttgtt gaaaaaattc tagaggatgt 7380 tagttccacg ggaaaactgg atataatttg cttgagatat tttaatcctg tcggtgctca 7440 ttctagtggt aaaataggtg aggctccatc tggtatccct aataatcttg ttccttattt 7500 attggatgtt gcgagtggta aacgtgataa attatttatt tatggcaatg attaccctac 7560 taatgatgga acaggtgtaa gggattttat tcatgttgtt gacttagcga aaggtcattt 7620 ggctgcaatg aattatttaa gtatcaattc gggatataat atctttaatc ttggtacagg 7680 aaaaggttat tcggtacttg aattaatcac tacatttgaa aaattaacaa acattaaggt 7740 caataaatct tttatagaga gaagggcagg ggatgttgcg tcttgttggg ctgatgcaga 7800 taaagctaat tctttattgg actggcaagc cgaacaaact ctagaacaga tgttattgga 7860 ctcgtggcgt tggaaaaaaa attatccaga cggattctga atataaaagg tttcagtttt 7920 atgaatcaat cagagcagag aaaaaaaata ctggttctta cacctcgctt tccctaccct 7980 gtcattggag gggatagatt aagagtctat atgttatgta aagaactttc caaaaaatat 8040 gatcttattc ttctgagctt atgtgatcaa ccactagaac ttgaaataaa tataaatgac 8100 tcggtcttca aagaaattca tcgtgtctat ctaccaaaat ataaatcata ttataatgta 8160 ttaaaagctt tggttacgca aaaaccgttg caaattgctt attatcaatc ggacacattt 8220 aagaataaat acaataaatt aattaaacaa tgcgatgcag tattttgtca tctgataaga 8280 gttgctgatt atgttaagga tacagacaag ttcaaaattc ttgatatgac agatgcaata 8340 tctttgaatt acagtcgcgt taaaaaatta gcaagtaaaa aaagtttgcg tgcaattatt 8400 tattctctgg aacaaaaaag attagaatca tatgaacgtt ctgtggcgaa tctttttgat 8460 ttgaccactt ttatttcatc cgtagaccgt gactatctct accctaatct gggcagtaat 8520 atccatatag tcaataatgg ggttgataca tcagccttga gatatataaa aagagaaata 8580 aaaatcgata agcctgtgga acttatattt atcggaaata tgtattcttt acaaaatatg 8640 gatgctgcaa aacattttgc taagaatatt ttaccttgct tgtatgatga gtttaatatt 8700 atttttaaag tgattggtaa gatctcagaa actaataaaa atatattaaa ttcatttaaa 8760 aatacaattg ctttaggtac tgttgatgat atcaattctt ccgcttctac agggcatata 8820 ggtatatgtc ctgttcgtct tggagcaggc gtacaaaata aaattcttga atacatggct 8880 ttaggtttac catgtattac atctagcatt ggttatgaag gtattaatgc aaaatcaggt 8940 agcgaaattt ttgttgcaga tacagtagag caatataaaa acgtactaag agaaataatt 9000 tacgattata atcgttatac tgaagtggct gaaaatgccc gtagttttgt agaaaataat 9060 ttttcttggg aatcaaaagt tgccaattta atgaatacat tagatgagaa attatatgaa 9120 caataataaa attattacac ctatcattat ggctggtggt tcaggcagtc ggttgtggcc 9180 actatcaaga attctctatc cgaaacaatt tcttagccta atcggtagtc ataccatgct 9240 tcaaacaacg gctaatcgtc tggatggttt ggattgtacc aacccttatg tcatttgtaa 9300 tgaacaatac cgctttatag ttgctgaaca gcttagaaaa atcgatagat tgacttcaaa 9360 gaatatcatc cttgagcctg ttgggcgtaa cactgcccct gcaattgcat tagcggcgtt 9420 gctgatgtct aagtctgata aaagtgcaga tgatcttatg ctcgtactgg ctgcagatca 9480 cgttatacac gatgaagaaa aattttgtaa cgctgttaga tcggcaattc catacgctgc 9540 tgatgggaaa ttggtaacat ttggtataat tccagacaaa gcagaaactg gttatggtta 9600 tatacatcga ggacaatata ttaatcagga agattcggat gcatttatag tgtcatcatt 9660 tgttgaaaag ccaaatcatg agacagccac taaatatctt gcttccggtg agtattattg 9720 gaatagcggt atgtttttgt ttagtgcaaa tcgttatata gaggaactta aacaatttcg 9780 gcctgatatt ttatccgctt gtgaaaaagc aattgcttca gcgaactttg accttgattt 9840 tgtgcgttta gatgaaagtt ctttctctaa gtgccctgaa gaatcaattg attacgctgt 9900 aatggaaaaa acaaaagacg caattgttat tccaatggat gctggctgga gtgatgtcgg 9960 ttcatggtct tctctttggg aaattaatga taaagactca gacggcaacg taatagttgg 10020 ggatattttc tctcatgaaa caaagaattc tttcatatat gccgaatcgg gaattgttgc 10080 tacagttgga gtggaaaatt tagttgttgt ccaaacaaag gatgctgttc ttgtctcaga 10140 gagaaataaa gttcaggatg taaagaaaat agtagaacaa attaaaaatt caggtcgtag 10200 cgagcattat gttcatcgcg aagtatatcg tccttggggt aaatatgatt ccattgacac 10260 aggggagcgt tatcaggtca aacgtataac agtaaatcct ggtgaaggac tttctttaca 10320 aatgcaccat catagggcag aacattggat catagtttct ggaactgcaa gggtgactat 10380 aggttctgaa actaagattc ttagcgaaaa tgaatctgtt tacatacctc ttggtgtaat 10440 acactgcttg gaaaatccag ggaaaattcc tcttgattta attgaagttc gttctggatc 10500 ttatttagaa gaagacgatg ttatccgttt tcaggaccga tatggtcgta gctaaatttt 10560 tgataatgta acgttagtag aagagcgcta atatttttag ttaatctgta ataagtatta 10620 tttgtttaag gtatatcatg tcgagtttac cctgctttaa agcctatgat attcgcggga 10680 aattaggcga agaactgaat gaagatattg cctggcgcat tggtcgcgct tatggcgaat 10740 ttctcaaacc gaaaaccatt gtgttaggcg gtgacgtccg actcaccagc gaaaccttaa 10800 aactggcgct ggcgaagggg ttacaggatg cgggcgtcga tgtgctggat attggcatgt 10860 ccggcaccga agagatctat ttcgccacgt tccatctcgg cgtggatggc ggcatcgaag 10920 ttaccgccag ccataacccg atggattaca acggcatgaa actggtgcgc gaaggggctc 10980 gcccgatcag cggtgatacc ggactgcgcg acatccagcg tctggcagaa gccaacgact 11040 ttcctcccgt tgatgaaacc aaacgcggtc gctatcagca aatcaatctg cgtgacgctt 11100 acgttgatca cctgttcggt tatatcaacg tcaaaaacct cacgccgctc aagctggtga 11160 ttaactccgg gaacggcgcg gcgggtccgg tggtggacgc cattgaagcc cgctttaaag 11220 ccctcggcgc acccgtggaa ttaatcaaag tgcacaacac gccggacggc aatttcccca 11280 acggtattcc taacccgcta ctgccggaat gtcgcgacga cacccgcaat gcggtcatca 11340 aacacggcgc ggatatgggc attgcctttg atggcgattt tgaccgctgt ttcctgtttg 11400 acgaaaaagg gcagtttatt gagggctact acattgtcgg cctgctggca gaagcgttcc 11460 tcgaaaaaaa tcccggcgcg aagatcatcc acgatccacg tctctcctgg aacaccgttg 11520 atgtggtgac tgccgcaggc ggcaccccgg taatgtcgaa aaccggacac gcctttatta 11580 aagaacgtat gcgcaaggaa gacgctatct acggtggcga aatgagcgcc caccattact 11640 tccgtgattt cgcttactgc gacagcggca tgatcccgtg gctgctggtc gccgaactgg 11700 tgtgcctgaa aggaaaaacg ctgggcgaac tggtgcgcga ccggatggca gcgtttccgg 11760 caagcggtga gatcaacagc aaactggcac accccgttga ggcgattaac cgcgtggaac 11820 agcactttag ccgcgaggcg ctggcggtgg atcgcaccga tggcatcagc atgacctttg 11880 ccgactggcg ctttaacctg cgctcctcta acaccgaacc ggtggtgcgg ttgaatgtgg 11940 aatcgcgcgg cgatgtaccg ctgatggaag aaaagacaaa acttatcctt gagttactga 12000 acaagtaatt cagtaatttc atataaatgg gttttaaaaa acggaaaaga tgagatatcc 12060 ggtgtggtat atccaaggta atgctattca gtatctctat gagtgagtta acatctatac 12120 cacatttaag ccgcacactt cgggatcccc atatgaatat cctccttagt tcctattccg 12180 aagttcctat tctttctaga gaataggaac ttcggaatag gaactaagga ggatattcat 12240 atggataaag ccgtaagcat ataagcatgg ataagctatt tatactttaa taagtacttt 12300 gtatacttat ttgcgaacat tccaggccgc gagcattcag cgcggtgatc acacctgaca 12360 ggagtatgta atgtccaagc aacagatcgg cgtagtcggt atggcagtga tgggacgcaa 12420 ccttgcgctc aacatcgaaa gccgtggtta taccgtctct attttcaacc gttcccgtga 12480 gaagacggaa gaagtgattg ccgaaaatcc aggcaagaaa ctggttcctt actatacggt 12540 gaaagagttt gtcgaatctc tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg 12600 tgcaggcacg gatgctgcta ttgattccct caaaccatat ctcgataaag gagacatcat 12660 cattgatggt ggtaacacct tcttccagga cactattcgt cgtaatcgtg agctttcagc 12720 agagggcttt aacttcatcg gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg 12780 tccttctatt atgcctggtg gccagaaaga agcctatgaa ttggtagcac cgatcctgac 12840 caaaatcgcc gccgtagctg aagacggtga accatgcgtt acctatattg gtgccgatgg 12900 cgcaggtcac tatgtgaaga tggttcacaa cggtattgaa tacggcgata tgcagctgat 12960 tgctgaagcc tattctctgc ttaaaggtgg cctgaacctc accaacgaag aactggcgca 13020 gacctttacc gagtggaata acggtgaact gagcagttac ctgatcgaca tcaccaaaga 13080 tatcttcacc aaaaaagatg aagacggtaa ctacctggtt gatgtgatcc tggatgaagc 13140 ggctaacaaa ggtaccggta aatggaccag ccagagcgcg ctggatctcg gcgaaccgct 13200 gtcgctgatt accgagtctg tgtttgcacg ttatatctct tctctgaaag atcagcgtgt 13260 tgccgcatct aaagttctct ctggtccgca agcacagcca gcaggcgaca aggctgagtt 13320 catcgaaaaa gttcgtcgtg cgctgtatct gggcaaaatc gtttcttacg cccagggctt 13380 ctctcagctg cgtgctgcgt ctgaagagta caactgggat ctgaactacg gcgaaatcgc 13440 gaagattttc cgtgctggct gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc 13500 ttatgccgaa aatccacaga tcgctaacct gttgctggct ccgtacttca agcaaattgc 13560 cgatgactac cagcaggcgc tgcgtgatgt cgttgcttat gcagtacaga acggtattcc 13620 ggttccgacc ttctccgcag cggttgccta ttacgacagc taccgtgctg ctgttctgcc 13680 tgcgaacctg atccaggcac agcgtgacta ttttggtgcg catacttata agcgtatcga 13740 taaagaaggt gtgttccata ccgaatggct ggattaa 13777 <210> 14 <211> 15027 <212> DNA <213> Artificial Sequence <220> <223> example O8 rfb locus nucleotide sequence - O8-EPA production strain stLMTB11734 <400> 14 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcgatcgctt aagatctagg atttcattat gttacttcct gtaattatgg 1320 ctggtggtac cggcagtcgt ctctggccga tgtcacgcga gctttatccg aaacagttcc 1380 tccgcctgtt cgggcagaac tccatgctgc aggaaaccat cacccgactc tcgggccttg 1440 aaatccatga accgatggtc atctgtaacg aagagcaccg cttcctggtg gctgaacagc 1500 tacgccagct caataagctg tcgaataata ttattcttga gccggtcggg cgcaacaccg 1560 ccccggccat cgccctggca gcccttcagg ccacccgcga cggcgacgac ccgctgatgc 1620 tggttctcgc cgctgaccat atcatcaata accagtcggc cttccacgac gccatccggg 1680 tcgccgagca gtatgctgat gaaggtcatc tggtcacctt cggtatcgtg ccgaatgccc 1740 cggaaactgg ctacggttac attcagcgcg gcgtggcgct caccgatagt gcccattccg 1800 cgtaccaggt ggcccgcttt gtggagaagc cggatcgcga gcgcgccgag gcttacctcg 1860 cctccgggga gtactactgg aacagcggca tgtttatgtt ccgcgccaag aaatacctca 1920 tcgagctggc caaataccgt ccggatatcc tggaagcctg ccaggctgcg gtgaatgccg 1980 ccgataatgg cagcgatttc atcaatatcc cgcatgatat tttctgcgag tgcccggatg 2040 agtccgtgga ctatgccgtt atggagaaaa ccgccgatgc ggtggtggtc ggtctcgatg 2100 ctgactggag cgacgtcggc tcctggtccg cactatggga ggtcagcccg aaagacgagc 2160 agggcaatgt cctcagcggt gacgcgtggg tacacaacag cgaaaactgc tacatcaaca 2220 gcgacgagaa gctagtggcg gccattggcg tagagaatct ggtgattgtc agcactaagg 2280 acgccgtgct ggtgatgaat cgcgagcgtt cccaggacgt gaagaaggcg gtcgagttcc 2340 tcaagcagaa ccagcgcagc gagtacaagc gccaccgtga gatttaccgc ccctggggcc 2400 gttgcgacgt agtggtccag accccgcgct tcaacgtcaa ccgcatcacg gtgaaaccag 2460 gcggtgcctt ctcgatgcag atgcaccacc atcgcgccga gcattgggtt attctcgccg 2520 gcaccggtca ggtgactgtc aacggtaagc agttcctgtt gtccgagaac cagtccacct 2580 ttattccgat tggcgccgag cactgcctgg aaaaccctgg ctgtattccg ctggaagtgc 2640 tggagatcca gtcgggggcg taccttggcg aggacgacat tattcgtatt aaagaccagt 2700 atggtcgttg ctaattattt tcgggacaag acgcagaatg acacagttaa cttgttttaa 2760 agcttatgac atccgtggtg aactgggtga ggaactgaac gaggacatcg cctaccgtat 2820 cggtcgcgcc tacggcgaat ttctgaaacc cgggaagata gtggtggggg gcgatgtgcg 2880 cctcacaagc gagtcgctga agctggcgct ggcccgcggg ttaatggacg ccggtaccga 2940 cgtgctggac atcggcctga gcggtaccga agagatttac tttgccacct tccaccttgg 3000 ggtagatggt ggcatcgagg tgaccgcgag ccacaatcct atgaactaca acggcatgaa 3060 gctggtgcgc gagaatgcga agcccatcag cggcgacacc ggcctgcggg atatccagcg 3120 cctggcggag gaaaaccagt tcccgccagt ggacccggcg cgtcgcggga ccctgagcaa 3180 gatatcggta ctgaaggagt atgttgacca tctgatgagc tacgtggact tctcgaactt 3240 cacccgtcca ctgaagttgg tggtgaactc cggaaacggg gctgcggggc acgtgattga 3300 tgaggtggag aaacgcttcg cggcggctgg ggtgccggta acctttatca aggtgcatca 3360 ccagccggat ggccatttcc ctaacggtat cccgaatccg ctgctgccgg agtgccgcca 3420 ggataccgcc gacgcggtgc gcgagcatca ggccgacatg gggattgcct ttgacggcga 3480 cttcgatcgc tgcttcctgt tcgatgacga agcttcgttt atcgaggggt attacattgt 3540 cggcctgctg gctgaggcgt tcctgcagaa gcagccggga gcgaaaatca ttcacgaccc 3600 gcgcttgacg tggaacacgg tagacatcgt gacccgcaac ggcggccagc cggtgatgtc 3660 gaagacgggg catgcgttca tcaaggagcg gatgcgtcag gaagacgcta tctacggcgg 3720 ggagatgagt gcgcaccatt acttccgcga tttcgcctac tgcgatagcg ggatgatccc 3780 gtggctgctg gtggcggagc tgctgtgtct gaagaacagc tcgctgaaat cgctggtggc 3840 ggaccgccag aaggcgttcc ctgcgtcggg agagatcaac cgcaagctaa gtaatgctgc 3900 tgaggcgatc gcccgcatcc gggcgcagta tgagccggcg gctgcacaca tcgacacaac 3960 ggacgggatc agtattgaat accctgaatg gcgctttaac ctgcgcacgt ctaacaccga 4020 gccggtggtg cgtctgaacg ttgagtccag agctgatgtg gcgcttatga atgaaaaaac 4080 gaccgagctg ttacacctgt taagcgggga ataaggtgag agatttacta acgacgattt 4140 atcgttatcg gggatttatc tggagcagtg ttaaacgtga ttttcaggca cgctatcaaa 4200 ctagtatgct gggcgcacta tggctcgttt tacaaccgct ctctatgatt ctggtctata 4260 ccctggtttt ttccgaggtg atgaaggcaa gaatgcccga taataccggg tcgtttgcct 4320 atagtattta tctctgttcc ggggtactga cctggggatt atttactgag atgctggata 4380 aaggtcagag cgtatttatt aacaatgcta atctgatcaa gaaactcagt tttccgaaaa 4440 tctgtctgcc gatcatcgtg acgttatcgg cggtgctaaa tttcgcgatt attttcagtc 4500 tgtttctaat ttttatcatt gtcaccggta acttccccgg ctggctcttt ctctcggtga 4560 taccggtcct gcttttgcag atcctgtttg ccggtgggct ggggatgatc cttggtgtca 4620 tgaacgtctt tttcagggat gtggggcaac tggttggcgt tgcgctgcaa ttctggtttt 4680 ggttcacacc cattgtttat gtactgaatt cattacctgc atgggcaaaa aatctgatga 4740 tgtataaccc gatgactcgg atcatgcaat cttatcagtc catcttcgcc tatcatctgg 4800 cccccaactg gtattcgcta tggccagtat tggctctcgc cattattttc tgcgtcatcg 4860 gtttcaggat gttccgcaag catgcggcgg atatggtgga tgaattataa tgagttatat 4920 cagagtaaat aatgtcggta aggcgtatcg ccagtatcac tcaaagaccg ggagactgat 4980 cgaatggtta tcccctctga ataccaaacg ccataatttg aaatggatcc tccgcgatat 5040 taatttcgaa gtcgctccgg gcgaggctgt cggtattatc ggtatcaacg gtgcaggcaa 5100 gagtaccctg cttaaactca taaccgggac gtccaggccg acgactggag aaattgaaat 5160 ctccggacgt gtcgctgcat tactcgaatt ggggatgggg tttcattctg atttcactgg 5220 tcggcagaat gtttatatgt ctgggcaact gttggggtta tcgtcagaga aaataactga 5280 actgatgccg caaattgaag agtttgctga gattggggac tatatcgatc aacctgtgcg 5340 cgtctactcc agtgggatgc aagttcgatt agcttttagt gtagcgacgg ctatccgtcc 5400 tgatgtgcta attatcgatg aggcattatc tgttggggat gcatatttcc agcataaaag 5460 ctttgagcgt attcgaaaat ttcgtcagga agggaccacg ctgttgctgg tatcccatga 5520 taaacaagcg atccaaagca tttgcgaccg ggccatttta ttgaataaag gccaaattga 5580 aatggaaggt gaacctgaag cagtgatgga ttattacaat gctcttctgg ccgataaaca 5640 aaatcagtcc attaaacaag ttgagcataa tggtaaaacg caaactgttt caggcactgg 5700 tgaggtgact atctctgagg ttcatcttct cgatgaacag ggcaatgtga ctgaatttgt 5760 ttcggtaggg catcgtgtca gcttgcaggt caacgttgag gtcaaggacg atattcctga 5820 gcttgttgtc ggatatatga ttaaggatcg acttgggcag ccgattttcg ggaccaatac 5880 gtaccatctc aatcagacac tcacctccct gaaaaaagga gaaaagcgtt cgttcttatt 5940 ttctttcgat gcgagattgg gggttggctc ctattctgtc gctgtcgcgt tgcatacttc 6000 cagtacgcac ctcggcaaaa actatgaatg gcgcgatctg gccgtggtat tcaacgtcgt 6060 taacacggaa caacaagagt ttgtcggcgt gtcctggttg ccgcctgaac tggagatttc 6120 ttaatgggtt cgtcgtttta tcgttcattt gaagaacgac acagaggttc ggttgaagaa 6180 atcaagcgcc gcttgagttt ttatttacct tttcttgcag gtctgaagga catttatcct 6240 gatggcgtga ttgcggatat tggttgcgga cgtggcgaat ggttggagat cctgactgaa 6300 aatggcattg cgaacatcgg cgtcgatctc gatgatggca tgctggcgcg cgccagggag 6360 gccggactga atgtgcagaa aatggattgt ctgcagtttt tgcaaagtca ggcggatcag 6420 agcctgatag cgttgaccgg ttttcatatt gctgagcatt tgccgtttga ggtcctgcag 6480 caactcgcca tgcataccct acgggtgctg aaaccaggtg gtttgctgat cctcgaaacg 6540 ccgaacccgg agaatgtaag cgtcggcacc tgttcatttt atatggatcc aacgcataat 6600 catcctctgc caccgccact gcttgagttt ttacctattc attatggttt tacccgagca 6660 attaccgttc gtctgcagga aaaagaggtt cttcaatctc cggatgcagc cgttaatttg 6720 gtcgatgtac tcaaaggggt gagccccgac tacagcatca ttgctcagaa agcagcgcca 6780 acagatattc ttgaacgctt tgacaccctg tttacccagc agtacggtct gacgctggat 6840 gctctgagca accgttacga tgcgattttg cgccaacagt tttcgtccgt tgtctcacgg 6900 ctggagacgt tgaaccaaac ctatatgcaa cagataagcc aaatgtcaga gactattcag 6960 acgttgcaag gtgaggttga cgatctgagt catgtcatcg atcagaacca tcagcttcat 7020 cagcaaatgg cggatttaca taacagtcgt tcatggcgta ttactcaacc actacgctgg 7080 ttgtctttgc aacgtcaatt attacgtcag gaaggggcta aagtgcgagc ccgtagggct 7140 gggaaaaaaa tattgcgcaa agggatggcg ctctcgctgg tctttttcca tcgttaccct 7200 aagtctaagg tttatctgtt taaggttctg agaaaaactg gctgctatac attgctacaa 7260 cgtttgttcc aacgcgtaat gctggtgcaa tctgacacga tgatgatgca gtccagaaga 7320 tatgatgtgg gtactgaaga aatgacaagt cgcgcgatga gtatttataa cgaattaaaa 7380 aataaaaata cggagaaata acgatgcgta ttgtcataga tttacaaggc gcacagacgg 7440 aaagccgctt tcgtggcatc ggtcgttata gtatcgcaat cgccagaggc ataatcagaa 7500 ataacagccg gcatgagatt ttcatcgcgc tatccgccat gctggatgag tcgattgcaa 7560 atattaaggc gcaatttgcc gatctcctgc cggcagaaaa tatagtcgta tggcatgccg 7620 taggccctgt tcgtgcgatg gaccaaggta atgaatggcg tcgggagagc gcagaactga 7680 ttcgggaagc gtttcttgaa tcattgtgtc cagatgtcgt tttcattacg agtttgtttg 7740 aaggtcatgt cgacgatgcg gctacatcgg tacacaaatt tagtcgtcag tataaagtag 7800 ccgtactgca ccacgatctt atccccctcg tgcaggcgga aacctatctg caggacgatg 7860 tatacaaacc ctactattta cagaaagttg agtggttaaa aaacgctgac cttttgttga 7920 ctaactctgc ttataccgca caggaagcga tcgagcatct gcatttacag ggcgatcatg 7980 tgcagaatat tgcagccgca gtcgattctc agttttgtat ggcggaggtg gcagcgagcg 8040 aaaaagagac cgtccttggc cattacggta ttcagcgcga gttcatgttg tatgcgcccg 8100 gaggatttga ctcaaggaaa aactttaaac ggttgattga ggcctatgcc gggctcagtg 8160 atgccttacg tcgcagtcat caactggtca tcgtcagtaa gctttccatc ggtgatcgtc 8220 agtatctgga atcccttgcg tcaggtaatg gtttacagca gggcgaactg gtactcactg 8280 gttatgtgcc ggaagatgag ctgatccagc tctatcgcct atgtaagctg ttcatctttg 8340 cttcactaca tgaaggtttt gggttgccgg ttctggaagc aatgtcgtgc ggtgcgccgg 8400 tgattggctc aaatgtcacc agtattcctg aagtcatcgg taatcctgag gcattattcg 8460 acccgtattc tgtctcttcc atgagggata agatcgcgca atgtttgact gatgatacct 8520 tcctcgcgcg tctgaaagaa atggcgcagc agcaagcgcg taatttctct tgggataaag 8580 ctgcggtgac tgctctggaa gctttcgaaa agatcgcggt agaagacacc ggtactgcgc 8640 aggttttgcc tgaagctttg attcagaaga tccttgctat ctcacaaggg cagccagatg 8700 accgcgatct gcgcttgtgc gcaacggcca ttgattacaa tctgaaaacg gcagaacttt 8760 atcaaatcga cgataaatcg ctgaactggc gtgtggaagg cccattcgat agctcatata 8820 gtctggcgtt ggtcaaccgc gaatttgccc gggcactctc agccgatggt gtagaggttt 8880 tattgcattc cactgaagga ccaggtgatt ttgccccaga tgcctcgttt atggcacagt 8940 cggaaaatag tgatcttctg gcattttata atcaatgtca gacccgcaag agtaacgaaa 9000 agatagatat tattagcaga aatatctatc caccgcgggt taccaaaatg gatgccaaag 9060 taaaattcct tcattgttat gcttgggaag aaacgggctt tccgcaaccg tggatcaatg 9120 aatttaatcg ggaacttgac ggagtgctgt gtacttcgga acatgttcgt aaaatactga 9180 ttgataacgg actgaatgtg cccgcatttg ttgttggcaa tggctgtgac cattggctca 9240 atatcccagc cgagacgaca aaagatgtgg atcacggaac attccgtttc ctgcacgtct 9300 cttcttgttt cccacgcaaa gggatacagg caatgcttca ggcttggggg aaggcgttca 9360 ctcgtcgtga caatgttatc ttaatcatta agacttttaa caatccgcac aatgaaattg 9420 acgcatggct ggctcaggcc caggctcaat tcatagacta tcccaaagtt gaagtgatca 9480 aagaggatat gtcagccacc gagcttaaag ggctttatga aagctgtgat gttttggttg 9540 ctccaggttg cgctgaaggc tttggtttac ctattgctga agcaatgctg agtgggctac 9600 cggctatcgt caccaattgg agcgggcaac ttgattttgt taattcacaa aattcatggc 9660 tggttgacta tcagttcact cgggtaaaaa cgcactttgg tctgttttcc tcagcctggg 9720 ccagtgtgga tattgacaac ttaacagatg cattaaaagc ggcagcctca accgataaat 9780 cagtgctgcg tgacatggcc aatgctggtc gcgagcttct tctgcagcag tttacctgga 9840 aagcggtggc tgatcgttct tgccaggcgg tcaagactct gcgtgcgcat attgatattg 9900 cacagcatcg ggcgcgcatt ggctgggtga cgacctggaa cacgaaatgt gggatcgcaa 9960 cctattccca gcatctggtg gaaagcgcac ctcatggcgc ggatgttgtt tttgctcccc 10020 aggtcagcgc tggcgatctt gtgtgtgcag acgaagagtt tgtacttcgc aactggattg 10080 taggtaaaga gagcaactat ctggaaaacc tccagccaca cattgatgct ctgagactcg 10140 atgtcattgt gatccaattc aactatggat tctttaatca tcgagaactg tcggcgttta 10200 ttcgtcgcca gcatgacgcc ggtcgttcag ttgttatgac gatgcactca actgtggatc 10260 cgctggaaaa agagccgagc tggaatttcc gtcttgctga aatgaaagag gcgctggcac 10320 tttgcgaccg gttgttggtg cattcgattg ccgatatgaa ccgccttaaa gatttaggct 10380 taactgcgaa tgttgcttta ttcccgcacg gtgttatcaa ctactccgca gcgagcgtca 10440 cacgtcaaca gcagtcttta ccgctaattg cgagctatgg cttctgctta ccgcataagg 10500 gcctgatgga actagtagaa tccgtccata gactcaagca agccggtaaa ccggttcgtt 10560 tacgactggt gaacgcagag tatcctgttg gggagtcacg cgatctggtg gcagagctta 10620 aagctgctgc tcagcggtta ggtgttaccg atctgattga gatgcataat gatttcctac 10680 ctgatgcgga gagtctgcgg ttgctttcag aagccgatct tctgattttt gcttatcaga 10740 atactgggga gtctgctagc ggggcggtac gttatggtat ggcgactcaa aaacctgttg 10800 cggtaacgcc cctggcgata tttgatgatt tggacgatgc cgtctttaaa tttgatggat 10860 gcagcgtcga tgatatcagt caggggattg accggatcct gaattccatc cgtgaacaga 10920 actcttgggc aaccaggact caacaacgtg ccgatgcatg gcgggaacaa catgattatc 10980 aagctgtttc acgccgtctg gttaatatgt gtcaaggctt agctaaagct aaatatttta 11040 aataaaaata tctctcttgt attttttgcc tttgaataca agaggggtta gataatgtgt 11100 catttattat gaaaattatt tttgctactg agccaattaa atacccatta acgggcatcg 11160 gtcggtattc cctggagctg gttaagcggc tggcggtcgc ccgcgaaatt gaagaattaa 11220 agctatttca cggtgcgtcg tttatagaac agatcccttt ggtggagaat aaaagcgata 11280 ccaaagccag caatcatggt cgtctgtcgg cgtttctacg ccgacagacg ctgttgattg 11340 aggcttatcg cttgctgcat ccgcggcgcc aggcgtgggc attgcgcgac tataaggatt 11400 atatctacca tggccccaat ttttatctgc cgcataaact ggaacgcgcc gtgaccacgt 11460 ttcatgacat atccattttt acctgcccgg aatatcatcc aaaagatcgg gttcgctata 11520 tggagaagtc cctgcatgag agtctggatt cggcaaagct gatcctgacc gtttctgatt 11580 tctcgcgcag tgaaattatc cgcttgttca actatccggc ggagcggatc gtaaccacca 11640 agctagcctg cagcagtgac tatatcccac gcagcccggc agagtgtctg ccggtactgc 11700 agaaatatca gctggcgtgg caggcctacg cgctatatat cggcactatg gagccacgta 11760 aaaatatccg aggcctgctg catgcctatc agctgctacc gatggagatc cgcatgcgct 11820 atccgctaat ccttagcggc tatcgcggct gggaagacga tgtgctgtgg cagttagtcg 11880 agcgcggtac tcgggaaggc tggatccgtt acctcggata tgttccggat gaagacctgc 11940 cgtatctgta cgcagcggcc agagtctttg tttatccctc cttctacgag ggattcggtt 12000 tacctattct tgaagcgatg tcttgcggtg tgccggtagt atgctccaat gtcacctctt 12060 tgcctgaggt tgttggcgat gccggcctcg ttgccgatcc taatgatata gacgcgatta 12120 gcgcgcaaat tttgcagagc ctgcaagatg atagctggcg ggaaatcgcc accgcgcgcg 12180 gtcttgctca ggcgaaacag ttttcgtggg agaactgtgc gacacagacc attaacgcct 12240 ataaattact ctaagggtgt cagttgagag ttctacacgt ctataagact tactatcccg 12300 atacctacgg cggtattgag caggtcattt atcagctaag tcagggctgc gcccgccggg 12360 gaatcgcagc cgatgttttc acttttagcc cggacaaaga tacaggtcct gtcgcttacg 12420 aagatcatcg ggtcatttat aataaacagc tttttgaaat tgcctccacg ccgttttcgc 12480 tgaaagcgtt aaagcgtttt aagctgatta aagatgacta cgatatcatc aactaccatt 12540 ttccgtttcc ctttatggat atgctgcatc tttcggcgcg gcctgacgcc aggactgtgg 12600 tgacctatca ctctgatata gtgaaacaaa aacggttaat gaagctgtac cagccgctgc 12660 aggagcgatt tctcagcggc gtagattgca tcgttgcctc gtcgcccaat tacgtggctt 12720 ccagccagac cctgaaaaaa tatctggata aaacggtggt gatcccgttt ggtctggagc 12780 agcaggacgt gcagcacgat ccgcagaggg tcgcgcactg gcgggaaact gtcggcgata 12840 agttctttct cttcgtcggc actttccgct actacaaagg gctgcatatt ctgatggatg 12900 ccgctgagcg tagccgactg ccagtggtgg ttgtaggggg cgggccgctg gaatcggaag 12960 tgcggcgtga agcgcagcag cgcgggctga gcaatgtgat gtttaccggc atgctcaacg 13020 acgaagataa gtacattctc ttccagctct gccggggcgt ggtattcccc tcgcatctgc 13080 gctctgaggc gtttggcatt acgttattgg aaggcgcacg ctttgcaagg ccgctgatct 13140 cttgcgagat cggtacaggt acctctttca ttaaccagga caaagtgagt ggttgcgtga 13200 ttccgccgaa tgatagccag gcgctggtgg aggcgatgaa tgagctctgg aataacgagg 13260 aaacctccaa ccgctatggc gaaaactcgc gtcgtcgttt tgaagagatg tttactgccg 13320 accatatgat tgacgcctat gtcaatctct acactacatt gctggaaagc aaatcctgag 13380 cggccgcgag ctcgtcgact cgaggatccg tgtaggctgg agctgcttcg aagttcctat 13440 actttctaga gaataggaac ttcggaatag gaactaagga ggatattcat atggataaag 13500 ccgtaagcat ataagcatgg ataagctatt tatactttaa taagtacttt gtatacttat 13560 ttgcgaacat tccaggccgc gagcattcag cgcggtgatc acacctgaca ggagtatgta 13620 atgtccaagc aacagatcgg cgtagtcggt atggcagtga tgggacgcaa ccttgcgctc 13680 aacatcgaaa gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa 13740 gaagtgattg ccgaaaatcc aggcaagaaa ctggttcctt actatacggt gaaagagttt 13800 gtcgaatctc tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg 13860 gatgctgcta ttgattccct caaaccatat ctcgataaag gagacatcat cattgatggt 13920 ggtaacacct tcttccagga cactattcgt cgtaatcgtg agctttcagc agagggcttt 13980 aacttcatcg gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg tccttctatt 14040 atgcctggtg gccagaaaga agcctatgaa ttggtagcac cgatcctgac caaaatcgcc 14100 gccgtagctg aagacggtga accatgcgtt acctatattg gtgccgatgg cgcaggtcac 14160 tatgtgaaga tggttcacaa cggtattgaa tacggcgata tgcagctgat tgctgaagcc 14220 tattctctgc ttaaaggtgg cctgaacctc accaacgaag aactggcgca gacctttacc 14280 gagtggaata acggtgaact gagcagttac ctgatcgaca tcaccaaaga tatcttcacc 14340 aaaaaagatg aagacggtaa ctacctggtt gatgtgatcc tggatgaagc ggctaacaaa 14400 ggtaccggta aatggaccag ccagagcgcg ctggatctcg gcgaaccgct gtcgctgatt 14460 accgagtctg tgtttgcacg ttatatctct tctctgaaag atcagcgtgt tgccgcatct 14520 aaagttctct ctggtccgca agcacagcca gcaggcgaca aggctgagtt catcgaaaaa 14580 gttcgtcgtg cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg 14640 cgtgctgcgt ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc 14700 cgtgctggct gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa 14760 aatccacaga tcgctaacct gttgctggct ccgtacttca agcaaattgc cgatgactac 14820 cagcaggcgc tgcgtgatgt cgttgcttat gcagtacaga acggtattcc ggttccgacc 14880 ttctccgcag cggttgccta ttacgacagc taccgtgctg ctgttctgcc tgcgaacctg 14940 atccaggcac agcgtgacta ttttggtgcg catacttata agcgtattga taaagaaggt 15000 gtgttccata ccgaatggct ggattaa 15027 <210> 15 <211> 11283 <212> DNA <213> Artificial Sequence <220> <223> example O15 rfb locus nucleotide sequence - O15-EPA production strain stLMTB11738 <400> 15 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcatgagcaa aactaaacta aatgttcttt accttgcaat aagtcagggt 1320 gccaattacc tactgccatt attaattttt ccttatcttg ttagagtcat tggtgtatcg 1380 aattttggtg atctgagttt ttcattgata actatacaag tgttgttaat ggttgttgaa 1440 tatggttttg gatatagtgg gacaagagaa atagcactaa ataacgataa aaaataccat 1500 tctgaatttt tttgcggtgt ggtgcttgct cgttttatat taatgctaat tgcagctata 1560 atactcataa tactctgttt tttttatgtt tttaacgacg ttaagtcttt gttatgtgtt 1620 ggttttctgt ccgtaattgc aggtgttttc aatccaaatt ggtttttgca aggtaaggaa 1680 atgatgagtg tgatggctgt gctgtcacta ttttcacgag gcatagcagt cgttgcagtt 1740 tatctaatta taaaacccgc aacgccgatg tacatcagtg ccttattatt gagcatgcca 1800 tatattttgt attcattctg tggcgttgcc tacttactta ttatcaagga gattttttta 1860 tgtaggccac cgataaagaa aattcaagta attttaaaaa atggatttca ttttttttgt 1920 tcaacacttg cgactagtgc atacacaatg ttgacccctc ttgtattggg tggcgtatct 1980 ggaaagtttg atgtaggcat ctttaactca gctaacatga tcaaacaagg tttggctgga 2040 cttgcatcac cattagtcca agctttttat ccaagaatta acattttgca aagagagaat 2100 ccatatattg caaacttaaa atctagaatg attcttaaat acttgcttgt tttttacatg 2160 gctttagcaa taccattttt actttttgcc aaccaattat cattattaat attcggcatg 2220 aaaggtgaag taattgcagg tgcaatgcaa ttaatgacat tgcttcctat attcataggt 2280 tttaatacag ttgtcgggtt acttgtatta gtacctaatg ggatgcaaaa acagtatttc 2340 aaatctattt tcctaggaac tattacttgt ttaagcatag tttatccagc atgtaaatat 2400 tatggagcaa cgggtgcgat tgtgagtctt attgtagctg aaattttcgt tggcatggga 2460 atgcttaaac aattcattaa agtaaataaa accgtatgta ggcctcataa attatgaata 2520 tctcggtaat aatatctgtt tggaaacgcc cagttcaatt agaattgatt ctctctgagc 2580 tcgattctca ggctaaagac aatagtctac acctagaagt aattgtttcc gatagtcata 2640 gtggtaaaga aattgatgat gtagttgctg ataatattca taaaaagaaa aatattaata 2700 ttatccatca acatactaaa aatatactct ccgctaagcg caatttcgga gcatccctag 2760 cccatgggga ttatttaata tttcttgatg atgattgtat acccgcaagt ggatatatat 2820 catcgttgct gaactattta aaaaaaatga atagtaaaag cgttttatgt ggggaagtta 2880 gattcgaaaa tgaactcatt gagaccagca attactatcg ctacaggaac tctttacacc 2940 ctaagtttag tgatagtcct gatatctcta tgaatgcctg gacttttgtc gcaatgaatt 3000 gtgttcttga tagaaaggca ttttcatcag gtatagtttc atataatgaa aattttattg 3060 gttatggttg tgaagatcat gagtttgggt ggcaacttga aaaaaatgac ttcaaaatta 3120 tttttgctga ttttaaaata ttacatcacg aatacagtgg cgatatagaa ggatatacaa 3180 aaaaaattcg tgctacagca cgtgatggta tgaatgtatt aagcaaagta aggcctgaaa 3240 tgttttctac taataaaaaa ttattcctag ttgagaaaat atttagtaaa cacaaaacgt 3300 ttagtaaaat atgccaatca atatttttca ataaatttat ttttaaaaaa ataatacaat 3360 ttttaaaaaa aacagatgca aataaaaaac tctatttccc aattctttac agatatgtgt 3420 tgatttcggc atatatacat ggtattggag agcgtggcac ctcaaaaaca gatgatttgc 3480 ttaagaactg gtatatatag atgatgctat cttcatttat taagacattt gtatggaagg 3540 taaaaaacaa tgaagtataa tgcattgatg gcttttttat tattttttgt tgtttttttt 3600 agattgtcgc tgataatacc tttcttatat ttggcattta ttcctgcatt ttttggtatt 3660 atgtatttag tgcgtaattt tatgattact atgggcaatg gattggtatc tatagatcgt 3720 aaaaatttgt tgctgttatc tatattcata attatttttt tattttgttt ggttttcgat 3780 ttgtttcaaa aaagccattc ttttcaaagt tattttaccg ttagattatt tatgttgttt 3840 ttattttcat ttgttcctgc gtattattta gtaaatagat tcataaaggg tgacttgaaa 3900 ttaatggagc gaatattagt gtattctctc tgggttcaaa tagttatttt ttttggtatg 3960 tatataagtc cagagttaaa aagattgtta tatactttct ttggtatgtc tgactctgtt 4020 aatctttggg aacaaaatgc taaagtaaga ggatttgggt tgtcgggtga aataaatttc 4080 atgacaccat ttttgatgat ctatatgtca ttttttatga tgaaaaggcg ttatgcttta 4140 attactttaa tttgtctgac tcaaatcgta aattctaaca tggctgtgat tgcagccatt 4200 attggtatcg gttgctctag acttaatatt aatataaaaa ttgcaacagt attgattttg 4260 ggagttttag tttatagctt aggagcggtg ttctttcctc gattttatga tgagttcgtt 4320 tctggagatg gcacaagaac tctggatatc ttattacagc aacatgtgtt tgttgtaggt 4380 aatttagatt tttttaatat tatatttgga ttacagcaaa acatatcttc atcaatcccc 4440 gatattaaac aaagttcgga tatgggctgg gttatactgt ttaattacgg tgggttaaca 4500 tttattacac tctttttatt tttaatcttt actatttcta ttgcgacatt tggaatgaca 4560 tatcaagcaa ttatatggat gttaattggg ataattttca ataccaaagg tttagtttta 4620 ggatctaacg gctatttctt tctatctttt atatatatgt ttttgaatag agtaacactt 4680 agtggacaga gttcaattac taataagtta ggtcaagtaa gtaaatagct tccagagtat 4740 atttgtcaat gatttgaggt tcggttatta tgttttcatc taaaacactg ttaattactg 4800 gtggtactgg ctctttcggg aatgctgtat taaatagatt tcttgataca gatattgcag 4860 aaatccgtat atttagtcgt gatgaaaaaa aacaagatga tatgcggaaa aaatacaata 4920 atcaaaaatt aaagttctat attggtgatg tcagagatta ccgtagtatt ttgaatgcga 4980 ctcgcggtgt tgattttata tatcatgcag cggcacttaa gcaagttcca tcatgtgaat 5040 ttcatcctat ggaagccgtt aaaactaata tccttggtac ggaaaatgtt cttgaagcag 5100 ctatagcgaa tgaagtgaag agggttgtat gcctaagtac tgataaagct gtatacccga 5160 ttaacgcaat gggtatttca aaagctatga tggaaaaggt catggtcgcg aaatcccgta 5220 atgttgatcg caataaaaca gtaatatgtg gtacccgtta tgggaatgtt atggcatctc 5280 gcggttcagt tattccatta tttgttgatc ttattagagc gggcaagcca ctcacaataa 5340 ctgatcctaa tatgacccgc tttatgatga ctcttgagga tgcggtagat ttagttcttt 5400 atgcgtttga acatggtaat aatggtgata tctttgtgca aaaagcacct gcagcaacta 5460 ttgacacatt agctattgct ttaaaggaat tactaaatgt tcctgaccat ccggtaaatg 5520 tcattggaac gcgtcatggc gagaaattat atgaagctct acttagtcgt gaggaaatga 5580 tcgctgctat agatatgggc gattattacc gtgtcccgcc agatcttcgt gaccttaatt 5640 atggcaaata tgttgagcaa ggtgatagcc gaatatctga aatagaagat tataactctc 5700 ataatactca acggttagat gttgaaggca tgaaagagct cttgctaaaa ttagccttta 5760 ttcgagcaat tcgtgctggt gaaaaatata atctggattc atgatatgaa aatattagtt 5820 actggtgcaa atggttttat tggtcgtaat ttatgtttga ggcttgagga acttggttat 5880 aaagatctta ttagaattga tcgagaatca acgaagcaag atcttgaaca aggcttacag 5940 gatgccgatt ttatttatca cttagctggt atcaatagac ctaagactga tgatgagttt 6000 atttctggaa acagtgattt aacaaagcat atagttgagt atctcctttc tattggtaag 6060 aatacaccaa ttatgctaag ttcttcgata caagctgaac ttaataatgc ttatggggtt 6120 agcaaagctg tagctgaaag ctatgtcgaa aaatatgctg ctgctagtgg ttcttcgtat 6180 tatattttca gatatccaaa cgtttttggt aaatggtgta agccaaacta taattctttt 6240 atagcaactt tttgctacaa tatttccaat gatattgaga ttactatcaa tgatgcagca 6300 gcgccagtca atctggtcta tattgatgat gtttgtactg atgctatagc tcttctctct 6360 gggacggttg aaagtggata taaagttgtt gcaccaattt attcaacaac agttggtgaa 6420 gttgcagaat taatttatag cttcaaaaat agccgttcca ccctgatcac agaggctgtc 6480 ggggcgggat ttacccgtgc attgtattct acatggctga gttatttacc agcagagaag 6540 tttgcgtaca aggtaccttt ttatggggat gcccgcggag tcttttgtga gatgttgaaa 6600 acgccttcag cggggcagtt ttcatttttt actgctcacc ctggtattac gcgtggcgga 6660 cattaccatc acagtaaaaa tgagaagttt ttggtcattc gaggtcaggc atgctttaaa 6720 tttgaacatg tgattaccgg tgagcgatat gaactgaaag tttcatcggg tgagtttaag 6780 attgttgaaa cagttcctgg ttggacacat gacattacaa atattggaac tgatgaatta 6840 atagtcatgc tctgggcaaa tgaaattttc aaccgtgatg agcccgatac tattgcgaga 6900 cctctataat gaaaaaatta aaagttatgt ctgttgttgg aacccgtcct gagattatcc 6960 gtttgtcgag ggttcttgct aagtttgatg aatactgcga gcatattatt gtccatactg 7020 gtcaaaatta tgattacgaa ttaaatgaag tgttcttcaa tgacttgggt gttcgaaaac 7080 ctgattattt tttaaatgca gcgggtaaaa atgcggcgga aaccattggt caggttatta 7140 ttaaggtaga tgaagtatta gaaatcgaaa aacctgaagc aatactggta ttgggcgata 7200 cgaattcatg tatttctgcc attccggcca aacgccgtaa agtgcctata tttcatatgg 7260 aagcaggtaa ccgttgtttc gatcaacgcg tgcctgaaga aaccaacaga cgtattgttg 7320 accatacggc tgatatcaat atgacctaca gtgatattgc tcgtgaatat ctcttggctg 7380 aaggtatccc agctgatcgg atcataaaaa ctggtagccc tatgtttgag gttctttcat 7440 attatatgcc ccaaattgat ggttcagatg tgctatcgcg tttgaatcta cagtctggtg 7500 agttttttgt agtaagtgcg catcgtgaag agaatgttga ttctccaaaa cagctcgtaa 7560 agcttgcgaa cattctaaat actgttgctg aaaaatataa tcttccagtt attgtctcca 7620 cacacccaag gacacgtaac cgaatccgtg agcaaggaat tgaatttcat tcaaatataa 7680 atctactgaa accattgggt ttccatgatt ataaccactt gcagaagaac tcacgagctg 7740 tgctttcaga tagcggtact atcactgaag agtcatccat catgaatttc ccagcggtaa 7800 acatccggga agcgcatgag cgtccggaag gctttgagga agcatccgtc atgatggtgg 7860 ggttagagtg tgaacgcgta ttacaagcgc tggatattct ggcaacacaa ccgcgaggtg 7920 aagtccgtct tttacgtcag gttagtgatt acagcatgcc aaatgtgtcg gataaagttg 7980 tcagaattgt tcactcttac acagattatg ttaagagagt cgtctggaaa gaatattgat 8040 gaaacttgct ttaatcatag atgattacct gcccaacagt actcgtgttg gtgcaaaaat 8100 gtttcatgaa cttgctcaag aatttatcca gcgtgggcac gatgttacgg taattactcc 8160 tggtacgggc atgcaagaag agatttcttt tgataccttt cagggggtaa aaacatggcg 8220 ttttaaaagc gggccgctca aggatgtaag taaaattcag cgagcggtca atgaaacgct 8280 tttgtcctat cgggcgtgga aagccatcaa aaaatgggta aaaaaagaga cctttgaggg 8340 ggtgatttat tattcacctt ccatattctg ggggccttta gttaaaaaaa ttaaagctcg 8400 ttgccaatgt cctgcttatc ttattttaag agatatgttt ccacaatggg taattgatgc 8460 aggaatgctt aatgctggtt ccccaataga acgctacttt cgtctttttg aaaaaatatc 8520 ttatcgtcag gcaaatcgta ttggacttat gtctgataag aatcttgatg tttttcggaa 8580 agataataaa ggctatccgt gcgaagtttt gcgtaattgg gcatccctaa caccaacgat 8640 catacccaag gattatatac cactacgtaa gcgacttggc ctagaggata aaaccatttt 8700 cttctatggt ggaaacatag gtcatgcaca ggacatgaca aacttgatgc gacttgtgag 8760 aaacatggca gcatatcctc aagctcattt cctatttatt ggccaggggg atgaagttga 8820 attaattaat tcattagcat ctgagtgggc attgacgaat ttcacctatt tgccctcggt 8880 taaccaagat gaatttaagt tcattttgtc ggaaatggat atcggcttgt tttctctttc 8940 cgctagacac tcttcccata attttcctgg taagttatta ggctatatgg ttcagtcgct 9000 acctatttta ggtagcgtaa atgccggaaa tgatttgctc gacattgtca atcaaaataa 9060 tgcgggatta atccatgtca atggtgagga cgataaatta tgtcaatctg cgctattaat 9120 gttgcatgat attgatgtgc gccggcaact tggttcgggg gcgaatatat tgttgaaaga 9180 acaattctcc gttgagtctg cggcacagac gatagaaatg aggttggagg catgcaatgc 9240 gattaattga taatgaccaa ctcgacgaat tatatgatca agccgggcaa tcggaacgtt 9300 tacgttccca ccttatgatg cacggctcgc atcaagaaaa ggtacagcgt ttacttattg 9360 cattagtaaa gggcagctat gttgaaccgc attatcacga acttcctcat cagtgggaaa 9420 tgttcattgt tatggagggg caacttcagg tttgtttgta tggtagaaat ggtgaggtta 9480 taaagcaatt tatagcagga gataatactg gaatgagcat tgtggagttt tctccgggcg 9540 atatacacag tgtcgaatgc ctatctccgc gtgctcttat ggtggaagtt aaggaggggc 9600 catttgaccc ttcttttgca aaatcgttcg tgtgagcggc cgcgagctcg tcgactcgag 9660 gatccgtgta ggctggagct gcttcgaagt tcctatactt tctagagaat aggaacttcg 9720 gaataggaac taaggaggat attcatatgg ataaagccgt aagcatataa gcatggataa 9780 gctatttata ctttaataag tactttgtat acttatttgc gaacattcca ggccgcgagc 9840 attcagcgcg gtgatcacac ctgacaggag tatgtaatgt ccaagcaaca gatcggcgta 9900 gtcggtatgg cagtgatggg acgcaacctt gcgctcaaca tcgaaagccg tggttatacc 9960 gtctctattt tcaaccgttc ccgtgagaag acggaagaag tgattgccga aaatccaggc 10020 aagaaactgg ttccttacta tacggtgaaa gagtttgtcg aatctctgga aacgcctcgt 10080 cgcatcctgt taatggtgaa agcaggtgca ggcacggatg ctgctattga ttccctcaaa 10140 ccatatctcg ataaaggaga catcatcatt gatggtggta acaccttctt ccaggacact 10200 attcgtcgta atcgtgagct ttcagcagag ggctttaact tcatcggtac cggtgtttct 10260 ggcggtgaag agggggcgct gaaaggtcct tctattatgc ctggtggcca gaaagaagcc 10320 tatgaattgg tagcaccgat cctgaccaaa atcgccgccg tagctgaaga cggtgaacca 10380 tgcgttacct atattggtgc cgatggcgca ggtcactatg tgaagatggt tcacaacggt 10440 attgaatacg gcgatatgca gctgattgct gaagcctatt ctctgcttaa aggtggcctg 10500 aacctcacca acgaagaact ggcgcagacc tttaccgagt ggaataacgg tgaactgagc 10560 agttacctga tcgacatcac caaagatatc ttcaccaaaa aagatgaaga cggtaactac 10620 ctggttgatg tgatcctgga tgaagcggct aacaaaggta ccggtaaatg gaccagccag 10680 agcgcgctgg atctcggcga accgctgtcg ctgattaccg agtctgtgtt tgcacgttat 10740 atctcttctc tgaaagatca gcgtgttgcc gcatctaaag ttctctctgg tccgcaagca 10800 cagccagcag gcgacaaggc tgagttcatc gaaaaagttc gtcgtgcgct gtatctgggc 10860 aaaatcgttt cttacgccca gggcttctct cagctgcgtg ctgcgtctga agagtacaac 10920 tgggatctga actacggcga aatcgcgaag attttccgtg ctggctgcat catccgtgcg 10980 cagttcctgc agaaaatcac cgatgcttat gccgaaaatc cacagatcgc taacctgttg 11040 ctggctccgt acttcaagca aattgccgat gactaccagc aggcgctgcg tgatgtcgtt 11100 gcttatgcag tacagaacgg tattccggtt ccgaccttct ccgcagcggt tgcctattac 11160 gacagctacc gtgctgctgt tctgcctgcg aacctgatcc aggcacagcg tgactatttt 11220 ggtgcgcata cttataagcg tattgataaa gaaggtgtgt tccataccga atggctggat 11280 taa 11283 <210> 16 <211> 13435 <212> DNA <213> Artificial Sequence <220> <223> example O16 rfb locus nucleotide sequence - O16-EPA production strain stLMTB11739 <400> 16 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320 cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380 aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440 atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500 cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560 accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620 gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680 gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740 acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800 cgcgcgtgga aacgtacata tggtttaccg acaattgtga ctaattgctc gaacaactat 1860 ggtccttatc atttcccgga aaagcttatt ccactggtta ttcttaatgc actggaaggt 1920 aaggcattac ctatttatgg caaaggagat cagatccgcg actggttgta tgttgaagat 1980 catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040 ggtgggcaca acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgctggat 2100 gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc tgatcgtccg 2160 ggacacgatc gccgctatgc tattgatgct gagaagattg gtcgcgcatt gggatggaaa 2220 ccacaggaaa cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca 2280 aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag 2340 ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400 agcgtgctct ggcacctttg ggtaatttga ttgcttttga tgttcactct actgattatt 2460 gcggtgattt tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggccggata 2520 ttattgtcaa tgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg 2580 cacaattaat taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag 2640 cctgggttat ccattactcg actgattacg tcttccctgg aaatggcgat atgccatggc 2700 tggagacgga tgcaaccgca ccactaaatg tttacggtga aaccaagtta gccggagaaa 2760 aagcgttaca ggaatattgc gcgaagcatc ttattttccg gaccagctgg gtctatgcag 2820 gaaaaggaaa taacttcgcc aaaacgatgt tacgtctggc aaaagagcgt gaagaattag 2880 cggttattaa cgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacag 2940 cacatgccat tcgtgtcgca ctgaataaac cggatgtcgc aggcttgtac catttggtag 3000 ccagtggtac cacaacctgg tacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060 caggcattcc ccttgcactc aacaagctca acgcagtacc aacaacagcc tatcctacac 3120 cagctcgtcg tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc 3180 ttgtcttgcc tgactggcag gttggcgtga aacgaatgct caatgaatta tttacgacta 3240 cagcaattta atagtttttg catcttgttc gtgatggtgg agcaagatga attaaaagga 3300 atgatgaaat gaaaatgcgt aaaggtatta ttttagcggg tggttctggt acacgtcttt 3360 atcctgtgac tatggctgtc agtaaacagc tattacctat ttatgataaa ccgatgatct 3420 attacccgct ctctacactg atgttggcgg gtattcgcga tattttgatt atcagtacac 3480 ctcaggatac tcctcgtttt caacaattgc tgggtgacgg tagccagtgg ggcctgaatc 3540 ttcagtacaa agtgcaacct agcccagatg gcctcgcgca ggcatttatc atcggtgaag 3600 agtttattgg tggtgatgat tgtgctttgg ttcttggtga taatatcttt tacggtcacg 3660 atctgccgaa gctaatggag gccgctgtta acaaagaaag tggtgcaacg gtatttgcct 3720 atcacgttaa tgatccagaa cgctatggtg tcgttgagtt tgataaaaac ggtacggcaa 3780 tcagtctgga agaaaaaccg ttagaaccaa agagtaatta cgccgttaca ggtctgtact 3840 tttatgataa cgacgtggtt cagatggcga aaaacttgaa gccgtctgca cgtggtgagt 3900 tagaaattac agatattaac cgtatttatc ttgagcaggg acgtctgtct gtcgcgatga 3960 tggggcgtgg ctacgcgtgg ctggacacgg ggactcatca gagtctgata gaagcaagta 4020 attttattgc gacaattgaa gagcgccagg gattgaaggt ttcctgtcct gaagagattg 4080 catttcgtaa aggttttatt gatgttgagc aagtaagaaa attagctgta ccactaataa 4140 agaataatta tgggcagtat ctttataaaa tgacgaagga ttcaaattaa tgaatgtgat 4200 tagaactgaa attgaagatg tgctaattct ggagccaaga gtatttggtg atgatagagg 4260 tttcttttat gagagcttta atcaatcagc atttgaacat attctaggct atccggtcag 4320 ctttgttcaa gacaatcact cacgttcatc aaaaaatgta ctcagaggcc ttcactttca 4380 acgcggcgag tacgcacaag ataaacttgt acgctgcact catggagcag tttttgatgt 4440 tgctgttgat attcgaccca attcggtatc ctttggtaaa tgggttggtg ttctgctttc 4500 agctgataat aagcagcagt tgtggatacc aaaagggttt gctcatggct ttttggttct 4560 gtctgatatc gctgaatttc aatataaaac tacaaactat tatcatcctg aaagcgattg 4620 tggaatatgt tggaatgatg aacgcattgc aattgattgg ccccaaacat cagggttaat 4680 cctttcgcca aaagatgaaa ggctctttac gttagatgag cttatcagat taaaattaat 4740 tgcatgaata cgaataaatt atctttaaga agaaacgtta tatatctggc tgtcgttcaa 4800 ggtagcaatt atcttttacc attgcttaca tttccatatc ttgtaagaac acttggtcct 4860 gaaaatttcg gtatattcgg tttttgccaa gcgactatgc tatatatgat aatgtttgtt 4920 gaatatggtt tcaatctcac agcaactcag agtattgcca aagcagcaga tagtaaagat 4980 aaagtaacgt ctattttttg ggcggtgata ttttcaaaaa tagttcttat cgtcattaca 5040 ttgattttct taacgtcgat gaccttgctt gttcctgaat ataacaagca tgccgtaatt 5100 atatggtcgt ttgttcctgc attagtcggg aatttaatct accctatctg gctgtttcag 5160 ggaaaagaaa aaatgaaatg gctgacttta agtagtattt tatcccgctt ggctattatc 5220 cctctaacat ttatttttgt gaacacaaag tcagatatag caattgccgg ttttattcag 5280 tcaagtgcaa atctggttgc tggaattatt gcactagcta tcgttgttca tgaaggttgg 5340 attggtaaag ttacgctatc attacataat gtgcgtcgat ctttagcaga cggttttcat 5400 gtttttattt ccacatctgc tattagttta tattctacgg gaatagttat tatcctggga 5460 tttatatctg gaccaacgtc cgtagggaat tttaatgcgg ccaatactat aagaaacgcg 5520 cttcaagggc tattaaatcc tatcacccaa gcaatatacc caagaatatc aagtacgctt 5580 gttcttaatc gtgtgaaggg tgtgatttta attaaaaaat cattgacctg cttgagtttg 5640 attggtggtg ctttttcatt aattctgctc ttgggtgcat ctatactagt aaaaataagt 5700 atagggccgg gatatgataa tgcagtgatt gtgctaatga ttatatcgcc tctgcctttt 5760 cttatttcat taagtaatgt ctatggcatt caagttatgc tgacccataa ttataagaaa 5820 gaattcagta agattttaat cgctgcgggt ttgttgagtt tgttgttgat ttttccgcta 5880 acaactcttt ttaaagagat tggtgcagca ataacattgc ttgcaacaga gtgcttagtt 5940 acgtcactca tgctgatgtt cgtaagaaat aataaattac tggtttgctg aggattttat 6000 gtacgattat atcattgttg gttctggttt gtttggtgcc gtttgtgcga atgagttaaa 6060 aaagctaaac aaaaaagttt tagtgattga gaaaagaaat catatcggtg gaaatgcgta 6120 cacagaggac tgtgagggta tccagattca taaatatggt gcacatattt ttcataccaa 6180 tgataaatat atatgggatt acgttaatga tttagtagaa tttaatcgtt ttactaattc 6240 tccactggcg atttataaag acaaattatt caaccttcct tttaatatga atactttcca 6300 ccaaatgtgg ggagttaaag atcctcaaga agctcaaaat atcattaatg ctcagaaaaa 6360 aaagtatggt gacaaggtac ctgaaaattt ggaggagcag gcgatttcat tagttgggga 6420 ggacttatac caagcattga taaagggtta tacggagaag cagtggggaa gaagtgcaaa 6480 agaattgcct gcatttatta ttaagcgaat cccagtgaga tttacgtttg ataacaatta 6540 tttttccgat cgctatcaag gtattccggt gggaggctac actaagctta ttgaaaaaat 6600 gcttgaaggt gtggacgtaa aattaggcat tgattttttg aaagacaaag attctctagc 6660 gagtaaagcc catagaatca tctacactgg acccattgat cagtacttcg actataggtt 6720 tggagcgtta gaatatcgct ctttaaaatt tgagacggaa cgccatgaat ttccaaactt 6780 ccaagggaat gcagtaataa atttcactga tgctaatgta ccatatacca gaataattga 6840 gcataaacat tttgactatg ttgagacaaa gcatacggtt gttacaaaag aatatccatt 6900 agagtggaaa gttggcgacg aaccctacta tccagttaat gataataaaa acatggagct 6960 ttttaagaaa tatagagagt tagctagcag agaagacaag gttatatttg gcgggcgttt 7020 ggccgagtat aaatattatg atatgcatca agtgatatct gccgctcttt atcaagtgaa 7080 aaatataatg agtacggatt aatgatctat cttgtaatta gtgtctttct cattacagca 7140 tttatctgtt tatatcttaa gaaggatata ttttatccag ccgtatgcgt taatatcatc 7200 ttcgcactgg tcttattggg atatgaaata acgtcagata tatatgcttt tcagttaaat 7260 gacgctacgt tgatttttct actttgcaat gttttgacat ttaccctgtc atgtttattg 7320 acggaaagtg tattagatct aaatatcaga aaagtcaata atgctattta tagcatacca 7380 tcgaagaaag tgcataatgt aggcttgtta gttatttctt tttcgatgat atatatatgc 7440 atgaggttaa gtaactacca gttcgggact agcttactta gctatatgaa tttgataaga 7500 gatgctgatg ttgaagacac atcaagaaat ttctcagcat acatgcagcc aatcattcta 7560 actacttttg ctttatttat ttggtctaaa aaatttacta atacaaaggt aagtaaaaca 7620 tttactttac ttgtttttat tgtattcatc tttgcaatta tactgaatac tggtaagcaa 7680 attgtcttta tggttatcat ctcttatgca ttcatcgtag gtgttaatag agtaaaacat 7740 tatgtttatc ttattacagc tgtaggtgtt ctattctcct tgtatatgct ctttttacgt 7800 ggactgcctg gggggatggc atattatcta tccatgtatt tggtcagccc tataatcgcg 7860 tttcaggagt tttattttca gcaagtatct aactctgcca gttctcatgt cttttggttt 7920 tttgaaaggc tgatggggct attaacaggt ggagtctcta tgtcgttgca taaagaattt 7980 gtgtgggtgg gtttgccaac aaatgtttat actgcttttt cggattatgt ttatatttcc 8040 gcggagctaa gctatttgat gatggttatt catggctgta tttcaggtgt tttatggaga 8100 ttgtctcgaa attacatatc tgtgaaaata ttttattcat attttattta taccttttct 8160 ttcatttttt atcatgaaag cttcatgact aatattagca gttggataca aataactctt 8220 tgtatcatag tattctctca atttcttaag gcccagaaaa taaagtgaaa atgtattttt 8280 tgaatgattt aaatttctct agacgcgatg ctggatttaa agcaagaaaa gatgcactgg 8340 acattgcttc agattatgaa aacatttctg ttgttaacat tcctctatgg ggtggagtag 8400 tccagagaat tattagttct gttaagctta gtacatttct ctgcggtctt gaaaataaag 8460 atgttttaat tttcaatttc ccgatggcca aaccattttg gcatatattg tcattctttc 8520 accgccttct aaaatttaga atagtacctc tgattcatga tattgatgaa ttaagaggag 8580 gagggggtag tgattctgtg cggcttgcta cctgtgatat ggtcataagt cacaatccac 8640 aaatgacaaa gtaccttagt aaatatatgt ctcaggataa aatcaaagac ataaaaatat 8700 ttgattacct cgtctcatct gatgtggagc atcgagatgt tacggataag caacgagggg 8760 tcatatatgc tggcaacctt tctaggcata aatgttcttt catatatact gaaggatgcg 8820 attttactct ctttggtgtc aactatgaaa ataaagataa tcctaaatat cttggaagtt 8880 ttgatgctca atctccggaa aagattaacc tcccaggcat gcaatttgga ctcatttggg 8940 atggagattc tgtcgaaacc tgtagtggtg cctttggcga ctatttaaag tttaataacc 9000 ctcataagac atctctttat ctttcaatgg aacttccagt atttatatgg gataaagccg 9060 cccttgcgga tttcattgta gataatagaa taggatatgc agtgggatca atcaaagaaa 9120 tgcaagagat tgttgactcc atgacaatag aaacttataa gcaaattagt gagaatacaa 9180 aaattatttc tcagaaaatt cgaacaggaa gttacttcag ggatgttctt gaagaggtga 9240 tcgatgatct taaaactcgc taaacgatat ggtctctgtg gttttattcg gcttgttaga 9300 gatgtcttat tgactcgtgt attttaccgg aactgtagaa ttattcgatt tccctgctat 9360 attcgcaatg atggtagcat taattttggt gaaaatttca caagtggagt cggtctcagg 9420 ctggatgcat ttggacgtgg cgtgattttt ttttccgata atgtgcaagt taacgactat 9480 gttcatatcg cctcaattga gagcgttacg ataggtcggg atacgcttat tgcaagtaaa 9540 gtatttatta ccgatcataa tcacggttcc tttaagcact ctgatccaat gagttcgcca 9600 aatatacctc cagacatgcg cacgttggaa tcttcagctg ttgtaattgg ccagagggtt 9660 tggttgggtg agaatgtgac ggttttgcct ggaacaatta ttggtaatgg agtcgtagtc 9720 ggcgccaatt ctgttgttag aggttctatt cccgaaaata ctgtcattgc gggagtacca 9780 gcaaaaatca taaagaaata caatcatgag accaaattat gggaaaaagc atagtcgttg 9840 tttctgcggt caattttacc actggcggtc catttaccat tttgaaaaaa tttttggcag 9900 caactaataa taaagaaaat gtcagtttta tcgcattagt ccattctgct aaagagttaa 9960 aagaaagtta tccatgggtt aaattcattg agtttcctga ggttaaaggg tcgtggctaa 10020 aacgtttgca ctttgaatat gtagtttgta aaaaactttc aaaagagctg aatgctacgc 10080 attggatttg tctgcatgat attacggcca atgtcgtcac taaaaaaaga tatgtgtatt 10140 gtcataaccc tgcccctttt tataaaggaa ttttattccg tgaaattctt atggagccta 10200 gctttttctt atttaaaatg ctatacgggc tgatatataa aataaacatt aaaaaaaata 10260 ctgcagtgtt tgttcaacaa ttctggatga aagaaaaatt tatcaagaaa tattctataa 10320 ataacatcat tgtcagtcgg ccagaaatta aattatctga taaaagccaa cttactgatg 10380 atgattctca atttaagaat aacccttctg agttgacaat attttaccct gctgttccac 10440 gagtatttaa aaattacgag cttattatta gtgcagcaag gaaattgaaa gaacaatcca 10500 atattaaatt tctgcttact atcagtggta cagaaaatgc gtatgcaaaa tatattatca 10560 gtcttgcaga aggactggat aatgttcatt tcctcgggta cttggataaa gaaaaaatcg 10620 atcattgtta taatatttca gatatagttt gttttccctc taggttagaa acatggggat 10680 tgccgttgtc tgaggctaaa gagcgaggta agtgggtatt agcatcagat ttcccattta 10740 ctagagaaac tcttggtagt tatgaaaaga aagctttttt tgattctaat aacgatgaca 10800 tgttagttaa acttattatt gacttcaaaa aaggtaacct caaaaaagat atctctgatg 10860 caaatttcat ttatcgtaat gaaaatgtat tagttgggtt tgatgaacta gttaatttta 10920 ttactgaaga acattgaaat ggtatatata ataatcgttt cccacggaca tgaagactac 10980 atcaaaaaat tactcgaaaa tcttaatgct gacgatgagc actacaagat tatcgtacgc 11040 gacaacaaag actctctatt attgaaacaa atatgccagc attatgcagg cctggactat 11100 attagtggag gtgtatacgg ctttggtcat aataataata ttgcggtggc gtatgtaaag 11160 gaaaaatata gacccgcaga tgatgattac attttgtttt tgaatcccga tatcatcatg 11220 aagcatgatg atttgctgac atatattaaa tatgtcgaaa gtaagcgtta tgcttttagt 11280 acattatgcc tgttccgaga tgaagcgaaa tctttacatg attattccgt aagaaaattt 11340 cctgtgcttt ctgattttat tgtgtcattt atgttaggga ttaataaaac aaaaattcct 11400 aaagaaagta tctattctga tacggttgtt gattggtgcg caggatcatt tatgctggta 11460 cgtttttcag attttgtgcg tgtaaatggc ttcgatcaag gttactttat gtactgtgaa 11520 gatattgacc tgtgcttgag gcttagcctg gctggtgtca gacttcatta tgttcccgct 11580 tttcatgcga tacattatgc tcatcatgac aatcgaagtt ttttttcaaa agccttcaga 11640 tggcacttaa aaagtacttt tagatattta gccagaaaac gtattttatc aaatcgcaac 11700 tttgatcgaa tttcatcagt ttttcacccg taagagctcg gtacccgggc ctagggtgta 11760 ggctggagct gcttcgaagt tcctatactt tctagagaat aggaacttcg gaataggaac 11820 taaggaggat attcatatcc gtcgacggcg gccgccctgc aggcatgcaa gcttgatcca 11880 tatggatcgc tagcttaatt aaataaagcc gtaagcatat aagcatggat aagctattta 11940 tactttaata agtactttgt atacttattt gcgaacattc caggccgcga gcattcagcg 12000 cggtgatcac acctgacagg agtatgtaat gtccaagcaa cagatcggcg tagtcggtat 12060 ggcagtgatg ggacgcaacc ttgcgctcaa catcgaaagc cgtggttata ccgtctctat 12120 tttcaaccgt tcccgtgaga agacggaaga agtgattgcc gaaaatccag gcaagaaact 12180 ggttccttac tatacggtga aagagtttgt cgaatctctg gaaacgcctc gtcgcatcct 12240 gttaatggtg aaagcaggtg caggcacgga tgctgctatt gattccctca aaccatatct 12300 cgataaagga gacatcatca ttgatggtgg taacaccttc ttccaggaca ctattcgtcg 12360 taatcgtgag ctttcagcag agggctttaa cttcatcggt acgggtgttt ctggcggtga 12420 agagggggcg ctgaaaggtc cttctattat gcctggtggc cagaaagaag cctatgaatt 12480 ggtagcaccg atcctgacca aaatcgccgc cgtagctgaa gacggtgaac catgcgttac 12540 ctatattggt gccgatggcg caggtcacta tgtgaagatg gttcacaacg gtattgaata 12600 cggcgatatg cagctgattg ctgaagccta ttctctgctt aaaggtggcc tgaacctcac 12660 caacgaagaa ctggcgcaga cctttaccga gtggaataac ggtgaactga gcagttacct 12720 gatcgacatc accaaagata tcttcaccaa aaaagatgaa gacggtaact acctggttga 12780 tgtgatcctg gatgaagcgg ctaacaaagg tacgggtaaa tggaccagcc agagcgcgct 12840 ggatctcggc gaaccgctgt cgctgattac cgagtctgtg tttgcacgtt atatctcttc 12900 tctgaaagat cagcgtgttg ccgcatctaa agttctctct ggtccgcaag cacagccagc 12960 aggcgacaag gctgagttca tcgaaaaagt tcgtcgtgcg ctgtatctgg gcaaaatcgt 13020 ttcttacgcc cagggcttct ctcagctgcg tgctgcgtct gaagagtaca actgggatct 13080 gaactacggc gaaatcgcga agattttccg tgctggctgc atcatccgtg cgcagttcct 13140 gcaaaaaatc accgatgctt atgccgaaaa tccacagatc gctaacctgt tgctggctcc 13200 gtacttcaag caaattgccg atgactacca gcaggcgctg cgtgatgtcg ttgcttatgc 13260 agtacagaac ggtattccgg ttccgacctt ctccgcagcg gttgcctatt acgacagcta 13320 ccgtgctgct gttctgcctg cgaacctgat ccaggcacag cgtgactatt ttggtgcgca 13380 tacttataag cgtattgata aagaaggtgt gttccatacc gaatggctgg attaa 13435 <210> 17 <211> 13228 <212> DNA <213> Artificial Sequence <220> <223> example O18A rfb locus nucleotide sequence - O18A-EPA production strain BVEC-L-00559 <400> 17 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320 cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380 aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440 atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500 cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560 accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620 gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680 gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740 acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800 cgcgcgtgga aacgtacata tggtttaccg acaattgtga ctaattgctc gaacaactat 1860 ggtccttatc atttcccgga aaagcttatt ccactggtta ttcttaatgc actggaaggt 1920 aaggcattac ctatttatgg caaaggagat cagatccgcg actggttgta tgttgaagat 1980 catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040 ggtgggcaca acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgctggat 2100 gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc tgatcgtccg 2160 ggacacgatc gccgctatgc tattgatgct gagaagattg gtcgcgcatt gggatggaaa 2220 ccacaggaaa cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca 2280 aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag 2340 ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400 agcgtgctct ggcacctttg ggtaatttga ttgcttttga tgttcactct actgattatt 2460 gcggtgattt tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggccggata 2520 ttattgtcaa tgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg 2580 cacaattaat taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag 2640 cctgggttat ccattactcg actgattacg tcttccctgg aaatggcgat atgccatggc 2700 tggagacgga tgcaaccgca ccactaaatg tttacggtga aaccaagtta gccggagaaa 2760 aagcgttaca ggaatattgc gcgaagcatc ttattttccg gaccagctgg gtctatgcag 2820 gaaaaggaaa taacttcgcc aaaacgatgt tacgtctggc aaaagagcgt gaagaattag 2880 cggttattaa cgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacag 2940 cacatgccat tcgtgtcgca ctgaataaac cggatgtcgc aggcttgtac catttggtag 3000 ccagtggtac cacaacctgg tacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060 caggcattcc ccttgcactc aacaagctca acgcagtacc aacaacagcc tatcctacac 3120 cagctcgtcg tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc 3180 ttgtcttgcc tgactggcag gttggcgtga aacgaatgct caatgaatta tttacgacta 3240 cagcaattta atagtttttg catcttgttc gtgatggtgg agcaagatga attaaaagga 3300 atgatgaaat gaaaatgcgt aaaggtatta ttttagcggg tggttctggt acacgtcttt 3360 atcctgtgac tatggctgtc agtaaacagc tattacctat ttatgataaa ccgatgatct 3420 attacccgct ctctacactg atgttggcgg gtattcgcga tattttgatt atcagtacac 3480 ctcaggatac tcctcgtttt caacaattgc tgggtgacgg tagccagtgg ggcctgaatc 3540 ttcagtacaa agtgcaacct agcccagatg gcctcgcgca ggcatttatc atcggtgaag 3600 agtttattgg tggtgatgat tgtgctttgg ttcttggtga taatatcttt tacggtcacg 3660 atctgccgaa gctaatggag gccgctgtta acaaagaaag tggtgcaacg gtatttgcct 3720 atcacgttaa tgatccagaa cgctatggtg tcgttgagtt tgataaaaac ggtacggcaa 3780 tcagtctgga agaaaaaccg ttagaaccaa agagtaatta cgccgttaca ggtctgtact 3840 tttatgataa cgacgtggtt cagatggcga aaaacttgaa gccgtctgca cgtggtgagt 3900 tagaaattac agatattaac cgtatttatc ttgagcaggg acgtctgtct gtcgcgatga 3960 tggggcgtgg ctacgcgtgg ctggacacgg ggactcatca gagtctgata gaagcaagta 4020 attttattgc gacaattgaa gagcgccagg gattgaaggt ttcctgtcct gaagagattg 4080 catttcgtaa aggttttatt gatgttgagc aagtaagaaa attagctgta ccactaataa 4140 agaataatta tgggcagtat ctttataaaa tgacgaagga ttcaaattaa tgaatgtgat 4200 tagaactgaa attgaagatg tgctaattct ggagccaaga gtatttggtg atgatagagg 4260 tttcttttat gagagcttta atcaatcagc atttgaacat attctaggct atccggtcag 4320 ctttgttcaa gacaatcact cacgttcatc aaaaaatgta ctcagaggcc ttcactttca 4380 acgcggcgag tacgcacaag ataaacttgt acgctgcact catggagcag tttttgatgt 4440 tgctgttgat attcgaccca attcggtatc ctttggtaaa tgggttggtg ttctgctttc 4500 agctgataat aagcagcagt tgtggatacc aaaagggttt gctcatggct ttttggttct 4560 gtctgatatc gctgaatttc aatataaaac tacaaactat tatcatcctg aaagcgattg 4620 tggaatatgt tggaatgatg aacgcattgc aattgattgg ccccaaacat cagggttaat 4680 cctttcgcca aaagatgaaa ggctctttac gttagatgag cttatcagat taaaattaat 4740 tgcatgaggc cggccttaag gaggactagt cccggcgcgc catgagttta atcaaaaaca 4800 gtttttggaa cctttgcggg tatgtacttc cagctattgt gacactacca gctttgggta 4860 ttatggggcg aaaattaggc ccagaattat ttggtgtatt cactttggca ttagctgttg 4920 tgggttatgc aagcattttt gatgcaggcc ttactcgcgc agtgatacga gaagtcgcaa 4980 ttgaaaaaga taatgaagaa aataagttga aaattatttc ttcagcgaca gttgtaatta 5040 tttatttgag tttggccgcc tcactcttat tatttttttt tagtggtcat atcgcattgc 5100 tactgaacat tagtgagact ttttttcata atgtaagtgt ctcgcttaaa attctcgcag 5160 catccatacc attatttttg attactcaaa tatggttgtc aattttagaa ggtgaagaaa 5220 gatttggttt acttaatatc tacaaatcaa ttacgggagt gatattagca atctcaccgg 5280 cattatttat acttattaaa ccctctttga tgtatgcgat aataggctta gttctagcaa 5340 ggtttttatg ttttattttg gcttttataa tttgtcacga taaagtgctt aaagctaaac 5400 taacaatcga tataccaaca attaaaagat tgtttatgtt cggtggttgg attacagtaa 5460 gtaatatcat cagccctgtg ctatcatatt ttgataggtt tattgtttca aatcaacttg 5520 gggctgctaa tgttgctttt tatactgcac catcagaaat tatttctcgg cttagtataa 5580 ttccaggtgc gttttcaaga gccttatttc caagattagc taatgcaaat aattccgctg 5640 aaagatataa aacgaaaaga ttaattacaa tttcactttt aataatcatc acccctattt 5700 tttgtattgg cgtgttattt tcagagaaga taatggtttt atggatgggg gcatcatttt 5760 ttggtgagcc tggtttggta ttatcaatat tactgattgg ctttattttt aatggattgg 5820 cacaagtacc atttgccagt attcaatccc gaggtcatgc taagataact gcatttgttc 5880 atctcttaga gttgtttcct tatttattac ttttatttta cctcataaaa gcacatgggg 5940 ttgttggcgc gggtattgcg tggtcagtga ggatgatagt agattatata gcattaagtc 6000 ttttggacgg taagtatatt aataaataaa attcaaaatg caagttaata actcatggct 6060 ttatttgggt aggtgacaat ttataatgat atatatatta actttaactc ttcttctagt 6120 tatagccata atgttttctc ttctcggcac aaaaagtagg atcacatctc cattaccttt 6180 gcatttttta ccatggttac taactttaat tgtcgggata agtaattacg atcaatttta 6240 cgagtttaat gaaagaagct tttactcttt gttgatttgg tttacagtta tttttatatt 6300 ttatttcata ggggaactgg ttaattataa acgtgaaaat ataaatgttt attatggtct 6360 ttcacatatt aaatatgaat gtaaaaaata ttggatcatt gtcatcccaa tttcattata 6420 taccattttc gaaatatata tggttggtat ggggggagca gatggattct ttctcaattt 6480 acgtcttgca aatacattgg agggctatac gggtaaaaaa tttatcttaa tgcctgctgt 6540 atatcctcta atgatggcta tgttcgcaat tgtttgtcta acaaaaactt ccaaattaaa 6600 taaatactcc atttatttct ggatgttttt gtattgtatt ggcacaatgg gaaaattttc 6660 aatattaacg ccaatattga catatttaat tatttatgac ttcaaacata gattaaaagt 6720 aaaaaaaaca ataaagttta cattgttgat aattatatta gctttaactt tgcattttac 6780 acgtatggct gagaatgacc actcaacatt tttatctatt ttagggctct atatttattc 6840 accaataatt gctttaggcc agttgaatga agtaaatagt agtcattttg gtgagtatac 6900 gtttagattc atatatgcta taactaataa aattggcctt attaaagaat tgccagtaaa 6960 tactattctt gactattcat acgttcctgt accaacaaat gtatatactg cacttcaacc 7020 attttaccag gattttggtt atactggcat catatttgga gcagtattat acggactaat 7080 atatgtgagt ttatacacgg ccggtgttcg tggaaataat acacaggcat tactgattta 7140 cgcattgttt tcagttagca gtgcaacggc tttcttcgct gaaacgctag taacgaattt 7200 agctggaaat gtgatgttag tattatgtac catcttacta tggcgattta cagtaatatg 7260 caaaccagta cagtaaccat tctaatggcc acctacaatg gcgaggcctt catcaaaaat 7320 cagattttgt cactacaaca acaaacattt tctaactggc ggttatttat tcaggatgat 7380 gggtctacag acaatactat atctataata aaaaacttcc aaaaatctga ctccagaatt 7440 cggctagttg atgataattt gaaaggtcaa ggtgcaggaa aaaatttttt atcgctgata 7500 aagtacagcg agacagatta tacaatttat tgtgaccaag atgatatttg gttagaaaac 7560 aaaatatttg aattagtaaa gtatgcaaat gaaattaaat tgaatgtatc agatgcgcct 7620 tcgctagttt atgctgatgg ctatgcttat atggatggtg agggtacaat cgatttttct 7680 gggatatcta acaatcatgc tgatcaatta aaggattttc ttttttttaa tggtggatac 7740 caaggatgtt ctattatgtt caatcgtgca atgaccaaat ttcttctgaa ttatcgagga 7800 tttgtatatc tacatgacga tatcacaaca ttagctgcat acgctcttgg taaagtttat 7860 tttctcccga aataccttat gttatataga cagcacacga atgcggtaac tggtatcaaa 7920 acattccgca atggattgac ttctaaattt aaatcaccag taaactatct tttatcacga 7980 aaacattatc aggtaaaaaa atcttttttt gaatgtaaca gctctatctt atcagagacg 8040 aataaaaaag tttttttgga ttttatttca ttttgtgaat caaataataa atttacagat 8100 ttttttaagt tatggcgagg tgggtttaga ttaaataaca gtagaactaa attattatta 8160 aaattcttaa tacggagaaa atttagcgaa tgatttcaat acttacacct acttttaatc 8220 ggcaacatac tttatcaagg ctattcaatt ctcttatatt acaaactgat aaagattttg 8280 agtggataat aattgatgat ggtagtatag atgcaacagc ggtacttgta gaagatttta 8340 gaaaaaaatg tgattttgac ttgatttatt gctatcagga aaataatggt aagcccatgg 8400 ctttaaacgc tggtgttaaa gcttgtagag gcgattatat ctttattgtt gacagtgatg 8460 atgcactaac tcccgatgcc ataaaattaa ttaaagaatc aatacatgat tgcttatctg 8520 agaaggaaag tttcagcgga gtcggtttta gaaaagcata tataaaaggg gggattattg 8580 gtaatgattt aaataattct tcagaacata tatactattt aaatgcgact gagattagca 8640 atttaataaa tggtgatgtt gcatattgtt ttaaaaaaga aagtttggta aaaaatccat 8700 tcccccgtat agaagatgaa aaatttgttc cagaattata tatttggaat aaaataactg 8760 acaaggcgaa gattcgattt aacataagca aagttatata tctttgtgag tatcttgatg 8820 atggtctttc taaaaatttc cataaccagc ttaaaaaata cccaaagggg tttaagattt 8880 attacaaaga tcaaagaaaa cgagagaaaa cttatataaa aaaaacaaag atgctaatta 8940 gatatttgca atgttgttat tatgagaaaa taaaatgaaa atactatttg tcattacagg 9000 tttaggcctt ggaggtgctg agaagcaggt ttgtctttta gctgataaat taagtttaag 9060 cgggcaccat gtaaagatta tttcacttgg acatatgtct aataataaag tctttcctag 9120 cgaaaataat gttaatgtca ttaatgtaaa tatgtcaaaa aacatttctg gagttataaa 9180 aggttgtgtc agaattagag atgttatagc taatttcaaa ccagacattg tacacagtca 9240 tatgtttcat gcaaacatta tcactagatt gtctgtaatt ggaatcaaaa acagacctgg 9300 tattatatca actgcacata ataaaaatga aggtgggtat ttcagaatgc tcacatatag 9360 aataaccgat tgtttaagtg attgttgtac aaatgttagc aaagaagcag tggatgagtt 9420 tttacggata aaagccttta atcccgctaa agcaattact atgtataatg ggatagatac 9480 caataaattt aaatttgatt tattggcaag gagggaaatt cgagacggta ttaatataaa 9540 aaatgatgat atattattac ttgctgcagg tcgtttaacg ttagctaaag attatcctaa 9600 tttattgaat gcaatgactc tgcttcctga acactttaaa cttattatta ttggtgatgg 9660 tgaattgcgt gacgaaatta atatgcttat aaaaaaattg caattatcta atagggtgtc 9720 cttgttggga gttaaaaaaa atattgctcc ctatttttct gcatgtgata tttttgttct 9780 ctcttctcgt tgggaaggat ttggattagt cgtggcagaa gctatgtcat gtgagcgaat 9840 tgttgttggc acggattcag ggggagtaag agaagttatt ggtgacgatg attttcttgt 9900 acccatatct gattcaacac aacttgcaag caaaattgaa aaattgtctt tgagccagat 9960 acgtgatcac attggttttc ggaatcgtga gcgtatttta aaaaatttct caatagatac 10020 tattattatg cagtggcaag aactctatgg aactataatt tgctcaaaac atgaaaggta 10080 gatttatatt tggaacgtgt cttttgtttg aatttaattc aatctcaatt gagatttttg 10140 tatttcaaaa ataccatcat agctaacgat gattggtatt tattttaaga tgctttctat 10200 aaatatattg acgtttttaa tgcgccgaaa cgattgggct gggaacagag aagtaaaact 10260 gttttgagaa tgaagagttt ttgagatgtt tatggatatt aaaaattgat ccagtgaatt 10320 aattatttat aataaatcaa gatttaatgt taataaatga taatcttttc tgacactcat 10380 attaattatg agtggtacgt ttggtaaacg gtaaactatt atatgacagc tagaacaact 10440 aaagttttgc acttacaatt actcccactc ttaagtggcg ttcaaagggt aacattaaac 10500 gaaattagtg cgttatatac tgattatgat tatacactag tttgctcaaa aaaaggtcca 10560 ctaacaaaag cattgctgga atatgatgtc gattgtcatt gtatccccga acttacgaga 10620 gaaattaccg taaagaatga ttttaaagca ttgttcaagc tttataagtt cataaaaaaa 10680 gaaaaatttg acattgtgca tacacattct tcaaaaacag gtattttggg gcgagttgct 10740 gccaaattag cacgtgttgg aaaggtgatc cacactgtac atggtttttc ttttccagcc 10800 gcatctagta aaaaaagtta ttacctttat tttttcatgg aatggatagc aaagttcttt 10860 acggataagt taatcgtctt gaatgtagat gatgaatata tagcaataaa caaattaaaa 10920 ttcaagcggg ataaagtttt tttaattcct aatggagtag acactgataa gttttctcct 10980 ttagaaaata aaatttatag tagcaccttg aatctagtaa tggttggtag attatccaag 11040 caaaaagatc ctgagacatt attgcttgct gttgaaaaac tgctgaatga aaatgttaat 11100 gttaagctga cacttgtagg agatggtgaa ctaaaagaac agttagaaag caggttcaaa 11160 cggcaagatg gacgtataat ttttcatgga tggtcagata acattgttaa tattttaaaa 11220 gttaatgatc tttttatatt accttctctt tgggagggta tgccattagc aattttagaa 11280 gcattgagct gtggacttcc atgtatagtc actaatattc caggtaataa tagcttaata 11340 gaagatggct ataatggttg tttgtttgaa attagagatt gtcagttatt atctcaaaaa 11400 atcatgtcat atgttggtaa gccagaactg attgcacagc aatctaccaa tgcacgatca 11460 tttattctga aaaattatgg attagttaaa agaaataata aggtcagaca gctatatgat 11520 aattaagagc tcggtacccg ggcctagggt gtaggctgga gctgcttcga agttcctata 11580 ctttctagag aataggaact tcggaatagg aactaaggag gatattcata tccgtcgacg 11640 gcggccgccc tgcaggcatg caagcttgat ccatatggat cgctagctta attaaataaa 11700 gccgtaagca tataagcatg gataagctat ttatacttta ataagtactt tgtatactta 11760 tttgcgaaca ttccaggccg cgagcattca gcgcggtgat cacacctgac aggagtatgt 11820 aatgtccaag caacagatcg gcgtagtcgg tatggcagtg atgggacgca accttgcgct 11880 caacatcgaa agccgtggtt ataccgtctc tattttcaac cgttcccgtg agaagacgga 11940 agaagtgatt gccgaaaatc caggcaagaa actggttcct tactatacgg tgaaagagtt 12000 tgtcgaatct ctggaaacgc ctcgtcgcat cctgttaatg gtgaaagcag gtgcaggcac 12060 ggatgctgct attgattccc tcaaaccata tctcgataaa ggagacatca tcattgatgg 12120 tggtaacacc ttcttccagg acactattcg tcgtaatcgt gagctttcag cagagggctt 12180 taacttcatc ggtaccggtg tttctggcgg tgaagagggg gcgctgaaag gtccttctat 12240 tatgcctggt ggccagaaag aagcctatga attggtagca ccgatcctga ccaaaatcgc 12300 cgccgtagct gaagacggtg aaccatgcgt tacctatatt ggtgccgatg gcgcaggtca 12360 ctatgtgaag atggttcaca acggtattga atacggcgat atgcagctga ttgctgaagc 12420 ctattctctg cttaaaggtg gcctgaacct caccaacgaa gaactggcgc agacctttac 12480 cgagtggaat aacggtgaac tgagcagtta cctgatcgac atcaccaaag atatcttcac 12540 caaaaaagat gaagacggta actacctggt tgatgtgatc ctggatgaag cggctaacaa 12600 aggtacgggt aaatggacca gccagagcgc gctggatctc ggcgaaccgc tgtcgctgat 12660 taccgagtct gtgtttgcac gttatatctc ttctctgaaa gatcagcgtg ttgccgcatc 12720 taaagttctc tctggtccgc aagcacagcc agcaggcgac aaggctgagt tcatcgaaaa 12780 agttcgtcgt gcgctgtatc tgggcaaaat cgtttcttac gcccagggct tctctcagct 12840 gcgtgctgcg tctgaagagt acaactggga tctgaactac ggcgaaatcg cgaagatttt 12900 ccgtgctggc tgcatcatcc gtgcgcagtt cctgcaaaaa atcaccgatg cttatgccga 12960 aaatccacag atcgctaacc tgttgctggc tccgtacttc aagcaaattg ccgatgacta 13020 ccagcaggcg ctgcgtgatg tcgttgctta tgcagtacag aacggtattc cggttccgac 13080 cttctccgca gcggttgcct attacgacag ctaccgtgct gctgttctgc ctgcgaacct 13140 gatccaggca cagcgtgact attttggtgc gcatacttat aagcgtattg ataaagaagg 13200 tgtgttccat accgaatggc tggattaa 13228 <210> 18 <211> 13554 <212> DNA <213> Artificial Sequence <220> <223> example O25B rfb locus nucleotide sequence - O25B-EPA production strain stGVXN4459 <400> 18 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcagtgaaga tacttgttac tggtggcgca ggatttattg gttctgctgt 1320 tgttcgtcac ataataaata atacgcaaga tagtgttgtt aatgtcgata aattaacata 1380 cgccggaaac ctggaatcac ttgcagatgt ttctgattct gaacgctatt tctttgaaca 1440 tgcggatatt tgtgatgcag ctgcaatggc acggattttt gctcagcatc agccggatgc 1500 agtgatgcac ctggcagctg aaagccatgt tgaccgttca attacaggcc ctgcggcatt 1560 tattgaaacc aatattgtgg gtacttatgt ccttttagaa gcggctcgga attattggtc 1620 tggtctggat gatgaaaaga aaaaaaactt ccgttttcat catatttcta ctgatgaggt 1680 gtatggtgac ttaccccatc cggatgaagt aaatagcaat gaaacgttgc cgctatttac 1740 ggaaacgaca gcatacgcgc caagtagtcc atattctgct tctaaagctt ccagcgatca 1800 tttggttcgc gcatggaaac gtacttatgg tttaccgacc attgtgacta attgctcgaa 1860 caactatggt ccttatcatt tcccggaaaa gcttattcca ctggttattc ttaattcact 1920 ggaaggtaag gcattaccta tttatggcaa aggagatcag atccgcgact ggttgtatgt 1980 agaggatcat gctcgagcgt tatataccgt cgtaaccgaa ggtaaagcgg gcgaaactta 2040 taacattggt ggacacaacg aaaagaaaaa catcgacgta gtgttcacta tttgtgattt 2100 gttggatgag atagtcccga aagagaaatc ttaccgcgag caaattactt atgttaccga 2160 tcgtccggga cacgatcgcc gttatgcgat tgatgctgag aagattggtc gcgaattggg 2220 atggaaacca caggaaacgt ttgagagtgg gattcgtaaa acggtggaat ggtacctgtc 2280 caatacaaaa tgggttgata atgtgaaaag tggtgcctat caatcgtgga ttgaacagaa 2340 ctatgagggc cgccagtaat gaatatcctc ctttttggca aaacagggca ggtaggttgg 2400 gaactacagc gtgctctggc acctctgggt aatttgattg ctcttgatgt tcactccact 2460 gattactgtg gtgattttag taatcctgaa ggtgtagctg aaaccgtaag aagcattcgg 2520 cctgatatta ttgtcaacgc agccgctcac accgcagtag acaaagcaga atcagaaccg 2580 aagtttgcac aattactgaa cgcgacgagt gtcgaagcga tcgcgaaagc agccaatgaa 2640 gtcggcgcct gggttattca ctactctact gactacgtat ttccggggac cggtgaaata 2700 ccatggcagg aggaggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagcg 2760 ggagaaaaag cattacaaga gcattgtgcg aagcacctta ttttccggac cagctgggtc 2820 tatgcaggta aaggaaataa cttcgccaaa acaatgttgc gtctggcaaa agagcgtgaa 2880 gaattagccg ttattaatga tcagtttggt gcgccaactg gcgcagagtt actggctgat 2940 tgtacggcac atgctattcg tgtggcactg aataaaccgg aagtcgcagg cttgtaccat 3000 ctggtagcta gtggtaccac aacgtggcac gattatgctg cgctggtttt tgaagaggcg 3060 cgcaaagcag gcattcccct tgcactcaac aagctcaacg cagtaccaac aacagcctat 3120 cctacaccag ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac 3180 tttgcgcttg tcttgcctga ctggcaggtt ggcgtgaaac gaatgcttaa cgaattattt 3240 acgactacag caatttaata gtttttgcat cttgttcgta atggtggagc aagatgtatt 3300 aaaaggaatg atgaaatgaa aacgcgtaaa ggtattattt tggcgggtgg ttctggtact 3360 cgtctttatc ctgtgacgat ggccgtcagt aaacagctgt taccgattta tgataaaccg 3420 atgatctatt acccgctctc tacactgatg ttagcgggta ttcgcgatat tctgattatc 3480 agtacaccac aggatactcc tcgttttcaa caactgctgg gtgacgggag ccagtggggc 3540 ctgaatcttc agtacaaagt gcaaccgagt ccggatggtc ttgcgcaggc gtttattatc 3600 ggtgaagagt ttattggtgg tgatgattgt gctttggtac ttggtgataa tatcttctac 3660 ggccacgacc tgccgaagtt aatggacgta gctgttaaca aagaaagtgg tgcaacggta 3720 tttgcctatc acgttaatga tcctgaacgt tatggtgtcg tggagtttga taataacggt 3780 actgcaatta gcctggaaga aaaaccgctg gaaccaaaaa gtaactatgc ggttactggg 3840 ctttatttct atgacaatga cgttgtggaa atggcgaaaa accttaagcc ttctgcccga 3900 ggtgaactgg aaattaccga tattaaccgt atttatatgg aacaaggacg tttgtctgtc 3960 gctatgatgg ggcgtggcta tgcatggctg gatacaggga cgcatcaaag tcttattgaa 4020 gcaagcaact tcattgccac cattgaagag cgccagggac taaaggtttc ctgtccggaa 4080 gaaattgctt atcgtaaagg gtttattgat gctgagcagg taaaagtatt agccgaaccg 4140 ttgaagaaaa atgcttatgg tcagtatctg ctcaaaatga ttaaaggtta ttaataagat 4200 gaacgtaatt aaaactgaaa ttcctgatgt gctgattttt gaaccaaaag tttttgggga 4260 tgaacgtggc ttcttttttg agagttttaa tcagaggatt tttgaagaag cagtaggtcg 4320 taaggttgag tttgttcagg ataaccattc taagtccagt aaaggtgttt tacgtggtct 4380 tcattatcag ttagaacctt atgctcaagg aaaactggtg cgctgtgttg ttggcgaggt 4440 ttttgatgtt gcggttgata ttcgtaaatc gtcacctaca tttgggaaat gggttggggt 4500 gaatttgtct gctgagaata agcgtcagtt gtggattcct gagggatttg cacatggttt 4560 tttggtgctg agtgatttag cagaagtttt atataaaacg aatcaatatt atgctccatc 4620 acatgaaaaa aatattatat ggaatgacct cttgcttaat attaaatggc cgagcacagc 4680 actgatcact ctgtctgata aggatgcaaa tggggaaaga tttgaactaa gtgagttttg 4740 aaatgtctct cttaaaacat agtatatgga atgttgcggg ctactttata ccaacattaa 4800 ttgcaattcc cgcctttgga ttaattgcga ggaaaattgg tgtagaacta tttggtttgt 4860 atacgttagc aatgattttt atagggtatg caagtatatt tgatgctggg ttaacaagag 4920 ctgttgtgcg tgaaatagca ttactaaaaa acagagtgga cgattgtaat acgataatag 4980 taacttctat tatcgctgtg atatttttag ggtttatcgg aggcggggga gtgtttctgc 5040 ttaaaggcga tattattgaa ctgttaaata tctcaccaat atattacgcc gattcgataa 5100 agtctctagt attattatca tctctgatac ctgtattctt agtcacgcaa atactattag 5160 cagagcttga gggtcgggaa tattttggga ttctaaatat acaaaaaagt gtagggaatt 5220 ctttaattgc agggttacct gcattatttg ttttaattaa tcaaacgctt ttttctgcaa 5280 ttattggtgt agcgattgca agagttatat gcttgtggtt aagctacatt atgagcaggg 5340 aaagaataac tatcgatatc tcattttttt caataactgt tttaaagcgg ttatttagat 5400 atggcgggtg ggtaactata agtaacataa tatctcctat attagcgagt atggatagat 5460 ttattctatc ccatatccag ggagcatcaa aaatatcatt ctatacagtc cctaatgagc 5520 tggtaactag gcttggaata gttccaggct ctcttgggaa agctgttttt ccaaaattaa 5580 gtcatgcaag gaattttaca gcgtcatatg cagagcaaaa aaaagcttat atattaatga 5640 ctgtcattgt aatgcctttg gttttatttg tatattatta cgcaaagttt attttaacat 5700 tgtggatggg ggctgagtat gcagggattt cggtcgaaat attacggatt atgcttatag 5760 ggtatatttt taactgttat tcacaaatct cttttgccaa catacaggcc tttggaaaag 5820 caaaatacac tgcatacatc catatgatgg aatttattcc ttatttgata atgttatata 5880 taatttcaaa ggaatatggg gttattggtg ttgcgtggtt atggacaatt cgagtaataa 5940 ttgatttttt gatgctttta tatatgagtt atcgttgtaa taatcttatg aaaaaagggt 6000 agcctgatga tatatattgt ggtattaaat tggaatgggg ctatagatac cattaattgt 6060 gttaaaagtt taatggattt aaatgttagc gattataaaa ttatcattgt tgataactgt 6120 tctatggata actcatatga tactataaaa gaaaatctta attcattata tattgctgat 6180 aaaagtatca ttgaggtgaa gtatgaggat agaaataaat ataaaacctt agaaaacgat 6240 aaaatcatat taatacaatc tccgcaaaat aatgggtacg caagtggtaa taatattggc 6300 atagagttcg ctcttaatca ggagaatatg aaatacgtct gggttctgaa taatgatact 6360 gaagtggata aagaggcttt aactcattta attagtaaat gtgattcaga taaaagtata 6420 gggatttgcg gttctcgttt agtctatttt gccgacagag agatgcagca aggactaggt 6480 ggggtgcata acaaatggtt atgcactaca aaaaattatg aaatgggaag attagtttcc 6540 aaaaaatatg atgatgaagt cattagtaat gatatagatt atataattgg cgcatcgatg 6600 tttttctcta gagaatgttt ggaaacagtt ggattgatga atgaagaata ttttttatac 6660 tatgaagagt tagatatttg cctcagagca aaagcaaaga actttaaatt aggtatttgc 6720 tcagaaagtt tggtttatca taaaataggt gcaagtactg atgggggaaa gagcatgatg 6780 gctgatcttt gctcaataaa aaataggctg gtcattacag aaaggtttta tccccaatat 6840 tattggacgg tatggttgtc actttttgtt gtagcattta accgtgctag aagaggtgag 6900 tttaataaga tgaaaagatg tttgaatgtt atgtttaact tcaaacgaaa caaaggtagc 6960 aaatgccatt agaatatgca cttaatcatg gtgttaataa atctatagtt tgatatgtta 7020 ttaaagggta tttaatgaaa gtggcttttt tatctgctta tgatccacta tctacatcca 7080 gttggtctgg cacaccttat tatatgctaa aggcattatc gaagagaaat atttccattg 7140 aaatattagg accggtaaat agctatatga tatacatgtt aaaagtatat aaattaatat 7200 taaggtgttt cggaaaagaa tatgattata gtcattcgaa gttgctttcc aggtattacg 7260 gtagaatatt cggtaggaaa ttaaaaaaaa ttgatggttt ggattttatt atcgcacctg 7320 caggttcctc acaaattgct tttttaaaaa caaccatacc aataatatat ctatcggata 7380 caacatatga tcaattaaaa agctattatc cgaatttaaa taaaaaaaca attataaatg 7440 atgaggatgc aagtttaatc gaacgcaagg ctattgaaaa agcaacagta gtatctttcc 7500 catctaaatg ggcaatggat ttttgcagga attattacag attagatttt gataaattag 7560 ttgaaatacc atggggggct aatttatttg atgatattca ctttgctaat aaaaatataa 7620 ttcaaaagaa tagttatact tgtcttttct tgggagttga ttgggaaaga aaaggtggga 7680 aaacagcctt gaaagcaatt gaatatgtaa ggcagttata tgggatcgat gttagactaa 7740 aaatttgtgg atgtactccg aatcaaaaga ttttacctac ttgggttgaa ttaattgata 7800 aagtagataa aaataacgtt gacgaatatc agaaattcat cgatgtgtta tctaacgctg 7860 atatacttct tttaccaacc attgctgaat gttatggaat ggtattttgt gaagctgctg 7920 cttttggatt gcctgttgtc gctacagata caggtggagt cagttctata gttatcaacg 7980 aaaggacggg gatattaatt aaagacccgt tagactataa gcactttgga aatgcaattc 8040 ataaaataat tagttccgta gagacttatc aaaactactc ccaaaacgca agaattagat 8100 ataataatat attgcattgg gacaattggg ctaaaaagat aattgagatt atgtatgagc 8160 ataagaatag aagaatcaaa tagcacaaaa agaattatat gtttatttat actttttctt 8220 gttttccctg attttttgtt ttatacatta ggggttgata attttagcat ttcaacgata 8280 atctcaatta cattgctttt tgttttttta agagctaaaa atatttgcaa agataatttt 8340 ctaataatag tagcgttatt catattgttg tgttttaact gtttgttaag tatgctattt 8400 aatattgaac aggctttaac atttaaagtt gtactttcaa tatatagcat cttaataatg 8460 gcatacgtct cctcttgtta tgcacagacg ttgtggttat gttctgaaga aatacttaag 8520 agatccgtct tttatttgtt cgcatttctt tgccttattg gcattataag tattctttta 8580 cagaagactg agattataca tgataaaagt atgattcttt ttcctgaacc atcagcattt 8640 gcattggttt ttatacctat cttttcattt tgtttatact atacaagagg gggggggcta 8700 ctattgctct atatattatc tttgggtatt gcgttaggta tccagaattt aacaatgttg 8760 gtaggcattg tgattagtgt ttttgtgatg aaaaaaataa ctataaggca aactattgtt 8820 atacttttgg gggcatggat tttttccatg atattaagtg atttagacat ttcttactat 8880 acatcgcggc ttgattttaa aaatactacg aacctatcag tgcttgtata tctttcagga 8940 attgaaagag ctttcttgaa ttttattaca agttatggtc ttggtattgg ttttcaacaa 9000 atgggagtga atggggagat aggaatatat caacaaattt tagctgaact tgatgcccct 9060 atgttaaata tatacgatgg ctcatttatt tcttctaagt taatatctga gtttggggtt 9120 attggtgcat taatgtgtat tttctatttt ttttattttt cccgatttta tctgcgtttc 9180 aaaaaaagta agagatattc accgcagtat attttagcat atagcttcta catgtgtttc 9240 ttcatccctc tttttatacg tggtgctggt tatataaacc cctatgtgtt tatgttattt 9300 tcatcaatat ttttgtgcaa atatcacgct aaaaatatct tgatgaaatc taatgtccag 9360 atagctatat aatagtagat tatattatca ttatcacgta aattacatat taatagcata 9420 tatgataact aggacataaa taatgtgcat taaaaaaaaa cttaagttaa ttaaacgata 9480 tggcctttat ggtggtctta ggcttcttaa agatatattc ttaacaaaat ttttattttg 9540 ttcaaatgtt aggattatta gatttccatg ttatattaga aaagatggaa gtgttagttt 9600 tggaaaaggt tttacatcag gtgtaggatt acgagttgat gcatttatgg atgccgtagt 9660 ttccattgga gaaaatgttc aaattaatga ctatgttcac atcgcggcta ttaataatgt 9720 cattattggt agagatacat taatagcaag taaagtattt attagtgatc ataatcatgg 9780 tattttttct aaatccgata tccatagttc accaactatt attccttcgt ctaggcccct 9840 tgaatctgca cctgtgtata ttggagagcg tgtgtggatt ggcgaaaatg tgacaatatt 9900 accaggtgcg tgtataggta atggtgtagt tattggcgca aacagtgttg ttcgtggtga 9960 gattcctaat aatgtgatca ttgctggtgt tccagctaaa attgttaaaa aatataacta 10020 tgagcgtatg caatgggaaa gaatatagtt gtaatatcgg ctgttaattt tacaaccgga 10080 ggccccttta ccgtactaaa aaatgtgctt acagcaacta aagatagagc cgaatgtaaa 10140 tttattgcac tggttcatag ctctgctgaa ctaatggaat tatttccgtg ggttgaattt 10200 atagagtatc cagaagtcaa gtcttcgtgg gttaaaagat tatatttcga atatataact 10260 tgcaatagat tatctaaggt gattaaggca actcattggg tatgcttaca tgatattaca 10320 gcaaatgtta gtgtacccta tagatttgtt tattgccaca atcctgcacc gttctataaa 10380 tatttaagct atcgagatat tataggagaa cctaaatttt atctttttta tcttttttat 10440 gggcttttat acaatatcaa tataaaaaag aacacagcag tttttgttca gcagcagtgg 10500 ctaaaaaaag aattcgaaaa aaaatataag ttaaagaatg ttgttgttag tcgccctgaa 10560 gatatttgcc cttttgaaag tgatggtttg gtaagaaata ataataaaaa ggatgtgagg 10620 atattttacc cagcagtgcc ccgtatattt aaaaactttg aagttatcat acgtgctgca 10680 caaatattac aagataaaaa tattcatttt tatcttactt ttgatggtac tgaaaataag 10740 tatgcaaaaa gaatatataa attagcttcc gaactgaaaa atgtacattt cctcggttac 10800 cttaatgcaa ccgagatggt taacttttat caagattcag atattatttg tttcccatcg 10860 aaactagaaa cgtggggatt accattatca gaagctaaaa catacaaaaa atggatattt 10920 gcggcagact taccttatgc tcatgaagtt ttatataact attcaaaaac tagatatttt 10980 ccatttgacg atgagaaaat acttgttcgc tacatattag agtacacaag taaaaatatg 11040 catgaagata taaaaaatag tagggtgaat tttaataatg atgcattgac tggttttgaa 11100 cagtttattg aatatatcct caaggggaac tgacgtggtt tatattataa tcgtttcaca 11160 tggccatgat gactatatag aaaatctttt attaaattta aagttgccct ctggaagatt 11220 taaaataata gttcgtgata acaaaagttc aatggtttta aaaaaaacat gcgaaaaaaa 11280 ttgcgtaacc tatttgcatg gagggcaata tggatttgga cataataata acatagcagt 11340 gtcatatata attaataact tcatgattat gaataatgat tattttctct ttcttaaccc 11400 cgatgtattc ataaccagtg aaagtttgat taattatgtt gattatataa ttagtaatga 11460 ttataagttt agcacattat gtctttatcg agattttact aaaagcaaac atgattattc 11520 aatacggagt tttccaactt tatatgattt tctttgttct tttttattgg gggtgaataa 11580 aagtaaaatt aagaaggaaa atatactttc tgatactgta gttgattggt gtgctggctc 11640 atttatgctt attcatgctt taagtttctt aaatgtgaat ggttttgatc aaaaatattt 11700 tatgtattgt gaagatattg acctttgtat gcgtttaaaa ttaagtggag tagatcttta 11760 ctatactccc cattttgatg ctattcatta tgcgcagcat gaaaatagaa gaatatttac 11820 taaagcattt cgatggcata taaggagtat tacgcgctac atattacgga aaccaattct 11880 ttcttataaa aactatagaa aaattacatc cgaactggta aagtgattaa ggatccgtgt 11940 aggctggagc tgcttcgaag ttcctatact ttctagagaa taggaacttc ggaataggaa 12000 ctaaggagga tattcatatg gataaagccg taagcatata agcatggata agctatttat 12060 actttaataa gtactttgta tacttatttg cgaacattcc aggccgcgag cattcagcgc 12120 ggtgatcaca cctgacagga gtatgtaatg tccaagcaac agatcggcgt agtcggtatg 12180 gcagtgatgg gacgcaacct tgcgctcaac atcgaaagcc gtggttatac cgtctctatt 12240 ttcaaccgtt cccgtgagaa gacggaagaa gtgattgccg aaaatccagg caagaaactg 12300 gttccttact atacggtgaa agagtttgtc gaatctctgg aaacgcctcg tcgcatcctg 12360 ttaatggtga aagcaggtgc aggcacggat gctgctattg attccctcaa accatatctc 12420 gataaaggag acatcatcat tgatggtggt aacaccttct tccaggacac tattcgtcgt 12480 aatcgtgagc tttcagcaga gggctttaac ttcatcggta ccggtgtttc tggcggtgaa 12540 gagggggcgc tgaaaggtcc ttctattatg cctggtggcc agaaagaagc ctatgaattg 12600 gtagcaccga tcctgaccaa aatcgccgcc gtagctgaag acggtgaacc atgcgttacc 12660 tatattggtg ccgatggcgc aggtcactat gtgaagatgg ttcacaacgg tattgaatac 12720 ggcgatatgc agctgattgc tgaagcctat tctctgctta aaggtggcct gaacctcacc 12780 aacgaagaac tggcgcagac ctttaccgag tggaataacg gtgaactgag cagttacctg 12840 atcgacatca ccaaagatat cttcaccaaa aaagatgaag acggtaacta cctggttgat 12900 gtgatcctgg atgaagcggc taacaaaggt accggtaaat ggaccagcca gagcgcgctg 12960 gatctcggcg aaccgctgtc gctgattacc gagtctgtgt ttgcacgtta tatctcttct 13020 ctgaaagatc agcgtgttgc cgcatctaaa gttctctctg gtccgcaagc acagccagca 13080 ggcgacaagg ctgagttcat cgaaaaagtt cgtcgtgcgc tgtatctggg caaaatcgtt 13140 tcttacgccc agggcttctc tcagctgcgt gctgcgtctg aagagtacaa ctgggatctg 13200 aactacggcg aaatcgcgaa gattttccgt gctggctgca tcatccgtgc gcagttcctg 13260 cagaaaatca ccgatgctta tgccgaaaat ccacagatcg ctaacctgtt gctggctccg 13320 tacttcaagc aaattgccga tgactaccag caggcgctgc gtgatgtcgt tgcttatgca 13380 gtacagaacg gtattccggt tccgaccttc tccgcagcgg ttgcctatta cgacagctac 13440 cgtgctgctg ttctgcctgc gaacctgatc caggcacagc gtgactattt tggtgcgcat 13500 acttataagc gtattgataa agaaggtgtg ttccataccg aatggctgga ttaa 13554 <210> 19 <211> 15197 <212> DNA <213> Artificial Sequence <220> <223> example O75 rfb locus nucleotide sequence - O75-EPA production strain stLMTB11737 <400> 19 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcagtgaaga tacttgttac tggtggcgca ggatttattg gttctgctgt 1320 tgttcgtcac ataataaata atacgcaaga tagtgttgtt aatgtcgata aattaacata 1380 cgccggaaac ctggaatcgc tcgctgaaat ttctgattct gaacgttatt catttgagca 1440 tgcagatatc tgcgatgccg aagcgatggc tcgtattttc gcacagcacc agccagacgc 1500 ggtgatgcac ctggcagcag agagccacgt tgaccgctca ataactggcc ctgcggcatt 1560 tattgaaacc aatattgtgg gtacttatgt tcttttagaa gcggcgcgca attattggtc 1620 tggtctggat gatgaaaaga aaaaaaactt ccgctttcat catatttcta ctgatgaggt 1680 gtatggtgac ttaccccatc cggatgaagt aaatagcaat gaaacgttgc cgctatttac 1740 ggaaatgaca gcatacgcgc caagtagtcc atattctgct tctaaagctt ccagcgatca 1800 tttggttcgc gcatggaaac gtacttatgg tttaccgacc attgtgacta attgctcgaa 1860 caactatggt ccttatcatt tcccggaaaa gcttattcca ctggttattc ttaatgcact 1920 ggaaggtaag gcattaccta tttatggcaa aggagatcag atccgcgact ggttgtatgt 1980 agaggatcat gctcgagcgt tatataccgt cgtaaccgaa ggtaaagcgg gcgaaactta 2040 taacattggt ggacacaacg aaaagaaaaa catcgacgta gtgttcacta tttgtgattt 2100 gttggatgag atagtcccga aagagaaatc ttatcgtgag caaattacct atgttgctga 2160 tcgcccaggg catgatcgcc gttatgcaat tgatgccgat aaaattagcc gcgaattggg 2220 ctggaaacca caggaaacgt ttgagagcgg gattcgtaaa actgtggaat ggtatctgtc 2280 caatacaaaa tgggttgata atgtgaaaag tggtgcctat caatcgtgga ttgaacagaa 2340 ctatgggggc cgccactaat gaatatcctc ctttttggca aaacagggca ggttggttgg 2400 gaactacagc gtgctctggc acctctgggt aatttgattg ctcttgatgt tcactccact 2460 gattactgtg gtgattttag taaccctgaa ggtgtggctg aaaccgttag aagcattcgg 2520 cctgatatta ttgtcaacgc agccgctcac accgcagtag acaaagcaga atcagaaccg 2580 gagtttgcac aattactgaa cgcgacgagt gtcgaagcga tcgcgaaagc agccaatgaa 2640 gtcggcgctt gggttattca ctactctact gactacgtat ttccggggac cggtgaaata 2700 ccatggcagg aggaggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagca 2760 ggagaaaaag cattacaaga gcattgtgcg aagcacctta ttttccggac cagctgggtc 2820 tatgcaggta aaggaaataa cttcgccaaa acgatgttgc gtctggcaaa agagcgtgaa 2880 gaattagccg ttattaatga tcagtttggt gcgccaactg gcgcagagtt gctggctgat 2940 tgtacggcac atgccattcg tgtggcactg aataaaccgg aagtcgcagg tttgtaccat 3000 ctggtagcca gtggtaccac aacctggcac gattatgctg cgctggtttt tgaagaggcg 3060 cgcaaagcag gcattcccct tgcactcaac aagctcaacg cagtaccaac aacagtctat 3120 cctacaccag ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac 3180 tttgcgcttg tcttgcctga ctggcaggtt ggtgtgaaac gcatgctcaa cgaattattt 3240 acgactacag caatttaata gtttttgcat cttgttcgtg atggtggaac aagatgaatt 3300 aaaaggaatg atggaatgaa tacgcgtaaa ggtattattt tagcgggtgg ttctggtaca 3360 cgtctttatc ctgtgactat ggctgtcagt aaacagctgt taccgattta tgataaaccg 3420 atgatctatt acccgctctc tacactgatg ttggcgggta ttcgcgatat tttgattatc 3480 agcacgccac aggatactcc tcgttttcaa caactgctgg gtgatgggag ccagtggggg 3540 ctaaatcttc actacaaagt gcaaccgagt ccggatggtc ttgcgcaggc atttatcatc 3600 ggtgaagagt ttatcggtgg tgatgattgt gctttggtac ttggtgataa tatcttctac 3660 ggtcacgacc tgcctaagtt aatggatgcc gctgttaaca aagaaagtgg tgcaacggta 3720 tttgcctatc acgttaatga tcctgaacgc tatggtgtcg ttgagtttga taaaaacggt 3780 actgcaatca gcctggaaga aaaaccgtta caaccaaaaa gtaattatgc ggtaaccggg 3840 ctttatttct atgataacta cgttgtggaa atggcgaaaa atcttaagcc ttctgcccgc 3900 ggtgaactgg aaattaccga tattaaccgt atctatatgg aacaggggca tttatctgtt 3960 gccatgatgg gacgtggata tgcctggctg gacacgggga cacatcaaag tcttattgaa 4020 gcaagcaact tcattgccac cattgaagag cgccagggct tgaaagtttc ctgcccggaa 4080 gaaattgctt accgtaaagg gtttattgat gctgagcagg tgaaagtatt agctaaaccg 4140 ctgaaaaaaa atgcttatgg tcagtatctg ctaaaaatga ttaaaggtta ttaataaaat 4200 gaatgttatt aaaacagaaa ttccagatgt actgattttt gaaccgaaag tttttggtga 4260 tgagcgtggt ttctttatgg aaagctttaa tcagaaagtt ttcgaagagg ctgtagggcg 4320 gaaggttgaa tttgttcagg ataatcattc taaatcgtgt aaaggtgtac ttagaggttt 4380 acactttcag cttcctccct ttgagcaggc aaaattagta aggtgtatag ttggcgaggt 4440 atttgatgtt gcagtagaca ttagacctaa ttctgaaaca tttggttcat gggttggagt 4500 aactctttcg tcagaaaata aaaggcagct atggattcca gaaggattcg cccatggttt 4560 tttaacttta agtgatattg cagagtttgt ttataaaact aacaactatt attctttaaa 4620 tcatgaaagg ggagtcattt ggaacgatga ggaaattaac attgcctggc cctctcaatc 4680 agagaagatt ctgtcacaga aagatattaa tttaccatca tttagatttg ttcaaatgtt 4740 tagcaagtag tgttatcttt acactgcaca tagtcatcat tttttatgct ttaagtaaat 4800 tatattgcac atctataaca caaagcgcaa taatatttcg acctgatgaa ggtttgtggt 4860 tatttatctt tctaggcgtt ttttatgact aaaatagttg tggtttctac agctccaata 4920 ttcccgacaa ataatgggta caaaagttct gtattaggaa gaattgatga gttattaaat 4980 gaggataatg aggtcgtttt gattgaaata aaccttgaaa atgttacgga aaagaaagat 5040 gaattaatac caacaagatt taataatatt caaagatatg aagtaaaaaa aatatctaga 5100 tcatttattg ccgagttaca aatattattt gatatcagaa ctcggtatga acaattattt 5160 tcttctgctg acattagaga taacataaaa aagataattg atttagaaaa accttctatt 5220 attattgctg agtctatatg ggcgttgcaa gcattgccta ttgaaattag tgcgagaata 5280 cactgtgtta ttcatgatgt ggcaactgat ttctttaaag aaatgtttgt atctcataat 5340 gaggttgtac gaaaaatttt gttttttaat gattacctaa agttgaaaat tactgaagaa 5400 aatattatca aacgtttgag agttgagcaa tttatctttc tgacagaaga agataaatgt 5460 tggtataaaa caagatacaa tattgatgag ggttgttgtt ccttagcgag caatcatctt 5520 tatgtagaaa agattaagag aactatcaat ttccaaaccc ctttcctgct tattcccggt 5580 agcattgaat tttcacaaaa tttttacggc ttaaattggt ttataaaaaa tatatatcct 5640 ggattaaata ggaaaataag aatagttgta acaggaaagg catcagataa aaaaataaag 5700 atgttaaact gtggagagga aattaccttt acgggagagc ttgacttttc cacatataat 5760 aaacttagct caacatgctt gtgtgttatt gcaccgatta caacgggcac tggaattaaa 5820 ataaaaatat tagaagctgt acaaaaaggt attcctgtac ttacaacaaa atttgcttca 5880 aaaggaatat gttccgattt atgtttttat tgcgaggagg atactgacac aaactttgtc 5940 aatttaatta acagttttct tgaaacgaca ttaagagtcc aagaatgaat ttattgcttt 6000 tttcagtcct tgcgtttggt ttaatattgg ctttggccca taataataaa agtggagata 6060 ttaacgcata cttaatgttt tttctcgtgg tcctaatggt attaatatca gggctgcgta 6120 tgaatgatag tgattatatc gaatacagga aaatgtataa tgaagtgcct attttatgtg 6180 actttagtct cgcatctata agagatatac atggggaggt aggctatcta ttcttatcat 6240 caatctttaa aactttatgc ttgccatttc aattatttct tttttttatt gcttttttat 6300 cactcctgct tacatatttt tcattcagaa aaataagttt aataccgata ctatcgttag 6360 ttttttattt aagccatgct tttatagtta gagatttgat tcaaattagg gcaggattag 6420 ctgttagcat atcattatat tcaataatta aatttaaagg aaataaaagt ataattacag 6480 gagttttatt tgcttctttg attcattctg gggcgcttat tattgctctt tgttatcctt 6540 ttttcaaaaa aaaatacata acattaaaaa tgatgttgtt tttattttta gtgtcaatta 6600 ttttttctta tttgaatggg cttaatttat cgatacaact cttatctcaa tatagtttgc 6660 ttccaactgc aatttcgaat tatgttggtt gggaagaata tgattatcgg gtgagtatat 6720 ttactaatcc ggtttttatt aaaggtgttt ttttaattgt cttaatgcac aaatatgtac 6780 tttcagatat taaaaatgag aaaattatag tgctttataa cttatatgtt ttaggtgtat 6840 tagctatggt tgcattgagt gggatggcta ttctttcagg ccgtctttca tcctttctga 6900 cactaggtga aagcatttta attgtatatg ctctgttcta caaaagaaat acacctctgg 6960 cgtttctaat tttttctttt ttaacaattg tgcaattagg atatgatcta tttatttcta 7020 atgtgcatcc tgagcttact ctgattatat ttgggtgaat ctaagtgaaa aataataaaa 7080 taggcatact tatctctaaa atacaaaatc ttggacctgt gaatgtagta cgaggattga 7140 taaaagaaaa taaaaaatat gcttttactg ttttttgttt aacaaatagc gtagataaaa 7200 atatatatga tgagttatgc tgtttaggag ccaaggttat attaatacca gatggtactt 7260 ggttcagcaa aattttattt gtgagaagtt ttttaaagga acatccacat aatatcttac 7320 attcacatgg gatcacggcc gatatgtttt cttactttct gaatggcgtg aaaatatcta 7380 ctattcacaa tagactagat gaggattata tcccattatt tggcgcggtt aaagggaatg 7440 ctatatatta tcttcatcgt tttatattac gaagatttaa tcatatcgtt gcttgctcag 7500 cagcggtcca atcaaaactg aaacaatcga aagtaaaaac taaaataacc accatccaga 7560 atgggattga tataactagg tttaagacac ttgagtctga taaaaaaaaa ttattgaggg 7620 aaaaacacgg atttgatagt gaaaaaagaa tatttatata ttgtggctcg ttatcattaa 7680 ggaaaaatat tgcttacctc ttggaacact tagccatcga agaaaatgat atatttttaa 7740 ttctaggtga tggtgaactt tttagatatt gtaaggataa atattctaaa gatttacggt 7800 atatatttat ggggaaagtt gaatgccctc ttgaatatta tcaattatca gatatttttg 7860 tttccgcttc tttatcggaa gggctcccct tggcactatt agaagctgcc tctactgggt 7920 gctatttata tgttagcgat atagagcccc atagagaaat tgcatctcta ttaggagagg 7980 aaaatatttc tatgtttaaa attaaggatg gatcatataa ttatttgcaa cctaaaataa 8040 aaaaagctga ctataacgct ctttctgacg ataaacttta caatatatcc gataaaaaaa 8100 tgtcaaatct ttatgacaaa ctttttgttt ctttattaga gcagaggcac taatataatg 8160 atttatgttt cggtaatttc tcatggtcat ttcaaaactc ttaaggaatt aggagcagta 8220 tcaaaattaa ataatcacag cagaattaaa gttatcatca aagataattt aggagagagc 8280 gagcttttgg atttttgtca ggaaaacaaa ataacttatt taaggtctaa agagaaaaaa 8340 ggatttggag agaataataa tgaagttttt tcctctatat cctccttaat tactaaggaa 8400 gatttttttg tggttatgaa tcctgatata tatattgagt gctctgatct attagatgtc 8460 gtagatgagt gtggttcagc gaatgttaat ctagcaacga taaatttata cagggatttt 8520 gataaaaaaa catatgataa ctcagtaagg aaatttccct cggcaattga tttttttatg 8580 tcatttttat ttaagaaaaa tgactgtgta gtaaataaga acaaaataac gaaaccaaca 8640 tatgttgatt gggctgcagg ttcttttcta atatttaatg ccttctttta ttcaaaactc 8700 aacggattca acgaaaagta ttttatgtat tgcgaagata ttgatatatg ttggcgagct 8760 aaaaaacact tcaatacttc agttttatac tatccatgct atgcagcaat tcatttggca 8820 caatttaaca atcgtaggat ttttagtaga catttcattt ggcatataaa aagtattatc 8880 ctttttttat tatataaaaa tggtatgctg cgttctagta agttgcttta atgctaatat 8940 tcttttaaga ggtgagaatg atacctgtta ttttggctgg tggttcggga agtcgcttgt 9000 ggccactttc acgagaaaag ttccccaagc agtttttaaa gttgactggc agtttgacaa 9060 tgttgcagtc aacattgtca cgtcttaata atttaaatgc tgatgattca atagttatat 9120 gcaacgaaga gcatagattt attgttgcag aacaattaag agagttaggc aaactttcaa 9180 ataacattat tcttgaaccc aaaggtcgta atacagcccc tgctataaca ctcgcagcat 9240 tagcagcaaa aagaaaattc gctgatgaag atccattgat tcttatttta gctgcagatc 9300 acaacatcca agacgaacat gttttctgtg aggcaattaa taaggcgtca tctttagcta 9360 gttatggaaa actagtgact tttggtatcg ttccattcaa acctgaaact gggtatggct 9420 atattcgtcg cggtgatgaa gtgcctgtag atgagcagca tgcggtggcc tttgaagtgg 9480 cgcagtttgt cgaaaaaccg aatctggaaa ccgcgcaggc ctatgtggca agcggcgaat 9540 attactggaa cagcggtatg ttcctgttcc gtgccggacg ctatctcgaa gaactgaaaa 9600 agtatcgtcc ggatattctc gatgcctgtg aaaaagcgat gagcgccgtc gatccggatc 9660 tcgattttat tcgtgtggat gaagaggcgt ttctcgcttg tccggaagag tcggtggatt 9720 acgcggtcat ggaatgcacg gcagatgccg ttgtggtgcc gatggatgcg ggctggagcg 9780 atgtcggttc ctggtcttca ttatgggaga tcagcgccca caccgccgag ggcaacgttt 9840 gccacggcga tgtgattaat cacaaaactg aaaacagcta tgtgtacgcc gaatctggcc 9900 tggtcaccac cgtcggggtg aaagatttgg tggtagtgca gaccaaagat gcagtgctga 9960 ttgccgaccg taatgcggtg caggatgtga agaaagtggt cgagcagatc aaagctgatg 10020 gtcgccatga gcatcgggtg catcgcgaag tgtatcgtcc gtggggcaaa tatgactcta 10080 tcgacgcggg cgaccgctac caggtgaaac gcatcaccgt gaaaccgggc gaaggtttgt 10140 cggtacagat gcattatcat cgcgcggaac actgggtggt tgtcgcggga acggcaaaag 10200 tcactatcaa cggtgatatc aaactgcttg gtgaaaacga gtccatttat attccgctgg 10260 gggcgatgca ctgcctggaa aacccgggga aaatagattt agaattaatt gaagttcgct 10320 ctggtgcata tcttgaagaa gatgatgtta ttagatgtta tgatcgctat ggacgaaagt 10380 aatatataat aattatttca gaattagaaa tgataattat aagttttcgt ctggataaac 10440 aatagatagt atgggttgga aaatatgagt tctttaactt gttttaaagc ttacgacatt 10500 cgcgggaaat taggtgaaga actgaatgaa gatatcgcct ggcgcattgg tcgcgcctat 10560 ggcgaatttc tcaaaccgaa aaccattgtg ttaggcggtg atgtccgtct caccagcgaa 10620 accttaaaac tggcgctggc aaaaggttta caggatgcgg gcgtcgatgt gctggatatt 10680 ggcatgtccg gcaccgaaga gatttatttc gccacgttcc atctcggcgt ggatggcggc 10740 attgaagtta ccgccagcca taatccgatg gattacaacg gcatgaagct ggtgcgcgaa 10800 ggggctcgcc cgatcagcgg tgataccgga ctgcgcgacg tccagcgtct ggcagaagct 10860 aacgactttc ctcccgtcga tgaaaccaaa cgcggtcgct atcagcaaat caatctgcgt 10920 gacgcttacg ttgatcacct gttcggttat atcaatgtca aaaaccttac gccgctcaag 10980 ctggtgatca actccgggaa tggcgcagcg ggtccggtgg tggacgctat cgaagcccgc 11040 tttaaagccc tcggcgcacc ggtggagtta atcaaagtgc ataacacgcc ggacggcaat 11100 ttccccaacg gtattcctaa cccgttgctg ccggaatgtc gcgacgacac ccgcaatgcg 11160 gtcatcaaac acggcgcgga tatgggcatt gcctttgatg gcgattttga ccgctgtttc 11220 ctgtttgacg aaaaagggca gtttattgag ggctactaca ttgtcggcct gctggcagaa 11280 gcgttcctcg aaaaaaatcc cggcgcgaag atcatccacg atccacgtct ctcctggaac 11340 accattgatg tggtgacggc cgcgggcggc acgccggtga tgtcgaaaac aggacacgcc 11400 tttattaaag aacgtatgcg caaggaagac gccatctacg gtggcgaaat gagcgctcac 11460 cattacttcc gcgatttcgc ttactgtgac agcggcatga tcccgtggct gctggtcgcc 11520 gaactggtgt gcctgaaagg aaaaacgctg ggcgaactgg tgcgcgaccg gatggcggcg 11580 tttccggcaa gcggtgagat caacagaaaa ctggcgcacc ctgttgaggc gattaaccgc 11640 gtggaacagc attttagccg tgaggtgctg gcggtggatc gcaccgatgg catcagcatg 11700 acctttgccg actggcgctt taacctgcgc tcttccaaca ccgaaccggt ggtgcgcctg 11760 aatgtggaat ctcgcggtga tgttcaggtt atggtaatcc atactcaaga aatattatca 11820 attttgacgt cataaagaat aagccctgac aagttagggc ttaattaata tatatttttt 11880 ttgaattggg gatttgtggt aagattttta atatgttatt taatgtggtt gaattaatgt 11940 tgactggaaa ataataatga gaacgaaaaa agcattacac aactttaaag ttgatttatt 12000 aattactttt ttattggttt tgctagggtt ttatattcga actgtttttg tttcaaaaat 12060 gggaagtgat attactggag tgatgttact attcacacag ttgacagcat atctcaattt 12120 ggcagaatta ggtattggaa ttgcagctgc cagcgtatta tataaaccgc tcagcgagaa 12180 tgaatacaat aaaataactt acataatatc tttgctctca gtcatataca aatatatatt 12240 tgtgtttgtt ttgattcttg gcgttgttat aggtatctgt atttattact ttattgattc 12300 tgtaaaggtt gtaaatggcg tttttttata ttgggctttg ttcgttttta atacatcgtt 12360 gacatatagt tatgctaaat actccacatt attaactgct aatcagcggt actcagcagt 12420 aagaaaaatt caaggtggcg gaaaagttat aataattgta tttcagatat taattttgtg 12480 ctttacgcaa agtttcatac tttatttgtt agttgagact ttaggtattt tttctcaata 12540 tttgattttt aaaaaaataa ttgggaacgg aaatcaatat ctcagtaatg aggttttact 12600 tattgaaagc gataaacttt tgataaaaaa agaattaaaa ataagaataa aaaatatgtt 12660 cttccataaa ataggtgctg tgcttgtcct taatacagac tacctgcttg tatcaaagtt 12720 tctgacatta agttatgtga caatttttgg cagctatatg atggtatttc agatagtaac 12780 tgttttgatg tcaagttttg ttaatgctat tactgcagga atgggtaatt acttaattaa 12840 taaaagtaat ttagaaatta aggaaattac acgtcaattt tatgtgatat ttatcgcctt 12900 tgcaacattc atatcactaa atatgttttt tcttgttaat gattttatcg caaaatggat 12960 aggtgttaat tatacattaa gtaacaccct agttgcatta atgattgtta acgtattcat 13020 tagtgttgtc agggtacctt ctgatatatt aaaaaacgca agtggacatt ttggtgatat 13080 ttattatcca ttattagaag gtgtgctgaa tattacgata tccatcattt tggctatcat 13140 tattggatta cctggcatta ttatagggac aatagtatct aacttaatag taataatgct 13200 tgcgaaacca ttatatcttt actctaagtt atttaatctt agaaatccga cgagggttta 13260 ttttgaattt atttctcggc ctatgttata ttcattatgt gtgattgggg tgagctattt 13320 attgcgcgat gaaatatatt catttaaagt aagtacatgg ttggatttta ttaacaagct 13380 actcttagtc tctactccta gcatattggt aatatgtgct attttctcta cggatagtga 13440 ctttagatta tttttcagaa aaattatata tgtgattatg aagaaataaa aatttcgaaa 13500 atgtattaat cgaaattatg caacgagctt tatttttata aatgatatgt gatcttttcg 13560 cgaataggag taaggatccg tgtaggctgg agctgcttcg aagttcctat actttctaga 13620 gaataggaac ttcggaatag gaactaagga ggatattcat atggataaag ccgtaagcat 13680 ataagcatgg ataagctatt tatactttaa taagtacttt gtatacttat ttgcgaacat 13740 tccaggccgc gagcattcag cgcggtgatc acacctgaca ggagtatgta atgtccaagc 13800 aacagatcgg cgtagtcggt atggcagtga tgggacgcaa ccttgcgctc aacatcgaaa 13860 gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa gaagtgattg 13920 ccgaaaatcc aggcaagaaa ctggttcctt actatacggt gaaagagttt gtcgaatctc 13980 tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg gatgctgcta 14040 ttgattccct caaaccatat ctcgataaag gagacatcat cattgatggt ggtaacacct 14100 tcttccagga cactattcgt cgtaatcgtg agctttcagc agagggcttt aacttcatcg 14160 gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg tccttctatt atgcctggtg 14220 gccagaaaga agcctatgaa ttggtagcac cgatcctgac caaaatcgcc gccgtagctg 14280 aagacggtga accatgcgtt acctatattg gtgccgatgg cgcaggtcac tatgtgaaga 14340 tggttcacaa cggtattgaa tacggcgata tgcagctgat tgctgaagcc tattctctgc 14400 ttaaaggtgg cctgaacctc accaacgaag aactggcgca gacctttacc gagtggaata 14460 acggtgaact gagcagttac ctgatcgaca tcaccaaaga tatcttcacc aaaaaagatg 14520 aagacggtaa ctacctggtt gatgtgatcc tggatgaagc ggctaacaaa ggtaccggta 14580 aatggaccag ccagagcgcg ctggatctcg gcgaaccgct gtcgctgatt accgagtctg 14640 tgtttgcacg ttatatctct tctctgaaag atcagcgtgt tgccgcatct aaagttctct 14700 ctggtccgca agcacagcca gcaggcgaca aggctgagtt catcgaaaaa gttcgtcgtg 14760 cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg cgtgctgcgt 14820 ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc cgtgctggct 14880 gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa aatccacaga 14940 tcgctaacct gttgctggct ccgtacttca agcaaattgc cgatgactac cagcaggcgc 15000 tgcgtgatgt cgttgcttat gcagtacaga acggtattcc ggttccgacc ttctccgcag 15060 cggttgccta ttacgacagc taccgtgctg ctgttctgcc tgcgaacctg atccaggcac 15120 agcgtgacta ttttggtgcg catacttata agcgtattga taaagaaggt gtgttccata 15180 ccgaatggct ggattaa 15197 <210> 20 <211> 535 <212> PRT <213> Artificial Sequence <220> <223> Example CRM197 sequence <400> 20 Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn 1 5 10 15 Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln 20 25 30 Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp 35 40 45 Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly 50 55 60 Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val 65 70 75 80 Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val 85 90 95 Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu 100 105 110 Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly 115 120 125 Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser 130 135 140 Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser 145 150 155 160 Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp 165 170 175 Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Val Arg 180 185 190 Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp Trp Asp Val 195 200 205 Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu Lys Glu His Gly 210 215 220 Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys Thr Val Ser Glu 225 230 235 240 Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln Thr Ala Leu Glu 245 250 255 His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly Thr Asn Pro Val 260 265 270 Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn Val Ala Gln Val 275 280 285 Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr Thr Ala Ala Leu 290 295 300 Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile Ala Asp Gly Ala 305 310 315 320 Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser 325 330 335 Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp 340 345 350 Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe 355 360 365 Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His 370 375 380 Lys Thr Gln Pro Phe Leu His Asp Gly Tyr Ala Val Ser Trp Asn Thr 385 390 395 400 Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln Gly Glu Ser Gly His 405 410 415 Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu Pro Ile Ala Gly Val 420 425 430 Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val Asn Lys Ser Lys Thr 435 440 445 His Ile Ser Val Asn Gly Arg Lys Ile Arg Met Arg Cys Arg Ala Ile 450 455 460 Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser Pro Val Tyr Val Gly 465 470 475 480 Asn Gly Val His Ala Asn Leu His Val Ala Phe His Arg Ser Ser Ser 485 490 495 Glu Lys Ile His Ser Asn Glu Ile Ser Ser Asp Ser Ile Gly Val Leu 500 505 510 Gly Tyr Gln Lys Thr Val Asp His Thr Lys Val Asn Ser Lys Leu Ser 515 520 525 Leu Phe Phe Glu Ile Lys Ser 530 535

Claims

대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물로서, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 농도는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각의 농도에 비해 독립적으로 증가되는 것인, 조성물.
제1항에 있어서, O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 O75 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 2.5:1인, 조성물.
제1항 또는 제2항에 있어서, O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 O75 항원 다당류 농도의 중량비는 약 2:1인, 조성물.
대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류를 포함하는 조성물로서, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 항원 다당류 대 O1, O2 및/또는 O6 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1인, 조성물.
제4항에 있어서, O75 항원 다당류 대 O4, O15, O16 및/또는 O18 항원 다당류 농도의 중량비는 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1인, 조성물.
제1항 내지 제5항 중 어느 한 항에 있어서, 조성물 중 O75 항원 다당류 대 O25 항원 다당류 농도의 중량비는 약 1:1인, 조성물.
제1항 내지 제6항 중 어느 한 항에 있어서, 대장균 항원 다당류 O1:O2:O4:O6:O15:O16:O18:O25:O75의 농도의 중량비는 1:1:1:1:1:1:1:2:2인, 조성물.
제1항 내지 제7항 중 어느 한 항에 있어서, O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고,
(i) 대장균 O1 항원 다당류는 화학식 (O1A)의 구조를 포함하고
[화학식 (O1A)]

,
(ii) 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함하고
[화학식 (O2)]

,
(iii) 대장균 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함하고
[화학식 (O4-Glc+)]

,
(iv) 대장균 O6 항원 다당류는 화학식 (O6A)의 구조를 포함하고
[화학식 (O6A)]

,
(v) 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함하고,
[화학식 (O15)]

,
(vi) 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함하고
[화학식 (O16)]

,
(vii) 대장균 O18 항원 다당류는 화학식 (O18A)의 구조를 포함하고
[화학식 (O18A)]

,
(viii) 대장균 O25 항원 다당류는 화학식 (O25B)의 구조를 포함하고
[화학식 (O25B)]

, 및
(ix) 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함하고
[화학식 (O75)]

,
여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수인, 조성물.
제1항 내지 제8항 중 어느 한 항에 있어서, O75 항원 다당류의 농도는 약 8 내지 약 64 μg/mL, 바람직하게는 약 8 내지 약 50 μg/mL, 바람직하게는 약 12 내지 약 40 μg/mL, 바람직하게는 약 16 내지 약 32 μg/mL, 바람직하게는 약 28 내지 약 36 μg/mL, 바람직하게는 약 32 μg/mL인, 조성물.
제1항 내지 제9항 중 어느 한 항에 있어서, 조성물에 존재하는 대장균 O 항원 다당류는 O1, O2, O4, O15, O16, O18, O25, O75 및 O6으로 구성되는 것인, 조성물.
제1항 내지 제9항 중 어느 한 항에 있어서, 담체 단백질에 공유 결합된 적어도 하나의 추가 대장균 항원 다당류를 추가로 포함하고, 바람직하게는 적어도 하나의 추가 대장균 항원 다당류는 화학식 (O8)을 갖는 O8 항원 다당류를 포함하고
[화학식 (O8)]

,
여기서 n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수인, 조성물.
제1항 내지 제11항 중 어느 한 항에 있어서, 담체 단백질은 슈도모나스 애루기노사의 탈독소화된 외독소 A(EPA) 또는 CRM₁₉₇, 바람직하게는 EPA이고, 바람직하게는 담체 단백질은 서열번호 1의 아미노산 서열을 갖는 1 내지 20개, 예컨대 1 내지 10개 또는 2 내지 4개의 글리코실화 공통 서열, 예컨대 서열번호 2의 아미노산 서열을 갖는 공통 서열을 포함하고, 더욱 바람직하게는 담체 단백질은 4개의 글리코실화 공통 서열을 포함하고, 가장 바람직하게는 각각의 담체 단백질은 서열번호 3의 아미노산 서열을 포함하는 EPA인, 조성물.
제1항 내지 제11항 중 어느 한 항에 있어서, 대장균 항원 다당류는 생체접합 또는 화학적 접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 대장균 항원 다당류는 생체접합에 의해 담체 단백질에 공유 결합되며, 바람직하게는 다당류는 담체 단백질의 글리코실화 부위의 Asn 잔기에 공유 결합되는 것인, 조성물.
대상체에게 제1항 내지 제13항 중 어느 한 항의 조성물을 투여하는 단계를 포함하는, 대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법.
대상체에서 대장균, 바람직하게는 장외 병원성 대장균(ExPEC)에 대한 면역 반응을 유도하는 방법으로서, 대상체에게 대장균 O1, O2, O4, O15, O16, O18, O25, O75 및 O6 항원 다당류 각각의 유효량을 투여하는 단계를 포함하고, 각각의 항원 다당류는 독립적으로 담체 단백질에 공유 결합되고, O75 및 O25 항원 다당류 각각의 유효량은 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 비해 독립적으로 증가되는 것인, 방법.
제15항에 있어서,
a) 유효량의 O75 항원 다당류는 O1, O2, O4, O15, O16, O18 및 O6 항원 다당류 각각에 대해 독립적으로 약 1.5:1 내지 약 2.5:1, 바람직하게는 약 2:1의 중량비로 투여되거나; 또는
b) 유효량의 O75 항원 다당류는 O1, O2 및/또는 O6 항원 다당류에 대해 독립적으로 약 1.5:1 내지 약 4:1, 바람직하게는 약 2:1의 중량비로 투여되고, 추가로 유효량의 O75 항원 다당류는 O25 항원 다당류에 대해 1:1의 중량비로 투여되는 것인, 방법.
제14항 내지 제16항 중 어느 한 항에 있어서, 면역 반응은 대상체에서 침습성 ExPEC 질환의 중증도를 제한하거나 이를 예방하며, 바람직하게는 침습성 ExPEC 질환은 패혈증 및/또는 균혈증을 포함하는 것인, 방법.
제15항 내지 제17항 중 어느 한 항에 있어서, O1 항원은 O1A이고, O4는 글루코실화되고, O6 항원은 O6A이고, O18 항원은 O18A이고, O25 항원은 O25B이고,
바람직하게는 O1A, O2, 글루코실화된 O4, O6A, O15, O16, O18A, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 포함하며, 여기서 각 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 바람직하게는 5 내지 30, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이고,
O75 항원 다당류 대 O6 항원 다당류의 중량비는 약 1.5:1 내지 약 4:1, 더욱 바람직하게는 약 2:1인, 방법.
제15항 내지 제18항 중 어느 한 항에 있어서, 대상체에게 투여되는 대장균 O 항원 다당류는
a) O1, O2, O4, O15, O16, O18, O25, O75 및 O6으로 구성되거나; 또는
b) 각각 독립적으로 담체 단백질에 공유 결합된 1 내지 15개의 추가 대장균 O 항원 다당류를 추가로 포함하는 것인, 방법.
제14항 내지 제19항 중 어느 한 항에 있어서, 대상체는 대장균(바람직하게는 ExPEC) 감염, 바람직하게는 침습성 ExPEC 질환이 있거나 이러한 질환의 위험이 있는 인간인, 방법.
제14항 내지 제20항 중 어느 한 항에 있어서, 약 8~16 μg, 바람직하게는 약 16 μg의 O75 항원 다당류가 투여당 투여되는 것인, 방법.
제14항 내지 제21항 중 어느 한 항에 있어서, 유효량의 O1:O2:O4:O6:O15:O16:O18:O25:O75의 투여되는 대장균 항원 다당류는 1:1:1:1:1:1:1:2:2의 중량비로 투여되는 것인, 방법.