KR102574882B1

KR102574882B1 - 대장균 o-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법

Info

Publication number: KR102574882B1
Application number: KR1020217033419A
Authority: KR
Inventors: 제로엔 고우르트센; 피터 얀 부르고우트; 에블린 마를렌 베르덴부르크; 얀 도우니스 폴만; 켈렌 크리스티나 패; 패트리샤 이바라 욘; 다렌 로버트 아바나트; 슈테판 요헨 케믈러; 미하엘 토마스 코와릭; 매뉴엘라 말리; 베로니카 감빌라라 폰크; 마틴 에드워드 브라운; 마리아 파울라 카란자 산드마이어
Original assignee: 얀센 파마슈티칼즈, 인코포레이티드; 글락소스미스클라인 바이오로지칼즈 에스.에이.
Priority date: 2019-03-18
Filing date: 2020-03-18
Publication date: 2023-09-04
Also published as: EP3942028A1; US20230190926A1; MA55365B1; US20200353073A1; ES2951442T3; EP3942028B9; EP3942028C0; US11491220B2; CN113950524A; PL3942028T3; TWI771663B; WO2020191088A1; AU2020240075A8; HUE063875T2; EP3942028B1; IL286467A; EA202192392A1; EP4253554A2; MX2021011418A; WO2020191088A9

Abstract

재조합 숙주 세포를 사용하여 담체 단백질에 공유 결합된 O-항원 다당류의 바이오컨쥬게이트를 생성하는 방법이 제공된다. 본원에 기술된 방법에 사용되는 재조합 숙주 세포는 생성하고자 하는 O-항원 다당류 바이오컨쥬게이트에 따라 특정 올리고사카릴 트랜스퍼라제 효소를 인코딩한다. 올리고사카릴 트랜스퍼라제 효소는 PglB 올리고사카릴 트랜스퍼라제 또는 이의 변이체일 수 있다. 또한, 바이오컨쥬게이트를 함유하는 조성물, 및 장외 병원성 대장균(ExPEC)에 대하여 대상체를 백신화시키기 위해 본원에 기술된 조성물을 사용하는 방법이 제공된다.

Description

대장균 O-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법

관련 출원에 대한 교차 참조

본 출원은 2019년 3월 18일에 출원된 미국 가출원 번호 62/819,762에 대한 우선권을 주장하며, 그 개시 내용은 전체가 참조로 본원에 포함된다.

전자적으로 제출된 서열 목록 참조

본 출원은 생성 날짜가 2020년 3월 11일이며, 199 KB의 크기를 갖는 파일명 "004852_11612 Sequence_Listing"을 갖는 ASCII 형식의 서열 목록으로서 EFS-Web를 통해 전자적으로 제출된 서열 목록을 갖는다. EFS-Web을 통해 제출된 서열 목록은 사양의 일부이며, 전체가 참조로서 본원에 통합된다.

발명의 배경

장외 병원성 대장균(ExPEC) 균주는 일반적으로 공생 대장균 균주와 함께 인간의 위장관에 무해한 점유균이다. O-항원, 캡슐 및 편모 항원 혈청형(O:K:H로 약칭됨, 예를 들어 O25:K1:H4)에 의해 정의된 바와 같이 ExPEC가 많은 클론 계통에서 우세하지만, ExPEC 분리주는 혈청형으로 공생 분리주와 쉽게 구별할 수 없다. 공생 대장균과 달리, ExPEC 균주는 광범위한 독성 인자를 발현하여, 이들이 위장관을 점령하게 할 뿐만 아니라, 광범위한 장외 감염을 유발하며, 이는 입원 및 사망으로 인한 상당한 의료 비용 부담과 관련이 있다. 신생아, 노인 및 면역 저하 환자는 침습성 ExPEC 질병(IED)을 포함하는 ExPEC 감염에 특히 취약하다.

ExPEC 균주는 요로 감염(UTI)의 가장 흔한 원인이며, 수술 부위 감염 및 신생아 수막염의 중요한 원인이다. 균주는 또한 복부 및 골반 감염 및 병원내 폐렴과 관련이 있으며, 골수염, 연조직염 및 상처 감염과 같은 다른 장외 감염과 종종 관련된다. 이러한 모든 주요 감염 부위는 ExPEC 균혈증을 유발할 수 있다. ExPEC는 지역사회 발병 균혈증의 가장 흔한 원인이자 병원 균혈증의 주요 원인 병원체이며, 임상적으로 유의한 혈액 분리물의 약 17% 내지 37%에서 발견된다. ExPEC-양성 혈액 배양물을 갖는 환자는 일반적으로 패혈증 증후군, 중증 패혈증 또는 패혈성 쇼크를 겪는다. 세팔로스포린, 플루오로퀴놀론 및 트리메토프림/설파메톡사졸을 포함한 1차 항생제에 대한 ExPEC의 내성 증가가 관찰되었다. ExPEC 서열 유형 131(ST131)의 출현 및 급속한 글로벌 전파는 다중 약물 내성을 포함하는 약물 내성 증가의 주요 동인으로 간주된다. 이 클론은 모든 ExPEC 임상 분리주의 12.5% 내지 30%에서 발견되며, 대부분 혈청형 O25b:H4를 나타내며, 플루오로퀴놀론에 대한 높은 수준의 내성을 보여주며, 이는 종종 트리메토프림/설파메톡사졸 내성, 및 세팔로스포린에 대한 내성을 부여하는 광범위 베타-락타마제를 동반한다.

O-항원은 대장균을 포함하는 그람-음성 박테리아에서 세포벽 지질다당류(LPS)의 면역우세 구성요소를 포함한다. 현재 180개가 넘는 혈청학적으로 고유한 대장균 O-항원이 확인되었으며, 대부분의 ExPEC 분리주는 20개 미만의 O-항원 혈청형 내에 분류되었다. 전장 대장균 O-항원은 전형적으로 고도로 보존된 LPS 코어 구조에 부착된 약 10 내지 25개의 반복 당 단위를 포함하며, 각각의 구성요소는 각각 rfb 및 rfa 유전자 클러스터에서 주로 인코딩되는 효소에 의해 별도로 합성되었다. O-항원의 중합 후, O-항원 다당류 백본은 전형적으로 아세틸 또는 글루코스 잔기의 첨가를 통해 변형될 수 있다. 이러한 변형은 공통 다당류 백본을 공유하지만 측 분지가 상이한 항원적으로 구별되는 혈청형을 생성함으로써 혈청형 다양성을 효과적으로 증가시킨다. O-항원 변형 효소를 인코딩하는 유전자는 전형적으로 염색체의 rfb 클러스터 외부에 있으며, 어떤 경우에는 이러한 유전자는 용원성 박테리오파지 내에서 발견된다.

O4 혈청군에 속하는 ExPEC 분리주는 미국 및 EU 혈액 분리주의 현대 감시 연구에서 일반적으로 확인되었다. O4 다당류의 구조는 대장균 O4:K52 균주로부터 -->2) α-L-Rha (1->6) α-D-Glc (1->3) α-L-FucNAc (1->3) β-D-GlcNAc (1->로서 결정되었다(Jann et al., Carbohydr. Res. (1993) v. 248, pp.241-250). 구별되는 형태의 O4 다당류 구조는 O4:K3, O4:K6 및 O4:K12 균주에 대해 결정되었으며, 여기서 위의 구조는 다당류의 람노스 잔기에 연결된 α-D-Glc(1->3)의 첨가에 의해 변형되며(Jann et al., 1993, 상기 참조), 이러한 형태의 다당류는 이하에서 '글루코실화된 O4'로 지칭된다. 대장균 O4 균주 내의 O-항원 변형을 담당하는 효소는 확인되지 않았다.

ExPEC 감염을 예방하기 위한 백신 개발을 위한 노력은 O-항원 다당류 컨쥬게이트에 집중되었다. 12가 O-항원 컨쥬게이트 백신은 O-항원 다당류의 추출과 정제 및 탈독소화된 슈도모나스 애루기노사(Pseudomonas aeruginosa) 외독소 A에 대한 화학적 컨쥬게이션을 통해 합성되고, 1상 임상 연구에서 안전성 및 면역원성에 대해 테스트되었다(Cross et al., J. Infect Dis.(1994) v.170, pp.834-40). 이 후보 백신은 임상 용도로 허가된 적이 없다. 대장균의 바이오컨쥬게이션 시스템은 최근에 개발되었는데, 다당류 항원과 담체 단백질이 모두 생체 내에서 합성된 후 대장균에서 발현되는 캄필로박터 제주니(Campylobacter jejuni) 효소인 올리고사카릴 전이효소 PglB의 활성을 통해 생체 내에서 컨쥬게이션된다 (Wacker et al., Proc. Nat. Acad. Sci. (2006) v. 103, pp. 7088-93). 이 N-결합된 단백질 글리코실화 시스템은 담체 단백질에 다양한 다당류를 전달할 수 있어, 컨쥬게이트를 정제하는 간단한 방법을 허용한다.

바이오컨쥬게이션은 대장균 4가 O-항원 후보 백신을 위한 컨쥬게이트 다당류를 생산하는데 성공적으로 사용되었다(Poolman and Wacker, J. Infect. Dis. (2016) v.213(1), pp. 6-13). 그러나, 성공적인 ExPEC 백신의 개발은 우세한 혈청형의 보급을 필요로 하며, ExPEC 분리주의 서브세트에서 추가 O-항원 변형의 존재는 비변형 및 변형 LPS를 나타내는 분리주를 커버하는 데 있어서 추가 과제를 제시한다. 더욱이, 다중 혈청형을 커버하는 보다 복잡한 백신 조성물을 위한 다중 구성요소의 생산 효율이 점점 더 중요해지고 있으며, 따라서 특정 O-항원의 개별 바이오컨쥬게이트 생산의 개선이 여전히 필요하다.

발명의 개요

ExPEC 분리주 중 항생제 내성 증가 및 우세한 O-혈청형 중 추가 O-항원 변형의 존재의 관점에서, 이러한 감염에 대한 개선된 예방학적 및 치료학적 치료가 필요하다. 본 발명은 O-항원 변형 효소를 인코딩하는 유전자를 확인하여, 선택된 O-항원 변형을 포함하는 바이오컨쥬게이트를 비롯한 O-항원의 바이오컨쥬게이트를 합성할 수 있는 재조합 숙주 세포의 조작을 허용하는 것을 포함하는, 현대 임상 분리주의 유전자 조성물을 규정함으로써 이러한 요구를 충족시킨다. 또한, 본 발명의 한 양태에서, 올리고사카릴트랜스퍼라제(OST)의 변이체를 사용함으로써 특정 O-항원의 바이오컨쥬게이트의 개선된 생산을 위한 숙주 세포 및 방법이 예측할 수 없는 혈청형 의존적 방식으로 특정 대장균 O-항원의 바이오컨쥬게이트의 특정 OST 변이체의 사용 이점에 근거하여 제공된다. 이러한 OST 변이체의 사용은 또한 특정 경우에, 예를 들어 OST의 야생형 또는 다른 변이체를 사용하여 생성된 바이오컨쥬게이트와 비교하여 담체 단백질에 결합된 글리칸의 상대적 수를 증가시킴으로써 바이오컨쥬게이트의 글리코실화 패턴에 영향을 미칠 수 있으며, 따라서 이러한 방법에 의해 생성된 신규한 바이오컨쥬게이트는 또한 본 발명의 한 양태로서 제공된다.

일 양태에서, 담체 단백질에 공유 결합된 대장균 O_x 항원 다당류의 바이오컨쥬게이트를 제조하는 방법이 제공되며, 상기 방법은

(i) a. O_x-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;

b. SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및

c. 올리고사카릴 트랜스퍼라제 PglB_y를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하는 단계; 및

(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 숙주 세포를 배양하는 단계를 포함하며,

여기에서,

O_x-항원이 O1A 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;

O_x-항원이 글루코실화된 O4 항원 다당류인 경우, PglB_y는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;

O_x-항원이 O6A 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;

O_x-항원이 O8 항원 다당류인 경우, PglB_y는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;

O_x-항원이 O15 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;

O_x-항원이 O16 항원 다당류인 경우, PglB_y는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며;

O_x-항원이 O18A 항원 다당류인 경우, PglB_y는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;

O_x-항원이 O75 항원 다당류인 경우, PglB_y는 N311V의 아미노산 돌연변이를 포함하며,

여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,

여기에서 O1A, 글루코실화된 O4, O6A, O8, O15, O16, O18A 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O4-Glc+), (O6A), (O8), (O15), (O16), (O18A) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

한 구체예에서, O_x-항원은 O1A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

한 구체예에서, O_x-항원은 글루코실화된 O4 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함한다. 한 구체예에서, O_x-항원은 글루코실화된 O4 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 Y77H 및 N311V를 포함한다. O_x-항원이 글루코실화된 O4 항원 다당류인 구체예에서, 재조합 숙주 세포는 바람직하게는, SEQ ID NO: 4에 대해 적어도 80% 동일성을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.

한 구체예에서, O_x-항원은 O6A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

한 구체예에서, O_x-항원은 O8 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.

한 구체예에서, O_x-항원은 O15 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

한 구체예에서, O_x-항원은 O16 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함한다.

한 구체예에서, O_x-항원은 O18A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며, 바람직하게는 SEQ ID NO: 6의 아미노산 서열을 포함한다.

한 구체예에서, O_x-항원은 O75 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V의 아미노산 돌연변이를 포함한다.

특정 양태에서, 담체 단백질에 공유 결합된 대장균 O_x-항원 다당류의 바이오컨쥬게이트를 제조하는 방법이 제공되며, 상기 방법은

여기에서 PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하고,

여기에서, O_x-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이고, O_x-항원이 글루코실화된 O4 항원 다당류인 경우, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;

여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 표 1에 제시된 바와 같은 각각 화학식 (O1A), (O4-Glc+), (O6A), (O15), (O16) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

특정 구체예에서, 방법은 재조합 숙주 세포로부터 바이오컨쥬게이트를 분리하는 것을 추가로 포함한다.

특정 구체예에서, 담체 단백질은 탈독소화된 P. 애루기노사(P. aeruginosa)의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스(S. aureus)의 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D로 구성된 군으로부터 선택된다.

특정 구체예에서, 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)이다. 바람직하게는, EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다. 특정 구체예에서, 각각의 글리코실화 부위는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, EPA 담체 단백질은 SEQ ID NO: 3을 포함한다.

특정 구체예에서, 재조합 숙주 세포는 대장균 세포, 예를 들어 대장균 K-12 균주, 예컨대 균주 W3110이다.

또 다른 양태에서, 본원에 기재된 담체 단백질에 공유 결합된 O_x 항원 다당류의 바이오컨쥬게이트를 제조하는 방법에 의해 생성된 바이오컨쥬게이트가 제공된다.

또 다른 양태에서, 이러한 바이오컨쥬게이트를 포함하는 조성물이 제공된다. 일부 구체예에서, 조성물은 적어도 2개, 바람직하게는 적어도 3개, 더욱 바람직하게는 적어도 5개, 더욱 더 바람직하게는 적어도 7개의 이러한 바이오컨쥬게이트를 포함한다.

특정 구체예에서, 본 발명에 따른 조성물은 담체 단백질에 공유 결힙된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기서 글루코실화된 O4 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O4-Glc+)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다. 특정 구체예에서, 본 발명에 따른 조성물은 적어도 담체 단백질에 공유 결힙된 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 추가로 포함하며, 여기서 O25B 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O25B)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다. 특정 구체예에서, 본 발명에 따른 조성물은 적어도 담체 단백질에 공유 결힙된 대장균 O2 항원 다당류의 바이오컨쥬게이트를 추가로 포함하며, 여기에서 O2 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O2)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다.

특정 구체예에서, 본 발명의 조성물은 (i) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 바이오컨쥬게이트, (ii) 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 바이오컨쥬게이트, (iii) 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, (iv) 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 바이오컨쥬게이트, (v) 담체 단백질에 공유 결합된 대장균 O8 항원 다당류의 바이오컨쥬게이트, (vi) 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 바이오컨쥬게이트, (vii) 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 바이오컨쥬게이트, (viii) 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트 및 (ix) 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기서 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O8), (O15), (O16), (O25B) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 특정 구체예에서, 이러한 조성물은 (x) 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 바이오컨쥬게이트를 추가로 포함하며, 여기에서 O18A 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O18A)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다. 특정 구체예에서, 본 발명의 조성물은 면역원성 조성물이다.

다른 양태에서, 본원에 기재된 바와 같은 바이오컨쥬게이트 또는 조성물을 대상체에게 투여하는 것을 포함하는, 장외 병원성 대장균(ExPEC)에 대해 대상체를 백신화하는 방법이 제공된다. 또 다른 양태에서, 장외 병원성 대장균(ExPEC)에 대한 백신화에 사용하기 위한 본원에 기재된 바와 같은 그러한 바이오컨쥬게이트 또는 조성물이 제공된다.

다른 양태에서, 담체 단백질에 공유 결합된 대장균 O_x 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 재조합 숙주 세포가 제공되며, 상기 재조합 숙주 세포는

(a) O_x-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;

(b) SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및

(c) 올리고사카릴 트랜스퍼라제 PglB_y를 인코딩하는 뉴클레오티드 서열을 포함하며,

여기에서,

O_x-항원이 O1A 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;

O_x-항원이 O75 항원 다당류인 경우, PglB_y는 N311V의 아미노산 돌연변이를 포함하고,

특정 구체예에서, O_x-항원은 O1A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하는 이러한 숙주 세포가 제공된다.

특정 구체예에서, O_x-항원은 글루코실화된 O4 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하는 본 발명의 재조합 숙주 세포가 제공된다. 특정 구체예에서, O_x-항원은 글루코실화된 O4 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 Y77H 및 N311V를 포함하는 본 발명의 재조합 숙주 세포가 제공된다. O_x-항원이 글루코실화된 O4 항원 다당류인 특정 구체예에서, 재조합 숙주 세포는 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.

특정 구체예에서, O_x-항원은 O6A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하는 본 발명의 재조합 숙주 세포가 제공된다.

특정 구체예에서, O_x-항원은 O8 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는 본 발명의 재조합 숙주 세포가 제공된다.

특정 구체예에서, O_x-항원은 O15 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하는 본 발명의 재조합 숙주 세포가 제공된다.

특정 구체예에서, O_x-항원은 O16 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하는 본 발명의 재조합 숙주 세포가 제공된다.

특정 구체예에서, O_x-항원은 O18A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는 본 발명의 재조합 숙주 세포가 제공된다.

특정 구체예에서, O_x-항원은 O75 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하는 본 발명의 재조합 숙주 세포가 제공된다.

특정 구체예에서, 담체 단백질이 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택되는 본 발명의 재조합 숙주 세포가 제공된다.

특정 구체예에서, 담체 단백질이 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)인 본 발명의 재조합 숙주 세포가 제공된다. 이의 특정 구체예에서, EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다. 특정 구체예에서, 각각의 글리코실화 부위는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, EPA 담체 단백질은 SEQ ID NO: 3을 포함한다.

특정 구체예에서, 재조합 숙주 세포가 대장균 세포, 예를 들어 대장균 K-12 균주, 예를 들어 균주 W3110인 본 발명의 재조합 숙주 세포가 제공된다.

본 발명에 따른 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 숙주 세포 및 방법에 대한 특정 구체예에서, 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터는 대장균 O4 항원 다당류(표 1의 화학식 (O4-Glc-))를 생성하는 효소를 인코딩하며, SEQ ID NO: 9와 적어도 80%, 예를 들어, 적어도 90%, 예를 들어, 적어도 95%, 예를 들어, 적어도 98% 동일한 서열을 포함한다. 특정 구체예에서, rfb 유전자 클러스터는 SEQ ID NO: 9를 포함한다.

본 발명에 따른 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 숙주 세포 및 방법에 대한 특정 구체예에서, 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성시킬 수 있는 글루코실 트랜스퍼라제는 SEQ ID NO: 4에 대한 적어도 90%, 바람직하게는, 적어도 95%, 바람직하게는, 적어도 98% 서열 동일성을 갖는 아미노산을 갖는다. 특정 구체예에서, 글루코실 트랜스퍼라제는 SEQ ID NO: 4를 포함한다.

본 발명에 따른 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 숙주 세포 및 방법에 대한 특정 구체예에서, 트랜스로카제는 박토프레놀-연결된 글루코스를 전위시킬 수 있으며, SEQ ID NO: 7에 대해 적어도 90%, 바람직하게는 적어도 95%, 바람직하게는 적어도 98%의 서열 동일성을 갖는다. 특정 구체예에서, 트랜스로카제는 SEQ ID NO: 7을 포함한다.

본 발명에 따른 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 숙주 세포 및 방법에 대한 특정 구체예에서, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며, SEQ ID NO: 8에 대해 적어도 90%, 바람직하게는 적어도 95%, 바람직하게는 적어도 98%의 서열 동일성을 갖는다. 특정 구체예에서, 글리코실트랜스퍼라제는 SEQ ID NO: 8을 포함한다.

본 발명의 다음의 상세한 설명뿐만 아니라 전술한 요약은 첨부된 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명이 도면에 도시된 정확한 구체예로 제한되지 않음을 이해해야 한다.
도면에서:
도 1은 실시예 4에 기재된 바와 같이 Glc-변형된 O4 다당류 바이오컨쥬게이트로 면역화된 2마리의 토끼의 혈청에서 비변형된(GLC-) 또는 글루코스-변형된(GLC+) O4 LPS에 대한 ELISA IgG 역가를 보여주며; ELISA 역가는 4회 반복으로 결정되었다.
도 2는 실시예 4에 기술된 바와 같이 특성화된 gtrS 상태가 특성 규명된 대장균 O4 분리주에 대해 Glc-변형된 O4 바이오컨쥬게이트로 면역화된 토끼의 풀링된 혈청을 사용한 전체 세포 ELISA에서 IgG 역가를 보여준다; 다음 분리주는 gtrS-음성이었다: A2625, stGVXN4988, OC24784, OC24787 및 OC24788; 다음 분리주는 gtrS-양성이었다: Y1382, E551, OC24334, stGVXN4983, stGVXN4994 및 OC24794; 음성 대조군 균주 OC9487(ATCC 35383; 혈청형 O75)도 포함되었다.
도 3은 변형된 O4 다당류로 면역된 토끼의 풀링된 혈청으로 조사된 gtrS-양성 및 -음성 O4 분리주에서 추출한 LPS의 웨스턴 블롯을 보여준다.
도 4a 및 4b는 글루코실화된 O4(O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체 반응을 보여준다; 도 4a는 면역화 후 0, 14 및 42일째에 ELISA에 의해 측정된 혈청 항체 수준을 보여주고; 개별 역가(log10 EC50 역가) 및 GMT ± 95% CI를 보여주고; 회색 점선은 임계값을 나타내며, 이를 넘는 샘플의 희석 곡선은 4PL 피팅을 갖는다. 도 4b는 글루코실화된 O4(O4-Glc+)-EPA 바이오컨쥬게이트(4.0 μg)로 면역화 후 42일째에 수득된 혈청 샘플에서 항체의 기능성을 결정하기 위한 옵소닌식세포(OPK) 검정의 결과를 보여준다; Wilcoxon 순위 합 테스트 및 Bonferroni 보정; ^*P≤0.05, ^***P≤0.0001.
도 5는 실시예 4에 기술된 바와 같은 3개의 다른 용량으로 면역화된 Sprague Dawley 래트에서 글루코실화된 O4(O4 Glc+)-EPA 바이오컨쥬게이트의 부스트 효과를 보여준다; 혈청 항체 수준은 면역화 후 0, 14 및 42일째에 ELISA에 의해 측정되었다; 개별 역가(log10 EC50 역가)는 각 동물에 대해 제시된다; 데이터 포인트 사이의 선은 시간에 따라 각 동물에 대한 IgG 역가를 연결한다; 회색 점선은 임계값을 나타내며, 이를 넘는 샘플의 희석 곡선은 4PL 피팅을 갖는다; 다중 비교를 위한 Wilcoxon 부호 순위 테스트 및 Bonferroni 보정으로 통계 분석을 수행하였다 (14일 vs 0일, 4.0 μg/용량의 경우 P = 0.012; 42일 vs 0일, 모든 용량에 있어서 P = 0.006; 42일 vs 14일, 모든 용량에 있어서 P = 0.006);
도 6은 O4-Glc+-EPA 바이오컨쥬게이트에 의해 유도된 항체의 기능성을 보여준다; Sprague Dawley 래트를 4.00 μg/용량의 제형 완충액 또는 O4(Glc+)-EPA 바이오컨쥬게이트로 근육내 3회 면역화시켰다; 항체의 기능성은 O4(Glc+) 및 O4(Glc-) 대장균 균주를 사용하여 옵소닌식세포 치사 검정(OPKA)에 의해 결정되었다; 개별 옵소닉 역가(OI) 및 GMT ± 95% CI가 제시된다.
도 7은 주변세포질 분획에서 O4-Glc+ 바이오컨쥬게이트를 검출하기 위해 모노클로날 항체를 사용하는, 블롯-유사 이미지로 각 시험된 균주에 대한 O4-Glc+ 바이오컨쥬게이트 생성을 가시화하는 PglB 스크린의 모세관 전기영동 판독을 보여준다. 모노-글리코실화된 생성물 약 180 kDa, 디-글리코실화된 생성물 약 320 kDa 및 트리-글리코실화된 생성물 약 450 kDa. A) 1차 스크리닝 라운드. 레인 3의 Wt PglB, 레인 2 및 4의 N311V-PglB, 레인 1의 빈 대조군 균주 및 레인 5 및 6의 기타 PglB 변이체. B) 2차 스크리닝 라운드. 레인 3의 N311V PglB, 레인 9의 N311V+Y77H PglB, 레인 1 및 2의 빈 대조군 균주, 나머지 레인의 기타 PglB 변이체.
도 8은 뉴질랜드 백색 토끼에서 ExPEC10V 백신에 의해 유도된 항체 반응을 보여준다. 동물은 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회 근육내 면역화 처리되었다. ExPEC10V 백신은 3개의 상이한 농도(군 1: 고용량, 군 2: 중간 용량 및 군 3: 저용량, 표 11)로 투여되었고, 대조군에는 식염수만 제공되었다(군 4, 0.9% (w/v) 염화나트륨 용액). 항체 수준은 0일(백신화 전) 및 14, 27 및 42일째(백신화 후)에 ELISA에 의해 측정되었다. 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% CI이 제시된다. 다중 비교를 위한 Bonferroni 보정과 Wilcoxon 순위 합계 테스트. ExPEC10V 백신화된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4) 비교. *p ≤ 0.05, ^**p ≤ 0.01; ^***p ≤ 0.001; ^****p ≤ 0.0001. LOD: 검출 한계.
도 9는 ExPEC10V에 의해 유도된 항체 반응을 보여준다. 뉴질랜드 백색 토끼는 ExPEC10V(105.6 μg 총 다당류) 또는 0.9% w/v 염화나트륨 용액(대조군)으로 3회 근육내 면역화 처리되었다. IgG 역가는 1일(면역화 전, n = 20/군), 31일(면역화 후, n = 20/군) 및 50일(면역화 후, n = 10/군)에 ELISA에 의해 결정되었다. 플롯은 각 군에 대한 개별 역가와 기하 평균 ± 95% 신뢰 구간을 보여준다. ExPEC10V와 대조군 사이의 IgG 역가의 차이는 우도비 테스트를 이용한 Tobit 모델을 사용하여 분석되었다. P-값 ≤ 0.05는 유의한 것으로 간주되었다. ^*P ≤0.05, ^****P ≤ 0.0001.
도 10은 인간에서 ExPEC10V 백신을 사용한 1/2a 상 임상 시험에 대한 전체 연구 설계를 보여준다. 도 10a는 코호트 1에 대한 전체 연구 설계를 보여주며, 도 10b는 코호트 2에 대한 전체 연구 설계를 보여준다. 자세한 내용은 실시예 11을 참조한다.

발명의 상세한 설명

다양한 간행물, 기사 및 특허가 배경 및 명세서 전반에 걸쳐 인용되거나 설명된다; 이들 참고 문헌 각각은 그 전체가 참고로 본원에 포함된다. 본 명세서에 포함된 문서, 행위, 재료, 장치, 물품 등에 대한 논의는 본 발명의 내용을 제공하기 위한 것이다. 이러한 논의는 이러한 내용 중 일부 또는 전부가 개시된 또는 청구된 임의의 발명과 관련하여 종래 기술의 일부를 형성한다는 것을 인정하는 것이 아니다.

달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 당업자에게 일반적으로 이해되는 것과 동일한 의미를 갖는다. 그렇지 않으면, 본원에 사용된 특정 용어는 명세서에 제시된 의미를 갖는다.

본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥이 달리 명백하게 지시하지 않는 한 복수의 대상을 포함한다는 점에 유의해야한다.

달리 나타내지 않는 한, 일련의 요소 앞에 오는 용어 "적어도"는 일련의 모든 요소를 나타내는 것으로 이해되어야 한다.

당업자는 단지 관례적인 실험을 사용하여 본원에 설명된 본 발명의 특정 구체예에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 이러한 등가물은 본 발명에 포함되는 것으로 의도된다.

문맥상 달리 요구되지 않는 한, 본 명세서 및 이어지는 청구 범위 전반에서, 용어 "포함하다" 및 "포함한다" 및 "포함하는"과 같은 변형은 언급된 정수 또는 단계 또는 정수의 군의 포함하나, 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 군을 배제하지 않는 것으로 이해될 것이다. 본원에서 사용되는 경우, 용어 "포함하는(comprising)"은 용어 "함유하는" 또는 "포함하는"이라는 용어로 대체될 수 있거나, 때때로 본 명세서에서 사용될 때 "갖는"이라는 용어로 대체될 수 있다.

본원에 사용되는 경우, "구성되는"은 청구항 요소에 명시되지 않은 임의의 요소, 단계 또는 성분을 배제한다. 본원에 사용되는 경우, "필수적 요소로 하여 구성되는"은 청구범위의 기본적이고 신규한 특성에 실질적으로 영향을 미치지 않는 재료 또는 단계를 배제하지 않는다. 본 발명의 양태 또는 구체예의 맥락에서 본원에 사용될 때마다 "포함하는", "함유하는", "포함하는" 및 "갖는"의 전술된 임의의 용어는 용어 "로 구성된" 또는 "필수적 요소로 하여 구성되는"으로 대체되어 개시내용의 범위를 변경시킬 수 있다.

본원에 사용된 바와 같이, 다수의 인용된 요소들 사이의 접속어 "및/또는"은 개별 및 조합된 옵션 모두를 포괄하는 것으로 이해된다. 예를 들어, 두 요소가 "및/또는"으로 연결되는 경우, 첫 번째 옵션은 두 번째 요소 없이 첫 번째 요소의 적용 가능성을 나타낸다. 두 번째 옵션은 첫 번째 요소가 없는 두 번째 요소의 적용 가능성을 나타낸다. 세 번째 옵션은 첫 번째 요소와 두 번째 요소의 함께 적용할 수 있는 가능성을 나타낸다. 이들 옵션 중 어느 하나는 그 의미 내에 속하는 것으로 이해되며, 따라서 본 원에 사용되는 용어 "및/또는"의 요건을 충족시킨다. 하나 초과의 옵션의 동시 적용 가능성도 그 의미에 속하는 것으로 이해되므로, 용어 "및/또는"의 요건을 충족한다.

대장균 O4 혈청형(Jann et al., 1993) 내에서 O-항원 구조적 변형, 즉 글루코스 분지의 확인은 이 혈청형 내에서 박테이라 분리주를 표적으로 하는 글리코컨쥬게이트 백신의 발견 및 개발에 대한 도전을 제시한다. O4 O-항원의 변형되지 않은(글루코스 측-분지를 갖지 않음) 형태와 변형된(글루코스 측-분지를 가짐) 형태를 발현하는 임상적 현대 O4 분리주의 비율은 알려져 있지 않다. 이 특성에 대한 정보를 얻는 것은 관련 항원 구조를 선택하는 데 중요하다. 또한, 한 형태의 O4 다당류에 대해 유도된 항체를 유발하는 백신이 다른 형태와 교차 반응하는 정도는 결정되지 않았다. 지질 A가 없는 O-항원의 정제 및 담체 단백질에 대한 후속 화학적 컨쥬게이션은 길고 힘든 공정이다. 추가로, 정제, 지질 A 탈독소화 및 화학적 컨쥬게이션 공정은 에피토프의 손실, 항원 이질성 및 컨쥬게이션된 다당류의 감소된 면역원성을 발생시킬 수 있다. 바이오컨쥬게이션에 의한 글리코컨쥬게이트의 합성은 이러한 고전적 정제 및 화학적 컨쥬게이션의 한계를 극복할 수 있지만, 글루코스-분지된 O4 O-항원의 생체내 합성은 rfb 유전자 클러스터의 외부에 있는 다당류 분지 효소의 활성을 필요로 한다. 현재까지 O4 대장균 균주에서 글루코스-분지를 담당하는 O-항원 변형 효소는 확인되지 않았다. PglB를 발현하는 바이오컨쥬게이션 대장균 균주 내로의 O4 rfb 유전자 클러스터 클로닝은 글루코스-분지된 O4 글리코컨쥬게이트를 합성하는데 충분하지 않을 것이며, 그보다는 단지 비-글루코스-분지된 O4 바이오컨쥬게이트(이의 글리칸의 구조는 표 1의 화학식 (O4)에 제시됨)를 생성할 것이다. 본원에 사용된 바와 같은 용어 "글루코실화된 O4", "글루코스-분지된 O4", "O4 Glc+" 및 "Glc+ O4" O-항원은 글루코스 측-분지를 갖는 O4 O-항원을 나타내며, 이의 구조는 표 1의 화학식 (O4-Glc+)에 제시된다.

대장균 O4 항원 다당류의 글루코스 분지를 담당하는 O-항원 변형 효소를 인코딩하는 유전자가 본원에 개시된다. 또한, 생체내 담체 단백질에 공유 결합된 글루코실화된 O4 항원 다당류를 포함하는 바이오컨쥬게이트를 생성할 수 있는 효소를 인코딩하는 핵산을 포함하는 숙주 세포, 예를 들어 재조합으로 조작된 숙주 세포가 본원에 개시된다. 이러한 숙주 세포는 담체 단백질에 연결된 글루코실화된 O4 항원을 포함하는 바이오컨쥬게이트를 생성하는데 사용될 수 있으며, 이는 예를 들어, 치료학적 및/또는 예방학적 조성물(예를 들어, 백신)의 제형에 사용될 수 있다. 다른 대장균 항원(예를 들어, O1, O2, O6, O8, O15, O16, O18, O25, 및/또는 O75 항원 다당류 및 이의 하위혈청형)과 조합된 또는 단독의 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하는 조성물이 본원에 추가로 제공된다. 조성물은 예방학적 및/또는 치료학적 방법, 예를 들어 대장균으로의 감염에 대한 숙주의 백신화에 사용될 수 있으며, 항체의 발생에 유용하며, 이는 예를 들어, 치료학적 방법, 예컨대 대상체의 면역화에 사용될 수 있다.

본원에 사용된 바와 같이, 용어 "O-항원", "O-항원 다당류", "O-항원 당류" 및 "OPS"는 그램-음성 박테리아의 O-항원을 나타낸다. 전형적으로, O-항원은 면역원성 반복 다당류 단위의 폴리머이다. 특정 구체예에서, 용어 "O-항원", "O-항원 다당류" 및 "OPS"는 대장균의 O-항원을 나타낸다. 대장균의 다른 혈청형은 다른 O-항원을 발현한다. 대장균에서, O-항원 생물발생과 관련된 유전자 생성물은 rfb 유전자 클러스터에 의해 인코딩된다.

본원에 사용된 바와 같은, "rfb 클러스터" 및 "rfb 유전자 클러스터"는 O-항원 백본 구조를 합성할 수 있는 효소 기구를 인코딩하는 유전자 클러스터를 나타낸다. 용어 rfb 클러스터는 임의의 O-항원 생합성 클러스터에 적용할 수 있으며, 바람직하게는 에스체리치아 속, 특히 대장균으로부터의 유전자 클러스터를 나타낸다.

본원에 사용된 바와 같은 용어 "O1A"는 대장균의 O1A 항원(대장균 혈청형 O1의 하위혈청형)을 나타낸다. 용어 "O2"는 대장균의 O2 항원을 나타낸다(대장균 혈청형 O2). 용어 "O6A"는 대장균의 O6A 항원을 나타낸다(대장균 혈청형 O6의 하위혈청형). 용어 "O8"은 대장균의 O8 항원을 나타낸다(대장균 혈청형 O8). 용어 "O15"는 대장균의 O15 항원을 나타낸다(대장균 혈청형 O15). 용어 "O16"은 대장균의 O16 항원을 나타낸다(대장균 혈청형 O16). 용어 "O18A"는 대장균의 O18A 항원을 나타낸다(대장균 혈청형 O18의 하위혈청형). 용어 "O25B"는 대장균의 O25B 항원(대장균 혈청형 O25의 하위혈청형)을 나타낸다. 용어 "O75"는 대장균의 O75 항원을 나타낸다(대장균 혈청형 O75).

본 출원 전반에 걸쳐 언급된 대장균 O-항원 다당류의 구조는 하기 표 1에 제시되어 있다. 각 대장균 O-항원 다당류에 대한 단일 반복 단위가 제시된다.

표 1: 대장균 O-항원 다당류의 구조

¹ 각각의 n은 독립적으로 1 내지 100, 예컨대 1-50, 1-40, 1-30, 1-20, 및 1-10, 3-50, 3-40, 예컨대 적어도 5, 예컨대 5-40, 예를 들어 7-30, 예를 들어 7-25, 예를 들어 10-20의 정수이지만, 일부 경우에는 1 내지 2일 수 있다.

본원에 기재된 모든 단당류는 당업계에 공지된 이들의 공통의 의미를 갖는다. 단당류는 D 또는 L 배열을 가질 수 있다. D 또는 L이 지정되지 않은 경우, 당은 D 배열을 갖는 것으로 이해된다. 전형적으로 단당류는 당업계에 일반적으로 알려져 있고 사용되는 약어로 언급된다. 예를 들어, Glc는 글루코스를 나타내며; D-Glc는 D-글루코스를 나타내며; L-Glc는 L-글루코스를 나타낸다. 단당류에 대한 다른 일반적인 약어는 다음을 포함한다: Rha, 람노스; GlcNAc, N-아세틸글루코사민; GalNAc, N-아세틸갈락토사민; Fuc, 푸코스; Man, 만노스; Man3Me, 3-O-메틸-만노스; Gal, 갈락토스; FucNAc, N-아세틸푸코사민; 및 Rib, 리보스. 접미사 "f"는 푸라노스를 나타내고, 접미사 "p"는 피라노스를 나타낸다.

O-항원과 관련하여 사용된 용어 "RU", "반복 단위" 및 "반복하는 단위"는 생체내에서 세포 기구(예를 들어, 글리코실트랜스퍼라제)에 의해 합성되는 것으로서 O-항원의 생물학적 반복 단위(BRU)를 나타낸다. O-항원의 RU의 수는 혈청형에 따라 다를 수 있으며, 본 발명의 구체예에서, 일반적으로 약 1-100 RU, 바람직하게는 약 1 내지 50 RU, 예컨대 1-50 RU, 1-40 RU, 1-30 RU, 1-20 RU 및 1-10 RU, 및 더욱 바람직하게는 적어도 3 RU, 적어도 4 RU, 적어도 5 RU, 예컨대 3-50 RU, 바람직하게는 5-40 RU, 예를 들어 7-25 RU , 예를 들어 10-20 RU로 다양하다. 그러나, 어떤 경우에는 O-항원의 RU 수는 1-2일 수 있다. 본원에 구체적으로 기술된 각 O-항원의 구조는 RU의 수를 지정하는 변수 "n"을 갖는 하나의 RU를 함유하는 것으로 나타난다. 본 발명의 바이오컨쥬게이트의 각각의 O-항원 다당류에서, n은 독립적으로 1-100의 정수, 예컨대 1-50, 1-40, 1-30, 1-20, 1-10, 바람직하게는 적어도 3, 더욱 바람직하게는 적어도 5, 예컨대 3-50, 바람직하게는 5-40(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40)이며, 어떤 경우에는 1-2일 수 있다. 일부 구체예에서, n은 독립적으로 약 7-25, 예를 들어 약 10-20의 정수이다. 값은 조성물 중 개별 O-항원 다당류 마다 다를 수 있으며, 평균값으로서 제공되며, 즉, 바이오컨쥬게이트가 독립적으로 5-40의 정수인 n을 갖는 것으로 본원에 기재된 경우, 조성물은 5-40개 반복 단위를 갖는 O-항원 다당류를 대부분 함유하나, 또한 5개 미만의 반복 단위 또는 40개 초과의 반복 단위를 갖는 일부 O-항원 다당류를 함유할 수 있다.

용어 "글리코컨쥬게이트"는 단백질, 펩티드, 지질 등을 포함하지만 이에 제한되지 않는 다른 화학종에 연결된 당 또는 당류 항원(예를 들어, 올리고당류 및 다당류)-단백질 컨쥬게이트를 나타낸다. 글리코컨쥬게이트는 화학적으로, 예를 들어 단백질과 당 또는 당류 항원의 화학적(합성) 결합에 의해 제조될 수 있다. 용어 글리코컨쥬게이트는 또한 바이오컨쥬게이트를 포함한다.

용어 "바이오컨쥬게이트"는 숙주 세포 배경, 바람직하게는 박테리아 숙주 세포, 예를 들어 대장균 숙주 세포에서 제조된 단백질(예를 들어, 담체 단백질) 및 당 또는 당류 항원(예를 들어, 올리고당류 및 다당류) 사이의 컨쥬게이트를 나타내며, 여기서 숙주 세포 기구는 항원을 단백질(예를 들어, N-결합)에 연결한다. 바람직하게는, 용어 "바이오컨쥬게이트"는 숙주 세포 배경에서 제조된 단백질(예를 들어, 담체 단백질)과 O-항원, 바람직하게는 대장균 O-항원(예를 들어, O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B, O75 등) 사이의 컨쥬게이트를 나타내며, 여기에서 숙주 세포 기구는 항원을 단백질(예를 들어, N-결합)에 연결한다. 바이오컨쥬게이트는 숙주 세포 기구에 의해 숙주 세포에서 제조되기 때문에, 항원과 단백질은 바이오컨쥬게이트에서 글리코시드 연결 또는 결합을 통해 공유 결합된다. 바이오컨쥬게이트는 O-항원을 합성하고/하거나 O-항원을 표적 단백질에 연결하는 데 필요한 세포 기구를 발현하도록 조작된 재조합 숙주 세포에서 제조될 수 있다. 본원에 기술된 바와 같은 바이오컨쥬게이트는 글리칸이 박테리아 세포벽으로부터 정제된 후 담체 단백질에 화학적으로 커플링되는, 화학적으로 제조된 글리코컨쥬게이트와 비교해 유리한 특성을 갖는데, 예를 들어, 바이오컨쥬게이트는 제조시 더 적은 화학물질을 필요로 하며, 생성된 최종 생성물에 있어서 더욱 일관되며, 자유(즉, 담체 단백질에 결합되지 않은) 글리칸을 덜 함유하거나 함유하지 않는다. 따라서, 전형적인 구체예에서, 바이오컨쥬게이트는 화학적으로 생성된 글리코컨쥬게이트보다 선호된다.

용어 "약"은 숫자와 함께 사용되는 경우 언급된 숫자의 ±1, ±5 또는 ±10% 이내의 임의의 수를 나타낸다.

용어 "퍼센트(%) 서열 동일성" 또는 "% 동일성"은 아미노선 서열의 전체 길이를 구성하는 아미노산 잔기의 수와 비교할때 2개 이상의 정렬된 아미노산 서열의 동일한 아미노산의 일치("히트")의 수를 설명한다. 다시 말해서, 2개 이상의 서열에 있어서, 당업계에 공지된 바와 같은 서열 비교 알고리즘을 사용하여 측정할 때 최대 상응성에 대해 비교하고 정렬될 경우 또는 수동으로 정렬되거나 시각적으로 검사할 경우, 정렬을 사용하여 동일한 (예를 들어, 90%, 95%, 97% 또는 98% 동일성) 아미노산 잔기의 백분율이 결정될 수 있다. 따라서, 서열 동일성을 결정하기 위해 비교되는 서열은 아미노산의 치환(들), 부가(들) 또는 결실(들)에 의해 상이할 수 있다. 단백질 서열을 정렬하는데 적절한 프로그램은 당업자에게 알려져 있다. 예를 들어, 단백질 서열의 서열 동일성 백분율은 예를 들어, NCBI BLAST 알고리즘을 사용하는 CLUSTALW, Clustal Omega, FASTA 또는 BLAST와 같은 프로그램으로 결정될 수 있다(Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402).

예를 들어, 아미노산 서열에 있어서, 서열 동일성 및/또는 유사성은 비제한적으로 문헌 [Smith and Waterman, 1981, Adv. Appl. Math. 2:482]의 국소 서열 동일성 알고리즘, 문헌[Needleman and Wunsch, 1970, J. Mol. Biol. 48:443]의 서열 동일성 정렬 알고리즘, 문헌 [Pearson and Lipman, 1988, Proc. Nat. Acad. Sci. U.S.A. 85:2444]의 유사성 방법에 대한 조사, 이들 알고리즘의 컴퓨터 구현(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Drive, Madison, Wis.), 문헌 [Devereux et al, 1984, Nucl. Acid Res. 12:387-395]에 기술된 Best Fit 서열 프로그램을 포함하는 당업계 공지된 표준 기술을 이용하여, 바람직하게는 디폴트 세팅을 사용하여 또는 검사에 의해 결정될 수 있다. 특정 구체예에서, 퍼센트 동일성은 다음 파라미터에 기초하여 FastDB에 의해 계산된다: 1의 불일치 페널티; 1의 갭 페널티; 0.33의 갭 크기 패널티; 및 30의 합류 페널티("Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149(1988), Alan R. Liss, Inc.).

유용한 알고리즘의 또 다른 예는 하기 문헌에 기술된 BLAST 알고리즘이다: [Altschul et al, 1990, J. Mol. Biol. 215:403-410; Altschul et al, 1997, Nucleic Acids Res. 25:3389-3402; and Karin et al, 1993, Proc. Natl. Acad. Sci. U.S.A. 90:5873-5787]. 특히 유용한 BLAST 프로그램은 문헌 [Altschul et al, 1996, Methods in Enzymology 266:460-480]에서 얻은 WU-BLAST-2 프로그램이다. WU-BLAST-2는 대부분 기본값으로 설정되는 여러 검색 파라미터를 사용한다.

추가적인 유용한 알고리즘은 문헌[Altschul et al,1993, Nucl. Acids Res. 25:3389-3402]에 의해 보고된 바와 같은 갭핑된 BLAST이다.

용어 "침습성 장외 병원성 대장균(ExPEC) 질환(IED)"은 본원에서 전신 박테리아 감염과 일치하는 급성 질환으로 정의되며, 이는 혈액 또는 기타 정상적으로 멸균된 신체 부위로부터의 대장균의 분리 및 식별에 의해, 또는 침습성 질환(전신염증반응증후군(SIRS), 패혈증 또는 패혈성 쇼크)의 징후 및 증상이 있고 식별 가능한 다른 감염원이 없는 환자의 소변으로부터의 대장균의 분리 및 식별에 의해 미생물학적으로 확인된다.

대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트

일 양태에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트가 본원에 제공된다. 본원에 사용된 바와 같은 용어 "O4"는 대장균으로부터의 O4 항원(대장균 혈청형 O4)을 지칭한다. O-항원 구조적 변형은 대장균 O4 혈청형 내에 존재하는 것으로 알려져 있다. 특히, 일부 O4 혈청형은 분지된 글루코스 단위를 갖는 변형된 O-항원을 발현한다. 본원에 사용된 "글루코실화된 O4 항원", "글루코실화된 O4 항원 다당류", "O4-Glc+ 항원 다당류" 및 "O4-Glc+ 항원"은 글루코스 분지를 갖는 O4 항원(예를 들어, 대장균 O4 항원)을 나타내며, 여기서 D-글루코스는 반복 단위 L-Rha→D-Glc→L-FucNAc→D-GlcNAc에서 L-람노스에 연결된다. 특정 구체예에서, 대장균 글루코실화된 O4 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O4-Glc+)의 구조를 포함하며, 여기서 n은 1 내지 100의 정수이다. 바람직한 구체예에서, n은 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

글루코스 분지 상태와 무관하게 대장균 O4 균주는 O4 항원 다당류의 생성을 담당하는 유전자를 인코딩하는 실질적으로 동일한 rfb 유전자 클러스터를 수반한다. 그러나, 글루코스 분지를 갖는 변형된 O4 항원의 생체내 합성은 rfb 유전자 클러스터의 외부에 있는 다당류 분지 효소의 활성을 필요로 한다. 본 발명자들이 아는 한, O4 항원의 글루코스 변형을 담당하는 다당류 분지 효소의 정체는 현재까지 알려지지 않은 채로 남아 있다. 여기서, 본 발명자들은 O4 항원의 글루코스 변형을 담당하는 다당류 분지 효소의 서열을 발견하였다. 이 효소의 확인은 글루코스 분지를 갖는 변형된 O4 항원 다당류의 바이오컨쥬게이트의 생성을 가능하게 한다. O4 항원 다당류의 글루코스 변형된 형태는 우세한 혈청형에 존재하며, 따라서 예를 들어 예방학적 또는 치료학적 용도를 위해 개선된 면역 반응을 제공하는 데 사용될 수 있다.

특히, O4 항원을 글루코실화하는 대장균 혈청형 O4에 특이적인 글루코실트랜스퍼라제 효소를 인코딩하는 gtrS 유전자의 서열이 본원에서 제공된다. 일반적으로, gtrA, gtrB 및 gtrS 유전자는 O-항원 글루코실화를 담당하는 효소를 인코딩한다. 상이한 혈청형의 gtrA 및 gtrB 유전자는 고도로 상동성이고 상호교환가능하지만, gtrS 유전자는 혈청형 특이적 O-항원 글루코실 트랜스퍼라제를 인코딩한다. 대장균 혈청형 O4의 gtrS 유전자는 글루코스 분지를 도입함으로써 O4 항원을 변형하는 GtrS 효소를 인코딩한다. O4 혈청형의 현대 임상 대장균 분리주의 특성 규명으로 테스트된 시험된 분리주의 78%에서 gtrS의 존재가 드러났으며, 이는 글루코스 잔기의 추가로 변형된 대장균 O4 항원 다당류가 현재 감염 분리주에서 우세함을 나타낸다.

한 구체예에서, SEQ ID NO: 4의 아미노산 서열을 포함하는 GtrS 글루코실트랜스퍼라제를 인코딩하는 대장균 혈청형 O4로부터의 gtrS 유전자의 핵산이 본원에 제공된다. 또 다른 구체예에서, gtrS 핵산은 SEQ ID NO: 4의 아미노산 서열과 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한, 바람직하게는 SEQ ID NO: 4의 아미노산 서열과 98%, 99% 또는 100% 동일한 대장균 혈청형 O4로부터의 GtrS 단백질을 인코딩한다. SEQ ID NO: 4의 아미노산 서열과 적어도 80% 동일한 GtrS 단백질은 대장균 O4 항원 다당류를 특정적으로 글루코실화하여 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 갖는 글루코실화된 O4 항원을 얻을 수 있다. 당업자는 SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 SEQ ID NO: 4의 GtrS 단백질의 변이된 형태를 만들고, 이러한 서열을 본 개시 내용에 비추어 볼 때 대장균 O4 항원의 글루코실화 활성에 대해 테스트할 수 있을 것이다. 대장균 혈청형 O4의 글루코실 트랜스퍼라제 gtrS 유전자를 인코딩하는 핵산을 포함하는 재조합 숙주 세포, 및 글루코스 변형된 O4 항원 다당류 및 이의 바이오컨쥬게이트의 생성에서 상기 재조합 숙주 세포의 사용은 하기 더욱 상세히 기재되어 있다.

각각 박토프레놀-연결된 글루코스 트랜스로카제(GtrA, 내부 막 위의 박토프레놀-연결된 글루코스를 주변 세포질로 뒤집음) 및 박토프레놀 글루코실 트랜스퍼라제(GtrB, 글루코스를 박토프레놀에 연결)로 기능하는 gtrA 및 gtrB 인코딩된 단백질에 대한 서열은 각각 SEQ ID NO: 7 및 8과 적어도 약 80% 동일한 아미노산 서열을 포함할 수 있다. 특정 구체예에서, SEQ ID NO: 7 및 8과 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 각각 GtrA 및 GtrB 단백질을 인코딩하며, 각각 박토프레놀-연결된 글루코스 트랜스로카제 및 박토프레놀 글루코실 트랜스퍼라제 활성을 갖는 핵산 서열이 또한 본 발명의 숙주 세포에 존재하며, 이는 추가로 O4-특이적 rfb 유전자좌, 상기 기술된 O4-특이적 GtrS 인코딩 서열, 본원에 기술된 바와 같은 올리고사카릴 트랜스퍼라제 및 본원에 기술된 바와 같은 하나 이상의 글리코실화 컨센서스 서열을 갖는 담체 단백질을 인코딩하는 서열을 추가로 포함하여 대장균 글루코실화된 O4 혈청형(표 1의 화학식 (O4-Glc+)의 글리칸 구조를 포함)의 바이오컨쥬게이트를 생성한다.

본원에 제공된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트는 바람직하게는, 글리코시드 연결에 의해 담체 단백질에 공유 결합된다. 본 개시 내용의 관점에서 당업자에게 공지된 임의의 담체 단백질이 사용될 수 있다. 적합한 담체 단백질은 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D를 포함한다. 요구되는 컨센서스 글리코실화 서열을 함유하는 다양한 상이한 담체 단백질과의 바이오컨쥬게이션이 기술되었으며, 이는 이 기술을 사용하여 광범위한 단백질이 글리코실화될 수 있음을 보여준다(예를 들어, WO 06/119987, WO 2015/124769, WO 2015/158403, WO 2015/82571, WO 2017/216286 및 WO 2017/67964 참조, 바이오컨쥬게이션에 성공적으로 사용된 광범위한 담체 단백질을 함께 보여줌).

특정 구체예에서, 담체 단백질이 변형되는데, 예를 들어 단백질이 덜 독성이고/거나 글리코실화에 더 민감하게 되는 방식으로 변형된다. 특정 구체예에서, 본원에 사용된 담체 단백질은, 더 낮은 농도의 단백질이 예를 들어, 면역원성 조성물 중에서 특히, 이의 바이오컨쥬게이트 형태로 투여되는 방식으로 담체 단백질의 글리코실화 부위의 수가 최대화되도록 변형된다.

따라서, 특정 구체예에서, 본원에 기술된 담체 단백질은 (예를 들어, 담체 단백질이 이의 천연/자연 즉, "야생형" 상태에서 관련된 글리코실화 부위의 수와 비교하여) 담체 단백질과 일반적으로 관련되는 것보다 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 글리코실화 부위를 포함하도록 변형된다. 담체 단백질 내로의 글리코실화 부위의 도입은, 예를 들어 글리코실화 부위가 완전히 또는 부분적으로 추가되도록 단백질의 일차 구조에 새로운 아미노산을 추가하여, 단백질의 일차 구조 임의의 곳에서 글리코실화 컨센서스 서열을 삽입함으로써 또는 글리코실화 부위를 생성하기 위해 단백질에 존재하는 아미노산을 돌연변이시킴으로써 달성될 수 있다. 당업자는 당업계에 공지된 접근법, 예를 들어 단백질을 인코딩하는 핵산 서열의 변형을 포함하는 재조합 접근법을 이용하여 단백질의 아미노산 서열이 용이하게 변형될 수 있음을 인식할 것이다. 특정 구체예에서, 글리코실화 컨센서스 서열은 담체 단백질의 특정 영역, 예를 들어 단백질의 표면 구조 내에 단백질의 N 또는 C 말단에서 및/또는 단백질 염기의 이황화 브릿지에 의해 안정화되는 루프에 도입된다. 일부 구체예에서, 글리코실화 컨센서스 서열은 더욱 효율적인 글리코실화를 위해 리신 잔기의 첨가에 의해 연장될 수 있다.

특정 단백질에 삽입되거나 생성될 수 있는 글리코실화 컨센서스 서열의 예시적인 예는 Asn-X-Ser(Thr) (여기에서, X는 Pro를 제외한 임의의 아미노산일 수 있음)(SEQ ID NO: 1) 및 Asp(Glu)-X-Asn-Z-Ser(Thr)(여기에서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨)(SEQ ID NO: 2)를 포함한다.

일부 구체예에서, 대장균 글루코실화된 O4 항원 다당류는 담체 단백질의 아스파라긴(Asn) 잔기에 공유 결합되며(예를 들어, N-결합됨), 여기에서 Asn 잔기는 SEQ ID NO: 1, 더욱 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 글리코실화 부위에 존재한다. 전형적으로, 담체 단백질은 1-10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1-10개, 바람직하게는 2-4개, 및 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 SEQ ID NO: 1의 아미노산 서열, 및 더욱 바람직하게는 SEQ ID NO: 2의 아미노산 서열을 갖는 글리코실화 컨센서스 서열을 포함한다.

특정 구체예에서, 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A이다. EPA에 있어서, 다양한 탈독소화된 단백질 변이체가 문헌에 기술되어 있으며, 담체 단백질로 사용될 수 있다. 예를 들어, 탈독소화는 문헌 [Lukac et al., 1988, Infect Immun, 56: 3095-3098 and Ho et al., 2006, Hum Vaccin, 2:89 -98]에 따라 촉매적으로 필수적인 잔기 L552V 및 ΔE553을 돌연변이시키고 결실시킴으로써 달성될 수 있다. 본원에 사용된 바와 같은 "EPA"는 탈독소화된 P. 애루기노사의 외독소 A를 나타낸다. 담체 단백질이 EPA인 이들 구체예에서, 대장균 글루코실화된 O4 항원 다당류는 SEQ ID NO: 1을 갖는 글리코실화 컨센서스 서열을 포함하는 글리코실화 부위에서 Asn 잔기에 공유 결합될 수 있으며, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 글리코실화 부위에서 Asn 잔기에 공유 결합될 수 있다. 바람직하게는, EPA 담체 단백질은 1-10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1-10개, 바람직하게는 2-4개, 및 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 SEQ ID NO: 1의 아미노산 서열, 및 더욱 바람직하게는 SEQ ID NO: 2의 아미노산 서열을 갖는 글리코실화 컨센서스 서열을 포함한다.

일부 구체예에서, EPA 담체 단백질은 각각 글리코실화 컨센서스 서열을 포함하는 4개의 글리코실화 부위, 예를 들어 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 글리코실화 부위를 포함한다. 본원에 사용된 바와 같은 "EPA-4 담체 단백질" 및 "EPA-4"는 각각 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 4개의 글리코실화 부위를 포함하는 탈독소화된 P. 애루기노사 외독소 A 담체 단백질을 나타낸다. EPA-4 담체 단백질의 예시적인 바람직한 예는 SEQ ID NO: 3의 아미노산 서열을 포함하는 EPA 담체 단백질이다.

조성물

또 다른 양태에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하는 조성물이 본원에 제공된다. 본원에 제공된 조성물은 본원에 기재된 담체 단백질(예를 들어, EPA)에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 임의의 바이오컨쥬게이트를 포함할 수 있다.

일부 구체예에서, 조성물은 면역원성 조성물이다. 본원에 사용된 바와 같은 "면역원성 조성물"은 조성물이 투여되는 숙주 또는 대상체에서 면역 반응을 유발할 수 있는 조성물을 나타낸다. 면역원성 조성물은 약학적으로 허용되는 담체를 추가로 포함할 수 있다. 일부 구체예에서, 조성물은 약학적으로 허용되는 담체를 추가로 포함하는 약학적 조성물이다. 본원에 사용된 바와 같은 "약학적으로 허용되는 담체"는 조성물과 함께 투여되는 희석제, 애쥬번트, 부형제 또는 비히클을 나타내며, 이는 무독성이며, 활성 성분의 효능을 방해해서는 안된다. 예를 들어, 식염수 용액 및 덱스트로스 및 글리세롤 수용액은 특히 주사용 용액의 경우 액체 담체로 또한 사용될 수 있다. 적합한 부형제는 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 쌀, 밀가루, 백악, 실리카겔, 소듐 스테아레이트, 글리세롤 모노스테아레이트, 활석, 염화나트륨, 건조 탈지유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등을 포함한다. 적합한 약학적으로 허용되는 담체의 다른 예는 문헌 ["Remington's Pharmaceutical Sciences" by E.W. Martin.]에 기재되어 있다.

한 구체예에서, 본 발명의 조성물은 Tris-완충 염수(TBS) pH 7.4(예를 들어, 각각 25 mM, 137 mM 및 2.7 mM으로 Tris, NaCl 및 KCl 함유) 중 본 발명의 바이오컨쥬게이트를 포함한다. 다른 구체예에서, 본 발명의 조성물은 약 7.0 pH의 약 10 mM KH₂PO₄/Na₂HPO₄ 완충액, 약 5% (w/v) 소르비톨, 약 10 mM 메티오닌 및 약 0.02% (w/v) 폴리소르베이트 80 중의 본 발명의 바이오컨쥬게이트를 포함한다. 다른 구체예에서, 본 발명의 조성물은 약 7.0 pH의 약 10 mM KH₂PO₄/Na₂HPO₄ 완충액, 약 8%(w/v) 수크로스, 약 1mM EDTA, 및 약 0.02% (w/v) 폴리소르베이트 80(예를 들어, EPA 담체 단백질에 공유 결합된 대장균 O-항원의 바이오컨쥬게이트에 적합한 완충액에 대해서는 WO 2018/077853 참조) 중의 본 발명의 바이오컨쥬게이트를 포함한다.

일부 구체예에서, 본원에 기재된 조성물은 일가 제형이고, 예를 들어 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트, 예컨대 대장균 글루코실화된 O4 항원 다당류의 일부로서 하나의 대장균 O-항원 다당류를 함유한다. 다가 조성물, 예를 들어, 2가, 3가, 4가 등의 조성물인 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)이 또한 본원에 제공된다. 예를 들어, 다가 조성물은 하나 초과의 항원, 예컨대 대장균 O-항원, 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트를 포함한다. 특정 구체예에서, 본원에서 제공되는 다가 조성물은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트 및 적어도 하나의 추가 항원을 포함한다.

한 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 본원에 기재된 바와 같은 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하는 일가 조성물이다.

또 다른 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류, 및 적어도 하나의 추가 항원을 포함하는 다가 조성물이다.

일부 구체예에서, 추가 항원은 항원 당류 또는 다당류, 더욱 바람직하게는 대장균 O-항원 다당류, 예컨대 O1, O2, O6, O8, O15, O16, O18, O25 및 O75 혈청형 및 이의 하위혈청 중 하나 이상의 대장균 O-항원이다. 일부 구체예에서, 추가의 대장균 O-항원 다당류 각각은 글리코컨쥬게이트이며, 이는 대장균 O-항원 다당류가 다른 화학종, 예를 들어 단백질, 펩티드, 지질 등, 가장 바람직하게는 담체 단백질에 예컨대, 화학적 또는 효소적 방법에 의해 공유적으로 결합됨을 의미한다. 바람직한 구체예에서, 추가의 대장균 O-항원 다당류 각각은 O-항원 다당류가 숙주 세포 기구에 의해 효소적으로 글리코시드 결합을 통해 예를 들어, 담체 단백질에 공유 결합되는 바이오컨쥬게이트이다. 특정 구체예에서, 본원에 제공된 조성물은 1-20개 추가의 글리코컨쥬게이트, 더욱 바람직하게는 대장균 O-항원 다당류의 바이오컨쥬게이트, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 추가의 글리코컨쥬게이트 또는 바람직하게는, 대장균 O-항원 다당류의 바이오컨쥬게이트를 포함할 수 있다. 다른 항원, 예컨대 펩티드, 단백질 또는 지질 항원 등이 본원에 제공된 조성물에 포함될 수 있다.

일부 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, 및 대장균 O1A 항원 다당류, 대장균 O2 항원 다당류, 대장균 O6A 항원 다당류, 대장균 O8 항원 다당류, 대장균 O15 항원 다당류, 대장균 O16 항원 다당류, 대장균 O18A 항원 다당류, 대장균 O25B 항원 다당류 및 대장균 O75 항원 다당류로 구성된 군으로부터 선택되는 적어도 하나의 추가 항원 다당류를 포함한다. 바람직하게는, 추가의 O-항원 다당류 각각은 담체 단백질에 공유 결합되고, 더욱 바람직하게는 바이오컨쥬게이트이다.

한 구체예에서, O1A 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O1A 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O1A)의 구조를 포함하며, 여기서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O1A 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

한 구체예에서, O2 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O2 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O2)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O2 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

한 구체예에서, O6A 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O6A 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O6A)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O6A 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

한 구체예에서, O8 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O8 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O8)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O8 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

한 구체예에서, O15 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O15 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O15)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O15 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

한 구체예에서, O16 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O16 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O16)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O16 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

한 구체예에서, O18A 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O18A 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O18A)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O18A 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

한 구체예에서, O25B 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O25B 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O25B)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O25B 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

한 구체예에서, O75 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O75 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O75)의 구조를 포함하며, 여기서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O75 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.

또 다른 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 적어도 대장균 O1A, O2, 글루코실화된 O4, O6A 및 O25B 항원 다당류, 바람직하게는 담체 단백질, 예를 들어, EPA(즉, 5가 조성물)에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A 및 O25B 항원 다당류의 바이오컨쥬게이트를 포함한다.

바람직한 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 적어도 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어, EPA(즉, 9가 조성물)에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류의 바이오컨쥬게이트를 포함한다.

또 다른 바람직한 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 적어도 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA(즉, 10가 조성물)에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 바이오컨쥬게이트를 포함한다.

다른 대장균 혈청형으로부터의 추가 O-항원(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)을 임의적으로 추가로 포함하는 조성물이 또한 본원에서 고려된다.

일부 구체예에서, 추가의 대장균 O1A, O2, O6A, O8, O15, O16, O18A, O25B, 및/또는 O75 항원 다당류 각각은 담체 단백질에 공유적으로 결합된다. O-항원 다당류는 화학적 또는 다른 합성 방법에 의해 담체 단백질에 연결될 수 있거나, O-항원 다당류는 바이오컨쥬게이트의 일부일 수 있고, 바람직하게는 바이오컨쥬게이트의 일부이다. 본 개시의 관점에서 당업자에게 공지된 임의의 담체 단백질이 사용될 수 있다. 적합한 담체 단백질은 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D를 포함한다. 바람직하게는, 담체 단백질은 EPA이다.

일부 구체예에서, 추가의 대장균 O1A, O2, O6A, O8, O15, O16, O18A, O25B, 및/또는 O75 항원 다당류 각각은, 특히 바이오컨쥬게이트의 일부인 경우, 담체 단백질의 아스파라긴(Asn) 잔기에 공유적으로 결합되며, 여기에서 Asn 잔기는 글리코실화 컨센서스 서열 Asn-X-Ser(Thr)을 포함하는 글리코실화 부위에 존재하고, 여기에서 X는 Pro을 제외한 임의의 아미노산이며(SEQ ID NO: 1)이며, 바람직하게는 Asn 잔기는 글리코실화 컨센서스 서열 Asp(Glu)-X-Asn-Z-Ser(Thr)을 포함하는 글리코실화 부위에 존재하며, 여기에서 X 및 Z는 Pro을 제외한 임의의 아미노산으로부터 독립적으로 선택된다(SEQ ID NO: 2). 담체 단백질은 1-10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위를 포함할 수 있으며, 각각은 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, 담체 단백질은 EPA-4 담체 단백질, 예를 들어 SEQ ID NO: 3의 아미노산 서열을 포함하는 EPA-4 담체 단백질이다.

특정 구체예에서, 하기를 포함하는 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)이 본원에 제공된다: (i) SEQ ID NO: 3을 포함하는 탈독소화된 P. 애루기노사의 외독소 A 담체 단백질(EPA-4 담체 단백질)에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트로서, 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함하는 바이오컨쥬게이트; (ii) EPA-4 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 바이오컨쥬게이트로서, 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함하는 바이오컨쥬게이트; (iii) EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 바이오컨쥬게이트로서, 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함하는 바이오컨쥬게이트; (iv) EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 바이오컨쥬게이트로서, 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함하는 바이오컨쥬게이트; (v) EPA-4 담체 단백질에 공유 결합된 대장균 O8 항원 다당류의 바이오컨쥬게이트로서, 대장균 O8 항원 다당류는 화학식 (O8)의 구조를 포함하는 바이오컨쥬게이트; (vi) EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 바이오컨쥬게이트로서, 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함하는 바이오컨쥬게이트; (vii) EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 바이오컨쥬게이트로서, 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함하는 바이오컨쥬게이트; (viii) EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트로서, 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함하는 바이오컨쥬게이트; 및 (ix) EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 바이오컨쥬게이트로서, 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함하는 바이오컨쥬게이트(여기에서 각각의 화학식은 표 1에 제공되며, 각각의 화학식에 있어서, 독립적으로 n은 1 내지 100, 예를 들어 1 내지 50, 바람직하게는 3 내지 50, 예를 들어 5 내지 40의 정수이다).

특정 구체예에서, 상기 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 하기를 추가로 포함한다: (x) EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 바이오컨쥬게이트로서, 대장균 O18A 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O18A)의 구조를 포함하며, 여기에서 이 구조에 있어서 n은 1 내지 100, 예를 들어 1 내지 50, 바람직하게는 3 내지 50, 예를 들어 5 내지 40의 정수이다.

일부 구체예에서, 본원에 제공된 조성물은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, 및 적어도 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 포함하고, 여기에서 대장균 O25B 항원 다당류의 바이오컨쥬게이트는 조성물에 존재하는 임의의 다른 바이오컨쥬게이트의 농도보다 약 1.5 내지 6배, 예를 들어 약 2 내지 4배 더 높은 농도, 예컨대 1.5, 2, 3, 4, 5 또는 6배 더 높은 농도로 조성물에 존재한다.

특정 구체예에서, 조성물은 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류의 바이오컨쥬게이트를 포함하고, 여기에서 O1A:O2:글루코실화된 O4:O6A:O8:O15:O16:O25B:O75의 바이오컨쥬게이트가 1:1:1:1:1:1:1:2:1 또는 2:1:1:2:1:1:1:4:1의 비율(O-항원 다당류의 중량 기준)로 존재한다.

특정 구체예에서, 조성물은 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 바이오컨쥬게이트를 포함하고, 여기에서 O1A:O2:글루코실화된 O4:O6A:O8:O15:O16:O18A:O25B:O75의 바이오컨쥬게이트가 1:1:1:1:1:1:1:1:2:1 또는 2:1:1:2:1:1:1:1:4:1의 비율(O-항원 다당류의 중량 기준)로 존재한다.

일부 구체예에서, 본원에 제공된 조성물은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, 및 적어도 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기에서 대장균 O25B 항원 다당류의 바이오컨쥬게이트는 2 내지 50 μg/mL, 바람직하게는 8내지 40 μg/mL, 더욱 바람직하게는 16 내지 32 μg/mL, 예컨대 16, 18, 20, 22, 24, 26, 28, 30, 또는 32 μg/mL의 농도로 조성물에 존재한다. 이러한 구체예에서, 대장균 O25B 항원 다당류의 바이오컨쥬게이트 농도는 조성물 중에 존재하는 임의의 다른 바이오컨쥬게이트의 농도보다 바람직하게는, 약 1.5 내지 6배, 예를 들어, 약 2 내지 4배 더 높고, 예를 들어 1.5, 2, 3, 4, 5, 또는 6배 더 높다.

특정 구체예에서, 본원에 기재된 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 애쥬번트를 포함하거나 이와 조합되어 투여된다. 본원에 기재된 조성물과 조합하여 투여하기 위한 애쥬번트는 상기 조성물의 투여 전(예를 들어, 72시간, 48시간, 24시간, 12시간, 6시간, 2시간, 1시간, 10분 이내), 동시에 또는 후에(예를 들어, 72시간, 48시간, 24시간, 12시간, 6시간, 2시간, 1시간, 10분 이내) 투여될 수 있다. 본원에 사용된 바와 같은 용어 "애쥬번트"는 본원에 기술된 조성물과 함께 또는 이의 일부로서 투여되는 경우, 바이오컨쥬게이트의 대장균 O-항원 다당류에 대한 면역 반응을 증대, 강화 및/또는 부스팅하며, 애쥬번트 화합물이 단독으로 투여되는 경우, 바이오컨쥬게이트 중의 대장균 O-항원 다당류에 대한 면역 반응을 발생시키지 않는 화합물을 나타낸다. 일부 구체예에서, 애쥬번트는 이의 바이오컨쥬게이트의 대장균 O-항원 다당류에 대한 면역 반응을 향상시키고, 알레르기 또는 다른 부작용을 일으키지 않는다. 애쥬번트는 예를 들어, 림프구 동원, B 및/또는 T 세포의 자극, 및 대식세포의 자극을 포함하는 여러 기전에 의해 면역 반응을 향상시킬 수 있다.

적합한 애쥬번트의 예는 임의적으로 QS7과 조합되는, 비제한적으로, 알루미늄 염(명반)(예컨대, 명반 또는 나노명반 제형을 포함하는 나노입자를 포함하는 수산화알루미늄, 인산알루미늄, 황산알루미늄 및 산화알루미늄), 인산칼슘, 모노포스포릴 지질 A(MPL) 또는 3-데-O-아실화된 모노포스포릴 지질 A(3D-MPL)(예를 들어, 영국 특허 GB2220211, EP0971739, EP1194166, US6491919 참조), AS01, AS02, AS03 및 AS04(모두 GlaxoSmithKline; 예를 들어, AS04에 있어서 EP1126876, US7357936, AS02에 있어서 EP0671948, EP0761231, US5750110), MF59(Novartis), 이미다조피리딘 화합물(WO2007/109812 참조), 이미다조퀴녹살린 화합물(WO2007/109813 참조), 델타-이눌린, STING-활성화 합성 사이클릭-디-뉴클레오티드(예를 들어, US20150056224), 레시틴과 카르보머 호모폴리머의 조합물(예를 들어, US6676958), 및 사포닌, 예컨대 QuilA 및 QS21(예를 들어, 문헌 [Zhu D and W Tuo, 2016, Nat Prod Chem Res 3: e113 (doi:10.4172/2329-6836.1000e113] 참조), Matrix M, Iscoms, Iscomatrix 등을 포함한다(문헌 [Kensil et al., in Vaccine Design: The Subunit and Adjuvant Approach (eds. Powell & Newman, Plenum Press, NY, 1995)]; 미국 특허 번호 5,057,540 참조). 일부 구체예에서, 애쥬번트는 프로운트 애쥬번트(완전 또는 불완전)이다. 다른 애쥬번트는 선택적으로 모노포스포릴 지질 A와 같은 면역 자극제와 조합된 수중유 에멀젼(예컨대, 스쿠알렌 또는 땅콩 오일)이다(문헌 [Stoute et al., N. Engl. J. Med. 336, 86-91(1997)] 참조). 또 다른 애쥬번트는 CpG이다(Bioworld Today, Nov. 15, 1998). 애주번트의 추가 예는 AS01E 및 AS01B에서와 같이 MPL 및 QS21과 같은 면역 자극제를 함유하는 리포솜이다(예를 들어, US 2011/0206758). 애쥬번트의 다른 예는 CpG(Bioworld Today, Nov. 15, 1998) 및 이미다조퀴놀린(예컨대, 이미퀴모드 및 R848)이다. 예를 들어, 문헌 [Reed G, et al., 2013, Nature Med, 19: 1597-1608] 참조. 특정 구체예에서, 애쥬번트는 톨-유사 수용체 4(TLR4) 효능제를 함유한다. TLR4 효능제는 당업계에 잘 알려져 있다(예를 들어, 문헌 [Ireton GC and SG Reed, 2013, Expert Rev Vaccines 12: 793-807] 참조). 특정 구체예에서, 애쥬번트는 지질 A를 포함하는 TLR4 효능제, 또는 이의 유사체 또는 유도체, 예컨대 MPL, 3D-MPL, RC529(예를 들어, EP1385541), PET-지질 A, GLA(글리코피라노실 지질 애쥬번트, 합성 이당류 당지질; 예를 들어, US20100310602, US8722064), SLA(예를 들어, 문헌 [Carter D et al, 2016, Clin Transl Immunology 5: e108 (doi: 10.1038/cti.2016.63)]으로서, 이는 인간 백신을 위한 TLR4 리간드를 최적화시키기 위한 구조-기능 접근법을 기술함), PHAD(포스포릴화된 헥사아실 이당류), 3D-PHAD (이의 구조는 GLA의 구조와 동일함), 3D-(6-아실)-PHAD (3D(6A)-PHAD) (PHAD, 3D-PHAD 및 3D(6A)PHAD는 합성 지질 A 변이체이며, 예를 들어, 이들 분자의 구조를 또한 제공하는 avantilipids.com/divisions/adjuvants 참조), E6020(CAS 번호 287180-63-6), ONO4007, OM-174 등을 포함한다.

특정 구체예에서, 본원에 기재된 조성물은 애쥬번트를 포함하지 않으며, 애쥬번트와 조합되어 투여되지 않는다.

특정 구체예에서, 본원에 기재된 조성물은 대상체에 대한 의도된 투여 경로에 적합하도록 제형화된다. 예를 들어, 본원에 기재된 조성물(예를 들어, 약학적 및/또는 면역원성)은 피하, 비경구, 경구, 설하, 협측, 피내, 경피, 결장직장, 복강내, 직장 투여, 정맥내, 비강내, 기관내, 근육내, 국소용, 경피 또는 피내 투여를 위해 제형화될 수 있다. 특정 구체예에서, 본원에 제공된 조성물(예를 들어, 약학적 및/또는 면역원성)은 근육내 주사용으로 제형화된다.

사용 방법

본원에 제공된 바이오컨쥬게이트 및 조성물은 대상체에서 대장균 글루코실화된 O4 항원에 대한 항체를 유도하고, 대장균, 특히 장외 병원성 대장균(ExPEC)에 대하여 대상체를 백신화시키는 데 사용될 수 있다. 본원에 사용된 바와 같은 "대상체"는 본원에 제공된 바이오컨쥬게이트 또는 조성물이 투여되거나 투여될 임의의 동물, 바람직하게는 포유동물을 의미한다. 본원에 사용된 바와 같은 용어 "포유동물"은 임의의 포유동물을 포함한다. 포유동물의 예에는 소, 말, 양, 돼지, 고양이, 개, 마우스, 래트, 토끼, 기니아 피그, 원숭이 또는 유인원과 같은 비인간 영장류(NHP), 인간 등이 포함되나 이에 제한되지 않는다. 특정 구체예에서, 대상체는 인간이다. 인간 대상체는 모든 연령이 될 수 있다. 특정 구체예에서, 대상체는 약 2개월 내지 약 18세, 예를 들어 1세 내지 18세의 인간이다. 특정 구체예에서, 대상체는 적어도 18세의 인간이다. 특정 구체예에서, 대상체는 15 내지 50세, 예를 들어 18 내지 45세, 예를 들어 20 내지 40세의 인간이다. 특정 구체예에서, 대상체는 인간 남성이다. 특정 구체예에서, 대상체는 인간 여성이다. 특정 구체예에서, 대상체는 면역저하된 대상체이다. 특정 구체예에서, 대상체는 적어도 50세, 적어도 55세, 적어도 60세, 적어도 65세의 인간이다. 특정 구체예에서, 대상체는 100세 이하, 95세 이하, 90세 이하, 85세 이하, 80세 이하, 또는 75세 이하인 인간이다. 특정 구체예에서, 대상체는 적어도 60세, 및 85세 이하의 인간이다. 특정 구체예에서, 대상체는 안정적인 건강 상태의 인간이다. 특정 구체예에서, 대상체는 안정적인 건강 상태의 적어도 60세 및 85세 이하의 인간 성인이다. 특정 구체예에서, 대상체는 요로 감염(UTI, 즉 요도, 방광, 요관 및/또는 신장의 박테리아 감염)의 병력이 있는, 즉 그의 또는 그녀의 인생에 적어도 1회의 UTI 에피소드를 갖는 인간이다. 특정 구체예에서, 대상체는 지난 20, 15, 12, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1년 동안 UTI의 병력이 있는 인간이다. 특정 구체예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 인간이다. 특정 구체예에서, 대상체는 재발성 UTI의 병력, 즉 6개월 동안 적어도 2회의 UTI 또는 1년 동안 적어도 3회의 UTI를 갖는 인간 대상체이다. 특정 구체예에서, 대상체는 지난 2년 동안 재발성 UTI의 병력이 있는 인간 대상체이다. 특정 구체예에서, 대상체는 안정적인 건강 상태의 60세 이상의 인간이다. 특정 구체예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 60세 이상의 인간이다. 특정 구체예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 적어도 60세 및 75세 미만의 인간이다. 특정 구체예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 75세 이상의 인간 대상체이다. 특정 구체예에서, 대상체는 선택적 비뇨생식기 및/또는 복부 시술 또는 수술, 예를 들어 경직장 초음파-유도 전립선 바늘 생검(TRUS-PNB)을 받도록 예정된 환자이다.

일 양태에서, 대상체에서 대장균 글루코실화된 O4 항원에 대한 항체를 유도하는 방법으로서, 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 임의의 바이오컨쥬게이트, 또는 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트를 단독으로 또는 다른 대장균 O-항원 다당류 또는 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트와 추가로 조합하여 포함하는 조성물을 대상체에 투여하는 단계를 포함하는 방법이 본원에 제공된다.

특정 구체예에서, 대장균 글루코실화된 O4 항원에 대해 유도되거나, 유발되거나 확인된 항체는 옵소닌식세포 활성을 갖는다. 특정 구체예, 유도되거나, 유발되거나 확인된 항체는 대장균 글루코실화된 및 글루코실화되지 않은 O4 균주 둘 모두의 옵소닌식세포 치사를 매개할 수 있는 교차-반응성 항체이다.

특정 구체예에서, 대장균 글루코실화된 O4 항원에 대해 유도되거나, 유발되거나 또는 확인된 항체는 비변형된 및 글루코스 변형된 O4 항원 다당류를 특이적으로 인식한다. 특정 구체예에서, 대장균 글루코실화된 O4 항원에 대해 유도되거나, 유발되거나 확인된 항체는 O4 혈청형의 대장균을 특이적으로 인식한다. 특정 구체예에서, 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트에 의해 유도된 항체는 비-글루코실화된 O4 항원과 비교하여 글루코실화된 O4 항원에 우선적으로 결합한다.

본원에 기재된 바이오컨쥬게이트 및 조성물에 의해 유도된 항체는 면역글로불린 분자 및 면역글로불린 분자의 면역학적 활성 부분, 즉 대장균 O-항원 다당류, 예를 들어 글루코실화된 O4 항원 다당류에 특이적으로 결합하는 항원 결합 부위를 함유하는 분자를 포함할 수 있다.

본원에 제공된 바이오컨쥬게이트 또는 조성물을 사용하여 유도되거나, 유발되거나 확인된 항체를 사용하여 요법 및/또는 질환 진행의 효능을 모니터링할 수 있다. 방사면역검정, ELISA(효소 결합 면역흡착 검정), 전기화학발광(ECL)-기반 면역검정, "샌드위치" 면역검정, 프레시피틴 반응, 겔 확산 침전 반응, 면역확산 검정, 면역방사 검정, 형광 면역검정, 단백질 A 면역검정 및 면역전기영도 검정과 같은 기술을 사용하는 경쟁적 및 비경쟁적 검정 시스템을 포함하나 이에 제한되지 않는 당업계에 공지된 임의의 면역검정 시스템이 이러한 목적으로 사용될 수 있다. 이러함 검정 중 여러개는 예를 들어, ECL-기반 면역검정은 다중 형식으로 수행되 수 있으며, 전형적으로 다중 검정 형식이 선호된다.

대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 사용하여 유도되거나, 유발되거나 확인된 항체는 예를 들어, 복수의 대장균 균주로부터 대장균 O4 균주, 특히 글루코실화된 O4 균주를 검출하고/거나 대장균 O4 또는 글루코실화된 O4 균주에 의한 감염을 진단하는데 사용될 수 있다.

또 다른 양태에서, 대장균(예를 들어, 장외 병원성 대장균, ExPEC)에 대해 대상체를 백신화시키는 방법으로서, 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트, 또는 단독의 또는 다른 대장균 O-항원 또는 이의 글리코컨주에이트 또는 바이오컨쥬게이트와 추가로 조합되는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트를 포함하는 조성물 중 임의의 것을 대상체에 투여하는 단계를 포함하는 방법이 본원에 제공된다. 당업자는 대장균 균주의 O 항원 또는 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트가 투여되는 조성물에 존재하는 대장균 균주에 대해 대상체가 백신화될 것임을 이해할 것이다. 예를 들어, O1A, O2, 글루코실화된 O4, O6A 및 O25B 항원 다당류를 포함하는 조성물의 투여는 대장균 혈청형 O1A, O2, O4, O6A 및 O25B에 대해 대상체를 백신화하는데 사용될 수 있다.

특정 구체예에서, 백신화는 침습성 ExPEC 질환(IED), 예를 들어, 요로감염, 균혈증, 패혈증 등을 예방하기 위한 것이다. 특정 구체예에서, 백신화는 요로 감염의 발생 또는 중증을 예방하거나 감소시키기 위한 것이다. 특정 구체예에서, IED는 예를 들어, 비뇨생식기 및/또는 복부 시술 또는 수술을 받는 환자에서 병원 획득될 수 있다. 특정 구체예에서, IED는 예를 들어, 병원, 외래 수술 센터 말기 신장 질환 시설, 장기 요양 시설 등에서 예를 들어, 일부 경우에, 중앙 라인, 카테터 등을 통해 또 다른 상태에 대해 건강 관리를 받고 있는 환자에서 건강 관리와 관련될 수 있다. 특정 구체예에서, IED는 예를 들어, 최근에 의료 위험에 노출되지 않은 환자에서 지역사회 획득될 수 있다.

또 다른 양태에서, 대상체에서 대장균(예를 들어, ExPEC)에 대해 면역 반응을 유도하는 방법으로서, 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트, 또는 단독의 또는 다른 대장균 O-항원 또는 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트와 추가로 조합되는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트를 포함하는 조성물 중 임의의 것을 대상체에게 투여하는 것을 포함하는 방법이 본원에 제공된다. 한 구체예에서, 대상체는 투여 시점에 대장균(예를 들어, ExPEC) 감염을 갖는다. 바람직한 구체예에서, 대상체는 투여 시점에 대장균(예를 들어, ExPEC) 감염을 갖지 않는다.

특정 구체예에서, 본원에 기재된 조성물 및 바이오컨쥬게이트는 항체, 바람직하게는 옵소닌식세포 활성을 갖는 항체의 생성을 포함하는 면역 반응을 유도하기 위해 대상체에게 투여될 수 있다. 이러한 항체는 당업자에게 공지된 기술(예를 들어, 면역친화성 크로마토그래피, 원심분리, 침전 등)을 사용하여 단리될 수 있다.

대상체에서 면역 반응을 생성하는 본원에 기재된 바이오컨쥬게이트 및 조성물의 능력은 당업자에게 공지되거나 본원에 기재된 임의의 접근법을 사용하여 평가될 수 있다. 일부 구체예에서, 대상체에서 면역 반응을 생성하는 바이오컨쥬게이트의 능력은 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이) 또는 대상체 세트를 본원에 기재된 바이오컨쥬게이트로 면역화하고 추가의 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이) 또는 대상체 세트를 대조군(PBS)으로 면역화시킴으로써 평가될 수 있다. 대상체 또는 대상체 세트는 이후에 ExPEC로 자극될 수 있으며, 대상체 또는 대상체 세트에서 질병(예를 들어, UTI, 균혈증, 또는 기타 질병)을 초래하는 ExPEC의 능력이 결정될 수 있다. 당업자는, 대조군으로 면역화된 대상체 또는 대상체 세트가 ExPEC로 자극 후 질병을 앓지만 본원에 기재된 바이오컨쥬게이트(들) 또는 이의 조성물로 면역화된 대상체 또는 대상체 세트는 질병을 덜 앓거나 질병에 걸리지 않은 경우, 바이오컨쥬게이트는 대상체에서 면역 반응을 발생시킬 수 있음을 인식할 것이다. ExPEC로부터의 O 항원과 교차 반응하는 항혈청을 유도하는 본원에 기재된 바이오컨쥬게이트(들) 또는 이의 조성물의 능력은 예를 들어, 면역검정, 예컨대 ELISA(예를 들어, [Van den Dobbelsteen et al, 2016, Vaccine 34: 4152-4160] 참조) 또는 ECL-기반 면역검정에 의해 테스트될 수 있다.

예를 들어, 대상체에서 면역 반응을 생성하는 본원에 기재된 바이오컨쥬게이트의 능력은 혈청 살균 검정(SBA) 또는 옵소닌식세포 치사 검정(OPK 검정, 또는 OPKA)을 사용하여 검출될 수 있으며, 이는 글리코컨쥬게이트-기반 백신의 승인을 얻는데 사용된 확립되고 허용되는 방법을 대표한다. 이러한 검정은 당업계에 잘 공지되어 있으며, 간략하게는 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이)에게 항체를 유발하는 화합물을 투여함으로써 관심 표적(예를 들어, O 항원 다당류, 예를 들어 대장균 글루코실화된 O4 항원 다당류)에 대한 항체를 발생시키고 분리하는 단계를 포함한다. 그 후, 항체의 멸균 능력은 예를 들어, 항체 및 보체 및 - 검정에 따라 - 호중구 세포의 존재 하에 문제의 박테리아(예를 들어, 관련 혈청형의 대장균)를 배양하고, 예를 들어, 표준 미생물학적 접근법을 사용하여 박테리아의 치사 및/또는 중화를 매개하는 항체의 능력을 검정함으로써 평가될 수 있다. 대장균 바이오컨쥬게이트 백신에 대한 OPK 검정의 예에 있어서, 예를 들어, 문헌 [Abbanat et al, 2017, Clin. Vaccine Immunol. 24: e00123-17] 참조. OPK 검정은 모노플렉스 또는 멀티플렉스 형식으로 수행될 수 있으며, 이중 멀티플렉스 형식(예를 들어, 동시에 다중 혈청형 테스트)이 전형적으로 선호된다. 멀티플렉스 OPK 검정은 종종 'MOPA'로서 본원에 지칭된다.

일부 구체예에서, 본원에 기재된 방법은 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트, 또는 다른 대장균 O-항원 또는 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트와 추가로 조합된 또는 단독의 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트를 포함하는 조성물을 유효량으로 투여하는 것을 포함한다. 한 구체예에서, "유효량"은 대장균(예를 들어, ExPEC)에 대해 대상체를 백신화시키는 양이다. 또 다른 구체예에서, "유효량"은 대장균(예를 들어, ExPEC)에 대한 면역 반응, 예컨대 항체, 바람직하게는 옵소닌식세포 활성을 갖는 항체의 생성을 포함하는 면역 반응을 대상체에서 유도하는 양이다.

특정 구체예에서, 본원에 제공된 조성물은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, 및 적어도 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 포함하고, 대장균 O25B 항원 다당류의 유효량은 조성물에 존재하는 임의의 다른 바이오컨쥬게이트의 농도보다 약 1.5 내지 6배, 예를 들어 약 2 내지 4배 더 높으며, 예컨대 1.5, 2, 3, 4, 5 또는 6배 더 높다. 이러한 구체예에서, 대장균 O25B 항원 다당류의 유효량은 예를 들어, 투여 당 약 5 내지 18 μg, 예컨대 투여 당 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 μg이다.

특정 구체예에서, 본 발명에 따른 바이오컨쥬게이트 또는 조성물은 대상체에게 1회 투여된다. 특정 구체예에서, 본 발명에 따른 바이오컨쥬게이트 또는 조성물은 예를 들어, 프라임-부스트 요법으로 대상체에게 1회 넘게 투여된다. 특정 구체예에서, 두 투여 사이의 시간은 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 6개월, 적어도 1년, 적어도 2년, 적어도 5년, 적어도 10년 또는 적어도 15년이다. 인간에서 원하는 면역 반응은 전형적으로 본 발명에 따른 바이오컨쥬게이트 또는 조성물의 단일 투여에 의해 발생할 수 있다. 특정 구체예에서, 예를 들어 10년 후에 반복 투여가 제공된다.

숙주 세포

대장균 O 항원 및 이러한 대장균 O 항원을 포함하는 바이오컨쥬게이트를 생성할 수 있는 숙주 세포, 예를 들어 원핵 숙주 세포가 본원에 제공된다. 본원에 제공된 숙주 세포는 바람직하게는, 대장균 O-항원 다당류 및/또는 이의 바이오컨쥬게이트를 생성하는데 사용되는 숙주 세포 기구(예를 들어, 글리코실트랜스퍼라제)를 인코딩하는 핵산을 (예를 들어, 유전자 조작을 통해) 하나 이상 포함하도록 변형된다.

당업자에게 공지된 임의의 숙주 세포는 고세균, 원핵 숙주 세포 및 진핵 숙주 세포를 포함하는 본원에 기재된 대장균 O 항원 다당류(예를 들어, 대장균 글루코실화된 O4 항원 다당류) 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 바이오컨쥬게이트(예를 들어, 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트)를 생성하는데 사용될 수 있다. 바람직한 구체예에서, 숙주 세포는 원핵 숙주 세포이다. 본원에 기재된 대장균 O 항원 다당류 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 바이오컨쥬게이트의 생성에 사용하기 위한 예시적인 원핵 숙주 세포는 비제한적으로, 에스체리치아(Escherichia) 종, 쉬겔라(Shigella) 종, 클레브시엘라(Klebsiella) 종, 잔토모나스(Xhantomonas) 종, 살모넬라(Salmonella) 종, 예르시니아(Yersinia) 종, 락토코커스(Lactococcus) 종, 락토바실러스(Lactobacillus) 종, 슈도모나스(Pseudomonas) 종, 코리네박테리움(Corynebacterium) 종, 스트렙토마이세스(Streptomyces) 종, 스트렙토코커스(Streptococcus) 종, 스타필로코커스(Staphylococcus) 종, 바실러스(Bacillus) 종 및 클로스트리듐(Clostridium) 종을 포함한다.

특정 구체예에서, 본원에 기재된 대장균 O 항원 다당류 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 바이오컨쥬게이트를 생성하는데 사용된 숙주 세포는 원핵 숙주 세포이며, 바람직하게는 대장균이다.

특정 구체예에서, 본원에 기재된 대장균 O 항원 다당류 및 바이오컨쥬게이트를 생성하는데 사용된 숙주 세포는 이종성 핵산, 예를 들어 요망되는 O 항원 혈청형의 rfb 유전자 클러스터를 포함하는 이종성 핵산, 하나 이상의 담체 단백질 및/또는 글리코실트랜스퍼라제를 인코딩하는 이종성 핵산을 포함하도록 조작된다. 특정 구체예에서, 이종성 rfb 유전자, 및/또는 글리코실화 경로(예를 들어, 원핵생물 및/또는 진핵생물 글리코실화 경로)에 관여하는 단백질을 인코딩하는 이종성 핵산은 본원에 기재된 숙주 세포 내로 도입될 수 있다. 이러한 핵산은 비제한적으로 올리고사카릴 트랜스퍼라제 및/또는 글리코실트랜스퍼라제를 포함하는 단백질을 인코딩할 수 있다.

예를 들어, 대장균 O 항원 다당류 및 이의 바이오컨쥬게이트를 제조하는 데 사용될 수 있는 재조합 숙주 세포를 제조하는 데 유용한 글리코실트랜스퍼라제를 인코딩하는 다양한 유전자 및 유전자 클러스터의 서열이 본원에 기재된다. 당업자는 유전자 코드의 축퇴성으로 인해 특정 아미노산 서열을 갖는 단백질이 다수의 상이한 핵산에 의해 인코딩될 수 있음을 이해할 것이다. 따라서, 당업자는 본원에 제공된 핵산이 핵산에 의해 인코딩되는 단백질의 아미노산 서열에 영향을 미치지 않으면서 이의 서열이 본원에 제공된 서열과 상이한 방식으로 변경될 수 있음을 이해할 것이다.

대장균 글루코실화된 O4 항원 다당류, O1A 항원 다당류, O2 항원 다당류, O6A 항원 다당류, O8 항원 다당류, O15 항원 다당류, O16 항원 다당류, O18A 항원 다당류, O25B 항원 다당류 또는 O75 항원 다당류의 바이오컨쥬게이트를 생성하기 위한 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 제공된다. 본원에 제공되는 숙주 세포는 대장균 O 항원 다당류를 생성할 수 있는 효소(예를 들어, 글리코실트랜스퍼라제)를 인코딩하는 핵산을 포함한다. 본원에 제공된 숙주 세포는 관심 O 항원을 생성할 수 있는 핵산을 자연적으로 발현할 수 있거나, 숙주 세포는 이러한 핵산을 발현하도록 제조될 수 있다. 특정 구체예에서, 핵산은 숙주 세포에 이종성이며, 당업계에 공지된 유전자 접근법을 사용하여 숙주 세포 내에 도입된다. 예를 들어, 핵산은 유전자 조작에 의해 숙주 세포 내에 도입될 수 있다(예를 들어, 유전자 클러스터는 플라스미드 또는 플라스미드 상에 발현되거나 숙주 세포 게놈 내로 통합된다(예를 들어, 국제 특허 출원 공개 WO 2014/037585, WO 2014/057109, WO 2015/052344 참조).

한 구체예에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 제공된다. 이러한 숙주 세포는 바람직하게는, 전구체 세포를 조작함으로써 gtrS 유전자를 인코딩하는 핵산 서열을 포함하는데, 이는 본 발명자들이 아는 한 글루코스를 대장균 O4 항원 및 특히, α-1,3-글리코시드 결합을 통해 L-Rha에 전달할 수 있는 다당류 분지 효소(즉, 대장군 O4 항원 다당류에 특이적인 글루코실트랜스퍼라제)를 인코딩하는 것으로서 본원에서 처음으로 확인되었다. 이러한 분지 효소의 아미노산 서열의 예는 SEQ ID NO: 4에 제공된다. 다른 예는 이에 대해 적어도 80% 동일한 아미노산 서열을 포함한다. 대장균 O4 항원 다당류에 특이적인 gtrS 유전자를 인코딩하는 핵산 서열의 예시적인 예는 비제한적으로 SEQ ID NO: 5, 또는 SEQ ID NO: 4를 인코딩하는 이에 대한 퇴화 핵산 서열, 또는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 갖는 기능성 O4-특이적 GtrS 효소를 인코딩하는 핵산 서열을 포함한다.

특정 구체예에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 4에 대해 적어도 80% 서열 동일성, 예컨대 SEQ ID NO: 4에 대해 약 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 95%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 포함한다. 유전자 코드의 중복성의 관점에서, 당업자는 요망되는 경우, 예를 들어, 코돈 최적화된 서열을 사용하여 글루코실 트랜스퍼라제의 아미노산 서열을 인코딩하는 핵산의 변이체를 만들 수 있다.

특정 구체예에서, SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제(GtrS)를 인코딩하는 뉴클레오티드 서열을 포함하는, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 7에 대해 적어도 80% 서열 동일성을 갖는 박토프레놀-연결된 글루코스 트랜스로카제(GtrA)를 인코딩하는 뉴클레오티드 서열, 및 SEQ ID NO: 8에 대해 적어도 80% 서열 동일성을 갖는 박토프레놀 글루코실 트랜스퍼라제(GtrB)를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다. 특정 구체예에서, 상기 핵산 서열은 각각 SEQ ID NO: 7 및 8에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 GtrA 및 GtrB 단백질을 인코딩하며, 각각 박토프레놀-연결된 글루코스 트랜스로카제(SEQ ID NO: 7) 및 박토프레놀 글루코실 트랜스퍼라제(SEQ ID NO: 8)를 갖는다. 유전자 코드의 중복성의 관점에서, 당업자는 요망되는 경우, 예를 들어, 코돈 최적화된 서열을 사용하여 박토프레놀-연결된 글루코스 트랜스로카제 및 박토프레놀 글루코실 트랜스퍼라제의 아미노산 서열을 인코딩하는 핵산의 변이체를 만들 수 있다.

본원에 제공된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열을 추가로 포함한다. 대장균 O4 항원 다당류의 생성에 유용한 rfb 유전자 클러스터의 예는 본원에서 SEQ ID NO: 9로서 제공된다. 또 다른 예는 GenBank, 유전자좌 AY568960에서 찾을 수 있다. 이 서열에 의해 인코딩된 것과 동일한 효소를 인코딩하는 퇴화 핵산 서열, 또는 적어도 80% 동일한, 바람직하게는 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한 효소를 인코딩하는 서열이 또한 사용될 수 있다.

특정 구체예에서, 글루코실화된 O4 항원 다당류를 생성하는 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포, 바람직하게는 재조합 대장균 숙주 세포)가 본원에 제공되며, 여기에서 숙주 세포는 gtrS, 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터, 및 담체 단백질을 인코딩하는 핵산을 포함한다. 이러한 숙주 세포는 gtrS 유전자, rfb 유전자 클러스터, 및/또는 담체 단백질을 인코딩하는 핵산을 포함하는 하나 이상의 플라스미드를 포함하거나, gtrS, rfb 클러스터 및/또는 숙주 세포 게놈 내로 통합된 담체 단백질을 인코딩하는 핵산과 같은 관련 유전자 일부 또는 모두를 포함하도록 재조합 접근법을 이용하여 조작될 수 있다. 특정 구체예에서, 유전자 또는 유전자 클러스터는 상동 재조합을 사용하여 숙주 세포의 게놈 내로 통합되었다. 숙주 세포의 게놈 내로의 유전자를 통합하는 장점은 항생제 선택의 부재 하의 안정성이다.

또 다른 특정 구체예에서, 글루코실화된 O4 항원 다당류를 생성하는 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포)가 본원에 제공되며, 숙주 세포는 GtrS(글루코실트랜스퍼라제)는 물론 O4 rfb 클러스터에 의해 인코딩된 효소를 포함한다. 특정 구체예에서, 상기 언급된 효소의 일부 또는 전부는 숙주 세포에 대해 이종성이다.

다른 특정 구체예에서, 대장균 글루코실화된 O4 항원 다당류, 바람직하게는 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성하는 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포)가 본원에 제공되며, 숙주 세포는 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열 및/또는 담체 단백질을 인코딩하는 뉴클레오티드 서열을 추가로 포함한다. 한 특정 구체예에서, 올리고사카릴 트랜스퍼라제는 숙주 세포에 대해 이종성이다. 또 다른 특정 구체예에서, 담체 단백질은 숙주 세포에 대해 이종성이다. 바람직하게는, 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 이종성 뉴클레오티드 서열을 포함한다. 바람직한 구체예에서, O4 클러스터의 rfb 유전자는 숙주 세포에 이종성이다. 바람직하게는, O4 항원에 분지된 글루코스 측쇄를 도입할 수 있는 효소를 인코딩하는 서열, 즉 gtrS 유전자(SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩함)는 숙주 세포에 대해 이종성이다. 핵산은 동일한 서열이 상기 숙주 세포에 자연적으로 존재하지 않는 경우 숙주 세포에 대해 이종성이다. 예를 들어, 이종성 핵산은 유전자 조작에 의해, 예를 들어 형질전환(예를 들어, 화학적 형질전환 또는 전기천공) 및/또는 재조합에 의해 어미 세포에 도입될 수 있다. 특정 구체예에서, 이종성 핵산, 예컨대 요망되는 rfb 유전자좌, gtrS 코딩 서열, 담체 단백질 인코딩 서열 및/또는 글리코실트랜스퍼라제 인코딩 서열은 숙주 세포, 바람직하게는 박테리아 숙주 세포, 바람직하게는 대장균 숙주 세포의 게놈 내에 도입된다. 바람직한 구체예에서, 내인성 rfb 유전자좌 및 적용 가능한 경우 gtrS 코딩 서열은 불활성화되고, 바람직하게는 이의 선행자와 비교하여 재조합 숙주 세포의 게놈으로부터 결실되고, 바람직하게는 이들은 각각 원하는 이종성 rfb 유전자좌 및 적용 가능한 경우 원하는 gtrS 코딩 서열에 의해 대체된다. 특정 구체예에서, 숙주 세포는 대장균의 K-12(비제한적인 예로서, 대장균 균주 W3110은 K-12 균주임), 또는 대장균의 B 균주(비제한적인 예로서, 대장균 균주 BL21은 B 균주임), 또는 일차 야생형 분리주와 대조적으로 대장균의 다른 잘 정의된 균주, 예를 들어 실험실 균주 또는 생산 균주이다. 바람직한 구체예에서, 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 gtrS 유전자 및 O4 rfb 유전자좌를, O4 항원 또는 글루코실화된 O4 항원을 발현하지 않는 대장균 내에 도입시킴으써 이러한 대장균으로부터 유래한다. 숙주 세포의 전구체로서 대장균 K-12 또는 대장균 B와 같은 잘 특성 규명된 균주를 사용하는 이점은 생산 균주의 특성이 잘 규정되어 있기 때문에 다양한 O-항원 바이오컨쥬게이트에 대해 유사한 생산 공정을 사용할 수 있는 가능성이다. 다양한 O-항원의 바이오컨쥬게이트가 상이하게 행동할 것이고, 발현 과정이 생산 균주마다 최적화될 수 있지만, 적어도 O-항원 바이오컨쥬게이트의 생성을 위한 기본 과정은 야생형 분리주와 같은 알려지지 않은 균주가 숙주 균주의 생성을 위한 전구체로서 사용되는 경우보다 더 잘 규정된 전구체 균주를 사용하여 더욱 예측가능할 것이다. 이러한 방식으로, 예를 들어, WO 2015/124769 및 WO 2017/035181에 기술된 바와 같은 O1A, O2, O6A 및 O25B 바이오컨쥬게이트와 같은 이전에 기술된 대장균 O-항원 바이오컨쥬게이트의 생산에 대한 경험은 다른 대장균 O-항원 바이오컨쥬게이트의 생산을 설계하기 위한 기초로 사용될 수 있다. gtrS와 달리, gtrA 및 gtrB 유전자는 혈청형 특이적이지 않으며, 특정 구체예에서, 숙주 세포에 대해 상동성이다(예를 들어, 대장균 K12 균주 W3110은 내인성 gtrS 유전자를 대체하는 SEQ ID NO: 4의 글루코실 트랜스퍼라제 또는 이와 적어도 80% 동일한 글루코실 트랜스퍼라제를 인코딩하는 O4-혈청형 특이적 재조합 도입된 gtrS 유전자와 함께 기능할 수 있는 gtrA 및 gtrB 유전자를 포함한다). 다른 구체예에서, gtrA 및 gtrB 유전자(각각 SEQ ID NO: 7 및 8과 적어도 약 80% 동일한 GtrA 및 GtrB를 인코딩하며, 각각 박토프레놀-연결된 글루코스 트랜스로카제 및 박토프레놀 글루코실 트랜스퍼라제 활성을 가짐) 중 하나 또는 둘 모두는 또한 예를 들어, 숙주 세포가 내인성 gtrA 및/또는 gtrB 유전자를 갖지 않는 경우 숙주 세포에 재조합적으로 도입된다.

또한, 담체 단백질에 공유 결합된 대장균 O1A, O2, O6A, O8, O15, O16, O18A, O25B 또는 O75 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 제공된다. 이러한 숙주 세포(예를 들어, 재조합 숙주 세포)는 O-항원 다당류에 특이적인 rfb 유전자 클러스터의 뉴클레오티드 서열을 포함한다. rfb 유전자 클러스터는 야생형 대장균 균주로부터 분리되고, 하나의 숙주 세포 내부에서 올리고사카릴 트랜스퍼라제(예를 들어, PgIB) 및 담체 단백질(예를 들어, EPA)을 인코딩하는 핵산과 조합될 수 있어 관심 대장균 O-항원 또는 이의 바이오컨쥬게이트를 생성하는 재조합 숙주 세포를 수득할 수 있다. 예를 들어, 이러한 숙주 세포는 WO 2014/037585, WO 2009/104074, 및 WO 2009/089396에 기술된 것과 같은 바이오컨쥬게이션 기술을 사용하여 rfb 유전자 클러스터, 올리고사카릴 트랜스퍼라제(예를 들어, PglB) 및 담체 단백질(예를 들어, EPA)을 포함하는 하나 이상의 플라스미드를 포함하도록 재조합 접근법을 사용하여 조작될 수 있다. 바람직하게는, 숙주 세포는 이들의 게놈 내로 통합된 rfb 유전자 클러스터를 포함한다. 올리고사카릴 트랜스퍼라제, 담체 단백질 및 적용 가능한 경우 gtrS 유전자를 인코딩하는 핵산은 특정 구체예에서, 또한 숙주 세포의 게놈 내로 통합된다. 이종성 또는 상동성 gtrA 및 gtrB 유전자는 특정 구체예에서, 또한 숙주 세포의 게놈 내에 통합된다.

O1A, O2, O6A 및 O25B 항원에 대한 바이오컨쥬게이트의 제조는 WO 2015/124769 및 WO 2017/035181에 상세히 설명되어 있다. 각 대장균 O 항원(rfb 유전자좌)에 대한 예시적인 유전자 클러스터는 문헌 [Iguchi A, et al, DNA Research, 2014, 1-7 (doi: 10.1093/dnares/dsu043), and in DebRoy C, et al, PLoS One. 2016, 11(1):e0147434 (doi: 10.1371/journal.pone.0147434; correction in: Plos One. 2016, 11(4):e0154551, doi: 10.1371/journal.pone.0154551)]에 설명되어 있다. rfb 클러스터에 대한 핵산 서열 및 여기에 인코딩된 단백질에 대한 아미노산 서열 또한 GenBank와 같은 공개 데이터베이스에서 찾아볼 수 있다. 본원에 기재된 혈청형의 다당류 항원과의 바이오컨쥬게이트에 대한 생산 균주에 사용될 수 있는 rfb 클러스터에 대한 예시적인 서열은 또한 SEQ ID NO: 9 및 11-19에 제공된다. 따라서, 상기 언급된 요망되는 바이오컨쥬게이트 각각에 있어서, 각 rfb 클러스터는 숙주 세포 내로 도입되어 요망되는 O-항원에 대한 특이적 rfb 클러스터를 가질뿐만 아니라 올리고사카릴트랜스퍼라제 및 담체 단백질을 인코딩하는 핵산을 함유하는 숙주 세포를 수득할 수 있다. 상기 언급된 이유로, 바람직하게는 숙주 세포는 재조합 숙주 세포이며, 바람직하게는 비교적 잘 공지된 특징을 갖는 균주, 예컨대 대장균 실험실 또는 생성 균주, 예를 들어, 대장균 K12 또는 대장균 BL21 등으로부터 유래된다. 바람직하게는, rfb 클러스터는 숙주 세포에 이종성이며, 예를 들어, 숙주 세포의 전구체 세포에 도입되며, 바람직하게는 이의 게놈 내에 통합된다. 바람직하게는, 원래 rfb 유전자 클러스터가 전구체 세포에 존재하는 경우, 이는 숙주 세포에서 관심 O-항원에 대한 rfb 유전자 클러스터에 의해 대체되어 관심 O-항원의 바이오컨쥬게이트의 생성을 가능하게 하였다. 바람직하게는, 올리고사카릴트랜스퍼라제는 숙주 세포에 대해 이종성이며, 특정 구체예에서, 이러한 올리고사카릴트랜스퍼라제를 인코딩하는 핵산은 숙주 세포의 게놈 내로 통합된다.

본원에 제공된 임의의 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포)는 단백질의 N-글리코실화에서 활성인 추가적인 효소를 인코딩하는 핵산을 포함하며, 예를 들어, 본원에 제공된 숙주 세포는 다른 글리코실트랜스퍼라제를 인코딩하는 핵산 또는 올리고사카릴 트랜스퍼라제를 인코딩하는 핵산을 추가로 포함할 수 있다.

본원에 제공된 숙주 세포는 올리고사카릴 트랜스퍼라제를 인코딩하는 핵산을 포함한다. 올리고사카릴 트랜스퍼라제는 N-글리코실화 컨센서스 모티프를 포함하는 초기 폴리펩티드 사슬의 아스파라긴 잔기로 지질-연결된 다당류를 전달한다. 올리고사카릴 트랜스퍼라제를 인코딩하는 핵산은 숙주 세포에 대해 고유할 수 있거나, 유전자 접근법을 사용하여 숙주 세포 내에 도입될 수 있다. 바람직한 구체예에서, 올리고사카릴 트랜스퍼라제는 숙주 세포에 대해 이종성이다. 대장균은 자연적으로 올리고사카릴 트랜스퍼라제를 포함하지 않으며, 따라서 대장균이 바이오컨쥬게이트의 생성을 위한 숙주 세포로서 사용되는 경우, 이종성 올리고사카릴 트랜스퍼라제는 예를 들어, 유전자 조작에 의해 도입시 이러한 숙주 세포에 포함된다. 올리고사카릴 트랜스퍼라제는 본 개시내용의 관점에서 당업계에 공지된 임의의 공급원으로부터 비롯될 수 있다.

특정 구체예에서, 예를 들어, 비제한적인 예로서 PglL로서 O-글리코실트랜스퍼라제와 같은 N-글리코실트랜스퍼라제 활성을 갖는 올리고사카릴 트랜스퍼라제에 대한 대안은 예를 들어, WO 2016/82597에 기술된 바와 같이 담체 단백질에서 이들 자신의 상이한 글리코실화 컨센서스 서열과 함께 사용될 수 있다. 따라서, O-글리코실트랜스퍼라제와 같은 다른 글리코실트랜스퍼라제는 본 발명에 따른 올리고사카릴트랜스퍼라제로서 사용될 수 있다.

특정 바람직한 구체예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터로부터의 올리고사카릴 트랜스퍼라제이다. 예를 들어, 한 구체예에서, 올리고사카릴 트랜스퍼라제는 캄포르박터 제주니로부터의 올리고사카릴 트랜스퍼라제이다(즉, pglB; 예를 들어, 문헌 [Wacker et al., 2002, Science 298:1790-1793; see also, e.g., NCBI Gene ID: 3231775, UniProt Accession No. O86154] 참조). 또 다른 구체예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터 라리로부터의 올리고사카릴 트랜스퍼라제이다(예를 들어, NCBI Gene ID: 7410986 참조).

특정 구체예에서, 올리고사카릴 트랜스퍼라제는 천연(야생형) 단백질 또는 이의 임의의 변이체, 예컨대 국제 특허 출원 공개 WO 2016/107818 및 WO 2016/107819에 기술된 것들을 포함하는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제이다. PglB는 지질-연결된 다당류를 컨센서스 서열 SEQ ID NO: 1 및 SEQ ID NO: 2의 아스파라긴 잔기로 전달할 수 있다. 특정 구체예에서, PglB 다당류 트랜스퍼라제는 SEQ ID NO: 6 또는 이의 변이체를 포함한다. 특정 구체예에서, 야생형 PglB에서 하나 이상의 내인성 글리코실화 컨센서스 서열은 변이되어 PglB 자가글리코실화를 회피하였으며, 예를 들어, SEQ ID NO: 6은 돌연변이 N534Q를 포함한다. 본원에 제공된 재조합 숙주 세포에 사용하기에 적합한 변이체 PglB 올리고사카릴 트랜스퍼라제의 예는 N311V, K482R, D483H, A669V, Y77H, S80R, Q287P 및 K289R로 구성된 군으로부터 선택되는 적어도 하나의 돌연변이를 포함하는 SEQ ID NO: 6의 PglB 올리고사카릴 트랜스퍼라제를 포함한다. 한 특정 구체예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 N311V를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 특정 구체예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H 및 N311V를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 특정 구체예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 N311V, K482R, D483H 및 A669V를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 특정 구체예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 포함하는 SEQ ID NO: 6을 갖는다. 특정 PglB 올리고사카릴 트랜스퍼라제 변이체가 특정 혈청형의 대장균 O-항원 바이오컨쥬게이트의 생성에서 현저하게 개선된 수율을 제공한다는 것이 본원에서 발견되고 설명되었다. 주어진 대장균 O-항원에 대한 개선되거나 최적의 PglB 변이체는 예측할 수 없었다. 따라서, 특정 양태에서, 본 발명은 또한 올리고사카릴 트랜스퍼라제로서 특정 PglB 변이체를 사용하여 특정 대장균 O-항원의 바이오컨쥬게이트를 생성하는 방법을 제공한다. SEQ ID NO: 6과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일하며, 여전히 올리고사카릴 트랜스퍼라제 활성을 가져, 바람직하게는 본원에서 조합되어 개시된 지정된 위치에서 특정 아미노산 중 하나 이상을 갖는 PglB의 추가의 변이체 (예를 들어, 77Y, 80S, 287Q, 289K, 311N, 482K, 483D, 669A; 또는 311V; 또는 311V, 482R, 483H, 669V; 또는 77H, 80R, 287P, 289R, 311V; 또는 77H, 311V; 등)가 또한 바이오컨쥬게이트의 생성에 사용될 수 있다.

특정 구체예에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6, 또는 바람직하게는 돌연변이 N311V를 포함하는 SEQ ID NO: 6, 또는 더욱 바람직하게는 돌연변이 Y77H 및 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.

다른 특정 구체예에서, 담체 단백질에 공유 결합된 대장균 O1A, O6A, 또는 O15 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6 또는 바람직하게는, 돌연변이 N311V, K482R, D483H 및 A669V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.

특정 구체예에서, 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6, 또는 바람직하게는 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.

특정 구체예에서, 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6, 또는 바람직하게는 돌연변이 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.

특정 구체예에서, 담체 단백질에 공유 결합된 대장균 O8, O18A, O25B, 또는 O2 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 바람직하게는 SEQ ID NO: 6은 위치 77, 80, 287, 289, 311, 482, 483, 및 669에서 아미노산 돌연변이를 포함하지 않는다.

일부 구체예에서, 본원에 제공된 임의의 숙주 세포는 담체 단백질, 예를 들어 숙주 세포 글리코실화 기구에 의해 생성된 O-항원 다당류(들)가 부착되어 바이오컨쥬게이트를 형성할 수 있는 단백질을 인코딩하는 핵산을 포함한다. 숙주 세포는, 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D를 포함하는 본 개시의 관점에서 당업자에게 공지된 임의의 담체 단백질을 인코딩하는 핵산을 포함할 수 있다.

바람직한 구체예에서, 숙주 세포는 탈독소화된 P. 애루기노사의 외독소 A(EPA)를 인코딩하는 핵산을 추가로 포함한다. 바람직하게는, EPA 담체 단백질은 1-10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1-10개, 바람직하게는 2-4개, 및 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 SEQ ID NO: 1의 아미노산 서열을 가지며, 더욱 바람직하게는 SEQ ID NO: 2의 아미노산 서열을 갖는 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, 숙주 세포는 SEQ ID NO: 3을 포함하는 EPA-4 담체 단백질을 인코딩하는 핵산을 추가로 포함한다.

특정 구체예에서, 본원에 기재된 숙주 세포에 의해 바이오컨쥬게이트의 생성에 사용되는 담체 단백질은 "tag", 즉 담체 단백질의 분리 및/또는 확인을 허용하는 아미노산의 서열을 포함한다. 예를 들어, tag를 담체 단백질에 추가하는 것은 그 단백질의 정제에 유용할 수 있으며, 따라서 컨쥬게이트 백신의 정제는 태깅된 담체 단백질을 포함한다. 본원에 사용될 수 있는 예시적인 tag는 비제한적으로, 히스티딘(HIS) tag(예를 들어, 헥사-히스티딘-tag, 또는 6XHis-Tag), FLAG-TAG 및 HA tag를 포함한다. 특정 구체예에서, 본원에 사용된 tag는 제거가능하며, 예를 들어, 일단 이들이 더 이상 필요하지 않으면, 예를 들어, 단백질이 정제된 후에 예를 들어, 화학적 제제 또는 효소적 수단에 의해 제거된다. 다른 구체예에서, 담체 단백질은 tag를 포함하지 않는다.

특정 구체예에서, 본원에 기재된 담체 단백질은 담체 단백질을 발현하는 숙주 세포의 주변세포질 공간으로 담체 단백질을 표적화하는 신호 서열을 포함한다. 특정 구체예에서, 신호 서열은 대장균 DsbA, 대장균 외막 포린 A(OmpA), 대장균 말토스 결합 단백질(MalE), 에르위니아 카로토보란스 펙테이트 리아제(Erwinia carotovorans pectate lyase)(PelB), FlgI, NikA, 또는 바실러스 종 엔독실라나제(XynA), 열 민감 대장균 장독소 LTIIB, 바실러스 엔독실라나제 XynA 또는 대장균 플래겔린(FlgI)으로부터 비롯된다. 한 구체예에서, 신호 서열은 SEQ ID NO: 10을 포함한다. 신호 서열은 단백질의 주변 세포질로의 전위 후에 절단될 수 있고, 따라서 바이오컨쥬게이트의 최종 담체 단백질에 더 이상 존재하지 않을 수 있다.

특정 구체예에서, 추가적인 변형이 (예를 들어, 재조합 기술을 사용하여) 본원에 기재된 숙주 세포 내로 도입될 수 있다. 예를 들어, 아마도 경쟁하거나 간섭하는 글리코실화 경로(예를 들어, 숙주 세포 내로 재조합으로 도입되는 글리코실화에 관련된 하나 이상의 이종성 유전자와 경쟁하거나 이를 간섭함)의 일부를 형성하는 단백질을 인코딩하는 숙주 세포 핵산(예를 들어, 유전자)은 이들을 불활성/기능이상으로 만드는 방식으로 숙주 세포 배경(게놈)에서 결실되거나 변형될 수 있다(즉, 결실/변형되는 숙주 세포 핵산은 기능성 단백질을 인코딩하지 않음). 특정 구체예에서, 핵산이 본원에 제공된 숙주 세포의 게놈으로부터 결실될 때, 이들은 바람직한 서열, 예를 들어 O 항원 다당류 또는 이의 바이오컨쥬게이트의 생성에 유용한 서열로 대체된다.

숙주 세포에서 결실될 수 있는 (일부 경우에, 다른 요망되는 핵산 서열로 대체될 수 있는) 예시적인 유전자 또는 유전자 클러스터는 waaL과 같은 당지질 생합성에 관여하는 숙주 세포의 유전자 또는 유전자 클러스터(예를 들어, 문헌 [Feldman et al., 2005, PNAS USA 102:3016-3021] 참조), 지질 A 코어 생합성 클러스터(waa), 갈락토스 클러스터(gal), 아라비노스 클러스터(ara), 콜론산 클러스터(wc), 캡슐 다당류 클러스터, 운데카프레놀-p 생합성 유전자(예를 들어, uppS, uppP), und-P 재순환 유전자, 뉴클레오티드 활성화된 당 생합성에 관여하는 대사 효소, 엔테로박터 공통 항원 클러스터(eca) 및 프로파지 O 항원 변형 클러스터, 예컨대 gtrABS 클러스터 또는 이의 영역을 포함한다. 특정 구체예에서, 본원에 기재된 숙주 세포는 이들이 요망되는 O 항원 다당류, 예를 들어 글루코실화된 O4 항원 다당류 이외의 임의의 O 항원 다당류를 생성하지 않도록 변형된다.

특정 구체예에서, waaL 유전자는 본원에 제공된 숙주 세포(예를 들어, 재조합 숙주 세포)의 게놈으로부터 결실되거나 기능적으로 불활성화된다. 용어 "waaL" 및 "waaL 유전자"는 주변 세포질에 위치한 활성 부위를 갖는 막 결합 효소를 인코딩하는 O-항원 리가제 유전자를 지칭한다. 인코딩된 효소는 운데카프레닐포스페이트(UPP)-결합된 O 항원을 지질 A 코어에 전달하여 지질다당류를 형성한다. 내인성 waaL 유전자(예를 들어, ΔwaaL 균주)의 결실 또는 방해하는 O-항원의 지질 A로의 전달을 방해하고, 대신 O-항원을 또 다른 생체분자, 예컨대 담체 단백질로의 전달을 향상시킬 수 있다.

또 다른 특정 구체예에서, waaL 유전자, gtrA 유전자, gtrB 유전자, gtrS 유전자 및 rfb 유전자 클러스터 중 하나 이상은 본원에 제공된 원핵 숙주 세포의 원래의 게놈으로부터 결실되거나 기능적으로 불활성화된다.

한 구체예에서, 본원에 사용된 숙주 세포는 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성하는 대장균이고, 여기서 waaL 유전자는 숙주 세포의 게놈으로부터 결실되거나 기능적으로 불활성화되고, 대장균 O4 항원 다당류에 특이적인 gtrS 유전자가 삽입된다. 글루코실화된 O4 O-항원의 바이오컨쥬게이트를 위한 생산 균주에 대한 특정 구체예에서, SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 gtrS 유전자는 모 균주의 gtrS 유전자를 O4 항원의 글루코실화를 담당하는 것으로 대체하도록 모 균주의 gtrS 유전자 대신 삽입된다. 이러한 모 균주의 예는 대장균 K-12 균주 W3110이다. gtrA 및 gtrB 유전자는 모 균주에 대해 상동일 수 있거나, 대안적으로 이들 유전자 중 하나 또는 둘 모두는 모 균주에 대해 이종성일 수 있다. 전형적으로, gtrS 유전자와 달리 이러한 gtrA 및 gtrB 유전자는 O-항원 구조에 특이적이지 않다.

또한 재조합 숙주 세포를 제조하는 방법이 본원에 제공된다. 본원에 기재된 방법에 의해 생성된 재조합 숙주 세포는 대장균 O 항원의 바이오컨쥬게이트를 생성하는데 사용될 수 있다. 방법은 하나 이상의 재조합 핵산 분자를 세포 내로 도입하여 재조합 숙주 세포를 생성하는 것을 포함한다. 전형적으로, 재조합 핵산 분자는 이종성이다. 본 개시내용의 관점에서 당업계에 공지된 임의의 방법을 사용하여 재조합 핵산 분자를 숙주 세포에 도입할 수 있다. 재조합 핵산은 당업자에게 공지된 임의의 방법, 예를 들어 전기천공, 화학적 형질전환, 열 충격, 자연 형질전환, 파지 형질도입 및 컨쥬게이션을 사용하여 본원에 기재된 숙주 세포 내로 도입될 수 있다. 특정 구체예에서, 재조합 핵산은 플라스미드를 사용하여 본원에 기재된 숙주 세포 내로 도입된다. 예를 들어, 이종성 핵산은 플라스미드(예를 들어, 발현 벡터)에 의해 숙주 세포에서 발현될 수 있다. 또 다른 특정 구체예에서, 이종성 핵산은 예를 들어, 국제 특허 출원 공개 WO 2014/037585, WO 2014/057109, 또는 WO 2015/052344에 기재된 바와 같은 게놈 내로의 삽입 방법을 사용하여 본원에 기재된 숙주 세포 내로 도입된다.

한 구체예에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성하기 위한 재조합 숙주 세포를 제조하는 방법은 하나 이상의 재조합 핵산 분자를 세포, 바람직하게는 대장균 세포에 도입하여 재조합 숙주 세포를 생성하는 것을 포함한다. 이러한 구체예에서, 세포 내로 도입된 재조합 핵산 분자는 (i) 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열; (ii) SEQ ID NO: 4에 대해 적어도 80%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열로서, 글루코실 트랜스퍼라제는 대장균 글루코실화된 O4 항원 다당류를 생성하기 위해 대장균 O4 항원 다당류를 변형시킬 수 있는, 뉴클레오티드 서열; (iii) 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및 (iv) 대장균 글루코실화된 O4 항원 다당류를 담체 단백질에 공유 결합시켜 바이오컨쥬게이트를 생성할 수 있는 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 포함한다. 바람직한 구체예에서, SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열은 내인성 gtrS 유전자를 대체한다. 내인성 gtrS를 삭제하면 글루코실화된 O4 항원 다당류 구조의 생성을 방해하지 않을 것이라는 이점이 있다. 특정 구체예에서, 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열은 재조합 숙주 세포를 제조하는 데 사용되는 모 균주의 내인성 rfb 유전자 클러스터를 대체한다. 세포가 아직 gtrA 및/또는 gtrB 유전자를 인코딩하지 않는 경우, 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 동일성을 갖는 트랜스로카제(gtrA) 및 글리코실트랜스퍼라제(gtrB)를 인코딩하는 뉴클레오티드 서열이 세포에 도입될 수 있다. 세포가 이미 gtrA 및 gtrB 유전자를 인코딩하는 경우(예를 들어, 대장균 K-12 균주 W3110의 경우), 이러한 유전자를 도입하거나 변경할 필요가 없다.

특정 구체예에서, 글루코실 트랜스퍼라제(O4 항원에 글루코스 분지를 부가하는데 특이적인 gtrS)는 SEQ ID NO: 4를 갖는다.

특정 구체예에서, 올리고사카릴 트랜스퍼라제는 C. 제주니로부터의 PglB이다. 이러한 한 구체예에서, 올리고사카릴 트랜스퍼라제는 SEQ ID NO: 6의 아미노산 서열을 포함한다. 또 다른 이러한 구체예에서, 올리고사카릴 트랜스퍼라제는 돌연변이 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 포함한다. 또 다른 이러한 구체예에서, 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H 및 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 포함한다.

또 다른 특정 구체예에서, 담체 단백질은 SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함한다. 또 다른 특정 구체예에서, 담체 단백질은 EPA, 바람직하게는 EPA-4, 예컨대 SEQ ID NO: 3을 포함하는 EPA-4이다.

도구 및 모델 유기체 둘 모두로서 분자 생물학에서 관례적으로 사용되는 대장균 균주는 예를 들어, 본 발명에 따른 특정 구체예에서 숙주 세포에 대한 모체로서 사용될 수 있다. 비제한적 예는 대장균 K12 균주(예를 들어, 예컨대 W1485, W2637, W3110, MG1655, DH1, DH5α, DH10 등), B 균주(예를 들어, BL-21, REL606 등), C 균주 또는 W 균주를 포함한다. 한 특정 구체예에서, 숙주 균주는 모 균주 W3110으로부터 유래된다. 이 균주는 예를 들어, 예일의 E. coli Genetic Stock Center에서 얻을 수 있다. 대장균에 대한 자세한 내용에 있어서는, 예를 들어, Ecoliwiki.net. 참조.

컨쥬게이트 및 바이오컨쥬게이트를 생성하는 방법

또한, 본원에 기재된 대장균 O 항원 다당류의 글리코컨쥬게이트를 생성하는 방법이 제공된다. 바이오컨쥬게이트를 포함하는 글리코컨쥬게이트는 예를 들어, 생산을 위해 본원에 기재된 재조합 숙주 세포를 사용하여 시험관내 또는 생체내에서 제조될 수 있다.

일부 구체예에서, 글리코컨쥬게이트는 화학적 합성에 의해 제조될 수 있으며, 즉 숙주 세포 외부에서 (시험관내) 제조될 수 있다. 예를 들어, 대장균 O 항원 다당류는 담체 단백질 뿐만 아니라 다당류/올리고당류에서 활성화 반응기를 사용하는 것을 포함하는, 당업자에게 공지된 방법을 사용하여 담체 단백질에 컨쥬게이션될 수 있다. 예를 들어, 그 개시내용이 본원에 참조로 통합되는 문헌 [Pawlowski et al., 2000, Vaccine 18:1873-1885; and Robbins, et al., 2009, Proc Natl Acad Sci USA 106:7974-7978)] 참조. 이러한 접근법은 숙주 세포로부터 항원성 다당류/올리고당을 추출하고, 다당류/올리고당을 정제하고, 다당류/올리고당을 화학적으로 활성화하고, 다당류/올리고당을 담체 단백질에 컨쥬게이션시키는 것을 포함한다.

일부 구체예에서, 본원에 기재된 숙주 세포를 사용하여 담체 단백질에 공유 결합된 대장균 O 항원 다당류를 포함하는 바이오컨쥬게이트를 생성할 수 있다. 숙주 세포를 사용하여 이러한 바이오컨쥬게이트를 생성하는 방법은 당업계에 공지되어 있다. 예를 들어, WO 2003/074687 및 WO 2006/119987을 참조한다. 이러한 방법은 바이오컨쥬게이트의 생성을 위한 조건 하에 본원에 기재된 임의의 재조합 숙주 세포를 배양하는 것을 포함한다. 바이오컨쥬게이트는 본 개시내용의 관점에서 당업계에 공지된 임의의 방법을 사용하여 재조합 숙주 세포로부터 단리, 분리 및/또는 정제될 수 있다. 예를 들어, 바이오컨쥬게이트는 예를 들어, 크로마토그래피(예를 들어, 이온 교환, 음이온 교환, 친화도 및 사이징 컬럼 크로마토그래피), 원심분리, 차등 용해도에 의해 또는 단백질 정제를 위한 임의의 다른 표준 기술에 의해 단백질의 정제를 위해 당업계에 공지된 임의의 방법에 의해 정제될 수 있다. 예를 들어, WO 2009/104074에 기술된 방법을 참조한다. 추가로, 바이오컨쥬게이트는 정제를 용이하게 하기 위해 이종성 폴리펩티드 서열에 융합될 수 있다. 특정 바이오컨쥬게이트를 정제하는데 사용되는 실제 조건은 부분적으로 바이오컨쥬게이트의 순 전하, 소수성 및/또는 친수성과 같은 인자에 의존적일 것이며, 당업자에게 명백할 것이다. O1A, O2, O6A 및 O25B에 대한 바이오컨쥬게이트의 제조 뿐만 아니라 이들을 포함하는 백신 조성물은 예를 들어, WO 2015/124769및 WO 2017/035181에 기재되어 있다.

또한, 본원에 기재된 방법에 의해, 즉, 본원에 기재된 재조합 숙주 세포를 사용하여 생성된 바이오컨쥬게이트가 제공된다.

일부 구체예에서, 담체 단백질에 공유 결합된 대장균 O-항원 다당류의 바이오컨쥬게이트를 제조하는 방법은 (i) (a) O-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열; (b) SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하고, 더욱 바람직하게는 각각 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 4개의 글리코실화 부위를 포함하는 담체 단백질, 바람직하게는 EPA를 인코딩하는 뉴클레오티드 서열; 및 (c) 올리고당 트랜스퍼라제, 예를 들어 PglB 올리고당 트랜스퍼라제 또는 이의 변이체를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하는 단계를 포함한다.

특정 구체예에서, 본원에 기재된 재조합 숙주 세포를 사용하여 생성된 대장균 O-항원 다당류는 특정 다당류 대 단백질 중량비(w/w)로 담체 단백질에 공유 결합된다. 담체 단백질에 공유 결합된 O-항원 다당류의 양의 이러한 중량비는 "글리칸/단백질 비" 또는 "다당류/단백질 비" 또는 "PS/단백질 비"로 언급된다. 일부 구체예에서, O-항원 다당류는 약 1:20 내지 20:1, 바람직하게는 1:10 내지 10:1, 더욱 바람직하게는 1:3 내지 3:1의 다당류 대 단백질 (w/w) 비율로 담체 단백질에 공유 결합된다. 본원에 기재된 바이오컨쥬게이트에 대한 특정 비제한적인 구체예에서, 글리칸/단백질 비율은 약 0.1 내지 0.5, 예컨대 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 또는 0.5이다. 이러한 구체예에서, O-항원 다당류:단백질의 중량비는 특정 O-항원 혈청형에 따라 약 1:10 내지 1:2, 예컨대 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3 또는 1:2이다. 특정 구체예에서, 글리칸/단백질 비는 약 0.15 내지 약 0.45이다. 일반적으로, O-항원 다당류 대 담체 단백질의 더 높은 글리칸/단백질 비율이 선호되는데, 그 이유는 다량의 담체 단백질이 일부 경우에 면역학적 간섭을 유발할 수 있기 때문이다. 또한, 더 높은 글리칸/단백질 비율은 바이오컨쥬게이트 형태로 투여된 충분한 O-항원 다당류를 얻는 데 도움이 될 것이며, 담체 단백질의 양은 상대적으로 낮게 유지되며, 이는 다중 혈청형이 조성물 예를 들어, 적어도 4개의 상이한 O-항원, 적어도 5개의 상이한 O-항원, 적어도 6개의 상이한 O-항원, 적어도 7개의 상이한 O-항원, 적어도 8개의 상이한 O-항원, 적어도 9개의 상이한 O-항원, 적어도 10개의 상이한 O-항원 등으로부터의 바이오컨쥬게이트를 포함하는 조성물에 의해 커버되어야 하는 다가 조성물에 특히 유리하다.

본 발명에 따른 컨쥬게이트의 글리칸/단백질 비는 단백질 양 및 글리칸 양을 결정함으로써 결정될 수 있다. 단백질 양은 280 nm에서의 UV 흡광도(A280)를 측정하여 결정될 수 있다. 글리칸 양은 (예를 들어, 표 1의 O8에 대한 Man, 및 표 1의 다른 글리칸에 대한 GlcNAc의) 반복 단위에서 당의 펄스 전류계 검출(IC-PAD)과 이온 크로마토그래피를 기반으로 결정될 수 있으며, 그 후 반복 단위의 구조 정보는 총 글리칸 양을 계산하는데 사용될 수 있다(예를 들어, O1A의 반복 단위는 845 Da의 몰 질량을 가지며, 이러한 반복 단위 1몰은 1몰의 GlcNAc를 함유하며, 이는 GlcNAc의 양이 IC-PAD에 의해 결정될 때 총 글리칸 양의 계산을 가능하게 한다).

일부 구체예에서, 본원에 기재된 세포 및 방법에 따라 재조합 숙주 세포를 사용하여 생성된 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트는 L-Rh 당의 위치 2에서 특정 정도의 아세틸화를 갖는다. 바이오컨쥬게이트에서 O25B 항원 다당류의 O-아세틸화 정도는 바람직하게는 적어도 30%, 바람직하게는 적어도 50%, 예컨대 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%이다.

유사하게는, 바이오컨쥬게이트에서 대장균 O16 항원 다당류의 O-아세틸화 정도는 바람직하게는 적어도 30%, 바람직하게는 적어도 50%, 예컨대 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%이다.

특정 구체예에서, O-항원 다당류의 바이오컨쥬게이트를 제조하는 방법은 생성되는 O-항원 다당류 바이오컨쥬게이트에 따라 특정 올리고사카릴 트랜스퍼라제 효소, 특히 PglB 올리고사카릴 트랜스퍼라제 또는 이의 변이체를 인코딩하는 핵산 서열을 포함하는 재조합 숙주 세포를 제공하는 단계를 포함한다. 특정 올리고사카릴 트랜스퍼라제 효소 변이체는 숙주 세포에 의해 생성된 바이오컨쥬게이트의 수율에 영향을 미칠 수 있다. 전형적으로, 수율이 특정 바이오컨쥬게이트를 생산하는 비용에 영향을 미치기 때문에 더 높은 수율이 바람직하며, 이는 여러 상이한 바이오컨쥬게이트를 포함하는 다가 조성물에 특히 중요한다. 일부 구체예에서, 방법은 재조합 숙주 세포로부터 바이오컨쥬게이트를 분리하는 것을 추가로 포함한다.

한 특정 구체예에서, O-항원이 O1A, O6A, 또는 O15 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 N311V, K482R, D483H, 및 A669V의 아미노산 돌연변이를 포함하고, 여기에서 아미노산 돌연변이는 SEQ DI NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.

또 다른 특정 구체예에서, O-항원이 글루코실화된 O4 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 아미노산 돌연변이 N311V, 또는 Y77H 및 N311V의 아미노산 돌연변이를 포함하며, 여기에서 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.

또 다른 특정 구체예에서, O-항원인 O16 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며, 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.

또 다른 특정 구체예에서, O-항원이 O75 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 N311V의 아미노산 돌연변이를 포함하며, 여기에서 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.

또 다른 특정 구체예에서, O-항원이 O8, O18A, O25B 또는 O2 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 SEQ ID NO: 6의 아미노산 서열을 포함하며, 여기에서 SEQ ID NO: 6은 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다. 이의 특정 구체예에서, PglB 올리고사카릴 트랜스퍼라제는 SEQ ID NO: 6의 아미노산 서열을 포함한다.

일부 구체예에서, 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택된다.

특정 구체예에서, 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)이다. 바람직하게는, EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다. 바람직하게는, 각각의 글리코실화 부위는 SEQ ID NO: 2의 아미노산 서열을 갖는 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, 숙주 세포는 SEQ ID NO: 3을 포함하는 EPA-4 담체 단백질을 인코딩하는 핵산을 포함한다.

또한, 상기 나타낸 O-항원/PglB 올리고사카릴 트랜스퍼라제 쌍에 따라 올리고사카릴 트랜스퍼라제 효소를 인코딩하는 재조합 숙주 세포를 사용하여 생성된 O-항원 다당류의 바이오컨쥬게이트가 본원에 제공된다. 또한, 이러한 바이오컨쥬게이트를 포함하는 조성물이 제공된다. 특정 구체예에서, 조성물은 적어도 2개, 바람직하게는 적어도 3개, 더욱 바람직하게는 적어도 5개, 더욱 더 바람직하게는 적어도 7개의 이러한 바이오컨쥬게이트를 포함한다.

일부 구체예에서, 상기 나타낸 O-항원/PglB 올리고사카릴 트랜스퍼라제 쌍에 따라 올리고사카릴 트랜스퍼라제 효소를 인코딩하는 재조합 숙주 세포에 의해 생성된 O-항원 다당류의 바이오컨쥬게이트는 바람직하게는 본원에 기재된 바람직한 속성, 예를 들어 글리칸/단백질 비 및/또는 다중-글리코실화된 담체 단백질의 양 또는 중량 중 하나 이상을 갖는다.

구체예

구체예 1은 담체 단백질에 공유 결합된 대장균 O_x 항원 다당류의 바이오컨쥬게이트를 제조하는 방법이며, 상기 방법은

여기에서,

O_x-항원이 글루코실화된 O4 항원 다당류인 경우, PglB_y는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;

O_x-항원이 O6A 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;

O_x-항원이 O15 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;

O_x-항원이 O16 항원 다당류인 경우, PglB_y는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하고;

여기에서 O1A, 글루코실화된 O4, O6A, O8, O15, O16, O18A 및 O75 항원 다당류는 표 1에 제시된 바와 같은 각각 화학식 (O1A), (O4-Glc+), (O6A), (O8), (O15), (O16), (O18A) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

구체예 2는 구체예 1의 방법이며, 여기에서 O_x-항원은 O1A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

구체예 3은 구체예 1의 방법이며, 여기에서 O_x-항원은 글루코실화된 O4 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함한다.

구체예 4는 구체예 3의 방법이며, 여기에서 재조합 숙주 세포는 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.

구체예 5는 구체예 1의 방법이며, 여기에서 O_x-항원은 O6A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

구체예 6은 구체예 1의 방법이며, 여기에서 O_x-항원은 O8 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.

구체예 7은 구체예 1의 방법이며, 여기에서 O_x-항원은 O15 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

구체예 8은 구체예 1의 방법이며, 여기에서 O_x-항원은 O16 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함한다.

구체예 9는 구체예 1의 방법이며, 여기에서 O_x-항원은 O18A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.

구체예 10은 구체예 1의 방법이며, 여기에서 O_x-항원은 O75 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V의 아미노산 돌연변이를 포함한다.

구체예 11은 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하는 방법이며, 상기 방법은

(i) (a) O_x-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;

(c) 올리고사카릴 트랜스퍼라제 PglB_y를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하는 단계; 및

PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하고,

여기에서 O_x-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이고, O_x-항원이 글루코실화된 O4 항원 다당류인 경우, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;

여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 표 1에 제시된 바와 같이 각각 화학식 (O1A), (O4-Glc+), (O6A), (O15), (O16) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

구체예 12는 구체예 1 내지 11 중 어느 하나의 방법으로서, 재조합 숙주 세포로부터 바이오컨쥬게이트를 단리하는 단계를 추가로 포함한다.

구체예 13은 구체예 1 내지 12 중 어느 하나의 방법이며, 여기에서 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택된다.

구체예 14는 구체예 13의 방법이며, 여기에서 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)이다.

구체예 15는 구체예 14의 방법이며, 여기에서 EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다.

구체예 16은 구체예 15의 방법이며, 여기에서 각각의 글리코실화 부위는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함한다.

구체예 17은 구체예 16의 방법이며, 여기에서 EPA 담체 단백질은 SEQ ID NO: 3을 포함한다.

구체예 18은 구체예 1 내지 17 중 어느 하나의 방법이며, 여기에서 재조합 숙주 세포는 대장균 세포, 예를 들어 대장균 K-12 균주, 예를 들어 균주 W3110이다.

구체예 19는 구체예 1-18 중 어느 하나의 방법에 의해 생성된 바이오컨쥬게이트이다.

구체예 20은 구체예 19의 바이오컨쥬게이트를 포함하는 조성물이다.

구체예 21은 구체예 19의 적어도 2개, 바람직하게는 적어도 3개, 더욱 바람직하게는 적어도 5개, 더욱 더 바람직하게는 적어도 7개의 바이오컨쥬게이트를 포함하는 조성물이다.

구체예 22는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하는 구체예 20 또는 21의 조성물이며, 여기에서 글루코실화된 O4 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어, 5 내지 40, 예를 들어, 7 내지 25, 예를 들어, 10 내지 20의 정수이다.

구체예 23은 적어도 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 추가로 포함하는 구체예 20 내지 22 중 어느 하나의 조성물이며, 여기에서 O25B 항원 다당류는 표 1에 제시된 화학식 (O25B)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다.

구체예 24는 적어도 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 바이오컨쥬게이트를 추가로 포함하는 구체예 20 내지 23 중 어느 하나의 조성물이며, 여기에서 O2 항원 다당류는 표 1에 제시된 화학식 (O2)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다.

구체예 25는 구체예 20 내지 24 중 어느 하나의 조성물이며, 이는 (i) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 바이오컨쥬게이트, (ii) 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 바이오컨쥬게이트, (iii) 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, (iv) 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 바이오컨쥬게이트, (v) 담체 단백질에 공유 결합된 대장균 O8 항원 다당류의 바이오컨쥬게이트, (vi) 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 바이오컨쥬게이트, (vii) 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 바이오컨쥬게이트, (viii) 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트 및 (ix) 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기서 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류는 각각 표 1에 도시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O8), (O15), (O16), (O25B) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

구체예 26은 구체예 25의 조성물이며, 이는 추가로 (x) 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기에서 O18A 항원 다당류는 표 1에 제시된 화학식 (O18A)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다.

구체예 27은 구체예 20 내지 26 중 어느 하나의 조성물이며, 여기에서 조성물은 면역원성 조성물이다.

구체예 28은 대장균, 특히 장외 병원성 대장균(ExPEC)에 대해 대상체를 백신화시키는 방법으로서, 대상체에 구체예 19의 바이오컨쥬게이트 또는 구체예 20 내지 27 중 어느 하나의 조성물 또는 면역원성 조성물을 투여하는 것을 포함하는 방법이다.

구체예 29는 장외 병원성 대장균(ExPEC)에 대한 백신화에 사용하기 위한 구체예 19의 바이오컨쥬게이트, 또는 구체예 20 내지 27 중 어느 하나의 조성물 또는 면역원성 조성물이다.

구체예 30은 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 재조합 숙주 세포이며, 재조합 숙주 세포는

여기에서,

여기에서 O1A, 글루코실화된 O4, O6A, O8, O15, O16, O18A 및 O75 항원 다당류는 표 1에 제시된 바와 같이 각각 화학식 (O1A), (O4-Glc+), (O6A), (O8), (O15), (O16), (O18A) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.

구체예 31은 구체예 30의 재조합 숙주 세포이며, 여기에서 O_x-항원은 O1A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

구체예 32는 구체예 30의 재조합 숙주 세포이며, 여기에서 O_x-항원이 글루코실화된 O4 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PdlB와 비교해 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함한다.

구체예 33은 구체예 32의 재조합 숙주 세포이며, 여기에서 재조합 숙주 세포는 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.

구체예 34는 구체예 30의 재조합 숙주 세포이며, 여기에서 O_x-항원은 O6A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

구체예 35는 구체예 30의 재조합 숙주 세포이며, 여기에서 O_x-항원은 O8 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.

구체예 36은 구체예 30의 재조합 숙주 세포이며, 여기에서 O_x-항원은 O15 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.

구체예 37은 구체예 30의 재조합 숙주 세포이며, 여기에서 O_x-항원은 O16 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함한다.

구체예 38은 구체예 30의 재조합 숙주 세포이며, 여기에서 O_x-항원은 O18A 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.

구체예 39는 구체예 30의 재조합 숙주 세포이며, 여기에서 O_x-항원은 O75 항원 다당류이고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V의 아미노산 돌연변이를 포함한다.

구체예 40은 구체예 30 내지 39 중 어느 하나의 재조합 숙주 세포이며, 여기에서 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택된다.

구현예 41은 구체예 30-40 중 어느 하나의 재조합 숙주 세포이며, 여기에서 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)이다.

구체예 42는 구체예 41의 재조합 숙주 세포이며, 여기에서 EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다.

구체예 43은 구체예 42의 재조합 숙주 세포이며, 여기에서 각 글리코실화 부위는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함한다.

구체예 44는 구체예 43의 재조합 숙주 세포이며, 여기에서 EPA 담체 단백질은 SEQ ID NO: 3을 포함한다.

구체예 45는 구체예 30 내지 44 중 어느 하나의 재조합 숙주 세포이며, 여기에서 재조합 숙주 세포는 대장균 세포, 예를 들어, 대장균 K-12 균주, 예컨대 균주 W3110이다.

구체예 46은 구체예 19에 따른 바이오컨쥬게이트이며, 여기에서 바이오컨쥬게이트는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트이다.

구체예 47은 구체예 46에 따른 바이오컨쥬게이트이며, 여기에서 담체 단백질은 SEQ ID NO: 3을 포함하는 EPA 담체 단백질이다.

구체예 48은 구체예 46 또는 47에 따른 바이오컨쥬게이트이며, 여기에서 글루코실화된 O4 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 가지며, n은 5 내지 40의 정수이다.

구체예 49는 구체예 46-48 중 어느 하나에 따른 바이오컨쥬게이트를 포함하는 조성물이다.

구체예 50은 구체예 49에 따른 조성물로서, 담체 단백질에 공유 결합된 대장균 항원 다당류를 각각 포함하는 하나 이상의 컨쥬게이트를 추가로 포함하는 조성물이다.

구체예 51은 구체예 50에 따른 조성물이며, 여기에서 하나 이상의 컨쥬게이트는 대장균 혈청형 O1A, O2, O6A, O8, O15, O16, O18A, O25B, 및 O75 중 하나 이상의 대장균 항원 다당류를 포함하며, 여기에서 O1A, O2, O6A, O8, O15, O16, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O6A), (O8), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어, 5 내지 40, 예를 들어, 7 내지 25, 예를 들어, 10 내지 20의 정수이다.

구체예 52는 구체예 51에 따른 조성물로서, 대장균 혈청형 O1A, O2, O6A, O8, O15, O16, O18A, O25B 및 O75의 컨쥬게이트를 포함하는 조성물이다.

구체예 53은 구체예 52에 따른 조성물이며, 여기에서 컨쥬게이트 각각은 바이오컨쥬게이트이다.

실시예

본 발명의 하기 실시예는 본 발명의 성질을 추가로 예시하기 위한 것이다. 하기 실시예는 본 발명을 제한하지 않으며, 본 발명의 범위는 첨부된 청구범위에 의해 결정되어야 함을 이해해야 한다.

실시예 1: 대장균 감염의 역학 데이터

균혈증 초래 대장균의 O-혈청형 분포를 결정하기 위해, 글로벌 감시 연구를 수행하였다. 2011년과 2017년 사이에 북미, 유럽, 아시아 태평양 지역 및 남미 국가에서 입원한 60세 이상의 환자로부터 3200개가 넘는 대장균 혈류 분리주를 수집하였다. 각 균주는 고전적 응집 기술 및 서열-기반 O-유전자형을 이용하여 O 항원 혈청형에 대해 분석되었다. 표 2 참조.

분리된 인간 혈액 샘플을 분석하여 그 안의 병원체의 정체와 이들의 항생제 내성 패턴을 결정하였다. 대장균 분리주를 분석 후 샘플로부터 수득하였다. 대장균 정체를 MALDI-TOF MS에 의해 확인하였다. 대장균 분리주에 대한 추가의 분석은 O-항원 혈청형을 결정하기 위해 항혈청-기반 응집 검정을 사용하여 수행하였다(DebRoy et al. (2011) Animal health research reviews / Conference of Research Workers in Animal Diseases 12, 169-185). 응집 방법으로 유형화할 수 없는 분리주를 전체-게놈 시퀀싱에 이어서 O-혈청형 wzy 및 wzx 유전자 서열을 기반으로 하는 O-지노타이핑에 의해 추가로 분석하였다.

표 2: 응집에 의한 O-지노타이핑과 응집에 의한 유형화할 수 없는 분리주의 O-지노타이핑을 기반으로 한, 2011년에서 2017년 사이에 전 세계적으로 수집된 3217개 혈액 분리주의 컬렉션으로부터 가장 공통적인 균혈증-관련 대장균 O-혈청형의 분포 대상체는 다음 국가의 입원 대상체였다: USA, 캐나다, 아르헨티나, 브라질, 영국, 독일, 스페인, 이탈리아, 네덜란드, 프랑스, 일본, 태국, 한국 및 호주.

전 세계의 균혈증 관련 대장균 세트에서 지리적 위치에 대한 계층화는 위치와 무관한 상위 10개 O-혈청형의 유병률을 보여주었으며, 이는 이들이 균혈증을 초래하는 대장균과 전세계적으로 관련된 우세한 O-혈청형임을 시사한다.

전 세계의 균혈증-관련 다중-약물 내성 대장균 분리주(n=345), 즉 임상적으로 관련된 항미생물제의 적어도 3가지 부류에 내성이 있는 이러한 균주 세트에서, 상위 10개 O-혈청형의 유병률은 75.4%이다.

역학 분석의 모든 정보를 종합하면, 유형화할 수 없는 균주의 하위부분을 내포한다고 가정할 경우 10가지 우세한 O-혈청형이 대장균-관련 균혈증 감염의 추정되는 60-80%를 커버할 수 있다.

균혈증-초래 대장균 혈청형의 상당 부분을 커버하는 다가 백신은 매우 유용할 것이다. 따라서, 표 2의 O-혈청형은 O-항원 기반 다가 백신에 대한 좋은 후보가 될 것이다. 이러한 백신은 바이오컨쥬게이션 기술을 사용하여 유리하게 제조될 수 있다.

상위 10개 혈청형(표 2) 중 하나는 O4이다. 따라서, 담체 단백질에 결합된 대장균 혈청형 O4의 O-항원 다당류를 포함하는 바이오컨쥬게이트 백신을 제조하는 것이 유익할 것이다.

실시예 2 : O-항원 변형 효소를 인코딩하는 유전자에 대한 현대 O4 임상 분리주의 특성 규명

대장균 O4 항원 다당류의 2개 변이체가 기술되었는데(예를 들어, 문헌 [Jann B, et al., 1993, Carbohydr. Res. 248: 241-250] 참조), 하나는 비분지된 구조(표 1에서 (O4-Glc-)로서 제시된 구조)를 가지며, 또 다른 변이체는 추가의 글루코스 측분지(표 1에서 (O4-Glc+)로서 제시된 구조)로 치환된 것이다. 이들 두 변이체가 현대 임상 분리주 중에서 발견되는 비율은 알려져 있지 않았다. 두 변이체 모두는 O4 항혈청과 반응하지만, 이들 변이체 사이에 면역학적 차이가 존재하는지의 여부는 또한 알려지지 않았다. 또한, (O4-Glc+) 항원 다당류를 생성하기 위해 글루코스 측-분지를 부착시키는 역할을 하는 효소는 지금까지 확인되지 않았으며, 이의 추정 코딩 서열은 아마도 O4 rfb 유전자 클러스터 외부에 존재할 것이다.

미국과 유럽 연합의 대상체로부터 2011-2012년 기간 동안 원래 분리된 32개의 응집 확인된 대장균 O4 임상 분리주 세트를 전체 게놈 서열 분석으로 처리하였다. 32개의 시퀀싱된 O4 분리주로부터 추출된 rfb 유전자 클러스터 서열을 참조 균주의 서열과 정렬하고, 뉴클레오티드 수준에서 비교하였다. 일부 자연 발생 단일 뉴클레오티드 다형성을 제외하고, 특성 규명된 분리주 모두는 O4 참조 균주와 동일한 rfb 클러스터를 나타내었으며, 이는 대장균 O4 균주가 이들의 Glc-분지 상태와 무관하게 동일한 rfb 유전자 클러스터를 수반함을 나타낸다. 따라서, 대장균 O4-Glc+ 항원 다당류를 생성하기 위해, 대장균 O4-특이적 분지 효소를 인코딩하고, 대장균 O4 rfb 유전자 클러스터의 외부 어딘가에 있을 알려지지 않은 서열을 갖는 유전자가 필요할 가능성이 높다. 이러한 알려지지 않은 유전자의 서열은 확인되어야 하며, 대장균 O4-Glc-항원 다당류와의 바이오컨쥬게이트를 생성하기만 할 균주에서 대장균 O4-Glc+ 항원 다당류를 갖는 바이오컨쥬게이트를 생성하고자 하는 경우, 사용되어야 한다.

그 후, 전체-게놈 서열 데이터를 O-항원 변형 효소를 인코딩할 수 있는 rfb 유전자 클러스터 외부에 있는 유전자의 존재에 대해 분석하였다. 쉬겔라 플렉스네리(Shigella flexneri) 중의 gtrAB의 상동체를 먼저 대장균 O4에서 확인하였다. 그 후, 대장균에서 gtrAB 다운스트림의 오픈 리딩 프레임은 대장균 O4-특이적 유전자 gtrS로서 추정적으로 확인되었으며, 이는 대장균 O4 항원에의 글루코스 분지 첨가를 담당하는 추정적 대장균 O4 특이적 분지 효소 GtrS를 인코딩할 수 있다.

O4 특이적 GtrS 효소의 아미노산 서열은 SEQ ID NO: 4로서 제공된다. 이러한 단백질을 인코딩하는 예시적인 핵산 서열은 SEQ ID NO: 5로서 제공된다.

특성 규명된 대장균 O4 분리주 중 약 80%가 여기에서 확인된 gtrS 유전자를 수반하는 것으로 밝혀졌다(32개 중 26개). 대장균 O4-특이적 gtrS 서열의 유병률은 또한 미국 및 유럽 연합에서 2014년-2016년 기간 동안 대상체로부터 분리된 20개의 응집-확인된 대장균 O4 임상 분리주의 독립된 세트에서 서열 특이적 프라이머를 사용하여 PCR에 의해 결정되었다. 이 분석은 20개의 분리주 중 17개가 O4 gtrS 염기서열을 수반하고 있음을 보여주었고, 이는 85%의 유병률에 해당한다.

실시예 3: O4 gtrS 의 대장균 W3110으로의 클로닝, Glc-변형된 O4 바이오컨쥬게이트의 생성 및 구조 확인

분지형 글루코스로 변형된 O4-항원 다당류를 포함하는 바이오컨쥬게이트가 제조될 수 있는지의 여부를 테스트하기 위해, 추정되는 분지 효소를 갖는 대장균 O4-항원 EPA 바이오컨쥬게이트 생산 균주를 작제하였다. 이를 위해 내인성 O16-gtrS 유전자를 추정되는 O4-gtrS 유전자(SEQ ID NO: 5, 실시예 2참조)로 치환하고, 상동성 재조합에 의해 대장균 균주 W3110 ΔwzzE-wecG ΔwaaL ΔwbbI-J-K에서 O16 rfb 클러스터를 O4 rfb 클러스터로 대체하였다. 대안적으로, 일부 균주에서, O4 rfb 클러스터를 플라스미드에 인코딩하였다.

후속하여, 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA) 담체 단백질(각각 'EPA-2' 및 'EPA-4'로 지칭되는 2 또는 4개의 컨센서스 글리코실화 부위를 갖는 변이체) 및 올리고사카릴 트랜스퍼라제 PglB를 인코딩하는 플라스미드를 균주에 도입하였다. Glc로 변형된 O4-EPA 바이오컨쥬게이트는 생물반응기 배양에서 대장균 생산 균주를 성장시키고, 각각 IPTG 및 아라비노스에 의해 PglB 및 EPA 발현을 유도하여 생성하였다. O4-EPA 바이오컨쥬게이트는 바이오매스 주변세포질 추출물로부터 추출하였다.

상세한 다당류 조성 및 O4-EPA 바이오컨쥬게이트의 연결을 확인하기 위해, 다중 NMR 실험은 EPA-4 담체 단백질을 갖는 바이오컨쥬게이트에 대해 수행하였다(데이터는 미도시됨). 수득된 배치는 공개된 문헌과 일치하였다(Jansson, P.E., et al., 1984, Carbohydr. Res. 134(2): 283-291; Jann B, et al., 1993, Carbohydr. Res. 248: 241-250). 313K에서 기록된 1D 스펙트럼은 5개의 아노머, 2개의 NAc 및 2개의 H6 신호(Rha & FucNAc)가 있는 O4 오당류 RU에서 큰 HOD 신호와 작고 날카로운 신호를 보여주었다.

1D 양성자 배치는 2D 양성자-양성자 및 양성자-탄소 상관 NMR 실험을 사용하여 확인되었다. 먼저, 2D TOCSY(120 ms) 실험은 O4 오당류 RU에 대해 H1 및 H6(Rha 및 FucNAc의 경우)에서 예상되는 교차 피크와 말단 RU 및 EPA에서 작은 피크를 보여주었다. 메틸 영역에서, TOCSY는 O4 RU에 있어서 α-FucNAc에 대한 H6 내지 H5 및 α-Rha에 있어서 H6 내지 H1의 교차 피크를 보여주었다. 관찰된 다른 피크는 EPA 아미노산 및 말단 Rha (tRha)로부터 비롯된다. 두번째, 탄소 NMR 스펙트럼은 O4 RU에 대해 잘 분산되고 진단적인 단일 피크를 함유하였다. 탄소는 HSQC 실험을 사용하여 부착된 양성자를 통해 간접적으로 프로파일링하였다. HSQC-DEPT 실험은 CH₂ 기에 대한 역 피크를 제공하였다. HSQC는 O4 오당류 RU [5개의 아노머, 고리, 2개의 N-아세틸 및 2개의 메틸(Rha 및 FucNAc)] 기는 물론 특징적인 영역의 EPA 아미노산에 대한 교차 피크를 제공하였다. O4에 대한 각각의 양성자/탄소 쌍은 양성자 배치 및 문헌에 따라 배치될 수 있다.

따라서, 구조적 특성 규명 실험은 Glc-분지된 O4 바이오컨쥬게이트(표 1에서 화학식 (O4-Glc+)로 나타낸 바와 같이 다당류 항원 구조를 포함)가 실시예 2에서 확인된 추정 대장균 O4-gtrS 유전자를 사용하여 생성될 수 있음을 확인시켜 주었다.

실시예 4 : 토끼에서 Glc-분지된 O4 바이오컨쥬게이트의 면역원성

Glc-변형된 O4 바이오컨쥬게이트(즉, 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 갖는 글리칸을 가짐)는 스피디-래빗 프로토콜(Eurogentec)을 적용함으로써 토끼 면역화에 사용하였다. 면역화된 토끼로부터의 혈청을 Glc-분지의 존재 (Glc+; 즉, 글루코실화된 O4 다당류를 함유) 또는 부재(Glc-; 즉, 비-글루코실화된 O4 다당류 함유) 하에 정제된 O4 지질다당류(LPS)에 대한 항-O4 IgG 역가에 대해 ELISA에 의해 분석하였다. 바이오컨쥬게이트로의 면역화는 두 토끼 모두에서 높은 IGg 역가를 발생시켰다(도 1). 두 경우 모두에서, Glc+ LPS에 대한 O4 바이오컨쥬게이트에 의해 유도된 항체 역가는 Glc- LPS와 비교하여 더 높았다.

혈청을 또한 풀링시키고, 특성 규명된 gtrS 상태를 갖는 대장균 O4 분리주의 테스트 세트를 사용하여 전체 세포 ELISA 연구에 사용하였다. 5개의 gtrS-음성(Glc-분지 없음) 및 6개의 gtrS-양성(Glc-분지) 대장균 O4 분리주 및 음성 대조군 균주를 테스트하였다. Glc-변형된 O4 바이오컨쥬게이트로 면역화된 토끼로부터의 풀링된 혈청은 시험된 O4 분리주를 특이적으로 인식하는 높은 역가의 IgG를 함유하였다(도 2). LPS ELISA에 따라, 모든 시험된 O4 분리주는 면역 혈청에 의해 인식되었다. gtrS-양성 분리주는 gtrS-음성 분리주보다 전반적으로 더 높은 결합을 나타내었다(도 2). 특히, 다음 분리주는 gtrS-양성이었으며: Y1382, E551, OC24334, stGVXN4983, stGVXN4994 및 OC24794; 다음 분리주는 gtrS-음성이었다: A2625, stGVXN4988, OC24784, OC24787, 및 OC24788. 면역 혈청은 비관련 O-혈청형의 음성 대조군 균주인 대장균 OC9487(ATCC 35383)에 결합하지 않았다.

은-염색된 폴리아크릴아미드 겔에서 gtrS-양성 및 -음성 분리주의 테스트 세트로부터 추출된 LPS의 프로파일은 O4 항원의 비변형된 형태 및 변형된 형태를 발현하는 분리주 사이의 현격한 차이를 드러내지 않았으며, 이는 관찰된 차이가 LPS 발현 수준에서 정량적 차이(데이타 미제시됨)로 설명되지 않음을 확인시켜준다.

풀링된 면역 혈청을 사용하여 추출된 LPS의 웨스턴 블롯을 수행하여 Glc-변형된 O4 바이오컨쥬게이트로의 면역화에 대한 반응으로 유발된 IgG에 의한 O4 O-항원의 인식을 평가하였다. 변형된 O4 면역화된 토끼로부터의 IgG에 의한 변형된 및 비변형된 O4 LPS 둘 모두의 결합이 관찰되었으며, 고분자량 LPS 밴드를 포함하는 광범위한 크기에 걸친 LPS 밴드의 특정 인식을 포함하였다(도 3).

하기 추가 실험에서, 'O4' 바이오컨쥬게이트 또는 생산 균주 또는 'EcoO4'가 언급될 경우, 달리 특정하게 나타내지 않는 한 Glc-분지된 O4(표 1의 글리칸 구조 (O4-Glc+)를 가짐)의 바이오컨쥬게이트 또는 생산 균주를 의미한다(따라서, 용어 'O4' 및 'O4-Glc+'은 이들 실험에서 바이오컨쥬게이트 또는 생산 균주에 대해 상호교환적으로 사용됨).

실시예 5 : 래트에서 Glc-분지된 O4 바이오컨쥬게이트의 면역원성

Sprague Dawley 래트를 3가지 상이한 용량(0.04 μg, 0.40 μg 또는 4.0 μg)의 제형 완충액 또는 (O4-Glc+)-EPA 바이오컨쥬게이트(즉, EPA 담체 단백질에 공유 결합된 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트; 담체 단백질은 상기 실시예 3에 기재된 바와 같이 EPA-2임)로 근육내 3회 면역화시켰다. 면역화 후 0, 14 및 42일째에 혈청 항체 수준을 ELISA로 측정하였다.

0.04 μg, 0.40 μg 및 4.00 μg의 (O4-Glc+)-EPA 바이오컨쥬게이트로의 면역화는 제형 완충액과 비교하여 면역화 후 42일??에 IgG 항체 수준의 현저한 증가를 유도하였다(도 4a). (O4-Glc+)-컨쥬게이트에 의해 유도된 항체는 기능적이었고, 즉 (O4-Glc+) 대장균 균주의 치사를 매개할 수 있었다(도 4b).

0.04 μg, 0.40 μg 및 4.0 μg의 (O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체 수준은 기준선에서 검출된 것과 비교하여 면역화 후 42일째(42일 vs 0일, 모든 용량에 있어서 P = 0.006) 및 면역화 후 14일째(42일 vs 14일, 모든 용량에 있어서 P = 0.006) 현저하게 증가되었다(도 5). 4.0 μg의 바이오컨쥬게이트가 투여된 군에서, 역가 또한 0일과 비교해 14일째에 현저하게 증가하였으며, 이는 단일 용량의 4.0 μg의 (O4-Glc+)-EPA 바이오컨쥬게이트가 IgG 역가의 현저한 증가를 유도함을 나타낸다(14일째 vs 0일, P=0.012). 시험한 모든 3개의 바이오컨쥬게이트 농도에 있어서 14일 내지 42일째에 관찰된 IgG 역가에서의 현저한 증가는 제3 용량의 (O4-Glc+)-EPA 바이오컨쥬게이트가 항체 반응을 증대시킬 수 있음을 보여주었다(도 5).

제형 완충액 또는 4.00 μg/용량의 바이오컨쥬게이트로 3회 근육내 면역화시킨 래트에서 O4-Glc+-EPA 컨쥬게이트에 의해 유도된 항체의 기능성은 O4(Glu+) 및 O4(Glu-) 대장균 균주를 사용하는 옵소닌식세포 치사 검정(OPKA)에 의해 결정하였다. (O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체는 기능적이었고, 즉 (O4-Glc+) 대장균 균주의 치사를 매개할 수 있다(도 4b, 도 6). 특히, (O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체는 (O4-Glc+) 및 (O4-Glc-, 즉 표 1에서 화학식 (O4-Glc-)의 구조를 갖는 글리칸을 가짐, 즉 Glc-분지가 없는 O4 다당류) 대장균 균주 둘 모두의 치사를 매개할 수 있었다(도 6).

결론적으로, O4-Glc+-EPA 바이오컨쥬게이트에 의해 유도된 항체는 교차-반응성이며, 글루코스 분지의 존재 및 부재하의 대장균 O4 균주의 치사를 매개할 수 있다.

실시예 6: 대장균 O-항원 바이오컨쥬게이트에 대한 생성 균주 및 생성된 바이오컨쥬게이트 생성물

상기 기술된 바와 같이 제조된 (O4-Glc+)-EPA 바이오컨쥬게이트 이외에, 9개의 다른 바이오컨쥬게이트를 생성하였다. 특히, 추가로 생성된 바이오컨쥬게이트는 대장균 O1A-EPA 바이오컨쥬게이트, O2-EPA 바이오컨쥬게이트, O6A-EPA 바이오컨쥬게이트, O8-EPA 바이오컨쥬게이트, O15-EPA 바이오컨쥬게이트, O16-EPA 바이오컨쥬게이트, O18A-EPA 바이오컨쥬게이트, O25B-EPA 바이오컨쥬게이트 및 O75-EPA 바이오컨쥬게이트를 포함하였다. 이들 컨쥬게이트의 글리칸의 화학 구조는 표 1의 각 화학식에서 찾아볼 수 있다. 10개 바이오컨쥬게이트를 포함하는 조성물은 'ExPEC10V'로 본원에서 지칭된다. O1A-EPA, O2-EPA, O6A-EPA 및 O25B-EPA 바이오컨쥬게이트를 포함하는 조성물은 'ExPEC4V'로서 언급된다(예를 들어, WO 2015/124769 및 WO 2017/035181에 이전에 기술되었음).

대장균 W3110 모 균주

비병원성 대장균 K12 균주 W3110은 모든 10개 생산 균주의 작제물을 위한 모 균주로서 사용하였다. 대장균 K12 균주 W3110은 Coli Genetic Stock Center(Yale University, New Haven(CT), USA, 제품 번호 CGSC#4474)에서 입수하였다. 이의 관련 유전자형은 종래 기술되었으며(대장균 W3110, F-, 람다-, IN(rrnD-rrnE)1, rph-1), 및 이의 게놈 서열은 종래 기술되었다(Hayashi K, et al., 2006, Mol. Syst. Biol. 2006.0007 (doi:10.1038/msb4100049). 대장균 W3110 균주는 대장균 O-항원 바이오컨쥬게이트 각각의 생산을 가능하게 하도록 유전자 변형되었다(표 3).

바이오컨쥬게이트 생산 균주

"ExPEC4V" 및 "ExPEC10V" 조성물은 둘 다 동일한 생산 균주로부터의 O2-EPA 및 O25B-EPA 바이오컨쥬게이트를 포함한다. "ExPEC4V" 조성물은 stGVXN4411 또는 stLMTB10217 생산 균주로부터의 O1A-EPA 바이오컨쥬게이트를 포함하는 반면, "ExPEC10V" 조성물은 stLMTB10217 생산 균주로부터의 O1A-EPA 바이오컨쥬게이트를 포함한다. "ExPEC4V" 조성물은 stGVXN4112 생산 균주로부터의 O6A-EPA 바이오컨쥬게이트를 포함하는 반면, "ExPEC10V" 조성물은 stLMTB10923 생산 균주로부터의 O6A-EPA 바이오컨쥬게이트를 포함한다. 또한, "ExPEC10V" 조성물은 "ExPEC4V"에 사용되지 않은 생산 균주로부터의 O4-EPA (즉, (O4-Glc+)-EPA), O8-EPA, O15-EPA, O16-EPA, O18A-EPA 및 O75-EPA 바이오컨쥬게이트를 포함한다. 다양한 생산 균주는 하기 나타낸 바와 같이 EPA 담체 단백질 및/또는 올리고사카릴 트랜스퍼라제 PglB의 발현을 위한 플라스미드에서 다를 수 있다. 여러 생산 균주의 개요가 아래 표 3에 나와 있다.

표 3: ExPEC4V 및 ExPEC10V 백신 조성물을 위한 O-항원 바이오컨쥬게이트에 대한 대장균 생산 균주의 유전자 공학 개요

O-항원 생합성( rfb ) 유전자 클러스터

모든 대장균 O-항원 생산 균주에서, 자연 발생 대장균 W3110 게놈 O16::IS5 -항원 생합성(rfb) 유전자 클러스터는 선택된 혈청형의 대장균 균주로부터 선택된 O-항원-특이적 생합성 클러스터에 의해 대체되었으며, 이는 혈청형-특이적 O-항원 구조를 인코딩한다(이러한 O-항원 구조에 대해서는 표 1 참조). 10개의 공여체 rfb 클러스터는 대장균 혈액 분리주의 전체-게놈 분석 후 선택하고 확인하였다. O-항원 생합성에 결함이 있는 W3110 O16::IS5 rfb 유전자 클러스터의 대체는 단일 상동 재조합 사건으로 달성되었다. O16 및 O18A rfb 유전자 클러스터의 경우, 공여체 DNA는 측접하는 gnd 및 rmlCA 유전자를 통해 재조합되는 반면, 다른 균주의 rfb 유전자 클러스터는 측접하는 gnd 및 galF 유전자를 통해 재조합되었다. 생산 균주에서 rfb 클러스터의 서열은 SEQ ID NO: 9 및 11-19로 제공된다.

O-항원 리가제( waaL ) 유전자

모든 대장균 O-항원 생산 균주는 waaL 유전자에 의해 인코딩된 대장균 W3110 게놈 O-항원 리가제의 결실을 인공적으로 도입하였다. ΔwaaL 균주에서 지질 A로의 O-항원의 전달이 중단되고, 이는 대신에 O-항원의 담체 단백질로의 직접 전달을 유도하여 생성물 수율을 증가시킨다.

O-항원 글루코실화( gtrABS ) 유전자

대장균 O8, O15, O16, O18A, O25B 및 O75 생산 균주에서, O16 O-항원 글루코실화를 담당하는 대장균 W3110 게놈 gtrABS 유전자가 결실되었다. 상이한 혈청형의 gtrA 및 gtrB 유전자는 고도로 상동성이고 상호교환가능하지만, gtrS 유전자는 혈청형-특이적 O-항원 글리코실 트랜스퍼라제를 인코딩한다. 대장균 W3110에서 GtrS는 대장균 O16 O-항원의 α-L-Rha-(1→3)-d-GlcNAc 모티프에 있는 GlcNAc 당에 글루코스(Glc) 잔기를 전달할 수 있다. 대장균 O1A, O2 및 O6A 생산 균주에서는 gtrABS 유전자의 결실 또는 대체가 발생하지 않았다. 이러한 O-항원은 대장균 O16 gtrS의 천연 기질인 α-L-Rha-(1→3)-D-GlcNAc 모티프를 놓치게 된다. 대장균 O4 생산 균주에서, W3110 gtrS 유전자는 대장균 O4 gtrS 유전자로 대체되어 대장균 O4 O-항원의 적절한 글루코실화를 수용하였다.

올리고사카릴 트랜스퍼라제 PglB

모든 대장균 O-항원 생산 균주는 C. 제주니 글리코실 트랜스퍼라제 PglB의 변이체를 발현하였으며, 이는 N-글리코실화에 의해 담체 단백질 상의 아미노산 컨센서스 서열 상으로 O-항원을 전달할 수 있다. PglB는 광범위한 기질 인식을 가졌으나, 낮은 생성물 수율로 인해, 변형된 기질 특이성을 갖는 PglB 변이체를 발현하는 여러 생산 균주를 제조하였으며, 이는 향상된 생성물 수율을 발생시켰다(예를 들어, WO 2016/107818, WO 2016/107819 참조). pgIB 유전자는 플라스미드 상의 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 유도성 프로모터 뒤에 배치되었다. 하기 표 4는 상기 기술된 ExPEC4V 및 ExPEC10V 조성물을 위한 바이오컨쥬게이트에 대한 대장균 O-항원 생산 균주의 생산에 사용되는 플라스미드에 의해 인코딩된 PglB 변이체를 나열한다. 벡터 백본, 항생제 내성 마커 및/또는 대안적 PglB 변이체에 변이가 있는 추가 플라스미드도 또한 바이오컨쥬게이트 생산에 대해 성공적으로 테스트되었다.

표 4: 대장균 O-항원 생산 균주에 사용되는 PglB 및 EPA 플라스미드

¹ SpR, 스펙티노마이신 내성; AmpR, 암피실린 내성; KanR, 카나마이신 내성

담체 단백질 (EPA)

모든 대장균 O-항원 생산 균주는 O-항원에 대한 담체 단백질로서 유전학적으로 탈독소화된 P. 애루기노사 AD-리보실트랜스퍼라제 톡소이드(EPA)를 발현하였다. EPA 톡소이드는 2개 잔기에서 야생형 EPA 독소와 상이하다: Leu552는 Val로 변경되었으며, Glu553(촉매 도메인에서)이 결실되었다. Glue553 결실은 독성을 현저하게 감소시키는 것으로 보고되었다. 탈독소화 돌연변이 외에도, 4개(EPA-4) 컨센서스 N-글리코실화 부위 모티프를 도입하였다. epa 유전자는 플라스미드 상의 L-아라비노스(Ara) 유도성 프로모터 뒤에 위치하였다(표 4). 표 4는 상기 기재된 "ExPEC4V" 및 "ExPEC10V" 조성물에 사용된 바이오컨쥬게이트에 대한 생산 균주에 사용되는 플라스미드로 제한된다. 벡터 백본, 항생제 내성 마커 및/또는 EPA 변이체에서 변이를 갖는, 예를 들어 컨센서스 N-글리코실화 부위 모티프의 수(예를 들어, 2개의 이러한 모티프, EPA-2를 가짐)가 변화하는 플라스미드도 바이오컨쥬게이트 생산에 대해 성공적으로 테스트되었다.

실시예 7 : 글루코실화된 O4(O4-Glc+) 항원과의 바이컨쥬게이트의 생성을 위한 올리고사카릴트랜스퍼라제 최적화

바이오컨쥬게이트 생산을 위한 수율 최적화는 C. 제주니 올리고사카릴 트랜스퍼라제 PglB의 변형에 의해 달성될 수 있으며, 이는 EPA 담체 단백질에 대한 관심 O-항원의 더욱 효율적인 또는 더 높은 등급의 N-글리코실화로 이어질 수 있다. 글루코실화된 O4 (O4-Glc+) O-항원 다당류를 갖는 바이오컨쥬게이트의 생산을 위한 대장균 균주에서, 이러한 최적화 전략을 적용하였으며, 바이오컨쥬게이트 생성물 수율을 향상시키는 (O4-Glc+)-특이적 최적화된 PglB 변이체를 발생시켰다.

이러한 접근법에서, EPA-발현 플라스미드를 함유하는 O4-Glc+ O-항원 다당류 생산 균주는 다양한 상이한 PglB 발현 플라스미드로 형질전환되었으며, 이들 각각은 PglB 단백질에 상이한 아미노산 치환을 함유하여 기질 특이성을 변경시켰다. 각 균주의 바이오컨쥬게이트 생산 수준 및 프로파일은 삼투압 충격 실험에서 쉐이크-플라스크 수준으로 평가하였으며, 판독은 O4-Glc+ -특이적 모노클로날 항체를 사용하여 주변 세포질 추출물에 대한 모세관 전기영동 면역검정에 의해 수행하였다.

N311V 아미노산 치환을 함유하는 테스트한 PglB 변이체 중 하나는 글루코실화된 O4 바이오컨쥬게이트의 생성물 수율을 현저하게 향상시키는 것으로 밝혀졌다(도 7a).

N311V PglB-변이체가 추가로 변형된 추가 개선에서, Y77H 아미노산 치환은 N311V PglB-변이체와 비교하여 O4-Glc+-특이적 생성물 수율을 추가로 향상시켰으며, 증가된 정도의 디- 및 트리-글리코실화 생성물을 나타내었으며, 여기에서 다른 변형은 중립적이거나 생성물 수율에 부정적인 영향을 미치는 것으로 밝혀졌다(도 7b). 플라스미드 pLMTB4008(SpR)은 돌연변이 Y77H 및 N311V가 있는, 대장균 코돈 사용 최적화되고 (O4-Glc+)-기질 최적화된 PglB 변이체를 인코딩한다.

야생형 (wt) C. 제주니 글리코실 트랜스퍼라제 PglB와 비교해 N311V 및 Y77H 아미노산 치환을 함유하는 O4-Glc+ O-항원 다당류에 대한 최적화된 기질 특이성을 갖는 PglB 변이체는 1차 라운드 최적화된 PglB-N311V 변이체와 비교하여 바이오컨쥬게이트 수율이 두배인 것으로 밝혀졌다.

유사하게 스트린을 사용하여, ExPEC10V 조성물 중 다른 9개 혈청형의 대장균 O-항원 바이오컨쥬게이트 생성에 대해 가장 최적 수율을 갖는 PglB 변이체를 또한 결정하였다.

O1A, O6A 또는 O15 항원 다당류를 갖는 바이오컨쥬게이트에 있어서, 아미노산 돌연변이 N311V, K482R, D483H 및 A669V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.

O2, O8, O18A 또는 O25B 항원 다당류를 갖는 바이오컨쥬게이트에 있어서, 야생형 PglB(즉, 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이가 없음)가 가장 높은 수율을 제공하는 것으로 밝혀졌다.

O16 항원 다당류를 갖는 바이오컨쥬게이트에 있어서, 아미노산 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.

O75 항원 다당류를 갖는 바이오컨쥬게이트에 있어서, 아미노산 돌연변이 N311V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.

이들 결과로부터 최적의 PglB 변이체가 다양한 O-항원에 있어서 상이하고, 주어진 O-항원 다당류를 갖는 바이오컨쥬게이트를 생성하기 위한 최적의 PglB 변이체는 예측할 수 없음을 알 수 있다.

실시예 8: 10개 대장균 혈청형으로부터의 O-항원의 바이오컨쥬게이트 및 이들의 품질 속성

표적 O-항원의 O-글리칸 잔기는 구조적으로 다양하고, 가변적인 반복 단위를 갖는다. 글리코실 트랜스퍼라제 PglB의 특이성 및 친화성은 글리칸 구조와 연결되어 있다. 따라서, 요망되는 품질 속성, 예를 들어 순도, 글리칸/단백질 비율 등을 갖는 바이오컨쥬게이트를 만드는 것은 어렵고 간단하지 않은 작업이다. PglB와 EPA 담체 단백질의 올바른 조합은 수율을 결정하고, 글리코실화 효율에 영향을 미칠 수 있다. PglB 및 담체 단백질을 최적화시킴으로써, 요망되는 품질 속성을 갖는 바이오컨쥬게이트를 생성하였다. 매우 많은 양의 담체 단백질은 면역학적 간섭으로 이어질 수 있기 때문에, 특히 하나 이상의 O-항원 바이오컨쥬게이트가 함께 조합되어 단일 조성물 또는 백신으로 투여되는 경우, 총 담체 단백질의 더 낮은 역치 값을 유지하는 것이 또한 중요할 수 있다. 이러한 현상을 피하기 위해서 더 높은 글리칸/단백질 비율을 갖는 컨쥬게이트가 바람직하다. 따라서, ExPEC10V 백신에 있어서, (임상 시험으로 처리된 이전에 기술된 ExPEC4V 백신과) 적어도 유사한 글리코실화 비율을 갖는 바이오컨쥬게이트를 개발하였다.

바이오컨쥬게이트는 종래 기술된 방법에 따라 생물반응기(10 L 및/또는 200 L 부피)에서 각 숙주 세포(실시예 6, 표 3)를 배양하고 바이오컨쥬게이트의 발현에 의해 생성하였다. 각 약물 물질은 박테리아 유가식 발효에 의해 배치식으로 제조하여 상응하는 다당류 혈청형의 발현된 바이오컨쥬게이트를 함유하는 바이오매스를 생성하였다. 세포를 배양하고, IPTG 및 아라비노스로 유도하였다. 바이오컨쥬게이트는 삼투압 충격에 이어서 크로마토그래피 정제에 의해 생물반응기 배양물에서 세포의 주변세포질로부터 분리하였다. 이러한 공정은 10개 바이오컨쥬게이트 각각에 대해 수행하였다.

ExPEC10V 및 ExPEC4V에 대한 약물 물질(DS)인 이렇게 제조된 대장균 O-항원 바이오컨쥬게이트는 유사한 중요한 품질 속성을 나타내었다: (1) 공정-관련 순도(RH-HPLC에 의해 측정)는 95% 보다 높았음, (2) 약 0.1-0.5, 대부분 0.15 내지 0.45 범위의 다당류/단백질 비율, (3) 박테리아 내독소(Ph. Eur. 2.2.3)는 0.5 EU/μg 다당류 미만이었다. 개별 다당류 사슬의 평균 길이는 전형적으로 약 10-20 반복 단위였다(고해상도 SDS-PAGE를 사용하여 측정됨).

다당류 반복 단위의 구조는 상기 기술된 ExPEC10V 조성물에 있어서 DS인 모든 10개 바이오컨쥬게이트의 경우, 표 1에서 상응하는 혈청형에 대해 화학식으로 제시된 것으로 (온전한 또는 트립신-분해된 컨쥬게이트의 NMR 및 MS/MS에 의해) 확인되었다.

O18 혈청형은 ExPEC10V 조성물을 위해 만들어진 바이오컨쥬게이트의 10개 혈청형 중에서 바이오컨쥬게이트 생산 수율이 가장 낮았다.

ExPEC10V 의약품(DP)은 상기 기술된 10개 1가 DS의 혼합물을 포함한다.

실시예 9 : ExPEC10V 백신의 독성학

ExPEC10V를 사용한 단일-용량 파일럿 독성 및 국소 내성 연구(비-GLP)를 암컷 NZQ 토끼에서 수행하였다. 일 군(n=2)은 대조군(식염수)의 근육내(IM) 주사(0일째)로 처리되었으며, 두 번째 군(n=4)은 0.6 mL의 투여량(176 μg PS/mL)을 사용하여 105.6 μg 총 다당류 (PS)/용량 (각각 O-혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75에 있어서 용량 당 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 19.2: 9.6 μg PS)으로 ExPEC10V의 IM 주입으로 처리하였다. 부검은 2일째에 수행하였다.

사망 사례는 관찰되지 않았다. 또한, 임상 관찰(Draize 스코어링을 사용한 주사 부위 효과 포함), 체중, 음식 섭취 및 체온에 대해 언급된 백신 관련 효과는 없었다. 조직병리학적으로 투여 부위 또는 배액(장골) 림프절에서 백신과 관련된 변화는 관찰되지 않았다. 비장의 배 중심 형성의 최소 증가가 처리된 동물 4마리 중 한 마리에서 관찰되었으며(2일째), 주사된 백신에 대한 정상적인 면역학적 반응으로 간주되었다. 전반적으로, 암컷 토끼에 대한 ExPEC10V의 단일 IM 용량의 투여는 내약성이 우수하였다.

실시예 10 : 토끼에서 ExPEC10V 블렌딩된 제형의 면역원성

ExPEC4V 백신(대장균 O1A, O2, O6A 및 O25B 혈청형의 바이오컨쥬게이트 포함)은 이전에 래트, 토끼 및 인간에서 이들 4가지 혈청형에 대해 면역원성인 것으로 나타났다(예를 들어, WO 2015/124769; WO 2017/035181; [Huttner et al, 2017, Lancet Infect Dis, http://dx.doi.org/10.1016/S1473-3099(17)30108-1, RW Frenck Jr, et al, 초록 5587, ASM Microbe 2018] 참조). 대장균 글루코실화된 O4 혈청형을 갖는 본 발명의 신규한 바이오컨쥬게이트는 상기 실시예 4 및 5에서 면역원성인 것으로 나타났다. 래트에 개별적으로 투여될 경우(일가) 대장균 혈청형 O8, O15, O16, O18A 및 O75의 바이오컨쥬게이트(이 실험에서 모두 담체 단백질로서 EPA-2를 가짐)의 면역원성은, 이들 바이오컨쥬게이트 각각이 또한 면역원성이라는 것을 확인시켜주었는데, 이는 ELISA 데이터가 이들 바이오컨쥬게이트 각각이 높은 수준의 대장균 O-항원 특이적 항체를 유발시킬 수 있음(미제시됨)을 나타내었기 때문이다.

상기 기술된 바와 같은 10개 바이오컨쥬게이트의 혼합물을 함유하는 10가 백신의 면역원성을 또한 테스트하였다. 뉴질랜드 화이트(NZW) 토끼(암컷, 12-16주령)는 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회의 근육내 면역화로 처리하였다(표 5; 0, 14 및 27일째에 투여). 이들 실험에 사용된 ExPEC10V의 일부인 10개의 다당류를 4개의 글리코실화 부위를 함유하는 EPA(EPA-4) 담체 단백질에 컨쥬게이션시켰다. 백신은 3개의 상이한 용량으로 제형화시켰다: 군 1 ('고용량'): 8 ug/용량의 O1A, O2, O6A, O4, O8, O15, O16, O18 및 O75 및 16 ug/투여량의 O25B; 군 2 ('중간 용량'): 4 ug/용량의 O2, O4, O8, O15, O16, O18 및 O75, 8 ug/용량의 O1A 및 O6A 및 16 ug/용량의 O25B; 군 3 ('저용량'): 0.4 ug/용량의 O2, O4, O8, O15, O16, O18 및 O75, 0.8 ug/용량의 O1A 및 O6A 및 1.6 ug/용량의 O25B. 대조군(군 4)의 동물에게는 식염수(0.9% (w/v) 염화나트륨 용액)만 제공하였다(표 5).

항체 반응은 0일째(면역화전) 및 면역화 후 14, 27 및 42일째에 평가하였다. 백신 및 담체 단백질 EPA에 포함된 각각의 바이오컨쥬게이트에 의해 유도된 혈청 항체 수준은 코팅 물질로서 유형 특이적 LPS를 사용하여 ELISA(총 IgG)에 의해 측정하였다. 항체 역가는 4-파라미터 로지스틱 비선형 회귀 모델에 플롯팅된 12-단계 적정 곡선의 중복을 기반으로 하는 최대 유효 농도 절단에 해당하는 EC50 값으로서 보고하였다. 기능적 활성은 OPK에 의해 결정되었다.

표 5. 실험군의 설명

결과는 도 8에 도시하고, 표 6에 요약하였다.

표 6. NZW 토끼에서 ExPEC10V에 의해 유도된 대장균 O-항원 특이적 항체 반응의 요약.

암회색 사각형은 p 값이 통계적으로 유의한 혈청형-특이적 항체 반응을 보여준다. 연회색 사각형은 p 값이 통계적으로 유의하지 않은(ns) 혈청형-특이적 항체 반응을 보여준다. 다중 비교를 위한 Bonferroni 보정과 Wilcoxon 순위 합계 테스트. ExPEC10V 백신화된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4)을 비교. ^*p≤0.05, ^**p≤0.01. # P 값은 대조군에서 이상치 동물을 제외한 후 통계적으로 유의하였다(민감도 분석).

고용량의 ExPEC10V(군 1)은 O1A, O2, O4, O6A, O16, O18A 및 O25B에 대한 식염수 대조군과 비교할 경우 조사된 모든 시점(면역화 후 14, 27 및 42일째)에서 현저하게 더 높은 IgG 항체 수준을 유도하였다(도 8, 표 6). 식염수 대조군과 비교할 경우 O8 및 O75 컨쥬게이트에 의해 유도된 현저하게 더 높은 항체 역가가 면역화 후 27일 및 42일째에 관찰되었다(도 8, 표 6).

중간 용량의 ExPEC10V(군 2) 및 저용량(군 3)은 O1A, O2, O4, O6A, O16 및 O25B에 대한 식염수 대조군과 비교할 경우 조사된 모든 시점(면역화 후 14, 27 및 42일째)에서 현저하게 더 높은 항체 수준을 유도하였다(도 8, 표 6). 식염수 대조군과 비교할 경우 O8, O18A 및 O75 컨쥬게이트에 의해 유도된 현저하게 더 높은 항체 역가가 면역화 후 27일 및 42일째에 관찰되었으며, 이는 토끼에서의 부스트 용량이 이들 O-혈청형에 대한 반응을 증가시킴을 시사한다(도 8, 표 6).

O15 컨쥬게이트에 있어서, 대조군에서 이상치 동물은 생략한 민감도 분석은 ExPEC10V 백신의 3개 용량 모두가 면역화 후 14, 27 및 42일째에 식염수 대조군과 비교하여 항체 반응의 현저한 증가를 유도함을 보여주었다(도 8, 표 6).

담체 단백질 EPA에 의해 유도된 항체는 조사된 모든 시점(14일, 27일 및 42일째)에서 테스트된 3가지 용량의 ExPEC10V(고, 중 및 저)에 대해 식염수-처리군(대조군)에서 EPA 항체 역가보다 현저하게 더 높았다(도 8).

용량간 비교(미제시됨)는 백신화 후 14일째에 고용량의 ExPEC10V가 테스트된 대부분의 컨쥬게이트(O1A, O2, O4, O6A, O15, O16, O18A 및 O25B) 저용량과 비교할 때 현저하게 더 높은 항체 반응을 유도하였음을 보여주었다. 중간 용량의 ExPEC10V는 또한 O1A, O2, O4, O18A, O25B 및 O75에 대한 저용량과 비교하여 현저하게 더 높은 항체 반응을 유도하였다. O8 컨쥬게이트에 있어서, ExPEC10V의 세 가지 제형 모두는 백신 접종 후 14일째에 유사한 수준의 항체를 유도하였다.

저용량의 ExPEC10V는 O1A, O2, O4, O16, O25B 및 O75 컨쥬게이트에 대한 고용량 및 중간 용량의 ExPEC10V과 비교하여 백신화 후 (프라임 및 2회 부스트 용량 후) 42일째에 항체 반응의 현저한 증가를 유도하였다. 이러한 발견은 예를 들어, 폐렴구균 컨쥬게이트 백신으로 백신화된 유아에서 용량과 일차 백신화에 대한 항체 반응의 크기 사이의 명확한 관계가 관찰되지 않았다는 컨쥬게이트 백신으로의 다른 경험과 일치한다(Poolman JT, et al. Expert Rev Vaccines. 2013, 12(12):1379-94).

O6A, O8 및 O15 컨쥬게이트에 대해 백신화 후 42일째에 테스트한 3가지 용량의 ExPEC10V 간에는 유의한 차이가 없었다. O18A 컨쥬게이트의 경우, 백신화 후 42일째에 중간 용량과 비교하여 고용량의 ExPEC10V가 현저하게 더 높은 항체 반응을 유도하였다.

담체 단백질(EPA)에 있어서, 고용량 및 중간 용량의 ExPEC10V는 백신화후 14일째에 저용량과 비교하여 현저하게 더 높은 항체 반응을 유도하였다. 고용량의 백신은 또한 백신화후 42일째에 저용량과 비교하여 현저하게 더 높은 항체 반응을 유도하였다.

결론적으로, 0, 14, 27일째에 근육내 주입을 통해 투여된 3가지 제형의 ExPEC10V(고, 중 및 저)는 토끼에서 면역원성이다.

지금까지, 토끼에서 이 백신에 의해 유도된 대장균 균주를 치사시킬 수 있는 기능적 항체는 혈청형 O1A, O2, O4, O6A, O15, O16 및 O25B에 대해 나타났다.

추가 실험에서, ExPEC10V 백신의 GMP 배치(생산에 대해서는 상기 실시예 8 참조)를 제조하고, 독성 연구의 일부로서 NZW 토끼에 주사하였다(표 7). 이 연구에서 NZW 토끼(수컷 및 암컷)는 ExPEC10V 백신(1일, 15일 및 29일)을 근육내 주사(0.6 mL)로 3회 처리하고, 대조군은 0.9%(w/v) 염화나트륨 용액(식염수)으로 처리하였다. 각 용량의 백신은 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A 및 O75에 대한 9.6 μg 다당류(PS) 및 혈청형 O25B에 대한 19.2 μg PS를 함유하였으며, 이는 105.6 μg의 총 PS (176 μg 총 PS/mL) 및 382.8 μg의 총 EPA (638 μg EPA/mL)에 상응한다. O-항원 및 담체 단백질(EPA)에 대한 IgG 역가는 전처리 기간(1일) 및 면역화 후 31일 및 50일 동안 수집된 샘플로부터 결정되었다.

모든 O-항원 및 담체 단백질 EPA에 대한 항체 반응에서 현저한 증가는 단지 식염수로만 처리된 대조군과 비교할 경우 ExPEC10V로 처리한 군에서 백신화 후 31일째 및 50일째에 관찰되었다(도 9, 표 8). O1A 혈청형의 경우, 백신화된 동물을 대조군과 비교할 때 현저하게 더 높은 항체 반응이 또한 1일(기준선)째에 관찰되었다. 이들 결과는 일부 동물이 대장균에 사전 노출되었거나, O1A-LPS와의 교차 반응하는 항체를 가지고 있음을 시사한다.

표 7. NZW 토끼에 사용된 실험군 및 ExPEC10V 용량.

* 각 용량(0.6mL 부피 용량)은 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B, O75 각각에 대해 9.6:9.6:9.6:9.6:9.6:9.6:9.6:9.6:19.2:9.6 μg 다당류(PS)를 함유한다(176 μg 총 PS/mL). 각 용량은 382.8 μg EPA 단백질을 함유한다(638 μg EPA/mL).

표 8. 독성 연구의 일환으로 NZW 토끼에서 ExPEC10V의 면역원성.

ExPEC10V에 의해 유도된 항체 반응. 연회색 사각형은 대조군과 비교하여 백신군에서 항체 반응의 유의한 증가가 관찰된 혈청형을 나타낸다. 우도비로의 토빗 모델. ^****P ≤0.0001.

실시예 11 : 인간에서 ExPEC10V 백신을 사용한 단계 1/2a 시험

현재 IED를 예방하기 위해 이용가능한 백신은 없다. ExPEC10V 백신을 포함하는 혈청형(O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75)은 ST131을 포함한 항균제 내성 IED를 유발하는 대부분의 ExPEC 분리주를 또한 대표하는 임상적으로 관련된 대다수의 ExPEC 균주로 인한 침습성 질환을 해결하기 위해 선택되었다. 선택된 혈청형은 노년층에서 혈류 감염을 일으키는 10가지 널리 퍼진 ExPEC O-혈청형을 대표하며, ExPEC로 인한 혈류 감염의 약 70%를 차지한다.

침습성 질환 예방에 있어서 컨쥬게이트 백신의 작용 기전은 항생제 내성기전의 영향을 받지 않을 것으로 예상되기 때문에, ExPEC10V 백신은 약물-내성 및 약물-감수성 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75 혈청형에 의해 유발된 IED에 대한 보호를 제공하는 것으로 여겨진다.

ExPEC10V에서도 발견되는 4가지 대장균 O-항원 컨쥬게이트(O1A, O2, O6A 및 O25B)의 서브세트를 포함하는 초기 백신 후보인 ExPEC4V에 대한 선행 임상 경험이 있다. 4건의 임상 연구(2건의 완료된 1상 연구, 1건의 완료된 2상 연구 및 진행 중인 2상 연구)의 결과에 기초하여, ExPEC4V는 연구 참가자들에 있어서 내약성이 우수하였으며, 혈청형(O1A, O2, O6A 및 O25B) 당 최대 16 μg 다당류(PS) 용량에서 백신 관련 안전성 신호가 관찰되지 않았다. 대부분의 유해 사례(AE)는 1등급 및 2등급이었고, 3등급 AE는 거의 보고되지 않았다. 후기 발병 예측 국소 AE(백신화 후 5일 이후에 시작되는 AE)는 주로 더 높은 용량의 ExPEC4V로 관찰되었다. 각 연구에서 ExPEC4V 백신은 면역원성인 것으로 나타났으며, 효소 결합 면역흡착 검정(ELISA)에 의해 측정된 바와 같이 용량 의존적 백신 면역 반응과 O-항원 특이적 면역글로불린 G(IgG) 역가 증가를 입증한다. 항체의 기능적 활성은 ExPEC4V-최적화된 옵소닌식세포 치사 검정(OPKA)으로 입증되었다. ELISA 및 OPKA 테스트 결과의 공동-분석은 검정 반응 사이의 상관관계를 보여주었으며(2상 임상 시험[연구 4V-BAC2001]에서 각각 30일 및 360일에 대한 피어슨 상관 계수 ≥0.61 및 ≥0.48), 이는 ELISA를 ExPEC4V 항체 역가의 일차 척도로 사용하고, 기능적 항체 활성을 예측하는데 사용함을 입증한다. 면역원성 데이터 분석은 ExPEC4V로의 백신화 후 3년에 걸쳐 면역 반응의 지속성을 입증하였다. 이제 ExPEC4V로 백신화되고, 혈청형-특이적 옵소닌식세포 항체의 역가가 높은 인간의 혈청은 이후에 O25B 또는 O2 혈청형으로 복강내 자극된 마우스에 수동적으로 전달될 경우 생체내 보호를 매개할 수 있었음이 또한 관찰되었다(미제시). 따라서, ExPEC4V-특이적 옵소닌식세포 인간 항체는 생체 내에서 박테리아 치사를 매개하며, 이는 제안된 보호 메커니즘이 박테리아 치사를 매개하는 옵소닌식세포 항체의 유도에 의한 것인 다른 컨쥬게이트 백신과 일치한다.

ExPEC10V는 총 10개의 혈청형을 포함하며, 60세 이상 성인에서 ExPEC로 인한 혈류 감염의 약 50%(ExPEC4V) 내지 약 70%로 적용 범위를 늘린다. ExPEC4V에 대한 임상 경험과 상기 실시예에서 논의된 ExPEC10V에 대한 전임상 데이터를 기반으로 하여, ExPEC10V의 투여가 또한 인간에서 대장균 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75에 대한 면역 반응을 유도할 것으로 예상된다.

ExPEC10V 백신의 3가지 다른 용량의 안전성, 반응원성 및 면역원성을 평가하기 위한 무작위, 관찰자 맹검, 인간 최초의 1/2a 상 연구를 안정적인 건강 상태의 60세 내지 85세 인간에서 수행하였다(연구 10V- BAC1001). 연구 설계는 2개의 코호트를 포함한다: 코호트 1에서 안정한 건강 상태의 60세 이상 내지 85세 이하의 404명의 참가자(참가자 100명/ExPEC10V 용량) 및 코호트 2에서 지난 5년 내에 UTI 병력이 있는 안정한 건강 상태의 60세 이상의 추가 600명 참가자로 총 1004명의 참가자가 연구에 등록되었다.

ExPEC10V는 60세 이상 성인의 침습성 장외 병원성 대장균(ExPEC) 질병(IED) 예방을 위해 개발 중인 10가 백신 후보이다. ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O-항원 다당류(PS)로 구성되며, 이의 생성은 상기 기술되었다. O4 PS는 글루코실화된 형태이며, 표 1의 화학식 (O4-Glc+)의 구조를 갖는다.

목적 및 끝점

코호트 1 - 1/2a 상 관찰자-맹검 기간과 라벨 개방된 장기 추적 기간(N=404):

코호트 2 - 이중 맹검 기간과 이중 맹검 장기 추적 기간(N = 600):

전반적인 설계

이는 2개의 코호트를 포함하는 무작위의 다기관 중재 연구이다.

코호트 1의 경우, 이 연구는 관찰자-맹검 활성 대조된 설계를 가지고 있으며, UTI 병력이 있거나 없는 안정적인 건강 상태의 60세 이상 내지 85세 이하의 총 404명의 성인 참가자가 포함된다. 코호트 1에 대한 연구 설계는 3개의 기간을 포함한다: 최대 28일의 스크리닝 기간, 1일째 백신화를 통한 관찰자-맹검 181-일 추적 기간, 및 백신화 후 182일부터 3년까지(1096일) 지속되는 라벨 개방된 LTFU 기간(도 10a). 단지 ExPEC10V 선택된 용량 군으로부터의 참가자(약 100명 참가자) 및 Prevnar 13 군의 참가자만이 LTFU 기간으로 진행된다. 코호트 1의 끝은 마지막 참가자의 3년차 방문(1096일)이다.

코호트 2에 있어서, 연구는 이중 맹검 플라세보 제어된 설계를 가지며, 지난 5년 동안 UTI 병력을 갖는 안정한 건강 상태의 60세 이상의 총 600명의 성인 참가자가 포함된다. 등록은 코호트 1로부터 1/2a 상 일차 분석 및 ExPEC10V 용량 선택 완료 후 시작된다. 코호트 2에 대한 연구 설계는 3개의 기간을 포함한다: 최대 28일의 스크리닝 기간, 1일째 백신화를 통한 이중 맹검 181-일 추적 기간, 및 백신화 후 182일부터 3년까지(1096일) 지속되는 이중 맹검 LTFU 기간(도 10b). 코호트 2에서 모든 참가자는 LTFU 기간으로 진행된다. 연구 끝은 코호트 2에서 마지막 참가자의 3년차 방문(1096일)이다.

코호트 1: 1상

코호트 1의 1상에서, 총 84명의 참가자는 한 단계에서 다음 단계로 진행하기 전에 정위에서의 안전성 평가가 있는 단계적 용량-증량 절차에 따라 시차 접근 방식으로 등록된다. 내부 데이터 검토 위원회(DRC)는 이들 84명의 1상 참가자의 신체 검사 데이터(기준선 및 표적화됨), 기준선 인구 통계 데이터 및 백신화 후 14일째 안전성 데이터(예측 국소 및 전신 AE, 예측되지 않은 AE, SAE, 임상 실험실 데이터 및 활력 징후 포함)를 검토하기 위해 이 연구를 위해 위임되었다. 이러한 상의 연구에서, 참가자가 등록되고 6 단계로 무작위 배정하였다:

단계 1: 4명의 센티널 참가자가 등록되고 무작위 배정하였다; 2명의 참가자는 ExPEC10V 저용량 군(표 11)이며, 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.

단계 2: 24명의 참가자가 등록되고 무작위 배정하였다; 18명의 참가자는 ExPEC10V 저용량 군(표 11)이며, 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.

단계 3: 4명의 센티널 참가자가 등록되고 무작위 배정하였다; 2명의 참가자는 ExPEC10V 중간 용량 군(표 11)이며, 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.

단계 4: 24명의 참가자가 등록되고 무작위 배정하였다; 18명의 참가자는 ExPEC10V 중간 용량 군(표 11)이며, 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.

단계 5: 4명의 센티널 참가자가 등록되고 무작위 배정하였다; 2명의 참가자는 ExPEC10V 고용량 군(표 11)이며, 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.

단계 6: 24명의 참가자가 등록되고 무작위 배정하였다; 18명의 참가자는 ExPEC10V 고용량 군(표 11)이며, 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.

모든 참가자는 배정된 연구 백신화 군에 따라 1일째에 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13을 단일 근육내(IM) 주사로 투여받았다. 단계 1, 3 및 5 각각에서 4명의 센티널 참가자는 백신화 후 24시간째에 전화로 연락하여 안전 정보를 수집하였다. 4명의 센티널 참가자의 각 군에서 백신화 후 24시간째에 맹검 안전성 데이터는 수석 연구원(PI), 연구 담당 의사(SRP) 및 후원 의료 책임자(SML)에 의해 검토되었다. 다음 단계를 위한 추가 참가자의 무작위 배정은 이러한 2일차 센티널 안전성 평가가 완료될 때까지 중단되었다.

임의의 임상적으로 유의한 결과가 없는 경우, 추가로 24명의 참가자(단계 2, 4 및 6)를 등록시키고, 3개 연구 백신화 군(표 11) 중 하나로 무작위 배정하여 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13을 1일째에 단일 IM 주사로 투여하였다.

각 용량 수준(2 단계 저용량, 4 단계 중간 용량 및 6 단계 고용량)에서 추가 24명 참가자의 백신화 후, 각 용량 수준에서 모두 28명(4+24) 참가자의 백신화 후 14일째 안전성 데이터를 다음 용량 수준 또는 2a 상으로 진행하기 전에 DCR에 의해 검토하였다.

코호트 1: 2a 상

초기 84명의 참가자에 대한 백신화 후 14일째 안전성 데이터 검토 후 DRC에 의해 결정된 바와 같은 허용가능한 안전성 및 반응성(임의의 안전성 문제 또는 특정 연구 일시 중지 룰을 충족하는 임의의 이벤트가 없는 경우)을 기반으로 하여, 코호트 1로부터의 나머지 320명 참가자를 무작위 배정시키고 2a 상 연구에서 투여하였다. 이들 추가의 320명 참가자를 등록시키고 5개의 백신화 연구 군 중 하나로 2:2:2:1:1의 비율로 병렬로 무작위 배정하여 1일째에 ExPEC10V (3개 용량 중 1), ExPEC4V 또는 Prevnar 13의 단일 IM 주사로 투여하였다(표 11).

초기 84명 참가자에 대한 14일째 안전성 검토를 수행하는 것 외에, DRC는 또한 연구 과정 동안 코호트 1의 안전성 데이터를 평가하며, 특정 백신화 연구 일시 중지 룰을 충족하는 임의의 이벤트 또는 발생할 수 있는 기타 안전 문제를 검토한다.

코호트 1에 있어서, 모든 참가자가 30일째 방문(4차 방문)을 완료하였거나 더 일찍 중단한 경우 일차 분석이 발생한다. 모든 참가자가 181일째 방문을 완료하였거나 더 일찍 중단되었을 때 최종 분석이 발생한다. 라벨 공개된 장기 추적(LTFU) 기간으로 진행되는 참가자에 있어서(ExPEC10V 선택된 용량 군 및 Prevnar 13군), 연간 추적 분석은 백신화 후 1년(366일), 2년(731일) 및 3년(1096일)차의 방문 시점에서 수집된 안전성 및 면역원성 데이터(다중 ECL-기반 면역검정 및 MOPA)를 포함한다.

코호트 2

코호트 2에서는 지난 5년 동안 UTI 병력이 있는 안정적 건강 상태의 60세 이상의 참자가를 대상으로 (코호트 1의 일차 분석 결과를 기반으로 하여) ExPEC10V의 선택적 용량의 안전성, 반응성 및 면역원성을 평가하였다. 코호트 2에 있어서, 이 연구는 이중-맹검 플라세보 대조 설계를 가지며, 총 600명의 참가자가 등록되고, 2:1 비율(ExPEC10V 군 400명 참가자 및 200명 플라세보군)로 병렬로 무작위 배정하였다.

모든 참가자는 배정된 연구 백신화 군에 따라 1일째에 선택된 용량의 ExPEC10V 또는 플라세보의 단일 IM 주사로 투여받았다(표 12).

코호트 2에 있어서, 일차 분석은 안전성 및 면역원성 데이터를 포함하며, 모든 참가자가 30일째 방문(4차 방문)을 완료했거나 일찍 중단하였을 경우 발생한다. 모든 참가자가 181일째 방문을 완료하였거나 더 일찍 중단되었을 때 최종 분석이 발생한다. 모든 참가자에 있어서, 연간 추적 분석은 백신화 후 1년차(366일), 2년차(731일) 및 3년차(1096일) 방문 시점까지 수집된 안전성 및 면역원성 데이터(다중 ECL 기반 면역검정 및 MOPA)를 포함한다.

대변 샘플 분석은 메타게노믹스를 이용하여 장내 세균총에서 병원체(예를 들어, 클로스트리듐 디피실레)의 유병률 및 ExPec10v 혈청형에 대한 ExPEC10V의 효과를 평가하기 위해 선택된 서브세트의 참가자에서 수행된다.

참가자 수

총 1004명의 참가자기 연구에 등록된다; 코호트 1의 참가자 404명 및 코호트 2의 참가자 600명.

중재 군

개입 설명

ExPEC10V: EPA 담체 단백질에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 PS를 함유하는 인산염 완충 용액 중 대장균 바이오컨쥬게이트 백신. 1일째에 ExPEC10V의 3가지 용량 중 하나의 단일 0.5mL IM(삼각근) 주사.

ExPEC4V: EPA 담체 단백질에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O6A, O25B(4:4:4:8 μg PS/ExPEC 혈청형)의 O-항원 PS를 함유하는 식염수 완충액 중 대장균 바이오컨쥬게이트 백신. 1일째에 ExPEC4V의 단일 0.5 mL IM(삼각근) 주사.

Prevnar 13: 비독소 디프테리아 CRM197 단백질에 개별적으로 연결된 스트렙토코커스 뉴모니애 혈청형 1, 3, 4, 5, 6A, 6B, 7F, 9V, 14, 18C, 19A, 19F 및 23F의 캡슐 항원의 당류의 멸균 현탁액. 1일째 단일 0.5 mL(삼각근) 주사, 단일 용량으로 미리 충전된 주사기로 제공됨.

플라세보: 생리식염수. 1일째에서 플라세보의 단일 0.5 mL IM(삼각근) 주사.

ExPEC 연구 중재 자료는 표 9에 설명되어 있다.

표 9. BAC1001MV ExPEC 연구 백신.

EPA = 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A; PS=다당류

ExPEC4V는 EPA 담체 단백질에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O6A 및 O25B의 O-항원 다당류(PS)로 구성된다.

ExPEC10V는 EPA 담체 단백질에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O-항원 다당류(PS)로 구성된다.

용량은 PS만을 기준으로 한다. EPA(μg)는 측정값이다.

ExPEC10V는 10개의 1가 약물 물질(DS)로 구성된다. 이 임상 연구를 위해 2개의 상이한 농도(중간 및 고)의 의약품(DP)을 생성시킨다(표 10). 세 번째(저) 농도는 제형 완충액과 동일한 희석 완충액으로 고농도를 1:1로 희석하여 클리닉에서 얻는다. 각 DP는 pH 7.0(0.02% [w/w] 폴리소르베이트 80, 5% [w/w] 소르비톨, 10 mM 메티오닌)의 인산나트륨/인산칼륨 완충액에서 제형화된다.

표 10: 1/2a 상 임상 연구를 위한 ExPEC10V 백신의 조성

EPA = 담체 단백질로 사용되는 유전적으로 탈독소화된 P. 애루기노사 외독소 A

^A 활성 성분은 PS 항원과 담체 단백질(EPA)로 구성된 생물학적으로 합성된 컨쥬게이트이다; 용량은 PS 모이어티에서만 계산된다.

^b "저농도"는 "고농도"를 희석 완충액으로 1:1로 희석하여 클리닉에서 얻는다.

안전성 평가

주요 안전성 평가에는 예측된 국소 및 전신 AE, 예측되지 않은 AE, SAE, 신체 검사, 바이탈 사인 측정 및 임상 실험실 테스트가 포함된다.

면역원성 평가

수집된 혈청의 주요 면역원성 평가는, 다중 ECL-기반 면역검정에 의해 측정되는 백신에 의해 유발된 ExPEC10V 및 ExPEC4V 혈청형-특이적 총 IgG 항체 수준, 및 다중 포맷(MOPA)의 옵소닌식세포 치사 검정(OPKA)에 의해 측정되는 바와 같은 ExPEC10V 및 ExPEC4V 혈청형-특이적 기능성 항체의 평가를 포함한다. Prevnar 13에 의해 유발된 뉴모코컬 항체 역가의 면역원성 평가는 수행되지 않는다.

ExPEC10V에 의해 유도된 혈청 항체 수준은 다중 전기화학발광(ECL)-기반 면역검정에 의해 평가된다. 이 검정은 상이한 대장균 O-LPS 항원 또는 담체 단백질 EPA로 코팅된 다중-스팟 96웰 포맷 마이크로플레이트에서 고결합 탄소 전극을 조합한다. 혈청 샘플에 존재하는 항원 특이적 항체의 수준은 SULFO-TAG로 표지된 이차 항체(항-인간 IgG)를 사용하여 검출된다. SULFO-TAG는 결합된 IgG 항체의 양에 비례하여 증가하는 강도로 전기 자극이 있을 때 발광한다. 이 검정은 ICH(International Conference on Harmonization) 권장 사항에 따라 검증되었다.

ExPEC10V에 의해 유도된 기능적 항체의 수준은 다중 옵소닌식세포 검정(MOPA)으로 측정된다. 간단히 말해서, 열-불활성화된 혈청 샘플은 연속적으로 희석되고, 다양한 유형의 항생제에 특이적으로 내성이 있는 다른 대장균 균주와 함께 배양된다. 그 후, 인간 보체 및 식세포(HL60)를 반응에 첨가하고, 두 번째 배양 기간 후, 반응 혼합물의 분취량을 선택적으로 특정 항생제에 내성인 균주의 성장을 허용하는 특정 항생제가 보충된 배지를 함유하는 다양한 PVDF 친수성 막 필터 플레이트에 옮긴다. 밤새 성장시킨 후, 생존 박테리아의 수를 결정하기 위해 집락 형성 단위(CFU)를 계산한다. 이 검정은 ICH 권장 사항에 따라 검증되었다.

다중 ECL-기반 면역검정 및 MOPA에 의해 측정된 바와 같은 ExPEC10V 혈청형 항체 및 다중 ECL-기반 면역검정만으로 측정된 EPA에 있어서, 모든 면역원성 시점에 대해 백신화 연구 군에 의해 면역원성의 다음 측정이 평가되고 표로 작성된다:

- 1일째로부터 혈청 항체 역가가 2배 이상 및 4배 이상 증가한 참가자의 비율(백신화 전)

- 기하 평균 역가 (GMT)

- GMR: 기준선 이후/기준선 값으로부터 계산된 기준선으로부터의 배수 변화.

LTFU 기간 동안 각 혈청형에 있어서 면역원성에 대한 설명 요약이 제공된다.

나중 단계에 대한 용량 선택은 코호트 1(30일째 결과)의 일차 분석 시점에 이용 가능한 증거 전체를 고려한다.

표 11: 코호트 1: 백신화 일정

*ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O-항원 다당류(PS)로 구성된다.

** ExPEC4V는 담체 단백질인 슈도모나스 애루기노사로부터 유래한 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 별도로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O6A 및 O25B의 O-항원 다당류(PS)로 구성된다.

***Prevnar 13, 뉴모코컬 13-변이체 컨쥬게이트 백신(디프테리아 CRM197 단백질)은 비독소 디프테리아 CRM197 단백질에 개별적으로 연결된 스트렙토코커스 뉴모니애 혈청형 1, 3, 4, 5, 6A, 6B, 7F, 9V, 14, 18C, 19A, 19F 및 23F의 캡슐 항원의 당류의 멸균 현탁액이다.

표 12: 코호트 2: 백신화 일정

^a ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O-항원 다당류(PS)로 구성된다.

연구의 코호트 2에 등록된 참가자의 무작위 배정 비율은 2:1(ExPEC10V:플라세보)이다. 코호트 2에 사용된 ExPEC10V 용량은 코호트 1의 일차 분석(30일째) 결과를 기반으로 한다.

상태

상기에서 설명한 연구의 코호트 1의 등록 및 백신화가 완료되었다. 연구는 맹검 방식으로 진행된다. 안전성 데이터의 지속적 검토에 근거하여, 주요 안전성 문제는 확인되지 않았으며, ExPEC10V 백신은 허용가능한 안전성 프로파일을 갖는다.

코호트 1 임상 샘플의 면역원성의 분석은 맹검 방식으로 진행 중이다. ECL 데이터는 100% 허용 품질 한계(Acceptance Quality Limit)(AQL) 체크되었으며, 데이터 관리를 위해 업로드되었다. MOPA 샘플의 분석은 진행중이다. 데이터 비맹검 및 통계 분석은 임상 연구 기관(CRO)을 사용하여 수행된다.

코호트에 대한 ExPEC10V 용량이 코호트 1로부터의 30일째 결과의 최종 일차 분석을 기반으로 확인되면, 코호트 2 백신화가 시작된다.

당업자는 본 발명의 광범위한 본 발명의 개념을 벗어나지 않고 전술한 구체예에 변경이 이루어질 수 있음을 이해할 것이다. 따라서, 본 발명은 개시된 특정 구체예에 제한되지 않고, 본 설명에 의해 정의된 본 발명의 사상 및 범위 내에 변형이 포함되도록 의도된 것으로 이해된다.

서열

SEQ ID NO: 1 (글리코실화 컨센서스 서열)

Asn-X-Ser(Thr), 여기에서 X는 Pro를 제외한 임의의 아미노산일 수 있음

SEQ ID NO: 2 (최적화된 글리코실화 컨센서스 서열)

Asp(Glu)-X-Asn-Z-Ser(Thr), 여기에서 X 및 Z는 Pro를 제외한 아미노산으로부터 독립적으로 선택됨

SEQ ID NO: 3 (4 글리코실화 컨센서스 서열을 포함하는 EPA 담체 단백질 (EPA-4))

SEQ ID NO: 4 (O4 GtrS 아미노산 서열)

SEQ ID NO: 5 (예시적 O4 gtrS 핵산 서열)

SEQ ID NO: 6 (예시적 PglB 서열('야생형'))

SEQ ID NO: 7 (예시적 gtrA 아미노산 서열; 대장균 W3110 yfdG, GenBank: BAA16209.1)

SEQ ID NO: 8 (예시적 gtrB 아미노산 서열 - 대장균 W3110 yfdH, GenBank: BAA16210.1)

SEQ ID NO: 9 (예시적 O4 rfb 유전자좌 뉴클레오티드 서열 - O4-EPA 생성 균주 BVEC-L-00684f)

SEQ ID NO: 10 (EPA 담체 단백질에 대한 예시적 신호 서열)

SEQ ID NO: 11 (예시적 O1A rfb 유전자좌 뉴클레오티드 서열 - O1A-EPA 생성 균주 stGVXN4411 및 stLMTB10217)

SEQ ID NO: 12 (예시적 O2 rfb 유전자좌 뉴클레오티드 서열 - O2-EPA 생성 균주 stGVXN4906)

SEQ ID NO: 13 (예시적 O6A rfb 유전자좌 뉴클레오티드 서열 - O6A-EPA 생성 균주 stGVXN4112 및 stLMTB10923)

SEQ ID NO: 14 (예시적 O8 rfb 유전자좌 뉴클레오티드 서열 - O8-EPA 생성 균주 stLMTB11734)

SEQ ID NO: 15 (예시적 O15 rfb 유전자좌 뉴클레오티드 서열 - O15-EPA 생성 균주 stLMTB11738)

SEQ ID NO: 16 (예시적 O16 rfb 유전자좌 뉴클레오티드 서열 - O16-EPA 생성 균주 stLMTB11739)

SEQ ID NO: 17 (예시적 O18A rfb 유전자좌 뉴클레오티드 서열 - O18A-EPA 생성 균주 BVEC-L-00559)

SEQ ID NO: 18 (예시적 O25B rfb 유전자좌 뉴클레오티드 서열 - O25B-EPA 생성 균주 stGVXN4459)

SEQ ID NO: 19 (예시적 O75 rfb 유전자좌 뉴클레오티드 서열 - O75-EPA 생성 균주 stLMTB11737)

SEQUENCE LISTING <110> Janssen Pharmaceuticals, Inc. GlaxoSmithKline Biologicals S.A. <120> Methods of Producing Bioconjugates of E. coli O-Antigen Polysaccharides, Compositions Thereof, and Methods of Use Thereof <130> 004852.11612/128WO1 (CRU6009WOPCT1; VB66734P) <150> US62/819,762 <151> 2019-03-18 <160> 19 <170> PatentIn version 3.5 <210> 1 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> glycosylation consensus sequence <220> <221> VARIANT <222> (2)..(2) <223> any amino acid residue except Pro <220> <221> VARIANT <222> (3)..(3) <223> Ser orThr <400> 1 Asn Xaa Xaa 1 <210> 2 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> optimized glycosylation consensus sequence <220> <221> VARIANT <222> (1)..(1) <223> Asp or Glu <220> <221> VARIANT <222> (2)..(2) <223> any amino acid residue except Pro <220> <221> VARIANT <222> (4)..(4) <223> any amino acid residue except Pro <220> <221> VARIANT <222> (5)..(5) <223> Ser or Thr <400> 2 Xaa Xaa Asn Xaa Xaa 1 5 <210> 3 <211> 652 <212> PRT <213> Artificial Sequence <220> <223> EPA carrier protein comprising 4 glycosylation consensus sequences (EPA-4) <400> 3 Gly Ser Gly Gly Gly Asp Gln Asn Ala Thr Gly Ser Gly Gly Gly Lys 1 5 10 15 Leu Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys Ala Cys 20 25 30 Val Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser Val Asp 35 40 45 Pro Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr Ser Met 50 55 60 Val Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp Asn Ala 65 70 75 80 Leu Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly Gly Val 85 90 95 Glu Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala Arg Gly 100 105 110 Ser Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys Pro Ser 115 120 125 Asn Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln Leu Ser 130 135 140 His Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu Leu Ala 145 150 155 160 Lys Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu Ser Asn 165 170 175 Glu Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser Val Val 180 185 190 Met Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu Trp Ala 195 200 205 Ser Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val Tyr Asn 210 215 220 Tyr Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu Gly Lys 225 230 235 240 Ile Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu Asp Ile 245 250 255 Lys Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg Leu His 260 265 270 Phe Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys 275 280 285 His Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg Gly Trp 290 295 300 Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu 305 310 315 320 Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg 325 330 335 Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile 340 345 350 Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala 355 360 365 Glu Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly 370 375 380 Ala Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Lys Asp 385 390 395 400 Gln Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser Gly Asp 405 410 415 Ala Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu Gly Asp 420 425 430 Gly Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp Thr Val 435 440 445 Glu Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly Tyr Val 450 455 460 Phe Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser Ile Val 465 470 475 480 Phe Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile Trp Arg 485 490 495 Gly Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr Ala Gln 500 505 510 Asp Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala Leu Leu 515 520 525 Arg Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg Thr Gly 530 535 540 Leu Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg Leu Ile 545 550 555 560 Gly His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro Glu Glu 565 570 575 Glu Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu Arg Thr 580 585 590 Val Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val Gly Gly 595 600 605 Asp Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile Ser Ala 610 615 620 Leu Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu Asp Leu 625 630 635 640 Lys Leu Gly Ser Gly Gly Gly Asp Gln Asn Ala Thr 645 650 <210> 4 <211> 421 <212> PRT <213> Artificial Sequence <220> <223> O4 GtrS amino acid sequence <400> 4 Met Asn Asn Leu Ile Met Asn Asn Trp Cys Lys Leu Ser Ile Phe Ile 1 5 10 15 Ile Ala Phe Ile Leu Leu Trp Leu Arg Arg Pro Asp Ile Leu Thr Asn 20 25 30 Ala Gln Phe Trp Ala Glu Asp Ser Val Phe Trp Tyr Lys Asp Ala Tyr 35 40 45 Glu Asn Gly Phe Leu Ser Ser Leu Thr Thr Pro Arg Asn Gly Tyr Phe 50 55 60 Gln Thr Val Ser Thr Phe Ile Val Gly Leu Thr Ala Leu Leu Asn Pro 65 70 75 80 Asp Tyr Ala Pro Phe Val Ser Asn Phe Phe Gly Ile Met Ile Arg Ser 85 90 95 Val Ile Ile Trp Phe Leu Phe Thr Glu Arg Phe Asn Phe Leu Thr Leu 100 105 110 Thr Thr Arg Ile Phe Leu Ser Ile Tyr Phe Leu Cys Met Pro Gly Leu 115 120 125 Asp Glu Val His Ala Asn Ile Thr Asn Ala His Trp Tyr Leu Ser Leu 130 135 140 Tyr Val Ser Met Ile Leu Ile Ala Arg Asn Pro Ser Ser Lys Ser Trp 145 150 155 160 Arg Phe His Asp Ile Phe Phe Ile Leu Leu Ser Gly Leu Ser Gly Pro 165 170 175 Phe Ile Ile Phe Ile Leu Ala Ala Ser Cys Phe Lys Phe Ile Asn Asn 180 185 190 Cys Lys Asp His Ile Ser Val Arg Ser Phe Ile Asn Phe Tyr Leu Arg 195 200 205 Gln Pro Tyr Ala Leu Met Ile Val Cys Ala Leu Ile Gln Gly Thr Ser 210 215 220 Ile Ile Leu Thr Phe Asn Gly Thr Arg Ser Ser Ala Pro Leu Gly Phe 225 230 235 240 Ser Phe Asp Val Ile Ser Ser Ile Ile Ser Ser Asn Ile Phe Leu Phe 245 250 255 Thr Phe Val Pro Trp Asp Ile Ala Lys Ala Gly Trp Asp Asn Leu Leu 260 265 270 Leu Ser Tyr Phe Leu Ser Val Ser Ile Leu Ser Cys Ala Ala Phe Val 275 280 285 Phe Val Lys Gly Thr Trp Arg Met Lys Val Phe Ala Thr Leu Pro Leu 290 295 300 Leu Ile Ile Ile Phe Ser Met Ala Lys Pro Gln Leu Thr Asp Ser Ala 305 310 315 320 Pro Gln Leu Pro Thr Leu Ile Asn Gly Gln Gly Ser Arg Tyr Phe Val 325 330 335 Asn Ile His Ile Ala Ile Phe Ser Leu Leu Cys Val Tyr Leu Leu Glu 340 345 350 Cys Val Arg Gly Lys Val Ala Thr Leu Phe Ser Lys Ile Tyr Leu Thr 355 360 365 Ile Leu Leu Phe Val Met Gly Cys Leu Asn Phe Val Ile Thr Pro Leu 370 375 380 Pro Asn Met Asn Trp Arg Glu Gly Ala Thr Leu Ile Asn Asn Ala Lys 385 390 395 400 Thr Gly Asp Val Ile Ser Ile Gln Val Leu Pro Pro Gly Leu Thr Leu 405 410 415 Glu Leu Arg Lys Lys 420 <210> 5 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> Example O4 gtrS nucleic acid sequence <400> 5 atgaataatt taattatgaa taactggtgt aaattatcta tatttattat tgcatttatt 60 ttgctatggc ttagaaggcc ggatatactc acaaacgcac aattttgggc agaagattcc 120 gttttctggt ataaggacgc ctatgagaac ggattcttaa gttcactaac aacgcctagg 180 aatgggtatt tccagactgt ttctacattt atagttggtc tgactgcttt attaaatcca 240 gattatgcac cttttgtttc taattttttt ggcataatga ttcgctcagt aattatatgg 300 tttttattta cagaaagatt caacttcctc acattgacta ctaggatttt cttatctatt 360 tattttctat gcatgcctgg attggatgaa gttcatgcaa atataacaaa tgcacattgg 420 tatttgtcat tatatgtatc aatgatcctg atagctcgca atccaagttc aaaatcatgg 480 aggtttcatg atatattctt tatcttgcta tccgggctca gtggcccatt tataattttc 540 attttagcag cttcatgctt taaatttata aataattgta aagatcatat tagtgtaaga 600 tctttcataa atttctactt gcgtcagcca tacgcattaa tgattgtttg cgctttaatt 660 caaggaactt ctataattct aactttcaat ggcacacgtt cctcagcacc gctaggattc 720 agttttgatg tgatttcgtc tattatatca tcgaatattt ttttatttac atttgtccca 780 tgggatattg caaaggctgg gtgggataat ttactgttat cttatttttt gtctgtttcg 840 attttgtcgt gtgcggcctt tgtttttgtt aaaggtacgt ggcgaatgaa agtatttgca 900 actttaccat tgctaattat aatattttca atggcaaaac cacaattgac agactcggca 960 cctcaattgc caacacttat taatgggcaa ggttcaagat acttcgtaaa tatacatatt 1020 gcgatattct ctttgctatg tgtttactta cttgagtgcg tcagggggaa agtggcaact 1080 ttattttcca aaatatactt aacaattttg ctattcgtga tgggatgttt gaattttgtt 1140 atcaccccac tcccaaacat gaactggagg gaaggtgcta ctttgattaa taatgcaaaa 1200 actggtgatg tcatttcgat tcaagtgcta ccacctggcc taacacttga actaaggaaa 1260 aaataa 1266 <210> 6 <211> 713 <212> PRT <213> Artificial Sequence <220> <223> Example PglB sequence ('wild-type') <400> 6 Met Leu Lys Lys Glu Tyr Leu Lys Asn Pro Tyr Leu Val Leu Phe Ala 1 5 10 15 Met Ile Ile Leu Ala Tyr Val Phe Ser Val Phe Cys Arg Phe Tyr Trp 20 25 30 Val Trp Trp Ala Ser Glu Phe Asn Glu Tyr Phe Phe Asn Asn Gln Leu 35 40 45 Met Ile Ile Ser Asn Asp Gly Tyr Ala Phe Ala Glu Gly Ala Arg Asp 50 55 60 Met Ile Ala Gly Phe His Gln Pro Asn Asp Leu Ser Tyr Tyr Gly Ser 65 70 75 80 Ser Leu Ser Ala Leu Thr Tyr Trp Leu Tyr Lys Ile Thr Pro Phe Ser 85 90 95 Phe Glu Ser Ile Ile Leu Tyr Met Ser Thr Phe Leu Ser Ser Leu Val 100 105 110 Val Ile Pro Thr Ile Leu Leu Ala Asn Glu Tyr Lys Arg Pro Leu Met 115 120 125 Gly Phe Val Ala Ala Leu Leu Ala Ser Ile Ala Asn Ser Tyr Tyr Asn 130 135 140 Arg Thr Met Ser Gly Tyr Tyr Asp Thr Asp Met Leu Val Ile Val Leu 145 150 155 160 Pro Met Phe Ile Leu Phe Phe Met Val Arg Met Ile Leu Lys Lys Asp 165 170 175 Phe Phe Ser Leu Ile Ala Leu Pro Leu Phe Ile Gly Ile Tyr Leu Trp 180 185 190 Trp Tyr Pro Ser Ser Tyr Thr Leu Asn Val Ala Leu Ile Gly Leu Phe 195 200 205 Leu Ile Tyr Thr Leu Ile Phe His Arg Lys Glu Lys Ile Phe Tyr Ile 210 215 220 Ala Val Ile Leu Ser Ser Leu Thr Leu Ser Asn Ile Ala Trp Phe Tyr 225 230 235 240 Gln Ser Ala Ile Ile Val Ile Leu Phe Ala Leu Phe Ala Leu Glu Gln 245 250 255 Lys Arg Leu Asn Phe Met Ile Ile Gly Ile Leu Gly Ser Ala Thr Leu 260 265 270 Ile Phe Leu Ile Leu Ser Gly Gly Val Asp Pro Ile Leu Tyr Gln Leu 275 280 285 Lys Phe Tyr Ile Phe Arg Ser Asp Glu Ser Ala Asn Leu Thr Gln Gly 290 295 300 Phe Met Tyr Phe Asn Val Asn Gln Thr Ile Gln Glu Val Glu Asn Val 305 310 315 320 Asp Leu Ser Glu Phe Met Arg Arg Ile Ser Gly Ser Glu Ile Val Phe 325 330 335 Leu Phe Ser Leu Phe Gly Phe Val Trp Leu Leu Arg Lys His Lys Ser 340 345 350 Met Ile Met Ala Leu Pro Ile Leu Val Leu Gly Phe Leu Ala Leu Lys 355 360 365 Gly Gly Leu Arg Phe Thr Ile Tyr Ser Val Pro Val Met Ala Leu Gly 370 375 380 Phe Gly Phe Leu Leu Ser Glu Phe Lys Ala Ile Met Val Lys Lys Tyr 385 390 395 400 Ser Gln Leu Thr Ser Asn Val Cys Ile Val Phe Ala Thr Ile Leu Thr 405 410 415 Leu Ala Pro Val Phe Ile His Ile Tyr Asn Tyr Lys Ala Pro Thr Val 420 425 430 Phe Ser Gln Asn Glu Ala Ser Leu Leu Asn Gln Leu Lys Asn Ile Ala 435 440 445 Asn Arg Glu Asp Tyr Val Val Thr Trp Trp Asp Tyr Gly Tyr Pro Val 450 455 460 Arg Tyr Tyr Ser Asp Val Lys Thr Leu Val Asp Gly Gly Lys His Leu 465 470 475 480 Gly Lys Asp Asn Phe Phe Pro Ser Phe Ala Leu Ser Lys Asp Glu Gln 485 490 495 Ala Ala Ala Asn Met Ala Arg Leu Ser Val Glu Tyr Thr Glu Lys Ser 500 505 510 Phe Tyr Ala Pro Gln Asn Asp Ile Leu Lys Thr Asp Ile Leu Gln Ala 515 520 525 Met Met Lys Asp Tyr Asn Gln Ser Asn Val Asp Leu Phe Leu Ala Ser 530 535 540 Leu Ser Lys Pro Asp Phe Lys Ile Asp Thr Pro Lys Thr Arg Asp Ile 545 550 555 560 Tyr Leu Tyr Met Pro Ala Arg Met Ser Leu Ile Phe Ser Thr Val Ala 565 570 575 Ser Phe Ser Phe Ile Asn Leu Asp Thr Gly Val Leu Asp Lys Pro Phe 580 585 590 Thr Phe Ser Thr Ala Tyr Pro Leu Asp Val Lys Asn Gly Glu Ile Tyr 595 600 605 Leu Ser Asn Gly Val Val Leu Ser Asp Asp Phe Arg Ser Phe Lys Ile 610 615 620 Gly Asp Asn Val Val Ser Val Asn Ser Ile Val Glu Ile Asn Ser Ile 625 630 635 640 Lys Gln Gly Glu Tyr Lys Ile Thr Pro Ile Asp Asp Lys Ala Gln Phe 645 650 655 Tyr Ile Phe Tyr Leu Lys Asp Ser Ala Ile Pro Tyr Ala Gln Phe Ile 660 665 670 Leu Met Asp Lys Thr Met Phe Asn Ser Ala Tyr Val Gln Met Phe Phe 675 680 685 Leu Gly Asn Tyr Asp Lys Asn Leu Phe Asp Leu Val Ile Asn Ser Arg 690 695 700 Asp Ala Lys Val Phe Lys Leu Lys Ile 705 710 <210> 7 <211> 120 <212> PRT <213> Escherichia coli <400> 7 Met Leu Lys Leu Phe Ala Lys Tyr Thr Ser Ile Gly Val Leu Asn Thr 1 5 10 15 Leu Ile His Trp Val Val Phe Gly Val Cys Ile Tyr Val Ala His Thr 20 25 30 Asn Gln Ala Leu Ala Asn Phe Ala Gly Phe Val Val Ala Val Ser Phe 35 40 45 Ser Phe Phe Ala Asn Ala Lys Phe Thr Phe Lys Ala Ser Thr Thr Thr 50 55 60 Met Arg Tyr Met Leu Tyr Val Gly Phe Met Gly Thr Leu Ser Ala Thr 65 70 75 80 Val Gly Trp Ala Ala Asp Arg Cys Ala Leu Pro Pro Met Ile Thr Leu 85 90 95 Val Thr Phe Ser Ala Ile Ser Leu Val Cys Gly Phe Val Tyr Ser Lys 100 105 110 Phe Ile Val Phe Arg Asp Ala Lys 115 120 <210> 8 <211> 306 <212> PRT <213> Escherichia coli <400> 8 Met Lys Ile Ser Leu Val Val Pro Val Phe Asn Glu Glu Glu Ala Ile 1 5 10 15 Pro Ile Phe Tyr Lys Thr Val Arg Glu Phe Glu Glu Leu Lys Ser Tyr 20 25 30 Glu Val Glu Ile Val Phe Ile Asn Asp Gly Ser Lys Asp Ala Thr Glu 35 40 45 Ser Ile Ile Asn Ala Leu Ala Val Ser Asp Pro Leu Val Val Pro Leu 50 55 60 Ser Phe Thr Arg Asn Phe Gly Lys Glu Pro Ala Leu Phe Ala Gly Leu 65 70 75 80 Asp His Ala Thr Gly Asp Ala Ile Ile Pro Ile Asp Val Asp Leu Gln 85 90 95 Asp Pro Ile Glu Val Ile Pro His Leu Ile Glu Lys Trp Gln Ala Gly 100 105 110 Ala Asp Met Val Leu Ala Lys Arg Ser Asp Arg Ser Thr Asp Gly Arg 115 120 125 Leu Lys Arg Lys Thr Ala Glu Trp Phe Tyr Lys Leu His Asn Lys Ile 130 135 140 Ser Asn Pro Lys Ile Glu Glu Asn Val Gly Asp Phe Arg Leu Met Ser 145 150 155 160 Arg Asp Val Val Glu Asn Ile Lys Leu Met Pro Glu Arg Asn Leu Phe 165 170 175 Met Lys Gly Ile Leu Ser Trp Val Gly Gly Lys Thr Asp Ile Val Glu 180 185 190 Tyr Val Arg Ala Glu Arg Ile Ala Gly Asp Thr Lys Phe Asn Gly Trp 195 200 205 Lys Leu Trp Asn Leu Ala Leu Glu Gly Ile Thr Ser Phe Ser Thr Phe 210 215 220 Pro Leu Arg Ile Trp Thr Tyr Ile Gly Leu Val Val Ala Ser Val Ala 225 230 235 240 Phe Ile Tyr Gly Ala Trp Met Ile Leu Asp Thr Ile Ile Phe Gly Asn 245 250 255 Ala Val Arg Gly Tyr Pro Ser Leu Leu Val Ser Ile Leu Phe Leu Gly 260 265 270 Gly Ile Gln Met Ile Gly Ile Gly Val Leu Gly Glu Tyr Ile Gly Arg 275 280 285 Thr Tyr Ile Glu Thr Lys Lys Arg Pro Lys Tyr Ile Ile Lys Arg Val 290 295 300 Lys Lys 305 <210> 9 <211> 14440 <212> DNA <213> Artificial Sequence <220> <223> example O4 rfb locus nucleotide sequence - O4-EPA production strain BVEC-L-00684f <400> 9 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320 cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380 aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440 atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500 cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560 accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620 gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtatatggt 1680 gatttgcctc atcctgacga ggtaaataat acagaagaat tacccttatt tactgagaca 1740 acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800 cgcgcgtgga aacgtaccta tggtttaccg accattgtga ctaattgctc taacaattat 1860 ggtccttatc atttcccgga aaaattgatt ccattggtta ttctcaatgc tctggaaggt 1920 aaagcattac ctatttatgg taaaggggat caaattcgcg actggctgta tgttgaagat 1980 catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040 ggtgggcaca acgaaaagaa aaacatagat gtagtgctca ctatttgtga tttgctggat 2100 gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc cgatcgtccg 2160 ggacacgatc gccgttatgc gattgatgct gagaatattg gtcgcgaatt gggatggaaa 2220 ccacaggaaa cgtttgagag cgggattcgg aagacagtgg aatggtatct gtccaataca 2280 aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaga gaactatgag 2340 ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400 agcgtgctct ggcacctctg ggtaacttga ttgctcttga tgttcattcc actgattatt 2460 gtggcgattt cagtaacccc gaaggtgtgg ctgaaaccgt caaaaaaatt cgcccagatg 2520 ttattgttaa tgctgctgct cataccgcgg tagataaggc tgagtcagaa ccagaatttg 2580 cacaattact caatgcgacc agcgttgaag caattgcaaa agcggctaat gaagttgggg 2640 cttgggtaat tcattactca actgactacg tcttccctgg aaatggcgac atgccatggc 2700 tcgagactga tgtaaccgct ccgctcaatg tttatggcaa aaccaaattg gctggagaaa 2760 gagcattaca agaacattgc gcaaagcatc ttattttccg taccagctgg gtatatgcag 2820 gtaaaggaaa taactttgcc aaaacaatgt tacgtctggc aaaagagcgc gaagaactgg 2880 ctgtgataaa cgatcagttt ggcgcaccaa caggtgctga attgctggct gattgcaccg 2940 ctcatgccat tcgcgtggca ttaaaaaaac cagaagttgc tggcttgtac catctggtag 3000 caaatggcac aacaacctgg cacgattacg ccgcgctagt attcgaagaa gcccgtaaag 3060 cagggattga ccttgcactt aacaaactca acgccgtacc aacaacggct tatcctactc 3120 cagcccgccg tcctcataat tctcgcctca ataccgaaaa gtttcagcag aactttgcgc 3180 ttgtcttgcc tgactggcag gtgggcgtga aacgtatgct caacgaatta tttacgacta 3240 cggcaattta acaaattttt gcatctcgct catgatgcca gagcgggatg aattaaaagg 3300 aatggtgaaa tgaaaacgcg taaaggtatt attctggctg gtggttccgg cactcgtctt 3360 tatcctgtga cgatggcagt gagtaaacaa ctgctgccga tttatgataa gccgatgatt 3420 tattatccgc tttcaacgct tatgttagcg ggtattcgcg atattcttat tatcagtacg 3480 ccacaggata caccgcgttt ccaacaattg ttgggggacg ggagtcagtg ggggcttaat 3540 ctacagtata aagtacaacc gagtccggat ggcctggcgc aagcgtttat tattggtgaa 3600 gactttattg gtggtgatga ttgtgcactc gtacttggcg ataatatctt ctatggacac 3660 gacttgccga aattaatgga agctgctgtt aacaaagaaa tcggtgcaac ggtatttgct 3720 tatcacgtca atgatcctga acgttatggt gtcgtggagt ttgataataa cggtactgca 3780 attagcctgg aagaaaaacc gctggaacca aaaagtaact atgcggttac tgggctttat 3840 ttctatgaca atgatgttgt agaaatggcg aaaaacctta agccttctgc ccgtggcgaa 3900 ctggaaatta ccgatattaa ccgtatttat atggagcagg gacgtttgtc tgtcgctatg 3960 atggggcgtg gttatgcctg gttggatact ggtacacatc aaagtcttat tgaagcaagt 4020 aacttcattg ccaccattga agagcgtcag ggattaaagg tatcttgccc ggaagagatt 4080 gcttaccgta aagggtttat tgatgctgag caggtgaaag tattagccga accgctgaag 4140 aaaaatgatt atggtcagta tctgctaaaa atgattaaag gttattaata aaatgaacgt 4200 aattaaaact gaaattcctg atgtgctgat ttttgaacca aaagtttttg gtgatgaacg 4260 tggcttcttt tttgagagtt ttaaccagaa agtatttgaa gaagctgtag gacggaaggt 4320 tgaatttgtt caggataacc attctaagtc taaaataaat gtattgcgtg ggatgcatta 4380 tcaaacacaa aatactcaag gaaaactggt tcgggtaatt tctggttcag tatatgatgt 4440 tgccgtagat ttaagagaaa aatcaaagac atttggcaaa tgggtgggtg tagaattatc 4500 tgggaataat aaaagacaat tgtggatccc cgaaggtttt gcccatggtt tttatgtgtt 4560 ggaggagaat accgaatttg tttataaatg taccgatact tataaccctg ctcatgaaca 4620 cacattgcta tggaatgatc caactatcaa tataagttgg ccaatcatac aaaactgcaa 4680 gccaattatt tctgaaaaag atgctaatgg acatcttttt tcacataaaa cctatttctg 4740 aaatgcaata ttatgagttt aattagaaac agtttctata atattgctgg ttttgctgtg 4800 ccgacattag ttgcagtccc tgctttgggg attcttgcca ggctgcttgg accggagaat 4860 tttggacttt tcacactagc attcgctttg ataggatatg caagtatttt cgacgccggg 4920 attagtcgag ctgtaatcag agaaatcgct ctttatcgag aaagtgaaaa agagcaaata 4980 caaattattt cgacagcaag tgtaatcgta ctattcttag gggtggttgc agctttgtta 5040 ctttatttta gtagtaataa agttgttgag ttattgaatg ttagttccgt ttatattgaa 5100 acagcagtgc gtgcattctc tgttatttca tttataatac ctgtgtatct gattaaccag 5160 atttggcttg gttatctgga agggctagaa aaatttgcaa atataaatgt tcagagaatg 5220 atttctagca caagcttggc tatattacca gtgatatttt gttattacaa tccctcgttg 5280 ctttatgcta tgtatgggtt ggtggttggg cgtgtgattt catttttgat tagcgcaata 5340 atttgtcgag atattattct taaaagtaaa ctttacttta atgtggcaac ttgcaatcgt 5400 cttatctctt ttggtggatg gataacagtt agtaatatca taagcccaat catggcatat 5460 ttcgaccgct ttatcatctc tcatattatg ggggcttcga gaattgcatt ttatacagcg 5520 ccctcagagg gtgtatcaag gttaattaat atcccatatg ctttggcaag agctctattt 5580 cctaaattgg catatagcaa taatgatgat gaacgaaaaa aattacaact acagagctac 5640 gcaattataa gcattgtatg tctacccata gttgttattg gtgtcatttt tgcctcattc 5700 ataatgacaa catggatggg acctgattat gccttagaag cagcaactat catgaaaata 5760 cttcttgctg gttttttctt taactcttta gcgcaaatac cttatgcata cttgcaatct 5820 atcggaaagt caaaaattac cgcatttgtg catctcatag aacttgcgcc atacttatta 5880 ttattgtatt acttcacaat gcatttcggc ataattggca cggcaatcgc ttggtcactt 5940 agaacatttt gtgattttgt tatactactt tcgatatcga gaagaaaatg attgcggttg 6000 atattgcgct tgcaacctac aatggtgcta attttattcg gcaacagatt gaatctatcc 6060 agaaacaaac ttatagaaat tggcgtctta taataagtga tgataactcg agtgatgata 6120 ctgttgatat tattaaggat atgatgtcta acgacagtcg tatctatttg gtaggaaata 6180 aaagacaagg aggggttatt cagaacttta attatgctct ttcacaaact acatctgaaa 6240 ttgtgttact atgtgaccag gatgacattt ggccggagga gcgtctggaa attcttatag 6300 ataaatttaa ggccttgcag cgtaatgatt ttgttccggc aatgatgttt actgatttga 6360 aattagtaga cgaaaataat tgtttgattg cagaaagttt ttatcgaacg aataatatta 6420 atccacaaga taatctgaaa aataataatc ttctctggcg ttcaacggta tatggctgta 6480 cttgcatcat gaataagaaa cttgttgata ttgcattgcc tatacctaca tatgcacata 6540 tgcatgatca atggttggca ttattagcga agcaatatgg taacattttt tatttcgact 6600 atgcgtctgt tcgttatagg caacattcta caaatgttgt tggtggtaga aataaaacgc 6660 catttcaaaa atttaattcc atacaaaaaa acctaaaaag gattaatttg ctagtggata 6720 gaactgttgc tttaattaaa tcaaataacg atttctatcc agggaataaa atggaaaata 6780 aaattgatta cttaaaattt ggagtgaatg aagtattacc ttatcttttt aaaggaaaca 6840 agaaagtttt ttcactttgt gtattaatta gtttggcatt acaaaaatga tatatttatt 6900 attttttttt gcactgttta tgatctgtac gtttttaaca cacaggcgac aggcattata 6960 tgttgtatct gcgttagtat ttcttttttt ggctttaacc tatccatcag gaggggactg 7020 gataggttat tttctccatt atgactgcat ggttaatgag cagtgtaata atggttttat 7080 aatgtttgaa cctggatatg aattaattgt ttccttattt ggatatttgg gatttcagac 7140 aattattatt tttatagccg ctgtaaatgt aattctaata ttaaattttg caaagcattt 7200 tgaaaacgga agttttgtta ttgttgcgat aatgtgcatg ttcctttgga gtgtttatgt 7260 tgaggcgatt agacaggctc tggccttatc tatagttata tttgggattc attctctttt 7320 tttgggtaga aaaaggaaat ttataacatt agtattattt gcgtcaactt tccatataac 7380 tgctttgatt tgttttcttc taatgactcc tctattttca aagaaattaa gcaagataat 7440 aagttatagc ctattaattt tcagtagctt ctttttcgct ttttctgaaa ccatattaag 7500 tgcactcctt gcaattttgc cagaaggatc cattgccagt gaaaaattaa gtttttactt 7560 agcaaccgag caatacaggc cacagttatc tattgggagt ggcactattc ttgacattat 7620 acttattttt ctgatatgtg taagttttaa acgaataaag aaatatatgc tcgctaatta 7680 taatgctgca aatgagatat tgcttattgg ttgctgtctt tatatttctt tcggtatttt 7740 tatcgggaaa atgatgccag ttatgactcg cattggttgg tatggttttc catttgttat 7800 agtacttctt tatattaact tgggttattc agaatatttt aagaggtata taaataaaag 7860 agggtgtggg tatagcaaat tattaattgc tttttatttt ttgctacaaa ttttgcgacc 7920 attaacatat gattatagct attataatat aatgcaccag gatactttgc tgaataggtt 7980 tgatgcatta gatgatgcat cattaagaca atcagcgaag agaaaatgtt tcgatttggg 8040 aaagatagga tatggtttct tatgtagtat ataatatcct gcattcattc ggataatttc 8100 ctatggaagt gtcctttgct ctgtctgtcc tcatttgttg aaattttatg ttaataagaa 8160 gctttagata accacttagg aactgtatgt ttgatctgtc caaaaattat attattgtaa 8220 gtgcgacggc gctggcttcc ggaggtgcat taactatatt aaagcaattt ataaaacatg 8280 catcacaaaa ttcaaatgac tatattatgt ttgtatctgc gggattggag ttgccggtct 8340 gtgataacat catttacata gaaaacacac caaaaggatg gttgaaaaga atatattggg 8400 attggttcgg ttgtcggaag tttatctcgg aacataagat taacgttaag aaagtaattt 8460 ctctacaaaa ttccagtttg aatgttcctt acgaacagat tatttacttg caccagccaa 8520 ttccttttag taaagttgat tcttttttaa aaaatatcac atccgataac gtaaagcttt 8580 ttttatataa aaagttttat tcctatttta tatttaaata tgtgaatgcc aatacaacca 8640 tcgtagtgca aacgaattgg atgaaaaaag gagtgctgga gcaatgtgat aaaattagta 8700 ccgaaagggt ccttgttata aaacctgata tcaaagcatt taataatact aattttgatg 8760 tagatatgga tgtatctgca aaaacactct tatatccagc gacaccactt acctataaaa 8820 atcatttggt cattctgaag gcgttggtta ttttaaagaa aaagtatttt atagatgatc 8880 tgaaattcca agtgactttt gaaaagaata ggtacaaaaa ttttgataag tttgtgcaat 8940 taaataactt aagcaaaaac gttgattatc tcggcgttct ttcatactcg aacttgcaaa 9000 aaaaatatat ggcggcatct ttaatcgttt ttcctagcta tatcgaatca tatgggttac 9060 cactcatcga agctgctagt ttaggaaaaa aaatcattag tagtgatctt ccttatgccc 9120 gggatgtttt aaaggattat agcggcgtag attttgtaat ttacaataat gaagatggct 9180 gggctaaggc gttgtttaat gttttaaatg gcaattcgaa gctcaatttt aggccttatg 9240 aaaaagatag tcgttcatct tggccacagt tcttctctat tttgaaataa ggtgtattat 9300 gtttaatggt aaaatattgt taattactgg tggtacgggg tctttcggta atgctgttct 9360 aagacgtttt cttgacactg atatcaaaga aatacgtatt ttttcccggg atgaaaaaaa 9420 acaagatgac atgaggaaaa aatataataa tccgaaactt aagttctata taggtgatgt 9480 tcgcgactat tcgagtatcc tcaatgcttc tcgaggtgtt gattttattt atcatgctgc 9540 agctctgaag caagtacctt cctgcgaatt ccacccaatg gaagctgtaa aaacgaatgt 9600 tttaggtacg gaaaacgtac tggaagcggc aatagctaat ggagttaggc gaattgtatg 9660 tttgagtaca gataaagctg tatatcctat caatgcaatg ggtatttcca aagcgatgat 9720 ggaaaaagta atggtagcaa aatcgcgcaa tgttgactgc tctaaaacgg ttatttgcgg 9780 tacacgttat ggcaatgtaa tggcatctcg tggttcagtt atcccattat ttgtcgatct 9840 gattaaatca ggtagaccaa tgacgataac agaccctaat atgactcgtt tcatgatgac 9900 tctcgaagac gctgttgatt tggttcttta cgcatttgaa catggcaata atggtgatat 9960 ttttgtccaa aaggcacctg cggctaccat cgaaacgttg gctattgcac tcaaagaatt 10020 acttaatgta aaccaacacc ctgtaaatat aatcggcacc cgacacgggg aaaaactgta 10080 cgaagcgtta ttgagccgag aggaaatgat tgcagcggag gatatgggtg attattatcg 10140 tgttccacca gatctccgcg atttgaacta tggaaaatat gtggaacatg gtgaccgtcg 10200 tatctcggaa gtggaagatt ataactctca taatactgat aggttagatg ttgagggaat 10260 gaaaaaatta ctgctaaaac ttccttttat ccgggcactt cggtctggtg aagattatga 10320 gttggattca taatatgaaa attttagtta ctggcgctgc agggtttatc ggtcgaaatt 10380 tggtattccg gcttaaggaa gctggatata acgaactcat tacgatagat cgtaactctt 10440 ctttggcgga tttagagcag ggacttaagc aggcagattt tatttttcac cttgctgggg 10500 taaatcgtcc cgtgaaggag tgtgaatttg aagagggaaa tagtaatcta actcaacaga 10560 ttgttgatat cctgaaaaaa aacaataaaa atactcctat catgctgagt tcttccatcc 10620 aggctgaatg tgataacgct tatggaaaga gtaaagcagc tgcggaaaaa atcattcagc 10680 agtatgggga aacgacaaac gctaaatatt atatttatcg cttgccgaat gtattcggta 10740 agtggtgtcg accaaattat aactccttta tagcaacttt ctgccatcgc attgcaaatg 10800 atgaagctat tacaattaat gatccttcag cagttgtaaa tctggtgtat atagatgact 10860 tttgttctga catattaaag ctattagaag gagcgaacga aactggttac aggacatttg 10920 gtccaattta ttctgttact gttggtgaag tggcacaatt aatttaccgg tttaaagaaa 10980 gtcgccaaac attaatcacc gaagatgtag gtaatggatt tacacgtgca ttgtactcaa 11040 catggttaag ttacctgtct cctgaacagt ttgcgtatac ggttccttct tatagtgatg 11100 acagaggggt attctgtgaa gtattgaaaa cgaaaaacgc gggccagttt tcgttcttta 11160 ctgcgcatcc aggaattact cggggtggtc attatcatca ttccaaaaat gagaaattta 11220 ttgtcatccg aggaagtgct tgtttcaaat ttgaaaatat tgtcacgagt gaacgatatg 11280 aacttaatgt ttcctctgat gattttaaaa ttgttgaaac agttccggga tggacgcata 11340 acattactaa taatggctcg gatgagctag ttgttatgct ttgggcaaat gaaatattta 11400 atcgttctga accagatact atagcgagag ttttatcgtg aaaaaattga aagtcatgtc 11460 ggttgttggg actcgtccag aaattattcg actctcgcgt gtccttgcaa aattagatga 11520 atattgtgac caccttattg ttcataccgg gcaaaactac gattatgaac tgaatgaagt 11580 ttttttcaaa gatttgggtg ttcgcaaacc tgattatttt cttaatgccg caggtaaaaa 11640 tgcagcagag actattggac aagttatcat taaagttgat gaggtccttg aacaggaaaa 11700 accagaagcc atgttagtac ttggcgatac taactcctgt atttcagcaa taccagcaaa 11760 gcgtcgaaga attccgatct tccatatgga ggctgggaat cgttgttttg accaacgcgt 11820 accggaagaa actaacagaa aaatagttga tcataccgct gatatcaata tgacatatag 11880 tgatatcgcg cgtgaatatc ttctggctga aggtgtacca gccgatagaa ttattaaaac 11940 cggtagccca atgtttgaag tactcactca ttatatgccg cagattgatg gttccgatgt 12000 actttctcgc ctgaatttaa cacctgggaa tttctttgtg gtaagtgccc acagagaaga 12060 aaatgttgat acccctaaac aacttgtgaa actggcgaat atacttaata ccgtggctga 12120 aaaatatgat gtcccggtag ttgtttctac tcatcctcgc actcgtaacc gcatcaacga 12180 aaacggtatt caattccata aaaatatctt gcttcttaag ccattaggat ttcacgatta 12240 caaccatctg caaaaaaatg cacgtgctgt tttatcggat agtgggacta ttacagaaga 12300 gtcctccatt atgaacttcc ctgcactcaa tatacgagaa gcgcacgaac gcccggaagg 12360 cttcgaagaa ggggcagtaa tgatggtcgg tcttgaatct gatcgcgttt tacaggcatt 12420 agaaattatt gcaacacagc ctcgtggaga agtacgctta cttcgtcagg ttagtgacta 12480 tagcatgcca aatgtttcag ataaagttct gcgtattatc cattcatata ctgactacgt 12540 taaacgggtt gtctggaagc aatactaatg aaacttgcat taatcattga tgattatttg 12600 ccccatagca cacgcgttgg ggctaaaatg tttcatgagt taggccttga attactgagc 12660 agaggccatg atgtaactgt aattacgcct gacatctcat tacaagcaat ttattctatt 12720 agtatgattg atggtataaa ggtttggcgt ttcaaaagtg gacctttaaa ggatgtaggt 12780 aaggctaaac gtgccataaa tgaaactctt ttatcttttc gcgcatggcg cgcatttaag 12840 cacctcattc aacatgatac atttgatggt atcgtttatt attccccctc tattttttgg 12900 ggcgacttgg ttaaaaaaat aaaacaacga tgccagtgcc caagctatct gatcctaagg 12960 gatatgtttc cacagtgggt cattgatgca ggtatgttga aagccggttc accaattgaa 13020 aaatatttta ggtattttga aaaaaagtca tatcagcagg ctggccggat aggggtaatg 13080 tctgataaga atcttgagat atttcgccag accaataaag gttatccgtg tgaagtttta 13140 cgtaattggg cctcaatgac tcctgtgtct gccagcgatg attatcattc acttcgtcaa 13200 aaatacgatc taaaagataa agtcattttt ttctatggcg gtaatattgg gcatgctcag 13260 gatatggcaa acttaatgcg ccttgcgcgt aatatgatgc gttatcatga tgctcatttc 13320 ctgtttatag ggcagggtga tgaagttgag ctgataaaat ctcttgctgc agaatggaat 13380 ttaactaatt tcactcatct accttcagtg aaccaggaag agtttaaatt aattttatct 13440 gaagttgatg tcggcctgtt ctccctttca tctcgccatt cttcacataa tttccccgga 13500 aaattactag ggtatatggt tcaatcaatc ccgatccttg ggagtgtgaa tggcggcaat 13560 gatttaatgg atgtaattaa taagcacaga gccggtttca ttcatgttaa tggtgaagat 13620 gataaactgt ttgaatctgc acaattgctt cttagtgatt cagttttaag aaaacagcta 13680 ggtcagaacg ctaatgtgtt gttaaagtct caattttcgg ttgaatcggc ggcacatact 13740 atcgaagtcc gactggaggc tggagaatgc gtttagttga tgacaatatt ctggatgaac 13800 tttttcgcac tgcagcaaat tctgaacgtt tgcgcgctca ttatttattg cacgcatctc 13860 atcaggagaa ggttcaacgt ttacttattg catttgtacg cgacagctat gttgaacccc 13920 attggcatga gttaccgcat cagtgggaaa tgtttgtcgt catgcaaggg caattagaag 13980 tttgtttgta tgagcaaaat ggtgagatcc aaaaacagtt tgttgttgga gacggtacgg 14040 gaataagcgt cgtggaattt tccccaggag atatacatag tgtcaaatgc ctgtcaccaa 14100 aagcccttat gttggagata aaggaggggc catttgaccc actcaaagct aaggcttttt 14160 ctaagtggtt atagggcgat acaccaccgt ttattcttct atcttattct atacatgctg 14220 ggttaccatc ttagcttctt caagccgcgc aaccccgcgg tgaccacccc tgacaggagt 14280 agctagcatt tgaccacccc tgacaggatt agctagcata tgagctcgag gatatctact 14340 gtgggtaccc gggatccgtg taggctggag ctgcttcgaa gttcctatac tttctagaga 14400 ataggaactt cggaatagga actaaggagg atattcatat 14440 <210> 10 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> example signal sequence for EPA carrier protein <400> 10 Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser 1 5 10 15 Ala Ser Ala <210> 11 <211> 13043 <212> DNA <213> Artificial Sequence <220> <223> example O1A rfb locus nucleotide sequence - O1A-EPA production strain stGVXN4411 and stLMTB10217 <400> 11 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcgtgaagat acttgttact aggggcgcag gatttattgg ttctgctgta 1320 gttcgtcaca ttataaataa tacgcaggat agtgttgtta atgtcgataa attaacgtac 1380 gccggaaacc tggaatcact tgctgatgtt tctgactctg aacgctatgt ttttgaacat 1440 gcggatattt gcgatgctgc tgcaatggcg cggatttttg ctcagcatca gccggatgca 1500 gtgatgcacc tggctgctga aagccatgtg gatcgttcaa ttacaggccc tgcggcattt 1560 attgaaacca atattgttgg tacttatgtc cttttggaag cggctcgcaa ttactggtct 1620 gctcttgatg gcgacaagaa aaatagcttc cgttttcatc atatttctac tgacgaagtc 1680 tatggtgatt tgcctcatcc tgacgaagta aataataaag aacaattacc cctctttact 1740 gagacgacag cttacgcgcc tagtagtcct tattccgcat caaaagcatc cagcgatcat 1800 ttagtccgcg cgtggaaacg tacctatggt ttaccgacta ttgtgactaa ctgttcgaat 1860 aactacggtc cttatcactt tccggaaaaa ttgattccac tagtaattct taatgctctg 1920 gaaggtaagg cattacctat ttatggcaaa ggggatcaaa ttcgtgactg gctgtatgtt 1980 gaagatcatg cgcgtgcgtt atataccgta gttactgaag gtcaagcggg tgaaacctat 2040 aacattggcg gacacaacga aaagaaaaac atcgatgttg tgctgactat ttgtgatttg 2100 ttggacgaga tagtcccgaa agagaaatct tatcgtgagc aaattactta tgttgctgat 2160 cgcccagggc atgatcgccg ttatgcgatt gatgctgaga agattggtcg cgaattggga 2220 tggaaaccac aggaaacgtt tgagagtggg attcgtaaaa cggtggaatg gtatttggct 2280 aatgcaaaat gggttgataa tgtgaaaagt ggtgcctatc aatcgtggat tgaacagaac 2340 tatgagggcc gccagtaatg aatatcctcc tttttggcaa aacagggcag gtaggttggg 2400 aactacagcg tgctctggca cctctgggta atttgattgc tcttgatgtt cactccactg 2460 attactgtgg tgattttagt aaccctgaag gtgtggctga aacagtcaaa agaattcgac 2520 ctgatgttat tgttaatgct gcggctcaca ccgcagtaga taaggctgag tcagaacccg 2580 aatttgcaca attactcaat gcgactagcg ttgaatcaat tgcaaaagcg gcaaatgaag 2640 ttggggcttg ggtaattcat tactcaactg actacgtatt ccctggaaat ggcgacacgc 2700 catggctgga gatggatgca accgcaccgc taaatgttta cggtgaaacc aagttagctg 2760 gagaaaaagc attacaagag cattgtgcga agcacctaat tttccgtacc agctgggtct 2820 atgcaggtaa aggaaataat ttcgccaaaa cgatgttgcg tctggcaaaa gagcgtgaag 2880 aactagccgt tattaatgat cagtttggtg cgccaacagg tgctgaactg ctggctgatt 2940 gtacggcaca tgccattcgt gtcgcactga ataaaccgga tgtcgcaggc ttgtaccatt 3000 tggtagccag tggtaccaca acctggtacg attatgctgc gctggttttt gaagaggcgc 3060 gcaatgcagg cattcctctt gcactcaaca agctcaacgc agtaccaaca actgcctatc 3120 ctacaccagc tcgtcgtcca cataactctc gccttaatac agaaaaattt cagcagaatt 3180 ttgcgcttgt attgcctgac tggcaggttg gtgtgaaacg catgctcaac gaattattta 3240 cgactacagc aatttaatag tttttgcatc ttgttcgtga tggtggagca agatgaatta 3300 aaaggaatga tgaaatgaaa acgcgtaaag gtattatttt agcgggtggt tctggtactc 3360 gtctttatcc tgtgactatg gtcgtcagta aacagctatt acctatatat gataaaccga 3420 tgatctatta tccgctttct acactgatgt tagcgggtat tcgcgatatt ctgattatta 3480 gtacgccaca ggatactcct cgttttcaac aactgctggg tgacggtagc cagtggggcc 3540 tgaatcttca gtacaaagtg caaccgagtc cggatggtct tgcgcaggca tttattatcg 3600 gtgaagagtt tattggtggt gatgattgtg ctttggtact tggtgataat atcttctacg 3660 gtcacgacct gcctaagtta atggatgccg ctgttaacaa agaaagtggt gcaacggtat 3720 ttgcctatca cgttaatgat cctgaacgct atggtgtcgt tgagtttgat aaaaacggta 3780 cggcgatcag cctggaagaa aaaccgctac aaccaaaaag taattatgcg gtaaccgggc 3840 tttattttta tgataacgac gttgtcgaaa tggcgaaaaa tcttaagcct tctgcccgcg 3900 gtgaactgga aattaccgat attaaccgta tctatatgga acaagggcgt ttatctgttg 3960 ccatgatggg gcgtggttat gcgtggttag acacggggac acatcagagc ctgattgagg 4020 caagcaactt tattgcaaca attgaagagc gtcaggggct gaaagtttcc tgcccggaag 4080 aaattgctta ccgtaaaggg tttgttgatg ctgagcaggt gaaagtatta gctgaacctc 4140 tgaaaaaaaa tgcttatggt cagtatctgc tgaaaatgat taaaggttat taataaaatg 4200 aacgtaatta aaacagaaat tcctgatgta ctgatttttg aaccgaaagt ttttggtgat 4260 gagcgtggtt tcttttttga gagctttaac cagaaggttt ttgaggaagc tgtaggccgc 4320 aaagttgaat ttgttcagga taaccattcg aagtctagta aaggtgtttt acgcgggctg 4380 cattatcagt tggaacctta tgcacaagga aaattggtgc gttgcgttgt cggtgaagtt 4440 tttgacgtag ctgttgatat tcgtaaatcg tcatcgactt ttggcaaatg ggttggggtg 4500 aatttatctg ctgagaataa gcggcaattg tggattcctg agggatttgc acatggtttt 4560 ttagtgctga gtgagacggc ggagtttttg tataagacga caaattatta tcatcctcag 4620 agtgatagag gaataaaatg ggatgatcca agcatcaata tttcatggcc agtcgattca 4680 caagtgctgc tatcagctaa agataataag catcctccat taacaaagat tgaaatgtat 4740 agttaagatc acgataaatc ttggaagggt tgcaaaattg aataaaatag tgagcaaaag 4800 tgaaataagg aacgtaatcc acaatgctgg ctatatgatg attactcaga tagctttata 4860 tgttgcacca ttatttatac tgagttatct gttaaaaaca ctgggggttg cacagtttgg 4920 taattatgcc ttaatactat caatcgttgc atatttacag attataacgg attatggttt 4980 ttcttttagt gcaagtcgtg cgatctcaca gaatagagag gacaaagaat atatatcaaa 5040 aatttatctg tcaactatga ctatcaagtt ggcgatatgc gctttcttat tcttattgct 5100 catgctattt ttaaatcttt tgcctgtgca agctgaatta aaacaaggaa tattatatgg 5160 atatcttctt gtaataggaa atactttcca accacaatgg tttttccaag gtatcgaaaa 5220 attaaaaatc atagcccttt ctaatgttat atcaagatgc gccgcgtgtt tacttgtatt 5280 tatctatgtg aggaatagcg aggatttaca aaaagcactt ttagtacagt cacttccatt 5340 agtaatttct gcgattggat taaatatatt tatattgaaa tatatcaata ttatttttcc 5400 ggaaaaaaaa ttatttaagg taattttaaa agaaggtaag gatttttttc ttgcatcact 5460 ttattctgtt attctcaata atagtggcat ttttctatta gggattttta ctaatcctgt 5520 tattgttggt gtatatgccg ccgctgaaaa gatagtcaag gccgtattgt cgctatttac 5580 accactgacg caagctatat atccttataa ttgtcgtaag ttttcactat ccgtatttga 5640 cggcattgag gcagcaaaaa aaactggtat accaattata attttagcat ttatagctgc 5700 tgttatcgtt gcaattacct tacctgttgc aatcgactat cttaattttc caaaagaaac 5760 aatttttgta ggtcaaatat taagtgcatg gatctttttt ggtgttctta ataatgtatt 5820 cggcattcag atattgagtg catcaggaag aagtaaaata tatagtagga tggtattcgt 5880 atcagcgctt ataacattac ttttgattac tctattattg cagttttgta acgccactgg 5940 agtggcatgt gcaatattat tgggtgaaat gttcttatca atattgttac ttaagcgata 6000 taaaaaaata atttaaggaa tagttatgaa gaagttatta ttagtgttcg gtactaggcc 6060 tgaagcaata aagatggcct ctatcattga attattaaaa aaagattgta gattcgaata 6120 taaaatatgt gtgacaggcc aacataaaga gatgcttgat caagttatgc aagtatttga 6180 tgttaaacct gattataatt tacggattat gcagcctggg caaacattag tatctatagc 6240 aacaaatata ctctcacggt taagtgaagt tttaattata gaaaagccag atattatact 6300 tgtgcatggg gatacaacga ctacccttgc tgctacttta gctgggtatt accaccaaat 6360 aaaagtttgt catgtggaag caggattaag aacaggggat atttactctc cttggcctga 6420 agagggcaat cgtaaagtta caggggcatt agcatgtatt catttcgccc caacagagag 6480 atcaaaagat aatctcctga gggagggggt caaagtaaat aatatatttg taacgggtaa 6540 taccgtcatc gactctttat ttattgcaaa agatatcata gataatgacc ctaatataaa 6600 gaacgcttta cataataaat ttaattttct tgataaaagc cgacgagtag tacttataac 6660 aggtcatcga agagaaaatt tcgggaaagg ttttgaagat atatgctttg caataaagga 6720 attagctttc atttatccta atgtagattt tatttatccg gtgcatctta atcccaatgt 6780 aatggaacca gtacatcgta tattagataa tatatgtaat atttacctta ttgagccctt 6840 ggattatttg ccttttgttt atttaatgaa tgagtcatat ttaatattga ctgattcagg 6900 ggggatacaa gaagaagcgc cttcgttagg taaaccggtt ttggttatgc gtgatactac 6960 tgaacgccct gaggcggttg aggctggtac tgttgtatta gtggggactt ctaagataaa 7020 aatagtaaat aaagtaacgg agctattaaa caatgctgat atctacaatg ctatgtctct 7080 gttacataat ccatatggcg atggaacagc tgctcaaaaa attcttaatg tgctcgccca 7140 agagctaatt taatttaagc taaaaatatg ttattaatta ttgctgatta tccaaacgaa 7200 atgaatatgc gcgagggagc tatgcaacga atagatgcga tagactctct cattcgagat 7260 cgcaagcgag tgtatttgaa tatttcattc aaaaagcatc tagttcgctc aaatagttcc 7320 tttaataatg ttatagttga aaatctaaat gcaattattc acagaaacat cataaaacag 7380 tacatgcaaa aatcaacaac tatatatgtt cattctgttt ataatttatt aaaggttata 7440 acgctcattg atctaaaaaa aacaattctt gatatacatg gtgttgtacc ggaagaactt 7500 ttggcagata ataaaaaatt acttagtaaa gtatataaca tggtggaaaa aaaaggtgtc 7560 cttggatgca aaaaattaat acacgtcagt acagaaatgc aaaaacacta tgaagcaaaa 7620 tatggagtaa acttggctga aaggtcaata gtgctcccga tttttgaata taaaaatata 7680 acccaatcgc aaaacaaatg gacagaaaat aaaatacgaa gtatctatct tggaggatta 7740 caaacatggc aaaatattga taaaatgatt caagtttgtg atgacacagt gataaacaat 7800 gaagcaggta agtatgaatt caactttttc atcccacaga gtaacttgga agggtttata 7860 gataaatatt cgttaaaatt acataatatc aatgctaatg catctacgct atcacgtgat 7920 gaagtaattc cctttctaaa agaatgtcat attggttttg tattgcgcga tgatataata 7980 gtaaacagag ttgcgtgccc tacaaaattg gttgaatatt tagagtgtgg tgtcgttcca 8040 gttgtgctct ccccacttat aggtgatttt tattcgatgg gatatcaata cattactaca 8100 gaggaaatgg ctaacagaag tataagtttg ttggatcttg aaaaaatggc tgcacataat 8160 ttacaaattt tgacttctta tcagaagaga acctacaagg cacagaaaga acttattgct 8220 caactgtgct gaatttttta catatataaa attatgtaag catatcgcgg gtcaggtaat 8280 tgtatgcgta tcaaatataa agataacggt tatatattat gttttctatt atgtttcatt 8340 ttgagctact tagttttact caaatctgac tactttcctg ctgattttct gccatataca 8400 gaaatatacg atgggacata cggagaaatc aataatattg agcctgcctt tttatattta 8460 acacggttgt ttcattattt aaatttcccc tatatatttt ttgcaatgtt agtttgtgcc 8520 ttatgtttaa gttggaaaat aaaatatgca agaaaaataa ttaaagatag ttatatatat 8580 ttgttcttgt atgtatatgt atcattttat gtgtttttgc atgaaatgac tcaattgcgc 8640 atagcaattg cagtcactat gtgctatgtg tcggtttatt attactttta taaaaattgt 8700 attaaacatg cactgccatg gatggtgttg gctattttgt ttcattacag cgccttgctt 8760 ttatttatgt cattatttat atacagttat aggaggttat taatagtaat tatagggttt 8820 gtaatatgta tgagcttttt aaacgtgtat gcagatacaa ttgcactata tttgccaaat 8880 gaaaaaatag taaattattt atatagtatt tcatcatcat tagacaatag aaatgatttg 8940 gcaatattca acctgaataa tataatattt ttatcaatat ttattttgat cttttatctt 9000 agccgatata taaaattaaa tgataatgag gcgaagttta ttaagtatgt gcaatgttca 9060 ggaatattag ccttttgtat tttctttctg gctagtggag tcccggtcat tgcttatcga 9120 actgcagagt tgctgcgaat attttatccg atggctttag tattaatcct ttcgcatata 9180 aaaaataata atatgcgtta ttttattgca gtcattatag ttatcctttc aggcttaatg 9240 ttgtttataa cactaagggc tgtatcaata gttggtcaag gattataaaa tgaatgttgc 9300 tattttgttg tctacgtata atggcgaaaa atatttagag gaacaactgg attcattgct 9360 gcttcaaagt tatcaggatt ttgtagtgta tatccgtgat gacggatcat ctgatagaac 9420 tgtaaatata ataaaccaat acgtaatgaa agataacaga tttattaacg tgggtaattc 9480 agaaaatctt ggttgtgctg cttcgtttat taatttatta agaaatgctt cagccgatat 9540 ttatatgttt tgtgaccaag atgattattg gcttccgaat aaattacagc gtgctgtgga 9600 ttatttttcg gctattgatc ctttacaacc taccttgtat cattgcgatc taagcgttgt 9660 tgatgaaaaa cttaatatta tacaaaattc atttttgcag catcagaaaa tgtcagcgta 9720 tgattcaatg agaaaaaata atcttttcat acaaaatttt gttgttggtt gttcatgtgc 9780 tgttaatgct tcacttgcgg aatttgttct ttcgcgaatt ggagagcagc atgtaaaaat 9840 gatagctatg catgactggt ggttagccgt gactgcaaaa ctttttggtc gaatccattt 9900 tgataatact caaacgattc tttatcgaca acatcagggc aatgtattag gtgcaaaatc 9960 atcaggtatg atgcgtttta ttcgattagg attaaatggg caagggattt cgcgagtagt 10020 atcttttaga aaaaaagttt gtgcgcaaaa taagcttctt ttagatgtct atgataaaga 10080 tttaaatctt gagcaaaaaa aatctatcag gcttgtaatt gagggcctta aagagaactc 10140 ttcaattgct gaccttttaa aatgtttcta tcatggtagc tatatgcaag gttttaaacg 10200 taatcttgcc ttaatatatt cagttcttta cacaaaaaaa agaagatagt gtatccttat 10260 gaaaaaaatt gctattatcg gtactgttgg cataccagca tcatatggcg gatttgaaac 10320 attagttgaa aatttaacaa gatacaattc ctcgggagtt gaatataatg ttttttgttc 10380 atcgtttcac tacaaatccc accaaaaaaa acataatggg gcccgtttaa tttatattcc 10440 gcttaaagcc aatggatggc agagcattgc gtatgacata atttcgttag catattctat 10500 ttttttgaag cctgatgtga ttctgatttt aggggtttct ggttgttcat ttttgccttt 10560 cttcaaactc ttaacacgcg ctaagtttat tactaatatt gatggcctgg aatggcgaag 10620 agataaatgg aattcaaaag tgaaacgttt cttaaaattt tcagaaaaaa tcgcagttca 10680 atattcggat gtcgttatta cggataatga ggcaatttct gagtacgttt ttaacgagta 10740 taataaagat agccgagtta ttgcctatgg aggggatcat gcatggttaa atactgagga 10800 tgtatttaca acaagaaatt ataaaagcga ttactacctt tctgtatgtc gtatcgaacc 10860 cgaaaacaat gtagaattaa ttttaaaaac attttcaaag ctaaaatata aaataaaatt 10920 tattggaaat tggaatggca gcgagtttgg aaagaaactt aggctgcatt attctaacta 10980 tccaaatatt gaaatgattg atccgattta tgatcttcaa caattatttc acttacgaaa 11040 taattgcata ggatatatac atggtcattc ggctggagga acaaaccctt ctttagtcga 11100 ggcaatgcat tttagtaaac ctatatttgc atatgattgt aagtttaata ggtacactac 11160 tgaaaatgaa gcatgttatt tttctaatga atctgacctc gcagagaaaa tcataatgca 11220 ttgtgagcta tcattaggtg tctctggcac gaaaatgaaa gaaattgcta accagaaata 11280 cacttggaga cgaatagcag aaatgtatga ggattgctat taactctgtt aaacttcaaa 11340 tcttttacaa tatatggcat gactataagc gcattaattg tttttcaagc cgctctcgcg 11400 gtgaccaccc cctgacaggg gatccgtgta ggctggagct gcttcgaagt tcctatactt 11460 tctagagaat aggaacttcg gaataggaac taaggaggat attcatatgg ataaagccgt 11520 aagcatataa gcatggataa gctatttata ctttaataag tactttgtat acttatttgc 11580 gaacattcca ggccgcgagc attcagcgcg gtgatcacac ctgacaggag tatgtaatgt 11640 ccaagcaaca gatcggcgta gtcggtatgg cagtgatggg acgcaacctt gcgctcaaca 11700 tcgaaagccg tggttatacc gtctctattt tcaaccgttc ccgtgagaag acggaagaag 11760 tgattgccga aaatccaggc aagaaactgg ttccttacta tacggtgaaa gagtttgtcg 11820 aatctctgga aacgcctcgt cgcatcctgt taatggtgaa agcaggtgca ggcacggatg 11880 ctgctattga ttccctcaaa ccatatctcg ataaaggaga catcatcatt gatggtggta 11940 acaccttctt ccaggacact attcgtcgta atcgtgagct ttcagcagag ggctttaact 12000 tcatcggtac cggtgtttct ggcggtgaag agggggcgct gaaaggtcct tctattatgc 12060 ctggtggcca gaaagaagcc tatgaattgg tagcaccgat cctgaccaaa atcgccgccg 12120 tagctgaaga cggtgaacca tgcgttacct atattggtgc cgatggcgca ggtcactatg 12180 tgaagatggt tcacaacggt attgaatacg gcgatatgca gctgattgct gaagcctatt 12240 ctctgcttaa aggtggcctg aacctcacca acgaagaact ggcgcagacc tttaccgagt 12300 ggaataacgg tgaactgagc agttacctga tcgacatcac caaagatatc ttcaccaaaa 12360 aagatgaaga cggtaactac ctggttgatg tgatcctgga tgaagcggct aacaaaggta 12420 ccggtaaatg gaccagccag agcgcgctgg atctcggcga accgctgtcg ctgattaccg 12480 agtctgtgtt tgcacgttat atctcttctc tgaaagatca gcgtgttgcc gcatctaaag 12540 ttctctctgg tccgcaagca cagccagcag gcgacaaggc tgagttcatc gaaaaagttc 12600 gtcgtgcgct gtatctgggc aaaatcgttt cttacgccca gggcttctct cagctgcgtg 12660 ctgcgtctga agagtacaac tgggatctga actacggcga aatcgcgaag attttccgtg 12720 ctggctgcat catccgtgcg cagttcctgc agaaaatcac cgatgcttat gccgaaaatc 12780 cacagatcgc taacctgttg ctggctccgt acttcaagca aattgccgat gactaccagc 12840 aggcgctgcg tgatgtcgtt gcttatgcag tacagaacgg tattccggtt ccgaccttct 12900 ccgcagcggt tgcctattac gacagctacc gtgctgctgt tctgcctgcg aacctgatcc 12960 aggcacagcg tgactatttt ggtgcgcata cttataagcg tatcgataaa gaaggtgtgt 13020 tccataccga atggctggat taa 13043 <210> 12 <211> 13790 <212> DNA <213> Artificial Sequence <220> <223> example O2 rfb locus nucleotide sequence - O2-EPA production strain stGVXN4906 <400> 12 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320 cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380 aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440 atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500 cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560 accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620 gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680 gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740 acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800 cgcgcatgga aacgtacgta tggtttaccg accattgtga ctaattgctc gaacaactat 1860 ggtccgtatc acttcccgga aaagcttatt ccattggtta ttcttaatgc actggaaggt 1920 aaggcattac ctatttatgg caaaggggat caaattcgcg actggttgta tgtagaggat 1980 catgctcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040 ggcggacaca acgaaaagaa aaacatcgat gttgtgctga ctatttgtga tttgttggat 2100 gagattgtac cgaaagagaa atcttatcgt gagcaaatta cttatgttgc tgatcgccca 2160 gggcatgatc gccgttatgc aattgatgcc gataaaatta gccgcgaatt gggctggaaa 2220 ccacaggaaa cgtttgagag cgggattcgc aaaacggtgg aatggtatct ggctaataca 2280 aattgggttg agaatgtgaa aagcggtgct tatcagtcat ggatcgaaca aaactatgag 2340 ggccgtcagt aatgaatatc ctgcttttcg gcaaaacagg gcaggtgggt tgggaactgc 2400 agcgtgctct ggcgccgctg ggtaatctga tcgctcttga tgttcactcc actaattatt 2460 gtggagattt cagcaacccc gaaggtgtgg cagaaaccgt caaaaaaatt cgtcctgacg 2520 ttattgttaa tgctgctgct cacactgcag tagataaagc agaatcagaa ccggatttcg 2580 cacaattact taacgcgaca agcgtcgaag cgattgcaaa agctgctaat gaagtcgggg 2640 cctgggttat acactactct actgattatg ttttcccagg cagtggtgac gcgccatggc 2700 tggaaacgga tgcaacagca ccgctaaatg tttacggtga aacaaaatta gctggggaaa 2760 aggcattaca agaacattgc gcaaagcatc ttattttccg taccagctgg gtatacgctg 2820 gtaaaggaaa taactttgct aaaacgatgt tgcgtttggc aaaagaacgc gaagaactgg 2880 ctgtgataaa cgatcagttt ggcgcaccaa caggtgctga attgctggct gattgcaccg 2940 ctcatgccat tcgcgtggca ttaaaaaaac cagaagtcgc tggcttgtac catctggtag 3000 caagtggcac aacaacctgg cacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060 cagggattaa tcttgcactt aacaaactta acgccgtgcc aacaacggcc tatcccacac 3120 cagcccgtcg accccataac tctcgcctca atacagaaaa gtttcagcag aactttgcgc 3180 ttgtcttgcc tgactggcag gtgggcgtga aacgtatgct caacgaatta tttacgacta 3240 cggcaattta acaaattttt gcatctcgct catgatgcca gagcgggatg aattaaaagg 3300 aatggtgaaa tgaaaacgcg taaaggtatt attctggctg gtggttccgg cactcgtctt 3360 tatcctgtga cgatggcagt gagtaaacaa ttgctgccga tttatgataa gccgatgatt 3420 tattatccgc tttcaacgct tatgttagcg ggtattcgcg atattcttat tattagtacg 3480 ccacaggata caccgcgttt ccaacaatta ttgggggacg ggagccagtg gggtcttaat 3540 ctacagtata aagtacaacc gagtccggat ggcctggcgc aagcgtttat tattggcgaa 3600 gactttattg gtggtgatga ttgtgcactc gtacttggcg ataatatctt ctatggacac 3660 gacttgccga aattgatgga agctgctgtt aacaaagaaa gcggtgcaac ggtatttgct 3720 tatcacgtta atgatcctga acgctatggt gtcgtggagt ttgataataa cggtacggca 3780 attagcctgg aagaaaaacc gctggagcca aaaagcaact atgcggttac tgggctttat 3840 ttctatgaca atgacgttgt ggaaatggct aaaaacctta agccttctgc ccgtggcgaa 3900 ctggaaatta ccgatattaa ccgtatttat atggaacaag gacgtttgtc tgtagccatg 3960 atggggcgtg gctatgcatg gttggataca gggacgcatc aaagccttat tgaagcaagt 4020 aacttcattg caacaattga agagcgtcag ggattaaagg tatcttgccc ggaagagatt 4080 gcttaccgta aagggtttat tgatgccgag caggtgaaag tattagccga accgcttatc 4140 aagaatcaat atggtcaata tttgctgaaa atgatcagcg aatagtatat gggaactcaa 4200 tgatggatat taaattaatc tctttgcaaa aacatgggga tgagcgcggt gcattaattg 4260 ctcttgaaga gcaacgaaat atacctttcg aagtcaaaag aatatattac atacttgaga 4320 ctcttaatgg agtaagacgc ggatttcatg cgcacaaggt tactcgtcag ttagctattg 4380 tagtcaaggg agcttgtaaa tttcatctgg ataatggtaa agaaacaaag caggtggaac 4440 ttaatgatcc aacaattgcg ttgctgatag aaccctatat atggcatgaa atgtatgatt 4500 ttagtgatga ttgtgtgctg cttgtaattg cggatgattt ctataaagag tctgattata 4560 tccgcaatta tgatgatttt attagaagag taaattcaat tgagaattca taagctaagt 4620 gacgtccaga caacatcaat tggtgatgga acaactatct ggcagtttgt tgtgatacta 4680 aaaggtgctg taattggtaa taattgcaac atctgtgcaa ataccttaat tgaaaataac 4740 gttgtaattg gtaacaatgt cacagtcaaa agcggtgtgt atatttggga tggcgttaaa 4800 atagaggata atgtttttat tggtccttgt gtagcattta caaatgataa gtatcctcgc 4860 tctaaagtct atcctgatga atttttgcaa acaataatac gcaaaggagc atcaataggt 4920 gctaacgcaa ccatcctgcc aggaattgaa attggtgaaa aagcaatcgt tggtgcgggg 4980 agtgttgtaa ccaaaaatgt accgccatgc gcaatagtag taggtaatcc agctcgattt 5040 attaaatggg tagaggataa tgaataaaat tgatttttta gatctttttg caattaacca 5100 gcgacagcac aaagaattag tctctgcgtt tagtagggtg ctagattctg gttggtatat 5160 catgggcgaa gaacttgagc agttcgagaa agagttcgca gaatactgtg gagttaagta 5220 ttgcattggt gtagcaaatg gccttgatgc gttgatacta gtattgaggg catggaaaga 5280 acttggctat cttgaagacg gtgacgaggt attagtaccg gcaaatacat atattgcttc 5340 tattcttgct ataacagaga acaaacttgt tcctgttctt gttgaaccag atatagaaac 5400 ttataatatt aatcctgctt taattgaaaa ttacattacg gaaaaaacta aagcaatatt 5460 accggttcac ttatatggtc tattgtgcaa tatgccagaa attagtgcaa tcgccagaaa 5520 atataatctg ttgattcttg aagattgtgc acaagcacat ggtgcaatac gtgatggtcg 5580 caaagctgga gcttgggggg atgctgcagg atttagtttt tatccaggaa aaaaccttgg 5640 agctttgggg gatgcgggag ctgttactac aaataatgca gaattatcct caactataaa 5700 agctttgcga aattatgggt cacataagaa atatgaaaat atttatcagg gattgaatag 5760 tcgattggat gaactgcaag cagccttatt gcgtgtaaaa atccatacat taccggaaga 5820 tactgcgatt cggcaaagga ttgctgaaaa atatattcgt gaaataaaaa accctgcgat 5880 tacgttacca gtgtacgaag gccaaggtgc gcatgtttgg catttatttg tagtaagaat 5940 cgctaatcgt gaaaaattcc agtcatactt attagagaag ggtatcaaaa ccttaattca 6000 ctatccatta ccaccccata agcagcaagc atatcaaaat atgtctagcc ttagccttcc 6060 aattactgag caaattcatg atgaagtcat ttctttacct ataagtccgg taatgagtga 6120 agatgatgtc aattatgtaa tcaaaatggt caatgattac aagtaatgaa aaaatttctt 6180 caggtaacta tattatccgc tatctataca ttcattaaaa tgattgcggg ttttatcatc 6240 ggtaaggtag tagcaattta tacagggcca tcaggggtag caatgcttgg ccaagtgcaa 6300 agtttaatca caatagttgc aggtactacc tctgcacctg taagcacagg ccttgttcga 6360 tatactgcgg aaaattggca agaaggacaa gaagcatgcg cgccatggtg gcgcgcatgc 6420 ttaagggtta ctctgttttt attcttgctt attattcccg ttgttattat attgtcgaaa 6480 aatattagtg agttactttt tagcgatgga caatacacat ggttaatcat tttcgcatgt 6540 tgtatattgc cattctccat tataaataca ttgatcgctt cagttttaaa tggtcaacaa 6600 ttttataagc aatatatatt ggttgggatg ttttctgtat tcatttctac tatgtttatg 6660 attttgttga ttgtagctta taatcttaaa ggtgcattga ttgccacagc tataaatagt 6720 gctattgctg gtcttgtatt ggttttattt tgtctcaata aatcttggtt tagatttaaa 6780 tattggtggg gtaaaacgga taaagacaaa attataaaaa ttattcatta tactctgatg 6840 gctctggttt ctgttatctc catgcctaca gcattgatgt gtattagaaa aatattgatt 6900 gctaaaactg gttgggagga tgcagggcaa tggcaggccg tatggaagat atctgaggtt 6960 tatcttggtg ttgtgacaat tgctttgtca acatatttct taccaagatt gacaattata 7020 aaaacaagtt tccttataaa aaaagaagta aatagtacta tattatacat aatatctatt 7080 acttcattca tggcgttgag tatctattta ttccgcgatt tggtaataac agttttattt 7140 actgaacagt ttcgctcagc tcgtgaatta tttttattac aacttatagg ggatgtaata 7200 aaaattgctg ggtttcttta tgcataccct cttcaaagtc aggggcatac taaactattc 7260 atcagttcag aagtgatttt ttctatgctc tttatcatta ccacctatat ttttgttgta 7320 aattatggag tacatggtgc taacataagt tatgtcatta catatagttt atattttgtg 7380 tttgcatttg tgtttactaa ttttattaat gttagaagaa ataattaaaa acagaggttg 7440 aattttgaaa ataattatac ctgtcttagg atttggcagg gctggtggtg aaagagttct 7500 ttctaagctg gcaactgaat tgatgaatta tggacatgat gtaagttttg ttgttccaga 7560 taatagaact aatccatatt atgctaccac agcaaaaatt gtcacgagta aatctagtca 7620 aaaccgtgta aaaatattga gaatcattaa aaattactat aatctgtggc gtaaatgcat 7680 agagttaaat cctgatgctg tagttgctag ttttcatttg actgcctatc ttgtcgcatt 7740 attaccaatc acccgtcgta agaaatatta ttatattcag gcgtatgaag ttaatttttt 7800 tgataatata atatggaaat taatagcggg tttaacatat tatttaccgc ttaaaaaaat 7860 actaaatagt cctaatttgc ttcctcataa acatgatgat tttataggag tagttcctgc 7920 aggagtagat ttaaacgttt tctatccgaa accatcaaat aggttattaa atggtcacac 7980 atcaataggg attattggta gaaaagagaa gcacaaagga actagcgaaa ttatttcagt 8040 attgtgttca ctggaaaata aagctggaat tataatcaat attgcgatct atcttgaaga 8100 agttgataag cagcgtttaa tcgctgccgg gtttcaggtt aatttttttc cgattacttc 8160 tgatttagaa ttggcatcct tttatcgaag caatgacatc atgattgctg ttgggttaat 8220 tgaagatggc gctttccatt atccttgtgc tgaatcaatg gcttgtggtt gtcttgttat 8280 ttcaaattat gcgccactta ctgaaactaa cagtgtactt aaattagtca agtttgatgc 8340 ttgcaaactt ggtgaagcaa ttaatctttg tctcaatctt gacctagaag aaaaaagcaa 8400 agaaatccaa tctaatattt ctgtgttgaa taaatatgac tggaaaattg ttggtgaaac 8460 tttcaatagt ttattgttag atgcaaataa atagtatacg ttgatgggga aaatatgaat 8520 attgttaaaa ctgatattcc agatctgatc gttcttgaac caaaagtgtt tagtgatgaa 8580 cgcggctttt ttatggagag ttataatcag attgaatttg agaaggcaat aggaaggcac 8640 gtaaattttg ttcaggataa tcattcaaaa tctagtaaag gcgtactacg tgggttgcat 8700 tatcaattag caccgtatgc acaggctaaa ttagttcgat gtgttgtagg tcaggtattt 8760 gatgttgctg ttgatcttag aaaaaattca ccaacgttca aaaaatggtt tggaataacc 8820 ctttccgcag aaaataaacg acaattatgg atacccgaag gatttgctca tggtttcttg 8880 gtgaccagtg atgaagctga gttcatttat aagacaacta actactatgc tcctggtcat 8940 cagcaagcaa ttatttacaa tgatcctatt ttaaacatcg attggccttt ctgcagtagt 9000 gctctgtcat tatcacaaaa agatcaagaa gcaaaattat tttcagaatt attggacagt 9060 gaactgttct aataaagtgt gccaccttat ccgtctgaag gataggtggt tgcttatatt 9120 tttttgagta tgtttgtata atgacagaaa atagtccgaa atataaacac gataaaagct 9180 taataagttt tatctactta ttttttatat ttacacttat tgtaggcttt attatcgcaa 9240 atacccagtt tttggggcga agtagagact atgataatta tatacagatc ttttctggta 9300 aagaagggga gggggttctt gaattatttt atcgcggatt gatgttaata acgaccagct 9360 atgaaactat catttttata attttaacat gttctttttt tataaaggca aggtttctcg 9420 ctaactattc gcgtaatttt tcaggcttga ccttattctt tatttattat gcaagcgttg 9480 cactttgggt tttagattat actcaattca gaaatggtct atgtatttcc attttaatgt 9540 tttccgtata ctatttattt ataaataaac cgacttattt ttatttctcg gtattatgtg 9600 caattgcaac tcattggtct gctttgcctt ttttgctttt atatcctttt gtctattcaa 9660 caaaaataag acgccttggt tatttttgtt tcagtattct tgttttgatt gcgatctcag 9720 gagaaggaaa agagatcata tcttttataa gaaattttgg agtgggacaa aaaataggaa 9780 atgaagctgg tgtaaattta ataaattcat tatcccttac cgctatttcc tggtttatta 9840 ttagttacat atcaagcatt ggaaatgaaa ggagaaattt aaggcttttc ttttgttatg 9900 gtgtcatgca atacgtgact tttagccttt tctctctacc tgttatggct ttccgtattt 9960 tggaaatgta ttttttcctt atgctaacca ttggggtgtt tattaagcaa aaaaagaatt 10020 attattttat tttttgcaaa gtgttaattt tattgtatct aacatactat tatcatatgg 10080 tctttggagt gattaatgtg taaggctaag gtgttggcta taattgttac ttacaacccg 10140 gaaattattc gattgacgga atgtattaac tctttagccc cacaagttga gagaataatt 10200 cttgtagata atggctcaaa taatagtgat ttgataaaaa atatcagtat taataacctt 10260 gaaattattt tactttcgga aaacaaaggc attgcatttg ctcagaacca tggtgttaag 10320 aagggcctgg aagcaaaaga gtttgactat ttatttttct cagatcagga tacttgcttt 10380 cctagcgatg ttattgaaaa acttaagagt acatttacga aaaataataa aaaaggtaaa 10440 aatgttgctt gtgcttctcc tttttttaaa gaccatcgtt caaattatat gcatccgtca 10500 gtcagcctaa atatttttac gagtacaaaa gttatatgta gtgaagtaga cgatgatctt 10560 tatccctcgc atgttattgc ttctgggatg ttaatgtctc gtgaagcatg gcgcgtcgtc 10620 ggaccatttt gtgaaaaact ctttatagac tgggttgata cagaatggtg ttggcgtgca 10680 ttagctaata atatgattat tgttcagaca ccatcagtca tcatttctca tgaacttggg 10740 tatgggcaga aaatttttgc tggtcgatct gttacaatac ataattcttt cagaaatttt 10800 tataaaatac gcaatgcaat atacttaatg ctgcattcaa attatagctt caagtatcgt 10860 tatcatgctt tttttcatgc gacaaagaat gttgtatttg aaattttata ttcgaaagaa 10920 aaattaaatt cactgaaggt ttgttttaaa gctgtacgtg atggtatgtt caataatttt 10980 taatacgaaa atagttaggc tcaaggtgtt taaatggaag aaaataatat gaagacggtc 11040 gctgtagttg gcacagtggg tgttcctgct tgttatggtg ggttcgaatc acttgttcag 11100 aatctaattg attatcaatc tgatggtata caatatcaga tattttgctc ttcaaaaaaa 11160 tatgataaaa aatttaaaaa ttataaaaat gcagaattaa tctatttgcc gataaatgcc 11220 aatggcgtct ctagcataat ttatgatatt atgtgtttaa ttatttgttt attcaaaagg 11280 ccagatgttg ttttaatatt gggggtgtct ggttgtttat ttctaccaat ttataaacta 11340 ttttcaaaat caaagattat tgtcaatatt gatgggcttg aatggcgtag aaataaatgg 11400 ggaacgtttg ctaagaaatt tcttaaaata tctgaggcga tatctattag aatagctgat 11460 attatcattt cagataatca agcaatagct gattatgtgg aaaataagta caagaaaaaa 11520 agtgtagtta tagcttatgg cggagatcat gccactaatc ttagtacacc gatagacaat 11580 gatcaaaaaa aagaaggtta ttatttgggg ctttgtagga tagagcctga gaataatata 11640 gaaatgattc tgaatgcctt cattaataca gataaaaaaa ttaaatttat gggtaattgg 11700 gataacagcg agtatggacg ccagctaaaa aaatattatt caaactatcc aaatatcacc 11760 ctactagaac ctaactataa tattgaagag ctttataaac taagaaaaaa ttgtcttgca 11820 tacattcatg gacactcggc tggtggaaca aacccttctt tagttgaagc gatgcatttt 11880 aatattccta tttttgcttt cgattgtgac tttaatcgtt acacaactaa caatttagct 11940 cattacttta atgattctga acaacttagc ttattagcag aaagtttgtc ttttggaaat 12000 cttaaatgtc gagtattaga tttaaaaaat tatgctgaag atatgtataa ctggaggcat 12060 atagctgcta tgtatgaatc tatttattaa acgcattaac aataatataa ttgaccttat 12120 atagcaggga aagatcacgt aacgctgcgg cgcgccgatc cccatatgaa tatcctcctt 12180 agttcctatt ccgaagttcc tattctttct agagaatagg aacttcggaa taggaactaa 12240 ggaggatatt catatggata aagccgtaag catataagca tggataagct atttatactt 12300 taataagtac tttgtatact tatttgcgaa cattccaggc cgcgagcatt cagcgcggtg 12360 atcacacctg acaggagtat gtaatgtcca agcaacagat cggcgtagtc ggtatggcag 12420 tgatgggacg caaccttgcg ctcaacatcg aaagccgtgg ttataccgtc tctattttca 12480 accgttcccg tgagaagacg gaagaagtga ttgccgaaaa tccaggcaag aaactggttc 12540 cttactatac ggtgaaagag tttgtcgaat ctctggaaac gcctcgtcgc atcctgttaa 12600 tggtgaaagc aggtgcaggc acggatgctg ctattgattc cctcaaacca tatctcgata 12660 aaggagacat catcattgat ggtggtaaca ccttcttcca ggacactatt cgtcgtaatc 12720 gtgagctttc agcagagggc tttaacttca tcggtaccgg tgtttctggc ggtgaagagg 12780 gggcgctgaa aggtccttct attatgcctg gtggccagaa agaagcctat gaattggtag 12840 caccgatcct gaccaaaatc gccgccgtag ctgaagacgg tgaaccatgc gttacctata 12900 ttggtgccga tggcgcaggt cactatgtga agatggttca caacggtatt gaatacggcg 12960 atatgcagct gattgctgaa gcctattctc tgcttaaagg tggcctgaac ctcaccaacg 13020 aagaactggc gcagaccttt accgagtgga ataacggtga actgagcagt tacctgatcg 13080 acatcaccaa agatatcttc accaaaaaag atgaagacgg taactacctg gttgatgtga 13140 tcctggatga agcggctaac aaaggtaccg gtaaatggac cagccagagc gcgctggatc 13200 tcggcgaacc gctgtcgctg attaccgagt ctgtgtttgc acgttatatc tcttctctga 13260 aagatcagcg tgttgccgca tctaaagttc tctctggtcc gcaagcacag ccagcaggcg 13320 acaaggctga gttcatcgaa aaagttcgtc gtgcgctgta tctgggcaaa atcgtttctt 13380 acgcccaggg cttctctcag ctgcgtgctg cgtctgaaga gtacaactgg gatctgaact 13440 acggcgaaat cgcgaagatt ttccgtgctg gctgcatcat ccgtgcgcag ttcctgcaga 13500 aaatcaccga tgcttatgcc gaaaatccac agatcgctaa cctgttgctg gctccgtact 13560 tcaagcaaat tgccgatgac taccagcagg cgctgcgtga tgtcgttgct tatgcagtac 13620 agaacggtat tccggttccg accttctccg cagcggttgc ctattacgac agctaccgtg 13680 ctgctgttct gcctgcgaac ctgatccagg cacagcgtga ctattttggt gcgcatactt 13740 ataagcgtat cgataaagaa ggtgtgttcc ataccgaatg gctggattaa 13790 <210> 13 <211> 13777 <212> DNA <213> Artificial Sequence <220> <223> example O6A rfb locus nucleotide sequence - O6A-EPA production strain stGVXN4112 and stLMTB10923 <400> 13 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatttgcc cgccgggcgt gacaattatg 300 aacgtgcgtc agggcgaacc tttaggtttg ggccactcca ttttatgtgc acgacctgcc 360 attggtgaca atccatttgt cgtggtgctg ccagacgttg tgatcgacga cgccagcgcc 420 gacccgctgc gctacaacct tgctgccatg attgcgcgct tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actctgtcat ccagaccaaa 540 gagccgctgg accgcgaagg taaagtcagc cgcattgttg aattcatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgttggtc gctatgtgct ttctgccgat 660 atttggccgg aacttgaacg cactcagcct ggtgcatggg ggcgtattca gctgactgat 720 gccattgccg aactggcgaa aaaacagtcc gttgatgcca tgctgatgac cggcgacagc 780 tacgactgcg gtaaaaaaat gggttatatg caagcgttcg tgaagtatgg actacgcaac 840 ctcaaagaag gggcgaagtt ccgtaaaggg attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaagatt agcggcgaaa 960 gtaatttgtt gcgaattttc ctgccgttgt tttatataaa caatcagaat aacaacgact 1020 tagcaatagg attttcgtca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcatttgaat tttacgggtt tagcgcgagt gggtaacgct cgtcacatcg 1140 tagacatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gctgaaatta 1200 taaagtcatt cttatagaac atcgcatttc aataatataa ttacacctaa atgaatagga 1260 tacaacgtgt gcacaattat ttaaggctta aagataaaat aaaaaacgta tttttagggt 1320 tgtatatatt gcagttattt aattatatcg cgccattggt aattatccct atcctgataa 1380 aatatattgg gttgggggaa tatggggaat tggtctatat tacatctatt tatcaaatag 1440 tggctttgat tattgatttt ggctttactt acacaggacc tgtggttgct gcgagacata 1500 gatgtgagac ccaaaattta cagcgctatt actcaatagt tgttctttta aaatcattgc 1560 tttttataat tgcattaaca tgtgtatttt tattgtgcag attaaatata gtccacttgt 1620 cattttttgg gtttttgtca atttttctat gcactattgg taatatatta tcgcccaatt 1680 ggtttttgca ggggattggt gattttaaaa aactttcata ctcacaagta atagtgagaa 1740 taacattgtt tatcatactt cttgtttatg tctgtagtgg cggagataat gtttttatcc 1800 taagtttttt gcaaaatgca acattactca tatgctgtat atacttatgg ccaaatattc 1860 atattagcca tgttgttcat cttaaaccta atgaatgcat tgtggaattt aagaaggcag 1920 gaaatgtttt tattggcgta ataggtacga ttggttacaa tggtctaatt cctgtgttaa 1980 ttggaaacct ttgcggtaat acgagtcttg gtgttttttc aatcgttcaa aaaatgacaa 2040 cagcatgtca aagtctaatt aatccaatat cacagtatat gttatctcaa gtttcagaaa 2100 ttaaacctca agataaactg ttttattata gaattaaaaa aagttttttt gtgcatttaa 2160 caattagcat aattgcatgt ttatgttata tggggttagg gcaatatgtg gcgactttta 2220 taggtaaagt tgacgtttca tttgttatta ttttatttgc gtcaataatt accatttttt 2280 catctttaaa taatgtcctt ggtatacagt ttcttatacc gacagataat gtaaaaatac 2340 tacgaagtat aaatgttatg gcgggaatta ttgttgttag tttgtcctgg ctgttaatat 2400 cacgctttga cattctgggg ggggttttat taaacctaat tggtgagttt cttgtattca 2460 gtatgctagc ttttattgcc catcgaaagt ggggagcgag agtataatga aagtgaaggc 2520 ggttcctgct attacattct atttaagttt aatgctgaca attttagtgt tactgtttgg 2580 taatgaacca aataaatcac aatatatcct tgttatagca acgataacag ttttttatat 2640 cgcatatatc actaataaaa taacttctcc ggccagcctt ctcgttatat catcttttgt 2700 gtttttaggt tgtcgccctt tattatcttt gtttgcaaac tatgattata ggattgccga 2760 ttggtttatt gaaggatata tggatgacga tgtgattttg gctaactatg ctataacact 2820 aatgtattat ggttatacat tgggactaat tctatgcaaa aatactgaaa aattttatcc 2880 gcatggtcct tatcctgaaa aacaattgct aaaaataaag tttcttttga ctttattttt 2940 tctgggttcg ataggtatgg ttgtaaaagg gatattcttt tttaacttta tagaatctaa 3000 tagttatgtt gatatttatc aatcaaatat aacaacgcca ataggttatg attttctatc 3060 ttatttattt tattgttctt ttttccttat atgtgcgttt catatacagt tcagaacaaa 3120 taaaaaattt ctttttattg cgatatgcat tgctgcattt agcaccttga agggtagtcg 3180 tagtgaagct ataacgtttc ttttaacggt tacatgtata tattttaatg aagtaaagac 3240 aagaaactta cgtctgctga ttacaatgat ttttgttttt agcgtcattt ttgtgattag 3300 tgaatttatc tcaatgtggc gcactggagg gagttttttt caattaatgc agggtaataa 3360 tcctgttata aactttgtat acggcatggg agtatcatat ctttccattt atcaatcagt 3420 aaaactacaa ctattgtcag ggggatataa tgttacctat ctattcagcc agttaataat 3480 aacttgctcg tcaatattta atgtcaaatt gagcttgccg gaaataagct atagccattt 3540 ggcctcatac acagcaaacc cagaactata taatcttggg ttcggacttg gggggagtta 3600 tttagcagaa tcgtttttag catttggtct gattggatgt ttcattatac cctttttact 3660 tttacttaat ttaaatgtat tggaaaaata tacaaaaaac aaaccaatta tatattttgt 3720 ttattatagt gtgttgccac ctatattatt cacaccaaga gagactttgt tctatttctt 3780 cccctatctt gtcaaaagta tatttgttgc ttttttagtt acattataca tccagtataa 3840 aaaggattga ccaaaatgtc agaaaaaaat gtcagcataa taatcccaag ttataacagg 3900 gctcatattc ttaaggaggt cataccaagt tattttcagg atgagacttt agaggttata 3960 gttatcaatg atggatcaac agataataca aatagtgtat tagctgaact gaaggaaaaa 4020 tattctcagt tagttatttt agaaaatgaa acgaataaaa aacagatgta ttctaaaaac 4080 cgagggattg aaatagccaa agggaaatat attttttttg gtgatgatga ctcttacctc 4140 ttacccggtg ttatatctcg gttattggct acaaaatatg agacaggcgc tgatgtaatc 4200 ggcgcaagaa tactttatat gaataataac gagaaaacaa ttgaagattg cataaatcga 4260 cataaaaaag aggggcgttt tgttagtgat ctaaatagat tggattttag ttatacatgt 4320 gatttggacc atccgattga atgtttttat gcacagcctt ttgttctagc tgaaagggaa 4380 ctaatatcga aatatcgatt tgatatatct tatacgggaa actgctatcg tgaggaaact 4440 gatttcatgc tatctctatt tattaaaaat aaaaaattta tatatgattc aaaggctttg 4500 ttaataaatt tacctccaag aaaagcgacg ggaggggcaa gaacagctaa tcgattaaaa 4560 tatcattacg aaagttgcat aaataattat agatttttaa aaaaatataa tgataatttg 4620 aatcttcttt caggacaaaa gcatgctata ttttaccgac agtgtcaatt cgttctgcta 4680 aaaatgaagt cgtttatcgg gaagttttta aaatgattat atatatcgcc gcgtataatg 4740 gttcaggagg gcaaggtggg gtggaaaggg ttgttgccca acaatgtaac attcttaaaa 4800 atttgggggt taaagtcatt atacttgata aaacatactt caaaatttct aacaaaattc 4860 gtaacaaaaa aatacaagta gcactttatc caatattagt ttctctttat ttaaccttac 4920 aaaaattacg tggcgtgacg tttaaagtta ttgcacatgg ctattgttct cctttttata 4980 ggaatgacat cttaatagct catggcaata tgaaatgtta ttttcaaaca gtcatgaata 5040 aaaaacctaa tcggttgtct ggcagtggtc ttttatcttt ctatgagcgt tgggctggag 5100 cattttcaaa aaatatctgg gctgtttcaa ataaggttaa aagtgaatgg aatgagcttt 5160 acaatattaa ttcacataaa atcaaagttg ttcgaaattt tataaatctt gcacaatttg 5220 attacactga tgttaatgaa gcagaatatg tgacatttgt cgggcgattg gaaaaaggaa 5280 aaggaataga tgatctgtat tacatatgta aaaatctgcc agatacttcc ttccatttag 5340 tttcaagtat tcccgcccca caaaattttg cttcgctaaa taatgttctg accagcattg 5400 ctgtccccta tgcgaaaatg ccagaaatat ttaagaaatc cagagtactt attttaccgt 5460 cctattatga aggatatgag ctggttacta ttgaagcgct atgctgtggt tgccctgtga 5520 taggctataa tgttggtgca attagagagt tgtatgcaga aagttttcct ggcgtattta 5580 ttgccaataa taaagaagat ttagcacaag tagcctacaa attaattagt cttgataatg 5640 aaaaatatta tcatttgaga caaactattt atagcaagcg tgagcttttt tctgaagaga 5700 gatatgcgga aattttaacg gcggcattta atgaaaaaaa ataagaaact ctgtctcatt 5760 tcaattaact catataatga acttaccgga ggaggagtat atttacgtac gcttgttagt 5820 tttctacaaa aacagaatgt taatttaaca cttattgata aaaaatcctc aggtaaacta 5880 ttcgaagaca atacttttca acatatatca tttattaaag gtaaacgtca ggatataata 5940 tccaggcttt tttttatacc atcattttat gtcccttata ttttctcaat aattaaaatt 6000 ttacggaagc aagatattct tgcttttcac aactctcggc ttggattgtt atgtctgctt 6060 tttagaatac tcatgcccca caaaaagatc atattgttta cggataactt cgaatatgac 6120 ttaataagac aaaaagataa aaacataact acttttattg aaaaattaat tgtttatctc 6180 aatgaattta tcgggcttaa gaattcagat ttagttagct atattacccg gcaagataaa 6240 aatgcaatgg ataaatttta tgggattaaa aaaagcagaa atttaattct ccctgtgata 6300 tttagtagag aaaaaccaac tgatgtattg tcagctcact ttattaatga gtataatcga 6360 ttgaataatg ataataggaa aaaagtagta tttactgcat cttttgattt ttttccaaat 6420 atagatgctg ccaactatgt tttaaatgca gcaaagtcta ataatgatta ttgctatatt 6480 ttggcaggta ggaaaagtac tactttgaat cttcctgatt tggataattt attttttttc 6540 gataatctat ctaatagtga aatgtcatat ttattatctg cttgtgatgt tttttattct 6600 cctatagttt taggaagtgg aatgaaaaca aaaattgcag aagcactatc atatggatta 6660 tatatttatg cgacagagca ttccttaatc ggctatgatg aaattataca caataaggag 6720 tgtgttaaaa aaatctcaca tttggatgag gaatttccta aagatttcaa gatgaaaagt 6780 atcaataaac agctaataat gtcttatcag caaaaatatt attcacatta tcggtttaat 6840 ggccatgaac ttgatataat aaattttgac gattagttag tggagatata atatgaacat 6900 attagtaact ggtggtgctg gatatatcgg atctcatacg gctattgaat tactgaatgc 6960 aggtcatgag attatcgttc tggacaattt cagtaatgct tcatacaagt gtatcgaaaa 7020 aataaaagaa attactcgac gtgattttat aacaattact ggagatgctg ggtgtaggaa 7080 gacactctcc gctattttcg agaaacacgc catagatata gttattcatt ttgctggctt 7140 taaatctgtt tcagagtcta aaagtgaacc cttaaagtat taccagaata atgttggagt 7200 gaccattact ttattacagg taatggaaga gtacagaatt aaaaaattta tctttagttc 7260 atctgcgaca gtctatggtg aaccagagat aattccaatt ccagaaacag ctaaaattgg 7320 aggaactacg aatccatatg gcacatcgaa gtattttgtt gaaaaaattc tagaggatgt 7380 tagttccacg ggaaaactgg atataatttg cttgagatat tttaatcctg tcggtgctca 7440 ttctagtggt aaaataggtg aggctccatc tggtatccct aataatcttg ttccttattt 7500 attggatgtt gcgagtggta aacgtgataa attatttatt tatggcaatg attaccctac 7560 taatgatgga acaggtgtaa gggattttat tcatgttgtt gacttagcga aaggtcattt 7620 ggctgcaatg aattatttaa gtatcaattc gggatataat atctttaatc ttggtacagg 7680 aaaaggttat tcggtacttg aattaatcac tacatttgaa aaattaacaa acattaaggt 7740 caataaatct tttatagaga gaagggcagg ggatgttgcg tcttgttggg ctgatgcaga 7800 taaagctaat tctttattgg actggcaagc cgaacaaact ctagaacaga tgttattgga 7860 ctcgtggcgt tggaaaaaaa attatccaga cggattctga atataaaagg tttcagtttt 7920 atgaatcaat cagagcagag aaaaaaaata ctggttctta cacctcgctt tccctaccct 7980 gtcattggag gggatagatt aagagtctat atgttatgta aagaactttc caaaaaatat 8040 gatcttattc ttctgagctt atgtgatcaa ccactagaac ttgaaataaa tataaatgac 8100 tcggtcttca aagaaattca tcgtgtctat ctaccaaaat ataaatcata ttataatgta 8160 ttaaaagctt tggttacgca aaaaccgttg caaattgctt attatcaatc ggacacattt 8220 aagaataaat acaataaatt aattaaacaa tgcgatgcag tattttgtca tctgataaga 8280 gttgctgatt atgttaagga tacagacaag ttcaaaattc ttgatatgac agatgcaata 8340 tctttgaatt acagtcgcgt taaaaaatta gcaagtaaaa aaagtttgcg tgcaattatt 8400 tattctctgg aacaaaaaag attagaatca tatgaacgtt ctgtggcgaa tctttttgat 8460 ttgaccactt ttatttcatc cgtagaccgt gactatctct accctaatct gggcagtaat 8520 atccatatag tcaataatgg ggttgataca tcagccttga gatatataaa aagagaaata 8580 aaaatcgata agcctgtgga acttatattt atcggaaata tgtattcttt acaaaatatg 8640 gatgctgcaa aacattttgc taagaatatt ttaccttgct tgtatgatga gtttaatatt 8700 atttttaaag tgattggtaa gatctcagaa actaataaaa atatattaaa ttcatttaaa 8760 aatacaattg ctttaggtac tgttgatgat atcaattctt ccgcttctac agggcatata 8820 ggtatatgtc ctgttcgtct tggagcaggc gtacaaaata aaattcttga atacatggct 8880 ttaggtttac catgtattac atctagcatt ggttatgaag gtattaatgc aaaatcaggt 8940 agcgaaattt ttgttgcaga tacagtagag caatataaaa acgtactaag agaaataatt 9000 tacgattata atcgttatac tgaagtggct gaaaatgccc gtagttttgt agaaaataat 9060 ttttcttggg aatcaaaagt tgccaattta atgaatacat tagatgagaa attatatgaa 9120 caataataaa attattacac ctatcattat ggctggtggt tcaggcagtc ggttgtggcc 9180 actatcaaga attctctatc cgaaacaatt tcttagccta atcggtagtc ataccatgct 9240 tcaaacaacg gctaatcgtc tggatggttt ggattgtacc aacccttatg tcatttgtaa 9300 tgaacaatac cgctttatag ttgctgaaca gcttagaaaa atcgatagat tgacttcaaa 9360 gaatatcatc cttgagcctg ttgggcgtaa cactgcccct gcaattgcat tagcggcgtt 9420 gctgatgtct aagtctgata aaagtgcaga tgatcttatg ctcgtactgg ctgcagatca 9480 cgttatacac gatgaagaaa aattttgtaa cgctgttaga tcggcaattc catacgctgc 9540 tgatgggaaa ttggtaacat ttggtataat tccagacaaa gcagaaactg gttatggtta 9600 tatacatcga ggacaatata ttaatcagga agattcggat gcatttatag tgtcatcatt 9660 tgttgaaaag ccaaatcatg agacagccac taaatatctt gcttccggtg agtattattg 9720 gaatagcggt atgtttttgt ttagtgcaaa tcgttatata gaggaactta aacaatttcg 9780 gcctgatatt ttatccgctt gtgaaaaagc aattgcttca gcgaactttg accttgattt 9840 tgtgcgttta gatgaaagtt ctttctctaa gtgccctgaa gaatcaattg attacgctgt 9900 aatggaaaaa acaaaagacg caattgttat tccaatggat gctggctgga gtgatgtcgg 9960 ttcatggtct tctctttggg aaattaatga taaagactca gacggcaacg taatagttgg 10020 ggatattttc tctcatgaaa caaagaattc tttcatatat gccgaatcgg gaattgttgc 10080 tacagttgga gtggaaaatt tagttgttgt ccaaacaaag gatgctgttc ttgtctcaga 10140 gagaaataaa gttcaggatg taaagaaaat agtagaacaa attaaaaatt caggtcgtag 10200 cgagcattat gttcatcgcg aagtatatcg tccttggggt aaatatgatt ccattgacac 10260 aggggagcgt tatcaggtca aacgtataac agtaaatcct ggtgaaggac tttctttaca 10320 aatgcaccat catagggcag aacattggat catagtttct ggaactgcaa gggtgactat 10380 aggttctgaa actaagattc ttagcgaaaa tgaatctgtt tacatacctc ttggtgtaat 10440 acactgcttg gaaaatccag ggaaaattcc tcttgattta attgaagttc gttctggatc 10500 ttatttagaa gaagacgatg ttatccgttt tcaggaccga tatggtcgta gctaaatttt 10560 tgataatgta acgttagtag aagagcgcta atatttttag ttaatctgta ataagtatta 10620 tttgtttaag gtatatcatg tcgagtttac cctgctttaa agcctatgat attcgcggga 10680 aattaggcga agaactgaat gaagatattg cctggcgcat tggtcgcgct tatggcgaat 10740 ttctcaaacc gaaaaccatt gtgttaggcg gtgacgtccg actcaccagc gaaaccttaa 10800 aactggcgct ggcgaagggg ttacaggatg cgggcgtcga tgtgctggat attggcatgt 10860 ccggcaccga agagatctat ttcgccacgt tccatctcgg cgtggatggc ggcatcgaag 10920 ttaccgccag ccataacccg atggattaca acggcatgaa actggtgcgc gaaggggctc 10980 gcccgatcag cggtgatacc ggactgcgcg acatccagcg tctggcagaa gccaacgact 11040 ttcctcccgt tgatgaaacc aaacgcggtc gctatcagca aatcaatctg cgtgacgctt 11100 acgttgatca cctgttcggt tatatcaacg tcaaaaacct cacgccgctc aagctggtga 11160 ttaactccgg gaacggcgcg gcgggtccgg tggtggacgc cattgaagcc cgctttaaag 11220 ccctcggcgc acccgtggaa ttaatcaaag tgcacaacac gccggacggc aatttcccca 11280 acggtattcc taacccgcta ctgccggaat gtcgcgacga cacccgcaat gcggtcatca 11340 aacacggcgc ggatatgggc attgcctttg atggcgattt tgaccgctgt ttcctgtttg 11400 acgaaaaagg gcagtttatt gagggctact acattgtcgg cctgctggca gaagcgttcc 11460 tcgaaaaaaa tcccggcgcg aagatcatcc acgatccacg tctctcctgg aacaccgttg 11520 atgtggtgac tgccgcaggc ggcaccccgg taatgtcgaa aaccggacac gcctttatta 11580 aagaacgtat gcgcaaggaa gacgctatct acggtggcga aatgagcgcc caccattact 11640 tccgtgattt cgcttactgc gacagcggca tgatcccgtg gctgctggtc gccgaactgg 11700 tgtgcctgaa aggaaaaacg ctgggcgaac tggtgcgcga ccggatggca gcgtttccgg 11760 caagcggtga gatcaacagc aaactggcac accccgttga ggcgattaac cgcgtggaac 11820 agcactttag ccgcgaggcg ctggcggtgg atcgcaccga tggcatcagc atgacctttg 11880 ccgactggcg ctttaacctg cgctcctcta acaccgaacc ggtggtgcgg ttgaatgtgg 11940 aatcgcgcgg cgatgtaccg ctgatggaag aaaagacaaa acttatcctt gagttactga 12000 acaagtaatt cagtaatttc atataaatgg gttttaaaaa acggaaaaga tgagatatcc 12060 ggtgtggtat atccaaggta atgctattca gtatctctat gagtgagtta acatctatac 12120 cacatttaag ccgcacactt cgggatcccc atatgaatat cctccttagt tcctattccg 12180 aagttcctat tctttctaga gaataggaac ttcggaatag gaactaagga ggatattcat 12240 atggataaag ccgtaagcat ataagcatgg ataagctatt tatactttaa taagtacttt 12300 gtatacttat ttgcgaacat tccaggccgc gagcattcag cgcggtgatc acacctgaca 12360 ggagtatgta atgtccaagc aacagatcgg cgtagtcggt atggcagtga tgggacgcaa 12420 ccttgcgctc aacatcgaaa gccgtggtta taccgtctct attttcaacc gttcccgtga 12480 gaagacggaa gaagtgattg ccgaaaatcc aggcaagaaa ctggttcctt actatacggt 12540 gaaagagttt gtcgaatctc tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg 12600 tgcaggcacg gatgctgcta ttgattccct caaaccatat ctcgataaag gagacatcat 12660 cattgatggt ggtaacacct tcttccagga cactattcgt cgtaatcgtg agctttcagc 12720 agagggcttt aacttcatcg gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg 12780 tccttctatt atgcctggtg gccagaaaga agcctatgaa ttggtagcac cgatcctgac 12840 caaaatcgcc gccgtagctg aagacggtga accatgcgtt acctatattg gtgccgatgg 12900 cgcaggtcac tatgtgaaga tggttcacaa cggtattgaa tacggcgata tgcagctgat 12960 tgctgaagcc tattctctgc ttaaaggtgg cctgaacctc accaacgaag aactggcgca 13020 gacctttacc gagtggaata acggtgaact gagcagttac ctgatcgaca tcaccaaaga 13080 tatcttcacc aaaaaagatg aagacggtaa ctacctggtt gatgtgatcc tggatgaagc 13140 ggctaacaaa ggtaccggta aatggaccag ccagagcgcg ctggatctcg gcgaaccgct 13200 gtcgctgatt accgagtctg tgtttgcacg ttatatctct tctctgaaag atcagcgtgt 13260 tgccgcatct aaagttctct ctggtccgca agcacagcca gcaggcgaca aggctgagtt 13320 catcgaaaaa gttcgtcgtg cgctgtatct gggcaaaatc gtttcttacg cccagggctt 13380 ctctcagctg cgtgctgcgt ctgaagagta caactgggat ctgaactacg gcgaaatcgc 13440 gaagattttc cgtgctggct gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc 13500 ttatgccgaa aatccacaga tcgctaacct gttgctggct ccgtacttca agcaaattgc 13560 cgatgactac cagcaggcgc tgcgtgatgt cgttgcttat gcagtacaga acggtattcc 13620 ggttccgacc ttctccgcag cggttgccta ttacgacagc taccgtgctg ctgttctgcc 13680 tgcgaacctg atccaggcac agcgtgacta ttttggtgcg catacttata agcgtatcga 13740 taaagaaggt gtgttccata ccgaatggct ggattaa 13777 <210> 14 <211> 15027 <212> DNA <213> Artificial Sequence <220> <223> example O8 rfb locus nucleotide sequence - O8-EPA production strain stLMTB11734 <400> 14 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcgatcgctt aagatctagg atttcattat gttacttcct gtaattatgg 1320 ctggtggtac cggcagtcgt ctctggccga tgtcacgcga gctttatccg aaacagttcc 1380 tccgcctgtt cgggcagaac tccatgctgc aggaaaccat cacccgactc tcgggccttg 1440 aaatccatga accgatggtc atctgtaacg aagagcaccg cttcctggtg gctgaacagc 1500 tacgccagct caataagctg tcgaataata ttattcttga gccggtcggg cgcaacaccg 1560 ccccggccat cgccctggca gcccttcagg ccacccgcga cggcgacgac ccgctgatgc 1620 tggttctcgc cgctgaccat atcatcaata accagtcggc cttccacgac gccatccggg 1680 tcgccgagca gtatgctgat gaaggtcatc tggtcacctt cggtatcgtg ccgaatgccc 1740 cggaaactgg ctacggttac attcagcgcg gcgtggcgct caccgatagt gcccattccg 1800 cgtaccaggt ggcccgcttt gtggagaagc cggatcgcga gcgcgccgag gcttacctcg 1860 cctccgggga gtactactgg aacagcggca tgtttatgtt ccgcgccaag aaatacctca 1920 tcgagctggc caaataccgt ccggatatcc tggaagcctg ccaggctgcg gtgaatgccg 1980 ccgataatgg cagcgatttc atcaatatcc cgcatgatat tttctgcgag tgcccggatg 2040 agtccgtgga ctatgccgtt atggagaaaa ccgccgatgc ggtggtggtc ggtctcgatg 2100 ctgactggag cgacgtcggc tcctggtccg cactatggga ggtcagcccg aaagacgagc 2160 agggcaatgt cctcagcggt gacgcgtggg tacacaacag cgaaaactgc tacatcaaca 2220 gcgacgagaa gctagtggcg gccattggcg tagagaatct ggtgattgtc agcactaagg 2280 acgccgtgct ggtgatgaat cgcgagcgtt cccaggacgt gaagaaggcg gtcgagttcc 2340 tcaagcagaa ccagcgcagc gagtacaagc gccaccgtga gatttaccgc ccctggggcc 2400 gttgcgacgt agtggtccag accccgcgct tcaacgtcaa ccgcatcacg gtgaaaccag 2460 gcggtgcctt ctcgatgcag atgcaccacc atcgcgccga gcattgggtt attctcgccg 2520 gcaccggtca ggtgactgtc aacggtaagc agttcctgtt gtccgagaac cagtccacct 2580 ttattccgat tggcgccgag cactgcctgg aaaaccctgg ctgtattccg ctggaagtgc 2640 tggagatcca gtcgggggcg taccttggcg aggacgacat tattcgtatt aaagaccagt 2700 atggtcgttg ctaattattt tcgggacaag acgcagaatg acacagttaa cttgttttaa 2760 agcttatgac atccgtggtg aactgggtga ggaactgaac gaggacatcg cctaccgtat 2820 cggtcgcgcc tacggcgaat ttctgaaacc cgggaagata gtggtggggg gcgatgtgcg 2880 cctcacaagc gagtcgctga agctggcgct ggcccgcggg ttaatggacg ccggtaccga 2940 cgtgctggac atcggcctga gcggtaccga agagatttac tttgccacct tccaccttgg 3000 ggtagatggt ggcatcgagg tgaccgcgag ccacaatcct atgaactaca acggcatgaa 3060 gctggtgcgc gagaatgcga agcccatcag cggcgacacc ggcctgcggg atatccagcg 3120 cctggcggag gaaaaccagt tcccgccagt ggacccggcg cgtcgcggga ccctgagcaa 3180 gatatcggta ctgaaggagt atgttgacca tctgatgagc tacgtggact tctcgaactt 3240 cacccgtcca ctgaagttgg tggtgaactc cggaaacggg gctgcggggc acgtgattga 3300 tgaggtggag aaacgcttcg cggcggctgg ggtgccggta acctttatca aggtgcatca 3360 ccagccggat ggccatttcc ctaacggtat cccgaatccg ctgctgccgg agtgccgcca 3420 ggataccgcc gacgcggtgc gcgagcatca ggccgacatg gggattgcct ttgacggcga 3480 cttcgatcgc tgcttcctgt tcgatgacga agcttcgttt atcgaggggt attacattgt 3540 cggcctgctg gctgaggcgt tcctgcagaa gcagccggga gcgaaaatca ttcacgaccc 3600 gcgcttgacg tggaacacgg tagacatcgt gacccgcaac ggcggccagc cggtgatgtc 3660 gaagacgggg catgcgttca tcaaggagcg gatgcgtcag gaagacgcta tctacggcgg 3720 ggagatgagt gcgcaccatt acttccgcga tttcgcctac tgcgatagcg ggatgatccc 3780 gtggctgctg gtggcggagc tgctgtgtct gaagaacagc tcgctgaaat cgctggtggc 3840 ggaccgccag aaggcgttcc ctgcgtcggg agagatcaac cgcaagctaa gtaatgctgc 3900 tgaggcgatc gcccgcatcc gggcgcagta tgagccggcg gctgcacaca tcgacacaac 3960 ggacgggatc agtattgaat accctgaatg gcgctttaac ctgcgcacgt ctaacaccga 4020 gccggtggtg cgtctgaacg ttgagtccag agctgatgtg gcgcttatga atgaaaaaac 4080 gaccgagctg ttacacctgt taagcgggga ataaggtgag agatttacta acgacgattt 4140 atcgttatcg gggatttatc tggagcagtg ttaaacgtga ttttcaggca cgctatcaaa 4200 ctagtatgct gggcgcacta tggctcgttt tacaaccgct ctctatgatt ctggtctata 4260 ccctggtttt ttccgaggtg atgaaggcaa gaatgcccga taataccggg tcgtttgcct 4320 atagtattta tctctgttcc ggggtactga cctggggatt atttactgag atgctggata 4380 aaggtcagag cgtatttatt aacaatgcta atctgatcaa gaaactcagt tttccgaaaa 4440 tctgtctgcc gatcatcgtg acgttatcgg cggtgctaaa tttcgcgatt attttcagtc 4500 tgtttctaat ttttatcatt gtcaccggta acttccccgg ctggctcttt ctctcggtga 4560 taccggtcct gcttttgcag atcctgtttg ccggtgggct ggggatgatc cttggtgtca 4620 tgaacgtctt tttcagggat gtggggcaac tggttggcgt tgcgctgcaa ttctggtttt 4680 ggttcacacc cattgtttat gtactgaatt cattacctgc atgggcaaaa aatctgatga 4740 tgtataaccc gatgactcgg atcatgcaat cttatcagtc catcttcgcc tatcatctgg 4800 cccccaactg gtattcgcta tggccagtat tggctctcgc cattattttc tgcgtcatcg 4860 gtttcaggat gttccgcaag catgcggcgg atatggtgga tgaattataa tgagttatat 4920 cagagtaaat aatgtcggta aggcgtatcg ccagtatcac tcaaagaccg ggagactgat 4980 cgaatggtta tcccctctga ataccaaacg ccataatttg aaatggatcc tccgcgatat 5040 taatttcgaa gtcgctccgg gcgaggctgt cggtattatc ggtatcaacg gtgcaggcaa 5100 gagtaccctg cttaaactca taaccgggac gtccaggccg acgactggag aaattgaaat 5160 ctccggacgt gtcgctgcat tactcgaatt ggggatgggg tttcattctg atttcactgg 5220 tcggcagaat gtttatatgt ctgggcaact gttggggtta tcgtcagaga aaataactga 5280 actgatgccg caaattgaag agtttgctga gattggggac tatatcgatc aacctgtgcg 5340 cgtctactcc agtgggatgc aagttcgatt agcttttagt gtagcgacgg ctatccgtcc 5400 tgatgtgcta attatcgatg aggcattatc tgttggggat gcatatttcc agcataaaag 5460 ctttgagcgt attcgaaaat ttcgtcagga agggaccacg ctgttgctgg tatcccatga 5520 taaacaagcg atccaaagca tttgcgaccg ggccatttta ttgaataaag gccaaattga 5580 aatggaaggt gaacctgaag cagtgatgga ttattacaat gctcttctgg ccgataaaca 5640 aaatcagtcc attaaacaag ttgagcataa tggtaaaacg caaactgttt caggcactgg 5700 tgaggtgact atctctgagg ttcatcttct cgatgaacag ggcaatgtga ctgaatttgt 5760 ttcggtaggg catcgtgtca gcttgcaggt caacgttgag gtcaaggacg atattcctga 5820 gcttgttgtc ggatatatga ttaaggatcg acttgggcag ccgattttcg ggaccaatac 5880 gtaccatctc aatcagacac tcacctccct gaaaaaagga gaaaagcgtt cgttcttatt 5940 ttctttcgat gcgagattgg gggttggctc ctattctgtc gctgtcgcgt tgcatacttc 6000 cagtacgcac ctcggcaaaa actatgaatg gcgcgatctg gccgtggtat tcaacgtcgt 6060 taacacggaa caacaagagt ttgtcggcgt gtcctggttg ccgcctgaac tggagatttc 6120 ttaatgggtt cgtcgtttta tcgttcattt gaagaacgac acagaggttc ggttgaagaa 6180 atcaagcgcc gcttgagttt ttatttacct tttcttgcag gtctgaagga catttatcct 6240 gatggcgtga ttgcggatat tggttgcgga cgtggcgaat ggttggagat cctgactgaa 6300 aatggcattg cgaacatcgg cgtcgatctc gatgatggca tgctggcgcg cgccagggag 6360 gccggactga atgtgcagaa aatggattgt ctgcagtttt tgcaaagtca ggcggatcag 6420 agcctgatag cgttgaccgg ttttcatatt gctgagcatt tgccgtttga ggtcctgcag 6480 caactcgcca tgcataccct acgggtgctg aaaccaggtg gtttgctgat cctcgaaacg 6540 ccgaacccgg agaatgtaag cgtcggcacc tgttcatttt atatggatcc aacgcataat 6600 catcctctgc caccgccact gcttgagttt ttacctattc attatggttt tacccgagca 6660 attaccgttc gtctgcagga aaaagaggtt cttcaatctc cggatgcagc cgttaatttg 6720 gtcgatgtac tcaaaggggt gagccccgac tacagcatca ttgctcagaa agcagcgcca 6780 acagatattc ttgaacgctt tgacaccctg tttacccagc agtacggtct gacgctggat 6840 gctctgagca accgttacga tgcgattttg cgccaacagt tttcgtccgt tgtctcacgg 6900 ctggagacgt tgaaccaaac ctatatgcaa cagataagcc aaatgtcaga gactattcag 6960 acgttgcaag gtgaggttga cgatctgagt catgtcatcg atcagaacca tcagcttcat 7020 cagcaaatgg cggatttaca taacagtcgt tcatggcgta ttactcaacc actacgctgg 7080 ttgtctttgc aacgtcaatt attacgtcag gaaggggcta aagtgcgagc ccgtagggct 7140 gggaaaaaaa tattgcgcaa agggatggcg ctctcgctgg tctttttcca tcgttaccct 7200 aagtctaagg tttatctgtt taaggttctg agaaaaactg gctgctatac attgctacaa 7260 cgtttgttcc aacgcgtaat gctggtgcaa tctgacacga tgatgatgca gtccagaaga 7320 tatgatgtgg gtactgaaga aatgacaagt cgcgcgatga gtatttataa cgaattaaaa 7380 aataaaaata cggagaaata acgatgcgta ttgtcataga tttacaaggc gcacagacgg 7440 aaagccgctt tcgtggcatc ggtcgttata gtatcgcaat cgccagaggc ataatcagaa 7500 ataacagccg gcatgagatt ttcatcgcgc tatccgccat gctggatgag tcgattgcaa 7560 atattaaggc gcaatttgcc gatctcctgc cggcagaaaa tatagtcgta tggcatgccg 7620 taggccctgt tcgtgcgatg gaccaaggta atgaatggcg tcgggagagc gcagaactga 7680 ttcgggaagc gtttcttgaa tcattgtgtc cagatgtcgt tttcattacg agtttgtttg 7740 aaggtcatgt cgacgatgcg gctacatcgg tacacaaatt tagtcgtcag tataaagtag 7800 ccgtactgca ccacgatctt atccccctcg tgcaggcgga aacctatctg caggacgatg 7860 tatacaaacc ctactattta cagaaagttg agtggttaaa aaacgctgac cttttgttga 7920 ctaactctgc ttataccgca caggaagcga tcgagcatct gcatttacag ggcgatcatg 7980 tgcagaatat tgcagccgca gtcgattctc agttttgtat ggcggaggtg gcagcgagcg 8040 aaaaagagac cgtccttggc cattacggta ttcagcgcga gttcatgttg tatgcgcccg 8100 gaggatttga ctcaaggaaa aactttaaac ggttgattga ggcctatgcc gggctcagtg 8160 atgccttacg tcgcagtcat caactggtca tcgtcagtaa gctttccatc ggtgatcgtc 8220 agtatctgga atcccttgcg tcaggtaatg gtttacagca gggcgaactg gtactcactg 8280 gttatgtgcc ggaagatgag ctgatccagc tctatcgcct atgtaagctg ttcatctttg 8340 cttcactaca tgaaggtttt gggttgccgg ttctggaagc aatgtcgtgc ggtgcgccgg 8400 tgattggctc aaatgtcacc agtattcctg aagtcatcgg taatcctgag gcattattcg 8460 acccgtattc tgtctcttcc atgagggata agatcgcgca atgtttgact gatgatacct 8520 tcctcgcgcg tctgaaagaa atggcgcagc agcaagcgcg taatttctct tgggataaag 8580 ctgcggtgac tgctctggaa gctttcgaaa agatcgcggt agaagacacc ggtactgcgc 8640 aggttttgcc tgaagctttg attcagaaga tccttgctat ctcacaaggg cagccagatg 8700 accgcgatct gcgcttgtgc gcaacggcca ttgattacaa tctgaaaacg gcagaacttt 8760 atcaaatcga cgataaatcg ctgaactggc gtgtggaagg cccattcgat agctcatata 8820 gtctggcgtt ggtcaaccgc gaatttgccc gggcactctc agccgatggt gtagaggttt 8880 tattgcattc cactgaagga ccaggtgatt ttgccccaga tgcctcgttt atggcacagt 8940 cggaaaatag tgatcttctg gcattttata atcaatgtca gacccgcaag agtaacgaaa 9000 agatagatat tattagcaga aatatctatc caccgcgggt taccaaaatg gatgccaaag 9060 taaaattcct tcattgttat gcttgggaag aaacgggctt tccgcaaccg tggatcaatg 9120 aatttaatcg ggaacttgac ggagtgctgt gtacttcgga acatgttcgt aaaatactga 9180 ttgataacgg actgaatgtg cccgcatttg ttgttggcaa tggctgtgac cattggctca 9240 atatcccagc cgagacgaca aaagatgtgg atcacggaac attccgtttc ctgcacgtct 9300 cttcttgttt cccacgcaaa gggatacagg caatgcttca ggcttggggg aaggcgttca 9360 ctcgtcgtga caatgttatc ttaatcatta agacttttaa caatccgcac aatgaaattg 9420 acgcatggct ggctcaggcc caggctcaat tcatagacta tcccaaagtt gaagtgatca 9480 aagaggatat gtcagccacc gagcttaaag ggctttatga aagctgtgat gttttggttg 9540 ctccaggttg cgctgaaggc tttggtttac ctattgctga agcaatgctg agtgggctac 9600 cggctatcgt caccaattgg agcgggcaac ttgattttgt taattcacaa aattcatggc 9660 tggttgacta tcagttcact cgggtaaaaa cgcactttgg tctgttttcc tcagcctggg 9720 ccagtgtgga tattgacaac ttaacagatg cattaaaagc ggcagcctca accgataaat 9780 cagtgctgcg tgacatggcc aatgctggtc gcgagcttct tctgcagcag tttacctgga 9840 aagcggtggc tgatcgttct tgccaggcgg tcaagactct gcgtgcgcat attgatattg 9900 cacagcatcg ggcgcgcatt ggctgggtga cgacctggaa cacgaaatgt gggatcgcaa 9960 cctattccca gcatctggtg gaaagcgcac ctcatggcgc ggatgttgtt tttgctcccc 10020 aggtcagcgc tggcgatctt gtgtgtgcag acgaagagtt tgtacttcgc aactggattg 10080 taggtaaaga gagcaactat ctggaaaacc tccagccaca cattgatgct ctgagactcg 10140 atgtcattgt gatccaattc aactatggat tctttaatca tcgagaactg tcggcgttta 10200 ttcgtcgcca gcatgacgcc ggtcgttcag ttgttatgac gatgcactca actgtggatc 10260 cgctggaaaa agagccgagc tggaatttcc gtcttgctga aatgaaagag gcgctggcac 10320 tttgcgaccg gttgttggtg cattcgattg ccgatatgaa ccgccttaaa gatttaggct 10380 taactgcgaa tgttgcttta ttcccgcacg gtgttatcaa ctactccgca gcgagcgtca 10440 cacgtcaaca gcagtcttta ccgctaattg cgagctatgg cttctgctta ccgcataagg 10500 gcctgatgga actagtagaa tccgtccata gactcaagca agccggtaaa ccggttcgtt 10560 tacgactggt gaacgcagag tatcctgttg gggagtcacg cgatctggtg gcagagctta 10620 aagctgctgc tcagcggtta ggtgttaccg atctgattga gatgcataat gatttcctac 10680 ctgatgcgga gagtctgcgg ttgctttcag aagccgatct tctgattttt gcttatcaga 10740 atactgggga gtctgctagc ggggcggtac gttatggtat ggcgactcaa aaacctgttg 10800 cggtaacgcc cctggcgata tttgatgatt tggacgatgc cgtctttaaa tttgatggat 10860 gcagcgtcga tgatatcagt caggggattg accggatcct gaattccatc cgtgaacaga 10920 actcttgggc aaccaggact caacaacgtg ccgatgcatg gcgggaacaa catgattatc 10980 aagctgtttc acgccgtctg gttaatatgt gtcaaggctt agctaaagct aaatatttta 11040 aataaaaata tctctcttgt attttttgcc tttgaataca agaggggtta gataatgtgt 11100 catttattat gaaaattatt tttgctactg agccaattaa atacccatta acgggcatcg 11160 gtcggtattc cctggagctg gttaagcggc tggcggtcgc ccgcgaaatt gaagaattaa 11220 agctatttca cggtgcgtcg tttatagaac agatcccttt ggtggagaat aaaagcgata 11280 ccaaagccag caatcatggt cgtctgtcgg cgtttctacg ccgacagacg ctgttgattg 11340 aggcttatcg cttgctgcat ccgcggcgcc aggcgtgggc attgcgcgac tataaggatt 11400 atatctacca tggccccaat ttttatctgc cgcataaact ggaacgcgcc gtgaccacgt 11460 ttcatgacat atccattttt acctgcccgg aatatcatcc aaaagatcgg gttcgctata 11520 tggagaagtc cctgcatgag agtctggatt cggcaaagct gatcctgacc gtttctgatt 11580 tctcgcgcag tgaaattatc cgcttgttca actatccggc ggagcggatc gtaaccacca 11640 agctagcctg cagcagtgac tatatcccac gcagcccggc agagtgtctg ccggtactgc 11700 agaaatatca gctggcgtgg caggcctacg cgctatatat cggcactatg gagccacgta 11760 aaaatatccg aggcctgctg catgcctatc agctgctacc gatggagatc cgcatgcgct 11820 atccgctaat ccttagcggc tatcgcggct gggaagacga tgtgctgtgg cagttagtcg 11880 agcgcggtac tcgggaaggc tggatccgtt acctcggata tgttccggat gaagacctgc 11940 cgtatctgta cgcagcggcc agagtctttg tttatccctc cttctacgag ggattcggtt 12000 tacctattct tgaagcgatg tcttgcggtg tgccggtagt atgctccaat gtcacctctt 12060 tgcctgaggt tgttggcgat gccggcctcg ttgccgatcc taatgatata gacgcgatta 12120 gcgcgcaaat tttgcagagc ctgcaagatg atagctggcg ggaaatcgcc accgcgcgcg 12180 gtcttgctca ggcgaaacag ttttcgtggg agaactgtgc gacacagacc attaacgcct 12240 ataaattact ctaagggtgt cagttgagag ttctacacgt ctataagact tactatcccg 12300 atacctacgg cggtattgag caggtcattt atcagctaag tcagggctgc gcccgccggg 12360 gaatcgcagc cgatgttttc acttttagcc cggacaaaga tacaggtcct gtcgcttacg 12420 aagatcatcg ggtcatttat aataaacagc tttttgaaat tgcctccacg ccgttttcgc 12480 tgaaagcgtt aaagcgtttt aagctgatta aagatgacta cgatatcatc aactaccatt 12540 ttccgtttcc ctttatggat atgctgcatc tttcggcgcg gcctgacgcc aggactgtgg 12600 tgacctatca ctctgatata gtgaaacaaa aacggttaat gaagctgtac cagccgctgc 12660 aggagcgatt tctcagcggc gtagattgca tcgttgcctc gtcgcccaat tacgtggctt 12720 ccagccagac cctgaaaaaa tatctggata aaacggtggt gatcccgttt ggtctggagc 12780 agcaggacgt gcagcacgat ccgcagaggg tcgcgcactg gcgggaaact gtcggcgata 12840 agttctttct cttcgtcggc actttccgct actacaaagg gctgcatatt ctgatggatg 12900 ccgctgagcg tagccgactg ccagtggtgg ttgtaggggg cgggccgctg gaatcggaag 12960 tgcggcgtga agcgcagcag cgcgggctga gcaatgtgat gtttaccggc atgctcaacg 13020 acgaagataa gtacattctc ttccagctct gccggggcgt ggtattcccc tcgcatctgc 13080 gctctgaggc gtttggcatt acgttattgg aaggcgcacg ctttgcaagg ccgctgatct 13140 cttgcgagat cggtacaggt acctctttca ttaaccagga caaagtgagt ggttgcgtga 13200 ttccgccgaa tgatagccag gcgctggtgg aggcgatgaa tgagctctgg aataacgagg 13260 aaacctccaa ccgctatggc gaaaactcgc gtcgtcgttt tgaagagatg tttactgccg 13320 accatatgat tgacgcctat gtcaatctct acactacatt gctggaaagc aaatcctgag 13380 cggccgcgag ctcgtcgact cgaggatccg tgtaggctgg agctgcttcg aagttcctat 13440 actttctaga gaataggaac ttcggaatag gaactaagga ggatattcat atggataaag 13500 ccgtaagcat ataagcatgg ataagctatt tatactttaa taagtacttt gtatacttat 13560 ttgcgaacat tccaggccgc gagcattcag cgcggtgatc acacctgaca ggagtatgta 13620 atgtccaagc aacagatcgg cgtagtcggt atggcagtga tgggacgcaa ccttgcgctc 13680 aacatcgaaa gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa 13740 gaagtgattg ccgaaaatcc aggcaagaaa ctggttcctt actatacggt gaaagagttt 13800 gtcgaatctc tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg 13860 gatgctgcta ttgattccct caaaccatat ctcgataaag gagacatcat cattgatggt 13920 ggtaacacct tcttccagga cactattcgt cgtaatcgtg agctttcagc agagggcttt 13980 aacttcatcg gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg tccttctatt 14040 atgcctggtg gccagaaaga agcctatgaa ttggtagcac cgatcctgac caaaatcgcc 14100 gccgtagctg aagacggtga accatgcgtt acctatattg gtgccgatgg cgcaggtcac 14160 tatgtgaaga tggttcacaa cggtattgaa tacggcgata tgcagctgat tgctgaagcc 14220 tattctctgc ttaaaggtgg cctgaacctc accaacgaag aactggcgca gacctttacc 14280 gagtggaata acggtgaact gagcagttac ctgatcgaca tcaccaaaga tatcttcacc 14340 aaaaaagatg aagacggtaa ctacctggtt gatgtgatcc tggatgaagc ggctaacaaa 14400 ggtaccggta aatggaccag ccagagcgcg ctggatctcg gcgaaccgct gtcgctgatt 14460 accgagtctg tgtttgcacg ttatatctct tctctgaaag atcagcgtgt tgccgcatct 14520 aaagttctct ctggtccgca agcacagcca gcaggcgaca aggctgagtt catcgaaaaa 14580 gttcgtcgtg cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg 14640 cgtgctgcgt ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc 14700 cgtgctggct gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa 14760 aatccacaga tcgctaacct gttgctggct ccgtacttca agcaaattgc cgatgactac 14820 cagcaggcgc tgcgtgatgt cgttgcttat gcagtacaga acggtattcc ggttccgacc 14880 ttctccgcag cggttgccta ttacgacagc taccgtgctg ctgttctgcc tgcgaacctg 14940 atccaggcac agcgtgacta ttttggtgcg catacttata agcgtattga taaagaaggt 15000 gtgttccata ccgaatggct ggattaa 15027 <210> 15 <211> 11283 <212> DNA <213> Artificial Sequence <220> <223> example O15 rfb locus nucleotide sequence - O15-EPA production strain stLMTB11738 <400> 15 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcatgagcaa aactaaacta aatgttcttt accttgcaat aagtcagggt 1320 gccaattacc tactgccatt attaattttt ccttatcttg ttagagtcat tggtgtatcg 1380 aattttggtg atctgagttt ttcattgata actatacaag tgttgttaat ggttgttgaa 1440 tatggttttg gatatagtgg gacaagagaa atagcactaa ataacgataa aaaataccat 1500 tctgaatttt tttgcggtgt ggtgcttgct cgttttatat taatgctaat tgcagctata 1560 atactcataa tactctgttt tttttatgtt tttaacgacg ttaagtcttt gttatgtgtt 1620 ggttttctgt ccgtaattgc aggtgttttc aatccaaatt ggtttttgca aggtaaggaa 1680 atgatgagtg tgatggctgt gctgtcacta ttttcacgag gcatagcagt cgttgcagtt 1740 tatctaatta taaaacccgc aacgccgatg tacatcagtg ccttattatt gagcatgcca 1800 tatattttgt attcattctg tggcgttgcc tacttactta ttatcaagga gattttttta 1860 tgtaggccac cgataaagaa aattcaagta attttaaaaa atggatttca ttttttttgt 1920 tcaacacttg cgactagtgc atacacaatg ttgacccctc ttgtattggg tggcgtatct 1980 ggaaagtttg atgtaggcat ctttaactca gctaacatga tcaaacaagg tttggctgga 2040 cttgcatcac cattagtcca agctttttat ccaagaatta acattttgca aagagagaat 2100 ccatatattg caaacttaaa atctagaatg attcttaaat acttgcttgt tttttacatg 2160 gctttagcaa taccattttt actttttgcc aaccaattat cattattaat attcggcatg 2220 aaaggtgaag taattgcagg tgcaatgcaa ttaatgacat tgcttcctat attcataggt 2280 tttaatacag ttgtcgggtt acttgtatta gtacctaatg ggatgcaaaa acagtatttc 2340 aaatctattt tcctaggaac tattacttgt ttaagcatag tttatccagc atgtaaatat 2400 tatggagcaa cgggtgcgat tgtgagtctt attgtagctg aaattttcgt tggcatggga 2460 atgcttaaac aattcattaa agtaaataaa accgtatgta ggcctcataa attatgaata 2520 tctcggtaat aatatctgtt tggaaacgcc cagttcaatt agaattgatt ctctctgagc 2580 tcgattctca ggctaaagac aatagtctac acctagaagt aattgtttcc gatagtcata 2640 gtggtaaaga aattgatgat gtagttgctg ataatattca taaaaagaaa aatattaata 2700 ttatccatca acatactaaa aatatactct ccgctaagcg caatttcgga gcatccctag 2760 cccatgggga ttatttaata tttcttgatg atgattgtat acccgcaagt ggatatatat 2820 catcgttgct gaactattta aaaaaaatga atagtaaaag cgttttatgt ggggaagtta 2880 gattcgaaaa tgaactcatt gagaccagca attactatcg ctacaggaac tctttacacc 2940 ctaagtttag tgatagtcct gatatctcta tgaatgcctg gacttttgtc gcaatgaatt 3000 gtgttcttga tagaaaggca ttttcatcag gtatagtttc atataatgaa aattttattg 3060 gttatggttg tgaagatcat gagtttgggt ggcaacttga aaaaaatgac ttcaaaatta 3120 tttttgctga ttttaaaata ttacatcacg aatacagtgg cgatatagaa ggatatacaa 3180 aaaaaattcg tgctacagca cgtgatggta tgaatgtatt aagcaaagta aggcctgaaa 3240 tgttttctac taataaaaaa ttattcctag ttgagaaaat atttagtaaa cacaaaacgt 3300 ttagtaaaat atgccaatca atatttttca ataaatttat ttttaaaaaa ataatacaat 3360 ttttaaaaaa aacagatgca aataaaaaac tctatttccc aattctttac agatatgtgt 3420 tgatttcggc atatatacat ggtattggag agcgtggcac ctcaaaaaca gatgatttgc 3480 ttaagaactg gtatatatag atgatgctat cttcatttat taagacattt gtatggaagg 3540 taaaaaacaa tgaagtataa tgcattgatg gcttttttat tattttttgt tgtttttttt 3600 agattgtcgc tgataatacc tttcttatat ttggcattta ttcctgcatt ttttggtatt 3660 atgtatttag tgcgtaattt tatgattact atgggcaatg gattggtatc tatagatcgt 3720 aaaaatttgt tgctgttatc tatattcata attatttttt tattttgttt ggttttcgat 3780 ttgtttcaaa aaagccattc ttttcaaagt tattttaccg ttagattatt tatgttgttt 3840 ttattttcat ttgttcctgc gtattattta gtaaatagat tcataaaggg tgacttgaaa 3900 ttaatggagc gaatattagt gtattctctc tgggttcaaa tagttatttt ttttggtatg 3960 tatataagtc cagagttaaa aagattgtta tatactttct ttggtatgtc tgactctgtt 4020 aatctttggg aacaaaatgc taaagtaaga ggatttgggt tgtcgggtga aataaatttc 4080 atgacaccat ttttgatgat ctatatgtca ttttttatga tgaaaaggcg ttatgcttta 4140 attactttaa tttgtctgac tcaaatcgta aattctaaca tggctgtgat tgcagccatt 4200 attggtatcg gttgctctag acttaatatt aatataaaaa ttgcaacagt attgattttg 4260 ggagttttag tttatagctt aggagcggtg ttctttcctc gattttatga tgagttcgtt 4320 tctggagatg gcacaagaac tctggatatc ttattacagc aacatgtgtt tgttgtaggt 4380 aatttagatt tttttaatat tatatttgga ttacagcaaa acatatcttc atcaatcccc 4440 gatattaaac aaagttcgga tatgggctgg gttatactgt ttaattacgg tgggttaaca 4500 tttattacac tctttttatt tttaatcttt actatttcta ttgcgacatt tggaatgaca 4560 tatcaagcaa ttatatggat gttaattggg ataattttca ataccaaagg tttagtttta 4620 ggatctaacg gctatttctt tctatctttt atatatatgt ttttgaatag agtaacactt 4680 agtggacaga gttcaattac taataagtta ggtcaagtaa gtaaatagct tccagagtat 4740 atttgtcaat gatttgaggt tcggttatta tgttttcatc taaaacactg ttaattactg 4800 gtggtactgg ctctttcggg aatgctgtat taaatagatt tcttgataca gatattgcag 4860 aaatccgtat atttagtcgt gatgaaaaaa aacaagatga tatgcggaaa aaatacaata 4920 atcaaaaatt aaagttctat attggtgatg tcagagatta ccgtagtatt ttgaatgcga 4980 ctcgcggtgt tgattttata tatcatgcag cggcacttaa gcaagttcca tcatgtgaat 5040 ttcatcctat ggaagccgtt aaaactaata tccttggtac ggaaaatgtt cttgaagcag 5100 ctatagcgaa tgaagtgaag agggttgtat gcctaagtac tgataaagct gtatacccga 5160 ttaacgcaat gggtatttca aaagctatga tggaaaaggt catggtcgcg aaatcccgta 5220 atgttgatcg caataaaaca gtaatatgtg gtacccgtta tgggaatgtt atggcatctc 5280 gcggttcagt tattccatta tttgttgatc ttattagagc gggcaagcca ctcacaataa 5340 ctgatcctaa tatgacccgc tttatgatga ctcttgagga tgcggtagat ttagttcttt 5400 atgcgtttga acatggtaat aatggtgata tctttgtgca aaaagcacct gcagcaacta 5460 ttgacacatt agctattgct ttaaaggaat tactaaatgt tcctgaccat ccggtaaatg 5520 tcattggaac gcgtcatggc gagaaattat atgaagctct acttagtcgt gaggaaatga 5580 tcgctgctat agatatgggc gattattacc gtgtcccgcc agatcttcgt gaccttaatt 5640 atggcaaata tgttgagcaa ggtgatagcc gaatatctga aatagaagat tataactctc 5700 ataatactca acggttagat gttgaaggca tgaaagagct cttgctaaaa ttagccttta 5760 ttcgagcaat tcgtgctggt gaaaaatata atctggattc atgatatgaa aatattagtt 5820 actggtgcaa atggttttat tggtcgtaat ttatgtttga ggcttgagga acttggttat 5880 aaagatctta ttagaattga tcgagaatca acgaagcaag atcttgaaca aggcttacag 5940 gatgccgatt ttatttatca cttagctggt atcaatagac ctaagactga tgatgagttt 6000 atttctggaa acagtgattt aacaaagcat atagttgagt atctcctttc tattggtaag 6060 aatacaccaa ttatgctaag ttcttcgata caagctgaac ttaataatgc ttatggggtt 6120 agcaaagctg tagctgaaag ctatgtcgaa aaatatgctg ctgctagtgg ttcttcgtat 6180 tatattttca gatatccaaa cgtttttggt aaatggtgta agccaaacta taattctttt 6240 atagcaactt tttgctacaa tatttccaat gatattgaga ttactatcaa tgatgcagca 6300 gcgccagtca atctggtcta tattgatgat gtttgtactg atgctatagc tcttctctct 6360 gggacggttg aaagtggata taaagttgtt gcaccaattt attcaacaac agttggtgaa 6420 gttgcagaat taatttatag cttcaaaaat agccgttcca ccctgatcac agaggctgtc 6480 ggggcgggat ttacccgtgc attgtattct acatggctga gttatttacc agcagagaag 6540 tttgcgtaca aggtaccttt ttatggggat gcccgcggag tcttttgtga gatgttgaaa 6600 acgccttcag cggggcagtt ttcatttttt actgctcacc ctggtattac gcgtggcgga 6660 cattaccatc acagtaaaaa tgagaagttt ttggtcattc gaggtcaggc atgctttaaa 6720 tttgaacatg tgattaccgg tgagcgatat gaactgaaag tttcatcggg tgagtttaag 6780 attgttgaaa cagttcctgg ttggacacat gacattacaa atattggaac tgatgaatta 6840 atagtcatgc tctgggcaaa tgaaattttc aaccgtgatg agcccgatac tattgcgaga 6900 cctctataat gaaaaaatta aaagttatgt ctgttgttgg aacccgtcct gagattatcc 6960 gtttgtcgag ggttcttgct aagtttgatg aatactgcga gcatattatt gtccatactg 7020 gtcaaaatta tgattacgaa ttaaatgaag tgttcttcaa tgacttgggt gttcgaaaac 7080 ctgattattt tttaaatgca gcgggtaaaa atgcggcgga aaccattggt caggttatta 7140 ttaaggtaga tgaagtatta gaaatcgaaa aacctgaagc aatactggta ttgggcgata 7200 cgaattcatg tatttctgcc attccggcca aacgccgtaa agtgcctata tttcatatgg 7260 aagcaggtaa ccgttgtttc gatcaacgcg tgcctgaaga aaccaacaga cgtattgttg 7320 accatacggc tgatatcaat atgacctaca gtgatattgc tcgtgaatat ctcttggctg 7380 aaggtatccc agctgatcgg atcataaaaa ctggtagccc tatgtttgag gttctttcat 7440 attatatgcc ccaaattgat ggttcagatg tgctatcgcg tttgaatcta cagtctggtg 7500 agttttttgt agtaagtgcg catcgtgaag agaatgttga ttctccaaaa cagctcgtaa 7560 agcttgcgaa cattctaaat actgttgctg aaaaatataa tcttccagtt attgtctcca 7620 cacacccaag gacacgtaac cgaatccgtg agcaaggaat tgaatttcat tcaaatataa 7680 atctactgaa accattgggt ttccatgatt ataaccactt gcagaagaac tcacgagctg 7740 tgctttcaga tagcggtact atcactgaag agtcatccat catgaatttc ccagcggtaa 7800 acatccggga agcgcatgag cgtccggaag gctttgagga agcatccgtc atgatggtgg 7860 ggttagagtg tgaacgcgta ttacaagcgc tggatattct ggcaacacaa ccgcgaggtg 7920 aagtccgtct tttacgtcag gttagtgatt acagcatgcc aaatgtgtcg gataaagttg 7980 tcagaattgt tcactcttac acagattatg ttaagagagt cgtctggaaa gaatattgat 8040 gaaacttgct ttaatcatag atgattacct gcccaacagt actcgtgttg gtgcaaaaat 8100 gtttcatgaa cttgctcaag aatttatcca gcgtgggcac gatgttacgg taattactcc 8160 tggtacgggc atgcaagaag agatttcttt tgataccttt cagggggtaa aaacatggcg 8220 ttttaaaagc gggccgctca aggatgtaag taaaattcag cgagcggtca atgaaacgct 8280 tttgtcctat cgggcgtgga aagccatcaa aaaatgggta aaaaaagaga cctttgaggg 8340 ggtgatttat tattcacctt ccatattctg ggggccttta gttaaaaaaa ttaaagctcg 8400 ttgccaatgt cctgcttatc ttattttaag agatatgttt ccacaatggg taattgatgc 8460 aggaatgctt aatgctggtt ccccaataga acgctacttt cgtctttttg aaaaaatatc 8520 ttatcgtcag gcaaatcgta ttggacttat gtctgataag aatcttgatg tttttcggaa 8580 agataataaa ggctatccgt gcgaagtttt gcgtaattgg gcatccctaa caccaacgat 8640 catacccaag gattatatac cactacgtaa gcgacttggc ctagaggata aaaccatttt 8700 cttctatggt ggaaacatag gtcatgcaca ggacatgaca aacttgatgc gacttgtgag 8760 aaacatggca gcatatcctc aagctcattt cctatttatt ggccaggggg atgaagttga 8820 attaattaat tcattagcat ctgagtgggc attgacgaat ttcacctatt tgccctcggt 8880 taaccaagat gaatttaagt tcattttgtc ggaaatggat atcggcttgt tttctctttc 8940 cgctagacac tcttcccata attttcctgg taagttatta ggctatatgg ttcagtcgct 9000 acctatttta ggtagcgtaa atgccggaaa tgatttgctc gacattgtca atcaaaataa 9060 tgcgggatta atccatgtca atggtgagga cgataaatta tgtcaatctg cgctattaat 9120 gttgcatgat attgatgtgc gccggcaact tggttcgggg gcgaatatat tgttgaaaga 9180 acaattctcc gttgagtctg cggcacagac gatagaaatg aggttggagg catgcaatgc 9240 gattaattga taatgaccaa ctcgacgaat tatatgatca agccgggcaa tcggaacgtt 9300 tacgttccca ccttatgatg cacggctcgc atcaagaaaa ggtacagcgt ttacttattg 9360 cattagtaaa gggcagctat gttgaaccgc attatcacga acttcctcat cagtgggaaa 9420 tgttcattgt tatggagggg caacttcagg tttgtttgta tggtagaaat ggtgaggtta 9480 taaagcaatt tatagcagga gataatactg gaatgagcat tgtggagttt tctccgggcg 9540 atatacacag tgtcgaatgc ctatctccgc gtgctcttat ggtggaagtt aaggaggggc 9600 catttgaccc ttcttttgca aaatcgttcg tgtgagcggc cgcgagctcg tcgactcgag 9660 gatccgtgta ggctggagct gcttcgaagt tcctatactt tctagagaat aggaacttcg 9720 gaataggaac taaggaggat attcatatgg ataaagccgt aagcatataa gcatggataa 9780 gctatttata ctttaataag tactttgtat acttatttgc gaacattcca ggccgcgagc 9840 attcagcgcg gtgatcacac ctgacaggag tatgtaatgt ccaagcaaca gatcggcgta 9900 gtcggtatgg cagtgatggg acgcaacctt gcgctcaaca tcgaaagccg tggttatacc 9960 gtctctattt tcaaccgttc ccgtgagaag acggaagaag tgattgccga aaatccaggc 10020 aagaaactgg ttccttacta tacggtgaaa gagtttgtcg aatctctgga aacgcctcgt 10080 cgcatcctgt taatggtgaa agcaggtgca ggcacggatg ctgctattga ttccctcaaa 10140 ccatatctcg ataaaggaga catcatcatt gatggtggta acaccttctt ccaggacact 10200 attcgtcgta atcgtgagct ttcagcagag ggctttaact tcatcggtac cggtgtttct 10260 ggcggtgaag agggggcgct gaaaggtcct tctattatgc ctggtggcca gaaagaagcc 10320 tatgaattgg tagcaccgat cctgaccaaa atcgccgccg tagctgaaga cggtgaacca 10380 tgcgttacct atattggtgc cgatggcgca ggtcactatg tgaagatggt tcacaacggt 10440 attgaatacg gcgatatgca gctgattgct gaagcctatt ctctgcttaa aggtggcctg 10500 aacctcacca acgaagaact ggcgcagacc tttaccgagt ggaataacgg tgaactgagc 10560 agttacctga tcgacatcac caaagatatc ttcaccaaaa aagatgaaga cggtaactac 10620 ctggttgatg tgatcctgga tgaagcggct aacaaaggta ccggtaaatg gaccagccag 10680 agcgcgctgg atctcggcga accgctgtcg ctgattaccg agtctgtgtt tgcacgttat 10740 atctcttctc tgaaagatca gcgtgttgcc gcatctaaag ttctctctgg tccgcaagca 10800 cagccagcag gcgacaaggc tgagttcatc gaaaaagttc gtcgtgcgct gtatctgggc 10860 aaaatcgttt cttacgccca gggcttctct cagctgcgtg ctgcgtctga agagtacaac 10920 tgggatctga actacggcga aatcgcgaag attttccgtg ctggctgcat catccgtgcg 10980 cagttcctgc agaaaatcac cgatgcttat gccgaaaatc cacagatcgc taacctgttg 11040 ctggctccgt acttcaagca aattgccgat gactaccagc aggcgctgcg tgatgtcgtt 11100 gcttatgcag tacagaacgg tattccggtt ccgaccttct ccgcagcggt tgcctattac 11160 gacagctacc gtgctgctgt tctgcctgcg aacctgatcc aggcacagcg tgactatttt 11220 ggtgcgcata cttataagcg tattgataaa gaaggtgtgt tccataccga atggctggat 11280 taa 11283 <210> 16 <211> 13435 <212> DNA <213> Artificial Sequence <220> <223> example O16 rfb locus nucleotide sequence - O16-EPA production strain stLMTB11739 <400> 16 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320 cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380 aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440 atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500 cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560 accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620 gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680 gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740 acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800 cgcgcgtgga aacgtacata tggtttaccg acaattgtga ctaattgctc gaacaactat 1860 ggtccttatc atttcccgga aaagcttatt ccactggtta ttcttaatgc actggaaggt 1920 aaggcattac ctatttatgg caaaggagat cagatccgcg actggttgta tgttgaagat 1980 catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040 ggtgggcaca acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgctggat 2100 gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc tgatcgtccg 2160 ggacacgatc gccgctatgc tattgatgct gagaagattg gtcgcgcatt gggatggaaa 2220 ccacaggaaa cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca 2280 aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag 2340 ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400 agcgtgctct ggcacctttg ggtaatttga ttgcttttga tgttcactct actgattatt 2460 gcggtgattt tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggccggata 2520 ttattgtcaa tgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg 2580 cacaattaat taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag 2640 cctgggttat ccattactcg actgattacg tcttccctgg aaatggcgat atgccatggc 2700 tggagacgga tgcaaccgca ccactaaatg tttacggtga aaccaagtta gccggagaaa 2760 aagcgttaca ggaatattgc gcgaagcatc ttattttccg gaccagctgg gtctatgcag 2820 gaaaaggaaa taacttcgcc aaaacgatgt tacgtctggc aaaagagcgt gaagaattag 2880 cggttattaa cgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacag 2940 cacatgccat tcgtgtcgca ctgaataaac cggatgtcgc aggcttgtac catttggtag 3000 ccagtggtac cacaacctgg tacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060 caggcattcc ccttgcactc aacaagctca acgcagtacc aacaacagcc tatcctacac 3120 cagctcgtcg tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc 3180 ttgtcttgcc tgactggcag gttggcgtga aacgaatgct caatgaatta tttacgacta 3240 cagcaattta atagtttttg catcttgttc gtgatggtgg agcaagatga attaaaagga 3300 atgatgaaat gaaaatgcgt aaaggtatta ttttagcggg tggttctggt acacgtcttt 3360 atcctgtgac tatggctgtc agtaaacagc tattacctat ttatgataaa ccgatgatct 3420 attacccgct ctctacactg atgttggcgg gtattcgcga tattttgatt atcagtacac 3480 ctcaggatac tcctcgtttt caacaattgc tgggtgacgg tagccagtgg ggcctgaatc 3540 ttcagtacaa agtgcaacct agcccagatg gcctcgcgca ggcatttatc atcggtgaag 3600 agtttattgg tggtgatgat tgtgctttgg ttcttggtga taatatcttt tacggtcacg 3660 atctgccgaa gctaatggag gccgctgtta acaaagaaag tggtgcaacg gtatttgcct 3720 atcacgttaa tgatccagaa cgctatggtg tcgttgagtt tgataaaaac ggtacggcaa 3780 tcagtctgga agaaaaaccg ttagaaccaa agagtaatta cgccgttaca ggtctgtact 3840 tttatgataa cgacgtggtt cagatggcga aaaacttgaa gccgtctgca cgtggtgagt 3900 tagaaattac agatattaac cgtatttatc ttgagcaggg acgtctgtct gtcgcgatga 3960 tggggcgtgg ctacgcgtgg ctggacacgg ggactcatca gagtctgata gaagcaagta 4020 attttattgc gacaattgaa gagcgccagg gattgaaggt ttcctgtcct gaagagattg 4080 catttcgtaa aggttttatt gatgttgagc aagtaagaaa attagctgta ccactaataa 4140 agaataatta tgggcagtat ctttataaaa tgacgaagga ttcaaattaa tgaatgtgat 4200 tagaactgaa attgaagatg tgctaattct ggagccaaga gtatttggtg atgatagagg 4260 tttcttttat gagagcttta atcaatcagc atttgaacat attctaggct atccggtcag 4320 ctttgttcaa gacaatcact cacgttcatc aaaaaatgta ctcagaggcc ttcactttca 4380 acgcggcgag tacgcacaag ataaacttgt acgctgcact catggagcag tttttgatgt 4440 tgctgttgat attcgaccca attcggtatc ctttggtaaa tgggttggtg ttctgctttc 4500 agctgataat aagcagcagt tgtggatacc aaaagggttt gctcatggct ttttggttct 4560 gtctgatatc gctgaatttc aatataaaac tacaaactat tatcatcctg aaagcgattg 4620 tggaatatgt tggaatgatg aacgcattgc aattgattgg ccccaaacat cagggttaat 4680 cctttcgcca aaagatgaaa ggctctttac gttagatgag cttatcagat taaaattaat 4740 tgcatgaata cgaataaatt atctttaaga agaaacgtta tatatctggc tgtcgttcaa 4800 ggtagcaatt atcttttacc attgcttaca tttccatatc ttgtaagaac acttggtcct 4860 gaaaatttcg gtatattcgg tttttgccaa gcgactatgc tatatatgat aatgtttgtt 4920 gaatatggtt tcaatctcac agcaactcag agtattgcca aagcagcaga tagtaaagat 4980 aaagtaacgt ctattttttg ggcggtgata ttttcaaaaa tagttcttat cgtcattaca 5040 ttgattttct taacgtcgat gaccttgctt gttcctgaat ataacaagca tgccgtaatt 5100 atatggtcgt ttgttcctgc attagtcggg aatttaatct accctatctg gctgtttcag 5160 ggaaaagaaa aaatgaaatg gctgacttta agtagtattt tatcccgctt ggctattatc 5220 cctctaacat ttatttttgt gaacacaaag tcagatatag caattgccgg ttttattcag 5280 tcaagtgcaa atctggttgc tggaattatt gcactagcta tcgttgttca tgaaggttgg 5340 attggtaaag ttacgctatc attacataat gtgcgtcgat ctttagcaga cggttttcat 5400 gtttttattt ccacatctgc tattagttta tattctacgg gaatagttat tatcctggga 5460 tttatatctg gaccaacgtc cgtagggaat tttaatgcgg ccaatactat aagaaacgcg 5520 cttcaagggc tattaaatcc tatcacccaa gcaatatacc caagaatatc aagtacgctt 5580 gttcttaatc gtgtgaaggg tgtgatttta attaaaaaat cattgacctg cttgagtttg 5640 attggtggtg ctttttcatt aattctgctc ttgggtgcat ctatactagt aaaaataagt 5700 atagggccgg gatatgataa tgcagtgatt gtgctaatga ttatatcgcc tctgcctttt 5760 cttatttcat taagtaatgt ctatggcatt caagttatgc tgacccataa ttataagaaa 5820 gaattcagta agattttaat cgctgcgggt ttgttgagtt tgttgttgat ttttccgcta 5880 acaactcttt ttaaagagat tggtgcagca ataacattgc ttgcaacaga gtgcttagtt 5940 acgtcactca tgctgatgtt cgtaagaaat aataaattac tggtttgctg aggattttat 6000 gtacgattat atcattgttg gttctggttt gtttggtgcc gtttgtgcga atgagttaaa 6060 aaagctaaac aaaaaagttt tagtgattga gaaaagaaat catatcggtg gaaatgcgta 6120 cacagaggac tgtgagggta tccagattca taaatatggt gcacatattt ttcataccaa 6180 tgataaatat atatgggatt acgttaatga tttagtagaa tttaatcgtt ttactaattc 6240 tccactggcg atttataaag acaaattatt caaccttcct tttaatatga atactttcca 6300 ccaaatgtgg ggagttaaag atcctcaaga agctcaaaat atcattaatg ctcagaaaaa 6360 aaagtatggt gacaaggtac ctgaaaattt ggaggagcag gcgatttcat tagttgggga 6420 ggacttatac caagcattga taaagggtta tacggagaag cagtggggaa gaagtgcaaa 6480 agaattgcct gcatttatta ttaagcgaat cccagtgaga tttacgtttg ataacaatta 6540 tttttccgat cgctatcaag gtattccggt gggaggctac actaagctta ttgaaaaaat 6600 gcttgaaggt gtggacgtaa aattaggcat tgattttttg aaagacaaag attctctagc 6660 gagtaaagcc catagaatca tctacactgg acccattgat cagtacttcg actataggtt 6720 tggagcgtta gaatatcgct ctttaaaatt tgagacggaa cgccatgaat ttccaaactt 6780 ccaagggaat gcagtaataa atttcactga tgctaatgta ccatatacca gaataattga 6840 gcataaacat tttgactatg ttgagacaaa gcatacggtt gttacaaaag aatatccatt 6900 agagtggaaa gttggcgacg aaccctacta tccagttaat gataataaaa acatggagct 6960 ttttaagaaa tatagagagt tagctagcag agaagacaag gttatatttg gcgggcgttt 7020 ggccgagtat aaatattatg atatgcatca agtgatatct gccgctcttt atcaagtgaa 7080 aaatataatg agtacggatt aatgatctat cttgtaatta gtgtctttct cattacagca 7140 tttatctgtt tatatcttaa gaaggatata ttttatccag ccgtatgcgt taatatcatc 7200 ttcgcactgg tcttattggg atatgaaata acgtcagata tatatgcttt tcagttaaat 7260 gacgctacgt tgatttttct actttgcaat gttttgacat ttaccctgtc atgtttattg 7320 acggaaagtg tattagatct aaatatcaga aaagtcaata atgctattta tagcatacca 7380 tcgaagaaag tgcataatgt aggcttgtta gttatttctt tttcgatgat atatatatgc 7440 atgaggttaa gtaactacca gttcgggact agcttactta gctatatgaa tttgataaga 7500 gatgctgatg ttgaagacac atcaagaaat ttctcagcat acatgcagcc aatcattcta 7560 actacttttg ctttatttat ttggtctaaa aaatttacta atacaaaggt aagtaaaaca 7620 tttactttac ttgtttttat tgtattcatc tttgcaatta tactgaatac tggtaagcaa 7680 attgtcttta tggttatcat ctcttatgca ttcatcgtag gtgttaatag agtaaaacat 7740 tatgtttatc ttattacagc tgtaggtgtt ctattctcct tgtatatgct ctttttacgt 7800 ggactgcctg gggggatggc atattatcta tccatgtatt tggtcagccc tataatcgcg 7860 tttcaggagt tttattttca gcaagtatct aactctgcca gttctcatgt cttttggttt 7920 tttgaaaggc tgatggggct attaacaggt ggagtctcta tgtcgttgca taaagaattt 7980 gtgtgggtgg gtttgccaac aaatgtttat actgcttttt cggattatgt ttatatttcc 8040 gcggagctaa gctatttgat gatggttatt catggctgta tttcaggtgt tttatggaga 8100 ttgtctcgaa attacatatc tgtgaaaata ttttattcat attttattta taccttttct 8160 ttcatttttt atcatgaaag cttcatgact aatattagca gttggataca aataactctt 8220 tgtatcatag tattctctca atttcttaag gcccagaaaa taaagtgaaa atgtattttt 8280 tgaatgattt aaatttctct agacgcgatg ctggatttaa agcaagaaaa gatgcactgg 8340 acattgcttc agattatgaa aacatttctg ttgttaacat tcctctatgg ggtggagtag 8400 tccagagaat tattagttct gttaagctta gtacatttct ctgcggtctt gaaaataaag 8460 atgttttaat tttcaatttc ccgatggcca aaccattttg gcatatattg tcattctttc 8520 accgccttct aaaatttaga atagtacctc tgattcatga tattgatgaa ttaagaggag 8580 gagggggtag tgattctgtg cggcttgcta cctgtgatat ggtcataagt cacaatccac 8640 aaatgacaaa gtaccttagt aaatatatgt ctcaggataa aatcaaagac ataaaaatat 8700 ttgattacct cgtctcatct gatgtggagc atcgagatgt tacggataag caacgagggg 8760 tcatatatgc tggcaacctt tctaggcata aatgttcttt catatatact gaaggatgcg 8820 attttactct ctttggtgtc aactatgaaa ataaagataa tcctaaatat cttggaagtt 8880 ttgatgctca atctccggaa aagattaacc tcccaggcat gcaatttgga ctcatttggg 8940 atggagattc tgtcgaaacc tgtagtggtg cctttggcga ctatttaaag tttaataacc 9000 ctcataagac atctctttat ctttcaatgg aacttccagt atttatatgg gataaagccg 9060 cccttgcgga tttcattgta gataatagaa taggatatgc agtgggatca atcaaagaaa 9120 tgcaagagat tgttgactcc atgacaatag aaacttataa gcaaattagt gagaatacaa 9180 aaattatttc tcagaaaatt cgaacaggaa gttacttcag ggatgttctt gaagaggtga 9240 tcgatgatct taaaactcgc taaacgatat ggtctctgtg gttttattcg gcttgttaga 9300 gatgtcttat tgactcgtgt attttaccgg aactgtagaa ttattcgatt tccctgctat 9360 attcgcaatg atggtagcat taattttggt gaaaatttca caagtggagt cggtctcagg 9420 ctggatgcat ttggacgtgg cgtgattttt ttttccgata atgtgcaagt taacgactat 9480 gttcatatcg cctcaattga gagcgttacg ataggtcggg atacgcttat tgcaagtaaa 9540 gtatttatta ccgatcataa tcacggttcc tttaagcact ctgatccaat gagttcgcca 9600 aatatacctc cagacatgcg cacgttggaa tcttcagctg ttgtaattgg ccagagggtt 9660 tggttgggtg agaatgtgac ggttttgcct ggaacaatta ttggtaatgg agtcgtagtc 9720 ggcgccaatt ctgttgttag aggttctatt cccgaaaata ctgtcattgc gggagtacca 9780 gcaaaaatca taaagaaata caatcatgag accaaattat gggaaaaagc atagtcgttg 9840 tttctgcggt caattttacc actggcggtc catttaccat tttgaaaaaa tttttggcag 9900 caactaataa taaagaaaat gtcagtttta tcgcattagt ccattctgct aaagagttaa 9960 aagaaagtta tccatgggtt aaattcattg agtttcctga ggttaaaggg tcgtggctaa 10020 aacgtttgca ctttgaatat gtagtttgta aaaaactttc aaaagagctg aatgctacgc 10080 attggatttg tctgcatgat attacggcca atgtcgtcac taaaaaaaga tatgtgtatt 10140 gtcataaccc tgcccctttt tataaaggaa ttttattccg tgaaattctt atggagccta 10200 gctttttctt atttaaaatg ctatacgggc tgatatataa aataaacatt aaaaaaaata 10260 ctgcagtgtt tgttcaacaa ttctggatga aagaaaaatt tatcaagaaa tattctataa 10320 ataacatcat tgtcagtcgg ccagaaatta aattatctga taaaagccaa cttactgatg 10380 atgattctca atttaagaat aacccttctg agttgacaat attttaccct gctgttccac 10440 gagtatttaa aaattacgag cttattatta gtgcagcaag gaaattgaaa gaacaatcca 10500 atattaaatt tctgcttact atcagtggta cagaaaatgc gtatgcaaaa tatattatca 10560 gtcttgcaga aggactggat aatgttcatt tcctcgggta cttggataaa gaaaaaatcg 10620 atcattgtta taatatttca gatatagttt gttttccctc taggttagaa acatggggat 10680 tgccgttgtc tgaggctaaa gagcgaggta agtgggtatt agcatcagat ttcccattta 10740 ctagagaaac tcttggtagt tatgaaaaga aagctttttt tgattctaat aacgatgaca 10800 tgttagttaa acttattatt gacttcaaaa aaggtaacct caaaaaagat atctctgatg 10860 caaatttcat ttatcgtaat gaaaatgtat tagttgggtt tgatgaacta gttaatttta 10920 ttactgaaga acattgaaat ggtatatata ataatcgttt cccacggaca tgaagactac 10980 atcaaaaaat tactcgaaaa tcttaatgct gacgatgagc actacaagat tatcgtacgc 11040 gacaacaaag actctctatt attgaaacaa atatgccagc attatgcagg cctggactat 11100 attagtggag gtgtatacgg ctttggtcat aataataata ttgcggtggc gtatgtaaag 11160 gaaaaatata gacccgcaga tgatgattac attttgtttt tgaatcccga tatcatcatg 11220 aagcatgatg atttgctgac atatattaaa tatgtcgaaa gtaagcgtta tgcttttagt 11280 acattatgcc tgttccgaga tgaagcgaaa tctttacatg attattccgt aagaaaattt 11340 cctgtgcttt ctgattttat tgtgtcattt atgttaggga ttaataaaac aaaaattcct 11400 aaagaaagta tctattctga tacggttgtt gattggtgcg caggatcatt tatgctggta 11460 cgtttttcag attttgtgcg tgtaaatggc ttcgatcaag gttactttat gtactgtgaa 11520 gatattgacc tgtgcttgag gcttagcctg gctggtgtca gacttcatta tgttcccgct 11580 tttcatgcga tacattatgc tcatcatgac aatcgaagtt ttttttcaaa agccttcaga 11640 tggcacttaa aaagtacttt tagatattta gccagaaaac gtattttatc aaatcgcaac 11700 tttgatcgaa tttcatcagt ttttcacccg taagagctcg gtacccgggc ctagggtgta 11760 ggctggagct gcttcgaagt tcctatactt tctagagaat aggaacttcg gaataggaac 11820 taaggaggat attcatatcc gtcgacggcg gccgccctgc aggcatgcaa gcttgatcca 11880 tatggatcgc tagcttaatt aaataaagcc gtaagcatat aagcatggat aagctattta 11940 tactttaata agtactttgt atacttattt gcgaacattc caggccgcga gcattcagcg 12000 cggtgatcac acctgacagg agtatgtaat gtccaagcaa cagatcggcg tagtcggtat 12060 ggcagtgatg ggacgcaacc ttgcgctcaa catcgaaagc cgtggttata ccgtctctat 12120 tttcaaccgt tcccgtgaga agacggaaga agtgattgcc gaaaatccag gcaagaaact 12180 ggttccttac tatacggtga aagagtttgt cgaatctctg gaaacgcctc gtcgcatcct 12240 gttaatggtg aaagcaggtg caggcacgga tgctgctatt gattccctca aaccatatct 12300 cgataaagga gacatcatca ttgatggtgg taacaccttc ttccaggaca ctattcgtcg 12360 taatcgtgag ctttcagcag agggctttaa cttcatcggt acgggtgttt ctggcggtga 12420 agagggggcg ctgaaaggtc cttctattat gcctggtggc cagaaagaag cctatgaatt 12480 ggtagcaccg atcctgacca aaatcgccgc cgtagctgaa gacggtgaac catgcgttac 12540 ctatattggt gccgatggcg caggtcacta tgtgaagatg gttcacaacg gtattgaata 12600 cggcgatatg cagctgattg ctgaagccta ttctctgctt aaaggtggcc tgaacctcac 12660 caacgaagaa ctggcgcaga cctttaccga gtggaataac ggtgaactga gcagttacct 12720 gatcgacatc accaaagata tcttcaccaa aaaagatgaa gacggtaact acctggttga 12780 tgtgatcctg gatgaagcgg ctaacaaagg tacgggtaaa tggaccagcc agagcgcgct 12840 ggatctcggc gaaccgctgt cgctgattac cgagtctgtg tttgcacgtt atatctcttc 12900 tctgaaagat cagcgtgttg ccgcatctaa agttctctct ggtccgcaag cacagccagc 12960 aggcgacaag gctgagttca tcgaaaaagt tcgtcgtgcg ctgtatctgg gcaaaatcgt 13020 ttcttacgcc cagggcttct ctcagctgcg tgctgcgtct gaagagtaca actgggatct 13080 gaactacggc gaaatcgcga agattttccg tgctggctgc atcatccgtg cgcagttcct 13140 gcaaaaaatc accgatgctt atgccgaaaa tccacagatc gctaacctgt tgctggctcc 13200 gtacttcaag caaattgccg atgactacca gcaggcgctg cgtgatgtcg ttgcttatgc 13260 agtacagaac ggtattccgg ttccgacctt ctccgcagcg gttgcctatt acgacagcta 13320 ccgtgctgct gttctgcctg cgaacctgat ccaggcacag cgtgactatt ttggtgcgca 13380 tacttataag cgtattgata aagaaggtgt gttccatacc gaatggctgg attaa 13435 <210> 17 <211> 13228 <212> DNA <213> Artificial Sequence <220> <223> example O18A rfb locus nucleotide sequence - O18A-EPA production strain BVEC-L-00559 <400> 17 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320 cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380 aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440 atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500 cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560 accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620 gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680 gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740 acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800 cgcgcgtgga aacgtacata tggtttaccg acaattgtga ctaattgctc gaacaactat 1860 ggtccttatc atttcccgga aaagcttatt ccactggtta ttcttaatgc actggaaggt 1920 aaggcattac ctatttatgg caaaggagat cagatccgcg actggttgta tgttgaagat 1980 catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040 ggtgggcaca acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgctggat 2100 gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc tgatcgtccg 2160 ggacacgatc gccgctatgc tattgatgct gagaagattg gtcgcgcatt gggatggaaa 2220 ccacaggaaa cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca 2280 aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag 2340 ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400 agcgtgctct ggcacctttg ggtaatttga ttgcttttga tgttcactct actgattatt 2460 gcggtgattt tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggccggata 2520 ttattgtcaa tgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg 2580 cacaattaat taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag 2640 cctgggttat ccattactcg actgattacg tcttccctgg aaatggcgat atgccatggc 2700 tggagacgga tgcaaccgca ccactaaatg tttacggtga aaccaagtta gccggagaaa 2760 aagcgttaca ggaatattgc gcgaagcatc ttattttccg gaccagctgg gtctatgcag 2820 gaaaaggaaa taacttcgcc aaaacgatgt tacgtctggc aaaagagcgt gaagaattag 2880 cggttattaa cgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacag 2940 cacatgccat tcgtgtcgca ctgaataaac cggatgtcgc aggcttgtac catttggtag 3000 ccagtggtac cacaacctgg tacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060 caggcattcc ccttgcactc aacaagctca acgcagtacc aacaacagcc tatcctacac 3120 cagctcgtcg tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc 3180 ttgtcttgcc tgactggcag gttggcgtga aacgaatgct caatgaatta tttacgacta 3240 cagcaattta atagtttttg catcttgttc gtgatggtgg agcaagatga attaaaagga 3300 atgatgaaat gaaaatgcgt aaaggtatta ttttagcggg tggttctggt acacgtcttt 3360 atcctgtgac tatggctgtc agtaaacagc tattacctat ttatgataaa ccgatgatct 3420 attacccgct ctctacactg atgttggcgg gtattcgcga tattttgatt atcagtacac 3480 ctcaggatac tcctcgtttt caacaattgc tgggtgacgg tagccagtgg ggcctgaatc 3540 ttcagtacaa agtgcaacct agcccagatg gcctcgcgca ggcatttatc atcggtgaag 3600 agtttattgg tggtgatgat tgtgctttgg ttcttggtga taatatcttt tacggtcacg 3660 atctgccgaa gctaatggag gccgctgtta acaaagaaag tggtgcaacg gtatttgcct 3720 atcacgttaa tgatccagaa cgctatggtg tcgttgagtt tgataaaaac ggtacggcaa 3780 tcagtctgga agaaaaaccg ttagaaccaa agagtaatta cgccgttaca ggtctgtact 3840 tttatgataa cgacgtggtt cagatggcga aaaacttgaa gccgtctgca cgtggtgagt 3900 tagaaattac agatattaac cgtatttatc ttgagcaggg acgtctgtct gtcgcgatga 3960 tggggcgtgg ctacgcgtgg ctggacacgg ggactcatca gagtctgata gaagcaagta 4020 attttattgc gacaattgaa gagcgccagg gattgaaggt ttcctgtcct gaagagattg 4080 catttcgtaa aggttttatt gatgttgagc aagtaagaaa attagctgta ccactaataa 4140 agaataatta tgggcagtat ctttataaaa tgacgaagga ttcaaattaa tgaatgtgat 4200 tagaactgaa attgaagatg tgctaattct ggagccaaga gtatttggtg atgatagagg 4260 tttcttttat gagagcttta atcaatcagc atttgaacat attctaggct atccggtcag 4320 ctttgttcaa gacaatcact cacgttcatc aaaaaatgta ctcagaggcc ttcactttca 4380 acgcggcgag tacgcacaag ataaacttgt acgctgcact catggagcag tttttgatgt 4440 tgctgttgat attcgaccca attcggtatc ctttggtaaa tgggttggtg ttctgctttc 4500 agctgataat aagcagcagt tgtggatacc aaaagggttt gctcatggct ttttggttct 4560 gtctgatatc gctgaatttc aatataaaac tacaaactat tatcatcctg aaagcgattg 4620 tggaatatgt tggaatgatg aacgcattgc aattgattgg ccccaaacat cagggttaat 4680 cctttcgcca aaagatgaaa ggctctttac gttagatgag cttatcagat taaaattaat 4740 tgcatgaggc cggccttaag gaggactagt cccggcgcgc catgagttta atcaaaaaca 4800 gtttttggaa cctttgcggg tatgtacttc cagctattgt gacactacca gctttgggta 4860 ttatggggcg aaaattaggc ccagaattat ttggtgtatt cactttggca ttagctgttg 4920 tgggttatgc aagcattttt gatgcaggcc ttactcgcgc agtgatacga gaagtcgcaa 4980 ttgaaaaaga taatgaagaa aataagttga aaattatttc ttcagcgaca gttgtaatta 5040 tttatttgag tttggccgcc tcactcttat tatttttttt tagtggtcat atcgcattgc 5100 tactgaacat tagtgagact ttttttcata atgtaagtgt ctcgcttaaa attctcgcag 5160 catccatacc attatttttg attactcaaa tatggttgtc aattttagaa ggtgaagaaa 5220 gatttggttt acttaatatc tacaaatcaa ttacgggagt gatattagca atctcaccgg 5280 cattatttat acttattaaa ccctctttga tgtatgcgat aataggctta gttctagcaa 5340 ggtttttatg ttttattttg gcttttataa tttgtcacga taaagtgctt aaagctaaac 5400 taacaatcga tataccaaca attaaaagat tgtttatgtt cggtggttgg attacagtaa 5460 gtaatatcat cagccctgtg ctatcatatt ttgataggtt tattgtttca aatcaacttg 5520 gggctgctaa tgttgctttt tatactgcac catcagaaat tatttctcgg cttagtataa 5580 ttccaggtgc gttttcaaga gccttatttc caagattagc taatgcaaat aattccgctg 5640 aaagatataa aacgaaaaga ttaattacaa tttcactttt aataatcatc acccctattt 5700 tttgtattgg cgtgttattt tcagagaaga taatggtttt atggatgggg gcatcatttt 5760 ttggtgagcc tggtttggta ttatcaatat tactgattgg ctttattttt aatggattgg 5820 cacaagtacc atttgccagt attcaatccc gaggtcatgc taagataact gcatttgttc 5880 atctcttaga gttgtttcct tatttattac ttttatttta cctcataaaa gcacatgggg 5940 ttgttggcgc gggtattgcg tggtcagtga ggatgatagt agattatata gcattaagtc 6000 ttttggacgg taagtatatt aataaataaa attcaaaatg caagttaata actcatggct 6060 ttatttgggt aggtgacaat ttataatgat atatatatta actttaactc ttcttctagt 6120 tatagccata atgttttctc ttctcggcac aaaaagtagg atcacatctc cattaccttt 6180 gcatttttta ccatggttac taactttaat tgtcgggata agtaattacg atcaatttta 6240 cgagtttaat gaaagaagct tttactcttt gttgatttgg tttacagtta tttttatatt 6300 ttatttcata ggggaactgg ttaattataa acgtgaaaat ataaatgttt attatggtct 6360 ttcacatatt aaatatgaat gtaaaaaata ttggatcatt gtcatcccaa tttcattata 6420 taccattttc gaaatatata tggttggtat ggggggagca gatggattct ttctcaattt 6480 acgtcttgca aatacattgg agggctatac gggtaaaaaa tttatcttaa tgcctgctgt 6540 atatcctcta atgatggcta tgttcgcaat tgtttgtcta acaaaaactt ccaaattaaa 6600 taaatactcc atttatttct ggatgttttt gtattgtatt ggcacaatgg gaaaattttc 6660 aatattaacg ccaatattga catatttaat tatttatgac ttcaaacata gattaaaagt 6720 aaaaaaaaca ataaagttta cattgttgat aattatatta gctttaactt tgcattttac 6780 acgtatggct gagaatgacc actcaacatt tttatctatt ttagggctct atatttattc 6840 accaataatt gctttaggcc agttgaatga agtaaatagt agtcattttg gtgagtatac 6900 gtttagattc atatatgcta taactaataa aattggcctt attaaagaat tgccagtaaa 6960 tactattctt gactattcat acgttcctgt accaacaaat gtatatactg cacttcaacc 7020 attttaccag gattttggtt atactggcat catatttgga gcagtattat acggactaat 7080 atatgtgagt ttatacacgg ccggtgttcg tggaaataat acacaggcat tactgattta 7140 cgcattgttt tcagttagca gtgcaacggc tttcttcgct gaaacgctag taacgaattt 7200 agctggaaat gtgatgttag tattatgtac catcttacta tggcgattta cagtaatatg 7260 caaaccagta cagtaaccat tctaatggcc acctacaatg gcgaggcctt catcaaaaat 7320 cagattttgt cactacaaca acaaacattt tctaactggc ggttatttat tcaggatgat 7380 gggtctacag acaatactat atctataata aaaaacttcc aaaaatctga ctccagaatt 7440 cggctagttg atgataattt gaaaggtcaa ggtgcaggaa aaaatttttt atcgctgata 7500 aagtacagcg agacagatta tacaatttat tgtgaccaag atgatatttg gttagaaaac 7560 aaaatatttg aattagtaaa gtatgcaaat gaaattaaat tgaatgtatc agatgcgcct 7620 tcgctagttt atgctgatgg ctatgcttat atggatggtg agggtacaat cgatttttct 7680 gggatatcta acaatcatgc tgatcaatta aaggattttc ttttttttaa tggtggatac 7740 caaggatgtt ctattatgtt caatcgtgca atgaccaaat ttcttctgaa ttatcgagga 7800 tttgtatatc tacatgacga tatcacaaca ttagctgcat acgctcttgg taaagtttat 7860 tttctcccga aataccttat gttatataga cagcacacga atgcggtaac tggtatcaaa 7920 acattccgca atggattgac ttctaaattt aaatcaccag taaactatct tttatcacga 7980 aaacattatc aggtaaaaaa atcttttttt gaatgtaaca gctctatctt atcagagacg 8040 aataaaaaag tttttttgga ttttatttca ttttgtgaat caaataataa atttacagat 8100 ttttttaagt tatggcgagg tgggtttaga ttaaataaca gtagaactaa attattatta 8160 aaattcttaa tacggagaaa atttagcgaa tgatttcaat acttacacct acttttaatc 8220 ggcaacatac tttatcaagg ctattcaatt ctcttatatt acaaactgat aaagattttg 8280 agtggataat aattgatgat ggtagtatag atgcaacagc ggtacttgta gaagatttta 8340 gaaaaaaatg tgattttgac ttgatttatt gctatcagga aaataatggt aagcccatgg 8400 ctttaaacgc tggtgttaaa gcttgtagag gcgattatat ctttattgtt gacagtgatg 8460 atgcactaac tcccgatgcc ataaaattaa ttaaagaatc aatacatgat tgcttatctg 8520 agaaggaaag tttcagcgga gtcggtttta gaaaagcata tataaaaggg gggattattg 8580 gtaatgattt aaataattct tcagaacata tatactattt aaatgcgact gagattagca 8640 atttaataaa tggtgatgtt gcatattgtt ttaaaaaaga aagtttggta aaaaatccat 8700 tcccccgtat agaagatgaa aaatttgttc cagaattata tatttggaat aaaataactg 8760 acaaggcgaa gattcgattt aacataagca aagttatata tctttgtgag tatcttgatg 8820 atggtctttc taaaaatttc cataaccagc ttaaaaaata cccaaagggg tttaagattt 8880 attacaaaga tcaaagaaaa cgagagaaaa cttatataaa aaaaacaaag atgctaatta 8940 gatatttgca atgttgttat tatgagaaaa taaaatgaaa atactatttg tcattacagg 9000 tttaggcctt ggaggtgctg agaagcaggt ttgtctttta gctgataaat taagtttaag 9060 cgggcaccat gtaaagatta tttcacttgg acatatgtct aataataaag tctttcctag 9120 cgaaaataat gttaatgtca ttaatgtaaa tatgtcaaaa aacatttctg gagttataaa 9180 aggttgtgtc agaattagag atgttatagc taatttcaaa ccagacattg tacacagtca 9240 tatgtttcat gcaaacatta tcactagatt gtctgtaatt ggaatcaaaa acagacctgg 9300 tattatatca actgcacata ataaaaatga aggtgggtat ttcagaatgc tcacatatag 9360 aataaccgat tgtttaagtg attgttgtac aaatgttagc aaagaagcag tggatgagtt 9420 tttacggata aaagccttta atcccgctaa agcaattact atgtataatg ggatagatac 9480 caataaattt aaatttgatt tattggcaag gagggaaatt cgagacggta ttaatataaa 9540 aaatgatgat atattattac ttgctgcagg tcgtttaacg ttagctaaag attatcctaa 9600 tttattgaat gcaatgactc tgcttcctga acactttaaa cttattatta ttggtgatgg 9660 tgaattgcgt gacgaaatta atatgcttat aaaaaaattg caattatcta atagggtgtc 9720 cttgttggga gttaaaaaaa atattgctcc ctatttttct gcatgtgata tttttgttct 9780 ctcttctcgt tgggaaggat ttggattagt cgtggcagaa gctatgtcat gtgagcgaat 9840 tgttgttggc acggattcag ggggagtaag agaagttatt ggtgacgatg attttcttgt 9900 acccatatct gattcaacac aacttgcaag caaaattgaa aaattgtctt tgagccagat 9960 acgtgatcac attggttttc ggaatcgtga gcgtatttta aaaaatttct caatagatac 10020 tattattatg cagtggcaag aactctatgg aactataatt tgctcaaaac atgaaaggta 10080 gatttatatt tggaacgtgt cttttgtttg aatttaattc aatctcaatt gagatttttg 10140 tatttcaaaa ataccatcat agctaacgat gattggtatt tattttaaga tgctttctat 10200 aaatatattg acgtttttaa tgcgccgaaa cgattgggct gggaacagag aagtaaaact 10260 gttttgagaa tgaagagttt ttgagatgtt tatggatatt aaaaattgat ccagtgaatt 10320 aattatttat aataaatcaa gatttaatgt taataaatga taatcttttc tgacactcat 10380 attaattatg agtggtacgt ttggtaaacg gtaaactatt atatgacagc tagaacaact 10440 aaagttttgc acttacaatt actcccactc ttaagtggcg ttcaaagggt aacattaaac 10500 gaaattagtg cgttatatac tgattatgat tatacactag tttgctcaaa aaaaggtcca 10560 ctaacaaaag cattgctgga atatgatgtc gattgtcatt gtatccccga acttacgaga 10620 gaaattaccg taaagaatga ttttaaagca ttgttcaagc tttataagtt cataaaaaaa 10680 gaaaaatttg acattgtgca tacacattct tcaaaaacag gtattttggg gcgagttgct 10740 gccaaattag cacgtgttgg aaaggtgatc cacactgtac atggtttttc ttttccagcc 10800 gcatctagta aaaaaagtta ttacctttat tttttcatgg aatggatagc aaagttcttt 10860 acggataagt taatcgtctt gaatgtagat gatgaatata tagcaataaa caaattaaaa 10920 ttcaagcggg ataaagtttt tttaattcct aatggagtag acactgataa gttttctcct 10980 ttagaaaata aaatttatag tagcaccttg aatctagtaa tggttggtag attatccaag 11040 caaaaagatc ctgagacatt attgcttgct gttgaaaaac tgctgaatga aaatgttaat 11100 gttaagctga cacttgtagg agatggtgaa ctaaaagaac agttagaaag caggttcaaa 11160 cggcaagatg gacgtataat ttttcatgga tggtcagata acattgttaa tattttaaaa 11220 gttaatgatc tttttatatt accttctctt tgggagggta tgccattagc aattttagaa 11280 gcattgagct gtggacttcc atgtatagtc actaatattc caggtaataa tagcttaata 11340 gaagatggct ataatggttg tttgtttgaa attagagatt gtcagttatt atctcaaaaa 11400 atcatgtcat atgttggtaa gccagaactg attgcacagc aatctaccaa tgcacgatca 11460 tttattctga aaaattatgg attagttaaa agaaataata aggtcagaca gctatatgat 11520 aattaagagc tcggtacccg ggcctagggt gtaggctgga gctgcttcga agttcctata 11580 ctttctagag aataggaact tcggaatagg aactaaggag gatattcata tccgtcgacg 11640 gcggccgccc tgcaggcatg caagcttgat ccatatggat cgctagctta attaaataaa 11700 gccgtaagca tataagcatg gataagctat ttatacttta ataagtactt tgtatactta 11760 tttgcgaaca ttccaggccg cgagcattca gcgcggtgat cacacctgac aggagtatgt 11820 aatgtccaag caacagatcg gcgtagtcgg tatggcagtg atgggacgca accttgcgct 11880 caacatcgaa agccgtggtt ataccgtctc tattttcaac cgttcccgtg agaagacgga 11940 agaagtgatt gccgaaaatc caggcaagaa actggttcct tactatacgg tgaaagagtt 12000 tgtcgaatct ctggaaacgc ctcgtcgcat cctgttaatg gtgaaagcag gtgcaggcac 12060 ggatgctgct attgattccc tcaaaccata tctcgataaa ggagacatca tcattgatgg 12120 tggtaacacc ttcttccagg acactattcg tcgtaatcgt gagctttcag cagagggctt 12180 taacttcatc ggtaccggtg tttctggcgg tgaagagggg gcgctgaaag gtccttctat 12240 tatgcctggt ggccagaaag aagcctatga attggtagca ccgatcctga ccaaaatcgc 12300 cgccgtagct gaagacggtg aaccatgcgt tacctatatt ggtgccgatg gcgcaggtca 12360 ctatgtgaag atggttcaca acggtattga atacggcgat atgcagctga ttgctgaagc 12420 ctattctctg cttaaaggtg gcctgaacct caccaacgaa gaactggcgc agacctttac 12480 cgagtggaat aacggtgaac tgagcagtta cctgatcgac atcaccaaag atatcttcac 12540 caaaaaagat gaagacggta actacctggt tgatgtgatc ctggatgaag cggctaacaa 12600 aggtacgggt aaatggacca gccagagcgc gctggatctc ggcgaaccgc tgtcgctgat 12660 taccgagtct gtgtttgcac gttatatctc ttctctgaaa gatcagcgtg ttgccgcatc 12720 taaagttctc tctggtccgc aagcacagcc agcaggcgac aaggctgagt tcatcgaaaa 12780 agttcgtcgt gcgctgtatc tgggcaaaat cgtttcttac gcccagggct tctctcagct 12840 gcgtgctgcg tctgaagagt acaactggga tctgaactac ggcgaaatcg cgaagatttt 12900 ccgtgctggc tgcatcatcc gtgcgcagtt cctgcaaaaa atcaccgatg cttatgccga 12960 aaatccacag atcgctaacc tgttgctggc tccgtacttc aagcaaattg ccgatgacta 13020 ccagcaggcg ctgcgtgatg tcgttgctta tgcagtacag aacggtattc cggttccgac 13080 cttctccgca gcggttgcct attacgacag ctaccgtgct gctgttctgc ctgcgaacct 13140 gatccaggca cagcgtgact attttggtgc gcatacttat aagcgtattg ataaagaagg 13200 tgtgttccat accgaatggc tggattaa 13228 <210> 18 <211> 13554 <212> DNA <213> Artificial Sequence <220> <223> example O25B rfb locus nucleotide sequence - O25B-EPA production strain stGVXN4459 <400> 18 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcagtgaaga tacttgttac tggtggcgca ggatttattg gttctgctgt 1320 tgttcgtcac ataataaata atacgcaaga tagtgttgtt aatgtcgata aattaacata 1380 cgccggaaac ctggaatcac ttgcagatgt ttctgattct gaacgctatt tctttgaaca 1440 tgcggatatt tgtgatgcag ctgcaatggc acggattttt gctcagcatc agccggatgc 1500 agtgatgcac ctggcagctg aaagccatgt tgaccgttca attacaggcc ctgcggcatt 1560 tattgaaacc aatattgtgg gtacttatgt ccttttagaa gcggctcgga attattggtc 1620 tggtctggat gatgaaaaga aaaaaaactt ccgttttcat catatttcta ctgatgaggt 1680 gtatggtgac ttaccccatc cggatgaagt aaatagcaat gaaacgttgc cgctatttac 1740 ggaaacgaca gcatacgcgc caagtagtcc atattctgct tctaaagctt ccagcgatca 1800 tttggttcgc gcatggaaac gtacttatgg tttaccgacc attgtgacta attgctcgaa 1860 caactatggt ccttatcatt tcccggaaaa gcttattcca ctggttattc ttaattcact 1920 ggaaggtaag gcattaccta tttatggcaa aggagatcag atccgcgact ggttgtatgt 1980 agaggatcat gctcgagcgt tatataccgt cgtaaccgaa ggtaaagcgg gcgaaactta 2040 taacattggt ggacacaacg aaaagaaaaa catcgacgta gtgttcacta tttgtgattt 2100 gttggatgag atagtcccga aagagaaatc ttaccgcgag caaattactt atgttaccga 2160 tcgtccggga cacgatcgcc gttatgcgat tgatgctgag aagattggtc gcgaattggg 2220 atggaaacca caggaaacgt ttgagagtgg gattcgtaaa acggtggaat ggtacctgtc 2280 caatacaaaa tgggttgata atgtgaaaag tggtgcctat caatcgtgga ttgaacagaa 2340 ctatgagggc cgccagtaat gaatatcctc ctttttggca aaacagggca ggtaggttgg 2400 gaactacagc gtgctctggc acctctgggt aatttgattg ctcttgatgt tcactccact 2460 gattactgtg gtgattttag taatcctgaa ggtgtagctg aaaccgtaag aagcattcgg 2520 cctgatatta ttgtcaacgc agccgctcac accgcagtag acaaagcaga atcagaaccg 2580 aagtttgcac aattactgaa cgcgacgagt gtcgaagcga tcgcgaaagc agccaatgaa 2640 gtcggcgcct gggttattca ctactctact gactacgtat ttccggggac cggtgaaata 2700 ccatggcagg aggaggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagcg 2760 ggagaaaaag cattacaaga gcattgtgcg aagcacctta ttttccggac cagctgggtc 2820 tatgcaggta aaggaaataa cttcgccaaa acaatgttgc gtctggcaaa agagcgtgaa 2880 gaattagccg ttattaatga tcagtttggt gcgccaactg gcgcagagtt actggctgat 2940 tgtacggcac atgctattcg tgtggcactg aataaaccgg aagtcgcagg cttgtaccat 3000 ctggtagcta gtggtaccac aacgtggcac gattatgctg cgctggtttt tgaagaggcg 3060 cgcaaagcag gcattcccct tgcactcaac aagctcaacg cagtaccaac aacagcctat 3120 cctacaccag ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac 3180 tttgcgcttg tcttgcctga ctggcaggtt ggcgtgaaac gaatgcttaa cgaattattt 3240 acgactacag caatttaata gtttttgcat cttgttcgta atggtggagc aagatgtatt 3300 aaaaggaatg atgaaatgaa aacgcgtaaa ggtattattt tggcgggtgg ttctggtact 3360 cgtctttatc ctgtgacgat ggccgtcagt aaacagctgt taccgattta tgataaaccg 3420 atgatctatt acccgctctc tacactgatg ttagcgggta ttcgcgatat tctgattatc 3480 agtacaccac aggatactcc tcgttttcaa caactgctgg gtgacgggag ccagtggggc 3540 ctgaatcttc agtacaaagt gcaaccgagt ccggatggtc ttgcgcaggc gtttattatc 3600 ggtgaagagt ttattggtgg tgatgattgt gctttggtac ttggtgataa tatcttctac 3660 ggccacgacc tgccgaagtt aatggacgta gctgttaaca aagaaagtgg tgcaacggta 3720 tttgcctatc acgttaatga tcctgaacgt tatggtgtcg tggagtttga taataacggt 3780 actgcaatta gcctggaaga aaaaccgctg gaaccaaaaa gtaactatgc ggttactggg 3840 ctttatttct atgacaatga cgttgtggaa atggcgaaaa accttaagcc ttctgcccga 3900 ggtgaactgg aaattaccga tattaaccgt atttatatgg aacaaggacg tttgtctgtc 3960 gctatgatgg ggcgtggcta tgcatggctg gatacaggga cgcatcaaag tcttattgaa 4020 gcaagcaact tcattgccac cattgaagag cgccagggac taaaggtttc ctgtccggaa 4080 gaaattgctt atcgtaaagg gtttattgat gctgagcagg taaaagtatt agccgaaccg 4140 ttgaagaaaa atgcttatgg tcagtatctg ctcaaaatga ttaaaggtta ttaataagat 4200 gaacgtaatt aaaactgaaa ttcctgatgt gctgattttt gaaccaaaag tttttgggga 4260 tgaacgtggc ttcttttttg agagttttaa tcagaggatt tttgaagaag cagtaggtcg 4320 taaggttgag tttgttcagg ataaccattc taagtccagt aaaggtgttt tacgtggtct 4380 tcattatcag ttagaacctt atgctcaagg aaaactggtg cgctgtgttg ttggcgaggt 4440 ttttgatgtt gcggttgata ttcgtaaatc gtcacctaca tttgggaaat gggttggggt 4500 gaatttgtct gctgagaata agcgtcagtt gtggattcct gagggatttg cacatggttt 4560 tttggtgctg agtgatttag cagaagtttt atataaaacg aatcaatatt atgctccatc 4620 acatgaaaaa aatattatat ggaatgacct cttgcttaat attaaatggc cgagcacagc 4680 actgatcact ctgtctgata aggatgcaaa tggggaaaga tttgaactaa gtgagttttg 4740 aaatgtctct cttaaaacat agtatatgga atgttgcggg ctactttata ccaacattaa 4800 ttgcaattcc cgcctttgga ttaattgcga ggaaaattgg tgtagaacta tttggtttgt 4860 atacgttagc aatgattttt atagggtatg caagtatatt tgatgctggg ttaacaagag 4920 ctgttgtgcg tgaaatagca ttactaaaaa acagagtgga cgattgtaat acgataatag 4980 taacttctat tatcgctgtg atatttttag ggtttatcgg aggcggggga gtgtttctgc 5040 ttaaaggcga tattattgaa ctgttaaata tctcaccaat atattacgcc gattcgataa 5100 agtctctagt attattatca tctctgatac ctgtattctt agtcacgcaa atactattag 5160 cagagcttga gggtcgggaa tattttggga ttctaaatat acaaaaaagt gtagggaatt 5220 ctttaattgc agggttacct gcattatttg ttttaattaa tcaaacgctt ttttctgcaa 5280 ttattggtgt agcgattgca agagttatat gcttgtggtt aagctacatt atgagcaggg 5340 aaagaataac tatcgatatc tcattttttt caataactgt tttaaagcgg ttatttagat 5400 atggcgggtg ggtaactata agtaacataa tatctcctat attagcgagt atggatagat 5460 ttattctatc ccatatccag ggagcatcaa aaatatcatt ctatacagtc cctaatgagc 5520 tggtaactag gcttggaata gttccaggct ctcttgggaa agctgttttt ccaaaattaa 5580 gtcatgcaag gaattttaca gcgtcatatg cagagcaaaa aaaagcttat atattaatga 5640 ctgtcattgt aatgcctttg gttttatttg tatattatta cgcaaagttt attttaacat 5700 tgtggatggg ggctgagtat gcagggattt cggtcgaaat attacggatt atgcttatag 5760 ggtatatttt taactgttat tcacaaatct cttttgccaa catacaggcc tttggaaaag 5820 caaaatacac tgcatacatc catatgatgg aatttattcc ttatttgata atgttatata 5880 taatttcaaa ggaatatggg gttattggtg ttgcgtggtt atggacaatt cgagtaataa 5940 ttgatttttt gatgctttta tatatgagtt atcgttgtaa taatcttatg aaaaaagggt 6000 agcctgatga tatatattgt ggtattaaat tggaatgggg ctatagatac cattaattgt 6060 gttaaaagtt taatggattt aaatgttagc gattataaaa ttatcattgt tgataactgt 6120 tctatggata actcatatga tactataaaa gaaaatctta attcattata tattgctgat 6180 aaaagtatca ttgaggtgaa gtatgaggat agaaataaat ataaaacctt agaaaacgat 6240 aaaatcatat taatacaatc tccgcaaaat aatgggtacg caagtggtaa taatattggc 6300 atagagttcg ctcttaatca ggagaatatg aaatacgtct gggttctgaa taatgatact 6360 gaagtggata aagaggcttt aactcattta attagtaaat gtgattcaga taaaagtata 6420 gggatttgcg gttctcgttt agtctatttt gccgacagag agatgcagca aggactaggt 6480 ggggtgcata acaaatggtt atgcactaca aaaaattatg aaatgggaag attagtttcc 6540 aaaaaatatg atgatgaagt cattagtaat gatatagatt atataattgg cgcatcgatg 6600 tttttctcta gagaatgttt ggaaacagtt ggattgatga atgaagaata ttttttatac 6660 tatgaagagt tagatatttg cctcagagca aaagcaaaga actttaaatt aggtatttgc 6720 tcagaaagtt tggtttatca taaaataggt gcaagtactg atgggggaaa gagcatgatg 6780 gctgatcttt gctcaataaa aaataggctg gtcattacag aaaggtttta tccccaatat 6840 tattggacgg tatggttgtc actttttgtt gtagcattta accgtgctag aagaggtgag 6900 tttaataaga tgaaaagatg tttgaatgtt atgtttaact tcaaacgaaa caaaggtagc 6960 aaatgccatt agaatatgca cttaatcatg gtgttaataa atctatagtt tgatatgtta 7020 ttaaagggta tttaatgaaa gtggcttttt tatctgctta tgatccacta tctacatcca 7080 gttggtctgg cacaccttat tatatgctaa aggcattatc gaagagaaat atttccattg 7140 aaatattagg accggtaaat agctatatga tatacatgtt aaaagtatat aaattaatat 7200 taaggtgttt cggaaaagaa tatgattata gtcattcgaa gttgctttcc aggtattacg 7260 gtagaatatt cggtaggaaa ttaaaaaaaa ttgatggttt ggattttatt atcgcacctg 7320 caggttcctc acaaattgct tttttaaaaa caaccatacc aataatatat ctatcggata 7380 caacatatga tcaattaaaa agctattatc cgaatttaaa taaaaaaaca attataaatg 7440 atgaggatgc aagtttaatc gaacgcaagg ctattgaaaa agcaacagta gtatctttcc 7500 catctaaatg ggcaatggat ttttgcagga attattacag attagatttt gataaattag 7560 ttgaaatacc atggggggct aatttatttg atgatattca ctttgctaat aaaaatataa 7620 ttcaaaagaa tagttatact tgtcttttct tgggagttga ttgggaaaga aaaggtggga 7680 aaacagcctt gaaagcaatt gaatatgtaa ggcagttata tgggatcgat gttagactaa 7740 aaatttgtgg atgtactccg aatcaaaaga ttttacctac ttgggttgaa ttaattgata 7800 aagtagataa aaataacgtt gacgaatatc agaaattcat cgatgtgtta tctaacgctg 7860 atatacttct tttaccaacc attgctgaat gttatggaat ggtattttgt gaagctgctg 7920 cttttggatt gcctgttgtc gctacagata caggtggagt cagttctata gttatcaacg 7980 aaaggacggg gatattaatt aaagacccgt tagactataa gcactttgga aatgcaattc 8040 ataaaataat tagttccgta gagacttatc aaaactactc ccaaaacgca agaattagat 8100 ataataatat attgcattgg gacaattggg ctaaaaagat aattgagatt atgtatgagc 8160 ataagaatag aagaatcaaa tagcacaaaa agaattatat gtttatttat actttttctt 8220 gttttccctg attttttgtt ttatacatta ggggttgata attttagcat ttcaacgata 8280 atctcaatta cattgctttt tgttttttta agagctaaaa atatttgcaa agataatttt 8340 ctaataatag tagcgttatt catattgttg tgttttaact gtttgttaag tatgctattt 8400 aatattgaac aggctttaac atttaaagtt gtactttcaa tatatagcat cttaataatg 8460 gcatacgtct cctcttgtta tgcacagacg ttgtggttat gttctgaaga aatacttaag 8520 agatccgtct tttatttgtt cgcatttctt tgccttattg gcattataag tattctttta 8580 cagaagactg agattataca tgataaaagt atgattcttt ttcctgaacc atcagcattt 8640 gcattggttt ttatacctat cttttcattt tgtttatact atacaagagg gggggggcta 8700 ctattgctct atatattatc tttgggtatt gcgttaggta tccagaattt aacaatgttg 8760 gtaggcattg tgattagtgt ttttgtgatg aaaaaaataa ctataaggca aactattgtt 8820 atacttttgg gggcatggat tttttccatg atattaagtg atttagacat ttcttactat 8880 acatcgcggc ttgattttaa aaatactacg aacctatcag tgcttgtata tctttcagga 8940 attgaaagag ctttcttgaa ttttattaca agttatggtc ttggtattgg ttttcaacaa 9000 atgggagtga atggggagat aggaatatat caacaaattt tagctgaact tgatgcccct 9060 atgttaaata tatacgatgg ctcatttatt tcttctaagt taatatctga gtttggggtt 9120 attggtgcat taatgtgtat tttctatttt ttttattttt cccgatttta tctgcgtttc 9180 aaaaaaagta agagatattc accgcagtat attttagcat atagcttcta catgtgtttc 9240 ttcatccctc tttttatacg tggtgctggt tatataaacc cctatgtgtt tatgttattt 9300 tcatcaatat ttttgtgcaa atatcacgct aaaaatatct tgatgaaatc taatgtccag 9360 atagctatat aatagtagat tatattatca ttatcacgta aattacatat taatagcata 9420 tatgataact aggacataaa taatgtgcat taaaaaaaaa cttaagttaa ttaaacgata 9480 tggcctttat ggtggtctta ggcttcttaa agatatattc ttaacaaaat ttttattttg 9540 ttcaaatgtt aggattatta gatttccatg ttatattaga aaagatggaa gtgttagttt 9600 tggaaaaggt tttacatcag gtgtaggatt acgagttgat gcatttatgg atgccgtagt 9660 ttccattgga gaaaatgttc aaattaatga ctatgttcac atcgcggcta ttaataatgt 9720 cattattggt agagatacat taatagcaag taaagtattt attagtgatc ataatcatgg 9780 tattttttct aaatccgata tccatagttc accaactatt attccttcgt ctaggcccct 9840 tgaatctgca cctgtgtata ttggagagcg tgtgtggatt ggcgaaaatg tgacaatatt 9900 accaggtgcg tgtataggta atggtgtagt tattggcgca aacagtgttg ttcgtggtga 9960 gattcctaat aatgtgatca ttgctggtgt tccagctaaa attgttaaaa aatataacta 10020 tgagcgtatg caatgggaaa gaatatagtt gtaatatcgg ctgttaattt tacaaccgga 10080 ggccccttta ccgtactaaa aaatgtgctt acagcaacta aagatagagc cgaatgtaaa 10140 tttattgcac tggttcatag ctctgctgaa ctaatggaat tatttccgtg ggttgaattt 10200 atagagtatc cagaagtcaa gtcttcgtgg gttaaaagat tatatttcga atatataact 10260 tgcaatagat tatctaaggt gattaaggca actcattggg tatgcttaca tgatattaca 10320 gcaaatgtta gtgtacccta tagatttgtt tattgccaca atcctgcacc gttctataaa 10380 tatttaagct atcgagatat tataggagaa cctaaatttt atctttttta tcttttttat 10440 gggcttttat acaatatcaa tataaaaaag aacacagcag tttttgttca gcagcagtgg 10500 ctaaaaaaag aattcgaaaa aaaatataag ttaaagaatg ttgttgttag tcgccctgaa 10560 gatatttgcc cttttgaaag tgatggtttg gtaagaaata ataataaaaa ggatgtgagg 10620 atattttacc cagcagtgcc ccgtatattt aaaaactttg aagttatcat acgtgctgca 10680 caaatattac aagataaaaa tattcatttt tatcttactt ttgatggtac tgaaaataag 10740 tatgcaaaaa gaatatataa attagcttcc gaactgaaaa atgtacattt cctcggttac 10800 cttaatgcaa ccgagatggt taacttttat caagattcag atattatttg tttcccatcg 10860 aaactagaaa cgtggggatt accattatca gaagctaaaa catacaaaaa atggatattt 10920 gcggcagact taccttatgc tcatgaagtt ttatataact attcaaaaac tagatatttt 10980 ccatttgacg atgagaaaat acttgttcgc tacatattag agtacacaag taaaaatatg 11040 catgaagata taaaaaatag tagggtgaat tttaataatg atgcattgac tggttttgaa 11100 cagtttattg aatatatcct caaggggaac tgacgtggtt tatattataa tcgtttcaca 11160 tggccatgat gactatatag aaaatctttt attaaattta aagttgccct ctggaagatt 11220 taaaataata gttcgtgata acaaaagttc aatggtttta aaaaaaacat gcgaaaaaaa 11280 ttgcgtaacc tatttgcatg gagggcaata tggatttgga cataataata acatagcagt 11340 gtcatatata attaataact tcatgattat gaataatgat tattttctct ttcttaaccc 11400 cgatgtattc ataaccagtg aaagtttgat taattatgtt gattatataa ttagtaatga 11460 ttataagttt agcacattat gtctttatcg agattttact aaaagcaaac atgattattc 11520 aatacggagt tttccaactt tatatgattt tctttgttct tttttattgg gggtgaataa 11580 aagtaaaatt aagaaggaaa atatactttc tgatactgta gttgattggt gtgctggctc 11640 atttatgctt attcatgctt taagtttctt aaatgtgaat ggttttgatc aaaaatattt 11700 tatgtattgt gaagatattg acctttgtat gcgtttaaaa ttaagtggag tagatcttta 11760 ctatactccc cattttgatg ctattcatta tgcgcagcat gaaaatagaa gaatatttac 11820 taaagcattt cgatggcata taaggagtat tacgcgctac atattacgga aaccaattct 11880 ttcttataaa aactatagaa aaattacatc cgaactggta aagtgattaa ggatccgtgt 11940 aggctggagc tgcttcgaag ttcctatact ttctagagaa taggaacttc ggaataggaa 12000 ctaaggagga tattcatatg gataaagccg taagcatata agcatggata agctatttat 12060 actttaataa gtactttgta tacttatttg cgaacattcc aggccgcgag cattcagcgc 12120 ggtgatcaca cctgacagga gtatgtaatg tccaagcaac agatcggcgt agtcggtatg 12180 gcagtgatgg gacgcaacct tgcgctcaac atcgaaagcc gtggttatac cgtctctatt 12240 ttcaaccgtt cccgtgagaa gacggaagaa gtgattgccg aaaatccagg caagaaactg 12300 gttccttact atacggtgaa agagtttgtc gaatctctgg aaacgcctcg tcgcatcctg 12360 ttaatggtga aagcaggtgc aggcacggat gctgctattg attccctcaa accatatctc 12420 gataaaggag acatcatcat tgatggtggt aacaccttct tccaggacac tattcgtcgt 12480 aatcgtgagc tttcagcaga gggctttaac ttcatcggta ccggtgtttc tggcggtgaa 12540 gagggggcgc tgaaaggtcc ttctattatg cctggtggcc agaaagaagc ctatgaattg 12600 gtagcaccga tcctgaccaa aatcgccgcc gtagctgaag acggtgaacc atgcgttacc 12660 tatattggtg ccgatggcgc aggtcactat gtgaagatgg ttcacaacgg tattgaatac 12720 ggcgatatgc agctgattgc tgaagcctat tctctgctta aaggtggcct gaacctcacc 12780 aacgaagaac tggcgcagac ctttaccgag tggaataacg gtgaactgag cagttacctg 12840 atcgacatca ccaaagatat cttcaccaaa aaagatgaag acggtaacta cctggttgat 12900 gtgatcctgg atgaagcggc taacaaaggt accggtaaat ggaccagcca gagcgcgctg 12960 gatctcggcg aaccgctgtc gctgattacc gagtctgtgt ttgcacgtta tatctcttct 13020 ctgaaagatc agcgtgttgc cgcatctaaa gttctctctg gtccgcaagc acagccagca 13080 ggcgacaagg ctgagttcat cgaaaaagtt cgtcgtgcgc tgtatctggg caaaatcgtt 13140 tcttacgccc agggcttctc tcagctgcgt gctgcgtctg aagagtacaa ctgggatctg 13200 aactacggcg aaatcgcgaa gattttccgt gctggctgca tcatccgtgc gcagttcctg 13260 cagaaaatca ccgatgctta tgccgaaaat ccacagatcg ctaacctgtt gctggctccg 13320 tacttcaagc aaattgccga tgactaccag caggcgctgc gtgatgtcgt tgcttatgca 13380 gtacagaacg gtattccggt tccgaccttc tccgcagcgg ttgcctatta cgacagctac 13440 cgtgctgctg ttctgcctgc gaacctgatc caggcacagc gtgactattt tggtgcgcat 13500 acttataagc gtattgataa agaaggtgtg ttccataccg aatggctgga ttaa 13554 <210> 19 <211> 15197 <212> DNA <213> Artificial Sequence <220> <223> example O75 rfb locus nucleotide sequence - O75-EPA production strain stLMTB11737 <400> 19 atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60 actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120 gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180 aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240 gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300 aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360 attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420 gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480 caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540 gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600 cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660 atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720 gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780 tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840 ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900 tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960 gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020 tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080 aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140 taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200 ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260 aattaagcta gcagtgaaga tacttgttac tggtggcgca ggatttattg gttctgctgt 1320 tgttcgtcac ataataaata atacgcaaga tagtgttgtt aatgtcgata aattaacata 1380 cgccggaaac ctggaatcgc tcgctgaaat ttctgattct gaacgttatt catttgagca 1440 tgcagatatc tgcgatgccg aagcgatggc tcgtattttc gcacagcacc agccagacgc 1500 ggtgatgcac ctggcagcag agagccacgt tgaccgctca ataactggcc ctgcggcatt 1560 tattgaaacc aatattgtgg gtacttatgt tcttttagaa gcggcgcgca attattggtc 1620 tggtctggat gatgaaaaga aaaaaaactt ccgctttcat catatttcta ctgatgaggt 1680 gtatggtgac ttaccccatc cggatgaagt aaatagcaat gaaacgttgc cgctatttac 1740 ggaaatgaca gcatacgcgc caagtagtcc atattctgct tctaaagctt ccagcgatca 1800 tttggttcgc gcatggaaac gtacttatgg tttaccgacc attgtgacta attgctcgaa 1860 caactatggt ccttatcatt tcccggaaaa gcttattcca ctggttattc ttaatgcact 1920 ggaaggtaag gcattaccta tttatggcaa aggagatcag atccgcgact ggttgtatgt 1980 agaggatcat gctcgagcgt tatataccgt cgtaaccgaa ggtaaagcgg gcgaaactta 2040 taacattggt ggacacaacg aaaagaaaaa catcgacgta gtgttcacta tttgtgattt 2100 gttggatgag atagtcccga aagagaaatc ttatcgtgag caaattacct atgttgctga 2160 tcgcccaggg catgatcgcc gttatgcaat tgatgccgat aaaattagcc gcgaattggg 2220 ctggaaacca caggaaacgt ttgagagcgg gattcgtaaa actgtggaat ggtatctgtc 2280 caatacaaaa tgggttgata atgtgaaaag tggtgcctat caatcgtgga ttgaacagaa 2340 ctatgggggc cgccactaat gaatatcctc ctttttggca aaacagggca ggttggttgg 2400 gaactacagc gtgctctggc acctctgggt aatttgattg ctcttgatgt tcactccact 2460 gattactgtg gtgattttag taaccctgaa ggtgtggctg aaaccgttag aagcattcgg 2520 cctgatatta ttgtcaacgc agccgctcac accgcagtag acaaagcaga atcagaaccg 2580 gagtttgcac aattactgaa cgcgacgagt gtcgaagcga tcgcgaaagc agccaatgaa 2640 gtcggcgctt gggttattca ctactctact gactacgtat ttccggggac cggtgaaata 2700 ccatggcagg aggaggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagca 2760 ggagaaaaag cattacaaga gcattgtgcg aagcacctta ttttccggac cagctgggtc 2820 tatgcaggta aaggaaataa cttcgccaaa acgatgttgc gtctggcaaa agagcgtgaa 2880 gaattagccg ttattaatga tcagtttggt gcgccaactg gcgcagagtt gctggctgat 2940 tgtacggcac atgccattcg tgtggcactg aataaaccgg aagtcgcagg tttgtaccat 3000 ctggtagcca gtggtaccac aacctggcac gattatgctg cgctggtttt tgaagaggcg 3060 cgcaaagcag gcattcccct tgcactcaac aagctcaacg cagtaccaac aacagtctat 3120 cctacaccag ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac 3180 tttgcgcttg tcttgcctga ctggcaggtt ggtgtgaaac gcatgctcaa cgaattattt 3240 acgactacag caatttaata gtttttgcat cttgttcgtg atggtggaac aagatgaatt 3300 aaaaggaatg atggaatgaa tacgcgtaaa ggtattattt tagcgggtgg ttctggtaca 3360 cgtctttatc ctgtgactat ggctgtcagt aaacagctgt taccgattta tgataaaccg 3420 atgatctatt acccgctctc tacactgatg ttggcgggta ttcgcgatat tttgattatc 3480 agcacgccac aggatactcc tcgttttcaa caactgctgg gtgatgggag ccagtggggg 3540 ctaaatcttc actacaaagt gcaaccgagt ccggatggtc ttgcgcaggc atttatcatc 3600 ggtgaagagt ttatcggtgg tgatgattgt gctttggtac ttggtgataa tatcttctac 3660 ggtcacgacc tgcctaagtt aatggatgcc gctgttaaca aagaaagtgg tgcaacggta 3720 tttgcctatc acgttaatga tcctgaacgc tatggtgtcg ttgagtttga taaaaacggt 3780 actgcaatca gcctggaaga aaaaccgtta caaccaaaaa gtaattatgc ggtaaccggg 3840 ctttatttct atgataacta cgttgtggaa atggcgaaaa atcttaagcc ttctgcccgc 3900 ggtgaactgg aaattaccga tattaaccgt atctatatgg aacaggggca tttatctgtt 3960 gccatgatgg gacgtggata tgcctggctg gacacgggga cacatcaaag tcttattgaa 4020 gcaagcaact tcattgccac cattgaagag cgccagggct tgaaagtttc ctgcccggaa 4080 gaaattgctt accgtaaagg gtttattgat gctgagcagg tgaaagtatt agctaaaccg 4140 ctgaaaaaaa atgcttatgg tcagtatctg ctaaaaatga ttaaaggtta ttaataaaat 4200 gaatgttatt aaaacagaaa ttccagatgt actgattttt gaaccgaaag tttttggtga 4260 tgagcgtggt ttctttatgg aaagctttaa tcagaaagtt ttcgaagagg ctgtagggcg 4320 gaaggttgaa tttgttcagg ataatcattc taaatcgtgt aaaggtgtac ttagaggttt 4380 acactttcag cttcctccct ttgagcaggc aaaattagta aggtgtatag ttggcgaggt 4440 atttgatgtt gcagtagaca ttagacctaa ttctgaaaca tttggttcat gggttggagt 4500 aactctttcg tcagaaaata aaaggcagct atggattcca gaaggattcg cccatggttt 4560 tttaacttta agtgatattg cagagtttgt ttataaaact aacaactatt attctttaaa 4620 tcatgaaagg ggagtcattt ggaacgatga ggaaattaac attgcctggc cctctcaatc 4680 agagaagatt ctgtcacaga aagatattaa tttaccatca tttagatttg ttcaaatgtt 4740 tagcaagtag tgttatcttt acactgcaca tagtcatcat tttttatgct ttaagtaaat 4800 tatattgcac atctataaca caaagcgcaa taatatttcg acctgatgaa ggtttgtggt 4860 tatttatctt tctaggcgtt ttttatgact aaaatagttg tggtttctac agctccaata 4920 ttcccgacaa ataatgggta caaaagttct gtattaggaa gaattgatga gttattaaat 4980 gaggataatg aggtcgtttt gattgaaata aaccttgaaa atgttacgga aaagaaagat 5040 gaattaatac caacaagatt taataatatt caaagatatg aagtaaaaaa aatatctaga 5100 tcatttattg ccgagttaca aatattattt gatatcagaa ctcggtatga acaattattt 5160 tcttctgctg acattagaga taacataaaa aagataattg atttagaaaa accttctatt 5220 attattgctg agtctatatg ggcgttgcaa gcattgccta ttgaaattag tgcgagaata 5280 cactgtgtta ttcatgatgt ggcaactgat ttctttaaag aaatgtttgt atctcataat 5340 gaggttgtac gaaaaatttt gttttttaat gattacctaa agttgaaaat tactgaagaa 5400 aatattatca aacgtttgag agttgagcaa tttatctttc tgacagaaga agataaatgt 5460 tggtataaaa caagatacaa tattgatgag ggttgttgtt ccttagcgag caatcatctt 5520 tatgtagaaa agattaagag aactatcaat ttccaaaccc ctttcctgct tattcccggt 5580 agcattgaat tttcacaaaa tttttacggc ttaaattggt ttataaaaaa tatatatcct 5640 ggattaaata ggaaaataag aatagttgta acaggaaagg catcagataa aaaaataaag 5700 atgttaaact gtggagagga aattaccttt acgggagagc ttgacttttc cacatataat 5760 aaacttagct caacatgctt gtgtgttatt gcaccgatta caacgggcac tggaattaaa 5820 ataaaaatat tagaagctgt acaaaaaggt attcctgtac ttacaacaaa atttgcttca 5880 aaaggaatat gttccgattt atgtttttat tgcgaggagg atactgacac aaactttgtc 5940 aatttaatta acagttttct tgaaacgaca ttaagagtcc aagaatgaat ttattgcttt 6000 tttcagtcct tgcgtttggt ttaatattgg ctttggccca taataataaa agtggagata 6060 ttaacgcata cttaatgttt tttctcgtgg tcctaatggt attaatatca gggctgcgta 6120 tgaatgatag tgattatatc gaatacagga aaatgtataa tgaagtgcct attttatgtg 6180 actttagtct cgcatctata agagatatac atggggaggt aggctatcta ttcttatcat 6240 caatctttaa aactttatgc ttgccatttc aattatttct tttttttatt gcttttttat 6300 cactcctgct tacatatttt tcattcagaa aaataagttt aataccgata ctatcgttag 6360 ttttttattt aagccatgct tttatagtta gagatttgat tcaaattagg gcaggattag 6420 ctgttagcat atcattatat tcaataatta aatttaaagg aaataaaagt ataattacag 6480 gagttttatt tgcttctttg attcattctg gggcgcttat tattgctctt tgttatcctt 6540 ttttcaaaaa aaaatacata acattaaaaa tgatgttgtt tttattttta gtgtcaatta 6600 ttttttctta tttgaatggg cttaatttat cgatacaact cttatctcaa tatagtttgc 6660 ttccaactgc aatttcgaat tatgttggtt gggaagaata tgattatcgg gtgagtatat 6720 ttactaatcc ggtttttatt aaaggtgttt ttttaattgt cttaatgcac aaatatgtac 6780 tttcagatat taaaaatgag aaaattatag tgctttataa cttatatgtt ttaggtgtat 6840 tagctatggt tgcattgagt gggatggcta ttctttcagg ccgtctttca tcctttctga 6900 cactaggtga aagcatttta attgtatatg ctctgttcta caaaagaaat acacctctgg 6960 cgtttctaat tttttctttt ttaacaattg tgcaattagg atatgatcta tttatttcta 7020 atgtgcatcc tgagcttact ctgattatat ttgggtgaat ctaagtgaaa aataataaaa 7080 taggcatact tatctctaaa atacaaaatc ttggacctgt gaatgtagta cgaggattga 7140 taaaagaaaa taaaaaatat gcttttactg ttttttgttt aacaaatagc gtagataaaa 7200 atatatatga tgagttatgc tgtttaggag ccaaggttat attaatacca gatggtactt 7260 ggttcagcaa aattttattt gtgagaagtt ttttaaagga acatccacat aatatcttac 7320 attcacatgg gatcacggcc gatatgtttt cttactttct gaatggcgtg aaaatatcta 7380 ctattcacaa tagactagat gaggattata tcccattatt tggcgcggtt aaagggaatg 7440 ctatatatta tcttcatcgt tttatattac gaagatttaa tcatatcgtt gcttgctcag 7500 cagcggtcca atcaaaactg aaacaatcga aagtaaaaac taaaataacc accatccaga 7560 atgggattga tataactagg tttaagacac ttgagtctga taaaaaaaaa ttattgaggg 7620 aaaaacacgg atttgatagt gaaaaaagaa tatttatata ttgtggctcg ttatcattaa 7680 ggaaaaatat tgcttacctc ttggaacact tagccatcga agaaaatgat atatttttaa 7740 ttctaggtga tggtgaactt tttagatatt gtaaggataa atattctaaa gatttacggt 7800 atatatttat ggggaaagtt gaatgccctc ttgaatatta tcaattatca gatatttttg 7860 tttccgcttc tttatcggaa gggctcccct tggcactatt agaagctgcc tctactgggt 7920 gctatttata tgttagcgat atagagcccc atagagaaat tgcatctcta ttaggagagg 7980 aaaatatttc tatgtttaaa attaaggatg gatcatataa ttatttgcaa cctaaaataa 8040 aaaaagctga ctataacgct ctttctgacg ataaacttta caatatatcc gataaaaaaa 8100 tgtcaaatct ttatgacaaa ctttttgttt ctttattaga gcagaggcac taatataatg 8160 atttatgttt cggtaatttc tcatggtcat ttcaaaactc ttaaggaatt aggagcagta 8220 tcaaaattaa ataatcacag cagaattaaa gttatcatca aagataattt aggagagagc 8280 gagcttttgg atttttgtca ggaaaacaaa ataacttatt taaggtctaa agagaaaaaa 8340 ggatttggag agaataataa tgaagttttt tcctctatat cctccttaat tactaaggaa 8400 gatttttttg tggttatgaa tcctgatata tatattgagt gctctgatct attagatgtc 8460 gtagatgagt gtggttcagc gaatgttaat ctagcaacga taaatttata cagggatttt 8520 gataaaaaaa catatgataa ctcagtaagg aaatttccct cggcaattga tttttttatg 8580 tcatttttat ttaagaaaaa tgactgtgta gtaaataaga acaaaataac gaaaccaaca 8640 tatgttgatt gggctgcagg ttcttttcta atatttaatg ccttctttta ttcaaaactc 8700 aacggattca acgaaaagta ttttatgtat tgcgaagata ttgatatatg ttggcgagct 8760 aaaaaacact tcaatacttc agttttatac tatccatgct atgcagcaat tcatttggca 8820 caatttaaca atcgtaggat ttttagtaga catttcattt ggcatataaa aagtattatc 8880 ctttttttat tatataaaaa tggtatgctg cgttctagta agttgcttta atgctaatat 8940 tcttttaaga ggtgagaatg atacctgtta ttttggctgg tggttcggga agtcgcttgt 9000 ggccactttc acgagaaaag ttccccaagc agtttttaaa gttgactggc agtttgacaa 9060 tgttgcagtc aacattgtca cgtcttaata atttaaatgc tgatgattca atagttatat 9120 gcaacgaaga gcatagattt attgttgcag aacaattaag agagttaggc aaactttcaa 9180 ataacattat tcttgaaccc aaaggtcgta atacagcccc tgctataaca ctcgcagcat 9240 tagcagcaaa aagaaaattc gctgatgaag atccattgat tcttatttta gctgcagatc 9300 acaacatcca agacgaacat gttttctgtg aggcaattaa taaggcgtca tctttagcta 9360 gttatggaaa actagtgact tttggtatcg ttccattcaa acctgaaact gggtatggct 9420 atattcgtcg cggtgatgaa gtgcctgtag atgagcagca tgcggtggcc tttgaagtgg 9480 cgcagtttgt cgaaaaaccg aatctggaaa ccgcgcaggc ctatgtggca agcggcgaat 9540 attactggaa cagcggtatg ttcctgttcc gtgccggacg ctatctcgaa gaactgaaaa 9600 agtatcgtcc ggatattctc gatgcctgtg aaaaagcgat gagcgccgtc gatccggatc 9660 tcgattttat tcgtgtggat gaagaggcgt ttctcgcttg tccggaagag tcggtggatt 9720 acgcggtcat ggaatgcacg gcagatgccg ttgtggtgcc gatggatgcg ggctggagcg 9780 atgtcggttc ctggtcttca ttatgggaga tcagcgccca caccgccgag ggcaacgttt 9840 gccacggcga tgtgattaat cacaaaactg aaaacagcta tgtgtacgcc gaatctggcc 9900 tggtcaccac cgtcggggtg aaagatttgg tggtagtgca gaccaaagat gcagtgctga 9960 ttgccgaccg taatgcggtg caggatgtga agaaagtggt cgagcagatc aaagctgatg 10020 gtcgccatga gcatcgggtg catcgcgaag tgtatcgtcc gtggggcaaa tatgactcta 10080 tcgacgcggg cgaccgctac caggtgaaac gcatcaccgt gaaaccgggc gaaggtttgt 10140 cggtacagat gcattatcat cgcgcggaac actgggtggt tgtcgcggga acggcaaaag 10200 tcactatcaa cggtgatatc aaactgcttg gtgaaaacga gtccatttat attccgctgg 10260 gggcgatgca ctgcctggaa aacccgggga aaatagattt agaattaatt gaagttcgct 10320 ctggtgcata tcttgaagaa gatgatgtta ttagatgtta tgatcgctat ggacgaaagt 10380 aatatataat aattatttca gaattagaaa tgataattat aagttttcgt ctggataaac 10440 aatagatagt atgggttgga aaatatgagt tctttaactt gttttaaagc ttacgacatt 10500 cgcgggaaat taggtgaaga actgaatgaa gatatcgcct ggcgcattgg tcgcgcctat 10560 ggcgaatttc tcaaaccgaa aaccattgtg ttaggcggtg atgtccgtct caccagcgaa 10620 accttaaaac tggcgctggc aaaaggttta caggatgcgg gcgtcgatgt gctggatatt 10680 ggcatgtccg gcaccgaaga gatttatttc gccacgttcc atctcggcgt ggatggcggc 10740 attgaagtta ccgccagcca taatccgatg gattacaacg gcatgaagct ggtgcgcgaa 10800 ggggctcgcc cgatcagcgg tgataccgga ctgcgcgacg tccagcgtct ggcagaagct 10860 aacgactttc ctcccgtcga tgaaaccaaa cgcggtcgct atcagcaaat caatctgcgt 10920 gacgcttacg ttgatcacct gttcggttat atcaatgtca aaaaccttac gccgctcaag 10980 ctggtgatca actccgggaa tggcgcagcg ggtccggtgg tggacgctat cgaagcccgc 11040 tttaaagccc tcggcgcacc ggtggagtta atcaaagtgc ataacacgcc ggacggcaat 11100 ttccccaacg gtattcctaa cccgttgctg ccggaatgtc gcgacgacac ccgcaatgcg 11160 gtcatcaaac acggcgcgga tatgggcatt gcctttgatg gcgattttga ccgctgtttc 11220 ctgtttgacg aaaaagggca gtttattgag ggctactaca ttgtcggcct gctggcagaa 11280 gcgttcctcg aaaaaaatcc cggcgcgaag atcatccacg atccacgtct ctcctggaac 11340 accattgatg tggtgacggc cgcgggcggc acgccggtga tgtcgaaaac aggacacgcc 11400 tttattaaag aacgtatgcg caaggaagac gccatctacg gtggcgaaat gagcgctcac 11460 cattacttcc gcgatttcgc ttactgtgac agcggcatga tcccgtggct gctggtcgcc 11520 gaactggtgt gcctgaaagg aaaaacgctg ggcgaactgg tgcgcgaccg gatggcggcg 11580 tttccggcaa gcggtgagat caacagaaaa ctggcgcacc ctgttgaggc gattaaccgc 11640 gtggaacagc attttagccg tgaggtgctg gcggtggatc gcaccgatgg catcagcatg 11700 acctttgccg actggcgctt taacctgcgc tcttccaaca ccgaaccggt ggtgcgcctg 11760 aatgtggaat ctcgcggtga tgttcaggtt atggtaatcc atactcaaga aatattatca 11820 attttgacgt cataaagaat aagccctgac aagttagggc ttaattaata tatatttttt 11880 ttgaattggg gatttgtggt aagattttta atatgttatt taatgtggtt gaattaatgt 11940 tgactggaaa ataataatga gaacgaaaaa agcattacac aactttaaag ttgatttatt 12000 aattactttt ttattggttt tgctagggtt ttatattcga actgtttttg tttcaaaaat 12060 gggaagtgat attactggag tgatgttact attcacacag ttgacagcat atctcaattt 12120 ggcagaatta ggtattggaa ttgcagctgc cagcgtatta tataaaccgc tcagcgagaa 12180 tgaatacaat aaaataactt acataatatc tttgctctca gtcatataca aatatatatt 12240 tgtgtttgtt ttgattcttg gcgttgttat aggtatctgt atttattact ttattgattc 12300 tgtaaaggtt gtaaatggcg tttttttata ttgggctttg ttcgttttta atacatcgtt 12360 gacatatagt tatgctaaat actccacatt attaactgct aatcagcggt actcagcagt 12420 aagaaaaatt caaggtggcg gaaaagttat aataattgta tttcagatat taattttgtg 12480 ctttacgcaa agtttcatac tttatttgtt agttgagact ttaggtattt tttctcaata 12540 tttgattttt aaaaaaataa ttgggaacgg aaatcaatat ctcagtaatg aggttttact 12600 tattgaaagc gataaacttt tgataaaaaa agaattaaaa ataagaataa aaaatatgtt 12660 cttccataaa ataggtgctg tgcttgtcct taatacagac tacctgcttg tatcaaagtt 12720 tctgacatta agttatgtga caatttttgg cagctatatg atggtatttc agatagtaac 12780 tgttttgatg tcaagttttg ttaatgctat tactgcagga atgggtaatt acttaattaa 12840 taaaagtaat ttagaaatta aggaaattac acgtcaattt tatgtgatat ttatcgcctt 12900 tgcaacattc atatcactaa atatgttttt tcttgttaat gattttatcg caaaatggat 12960 aggtgttaat tatacattaa gtaacaccct agttgcatta atgattgtta acgtattcat 13020 tagtgttgtc agggtacctt ctgatatatt aaaaaacgca agtggacatt ttggtgatat 13080 ttattatcca ttattagaag gtgtgctgaa tattacgata tccatcattt tggctatcat 13140 tattggatta cctggcatta ttatagggac aatagtatct aacttaatag taataatgct 13200 tgcgaaacca ttatatcttt actctaagtt atttaatctt agaaatccga cgagggttta 13260 ttttgaattt atttctcggc ctatgttata ttcattatgt gtgattgggg tgagctattt 13320 attgcgcgat gaaatatatt catttaaagt aagtacatgg ttggatttta ttaacaagct 13380 actcttagtc tctactccta gcatattggt aatatgtgct attttctcta cggatagtga 13440 ctttagatta tttttcagaa aaattatata tgtgattatg aagaaataaa aatttcgaaa 13500 atgtattaat cgaaattatg caacgagctt tatttttata aatgatatgt gatcttttcg 13560 cgaataggag taaggatccg tgtaggctgg agctgcttcg aagttcctat actttctaga 13620 gaataggaac ttcggaatag gaactaagga ggatattcat atggataaag ccgtaagcat 13680 ataagcatgg ataagctatt tatactttaa taagtacttt gtatacttat ttgcgaacat 13740 tccaggccgc gagcattcag cgcggtgatc acacctgaca ggagtatgta atgtccaagc 13800 aacagatcgg cgtagtcggt atggcagtga tgggacgcaa ccttgcgctc aacatcgaaa 13860 gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa gaagtgattg 13920 ccgaaaatcc aggcaagaaa ctggttcctt actatacggt gaaagagttt gtcgaatctc 13980 tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg gatgctgcta 14040 ttgattccct caaaccatat ctcgataaag gagacatcat cattgatggt ggtaacacct 14100 tcttccagga cactattcgt cgtaatcgtg agctttcagc agagggcttt aacttcatcg 14160 gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg tccttctatt atgcctggtg 14220 gccagaaaga agcctatgaa ttggtagcac cgatcctgac caaaatcgcc gccgtagctg 14280 aagacggtga accatgcgtt acctatattg gtgccgatgg cgcaggtcac tatgtgaaga 14340 tggttcacaa cggtattgaa tacggcgata tgcagctgat tgctgaagcc tattctctgc 14400 ttaaaggtgg cctgaacctc accaacgaag aactggcgca gacctttacc gagtggaata 14460 acggtgaact gagcagttac ctgatcgaca tcaccaaaga tatcttcacc aaaaaagatg 14520 aagacggtaa ctacctggtt gatgtgatcc tggatgaagc ggctaacaaa ggtaccggta 14580 aatggaccag ccagagcgcg ctggatctcg gcgaaccgct gtcgctgatt accgagtctg 14640 tgtttgcacg ttatatctct tctctgaaag atcagcgtgt tgccgcatct aaagttctct 14700 ctggtccgca agcacagcca gcaggcgaca aggctgagtt catcgaaaaa gttcgtcgtg 14760 cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg cgtgctgcgt 14820 ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc cgtgctggct 14880 gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa aatccacaga 14940 tcgctaacct gttgctggct ccgtacttca agcaaattgc cgatgactac cagcaggcgc 15000 tgcgtgatgt cgttgcttat gcagtacaga acggtattcc ggttccgacc ttctccgcag 15060 cggttgccta ttacgacagc taccgtgctg ctgttctgcc tgcgaacctg atccaggcac 15120 agcgtgacta ttttggtgcg catacttata agcgtattga taaagaaggt gtgttccata 15180 ccgaatggct ggattaa 15197

Claims

담체 단백질에 공유 결합된 대장균 O_x 항원 다당류의 바이오컨쥬게이트를 제조하는 방법으로서, 상기 방법은
(i) a. O_x-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. 글리코실화 컨센서스 서열 Asn-X-Ser(Thr) (여기에서, X는 Pro를 제외한 임의의 아미노산임) (SEQ ID NO: 1), 또는 글리코실화 컨센서스 서열 Asp(Glu)-X-Asn-Z-Ser(Thr) (여기에서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨) (SEQ ID NO: 2)을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglB_y를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 원핵 숙주 세포를 제공하는 단계; 및
(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 원핵 숙주 세포를 배양하는 단계를 포함하며,
여기에서 O_x-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이고,
O_x-항원이 O1A 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
O_x-항원이 글루코실화된 O4 항원 다당류인 경우, PglB_y는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 원핵 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
O_x-항원이 O6A 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
O_x-항원이 O15 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
O_x-항원이 O16 항원 다당류인 경우, PglB_y는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며;
O_x-항원이 O75 항원 다당류인 경우, PglB_y는 N311V의 아미노산 돌연변이를 포함하며,
여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,
여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 각각 화학식
(O1A)
;
(O4-Glc+)
;
(O6A)
;
(O15)
;
(016)
; 및
(O75)
의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100의 정수인, 방법.
제1항에 있어서, 각각의 n은 독립적으로 7 내지 25의 정수인, 방법.
제1항에 있어서, O_x-항원이 글루코실화된 O4 항원 다당류이며, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PdlB와 비교해 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하는, 방법.
제3항에 있어서, 재조합 원핵 숙주 세포가 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하는, 방법.
담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하는 방법으로서, 상기 방법은
(i) a. O_x-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. 글리코실화 컨센서스 서열 Asn-X-Ser(Thr) (여기에서, X는 Pro를 제외한 임의의 아미노산임) (SEQ ID NO: 1), 또는 글리코실화 컨센서스 서열 Asp(Glu)-X-Asn-Z-Ser(Thr) (여기에서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨) (SEQ ID NO: 2)을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglB_y를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 원핵 숙주 세포를 제공하는 단계; 및
(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 원핵 숙주 세포를 배양하는 단계를 포함하며,
여기에서 PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하며,
여기에서 O_x-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이며,
O_x-항원이 글루코실화된 O4 항원 다당류인 경우, 재조합 원핵 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며,
여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 각각
화학식
(O1A)
;
(O4-Glc+)
;
(O6A)
;
(O15)
;
(O16)
; 및
(O75)
의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100의 정수인, 방법.
제5항에 있어서, 각각의 n은 독립적으로 7 내지 25의 정수인, 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 재조합 원핵 숙주 세포로부터 바이오컨쥬게이트를 분리하는 단계를 추가로 포함하는 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 담체 단백질이 탈독소화된 P. 애루기노사(P. aeruginosa)의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스(S. aureus)의 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D로 구성된 군으로부터 선택되는, 방법.
제8항에 있어서, 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)인, 방법.
제9항에 있어서, EPA 담체 단백질은 SEQ ID NO: 3을 포함하는, 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 재조합 원핵 숙주 세포가 대장균 세포, 대장균 K-12 균주, 또는 균주 W3110인, 방법.
담체 단백질에 공유 결합된 대장균 O_x 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 재조합 원핵 숙주 세포로서, 상기 재조합 원핵 숙주 세포가
a. O_x-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. 글리코실화 컨센서스 서열 Asn-X-Ser(Thr) (여기에서, X는 Pro를 제외한 임의의 아미노산임) (SEQ ID NO: 1), 또는 글리코실화 컨센서스 서열 Asp(Glu)-X-Asn-Z-Ser(Thr) (여기에서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨) (SEQ ID NO: 2)을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglB_y를 인코딩하는 뉴클레오티드 서열을 포함하며,
여기에서 O_x-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이고,
O_x-항원이 O1A 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
O_x-항원이 글루코실화된 O4 항원 다당류인 경우, PglB_y는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 원핵 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
O_x-항원이 O6A 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
O_x-항원이 O15 항원 다당류인 경우, PglB_y는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
O_x-항원이 O16 항원 다당류인 경우, PglB_y는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며;
O_x-항원이 O75 항원 다당류인 경우, PglB_y는 N311V의 아미노산 돌연변이를 포함하며,
여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,
여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 각각 화학식
(O1A)
;
(O4-Glc+)
;
(O6A)
;
(O15)
;
(016)
; 및
(O75)
의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100의 정수인, 재조합 원핵 숙주 세포.
제12항에 있어서, 각각의 n은 독립적으로 7 내지 25의 정수인, 재조합 원핵 숙주 세포.
제12항에 있어서, O_x-항원이 글루코실화된 O4 항원 다당류고, PglB_y는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PdlB와 비교해 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하는, 재조합 원핵 숙주 세포.
제14항에 있어서, 재조합 원핵 숙주 세포가 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하는, 재조합 원핵 숙주 세포.
제12항 내지 제15항 중 어느 한 항에 있어서, 담체 단백질이 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스의 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택되는, 재조합 원핵 숙주 세포.
제16항에 있어서, 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)인, 재조합 원핵 숙주 세포.
제17항에 있어서, EPA 담체 단백질은 SEQ ID NO: 3을 포함하는, 재조합 원핵 숙주 세포.
제12항 내지 제15항 중 어느 한 항에 있어서, 재조합 원핵 숙주 세포가 대장균 세포, 대장균 K-12 균주, 또는 균주 W3110인, 재조합 원핵 숙주 세포.