KR20230112679A

KR20230112679A - 아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균

Info

Publication number: KR20230112679A
Application number: KR1020237021062A
Authority: KR
Inventors: 티나 코게이; 그레고르 코섹; 스테판 푸이스; 마르코 블라지크; 야카 호르바트
Original assignee: 에이시에스 바이오 디.오.오.
Priority date: 2020-11-26
Filing date: 2021-11-26
Publication date: 2023-07-27
Also published as: CA3199885A1; US20240018559A1; EP4006139A1; JP2023550969A; EP4251745A1; CN116745410A; WO2022112509A1

Abstract

본 발명은 일반적으로 생물공학에 관한 것으로, 구체적으로 아이소프레노이드 측쇄가 있는 사이토키닌(아이소프레노이드 사이토키닌)을 생산할 수 있는 유전자 조작된 세균 및 이의 제조 및 적용에 관한 것이다.

Description

아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균

사이토키닌은 종자 발아에서부터 식물 및 잎 노화에 이르기까지 수많은 식물 성장 및 발달 과정을 제어하는 필수적인 식물 호르몬으로, 세포 분열 유도 능력을 특징으로 한다(Mok, Martin, and Mok 2000). 자연적으로 발생하는 사이토키닌은 방향족 측쇄(방향족 사이토키닌) 또는 아데닌의 N ⁶ -말단에 아이소프렌-유래 측쇄(아이소프레노이드 사이토키닌)가 있는 아데닌 유도체이다. N ⁶ -측쇄 구조 및 구성은 사이토키닌의 유형 및 활성 모두를 결정한다. 아이소프레노이드 사이토키닌은 광범위하며 자연적으로 식물 및 조류에서 생산되고 많은 종의 세균, 진균, 선충 및 기생성 곤충에서도 생산된다(Stirk and van Staden 2010). 천연 아이소프레노이드 사이토키닌은 N ⁶ -(D2-아이소펜테닐)아데닌[N ⁶ -(D2-isopentenyl)adenine: iP], 트랜스-제아틴(trans-zeatin: tZ), 시스-제아틴(cis-zeatin: cZ) 및 다이하이드로제아틴(dihydrozeatin: DZ)이다(도 1).

아이소프레노이드 사이토키닌은 아데닌 또는 아데노신의 유도체로서, 6번 위치의 고리 외 아미노기가 다이메틸알릴 측쇄의 부착으로 변형되어 모 화합물인 N ⁶ -(D2-아이소펜테닐)아데닌(iP) 및 이의 리보사이드인 N ⁶ -(D2-아이소펜테닐)아데노신(iPR)이 생성된다. 다이메틸알릴 측쇄는 9' 위치에서 수산화되어 트랜스-제아틴(tZ) 또는 이의 리보사이드인 트랜스-리보실제아틴(tZR)을 생성할 수 있다. 또한, 고리 외 이중 결합은 환원되어 다이하이드로제아틴(DZ) 또는 이의 리보사이드인 리보실 다이하이드로제아틴(DZR)을 생성할 수 있다(도 1). iP, iPR, tZ, tZR, DZ 및 DZR의 여섯 가지 화합물 모두 생물학적으로 활성이 있으며 자연적으로 발생한다.

자연적으로 발생하는 사이토키닌의 대부분은 유리 염기, 리보사이드 및 뉴클레오타이드, 또는 글루코스, 자일로스 또는 아미노산 잔기와의 접합체와 같은 독특한 구조적 유도체 또는 형태로 존재한다. 식물에서, 사이토키닌 유리 염기는 가장 생물학적으로 활성이 있는 형태로 간주되며, 글루코스 접합체는 글리코실화 위치에 따라 영구적으로 비활성이거나 가역적 저장 형태로 간주된다.

제아틴은 식물에서 사이토키닌의 주요 형태이다. 제아틴은 아데닌의 N ⁶ 위치에 수산화 아이소프렌-유래 측쇄가 있는 아데닌 유도체로서, 시스- 또는 트랜스-배치로 존재할 수 있다(도 1). 트랜스-제아틴은 가장 효과적인 자연적으로 발생하는 사이토키닌 중 하나이다. 많은 이전 연구에서, 분석 방법이 시스- 및 트랜스-제아틴을 구별하지 못했기 때문에, 관찰된 생리학적 과정에서 두 화합물의 존재 및 역할의 이해를 어렵게 했다.

구조적 유사성에도 불구하고, 시스-제아틴은 tRNA 경로를 통해 합성되는 반면, 트랜스-제아틴 및 생합성적으로 연관된 화합물인 iP 및 DZ는 식물 세포에서 드노보(de novo)(또는 AMP) 생합성 경로를 통해 합성된다.

tRNA 경로에서, 시스-제아틴은 아이소펜테닐화 tRNA 분해의 재활용 생성물이다. 시스-제아틴은 특정 (UNN-)tRNA에서 37번 아데닌의 프레닐화를 촉매하여 아이소펜테닐 아데닌(IP)-함유 tRNA의 형성을 유도하는 tRNA-아이소펜테닐 전이효소(tRNA-IPT)에 의해 매우 낮은 비율로 고세균을 제외한( et al. 2015) 거의 모든 유기체에서 합성된다. 드노보 사이토키닌 생합성 경로에서, 첫 번째 단계는 아데닐레이트 아이소펜테닐 전이효소(IPT, EC 2.5.1.27)에 의한 촉매로 아데노신 5'-인산(AMP, ADP 또는 ATP)이 다이메틸알릴 이인산(DMAPP)으로 N-프레닐화되어, 아이소펜테닐아데닌 뉴클레오타이드(iP)를 생성하는 것이다. 이후 식물에서 IPT에 의해 생성되는 iP는 프레닐 측쇄에서 수산화되어 tZ-뉴클레오타이드를 생성한다. 애기장대에서, CYP735A1 및 CYP735A2의 2가지 사이토크롬 P450 모노옥시게나제는 수산화 반응을 촉매한다. CYP735A는 iP-뉴클레오사이드 및 iP보다 iP-뉴클레오타이드를 우선적으로 사용한다. 이 반응은 입체-특이적(stereo-specific)이므로, CYP735A는 tZ-뉴클레오타이드를 생성한다(Takei, Yamaya, and Sakakibara 2004). 드노보 및 tRNA 경로 모두의 마지막 단계에서, 사이토키닌-활성화 효소 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 'Lonely guy'(LOG, EC 3.2.2.n1)는 리보실 모이어티를 제거하고 사이토키닌 뉴클레오타이드를 이의 활성 핵염기로 전환한다(Kurakawa et al. 2007). iPRMP, tZRMP, DZRMP 및 cZRMP의 4가지 사이토키닌 뉴클레오사이드 일인산 모두 LOG에 의해 이용된다.

아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)와 같은 식물병원성 세균에 의한 식물 감염의 경우, tZ의 생합성은 감염을 촉진하기 위해 시작된다. 감염 과정 중에서, tZ 또는 iP 생합성이 세균 세포 내부에서 발생할 수 있거나 세균성 IPT 유전자 동족체가 숙주의 핵 게놈에 통합되어 감염된 식물 세포에서 발현될 수 있다.

중요한 것은 세균과 보다 고등생물인 식물의 IPT 사이의 기질 특이성이 다르다는 것이다(Kakimoto 2001; Sakakibara 2005). 첫 번째 양상에서, 아그로박테리움 투메파시엔스의 Tmr 및 Tzs와 같은 세균성 IPT는 수용체로서 AMP만을 사용하여(반면 식물의 IPT 효소는 ADP 및 ATP를 우선적으로 사용함) 트랜스-제아틴 리보사이드 5'-일인산(tZRMP)을 형성한다(Sakakibara 2006; Kamada-Nobusada and Sakakibara 2009). 또한, Tzs 및 Tmr과 같은 아그로박테리움의 IPT는 측쇄 공여체로서 DMAPP 또는, 메틸에리스리톨 인산(MEP) 경로에서 DMAPP의 수산화 전구체인, 1-하이드록시-2-메틸-2-부테닐 4-이인산(1-hydroxy-2-methyl-2-butenyl 4-diphosphate: HMBDP)을 사용할 수 있다. DMAPP가 기질로 사용되는 경우, 1차 생성물은 iPRMP인 반면, tZRMP는 IPT가 HMBDP를 이용할 때 형성된다. 따라서, 감염 중 식물 세포의 엽록체에서 아그로박테리움의 IPT인 Tmr이 발현되면 tZRMP의 직접 합성을 위한 대사적 우회가 생성되어, 식물 세포의 색소체에 아이소프레노이드 전구체 HMBDP의 효율적인 기질 공급이 격리된다. 천연 경로에서와 같이, LOG 포스포리보하이드롤라제는 마지막으로 iP- 또는 tZ-뉴클레오사이드 일인산(iPRMP, tZRMP)으로부터 리보스 일인산 모이어티를 방출시켜 생물학적 활성 분자인 iP 및 tZ를 생성한다.

종양-유발 식물 병원성 세균인 아그로박테리움 투메파시엔스는 Tmr 및 Tzs의 2가지 IPT를 갖는다. Tmr 및 Tzs는 상동성 단백질이며, 둘 다 DMAPP : AMP 아이소펜테닐 전이효소이지만, 기질 인식에 중요한 아미노산이 식물 아데닐레이트 IPT의 것과 다르다(Chu et al., 2010). tmr(ipt) 유전자는 숙수 식물에 감염을 매개하는 Ti-플라스미드의 T-영역에 위치한다. tmr 유전자는 세균에서 식물 게놈으로 전이되어 숙주 식물이 사이토키닌을 생산하게 만들어 종양 형성을 초래한다. 시험관 내 실험으로 Tmr이 DMAPP 및 HMBDP 모두를 유사한 Km 값으로 AMP로 바꾼다는 것이 입증되었다(Sakakibara et al. 2005). 아그로박테리움 투메파시엔스의 노팔린(nopaline)-생산 균주는 DMAPP : AMP 아이소펜테닐 전이효소에 대한 다른 유전자인 tzs를 보유하며, 이는 Ti-플라스미드의 vir 영역에 존재하며 식물 세포로 전위되지 않는다. Tzs는 이러한 아그로박테리움 투메파시엔스 균주에 의한 높은 수준의 사이토키닌 생산 및 분비를 가능하게 하며(Morris et al. 1993), 또한 HMBDP 또는 DMAPP를 사용하여 iPRMP 및 tZRMP를 생산할 수 있다. Tzs는 Tmr에 대해 51.3%의 단백질 서열 동일성을 갖는다. tmr/tzs에 상동적인 DMAPP : AMP 아이소펜테닐 전이효소를 암호화하는 유전자는 아그로박테리움 속의 다른 세균인 아그로박테리움 비티스(A. vitis) 및 아그로박테리움 라이조게네스(A. rhizogenes)뿐만 아니라 슈도모나스 시린개 피브이 사바스타노이(Pseudomonas syringae pv. savastanoi), 슈도모나스 솔라나세아룸(Pseudomonas solanacearum), 판토에아 아글로메란스(Pantoea agglomerans) 및 로도코쿠스 파시앤스(Rhodococcus fascians)와 같은 다른 식물-병원성 세균에 존재한다(Kakimoto, 2003).

아이소펜테닐 공여체인 다이메틸알릴 이인산(DMAPP) 및 이의 전구체인 1-하이드록시-2-메틸-2-부테닐 4-이인산(HMBDP)은 식물 및 세균의 엽록체에서, 또한 바실러스 서브틸리스(Bacillus subtilis)에서 메틸에리스리톨 인산(methylerythritol phosphate: MEP) 경로를 통해 생산된다. MEP 경로에서, 피루브산 및 글리세르알데하이드-3-인산(glyceraldehyde-3-phosphate)은 1-데옥시-D-자일룰로스-5-인산 합성효소(1-deoxy-D-xylulose-5-phosphate synthase: Dxs, EC 2.2.1.7)에 의해 궁극적으로 HMBDP, DMAPP 및 아이소프렌 또는 더 큰 터페노이드(terpenoid) 화합물을 생산하는 대사 캐스케이드로 응축된다. MEP 경로에서 DXS에 의해 매개되는 첫 번째 단계는 식물 및 세균에서 아이소프레노이드를 생산하기 위한 속도-제한 단계이다(Julsing et al. 2007).

감염 중 식물-병원성 세균에서 드노보 경로를 통한 사이토키닌의 천연 생합성율은 매우 낮다. 이는 세균 기원의 IPT 효소, LOG 효소 및, 숙주 세포의 대사에 의해 공급되는, 빌딩 블록의 발현에 의존한다. 이러한 감염-기반 시스템은 산업적 규모의 생산으로 쉽게 전환될 수 없다. 농업적 적용에서 사이토키닌 호르몬 사용의 높은 활성 및 잠재력에 따라, 유전적이고 생물공학적으로 다루기 쉬운 숙주에서 iP, tZ 및 리보사이드 tZR 및 iPR과 같은 사이토키닌의 효율적이고 지속가능한 생산이 필요하다.

본 발명의 목적은 tZ 및 iP와 같은 아이소프레노이드 측쇄가 있는 사이토키닌(아이소프레노이드 사이토키닌) 및 이들의 리보사이드인 tZR 및 iPR의 보다 효율적인 생산을 가능하게 하는 수단을 제공하는 것이다. 보다 구체적으로, 본 발명의 목적은 tZ 및 iP와 같은 아이소프레노이드 측쇄가 있는 사이토키닌(아이소프레노이드 사이토키닌) 및 이들의 리보사이드인 tZR 및 iPR을 보다 높은 명목 수율로 생산하는 것을 가능하게 하는 수단을 제공하는 것이다.

이는 조작된 세균 균주로서, a) 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 선택적으로 b) 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 조작된 세균 균주를 갖는 본 발명자들에 의해 달성된다. 실시예에 나타난 바와 같이, 이러한 조작된 세균 균주는 놀랍게도 상등액에서 10㎎/ℓ를 초과하는 비정상적으로 높은 역가의 아이소프레노이드 사이토키닌을 나타낸다. 결과적으로, 이것은 식물 세포 감염이 더 이상 필요하지 않으며 tZ 및 iP와 같은 아이소프레노이드 사이토키닌 및 이들의 리보사이드인 tZR 및 iPR의 효율적인 생합성을 위한 생합성 기질 및 보조인자가 조작된 세균 세포에 의해 효과적으로 공급됨을 의미한다.

따라서 본 발명은 첫 번째 양상에서 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 세균을 제공한다. 보다 구체적으로, 본 발명은 세균으로서, a) 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 선택적으로 b) 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 세균을 제공한다.

또한 본 발명은 두 번째 양상에서 적합한 배양 배지에서 적합한 배양 조건 하에서 본 발명에 따른 세균을 배양하는 단계를 포함하는 사이토키닌 또는 이의 리보사이드 유도체, 특히 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법을 제공한다.

본 발명은 다음 항목으로 요약될 수 있다:

1. 세균으로서, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 세균.

2. 항목 1에 있어서, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

3. 항목 1에 있어서, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

4. 항목 1에 있어서, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

5. 항목 1 내지 항목 4 중 어느 하나에 있어서, 세균은 상기 이종의 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자를 포함하는, 세균.

6. 항목 5에 있어서, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 상기 이종의 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함하는, 세균.

7. 항목 5 또는 항목 6에 있어서, 외인성 핵산 분자는 벡터인, 세균.

8. 항목 5 또는 항목 6에 있어서, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합되는, 세균.

9. 항목 1 내지 항목 8 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 세균.

10. 항목 9에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 상기 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시키는 것으로 달성되는, 세균.

11. 항목 10에 있어서, 유전자의 카피수 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하는 것으로 달성되는, 세균.

12. 항목 9 내지 항목 11 중 어느 하나에 있어서, 세균은 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함하는, 세균.

13. 항목 12에 있어서, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함하는, 세균.

14. 항목 11 내지 항목 13 중 어느 하나에 있어서, 외인성 핵산 분자는 벡터인, 세균.

15. 항목 11 내지 항목 13 중 어느 하나에 있어서, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합되는, 세균.

16. 항목 9 내지 항목 15 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 리보솜 결합 부위를 변형하는 것으로 달성되는, 세균.

17. 항목 9 내지 항목 16 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시키는 것으로 달성되는, 세균.

18. 항목 9 내지 항목 17 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

19. 항목 9 내지 항목 18 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

20. 항목 9 내지 항목 18 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

21. 항목 9 내지 항목 20 중 어느 하나에 있어서, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 세균성 폴리펩타이드인, 세균.

22. 항목 1 내지 항목 21 중 어느 하나에 있어서, 세균은 변형되지 않은 다른 동일한 세균과 비교하여 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 추가 변형된, 세균.

23. 항목 22에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 상기 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시키는 것으로 달성되는, 세균.

24. 항목 23에 있어서, 유전자의 카피수 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하는 것으로 달성되는, 세균.

25. 항목 22 내지 항목 24 중 어느 하나에 있어서, 세균은 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함하는, 세균.

26. 항목 25에 있어서, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함하는, 세균.

27. 항목 24 내지 항목 26 중 어느 하나에 있어서, 외인성 핵산 분자는 벡터인, 세균.

28. 항목 24 내지 항목 26 중 어느 하나에 있어서, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합되는, 세균.

29. 항목 22 내지 항목 28 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 리보솜 결합 부위를 변형하는 것으로 달성되는, 세균.

30. 항목 22 내지 항목 29 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시키는 것으로 달성되는, 세균.

31. 항목 22 내지 항목 30 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

32. 항목 22 내지 항목 31 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63 내지 65 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 65 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

33. 항목 22 내지 항목 32 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

34. 항목 22 내지 항목 32 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 64의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 64의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

35. 항목 22 내지 항목 34 중 어느 하나에 있어서, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 세균성 폴리펩타이드인, 세균.

36. 항목 1 내지 항목 35 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 하나의 효소)의 발현 및/또는 활성이 증가되도록 추가 변형된, 세균.

37. 항목 36에 있어서, 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실 전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀 전이효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소 및 아데노신 키나제 활성이 있는 효소로 이루어진 군으로부터 선택된, 세균.

38. 항목 1 내지 항목 37 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 추가 변형된, 세균.

39. 항목 38에 있어서, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소 및 아데노신-포스포리보실 전이효소 활성이 있는 효소로 이루어진 군으로부터 선택된, 세균.

40. 항목 38 또는 항목 39에 있어서, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소인, 세균.

41. 항목 38 내지 항목 40 중 어느 하나에 있어서, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 아데노신-포스포리보실 전이효소 활성이 있는 효소인, 세균.

42. 항목 1 내지 항목 41 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 추가 변형된, 세균.

43. 항목 42에 있어서, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소는 IMP 탈수소효소 활성이 있는 효소 및 GMP 합성효소 활성이 있는 효소로 이루어진 군으로부터 선택된, 세균.

44. 항목 42 또는 항목 43에 있어서, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소는 IMP 탈수소효소 활성이 있는 효소인, 세균.

45. 항목 42 내지 항목 44 중 어느 하나에 있어서, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소는 GMP 합성효소 활성이 있는 효소인, 세균.

46. 항목 1 내지 항목 45 중 어느 하나에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 추가 변형된, 세균.

47. 항목 46에 있어서, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 단백질 발현의 증가는 상기 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시키는 것으로 달성되는, 세균.

48. 항목 47에 있어서, 유전자의 카피수 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하는 것으로 달성되는, 세균.

49. 항목 1 내지 항목 48 중 어느 하나에 있어서, 세균은 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함하는, 세균.

50. 항목 49에 있어서, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함하는, 세균.

51. 항목 48 내지 항목 50 중 어느 하나에 있어서, 외인성 핵산 분자는 벡터인, 세균.

52. 항목 48 내지 항목 50 중 어느 하나에 있어서, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합되는, 세균.

53. 항목 46 내지 항목 52 중 어느 하나에 있어서, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 i) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 세균.

54. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 장내세균과(Enterobacteriaceae), 바실러스과(Bacillaceae), 유산균과(Lactobacillaceae) 및 코리네박테리움과(Corynebacteriaceae)로 이루어진 군으로부터 선택된 과(family)의 세균인, 세균.

55. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스과 및 코리네박테리움과로 이루어진 군으로부터 선택된 과의 세균인, 세균.

56. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스과의 세균인, 세균.

57. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 코리네박테리움과의 세균인, 세균.

58. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스(Bacillus), 락토코커스(Lactococcus), 락토바실러스(Lactobacillus), 클로스트리듐(Clostridium), 코리네박테리움(Corynebacterium), 지오바실러스(Geobacillus), 써모안에어로박테리움(Thermoanaerobacterium), 스트렙토코커스(Streptococcus), 에스체리치아(Escherichia), 쉬겔라(Shigella), 아시네토박터(Acinetobacter), 시트로박터(Citrobacter), 살모넬라(Salmonella), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 클루이베라(Kluyvera), 세라티아(Serratia), 세데세아(Cedecea), 모르가넬라(Morganella), 하프니아(Hafnia), 에드워드시엘라(Edwardsiella), 프로비덴시아(Providencia), 프로테우스(Proteus) 또는 예르시니아(Yersinia) 속의 세균인, 세균.

59. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스 또는 코리네박테리움 속의 세균인, 세균.

60. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스 속의 세균인, 세균.

61. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 코리네박테리움 속의 세균인, 세균.

62. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 바실러스 서브틸리스(Bacillus subtilis)인, 세균.

63. 항목 1 내지 항목 53 중 어느 하나에 있어서, 세균은 코리네박테리움 스테이셔니스(Corynebacterium stationis)인, 세균.

64. 적합한 배양 배지에서 적합한 배양 조건 하에서 항목 1 내지 항목 63 중 어느 하나에 따른 세균을 배양하는 단계를 포함하는, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.

65. 항목 64에 있어서, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 트랜스-제아틴(tZ), 트랜스-제아틴 리보사이드(tZR), N ⁶ -(D2-아이소펜테닐)아데닌(iP), N(6)-(다이메틸알릴)아데노신(iPR), 다이하이드로제아틴(DZ), 리보실 다이하이드로제아틴(DZR) 및 이들의 조합으로 이루어진 군으로부터 선택된, 방법.

66. 항목 65에 있어서, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 각각 트랜스-제아틴(tZ) 및 트랜스-제아틴 리보사이드(tZR)인, 방법.

67. 항목 64에 있어서, 방법은 트랜스-제아틴(tZ)을 생산하기 위한 것인, 방법.

도 1: 아이소프레노이드 사이토키닌: A) 리보사이드: N ⁶ -(D2-아이소펜테닐)아데닌 리보사이드(iPR), 트랜스-제아틴 리보사이드(tZR), 시스-제아틴 리보사이드(cZR) 및 다이하이드로제아틴 리보사이드(DZR). B) 유리 염기: N ⁶ -(D2-아이소펜테닐)아데닌(iP), 트랜스-제아틴(tZ), 시스-제아틴(cZ) 및 다이하이드로제아틴(DZ).
도 2: MEP 대사 경로의 개략도.
도 3: IPT(EC 2.5.1.27) 및 LOG(EC 3.2.2.n1)의 이종 발현을 사용한 아이소프레노이드 사이토키닌 생합성 경로.
도 4: 진탕기-규모의 실험에서 바실러스 서브틸리스 균주의 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB14, TZAB15 - IPT-LOG.
도 5: 황산 아데닌을 사용한 진탕기-규모 실험에서 바실러스 서브틸리스 균주의 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB14 - IPT-LOG.
도 6: 진탕기-규모 실험에서 IPT 및 LOG 유전자 및 DXS 유전자가 있는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB15 - IPT-LOG, TZAB43 - IPT-LOG-DXS.
도 7: 진탕기-규모 실험에서 28시간 후 IPT(서열번호 1) 및 LOG(서열번호 34) 또는 IPT(서열번호 2) 및 LOG(서열번호 34)를 발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산. VKPM B2116 - 모균주, TZAB1, TZAB2, TZAB3, TZAB4 - IPT(서열번호 2) 및 LOG(서열번호 34)가 있는 균주, TZAB14, TZAB15 - IPT(서열번호 1) 및 LOG(서열번호 34)가 있는 균주.
도 8: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 24시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 168에서의 사이토키닌의 생산.
도 9: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 18시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 RB50에서의 사이토키닌의 생산.
도 10: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 24시간 후 DXS(서열번호 63)를 과발현하는 바실러스 서브틸리스 균주 VKPM B2116에서의 사이토키닌의 생산.
도 11: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 10시간 후 DXS(서열번호 63)를 과발현하는 대장균 균주 BL21(DE3)에서의 사이토키닌의 생산.
도 12: IPT(서열번호 1) 및 LOG(서열번호 34)가 있고 진탕기-규모 실험에서 48시간 후 DXS(서열번호 63)를 과발현하는 코리네박테리움 스테이셔니스에서의 사이토키닌의 생산.
도 13: 진탕기-규모 실험에서 18시간 후 다양한 IPT(서열번호 1, 서열번호 6, 서열번호 7 및 서열번호 9)와의 조합으로 LOG8(서열번호 41)을 발현하는 바실러스 서브틸리스 균주에서의 사이토키닌의 생산.
도 14: 진탕기-규모 실험에서 18시간 후 다양한 LOG(서열번호 34 내지 44)와의 조합으로 IPT(서열번호 1)를 발현하는 바실러스 서브틸리스 균주에서의 사이토키닌의 생산.
이하 본 발명을 보다 상세하게 설명한다.

본 명세서에서 특별히 정의하지 않는 한, 사용된 모든 기술적 용어 및 과학적 용어는 생화학, 유전학 및 미생물학 분야의 숙련된 기술자가 일반적으로 이해하는 것과 같은 의미를 갖는다.

본 명세서에 기술된 것과 유사하거나 동등한 모든 방법 및 재료가, 본 명세서에 기술된 적합한 방법 및 재료와 함께, 본 발명을 실행하거나 시험하는데 사용될 수 있다. 본 명세서에 언급된 모든 공개 문헌, 특허 출원, 특허 및 다른 참고 문헌들은 그 전체가 참조에 의해 원용된다. 상충하는 경우, 정의를 포함하여, 본 명세서가 우선될 것이다. 또한, 재료, 방법 및 실시예는 단지 예시일 뿐이며, 달리 명시되지 않는 한, 제한하려는 의도가 아니다.

본 발명의 실행은, 달리 나타내지 않은 한, 이 분야의 기술 내에 있는, 세포 생물학, 세포 배양, 분자 생물학, 유전자 이식 생물학, 미생물학 및 재조합 DNA의 통상적인 기술을 사용할 것이다. 이러한 기술들은 문헌에 충분히 설명되어 있다. 예를 들어, 문헌[Current Protocols in Molecular Biology(Frederick M. AUSUBEL, 2000, Wiley and son Inc, Library of Congress, USA)]; 문헌[Molecular Cloning: A Laboratory Manual, Third Edition(Sambrook et al, 2001, Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press)]; 문헌[Oligonucleotide Synthesis(M. J. Gait ed., 1984)]; Mullis 등의 미국 특허 제4,683,195호; 문헌[Nucleic Acid Hybridization(B. D. Harries & S. J. Higgins eds. 1984)]; 문헌[Transcription And Translation(B. D. Hames & S. J. Higgins eds. 1984)]; 문헌[Culture Of Animal Cells(R. I. Freshney, Alan R. Liss, Inc., 1987)]; 문헌[Immobilized Cells And Enzymes(IRL Press, 1986)]; 문헌[B. Perbal, A Practical Guide To Molecular Cloning(1984)]; 문헌[the series, Methods In ENZYMOLOGY(J. Abelson and M. Simon, eds.-in-chief, Academic Press, Inc., New York)], specifically, Vols.154 and 155 (Wu et al. eds.) and Vol. 185, "Gene Expression Technology" (D. Goeddel, ed.)]을 참고할 수 있다.

발명의 세균

위에 나타낸 바와 같이, 본 발명자들은 조작된 세균 균주로서, a) 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 선택적으로 b) 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 조작된 세균 균주를 갖는다. 실시예에 나타난 바와 같이, 이러한 조작된 세균 균주는 놀랍게도 상등액에서 10㎎/ℓ를 초과하는 비정상적으로 높은 역가의 아이소프레노이드 사이토키닌을 나타낸다. 결과적으로, 이것은 식물 세포 감염이 더 이상 필요하지 않으며 tZ 및 iP와 같은 아이소프레노이드 사이토키닌 및 이들의 리보사이드인 tZR 및 iPR의 효율적인 생합성을 위한 생합성 기질 및 보조인자가 조작된 세균 세포에 의해 효과적으로 공급됨을 의미한다.

아데닐레이트 아이소펜테닐 전이효소(IPT)는 드노보 사이토키닌 생합성 경로에서 첫 번째 단계로서 아데노신 5'-인산(AMP, ADP 또는 ATP)을 다이메틸알릴 이인산(DMAPP) 또는 1-하이드록시-2-메틸-2-부테닐 4-이인산(HMBDP)으로 N-프레닐화(N-prenylation)하는 것을 촉매하는 잘 정의된 분류의 효소이다. 여기에는 두 가지 유형의 IPT(EC 2.5.1.27 및 EC 2.5.1.112)가 있다. IPT 효소는 세균과 식물에 존재한다. 두 가지 IPT 동족체인 Tzs 및 Tmr을 함유하는 아그로박테리움의 것과 같은 세균의 IPT는 프레닐 수용체로서 AMP를 사용하고 공여체로서 HMBDP 또는 DMAPP를 사용한다(EC 2.5.1.27). HMBDP를 사용한 반응 산물은 tZ-뉴클레오타이드이다. 또한, 세균의 IPT는 단백질 패밀리 및 도메인의 Pfam 데이터베이스(https://pfam.xfam.org/family/ipt)에서 Pfam 패밀리 IPT(PF01745)에 속한다. IPT Pfam 도메인 유전자들은 계통발생적으로 산재되어 있고 방선균(Actinobacteria), 남세균(Cyanobacteria), 알파-프로테오박테리아(α-Proteobacteria), 베타-프로테오박테리아(β-Proteobacteria) 및 감마-프로테오박테리아(γ-Proteobacteria)의 일부 구성원에서 그리고 진핵생물인 딕티오스텔리움 디스코이데움(Dictyostelium discoideum)에서만 발견된다(Nishii et al., 2018). 보다 고등생물인 식물의 IPT는 프레닐 수용체로서 ATP 또는 ADP를 주로 사용하고 공여체로서 DMAPP를 주로 사용하며(EC 2.5.1.112) Pfam 패밀리 IPPT(PF01715)에 속한다(https://pfam.xfam.org/family/ippt). 반응 산물은 iP이며, 이후 프레닐 측쇄에서 수산화되어 tZ-뉴클레오타이드가 된다.

아그로박테리움 투메파시엔스의 Tzs(IPT(PF01745); EC 2.5.1.27; 서열번호 1)는 3개의 알파-헬릭스(알파1 내지 알파3)로 둘러쌓인 5가닥 평행 베타-시트가 있는 N-말단 도메인 및 5개의 알파 헬릭스(알파4 내지 알파8)가 있는 C-말단 도메인의 2개의 도메인으로 이루어진다. N-말단 도메인은 뉴클레오타이드-결합 p 루프 모티프 Gly-8-Pro-Thr-Cys-Ser-Gly-Lys-Thr-15를 함유하고, p 루프-함유 뉴클레오사이드 삼인산 가수분해효소(pNTPase) 슈퍼패밀리와 구조적으로 연관된다. 알파8의 C-말단 측면은 N-말단까지 연장되어 부착된다. 도메인들 사이의 경계부는 AMP에 결합하는 용매-접근가능한 통로를 형성한다. AMP의 프레닐화 부위는 Asp-33 및 Ser-45에 결합한다. DMAPP는 Asp-173, Tyr-211 및 His-214에 결합된다. Thr-10, Asp-33 및 Arg-138은 IPT들 사이에 완전히 보존되어 있다. Tzs에서, 측쇄에 의해 형성되는 친수성 영역은 프레닐-공여체 기질의 수산기의 존재 또는 부재를 구별하는 기질-결합 포켓 내 2개의 중요한 아미노산 잔기인 His-214 및 Asp-173을 함유하며, 이는 HMBDP의 사용을 가능하게 한다(Sugawara et al. 2008).

일반적으로, 본 발명에 따라 사용되는 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 세균에 대해 이종성일 것이며, 이는 상기 폴리펩타이드가 일반적으로는 상기 세균에서 발견되거나 상기 세균에 의해 만들어지지(즉, 발현되지) 않지만, 다른 종에서 유래됨을 의미한다. 또한, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 Pfam 패밀리 IPT(PF01745)의 구성원에서 유래하거나 이에 상응하며, 바람직하게는 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 세균성 폴리펩타이드이다. "아데닐레이트 아이소펜테닐 전이효소 활성이 있는 세균성 폴리펩타이드"는 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드가 아그로박테리움 투메파시엔스와 같은 세균에서 유래됨을 의미한다.

tZ, iP, tZR 및 iPR을 포함하는 아이소프레노이드 사이토키닌의 생합성에 가장 적합한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 아그로박테리움 투메파시엔스의 Tzs 또는 Tmr과 같이 프레닐 공여체로서 HMBDP 및 DMAPP 모두를 사용할 수 있는 효소이다. 또한, 이들은 Pfam 패밀리 IPT(PF01745)에 속하고 서열번호 1의 173번 위치와 동등한 위치에 Asp 잔기를 함유하고/함유하거나 서열번호 1의 211번 위치와 동등한 위치에 Tyr 잔기를 함유하고/함유하거나 서열번호 1의 214번 위치와 동등한 위치에 His 잔기를 함유한다.

본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.

본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.

본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 85%, 예를 들어 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.

본 발명에 따른 사용을 위한 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드일 수 있다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 1의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 2의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 3의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 4의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 5의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 6의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 7의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 8의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 9의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 50%, 예를 들어 적어도 55%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 60%, 예를 들어 적어도 65%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열과 적어도 95%, 예를 들어 적어도 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 서열번호 10의 아미노산 서열을 포함한다.

아데닐레이트 아이소펜테닐 전이효소 활성을 결정하기 위한 기술은 기술자에게 잘 알려져 있다. 예시적인 방법이 예를 들어 문헌[Takei, Sakakibara 및 Sugiyama(2001)] 및 문헌[ et al(2015)]에 기술되어 있다. 아데닐레이트 아이소펜테닐 전이효소 활성은 예를 들어 다음의 분석법들 중 임의의 방법에 따라 결정될 수 있다:

(1) 25℃에서 20분 동안 1mM AMP 및 340μM DMAPP가 있는 반응 혼합물(1M 베타인, 20mM 트라이에탄올아민, 50mM KCl, 10mM MgCl₂, 1mM 다이티오트레이톨, 1㎎/㎖ 소 혈청 알부민, pH 8.0)에서 효소를 인큐베이션한다. 1/4부피의 10% 아세테이트를 첨가하여 반응을 중지하고 18,000×g에서 20분 동안 원심분리한다. 생성되는 상등액에 대한 사이토키닌 분석을 수행한다. 1유닛의 IPT 활성은 반응 조건 하에서 분당 1μmol의 iPMP를 생산하는 효소의 양으로 정의된다(Takei, Sakakibara, and Sugiyama 2001).

(2) 기질로서 100μM AMP 및 100μM DMAPP(Echelon BioSciences, 미국 유타주 솔트레이크시티 소재)가 있고 100㎕의 정제된 효소가 있는 200㎕의 반응 혼합물(10mM MgCl₂ 함유, 100mM Tris/HCl 완충액, pH 7.5)에서 25℃에서 밤새도록 활성 분석을 수행한다. IPT의 기질 선호도를 평가하기 위해, ADP 또는 ATP를 아이소프렌 사슬 수용 기질로 사용하고, 아이소펜테닐 이인산 또는 HMBPP(Echelon Bioscences)를 아이소프렌 사슬 제공 기질로 사용한다. 아이소프레노이드 기질을 첨가하여 반응을 개시하고 95℃에서 5분 동안 가열하여 효소를 비활성화하여 반응을 중지한다. IPT 활성 분석법은 268㎚에서의 UV 검출을 사용한 HPLC 또는 모세관 전기영동법으로 반응산물을 결정하는 것을 기반으로 한다. 사이토키닌 리보사이드 및 해당 일인산염은 Alliance 2695 고성능 액체 크로마토그래프(Waters)에 연결된 Symmetry C18 칼럼(2.1×150㎜, 5㎛; Waters, 미국 매사추세츠주 밀퍼드 소재) 상에서 결정한다. 다음의 용매 혼합을 사용하여 15mM 포름산 암모늄(pH 4.0)(A) 및 메탄올(B)의 선형 구배로 칼럼을 용출하였다: 0 내지 25분, 5 내지 60% B, 25 내지 26분, 60 내지 100% B, 26 내지 27분 100% B. 올리고뉴클레오타이드 가수분해물의 분석을 위해 15mM 포름산 암모늄(pH 4.0)(A) 및 아세토니트릴(B)의 선형 구배를 사용하였다(0 내지 30분, 5 내지 24% B, 30 내지 31분, 24 내지 100% B). 유속은 0.25㎖/분이고 칼럼 온도는 30℃이다. 정품 표준 화합물(Olchemim, 체코 올로모우츠 소재)을 사용한 검량 곡선법으로 산물의 농도를 결정한다. 사이토키닌 이인산 및 삼인산의 결정을 위해 모세관 전기영동을 사용한다( et al, 2015).

아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 것 이외에, 본 발명의 세균은 선택적으로 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 (추가) 변형될 수 있다.

따라서, 일부 실시형태에 따르면, 본 발명의 세균은 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하고 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형되어 있다.

"단백질 발현이 증가"는 이렇게 변형된 세균에 의해 생산된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 보다 구체적으로, "단백질 발현이 증가"는 이렇게 변형된 세균에 의해 생산된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포 내 단백질의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.

단백질 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 단백질 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 유전자를 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시켜 달성할 수 있다.

또한 단백질 발현의 증가는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 유전자의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다.

또한 단백질 발현의 증가는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시켜, 예를 들어 본래의 프로모터를 이 프로모터와 비교하여 폴리펩타이드의 더 높은 발현 및 과생성을 가능하게 하는 프로모터로 대체하여, 달성할 수 있다. 사용할 수 있는 프로모터에는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7, ParaBAD, Plac, Ptac 및 Ptrc, 및 코리네파지(corynephage) BFK20에서 유래한 P F1 프로모터가 포함된다.

또한 단백질 발현의 증가는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.

일부 실시형태에 따르면, 유전자 카피수의 증가는 숙주 세포에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상(예를 들어 둘 또는 셋)의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하여 달성할 수 있다.

일부 실시형태에 따르면, 본 발명의 세균은 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드를 암호화하는 하나 이상(예를 들어 둘, 셋 또는 넷)의 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함한다. 적합하게는, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함한다. 일부 실시형태에 따르면, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합된다.

사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제로서의 효소적 기능이 있는 사이토키닌-활성화 효소이다. Lonely Guy(LOG) 단백질로도 지칭되는 이러한 펩타이드는 다양한 유기체의 게놈에 암호화되어 있으며, 대부분의 LOG 단백질은 원핵생물의 것이다. 생화학적 및 기능적 연구를 통해 벼(Oryza sativa), 애기장대(Arabidopsis thaliana), 맥각병균(Claviceps purpurea), 결핵균(Mycobacterium tuberculosis) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)과 같은 몇몇 유기체의 효소가 LOG로 특성화되었다. LOG 단백질은 본래 식물호르몬-활성화 식물 효소로 특성화되었으나, 실험적 증거없이 세균성 LOG 동족체가 추정 라이신 탈탄산효소(lysine decarboxylase: LDC)로 잘못 지정되었다. 이들의 실제 효소 활성은 최근에 코리네박테리움 글루타미쿰 동족체의 기능적 분석을 통해 확인되었다(Seo et al. 2016). 이량체성 I형 LOG와 육량체성 II형 LOG의 두 가지 유형의 LOG 단백질이 세균에서 확인되었다. II형 LOG 단백질은 서로 다른 올리고머 상태와 프레닐-결합 부위에 서로 다른 잔기를 갖는다. I형 LOG는 Ia형과 Ib형의 두 가지 하위군으로 더 나뉠 수 있다. Ia형은 대부분의 유기체의 이량체성 LOG를 포함하고, Ib형은 방선균류(Actinomycetales)의 이량체성 LOG를 포함한다. II형 LOG는 대부분의 유기체의 육량체성 LOG를 포함하는 IIa형과 보다 고등 식물의 LOG를 포함하는 IIb형으로 나뉜다(Seo and Kim 2017).

LOG 단백질은 iPRMP 또는 트랜스-제아틴 리보사이드 5'-일인산(tZRMP)과 같은 사이토키닌 전구체에서 N ⁶ -치환된 염기 및 리보스 5'-일인산 사이의 결합을 가수분해하는 탈포스포리보실화(dephosphoribosylation)를 통해 활성 사이토키닌을 생산한다. 코리네박테리움 글루타미쿰의 LOG는 8개의 알파-헬릭스에 의해 둘러쌓인 7개의 평행한 베타-가닥으로 형성된 중앙 베타-시트가 있는 2개의 동일한 단량체로 구성된다. LOG 단백질은 활성 부위의 형성에 기여하는 "PGGXGTXXE" 모티프를 함유한다. 활성 부위는 이량체의 포켓에 형성되며, 보존된 "PGGXGTXXE" 모티프는 포켓의 표면에 있다. "PGGXGTXXE" 모티프는 뉴클레오타이드-결합 부위이며, 보존된 잔기는 결합된 AMP를 안정화한다(Seo et al. 2016). 이 모티프는 모든 LOG 효소에서 고도로 보존되어 있다(Seo and Kim 2017).

사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래될 수 있거나 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)될 수 있다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래된다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 이것이 발현되는 것과 다른 종에서 유래된다(즉, 이종성).

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 세균성 폴리펩타이드이다. "사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 세균성 폴리펩타이드"는 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드가 자연적으로 코리네박테리움 글루타미쿰과 같은 세균에서 유래됨을 의미한다.

본 발명에 따른 사용을 위한 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드일 수 있다.

본 발명에 따른 사용을 위한 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드일 수 있다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 34의 아미노산 서열 또는 서열번호 34와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 34의 아미노산 서열 또는 서열번호 34와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 34의 아미노산 서열 또는 서열번호 34와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 34의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 35의 아미노산 서열 또는 서열번호 35와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 35의 아미노산 서열 또는 서열번호 35와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 35의 아미노산 서열 또는 서열번호 35와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 35의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 36의 아미노산 서열 또는 서열번호 36과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 36의 아미노산 서열 또는 서열번호 36과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 36의 아미노산 서열 또는 서열번호 36과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 36의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 37의 아미노산 서열 또는 서열번호 37과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 37의 아미노산 서열 또는 서열번호 37과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 37의 아미노산 서열 또는 서열번호 37과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 37의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 38의 아미노산 서열 또는 서열번호 38과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 38의 아미노산 서열 또는 서열번호 38과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 38의 아미노산 서열 또는 서열번호 38과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 38의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 39의 아미노산 서열 또는 서열번호 39와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 39의 아미노산 서열 또는 서열번호 39와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 39의 아미노산 서열 또는 서열번호 39와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 39의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 40의 아미노산 서열 또는 서열번호 40과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 40의 아미노산 서열 또는 서열번호 40과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 40의 아미노산 서열 또는 서열번호 40과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 40의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 41의 아미노산 서열 또는 서열번호 41과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 41의 아미노산 서열 또는 서열번호 41과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 41의 아미노산 서열 또는 서열번호 41과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 41의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 42의 아미노산 서열 또는 서열번호 42와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 42의 아미노산 서열 또는 서열번호 42와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 42의 아미노산 서열 또는 서열번호 42와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 42의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 43의 아미노산 서열 또는 서열번호 43과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 43의 아미노산 서열 또는 서열번호 43과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 43의 아미노산 서열 또는 서열번호 43과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 43의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 44의 아미노산 서열 또는 서열번호 44와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 44의 아미노산 서열 또는 서열번호 44와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 44의 아미노산 서열 또는 서열번호 44와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 서열번호 44의 아미노산 서열을 포함한다.

사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성을 결정하기 위한 기술은 기술자에게 잘 알려져 있다. 예시적인 방법이 예를 들어 문헌[Seo et al.(2016)]에 기술되어 있다. 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성은 예를 들어 다음의 방법에 따라 결정될 수 있다:

박층 크로마토그래피(TLC) 방법으로 분리된 아데닌 고리 화합물을 검출하여 포스포리보하이드롤라제 활성을 결정한다. 30℃에서 20mM AMP, 36mM Tris-HCl(pH 8.0) 및 23μM 정제 효소의 혼합물에서 효소 반응을 수행한 다음 혼합물을 95℃에서 1.5분 동안 가열하여 반응을 중지한다. 이후 PEI-셀룰로스-F 플라스틱 TLC 시트(Merck Millipore) 상에 반응 혼합물로 점을 찍는다. 이동상은 1M 염화나트륨이다. TLC 챔버에서 전개 후, 시트를 완전히 건조시킨다. UV 램프(290㎚)로 아데닌 고리-포함 화합물을 검출한다(Seo et al. 2016).

아이소프레노이드 사이토키닌의 아이소펜테닐 측쇄 전구체의 공급을 증가시키기 위해, 메틸에리스리톨 4-인산(MEP) 경로를 통한 대사 흐름을 증가시킬 수 있다. 이는 주로 1-데옥시-D-자일룰로스 5-인산(DXP) 합성효소(DXS)의 과발현을 통해 달성할 수 있다.

따라서, 일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 (추가) 변형된 것을 특징으로 한다.

"단백질 발현이 증가"는 이렇게 변형된 세균에 의해 생산된 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 보다 구체적으로, "단백질 발현이 증가"는 이렇게 변형된 세균에 의해 생산된 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포 내 단백질의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.

단백질 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 단백질 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 유전자 또는 유전자들을 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 유전자 또는 유전자들의 카피수를 증가시켜 달성할 수 있다.

또한 단백질 발현의 증가는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 유전자의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다.

또한 단백질 발현의 증가는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시켜, 예를 들어 본래의 프로모터를 이 프로모터와 비교하여 폴리펩타이드의 더 높은 발현 및 과생성을 가능하게 하는 프로모터로 대체하여, 달성할 수 있다. 사용할 수 있는 프로모터에는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7, ParaBAD, Plac, Ptac 및 Ptrc, 및 코리네파지(corynephage) BFK20에서 유래한 P F1 프로모터가 포함된다.

또한 단백질 발현의 증가는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.

일부 실시형태에 따르면, 유전자 카피수의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상(예를 들어 둘 또는 셋)의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하여 달성할 수 있다.

일부 실시형태에 따르면, 본 발명의 세균은 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드를 암호화하는 하나 이상(예를 들어 둘, 셋 또는 넷)의 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함한다. 적합하게는, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함한다. 일부 실시형태에 따르면, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합된다.

1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 D-글리세르알데하이드 3-인산과 피루브산 사이의 축합을 촉매하여 1-데옥시-D-자일룰로스 5-인산(DXP)을 생산하는 효소(DXS; E.C. 2.2.1.7)이다. DXS는 메틸에리스리톨 인산(MEP) 경로에서 HMBDP 및 DMAPP의 아이소프레노이드 생합성의 첫 번째 효소적 단계를 촉매하며, kcat/Km값이 이 경로의 다른 효소에 대한 것보다 상당히 낮다(Kuzuyama et al. 2000). DXS는 진정세균에서 단일 카피로 존재하지만, 녹조류 및 보다 고등 식물은 DXS를 암호화하는 둘 이상의 유전자를 가지며, 이는 3개의 구별가능한 군을 형성한다. 보다 고등 식물에서, 별개의 DXS 동종효소의 발현은 조직의 유형 및 발달 단계에 따른다.

DXS는 세균과 식물에서 고도로 보존되어 있다. 이의 단백질 서열은 트랜스케톨라제(transketolase) 및 피루브산 탈수소효소 E1 서브유닛과 약 20%의 동일성을 갖는다. 세 가지 효소 모두 유사한 반응을 촉매하며 조효소 티아민 피로인산(thiamine pyrophosphate: TPP)을 필요로 한다. 대장균의 DXS는 트랜스케톨라제 및 피루브산 탈수소효소의 E1 서브유닛의 동등한 도메인에 상동적인 3개의 도메인(I, II 및 III)을 함유한다. 2개의 DXS 단량체들은 이량체에 나란히 배열된다. 도메인 I(1 내지 319번 잔기)은 같은 단량체의 도메인 II(320 내지 495번 잔기) 및 III(496 내지 629번 잔기)의 위에 있다. 3개의 도메인 모두 α 헬릭스 사이에 대부분 평행한 β-시트인 중심이 있는 α/β 폴드(fold)를 갖는다. 도메인 I은 다섯-가닥의 평행한 β-시트를 함유하고, 도메인 II는 여섯-가닥의 평행한 β-시트를 함유하고, 도메인 III은 첫 번째 가닥이 다른 4개의 가닥에 역-평행인 다섯-가닥의 β-시트를 함유한다. 도메인 I은 N-말단에(1 내지 49번 잔기), 첫 번째 가닥 뒤에(81 내지 122번 잔기), 그리고 네 번째 및 다섯 번째 가닥 사이의 연결부에(184 내지 250번 잔기) 여러 개의 확장된 표면 부분을 갖는다.

DXS의 활성 부위는 같은 단량체에서 도메인 I과 II의 경계부에 위치한다. 두 도메인의 중앙 평행 β-시트의 C-말단 끝은 서로를 향하며, TPP 조효소는 이 경계부에서 포켓의 아래 쪽에 위치한다. TPP의 아미노-피리미딘 고리는 도메인 II와 상호작용하며, 피로인산기는 도메인 I과 상호작용한다. 티아졸륨 고리의 C2 원자는 기질-결합 부위에 노출된다. C2 원자는 반응에 참여한다. TPP의 피로인산기는 효소와 수많은 극성 상호작용을 한다. 활성 부위는 두 개의 인산기와 Asp154, Asn183 및 Met185의 측쇄들 사이에 결합된 마그네슘 이온으로 이루어진다. DXS에서 Gly153-Asp-Gly155-Asn183 서열은 TPP 결합 모티프 ≫GDG-X(25-30)-N≪과 일치한다. C2는 피루브산-결합 부위를 구성한다. GAP는 포켓에 위치한다(Xiang et al., 2007).

몇몇 연구에서 DXP의 형성이 MEP 경로의 제한 단계임을 나타내므로, DXS 활성을 증가시키는 것은 바실러스 서브틸리스를 포함하여(Yang et al. 2019) 많은 종에서 터페노이드 생합성을 위한 가장 효과적인 전략으로 이식된다. 대장균과 데이노코커스 라디오두란스(Deinococcus radiodurans)의 Dxs에서 단일 아미노산의 돌연변이는 촉매 활성을 증가시켰다. 대장균 Dxs의 Y392F 돌연변이는 야생형과 비교하여 2.5배 초과로 상대적 촉매 활성을 증가시켰다(Xiang et al. 2012). DXS는 MEP 경로의 최종 산물인 IPP와 DMAPP에 의한 음성적 피드백 메커니즘에 의해 조절된다(Banerjee et al. 2013). DXS는 IPP와 DMAPP의 음성적 피드백 억제를 완화하기 위한 부위-특이적 돌연변이의 대상이었다. 검은 미루나무(Populus trichocarpa)의 DXS의 A147G/A352G 돌연변이는 이의 IPP 결합 친화성을 약간 감소시켰지만, TPP 및 피루브산에 대한 Km을 증가시켰으며, 효소의 촉매 효율을 약 15-배 감소시켰다(Banerjee et al., 2016). DXS 이외 경로의 몇몇 다른 효소들의 과발현 또한 다른 세균에서 혼합된 결과와 함께 시험이 이루어졌다. 또한, 인공 오페론(오페론 dxs-ispD-ispF-ispH 및 ispC/dxr-ispE-ispG-ispA)으로서 전체 MEP 경로의 과발현 또한 바실러스 서브틸리스에서 시험이 이루어졌다(Xue et al. 2015).

1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래할 수 있거나 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)할 수 있다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)한다.

바람직하게는, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 세균성 폴리펩타이드이다. "1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 세균성 폴리펩타이드"는 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드가 바실러스 서브틸리스와 같은 세균으로부터 자연적으로 유래함을 의미한다.

본 발명에 따른 사용을 위한 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드일 수 있다.

일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 63의 아미노산 서열 또는 서열번호 63과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 63의 아미노산 서열 또는 서열번호 63과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 63의 아미노산 서열 또는 서열번호 63과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 63의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 64의 아미노산 서열 또는 서열번호 64와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 64의 아미노산 서열 또는 서열번호 64와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 64의 아미노산 서열 또는 서열번호 64와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 64의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 65의 아미노산 서열 또는 서열번호 65와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 65의 아미노산 서열 또는 서열번호 65와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 65의 아미노산 서열 또는 서열번호 65와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 65의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 66의 아미노산 서열 또는 서열번호 66과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 66의 아미노산 서열 또는 서열번호 66과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 66의 아미노산 서열 또는 서열번호 66과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 66의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 67의 아미노산 서열 또는 서열번호 67과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 67의 아미노산 서열 또는 서열번호 67과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 67의 아미노산 서열 또는 서열번호 67과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 67의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 68의 아미노산 서열 또는 서열번호 68과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 68의 아미노산 서열 또는 서열번호 68과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 68의 아미노산 서열 또는 서열번호 68과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 68의 아미노산 서열을 포함한다.

위에 언급된 바와 같이, 야생형 DXS 서열의 변형은 촉매 활성을 증가시킬 수 있다. 따라서 본 발명은 특히 이것이 유래된 야생형 DXS 효소와 비교하여 증가된 활성 또는 불활성화된 음성적 피드백 메커니즘을 갖는 돌연변이 DXS의 사용을 고려한다. 이러한 돌연변이 DXS 효소의 비-제한적 예시에는 서열번호 69 및 70에 제시된 것들이 있다.

일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 69의 아미노산 서열 또는, 392번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 392번 위치의 아미노산이 F라는 조건으로, 서열번호 69와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 69의 아미노산 서열 또는, 392번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 392번 위치의 아미노산이 F라는 조건으로, 서열번호 69와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 69의 아미노산 서열 또는, 392번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 392번 위치의 아미노산이 F라는 조건으로, 서열번호 69와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 69의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 70의 아미노산 서열 또는, 389번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 389번 위치의 아미노산이 F라는 조건으로, 서열번호 70과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 70의 아미노산 서열 또는, 389번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 389번 위치의 아미노산이 F라는 조건으로, 서열번호 70과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 70의 아미노산 서열 또는, 389번 위치의 아미노산이 Y가 아니라는 조건으로, 바람직하게는 389번 위치의 아미노산이 F라는 조건으로, 서열번호 70과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 서열번호 70의 아미노산 서열을 포함한다.

1-데옥시-D-자일룰로스-5-인산 합성효소 활성을 결정하기 위한 기술은 기술자에게 잘 알려져 있다. 예시적인 방법은 예를 들어 문헌[Kuzuyama et al(2000)] 및 문헌[Kudoh et al(2017)]에 기술되어 있다. 1-데옥시-D-자일룰로스-5-인산 합성효소 활성은 예를 들어 다음의 방법에 따라 결정할 수 있다:

(1) DXS 분석으로 1-데옥시-D-자일룰로스-5-인산 합성효소 활성을 결정한다(Kuzuyama et al., 2000): 표준 분석 시스템은 0.5㎖의 최종 부피에 1mM MgCl₂, 2mM　dl-다이티오트레이톨(dithiothreitol), 1mM 피루브산 나트륨, 2mM　dl-글리세르알데하이드 3-인산(glyceraldehyde 3-phosphate) 및 150μM 티아민 이인산(thiamine diphosphate)을 함유하는 100mM Tris-HCl(pH 8.0)로 이루어진다. 37℃에서 완전 분석 혼합물에 효소 용액을 첨가하여 반응을 개시하고, 10분-인큐베이션 후, 1분 동안 100℃에서 인큐베이션하여 반응을 중단한다. 다음, 반응 혼합물을 60분 동안 56℃에서 알칼라인 포스파타제로 처리하여 반응 산물인 DXP를 완전히 탈인산화한다. 생성되는 탈인산화된 화합물인 1-데옥시자일룰로스(DX)의 생산을 Shodex KS-801(8×300㎜) 칼럼(Showa Denko)이 구비된 굴절률 분광기(모델 RI-71; Showa Denko, 일본 도쿄 소재)로 모니터하고, 80℃에서 1㎖/분의 유속으로 H₂O로 용출시킨다. 이 조건 하에서 8.6분에 DX가 용출된다. 화학적으로 합성된 DX를 표준품으로 사용하여 DX 생산량을 정확하게 추산한다. 1유닛의 DXS 활성은 37℃에서 분당 1μmol의 DXP를 생산하는 효소의 양으로 정의한다. DXS에 의한 DXP의 생산을 Senshu Pak NH2-1251-N(4.6×250㎜) 칼럼(Senshu Science, 일본 도쿄 소재)을 사용하여 1㎖/분의 유속으로 100mM KH₂PO₄(pH 3.5)로 용출하면서 고성능 액체 크로마토그래피로 195㎚에서 모니터한다. 이 조건 하에서 DXP는 8.1분에 용출된다.

(2) DXS의 결합 효소 분석(Kudoh et al., 2017): 대장균의 DXR을 결합 효소로 사용한 결합 효소 분석을 사용하여 DXS 활성을 측정한다. 이 분석법에서, DXS 활성에 의해 생성되는 DXP는 추가로 MEP로 전환된다. 이 단계는 NADPH를 소모하기 때문에, 전체 반응을 340㎚에서 분광광도계로 측정할 수 있다. 분석 혼합물은 100mM Tris/HCl(pH 7.8), 10mM MgCl₂, 0.3mM 티아민 피로인산(TPP), 1mM 다이티오트레이톨(DTT), 0.3mM 니코틴아마이드 아데닌 다이뉴클레오타이드 인산(NADPH), 다양한 농도의 피루브산 나트륨(0.05 내지 5mM) 및 D,L-GAP(0.2 내지 2.0mM) 및 DXR(100 또는 50㎎/㎖)을 함유한다. 혼합물을 온도-조절 분광광도계(모델 UV-1800, Shimadzu, 일본 쿄토 소재) 내에서 2분 동안 30℃에서 인큐베이션하고 DXS 시료를 첨가하여(최종 농도 50 또는 25㎎/㎖) 반응을 시작한다. 30℃에서 340㎚에서의 흡광도를 모니터하여 반응을 추적한다.

퓨린 뉴클레오타이드는 DNA와 RNA의 구조적 구성 요소, 에너지 운반체(즉, ATP 및 GTP), 효소 보조인자(즉, NAD⁺　및 NADP⁺)이며, 세포 생리에 필수적인 대사산물이다. 퓨린 뉴클레오타이드의 합성은 D-리보스 5-인산과 ATP로부터 5'-포스포리보실-피로인산(PRPP)의 합성으로 시작된다. PRPP 합성효소(리보스-인산 다이포스포키나제; EC 2.7.6.1)는 D-리보스 5-인산에 ATP의 다이포스포릴기를 전달하는 것을 촉매하면서 동시에 AMP를 형성한다. PRPP 합성효소는 자유-생활하는 유기체들 사이에 어디에나 존재한다. 대부분의 세균은 PRPP 합성효소를 암호화하는 하나의 유전자를 가지며, 진핵생물에는 하나 초과의 유전자가 존재한다. 다음 단계는 바실러스 서브틸리스의 purF에 의해 암호화되는 글루타민 5-포스포리보실-1-피로인산(PRPP) 아미도전달효소(아미도포스포리보실전이효소; EC 2.4.2.14)에 의해 촉매되는 PRPP와 글루타민으로부터의 5-포스포-β-D-리보실아민의 합성이다. 이는 퓨린 드노보 합성의 속도-제한 반응이다. 5-포스포-β-D-리보실아민에서 이노신-5-인산(IMP)의 합성으로 이어지는 추가 10단계들은 pur 오페론에 암호화된 효소들에 의해 촉매된다. pur 오페론은 purR에 의해 암호화된 PurR 억제인자에 의해 전사 수준에서 그리고 영향받는 유전자들의 상류 제어 영역의 특정 DNA 서열인 PurBox에 의해 음성적으로 조절된다. IMP는 AMP와 GMP 합성의 분기점이다. AMP는 PurA와 PurB에 의해 촉매되는 두 개의 효소적 단계에서 IMP로부터 합성되며, GMP는 GuaB와 GuaA에 의해 IMP로부터 합성된다. 퓨린 합성의 효소들을 암호화하는 유전자들 또는 오페론들의 발현은 성장 배지 내 퓨린 염기 및 뉴클레오사이드에 의해 조절된다. PRPP 합성효소, PRPP 아미도전달효소, 아데닐로호박산 합성효소 및 IMP 탈수소효소는 경로의 최종 산물의 피드백 억제에 의해 조절된다. PurR 억제인자는 전사의 개시를 억제한다. 회수 경로(salvage pathway) 또한 하이포잔틴, 구아닌 및 아데닌을 사용하여 해당 모노뉴클레오타이드 AMP 및 GMP를 생성하는데 참여한다.

퓨린 뉴클레오타이드 생합성 경로는 일차 대사에서 퓨린 뉴클레오타이드의 역할 때문에 잘 연구되어 있다. 여기에는 드노보 합성 경로와 회수 경로 둘 다 포함된다. 전사 및 대사 수준에서 퓨린 뉴클레오타이드 생합성 경로의 조절 완화는 퓨린 뉴클레오타이드 생합성 경로를 통한 대사 흐름을 향상시켰으며 이에 따라 퓨린 뉴클레오타이드 생합성 경로에서 직접적으로 발생하는 산물(이노신, 구아노신, 아데노신 및 리보플라빈)의 수율을 증가시켰다. 퓨린 뉴클레오타이드 생합성 경로 산물의 수율을 높이기 위해 유전자 과발현, 유전자 결실 및 돌연변이에 의한 효소의 조절 완화를 포함한 다양한 변형이 성공적으로 사용되었다. 퓨린 흐름의 증가 상에서 양성적 효과가 있는 바실러스 서브틸리스 효소의 예시적인 변형이 아래 표 1에 나열되어 있다.

따라서, 일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소의 발현 및/또는 활성이 증가되도록 (추가) 변형된 것을 특징으로 한다.

일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 아데노신 일인산 생합성 경로에 관련된 적어도 하나의 효소의 발현 및/또는 활성이 증가되도록 (추가) 변형된 것을 특징으로 한다.

퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 효소)는 이것이 발현되는 세균과 같은 종에서 유래할 수 있거나 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)할 수 있다. 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 효소)는 이것이 발현되는 세균과 같은 종에서 유래한다. 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 효소)는 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)한다.

"단백질 발현 증가"는 이렇게 변형된 세균에 의해 생산된 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 보다 구체적으로, "발현 증가"는 이렇게 변형된 세균에 의해 생산된 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포 내 단백질의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.

단백질 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 단백질 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 생합성 경로에 관련된 효소)를 암호화하는 유전자를 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)를 암호화하는 유전자의 카피수를 증가시켜 달성할 수 있다.

또한 단백질 발현의 증가는 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)를 암호화하는 유전자의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다.

또한 단백질 발현의 증가는 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시켜, 예를 들어 본래의 프로모터를 이 프로모터와 비교하여 효소의 더 높은 발현 및 과생성을 가능하게 하는 프로모터로 대체하여, 달성할 수 있다. 사용할 수 있는 프로모터에는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7, ParaBAD, Plac, Ptac 및 Ptrc, 및 코리네파지 BFK20에서 유래한 P F1 프로모터가 포함된다.

또한 단백질 발현의 증가는 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.

일부 실시형태에 따르면, 유전자 카피수의 증가는 숙주 세포에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 유전자를 포함하는 하나 이상(예를 들어 둘 또는 셋)의 외인성 핵산 분자(예를 들어 하나 이상의 벡터)를 세균에 도입하여 달성한다.

일부 실시형태에 따르면, 본 발명의 세균은 퓨린 뉴클레오타이드 생합성 경로에 관련된 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 효소)를 암호화하는 하나 이상(예를 들어 둘, 셋 또는 넷)의 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함한다. 적합하게는, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 퓨린 뉴클레오타이드 생합성 경로에 관련된 상기 효소(예를 들어, 아데노신 생합성 일인산 경로에 관련된 상기 효소)를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함한다. 일부 실시형태에 따르면, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합된다.

퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 포스포리보실아민-글라이신 리가제 활성이 있는 효소, 포스포리보실글라이신아마이드 포르밀전이효소 활성이 있는 효소, 포스포리보실포르밀글라이신아미딘 합성효소 활성이 있는 효소, 포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성이 있는 효소, N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성이 있는 효소, N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성이 있는 효소, 포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소, IMP 사이클로가수분해효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소, 아데닐산 키나제 활성이 있는 효소, ATP 합성효소 활성이 있는 효소, 아데노신 키나제 활성이 있는 효소, IMP 탈수소효소 활성이 있는 효소 및 GMP 합성효소 활성이 있는 효소로 이루어진 군으로부터 선택된 효소일 수 있다.

아데노신 일인산 생합성 경로에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 포스포리보실아민-글라이신 리가제 활성이 있는 효소, 포스포리보실글라이신아마이드 포르밀전이효소 활성이 있는 효소, 포스포리보실포르밀글라이신아미딘 합성효소 활성이 있는 효소, 포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성이 있는 효소, N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성이 있는 효소, N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성이 있는 효소, 포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소, IMP 사이클로가수분해효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소, 아데닐산 키나제 활성이 있는 효소, ATP 합성효소 활성이 있는 효소, 아데노신 키나제 활성이 있는 효소로 이루어진 군으로부터 선택된 효소일 수 있다.

일부 실시형태에 따르면, 퓨린 뉴클레오타이드 생합성 경로(예를 들어 아데노신 일인산 생합성 경로)에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소 및 아데노신 키나제 활성이 있는 효소로 이루어진 군으로부터 선택된다.

일부 실시형태에 따르면, 본 발명의 세균은 퓨린 뉴클레오타이드 생합성 경로에 관련된 하나 이상의 내인성 효소와 관련하여 표 1에 개시된 바와 같은 변형들 중 임의의 하나를 갖도록 (추가) 변형되었다. 특히, 세균은 문제의 효소의 억제인자에 저항하게 만드는 무작위 돌연변이 유발의 결과일 수 있다.

일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 (추가) 변형된 것을 특징으로 한다.

일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 발현이 감소되도록 변형될 수 있다.

일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 상기 적어도 하나의 내인성 효소를 암호화하는 내인성 유전자의 발현 수준이 감소되도록 변형될 수 있다. 내인성 유전자의 발현 수준은 예를 들어 다른 동일한 세균과 비교하여 적어도 50%, 예를 들어 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 감소될 수 있다.

일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 예를 들어 일부 또는 전체 유전자 서열의 결실에 의해 비활성화된다.

일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 상기 효소를 암호화하는 내인성 유전자를 DNA 절단, 바람직하게는 이중-가닥 절단으로 선택적으로 비활성화할 수 있는 희귀-절단 엔도뉴클레아제를 미생물에 도입하거나 미생물에서 발현시키는 것에 의해 비활성화된다. 내인성 유전자를 비활성화하기 위해 본 발명에 따라 사용되는 희귀-절단 엔도뉴클레아제는 예를 들어 전사 활성인자-유사 효과인자(TALE) 뉴클레아제, 메가뉴클레아제, 징크-핑거 뉴클레아제(ZFN) 또는 RNA-가이드 엔도뉴클레아제일 수 있다.

상기 효소를 암호화하는 내인성 유전자를 비활성화하기 위한 하나의 방법은 CRISPRi 시스템을 사용하는 것이다. CRISPRi 시스템은 표적화된 유전자 발현의 억제 또는 게놈 상의 표적 위치를 차단하기 위한 도구로서 개발되었다. CRISPRi 시스템은 촉매적으로 비활성적인 "데드(dead)" Cas9 단백질(dCas9) 및 DNA에 대한 dCas9의 결합 부위를 정의하는 가이드 RNA로 이루어진다.

따라서, 일부 실시형태에 따르면, 상기 효소를 암호화하는 내인성 유전자는 RNA-가이드 엔도뉴클레아제를, 예를 들어 촉매적으로 비활성인 Cas9 단백질 및 세포 조건 하에서 상기 효소를 암호화하는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 단일 가이드 RNA(sgRNA)를, 세균에 도입하거나 세균에서 발현시키는 것에 의해 비활성화된다.

일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 억제에 의해 감소된다.

상기 내인성 효소의 발현의 억제는 이 분야에 알려진 임의의 적합한 수단에 의해 달성될 수 있다. 예를 들어, 발현은 억제 핵산 분자, 예를 들어 안티센스 올리고뉴클레오타이드, 리보자임 또는 간섭 RNA(RNAi) 분자, 예를 들어 마이크로RNA(miRNA), 작은 간섭 RNA(siRNA) 또는 짧은 헤어핀 RNA(shRNA)의 사용을 포함하는 유전자 침묵 기술에 의해 억제될 수 있다.

일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 상기 폴리펩타이드를 암호화하는 내인성 유전자의 전사적 및/또는 번역적 억제에 의해 감소(예를 들어, 억제)된다.

일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 억제 핵산 분자를 세균에 도입하거나 세균에서 발현시키는 것으로 억제된다. 예를 들어, 억제 핵산 분자는 세균에서 상기 억제 핵산 분자의 생산을 유발하는 기능을 하는 프로모터, 예를 들어 유도성 프로모터에 작동 가능하게 연결된 상기 억제 핵산 분자를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자로 도입될 수 있다. 적합하게는, 억제 핵산 분자는 세포 조건 하에서 내인성 효소를 암호화하는 세포 mRNA 및/또는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 것이다. 표적에 따라, 암호화 게놈 DNA의 전사 및/또는 암호화 mRNA의 번역이 억제된다.

일부 실시형태에 따르면, 억제 핵산 분자는 안티센스 올리고뉴클레오타이드, 리보자임 또는 간섭 RNA(RNAi) 분자이다. 바람직하게는, 이러한 핵산 분자는 관심있는 폴리펩타이드 또는 효소를 암호화하는 세포 mRNA 및/또는 게놈 DNA(예를 들어, 폴리펩타이드를 암호화하는 세포 mRNA 및/또는 게놈 DNA)의 보체의 적어도 10개의 연속적인 뉴클레오타이드를 포함한다.

일부 실시형태에 따르면, 억제 핵산은 안티센스 올리고뉴클레오타이드이다. 이러한 안티센스 올리고뉴클레오타이드는 세포 조건 하에서 폴리펩타이드를 암호화하는 세포 mRNA 및/또는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 핵산 분자(DNA 또는 RNA)이다.

일부 실시형태에 따르면, 억제 핵산 분자는 리보자임, 예를 들어 망치머리형 리보자임이다. 리보자임 분자는 mRNA 전사체를 촉매적으로 절단하여 폴리펩타이드의 번역을 차단하도록 설계된다.

일부 실시형태에 따르면, 억제 핵산 분자는 간섭 RNA(RNAi) 분자이다. RNA 간섭은 RNA 분자가 발현을 억제하여, 전형적으로 특정 mRNA를 파괴하는 생물학적 과정이다. 예시적인 RNAi 분자의 유형은 마이크로RNA(miRNA), 작은 간섭 RNA(siRNA) 및 짧은 헤어핀 RNA(shRNA)를 포함한다. 일부 실시형태에 따르면, RNAi 분자는 miRNA이다. 일부 실시형태에 따르면, RNAi 분자는 siRNA이다. 일부 실시형태에 따르면, RNAi 분자는 shRNA이다.

일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 활성이 감소되도록 변형되었다.

퓨린 뉴클레오타이드 분해 경로에 관련된 내인성 효소의 활성 감소는 이 분야에 알려진 임의의 적합한 수단에 의해 달성될 수 있다. 예를 들어, 활성은 활성의 감소 또는 손실을 초래하는 효소의 활성 부위에 하나 이상의 돌연변이를 도입하는 것에 의해 감소될 수 있다. 따라서, 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 내인성 효소의 활성은 활성의 감소 또는 손실을 초래하는 적어도 하나의 활성-부위 돌연변이에 의해 감소된다. 적어도 하나의 활성-부위 돌연변이는 예를 들어 적어도 하나의 비-보존성 아미노산의 치환일 수 있다.

일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 효소는 퓨린 뉴클레오사이드 포스포릴라제 및 아데노신-포스포리보실전이효소로 이루어진 군으로부터 선택된다. 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 퓨린 뉴클레오사이드 포스포릴라제이다. 일부 실시형태에 따르면, 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 아데노신-포스포리보실전이효소이다.

일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 (추가) 변형되었다.

일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 상기 적어도 하나의 내인성 효소를 암호화하는 내인성 유전자의 발현 수준이 감소되도록 변형될 수 있다. 내인성 유전자의 발현 수준은 예를 들어 다른 동일한 세균과 비교하여 적어도 50%, 예를 들어 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 감소될 수 있다.

상기 효소를 암호화하는 내인성 유전자를 비활성화하기 위한 하나의 방법은 CRISPRi 시스템을 사용하는 것이다. CRISPRi 시스템은 표적화된 유전자 발현의 억제 또는 게놈 상의 표적 위치를 차단하기 위한 도구로서 개발되었다. CRISPRi 시스템은 촉매적으로 비활성적인 "데드" Cas9 단백질(dCas9) 및 DNA에 대한 dCas9의 결합 부위를 정의하는 가이드 RNA로 이루어진다.

일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 억제에 의해 감소된다.

일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 상기 폴리펩타이드를 암호화하는 내인성 유전자의 전사적 및/또는 번역적 억제에 의해 감소(예를 들어, 억제)된다.

일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 상기 적어도 하나의 내인성 효소의 발현은 억제 핵산 분자를 세균에 도입하거나 세균에서 발현시키는 것으로 억제된다. 예를 들어, 억제 핵산 분자는 세균에서 상기 억제 핵산 분자의 생산을 유발하는 기능을 하는 프로모터, 예를 들어 유도성 프로모터에 작동 가능하게 연결된 상기 억제 핵산 분자를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자로 도입될 수 있다. 적합하게는, 억제 핵산 분자는 세포 조건 하에서 내인성 효소를 암호화하는 세포 mRNA 및/또는 게놈 DNA와 특이적으로 혼성화(예를 들어, 결합)하는 것이다. 표적에 따라, 암호화 게놈 DNA의 전사 및/또는 암호화 mRNA의 번역이 억제된다.

일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소의 활성이 감소되도록 변형되었다.

구아노신 일인산 생합성 경로에 관련된 내인성 효소의 활성 감소는 이 분야에 알려진 임의의 적합한 수단에 의해 달성될 수 있다. 예를 들어, 활성은 활성의 감소 또는 손실을 초래하는 효소의 활성 부위에 하나 이상의 돌연변이를 도입하는 것에 의해 감소될 수 있다. 따라서, 일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 내인성 효소의 활성은 활성의 감소 또는 손실을 초래하는 적어도 하나의 활성-부위 돌연변이에 의해 감소된다. 적어도 하나의 활성-부위 돌연변이는 예를 들어 적어도 하나의 비-보존성 아미노산의 치환일 수 있다.

일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 효소는 IMP 탈수소효소 및 GMP 합성효소로 이루어진 군으로부터 선택된다.

일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 효소는 IMP 탈수소효소이다.

일부 실시형태에 따르면, 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 효소는 GMP 합성효소이다.

CYP450은 광범위한 산화 반응을 촉매하는 다양한 헴-함유 효소의 군이다. 또한 사이토크롬 P450 모노옥시게나제(CYP450)는 아이소펜테닐아데닌-유형의 사이토키닌의 수산화를 촉매한다. 애기장대에는 아이소펜테닐아데닌-유형의 사이토키닌의 수산화를 위한 2가지 사이토크롬 P450 모노옥시게나제인 CYP735A1 및 CYP735A2가 존재한다. CYP735A는 iP-뉴클레오타이드의 입체-특이적 수산화 반응을 촉매하며, 낮은 친화력으로 iP-뉴클레오사이드 또는 iP를 수산화하여 tZ를 생합성한다(Takei et al., 2004b). 식물 기원의 대부분의 CYP450은 소포체(ER)에 막-고정되어 있다. 사이토크롬 P450 모노옥시게나제는 로도코커스 파시안스(Rhodococcus fascians)와 같은 세균에도 존재한다. 사이토크롬 P450은 일반적으로 보조 단백질(들)의 특성에 따라 2가지의 넓은 부류로 나뉜다. I류의 P450은 미토콘드리아의 막과 세균에서 발견되며, II류의 사이토크롬 P450은 포유동물 세포의 간 마이크로솜의 효소로 대표된다. I류의 P450은 플라빈 아데닌 다이뉴클레오타이드(FAD)-함유 환원효소, 철-황 단백질(페레독신) 및 P450을 포함하는 3-성분 시스템이다. II류의 사이토크롬 P450은 FAD-함유 플라빈 모노뉴클레오타이드(FMN)-함유 NADPH-의존성 사이토크롬 P450 환원효소 및 P450으로 이루어진다. III류 및 IV류의 CYP450도 세균에서 기술되었지만, I류는 세균에서 가장 흔한 CYP450이다. 슈도모나스 푸티다(Pseudomonas putida) P450cam의 가장 잘 특성화된 세균성 사이토크롬 P450 모노옥시게나제 시스템은 푸티다레독신 환원효소; 중개성 철-황 단백질인 푸티다레독신; 및 사이토크롬 P450cam의 3가지 가용성 단백질로 이루어진다. CYP450 Fas1은 선형 플라스미드의 fas 영역에 암호화되어 있고 로도코커스 파시안스에 의해 생산되는 사이토키닌을 수산화하는 것으로 생각된다(Frebort et al., 2011).

사이토크롬 P450 모노옥시게나제(CYP450)는 iP-뉴클레오타이드를 수산화하여 AMP 및 DMAPP로부터 3개의 효소적 단계에서 트랜스-제아틴을 생산할 수 있다. 효소는 iPRMP의 프레닐 측쇄를 입체-특이적으로 수산화할 수 있고 이에 따라 tZRMP로의 우회로를 만들 수 있으며, 이는 추가로 활성화되어 트랜스-제아틴을 생산할 수 있다.

따라서, 일부 실시형태에 따르면, 본 발명의 세균은 변형을 수반하지 않는 다른 동일한 세균과 비교하여 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 (추가) 변형된 것을 특징으로 한다.

"단백질 발현 증가"는 이렇게 변형된 세균에 의해 생산된 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 보다 구체적으로, "발현 증가"는 이렇게 변형된 세균에 의해 생산된 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포 내 단백질의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.

단백질 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 단백질 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 유전자를 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 유전자의 카피수를 증가시켜 달성할 수 있다.

또한 단백질 발현의 증가는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 유전자의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다.

또한 단백질 발현의 증가는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 유전자에 작동 가능하게 연결된 프로모터의 강도를 증가시켜 달성할 수 있다. 사용할 수 있는 프로모터에는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7, ParaBAD, Plac, Ptac 및 Ptrc, 및 코리네파지 BFK20에서 유래한 P F1 프로모터가 포함된다.

또한 단백질 발현의 증가는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.

일부 실시형태에 따르면, 본 발명의 세균은 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 하나 이상(예를 들어 둘, 셋 또는 넷)의 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자(예를 들어 벡터)를 포함한다. 적합하게는, 외인성 핵산 분자는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하고 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 더 포함한다. 일부 실시형태에 따르면, 외인성 핵산 분자는 세균의 게놈에 안정적으로 통합된다.

사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래될 수 있거나 이것이 발현되는 것과 다른 종에서 유래(즉, 이종성)될 수 있다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 이것이 발현되는 세균과 같은 종에서 유래된다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 이것이 발현되는 것과 다른 종에서 유래된다(즉, 이종성). 예를 들어, 세균이 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드를 암호화하는 내인성 유전자를 갖지 않는 경우, 상기 세균에서 발현되는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 상기 세균에 대해 이종일 것이다.

일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 세균성 폴리펩타이드이다. "사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 세균성 폴리펩타이드"는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드가 로도코커스 파시안스와 같은 세균으로부터 자연적으로 유래함을 의미한다. 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 세균성 폴리펩타이드의 비-제한적 예시는 서열번호 93에 제시되어 있다.

일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 식물 폴리펩타이드이다. "사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 식물 폴리펩타이드"는 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드가 애기장대와 같은 식물로부터 자연적으로 유래함을 의미한다. 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 식물 폴리펩타이드의 비-제한적 예시는 서열번호 94 및 95에 제시되어 있다.

본 발명에 따른 사용을 위한 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 예를 들어 i) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드일 수 있다.

일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 93의 아미노산 서열 또는 서열번호 93과 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 93의 아미노산 서열 또는 서열번호 93과 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 93의 아미노산 서열 또는 서열번호 93과 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 93의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 94의 아미노산 서열 또는 서열번호 94와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 94의 아미노산 서열 또는 서열번호 94와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 94의 아미노산 서열 또는 서열번호 94와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 94의 아미노산 서열을 포함한다.

일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 95의 아미노산 서열 또는 서열번호 95와 적어도 70%, 예를 들어 적어도 75%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 95의 아미노산 서열 또는 서열번호 95와 적어도 80%, 예를 들어 적어도 85%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 95의 아미노산 서열 또는 서열번호 95와 적어도 90%, 예를 들어 적어도 95%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에 따르면, 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 서열번호 95의 아미노산 서열을 포함한다.

본 발명에 따른 세균은 임의의 적합한 세균으로부터 생산될 수 있다. 세균은 그람-양성 또는 그람-음성일 수 있다. 그람-음성 세균성 숙주 세포의 비-제한적 예시에는 에스체리치아, 에르위니아, 클렙시엘라 및 시트로박터 속의 종들이 포함된다. 그람-양성 세균성 숙주 세포의 비-제한적 예시에는 바실러스, 락토코커스, 락토바실러스, 클로스트리듐, 코리네박테리움, 스트렙토마이세스(Streptomyces), 스트렙토코커스 및 셀룰로모나스(Cellulomonas) 속의 종들이 포함된다. 일부 실시형태에 따르면, 본 발명의 세균은 그람-양성이다. 일부 실시형태에 따르면, 본 발명의 세균은 그람-음성이다.

일부 실시형태에 따르면, 본 발명의 세균은 장내세균과, 바실러스과, 유산균과 및 코리네박테리움과로 이루어진 군으로부터 선택된 과(family)의 세균이다. 일부 실시형태에 따르면, 재조합 숙주 세포는 장내세균과의 세균이다. 일부 실시형태에 따르면, 재조합 숙주 세포는 바실러스과의 세균이다. 일부 실시형태에 따르면, 재조합 숙주 세포는 코리네박테리움과의 세균이다.

일부 실시형태에 따르면, 본 발명의 세균은 바실러스, 락토코커스, 락토바실러스, 클로스트리듐, 코리네박테리움, 지오바실러스, 써모안에어로박테리움, 스트렙토코커스, 슈도모나스, 스트렙토마이세스, 에스체리치아, 쉬겔라, 아시네토박터, 시트로박터, 살모넬라, 클렙시엘라, 엔테로박터, 에르위니아, 클루이베라, 세라티아, 세데세아, 모르가넬라, 하프니아, 에드워드시엘라, 프로비덴시아, 프로테우스 또는 예르시니아 속의 세균일 수 있는 세균이다.

일부 실시형태에 따르면, 본 발명의 세균은 바실러스 속의 세균이다. 바실러스 속의 세균의 비-제한적 예시는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스, 바실러스 인체니포미스(Bacillus licheniformis) 및 바실러스 모자벤시스(Bacillus mojavensis)이다. 일부 실시형태에 따르면, 본 발명의 세균은 바실러스 서브틸리스이다.

일부 실시형태에 따르면, 본 발명의 세균은 코리네박테리움 속의 세균이다. 코리네박테리움 속의 세균의 비-제한적 예시는 코리네박테리움 글루타미쿰 및 코리네박테리움 스테이셔니스이다. 일부에 따르면, 본 발명의 세균은 코리네박테리움 글루타미쿰이다. 일부에 따르면, 본 발명의 세균은 코리네박테리움 스테이셔니스이다. 본 발명의 맥락에서, 코리네박테리움 스테이셔니스 및 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes)는 같은 종을 의미하며 호환 가능하게 사용될 수 있다.

일부 실시형태에 따르면, 본 발명의 세균은 에스체리치아 속의 세균이다. 에스체리치아 속의 세균의 비-제한적 예시는 대장균이다. 일부에 따르면, 본 발명의 세균은 대장균이다.

위에서 언급한 바와 같이, 본 발명의 세균은 본 명세서에 상세하게 기술된 하나 이상의 폴리펩타이드를 발현하도록 변형되며, 이는 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자, 예를 들어 DNA 분자가 세균에 도입되었음을 의미할 수 있다. 따라서, 본 발명의 세균은 문제의 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 외인성 핵산 분자, 예를 들어 DNA 분자를 포함할 수 있다. 세균 세포에 외인성 핵산 분자, 예를 들어 DNA 분자를 도입하기 위한 기술은 이 분야의 기술자들에게 잘 알려져 있으며 특히 형질전환(예를 들어, 열충격 또는 자연 형질전환)을 포함한다.

세균에서 폴리펩타이드의 (과)발현을 촉진하기 위해, 외인성 핵산 분자는 적합한 조절 요소, 예를 들어 세균 세포에서 mRNA 분자의 생산을 유발하는 기능을 하고 상기 폴리펩타이드를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 프로모터를 포함할 수 있다.

본 발명에 따른 유용한 프로모터는 주어진 숙주 세포에서 mRNA 분자의 생산을 유발하는 기능을 하는 임의의 알려진 프로모터이다. 많은 이러한 프로모터들이 기술자에게 알려져 있다. 이러한 프로모터에는 일반적으로 다른 유전자와 관련된 프로모터 및/또는 임의의 세균에서 분리된 프로모터가 포함된다. 단백질 발현을 위한 프로모터의 사용은 분자 생물학 분야의 기술자들에게 일반적으로 알려져 있으며, 예를 들어 문헌[Sambrook et al., Molecular cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 1989]을 참조할 수 있다. 사용된 프로모터는 유도성, 예를 들어 온도-유도성 프로모터(예를 들어, 온도-민감성 람다 억제인자 c1857에 의해 제어될 수 있는 pL 또는 pR 파지 람다 프로모터)일 수 있다. 프로모터의 맥락에서 사용된 용어 "유도성"은 온도의 변화 또는 화학 물질("화학적 유도제")의 존재와 같이 자극이 존재하는 경우에만 프로모터가 작동 가능하게 연결된 뉴클레오타이드 서열의 전사를 지시함을 의미한다. 본 명세서에서 사용된 바와 같이, 본 발명에 따른 "화학적 유도"는 숙주 세포에 외인성 또는 내인성 물질(거대 분자, 예를 들어 단백질 또는 핵산을 포함함)의 물리적 적용을 의미한다. 이는 숙주 세포에 존재하는 표적 프로모터가 전사율을 증가시키게 하는 효과를 갖는다. 대안적으로는, 사용된 프로모터는 구성적일 수 있다. 프로모터의 맥락에서 사용된 용어 "구성적"은 프로모터가 자극(예를 들어, 열충격, 화학적인 것 등)의 부재 하에서 작동 가능하게 연결된 뉴클레오타이드 서열의 전사를 지시할 수 있음을 의미한다.

온도 유도 시스템은 예를 들어 열민감성 억제인자에 의해 억제되는 프로모터를 사용함에 따라 작동한다. 이러한 억제인자는 낮은 온도, 예를 들어 30℃에서 활성이지만, 37℃에서는 올바르게 접힐 수 없어 비활성이다. 따라서 이러한 회로는 또한 억제인자와 함께 유전자의 게놈 통합에 의해 관심있는 유전자를 직접적으로 조절하는데 사용될 수 있다. 이러한 온도-유도성 발현 시스템의 예시는 pL 및/또는 pRλ 파지 프로모터를 기반으로 하며, 이는 열민감성 cI857 억제인자에 의해 조절된다. 게놈 통합 DE3 시스템과 유사하게, T7 RNA 중합효소 유전자의 발현 또한 온도-제어 프로모터 시스템을 사용하여 제어할 수 있으며, 관심있는 유전자의 발현은 T7 프로모터를 사용하여 제어할 수 있다.

세균에서 기능하는 프로모터의 비-제한적 예시에는 구성적 및 유도성 프로모터, 예를 들어 T7 프로모터, 베타-락타마제(lactamase) 및 락토스 프로모터 시스템; 알칼라인 포스파타제(phoA) 프로모터, 트립토판(trp) 프로모터 시스템, 테트라사이클린 프로모터, 람다-파지 프로모터, 리보솜성 단백질 프로모터; 및 하이브리드 프로모터, 예를 들어 tac 프로모터가 포함된다. 다른 세균성 및 합성적 프로모터 또한 적합하다.

프로모터 이외에, 외인성 핵산 분자는 5' 비번역 영역(5' UTR) 및 3' 비번역 영역(3' UTR)으로부터 선택된 적어도 하나의 조절 요소를 더 포함할 수 있다. 원핵생물 및 진핵생물에서 유래된 많은 이러한 5' UTR 및 3' UTR이 기술자에게 잘 알려져 있다. 이러한 조절 요소에는 일반적으로 다른 유전자와 관련된 5' UTR 및 3' UTR 및/또는 임의의 세균에서 분리된 5' UTR 및 3' UTR이 포함된다.

일반적으로, 5' UTR은 샤인-달가노 서열로도 불리는 일반적으로 개시 코돈에서 상류에 있는 3 내지 10개의 염기 쌍의 리보솜 결합 부위(RBS)를 함유한다.

외인성 핵산 분자는 벡터 또는 벡터의 일부, 예를 들어 발현 벡터일 수 있다. 일반적으로, 이러한 벡터는 세균 세포 내에서 염색체 외적으로 존재하며, 이는 세균의 핵 또는 뉴클레오이드(nucleoid) 영역의 외부에서 발견됨을 의미한다.

외인성 핵산 분자가 세균의 게놈에 안정적으로 통합되는 것 또한 본 발명에서 고려된다. 예를 들어 상동성 재조합에 의한 숙주 세포 게놈으로의 안정적인 통합을 위한 수단이 기술자에게 잘 알려져 있다.

발명의 방법

또한 본 발명은 적합한 배양 배지에서 적합한 배양 조건 하에서 본 발명에 따른 세균을 배양하는 단계를 포함하는 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법을 제공한다.

방법은 배양 배지에서 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 수집하는 단계를 더 포함할 수 있다.

일부 실시형태에 따르면, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 트랜스-제아틴(tZ), 트랜스-제아틴 리보사이드(tZR), N ⁶ -(D2-아이소펜테닐)아데닌(iP), N ⁶ -(다이메틸알릴)아데노신(iPR), 다이하이드로제아틴(DZ), 리보실 다이하이드로제아틴(DZR) 및 이들의 조합으로 이루어진 군으로부터 선택된다.

일부 실시형태에 따르면, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 각각 트랜스-제아틴(tZ) 및 트랜스-제아틴 리보사이드(tZR)이다.

사용되는 배양 배지는 문제의 세균 세포를 배양하기에 적합한 임의의 통상적인 배지일 수 있고, 선행기술의 원리에 따라 구성될 수 있다. 배지는 일반적으로 각 세균의 성장 및 생존에 필요한 모든 영양소, 예를 들어 탄소 및 질소원 및 기타 무기염을 함유한다. 적합한 배지, 예를 들어 최소 또는 복합 배지를 상업적 공급업체로부터 구하거나 공개된 제조법, 예를 들어 미국균주은행(American Type Culture Collection: ATCC)의 균주 카탈로그에 따라 제조할 수 있다. 기술자에게 잘 알려진 비-제한적 표준 배지에는 루리아 베르타니(LB) 배지, 사부로드 덱스트로스(SD) 배지, MS 배지, 효모 펩톤 덱스트로스, BMMY, GMMY 또는 효모 맥아 추출물(YM) 배지가 포함되며, 이들 모두 상업적으로 이용가능하다. 세균 세포, 예를 들어, 바실러스 서브틸리스, 락토코커스 락티스 또는 대장균 세포를 배양하는데 적합한 배지의 비-제한적 예시에는 최소 배지 및 풍부 배지 예를 들어 루리아 배지(LB), M9 배지, M17 배지, SA 배지, MOPS 배지, 테리픽 배지(Terrific Broth), YT 등이 포함된다.

탄소원은 이 분야에 알려진 임의의 적합한 탄소 기질, 특히 미생물의 배양 및/또는 발효에 일반적으로 사용되는 임의의 탄소 기질일 수 있다. 적합한 발효가능한 탄소 기질의 비-제한적 예시에는 탄수화물(예를 들어, C5 당, 예를 들어 아라비노스 또는 자일로스, 또는 C6 당, 예를 들어 글루코스), 글리세롤, 글리세린, 아세트산염, 다이하이드록시아세톤, 단일-탄소원, 메탄올, 메탄, 오일, 동물성 지방, 동물성 오일, 식물성 오일, 지방산, 지질, 인지질, 글리세로지질, 모노글리세리드, 다이글리세리드, 트리글리세리드, 재생가능한 탄소원, 폴리펩타이드(예를 들어, 미생물성 또는 식물성 단백질 또는 펩타이드), 효모 추출물, 효모 추출물의 성분, 카사미노산 또는 전술한 것 중 둘 이상의 임의의 조합이 포함된다.

질소원으로서, 다양한 암모늄염, 예를 들어 암모니아 및 황산암모늄, 기타 질소 화합물, 예를 들어 아민, 천연 질소원, 예를 들어 펩톤, 대두-가수분해물 및 소화된 발효 미생물이 사용될 수 있다. 미네랄로서, 일인산칼륨, 황산마그네슘, 염화나트륨, 황산제1철, 황산망간, 염화칼슘 등이 사용될 수 있다.

아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체, 예를 들어 각각 트랜스-제아틴(tZ) 및 트랜스-제아틴 리보사이드(tZR)의 생산을 더 개선하기 위해, 배양 배지에 아데닌 또는 아데노신 공급원, 예를 들어 황산 아데닌을 보충할 수 있다. 따라서, 일부 실시형태에 따르면, 배양 배지는 황산 아데닌을 포함한다. 배양 배지 내 황산 아데닌의 농도는 일반적으로 약 0.1g/ℓ 내지 약 4g/ℓ, 예를 들어 약 1g/ℓ 내지 약 3.5g/ℓ의 범위일 수 있다. 일부 실시형태에 따르면, 배양 배지 내 황산 아데닌의 농도는 약 2.5g/ℓ 내지 약 3.5g/ℓ의 범위이다. 그러나, 다른 아데닌 또는 아데노신 공급원, 예를 들어 효모 추출물 또한 본 발명에 따른 사용을 위해 고려된다.

배양은 바람직하게는 약 20 내지 약 45℃, 예를 들어 약 30 내지 38℃, 예를 들어 약 37℃의 온도로 호기 조건 하에서, 예를 들어 진탕 배양을 사용하여, 그리고 에어레이션과 함께 교반 배양을 사용하여 수행할 수 있다. 일부 실시형태에 따르면, 배양은 약 30 내지 38℃, 예를 들어 약 37℃의 온도에서 수행한다. 배양 pH는 일반적으로 5 초과, 예를 들어, 약 6 내지 약 8, 바람직하게는 약 6.5 내지 약 7.5, 보다 바람직하게는 약 6.8 내지 약 7.2의 범위이다. 일부 실시형태에 따르면, 배양은 약 6 내지 약 8의 pH에서 수행한다. 배양 pH는 암모니아, 탄산칼슘, 다양한 산, 다양한 염기 및 완충제로 조정할 수 있다. 배양은 10 내지 70시간의 범위, 예를 들어 10 내지 24시간의 범위 또는 10 내지 48시간의 범위의 기간 동안 수행할 수 있다.

배양 후, 원심분리 또는 막 여과를 사용하여 고형물 예를 들어 세포를 배양 배지로부터 제거할 수 있다. 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 배지에서 화학적 화합물을 분리 및 정제하기 위한 통상적인 방법으로 수집할 수 있다. 잘 알려진 정제 공정에는 원심분리 또는 여과, 침전, 이온 교환, 크로마토그래피 방법, 예를 들어 이온 교환 크로마토그래피 또는 겔 여과 크로마토그래피 및 결정화 방법이 포함되지만 이로 제한되지 않는다.

따라서 본 발명은 본 명세서에 상세하게 기술된 방법에 의해 얻을 수 있는 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 제공한다.

약어

iP - N ⁶ -(D2-아이소펜테닐)아데닌

iPR - N ⁶ -(D2-아이소펜테닐)아데닌 리보사이드, 일명 N ⁶ -(D2 -아이소펜테닐)아데노신

tZ - 트랜스-제아틴

tZR - 트랜스-리보실제아틴, 일명 트랜스-제아틴 리보사이드

DZ - 다이하이드로제아틴

DZR - 리보실 다이하이드로제아틴, 일명 다이하이드로제아틴 리보사이드

cZ - 시스-제아틴

MVA 경로 - 메발론산 생합성 경로

MEP 경로 - 메틸에리스리톨 인산 생합성 경로

DMAPP - 다이메틸알릴 이인산

HMBDP - 1-하이드록시-2-메틸-2-부테닐 4-이인산

DXP - 1-데옥시-D-자일룰로스-5-인산

DXS - 1-데옥시-D-자일룰로스-5-인산 합성효소; DXP-합성효소(EC 2.2.1.7)

tZRMP - 트랜스-제아틴 리보사이드 5'-일인산

iPRMP - N ⁶ -(D2-아이소펜테닐)아데닌 리보사이드 5'-일인산

DZRMP - 다이하이드로제아틴 리보사이드 5'-일인산

cZRMP - 시스-제아틴 리보사이드 5'-일인산

IPT - 아데닐레이트 아이소펜테닐전이효소(EC 2.5.1.27)

LOG - 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 'Lonely guy'(EC 3.2.2.n1)

CYP450 - 사이토크롬 P450 모노옥시게나제

기타 특정 정의

본 명세서에 사용된 "아데닐레이트 아이소펜테닐전이효소 활성이 있는 폴리펩타이드" 또는 "아데닐레이트 아이소펜테닐전이효소 활성을 갖는 폴리펩타이드"는 다음의 반응을 촉매하는 폴리펩타이드를 의미한다: 다이메틸알릴 이인산 + AMP <=> 이인산 + N(6)-(다이메틸알릴)아데노신 5'-인산(EC 2.5.1.27) 및 선택적으로 1-하이드록시-2-메틸-2-부테닐 4-이인산 + AMP <=> 이인산 + 트랜스-제아틴 리보사이드 5'-인산. 이러한 폴리펩타이드의 비-제한적 예시는 서열번호 1 내지 33에 제공된다.

본 명세서에 사용된 "사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드" 또는 "사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성을 갖는 폴리펩타이드"는 다음의 반응을 촉매하는 폴리펩타이드를 의미한다: N(6)-(델타(2)-아이소펜테닐)-아데노신 5'-인산 + H(2)O <=> N(6)-(다이메틸알릴)아데닌 + D-리보스 5'-인산(EC 3.2.2.n1). 이러한 폴리펩타이드의 비-제한적 예시는 서열번호 34 내지 62에 제공된다.

본 명세서에 사용된 "1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드" 또는 "1-데옥시-D-자일룰로스-5-인산 합성효소 활성을 갖는 폴리펩타이드"는 다음의 반응을 촉매하는 폴리펩타이드를 의미한다: 피루브산 + D-글리세르알데하이드 3-인산 <=> 1-데옥시-D-자일룰로스 5-인산 + CO(2)(EC 2.2.1.7). 이러한 폴리펩타이드의 비-제한적 예시는 서열번호 63 내지 70에 제공된다.

본 명세서에 사용된 "리보스-인산 다이포스포키나제 활성이 있는 효소" 또는 "리보스-인산 다이포스포키나제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + D-리보스 5-인산 <=> AMP + 5-포스포-알파-D-리보스 1-이인산(EC 2.7.6.1). 리보스-인산 다이포스포키나제 활성이 있는 효소는 세균성 유전자 prs 또는 이의 동원체(ortholog)에 의해 암호화된다.

본 명세서에 사용된 "아미도포스포리보실전이효소 활성이 있는 효소" 또는 "아미도포스포리보실 전이효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 5-포스포-베타-D-리보실아민 + 이인산 + L-글루탐산염 <=> L-글루타민 + 5-포스포-알파-D-리보스 1-이인산 + H₂O(EC 2.4.2.14). 아미도포스포리보실전이효소 활성이 있는 효소는 세균성 유전자 purF 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소" 또는 "포르밀테트라하이드로엽산 디포르밀라제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 10-포르밀테트라하이드로엽산 + H₂O <=> 포름산염 + 테트라하이드로엽산(EC 3.5.1.10). 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소는 세균성 유전자 purU 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "포스포리보실아민-글라이신 리가제 활성이 있는 효소" 또는 "포스포리보실아민-글라이신 리가제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 5-포스포-베타-D-리보실아민 + 글라이신 <=> ADP + 인산염 + N¹-(5-포스포-베타-D-리보실)글라이신아마이드(EC 6.3.4.13). 포스포리보실아민-글라이신 리가제 활성이 있는 효소는 세균성 유전자 purD 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "포스포리보실글라이신아마이드 포르밀전이효소 활성이 있는 효소" 또는 "포스포리보실글라이신아마이드 포르밀전이효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 10-포르밀테트라하이드로엽산 + N¹-(5-포스포-베타-D-리보실)글라이신아마이드 <=> 테트라하이드로엽산 + N²-포르밀-N¹-(5-포스포-베타-D-리보실)글라이신아마이드(EC 2.1.2.2). 포스포리보실글라이신아마이드 포르밀전이효소 활성이 있는 효소는 세균성 유전자 purT 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "포스포리보실포르밀글라이신아미딘 합성효소 활성이 있는 효소" 또는 "포스포리보실포르밀글라이신아미딘 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + N²-포르밀-N¹-(5-포스포-베타-D-리보실)글라이신아마이드 + L-글루타민 + H₂O <=> ADP + 인산염 + 2-(포름아미도)-N¹-(5-포스포-베타-D-리보실)아세트아미딘 + L-글루탐산염(EC 6.3.5.3). 포스포리보실포르밀글라이신아미딘 합성효소 활성이 있는 효소는 세균성 유전자 purL 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성이 있는 효소" 또는 "포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 2-(포름아미도)-N¹-(5-포스포-베타-D-리보실)아세트아미딘 <=> ADP + 인산염 + 5-아미노-1-(5-포스포-베타-D-리보실)이미다졸(EC 6.3.3.1). 포스포리보실포르밀글라이신아미딘 사이클로-리가제 활성이 있는 효소는 세균성 유전자 purM 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성이 있는 효소" 또는 "N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 5-아미노-1-(5-포스포-D-리보실)이미다졸 + HCO₃ ^- <=> ADP + 인산염 + 5-카복시아미노-1-(5-포스포-D-리보실)이미다졸(EC 6.3.4.18). N5-카복시아미노이미다졸 리보뉴클레오타이드 합성효소 활성이 있는 효소는 세균성 유전자 purK 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성이 있는 효소" 또는 "N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 5-카복시아미노-1-(5-포스포-D-리보실)이미다졸 <=> 5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복시산(EC 5.4.99.18). N5-카복시아미노이미다졸 리보뉴클레오타이드 뮤타제 활성이 있는 효소는 세균성 유전자 purE 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성이 있는 효소" 또는 "포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복시산 + L-아스파르트산염 <=> ADP + 인산염 + (S)-2-(5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복사미도)숙신산(EC 6.3.2.6). 포스포리보실아미노이미다졸숙시노카복사미드 합성효소 활성이 있는 효소는 세균성 유전자 purC 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "아데닐로호박산 분해효소 활성이 있는 효소" 또는 "아데닐로호박산 분해효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: (S)-2-(5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복사미도)숙신산 <=> 푸마르산염 + 5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복사미드(EC 4.3.2.2). 아데닐로호박산 분해효소 활성이 있는 효소는 세균성 유전자 purB 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소" 또는 "포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 10-포르밀테트라하이드로엽산 + 5-아미노-1-(5-포스포-D-리보실)이미다졸-4-카복사미드 <=> 테트라하이드로엽산염 + 5-포름아미도-1-(5-포스포-D-리보실)이미다졸-4-카복사미드(EC 2.1.2.3). 포스포리보실아미노이미다졸-카복사미드 포르밀전이효소 활성이 있는 효소는 세균성 유전자 purH 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "IMP 사이클로가수분해효소 활성이 있는 효소" 또는 "IMP 사이클로가수분해효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: IMP + H₂O <=> 5-포름아미도-1-(5-포스포-D-리보실)이미다졸-4-카복사미드(EC 3.5.4.10). IMP 사이클로가수분해효소 활성이 있는 효소는 예를 들어 세균성 유전자 purH 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "아데닐로호박산 합성효소 활성이 있는 효소" 또는 "아데닐로호박산 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: GTP + IMP + L-아스파르트산염 <=> GDP + 인산염 + N⁶-(1,2-다이카복시에틸)-AMP(EC 6.3.4.4). 아데닐로호박산 합성효소 활성이 있는 효소는 세균성 유전자 purA 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "아데닐산 키나제 활성이 있는 효소" 또는 "아데닐산 키나제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + AMP <=> 2 ADP(EC 2.7.4.3). 아데닐산 키나제 활성이 있는 효소는 세균성 유전자 adk 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "ATP 합성효소 활성이 있는 효소" 또는 "ATP 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + H₂O + H⁺(세포기질) <=> ADP + 인산염 + H⁺(세포주변질)(EC 3.6.3.14). ATP 합성효소 활성이 있는 효소는 예를 들어 세균성 atp 오페론(atpB, atpF, atpE, atpD, atpG, atpA, atpH 및 atpC 유전자 포함) 또는 이의 동원체에 의해 암호화된 ATP 합성효소 F₀ 또는 F₁ 복합체이다.

본 명세서에 사용된 "아데노신 키나제 활성이 있는 효소" 또는 "아데노신 키나제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + 아데노신 <=> ADP + AMP(EC 2.7.1.20). 아데노신 키나제 활성이 있는 효소는 세균성 유전자 adk 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "IMP 탈수소효소 활성이 있는 효소" 또는 "IMP 탈수소효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 이노신 5'-인산 + NAD⁺ + H₂O <=> 잔토신 5'-인산 + NADH(EC 1.1.1.205). IMP 탈수소효소 활성이 있는 효소는 세균성 유전자 guaB 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "GMP 합성효소 활성이 있는 효소" 또는 "GMP 합성효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: ATP + XMP + L-글루타민 + H₂O <=> AMP + 이인산염 + GMP + L-글루탐산염(EC 6.3.5.2). GMP 합성효소 활성이 있는 효소는 세균성 유전자 guaA 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소" 또는 "퓨린 뉴클레오사이드 포스포릴라제 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: 퓨린 뉴클레오사이드 + 인산염 <=> 퓨린 + 알파-D-리보스 1-인산(EC 2.4.2.1). 퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소는 예를 들어 세균성 유전자 deoD 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "아데노신 포스포리보실전이효소 활성이 있는 효소" 또는 "아데노신 포스포리보실전이효소 활성을 갖는 효소"는 다음의 반응을 촉매하는 효소를 의미한다: AMP + 이인산염 <=> 아데닌 + 5-포스포-알파-D-리보스 1-이인산(EC 2.4.2.7). 아데노신 포스포리보실전이효소 활성이 있는 효소는 예를 들어 세균성 유전자 apt 또는 이의 동원체에 의해 암호화된다.

본 명세서에 사용된 "퓨린 뉴클레오타이드 생합성 경로"는 뉴클레오타이드가 합성되는 드노보 생합성 경로 및 회수 경로를 모두 포함하는 것으로 이해된다.

본 명세서에 사용된 "아데노신 일인산 생합성 경로"는 아데노신 일인산이 합성되는 드노보 생합성 경로 및 회수 경로를 모두 포함하는 것으로 이해된다.

본 명세서에 사용된 "구아노신 일인산 생합성 경로"는 구아노신 일인산이 합성되는 드노보 생합성 경로 및 회수 경로를 모두 포함하는 것으로 이해된다.

본 명세서에 사용된 "사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드" 또는 "사이토크롬 P450 모노옥시게나제(CYP450) 활성을 갖는 폴리펩타이드"는 다음의 트랜스-수산화 반응을 촉매하는 폴리펩타이드를 의미한다: 1) N6-(△2-아이소펜테닐)-아데노신 5'-일인산 + 환원된 [NADPH-헴단백질 환원효소] + 산소 → 트랜스-제아틴 리보사이드 일인산 + 산화된 [NADPH-헴단백질 환원효소] + H₂O; 2) N6-(△2-아이소펜테닐)-아데노신 5'-삼인산 + 환원된 [NADPH-헴단백질 환원효소] + 산소 → 트랜스-제아틴 리보사이드 삼인산 + 산화된 [NADPH-헴단백질 환원효소] + H₂O; 3) N6-(△2-아이소펜테닐)-아데노신 5'-이인산 + 환원된 [NADPH-헴단백질 환원효소] + 산소 → 트랜스-제아틴 리보사이드 이인산 + 산화된 [NADPH-헴단백질 환원효소] + H₂O(EC 1.14.14.-). 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 예를 들어 세균성 유전자 FAS1 또는 애기장대(식물) 유전자 CYP735A1 및 CYP735A2 또는 이들의 동원체에 의해 암호화된다. 비-제한적 예시에는 서열번호 93 내지 95가 포함된다.

"폴리펩타이드" 및 "단백질"은 본 명세서에서, 길이 또는 번역-후 변형(예를 들어, 글리코실화, 인산화, 지질화, 미리스토일화, 유비퀴틴화 등)에 상관없이, 아마이드 결합에 의해 공유 결합된 적어도 2개의 아미노산의 중합체를 나타내기 위해 호환 가능하게 사용된다. D- 및 L-아미노산 및 D- 및 L-아미노산의 혼합물이 이 정의에 포함된다.

"핵산" 또는 "폴리뉴클레오타이드"는 본 명세서에서, 길이 또는 염기 변형에 상관없이, 인산다이에스터에 의해 공유 결합된 적어도 2개의 핵산 단량체 단위 또는 염기(예를 들어, 아데닌, 시토신, 구아닌, 티민)의 중합체를 나타내기 위해 호환 가능하게 사용된다.

예를 들어 세균, 핵산 또는 폴리펩타이드와 관련하여 사용될 때 "재조합" 또는 "비-천연 발생"은 자연에 존재하지 않는 방식으로 변형되거나 이와 동일하지만 합성 물질로부터 및/또는 재조합 기술을 사용한 조작으로 생산 또는 파생된 물질 또는 물질의 천연 또는 본래 형태에 상응하는 물질을 의미한다. 비-제한적 예시에는 무엇보다도 세포의 천연(비-재조합) 형태에서 발견되지 않는 유전자를 발현하거나 천연 유전자를 다른 수준으로 발현하는 재조합 세균 세포가 포함된다.

본 명세서에서 유전자 또는 핵산 분자의 맥락에서 사용되는 "이종성" 또는 "외인성"은 존재하는 세균의 게놈의 일부로서 자연적으로 발생하지 않거나 자연에서 발생하는 것과 다른 게놈의 위치 또는 위치들에서 발견되는 유전자 또는 핵산 분자(즉, DNA 또는 RNA 분자)를 의미한다. 따라서, "이종성" 또는 "외인성" 유전자 또는 핵산 분자는 세균에 대해 내인성이 아니며 미생물에 외인성으로 도입된 것이다. "이종성" 유전자 또는 핵산 분자 DNA 분자는 숙주 DNA로서 다른 유기체, 다른 종, 다른 속 또는 다른 계로부터의 것일 수 있다.

본 명세서에서 폴리펩타이드의 맥락에서 사용되는 "이종성"은 폴리펩타이드가 일반적으로 숙주 미생물에서 발견되거나 숙주 미생물에 의해 만들어지지 않지만(발현되지 않지만), 다른 유기체, 다른 종, 다른 속 또는 다른 계로부터 유래됨을 의미한다.

본 명세서에 사용된 용어 "동원체" 또는 "동원체들"은 공통의 조상 유전자에서 유래하지만 다른 종에 존재하는 유전자, 이에 의해 암호화되는 핵산 분자, 즉 mRNA 또는 이에 의해 암호화되는 단백질을 의미한다.

유전자의 "감소된 발현"은 변형된 세균에 의해 생산되는 상기 유전자에 의해 암호화되는 전사 산물의 양, 각각의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 감소됨을 의미한다. 특히, 유전자의 "감소된 발현"은 변형된 세균에 의해 생산되는 상기 유전자에 의해 암호화되는 전사 산물의 양, 각각의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 100% 감소됨을 의미한다. 유전자의 발현 수준은 PCR, 서던 블로팅 등을 포함하는 잘 알려진 방법으로 결정할 수 있다. 또한, 유전자 발현의 수준은 노던 블로팅, 정량적 RT-PCR 등을 포함하는 다양한 잘 알려진 방법을 사용하여 유전자로부터 전사된 mRNA의 양을 측정하여 추산할 수 있다. 유전자에 의해 암호화된 폴리펩타이드의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅 등을 포함하는 잘 알려진 방법으로 측정할 수 있다.

유전자의 발현은 유전자에 의해 암호화된 폴리펩타이드의 세포내 활성이 돌연변이를 수반하지 않는 다른 동일한 세균과 비교하여 감소되도록 변형된 세균 게놈의 유전자에 돌연변이를 도입하는 것에 의해 감소될 수 있다. 감소된 유전자 발현을 초래하는 돌연변이에는 유전자에 의해 암호화된 폴리펩타이드에서 아미노산의 치환을 유발하는 하나의 뉴클레오타이드 또는 그 이상의 대체(과오돌연변이: missense mutation), 정지 코돈의 도입(넌센스 돌연변이: nonsense mutation), 프레임 시프트를 유발하는 뉴클레오타이드의 결실 또는 삽입, 약물-저항 유전자의 삽입 또는 유전자의 일부 또는 전체 유전자의 결실이 포함된다(Qiu and Goodman, 1997; Kwon et al., 2000). 또한 발현은 발현 조절 서열, 예를 들어, 프로모터, 샤인-달가노(SD) 서열 등의 변형에 의해 감소될 수 있다. 또한 유전자의 발현은 유전자 대체(Datsenko and Wanner, 2000), 예를 들어, "람다-레드 매개 유전자 대체"에 의해 감소될 수 있다. 람다-레드 매개 유전자 대체는 본 명세서에 기술된 바와 같은 하나 이상의 유전자를 비활성화하는데 특히 적합한 방법이다.

"비활성화하는", "비활성화" 및 "비활성화된"은, 유전자의 맥락에서 사용될 때, 문제의 유전자가 더이상 기능성 단백질을 발현하지 않는 것을 의미한다. 변형된 DNA 영역이 유전자의 일부 또는 전체 서열의 결실, 유전자의 해독 틀의 이동, 과오/넌센스 돌연변이(들)의 도입 또는, 유전자 발현을 제어하는 서열, 예를 들어, 프로모터, 인핸서, 감쇠조절인자(attenuator), 리보솜-결합 부위 등을 포함하는, 유전자의 인접 영역의 변형으로 인해 유전자를 자연적으로 발현하지 못할 가능성이 있다. 바람직하게는, 관심있는 유전자는, 예를 들어 유전자 대체에 의한, 유전자의 일부 또는 전체 서열의 결실에 의해 비활성화된다. 비활성화는 또한 관심있는 유전자를 DNA 절단하여, 바람직하게는 이중-가닥 절단하여 선택적으로 비활성화할 수 있는 희귀-절단 엔도뉴클레아제를 도입 또는 발현시키는 것에 의해 달성될 수 있다. 본 발명의 맥락에서 "희귀-절단 엔도뉴클레아제"에는 전사 활성화인자-유사 효과인자(TALE) 뉴클레아제, 메가뉴클레아제, 징크-핑거 뉴클레아제(ZFN) 및 RNA-가이드 엔도뉴클레아제가 포함된다.

세균의 게놈 내 유전자의 존재 또는 부재는 PCR, 서던 블로팅 등을 포함하는 잘 알려진 방법으로 검출할 수 있다. 또한, 유전자 발현의 수준은 노던 블로팅, 정량적 RT-PCR 등을 포함하는 다양한 잘 알려진 방법을 사용하여 유전자로부터 전사된 mRNA의 양을 측정하여 추산할 수 있다. 유전자에 의해 암호화된 단백질의 양은 SDS-PAGE 후 면역블로팅 분석(웨스턴 블로팅 분석) 등을 포함하는 잘 알려진 방법으로 측정할 수 있다.

유전자의 "증가된 발현 수준"은 변형된 세균에 의해 생산되는 상기 유전자에 의해 암호화되는 전사 산물의 양, 각각의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 특히, 유전자의 "증가된 발현 수준"은 변형된 세균에 의해 생산되는 상기 유전자에 의해 암호화되는 전사 산물의 양, 각각의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 유전자의 발현 수준은 PCR, 서던 블로팅 등을 포함하는 잘 알려진 방법으로 결정할 수 있다. 또한, 유전자 발현의 수준은 노던 블로팅, 정량적 RT-PCR 등을 포함하는 다양한 잘 알려진 방법을 사용하여 유전자로부터 전사된 mRNA의 양을 측정하여 추산할 수 있다. 유전자에 의해 암호화된 폴리펩타이드의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅 등을 포함하는 잘 알려진 방법으로 측정할 수 있다.

폴리펩타이드의 "증가된 발현 수준"은 변형된 세균에 의해 생산되는 문제의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 증가됨을 의미한다. 특히, 폴리펩타이드의 "증가된 발현 수준"은 변형된 세균에 의해 생산되는 문제의 폴리펩타이드의 양이 변형을 수반하지 않는 다른 동일한 세균과 비교하여 적어도 10%, 예를 들어 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 적어도 150%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 약 900%, 적어도 약 1000%, 적어도 약 2000%, 적어도 약 3000%, 적어도 약 4000%, 적어도 약 5000%, 적어도 약 6000%, 적어도 약 7000%, 적어도 약 8000%, 적어도 약 9000% 또는 적어도 약 10000% 증가됨을 의미한다. 주어진 세포에서 생산되는 폴리펩타이드의 양은 ELISA, 면역조직화학법 또는 웨스턴 블로팅과 같은 이 분야에 알려진 임의의 적합한 정량화 기술로 결정할 수 있다.

폴리펩타이드 발현의 증가는 이 분야의 기술자들에게 잘 알려진 임의의 적합한 수단으로 달성할 수 있다. 예를 들어, 폴리펩타이드 발현의 증가는 세균에서 mRNA 분자의 생산을 유발하는 기능을 하는 프로모터에 작동 가능하게 연결된 폴리펩타이드를 암호화하는 유전자 또는 유전자들을 포함하는 외인성 핵산, 예를 들어 벡터를 세균에 도입하는 것과 같이, 세균에서 폴리펩타이드를 암호화하는 유전자 또는 유전자들의 카피수를 증가시켜 달성할 수 있다. 또한 폴리펩타이드 발현의 증가는 폴리펩타이드를 암호화하는 유전자 또는 유전자들의 적어도 두 번째 카피를 세균의 게놈에 통합하여 달성할 수 있다. 또한 폴리펩타이드 발현의 증가는 폴리펩타이드를 암호화하는 유전자 또는 유전자들에 작동 가능하게 연결된 프로모터(들)의 강도를 증가시켜 달성할 수 있다. 또한 폴리펩타이드 발현의 증가는 폴리펩타이드를 암호화하는 mRNA 분자 상의 리보솜 결합 부위를 변형하여 달성할 수 있다. 리보솜 결합 부위 서열을 변형함으로써, 번역 개시율이 증가되어, 번역 효율을 증가시킬 수 있다.

본 명세서에 사용된, 폴리펩타이드(예를 들어, 퓨린 뉴클레오타이드 분해 경로에 관련된 효소)의 "감소된" 또는 "감소하는" 발현 또는 발현"의 감소"는 변형된 세균에서 상기 폴리펩타이드의 발현이 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 발현(대조군)과 비교하여 감소됨을 의미한다. 변형된 세균에서 폴리펩타이드의 발현은 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 발현(대조군)과 비교하여, 적어도 약 10%, 및 바람직하게는 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 또는 100% 또는 10% 내지 100% 사이의 정수의 임의의 백분율(예를 들어, 6%, 7%, 8% 등)만큼 감소될 수 있다. 특히, 폴리펩타이드의 "감소된" 또는 "감소하는" 발현 또는 발현"의 감소"는 변형된 세균에서 폴리펩타이드의 양이 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 양(대조군)과 비교하여, 적어도 약 10%, 바람직하게는 적어도 약 20%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 또는 100% 또는 10% 내지 100% 사이의 정수의 임의의 백분율(예를 들어, 6%, 7%, 8% 등)만큼 감소됨을 의미한다. 세균에서 폴리펩타이드의 발현 또는 양은 예를 들어 ELISA, 면역조직화학, 웨스턴 블로팅 또는 유세포분석 기술을 포함하는 이 분야에 알려진 임의의 적합한 수단으로 결정할 수 있다.

본 명세서에 사용된, 폴리펩타이드(예를 들어, 퓨린 뉴클레오타이드 분해 경로에 관련된 효소)의 "감소된" 또는 "감소하는" 활성 또는 활성"의 감소"는 변형된 세균에서 상기 폴리펩타이드의 촉매 활성이 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 촉매 활성(대조군)과 비교하여 감소됨을 의미한다. 변형된 세균에서 폴리펩타이드의 활성은 상기 변형을 수반하지 않는 다른 동일한 세균의 상기 폴리펩타이드의 발현(대조군)과 비교하여, 적어도 약 10%, 및 바람직하게는 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 99% 또는 100% 또는 10% 내지 100% 사이의 정수의 임의의 백분율(예를 들어, 6%, 7%, 8% 등)만큼 감소될 수 있다. 미생물에서 폴리펩타이드의 활성은 임의의 적합한 단백질 및 효소 활성 분석법으로 결정할 수 있다.

본 명세서에 사용된 "효소의 억제인자"는 효소의 촉매 활성을 억제하는 천연 또는 합성의 임의의 화학적 화합물을 의미한다. 효소의 억제인자는 반드시 100% 또는 완전한 억제를 달성할 필요는 없다. 이와 관련하여, 효소의 억제인자는 임의의 억제 수준을 유도할 수 있다.

"치환" 또는 "치환된"은 하나의 아미노산 잔기가 다른 것으로 대체되는 것에 의한 폴리펩타이드의 변형을 의미하며, 예를 들어 폴리펩타이드 서열에서 세린 잔기를 글리신 또는 알라닌 잔기로 대체하는 것이 아미노산 치환이다. 폴리뉴클레오타이드에 관련하여 사용될 때, "치환" 또는 "치환된"은 하나의 뉴클레오타이드가 다른 것으로 대체되는 것에 의한 폴리뉴클레오타이드의 변형을 의미하며, 예를 들어 폴리뉴클레오타이드 서열에서 시토신을 티민으로 대체하는 것이 뉴클레오타이드 치환이다.

"보존적 치환"은, 폴리펩타이드에 관련하여 사용될 때, 아미노산 잔기를 유사한 측쇄를 갖는 다른 잔기로 치환하는 것을 의미하며, 따라서 전형적으로 폴리펩타이드의 아미노산을 같거나 유사한 부류에 속하는 아미노산으로 치환하는 것을 포함한다. 제한하는 것이 아닌 예시로서, 지방족 측쇄를 갖는 아미노산은 다른 지방족 아미노산, 예를 들어 알라닌, 발린, 류신 및 아이소류신으로 치환될 수 있고, 수산기 측쇄를 갖는 아미노산은 수산기 측쇄를 갖는 다른 아미노산, 예를 들어 세린 및 트레오닌으로 치환될 수 있고, 방향족 측쇄를 갖는 아미노산은 방향족 측쇄를 갖는 다른 아미노산, 예를 들어 페닐알라닌, 티로신, 트립토판 및 히스티딘으로 치환될 수 있고, 염기성 측쇄를 갖는 아미노산은 염기성 측쇄를 갖는 다른 아미노산, 예를 들어 라이신 및 아르기닌으로 치환될 수 있고, 산성 측쇄를 갖는 아미노산은 산성 측쇄를 갖는 다른 아미노산, 예를 들어 아스파르트산 또는 글루탐산으로 치환될 수 있고, 소수성 또는 친수성 아미노산은 각각 다른 소수성 또는 친수성 아미노산으로 대체될 수 있다.

"비-보존적 치환"은, 폴리펩타이드에 관련하여 사용될 때, 폴리펩타이드의 아미노산을 유의적으로 다른 측쇄 특성을 갖는 아미노산으로 치환하는 것을 의미한다. 비-보존적 치환은 정의된 군 내에서 보다는 사이에서의 아미노산을 사용할 수 있고 (a) 치환(예를 들어, 글리신 대신 세린) 영역의 펩타이드 백본 구조, (b) 전하 또는 소수성 또는 (c) 측쇄의 규모에 영향을 미칠 수 있다. 제한하는 것이 아닌 예시로서, 예시적인 비-보존적 치환은 산성 아미노산이 염기성 또는 지방족 아미노산으로 치환되는 것; 방향족 아미노산이 작은 아미노산으로 치환되는 것; 및 친수성 아미노산이 소수성 아미노산으로 치환되는 것일 수 있다.

"발현"은 전사, 전사-후 변형, 번역, 번역-후 변형 및 분비를 포함하지만 이로 제한되지 않는 폴리펩타이드(예를 들어, 암호화된 효소)의 생산에 관련된 임의의 단계를 포함한다.

본 명세서에 사용된 유전자의 "조절 영역"은 암호화 서열의 발현에 영향을 미치는 핵산 서열을 의미한다. 조절 영역은 이 분야에 알려져 있으며 프로모터, 인핸서, 전사 종결인자, 폴리아데닐화 부위, 매트릭스 부착 영역 및/또는 암호화 서열의 발현을 조절하는 기타 요소를 포함하지만 이로 제한되지 않는다.

본 명세서에 사용된 "벡터"는 연결되어 있는 다른 핵산 분자를 수송할 수 있는 핵산 분자를 의미한다. 벡터의 한 유형은 "플라스미드"이며, 부가적인 핵산 절편이 결찰될 수 있는 원형의 이중 가닥 핵산 루프를 의미한다. 특정 벡터는 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터를 본 명세서에서 "발현 벡터"로 지칭한다. 특정 다른 벡터는 외인성 핵산 분자가 세균의 게놈에 삽입되는 것을 촉진할 수 있다. 이러한 벡터를 본 명세서에서 "형질전환 벡터"로 지칭한다. 일반적으로, 재조합 핵산 기술에 유용한 벡터는 종종 플라스미드의 형태이다. 플라스미드가 벡터의 가장 일반적으로 사용되는 형태이므로 본 명세서에서, "플라스미드" 및 "벡터"는 호환 가능하게 사용될 수 있다. 많은 적합한 벡터가 이 분야의 기술자에게 알려져 있으며 상업적으로 이용할 수 있다.

본 명세서에 사용된 "프로모터"는 일반적으로 구조 유전자의 암호화 영역 상류(5')의 DNA 서열로서 RNA 중합효소 및 전사의 개시에 필요할 수 있는 다른 요소에 대한 인식 및 결합 부위를 제공하여 암호화 영역의 발현을 조절하는 DNA 서열을 의미한다. 프로모터의 선택은 관심있는 핵산 서열에 따라 달라질 것이다. 적합한 "프로모터"는 일반적으로 본 발명의 세균에서 전사의 개시를 지원하여 mRNA 분자의 생산을 일으킬 수 있는 것이다. "강력한" 프로모터에는 예를 들어 단백질의 효율적인 발현 및 과생산을 가능하게 하는 바실러스 서브틸리스, 바실러스 아밀로리퀘파시엔스 또는 유사체의 천연 프로모터, 예를 들어 P43, P15, Pveg, Pylb, PgroES, PsigX, PtrnQ, Ppst, PsodA, PrpsF, PlepA, PliaG, PrpsF, Ppst, PfusA, PsodA, Phag뿐만 아니라 바실러스 서브틸리스에서 활성인 인공 프로모터 또는 유도성 바실러스 서브틸리스 프로모터, 예를 들어 PmtlA, Pspac, PxylA, PsacB 또는 유사체가 포함된다. "강력한" 프로모터의 추가 예시로 코리네박테리움의 천연 프로모터, 예를 들어 P CP_2454, Ptuf 및 Psod, 대장균의 천연 프로모터, 예를 들어 T7 및 코리네파지 BFK20에서 유래한 P F1 프로모터가 포함된다.

본 명세서에 사용된 "작동 가능하게 연결된"은 기술된 구성 요소가 의도된 방식으로 기능하도록 하는 관계에 있는 병치(juxtaposition)를 의미한다. 암호화 서열에 "작동 가능하게 연결된" 제어 서열은 암호화 서열의 발현이 제어 서열과 화합되는 조건 하에서 달성되는 방식으로 결찰된다. 프로모터 서열은 유전자의 전사를 조절하기 위해 유전자의 전사 시작 부위에 충분히 근접할 때 유전자에 "작동 가능하게 연결"된다.

"서열 동일성의 백분율", "% 서열 동일성" 및 "% 동일성"은 아미노산 서열과 참조 아미노산 서열 사이의 비교를 나타내기 위해 본 명세서에 사용된다. 본 명세서에 사용된 "% 서열 동일성"은 다음과 같이 두 개의 아미노산 서열로부터 계산된다: -12의 갭 오픈 페널티(갭의 첫 번째 널(null)에 대한 것) 및 -4의 갭 확장 페널티(갭에서 각각의 추가 널에 대한 것)를 갖는 기본 BLOSUM62 매트릭스를 사용하여, Genetic Computing Group's GAP(글로벌 정렬 프로그램)의 버젼 9를 사용하여 서열을 정렬한다. 정렬 후, 일치하는 수를 참조 아미노산 서열의 아미노산 수에 대한 백분율로 나타내어 % 동일성을 계산한다.

"참조 서열" 또는 "참조 아미노산 서열"은 다른 서열이 비교되는 정의된 서열을 의미한다. 본 발명의 맥락에서, 참조 아미노산 서열은 예를 들어 서열번호 1에 기재된 아미노산 서열일 수 있다.

본 명세서에 사용된 용어 "약"은 사용된 수의 수치값의 플러스 또는 마이너스 10%를 의미한다.

본 명세서에서 수적 한계 또는 범위가 명시된 경우, 끝점이 포함된다. 또한, 수적 한계 또는 범위 내의 모든 값 및 하위 범위가 명시적으로 작성된 것과 같이 구체적으로 포함된다.

본 명세서에 사용된, 단수적 표현은 문맥이 달리 명시하지 않는 한 "적어도 하나" 또는 "하나 이상"을 의미한다.

본 명세서에 사용된, 용어 "포함하는", "함유하는", "갖는" 및 이들의 문법적 변형 용어는 명시된 특징, 단계 또는 구성요소를 명시하는 것으로 간주되지만 하나 이상의 추가적인 특징, 단계, 구성요소 또는 이들의 군의 추가를 배제하지 않는다.

본 발명을 일반적으로 기술하였지만, 본 명세서에서 단지 예시적인 목적으로 제공되며 달리 명시되지 않는 한 제한하려는 의도가 아닌, 특정 구체적인 실시예를 참조하여 추가적인 이해를 얻을 수 있다.

실시예

실시예 1: 출발 균주의 선택

서로 다른 바실러스 균주들을 아이소프레노이드 사이토키닌 생산의 조작을 위한 출발 균주로 사용할 수 있다(표 2). 바실러스 속 균주들은 자연에서 분리하거나 균주 은행에서 얻을 수 있다. 그 중에서도, 퓨린 뉴클레오타이드 생합성 경로에 관련된 대사산물을 과생산하기 위한 고전적인 돌연변이 유발 및 선별 방법에 이미 적용되었던 바실러스 서브틸리스 균주들 사이에서 아이소프레노이드 사이토키닌 생산을 위한 출발 균주를 선택할 수 있다. 예를 들어, 리보플라빈, 이노신, 구아노신 또는 아데노신을 과생산하는 균주들을 선택할 수 있다. 퓨린 뉴클레오타이드 및 리보플라빈 경로로부터의 무작위 돌연변이 유발 및 독성 대사 억제인자에 적용된 균주가 바람직하며 표 3에 포함되어 있다.

바실러스 서브틸리스 VKPM B2116은 바실러스 서브틸리스 W23 균주로부터의 6.4kbp DNA 섬(island)을 갖는 바실러스 서브틸리스 168(대략 4Mbp의 게놈을 갖는 가장 일반적인 바실러스 서브틸리스 숙주 균주)의 잡종 균주이다. 이러한 구성은 대부분의 바실러스 서브틸리스 산업 균주에 일반적이며 바실러스 서브틸리스 168(트립토판 영양요구성 trpC)을 W23(자가영양성 TrpC+)의 DNA로 형질전환하여 수득된다. VKPM B21216의 게놈 내 6.4kbp W23 섬은 게놈이 공개적으로 이용가능한 바실러스 서브틸리스 레거시 균주들 중 하나인, 바실러스 서브틸리스 SMY에서와 같다(Zeigler et al. 2008). 바실러스 서브틸리스 VKPM B2116은 고전적인 돌연변이 유발 및 선별로 수득된 바실러스 서브틸리스 SMY의 직접 후손 균주이다. 이 균주의 다른 이름은 바실러스 서브틸리스 VNII Genetika 304이다. 균주의 구성에 대한 설명은 1980년에 출원된 소련 특허 SU908092에 있다. 돌연변이는 후속 돌연변이 유발 및 대사 억제제의 선별로 수득되었다. 균주 VKPM B2116은 플라빈 키나제를 암호화하는 ribC 유전자의 돌연변이로 인해 비타민 B2의 독성 유사체인 로세오플라빈에 내성이 있다. 이 균주는 독성 퓨린 유사체인 8-아자구아닌(8-azaguanine)에도 내성이 있다.

실시예 2: 바실러스 서브틸리스에 최적화된 아이소프레노이드 사이토키닌 생합성을 위한 합성 유전자 IPT 서열번호 1 및 LOG 서열번호 34의 합성

GENEius(Eurofins)를 사용하여 바실러스 서브틸리스에서의 유전자 발현을 위한 코돈-최적화 뉴클레오타이드 서열을 생성하기 위해 아그로박테리움 투메파시엔스(동의어: 아그로박테리움 파브룸(Agrobacterium fabrum))(균주 C58/ATCC 33970))로부터의 아데닐레이트 다이메틸알릴전이효소(IPT) Tzs(유전자 tzs, E.C.2.5.1.27, UniProt: P58758)(서열번호 1) 및 코리네박테리움 글루타미쿰(균주 ATCC 13032/DSM 20300/NCIMB 10025)으로부터의 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제(LOG)(유전자 Cgl2379, E.C. 3.2.2.n1, UniProt: Q8NN34)(서열번호 34)의 아미노산 서열을 사용하였다. RBS 서열 및 합성 아이소프레노이드 사이토키닌 오페론 발현 카세트의 추가 조립을 위한 합성 단편 양쪽 말단의 짧은 어댑터 서열을 추가하여 합성 DNA 단편 IPT-LOG(서열번호 71)를 설계하였다.

실시예 3: 바실러스 서브틸리스에 최적화된 아이소프레노이드 사이토키닌 생합성을 위한 합성 유전자 IPT 서열번호 2 및 LOG 서열번호 34의 합성

GENEius(Eurofins)를 사용하여 바실러스 서브틸리스에서의 유전자 발현을 위한 코돈-최적화 뉴클레오타이드 서열을 생성하기 위해 아그로박테리움 투메파시엔스(동의어: 아그로박테리움 파브룸(Agrobacterium fabrum))(균주 C58/ATCC 33970))로부터의 아데닐레이트 다이메틸알릴전이효소(IPT) Tmr(유전자 izt, E.C.2.5.1.27, Uniprot: P0A3L5)(서열번호 2) 및 코리네박테리움 글루타미쿰으로부터의 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제(LOG)(유전자 Cgl2379, E.C. 3.2.2.n1, UniProt: Q8NN34)(서열번호 34)의 아미노산 서열을 사용하였다. RBS 서열 및 합성 아이소프레노이드 사이토키닌 오페론 발현 카세트의 추가 조립을 위한 합성 단편 양쪽 말단의 짧은 어댑터 서열을 추가하여 합성 DNA 단편 IPT-LOG(서열번호 72)를 설계하였다.

실시예 4: IPT 및 LOG를 함유하는 합성 아이소프레노이드 사이토키닌 오페론의 조립 및 바실러스 서브틸리스로의 형질전환

아이소프레노이드 사이토키닌 생합성을 위한 합성 유전자 IPT-LOG(서열번호 71 및 서열번호 72)를 함유하는 합성 단편을 인공 아이소프레노이드 사이토키닌 오페론에 조립하였다. 바실러스 서브틸리스 게놈 내 amyE 자리로의 안정적 게놈 통합을 위해 유전자 통합 상동성, 프로모터 서열 및 에리트로마이신 선별 마커(서열번호 73)를 함유하는 초기 및 최종 단편을 설계 및 합성하였다.

인공 오페론 조립의 첫 번째 단계로 서열번호 76의 초기 단편을 위해 그리고 아이소프레노이드 사이토키닌 생합성을 위한 유전자들을 함유하는 서열번호 71 및 서열번호 72의 IPT-LOG 합성 단편을 위해 서열번호 74 및 서열번호 75의 프라이머 쌍을 사용하여 별개의 DNA 단편을 PCR 증폭하였다. 서열번호 79의 최종 단편의 증폭을 위해서는 서열번호 77 및 서열번호 78의 프라이머 세트를 사용하였다.

Eppendorf 사이클러 및 제조사에서 제공하는 완충액에서 Phusion 중합효소(Thermo Fisher)를 사용하고 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고 98℃ 30초; (98℃ 30초, 68.5℃ 25초 및 72℃ 23/25초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다.

각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위해 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI) 및 XbaI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI) 및 XbaI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 처음 두 개의 단편을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 80 및 서열번호 81의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. 최종 단편의 결찰을 위해 제한효소 처리, 세척 및 결찰 단계를 반복하였다. PCR 산물을 0.8% 아가로스 겔에서 전기영동하고, 단편을 겔에서 잘라내고, 이전과 같이 소화 및 세척하고, 이전과 같이 결찰하였다. 서열번호 76 및 서열번호 77의 프라이머 쌍을 사용하여 amyE 상동성, RBS 서열을 갖는 프로모터, IPT 및 LOG 유전자 및 에리트로마이신 저항 카세트를 함유하는 최종 오페론을 증폭하고, 앞서 기술된 바와 같이 세척 및 결찰하였다. 바실러스 서브틸리스 VKPM B2116의 형질전환을 위해 서열번호 82 및 서열번호 83의 IPT-LOG를 함유하는 구축된 합성 트랜스-제아틴 오페론을 사용하였다. 서열번호 83의 IPT-LOG 오페론으로 형질전환하여 형질전환 균주 TZAB1, TZAB2, TZAB3 및 TZAB4를 얻었다. 서열번호 82의 IPT-LOG 오페론으로 형질전환하여 형질전환 균주 TZAB14 및 TZAB15를 얻었다. 인공 오페론이 amyE 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.

실시예 5: dxs 의 과발현으로 아이소프레노이드 전구체 공급이 증가함에 의해 증가된 아이소프레노이드 사이토키닌 생합성

아이소프레노이드 사이토키닌의 생합성을 위한 아이소프레노이드 측쇄는 바실러스 서브틸리스에서 MEP 경로에 의해 합성된다. 바실러스 서브틸리스에서의 유전자 발현을 위한 것으로서 GENEius(Eurofins)의 코돈-최적화 기능을 사용하여 dxs의 합성 뉴클레오타이드 서열을 생성하기 위해 바실러스 서브틸리스의 1-데옥시자일룰로스-5-인산 합성효소(Dxs, EC 2.2.1.7)의 단백질 서열을 사용하였다. 서열번호 84 및 서열번호 85의 dxs 합성 DNA 단편을 중첩 PCR에 의해 연결된 2개의 중첩 부분에 설계하였다. 서열번호 86의 연결된 전체 합성 유전자 dxs를 인공 오페론에 조립하였다. 바실러스 서브틸리스 게놈으로의 안정적 게놈 통합을 위해 lacA 상동성, 프로모터 서열 및 서열번호 87의 스펙티노마이신 선별 마커를 함유하는 초기 및 최종 단편을 설계 및 합성하였다. 단편은 실시예 4에 기술된 바와 같이 조립하였다.

인공 오페론 조립의 첫 번째 단계로 서열번호 88의 초기 단편, 서열번호 89의 최종 단편 및 서열번호 86의 연결된 합성 유전자 dxs를 위해 서열번호 74 및 서열번호 75의 프라이머 세트를 사용하여 별개의 DNA 단편을 PCR 증폭하였다.

Eppendorf 사이클러 및 제조사에서 제공하는 완충액에서 Phusion 중합효소(Thermo Fisher)를 사용하고 50㎕의 최종 부피에 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하여 30 사이클 동안 단편들을 증폭하였다. 98℃ 30초; (98℃ 30초, 71℃ 25초 및 72℃ 23/25초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하였다.

각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위해 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI) 및 XbaI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI) 및 XbaI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 처음 두 개의 단편을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 74 및 서열번호 75의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. 최종 단편의 결찰을 위해 제한효소 처리, 세척 및 결찰 단계를 반복하였다. 마지막 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR에서 서열번호 90의 완전한 합성 dxs 오페론을 위한 주형으로 사용하고, 서열번호 91 및 서열번호 92의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. PCR 산물을 0.8% 아가로스 겔에서 전기영동하고, 단편을 겔에서 잘라내고, 이전과 같이 세척하고, 이전과 같이 결찰하였다. 바실러스 서브틸리스 TZAB15를 IPT-LOG 오페론으로 amyE에 형질전환하기 위해 구축된 합성 dxs 오페론을 사용하였다(서열번호 80). 인공 DXS 오페론(서열번호 90)으로 형질전환하여 형질전환 균주 TZAB43을 얻었다. 인공 오페론이 lacA 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.

실시예 6: 아이소프레노이드 사이토키닌의 생산을 위한 바실러스 서브틸리스 균주의 배양

구축된 균주 및 대조 균주 모두는 이 절차에 따라 배양하였다. 20% 글리세롤에 담겨 -80℃에 보관된 VKPM B2116, TZAB1, TZAB2, TZAB3, TZAB4, TZAB14, TZAB15 및 TZAB43 균주들의 동결 스톡을 에리트로마이신과 린코마이신이 적절한 농도로 함유된 고체 종배양 배지에 도말하고 37℃에서 대략 1일 동안 인큐베이션하였다. 추가 시험을 위해, 영양-단계 배지에 접종하되, 25㎖의 영양 배지 및 적절한 양의 항생제가 함유된 주름진 250㎖ 에를렌마이어 플라스크당 1 내지 5개의 고체 종배양 플레이트 배양물 플러그를 접종하였다. 220RPM에서 18 내지 20시간 동안 37℃에서 인큐베이션하였다. 영양 배지의 배양물을 종배양물로 사용하여 생산 배지에 접종하였다. 10% 접종원을 사용하였다(250㎖ 에를렌마이어 플라스크에 담긴 25㎖의 생산 배지당 2.5㎖). 기술된 바와 같은 생산 배지를 사용하거나 황산 아데닌으로 수정하였다(최종 농도 3g/ℓ). 220RPM에서 최대 48시간 동안 30℃ 또는 37℃에서 인큐베이션하였다. 발효된 배양물 시료를 취하고 실시예 7에 기술된 바와 같이 분석하였다. 트랜스-제아틴, 트랜스-제아틴 리보사이드 및 아이소펜테닐 아데닌의 역가는 실시예 7에 기술된 바와 같이 LC/MS를 사용하여 측정하였다.

영양 배지의 성분들(표 7)을 혼합하고 pH를 7.2 내지 7.4로 설정하였다. 다음 KH₂PO₄- K₂HPO₄ 용액을 최종 농도 KH₂PO₄ 1.5g/ℓ 및 K₂HPO₄ 3.5g/ℓ로 첨가하였다. 배지를 에를렌마이어 플라스크에 분배하고(250㎖-주름진 에를렌마이어 플라스크당 25㎖) 121℃에서 30분 오토클레이브하였다. 오토클레이브 이후 멸균 포도당을 최종 농도 7.5g/ℓ로 첨가하였다. 접종 전에 항생제를 첨가하였다.

생산 배지의 성분들(표 8)을 혼합하고 pH를 7.2 내지 7.4로 설정하였다. 다음 KH₂PO₄- K₂HPO₄ 용액을 최종 농도 KH₂PO₄ 1.5g/ℓ 및 K₂HPO₄ 3.5g/ℓ로 첨가하였다. 배지를 30분 동안 121℃에서 오토클레이브하였다. 오토클레이브 이후 멸균 우레아 용액(20㎖의 스톡 용액, 최종 농도는 6g/ℓ), 멸균 포도당 용액(500㎖의 스톡 용액, 최종 농도는 100g/ℓ 포도당)을 첨가하여 1ℓ의 생산 배지를 얻었다. 접종 전에 적절한 항생제를 첨가하였다. 이후 배지를 멸균 에를렌마이어 플라스크에 분배하였다(250㎖-주름진 에를렌마이어 플라스크당 25㎖).

실시예 7: 아이소프레노이드 사이토키닌 분석

실시예 6에 기술된 절차에 따라 배양한 모든 균주들을 이 절차에 따라 분석하였다. 발효된 생산 배지 시료를 취하고 바로 -20℃에서 동결시켰다. 대사산물의 추출을 위해, 발효 생산 배지를 pH 4의 메탄올과 100mM 아세트산 암모늄의 1:1 혼합물로 구성된 추출 완충액으로 1:1로 희석하였다. 시료를 일정하게 교반하면서 상온에서 1시간 동안 추출하고, 15분 동안 4000 내지 4500RPM으로 원심분리하고, 여과(0.22㎛)하였다. 즉시 시료를 LC/MS로 분석하거나 분석할 때까지 -20℃에 보관하였다.

MS/MS 가능 질량 분석기인 Thermo TSQ Quantum Access MAX에 연결된 Thermo Accela 1250 HPLC 장비에서 시료를 분석하였다. 이 방법은 150×4.6㎜, 2.6㎛ 입자 크기의 Thermo Accucore C30 칼럼, 60℃ 유지, 이동상 A - 0.1% 포름산 함유 물 및 이동상 B - 메탄올의 구배 프로그램의 사용과 다음의 출발 조건의 사용을 기반으로 한다: 95% A, 10분에 B%에서 50%까지의 선형 구배 증가 및 초기 조건으로 5분 안정화, 1㎖/분 유속. 질량 분석기는 hESI 이온 공급원이 장착되어 있고, 양성(+) 모드에서 작동되며, 스프레이 전압이 4600V로 설정되어 있고, 기화기 온도는 350℃이며, 1.0torr의 충돌 압력 및 10V의 충돌 에너지로 설정되었다. 트랜스-제아틴은 모 이온 219.9m/z에서 딸 이온 185.2, 148.0 및 136.0으로의 전이로 MRM 모드에서 관찰되었다.

트랜스-제아틴 리보사이드(tZR)는 모 이온 352.5m/z에서 딸 이온 220.1, 202.1, 148.0 및 136.1로의 전이로 MRM 모드에서 관찰되었다. 아이소펜테닐 아데닌(iP)는 모 이온 204.4m/z에서 딸 이온 148.4, 136.3 및 119.2로의 전이로 MRM 모드에서 관찰되었다. 아이소펜테닐 아데닌 리보사이드(iPR)는 모 이온 336.5m/z에서 딸 이온 204.1, 148.0 및 113.1로의 전이로 MRM 모드에서 관찰되었다.

실시예 8: IPT 및 LOG를 이종 발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산

실시예 6에 기술된 바와 같이 배양을 수행하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였다. 검출된 아이소프레노이드 사이토키닌의 수율을 도 4에 나타내었다. 서열번호 82의 IPT-LOG 발현 균주는 최대 10㎎/ℓ의 양으로 아이소프레노이드 사이토키닌을 생산한다(도 4 참조).

실시예 9: 성장 배지에서 황산 아데닌과 함께 IPT 및 LOG를 이종 발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산

실시예 6에 기술된 바와 같이 배양을 수행하였다. 생산 배지는 실시예 6에 기술된 바와 같이 구성되거나, 최종 농도 3g/ℓ로 황산 아데닌으로 수정되었다. 발효 배양액을 추출하고 실시예 7에 기술된 바와 같이 분석하였다. 이의 결과는 도 5에 나타내었다. 서열번호 82의 IPT-LOG를 갖는 TZAB14 균주에서 아이소프레노이드 사이토키닌의 생산은 황산 아데닌이 없는 배지와 비교하여 황산 아데닌을 함유하는 배지에서 증가하였다.

실시예 10: 서열번호 82의 IPT-LOG를 이종 발현하고 DXS를 과발현하는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산

실시예 6에 기술된 바와 같이 배양을 수행하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였다. 수율은 도 6에 나타내었다. 서열번호 82의 IPT-LOG 오페론 및 서열번호 90의 DXS 오페론을 갖는 균주에서 아이소프레노이드 사이토키닌의 생산이 증가되었다.

실시예 11: IPT-LOG(서열번호 83)를 갖는 바실러스 서브틸리스 균주에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌 생산의 분석

실시예 6에 기술된 바와 같이 배양을 수행하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였다. 서열번호 83의 IPT-LOG를 갖는 TZAB1, TZAB2, TZAB3 및 TZAB4 균주와 서열번호 82의 IPT-LOG를 갖는 TZAB14 및 TZAB15 균주는 아이소프레노이드 사이토키닌을 생산하였다. 이의 결과는 도 7에 나타내었다.

실시예 12: 바실러스 서브틸리스 균주에서 IPT-LOG 오페론, IPT 및 DXS의 이종 발현을 사용한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산

실시예 4에 기술된 바와 같이 아이소프레노이드 사이토키닌 생합성을 위한 IPT1-LOG1 유전자를 함유하는 합성 DNA 단편(서열번호 71)을 인공 아이소프레노이드 사이토키닌 오페론에 조립하였다.

서열번호 123 및 서열번호 183의 프라이머들을 사용하여 IPT1-LOG1(서열번호 82) 단편의 첫 번째 부분을 PCR 증폭하고 별도로 서열번호 123 및 서열번호 128의 프라이머들을 사용하여 IPT1-LOG1(서열번호 82)의 마지막 부분을 PCR 증폭하여 IPT1(서열번호 1)만을 함유하는 IPT1 발현 카세트를 조립하였으며, 이때 Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고 98℃ 30초; (98℃ 30초, 68.5℃ 25초 및 72℃ 25초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 수행하였다. PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰로 단편을 인공 IPT1 발현 카세트에 조립하였다. 성공적인 결찰을 위해 호환 가능한 제한 말단을 제공하기 위해 XbaI 제한 부위를 사용하였다. 결찰 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 XbaI(Thermo Fisher) 제한 효소 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 처음 두 개의 단편을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 123 및 서열번호 128의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. IPT 단편을 갖는 최종 발현 카세트(서열번호 184)를 생성하였다.

이후 IPT1-LOG1(서열번호 82) 또는 IPT 단편(서열번호 184)을 함유하는 트랜스-제아틴 오페론을 위해 구축된 최종 발현 카세트를 바실러스 서브틸리스 VKPM B2116, 바실러스 서브틸리스 168 및 바실러스 서브틸리스 RB50 균주의 형질전환에 사용하였고 표 9에 나타낸 새로운 형질전환 균주를 개발하였다. 인공 오페론이 amyE 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.

dxs 유전자를 함유하는 합성 단편(서열번호 86)을 실시예 5에 기술된 바와 같이 발현 카세트에 조립하였다. 구축된 DXS 발현 카세트(서열번호 90)를 바실러스 서브틸리스 VKPM B2116, 바실러스 서브틸리스 168 및 바실러스 서브틸리스 RB50 유래 균주의 형질전환에 사용하였고 표 9에 나타낸 새로운 형질전환 균주를 개발하였다. 인공 오페론이 lacA 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.

모든 구축된 균주 및 대조 균주는 실시예 6에 기술된 절차에 따라 배양하였다. 20% 글리세롤에 담겨 -80℃에 보관된 균주들의 동결 스톡을 에리트로마이신과 린코마이신이 적절한 농도로 함유된 고체 종배양 배지에 도말하고 37℃에서 대략 1일 동안 인큐베이션하였다. 추가 시험을 위해, 영양-단계 배지에 접종하되, 25㎖의 영양 배지 및 적절한 양의 항생제가 함유된 주름진 250㎖ 에를렌마이어 플라스크당 1 내지 5개의 고체 종배양 플레이트 배양물 플러그를 접종하였다. 220RPM에서 8 내지 20시간 동안 37℃에서 인큐베이션하였다. 영양 배지의 배양물을 종배양물로 사용하여 생산 배지에 접종하였다. 10% 접종원을 사용하였다(250㎖ 에를렌마이어 플라스크에 담긴 25㎖의 생산 배지당 2.5㎖). 생산 배지는 바실러스 서브틸리스 168 유래 균주의 평가를 위해 트립토판으로 수정하였다(최종 농도 50㎎/ℓ). 220RPM에서 최대 48시간 동안 30℃, 34℃ 또는 37℃에서 인큐베이션하였다. 발효된 배양물 시료를 취하고 실시예 7에 기술된 바와 같이 분석하였다. 트랜스-제아틴(tZ), 트랜스-제아틴 리보사이드(tZR) 및 아이소펜테닐 아데닌 리보사이드(iPR) 및 아이소펜테닐 아데닌(iP)의 역가는 실시예 7에 기술된 바와 같이 LC/MS를 사용하여 측정하였다.

추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였다. 검출된 아이소프레노이드 사이토키닌의 수율을 표 17, 도 8, 도 9 및 도 10에 나타내었다. 서열번호 82의 IPT-LOG 발현 균주는 최대 60㎎/ℓ의 총량으로 아이소프레노이드 사이토키닌을 생산하며(도 10 참조) 아이소프레노이드 사이토키닌의 생산은 IPT-LOG 오페론(서열번호 82)을 갖는 균주 및 DXS 오페론(서열번호 90)을 갖는 균주에서 추가로 전반적으로 증가하였다.

실시예 13: 대장균 BL21(DE3) 균주에서 IPT, IPT1-LOG1 오페론 및 DXS의 이종 발현을 사용한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산

가능한 아이소프레노이드 사이토키닌 생산 균주로서 대장균을 평가하기 위해, 2개의 발현 플라스미드 세트를 구축하였다.

첫 번째 세트는 합성 유전자 IPT(서열번호 179) 및 IPT-LOG 오페론(서열번호 82)의 이종 사이토키닌 유전자/오페론 발현을 위한 플라스미드이다. IPT 유전자 또는 IPT-LOG 오페론을 pBBR1 플라스미드 벡터에 조립하였다. pBBR1 벡터는 아이소프로필-β-D-1-티오갈락토파이란노사이드(IPTG)로 유도할 수 있는 프로모터: LacI^Q/P　_lacUV5　-T7 기반의 이종 발현 시스템을 가지며 선별 마커로서 클로람페니콜 저항성 카세트를 함유한다.

두 번째 플라스미드는 DXS(서열번호 90)의 이종 발현으로 아이소프레노이드 전구체 공급을 증가시키기 위해 클로닝하였다. DXS 유전자를 p15A 플라스미드 벡터에 조립하였다. p15A 벡터는 XylS/Pm 기반의 발현 시스템을 갖는다: 여기서 XylS은 m-톨루엔산염 유도성 Pm 프로모터의 양성 조절인자이며 선별 마커로서 카나마이신 저항성 카세트를 함유한다.

발현 플라스미드 조립의 첫 번째 단계는 삽입 단편인 IPT-LOG 및 DXS와 벡터 백본인 pBBR1 및 p15A의 PCR 증폭이다. IPT DNA 단편은 서열번호 163 및 서열번호 182의 프라이머 세트로 증폭하였고, IPT-LOG DNA 단편은 IPT를 위한 서열번호 163 및 서열번호 164의 프라이머 세트 및 LOG 증폭을 위한 서열번호 165 및 서열번호 166의 프라이머 세트로 증폭하였다. 서열번호 167 및 서열번호 168의 프라이머 세트는 pBBR1 벡터 백본을 증폭하기 위해 사용하였다. DXS 단편은 서열번호 169 및 서열번호 170의 프라이머 세트로 증폭하였고 서열번호 171 및 서열번호 172의 프라이머 세트는 p15A 벡터 백본을 증폭하기 위해 사용하였다. Eppendorf 사이클러를 사용하고 Phusion 중합효소(Thermo Fisher)를 제조사에서 제공하는 완충액에 첨가하여 사용하여 단편들을 증폭하였고 30 사이클 동안 50㎕의 최종 부피에 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 각 단편의 양은 NanoDrop 기기를 사용하여 260㎚에서의 흡광도로 측정하였다. 10㎕ HIFI 조립 반응(NEBuilder HiFi DNA Assembly Master Mix)을 사용하여 단편들을 최종 발현 작제물로 조립하였다. 반응은 얼음 상에서 설정하였으며, 5㎕의 HIFI DNA Assembly Master Mix에 대해 단편들을 1:2의 벡터:삽입물 DNA 몰 비율로 첨가하였다(단편들의 총량은 최대 0.2pmol이었음). 반응액을 최종 부피 10㎕가 되도록 뉴클레아제 제외 물로 채웠다. 열순환기에서 시료를 60분 동안 50℃에서 인큐베이션하였다. 다음 단계에서, 1㎕의 냉각한 조립 산물을 수용성 대장균 BL21(DE3) 세포의 형질전환에 사용하였다. 수득한 균주에서 플라스미드 DNA를 분리하고 시퀀싱하여 올바르게 조립되었는지 확인하였다.

DXS 유전자의 발현을 위한 p15A 플라스미드의 형질전환으로 형질전환 균주 TZ3077을 얻었다. IPT 유전자의 발현을 위한 pBBR1 플라스미드의 형질전환으로 형질전환 균주 TZAB3079를 얻었다. IPT-LOG 오페론의 발현을 위한 pBBR1 플라스미드의 형질전환으로 형질전환 균주 TZ3082를 얻었다. 추가로, IPT 유전자 및 IPT-LOG 오페론 발현 플라스미드를 TZ3077(DXS 발현 플라스미드를 갖는 대장균 BL21(DE3) 균주)에 형질전환하였다. 하나는 DXS 유전자를 위한 것이고 다른 것은 IPT 유전자 발현을 위한 것인 두 개의 플라스미드를 갖는 수득된 균주는 TZAB3087로 저장하였다. 하나는 DXS 유전자를 위한 것이고 다른 것은 IPT-LOG 오페론 발현을 위한 것인 두 개의 플라스미드를 갖는 수득된 균주는 TZ3091로 저장하였다. 모든 형질전환체들은 cPCR로 확인하였고 아래 표 10에 나열하였다.

구축된 균주들(TZ3077 내지 TZ3091) 및 대조 균주인 대장균 BL21(DE3)을 20% 글리세롤에 담아 -80℃에 보관하였다. 균주들은 항상 적절한 농도의 선별 항생제(카나마이신/클로람페니콜)의 존재 내에서 배양하였다. 먼저, 이들을 고체 종배양 배지 - 2YT 한천 플레이트(표 11)에 도말하고 37℃에서 대략 17시간 동안 인큐베이션하였다. 추가 시험을 위해, 영양-단계 배지 - 2YT에 50㎖의 영양 배지 및 적절한 양의 항생제가 함유된 250㎖ 에를렌마이어 플라스크당 1개의 고체 종배양 플레이트 배양 단일 콜로니를 접종하였다. 220RPM에서 17시간 동안 37℃에서 인큐베이션하였다. 영양 배지(표 12)에서의 배양물을 종배양물로 사용하였고, 2.5% 접종물을 250㎖ 에를렌마이어 플라스크에 담긴 50㎖의 생산 배지의 접종을 위해 사용하였다. 생산 배지(표 13)로 포도당이 보충된 2YT를 사용하였다(멸균 포도당을 25g/ℓ의 최종 농도로 오토클레이브 후에 첨가함). 220RPM에서 10시간 동안 37℃에서 인큐베이션하였다. 2시간의 발효 후, 발현 플라스미드를 갖는 균주들을 유도시켰다. IPT/IPT-LOG 발현 플라스미드를 갖는 균주는 최종 농도 150μM의 IPTG로 유도시켰다. DXS 발현 플라스미드를 갖는 균주는 최종 농도 1mM의 m-톨루엔산염으로 유도시켰다. 두 가지 발현 시스템(DXS 및 IPT/IPT-LOG)을 모두 갖는 균주는 두 가지 유도인자들(150μM IPTG 및 1mM m-톨루엔산염)로 유도시켰다. 10시간의 발효 후, 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 분석을 위해 배양액 시료를 취하였다. 사용한 추출 프로토콜은 실시예 7에 기술된 바와 같다. 트랜스-제아틴, 트랜스-제아틴 리보사이드, 아이소펜테닐 아데닌 및 아이소펜테닐 아데닌 리보사이드의 역가는 실시예 7에 기술된 바와 같이 LC/MS를 사용하여 측정하였다.

검출된 아이소프레노이드 사이토키닌의 수율을 도 11에 나타내었다. 하나 또는 두 가지의 선별 항생제의 존재 내에서 균주 성장이 다르고 서로 다른 유도인자를 사용했기 때문에, 사이토키닌의 측정치를 600㎚에서의 각 배양액의 광학밀도(OD600)로 나누어 정규화하였다.

IPT를 발현하는 균주는 최대 2.8㎎/ℓ의 양으로 아이소프레노이드 사이토키닌을 생산하였다(도 11 및 표 17 참조). IPT-LOG를 발현하는 균주는 최대 3.4㎎/ℓ의 양으로 아이소프레노이드 사이토키닌을 생산하였다. 아이소프레노이드 사이토키닌의 생산은 IPT-LOG의 발현 및 아이소프레노이드 전구체 공급을 위한 추가적인 DXS의 발현이 있는 균주에서 3.4㎎/ℓ로 증가하였다.

실시예 14: 클로닝 벡터로의 IPT1-LOG1 오페론, IPT1 및 DXS 유전자의 조립 및 코리네박테리움 스테이셔니스로의 플라스미드의 형질전환

서열번호 178의 단편을 위한 서열번호 173 및 서열번호 174의 프라이머 세트를 사용하여 앞서 구축된 서열번호 82의 합성 트랜스-제아틴 오페론으로부터 아이소프레노이드 사이토키닌 생합성을 위한 IPT1-LOG1(서열번호 178) 유전자를 함유하는 합성 단편을 증폭하였고 IPT1 유전자(서열번호 180)의 발현을 위한 서열번호 180의 단편의 구축을 위해 서열번호 173 및 서열번호 177의 프라이머 세트를 사용하였다. Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 63.3℃ 25초 및 72℃ 45초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다.

합성 dxs 유전자(서열번호 181)는 서열번호 175 및 서열번호 176의 프라이머 세트를 사용하여 서열번호 90의 앞서 구축된 합성 dxs 오페론으로부터 증폭하였는데, 이때 Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 67.6℃ 25초 및 72℃ 60초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 시행하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다.

제조사에서 제공하는 프로토콜에 따른 NEBuilder HiFi DNA Assembly Master Mix를 사용한 HiFi 조립 반응으로 IPT1 유전자 및 IPT1-LOG1 아이소프레노이드 사이토키닌 오페론을 추가로 pVWEx6 플라스미드(Henke et al. 2021)에 클로닝하고 dxs 유전자 발현 카세트를 pECXT99APsyn 플라스미드에 클로닝하였다. 두 가지 플라스미드 모두 BamHI FD 제한 효소로 소화시켜 사전에 선형화하였다. HiFi 반응 혼합물을 추가로 전기수용성 DH10β 대장균 세포의 전기천공을 위해 사용하였다. 카나마이신 선별 마커는 pVWEx6 + IPT1-LOG1 및 pVWEx6 + IPT1 형질전환체의 선별을 가능하게 하며, pECXT99APsyn + dxs 형질전환체의 선별을 위해서는 테트라사이클린을 사용하였다. 형질전환체들은 콜로니 PCR로 확인하였다. 플라스미드 분리를 위해 콜로니를 적절한 항생제가 있는 2TY 배지에 접종하고 37℃에서 밤새 인큐베이션하였다. GeneJET Plasmid Miniprep Kit(Thermo Fisher) 플라스미드 추출 키트를 사용하여 제조사에서 제공하는 프로토콜에 따라 밤새 배양한 배양물로부터 플라스미드를 분리하였다. 분리한 플라스미드는 KpnI 및 XbaI FD 제한 효소로 소화시켜 추가로 분석하였다.

생성된 플라스미드를 코리네박테리움 스테이셔니스 DSM 20305에 형질전환하기 위해 문헌[Yili et al. 2015]에 따라 전기수용성 세포를 준비하였다. 분리된 플라스미드의 형질전환은 2㎜ 큐벳을 사용하여 BioRad의 전기천공기를 사용하여 수행하였다. 대략 250ng의 플라스미드를 50㎕의 앞서 준비한 전기수용성 세포 분취물에 도입하고, 2㎜ 큐벳으로 옮기고, 전기 펄스에 노출시켰다. 즉시 세포를 1㎖의 재생 배지 함유 2㎖ Eppendorf 튜브로 옮겼다. 30℃ 및 200rpm으로 설정한 교반기에서 3시간 동안 인큐베이션한 다음, 형질전환체를 적절한 농도의 선별 마커가 있는 회수 한천 플레이트 LBHIS에 도말하였다. 수득한 형질전환체(표 14에 나타냄)는 콜로니 PCR로 확인하였다.

pVWEx6+ipt1-log1 및 pECXT99APsyn+dxs, 그리고 pVWEx6+ipt1 및 pECXT99APsyn+dxs의 형질전환을 위해, 확인된 형질전환체를 2세대 균주를 위한 새로운 전기수용성 세포의 준비를 위해 사용하였다. 전기수용성 세포를 추가 플라스미드로 형질전환시키고 플레이트 상에서 카나마이신과 테트라사이클린으로 선별하였다. 두 플라스미드에 대해 형질전환체의 콜로니 PCR 검증을 수행하였다.

실시예 15: 코리네박테리움 스테이셔니스 이종 발현에 의한 트랜스-제아틴 및 관련 아이소프레노이드 사이토키닌의 생산

모든 구축된 균주들 및 대조 균주는 이 절차에 따라 배양하였다. 20% 글리세롤에 담겨 -80℃에 보관된 코리네박테리움 스테이셔니스 DSM 20305, TZ3136, TZ3138, TZ3139, TZ3142 및 TZ3146 균주들의 동결 스톡을 테트라사이클린 또는/및 카나마이신이 적절한 농도로 함유된 고체 종배양 배지에 도말하고 30℃에서 대략 1일 동안 인큐베이션하였다. 추가 시험을 위해, 영양-단계 배지에 접종하되, 25㎖의 영양 배지 및 적절한 양의 항생제가 함유된 주름진 250㎖ 에를렌마이어 플라스크당 5개의 고체 종배양 플레이트 배양물 플러그를 접종하였다. 200RPM에서 18시간 동안 30℃에서 인큐베이션하였다. 영양 배지의 배양물을 종배양물로 사용하여 생산 배지에 접종하였다. 10% 접종원을 사용하였다(주름진 250㎖ 에를렌마이어 플라스크에 담긴 25㎖의 생산 배지당 2.5㎖). 200RPM에서 최대 48시간 동안 30℃에서 인큐베이션하였다. 발효된 배양물 시료를 취하고 실시예 7에 기술된 바와 같이 분석하였다. 트랜스-제아틴, 트랜스-제아틴 리보사이드, 아이소펜테닐 아데닌 및 아이소펜테닐 아데닌 리보사이드의 역가는 실시예 7에 기술된 바와 같이 LC/MS를 사용하여 측정하였다.

실시예 16: 코리네박테리움 스테이셔니스 이종 발현에 의한 아이소프레노이드 사이토키닌의 분석

발효 과정에서 코리네박테리움 스테이셔니스 형질전환체의 아이소프레노이드 사이토키닌 생산을 시험하였다. 배양은 실시예 15에 기술된 바와 같이 수행하였다. 추출 및 분석은 실시예 7에 기술된 절차에 따라 수행하였다. 이의 결과는 도 12 및 표 17에 나타내었다.

실시예 17: purA 유전자의 과발현에 의한 바실러스 서브틸리스의 퓨린 뉴클레오타이드 생합성 경로의 증강

퓨린 뉴클레오타이드 생합성 경로의 증강을 위해 사용한 purA 유전자 함유 합성 단편(서열번호 98)을 인공 유전자 발현 카세트에 조립하였다. 바실러스 서브틸리스 게놈의 yybN 자리로의 안정적 게놈 통합을 위해 유전자 통합 상동성, 프로모터 서열 및 제오신(zeocin) 선별 마커를 함유하는 초기(서열번호 96) 및 최종 단편(서열번호 97)을 설계 및 합성하였다.

인공 오페론 조립의 첫 번째 단계로 서열번호 96의 초기 단편을 위해 서열번호 99 및 서열번호 100의 프라이머 쌍 및 서열번호 97의 최종 단편을 위해 서열번호 101 및 서열번호 102의 프라이머 세트를 사용하여 별개의 DNA 단편을 PCR 증폭하였다. 서열번호 103 및 서열번호 104의 프라이머 세트는 서열번호 98의 purA 과발현을 위한 유전자 함유 단편의 증폭을 위해 사용하였다. Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 65℃ 25초 및 72℃ 23/25초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위한 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI) 및 XbaI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI) 및 XbaI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 처음 두 개의 단편을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 102 및 서열번호 105의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. 최종 단편의 결찰을 위해 제한효소 처리, 세척 및 결찰 단계를 반복하였다. PCR 산물을 0.8% 아가로스 겔에서 전기영동하고, 단편을 겔에서 잘라내고, 이전과 같이 소화 및 세척하고, 이전과 같이 결찰하였다. 서열번호 106 및 서열번호 107의 프라이머 쌍을 사용하여 yybN 상동성, RBS 서열을 갖는 프로모터, purA 유전자 및 제오신 저항성 카세트를 함유하는 최종 오페론을 증폭하고, 앞서 기술된 바와 같이 세척 및 결찰하였다. 바실러스 서브틸리스 VKPM B2116의 형질전환을 위해 구축된 합성 오페론을 사용하였다. 서열번호 108의 purA 오페론으로 형질전환하여 형질전환 균주 BS19를 얻었다. 인공 오페론이 yybN 통합 부위에 올바르게 통합되었는지는 cPCR로 확인하였다.

실시예 18: LOG8 유전자와의 조합으로 다양한 IPT 유전자의 상동체를 함유하는 합성 아이소프레노이드 사이토키닌 오페론의 조립 및 바실러스 서브틸리스로의 형질전환

아이소프레노이드 사이토키닌 생합성을 위한 합성 LOG 유전자(LOG8 - 서열번호 116) 및 다양한 IPT 유전자(서열번호 129, 154 내지 156)를 함유하는 합성 단편을 인공 아이소프레노이드 사이토키닌 오페론에 조립하였다. 바실러스 서브틸리스 게놈의 amyE 자리로의 안정적 게놈 통합을 위해 유전자 통합 상동성, 프로모터 서열 및 에리트로마이신 선별 마커(서열번호 73)를 함유하는 초기 및 최종 단편을 설계 및 합성하였다.

인공 오페론 조립의 첫 번째 단계로 서열번호 76의 초기 단편을 위해, 그리고 아이소프레노이드-사이토키닌 생합성을 위한 유전자들을 함유하는 합성 단편 LOG8(서열번호 116) 및 IPT1, IPT6, IPT7 및 IPT9 단편들(각각 서열번호 179, 151, 152 및 153)을 위해, 서열번호 74 및 서열번호 75의 프라이머 쌍을 사용하여 별개의 DNA 단편을 PCR 증폭하였다. 서열번호 77 및 서열번호 78의 프라이머 세트는 서열번호 79의 최종 단편의 증폭을 위해 사용하였다. Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 65℃ 25초 및 72℃ 30초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위한 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI), VspI, NdeI 및 SnaBI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI), VspI, NdeI 및 SnaBI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다. 초기 단편 및 다양한 IPT 단편들(서열번호 179, 151, 152 및 153)을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 가지 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 120 및 서열번호 121의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. DNA 단편들을 앞서 기술된 바와 같이 아가로스 겔에서 추출하였다. AmyE + IPT1 오페론, AmyE + IPT6 오페론, AmyE + IPT7 오페론 및 AmyE + IPT9 오페론(각각 서열번호 129, 154, 155 및 156) 및 LOG8 유전자 함유 단편(서열번호 116)의 결찰을 위해 제한효소 처리(VspI 및 NdeI), 세척 및 결찰 단계를 반복하였다. 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 122 및 서열번호 123의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. DNA 단편들을 앞서 기술된 바와 같이 아가로스 겔에서 추출하였다. 이전에 SnaBI 제한 부위에 의해 결찰되었고 서열번호 126 및 서열번호 127의 프라이머 세트를 사용하여 PCR 증폭된, AmyE 0 + IPT1/6/7/9 + LOG8 오페론(각각 서열번호 136, 157, 158 및 159) 및 EryR + AmyE END 오페론(서열번호 140)을 결찰하기 위해 XbaI 효소 처리를 수행하였다.

서열번호 128 및 서열번호 123의 프라이머 쌍을 사용하여 amyE 상동성, RBS 서열을 갖는 프로모터, 다양한 IPT 유전자와 LOG8 유전자 및 에리트로마이신 저항 카세트를 함유하는 최종 오페론을 증폭하고, 앞서 기술된 바와 같이 세척 및 결찰하였다. 바실러스 서브틸리스 BS19(실시예 17에 기술되어 있음)의 형질전환을 위해 IPT1-LOG8, IPT6-LOG8, IPT7-LOG8 및 IPT9-LOG8(각각 서열번호 147, 160, 161 및 162)을 함유하는 구축된 합성 트랜스-제아틴 오페론을 사용하였다. 모든 형질전환체들은 cPCR로 확인하였고 아래 표 18에 나열하였다. 모든 구축된 균주들은 실시예 6에 기술된 바와 같이 배양하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였고 사이토키닌의 수율을 도 13에 나타내었다.

실시예 19: IPT1 및 다양한 LOG를 함유하는 합성 아이소프레노이드 사이토키닌 오페론의 조립 및 바실러스 서브틸리스로의 형질전환

아이소프레노이드 사이토키닌 생합성을 위한 합성 IPT1 유전자(서열번호 71) 및 다양한 LOG 유전자(서열번호 110 내지 119)를 함유하는 합성 단편을 인공 아이소프레노이드 사이토키닌 오페론에 조립하였다. 바실러스 서브틸리스 게놈의 amyE 자리로의 안정적 게놈 통합을 위해 유전자 통합 상동성, 프로모터 서열 및 에리트로마이신 선별 마커를 함유하는 초기 및 최종 단편을 설계 및 합성하였다.

인공 오페론 조립의 첫 번째 단계로 서열번호 76의 초기 단편을 위해, 아이소프레노이드-사이토키닌 생합성을 위한 유전자들을 함유하는 서열번호 71의 합성 단편 IPT1 및 LOG2 내지 LOG11 단편들(서열번호 110 내지 119)을 위한, 서열번호 74 및 서열번호 75의 프라이머 쌍을 사용하여 별개의 DNA 단편을 PCR 증폭하였다. 서열번호 126 및 서열번호 127의 프라이머 세트는 에리트로마이신 선별 마커를 함유하는 최종 단편(서열번호 140)의 증폭을 위해 사용하였다. Eppendorf 사이클러 및 제조사에서 제공하는 완충액 중 Phusion 중합효소(Thermo Fisher)를 사용하고, 50㎕의 최종 부피로 200μM dNTP, 0.5μM의 각 프라이머 및 대략 10ng의 주형을 첨가하고, 98℃ 30초; (98℃ 30초, 65℃ 25초 및 72℃ 30초)의 30 사이클; 72℃ 5분; 10℃ 유지의 PCR 순환 조건을 사용하여 30 사이클 동안 단편들을 증폭하였다. 각 단편의 PCR 반응 산물을 0.8% 아가로스 겔에서 전기영동하고, 겔에서 잘라내고, GeneJET Gel Extraction Kit(Thermo Fisher)를 사용하여 제조사에서 제공한 프로토콜에 따라 겔에서 추출하였다. 제한 및 결찰의 반복 단계로 단편을 인공 오페론에 조립하였다. 성공적인 결찰을 위한 호환 가능한 제한 말단을 제공하기 위해 SpeI(BcuI), VspI, NdeI, XbaI 및 SnaBI 제한 부위 조합을 사용하였다. 각 결찰 단계 이후, 결합된 단편을 다음 PCR 증폭을 위한 새로운 주형으로 사용하였다. 제한효소 처리는 5㎕의 FD 그린 완충액(Thermo Fisher Scientific), 2 내지 3㎕의 선택된 효소(SpeI(BcuI), VspI, NdeI, XbaI 및 SnaBI, Thermo Fisher) 및 최대 약 1500ng의 PCR 단편을 첨가하여 50㎕ 부피에서 수행하였다. 제한효소 처리 후, 소화된 DNA 단편을 Wizard SV Gel 및 PCR Clean-up 시스템을 사용하여 제조사에서 제공하는 프로토콜에 따라 세척하였다.

처음 두 단편들을 결찰 반응에 사용하였고, 이때 2.5U의 T4 DNA 리가제(Thermo Fisher)를 제조사에서 제공한 완충액에 첨가하여 사용하였으며, 5% PEG 4000 및 1:1 몰비율의 두 단편을 첨가하여 15㎕의 최종 부피로 수행하였다. 다음 단계에서, 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 120 및 서열번호 121의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. DNA 단편들을 앞서 기술된 바와 같이 아가로스 겔에서 추출하였다. 다양한 LOG 유전자(서열번호 110 내지 119) 함유 단편의 결찰을 위해 제한효소 처리(VspI 및 NdeI), 세척 및 결찰 단계를 반복하였다. 1㎕의 불활성화한 결찰물을 새로운 50㎕ PCR의 주형으로 사용하고, 서열번호 122 및 서열번호 123의 프라이머 세트 및 앞에서와 같은 PCR 믹스 및 PCR 순환 조건을 사용하되 보다 긴 신장 시간을 사용하여 PCR을 수행하였다. DNA 단편들을 앞서 기술된 바와 같이 아가로스 겔에서 추출하였다. 이전에 SnaBI 제한 부위에 의해 결찰되었고 서열번호 126 및 서열번호 127의 프라이머 세트를 사용하여 PCR 증폭된, AmyE 0 + IPT1 + LOG2 내지 11 오페론(각각 서열번호 130 내지 139) 및 EryR + AmyE END 오페론(서열번호 140)을 결찰하기 위해 XbaI 효소 처리를 수행하였다.

서열번호 128 및 서열번호 123의 프라이머 쌍을 사용하여 amyE 상동성, RBS 서열을 갖는 프로모터, IPT1 및 다양한 LOG 유전자 및 에리트로마이신 저항성 카세트를 함유하는 최종 오페론을 증폭하고, 앞서 기술된 바와 같이 세척 및 결찰하였다. 바실러스 서브틸리스 BS19(실시예 17에 기술되어 있음)의 형질전환을 위해 IPT1-LOG 2 내지 11(서열번호 141 내지 150)을 함유하는 구축된 합성 트랜스-제아틴 오페론을 사용하였다. 모든 형질전환체들은 cPCR로 확인하였고 아래 표 19에 나열하였다. 모든 구축된 균주들은 실시예 6에 기술된 바와 같이 배양하였다. 추출 및 분석은 실시예 7에 기술된 바와 같이 수행하였고 사이토키닌의 수율을 도 14에 나타내었다.

설명에 인용된 참고문헌 목록

SEQUENCE LISTING <110> ACIES BIO D.O.O. <120> Genetically engineered bacterium capable of producing cytokinins with isoprenoid side chains <130> WO2022112509 <140> PCT/EP2021/083188 <141> 2021-11-26 <150> EP20075015 <151> 2020-11-26 <160> 184 <170> PatentIn version 3.5 <210> 1 <211> 243 <212> PRT <213> Agrobacterium tumefaciens <400> 1 Met Leu Leu His Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp 1 5 10 15 Met Ala Ile Gln Ile Ala Gln Glu Thr Gly Trp Pro Val Val Ala Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro 35 40 45 Leu Glu Ser Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Ser Arg 50 55 60 Pro Leu Thr Glu Gly Ile Leu Asp Ala Glu Ser Ala His Arg Arg Leu 65 70 75 80 Ile Phe Glu Val Asp Trp Arg Lys Ser Glu Glu Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Asn Cys Met Ala Lys Ser Pro Phe Trp 100 105 110 Arg Ser Gly Phe Gln Trp His Val Lys Arg Leu Arg Leu Gly Asp Ser 115 120 125 Asp Ala Phe Leu Thr Arg Ala Lys Gln Arg Val Ala Glu Met Phe Ala 130 135 140 Ile Arg Glu Asp Arg Pro Ser Leu Leu Glu Glu Leu Ala Glu Leu Trp 145 150 155 160 Asn Tyr Pro Ala Ala Arg Pro Ile Leu Glu Asp Ile Asp Gly Tyr Arg 165 170 175 Cys Ala Ile Arg Phe Ala Arg Lys His Asp Leu Ala Ile Ser Gln Leu 180 185 190 Pro Asn Ile Asp Ala Gly Arg His Val Glu Leu Ile Glu Ala Ile Ala 195 200 205 Asn Glu Tyr Leu Glu His Ala Leu Ser Gln Glu Arg Asp Phe Pro Gln 210 215 220 Trp Pro Glu Asp Gly Ala Gly Gln Pro Val Cys Pro Val Thr Leu Thr 225 230 235 240 Arg Ile Arg <210> 2 <211> 240 <212> PRT <213> Agrobacterium tumefaciens <400> 2 Met Asp Leu Arg Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Ser 1 5 10 15 Thr Ala Val Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro 35 40 45 Thr Val Glu Glu Leu Lys Gly Thr Ser Arg Leu Tyr Leu Asp Asp Arg 50 55 60 Pro Leu Val Lys Gly Ile Ile Ala Ala Lys Gln Ala His Glu Arg Leu 65 70 75 80 Met Gly Glu Val Tyr Asn Tyr Glu Ala His Gly Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Lys Cys Met Ala Gln Ser Ser Tyr Trp 100 105 110 Ser Ala Asp Phe Arg Trp His Ile Ile Arg His Glu Leu Ala Asp Glu 115 120 125 Glu Thr Phe Met Asn Val Ala Lys Ala Arg Val Lys Gln Met Leu Arg 130 135 140 Pro Ala Ala Gly Leu Ser Ile Ile Gln Glu Leu Val Asp Leu Trp Lys 145 150 155 160 Glu Pro Arg Leu Arg Pro Ile Leu Lys Glu Ile Asp Gly Tyr Arg Tyr 165 170 175 Ala Met Leu Phe Ala Ser Gln Asn Gln Ile Thr Ser Asp Met Leu Leu 180 185 190 Gln Leu Asp Ala Asp Met Glu Asp Lys Leu Ile His Gly Ile Ala Gln 195 200 205 Glu Tyr Leu Ile His Ala Arg Arg Gln Glu Gln Lys Phe Pro Arg Val 210 215 220 Asn Ala Ala Ala Tyr Asp Gly Phe Glu Gly His Pro Phe Gly Met Tyr 225 230 235 240 <210> 3 <211> 234 <212> PRT <213> Pseudomonas savastanoi <400> 3 Met Lys Ile Tyr Leu Ile Trp Gly Ala Thr Cys Thr Gly Lys Thr Glu 1 5 10 15 His Ser Ile Lys Leu Ser Lys Ser Thr Gly Trp Pro Val Ile Val Leu 20 25 30 Asp Arg Val Gln Cys Cys Phe Asp Ile Ala Thr Gly Ser Gly Arg Pro 35 40 45 His Pro Glu Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Asn Arg 50 55 60 Arg Ile Ser Glu Gly Val Ile Ser Ala Glu Glu Ala Asn Asp Arg Leu 65 70 75 80 Lys Leu Glu Val Asn Lys His Ile Asp Ser Gly Gly Val Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Lys Leu Ile Ser Lys Asp Pro Tyr Trp 100 105 110 Cys Asp Arg Phe Ile Trp Ser Gln His Arg Met Arg Leu Gln Asp Thr 115 120 125 Asp Val Phe Met Asp Lys Ala Lys Ala Arg Val Arg Arg Met Leu Val 130 135 140 Gly Ser Thr Glu Thr Thr Gly Leu Leu Asp Glu Leu Val Ala Ala Gln 145 150 155 160 Ser Asp Leu Asn Ala Lys Leu Ala Ile Gln Asp Ile Asp Gly Tyr Arg 165 170 175 Tyr Ile Met Asn Tyr Ala Gln Ala Arg Arg Leu Ser Ile Thr Gln Leu 180 185 190 Leu Asn Val Met Thr Gly Asp Met Lys Glu Glu Leu Ile Asn Gly Ile 195 200 205 Ala Leu Glu Tyr Tyr Glu His Ala Lys Trp Gln Glu Arg Asp Phe Pro 210 215 220 Ala Glu Trp Leu Ala Glu Arg Ser Thr Arg 225 230 <210> 4 <211> 236 <212> PRT <213> Erwinia herbicola <400> 4 Met Arg Gly Asn Val Tyr Leu Leu Trp Gly Ala Thr Thr Thr Gly Lys 1 5 10 15 Thr Ala Phe Ser Val Ser Val Ala Lys Glu Arg Gly Trp Ser Val Ile 20 25 30 Ala Leu Asp Arg Phe Gln Gly Tyr His Glu Ile Ser Thr Gly Ser Gly 35 40 45 Ala Pro Thr Asn Asn Glu Leu Glu Lys Thr Glu Arg Ile Tyr Ile Thr 50 55 60 Pro Gln Arg Gly Leu Ala Asp Gly Ile Ile Thr Ala Lys Asp Tyr Asn 65 70 75 80 Tyr Trp Leu Lys Ser Arg Val Leu Ser Leu Pro Glu Gly Lys Ser Asp 85 90 95 Phe Ile Ile Glu Gly Gly Ser Val Ser Leu Leu Lys Glu Met Val Ser 100 105 110 Asp Glu Phe Trp Ala Asp Phe Leu Trp Glu Ile Lys Ile Phe Arg Ala 115 120 125 Pro Ser Lys Asp Val Phe Ile Lys Arg Ala Lys Arg Arg Ile Thr Asp 130 135 140 Met Leu His Pro Glu Asp Gly Arg Pro Ser Ile Met Asp Glu Val Ser 145 150 155 160 Ser Phe Phe Met Asn His Lys Thr Ile His Pro Leu Glu Asp Ile Asp 165 170 175 Gly Tyr Arg Thr Ile Ile Asp Tyr Cys Arg Cys Lys Lys Ile Gly Phe 180 185 190 Asp Lys Leu Lys Ile Met Thr Thr Asp Gln Glu Lys Ile Ile Ile Ser 195 200 205 Gly Ile Ala Glu Glu Tyr Tyr Ala His Ala Leu Trp Gln Glu Gln Glu 210 215 220 Thr Pro Cys Phe Pro His Ser Trp Ser Arg Arg Trp 225 230 235 <210> 5 <211> 255 <212> PRT <213> Rhodococcus fascians <400> 5 Met Lys Glu Ser Thr Met Ala Gln Thr Gln Ala Arg Phe Asp Arg Val 1 5 10 15 Arg Trp Glu Pro Gly Val Tyr Ala Ile Val Gly Ala Thr Gly Ile Gly 20 25 30 Lys Ser Ala Glu Ala Ser Lys Leu Ala Leu Ser His Ser Ala Pro Ile 35 40 45 Val Val Ala Asp Arg Ile Gln Cys Tyr Ser Asp Leu Leu Val Thr Ser 50 55 60 Gly Arg Ala Phe Asp Ala Lys Val Glu Gly Leu Asn Arg Val Trp Leu 65 70 75 80 Asp Asn Arg Thr Ile His Gln Gly Asn Phe Asp Pro Asp Glu Ala Phe 85 90 95 Asp Arg Leu Ile Lys Val Leu Thr Ser Tyr Val Asp Arg Gly Glu Ala 100 105 110 Val Val Met Glu Gly Gly Ser Ile Ser Leu Ile Leu Arg Phe Ala Gln 115 120 125 Thr Ile Ser Asn Leu Pro Phe Pro Ala Val Val Asn Val Met Pro Ile 130 135 140 Pro Asp Arg Gln His Tyr Phe Ala Gln Gln Cys Ala Arg Ala Arg Gln 145 150 155 160 Met Leu Arg Gly Asp Ser Thr Gly Arg Asn Leu Leu Thr Glu Leu Ala 165 170 175 Glu Ala Trp Val Leu Gly Asp Gln His Asn Phe Ile Ala Ser Val Ala 180 185 190 Gly Leu Asp Cys Val Leu Asp Trp Cys Ala Thr His Ser Val Thr Pro 195 200 205 Glu Glu Leu Ala Asn Arg Asp Leu Thr Thr Glu Val Leu Asp Glu Leu 210 215 220 Ala Ala Ser Met Gly Gly Arg Tyr Val Glu His Gly Val Leu Gln Gln 225 230 235 240 Glu Ile Phe Leu Arg Thr Phe Gly Ala Pro Gly Val Thr Ala Arg 245 250 255 <210> 6 <211> 243 <212> PRT <213> Agrobacterium tumefaciens <400> 6 Met Ile Leu His Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp 1 5 10 15 Met Ala Ile Gln Ile Ala Gln Glu Thr Gly Trp Pro Val Val Ala Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro 35 40 45 Leu Glu Ser Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Ser Arg 50 55 60 Pro Leu Thr Glu Gly Ile Leu Asp Ala Glu Ser Ala His Arg Arg Leu 65 70 75 80 Ile Phe Glu Val Asp Trp Arg Lys Ser Glu Asp Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Asn Cys Met Ala Lys Ser Pro Phe Trp 100 105 110 Arg Ser Gly Phe Gln Trp His Val Lys Arg Leu Arg Leu Gly Asp Ser 115 120 125 Asp Ala Phe Leu Thr Arg Ala Lys Gln Arg Val Ala Glu Met Phe Ala 130 135 140 Ile Arg Glu Asp Arg Pro Ser Leu Leu Glu Glu Leu Ala Glu Leu Trp 145 150 155 160 Asn Tyr Pro Ala Ala Arg Pro Ile Leu Glu Asp Ile Asp Gly Tyr Arg 165 170 175 Cys Ala Ile Arg Phe Ala Arg Lys His Asp Leu Ala Ile Ser Gln Leu 180 185 190 Pro Asn Ile Asp Ala Gly Arg His Val Glu Leu Ile Glu Ala Ile Ala 195 200 205 Asn Glu Tyr Leu Glu His Ala Leu Ser Gln Glu Arg Asp Phe Pro Gln 210 215 220 Trp Pro Glu Asp Gly Ala Gly Gln Pro Val Cys Pro Val Thr Leu Thr 225 230 235 240 Arg Ile Arg <210> 7 <211> 238 <212> PRT <213> Ralstonia solanacearum <400> 7 Met Pro Val Arg Leu Tyr Leu Ile Trp Gly Ala Thr Thr Thr Gly Lys 1 5 10 15 Thr Ala Gln Ser Val Ala Leu Ala Arg Ser Ala Gly Ala Pro Val Ile 20 25 30 Ser Leu Asp Arg Val Gln Cys Cys His Glu Leu Ala Val Gly Ser Gly 35 40 45 Arg Pro Ser Pro Ser Glu Leu Leu Gly Thr Arg Arg Glu Tyr Leu Cys 50 55 60 Glu Arg Glu Val Ser Arg Gly Val Val Ser Ala Ala Glu Ala Asn Gln 65 70 75 80 Leu Leu Leu Asp Lys Val Ala Arg Tyr Ala Thr Gln Glu Arg Ala Leu 85 90 95 Ile Leu Glu Gly Gly Ser Val Ser Leu Ile Asn Ala Met Ile Arg Asp 100 105 110 Ala Arg Trp Ser Glu Arg Gly Glu Trp Ile Leu Arg Arg Ile Pro Val 115 120 125 Pro Gly Arg Ala Ala Phe Met Ala Ala Ala Arg Lys Arg Val Arg Glu 130 135 140 Met Leu Asp Pro Pro Pro Gly Gln Ala Gly Ile Leu Asp Glu Leu Gln 145 150 155 160 Gly Leu Trp Gly Tyr Pro Arg Asn His Ala Val Leu Glu Asp Ile Asp 165 170 175 Gly Tyr Arg Gln Ile Ile Arg Tyr Ala Asn Ala Leu Gln Val Pro Ile 180 185 190 Cys Arg Ile Thr Ser Ile Asp Pro Asn Ala Lys Ala Leu Leu Ile Glu 195 200 205 Arg Ile Ala Gln Glu Tyr Trp Glu His Ala Leu Trp Gln Glu Gln Glu 210 215 220 Phe Leu Gly Ile Pro Ala Ser Trp Met Arg Ala Asp Asp Ala 225 230 235 <210> 8 <211> 249 <212> PRT <213> Xanthomonas oryzae <400> 8 Met Ser Cys Ile Leu His Leu Ile Trp Gly Pro Thr Cys Ser Gly Lys 1 5 10 15 Thr Glu Val Ala Val Ala Leu Ala Glu Gln Thr Gly Trp Pro Val Ile 20 25 30 Ala Leu Asp Arg Val Gln Cys Cys Pro Glu Met Ser Thr Cys Ser Gly 35 40 45 Arg Pro Leu Pro Ala Glu Leu Arg Ala Thr Arg Arg Ile Tyr Leu Ala 50 55 60 Ser Arg Ala Val Arg Glu Gly Ile Ile Ala Ala Asp Glu Ala His Ala 65 70 75 80 Leu Leu Val Asp Leu Val Asp Arg Arg Ser Ala Ala Gly Gly Val Ile 85 90 95 Leu Glu Gly Gly Ser Ile Ser Leu Ile Asn Arg Met Ile Leu Asp Pro 100 105 110 Tyr Trp Ala Asn Asp Trp Gln Trp Arg Ser His Arg Leu Leu Leu Gly 115 120 125 Glu Cys Ala Asp Phe Leu Asp Arg Ala Leu Arg Arg Val Glu Lys Met 130 135 140 Leu Arg Thr Gly Met Gly Arg Pro Ser Leu Leu Glu Glu Leu Val Ala 145 150 155 160 Leu Trp Pro Asp Pro Ala Leu Arg Pro Thr Ile Glu Asp Val Asp Gly 165 170 175 Tyr Arg Tyr Ser Ile Arg Phe Ala Arg Gln Trp Asn Val Pro Val Gly 180 185 190 Gln Leu Leu Ser Ile Gly Asp Glu Met Lys Gln Arg Leu Ile His Gly 195 200 205 Ile Ala Glu Glu Tyr Leu Gly His Ala Gln Trp Gln Glu Arg Asp Leu 210 215 220 Leu Thr Leu Pro Ala Asn Trp Gln Ala Gln Asp Val Ser Met Gly Gly 225 230 235 240 Ser Lys Ser Gly Leu His His Arg Leu 245 <210> 9 <211> 243 <212> PRT <213> Neorhizobium sp. NCHU2750 <400> 9 Met Leu Leu His Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp 1 5 10 15 Met Ala Ile Gln Ile Ala Gln Glu Thr Gly Trp Pro Val Val Ala Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro 35 40 45 Leu Glu Ser Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Ser Arg 50 55 60 Pro Leu Thr Glu Gly Ile Leu Asp Ala Glu Ser Ala His Arg Arg Leu 65 70 75 80 Ile Phe Glu Val Asp Trp Arg Lys Ser Glu Glu Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Asn Cys Met Ala Lys Ser Pro Phe Trp 100 105 110 Arg Ser Gly Phe Gln Trp His Val Lys Arg Leu Arg Leu Gly Asp Ser 115 120 125 Asp Ala Phe Leu Thr Arg Ala Lys Gln Arg Val Ala Glu Met Phe Ala 130 135 140 Ile Arg Glu Asp Arg Pro Ser Leu Leu Glu Glu Leu Ala Glu Leu Trp 145 150 155 160 Asn Tyr Pro Ala Ala Arg Pro Ile Leu Glu Asp Ile Asp Gly Tyr Arg 165 170 175 Cys Ala Ile Arg Phe Ala Arg Lys His Asp Leu Ala Ile Ser Gln Leu 180 185 190 Pro Asn Ile Asp Ala Gly Arg His Val Glu Leu Ile Glu Ala Ile Ala 195 200 205 Asn Glu Tyr Leu Glu His Ala Leu Ser Gln Glu Arg Asp Phe Pro Gln 210 215 220 Trp Pro Glu Asp Gly Ala Gly Gln Pro Val Cys Pro Val Thr Leu Thr 225 230 235 240 Arg Ile Arg <210> 10 <211> 237 <212> PRT <213> Streptomyces hainanensis <400> 10 Met His Ile Ile Ala Gly Pro Thr Gly Ile Gly Lys Ser Ala Ala Ala 1 5 10 15 Thr Glu Leu Ala Arg Ala Thr Gly Ala Pro Ile Val Val Ala Asp Arg 20 25 30 Ile Gln Cys Phe Pro Glu Leu Ala Thr Thr Ser Ala Arg Ala Gly Gly 35 40 45 Glu Ala Ala Asp Val Glu Arg Ile Trp Leu Ala Glu Arg Ala Val Ala 50 55 60 Asp Gly Asp Phe Ala Val Ala Asp Ala Leu Glu Ala Leu Ile Gly Thr 65 70 75 80 Leu Arg Gly Leu Arg Glu Arg His Pro Phe Val Ile Val Glu Gly Gly 85 90 95 Ser Ile Ser Leu Leu Trp Asp Phe Ala Glu Leu Leu Pro Glu Leu Gly 100 105 110 Phe Arg Ala Thr Val Arg Leu Met His Ile Ala Asp Arg Arg Glu Tyr 115 120 125 Val Ala Gly Leu Thr Arg Arg Ala Arg Gly Met Leu Val Pro Glu Gly 130 135 140 Ala Ala Thr Ser Ala Ile Glu Glu Leu Ala Ile Ala Trp Lys Ser Val 145 150 155 160 Glu Gln Arg Ser Phe Val Ala Ser Ile Asn Gly Phe Lys Gly Ile Leu 165 170 175 Glu Trp Cys Ala Thr His Ser Phe Ala Val Glu Ser Leu Ala Ser Ala 180 185 190 Ala Leu Thr Glu Glu Gln Val Gly Glu Leu Ser Arg Met Val Ala Leu 195 200 205 Arg His Ala Glu His Gly Val Leu Gln Asp Arg Ile Phe Ser Met Val 210 215 220 Phe Asp Gly Trp Cys Gly Glu Pro Asp Ala Val Thr Asp 225 230 235 <210> 11 <211> 256 <212> PRT <213> Streptomyces ipomoeae <400> 11 Met Ala Asp Thr Gly Thr His Val Glu Thr Ser Pro Leu Val His Leu 1 5 10 15 Ile Ala Gly Pro Thr Gly Val Gly Lys Ser Ala Ala Ala Thr Glu Leu 20 25 30 Ala Arg Glu Thr Gly Ala Pro Val Val Val Ala Asp Arg Leu Gln Cys 35 40 45 Phe Thr Asp Leu Ala Thr Ala Ser Ala Arg Ala Gly Ala Glu Val Pro 50 55 60 Asp Val Gln Arg Tyr Trp Leu Gly Asp Arg Thr Val Ala Asp Gly Asp 65 70 75 80 Leu Ser Ala Ser Ala Ala Thr Asp Ala Leu Val Ala Leu Val Glu Arg 85 90 95 Leu Ala Ile Arg His Pro Leu Val Ile Val Glu Gly Gly Ser Ile Ser 100 105 110 Leu Leu Arg Glu Leu Ser Glu Arg Arg Ala Ala Leu Ser Trp Arg Leu 115 120 125 Thr Val Arg Leu Met Pro Leu Pro Asp Arg Ser Asp Tyr Val Ala Ala 130 135 140 Leu Thr Arg Arg Ala Arg Thr Met Leu Ala Pro Pro Pro Pro Glu Arg 145 150 155 160 Gly Leu Leu Asp Glu Leu Ala Thr Leu Trp Arg Asp Pro His Arg Arg 165 170 175 Tyr Phe Ala Ala Ser Val Asn Gly Phe Glu Thr Val Leu Glu Cys Cys 180 185 190 Ala Lys Tyr Ser Leu Asp Val Lys Thr Leu His Lys Arg Asn Leu Pro 195 200 205 Glu His Ile Leu Ala Arg Met Ala Ala Leu Ile Ala Glu Arg His Ala 210 215 220 Glu His Gly Ile Leu Gln His Gln Val Phe Thr Glu Ile Phe Ala Asp 225 230 235 240 Arg Ile Ser Gly Ser Arg Cys Asp Leu Gly Ala Leu Glu Arg Val Ala 245 250 255 <210> 12 <211> 257 <212> PRT <213> Streptomyces turgidiscabies <400> 12 Met Glu Lys Val Leu Lys Met Thr Ala Arg Ile Arg Thr Ala Arg Gly 1 5 10 15 Arg Gly Thr Ile Gly Val Arg Ala Leu Val Gly Pro Thr Gly Val Gly 20 25 30 Lys Ser Ala Ala Ala Thr Ala Leu Ala Arg Asp Thr Gly Ala Pro Val 35 40 45 Leu Val Ala Asp Arg Ile Gln Cys Phe Thr Asp Leu Val Val Thr Ser 50 55 60 Gly Arg Ala Ala Asp Ala His Val Leu Glu Val Asp Arg Ile Trp Leu 65 70 75 80 Ser Asp Arg Thr Val Ser Asp Gly Asp Tyr Ala Leu Gly Glu Ala Ser 85 90 95 Glu Asp Leu Leu Ser Arg Leu Gly Ser Leu Val Thr Asp Arg Gly Leu 100 105 110 Val Val Leu Glu Gly Gly Ser Ile Ser Leu Leu Leu Arg Phe Ala Glu 115 120 125 Leu Met Glu Asn Leu Pro Tyr Ser Val Ser Val Asp Leu Leu Pro Ile 130 135 140 Phe Asp Lys Ser Tyr Tyr Ser Ala Arg Gln Ile Ala Arg Ala Arg Lys 145 150 155 160 Met Leu Leu Pro Asp Ser Ser Gly Arg Ser Leu Leu Thr Glu Phe Ala 165 170 175 Ala Ala Trp Arg Thr Pro Gly Gln Arg Arg Phe Ala Ala Ser Val Ser 180 185 190 Gly Leu Asp Ser Ile Cys Glu Trp Cys Ala Lys His Ser Val Glu Pro 195 200 205 Glu Glu Val Ala Asp Val Asp Leu Ser Glu Lys Met Leu Gly Glu Leu 210 215 220 Ser Thr Met Leu Gly Glu Arg Tyr Ala Ala His Gly Phe Thr Gln Glu 225 230 235 240 Arg Leu Phe Leu Lys Thr Phe Asp His His Val Arg Asn Ser Pro Asp 245 250 255 Ala <210> 13 <211> 256 <212> PRT <213> Streptomyces turgidiscabies <400> 13 Met Gly Glu Ile Pro Ala Asp Cys Thr Val Arg Pro Tyr Val His Leu 1 5 10 15 Ile Ala Gly Pro Thr Gly Ala Gly Lys Ser Ala Val Ala Asn Asp Leu 20 25 30 Ala Arg Val Thr Gly Ala Pro Val Val Val Ala Asp Arg Leu Gln Cys 35 40 45 Phe Thr Asp Leu Ala Thr Thr Ser Ala Arg Ala Gly Ala Gln Ala Pro 50 55 60 Gly Val Arg Arg Tyr Trp Leu Ala Asp Arg Thr Val Ala Asp Gly Asp 65 70 75 80 Leu Asp Ala Ala Ala Ala Ala Asp Ser Leu Phe Gly Leu Val Glu Arg 85 90 95 Leu Gly Ser Arg His Pro Phe Val Ile Val Glu Gly Gly Ser Ile Ser 100 105 110 Leu Leu Lys Val Leu Ala Ala Arg Cys Ala Ala Leu Pro Trp Gln Leu 115 120 125 Ser Val Arg Val Leu Pro Leu Pro Ala Tyr Gly Asp Tyr Ile Glu Ala 130 135 140 Leu Thr Cys Arg Ala Arg Thr Met Leu Ala Pro Pro Thr Pro Glu Arg 145 150 155 160 Ser Leu Leu Glu Glu Leu Ala Val Leu Trp Ala Asp Pro Arg His Arg 165 170 175 Arg Phe Ala Ala Ser Val Asn Gly Phe Glu Ala Val Leu Glu Cys Cys 180 185 190 Ala Lys Tyr Ser Leu Asn Val Gly Thr Ile His Lys Gln Ala Pro Pro 195 200 205 Asp Pro Ile Arg Ser Gln Met Ala Ser Leu Ile Ala Leu Arg His Ala 210 215 220 Glu His Gly Ile Leu Gln Ser Arg Val Phe Thr Glu Thr Phe Gly Ser 225 230 235 240 Arg Leu Pro Glu Gln Ile Leu Asp Pro Ser Val Leu Gly Arg Ala Ala 245 250 255 <210> 14 <211> 243 <212> PRT <213> Agrobacterium rhizogenes <400> 14 Met Leu Leu Tyr Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp 1 5 10 15 Ile Ala Ile Gln Ile Ala Gln Lys Thr Gly Trp Pro Val Val Ala Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro 35 40 45 Leu Pro Ser Glu Leu Gln Ser Thr Arg Arg Ile Tyr Leu Asp Ser Arg 50 55 60 Arg Leu Thr Lys Gly Ile Ile Asp Ala Glu Gly Ala His Arg Arg Leu 65 70 75 80 Ile Leu Glu Val Asp Trp Gln Glu Ser Glu Glu Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Val Ser Leu Leu Asn Cys Met Ala Lys Ser Pro Tyr Trp 100 105 110 Lys Ser Gly Phe Gln Trp His Val Lys Arg Leu Arg Leu Gly Asp Ser 115 120 125 Asp Ala Phe Leu Ala Arg Ala Lys Gln Arg Val Thr Glu Met Phe Ala 130 135 140 Ile Arg Glu Asp Arg Pro Ser Leu Leu Glu Glu Leu Ala Glu Leu Trp 145 150 155 160 Asn Tyr Pro Ala Thr Arg Pro Ile Leu Glu Asp Ile Asp Gly Tyr Arg 165 170 175 Cys Ala Ile Arg Phe Ala Arg Lys His Asp Leu Ala Ile Asn Gln Leu 180 185 190 Pro Asp Ile Asp Ala Glu Arg Gln Gln Asp Leu Ile Glu Ala Ile Ala 195 200 205 Lys Glu Tyr Leu Glu His Ala Ile Met Gln Glu Arg Asp Phe Pro Gln 210 215 220 Trp Pro Glu Asp Gly Ala Arg Gln Pro Val Gly Pro Ala Thr Leu Met 225 230 235 240 Arg Ile Gln <210> 15 <211> 240 <212> PRT <213> Agrobacterium tumefaciens <400> 15 Met Asp Leu His Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Thr 1 5 10 15 Thr Ala Ile Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro 35 40 45 Thr Val Glu Glu Leu Lys Gly Thr Thr Arg Leu Tyr Leu Asp Asp Arg 50 55 60 Pro Leu Val Glu Gly Ile Ile Ala Ala Lys Gln Ala His His Arg Leu 65 70 75 80 Ile Glu Glu Val Tyr Asn His Glu Ala Asn Gly Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Thr Ser Leu Leu Asn Cys Met Ala Arg Asn Ser Tyr Trp 100 105 110 Ser Ala Asp Phe Arg Trp His Ile Ile Arg His Lys Leu Pro Asp Gln 115 120 125 Glu Thr Phe Met Lys Ala Ala Lys Ala Arg Val Lys Gln Met Leu His 130 135 140 Pro Ala Ala Gly His Ser Ile Ile Gln Glu Leu Val Tyr Leu Trp Asn 145 150 155 160 Glu Pro Arg Leu Arg Pro Ile Leu Lys Glu Ile Asp Gly Tyr Arg Tyr 165 170 175 Ala Met Leu Phe Ala Ser Gln Asn Gln Ile Thr Ala Asp Met Leu Leu 180 185 190 Gln Leu Asp Ala Asn Met Glu Gly Lys Leu Ile Asn Gly Ile Ala Gln 195 200 205 Glu Tyr Phe Ile His Ala Arg Gln Gln Glu Gln Lys Phe Pro Gln Val 210 215 220 Asn Ala Ala Ala Phe Asp Gly Phe Glu Gly His Pro Phe Gly Met Tyr 225 230 235 240 <210> 16 <211> 240 <212> PRT <213> Agrobacterium tumefaciens <400> 16 Met Asp Leu Arg Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Ser 1 5 10 15 Thr Ala Val Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro 35 40 45 Thr Val Glu Glu Leu Lys Gly Thr Ser Arg Leu Tyr Leu Asp Asp Arg 50 55 60 Pro Leu Val Lys Gly Ile Ile Ala Ala Lys Gln Ala His Glu Arg Leu 65 70 75 80 Met Gly Glu Val Tyr Asn Tyr Glu Ala His Gly Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Lys Cys Met Ala Gln Ser Ser Tyr Trp 100 105 110 Ser Ala Asp Phe Arg Trp His Ile Ile Arg His Glu Leu Ala Asp Glu 115 120 125 Glu Thr Phe Met Asn Val Ala Lys Ala Arg Val Lys Gln Met Leu Arg 130 135 140 Pro Ala Ala Gly Leu Ser Ile Ile Gln Glu Leu Val Asp Leu Trp Lys 145 150 155 160 Glu Pro Arg Leu Arg Pro Ile Leu Lys Glu Ile Asp Gly Tyr Arg Tyr 165 170 175 Ala Met Leu Phe Ala Ser Gln Asn Gln Ile Thr Ser Asp Met Leu Leu 180 185 190 Gln Leu Asp Ala Asp Met Glu Asp Lys Leu Ile His Gly Ile Ala Gln 195 200 205 Glu Tyr Leu Ile His Ala Arg Arg Gln Glu Gln Lys Phe Pro Arg Val 210 215 220 Asn Ala Ala Ala Tyr Asp Gly Phe Glu Gly His Pro Phe Gly Met Tyr 225 230 235 240 <210> 17 <211> 240 <212> PRT <213> Agrobacterium vitis <400> 17 Met Asp Leu Arg Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Ser 1 5 10 15 Thr Ala Ile Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro 35 40 45 Thr Val Glu Glu Leu Lys Gly Thr Thr Arg Leu Tyr Leu Asp Asp Arg 50 55 60 Pro Leu Val Lys Gly Ile Ile Ala Ala Glu Gln Ala His Glu Arg Leu 65 70 75 80 Ile Ala Glu Val Tyr Asn Tyr Glu Ala His Gly Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Lys Cys Met Ala Gln Ser Gly Tyr Trp 100 105 110 Ser Ala Asp Phe Arg Trp His Ile Ile Arg His Lys Leu Ala Asp Glu 115 120 125 Glu Thr Phe Met Lys Ala Ala Lys Ala Arg Val Lys Gln Met Leu Cys 130 135 140 Pro Ala Ile Gly Pro Ser Leu Ile Gln Glu Leu Val Tyr Leu Trp Asn 145 150 155 160 Glu Pro Arg Leu Arg Pro Ile Leu Lys Glu Ile Asp Gly Tyr Arg Tyr 165 170 175 Ala Met Leu Phe Ala Ser Gln Asn Arg Ile Thr Pro Asp Met Leu Leu 180 185 190 Gln Leu Asp Ala Asp Met Glu Gly Lys Leu Ile His Gly Ile Ala Gln 195 200 205 Glu Tyr Leu Ile His Ala Arg Arg Gln Glu His Glu Phe Pro Pro Val 210 215 220 Ser Ala Ala Ala Phe Glu Gly Phe Glu Gly Pro Pro Phe Gly Ala Tyr 225 230 235 240 <210> 18 <211> 236 <212> PRT <213> Agrobacterium vitis <400> 18 Met Glu Ala His Leu Ile Phe Gly Pro Thr Ser Thr Gly Lys Thr Ser 1 5 10 15 Val Ala Ile Ala Leu Ala Lys Arg Thr Gly Phe Pro Val Ile Val Leu 20 25 30 Asp Arg Ile Gln Cys Tyr Ser Gln Leu Ser Val Gly Gly Gly Arg Pro 35 40 45 Ser Ala Ala Glu Phe Gln Gly Thr Arg Arg Ile Tyr Leu Ile Glu Gly 50 55 60 Ser Leu Asp Glu Gly Val Ile Ser Ala Glu Arg Ala His Glu Cys Leu 65 70 75 80 Val Ala Ala Val Glu Ala His Lys Pro Glu Gly Gly Val Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Phe Lys Arg Met Ala Gln Ser Ser Tyr Trp 100 105 110 Asn Cys Gly Phe Thr Trp His Val Thr Arg Leu His Leu Gly Gly Glu 115 120 125 Glu Ile Phe Leu Ala Ala Ala Lys Lys Arg Ile Asn Gln Met Met Gln 130 135 140 Pro Asp Glu Gln Gly Asn Ser Phe Leu Gly Glu Leu Val Ser Val Trp 145 150 155 160 Lys Thr Thr Ala Leu Arg Ala Thr Leu Glu Gly Ile Cys Gly Tyr Arg 165 170 175 Tyr Ala Ile Glu Phe Ala Gly Lys Gln Gly Leu Glu Met Asp Ala Leu 180 185 190 Thr Ser Leu Asn Arg Arg Gln Leu Glu Gln Leu Val His Gly Met Ala 195 200 205 His Glu Tyr Leu Cys Tyr Ala Arg Gln Gln Glu Gln Glu Leu Pro Leu 210 215 220 Pro Ser Leu Ala Gly Gly Glu Gly Pro Pro Phe Gln 225 230 235 <210> 19 <211> 240 <212> PRT <213> Halomonas anticariensis <400> 19 Met Arg Arg His Tyr Ile Leu Gly Thr Thr Ala Ser Gly Lys Thr Ser 1 5 10 15 Ala Ser Ile Ser Leu Ala Glu Met Val Asn Ala Pro Val Val Val Leu 20 25 30 Asp Arg Ile Gln Cys Phe Gln Glu Leu Trp Thr Val Ser Ser Arg Pro 35 40 45 Gln Asp Ser Glu Leu Gly Ala Thr Lys Arg Phe Tyr Leu Asp Asp Arg 50 55 60 Glu Ile Ser His Gly Asn Leu Gly Val Glu Asp Ala Tyr Thr Lys Leu 65 70 75 80 Val Asn Ile Val Asp Lys Leu Ser Asn Tyr His Ser Phe Val Ile Leu 85 90 95 Glu Gly Gly Ser Val Ser Leu Cys Arg Leu Ile Val Glu Arg Ala Glu 100 105 110 Leu Cys Arg Gly Ser Thr Val Glu Ile Arg Trp Asn Asn Pro Asp Asp 115 120 125 Pro Ala Tyr Val Gln Lys Ile Arg Glu Arg Val Val Gln Met Met Glu 130 135 140 Pro Arg Val Asp Arg Arg Ser Ile Val Asp Glu Leu Lys Tyr Ala Trp 145 150 155 160 Asp Tyr Lys Glu Gln Arg Asp Phe Ile Thr Ser Ile Cys Gly Phe Asp 165 170 175 Gly Ile Leu Ser Trp Cys Asp Asp Asn Asn Phe His Ile Glu Asp Val 180 185 190 Asp Phe Glu Cys Leu Pro Leu Ser Ala Ile Gly Glu Ile Thr Asp Arg 195 200 205 Val Ala Glu Ser His Arg Lys Tyr Ala Arg Thr Gln Phe Glu Met Leu 210 215 220 Asn Ile Met Glu Gln Ala Met Ile Ala Thr Gly Val Lys Val Val Arg 225 230 235 240 <210> 20 <211> 233 <212> PRT <213> Lonsdalea quercina <400> 20 Met Asp Thr Thr Leu His Leu Ile Trp Gly Pro Thr Ser Thr Gly Lys 1 5 10 15 Thr Ala Arg Ser Val Ala Ile Ala Glu Lys Thr Gly Ala Pro Val Leu 20 25 30 Val Leu Asp Arg Ile Gln Cys Cys Pro Glu Val Thr Met Gly Ser Gly 35 40 45 Arg Pro Thr Glu Gln Glu Leu Arg Gly Thr Glu Arg Val Tyr Leu Ser 50 55 60 Ser Arg Pro Ile Glu Gln Ser Ile Ile Ser Ala Pro Gln Ala Val Glu 65 70 75 80 Arg Leu His Gln Leu Val Asp His Phe Ala Lys Ile His Pro Leu Ile 85 90 95 Ile Leu Glu Gly Gly Ser Val Ser Ile Leu Gln Glu Met Val Lys His 100 105 110 Gln Thr Trp Gly Gln Gln Tyr Ala Trp Thr Phe Glu Pro Ile Pro Met 115 120 125 Pro Ser Ala Glu His Phe Leu Asn Arg Ala Arg Lys Arg Ile Trp Glu 130 135 140 Met Phe Tyr Pro Gly Gly Gly Leu Lys Ser Leu Leu Asp Glu Met Val 145 150 155 160 Gln Ile Trp Ala His Pro Glu Tyr Arg Asp Thr Leu Ala Asp Ile Asp 165 170 175 Gly Tyr Arg Cys Ile Ile Ser Tyr Leu Arg Gln Arg Gly Arg Arg Val 180 185 190 Asp Glu Ile Pro Arg Met Ser Leu His Glu His Lys Gln Met Ala Glu 195 200 205 Asp Ile Ala Gln Glu Tyr Trp Gln His Ala Val Trp Gln Thr Asp Asn 210 215 220 Phe Pro Glu Ile Pro Pro Cys Trp Arg 225 230 <210> 21 <211> 238 <212> PRT <213> Ralstonia solanacearum <400> 21 Met Pro Ile Arg Leu Tyr Leu Ile Trp Gly Ala Thr Thr Thr Gly Lys 1 5 10 15 Thr Ala Gln Ser Val Ala Leu Ala Arg Ala Thr Gly Ala Pro Val Ile 20 25 30 Ser Leu Asp Arg Val Gln Cys Cys His Glu Leu Ala Val Gly Ser Gly 35 40 45 Arg Pro Leu Pro Ser Glu Leu Leu Gly Thr Arg Arg Glu Tyr Leu Cys 50 55 60 Asp Arg Ser Val Ser Ser Gly Val Ile Pro Ala Ala Asp Ala Asn Gln 65 70 75 80 Leu Leu Phe Asp Lys Val Val Arg Tyr Ser Ala His Glu Arg Ala Leu 85 90 95 Ile Leu Glu Gly Gly Ser Val Ser Leu Ile Asn Ala Met Ile Arg Asp 100 105 110 Ala Arg Trp Ser Ala Leu Gly Glu Trp Ala Leu Arg Arg Ile Val Leu 115 120 125 Pro Gly Arg Ala Val Phe Ile Ala Gln Ala Ile Lys Arg Val Arg Asp 130 135 140 Met Leu Glu Pro Pro Pro Gly His Ala Ser Ile Leu Asp Glu Leu Glu 145 150 155 160 Gly Leu Trp Ala His Pro Gly Asn His Ala Val Leu Glu Asp Val Asp 165 170 175 Gly Tyr Arg Gln Ile Ile Arg Tyr Ala Arg Ala Ser Gln Val Pro Ile 180 185 190 Asp Arg Ile Thr Ser Ile Asp Arg Ser Thr Met Ala Thr Leu Val Glu 195 200 205 Arg Ile Ala Gln Glu Tyr Trp Glu His Ala Leu Trp Gln Glu Gln Glu 210 215 220 Phe Leu Gly Ile Pro Ala Thr Trp Arg Arg Ala Asp Asp Ala 225 230 235 <210> 22 <211> 239 <212> PRT <213> Rhizobium radiobacter <400> 22 Met Asp Leu Arg Leu Ile Phe Gly Pro Thr Cys Thr Gly Lys Thr Ser 1 5 10 15 Thr Ala Ile Ala Leu Ala Gln Gln Thr Gly Leu Pro Val Leu Ser Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Leu Ser Thr Gly Ser Gly Arg Pro 35 40 45 Thr Val Glu Glu Leu Lys Gly Thr Thr Arg Leu Tyr Leu Asp Asp Arg 50 55 60 Pro Leu Val Lys Gly Ile Ile Thr Ala Lys Gln Ala His Glu Arg Leu 65 70 75 80 Ile Ala Glu Val His Asn His Glu Ala Lys Gly Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Arg Cys Met Ala Gln Ser Arg Tyr Trp 100 105 110 Asn Ala Asp Phe Arg Trp His Ile Ile Arg Asn Glu Leu Ala Asp Glu 115 120 125 Glu Ser Phe Met Ser Val Ala Lys Thr Arg Val Lys Gln Met Leu Arg 130 135 140 Pro Ser Ala Gly Leu Ser Ile Ile Gln Glu Leu Val Gln Leu Trp Arg 145 150 155 160 Glu Pro Arg Leu Arg Pro Ile Leu Glu Gly Ile Asp Gly Tyr Arg Tyr 165 170 175 Ala Leu Leu Phe Ala Thr Gln Asn Gln Ile Thr Pro Asp Met Leu Leu 180 185 190 Gln Leu Asp Ala Asp Met Glu Asn Lys Leu Ile His Gly Ile Ala Gln 195 200 205 Glu Phe Leu Ile His Ala Arg Arg Gln Glu Gln Lys Phe Pro Leu Val 210 215 220 Gly Ala Thr Ala Val Glu Ala Phe Glu Gly Pro Pro Phe Arg Met 225 230 235 <210> 23 <211> 252 <212> PRT <213> Rhizobium tumorigenes <400> 23 Met Leu Ile Tyr Leu Ile Tyr Gly Pro Thr Cys Ser Gly Lys Thr Asp 1 5 10 15 Leu Ala Ile Gln Ile Ala Arg Glu Thr Gly Trp Pro Val Ile Ala Leu 20 25 30 Asp Arg Val Gln Cys Cys Pro Gln Ile Ala Thr Gly Ser Gly Arg Pro 35 40 45 Leu Glu Ser Glu Leu Gln Ser Thr Gln Arg Ile Tyr Leu Asp Ser Arg 50 55 60 Pro Leu Thr Glu Gly Val Met Glu Ala Glu Ala Ala His Leu Gln Leu 65 70 75 80 Ile Ser Ala Ile Glu Asp Arg Lys Ser Ser Pro Gly Leu Ile Leu Glu 85 90 95 Gly Gly Ser Ile Ser Leu Leu Asn Cys Met Ala Lys Asp Ser Tyr Trp 100 105 110 Asn Ala Gly Phe Arg Trp His Val Arg Arg Leu Arg Leu Pro Thr Pro 115 120 125 Asp Val Phe Leu Pro Arg Ala Arg Leu Arg Val Thr Glu Met Phe Ala 130 135 140 Ile Lys Asp Glu Arg Pro Ser Leu Leu Glu Glu Leu Ala Asp Leu Trp 145 150 155 160 Asn Gln Glu Val Leu Arg Pro Val Leu Glu Asp Ile Asp Gly Tyr Arg 165 170 175 Cys Ala Ile Gln Phe Ala Arg Glu Asn Asn Ile Glu Ile Gly Glu Leu 180 185 190 Leu His Leu Asp Pro Met Arg Arg Glu Ala Leu Ile Ala Ala Ile Ala 195 200 205 Glu Glu Tyr Leu Glu His Ala Arg Trp Gln Glu Arg Glu Phe Pro Asp 210 215 220 Trp Gln Glu Gly Gly Asn Val Gly Leu Thr Pro Leu Pro Ala Ser His 225 230 235 240 Asp Thr Gly Ser Pro Arg Asp Leu Arg Ser Leu Gly 245 250 <210> 24 <211> 236 <212> PRT <213> Streptomyces bingchenggensis <400> 24 Met His Val Ile Ala Gly Pro Thr Gly Val Gly Lys Ser Ala Ala Ala 1 5 10 15 Thr Ala Leu Ala Arg Ile Thr Gly Ala Pro Ile Val Val Ala Asp Arg 20 25 30 Ile Gln Cys Phe Thr Asp Leu Ala Thr Thr Ser Ala Arg Ala Gly Glu 35 40 45 Glu Thr Val Glu Val Glu Arg Ser Trp Leu Gly Asp Arg Thr Val Ala 50 55 60 Asp Gly Asp Tyr Pro Pro Glu Glu Ala Ala Asp Ala Leu Val Arg Arg 65 70 75 80 Leu Ala Glu Leu Gly Glu Arg His Arg Phe Val Ile Val Glu Gly Gly 85 90 95 Ser Ile Ser Leu Leu Arg Asp Phe Ala Glu Arg Leu Pro Asp Leu Pro 100 105 110 Tyr Arg Leu Thr Val Arg Leu Leu His Ile Pro Asp Arg Glu Gly Tyr 115 120 125 Val Val Arg Leu Ala Arg Arg Ala Arg Arg Met Leu Ala Pro Gly Gly 130 135 140 Ser Gln Thr Ser Met Leu Glu Glu Leu Ala Ala Leu Trp Glu Ser Pro 145 150 155 160 Asp His Arg Phe Phe Ala Ala Ser Val Asn Gly Leu Glu Ala Ile Leu 165 170 175 Glu Trp Cys Ala Thr Tyr Ser Val Arg Val Glu Ser Leu Ala Ser Tyr 180 185 190 Glu Leu Ser Glu Ala Gln Leu Glu Lys Met Ala Trp Met Val Ala Glu 195 200 205 Arg His Ala Glu His Gly Ile Leu Gln Glu Arg Ile Phe Ser Lys Val 210 215 220 Phe Asp Gly Ile Pro Ser Ala Val Tyr Gly Pro Ala 225 230 235 <210> 25 <211> 246 <212> PRT <213> Streptomyces glauciniger <400> 25 Met Ile Ser Leu His Leu Ile Leu Gly Pro Thr Gly Val Gly Lys Thr 1 5 10 15 Ser Arg Ser Val Ala Leu Ala Leu Arg His Glu Thr Pro Val Leu Val 20 25 30 Leu Asp Arg Val Gln Cys His Pro Gln Leu Ala Ile Gly Ser Gly Arg 35 40 45 Pro Thr Gln Val Glu Leu Gln Asp Thr Val Arg Tyr Tyr Leu Thr Glu 50 55 60 Arg Pro Leu His His Gly Val Ile Thr Ala Ala Asp Ala Val Asp Arg 65 70 75 80 Leu Ile His His Arg Lys Met Ile His Asp Ser Gly Val Asp Arg Leu 85 90 95 Ile Leu Glu Gly Gly Ser Ile Ser Ile Leu Ala Glu Leu Leu Thr Arg 100 105 110 Thr Asp Trp Tyr Glu Asp Ala Thr Met Ala Val Glu Cys Trp Leu Glu 115 120 125 Ala Ser Ala Ser Ala Tyr Glu Ala Arg Val Thr Glu Arg Val Glu His 130 135 140 Met Leu Gly Tyr Ser Asp His Ser Gly Arg Thr Met Leu Asp Glu Leu 145 150 155 160 Ala Glu Leu Trp Leu His Pro Glu Ala Arg Pro Arg Leu His Ser Ile 165 170 175 Ala Gly Tyr Arg Glu Val Ile Asp Leu Cys Ala Ala Glu Gly Leu Asp 180 185 190 Pro Met Tyr Leu Arg Gly Leu Ala Ala Arg Leu Arg Arg Thr Gln Cys 195 200 205 Ala Thr Ala Ile Thr Ser Ala His Leu Asp Tyr Ala Arg Arg Gln Arg 210 215 220 Leu Ala Leu Ala Thr Ala Leu Pro Glu Leu Val Gln Arg Gly Phe Glu 225 230 235 240 Val Thr Leu Cys Glu Ile 245 <210> 26 <211> 294 <212> PRT <213> Streptomyces hainanensis <400> 26 Met Ala Arg Ser Gly Arg Arg Ser Leu Ala Arg Ser Glu Arg Ser Arg 1 5 10 15 Thr Ser Leu Asn Val Ser Thr His Arg Pro Ile Gly Arg Pro Arg Ser 20 25 30 Arg Ala Pro Ile Ala Thr Arg Glu Glu Pro Thr Val Arg His Ile Ala 35 40 45 Ala Glu Val Pro Leu Thr Val Arg Leu Ile Val Gly Pro Thr Gly Val 50 55 60 Gly Lys Ser Ala Ala Ala Ser Asp Val Ala Arg Arg Thr Gly Ala Pro 65 70 75 80 Val Val Val Ala Asp Arg Ile Gln Cys Phe Thr Asp Leu Ala Thr Thr 85 90 95 Ser Ala Arg Ala Gly Ala Asp Glu Pro Asp Val Thr Arg Ala Trp Leu 100 105 110 Gly Asp Arg Thr Val Ala Asp Gly Asp Tyr Pro Ala Pro Glu Ala Ala 115 120 125 Ala Ala Leu Val Arg Ala Val Arg Arg Val Ala Arg Pro Gly Arg Pro 130 135 140 Val Val Val Glu Gly Gly Ser Ile Ser Leu Leu Ala Tyr Leu Val Asp 145 150 155 160 His His Leu Pro Val Leu Pro Trp Arg Phe Thr Val Thr Ser Leu Thr 165 170 175 Arg Pro Ala Pro Ser Arg Tyr Leu Ala Ala Leu Thr Ala Arg Ala His 180 185 190 Ala Met Leu Arg Pro Glu Pro Pro Leu Ala Gly Leu Leu Asp Glu Leu 195 200 205 Ala Ala Leu Trp Arg Val Pro Gly His Arg Trp Phe Ala Ala Ser Val 210 215 220 Asn Gly Phe Glu Ala Ala Leu Glu Trp Cys Ala Lys Tyr Gly Leu Asp 225 230 235 240 Pro Thr Glu Pro Thr Leu Val Gly Leu Pro Pro Arg Leu Val Asp Glu 245 250 255 Leu Ala Leu Leu Ile Ala Glu Arg His Ala Glu His Gly Ala Asp Gln 260 265 270 Glu Arg Ala Phe Ala Ala Leu Phe Ala Pro Ala Ala Arg Ala Gly Val 275 280 285 Arg Leu Gly Asp Ala Ala 290 <210> 27 <211> 256 <212> PRT <213> Streptomyces sp. NRRL WC-3618 <400> 27 Met Ala Glu Ile Ser Asn Asp Arg Thr Ala Arg Pro Phe Val His Leu 1 5 10 15 Ile Ala Gly Pro Thr Gly Ala Gly Lys Ser Ala Ala Ala Asn Glu Leu 20 25 30 Ala Arg Val Thr Gly Ala Pro Val Val Val Ala Asp Arg Leu Gln Cys 35 40 45 Phe Thr Asp Leu Val Thr Thr Ser Ala Arg Ala Gly Ala Glu Ala Arg 50 55 60 Gly Val Arg Arg Tyr Trp Leu Ala Asp Arg Thr Val Ala Asp Gly Asp 65 70 75 80 Leu Gly Ala Val Ala Ala Ala Asp Ser Leu Val Gly Leu Val Glu Arg 85 90 95 Leu Gly Arg Gln His Arg Phe Val Ile Val Glu Gly Gly Ser Ile Ser 100 105 110 Leu Leu Lys Ala Leu Ala Glu Arg Arg Ala Thr Leu Pro Trp Gln Leu 115 120 125 Ser Val Arg Val Leu Pro Leu Pro Ala Tyr Gly Asp Tyr Val Glu Ala 130 135 140 Leu Thr Arg Arg Ala Gln Thr Met Ile Ala Pro Pro Thr Pro Asp Pro 145 150 155 160 Ser Leu Leu Glu Glu Leu Ala Thr Leu Trp Ala Asp Pro Arg Leu Arg 165 170 175 Arg Phe Ala Ala Ser Val Asn Gly Phe Glu Ala Val Leu Glu Ile Cys 180 185 190 Ala Lys Tyr Ser Leu Asp Val Glu Thr Ile His Lys Gln Val Pro Pro 195 200 205 Ala Pro Val Leu Ser Gln Met Ala Ser Leu Ile Ala Leu Arg His Ala 210 215 220 Glu His Gly Ile Leu Gln Ser Tyr Val Phe Thr Glu Ile Phe Glu Glu 225 230 235 240 Gln Ile Pro Val Gln Val Ser Asp Pro Gly Val Leu Val Arg Ala Ala 245 250 255 <210> 28 <211> 239 <212> PRT <213> Trinickia caryophylli <400> 28 Met Thr Ile Arg Leu Tyr Met Ile Trp Gly Pro Thr Thr Thr Gly Lys 1 5 10 15 Thr Ala Leu Ser Val Ala Leu Ala Arg Met Val Gly Val Pro Val Leu 20 25 30 Ser Leu Asp Arg Val Gln Cys Cys His Glu Ile Ala Val Gly Ser Gly 35 40 45 Arg Pro Ser Pro Glu Glu Leu Glu Gly Thr Ala Arg Glu Tyr Leu Cys 50 55 60 His Arg Arg Val Ala Asp Gly Val Val Ser Ala Ala Glu Ala Asn Arg 65 70 75 80 Leu Leu Lys Ala Lys Val Leu Asp Tyr Ser Arg His Leu Pro Ala Leu 85 90 95 Ile Leu Glu Gly Gly Ser Val Ser Leu Phe Asn Glu Met Thr Ala Asp 100 105 110 Asp Ser Trp Ala His Ile Ala Glu Trp Val Leu Gln Arg Val Pro Leu 115 120 125 Pro Ala Gln Asp Val Phe Met Lys Arg Ala Arg Gly Arg Ala Arg Ala 130 135 140 Met Leu Asp Ala Pro Ala Gly Glu Arg Ser Met Leu Asp Glu Leu Val 145 150 155 160 Asp Leu Trp Arg Asp Pro Arg Thr His Ala Val Leu Glu Asp Ile Asp 165 170 175 Gly Tyr Arg Gln Leu Ile Gly Tyr Ala Arg Ala Ala Gly Ile Pro Val 180 185 190 Val Glu Leu Ser Asn Ala Ala Pro Glu Ile Phe Asp Asp Trp Val Glu 195 200 205 Leu Ile Ala Arg Glu Tyr Trp Glu His Ala Cys Trp Gln Glu Gln Arg 210 215 220 Phe Ala Ser Pro Pro Thr Cys Trp Arg His Val Ala His Ala Trp 225 230 235 <210> 29 <211> 238 <212> PRT <213> Xanthomonas albilineans <400> 29 Met Asn Gly Ala Leu Tyr Leu Ile Trp Gly Pro Thr Cys Ser Gly Lys 1 5 10 15 Thr Ala Leu Ala Val Ala Leu Ala Glu Gln Ser Gly Trp Pro Val Ile 20 25 30 Ala Leu Asp Arg Ile Gln Cys Tyr Pro Glu Leu Ala Thr Gly Ser Gly 35 40 45 Arg Pro Leu Ser Ser Glu Leu Arg Gly Thr Arg Arg Ile Tyr Leu Ala 50 55 60 Ser Arg Ala Val Arg Glu Gly Ile Ile Ala Ala Asp Glu Ala His Ala 65 70 75 80 Leu Leu Lys Asp Met Val Gly Arg His Ser Ala Ala Gly Gly Val Ile 85 90 95 Leu Glu Gly Gly Ser Ile Ser Leu Ile Asn Arg Met Ile Ala Asp Pro 100 105 110 Tyr Trp Ala Ser Gly Trp Gln Trp His Ser Arg Arg Leu Arg Leu Gly 115 120 125 Asp Pro Ala Ala Phe Leu Asp Arg Ala Leu Arg Arg Val Glu Gln Met 130 135 140 Leu Arg Thr His Gln Glu His Pro Ser Leu Leu Glu Glu Leu Val Ala 145 150 155 160 Leu Trp Pro Asp Pro Ala Leu Arg Pro Ile Leu Glu Asp Val Asp Gly 165 170 175 Tyr Arg Tyr Ala Ile Arg Phe Ala Arg His Trp Ser Leu Pro Val Ala 180 185 190 Asp Leu Leu Ser Met Arg Asp Glu Met Lys Gln Arg Leu Ile Arg Gly 195 200 205 Ile Ala Glu Glu Tyr Leu Glu His Ala Gln Trp Gln Glu Arg Asp Leu 210 215 220 Leu Ala Leu Pro Ala Ser Trp Gln Ala Gln Glu Leu Ser Thr 225 230 235 <210> 30 <211> 238 <212> PRT <213> Chondromyces crocatus <400> 30 Met Lys Ala His Cys Ile Val Gly Ala Thr Gly Thr Gly Lys Thr Ala 1 5 10 15 Arg Ala Thr Ser Leu Ala Arg Gln Thr Gly Ala Pro Val Leu Val Leu 20 25 30 Asp Arg Phe Gln Val Phe Glu Asp Leu Ala Ser Gly Thr Gly Arg Pro 35 40 45 Leu Ser Arg Glu Val Ala Gly Thr Thr Arg Leu Tyr Leu Gly His Arg 50 55 60 Tyr Met Met Asp Gly Glu Leu Thr Arg Gln Asp Ala Leu Leu Asp Phe 65 70 75 80 Leu Arg Thr Val Gly Lys Leu Ala Val Asp His Asp Phe Ile Ile Leu 85 90 95 Glu Gly Gly Ser Ile Ser Leu Asn Glu Ala Leu Ile Glu Glu Ser Leu 100 105 110 Leu Gly Thr Thr Gly Val Thr Val Glu Arg Met Arg Met Thr Ser Val 115 120 125 Lys Ala Tyr Glu Gln Gly Leu Arg Arg Arg Ala Arg Met Met Leu Thr 130 135 140 Pro Ser Ala Glu Arg Pro Ser Met Ile Glu Glu Leu Ala Arg Gly Trp 145 150 155 160 Asp Asn Pro Arg Leu Arg Ala Phe Leu Ser Ser Ile Thr Gly Tyr Asp 165 170 175 Ala Ile Val Asp His Cys Glu Gln Ala Gly Ile Glu Pro Ala Glu Leu 180 185 190 Ala Ala Gly Pro Val Asp Pro Val Leu Ile Asp Glu Val Val Leu Ser 195 200 205 His Met Lys Tyr Ala Ala Lys Gln Thr Ala Ala Phe Asn Gln Leu Phe 210 215 220 Pro Glu Gln Ser Ser Phe Pro Gly Cys Gln Pro Cys Thr Ala 225 230 235 <210> 31 <211> 239 <212> PRT <213> Dickeya dianthicola <400> 31 Met Ser Thr Ile Leu Tyr Leu Leu Trp Gly Pro Thr Ser Thr Gly Lys 1 5 10 15 Thr Ser His Ser Val Ile Leu Ala Lys Lys Tyr Gly Phe Pro Val Ile 20 25 30 Ala Leu Asp Arg Phe Gln Gly Tyr Gln Glu Ile Lys Thr Gly Ser Gly 35 40 45 Ala Pro Asp Gln Ala Glu Leu Gln Gly Thr Glu Arg Ile Tyr Ile Thr 50 55 60 Pro Ser His His Leu Thr Glu Ser Val Val Ser Ser Glu Glu Ala His 65 70 75 80 Asn Ile Leu Lys Lys Lys Ile Ser Ile Leu Leu Asn Arg Asn Ser Ser 85 90 95 Val Ile Leu Glu Gly Gly Ser Val Ser Leu Leu Thr Lys Ile Val Met 100 105 110 Asp Asp Tyr Trp Ser Gln Phe Ser Trp Arg Ile Arg Arg Phe His Met 115 120 125 Ile Ser Lys Lys Asp Phe Ile Glu Lys Ala Gln Lys Arg Val Thr Ser 130 135 140 Met Ile Tyr Pro Gln Asn Gly Gly Ser Ser Ile Leu Lys Glu Thr Ser 145 150 155 160 Leu Phe Phe Arg Lys Asn Leu Thr Ile Glu Pro Leu Glu Asp Ile Asp 165 170 175 Gly Tyr Arg Lys Ile Ile Gln Tyr Cys Lys Glu Lys Asn Ile Asp Phe 180 185 190 Asp Ser Leu Asp Lys Leu Asn Ser Asn Glu Lys Asp Asn Leu Ile Asp 195 200 205 Ile Ile Ser Asn Glu Tyr Tyr Glu His Ala Leu Trp Gln Glu Lys Asn 210 215 220 Phe Pro Gly Phe Pro Ala Ser Trp Ser Trp Glu Thr Leu Lys Asn 225 230 235 <210> 32 <211> 244 <212> PRT <213> Nostoc sp. <400> 32 Met Arg Leu His Ile Ile Leu Gly Pro Thr Ser Val Gly Lys Thr Asp 1 5 10 15 Arg Ser Val Val Leu Ala Lys Gln Thr Lys Ala Pro Val Ile Val Leu 20 25 30 Asp Arg Ile Gln Ile Tyr Gln Glu Ile Ala Thr Gly Ser Gly Arg Pro 35 40 45 Leu Ile Asp Glu Leu Glu Gly Thr Thr Arg Ile Tyr Leu Glu Glu Arg 50 55 60 Gln Leu Ala Asp Gly Asn Leu Asn Thr Leu Glu Ser Leu Ser Leu Ala 65 70 75 80 Leu Gln His Ile Asp Arg Leu Ser Ser Gln His Lys Leu Leu Ile Leu 85 90 95 Glu Gly Gly Ser Ile Ser Leu Cys Thr Ala Leu Trp Lys Ser Arg Ile 100 105 110 Leu Glu Asn Tyr Gln Thr Thr Ile Glu Tyr Val Lys Val Glu Asn Glu 115 120 125 Glu Leu Tyr Gln Ser Arg Leu Trp Arg Arg Met Gln Asn Ala Leu Ile 130 135 140 Ser Asn Pro Arg Arg Pro Ser Leu Ile Glu Glu Leu Ser Arg Val Trp 145 150 155 160 Gln Asp Pro His Lys Leu Ala Leu Val Arg Thr Val Val Gly Tyr Asp 165 170 175 Val Leu Ile His Trp Cys Gln Lys Tyr Gly Leu Ser Pro Asp Gln Met 180 185 190 Trp Lys Ser Phe Gln Asp Asn Ser Phe Tyr Ile Asn Leu Met Gln Glu 195 200 205 Met Phe Leu Ala Tyr Met Gln Tyr Ser Gln Asn Gln Arg Gln Ala Phe 210 215 220 Asp Gln Leu Ala Val Glu Tyr Lys Gln Gln Gln Ala Leu Leu Ala Ser 225 230 235 240 Thr Val Thr Leu <210> 33 <211> 283 <212> PRT <213> Dictyostelium discoideum <400> 33 Met Lys Ile Leu Leu Ile Ile Gly Ser Thr Gly Val Gly Lys Thr Asp 1 5 10 15 Leu Ser Ile Asn Tyr Ser Lys Lys Tyr Asn Ala Pro Val Val Val Leu 20 25 30 Asp Arg Ile Gln Cys Phe Pro Glu Leu Ser Ile Thr Ser Gly Arg Pro 35 40 45 Asp Glu Ser Glu Tyr Phe Gly Ser Lys Arg Ile Tyr Leu Thr Asp Leu 50 55 60 Leu Val Glu Pro Gly Asn Glu Asn Ile Lys Lys Thr Phe Tyr Val Asn 65 70 75 80 Lys Leu Ile Asn Ile Leu Asn Glu Ile Lys Asn Asn Tyr Asp Thr Gln 85 90 95 Asn Leu Pro Asn Glu Lys Gly Tyr Gly Cys Ile Phe Glu Gly Gly Ser 100 105 110 Ile Ser Leu Leu Lys Glu Leu Leu Thr Lys Ile Asn Lys Leu Pro Tyr 115 120 125 Lys Ile Thr Cys Val Ile Tyr Ile Arg Pro Ser Asp Ser Ile Asp Asn 130 135 140 His Lys Leu Tyr Lys Ala Lys Ile Phe Lys Arg Val Ser Gln Met Leu 145 150 155 160 Phe Pro Thr Glu Glu Gly Asn Asp Ser Gln Ile Leu Glu Val Lys Arg 165 170 175 Ile Leu Asn Lys Gly Lys Thr Val Asn Ala Gln Gly Glu Ile Asn Leu 180 185 190 Glu Tyr Tyr Glu Lys Ile Lys Gln Val Leu Ile Ser Leu Val Gly Leu 195 200 205 Val Gly Ile Glu Asp Val Ile His Phe Leu Asp Lys Gln Tyr Asp Gln 210 215 220 Lys Asn Ile Thr Ser Lys Leu Asp Pro Asn Tyr Leu Asn Glu Ile Gln 225 230 235 240 Ser Gln Leu Ile Glu Thr Ile Thr Leu Ala His Tyr Asn Tyr Ala Leu 245 250 255 Ser Gln Ile Glu Leu Ile Asp Ser Leu Ile Lys Gln Leu Pro Lys Ser 260 265 270 Ile Glu Tyr Cys Leu Lys Asn Ile Glu Ile Asn 275 280 <210> 34 <211> 195 <212> PRT <213> Corynebacterium glutamicum <400> 34 Met Thr Ser Leu Phe Asp Ala Pro Thr Leu Gln Arg Val Thr Val Phe 1 5 10 15 Thr Gly Ser Ala Leu Gly Ser Ser Ser Leu Tyr Thr Gln Ala Ala Gln 20 25 30 Thr Leu Ala Lys Thr Ala Val Asp Arg Gly Ile Asp Leu Val Tyr Gly 35 40 45 Gly Gly Lys Val Gly Leu Met Gly Ile Val Ala Asp Ala Phe Leu Glu 50 55 60 Ser Gly Gly Glu Ala Phe Gly Val Ile Thr Glu Ser Leu Met Lys Gly 65 70 75 80 Glu Leu Gly His Glu Lys Leu Thr Glu Leu Glu Ile Val Pro Asp Met 85 90 95 His Ile Arg Lys Arg Arg Met Ala Glu Leu Gly Asp Gly Phe Ile Ala 100 105 110 Met Pro Gly Gly Ala Gly Thr Leu Glu Glu Leu Phe Glu Val Trp Thr 115 120 125 Trp Gln Gln Leu Gly Ile His Gln Lys Pro Val Ala Leu Tyr Asp Val 130 135 140 Asp Gly Phe Trp Gln Pro Leu Leu Glu Met Leu Glu Gln Met Thr Gln 145 150 155 160 Arg Gly Phe Ile Lys Arg Asp Phe Phe Glu Cys Leu Ile Val Glu Ser 165 170 175 Asp Pro His Ala Leu Leu Lys Ala Met Gln Thr Trp Thr Pro Pro Ala 180 185 190 Pro Lys Trp 195 <210> 35 <211> 191 <212> PRT <213> Bacillus subtilis <400> 35 Met Lys Thr Ile Cys Val Phe Ala Gly Ser Asn Pro Gly Gly Asn Glu 1 5 10 15 Ala Tyr Lys Arg Lys Ala Ala Glu Leu Gly Val Tyr Met Ala Glu Gln 20 25 30 Gly Ile Gly Leu Val Tyr Gly Gly Ser Arg Val Gly Leu Met Gly Thr 35 40 45 Ile Ala Asp Ala Ile Met Glu Asn Gly Gly Thr Ala Ile Gly Val Met 50 55 60 Pro Ser Gly Leu Phe Ser Gly Glu Val Val His Gln Asn Leu Thr Glu 65 70 75 80 Leu Ile Glu Val Asn Gly Met His Glu Arg Lys Ala Lys Met Ser Glu 85 90 95 Leu Ala Asp Gly Phe Ile Ser Met Pro Gly Gly Phe Gly Thr Tyr Glu 100 105 110 Glu Leu Phe Glu Val Leu Cys Trp Ala Gln Ile Gly Ile His Gln Lys 115 120 125 Pro Ile Gly Leu Tyr Asn Val Asn Gly Tyr Phe Glu Pro Met Met Lys 130 135 140 Met Val Lys Tyr Ser Ile Gln Glu Gly Phe Ser Asn Glu Ser His Leu 145 150 155 160 Lys Leu Ile His Ser Ser Ser Arg Pro Asp Glu Leu Ile Glu Gln Met 165 170 175 Gln Asn Tyr Ser Tyr Pro Ile Leu Glu Lys Lys Trp Thr Glu Ile 180 185 190 <210> 36 <211> 256 <212> PRT <213> Corynebacterium glutamicum <400> 36 Met Ala Pro Lys Gln Thr Pro Ser Pro Glu Lys Asn Arg Asn Leu Val 1 5 10 15 Gly Pro Val Leu Gln Arg Arg Gln Thr Glu Gly Thr Phe Asp Gln Arg 20 25 30 Leu Leu Glu Met Arg Ala Asp His Asn Trp Lys His Ala Asp Pro Trp 35 40 45 Arg Val Leu Arg Ile Gln Ser Glu Phe Val Ala Gly Phe Asp Ala Leu 50 55 60 His Glu Met Pro Lys Ala Val Thr Val Phe Gly Ser Ala Arg Ile Lys 65 70 75 80 Glu Asp His Pro Tyr Tyr Lys Ala Gly Val Glu Leu Gly Glu Lys Leu 85 90 95 Val Ala Ala Asp Tyr Ala Val Val Thr Gly Gly Gly Pro Gly Leu Met 100 105 110 Glu Ala Pro Asn Lys Gly Ala Ser Glu Ala Asn Gly Leu Ser Val Gly 115 120 125 Leu Gly Ile Glu Leu Pro His Glu Gln His Leu Asn Pro Tyr Val Asp 130 135 140 Leu Gly Leu Asn Phe Arg Tyr Phe Phe Ala Arg Lys Thr Met Phe Leu 145 150 155 160 Lys Tyr Ser Gln Ala Phe Val Cys Leu Pro Gly Gly Phe Gly Thr Leu 165 170 175 Asp Glu Leu Phe Glu Val Leu Cys Met Val Gln Thr Gly Lys Val Thr 180 185 190 Asn Phe Pro Ile Val Leu Ile Gly Thr Glu Phe Trp Ala Gly Leu Val 195 200 205 Asp Trp Ile Arg His Arg Leu Val Glu Glu Gly Met Ile Asp Glu Lys 210 215 220 Asp Val Asp Arg Met Leu Val Thr Asp Asp Leu Asp Gln Ala Val Lys 225 230 235 240 Phe Ile Val Asp Ala His Ala Gly Leu Asp Val Ala Arg Arg His Asn 245 250 255 <210> 37 <211> 195 <212> PRT <213> Pseudomonas aeruginosa <400> 37 Met Thr Leu Arg Ser Val Cys Val Phe Cys Gly Ala Ser Pro Gly Ala 1 5 10 15 Ser Pro Val Tyr Gln Glu Ala Ala Val Ala Leu Gly Arg His Leu Ala 20 25 30 Glu Arg Gly Leu Thr Leu Val Tyr Gly Gly Gly Ala Val Gly Leu Met 35 40 45 Gly Thr Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ile Gly 50 55 60 Ile Ile Pro Gln Ser Leu Gln Glu Ala Glu Ile Gly His Lys Gly Leu 65 70 75 80 Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met 85 90 95 Ala Glu Leu Ala Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr 100 105 110 Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His 115 120 125 Ala Lys Pro Leu Gly Leu Leu Glu Val Asn Gly Phe Tyr Asp Pro Leu 130 135 140 Leu Thr Phe Leu Asp His Leu Val Asp Glu Arg Phe Val Arg Ala Glu 145 150 155 160 His Arg Gly Met Leu Gln Arg Gly Ala Ser Pro Glu Ala Leu Leu Asp 165 170 175 Ala Leu Ala Ala Trp Thr Pro Ser Val Ala Pro Lys Trp Val Asp Arg 180 185 190 Thr Pro Gln 195 <210> 38 <211> 256 <212> PRT <213> Rhodococcus fascians <400> 38 Met Asn Ser Val Asp Asp Pro Gly Ser Tyr Glu Gln Ile Gly Ser Glu 1 5 10 15 Lys Pro Ala Lys His Lys Gly Ser Val Val Leu Arg Arg Gly Arg Asn 20 25 30 Thr Glu Thr Ser Thr Ser Asp Gln Arg Leu Leu Asp Glu Arg Gly Ser 35 40 45 Gly Asn Trp Ile His Ser Asp Thr Trp Arg Val Leu Arg Ile Gln Ser 50 55 60 Glu Phe Val Glu Gly Phe Gly Ala Leu Ala Glu Val Pro Arg Ala Val 65 70 75 80 Thr Val Phe Gly Ser Ala Arg Thr Pro Val Asp His Pro Glu Tyr Glu 85 90 95 Arg Ala Arg Glu Leu Gly Ala Ala Leu Ala Arg Glu Gly Phe Ala Val 100 105 110 Ile Thr Gly Gly Gly Pro Gly Val Met Glu Gly Ala Asn Arg Gly Ala 115 120 125 Ser Glu Ala Asp Gly Tyr Ser Ile Gly Leu Gly Ile Glu Leu Pro Phe 130 135 140 Glu Gln Gly Leu Asn Asp Trp Val Asp Leu Gly Val Asn Phe Arg Tyr 145 150 155 160 Phe Phe Val Arg Lys Thr Met Phe Val Lys Tyr Ser Gln Ala Phe Val 165 170 175 Cys Leu Pro Gly Gly Phe Gly Thr Leu Asp Glu Leu Phe Glu Ala Leu 180 185 190 Thr Leu Val Gln Thr Ala Lys Val Thr Arg Phe Pro Ile Val Leu Leu 195 200 205 Gly Lys Asp Phe Trp Ser Gly Leu Leu Asp Trp Ile Lys Thr Thr Leu 210 215 220 Val Lys Glu Gly Lys Val Ser Glu Lys Asp Leu Asp Leu Ile His Cys 225 230 235 240 Thr Asp Ser Val Asp Glu Ala Val Arg Ile Val Arg Glu Ala Gln Gln 245 250 255 <210> 39 <211> 198 <212> PRT <213> Rhodococcus fascians <400> 39 Met Asn Leu Arg Pro Met Pro Ala Thr Thr Val Ser Ala Gln Ala Arg 1 5 10 15 Pro Thr Pro Lys Ser Val Thr Val Phe Cys Gly Ala Met Pro Gly Arg 20 25 30 Gly Thr Lys Tyr Gly Gln Leu Ala Glu Gly Met Gly Arg Ala Ile Ala 35 40 45 Arg Ser Lys Leu Arg Leu Val Tyr Gly Gly Ala Arg Val Gly Leu Met 50 55 60 Gly Thr Leu Ala Asn Ala Ala Leu Asp Ser Gly Gly Thr Val Val Gly 65 70 75 80 Val Ile Pro Glu Ser Phe Thr Ala Ile Pro Glu Ala Ala His His Gly 85 90 95 Leu Thr Glu Leu His Val Val His Asp Met His Gln Arg Lys Ala Leu 100 105 110 Met Ala Glu Leu Gly Asp Ala Phe Ile Ala Leu Pro Gly Gly Val Gly 115 120 125 Thr Ala Glu Glu Phe Phe Glu Val Leu Thr Trp Ser His Leu Gly Leu 130 135 140 His Asn Lys Pro Cys Val Leu Leu Asn Asp Asn Glu Tyr Tyr Arg Pro 145 150 155 160 Leu Leu Ser Tyr Ile Glu His Ala Ala Val Glu Gly Phe Ile Thr Pro 165 170 175 Ala Thr Arg Ser Arg Val Ile Val Cys Lys Asp Ile Glu Gly Ala Ile 180 185 190 Ala Ala Ile Arg Ser Pro 195 <210> 40 <211> 187 <212> PRT <213> Corynebacterium stationis <400> 40 Met Lys Ser Val Ala Ile Tyr Cys Gly Ser Ser Met Gly Ser Ser Pro 1 5 10 15 Arg Tyr Ala Glu Val Ala Lys Glu Met Gly Glu Glu Leu Ala Arg Arg 20 25 30 Asn Leu Arg Val Val Tyr Gly Gly Gly Asn Val Gly Leu Met Gly Thr 35 40 45 Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Val Gly Val Ile 50 55 60 Pro Arg Gln Leu Ile Asn Arg Glu Met Ala His Ala Gly Leu Thr Asp 65 70 75 80 Leu Glu Val Val Asp Thr Met Ala Gln Arg Lys Thr Arg Met Glu Glu 85 90 95 Leu Ala Asp Ala Phe Val Cys Leu Pro Gly Gly Val Gly Thr Leu Glu 100 105 110 Glu Val Val Glu Val Leu Thr Met Gln Gln Leu Gly His Val Gln Gly 115 120 125 Pro Val Gly Leu Val Asn Val Asp Gly Phe Trp Glu Pro Phe Val Arg 130 135 140 Thr Leu Glu Ser Met Val Ala Cys Gly Phe Val Gln Ser Arg Tyr Ile 145 150 155 160 Asp Ala Ile Ala Leu Ser Ser Asp Pro Ala Glu Ile Leu Asp Glu Phe 165 170 175 Ala Gly Trp Ser Pro Ile Gly Ala Lys Trp Ser 180 185 <210> 41 <211> 275 <212> PRT <213> Corynebacterium stationis <400> 41 Met Ala Pro Leu Arg Ser Asn Lys Asp Gly Lys Pro Arg Val Pro Arg 1 5 10 15 Thr Thr Glu Ser Ala Glu Thr Asn Arg Met Leu Arg Gly Pro Met Leu 20 25 30 Leu Arg Thr Asp Gly Asn Gln Thr Ser Thr Tyr Asp Gln Arg Leu Leu 35 40 45 Glu Ser Gly Ala Asp His Ala Trp Lys His Ala Asp Pro Trp Arg Val 50 55 60 Leu Arg Ile Gln Gly Glu Phe Val Ala Gly Phe Asp Ala Leu Ser Asp 65 70 75 80 Leu Pro Lys Ala Val Thr Val Tyr Gly Ser Ala Arg Thr Lys Glu Asp 85 90 95 Thr Pro Glu Tyr Ala Gln Gly Ile Asp Leu Gly Ala Lys Leu Val Glu 100 105 110 His Asp Tyr Ala Val Val Thr Gly Gly Gly Pro Gly Ile Met Glu Ala 115 120 125 Ala Asn Arg Gly Ala Tyr Glu Ala Gly Gly Leu Ser Val Gly Leu Gly 130 135 140 Ile Glu Leu Pro Phe Glu Gln Gly Leu Asn Lys Tyr Val Asp Leu Gly 145 150 155 160 Ile Asn Phe Arg Tyr Phe Phe Ala Arg Lys Thr Met Phe Leu Lys Tyr 165 170 175 Ser Gln Ala Phe Val Cys Leu Pro Gly Gly Met Gly Thr Met Asp Glu 180 185 190 Leu Phe Glu Met Leu Cys Met Val Gln Thr Gly Lys Val Thr Asn Tyr 195 200 205 Pro Ile Val Leu Ile Gly Thr Glu Tyr Trp Ser Gly Leu Val Glu Trp 210 215 220 Met Ala Asn Thr Leu Val Ala Glu Gly Tyr Ile Asn Pro Gln Asp Met 225 230 235 240 Asp Leu Phe Leu Leu Thr Asp Ser Val Asp Glu Ala Val Glu His Ile 245 250 255 Val Ala Ala His Lys Glu Met Thr Asp Glu Arg Val Ser Arg Leu Asn 260 265 270 His Asp Ala 275 <210> 42 <211> 252 <212> PRT <213> Streptomyces coelicolor <400> 42 Met Ala Thr Gly Asn Pro Glu Gly Lys Lys Arg Pro Pro Glu Glu Gln 1 5 10 15 Arg Leu Gly Pro Val Leu Arg Arg Arg Gly Gln Val Gln Glu Ser Thr 20 25 30 Thr Asp Gln Arg Leu Leu Asp Glu Arg Ala Pro Thr Asp Trp Val His 35 40 45 Thr Asp Pro Trp Arg Val Leu Arg Ile Gln Ser Glu Phe Ile Glu Gly 50 55 60 Phe Gly Thr Leu Ala Glu Leu Pro Pro Ala Ile Ser Val Phe Gly Ser 65 70 75 80 Ala Arg Thr Pro Ala Asp Ser Pro Glu Tyr Asp Ala Gly Val Arg Leu 85 90 95 Gly Arg Gly Leu Val Glu Ala Gly Phe Ala Val Ile Thr Gly Gly Gly 100 105 110 Pro Gly Ala Met Glu Ala Ala Asn Lys Gly Ala Leu Glu Ala Lys Gly 115 120 125 Thr Ser Val Gly Leu Gly Ile Glu Leu Pro Phe Glu Gln Gly Leu Asn 130 135 140 Pro Tyr Val Asp Ile Gly Leu Asn Phe Arg Tyr Phe Phe Val Arg Lys 145 150 155 160 Met Met Phe Val Lys Tyr Ala Gln Gly Phe Val Val Leu Pro Gly Gly 165 170 175 Leu Gly Thr Leu Asp Glu Leu Phe Glu Ala Leu Thr Leu Val Gln Thr 180 185 190 Gln Lys Val Thr Arg Phe Pro Ile Val Leu Phe Gly Ser Glu Tyr Trp 195 200 205 Gly Gly Leu Val Asp Trp Leu Arg Gly Thr Leu Val Ala Gln Gly Lys 210 215 220 Ala Ala Glu Lys Asp Leu Met Leu Phe His Val Thr Asp Asp Val Asp 225 230 235 240 Glu Ala Val Ala Leu Val Ser Lys Glu Ala Gly Arg 245 250 <210> 43 <211> 215 <212> PRT <213> Arabidopsis thaliana <400> 43 Met Glu Ile Lys Gly Glu Ser Met Gln Lys Ser Lys Phe Arg Arg Ile 1 5 10 15 Cys Val Phe Cys Gly Ser Ser Gln Gly Lys Lys Ser Ser Tyr Gln Asp 20 25 30 Ala Ala Val Asp Leu Gly Asn Glu Leu Val Ser Arg Asn Ile Asp Leu 35 40 45 Val Tyr Gly Gly Gly Ser Ile Gly Leu Met Gly Leu Val Ser Gln Ala 50 55 60 Val His Asp Gly Gly Arg His Val Ile Gly Ile Ile Pro Lys Thr Leu 65 70 75 80 Met Pro Arg Glu Leu Thr Gly Glu Thr Val Gly Glu Val Arg Ala Val 85 90 95 Ala Asp Met His Gln Arg Lys Ala Glu Met Ala Lys His Ser Asp Ala 100 105 110 Phe Ile Ala Leu Pro Gly Gly Tyr Gly Thr Leu Glu Glu Leu Leu Glu 115 120 125 Val Ile Thr Trp Ala Gln Leu Gly Ile His Asp Lys Pro Val Gly Leu 130 135 140 Leu Asn Val Asp Gly Tyr Tyr Asn Ser Leu Leu Ser Phe Ile Asp Lys 145 150 155 160 Ala Val Glu Glu Gly Phe Ile Ser Pro Thr Ala Arg Glu Ile Ile Val 165 170 175 Ser Ala Pro Thr Ala Lys Glu Leu Val Lys Lys Leu Glu Glu Tyr Ala 180 185 190 Pro Cys His Glu Arg Val Ala Thr Lys Leu Cys Trp Glu Met Glu Arg 195 200 205 Ile Gly Tyr Ser Ser Glu Glu 210 215 <210> 44 <211> 306 <212> PRT <213> Arabidopsis thaliana <400> 44 Met Gly Val Ser Met Leu Asp Ser Ser Trp Ser Phe Arg Leu Ser Ser 1 5 10 15 Lys Met Ser Pro Ser Pro Thr Gln Lys Leu Ala Ser Ser Leu Thr Glu 20 25 30 Arg Asp Pro Ile Ser Leu Asn Leu Arg Phe Asp His Ser Ile Arg Ala 35 40 45 Tyr Ser Ala Arg Ala Leu Lys Cys Arg Ser Val Lys Ser Glu Asp Phe 50 55 60 Val Glu Arg Ser Ser Pro Phe Glu Val Lys Lys Glu Leu Glu Ile Cys 65 70 75 80 Phe Asp Leu Val His Arg Leu Gly Arg Gly Ile Val Tyr Leu Gly Ser 85 90 95 Ala Arg Ile Pro Pro Asn His Ser His Tyr Leu Gln Ala Gln Glu Leu 100 105 110 Ser Arg Glu Ala Ala Thr Leu Leu Asp Cys Thr Thr Trp Ser Gly Ala 115 120 125 Gly Pro Gly Leu Met Asp Ala Val Thr Glu Gly Ala Leu Glu Ala Glu 130 135 140 Lys Pro Val Gly Gly Ile Lys Ile Glu Lys Glu Ala Gly Glu Trp Thr 145 150 155 160 Ala Ser Lys Phe His Pro Tyr Leu Pro Pro Gln Asn Tyr His Thr Cys 165 170 175 Arg Phe Phe Ser Ala Arg Lys His Gly Leu Val Asp Ala Val Ile Arg 180 185 190 Asn Asn Val Ser Glu Lys Thr Ala Ile Ile Ala Leu Pro Gly Gly Ile 195 200 205 Gly Thr Leu Asp Glu Met Phe Glu Ile Leu Ala Leu Ile Gln Leu Glu 210 215 220 Arg Ile Gly Ser Ala Leu Pro Val Pro Phe Ile Val Met Asn Tyr Asp 225 230 235 240 Ala Phe Tyr Ser Lys Leu Leu Glu Phe Ile Glu Thr Cys Glu Asn Leu 245 250 255 Gly Thr Val Ser Lys Gly Glu Val Ser Ala Leu Trp Lys Val Cys Asn 260 265 270 Asn Asn Phe Glu Ala Leu Thr Tyr Leu Ala Glu Phe Tyr Asp Leu Pro 275 280 285 Asp Gly Ser Ala Lys Leu Glu Thr Glu Leu Arg Lys Thr Thr Pro Thr 290 295 300 Arg Gly 305 <210> 45 <211> 194 <212> PRT <213> Burkholderia sp. TNe-862 <400> 45 Met Lys Ala Val Cys Val Tyr Cys Gly Ser Ala Glu Gly Ala Asn Pro 1 5 10 15 Ile Tyr Ala Glu Ala Ala Gln Ala Phe Gly Arg Ala Leu Val Ala Ala 20 25 30 Asn Leu Ala Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Val 35 40 45 Ile Ala Asp Thr Val Met Ala Ala Gly Gly Arg Ala Ile Gly Val Ile 50 55 60 Pro Glu Leu Leu Val Asp Lys Glu Val Gly His Thr Gly Leu Thr Glu 65 70 75 80 Leu His Val Val Pro Asp Met His His Arg Lys Lys Met Met Ala Asp 85 90 95 Phe Ser Asp Ala Phe Val Ala Met Pro Gly Gly Ala Gly Thr Leu Glu 100 105 110 Glu Leu Phe Glu Val Tyr Thr Trp Ala Gln Leu Gly Tyr His Arg Lys 115 120 125 Pro Val Gly Val Leu Asn Ile Gly Gly Phe Tyr Asp Pro Leu Val Ala 130 135 140 Leu Leu Asp His Thr Val Arg Glu Gly Phe Met Arg Gln Thr Tyr Arg 145 150 155 160 Glu Met Leu Gln Ile Asp Gly Asp Pro Ala Ala Leu Ile Ala Arg Leu 165 170 175 Lys Arg Tyr His Ala Pro Ala Lys Asp Lys Trp Ala Asp Leu Arg Glu 180 185 190 Asn Val <210> 46 <211> 194 <212> PRT <213> Paraburkholderia sp. SOS3 <400> 46 Met Lys Ala Val Cys Val Tyr Cys Gly Ser Ala Lys Gly Ala Asn Pro 1 5 10 15 Ile Tyr Ala Glu Ala Ala His Ala Phe Gly Arg Ala Leu Val Asp Ala 20 25 30 Asn Leu Ala Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Met 35 40 45 Ile Ala Asp Ser Val Met Ala Ala Gly Gly Arg Ala Ile Gly Val Ile 50 55 60 Pro Glu Leu Leu Val Asp Lys Glu Ile Gly His His Gly Leu Thr Glu 65 70 75 80 Leu His Val Val Ser Asp Met His Glu Arg Lys Lys Leu Met Ala Asp 85 90 95 Leu Ser Asp Ala Phe Val Ala Leu Pro Gly Gly Ala Gly Thr Leu Glu 100 105 110 Glu Leu Phe Glu Val Tyr Thr Trp Ala Gln Leu Gly Tyr His Arg Lys 115 120 125 Pro Val Gly Ile Leu Asn Ile Ala Gly Phe Tyr Asp Pro Leu Ile Ala 130 135 140 Met Leu Glu His Thr Val Arg Glu Gly Phe Met Gln Gln Thr Tyr Phe 145 150 155 160 Glu Thr Leu Gln Ile Asp Asn Glu Ala Ala Ala Leu Leu Gly Lys Leu 165 170 175 Gln His Tyr Arg Pro Leu Ala Gln Asp Lys Trp Ser Gln His Arg Asp 180 185 190 Lys Val <210> 47 <211> 195 <212> PRT <213> Pseudomonas sp. HAR-UPW-AIA-41 <400> 47 Met Pro Leu Gln Ser Ile Cys Val Phe Cys Gly Ala Ser Val Gly His 1 5 10 15 Asp Pro Ala Tyr Gln Gln Ala Ala Glu Ala Leu Gly Arg Thr Leu Ala 20 25 30 Glu Arg Gly Leu Arg Leu Ile Tyr Gly Gly Gly Glu Val Gly Leu Met 35 40 45 Gly Lys Leu Ala Asp Ala Val Leu Ala Ala Gly Gly Glu Val Thr Gly 50 55 60 Ile Ile Pro Gln Ser Leu Gln Arg Ser Glu Ile Gly His Lys Gly Leu 65 70 75 80 Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met 85 90 95 Ala Glu Leu Ser Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr 100 105 110 Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Ala Gln Leu Gly Tyr His 115 120 125 Thr Lys Pro Ile Gly Leu Leu Asp Val Ala Gly Phe Tyr Arg Gly Leu 130 135 140 Ser Ala Phe Leu Asp Gln Thr Val Ser Ala Gly Phe Ile Arg Pro Pro 145 150 155 160 His Arg Gly Leu Leu His Gln Ala Glu Asp Pro Ala Gln Leu Leu Asp 165 170 175 Leu Leu Gln Gln Gln Gln Gly Ser Val Thr Pro Lys Trp Asp Ala Arg 180 185 190 Gln Pro Ile 195 <210> 48 <211> 195 <212> PRT <213> Pseudomonas putida <400> 48 Met Pro Val Arg Ser Val Cys Val Phe Cys Gly Ala Ser Met Gly Ala 1 5 10 15 Asn Pro Ala Tyr Arg Glu Ala Ala Val Ala Leu Gly Gln Ala Ile Ala 20 25 30 Arg Arg Gly Leu Thr Leu Val Tyr Gly Gly Gly Ala Val Gly Leu Met 35 40 45 Gly Val Val Ala Asp Ala Ala Met Ala Ala Gly Gly Glu Val Val Gly 50 55 60 Ile Ile Pro Gln Ser Leu Leu Asp Ala Glu Val Gly His Lys Gly Leu 65 70 75 80 Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met 85 90 95 Ala Glu Leu Ser Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr 100 105 110 Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His 115 120 125 Ala Lys Pro Leu Gly Leu Leu Asp Val Asn Gly Phe Tyr Asp Lys Leu 130 135 140 Gly Gly Phe Leu Asp His Ile Val Glu Glu Gly Phe Val Arg Pro Gln 145 150 155 160 His Arg Ala Met Leu Leu Leu Gly Gln Gln Pro Asp Glu Leu Leu Glu 165 170 175 Gly Met Asp Ser Phe Val Ala Pro Val Ala Pro Lys Trp Val Asp Lys 180 185 190 Gln Pro Asp 195 <210> 49 <211> 203 <212> PRT <213> Bradyrhizobium sp. Leo170 <400> 49 Met Gln Asn Gln Asn Ala Lys Ala Leu Lys Ser Val Cys Ile Phe Cys 1 5 10 15 Gly Ser Ser Pro Gly Arg Asp Pro Ile Tyr Leu Gln Thr Ala Val Ala 20 25 30 Thr Gly Gln Ala Leu Ala Lys Ala Gly Val Thr Ile Val Tyr Gly Gly 35 40 45 Gly Lys Val Gly Leu Met Gly Ala Val Ala Asp Ala Ala Leu Ala Ala 50 55 60 Gly Gly Arg Val Val Gly Val Ile Pro Arg Ala Leu Val Glu Arg Glu 65 70 75 80 Ile Gly His Thr Gly Leu Ser Gln Leu His Ile Val Glu Thr Met His 85 90 95 Glu Arg Lys Thr Met Met Ala Gln Leu Ser Asp Gly Phe Ile Ala Leu 100 105 110 Pro Gly Gly Ala Gly Thr Leu Glu Glu Leu Phe Glu Glu Trp Thr Trp 115 120 125 Ala Gln Leu Gly Ile His Gln Lys Pro Cys Gly Leu Leu Asn Val Lys 130 135 140 Asp Tyr Phe Ala Pro Leu Ile Ala Met Val Glu Arg Met Val Ala Glu 145 150 155 160 Gly Phe Thr Ile Ala Ala Tyr Ala Glu Met Leu Ile Ile Glu Thr Lys 165 170 175 Val Asp Ala Leu Leu Ser Arg Phe Gly Thr Tyr Gln Pro Pro Pro Arg 180 185 190 Lys Trp Leu Arg Thr Glu Ala Ala Ala Lys Pro 195 200 <210> 50 <211> 200 <212> PRT <213> Rhodococcus hoagii <400> 50 Met Arg Ile Thr Val Phe Met Gly Ser Ala Thr Gly His Asp Pro Ala 1 5 10 15 His Leu Gln Thr Ala Thr Gln Phe Gly Arg Asp Leu Ala Ala Ala Gly 20 25 30 Ile Gly Leu Val Tyr Gly Gly Gly Arg Val Gly Leu Met Gly Ala Val 35 40 45 Ala Asp Ala Val Val Ala Gly Gly Gly Glu Thr Val Gly Val Ile Pro 50 55 60 Arg His Leu Ala Asp Lys Glu Ile Ala His Pro Gly Leu Ser Thr Leu 65 70 75 80 Glu Val Val Glu Ser Met His Ala Arg Lys Gln Arg Met Ala Glu Leu 85 90 95 Ala Asp Ala Phe Val Val Leu Pro Gly Gly Ala Gly Thr Leu Asp Glu 100 105 110 Phe Phe Glu Ile Trp Thr Trp Gln Gln Leu Gly Leu His Asp Lys Pro 115 120 125 Val Phe Leu Phe Asp Ala Asp Gly Phe Trp Gln Pro Leu Val Gly Leu 130 135 140 Leu Asp His Leu Val Asp Ala Gly Phe Val Ala Ala Tyr Gln Arg Glu 145 150 155 160 Ala Leu Leu Val Ala Ala Asp Leu Asp Asp Val Arg Thr Ala Met Thr 165 170 175 Thr Trp Ala Pro Pro Ala Pro Lys Trp Ser Gly Thr Ala Glu Pro Ala 180 185 190 Asn Asp Thr Asp Leu Glu Arg Ala 195 200 <210> 51 <211> 185 <212> PRT <213> Streptomyces gilvigriseus <400> 51 Met Arg Val Ala Val Phe Thr Gly Ser Ser Phe Gly Ser Ser Pro Ala 1 5 10 15 Phe Ala Arg Ala Ala Glu Glu Leu Gly Arg Gly Leu Ala Glu Ala Gly 20 25 30 Met Gly Ile Val Tyr Gly Gly Gly His Val Gly Leu Met Gly Ala Val 35 40 45 Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ser Gly Val Ile Pro 50 55 60 Arg Ala Leu Ala Glu Arg Glu Leu Gln His Glu Gly Leu Thr Arg Leu 65 70 75 80 Arg Ile Val Glu Thr Met His Glu Arg Lys Ala Ala Met Ala Ala Glu 85 90 95 Ala Asp Ala Phe Val Ala Leu Pro Gly Gly Ala Gly Thr Leu Glu Glu 100 105 110 Leu Phe Glu Ala Trp Thr Trp Gln His Leu Gly Tyr His Ala Lys Pro 115 120 125 Val Val Leu Tyr Asp Val Asp Gly Phe Trp Gln Pro Leu Arg Ala Met 130 135 140 Val Ser Gly Met Val Glu Ser Gly Phe Ile Arg Ala Glu Phe Arg Asp 145 150 155 160 Thr Leu Pro Thr Ala Gly Ser Val Ala Glu Leu Leu Gly Leu Leu Lys 165 170 175 Asp Trp Arg Ala Pro Gly Gly Lys Trp 180 185 <210> 52 <211> 195 <212> PRT <213> Pseudomonas fluorescens <400> 52 Met Ser Ile Ala Ser Val Cys Val Phe Cys Gly Ala Ser Thr Gly Thr 1 5 10 15 Asp Pro Ala Tyr Arg Glu Ala Ala Gln Ala Leu Gly Arg Ala Leu Ala 20 25 30 Glu Arg Lys Leu Thr Leu Val Tyr Gly Gly Gly Ala Val Gly Leu Met 35 40 45 Gly Ile Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ile Gly 50 55 60 Ile Ile Pro Gln Ser Leu Lys Asp Lys Glu Ile Gly His Ser Gly Leu 65 70 75 80 Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met 85 90 95 Ala Glu Leu Ser Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr 100 105 110 Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His 115 120 125 Gly Lys Pro Leu Gly Leu Leu Glu Val Asn Gly Phe Tyr Ser Lys Leu 130 135 140 Thr Ala Phe Leu Asp His Ile Val Gly Glu Gly Phe Val Arg Ala Pro 145 150 155 160 His Arg Asp Met Leu Gln Val Ser Glu Ser Ala Gln Asp Leu Leu Asp 165 170 175 Ala Leu Asp Glu Trp Gln Pro Ser Val Gln Pro Lys Trp Ala Glu Gln 180 185 190 Lys Pro Ser 195 <210> 53 <211> 195 <212> PRT <213> Pseudomonas oryzihabitans <400> 53 Met Ser Leu Lys Ala Val Cys Val Phe Cys Gly Ala Lys Ser Gly Ala 1 5 10 15 Ser Pro Val Phe Glu Gln Ala Ala Ala Gln Leu Gly Arg Ala Leu Ala 20 25 30 Glu Arg Gly Leu Thr Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met 35 40 45 Gly Val Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ile Gly 50 55 60 Ile Ile Pro Gln Ser Leu Lys Thr Ala Glu Leu Gly His Thr Gly Cys 65 70 75 80 Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met 85 90 95 Ala Glu Leu Ala Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr 100 105 110 Leu Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His 115 120 125 Ala Lys Pro Met Gly Leu Leu Glu Val Asp Gly Phe Tyr Ala Gln Leu 130 135 140 Glu Gly Phe Leu Asp His Leu Val Ala Gln Gly Phe Val Ala Ala Pro 145 150 155 160 His Arg Ala Met Leu Gln Val Glu Asp Ser Pro Ile Ala Leu Leu Asp 165 170 175 Ala Leu Ala Ala Trp Gln Pro Thr Ala Pro Pro Arg Trp Ala Glu Pro 180 185 190 Ala Pro Arg 195 <210> 54 <211> 189 <212> PRT <213> Amycolatopsis rhizosphaerae <400> 54 Met Arg Arg Ile Cys Val Phe Cys Gly Ser Ser Ser Gly Asn Asp Ala 1 5 10 15 Val Tyr Ala Glu Gln Ala Ala Ala Leu Gly Lys Leu Leu Ala Glu Arg 20 25 30 Gly Ile Gly Leu Val Tyr Gly Gly Ala Ser Val Gly Ile Met Gly Val 35 40 45 Val Ala Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Ile Gly Val Ile 50 55 60 Pro Lys His Leu Met Arg Val Glu Ile Gly His Ala Asp Leu Thr Glu 65 70 75 80 Leu His Val Thr Ala Gly Met His Glu Arg Lys Ala Lys Met Ala Glu 85 90 95 Leu Ser Asp Gly Phe Leu Ala Leu Pro Gly Gly Ala Gly Thr Leu Glu 100 105 110 Glu Leu Ala Glu Val Trp Thr Trp Ala Gln Leu Gly Leu His His Lys 115 120 125 Pro Ile Gly Leu Val Asp Val Ala Gly Tyr Tyr Arg Pro Leu Arg Glu 130 135 140 Phe Ala Asp His Met Val Ala Glu Gly Phe Leu Arg Pro Gln His Arg 145 150 155 160 Asp Leu Ile Phe Ile Asp Pro Asp Pro Val Val Leu Leu Asp Ala Phe 165 170 175 Glu Ser Tyr Glu Pro Pro Thr Val Ala Lys Trp Ile Gly 180 185 <210> 55 <211> 193 <212> PRT <213> Corynebacterium provencense <400> 55 Met Thr Ala Ala Ala Pro Val Arg Lys Val Ala Leu Tyr Leu Gly Ser 1 5 10 15 Ala Thr Gly Asp Ser Pro Ala Tyr Arg Glu Thr Thr Val Arg Thr Val 20 25 30 Glu Val Leu Ala Asp Ala Gly Cys Glu Leu Val Tyr Gly Gly Gly Ser 35 40 45 Val Gly Leu Met Gly Val Ala Ala Asp Thr Ala Leu Ala Ala Gly Met 50 55 60 Pro Val His Gly Val Ile Thr Arg His Leu Met Asp Gly Glu Thr Gly 65 70 75 80 His Pro Gly Leu Thr Asp Leu Glu Val Val Asp Thr Met Thr Arg Arg 85 90 95 Lys Glu Arg Met Ala Glu Ile Ala Asp Ala Phe Ile Val Leu Pro Gly 100 105 110 Gly Ile Gly Thr Leu Glu Glu Phe Phe Glu Val Trp Val Ala Gln Val 115 120 125 Leu Gly Ile His Thr Arg Pro Val Ala Leu Val Asp Val Asp Asn Tyr 130 135 140 Trp Gln Pro Leu Thr Asp Met Ile Asp His Met Val Ser Arg Gly Phe 145 150 155 160 Leu Ser Ala Val His Arg Asp His Leu Ile Arg Val Asn Asp Pro Glu 165 170 175 Met Ile Pro Thr Ala Leu Asp Val Trp Thr Pro Ala Ala Ala Lys Trp 180 185 190 Ser <210> 56 <211> 195 <212> PRT <213> Erwinia typographi <400> 56 Met Asn Thr Val Gly Ile Phe Cys Gly Ser Ser Glu Gly His Ser Thr 1 5 10 15 Ala Tyr Ile Asp Ala Ala Arg His Val Gly Lys Tyr Leu Ala Glu Gln 20 25 30 Gly Ile Ser Ile Val Tyr Gly Gly Gly Arg Val Gly Leu Met Gly Ala 35 40 45 Val Ala Asp Ala Ala Leu Ala Tyr Gly Gly His Val Thr Gly Val Ile 50 55 60 Pro Lys Ser Leu Leu Glu Arg Glu Ile Ala His Thr Gly Leu Ser Glu 65 70 75 80 Leu Leu Val Val Asp Asn Met His Gln Arg Lys Asn Met Met Ala Glu 85 90 95 Leu Ser Ser Gly Phe Ile Ala Leu Pro Gly Gly Ala Gly Thr Ala Glu 100 105 110 Glu Ile Phe Glu Gln Trp Thr Trp Ala Gln Leu Gly Ile His Asp Lys 115 120 125 Pro Leu Ala Phe Leu Asn Val Asn His Phe Tyr Asp Pro Leu Thr Val 130 135 140 Met Val Gln Arg Met Val Ser Asp Gly Phe Met Lys Gln Asp Tyr Ala 145 150 155 160 Asn Met Leu Arg Phe Ser Glu Asn Leu His Asp Ile Ile Asp Tyr Phe 165 170 175 Lys Thr Tyr Thr Pro Pro Val Ser Lys Trp Thr Thr Arg Asn Glu Asn 180 185 190 His His Val 195 <210> 57 <211> 194 <212> PRT <213> Paraburkholderia sp. BL10I2N1 <400> 57 Met Lys Ser Val Cys Val Tyr Cys Gly Ser Ser Asp Gly Val Lys Pro 1 5 10 15 Leu Tyr Ala Glu Ala Ala Arg Ala Phe Gly Arg Ala Ile Val Glu Ala 20 25 30 Arg Leu Ala Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Val 35 40 45 Ile Ala Asp Glu Val Met Ala Ala Gly Gly Arg Ala Ile Gly Val Ile 50 55 60 Pro Glu Leu Leu Val Asn Lys Glu Val Gly His Glu Gly Leu Thr Glu 65 70 75 80 Leu His Val Val Pro Asp Met His Gln Arg Lys Lys Met Met Ala Asp 85 90 95 Leu Ser Asp Ala Phe Ile Ala Met Pro Gly Gly Ala Gly Thr Leu Glu 100 105 110 Glu Leu Phe Glu Val Tyr Thr Trp Ala Gln Leu Gly Tyr His Gln Lys 115 120 125 Pro Val Ala Val Leu Asn Ile Asp Gly Tyr Tyr Asp Pro Leu Ile Ser 130 135 140 Met Leu Gln His Thr Val Gln Glu Gly Phe Met Arg Gln Thr Tyr Leu 145 150 155 160 Asp Ile Leu Gln Ile Asp Ser Asp Pro Val Ser Leu Ile Ser Lys Leu 165 170 175 Gln Arg Tyr Leu Pro Pro Ala Arg Asp Lys Trp Ala Asp Asn Arg Glu 180 185 190 Ala Val <210> 58 <211> 195 <212> PRT <213> Pseudomonas putida <400> 58 Met Ser Leu Arg Ser Val Cys Val Phe Cys Gly Ala Ser Thr Gly Ala 1 5 10 15 Ser Pro Val Tyr Arg Glu Ala Ala Ile Ala Leu Gly Gln Ala Ile Ala 20 25 30 Gly Arg Gly Leu Thr Leu Val Tyr Gly Gly Gly Ala Val Gly Leu Met 35 40 45 Gly Ile Val Ala Asp Ala Ala Met Ala Ala Gly Gly Glu Val Ile Gly 50 55 60 Ile Ile Pro Val Ser Leu Gln Arg Ala Glu Ile Ala His Pro Gly Leu 65 70 75 80 Thr Arg Leu Glu Val Val Asp Gly Met His Ala Arg Lys Ala Arg Met 85 90 95 Ala Glu Leu Ser Asp Ala Phe Ile Ala Leu Pro Gly Gly Leu Gly Thr 100 105 110 Phe Glu Glu Leu Phe Glu Val Trp Thr Trp Gly Gln Leu Gly Tyr His 115 120 125 Gly Lys Pro Leu Gly Leu Leu Glu Val Asn Gly Phe Tyr Glu Lys Leu 130 135 140 Ser Gly Phe Leu Asp His Val Val Glu Gln Gly Phe Val Arg Pro Gln 145 150 155 160 His Arg Ser Met Leu Gln Met Asn Glu Ala Pro Asp Ala Leu Leu Asp 165 170 175 Ala Leu Asp Ala Trp Glu Pro Val Val Gln Pro Lys Trp Val Asp Gln 180 185 190 Pro Pro Ser 195 <210> 59 <211> 199 <212> PRT <213> Acinetobacter baylyi <400> 59 Met Val Lys Lys Phe Met Asn Ser Val Cys Ile Phe Cys Gly Ser Ala 1 5 10 15 Val Gly Thr Asp Pro Val Phe Ile Gln Ala Ala Gln Ser Thr Gly Lys 20 25 30 Arg Ile Ala Glu Gln Gly Lys Thr Leu Val Tyr Gly Gly Gly Arg Ser 35 40 45 Gly Leu Met Gly Val Val Ala Asp Ser Ala Leu Gln Ala Gly Gly His 50 55 60 Val Ile Gly Val Ile Pro Thr Ala Leu Val Asp Arg Glu Leu Ala His 65 70 75 80 Pro His Leu Thr Glu Leu His Val Val Lys Asn Met His Glu Arg Lys 85 90 95 Thr Lys Met Ala Glu Leu Ser Asp Gly Phe Ile Ala Leu Pro Gly Gly 100 105 110 Ala Gly Thr Leu Glu Glu Ile Phe Glu Gln Trp Thr Trp Ala Gln Leu 115 120 125 Gly Ile His Gln Lys Pro Cys Gly Phe Leu Asn Ile Lys Gly Phe Tyr 130 135 140 Asp Asp Leu Leu Lys Met Ile Gln Gly Thr Val Asp Tyr Gly Phe Thr 145 150 155 160 Gln Ser Arg Phe Ala Glu Lys Leu Ile Ala Ser Asp Asp Ile Glu Ile 165 170 175 Ile Leu Asn Gln Phe Glu His Tyr Leu Ala Pro Thr Pro Lys Trp Gly 180 185 190 Asp His Ala Lys Val His Pro 195 <210> 60 <211> 185 <212> PRT <213> Arcobacter mytili <400> 60 Met Lys Ile Ala Val Phe Cys Gly Ser Ser Met Gly Asn Asn Ile Lys 1 5 10 15 Tyr Leu Asn Ala Thr Lys Ala Leu Gly Lys Phe Phe Ala Gln Asn Asn 20 25 30 Ile Asp Val Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Ala Ile 35 40 45 Ala Asp Ser Val Met Glu Asn Gly Gly Lys Val Tyr Gly Val Ile Pro 50 55 60 Glu Lys Leu Lys Ser Lys Glu Leu Ala His Thr Gly Ile Thr Glu Leu 65 70 75 80 His Val Val Ser Thr Met His Glu Arg Lys Ala Met Met Ala Glu Leu 85 90 95 Ala Asp Ala Phe Val Thr Leu Pro Gly Gly Ala Gly Thr Leu Glu Glu 100 105 110 Ile Phe Glu Ala Trp Thr Trp Ala Gln Leu Gly Tyr His Asn Lys Pro 115 120 125 Cys Ala Phe Tyr Asn Val Asp Gly Phe Tyr Asp Lys Leu Phe Glu Leu 130 135 140 Ile Asn Asn Met Cys Glu Cys Glu Phe Leu Lys Pro Glu Tyr Ser Asn 145 150 155 160 Met Leu Ile Lys Thr Asp Asn Lys Glu Glu Leu Leu Glu Ala Ile Lys 165 170 175 Asn Tyr Lys Ala Pro Leu Asn Lys Trp 180 185 <210> 61 <211> 189 <212> PRT <213> Blastococcus endophyticus <400> 61 Met Arg Ile Ala Val Phe Thr Gly Ser Gln Ser Gly Pro Glu Ser His 1 5 10 15 Arg Thr Ala Ala Ala Ala Leu Ala Gly Asp Leu Ala Arg Ala Gly Val 20 25 30 Gly Ile Val Tyr Gly Gly Gly His Val Gly Leu Met Gly Val Val Ala 35 40 45 Asp Ala Ala Leu Ala Ala Gly Gly Glu Val Val Gly Val Ile Pro Gln 50 55 60 His Leu Val Asp Asp Glu Leu Ala His Pro Arg Leu Pro Arg Leu Glu 65 70 75 80 Ile Val Ser Ser Met His Glu Arg Lys Ala Arg Met Ala Glu Leu Ser 85 90 95 Asp Ala Phe Val Ala Leu Pro Gly Ala Ala Gly Thr Leu Glu Glu Leu 100 105 110 Phe Glu Ala Trp Thr Trp Gly Met Leu Gly Leu His Ala Lys Pro Thr 115 120 125 Val Leu Val Asp Val Asp Gly Phe Trp Gln Pro Leu Leu Ala Gln Leu 130 135 140 Arg Arg Met Ala Asp Asp Gly Tyr Leu Asp Arg Arg Arg Leu Asp Ala 145 150 155 160 Leu Gly Val Val Thr Asp Ala Ala Gly Leu Leu Ala Phe Val Glu Gly 165 170 175 Tyr Glu His Pro Pro Arg Lys Trp Thr Pro Thr Pro Ala 180 185 <210> 62 <211> 194 <212> PRT <213> Burkholderia sp. OLGA172 <400> 62 Met Lys Ser Val Cys Val Tyr Cys Gly Ser Ser Asp Gly Val Arg Pro 1 5 10 15 Leu Tyr Ala Glu Ala Ala Arg Ala Phe Gly Arg Ala Leu Val Gln Ala 20 25 30 Asp Leu Ala Leu Val Tyr Gly Gly Gly Lys Val Gly Leu Met Gly Val 35 40 45 Ile Ala Asp Thr Val Met Ala Glu Gly Gly Arg Ala Val Gly Val Ile 50 55 60 Pro Glu Leu Leu Val Asn Lys Glu Val Gly His Asn Gly Leu Thr Glu 65 70 75 80 Leu His Val Val Pro Asp Met His His Arg Lys Lys Met Met Ala Asp 85 90 95 Leu Ser Asp Ala Phe Val Ala Met Pro Gly Gly Ala Gly Thr Leu Glu 100 105 110 Glu Leu Phe Glu Val Tyr Thr Trp Ala Gln Leu Gly Tyr His Gln Lys 115 120 125 Pro Val Ala Leu Leu Asn Ile Asp Gly Phe Tyr Asp Pro Leu Ile Ala 130 135 140 Leu Leu Lys His Thr Val Asp Glu Gly Phe Met Arg Gln Thr Tyr Phe 145 150 155 160 Asp Ile Leu Gln Arg Asp Ala Asp Pro Val Ala Leu Ile Asp Lys Leu 165 170 175 Gln Arg Tyr Lys Pro Pro Ala Ser Asp Lys Trp Ala Ile Lys Arg Asp 180 185 190 Ala Val <210> 63 <211> 633 <212> PRT <213> Bacillus subtilis <400> 63 Met Asp Leu Leu Ser Ile Gln Asp Pro Ser Phe Leu Lys Asn Met Ser 1 5 10 15 Ile Asp Glu Leu Glu Lys Leu Ser Asp Glu Ile Arg Gln Phe Leu Ile 20 25 30 Thr Ser Leu Ser Ala Ser Gly Gly His Ile Gly Pro Asn Leu Gly Val 35 40 45 Val Glu Leu Thr Val Ala Leu His Lys Glu Phe Asn Ser Pro Lys Asp 50 55 60 Lys Phe Leu Trp Asp Val Gly His Gln Ser Tyr Val His Lys Leu Leu 65 70 75 80 Thr Gly Arg Gly Lys Glu Phe Ala Thr Leu Arg Gln Tyr Lys Gly Leu 85 90 95 Cys Gly Phe Pro Lys Arg Ser Glu Ser Glu His Asp Val Trp Glu Thr 100 105 110 Gly His Ser Ser Thr Ser Leu Ser Gly Ala Met Gly Met Ala Ala Ala 115 120 125 Arg Asp Ile Lys Gly Thr Asp Glu Tyr Ile Ile Pro Ile Ile Gly Asp 130 135 140 Gly Ala Leu Thr Gly Gly Met Ala Leu Glu Ala Leu Asn His Ile Gly 145 150 155 160 Asp Glu Lys Lys Asp Met Ile Val Ile Leu Asn Asp Asn Glu Met Ser 165 170 175 Ile Ala Pro Asn Val Gly Ala Ile His Ser Met Leu Gly Arg Leu Arg 180 185 190 Thr Ala Gly Lys Tyr Gln Trp Val Lys Asp Glu Leu Glu Tyr Leu Phe 195 200 205 Lys Lys Ile Pro Ala Val Gly Gly Lys Leu Ala Ala Thr Ala Glu Arg 210 215 220 Val Lys Asp Ser Leu Lys Tyr Met Leu Val Ser Gly Met Phe Phe Glu 225 230 235 240 Glu Leu Gly Phe Thr Tyr Leu Gly Pro Val Asp Gly His Ser Tyr His 245 250 255 Glu Leu Ile Glu Asn Leu Gln Tyr Ala Lys Lys Thr Lys Gly Pro Val 260 265 270 Leu Leu His Val Ile Thr Lys Lys Gly Lys Gly Tyr Lys Pro Ala Glu 275 280 285 Thr Asp Thr Ile Gly Thr Trp His Gly Thr Gly Pro Tyr Lys Ile Asn 290 295 300 Thr Gly Asp Phe Val Lys Pro Lys Ala Ala Ala Pro Ser Trp Ser Gly 305 310 315 320 Leu Val Ser Gly Thr Val Gln Arg Met Ala Arg Glu Asp Gly Arg Ile 325 330 335 Val Ala Ile Thr Pro Ala Met Pro Val Gly Ser Lys Leu Glu Gly Phe 340 345 350 Ala Lys Glu Phe Pro Asp Arg Met Phe Asp Val Gly Ile Ala Glu Gln 355 360 365 His Ala Ala Thr Met Ala Ala Ala Met Ala Met Gln Gly Met Lys Pro 370 375 380 Phe Leu Ala Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val 385 390 395 400 Val His Asp Ile Cys Arg Gln Asn Ala Asn Val Phe Ile Gly Ile Asp 405 410 415 Arg Ala Gly Leu Val Gly Ala Asp Gly Glu Thr His Gln Gly Val Phe 420 425 430 Asp Ile Ala Phe Met Arg His Ile Pro Asn Met Val Leu Met Met Pro 435 440 445 Lys Asp Glu Asn Glu Gly Gln His Met Val His Thr Ala Leu Ser Tyr 450 455 460 Asp Glu Gly Pro Ile Ala Met Arg Phe Pro Arg Gly Asn Gly Leu Gly 465 470 475 480 Val Lys Met Asp Glu Gln Leu Lys Thr Ile Pro Ile Gly Thr Trp Glu 485 490 495 Val Leu Arg Pro Gly Asn Asp Ala Val Ile Leu Thr Phe Gly Thr Thr 500 505 510 Ile Glu Met Ala Ile Glu Ala Ala Glu Glu Leu Gln Lys Glu Gly Leu 515 520 525 Ser Val Arg Val Val Asn Ala Arg Phe Ile Lys Pro Ile Asp Glu Lys 530 535 540 Met Met Lys Ser Ile Leu Lys Glu Gly Leu Pro Ile Leu Thr Ile Glu 545 550 555 560 Glu Ala Val Leu Glu Gly Gly Phe Gly Ser Ser Ile Leu Glu Phe Ala 565 570 575 His Asp Gln Gly Glu Tyr His Thr Pro Ile Asp Arg Met Gly Ile Pro 580 585 590 Asp Arg Phe Ile Glu His Gly Ser Val Thr Ala Leu Leu Glu Glu Ile 595 600 605 Gly Leu Thr Lys Gln Gln Val Ala Asn Arg Ile Arg Leu Leu Met Pro 610 615 620 Pro Lys Thr His Lys Gly Ile Gly Ser 625 630 <210> 64 <211> 620 <212> PRT <213> Escherichia coli <400> 64 Met Ser Phe Asp Ile Ala Lys Tyr Pro Thr Leu Ala Leu Val Asp Ser 1 5 10 15 Thr Gln Glu Leu Arg Leu Leu Pro Lys Glu Ser Leu Pro Lys Leu Cys 20 25 30 Asp Glu Leu Arg Arg Tyr Leu Leu Asp Ser Val Ser Arg Ser Ser Gly 35 40 45 His Phe Ala Ser Gly Leu Gly Thr Val Glu Leu Thr Val Ala Leu His 50 55 60 Tyr Val Tyr Asn Thr Pro Phe Asp Gln Leu Ile Trp Asp Val Gly His 65 70 75 80 Gln Ala Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Ile Gly 85 90 95 Thr Ile Arg Gln Lys Gly Gly Leu His Pro Phe Pro Trp Arg Gly Glu 100 105 110 Ser Glu Tyr Asp Val Leu Ser Val Gly His Ser Ser Thr Ser Ile Ser 115 120 125 Ala Gly Ile Gly Ile Ala Val Ala Ala Glu Lys Glu Gly Lys Asn Arg 130 135 140 Arg Thr Val Cys Val Ile Gly Asp Gly Ala Ile Thr Ala Gly Met Ala 145 150 155 160 Phe Glu Ala Met Asn His Ala Gly Asp Ile Arg Pro Asp Met Leu Val 165 170 175 Ile Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val Gly Ala Leu 180 185 190 Asn Asn His Leu Ala Gln Leu Leu Ser Gly Lys Leu Tyr Ser Ser Leu 195 200 205 Arg Glu Gly Gly Lys Lys Val Phe Ser Gly Val Pro Pro Ile Lys Glu 210 215 220 Leu Leu Lys Arg Thr Glu Glu His Ile Lys Gly Met Val Val Pro Gly 225 230 235 240 Thr Leu Phe Glu Glu Leu Gly Phe Asn Tyr Ile Gly Pro Val Asp Gly 245 250 255 His Asp Val Leu Gly Leu Ile Thr Thr Leu Lys Asn Met Arg Asp Leu 260 265 270 Lys Gly Pro Gln Phe Leu His Ile Met Thr Lys Lys Gly Arg Gly Tyr 275 280 285 Glu Pro Ala Glu Lys Asp Pro Ile Thr Phe His Ala Val Pro Lys Phe 290 295 300 Asp Pro Ser Ser Gly Cys Leu Pro Lys Ser Ser Gly Gly Leu Pro Ser 305 310 315 320 Tyr Ser Lys Ile Phe Gly Asp Trp Leu Cys Glu Thr Ala Ala Lys Asp 325 330 335 Asn Lys Leu Met Ala Ile Thr Pro Ala Met Arg Glu Gly Ser Gly Met 340 345 350 Val Glu Phe Ser Arg Lys Phe Pro Asp Arg Tyr Phe Asp Val Ala Ile 355 360 365 Ala Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Ile Gly Gly 370 375 380 Tyr Lys Pro Ile Val Ala Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr 385 390 395 400 Asp Gln Val Leu His Asp Val Ala Ile Gln Lys Leu Pro Val Leu Phe 405 410 415 Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly Gln Thr His Gln 420 425 430 Gly Ala Phe Asp Leu Ser Tyr Leu Arg Cys Ile Pro Glu Met Val Ile 435 440 445 Met Thr Pro Ser Asp Glu Asn Glu Cys Arg Gln Met Leu Tyr Thr Gly 450 455 460 Tyr His Tyr Asn Asp Gly Pro Ser Ala Val Arg Tyr Pro Arg Gly Asn 465 470 475 480 Ala Val Gly Val Glu Leu Thr Pro Leu Glu Lys Leu Pro Ile Gly Lys 485 490 495 Gly Ile Val Lys Arg Arg Gly Glu Lys Leu Ala Ile Leu Asn Phe Gly 500 505 510 Thr Leu Met Pro Glu Ala Ala Lys Val Ala Glu Ser Leu Asn Ala Thr 515 520 525 Leu Val Asp Met Arg Phe Val Lys Pro Leu Asp Glu Ala Leu Ile Leu 530 535 540 Glu Met Ala Ala Ser His Glu Ala Leu Val Thr Val Glu Glu Asn Ala 545 550 555 560 Ile Met Gly Gly Ala Gly Ser Gly Val Asn Glu Val Leu Met Ala His 565 570 575 Arg Lys Pro Val Pro Val Leu Asn Ile Gly Leu Pro Asp Phe Phe Ile 580 585 590 Pro Gln Gly Thr Gln Glu Glu Met Arg Ala Glu Leu Gly Leu Asp Ala 595 600 605 Ala Gly Met Glu Ala Lys Ile Lys Ala Trp Leu Ala 610 615 620 <210> 65 <211> 633 <212> PRT <213> Corynebacterium stationis <400> 65 Met Gly Ile Leu Asn Lys Val Lys Ser Pro Gln Asp Leu Lys Lys Leu 1 5 10 15 Ser Asp Asp Lys Val Glu Glu Leu Ala Ala Glu Ile Arg Gln Phe Leu 20 25 30 Ile Asp Lys Val Ser Val Thr Gly Gly His Leu Gly Pro Asn Leu Gly 35 40 45 Val Val Glu Leu Thr Ile Ala Leu His Arg Val Phe Asp Ser Pro Arg 50 55 60 Asp Pro Ile Val Phe Asp Thr Ser His Gln Ser Tyr Val His Lys Ile 65 70 75 80 Leu Thr Gly Arg Ala Asp Gln Phe Asp Thr Leu Arg Gln Lys Asp Gly 85 90 95 Leu Ser Gly Tyr Thr Asp Arg Gly Glu Ser Glu His Asp Trp Thr Glu 100 105 110 Ser Ser His Ala Ser Ala Ala Ile Ser Val Ile Asp Gly Leu Ser Lys 115 120 125 Ala Phe Cys Ile Lys Gly Glu Ser Arg Arg Asn Ala Val Ala Val Val 130 135 140 Gly Asp Gly Ala Leu Thr Gly Gly Met Cys Trp Glu Ala Leu Asn Asn 145 150 155 160 Ile Ser Ala Asn Lys Glu Arg Asn Ala Val Ile Val Val Asn Asp Asn 165 170 175 Gly Arg Ser Tyr Ser Pro Thr Ile Gly Gly Leu Ser Glu Asn Leu Ser 180 185 190 Arg Ile Arg Thr Gln His Gly Tyr Asp Glu Leu Met Glu His Gly Lys 195 200 205 Lys Thr Leu Lys Ser Leu Gly Trp Val Gly Asn Arg Thr Phe Asp Ala 210 215 220 Leu Arg Ala Val Lys Glu Gly Val Lys Ser Ser Ile Leu Pro Thr Glu 225 230 235 240 Met Phe Pro Glu Leu Gly Met Lys Tyr Ile Gly Pro Ile Asn Gly His 245 250 255 Asp Leu Asp Ala Leu Asp His Ala Leu Ser Tyr Ala Arg Asp Tyr Glu 260 265 270 Gly Pro Ile Ile Val His Val Val Thr Glu Lys Gly His Gly Phe Ala 275 280 285 Pro Ala Val Asn Glu Pro Gln Asp Gln Met His Ser Thr Gly Ala Ile 290 295 300 Asp Pro Val Thr Gly Val Pro Lys Gly Lys Ser Gln Pro Gly Trp Thr 305 310 315 320 Ala Val Phe Ser Glu Glu Leu Ile Glu Ala Ala Lys Lys Arg Asp Asp 325 330 335 Ile Val Ala Ile Thr Ala Ala Met Ala Gly Pro Thr Gly Leu Ile Pro 340 345 350 Phe Ala Glu Gln Phe Pro Asn Arg Phe Phe Asp Val Gly Ile Ala Glu 355 360 365 Gln His Ala Met Ala Ser Ala Ser Gly Leu Ala Leu Gly Gly Leu His 370 375 380 Pro Val Val Ala Ile Tyr Ser Thr Phe Leu Asn Arg Ala Phe Asp Gln 385 390 395 400 Leu Leu Met Asp Ile Ala Leu Leu Lys Gln Pro Val Thr Ile Val Leu 405 410 415 Asp Arg Ala Gly Val Thr Gly Ser Asp Gly Ala Ser His Asn Gly Val 420 425 430 Trp Asp Met Ala Leu Thr Thr Ile Ile Pro Gly Ile His Val Ala Ala 435 440 445 Pro Arg Asp Gly Gln Arg Leu Arg Glu Leu Phe Gln Glu Ser Leu Glu 450 455 460 Ile Lys Ser Gly Pro Ser Val Val Arg Phe Pro Lys Gly Asn Leu Leu 465 470 475 480 Glu Asp Met Asp Ala Val Ala Thr Thr Glu Asp Gly Val Asp Ile Ile 485 490 495 Phe Glu Ser Glu Gln Glu Arg Phe Ala Asp Ala Glu Ala Lys Lys Val 500 505 510 Leu Val Ile Ser Ile Gly Ala Met Ala Ala Arg Ser Leu Gly Ala Ala 515 520 525 Gln Ile Leu Glu Asp Lys Gly Met Ala Val Thr Val Val Asp Pro Arg 530 535 540 Trp Leu Cys Pro Val Ala Pro Ser Leu Ile Glu Met Ala Asp Glu His 545 550 555 560 Asp Ile Val Val Val Ala Glu Asp Gly Met Met Arg Ala Gly Val Gly 565 570 575 Ser Leu Phe Asp Glu Ala Phe Ser Ala Ala Glu Val Asp Thr Pro Leu 580 585 590 Arg Arg Val Ala Phe Pro Ser Ile Phe Pro Lys His Gly Ser Arg Gly 595 600 605 Glu Val Leu Glu Glu Val Gly Met Asp Ala Asp Gly Ile Ala Ala Ala 610 615 620 Val Thr Glu Trp Val Asp Asp Leu His 625 630 <210> 66 <211> 642 <212> PRT <213> Streptomyces avermitilis <400> 66 Met Pro Leu Leu Thr Arg Ile Arg Gly Pro Arg Asp Leu Asp Arg Leu 1 5 10 15 Ser Leu Glu Gln Leu Asp Gln Leu Ala Glu Glu Ile Arg Thr Phe Leu 20 25 30 Val Asp Ala Val Ser Lys Thr Gly Gly His Leu Gly Pro Asn Leu Gly 35 40 45 Val Val Glu Leu Thr Ile Ala Leu His Arg Val Phe Asp Ser Pro Lys 50 55 60 Asp Arg Val Leu Phe Asp Thr Gly His Gln Ser Tyr Val His Lys Leu 65 70 75 80 Leu Thr Gly Arg Gln Asp Phe Ser Lys Leu Lys Met Lys Gly Gly Leu 85 90 95 Ser Gly Tyr Pro Ser Gln Ala Glu Ser Glu His Asp Val Ile Glu Asn 100 105 110 Ser His Ala Ser Thr Val Leu Gly Trp Ala Asp Gly Leu Ala Lys Ala 115 120 125 Asn Gln Val Leu Glu Arg Asp Asp His Val Val Ala Val Ile Gly Asp 130 135 140 Gly Ala Leu Thr Gly Gly Met Ala Trp Glu Ala Leu Asn Asn Ile Ala 145 150 155 160 Ala Ala Lys Asp Arg Pro Leu Val Ile Val Val Asn Asp Asn Glu Arg 165 170 175 Ser Tyr Ala Pro Thr Ile Gly Gly Leu Ala Asn His Leu Ala Thr Leu 180 185 190 Arg Thr Thr Asp Gly Tyr Glu Arg Phe Leu Ala Arg Gly Lys Asp Leu 195 200 205 Leu Glu Arg Thr Pro Val Val Gly Arg Pro Leu Tyr Glu Thr Leu His 210 215 220 Gly Ala Lys Lys Gly Leu Lys Asp Phe Ile Ala Pro Gln Gly Met Phe 225 230 235 240 Glu Asp Leu Gly Leu Lys Tyr Val Gly Pro Ile Asp Gly His Asp Ile 245 250 255 Glu Ala Leu Glu Ser Ala Leu Ala Arg Ala Lys Arg Phe Gly Gly Pro 260 265 270 Val Ile Val His Cys Leu Thr Glu Lys Gly Arg Gly Tyr Gln Pro Ala 275 280 285 Leu Gln Asp Glu Ala Asp Arg Phe His Ala Val Gly Lys Ile His Pro 290 295 300 Asp Thr Gly Leu Pro Ile Ala Ser Ser Gly Ala Asp Trp Thr Ser Val 305 310 315 320 Phe Gly Glu Glu Met Val Lys Leu Gly Gln Glu Arg Lys Asp Ile Val 325 330 335 Ala Ile Thr Ala Ala Met Leu Gln Pro Val Gly Leu Asp Lys Phe Ala 340 345 350 Lys Val Phe Pro Lys Arg Val Tyr Asp Val Gly Ile Ala Glu Gln His 355 360 365 Ala Ala Val Ser Ala Ala Gly Leu Ala Thr Gly Gly Leu His Pro Val 370 375 380 Phe Ala Val Tyr Ala Thr Phe Leu Asn Arg Ala Phe Asp Gln Val Leu 385 390 395 400 Met Asp Val Ala Leu His Lys Cys Gly Val Thr Phe Val Leu Asp Arg 405 410 415 Ala Gly Val Thr Gly Thr Asp Gly Ala Ser His Asn Gly Met Trp Asp 420 425 430 Met Ser Ile Leu Gln Val Val Pro Gly Leu Arg Leu Ala Ala Pro Arg 435 440 445 Asp Ala Asp Gln Val Arg Ala Gln Leu Arg Glu Ala Val Asp Val Asp 450 455 460 Asp Ala Pro Thr Val Val Arg Phe Ser Lys Gly Ala Val Gly Pro Ala 465 470 475 480 Val Pro Ala Val Gly Arg Ile Gly Gly Met Asp Val Leu Arg Glu Pro 485 490 495 Gly Thr Asp Ala Pro Asp Val Leu Leu Val Ser Val Gly Ala Leu Ala 500 505 510 Pro Met Cys Leu Glu Ile Ala Gly Leu Leu Asp Lys Gln Gly Ile Ser 515 520 525 Ala Thr Val Val Asp Pro Arg Trp Val Lys Pro Val Asp Glu Ala Met 530 535 540 Ala Pro Leu Ala Glu Arg His Arg Val Val Val Thr Val Glu Asp Asn 545 550 555 560 Ser Arg Val Gly Gly Val Gly Ser Ala Ile Ala Gln Ala Leu Arg Asp 565 570 575 Ala Gly Val Asp Val Pro Leu Arg Asp Phe Gly Ile Pro Pro Arg Phe 580 585 590 Leu Asp His Ala Ser Arg Gly Glu Val Met Ala Glu Ile Gly Leu Thr 595 600 605 Ala Pro Asp Ile Ala Arg Gln Val Thr Gly Leu Val Ser Lys Leu Asp 610 615 620 Gly Arg Phe Glu Arg Pro Thr Ala Glu Ile Asp Ser Val Glu Pro Ala 625 630 635 640 Arg Asp <210> 67 <211> 656 <212> PRT <213> Streptomyces coelicolor <400> 67 Met Thr Ile Leu Glu Asn Ile Arg Gly Pro Arg Asp Leu Lys Ala Leu 1 5 10 15 Ser Glu Ala Glu Leu Gly Glu Leu Ser Asp Glu Ile Arg Asp Phe Leu 20 25 30 Val His Ala Val Ala Arg Thr Gly Gly His Leu Gly Pro Asn Leu Gly 35 40 45 Val Val Glu Leu Thr Val Ala Leu His Arg Val Phe Glu Ser Pro Asp 50 55 60 Asp Arg Ile Leu Trp Asp Thr Gly His Gln Ser Tyr Val His Lys Leu 65 70 75 80 Leu Thr Gly Arg Gln Asp Phe Ser Lys Leu Arg Ser Lys Gly Gly Leu 85 90 95 Ser Gly Tyr Pro Ser Arg Glu Glu Ser Ala His Asp Val Ile Glu Asn 100 105 110 Ser His Ala Ser Thr Val Leu Gly Trp Ala Asp Gly Leu Ala Lys Ala 115 120 125 Arg Gln Val Gln Gly Glu Arg Ser His Val Val Ala Val Ile Gly Asp 130 135 140 Gly Ala Leu Thr Gly Gly Met Ala Trp Glu Ala Leu Asn Asn Ile Ala 145 150 155 160 Ala Ala Arg Asp Arg Pro Leu Ile Ile Val Val Asn Asp Asn Glu Arg 165 170 175 Ser Tyr Ala Pro Thr Ile Gly Gly Leu Ala Asn His Leu Ala Thr Leu 180 185 190 Arg Thr Thr Asp Gly Tyr Glu Arg Ala Leu Ala Trp Gly Lys Asp Val 195 200 205 Leu Gln Arg Thr Pro Val Val Gly His Thr Val Tyr Glu Ala Leu His 210 215 220 Gly Ala Lys Lys Gly Phe Lys Asp Ala Phe Ala Pro Gln Gly Leu Phe 225 230 235 240 Glu Asp Leu Gly Leu Lys Tyr Leu Gly Pro Ile Asp Gly His Asp Ile 245 250 255 Gly Ala Val Glu Ser Ala Leu Arg Arg Ala Lys Arg Phe His Gly Pro 260 265 270 Val Leu Val His Cys Leu Thr Glu Lys Gly Arg Gly Tyr Glu Pro Ala 275 280 285 Leu Arg Asp Glu Glu Asp His Phe His Thr Val Gly Val Met Asp Pro 290 295 300 Leu Thr Cys Glu Pro Leu Gly Pro Ala Gly Gly Pro Ser Trp Thr Ser 305 310 315 320 Val Phe Gly Glu Glu Ile Val Arg Ile Gly Glu Glu Arg Ala Asp Val 325 330 335 Val Ala Ile Thr Ala Ala Met Leu His Pro Val Gly Leu Ala Pro Phe 340 345 350 Ala Glu Arg Phe Pro Asp Arg Val Trp Asp Val Gly Ile Ala Glu Gln 355 360 365 His Ala Ala Val Ser Ala Ala Gly Leu Ala Thr Gly Gly Leu His Pro 370 375 380 Val Val Ala Val Tyr Ala Thr Phe Leu Asn Arg Ala Phe Asp Gln Leu 385 390 395 400 Leu Met Asp Val Ala Leu His Arg Cys Gly Val Thr Phe Val Leu Asp 405 410 415 Arg Ala Gly Val Thr Gly Val Asp Gly Ala Ser His Asn Gly Met Trp 420 425 430 Asp Met Ser Val Leu Gln Val Val Pro Gly Leu Arg Ile Ala Ala Pro 435 440 445 Arg Asp Ala Asp Gln Leu Arg Thr Gln Leu Arg Glu Ala Val Ala Val 450 455 460 Asp Asp Ala Pro Thr Leu Leu Arg Phe Pro Lys Glu Ser Val Gly Pro 465 470 475 480 Ala Val Pro Ala Val Asp Arg Ile Gly Gly Leu Asp Val Leu His Thr 485 490 495 Ala Asp Arg Ser Glu Val Leu Leu Val Ala Val Gly Val Met Ala Pro 500 505 510 Val Cys Leu Gly Ala Ala Glu Leu Leu Glu Ala Arg Gly Ile Gly Cys 515 520 525 Thr Val Val Asp Pro Arg Trp Val Lys Pro Val Asp Pro Ala Leu Ala 530 535 540 Pro Leu Ala Ala Arg His Arg Leu Val Ala Val Val Glu Asp Asn Ser 545 550 555 560 Arg Ala Ala Gly Val Gly Ser Ala Val Ala Leu Ala Leu Gly Asp Ala 565 570 575 Glu Val Asp Val Pro Val Arg Arg Phe Gly Ile Pro Glu Gln Phe Leu 580 585 590 Ala His Ala Lys Arg Ala Glu Val Leu Ala Asp Ile Gly Leu Thr Pro 595 600 605 Val Asp Val Ala Gly Arg Ile Ala Ala Ser Leu Ala Leu Ala Glu Pro 610 615 620 Ala Gly Asp Arg Ala Gly Gly Pro Ala Val Glu Gln Pro Gly Asp Gly 625 630 635 640 Arg Met Ser Gly Asp Gly Arg Ile Val Met Pro Ala Gln Gly Glu Asn 645 650 655 <210> 68 <211> 629 <212> PRT <213> Deinococcus radiodurans <400> 68 Met Asn Glu Leu Pro Gly Thr Ser Asp Thr Pro Leu Leu Asp Gln Ile 1 5 10 15 His Gly Pro Lys Asp Leu Lys Arg Leu Ser Arg Glu Gln Leu Pro Ala 20 25 30 Leu Thr Glu Glu Leu Arg Gly Glu Ile Val Arg Val Cys Ser Arg Gly 35 40 45 Gly Leu His Leu Ala Ser Ser Leu Gly Ala Val Asp Ile Ile Thr Ala 50 55 60 Leu His Tyr Val Leu Asp Ser Pro Arg Asp Arg Ile Leu Phe Asp Val 65 70 75 80 Gly His Gln Ala Tyr Ala His Lys Ile Leu Thr Gly Arg Arg Asp Gln 85 90 95 Met Ala Asp Ile Lys Lys Glu Gly Gly Ile Ser Gly Phe Thr Lys Val 100 105 110 Ser Glu Ser Glu His Asp Ala Ile Thr Val Gly His Ala Ser Thr Ser 115 120 125 Leu Ala Asn Ala Leu Gly Met Ala Leu Ala Arg Asp Ala Gln Gly Lys 130 135 140 Asp Phe His Val Ala Ala Val Ile Gly Asp Gly Ser Leu Thr Gly Gly 145 150 155 160 Met Ala Leu Ala Ala Leu Asn Thr Ile Gly Asp Met Gly Arg Lys Met 165 170 175 Leu Ile Val Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val Gly 180 185 190 Ala Met Asn Lys Phe Met Arg Gly Leu Gln Val Gln Lys Trp Phe Gln 195 200 205 Glu Gly Glu Gly Ala Gly Lys Lys Ala Val Glu Ala Val Ser Lys Pro 210 215 220 Leu Ala Asp Phe Met Ser Arg Ala Lys Asn Ser Thr Arg His Phe Phe 225 230 235 240 Asp Pro Ala Ser Val Asn Pro Phe Ala Ala Met Gly Val Arg Tyr Val 245 250 255 Gly Pro Val Asp Gly His Asn Val Gln Glu Leu Val Trp Leu Leu Glu 260 265 270 Arg Leu Val Asp Leu Asp Gly Pro Thr Ile Leu His Ile Val Thr Thr 275 280 285 Lys Gly Lys Gly Leu Ser Tyr Ala Glu Ala Asp Pro Ile Tyr Trp His 290 295 300 Gly Pro Ala Lys Phe Asp Pro Ala Thr Gly Glu Tyr Val Pro Ser Ser 305 310 315 320 Ala Tyr Ser Trp Ser Ala Ala Phe Gly Glu Ala Val Thr Glu Trp Ala 325 330 335 Lys Thr Asp Pro Arg Thr Phe Val Val Thr Pro Ala Met Arg Glu Gly 340 345 350 Ser Gly Leu Val Glu Phe Ser Arg Val His Pro His Arg Tyr Leu Asp 355 360 365 Val Gly Ile Ala Glu Glu Val Ala Val Thr Thr Ala Ala Gly Met Ala 370 375 380 Leu Gln Gly Met Arg Pro Val Val Ala Ile Tyr Ser Thr Phe Leu Gln 385 390 395 400 Arg Ala Tyr Asp Gln Val Leu His Asp Val Ala Ile Glu His Leu Asn 405 410 415 Val Thr Phe Cys Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly Ala 420 425 430 Thr His Asn Gly Val Phe Asp Leu Ser Phe Leu Arg Ser Ile Pro Gly 435 440 445 Val Arg Ile Gly Leu Pro Lys Asp Ala Ala Glu Leu Arg Gly Met Leu 450 455 460 Lys Tyr Ala Gln Thr His Asp Gly Pro Phe Ala Ile Arg Tyr Pro Arg 465 470 475 480 Gly Asn Thr Ala Gln Val Pro Ala Gly Thr Trp Pro Asp Leu Lys Trp 485 490 495 Gly Glu Trp Glu Arg Leu Lys Gly Gly Asp Asp Val Val Ile Leu Ala 500 505 510 Gly Gly Lys Ala Leu Asp Tyr Ala Leu Lys Ala Ala Glu Asp Leu Pro 515 520 525 Gly Val Gly Val Val Asn Ala Arg Phe Val Lys Pro Leu Asp Glu Glu 530 535 540 Met Leu Arg Glu Val Gly Gly Arg Ala Arg Ala Leu Ile Thr Val Glu 545 550 555 560 Asp Asn Thr Val Val Gly Gly Phe Gly Gly Ala Val Leu Glu Ala Leu 565 570 575 Asn Ser Met Asn Leu His Pro Thr Val Arg Val Leu Gly Ile Pro Asp 580 585 590 Glu Phe Gln Glu His Ala Thr Ala Glu Ser Val His Ala Arg Ala Gly 595 600 605 Ile Asp Ala Pro Ala Ile Arg Thr Val Leu Ala Glu Leu Gly Val Asp 610 615 620 Val Pro Ile Glu Val 625 <210> 69 <211> 620 <212> PRT <213> Artificial Sequence <220> <223> Mutant Escherichia coli enzyme DXS (Y392F) <400> 69 Met Ser Phe Asp Ile Ala Lys Tyr Pro Thr Leu Ala Leu Val Asp Ser 1 5 10 15 Thr Gln Glu Leu Arg Leu Leu Pro Lys Glu Ser Leu Pro Lys Leu Cys 20 25 30 Asp Glu Leu Arg Arg Tyr Leu Leu Asp Ser Val Ser Arg Ser Ser Gly 35 40 45 His Phe Ala Ser Gly Leu Gly Thr Val Glu Leu Thr Val Ala Leu His 50 55 60 Tyr Val Tyr Asn Thr Pro Phe Asp Gln Leu Ile Trp Asp Val Gly His 65 70 75 80 Gln Ala Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Ile Gly 85 90 95 Thr Ile Arg Gln Lys Gly Gly Leu His Pro Phe Pro Trp Arg Gly Glu 100 105 110 Ser Glu Tyr Asp Val Leu Ser Val Gly His Ser Ser Thr Ser Ile Ser 115 120 125 Ala Gly Ile Gly Ile Ala Val Ala Ala Glu Lys Glu Gly Lys Asn Arg 130 135 140 Arg Thr Val Cys Val Ile Gly Asp Gly Ala Ile Thr Ala Gly Met Ala 145 150 155 160 Phe Glu Ala Met Asn His Ala Gly Asp Ile Arg Pro Asp Met Leu Val 165 170 175 Ile Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val Gly Ala Leu 180 185 190 Asn Asn His Leu Ala Gln Leu Leu Ser Gly Lys Leu Tyr Ser Ser Leu 195 200 205 Arg Glu Gly Gly Lys Lys Val Phe Ser Gly Val Pro Pro Ile Lys Glu 210 215 220 Leu Leu Lys Arg Thr Glu Glu His Ile Lys Gly Met Val Val Pro Gly 225 230 235 240 Thr Leu Phe Glu Glu Leu Gly Phe Asn Tyr Ile Gly Pro Val Asp Gly 245 250 255 His Asp Val Leu Gly Leu Ile Thr Thr Leu Lys Asn Met Arg Asp Leu 260 265 270 Lys Gly Pro Gln Phe Leu His Ile Met Thr Lys Lys Gly Arg Gly Tyr 275 280 285 Glu Pro Ala Glu Lys Asp Pro Ile Thr Phe His Ala Val Pro Lys Phe 290 295 300 Asp Pro Ser Ser Gly Cys Leu Pro Lys Ser Ser Gly Gly Leu Pro Ser 305 310 315 320 Tyr Ser Lys Ile Phe Gly Asp Trp Leu Cys Glu Thr Ala Ala Lys Asp 325 330 335 Asn Lys Leu Met Ala Ile Thr Pro Ala Met Arg Glu Gly Ser Gly Met 340 345 350 Val Glu Phe Ser Arg Lys Phe Pro Asp Arg Tyr Phe Asp Val Ala Ile 355 360 365 Ala Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Ile Gly Gly 370 375 380 Tyr Lys Pro Ile Val Ala Ile Phe Ser Thr Phe Leu Gln Arg Ala Tyr 385 390 395 400 Asp Gln Val Leu His Asp Val Ala Ile Gln Lys Leu Pro Val Leu Phe 405 410 415 Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly Gln Thr His Gln 420 425 430 Gly Ala Phe Asp Leu Ser Tyr Leu Arg Cys Ile Pro Glu Met Val Ile 435 440 445 Met Thr Pro Ser Asp Glu Asn Glu Cys Arg Gln Met Leu Tyr Thr Gly 450 455 460 Tyr His Tyr Asn Asp Gly Pro Ser Ala Val Arg Tyr Pro Arg Gly Asn 465 470 475 480 Ala Val Gly Val Glu Leu Thr Pro Leu Glu Lys Leu Pro Ile Gly Lys 485 490 495 Gly Ile Val Lys Arg Arg Gly Glu Lys Leu Ala Ile Leu Asn Phe Gly 500 505 510 Thr Leu Met Pro Glu Ala Ala Lys Val Ala Glu Ser Leu Asn Ala Thr 515 520 525 Leu Val Asp Met Arg Phe Val Lys Pro Leu Asp Glu Ala Leu Ile Leu 530 535 540 Glu Met Ala Ala Ser His Glu Ala Leu Val Thr Val Glu Glu Asn Ala 545 550 555 560 Ile Met Gly Gly Ala Gly Ser Gly Val Asn Glu Val Leu Met Ala His 565 570 575 Arg Lys Pro Val Pro Val Leu Asn Ile Gly Leu Pro Asp Phe Phe Ile 580 585 590 Pro Gln Gly Thr Gln Glu Glu Met Arg Ala Glu Leu Gly Leu Asp Ala 595 600 605 Ala Gly Met Glu Ala Lys Ile Lys Ala Trp Leu Ala 610 615 620 <210> 70 <211> 633 <212> PRT <213> Artificial Sequence <220> <223> Mutant Bacillus subtilis enzyme DXS (Y389F) <400> 70 Met Asp Leu Leu Ser Ile Gln Asp Pro Ser Phe Leu Lys Asn Met Ser 1 5 10 15 Ile Asp Glu Leu Glu Lys Leu Ser Asp Glu Ile Arg Gln Phe Leu Ile 20 25 30 Thr Ser Leu Ser Ala Ser Gly Gly His Ile Gly Pro Asn Leu Gly Val 35 40 45 Val Glu Leu Thr Val Ala Leu His Lys Glu Phe Asn Ser Pro Lys Asp 50 55 60 Lys Phe Leu Trp Asp Val Gly His Gln Ser Tyr Val His Lys Leu Leu 65 70 75 80 Thr Gly Arg Gly Lys Glu Phe Ala Thr Leu Arg Gln Tyr Lys Gly Leu 85 90 95 Cys Gly Phe Pro Lys Arg Ser Glu Ser Glu His Asp Val Trp Glu Thr 100 105 110 Gly His Ser Ser Thr Ser Leu Ser Gly Ala Met Gly Met Ala Ala Ala 115 120 125 Arg Asp Ile Lys Gly Thr Asp Glu Tyr Ile Ile Pro Ile Ile Gly Asp 130 135 140 Gly Ala Leu Thr Gly Gly Met Ala Leu Glu Ala Leu Asn His Ile Gly 145 150 155 160 Asp Glu Lys Lys Asp Met Ile Val Ile Leu Asn Asp Asn Glu Met Ser 165 170 175 Ile Ala Pro Asn Val Gly Ala Ile His Ser Met Leu Gly Arg Leu Arg 180 185 190 Thr Ala Gly Lys Tyr Gln Trp Val Lys Asp Glu Leu Glu Tyr Leu Phe 195 200 205 Lys Lys Ile Pro Ala Val Gly Gly Lys Leu Ala Ala Thr Ala Glu Arg 210 215 220 Val Lys Asp Ser Leu Lys Tyr Met Leu Val Ser Gly Met Phe Phe Glu 225 230 235 240 Glu Leu Gly Phe Thr Tyr Leu Gly Pro Val Asp Gly His Ser Tyr His 245 250 255 Glu Leu Ile Glu Asn Leu Gln Tyr Ala Lys Lys Thr Lys Gly Pro Val 260 265 270 Leu Leu His Val Ile Thr Lys Lys Gly Lys Gly Tyr Lys Pro Ala Glu 275 280 285 Thr Asp Thr Ile Gly Thr Trp His Gly Thr Gly Pro Tyr Lys Ile Asn 290 295 300 Thr Gly Asp Phe Val Lys Pro Lys Ala Ala Ala Pro Ser Trp Ser Gly 305 310 315 320 Leu Val Ser Gly Thr Val Gln Arg Met Ala Arg Glu Asp Gly Arg Ile 325 330 335 Val Ala Ile Thr Pro Ala Met Pro Val Gly Ser Lys Leu Glu Gly Phe 340 345 350 Ala Lys Glu Phe Pro Asp Arg Met Phe Asp Val Gly Ile Ala Glu Gln 355 360 365 His Ala Ala Thr Met Ala Ala Ala Met Ala Met Gln Gly Met Lys Pro 370 375 380 Phe Leu Ala Ile Phe Ser Thr Phe Leu Gln Arg Ala Tyr Asp Gln Val 385 390 395 400 Val His Asp Ile Cys Arg Gln Asn Ala Asn Val Phe Ile Gly Ile Asp 405 410 415 Arg Ala Gly Leu Val Gly Ala Asp Gly Glu Thr His Gln Gly Val Phe 420 425 430 Asp Ile Ala Phe Met Arg His Ile Pro Asn Met Val Leu Met Met Pro 435 440 445 Lys Asp Glu Asn Glu Gly Gln His Met Val His Thr Ala Leu Ser Tyr 450 455 460 Asp Glu Gly Pro Ile Ala Met Arg Phe Pro Arg Gly Asn Gly Leu Gly 465 470 475 480 Val Lys Met Asp Glu Gln Leu Lys Thr Ile Pro Ile Gly Thr Trp Glu 485 490 495 Val Leu Arg Pro Gly Asn Asp Ala Val Ile Leu Thr Phe Gly Thr Thr 500 505 510 Ile Glu Met Ala Ile Glu Ala Ala Glu Glu Leu Gln Lys Glu Gly Leu 515 520 525 Ser Val Arg Val Val Asn Ala Arg Phe Ile Lys Pro Ile Asp Glu Lys 530 535 540 Met Met Lys Ser Ile Leu Lys Glu Gly Leu Pro Ile Leu Thr Ile Glu 545 550 555 560 Glu Ala Val Leu Glu Gly Gly Phe Gly Ser Ser Ile Leu Glu Phe Ala 565 570 575 His Asp Gln Gly Glu Tyr His Thr Pro Ile Asp Arg Met Gly Ile Pro 580 585 590 Asp Arg Phe Ile Glu His Gly Ser Val Thr Ala Leu Leu Glu Glu Ile 595 600 605 Gly Leu Thr Lys Gln Gln Val Ala Asn Arg Ile Arg Leu Leu Met Pro 610 615 620 Pro Lys Thr His Lys Gly Ile Gly Ser 625 630 <210> 71 <211> 1451 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA fragment tzs-LOG (IPT-LOG) <400> 71 cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60 tattacacct gatctacggt cctacatgta gtggtaaaac tgatatggct atacaaatcg 120 cgcaagaaac aggttggccc gtcgttgctc ttgatcgtgt gcagtgctgt ccacagattg 180 cgacaggatc cggcagacct ctggaaagcg agttacaatc tacccggcgg atttatttag 240 actcacgccc tttgacagaa ggcattcttg acgcggaatc cgctcatcgc cgtcttatat 300 tcgaggtaga ttggaggaaa tcggaagaag gcttaatcct cgaaggaggg tccatctcgc 360 ttctaaattg tatggctaag tctccatttt ggagatctgg attccagtgg cacgtcaagc 420 gcctgagact tggggattca gatgcgtttc tgacgcgagc aaaacagcgt gtggctgaga 480 tgtttgctat tagagaagat cggccaagtt tattggagga gctcgccgag ctgtggaatt 540 acccggcagc tcgcccgatt ttggaagaca ttgacggcta tcgatgtgcc attagatttg 600 caaggaaaca cgatctcgcc atatcacagc tgccgaacat cgatgccggc cggcatgttg 660 aactgatcga agccattgca aacgaatatc ttgaacatgc gctaagccaa gaacgcgact 720 ttcctcaatg gccggaggac ggcgcaggac aaccagtatg cccggttacc ttaacgagaa 780 tccgttaaaa aagaggggag ggaaacatta tgatgacatc gctttttgac gcgcctacgc 840 ttcaacgcgt aacggttttc actgggagcg ccttgggctc ctctagtctt tatactcagg 900 ctgctcaaac cctggctaaa accgcggtag accgagggat tgatctggtt tatggcggtg 960 gaaaagtcgg cctcatgggt attgttgctg atgcattcct tgaaagcggg ggtgaggcat 1020 tcggcgtgat aacagagtca ctgatgaaag gagaattagg ccatgagaaa ctgacggagt 1080 tggaaatcgt gcccgacatg catattcgta aaaggcggat ggcggaactt ggggatggat 1140 tcattgcgat gcctggagga gccggcaccc tggaagaact gtttgaagtc tggacatggc 1200 agcagttagg aattcatcaa aagccggttg cactctatga cgtcgatggc ttctggcaac 1260 cgttattgga aatgttggaa caaatgacac agagaggatt tatcaagaga gatttttttg 1320 aatgcctcat cgtcgaatca gatccgcacg cattattaaa ggccatgcag acatggacac 1380 ctccagcccc aaaatggtaa attaattcta gagtcgatcc ccgggttcgc cagcaatgac 1440 taccggcagc c 1451 <210> 72 <211> 1442 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA fragment tmr-LOG (IPT-LOG) <400> 72 cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgg 60 atttaagact gattttcggt ccaacctgta cgggaaagac ttccaccgca gttgcgttag 120 ctcaacagac aggcctcccg gttttatcat tggatcgggt tcagtgttgc ccgcaactgt 180 ccacgggctc tggccgaccc acagtggagg aactaaaagg aacatcgcgg ttatatttgg 240 atgaccgacc attggtgaaa ggtataatag ctgcgaaaca ggcacacgag agattgatgg 300 gcgaagtgta caactatgaa gcgcatgggg ggctgatttt ggagggagga agtatctcac 360 tgttaaaatg catggctcaa tcaagctatt ggagcgctga tttccgctgg catattataa 420 gacacgaatt ggcagatgaa gaaacattta tgaatgtcgc gaaagcacgg gtaaagcaga 480 tgttacgtcc tgccgcaggc cttagcatca ttcaagagtt agtggatctt tggaaggagc 540 cgcgccttag acctatcctg aaagaaatag atggctatcg ttacgctatg ctctttgcat 600 ctcagaatca gattacttct gatatgctgc tgcaacttga cgcggacatg gaagacaaac 660 tcattcatgg tattgcccaa gaatacctta ttcatgcgag gcgccaagaa caaaagtttc 720 ccagagtaaa cgccgccgcc tatgacgggt ttgaaggcca tccgtttgga atgtattaaa 780 aaagagggga gggaaacatt atgatgacat cgctttttga cgcgcctacg cttcaacgcg 840 taacggtttt cactgggagc gccttgggct cctctagtct ttatactcag gctgctcaaa 900 ccctggctaa aaccgcggta gaccgaggga ttgatctggt ttatggcggt ggaaaagtcg 960 gcctcatggg tattgttgct gatgcattcc ttgaaagcgg gggtgaggca ttcggcgtga 1020 taacagagtc actgatgaaa ggagaattag gccatgagaa actgacggag ttggaaatcg 1080 tgcccgacat gcatattcgt aaaaggcgga tggcggaact tggggatgga ttcattgcga 1140 tgcctggagg agccggcacc ctggaagaac tgtttgaagt ctggacatgg cagcagttag 1200 gaattcatca aaagccggtt gcactctatg acgtcgatgg cttctggcaa ccgttattgg 1260 aaatgttgga acaaatgaca cagagaggat ttatcaagag agattttttt gaatgcctca 1320 tcgtcgaatc agatccgcac gcattattaa aggccatgca gacatggaca cctccagccc 1380 caaaatggta aattaattct agagtcgatc cccgggttcg ccagcaatga ctaccggcag 1440 cc 1442 <210> 73 <211> 958 <212> DNA <213> Artificial Sequence <220> <223> Erythromycin selectable marker <400> 73 gagggattcg tcatgttggt attccaaatg cgttatgtag ataaaacatc tactgttttg 60 aaacagacta aaaacagtga ttacgcagat aaataaatac gttagattaa ttcctaccag 120 tgactaatct tatgactttt taaacagata actaaaatta caaacaaatc gtttaacttc 180 tgtatttgtt tatagatgta atcacttcag gagtgattac atgaacaaaa atataaaata 240 ttctcaaaac tttttaacga gtgaaaaagt actcaaccaa ataataaaac aattgaattt 300 aaaagaaacc gataccgttt acgaaattgg aacaggtaaa gggcatttaa cgacgaaact 360 ggctaaaata agtaaacagg taacgtctat tgaattagac agtcatctat tcaacttatc 420 gtcagaaaaa ttaaaactga acattcgtgt cactttaatt caccaagata ttctacagtt 480 tcaattccct aacaaacaga ggtataaaat tgttgggaat attccttacc atttaagcac 540 acaaattatt aaaaaagtgg tttttgaaag ccatgcgtct gacatctatc tgattgttga 600 agaaggattc tacaagcgta ccttggatat tcaccgaaca ctagggttgc tcttgcacac 660 tcaagtctcg attcagcaat tgcttaagct gccagcggaa tgctttcatc ctaaaccaaa 720 agtaaacagt gtcttaataa aacttacccg ccataccaca gatgttccag ataaatattg 780 gaagctatat acgtactttg tttcaaaatg ggtcaatcga gaatatcgtc aactgtttac 840 taaaaatcag tttcatcaag caatgaaaca cgccaaagta aacaatttaa gtaccgttac 900 ttatgagcaa gtattgtcta tttttaatag ttatctatta tttaacggga ggaaataa 958 <210> 74 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer TwistBio For <400> 74 gaagtgccat tccgcctgac ct 22 <210> 75 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer TwistBio Rev <400> 75 cactgagcct ccacctagcc t 21 <210> 76 <211> 1680 <212> DNA <213> Artificial Sequence <220> <223> Initial fragment amyE <400> 76 gaagtgccat tccgcctgac cttcgccttt gcggtagtgg tgcttacgat gtacgacagg 60 gggattcccc atacattctt cgcttggctg aaaatgattc ttctttttat cgtctgcggc 120 ggcgttctgt ttctgcttcg gtatgtgatt gtgaagctgg cttacagaag agcggtaaaa 180 gaagaaataa aaaagaaatc atcttttttg tttggaaagc gagggaagcg ttcacagttt 240 cgggcagctt tttttatagg aacattgatt tgtattcact ctgccaagtt gttttgatag 300 agtgattgtg ataattttaa atgtaagcgt taacaaaatt ctccagtctt cacatcggtt 360 tgaaaggagg aagcggaaga atgaagtaag agggattttt gactccgaag taagtcttca 420 aaaaatcaaa taaggagtgt caagaatgtt tgcaaaacga ttcaaaacct ctttactgcc 480 gttattcgct ggatttttat tgctgtttca tttggttctg gcaggaccgg cggctgcgag 540 tgctgaaacg gcgaacaaat cgaatgagct tacagcaccg tcgatcaaaa gcggaaccat 600 tcttcatgca tggaattggt cgttcaatac gttaaaacac aatatgaagg atattcatga 660 tgcaggatat acagccattc agacatctcc gattaaccaa gtaaaggaag ggaatcaagg 720 agataaaagc atgtcgaact ggtactggct gtatcagccg acatcgtatc aaattggcaa 780 ccgttactta ggtactgaac aagaatttaa agaaatgtgt gcagccgctg aagaatatgg 840 cataaaggtc attgttgacg cggtcatcaa tcataccacc agtgattatg ccgcgatttc 900 caatgaggtt aagagtattc caaactggac acatggaaac acacaaatta aaaactggtc 960 tgatcgatgg gatgtcacgc agaattcatt gctcgggctg tatgactgga atacacaaaa 1020 tacacaagta cagtcctatc tgaaacggtt cttagacagg gcattgaatg acggggcaga 1080 cggttttcga tttgatgccg ccaaacatat agagcttcca gatgatggca gttacggcag 1140 tcaattttgg ccgaatatca caaatacatc tgcagagttc caatacggag aaatcctgca 1200 ggatagtgcc tccagagatg ctgcttatgc gaattatatg gatgtgacag cgtctaacta 1260 tgggcattcc ataaggtccg ctttaaagaa tcgtaatctg ggcgtgtcga atatctccca 1320 ctatgcatct gatgtgtctg cggacaagct agtgacatgg gtagagtcgc atgatacacg 1380 ggtgcgcatg atcgtatggt tcactgtcca ccaaccaaaa ctgtgctcag taccgccaat 1440 atttctccct tggggggtac aaagaggtgt ccctagaaga gatccacgct gtgtaaaaat 1500 tttacaaaaa ggtattgact ttccctacag ggtgtgtaat aatttaatta caggcggggg 1560 caaccccgct cagtacctag agcgtaaaag aggggaggga aacactagtt ggcttcgttg 1620 ggattctccg gtgatgctga tttcgctgcg tatgctgcga ggctaggtgg aggctcagtg 1680 <210> 77 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer For for end fragment with erythromycin selectable marker <400> 77 aaatctagaa attaagaagg agggattcgt ca 32 <210> 78 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer Rev for end fragment with erythromycin selectable marker <400> 78 cactgagcct ccacctagcc taatactcat ggcttgtgac cgct 44 <210> 79 <211> 1911 <212> DNA <213> Artificial Sequence <220> <223> End fragment containing erythromycin selectable marker <400> 79 gaagtgccat tccgcctgac ctcacggtag tcattgctgg cgaacgcgtc tagaaattaa 60 gaaggaggga ttcgtcatgt tggtattcca aatgcgttat gtagataaaa catctactgt 120 tttgaaacag actaaaaaca gtgattacgc agataaataa atacgttaga ttaattccta 180 ccagtgacta atcttatgac tttttaaaca gataactaaa attacaaaca aatcgtttaa 240 cttctgtatt tgtttataga tgtaatcact tcaggagtga ttacatgaac aaaaatataa 300 aatattctca aaacttttta acgagtgaaa aagtactcaa ccaaataata aaacaattga 360 atttaaaaga aaccgatacc gtttacgaaa ttggaacagg taaagggcat ttaacgacga 420 aactggctaa aataagtaaa caggtaacgt ctattgaatt agacagtcat ctattcaact 480 tatcgtcaga aaaattaaaa ctgaacattc gtgtcacttt aattcaccaa gatattctac 540 agtttcaatt ccctaacaaa cagaggtata aaattgttgg gaatattcct taccatttaa 600 gcacacaaat tattaaaaaa gtggtttttg aaagccatgc gtctgacatc tatctgattg 660 ttgaagaagg attctacaag cgtaccttgg atattcaccg aacactaggg ttgctcttgc 720 acactcaagt ctcgattcag caattgctta agctgccagc ggaatgcttt catcctaaac 780 caaaagtaaa cagtgtctta ataaaactta cccgccatac cacagatgtt ccagataaat 840 attggaagct atatacgtac tttgtttcaa aatgggtcaa tcgagaatat cgtcaactgt 900 ttactaaaaa tcagtttcat caagcaatga aacacgccaa agtaaacaat ttaagtaccg 960 ttacttatga gcaagtattg tctattttta atagttatct attatttaac gggaggaaat 1020 aattctatga gtcgcttttg taaatttgga aagttacacg ttactaaagg gaatgtagat 1080 ggatcctttt aatggagtgt acgccaagcg cggtcaattg gcataacgtc aacaaggcaa 1140 agcgcccggg catgaatctg ctgtcatcca tgcaaatgat tgcccacggc tcggacagcg 1200 ttctctattt ccaataccgc aaatcacggg ggtcatcaga aaaattacac ggagcggttg 1260 tggatcatga caatagcccg aagaaccgcg tctttcaaga agtggccaag gtaggcgaga 1320 cattggaacg gctgtccgaa gttgtcggaa cgaagaggcc ggctcaaacc gcgattttat 1380 atgactggga aaatcattgg gcgctcgagg atgctcaggg gtttgcgaag gcgacaaaac 1440 gttatccgca aacgcttcag cagcattacc gcacattctg ggaacacgat atccctgtcg 1500 acgtcatcac gaaagaacaa gacttttcac catataaact gctgatcgtc ccgatgctgt 1560 atttaatcag cgaggacacc gtttcccgtt taaaagcgtt tacggctgac ggcggcacct 1620 tagtcatgac gtatatcagc ggggttgtga atgagcatga cttaacatac acaggcggat 1680 ggcatccgga tcttcaagct atatttggag ttgagcctct tgaaacggac accctgtatc 1740 cgaaggatcg aaacgctgtc agctaccgca gccaaatata tgaaatgaag gattatgcaa 1800 ccgtgattga tgtaaagaca gcttcagtgg aagcggtgta tcaagaagat ttttatgcgc 1860 gcacgccagc ggtcacaagc catgagtatt aggctaggtg gaggctcagt g 1911 <210> 80 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer For for IPT-LOG operon <400> 80 gcggtagtgg tgcttacgat 20 <210> 81 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer Rev for IPT-LOG operon <400> 81 aggatccatc tacattccct ttagt 25 <210> 82 <211> 3968 <212> DNA <213> Artificial Sequence <220> <223> Complete synthetic trans-zeatin operon containing IPT-LOG (with TZS) <400> 82 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgac 2340 atcgcttttt gacgcgccta cgcttcaacg cgtaacggtt ttcactggga gcgccttggg 2400 ctcctctagt ctttatactc aggctgctca aaccctggct aaaaccgcgg tagaccgagg 2460 gattgatctg gtttatggcg gtggaaaagt cggcctcatg ggtattgttg ctgatgcatt 2520 ccttgaaagc gggggtgagg cattcggcgt gataacagag tcactgatga aaggagaatt 2580 aggccatgag aaactgacgg agttggaaat cgtgcccgac atgcatattc gtaaaaggcg 2640 gatggcggaa cttggggatg gattcattgc gatgcctgga ggagccggca ccctggaaga 2700 actgtttgaa gtctggacat ggcagcagtt aggaattcat caaaagccgg ttgcactcta 2760 tgacgtcgat ggcttctggc aaccgttatt ggaaatgttg gaacaaatga cacagagagg 2820 atttatcaag agagattttt ttgaatgcct catcgtcgaa tcagatccgc acgcattatt 2880 aaaggccatg cagacatgga cacctccagc cccaaaatgg taaattaatt ctagaaatta 2940 agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3000 ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3060 accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3120 acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3180 aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3240 aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3300 aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3360 ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3420 cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3480 agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3540 gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3600 cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3660 ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3720 tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 3780 tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 3840 gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 3900 taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 3960 tggatcct 3968 <210> 83 <211> 3968 <212> DNA <213> Artificial Sequence <220> <223> Complete synthetic trans-zeatin operon containing IPT-LOG (with TMR) <400> 83 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgac 2340 atcgcttttt gacgcgccta cgcttcaacg cgtaacggtt ttcactggga gcgccttggg 2400 ctcctctagt ctttatactc aggctgctca aaccctggct aaaaccgcgg tagaccgagg 2460 gattgatctg gtttatggcg gtggaaaagt cggcctcatg ggtattgttg ctgatgcatt 2520 ccttgaaagc gggggtgagg cattcggcgt gataacagag tcactgatga aaggagaatt 2580 aggccatgag aaactgacgg agttggaaat cgtgcccgac atgcatattc gtaaaaggcg 2640 gatggcggaa cttggggatg gattcattgc gatgcctgga ggagccggca ccctggaaga 2700 actgtttgaa gtctggacat ggcagcagtt aggaattcat caaaagccgg ttgcactcta 2760 tgacgtcgat ggcttctggc aaccgttatt ggaaatgttg gaacaaatga cacagagagg 2820 atttatcaag agagattttt ttgaatgcct catcgtcgaa tcagatccgc acgcattatt 2880 aaaggccatg cagacatgga cacctccagc cccaaaatgg taaattaatt ctagaaatta 2940 agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3000 ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3060 accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3120 acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3180 aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3240 aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3300 aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3360 ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3420 cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3480 agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3540 gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3600 cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3660 ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3720 tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 3780 tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 3840 gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 3900 taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 3960 tggatcct 3968 <210> 84 <211> 1080 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA fragment of dxs part1 <400> 84 gaagtgccat tccgcctgac ctcgcagcat acgcagcgaa atcagcatca ccggagaatc 60 ccaacgaagc caactagtat ggacttgttg tccattcaag acccgtcttt cctaaagaat 120 atgagcattg acgagcttga aaaattgtcc gatgagatcc gccaatttct catcacatct 180 ctatcggcct cgggcggaca cattggaccg aatctggggg tcgtggaact gacagtagcc 240 ctccacaagg agttcaactc acccaaagac aaatttctct gggacgtggg gcaccaaagc 300 tacgttcata aattgcttac tggtcgtggc aaagagttcg ccacattgcg ccagtacaaa 360 ggactctgcg gattccctaa acgctcggaa tccgagcacg atgtgtggga aacaggtcat 420 tcttctactt ctctcagcgg cgccatggga atggccgctg cacgagatat taaagggact 480 gatgagtaca taatcccaat aataggtgac ggcgctttaa caggaggaat ggccctagag 540 gccttgaacc acatagggga tgagaagaaa gatatgatag tcattttgaa tgataatgag 600 atgtctattg ctcccaacgt tggagcaata catagcatgt tagggcggtt acgtactgca 660 ggaaagtacc agtgggtaaa agatgaactt gaatacctct tcaagaagat acccgctgta 720 ggaggcaagc ttgcagccac ggccgagaga gtgaaggatt ctcttaaata tatgttggtt 780 tcagggatgt tctttgaaga attgggattc acgtaccttg gtccggttga cggccattct 840 taccacgagt taattgaaaa tttacaatac gcgaaaaaaa cgaaggggcc tgttctgctg 900 cacgttatta ccaaaaaagg aaaaggttat aaacctgcgg aaaccgatac aattggcacg 960 tggcacggca ccgggcctta taaaatcaac acgggggact ttgtcaagcc gaaagctgcc 1020 gcgcctagtt ggtccggcct ggttagtggg acggtacagc gaatggcagg ctaggtggag 1080 <210> 85 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA fragment of dxs part2 <400> 85 gaagtgccat tccgcctgac ctaatcaaca cgggggactt tgtcaagccg aaagctgccg 60 cgcctagttg gtccggcctg gttagtggga cggtacagcg aatggcccgg gaagatggga 120 ggattgtcgc tatcacaccg gcaatgccag taggtagcaa gttagaaggt tttgcgaaag 180 aatttccgga taggatgttt gacgtaggta ttgctgagca gcatgcggcg acgatggctg 240 cggcaatggc aatgcagggc atgaagcctt ttttagctat ttattcaaca tttctgcaaa 300 gagcgtatga ccaagtggta catgacattt gtcggcaaaa tgctaatgtc tttattggga 360 ttgatcgcgc agggttagtg ggtgcagacg gggaaacgca tcaaggagtg tttgacatcg 420 cgtttatgcg acatatccca aatatggtcc ttatgatgcc aaaagacgaa aacgagggtc 480 aacacatggt gcatacagct cttagttatg acgaaggacc tatcgcgatg agatttccga 540 gagggaatgg attaggcgtc aaaatggatg agcagcttaa aacaattccg attggaacat 600 gggaagtctt acgtccagga aatgacgcgg ttatccttac atttggcact accattgaga 660 tggcgattga ggcagcagaa gaactccaga aggagggcct gtcagtccgt gttgttaatg 720 cgagatttat taaaccgatt gacgaaaaga tgatgaaaag tatcctgaaa gaaggcctgc 780 cgatacttac catcgaggaa gctgttctgg aaggaggatt tggctcatca atccttgaat 840 ttgcacatga tcagggcgaa tatcacacac cgatcgatcg aatgggcatc ccggatcgat 900 ttatcgagca tggctccgtt acagcactgc ttgaagagat cggcttaacg aaacagcagg 960 tggcaaacag aatcaggtta cttatgccgc cgaagacaca taagggcatc ggctcataaa 1020 aaagagggga gggaaacatt aatgacgacc tggctaacga gtctcgccga tctaggctag 1080 gtggaggctc agtg 1094 <210> 86 <211> 2040 <212> DNA <213> Artificial Sequence <220> <223> Joined synthetic gene dxs complete sequence <400> 86 gaagtgccat tccgcctgac ctcgcagcat acgcagcgaa atcagcatca ccggagaatc 60 ccaacgaagc caactagtat ggacttgttg tccattcaag acccgtcttt cctaaagaat 120 atgagcattg acgagcttga aaaattgtcc gatgagatcc gccaatttct catcacatct 180 ctatcggcct cgggcggaca cattggaccg aatctggggg tcgtggaact gacagtagcc 240 ctccacaagg agttcaactc acccaaagac aaatttctct gggacgtggg gcaccaaagc 300 tacgttcata aattgcttac tggtcgtggc aaagagttcg ccacattgcg ccagtacaaa 360 ggactctgcg gattccctaa acgctcggaa tccgagcacg atgtgtggga aacaggtcat 420 tcttctactt ctctcagcgg cgccatggga atggccgctg cacgagatat taaagggact 480 gatgagtaca taatcccaat aataggtgac ggcgctttaa caggaggaat ggccctagag 540 gccttgaacc acatagggga tgagaagaaa gatatgatag tcattttgaa tgataatgag 600 atgtctattg ctcccaacgt tggagcaata catagcatgt tagggcggtt acgtactgca 660 ggaaagtacc agtgggtaaa agatgaactt gaatacctct tcaagaagat acccgctgta 720 ggaggcaagc ttgcagccac ggccgagaga gtgaaggatt ctcttaaata tatgttggtt 780 tcagggatgt tctttgaaga attgggattc acgtaccttg gtccggttga cggccattct 840 taccacgagt taattgaaaa tttacaatac gcgaaaaaaa cgaaggggcc tgttctgctg 900 cacgttatta ccaaaaaagg aaaaggttat aaacctgcgg aaaccgatac aattggcacg 960 tggcacggca ccgggcctta taaaatcaac acgggggact ttgtcaagcc gaaagctgcc 1020 gcgcctagtt ggtccggcct ggttagtggg acggtacagc gaatggcccg ggaagatggg 1080 aggattgtcg ctatcacacc ggcaatgcca gtaggtagca agttagaagg ttttgcgaaa 1140 gaatttccgg ataggatgtt tgacgtaggt attgctgagc agcatgcggc gacgatggct 1200 gcggcaatgg caatgcaggg catgaagcct tttttagcta tttattcaac atttctgcaa 1260 agagcgtatg accaagtggt acatgacatt tgtcggcaaa atgctaatgt ctttattggg 1320 attgatcgcg cagggttagt gggtgcagac ggggaaacgc atcaaggagt gtttgacatc 1380 gcgtttatgc gacatatccc aaatatggtc cttatgatgc caaaagacga aaacgagggt 1440 caacacatgg tgcatacagc tcttagttat gacgaaggac ctatcgcgat gagatttccg 1500 agagggaatg gattaggcgt caaaatggat gagcagctta aaacaattcc gattggaaca 1560 tgggaagtct tacgtccagg aaatgacgcg gttatcctta catttggcac taccattgag 1620 atggcgattg aggcagcaga agaactccag aaggagggcc tgtcagtccg tgttgttaat 1680 gcgagattta ttaaaccgat tgacgaaaag atgatgaaaa gtatcctgaa agaaggcctg 1740 ccgatactta ccatcgagga agctgttctg gaaggaggat ttggctcatc aatccttgaa 1800 tttgcacatg atcagggcga atatcacaca ccgatcgatc gaatgggcat cccggatcga 1860 tttatcgagc atggctccgt tacagcactg cttgaagaga tcggcttaac gaaacagcag 1920 gtggcaaaca gaatcaggtt acttatgccg ccgaagacac ataagggcat cggctcataa 1980 aaaagagggg agggaaacat taatgacgac ctggctaacg agtctcgccg atctaggcta 2040 <210> 87 <211> 768 <212> DNA <213> Artificial Sequence <220> <223> Spectinomycin selectable marker <400> 87 gtgaggcgaa tatatttgaa tacatacgaa caaatcaata aagtgaaaaa aatacttcgg 60 aaacatttaa aaaataacct tattggtact tacatgtttg gatcaggagt tgagagtgga 120 ctcaaaccaa atagtgatct tgacttttta gtcgtcgtat ctgaaccatt gacagatcaa 180 agtaaagaaa tacttataca aaaaattaga cctatttcaa aaaaaatagg agataaaagc 240 aacttacgat atattgaatt aacaattatt attcagcaag aaatggtacc gtggaatcat 300 cctcccaaac aagaatttat ttatggagaa tggttacaag agctttatga acaaggatac 360 attcctcaga aggaattaaa ttcagattta accataatgc tttaccaagc aaaacgaaaa 420 aataaaagaa tatacggaaa ttatgactta gaggaattac tacctgatat tccattttct 480 gatgtgagaa gagccattat ggattcgtca gaggaactta tagataatta tcaggatgat 540 gaaaccaact ctatattaac tttatgccgc atgattttaa ctatggacac gggtaaaatc 600 ataccaaaag atattgcggg aaatgcagtg gctgaatctt ctccattaga acatagggag 660 agaattttgt tagcagttcg tagttatctt ggagagaata ttgaatggac taatgaaaat 720 gtaaatctta cgataaacta tcttaataac cgccttaaga aactttaa 768 <210> 88 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> Initial fragment lacA <400> 88 gaagtgccat tccgcctgac ctgcctttta atcccggcaa cagcttaatc agtacatcca 60 tcattccgaa gcatccgaca ttcgatcatt acaaggaatt atttgcgggc aaggaaagcc 120 ttcaatatgt gcagtggtat gtcaactcta tgaagatcag cctgtttaca atggcagggt 180 ctttgctctg tgtgacgttt acggcctatg cgttttcgcg ctttcggttt aaagggagga 240 aatacgcttt aacgctcttt ttattgctgc agatgattcc tcagttttca gctttaattg 300 ccttgtttgt gctggcgcaa atcttgggaa tgatcaatag ccactggctg ctaatcttgc 360 tttatatcgg cggcctgatc ccgatgaata cgtatttgat gaaagggtac atggattcca 420 ttccgatgga tttagacgaa agcgccaaga ttgacggagc cagcagcacc agaatcttct 480 tccagatcat tctgccatta tcaaaaccga tggcggcagt cgtggccatg aacggcttta 540 ccggtccgct cggagatttt gtgctgtcct caaccatatt gagaacgcct gaatcatata 600 cattgcccgt cggtctattc aatttagtga atgatgtcat gggggccagc tatacgacat 660 ttgcggccgg agccctgctt atcagcatac cggttgccgt catctttatt atgctgcaaa 720 agaattttgt gtccggatta accgcaggcg gaacgaaggg ctaagagaac aaggaggaga 780 atgtgatgtc aaagcttgaa aaaacgcacg taacaaaagc aaaatttatg ctccatgggg 840 gagactacaa ccccgatcag tggctggatc ggcccgatat tttagctgac gatatcaaac 900 tgatgaagct ttctcatacg aatacgtttt ctgtcggcat ttttgcatgg agcgcacttg 960 agccggagga gggcgtatat caatttgaat ggctggatga tatttttgag cggattcaca 1020 gtataggcgg ccgggtcata ttagcaacgc cgagcggagc ccgtccggcc tggctgtcgc 1080 aaacctatcc ggaagttttg cgcgtcaatg cctcccgcgt caaacagctg cacggcggaa 1140 ggcacaacca ctgcctcaca tctaaagtct accgagaaaa aacacggcac atcaaccgct 1200 acgggtgcgc atgatcgtat ggttcactgt ccaccaacca aaactgtgct cagtaccgcc 1260 aatatttctc ccttgggggg tacaaagagg tgtccctaga agagatccac gctgtgtaaa 1320 aattttacaa aaaggtattg actttcccta cagggtgtgt aataatttaa ttacaggcgg 1380 gggcaacccc gctcagtacc tagagcgtaa aagaggggag ggaaacacta gttggcttcg 1440 ttgggattct ccggtgatgc tgatttcgct gcgtatgctg cgaggctagg tggaggctca 1500 gtg 1503 <210> 89 <211> 2172 <212> DNA <213> Artificial Sequence <220> <223> End fragment with spectinomycin selectable marker <400> 89 gaagtgccat tccgcctgac ctcacggtag tcattgctgg cgaacgcgtc tagagctccg 60 gcataaaatt aactaaaata attattatgt agataaaaaa tttagaagcc aatgaaatct 120 ataaataaac taaattaagt ttatttaatt aacaactatg gatataaaat aggtactaat 180 caaaatagtg aggcgaatat atttgaatac atacgaacaa atcaataaag tgaaaaaaat 240 acttcggaaa catttaaaaa ataaccttat tggtacttac atgtttggat caggagttga 300 gagtggactc aaaccaaata gtgatcttga ctttttagtc gtcgtatctg aaccattgac 360 agatcaaagt aaagaaatac ttatacaaaa aattagacct atttcaaaaa aaataggaga 420 taaaagcaac ttacgatata ttgaattaac aattattatt cagcaagaaa tggtaccgtg 480 gaatcatcct cccaaacaag aatttattta tggagaatgg ttacaagagc tttatgaaca 540 aggatacatt cctcagaagg aattaaattc agatttaacc ataatgcttt accaagcaaa 600 acgaaaaaat aaaagaatat acggaaatta tgacttagag gaattactac ctgatattcc 660 attttctgat gtgagaagag ccattatgga ttcgtcagag gaacttatag ataattatca 720 ggatgatgaa accaactcta tattaacttt atgccgcatg attttaacta tggacacggg 780 taaaatcata ccaaaagata ttgcgggaaa tgcagtggct gaatcttctc cattagaaca 840 tagggagaga attttgttag cagttcgtag ttatcttgga gagaatattg aatggactaa 900 tgaaaatgta aatcttacga taaactatct taataaccgc cttaagaaac tttaacccgg 960 gcgcgttgct ttcgatgaag ttttaccgcc atcaccagac cctcaatcgt atgtgtttac 1020 tgccaatact ggagacagca cggtttcggt tattgatgca gatttaaaca ctgttgtaaa 1080 aacaatccct ttttctgacg tgccaactaa tctaggcgtt actttcgata aagcattcac 1140 gtatgtcctc catggaaata ccaaccttgt ctcagtgatt gataataaaa cattaaccat 1200 cataaatacc attactgttg gaggagggcc gagaaaaatc gaatttgatc caacagatga 1260 gttcgcatac gtgatggccg ccggatctat atatgtgatt aacacggcct ctcaatcggt 1320 cattgatgtc attccgatac ccggcgcttt agactttgct cttgatccga atggacagta 1380 tgtctatacc gctaatggaa gcagttggtc ggttgataaa tatgatgtaa atactgggca 1440 gttggtagaa agtatcatag atacatttga atttcccagt ttaattacaa ctccttacgc 1500 tggaaatttt gcgtacgtat tgaatggtga gctgtggccg aaaggtgtaa cggagattag 1560 tttgtcacca ttaagcaggg gaggggactt cagccgttta tttgaaacgc tgaggacgat 1620 tgtattttct ctcgatagta ctagagctta ttttcaagag ccatatagtg aaccgtttct 1680 catcaataac ttatacgtag ttaatacggc cagacagagg atcattgcaa acgtgtctct 1740 ccccggcgcc tttgacctcg ccgtaacgcc ggacaaacag tatatttatg cggcacagcc 1800 caacgacaat gctgtgaccg tgtaccgcac aagtgattat acagccgtga cggtgattcc 1860 ggttggcgcg ggtccgtctg cgattgcgat gtagctattt tatagatcaa gagaagcggt 1920 gctgtgataa gagaatcgtt tataaataaa tgatccgatt tgctgaatgg cagccaggat 1980 aatcagaaac agcagttcac ttatagagaa actgagcatc caccaaatcc cggctgctgc 2040 cagtgctccc gcaaacactt ttctgaacag gctgccgtgc cggaaaagct gccgcaaata 2100 cgttcgcatg caaaacaata aatacaggat cagtagcatc gcaagtccca taggctaggt 2160 ggaggctcag tg 2172 <210> 90 <211> 4245 <212> DNA <213> Artificial Sequence <220> <223> Complete synthetic dxs operon <400> 90 taatcccggc aacagcttaa tcagtacatc catcattccg aagcatccga cattcgatca 60 ttacaaggaa ttatttgcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc 120 tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta 180 tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct 240 gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg 300 aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa 360 tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa 420 gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc 480 gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc 540 ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt 600 gaatgatgtc atgggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat 660 accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg 720 cggaacgaag ggctaagaga acaaggagga gaatgtgatg tcaaagcttg aaaaaacgca 780 cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga 840 tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt 900 ttctgtcggc atttttgcat ggagcgcact tgagccggag gagggcgtat atcaatttga 960 atggctggat gatatttttg agcggattca cagtataggc ggccgggtca tattagcaac 1020 gccgagcgga gcccgtccgg cctggctgtc gcaaacctat ccggaagttt tgcgcgtcaa 1080 tgcctcccgc gtcaaacagc tgcacggcgg aaggcacaac cactgcctca catctaaagt 1140 ctaccgagaa aaaacacggc acatcaaccg ctacgggtgc gcatgatcgt atggttcact 1200 gtccaccaac caaaactgtg ctcagtaccg ccaatatttc tcccttgggg ggtacaaaga 1260 ggtgtcccta gaagagatcc acgctgtgta aaaattttac aaaaaggtat tgactttccc 1320 tacagggtgt gtaataattt aattacaggc gggggcaacc ccgctcagta cctagagcgt 1380 aaaagagggg agggaaacac tagtatggac ttgttgtcca ttcaagaccc gtctttccta 1440 aagaatatga gcattgacga gcttgaaaaa ttgtccgatg agatccgcca atttctcatc 1500 acatctctat cggcctcggg cggacacatt ggaccgaatc tgggggtcgt ggaactgaca 1560 gtagccctcc acaaggagtt caactcaccc aaagacaaat ttctctggga cgtggggcac 1620 caaagctacg ttcataaatt gcttactggt cgtggcaaag agttcgccac attgcgccag 1680 tacaaaggac tctgcggatt ccctaaacgc tcggaatccg agcacgatgt gtgggaaaca 1740 ggtcattctt ctacttctct cagcggcgcc atgggaatgg ccgctgcacg agatattaaa 1800 gggactgatg agtacataat cccaataata ggtgacggcg ctttaacagg aggaatggcc 1860 ctagaggcct tgaaccacat aggggatgag aagaaagata tgatagtcat tttgaatgat 1920 aatgagatgt ctattgctcc caacgttgga gcaatacata gcatgttagg gcggttacgt 1980 actgcaggaa agtaccagtg ggtaaaagat gaacttgaat acctcttcaa gaagataccc 2040 gctgtaggag gcaagcttgc agccacggcc gagagagtga aggattctct taaatatatg 2100 ttggtttcag ggatgttctt tgaagaattg ggattcacgt accttggtcc ggttgacggc 2160 cattcttacc acgagttaat tgaaaattta caatacgcga aaaaaacgaa ggggcctgtt 2220 ctgctgcacg ttattaccaa aaaaggaaaa ggttataaac ctgcggaaac cgatacaatt 2280 ggcacgtggc acggcaccgg gccttataaa atcaacacgg gggactttgt caagccgaaa 2340 gctgccgcgc ctagttggtc cggcctggtt agtgggacgg tacagcgaat ggcccgggaa 2400 gatgggagga ttgtcgctat cacaccggca atgccagtag gtagcaagtt agaaggtttt 2460 gcgaaagaat ttccggatag gatgtttgac gtaggtattg ctgagcagca tgcggcgacg 2520 atggctgcgg caatggcaat gcagggcatg aagccttttt tagctattta ttcaacattt 2580 ctgcaaagag cgtatgacca agtggtacat gacatttgtc ggcaaaatgc taatgtcttt 2640 attgggattg atcgcgcagg gttagtgggt gcagacgggg aaacgcatca aggagtgttt 2700 gacatcgcgt ttatgcgaca tatcccaaat atggtcctta tgatgccaaa agacgaaaac 2760 gagggtcaac acatggtgca tacagctctt agttatgacg aaggacctat cgcgatgaga 2820 tttccgagag ggaatggatt aggcgtcaaa atggatgagc agcttaaaac aattccgatt 2880 ggaacatggg aagtcttacg tccaggaaat gacgcggtta tccttacatt tggcactacc 2940 attgagatgg cgattgaggc agcagaagaa ctccagaagg agggcctgtc agtccgtgtt 3000 gttaatgcga gatttattaa accgattgac gaaaagatga tgaaaagtat cctgaaagaa 3060 ggcctgccga tacttaccat cgaggaagct gttctggaag gaggatttgg ctcatcaatc 3120 cttgaatttg cacatgatca gggcgaatat cacacaccga tcgatcgaat gggcatcccg 3180 gatcgattta tcgagcatgg ctccgttaca gcactgcttg aagagatcgg cttaacgaaa 3240 cagcaggtgg caaacagaat caggttactt atgccgccga agacacataa gggcatcggc 3300 tcataaatta attctagagc tccggcataa aattaactaa aataattatt atgtagataa 3360 aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac 3420 tatggatata aaataggtac taatcaaaat agtgaggcga atatatttga atacatacga 3480 acaaatcaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac 3540 ttacatgttt ggatcaggag ttgagagtgg actcaaacca aatagtgatc ttgacttttt 3600 agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag 3660 acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat 3720 tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga 3780 atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt 3840 aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt 3900 agaggaatta ctacctgata ttccattttc tgatgtgaga agagccatta tggattcgtc 3960 agaggaactt atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg 4020 catgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt 4080 ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct 4140 tggagagaat attgaatgga ctaatgaaaa tgtaaatctt acgataaact atcttaataa 4200 ccgccttaag aaactttaac ccgggcgcgt tgctttcgat gaagt 4245 <210> 91 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer For for dxs operon <400> 91 taatcccggc aacagcttaa tcagtac 27 <210> 92 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer Rev for dxs operon <400> 92 acttcatcga aagcaacgcg 20 <210> 93 <211> 399 <212> PRT <213> Rhodococcus fascians <400> 93 Met Ala Gly Thr Ala Asp Leu Pro Leu Glu Met Arg Arg Asn Gly Leu 1 5 10 15 Asn Pro Thr Glu Glu Leu Ala Gln Val Arg Asp Arg Asp Gly Val Ile 20 25 30 Pro Val Gly Glu Leu Tyr Gly Ala Pro Ala Phe Leu Val Cys Arg Tyr 35 40 45 Glu Asp Val Arg Arg Ile Phe Ala Asp Ser Asn Arg Phe Ser Asn Ala 50 55 60 His Thr Pro Met Phe Ala Ile Pro Ser Gly Gly Asp Val Ile Glu Asp 65 70 75 80 Glu Leu Ala Ala Met Arg Ala Gly Asn Leu Ile Gly Leu Asp Pro Pro 85 90 95 Asp His Thr Arg Leu Arg His Ile Leu Ala Ala Glu Phe Ser Val His 100 105 110 Arg Leu Ser Arg Leu Gln Pro Arg Ile Ala Glu Ile Val Asp Ser Ala 115 120 125 Leu Asp Gly Leu Glu Gln Ala Gly Gln Pro Ala Asp Leu Met Asp Arg 130 135 140 Tyr Ala Leu Pro Val Ser Leu Leu Val Leu Cys Glu Leu Leu Gly Val 145 150 155 160 Pro Tyr Ala Asp Arg Asp Glu Leu Arg Asp Arg Thr Ala Arg Leu Leu 165 170 175 Asp Leu Ser Ala Ser Ala Glu Gln Arg Ala Val Ala Gln Arg Glu Asp 180 185 190 Arg Arg Tyr Met Ala Thr Leu Val Thr Arg Ala Gln Glu Gln Pro Gly 195 200 205 Asp Asp Leu Leu Gly Ile Leu Ala Arg Lys Ile Gly Asp Asn Leu Ser 210 215 220 Thr Asp Glu Leu Ile Ser Ile Ile Ser Leu Ile Met Leu Gly Gly His 225 230 235 240 Glu Thr Thr Ala Ser Met Ile Gly Leu Ser Val Leu Ala Leu Leu His 245 250 255 His Pro Glu Gln Ala Ala Met Met Ile Glu Asp Pro Asn Cys Val Asn 260 265 270 Ser Gly Ile Glu Glu Leu Leu Arg Trp Leu Ser Val Ala His Ser Gln 275 280 285 Pro Pro Arg Met Ala Val Thr Glu Val Gln Ile Ala Gly Val Thr Ile 290 295 300 Pro Ala Gly Ser Phe Val Ile Pro Ser Leu Leu Ala Ala Asn Arg Asp 305 310 315 320 Ser Asn Leu Thr Asp Arg Pro Asp Asp Leu Asp Ile Thr Arg Gly Val 325 330 335 Ala Gly His Leu Ala Phe Gly His Gly Val His Phe Cys Leu Gly His 340 345 350 Ser Leu Ala Arg Met Thr Leu Arg Thr Ala Val Pro Ala Val Leu Arg 355 360 365 Arg Phe Pro Asp Leu Ala Leu Ser Pro Ser His Asp Val Arg Leu Arg 370 375 380 Ser Ala Ser Ile Val Leu Gly Leu Glu Glu Leu Gln Leu Thr Trp 385 390 395 <210> 94 <211> 512 <212> PRT <213> Arabidopsis thaliana <400> 94 Met Met Val Thr Leu Val Leu Lys Tyr Val Leu Val Ile Val Met Thr 1 5 10 15 Leu Ile Leu Arg Val Leu Tyr Asp Ser Ile Cys Cys Tyr Phe Leu Thr 20 25 30 Pro Arg Arg Ile Lys Lys Phe Met Glu Arg Gln Gly Ile Thr Gly Pro 35 40 45 Lys Pro Arg Leu Leu Thr Gly Asn Ile Ile Asp Ile Ser Lys Met Leu 50 55 60 Ser His Ser Ala Ser Asn Asp Cys Ser Ser Ile His His Asn Ile Val 65 70 75 80 Pro Arg Leu Leu Pro His Tyr Val Ser Trp Ser Lys Gln Tyr Gly Lys 85 90 95 Arg Phe Ile Met Trp Asn Gly Thr Glu Pro Arg Leu Cys Leu Thr Glu 100 105 110 Thr Glu Met Ile Lys Glu Leu Leu Thr Lys His Asn Pro Val Thr Gly 115 120 125 Lys Ser Trp Leu Gln Gln Gln Gly Thr Lys Gly Phe Ile Gly Arg Gly 130 135 140 Leu Leu Met Ala Asn Gly Glu Ala Trp His His Gln Arg His Met Ala 145 150 155 160 Ala Pro Ala Phe Thr Arg Asp Arg Leu Lys Gly Tyr Ala Lys His Met 165 170 175 Val Glu Cys Thr Lys Met Met Ala Glu Arg Leu Arg Lys Glu Val Gly 180 185 190 Glu Glu Val Glu Ile Gly Glu Glu Met Arg Arg Leu Thr Ala Asp Ile 195 200 205 Ile Ser Arg Thr Glu Phe Gly Ser Ser Cys Asp Lys Gly Lys Glu Leu 210 215 220 Phe Ser Leu Leu Thr Val Leu Gln Arg Leu Cys Ala Gln Ala Thr Arg 225 230 235 240 His Leu Cys Phe Pro Gly Ser Arg Phe Leu Pro Ser Lys Tyr Asn Arg 245 250 255 Glu Ile Lys Ser Leu Lys Thr Glu Val Glu Arg Leu Leu Met Glu Ile 260 265 270 Ile Asp Ser Arg Lys Asp Ser Val Glu Ile Gly Arg Ser Ser Ser Tyr 275 280 285 Gly Asp Asp Leu Leu Gly Leu Leu Leu Asn Gln Met Asp Ser Asn Lys 290 295 300 Asn Asn Leu Asn Val Gln Met Ile Met Asp Glu Cys Lys Thr Phe Phe 305 310 315 320 Phe Thr Gly His Glu Thr Thr Ser Leu Leu Leu Thr Trp Thr Leu Met 325 330 335 Leu Leu Ala His Asn Pro Thr Trp Gln Asp Asn Val Arg Asp Glu Val 340 345 350 Arg Gln Val Cys Gly Gln Asp Gly Val Pro Ser Val Glu Gln Leu Ser 355 360 365 Ser Leu Thr Ser Leu Asn Lys Val Ile Asn Glu Ser Leu Arg Leu Tyr 370 375 380 Pro Pro Ala Thr Leu Leu Pro Arg Met Ala Phe Glu Asp Ile Lys Leu 385 390 395 400 Gly Asp Leu Ile Ile Pro Lys Gly Leu Ser Ile Trp Ile Pro Val Leu 405 410 415 Ala Ile His His Ser Asn Glu Leu Trp Gly Glu Asp Ala Asn Glu Phe 420 425 430 Asn Pro Glu Arg Phe Thr Thr Arg Ser Phe Ala Ser Ser Arg His Phe 435 440 445 Met Pro Phe Ala Ala Gly Pro Arg Asn Cys Ile Gly Gln Thr Phe Ala 450 455 460 Met Met Glu Ala Lys Ile Ile Leu Ala Met Leu Val Ser Lys Phe Ser 465 470 475 480 Phe Ala Ile Ser Glu Asn Tyr Arg His Ala Pro Ile Val Val Leu Thr 485 490 495 Ile Lys Pro Lys Tyr Gly Val Gln Leu Val Leu Lys Pro Leu Asp Leu 500 505 510 <210> 95 <211> 518 <212> PRT <213> Arabidopsis thaliana <400> 95 Met Leu Leu Thr Ile Leu Lys Ser Leu Leu Val Ile Phe Val Thr Thr 1 5 10 15 Ile Leu Arg Val Leu Tyr Asp Thr Ile Ser Cys Tyr Trp Leu Thr Pro 20 25 30 Arg Arg Ile Lys Lys Ile Met Glu Gln Gln Gly Val Thr Gly Pro Lys 35 40 45 Pro Arg Pro Leu Thr Gly Asn Ile Leu Glu Ile Ser Ala Met Val Ser 50 55 60 Gln Ser Ala Ser Lys Asp Cys Asp Ser Ile His His Asp Ile Val Gly 65 70 75 80 Arg Leu Leu Pro His Tyr Val Ala Trp Ser Lys Gln Tyr Gly Lys Arg 85 90 95 Phe Ile Val Trp Asn Gly Thr Asp Pro Arg Leu Cys Leu Thr Glu Thr 100 105 110 Glu Leu Ile Lys Glu Leu Leu Met Lys His Asn Gly Val Ser Gly Arg 115 120 125 Ser Trp Leu Gln Gln Gln Gly Thr Lys Asn Phe Ile Gly Arg Gly Leu 130 135 140 Leu Met Ala Asn Gly Gln Asp Trp His His Gln Arg His Leu Ala Ala 145 150 155 160 Pro Ala Phe Thr Gly Glu Arg Leu Lys Gly Tyr Ala Arg His Met Val 165 170 175 Glu Cys Thr Ser Lys Leu Val Glu Arg Leu Arg Lys Glu Val Gly Glu 180 185 190 Gly Ala Asn Glu Val Glu Ile Gly Glu Glu Met His Lys Leu Thr Ala 195 200 205 Asp Ile Ile Ser Arg Thr Lys Phe Gly Ser Ser Phe Glu Lys Gly Lys 210 215 220 Glu Leu Phe Asn His Leu Thr Val Leu Gln Arg Arg Cys Ala Gln Ala 225 230 235 240 Thr Arg His Leu Cys Phe Pro Gly Ser Arg Phe Leu Pro Ser Lys Tyr 245 250 255 Asn Arg Glu Ile Lys Ser Leu Lys Lys Glu Val Glu Arg Leu Leu Ile 260 265 270 Glu Ile Ile Gln Ser Arg Arg Asp Cys Ala Glu Met Gly Arg Ser Ser 275 280 285 Thr His Gly Asp Asp Leu Leu Gly Leu Leu Leu Asn Glu Met Asp Ile 290 295 300 Asp Lys Asn Asn Asn Asn Asn Asn Asn Asn Leu Gln Leu Ile Met Asp 305 310 315 320 Glu Cys Lys Thr Phe Phe Phe Ala Gly His Glu Thr Thr Ala Leu Leu 325 330 335 Leu Thr Trp Thr Thr Met Leu Leu Ala Asp Asn Pro Thr Trp Gln Glu 340 345 350 Lys Val Arg Glu Glu Val Arg Glu Val Phe Gly Arg Asn Gly Leu Pro 355 360 365 Ser Val Asp Gln Leu Ser Lys Leu Thr Ser Leu Ser Lys Val Ile Asn 370 375 380 Glu Ser Leu Arg Leu Tyr Pro Pro Ala Thr Leu Leu Pro Arg Met Ala 385 390 395 400 Phe Glu Asp Leu Lys Leu Gly Asp Leu Thr Ile Pro Lys Gly Leu Ser 405 410 415 Ile Trp Ile Pro Val Leu Ala Ile His His Ser Glu Glu Leu Trp Gly 420 425 430 Lys Asp Ala Asn Gln Phe Asn Pro Glu Arg Phe Gly Gly Arg Pro Phe 435 440 445 Ala Ser Gly Arg His Phe Ile Pro Phe Ala Ala Gly Pro Arg Asn Cys 450 455 460 Ile Gly Gln Gln Phe Ala Leu Met Glu Ala Lys Ile Ile Leu Ala Thr 465 470 475 480 Leu Ile Ser Lys Phe Asn Phe Thr Ile Ser Lys Asn Tyr Arg His Ala 485 490 495 Pro Ile Val Val Leu Thr Ile Lys Pro Lys Tyr Gly Val Gln Val Ile 500 505 510 Leu Lys Pro Leu Val Ser 515 <210> 96 <211> 1377 <212> DNA <213> Artificial Sequence <220> <223> Fragment 0-yybN-P15 <400> 96 gaaaatgagc tcccacatac cggctaggta tgtggcgttc ttcttcatgt tctggcatgc 60 agctgtgagg aggatttgtt tgctcacccc ctgaacctgc gatagctaag cccgtgcagt 120 tgttttgaac ctacaaagct tcgttctatt ttttcttttc tttttttaga gatttcctga 180 aatagaaaag caatcttttc taaccttttc tttatggttt tgccatacat accgagtaac 240 gactttctgg cgtttcgttg attttgtgta atattctcaa acatatttca ggatttgatt 300 tatatgaccg atagtctttg cgatcaattg ttgagtacgt aagtgtatgc tgattcaaca 360 aatgtatctg tattgttcac tttataatga aatttccatt ttggaagcaa acccctgact 420 gggtgataac gtctatgtgc gatggcacca aaaacttgga ggtcaaatag tcctttagag 480 atgagagttg ttaagtagcc ggaatgtaga gcgacggctt ctacttgaaa atcaaatcat 540 gcaatttagt gatccaatcg gtcaaggtag ggcttggaac agaatcatgg acttttctgg 600 agttgcaaac tatgaatcgt cctcattaaa tttataataa aaatattctc aattgagcaa 660 atcgcccacc ctttttcctt tataacataa aatccaatac tatcaataaa attctttaca 720 ggttattaca gttaagatat aatatagtta atcttttacg taaaaggagg tttttattac 780 ttgtgttgaa gttttaaata ggagtaactc catctcccca ttacggtctt catttaattt 840 catcctgagt tttatttagt tagatataaa aacgaaaatt tcacattatt tttaactaac 900 cgatagtata aaatatatat tgaaaggatt gtaaaattat gaataaattc ctgaagagca 960 atttccgttt ccttcttgcg gctgctttag gcatatcatt acttgctagt agtaatttta 1020 taaaagccag caatgataac tataaattcc atttacttgt accttatggc tatggtaatg 1080 cctattcaaa tgatgacggg tgcgcatgat cgtatggttc actgtccacc aaccaaaact 1140 gtgctcagta ccgccaatat ttctcccttg gggggtacaa agaggtgtcc ctagaagaga 1200 tccacgctgt gtaaaaattt tacaaaaagg tattgacttt ccctacaggg tgtgtaataa 1260 tttaattaca ggcgggggca accccgctca gtacctagag cgtaaaagag gggagggaaa 1320 cactagttgg cttcgttggg attctccggt gatgctgatt tcgctgcgta tgctgcg 1377 <210> 97 <211> 1489 <212> DNA <213> Artificial Sequence <220> <223> Fragment END-ZeoR-yybN-HOM-R <400> 97 cggtagtcat tgctggcgaa cgcgatctag acgaagttat cttgatatgg ctttttatat 60 gtgttactct acatacagaa aggaggaact aaatatggct aagttgacca gtgcagttcc 120 tgttttaaca gctagagacg ttgctggagc ggttgaattc tggacggacc gtcttggttt 180 ctcaagagac ttcgtggaag acgatttcgc aggtgttgtc agagacgatg ttacattatt 240 catttcagca gttcaggatc aagttgtacc tgacaacaca cttgcttggg tttgggtgcg 300 cggcctggac gaactgtacg cagaatggtc tgaggtcgtg tcaacgaact tcagagacgc 360 atctggtcca gcaatgacag aaattggaga gcaaccttgg ggtagagaat ttgcacttag 420 agatcctgca ggaaattgtg ttcatttcgt agctgaagag caagattgaa gcttgaattc 480 ggatccgtcg actacgtatg ccaatgatga tgaagagtcg acatggatga gcgatgatga 540 tatcgcattt agacagacca ctcatacaga taatccttgg aaagtaaatt tacagaaatc 600 ggcagaaggt aaaggtacaa tcatgacatt ttggttgatt aacacaggga atagtaaaat 660 tccaaaagct tctaaaatac ataacgtaaa acaaggaagc ggagctcatt attatcatgc 720 aaatagccag ggaagccata catatgtagc cttagcagtt gaaaacaaca attacagtgc 780 aagttcttat ggtatagatg gtgtatggga tgaagaaact tggtaaacaa gaaccttcta 840 aaaacgttgg caccttttag ccacgcgaaa aaatttagaa tgataatctt tttataagat 900 tatcattttt atttattcta ttaagaattg agtgagaaca tggaaagtca tatttatcgc 960 attatcaaaa ataaattaac tataataata tttactataa tcatattgat tccttgtgtt 1020 gatatatcac tattgttaat gactaacaca gaataccatc ctgcatatgc gtttttcctt 1080 tctggcactt ccgtagggca tgcttcacaa atgatcctat tatggtttct tccgctttat 1140 tttttgttac tatgtgctga cgattctata caagattata aaacaggata tcattacatt 1200 cttataagca aagttggcag aaaaaaatat tgtttggaaa aaatatttac ctcttttatc 1260 atttcatttt tgacaatgtt tttgtcacta atattaaact ttttattggt tcaggttttc 1320 ttttttaaag gtacatttaa aaatgactta gaccaaatta aattccctga taacagcctt 1380 tatactttta gtatggccca tccttatata gcaattgtgt tattttctat tatttgttgt 1440 attatgtctg gatttgttgg agcacttggt tcaagcctca gtttacttt 1489 <210> 98 <211> 1404 <212> DNA <213> Artificial Sequence <220> <223> Fragment 25-solo-BS-purA <400> 98 cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60 caagcgtagt agttgttggc acacagtggg gcgacgaggg caagggcaag attacagatt 120 tcctgtctga aaacgcggag gtgatcgcac gctatcaggg aggaaacaac gccggccata 180 caatcaaatt cgacggcatt acatataaac ttcaccttat cccgtctggt atcttttaca 240 aagacaagac atgtgtcatc ggaaatggaa tggtcgtcga ccctaaagcg ctggtcacag 300 aactggccta tcttcacgaa cgcaatgtta gcacagacaa tttacgcatt agcaatagag 360 cgcatgtaat tctgccttat catctgaagt tagatgaagt tgaggaggaa cgcaagggtg 420 ctaataaaat tggtacaaca aagaagggca tcggcccggc ttatatggac aaagcggccc 480 gcatcggtat ccgcatcgca gatctgcttg acagagatgc gtttgctgag aaactggaaa 540 gaaacttaga ggagaagaac agactgttag aaaaaatgta tgaaacggaa ggatttaaat 600 tagaggatat tctggacgag tactacgaat acggccagca aatcaaaaaa tatgtatgcg 660 atacatctgt agtactgaac gatgcgctgg atgagggaag aagagtatta tttgaaggtg 720 cccaaggagt tatgctggat atcgatcaag gtacatatcc atttgttaca agcagcaatc 780 ctgttgctgg cggcgtcaca attggatctg gcgtaggccc tacgaaaatt aaacacgtcg 840 ttggcgtgtc aaaagcatat acgacaagag ttggtgatgg accgttcccg acagaactga 900 aagatgagat tggcgatcaa attagagagg tcggaagaga atatggcaca acaacaggta 960 gaccgagaag agttggttgg ttcgattcag tcgtggtgag acatgcaaga agagtgtctg 1020 gcattacgga tttatcactt aattcaattg atgttctggc tggaatcgaa acgttaaaaa 1080 tctgtgtggc atatagatat aaaggagaaa ttattgaaga atttccagcc tcacttaaag 1140 cactggccga atgcgaacct gtgtacgaag aaatgccagg ctggacagaa gatattacag 1200 gagctaaatc actttcagaa ctgccggaaa atgcgagaca ttacctggaa agagtgtcac 1260 aactgacagg cattccgctg tcaatttttt cagtgggccc ggatagatca caaacaaacg 1320 tgctgagatc agtgtacaga gcaaattaaa ttaattctag agtcgatccc cgggttcgcc 1380 agcaatgact accggcagcc cgcc 1404 <210> 99 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for Fragment 0-yybN-P15 amplification <400> 99 ggagaatccc aacgaagcca 20 <210> 100 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for Fragment 0-yybN-P15 amplification <400> 100 ggctaggtat gtggcgttct 20 <210> 101 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for END-ZeoR-yybN-HOM-R amplification <400> 101 cggtagtcat tgctggcgaa 20 <210> 102 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for END-ZeoR-yybN-HOM-R amplification <400> 102 actgaggctt gaaccaagtg 20 <210> 103 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for Fragment 25-solo-BS-purA amplification <400> 103 gcagcgaaat cagcatcacc 20 <210> 104 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer for Fragment 25-solo-BS-purA amplification <400> 104 cactgagcct ccacctagcc t 21 <210> 105 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer for amplification of purA fragment and end fragment assembly <400> 105 tttaactagt atgtcttcag tagttgtagt aggtac 36 <210> 106 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for final purA operon amplification <400> 106 aagcccgtgc agttgttttg 20 <210> 107 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer for final purA operon amplification <400> 107 cacaattgct atataaggat gggc 24 <210> 108 <211> 4089 <212> DNA <213> Artificial Sequence <220> <223> complete purA operon <400> 108 gaaaatgagc tcccacatac cggctaggta tgtggcgttc ttcttcatgt tctggcatgc 60 agctgtgagg aggatttgtt tgctcacccc ctgaacctgc gatagctaag cccgtgcagt 120 tgttttgaac ctacaaagct tcgttctatt ttttcttttc tttttttaga gatttcctga 180 aatagaaaag caatcttttc taaccttttc tttatggttt tgccatacat accgagtaac 240 gactttctgg cgtttcgttg attttgtgta atattctcaa acatatttca ggatttgatt 300 tatatgaccg atagtctttg cgatcaattg ttgagtacgt aagtgtatgc tgattcaaca 360 aatgtatctg tattgttcac tttataatga aatttccatt ttggaagcaa acccctgact 420 gggtgataac gtctatgtgc gatggcacca aaaacttgga ggtcaaatag tcctttagag 480 atgagagttg ttaagtagcc ggaatgtaga gcgacggctt ctacttgaaa atcaaatcat 540 gcaatttagt gatccaatcg gtcaaggtag ggcttggaac agaatcatgg acttttctgg 600 agttgcaaac tatgaatcgt cctcattaaa tttataataa aaatattctc aattgagcaa 660 atcgcccacc ctttttcctt tataacataa aatccaatac tatcaataaa attctttaca 720 ggttattaca gttaagatat aatatagtta atcttttacg taaaaggagg tttttattac 780 ttgtgttgaa gttttaaata ggagtaactc catctcccca ttacggtctt catttaattt 840 catcctgagt tttatttagt tagatataaa aacgaaaatt tcacattatt tttaactaac 900 cgatagtata aaatatatat tgaaaggatt gtaaaattat gaataaattc ctgaagagca 960 atttccgttt ccttcttgcg gctgctttag gcatatcatt acttgctagt agtaatttta 1020 taaaagccag caatgataac tataaattcc atttacttgt accttatggc tatggtaatg 1080 cctattcaaa tgatgacggg tgcgcatgat cgtatggttc actgtccacc aaccaaaact 1140 gtgctcagta ccgccaatat ttctcccttg gggggtacaa agaggtgtcc ctagaagaga 1200 tccacgctgt gtaaaaattt tacaaaaagg tattgacttt ccctacaggg tgtgtaataa 1260 tttaattaca ggcgggggca accccgctca gtacctagag cgtaaaagag gggagggaaa 1320 cactagtatg tcaagcgtag tagttgttgg cacacagtgg ggcgacgagg gcaagggcaa 1380 gattacagat ttcctgtctg aaaacgcgga ggtgatcgca cgctatcagg gaggaaacaa 1440 cgccggccat acaatcaaat tcgacggcat tacatataaa cttcacctta tcccgtctgg 1500 tatcttttac aaagacaaga catgtgtcat cggaaatgga atggtcgtcg accctaaagc 1560 gctggtcaca gaactggcct atcttcacga acgcaatgtt agcacagaca atttacgcat 1620 tagcaataga gcgcatgtaa ttctgcctta tcatctgaag ttagatgaag ttgaggagga 1680 acgcaagggt gctaataaaa ttggtacaac aaagaagggc atcggcccgg cttatatgga 1740 caaagcggcc cgcatcggta tccgcatcgc agatctgctt gacagagatg cgtttgctga 1800 gaaactggaa agaaacttag aggagaagaa cagactgtta gaaaaaatgt atgaaacgga 1860 aggatttaaa ttagaggata ttctggacga gtactacgaa tacggccagc aaatcaaaaa 1920 atatgtatgc gatacatctg tagtactgaa cgatgcgctg gatgagggaa gaagagtatt 1980 atttgaaggt gcccaaggag ttatgctgga tatcgatcaa ggtacatatc catttgttac 2040 aagcagcaat cctgttgctg gcggcgtcac aattggatct ggcgtaggcc ctacgaaaat 2100 taaacacgtc gttggcgtgt caaaagcata tacgacaaga gttggtgatg gaccgttccc 2160 gacagaactg aaagatgaga ttggcgatca aattagagag gtcggaagag aatatggcac 2220 aacaacaggt agaccgagaa gagttggttg gttcgattca gtcgtggtga gacatgcaag 2280 aagagtgtct ggcattacgg atttatcact taattcaatt gatgttctgg ctggaatcga 2340 aacgttaaaa atctgtgtgg catatagata taaaggagaa attattgaag aatttccagc 2400 ctcacttaaa gcactggccg aatgcgaacc tgtgtacgaa gaaatgccag gctggacaga 2460 agatattaca ggagctaaat cactttcaga actgccggaa aatgcgagac attacctgga 2520 aagagtgtca caactgacag gcattccgct gtcaattttt tcagtgggcc cggatagatc 2580 acaaacaaac gtgctgagat cagtgtacag agcaaattaa attaattcta gacgaagtta 2640 tcttgatatg gctttttata tgtgttactc tacatacaga aaggaggaac taaatatggc 2700 taagttgacc agtgcagttc ctgttttaac agctagagac gttgctggag cggttgaatt 2760 ctggacggac cgtcttggtt tctcaagaga cttcgtggaa gacgatttcg caggtgttgt 2820 cagagacgat gttacattat tcatttcagc agttcaggat caagttgtac ctgacaacac 2880 acttgcttgg gtttgggtgc gcggcctgga cgaactgtac gcagaatggt ctgaggtcgt 2940 gtcaacgaac ttcagagacg catctggtcc agcaatgaca gaaattggag agcaaccttg 3000 gggtagagaa tttgcactta gagatcctgc aggaaattgt gttcatttcg tagctgaaga 3060 gcaagattga agcttgaatt cggatccgtc gactacgtat gccaatgatg atgaagagtc 3120 gacatggatg agcgatgatg atatccattt agacagacca ctcatacaga taatccttgg 3180 aaagtaaatt tacagaaatc ggcagaaggt aaaggtacaa tcatgacatt ttggttgatt 3240 aacacaggga atagtaaaat tccaaaagct tctaaaatac ataacgtaaa acaaggaagc 3300 ggagctcatt attatcatgc aaatagccag ggaagccata catatgtagc cttagcagtt 3360 gaaaacaaca attacagtgc aagttcttat ggtatagatg gtgtatggga tgaagaaact 3420 tggtaaacaa gaaccttcta aaaacgttgg caccttttag ccacgcgaaa aaatttagaa 3480 tgataatctt tttataagat tatcattttt atttattcta ttaagaattg agtgagaaca 3540 tggaaagtca tatttatcgc attatcaaaa ataaattaac tataataata tttactataa 3600 tcatattgat tccttgtgtt gatatatcac tattgttaat gactaacaca gaataccatc 3660 ctgcatatgc gtttttcctt tctggcactt ccgtagggca tgcttcacaa atgatcctat 3720 tatggtttct tccgctttat tttttgttac tatgtgctga cgattctata caagattata 3780 aaacaggata tcattacatt cttataagca aagttggcag aaaaaaatat tgtttggaaa 3840 aaatatttac ctcttttatc atttcatttt tgacaatgtt tttgtcacta atattaaact 3900 ttttattggt tcaggttttc ttttttaaag gtacatttaa aaatgactta gaccaaatta 3960 aattccctga taacagcctt tatactttta gtatggccca tccttatata gcaattgtgt 4020 tattttctat tatttgttgt attatgtctg gatttgttgg agcacttggt tcaagcctca 4080 gtttacttt 4089 <210> 109 <211> 2818 <212> DNA <213> Artificial Sequence <220> <223> operon 25-solo-BS-purA fragment + END-ZeoR-yybN-HOM-R fragment <400> 109 cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60 caagcgtagt agttgttggc acacagtggg gcgacgaggg caagggcaag attacagatt 120 tcctgtctga aaacgcggag gtgatcgcac gctatcaggg aggaaacaac gccggccata 180 caatcaaatt cgacggcatt acatataaac ttcaccttat cccgtctggt atcttttaca 240 aagacaagac atgtgtcatc ggaaatggaa tggtcgtcga ccctaaagcg ctggtcacag 300 aactggccta tcttcacgaa cgcaatgtta gcacagacaa tttacgcatt agcaatagag 360 cgcatgtaat tctgccttat catctgaagt tagatgaagt tgaggaggaa cgcaagggtg 420 ctaataaaat tggtacaaca aagaagggca tcggcccggc ttatatggac aaagcggccc 480 gcatcggtat ccgcatcgca gatctgcttg acagagatgc gtttgctgag aaactggaaa 540 gaaacttaga ggagaagaac agactgttag aaaaaatgta tgaaacggaa ggatttaaat 600 tagaggatat tctggacgag tactacgaat acggccagca aatcaaaaaa tatgtatgcg 660 atacatctgt agtactgaac gatgcgctgg atgagggaag aagagtatta tttgaaggtg 720 cccaaggagt tatgctggat atcgatcaag gtacatatcc atttgttaca agcagcaatc 780 ctgttgctgg cggcgtcaca attggatctg gcgtaggccc tacgaaaatt aaacacgtcg 840 ttggcgtgtc aaaagcatat acgacaagag ttggtgatgg accgttcccg acagaactga 900 aagatgagat tggcgatcaa attagagagg tcggaagaga atatggcaca acaacaggta 960 gaccgagaag agttggttgg ttcgattcag tcgtggtgag acatgcaaga agagtgtctg 1020 gcattacgga tttatcactt aattcaattg atgttctggc tggaatcgaa acgttaaaaa 1080 tctgtgtggc atatagatat aaaggagaaa ttattgaaga atttccagcc tcacttaaag 1140 cactggccga atgcgaacct gtgtacgaag aaatgccagg ctggacagaa gatattacag 1200 gagctaaatc actttcagaa ctgccggaaa atgcgagaca ttacctggaa agagtgtcac 1260 aactgacagg cattccgctg tcaatttttt cagtgggccc ggatagatca caaacaaacg 1320 tgctgagatc agtgtacaga gcaaattaaa ttaattctag acgaagttat cttgatatgg 1380 ctttttatat gtgttactct acatacagaa aggaggaact aaatatggct aagttgacca 1440 gtgcagttcc tgttttaaca gctagagacg ttgctggagc ggttgaattc tggacggacc 1500 gtcttggttt ctcaagagac ttcgtggaag acgatttcgc aggtgttgtc agagacgatg 1560 ttacattatt catttcagca gttcaggatc aagttgtacc tgacaacaca cttgcttggg 1620 tttgggtgcg cggcctggac gaactgtacg cagaatggtc tgaggtcgtg tcaacgaact 1680 tcagagacgc atctggtcca gcaatgacag aaattggaga gcaaccttgg ggtagagaat 1740 ttgcacttag agatcctgca ggaaattgtg ttcatttcgt agctgaagag caagattgaa 1800 gcttgaattc ggatccgtcg actacgtatg ccaatgatga tgaagagtcg acatggatga 1860 gcgatgatga tatccattta gacagaccac tcatacagat aatccttgga aagtaaattt 1920 acagaaatcg gcagaaggta aaggtacaat catgacattt tggttgatta acacagggaa 1980 tagtaaaatt ccaaaagctt ctaaaataca taacgtaaaa caaggaagcg gagctcatta 2040 ttatcatgca aatagccagg gaagccatac atatgtagcc ttagcagttg aaaacaacaa 2100 ttacagtgca agttcttatg gtatagatgg tgtatgggat gaagaaactt ggtaaacaag 2160 aaccttctaa aaacgttggc accttttagc cacgcgaaaa aatttagaat gataatcttt 2220 ttataagatt atcattttta tttattctat taagaattga gtgagaacat ggaaagtcat 2280 atttatcgca ttatcaaaaa taaattaact ataataatat ttactataat catattgatt 2340 ccttgtgttg atatatcact attgttaatg actaacacag aataccatcc tgcatatgcg 2400 tttttccttt ctggcacttc cgtagggcat gcttcacaaa tgatcctatt atggtttctt 2460 ccgctttatt ttttgttact atgtgctgac gattctatac aagattataa aacaggatat 2520 cattacattc ttataagcaa agttggcaga aaaaaatatt gtttggaaaa aatatttacc 2580 tcttttatca tttcattttt gacaatgttt ttgtcactaa tattaaactt tttattggtt 2640 caggttttct tttttaaagg tacatttaaa aatgacttag accaaattaa attccctgat 2700 aacagccttt atacttttag tatggcccat ccttatatag caattgtgtt attttctatt 2760 atttgttgta ttatgtctgg atttgttgga gcacttggtt caagcctcag tttacttt 2818 <210> 110 <211> 667 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG2_Bsu <400> 110 ttctttttgc gccaggtagc catagctggt catatgatga aaacaatctg tgtattcgct 60 ggcagcaacc ctggcggtaa tgaagcttac aagagaaagg ccgctgaact gggtgtgtat 120 atggcggaac agggaatcgg attagtatac ggtggctctc gcgtcggact gatgggcacg 180 attgcagacg caatcatgga gaacggcggc acggcaattg gagttatgcc atctggatta 240 ttttctggag aagttgtcca tcagaatctg acagagctga ttgaggtcaa tggcatgcac 300 gagagaaaag ccaaaatgtc agagctggcg gatggtttca tcagcatgcc tggaggattt 360 ggaacatacg aggagctttt tgaagttctt tgctgggcgc aaattggcat tcatcaaaaa 420 ccgattggcc tgtataatgt gaacggctat tttgaaccga tgatgaagat ggtgaaatat 480 tcaattcaag aaggctttag caatgaatca catcttaaac tgatccactc atcatcaaga 540 ccggatgaac tgatcgaaca aatgcagaat tattcatatc cgattttaga aaaaaaatgg 600 acagaaattt aaattaattc tagagtcgat ccccgggttc gccagcaatg actaccggca 660 gcccgcc 667 <210> 111 <211> 862 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG3_Cgl <400> 111 ttctttttgc gccaggtagc catagctggt catatgatgg caccgaaaca gacaccttct 60 ccagaaaaaa atagaaacct tgtgggtcca gtgctgcaac gccgccaaac agagggcacg 120 tttgaccagc gcctgcttga aatgagagca gaccacaatt ggaagcacgc agacccgtgg 180 agagtgttaa gaattcagtc agagtttgtt gcaggatttg atgctctgca tgagatgccg 240 aaggcggtca cagtgtttgg aagcgcgaga attaaagagg atcatcctta ttataaagca 300 ggtgttgagc ttggagaaaa acttgttgcc gctgattacg cggttgtaac gggcggaggc 360 cctggcctta tggaagcacc gaataaagga gcgtcagaag ccaatggctt atcagtcggt 420 ttaggtattg aacttcctca cgagcagcat ttaaacccgt atgtggatct gggattaaat 480 tttagatact tttttgctag aaagacgatg tttctgaaat attcacaagc ttttgtctgt 540 ctgccgggcg gcttcggaac actggacgaa ctgttcgaag tgctgtgcat ggtccaaaca 600 ggcaaagtta caaacttccc gattgtactg atcggcacag aattctgggc tggcctggtt 660 gactggatca gacatagact ggtcgaagaa ggcatgattg atgaaaaaga tgtagacaga 720 atgctggtaa cagatgatct ggatcaagcc gttaagttca tcgtcgatgc ccatgccggc 780 ctggatgtag cgagaagaca taactaaatt aattctagag tcgatccccg ggttcgccag 840 caatgactac cggcagcccg cc 862 <210> 112 <211> 679 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG4_Pae <400> 112 ttctttttgc gccaggtagc catagctggt catatgatga cgcttagatc agtctgtgtg 60 ttctgcggcg cgagcccggg agcttctccg gtttatcaag aagctgctgt ggcccttggt 120 agacatttag cggaacgcgg actgacgtta gtatatggcg gaggtgccgt aggactgatg 180 ggtacagtgg ccgacgccgc tctggcggcg ggcggagaag ttattggtat tatccctcaa 240 tcacttcagg aggccgaaat tggccataaa ggcttaacaa gattagaagt tgtagatggc 300 atgcatgcac gcaaggctag aatggctgag ttagctgatg cctttatcgc gcttccgggc 360 ggacttggaa cacttgagga actgtttgag gtctggacat ggggccagtt aggctaccac 420 gcaaaaccac tgggcctgct ggaagttaat ggcttctatg atcctctgct gacatttctg 480 gaccacctgg tcgatgaaag atttgtgaga gcggaacata gaggcatgct gcagagagga 540 gcgtcacctg aagcactgct ggacgcactg gcagcatgga caccgtcagt cgcaccgaaa 600 tgggttgata gaacaccaca ataaattaat tctagagtcg atccccgggt tcgccagcaa 660 tgactaccgg cagcccgcc 679 <210> 113 <211> 862 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG5_Rfa <400> 113 ttctttttgc gccaggtagc catagctggt catatgatga acagcgttga cgaccctggt 60 tcatacgaac agattggcag cgagaagccg gcaaagcata aaggctctgt tgtactgcgc 120 agaggcagaa atacggaaac atctacgtca gaccaacgct tattagatga aagaggttca 180 ggtaattgga tccattctga tacgtggcgc gtcttacgca ttcagagcga atttgtggaa 240 ggctttggtg cgctggccga agttcctaga gctgtcacag tattcggcag cgccagaacg 300 ccagtcgatc acccggaata cgagagagct agagagttag gagccgcgct tgctagagaa 360 ggatttgcgg taattacagg cggtggacca ggcgtcatgg agggagctaa cagaggagcg 420 tcagaggcgg atggctattc aattggcctt ggcatcgagc tgccgttcga acaaggctta 480 aacgactggg tagatcttgg agtgaatttc agatattttt ttgtaagaaa aacaatgttc 540 gtgaaatatt cacaggcctt tgtgtgcctt ccgggcggct ttggaacact ggacgaactg 600 tttgaagcac tgacacttgt tcaaacagca aaagtcacaa gatttccgat tgttctgctg 660 ggaaaggact tctggtcagg actgctggat tggattaaaa caacactggt taaagagggc 720 aaagtctcag aaaaagatct ggatctgatc cattgtacag attcagtgga tgaagcagtg 780 agaatcgtta gagaagcaca acagtaaatt aattctagag tcgatccccg ggttcgccag 840 caatgactac cggcagcccg cc 862 <210> 114 <211> 688 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG6_Rfa <400> 114 ttctttttgc gccaggtagc catagctggt catatgatga atttacgccc gatgcctgcc 60 acgacggtta gcgcccaagc aagaccaacg ccaaagtcag ttacggtgtt ctgcggagct 120 atgccgggta gaggaacaaa atacggtcaa cttgctgagg gcatgggtag agctattgct 180 agaagcaaat taagacttgt atatggagga gcgagagtcg gccttatggg aacactggca 240 aacgcagcct tagactctgg cggtacagtc gttggagtca ttcctgaatc atttacagct 300 atccctgaag ccgcccacca cggactgaca gaactgcatg tagtgcacga tatgcatcaa 360 agaaaagcct taatggctga gctgggcgat gcattcattg cacttcctgg cggcgtcggc 420 acagcggagg agttttttga ggtgctgaca tggagccatc tgggcctgca taacaaaccg 480 tgcgttctgc tgaatgataa tgaatactat agaccgctgc tgtcatatat tgaacatgca 540 gcggtcgaag gctttatcac acctgcgaca agatcaagag taatcgtgtg taaagacatt 600 gaaggcgcga ttgcggcgat tagatcaccg taaattaatt ctagagtcga tccccgggtt 660 cgccagcaat gactaccggc agcccgcc 688 <210> 115 <211> 655 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG7_Cst <400> 115 ttctttttgc gccaggtagc catagctggt catatgatga aatcagtagc gatttattgc 60 ggatcatcaa tgggatctag ccctagatat gcagaagtag ctaaagagat gggagaggaa 120 cttgcaagac gcaatctgag agtagtgtat ggaggaggaa acgtcggact gatgggtaca 180 gtggccgacg cagcgttagc ggccggtggc gaggtggtag gcgtaattcc aagacagtta 240 attaaccgcg agatggcaca tgccggtctg acagatttag aagtggtgga cacaatggcg 300 cagagaaaaa cgagaatgga ggaacttgcc gatgcttttg tgtgtctgcc tggcggtgtt 360 ggcacgctgg aagaagtcgt tgaagttctt acaatgcaac aacttggcca cgtccaaggc 420 ccggtcggcc tggttaatgt tgacggcttt tgggaaccgt ttgtcagaac actggaatca 480 atggtcgctt gcggcttcgt tcagtcaaga tacatcgatg ctatcgcact gtcttcagat 540 ccggctgaaa ttctggatga attcgcaggc tggagcccga tcggcgcgaa gtggagctaa 600 attaattcta gagtcgatcc ccgggttcgc cagcaatgac taccggcagc ccgcc 655 <210> 116 <211> 919 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG8_Cst <400> 116 ttctttttgc gccaggtagc catagctggt catatgatgg cccctcttcg ctcaaacaaa 60 gatggcaaac ctagagttcc tagaacgacg gaaagcgccg aaacgaatag aatgttaaga 120 ggtccgatgt tactgagaac agacggaaat cagacgtcaa catacgatca aagactttta 180 gagtcaggcg cagatcacgc ttggaagcat gcagatccgt ggcgcgttct gagaatccag 240 ggagagttcg tggcaggatt tgatgctctg agcgatctgc ctaaggcggt tacggtatac 300 ggctcagcca gaacaaaaga ggacacaccg gaatatgcac agggcatcga tttaggtgca 360 aaattagttg agcatgacta cgctgttgtg acaggcggtg gcccaggcat catggaggcg 420 gcgaatagag gcgcctatga agctggaggt ctttctgtgg gcctgggcat tgaacttccg 480 tttgaacaag gtttaaacaa atatgtagat cttggaatta actttagata ctttttcgcg 540 agaaagacaa tgttcctgaa atattcacag gcgtttgtgt gcctgccggg cggtatggga 600 acaatggatg agctgtttga aatgctgtgt atggtgcaaa caggaaaagt gacaaactat 660 ccgattgtac tgatcggcac agaatattgg agcggcctgg tagaatggat ggctaataca 720 ctggtcgccg aaggctacat caatccacaa gatatggatc tgttcctgct gacagacagc 780 gtcgacgaag ccgtcgaaca tattgtcgcg gctcataaag aaatgacaga cgaaagagtc 840 tcaagactga atcacgacgc ataaattaat tctagagtcg atccccgggt tcgccagcaa 900 tgactaccgg cagcccgcc 919 <210> 117 <211> 850 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG9_SC <400> 117 ttctttttgc gccaggtagc catagctggt catatgatgg ccacaggcaa cccggaggga 60 aaaaaacgcc ctcctgagga acaacgcctt ggccctgttc ttagaagacg cggacaagtt 120 caggagtcta caacagacca aagactgctt gatgagagag ccccgacaga ttgggtgcat 180 acagatccat ggagagtttt aagaattcag tcagagttta ttgagggatt tggtacactg 240 gcggaactgc cgccggccat ttctgttttt ggatcagcga gaacgccggc cgactcaccg 300 gaatatgacg ctggcgtcag actgggaaga ggtctggtgg aagcgggatt cgccgtgatc 360 acgggcggcg gtccgggcgc aatggaagct gctaacaagg gtgcgttaga agcgaaaggt 420 acaagcgtcg gtttaggaat tgaacttcca ttcgaacaag gattaaatcc ttacgttgat 480 atcggactta atttcagata tttcttcgta agaaagatga tgtttgtaaa gtacgcacaa 540 ggatttgtag tgttaccagg cggcttaggc acacttgatg aactgtttga agcactgaca 600 ctggtacaga cgcagaaagt cacgagattt ccgatcgtcc tgtttggcag cgaatattgg 660 ggcggcctgg tcgattggct gagaggcaca ctggttgctc agggcaaagc ggctgaaaaa 720 gatctgatgc tgtttcacgt cacagacgac gtagatgaag cagtggcact ggtgtcaaaa 780 gaagcaggca gataaattaa ttctagagtc gatccccggg ttcgccagca atgactaccg 840 gcagcccgcc 850 <210> 118 <211> 739 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG10_ATh <400> 118 ttctttttgc gccaggtagc catagctggt catatgatgg agattaaggg agagagcatg 60 caaaagtcaa agttcagacg catttgtgtg ttttgcggtt catcacaggg caaaaagtct 120 tcatatcaag atgctgcagt tgatctgggt aacgaattag taagcagaaa catcgatctt 180 gtctacggcg gtggctctat tggacttatg ggcttagtgt ctcaagcagt ccatgacggc 240 ggtagacatg tcatcggcat tattcctaaa acgttaatgc cgcgcgagct gacaggcgaa 300 acagtaggag aggtaagagc ggtggccgac atgcatcaaa gaaaagcgga aatggccaaa 360 cacagcgacg catttattgc tttaccgggc ggctacggaa cactggaaga acttcttgag 420 gtcatcacgt gggcccagct gggcattcat gataaaccag tgggactgct gaatgtggat 480 ggctattata atagcctgct gtcatttatt gataaagcgg ttgaagaagg attcatttca 540 ccgacggcaa gagaaatcat tgtttcagcg cctacagcta aagaactggt taaaaaactg 600 gaagagtatg cgccgtgcca tgaaagagtt gctacaaaac tgtgttggga aatggagaga 660 atcggatatt catcagaaga ataaattaat tctagagtcg atccccgggt tcgccagcaa 720 tgactaccgg cagcccgcc 739 <210> 119 <211> 1012 <212> DNA <213> Artificial Sequence <220> <223> Fragment-LOG11_ATh <400> 119 ttctttttgc gccaggtagc catagctggt catatgatgg gtgtctcaat gctggattct 60 tcttggtcat ttcgcctttc aagcaagatg tctccaagcc cgacgcaaaa attagccagc 120 tctctgacag aacgcgatcc aatcagctta aatctgcgct tcgaccattc aattagagca 180 tatagcgcaa gagctcttaa gtgcagatct gtcaaatctg aagatttcgt tgaaagatca 240 tcaccatttg aagttaagaa ggagctggaa atttgctttg atcttgtcca tagattaggt 300 agaggcattg tttaccttgg cagcgctaga attccgccga accacagcca ttacctgcag 360 gcacaggaat tatcaagaga agcggcaacg ttacttgact gcacaacgtg gtcaggcgct 420 ggacctggcc ttatggatgc ggtgacggaa ggtgcccttg aggcggaaaa gccggtaggt 480 ggcatcaaaa ttgaaaaaga agcgggcgag tggacggcgt caaaattcca cccgtattta 540 cctccgcaaa attatcatac atgtagattt ttctcagcga gaaaacatgg ccttgtcgat 600 gccgtaatta gaaataatgt ttcagaaaaa acagctatca ttgcactgcc gggcggcatt 660 ggaacattag atgagatgtt cgaaatcctg gctctgattc aactggagag aattggctca 720 gctctgccgg tgccttttat cgtaatgaac tacgacgcct tttattcaaa actgctggaa 780 tttatcgaga catgtgaaaa tctgggaaca gtttcaaaag gagaagtgtc agcactgtgg 840 aaagtgtgta ataacaactt tgaggccctg acatatctgg cggaatttta tgacctgcct 900 gatggatcag caaaactgga gacagaactg agaaaaacaa cacctacaag aggataaatt 960 aattctagag tcgatccccg ggttcgccag caatgactac cggcagcccg cc 1012 <210> 120 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for AmyE 0 + IPT1 amplification <400> 120 gcggtagtgg tgcttacgat 20 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for AmyE 0 + IPT1 amplification <400> 121 gactcgttag ccaggtcgtc 20 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for Amy 0 + IPT1 + LOG2-11 amplification <400> 122 cggtagtcat tgctggcgaa 20 <210> 123 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for Amy 0 + IPT1 + LOG2-11 amplification <400> 123 tacgatgtac gacaggggga 20 <210> 124 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer for erythromycin resistance cassette amplification <400> 124 aggatccatc tacattccct ttagt 25 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for erythromycin resistance cassette amplification <400> 125 cgcgtaacgg ttttcactgg 20 <210> 126 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer for EryR + AmyE END operon amplification <400> 126 aaatctagaa attaagaagg agggattcgt ca 32 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer for EryR + AmyE END operon amplification <400> 127 caatggggaa gagaaccgct 20 <210> 128 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer for final operon amplification <400> 128 atctacattc cctttagtaa cgtgt 25 <210> 129 <211> 2355 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 <400> 129 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgttg aaaaagaggg gagggaaaca ttaatgacga 2340 cctggctaac gagtc 2355 <210> 130 <211> 2966 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG2 <400> 130 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340 aacaatctgt gtattcgctg gcagcaaccc tggcggtaat gaagcttaca agagaaaggc 2400 cgctgaactg ggtgtgtata tggcggaaca gggaatcgga ttagtatacg gtggctctcg 2460 cgtcggactg atgggcacga ttgcagacgc aatcatggag aacggcggca cggcaattgg 2520 agttatgcca tctggattat tttctggaga agttgtccat cagaatctga cagagctgat 2580 tgaggtcaat ggcatgcacg agagaaaagc caaaatgtca gagctggcgg atggtttcat 2640 cagcatgcct ggaggatttg gaacatacga ggagcttttt gaagttcttt gctgggcgca 2700 aattggcatt catcaaaaac cgattggcct gtataatgtg aacggctatt ttgaaccgat 2760 gatgaagatg gtgaaatatt caattcaaga aggctttagc aatgaatcac atcttaaact 2820 gatccactca tcatcaagac cggatgaact gatcgaacaa atgcagaatt attcatatcc 2880 gattttagaa aaaaaatgga cagaaattta aattaattct agagtcgatc cccgggttcg 2940 ccagcaatga ctaccggcag cccgcc 2966 <210> 131 <211> 3161 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG3 <400> 131 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggc 2340 accgaaacag acaccttctc cagaaaaaaa tagaaacctt gtgggtccag tgctgcaacg 2400 ccgccaaaca gagggcacgt ttgaccagcg cctgcttgaa atgagagcag accacaattg 2460 gaagcacgca gacccgtgga gagtgttaag aattcagtca gagtttgttg caggatttga 2520 tgctctgcat gagatgccga aggcggtcac agtgtttgga agcgcgagaa ttaaagagga 2580 tcatccttat tataaagcag gtgttgagct tggagaaaaa cttgttgccg ctgattacgc 2640 ggttgtaacg ggcggaggcc ctggccttat ggaagcaccg aataaaggag cgtcagaagc 2700 caatggctta tcagtcggtt taggtattga acttcctcac gagcagcatt taaacccgta 2760 tgtggatctg ggattaaatt ttagatactt ttttgctaga aagacgatgt ttctgaaata 2820 ttcacaagct tttgtctgtc tgccgggcgg cttcggaaca ctggacgaac tgttcgaagt 2880 gctgtgcatg gtccaaacag gcaaagttac aaacttcccg attgtactga tcggcacaga 2940 attctgggct ggcctggttg actggatcag acatagactg gtcgaagaag gcatgattga 3000 tgaaaaagat gtagacagaa tgctggtaac agatgatctg gatcaagccg ttaagttcat 3060 cgtcgatgcc catgccggcc tggatgtagc gagaagacat aactaaatta attctagagt 3120 cgatccccgg gttcgccagc aatgactacc ggcagcccgc c 3161 <210> 132 <211> 2978 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG4 <400> 132 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgac 2340 gcttagatca gtctgtgtgt tctgcggcgc gagcccggga gcttctccgg tttatcaaga 2400 agctgctgtg gcccttggta gacatttagc ggaacgcgga ctgacgttag tatatggcgg 2460 aggtgccgta ggactgatgg gtacagtggc cgacgccgct ctggcggcgg gcggagaagt 2520 tattggtatt atccctcaat cacttcagga ggccgaaatt ggccataaag gcttaacaag 2580 attagaagtt gtagatggca tgcatgcacg caaggctaga atggctgagt tagctgatgc 2640 ctttatcgcg cttccgggcg gacttggaac acttgaggaa ctgtttgagg tctggacatg 2700 gggccagtta ggctaccacg caaaaccact gggcctgctg gaagttaatg gcttctatga 2760 tcctctgctg acatttctgg accacctggt cgatgaaaga tttgtgagag cggaacatag 2820 aggcatgctg cagagaggag cgtcacctga agcactgctg gacgcactgg cagcatggac 2880 accgtcagtc gcaccgaaat gggttgatag aacaccacaa taaattaatt ctagagtcga 2940 tccccgggtt cgccagcaat gactaccggc agcccgcc 2978 <210> 133 <211> 3161 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG5 <400> 133 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340 cagcgttgac gaccctggtt catacgaaca gattggcagc gagaagccgg caaagcataa 2400 aggctctgtt gtactgcgca gaggcagaaa tacggaaaca tctacgtcag accaacgctt 2460 attagatgaa agaggttcag gtaattggat ccattctgat acgtggcgcg tcttacgcat 2520 tcagagcgaa tttgtggaag gctttggtgc gctggccgaa gttcctagag ctgtcacagt 2580 attcggcagc gccagaacgc cagtcgatca cccggaatac gagagagcta gagagttagg 2640 agccgcgctt gctagagaag gatttgcggt aattacaggc ggtggaccag gcgtcatgga 2700 gggagctaac agaggagcgt cagaggcgga tggctattca attggccttg gcatcgagct 2760 gccgttcgaa caaggcttaa acgactgggt agatcttgga gtgaatttca gatatttttt 2820 tgtaagaaaa acaatgttcg tgaaatattc acaggccttt gtgtgccttc cgggcggctt 2880 tggaacactg gacgaactgt ttgaagcact gacacttgtt caaacagcaa aagtcacaag 2940 atttccgatt gttctgctgg gaaaggactt ctggtcagga ctgctggatt ggattaaaac 3000 aacactggtt aaagagggca aagtctcaga aaaagatctg gatctgatcc attgtacaga 3060 ttcagtggat gaagcagtga gaatcgttag agaagcacaa cagtaaatta attctagagt 3120 cgatccccgg gttcgccagc aatgactacc ggcagcccgc c 3161 <210> 134 <211> 2987 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG6 <400> 134 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340 tttacgcccg atgcctgcca cgacggttag cgcccaagca agaccaacgc caaagtcagt 2400 tacggtgttc tgcggagcta tgccgggtag aggaacaaaa tacggtcaac ttgctgaggg 2460 catgggtaga gctattgcta gaagcaaatt aagacttgta tatggaggag cgagagtcgg 2520 ccttatggga acactggcaa acgcagcctt agactctggc ggtacagtcg ttggagtcat 2580 tcctgaatca tttacagcta tccctgaagc cgcccaccac ggactgacag aactgcatgt 2640 agtgcacgat atgcatcaaa gaaaagcctt aatggctgag ctgggcgatg cattcattgc 2700 acttcctggc ggcgtcggca cagcggagga gttttttgag gtgctgacat ggagccatct 2760 gggcctgcat aacaaaccgt gcgttctgct gaatgataat gaatactata gaccgctgct 2820 gtcatatatt gaacatgcag cggtcgaagg ctttatcaca cctgcgacaa gatcaagagt 2880 aatcgtgtgt aaagacattg aaggcgcgat tgcggcgatt agatcaccgt aaattaattc 2940 tagagtcgat ccccgggttc gccagcaatg actaccggca gcccgcc 2987 <210> 135 <211> 2954 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG7 <400> 135 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340 atcagtagcg atttattgcg gatcatcaat gggatctagc cctagatatg cagaagtagc 2400 taaagagatg ggagaggaac ttgcaagacg caatctgaga gtagtgtatg gaggaggaaa 2460 cgtcggactg atgggtacag tggccgacgc agcgttagcg gccggtggcg aggtggtagg 2520 cgtaattcca agacagttaa ttaaccgcga gatggcacat gccggtctga cagatttaga 2580 agtggtggac acaatggcgc agagaaaaac gagaatggag gaacttgccg atgcttttgt 2640 gtgtctgcct ggcggtgttg gcacgctgga agaagtcgtt gaagttctta caatgcaaca 2700 acttggccac gtccaaggcc cggtcggcct ggttaatgtt gacggctttt gggaaccgtt 2760 tgtcagaaca ctggaatcaa tggtcgcttg cggcttcgtt cagtcaagat acatcgatgc 2820 tatcgcactg tcttcagatc cggctgaaat tctggatgaa ttcgcaggct ggagcccgat 2880 cggcgcgaag tggagctaaa ttaattctag agtcgatccc cgggttcgcc agcaatgact 2940 accggcagcc cgcc 2954 <210> 136 <211> 3218 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG8 <400> 136 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggc 2340 ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400 aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460 atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520 gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580 taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640 gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700 cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760 cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820 ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880 cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940 aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000 agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060 gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120 aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagagtcga 3180 tccccgggtt cgccagcaat gactaccggc agcccgcc 3218 <210> 137 <211> 3122 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG9 <400> 137 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgtt 2340 attacatctt atttacggac ctacatgttc aggaaaaaca gacatggcca ttcaaattgc 2400 tcaagaaacg ggatggccgg ttgtggcgtt agacagagta cagtgctgcc cacagattgc 2460 aacgggctca ggtagaccgt tagaatctga gttacaatca acaagaagaa tctatctgga 2520 ttcacgccca ctgacagagg gcatcctgga cgcagagagc gcgcaccgcc gccttatctt 2580 tgaagtcgat tggcgcaaat ctgaggaggg ccttatcctt gaaggaggaa gcattagcct 2640 gcttaattgt atggcaaaat caccgttttg gagatctggc ttccagtggc acgtaaagag 2700 actgagactt ggcgattcag acgcatttct gacaagagca aaacagagag tcgcagaaat 2760 gttcgcgatt agagaagaca gaccaagcct gctggaggaa ttagctgaac tgtggaacta 2820 tccggctgcg cgccctattc tggaggatat tgatggttat cgctgtgcga ttagatttgc 2880 tagaaagcat gatctggcta tttcacaact gcctaatatc gatgcgggaa gacatgttga 2940 actgattgaa gccatcgcca acgaatacct ggaacatgcc ctgtcacagg aaagagattt 3000 tcctcaatgg ccggaagatg gtgccggcca accggtttgc ccggtgacac tgacaagaat 3060 tagataaatt aattctagag tcgatccccg ggttcgccag caatgactac cggcagcccg 3120 cc 3122 <210> 138 <211> 3038 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG10 <400> 138 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgga 2340 gattaaggga gagagcatgc aaaagtcaaa gttcagacgc atttgtgtgt tttgcggttc 2400 atcacagggc aaaaagtctt catatcaaga tgctgcagtt gatctgggta acgaattagt 2460 aagcagaaac atcgatcttg tctacggcgg tggctctatt ggacttatgg gcttagtgtc 2520 tcaagcagtc catgacggcg gtagacatgt catcggcatt attcctaaaa cgttaatgcc 2580 gcgcgagctg acaggcgaaa cagtaggaga ggtaagagcg gtggccgaca tgcatcaaag 2640 aaaagcggaa atggccaaac acagcgacgc atttattgct ttaccgggcg gctacggaac 2700 actggaagaa cttcttgagg tcatcacgtg ggcccagctg ggcattcatg ataaaccagt 2760 gggactgctg aatgtggatg gctattataa tagcctgctg tcatttattg ataaagcggt 2820 tgaagaagga ttcatttcac cgacggcaag agaaatcatt gtttcagcgc ctacagctaa 2880 agaactggtt aaaaaactgg aagagtatgc gccgtgccat gaaagagttg ctacaaaact 2940 gtgttgggaa atggagagaa tcggatattc atcagaagaa taaattaatt ctagagtcga 3000 tccccgggtt cgccagcaat gactaccggc agcccgcc 3038 <210> 139 <211> 3311 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT1 + LOG11 <400> 139 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggg 2340 tgtctcaatg ctggattctt cttggtcatt tcgcctttca agcaagatgt ctccaagccc 2400 gacgcaaaaa ttagccagct ctctgacaga acgcgatcca atcagcttaa atctgcgctt 2460 cgaccattca attagagcat atagcgcaag agctcttaag tgcagatctg tcaaatctga 2520 agatttcgtt gaaagatcat caccatttga agttaagaag gagctggaaa tttgctttga 2580 tcttgtccat agattaggta gaggcattgt ttaccttggc agcgctagaa ttccgccgaa 2640 ccacagccat tacctgcagg cacaggaatt atcaagagaa gcggcaacgt tacttgactg 2700 cacaacgtgg tcaggcgctg gacctggcct tatggatgcg gtgacggaag gtgcccttga 2760 ggcggaaaag ccggtaggtg gcatcaaaat tgaaaaagaa gcgggcgagt ggacggcgtc 2820 aaaattccac ccgtatttac ctccgcaaaa ttatcataca tgtagatttt tctcagcgag 2880 aaaacatggc cttgtcgatg ccgtaattag aaataatgtt tcagaaaaaa cagctatcat 2940 tgcactgccg ggcggcattg gaacattaga tgagatgttc gaaatcctgg ctctgattca 3000 actggagaga attggctcag ctctgccggt gccttttatc gtaatgaact acgacgcctt 3060 ttattcaaaa ctgctggaat ttatcgagac atgtgaaaat ctgggaacag tttcaaaagg 3120 agaagtgtca gcactgtgga aagtgtgtaa taacaacttt gaggccctga catatctggc 3180 ggaattttat gacctgcctg atggatcagc aaaactggag acagaactga gaaaaacaac 3240 acctacaaga ggataaatta attctagagt cgatccccgg gttcgccagc aatgactacc 3300 ggcagcccgc c 3311 <210> 140 <211> 2093 <212> DNA <213> Artificial Sequence <220> <223> operon EryR + AmyE END <400> 140 attaattcta gaaattaaga aggagggatt cgtcatgttg gtattccaaa tgcgttatgt 60 agataaaaca tctactgttt tgaaacagac taaaaacagt gattacgcag ataaataaat 120 acgttagatt aattcctacc agtgactaat cttatgactt tttaaacaga taactaaaat 180 tacaaacaaa tcgtttaact tctgtatttg tttatagatg taatcacttc aggagtgatt 240 acatgaacaa aaatataaaa tattctcaaa actttttaac gagtgaaaaa gtactcaacc 300 aaataataaa acaattgaat ttaaaagaaa ccgataccgt ttacgaaatt ggaacaggta 360 aagggcattt aacgacgaaa ctggctaaaa taagtaaaca ggtaacgtct attgaattag 420 acagtcatct attcaactta tcgtcagaaa aattaaaact gaacattcgt gtcactttaa 480 ttcaccaaga tattctacag tttcaattcc ctaacaaaca gaggtataaa attgttggga 540 atattcctta ccatttaagc acacaaatta ttaaaaaagt ggtttttgaa agccatgcgt 600 ctgacatcta tctgattgtt gaagaaggat tctacaagcg taccttggat attcaccgaa 660 cactagggtt gctcttgcac actcaagtct cgattcagca attgcttaag ctgccagcgg 720 aatgctttca tcctaaacca aaagtaaaca gtgtcttaat aaaacttacc cgccatacca 780 cagatgttcc agataaatat tggaagctat atacgtactt tgtttcaaaa tgggtcaatc 840 gagaatatcg tcaactgttt actaaaaatc agtttcatca agcaatgaaa cacgccaaag 900 taaacaattt aagtaccgtt acttatgagc aagtattgtc tatttttaat agttatctat 960 tatttaacgg gaggaaataa ttctatgagt cgcttttgta aatttggaaa gttacacgtt 1020 actaaaggga atgtagatgg atcctgtatg ccaatgatga tgaagagtcg acatggatga 1080 gcgatgatga tatccgttta ggctgggcgg tgatagcttc tcgttcaggc agtacgcctc 1140 ttttcttttc cagacctgag ggaggcggaa atggtgtgag gttcccgggg aaaagccaaa 1200 taggcgatcg cgggagtgct ttatttgaag atcaggctat cactgcggtc aatagatttc 1260 acaatgtgat ggctggacag cctgaggaac tctcgaaccc gaatggaaac aaccagatat 1320 ttatgaatca gcgcggctca catggcgttg tgctggcaaa tgcaggttca tcctctgtct 1380 ctatcaatac ggcaacaaaa ttgcctgatg gcaggtatga caataaagct ggagcgggtt 1440 catttcaagt gaacgatggt aaactgacag gcacgatcaa tgccaggtct gtagctgtgc 1500 tttatcctga tgatattgca aaagcgcctc atgttttcct tgagaattac aaaacaggtg 1560 taacacattc tttcaatgat caactgacga ttaccttgcg tgcagatgcg aatacaacaa 1620 aagccgttta tcaaatcaat aatggaccag agacggcgtt taaggatgga gatcaattca 1680 caatcggaaa aggagatcca tttggcaaaa catacaccat catgttaaaa ggaacgaaca 1740 gtgatggtgt aacgaggacc gagaaataca gttttgttaa aagagatcca gcgtcggcca 1800 aaaccatcgg ctatcaaaat ccgaatcatt ggagccaggt aaatgcttat atctataaac 1860 atgatgggag ccgagtaatt gaattgaccg gatcttggcc tggaaaacca atgactaaaa 1920 atgcagacgg aatttacacg ctgacgctgc ctgcggacac ggatacaacc aacgcaaaag 1980 tgatttttaa taatggcagc gcccaagtgc ccggtcagaa tcagcctggc tttgattacg 2040 tgctaaatgg tttatataat gactcgggct taagcggttc tcttccccat tga 2093 <210> 141 <211> 5003 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG2 EryR AmyE END operon <400> 141 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340 aacaatctgt gtattcgctg gcagcaaccc tggcggtaat gaagcttaca agagaaaggc 2400 cgctgaactg ggtgtgtata tggcggaaca gggaatcgga ttagtatacg gtggctctcg 2460 cgtcggactg atgggcacga ttgcagacgc aatcatggag aacggcggca cggcaattgg 2520 agttatgcca tctggattat tttctggaga agttgtccat cagaatctga cagagctgat 2580 tgaggtcaat ggcatgcacg agagaaaagc caaaatgtca gagctggcgg atggtttcat 2640 cagcatgcct ggaggatttg gaacatacga ggagcttttt gaagttcttt gctgggcgca 2700 aattggcatt catcaaaaac cgattggcct gtataatgtg aacggctatt ttgaaccgat 2760 gatgaagatg gtgaaatatt caattcaaga aggctttagc aatgaatcac atcttaaact 2820 gatccactca tcatcaagac cggatgaact gatcgaacaa atgcagaatt attcatatcc 2880 gattttagaa aaaaaatgga cagaaattta aattaattct agaaattaag aaggagggat 2940 tcgtcatgtt ggtattccaa atgcgttatg tagataaaac atctactgtt ttgaaacaga 3000 ctaaaaacag tgattacgca gataaataaa tacgttagat taattcctac cagtgactaa 3060 tcttatgact ttttaaacag ataactaaaa ttacaaacaa atcgtttaac ttctgtattt 3120 gtttatagat gtaatcactt caggagtgat tacatgaaca aaaatataaa atattctcaa 3180 aactttttaa cgagtgaaaa agtactcaac caaataataa aacaattgaa tttaaaagaa 3240 accgataccg tttacgaaat tggaacaggt aaagggcatt taacgacgaa actggctaaa 3300 ataagtaaac aggtaacgtc tattgaatta gacagtcatc tattcaactt atcgtcagaa 3360 aaattaaaac tgaacattcg tgtcacttta attcaccaag atattctaca gtttcaattc 3420 cctaacaaac agaggtataa aattgttggg aatattcctt accatttaag cacacaaatt 3480 attaaaaaag tggtttttga aagccatgcg tctgacatct atctgattgt tgaagaagga 3540 ttctacaagc gtaccttgga tattcaccga acactagggt tgctcttgca cactcaagtc 3600 tcgattcagc aattgcttaa gctgccagcg gaatgctttc atcctaaacc aaaagtaaac 3660 agtgtcttaa taaaacttac ccgccatacc acagatgttc cagataaata ttggaagcta 3720 tatacgtact ttgtttcaaa atgggtcaat cgagaatatc gtcaactgtt tactaaaaat 3780 cagtttcatc aagcaatgaa acacgccaaa gtaaacaatt taagtaccgt tacttatgag 3840 caagtattgt ctatttttaa tagttatcta ttatttaacg ggaggaaata attctatgag 3900 tcgcttttgt aaatttggaa agttacacgt tactaaaggg aatgtagatg gatcctgtat 3960 gccaatgatg atgaagagtc gacatggatg agcgatgatg atatccgttt aggctgggcg 4020 gtgatagctt ctcgttcagg cagtacgcct cttttctttt ccagacctga gggaggcgga 4080 aatggtgtga ggttcccggg gaaaagccaa ataggcgatc gcgggagtgc tttatttgaa 4140 gatcaggcta tcactgcggt caatagattt cacaatgtga tggctggaca gcctgaggaa 4200 ctctcgaacc cgaatggaaa caaccagata tttatgaatc agcgcggctc acatggcgtt 4260 gtgctggcaa atgcaggttc atcctctgtc tctatcaata cggcaacaaa attgcctgat 4320 ggcaggtatg acaataaagc tggagcgggt tcatttcaag tgaacgatgg taaactgaca 4380 ggcacgatca atgccaggtc tgtagctgtg ctttatcctg atgatattgc aaaagcgcct 4440 catgttttcc ttgagaatta caaaacaggt gtaacacatt ctttcaatga tcaactgacg 4500 attaccttgc gtgcagatgc gaatacaaca aaagccgttt atcaaatcaa taatggacca 4560 gagacggcgt ttaaggatgg agatcaattc acaatcggaa aaggagatcc atttggcaaa 4620 acatacacca tcatgttaaa aggaacgaac agtgatggtg taacgaggac cgagaaatac 4680 agttttgtta aaagagatcc agcgtcggcc aaaaccatcg gctatcaaaa tccgaatcat 4740 tggagccagg taaatgctta tatctataaa catgatggga gccgagtaat tgaattgacc 4800 ggatcttggc ctggaaaacc aatgactaaa aatgcagacg gaatttacac gctgacgctg 4860 cctgcggaca cggatacaac caacgcaaaa gtgattttta ataatggcag cgcccaagtg 4920 cccggtcaga atcagcctgg ctttgattac gtgctaaatg gtttatataa tgactcgggc 4980 ttaagcggtt ctcttcccca ttg 5003 <210> 142 <211> 5198 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG3 EryR AmyE END operon <400> 142 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggc 2340 accgaaacag acaccttctc cagaaaaaaa tagaaacctt gtgggtccag tgctgcaacg 2400 ccgccaaaca gagggcacgt ttgaccagcg cctgcttgaa atgagagcag accacaattg 2460 gaagcacgca gacccgtgga gagtgttaag aattcagtca gagtttgttg caggatttga 2520 tgctctgcat gagatgccga aggcggtcac agtgtttgga agcgcgagaa ttaaagagga 2580 tcatccttat tataaagcag gtgttgagct tggagaaaaa cttgttgccg ctgattacgc 2640 ggttgtaacg ggcggaggcc ctggccttat ggaagcaccg aataaaggag cgtcagaagc 2700 caatggctta tcagtcggtt taggtattga acttcctcac gagcagcatt taaacccgta 2760 tgtggatctg ggattaaatt ttagatactt ttttgctaga aagacgatgt ttctgaaata 2820 ttcacaagct tttgtctgtc tgccgggcgg cttcggaaca ctggacgaac tgttcgaagt 2880 gctgtgcatg gtccaaacag gcaaagttac aaacttcccg attgtactga tcggcacaga 2940 attctgggct ggcctggttg actggatcag acatagactg gtcgaagaag gcatgattga 3000 tgaaaaagat gtagacagaa tgctggtaac agatgatctg gatcaagccg ttaagttcat 3060 cgtcgatgcc catgccggcc tggatgtagc gagaagacat aactaaatta attctagaaa 3120 ttaagaagga gggattcgtc atgttggtat tccaaatgcg ttatgtagat aaaacatcta 3180 ctgttttgaa acagactaaa aacagtgatt acgcagataa ataaatacgt tagattaatt 3240 cctaccagtg actaatctta tgacttttta aacagataac taaaattaca aacaaatcgt 3300 ttaacttctg tatttgttta tagatgtaat cacttcagga gtgattacat gaacaaaaat 3360 ataaaatatt ctcaaaactt tttaacgagt gaaaaagtac tcaaccaaat aataaaacaa 3420 ttgaatttaa aagaaaccga taccgtttac gaaattggaa caggtaaagg gcatttaacg 3480 acgaaactgg ctaaaataag taaacaggta acgtctattg aattagacag tcatctattc 3540 aacttatcgt cagaaaaatt aaaactgaac attcgtgtca ctttaattca ccaagatatt 3600 ctacagtttc aattccctaa caaacagagg tataaaattg ttgggaatat tccttaccat 3660 ttaagcacac aaattattaa aaaagtggtt tttgaaagcc atgcgtctga catctatctg 3720 attgttgaag aaggattcta caagcgtacc ttggatattc accgaacact agggttgctc 3780 ttgcacactc aagtctcgat tcagcaattg cttaagctgc cagcggaatg ctttcatcct 3840 aaaccaaaag taaacagtgt cttaataaaa cttacccgcc ataccacaga tgttccagat 3900 aaatattgga agctatatac gtactttgtt tcaaaatggg tcaatcgaga atatcgtcaa 3960 ctgtttacta aaaatcagtt tcatcaagca atgaaacacg ccaaagtaaa caatttaagt 4020 accgttactt atgagcaagt attgtctatt tttaatagtt atctattatt taacgggagg 4080 aaataattct atgagtcgct tttgtaaatt tggaaagtta cacgttacta aagggaatgt 4140 agatggatcc tgtatgccaa tgatgatgaa gagtcgacat ggatgagcga tgatgatatc 4200 cgtttaggct gggcggtgat agcttctcgt tcaggcagta cgcctctttt cttttccaga 4260 cctgagggag gcggaaatgg tgtgaggttc ccggggaaaa gccaaatagg cgatcgcggg 4320 agtgctttat ttgaagatca ggctatcact gcggtcaata gatttcacaa tgtgatggct 4380 ggacagcctg aggaactctc gaacccgaat ggaaacaacc agatatttat gaatcagcgc 4440 ggctcacatg gcgttgtgct ggcaaatgca ggttcatcct ctgtctctat caatacggca 4500 acaaaattgc ctgatggcag gtatgacaat aaagctggag cgggttcatt tcaagtgaac 4560 gatggtaaac tgacaggcac gatcaatgcc aggtctgtag ctgtgcttta tcctgatgat 4620 attgcaaaag cgcctcatgt tttccttgag aattacaaaa caggtgtaac acattctttc 4680 aatgatcaac tgacgattac cttgcgtgca gatgcgaata caacaaaagc cgtttatcaa 4740 atcaataatg gaccagagac ggcgtttaag gatggagatc aattcacaat cggaaaagga 4800 gatccatttg gcaaaacata caccatcatg ttaaaaggaa cgaacagtga tggtgtaacg 4860 aggaccgaga aatacagttt tgttaaaaga gatccagcgt cggccaaaac catcggctat 4920 caaaatccga atcattggag ccaggtaaat gcttatatct ataaacatga tgggagccga 4980 gtaattgaat tgaccggatc ttggcctgga aaaccaatga ctaaaaatgc agacggaatt 5040 tacacgctga cgctgcctgc ggacacggat acaaccaacg caaaagtgat ttttaataat 5100 ggcagcgccc aagtgcccgg tcagaatcag cctggctttg attacgtgct aaatggttta 5160 tataatgact cgggcttaag cggttctctt ccccattg 5198 <210> 143 <211> 5015 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG4 EryR AmyE END operon <400> 143 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgac 2340 gcttagatca gtctgtgtgt tctgcggcgc gagcccggga gcttctccgg tttatcaaga 2400 agctgctgtg gcccttggta gacatttagc ggaacgcgga ctgacgttag tatatggcgg 2460 aggtgccgta ggactgatgg gtacagtggc cgacgccgct ctggcggcgg gcggagaagt 2520 tattggtatt atccctcaat cacttcagga ggccgaaatt ggccataaag gcttaacaag 2580 attagaagtt gtagatggca tgcatgcacg caaggctaga atggctgagt tagctgatgc 2640 ctttatcgcg cttccgggcg gacttggaac acttgaggaa ctgtttgagg tctggacatg 2700 gggccagtta ggctaccacg caaaaccact gggcctgctg gaagttaatg gcttctatga 2760 tcctctgctg acatttctgg accacctggt cgatgaaaga tttgtgagag cggaacatag 2820 aggcatgctg cagagaggag cgtcacctga agcactgctg gacgcactgg cagcatggac 2880 accgtcagtc gcaccgaaat gggttgatag aacaccacaa taaattaatt ctagaaatta 2940 agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3000 ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3060 accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3120 acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3180 aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3240 aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3300 aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3360 ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3420 cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3480 agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3540 gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3600 cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3660 ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3720 tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 3780 tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 3840 gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 3900 taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 3960 tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4020 ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4080 gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4140 gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4200 cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4260 tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4320 aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4380 ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4440 gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4500 gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4560 aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4620 ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4680 accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4740 aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 4800 attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 4860 acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 4920 agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 4980 aatgactcgg gcttaagcgg ttctcttccc cattg 5015 <210> 144 <211> 5198 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG5 EryR AmyE END operon <400> 144 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340 cagcgttgac gaccctggtt catacgaaca gattggcagc gagaagccgg caaagcataa 2400 aggctctgtt gtactgcgca gaggcagaaa tacggaaaca tctacgtcag accaacgctt 2460 attagatgaa agaggttcag gtaattggat ccattctgat acgtggcgcg tcttacgcat 2520 tcagagcgaa tttgtggaag gctttggtgc gctggccgaa gttcctagag ctgtcacagt 2580 attcggcagc gccagaacgc cagtcgatca cccggaatac gagagagcta gagagttagg 2640 agccgcgctt gctagagaag gatttgcggt aattacaggc ggtggaccag gcgtcatgga 2700 gggagctaac agaggagcgt cagaggcgga tggctattca attggccttg gcatcgagct 2760 gccgttcgaa caaggcttaa acgactgggt agatcttgga gtgaatttca gatatttttt 2820 tgtaagaaaa acaatgttcg tgaaatattc acaggccttt gtgtgccttc cgggcggctt 2880 tggaacactg gacgaactgt ttgaagcact gacacttgtt caaacagcaa aagtcacaag 2940 atttccgatt gttctgctgg gaaaggactt ctggtcagga ctgctggatt ggattaaaac 3000 aacactggtt aaagagggca aagtctcaga aaaagatctg gatctgatcc attgtacaga 3060 ttcagtggat gaagcagtga gaatcgttag agaagcacaa cagtaaatta attctagaaa 3120 ttaagaagga gggattcgtc atgttggtat tccaaatgcg ttatgtagat aaaacatcta 3180 ctgttttgaa acagactaaa aacagtgatt acgcagataa ataaatacgt tagattaatt 3240 cctaccagtg actaatctta tgacttttta aacagataac taaaattaca aacaaatcgt 3300 ttaacttctg tatttgttta tagatgtaat cacttcagga gtgattacat gaacaaaaat 3360 ataaaatatt ctcaaaactt tttaacgagt gaaaaagtac tcaaccaaat aataaaacaa 3420 ttgaatttaa aagaaaccga taccgtttac gaaattggaa caggtaaagg gcatttaacg 3480 acgaaactgg ctaaaataag taaacaggta acgtctattg aattagacag tcatctattc 3540 aacttatcgt cagaaaaatt aaaactgaac attcgtgtca ctttaattca ccaagatatt 3600 ctacagtttc aattccctaa caaacagagg tataaaattg ttgggaatat tccttaccat 3660 ttaagcacac aaattattaa aaaagtggtt tttgaaagcc atgcgtctga catctatctg 3720 attgttgaag aaggattcta caagcgtacc ttggatattc accgaacact agggttgctc 3780 ttgcacactc aagtctcgat tcagcaattg cttaagctgc cagcggaatg ctttcatcct 3840 aaaccaaaag taaacagtgt cttaataaaa cttacccgcc ataccacaga tgttccagat 3900 aaatattgga agctatatac gtactttgtt tcaaaatggg tcaatcgaga atatcgtcaa 3960 ctgtttacta aaaatcagtt tcatcaagca atgaaacacg ccaaagtaaa caatttaagt 4020 accgttactt atgagcaagt attgtctatt tttaatagtt atctattatt taacgggagg 4080 aaataattct atgagtcgct tttgtaaatt tggaaagtta cacgttacta aagggaatgt 4140 agatggatcc tgtatgccaa tgatgatgaa gagtcgacat ggatgagcga tgatgatatc 4200 cgtttaggct gggcggtgat agcttctcgt tcaggcagta cgcctctttt cttttccaga 4260 cctgagggag gcggaaatgg tgtgaggttc ccggggaaaa gccaaatagg cgatcgcggg 4320 agtgctttat ttgaagatca ggctatcact gcggtcaata gatttcacaa tgtgatggct 4380 ggacagcctg aggaactctc gaacccgaat ggaaacaacc agatatttat gaatcagcgc 4440 ggctcacatg gcgttgtgct ggcaaatgca ggttcatcct ctgtctctat caatacggca 4500 acaaaattgc ctgatggcag gtatgacaat aaagctggag cgggttcatt tcaagtgaac 4560 gatggtaaac tgacaggcac gatcaatgcc aggtctgtag ctgtgcttta tcctgatgat 4620 attgcaaaag cgcctcatgt tttccttgag aattacaaaa caggtgtaac acattctttc 4680 aatgatcaac tgacgattac cttgcgtgca gatgcgaata caacaaaagc cgtttatcaa 4740 atcaataatg gaccagagac ggcgtttaag gatggagatc aattcacaat cggaaaagga 4800 gatccatttg gcaaaacata caccatcatg ttaaaaggaa cgaacagtga tggtgtaacg 4860 aggaccgaga aatacagttt tgttaaaaga gatccagcgt cggccaaaac catcggctat 4920 caaaatccga atcattggag ccaggtaaat gcttatatct ataaacatga tgggagccga 4980 gtaattgaat tgaccggatc ttggcctgga aaaccaatga ctaaaaatgc agacggaatt 5040 tacacgctga cgctgcctgc ggacacggat acaaccaacg caaaagtgat ttttaataat 5100 ggcagcgccc aagtgcccgg tcagaatcag cctggctttg attacgtgct aaatggttta 5160 tataatgact cgggcttaag cggttctctt ccccattg 5198 <210> 145 <211> 5024 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG6 EryR AmyE END operon <400> 145 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340 tttacgcccg atgcctgcca cgacggttag cgcccaagca agaccaacgc caaagtcagt 2400 tacggtgttc tgcggagcta tgccgggtag aggaacaaaa tacggtcaac ttgctgaggg 2460 catgggtaga gctattgcta gaagcaaatt aagacttgta tatggaggag cgagagtcgg 2520 ccttatggga acactggcaa acgcagcctt agactctggc ggtacagtcg ttggagtcat 2580 tcctgaatca tttacagcta tccctgaagc cgcccaccac ggactgacag aactgcatgt 2640 agtgcacgat atgcatcaaa gaaaagcctt aatggctgag ctgggcgatg cattcattgc 2700 acttcctggc ggcgtcggca cagcggagga gttttttgag gtgctgacat ggagccatct 2760 gggcctgcat aacaaaccgt gcgttctgct gaatgataat gaatactata gaccgctgct 2820 gtcatatatt gaacatgcag cggtcgaagg ctttatcaca cctgcgacaa gatcaagagt 2880 aatcgtgtgt aaagacattg aaggcgcgat tgcggcgatt agatcaccgt aaattaattc 2940 tagaaattaa gaaggaggga ttcgtcatgt tggtattcca aatgcgttat gtagataaaa 3000 catctactgt tttgaaacag actaaaaaca gtgattacgc agataaataa atacgttaga 3060 ttaattccta ccagtgacta atcttatgac tttttaaaca gataactaaa attacaaaca 3120 aatcgtttaa cttctgtatt tgtttataga tgtaatcact tcaggagtga ttacatgaac 3180 aaaaatataa aatattctca aaacttttta acgagtgaaa aagtactcaa ccaaataata 3240 aaacaattga atttaaaaga aaccgatacc gtttacgaaa ttggaacagg taaagggcat 3300 ttaacgacga aactggctaa aataagtaaa caggtaacgt ctattgaatt agacagtcat 3360 ctattcaact tatcgtcaga aaaattaaaa ctgaacattc gtgtcacttt aattcaccaa 3420 gatattctac agtttcaatt ccctaacaaa cagaggtata aaattgttgg gaatattcct 3480 taccatttaa gcacacaaat tattaaaaaa gtggtttttg aaagccatgc gtctgacatc 3540 tatctgattg ttgaagaagg attctacaag cgtaccttgg atattcaccg aacactaggg 3600 ttgctcttgc acactcaagt ctcgattcag caattgctta agctgccagc ggaatgcttt 3660 catcctaaac caaaagtaaa cagtgtctta ataaaactta cccgccatac cacagatgtt 3720 ccagataaat attggaagct atatacgtac tttgtttcaa aatgggtcaa tcgagaatat 3780 cgtcaactgt ttactaaaaa tcagtttcat caagcaatga aacacgccaa agtaaacaat 3840 ttaagtaccg ttacttatga gcaagtattg tctattttta atagttatct attatttaac 3900 gggaggaaat aattctatga gtcgcttttg taaatttgga aagttacacg ttactaaagg 3960 gaatgtagat ggatcctgta tgccaatgat gatgaagagt cgacatggat gagcgatgat 4020 gatatccgtt taggctgggc ggtgatagct tctcgttcag gcagtacgcc tcttttcttt 4080 tccagacctg agggaggcgg aaatggtgtg aggttcccgg ggaaaagcca aataggcgat 4140 cgcgggagtg ctttatttga agatcaggct atcactgcgg tcaatagatt tcacaatgtg 4200 atggctggac agcctgagga actctcgaac ccgaatggaa acaaccagat atttatgaat 4260 cagcgcggct cacatggcgt tgtgctggca aatgcaggtt catcctctgt ctctatcaat 4320 acggcaacaa aattgcctga tggcaggtat gacaataaag ctggagcggg ttcatttcaa 4380 gtgaacgatg gtaaactgac aggcacgatc aatgccaggt ctgtagctgt gctttatcct 4440 gatgatattg caaaagcgcc tcatgttttc cttgagaatt acaaaacagg tgtaacacat 4500 tctttcaatg atcaactgac gattaccttg cgtgcagatg cgaatacaac aaaagccgtt 4560 tatcaaatca ataatggacc agagacggcg tttaaggatg gagatcaatt cacaatcgga 4620 aaaggagatc catttggcaa aacatacacc atcatgttaa aaggaacgaa cagtgatggt 4680 gtaacgagga ccgagaaata cagttttgtt aaaagagatc cagcgtcggc caaaaccatc 4740 ggctatcaaa atccgaatca ttggagccag gtaaatgctt atatctataa acatgatggg 4800 agccgagtaa ttgaattgac cggatcttgg cctggaaaac caatgactaa aaatgcagac 4860 ggaatttaca cgctgacgct gcctgcggac acggatacaa ccaacgcaaa agtgattttt 4920 aataatggca gcgcccaagt gcccggtcag aatcagcctg gctttgatta cgtgctaaat 4980 ggtttatata atgactcggg cttaagcggt tctcttcccc attg 5024 <210> 146 <211> 4991 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG7 EryR AmyE END operon <400> 146 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgaa 2340 atcagtagcg atttattgcg gatcatcaat gggatctagc cctagatatg cagaagtagc 2400 taaagagatg ggagaggaac ttgcaagacg caatctgaga gtagtgtatg gaggaggaaa 2460 cgtcggactg atgggtacag tggccgacgc agcgttagcg gccggtggcg aggtggtagg 2520 cgtaattcca agacagttaa ttaaccgcga gatggcacat gccggtctga cagatttaga 2580 agtggtggac acaatggcgc agagaaaaac gagaatggag gaacttgccg atgcttttgt 2640 gtgtctgcct ggcggtgttg gcacgctgga agaagtcgtt gaagttctta caatgcaaca 2700 acttggccac gtccaaggcc cggtcggcct ggttaatgtt gacggctttt gggaaccgtt 2760 tgtcagaaca ctggaatcaa tggtcgcttg cggcttcgtt cagtcaagat acatcgatgc 2820 tatcgcactg tcttcagatc cggctgaaat tctggatgaa ttcgcaggct ggagcccgat 2880 cggcgcgaag tggagctaaa ttaattctag aaattaagaa ggagggattc gtcatgttgg 2940 tattccaaat gcgttatgta gataaaacat ctactgtttt gaaacagact aaaaacagtg 3000 attacgcaga taaataaata cgttagatta attcctacca gtgactaatc ttatgacttt 3060 ttaaacagat aactaaaatt acaaacaaat cgtttaactt ctgtatttgt ttatagatgt 3120 aatcacttca ggagtgatta catgaacaaa aatataaaat attctcaaaa ctttttaacg 3180 agtgaaaaag tactcaacca aataataaaa caattgaatt taaaagaaac cgataccgtt 3240 tacgaaattg gaacaggtaa agggcattta acgacgaaac tggctaaaat aagtaaacag 3300 gtaacgtcta ttgaattaga cagtcatcta ttcaacttat cgtcagaaaa attaaaactg 3360 aacattcgtg tcactttaat tcaccaagat attctacagt ttcaattccc taacaaacag 3420 aggtataaaa ttgttgggaa tattccttac catttaagca cacaaattat taaaaaagtg 3480 gtttttgaaa gccatgcgtc tgacatctat ctgattgttg aagaaggatt ctacaagcgt 3540 accttggata ttcaccgaac actagggttg ctcttgcaca ctcaagtctc gattcagcaa 3600 ttgcttaagc tgccagcgga atgctttcat cctaaaccaa aagtaaacag tgtcttaata 3660 aaacttaccc gccataccac agatgttcca gataaatatt ggaagctata tacgtacttt 3720 gtttcaaaat gggtcaatcg agaatatcgt caactgttta ctaaaaatca gtttcatcaa 3780 gcaatgaaac acgccaaagt aaacaattta agtaccgtta cttatgagca agtattgtct 3840 atttttaata gttatctatt atttaacggg aggaaataat tctatgagtc gcttttgtaa 3900 atttggaaag ttacacgtta ctaaagggaa tgtagatgga tcctgtatgc caatgatgat 3960 gaagagtcga catggatgag cgatgatgat atccgtttag gctgggcggt gatagcttct 4020 cgttcaggca gtacgcctct tttcttttcc agacctgagg gaggcggaaa tggtgtgagg 4080 ttcccgggga aaagccaaat aggcgatcgc gggagtgctt tatttgaaga tcaggctatc 4140 actgcggtca atagatttca caatgtgatg gctggacagc ctgaggaact ctcgaacccg 4200 aatggaaaca accagatatt tatgaatcag cgcggctcac atggcgttgt gctggcaaat 4260 gcaggttcat cctctgtctc tatcaatacg gcaacaaaat tgcctgatgg caggtatgac 4320 aataaagctg gagcgggttc atttcaagtg aacgatggta aactgacagg cacgatcaat 4380 gccaggtctg tagctgtgct ttatcctgat gatattgcaa aagcgcctca tgttttcctt 4440 gagaattaca aaacaggtgt aacacattct ttcaatgatc aactgacgat taccttgcgt 4500 gcagatgcga atacaacaaa agccgtttat caaatcaata atggaccaga gacggcgttt 4560 aaggatggag atcaattcac aatcggaaaa ggagatccat ttggcaaaac atacaccatc 4620 atgttaaaag gaacgaacag tgatggtgta acgaggaccg agaaatacag ttttgttaaa 4680 agagatccag cgtcggccaa aaccatcggc tatcaaaatc cgaatcattg gagccaggta 4740 aatgcttata tctataaaca tgatgggagc cgagtaattg aattgaccgg atcttggcct 4800 ggaaaaccaa tgactaaaaa tgcagacgga atttacacgc tgacgctgcc tgcggacacg 4860 gatacaacca acgcaaaagt gatttttaat aatggcagcg cccaagtgcc cggtcagaat 4920 cagcctggct ttgattacgt gctaaatggt ttatataatg actcgggctt aagcggttct 4980 cttccccatt g 4991 <210> 147 <211> 5255 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG8 EryR AmyE END operon <400> 147 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggc 2340 ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400 aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460 atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520 gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580 taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640 gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700 cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760 cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820 ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880 cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940 aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000 agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060 gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120 aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagaaatta 3180 agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3240 ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3300 accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3360 acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3420 aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3480 aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3540 aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3600 ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3660 cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3720 agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3780 gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3840 cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3900 ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3960 tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 4020 tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 4080 gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 4140 taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 4200 tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4260 ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4320 gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4380 gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4440 cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4500 tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4560 aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4620 ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4680 gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4740 gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4800 aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4860 ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4920 accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4980 aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 5040 attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 5100 acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 5160 agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 5220 aatgactcgg gcttaagcgg ttctcttccc cattg 5255 <210> 148 <211> 5159 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG9 EryR AmyE END operon <400> 148 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgtt 2340 attacatctt atttacggac ctacatgttc aggaaaaaca gacatggcca ttcaaattgc 2400 tcaagaaacg ggatggccgg ttgtggcgtt agacagagta cagtgctgcc cacagattgc 2460 aacgggctca ggtagaccgt tagaatctga gttacaatca acaagaagaa tctatctgga 2520 ttcacgccca ctgacagagg gcatcctgga cgcagagagc gcgcaccgcc gccttatctt 2580 tgaagtcgat tggcgcaaat ctgaggaggg ccttatcctt gaaggaggaa gcattagcct 2640 gcttaattgt atggcaaaat caccgttttg gagatctggc ttccagtggc acgtaaagag 2700 actgagactt ggcgattcag acgcatttct gacaagagca aaacagagag tcgcagaaat 2760 gttcgcgatt agagaagaca gaccaagcct gctggaggaa ttagctgaac tgtggaacta 2820 tccggctgcg cgccctattc tggaggatat tgatggttat cgctgtgcga ttagatttgc 2880 tagaaagcat gatctggcta tttcacaact gcctaatatc gatgcgggaa gacatgttga 2940 actgattgaa gccatcgcca acgaatacct ggaacatgcc ctgtcacagg aaagagattt 3000 tcctcaatgg ccggaagatg gtgccggcca accggtttgc ccggtgacac tgacaagaat 3060 tagataaatt aattctagaa attaagaagg agggattcgt catgttggta ttccaaatgc 3120 gttatgtaga taaaacatct actgttttga aacagactaa aaacagtgat tacgcagata 3180 aataaatacg ttagattaat tcctaccagt gactaatctt atgacttttt aaacagataa 3240 ctaaaattac aaacaaatcg tttaacttct gtatttgttt atagatgtaa tcacttcagg 3300 agtgattaca tgaacaaaaa tataaaatat tctcaaaact ttttaacgag tgaaaaagta 3360 ctcaaccaaa taataaaaca attgaattta aaagaaaccg ataccgttta cgaaattgga 3420 acaggtaaag ggcatttaac gacgaaactg gctaaaataa gtaaacaggt aacgtctatt 3480 gaattagaca gtcatctatt caacttatcg tcagaaaaat taaaactgaa cattcgtgtc 3540 actttaattc accaagatat tctacagttt caattcccta acaaacagag gtataaaatt 3600 gttgggaata ttccttacca tttaagcaca caaattatta aaaaagtggt ttttgaaagc 3660 catgcgtctg acatctatct gattgttgaa gaaggattct acaagcgtac cttggatatt 3720 caccgaacac tagggttgct cttgcacact caagtctcga ttcagcaatt gcttaagctg 3780 ccagcggaat gctttcatcc taaaccaaaa gtaaacagtg tcttaataaa acttacccgc 3840 cataccacag atgttccaga taaatattgg aagctatata cgtactttgt ttcaaaatgg 3900 gtcaatcgag aatatcgtca actgtttact aaaaatcagt ttcatcaagc aatgaaacac 3960 gccaaagtaa acaatttaag taccgttact tatgagcaag tattgtctat ttttaatagt 4020 tatctattat ttaacgggag gaaataattc tatgagtcgc ttttgtaaat ttggaaagtt 4080 acacgttact aaagggaatg tagatggatc ctgtatgcca atgatgatga agagtcgaca 4140 tggatgagcg atgatgatat ccgtttaggc tgggcggtga tagcttctcg ttcaggcagt 4200 acgcctcttt tcttttccag acctgaggga ggcggaaatg gtgtgaggtt cccggggaaa 4260 agccaaatag gcgatcgcgg gagtgcttta tttgaagatc aggctatcac tgcggtcaat 4320 agatttcaca atgtgatggc tggacagcct gaggaactct cgaacccgaa tggaaacaac 4380 cagatattta tgaatcagcg cggctcacat ggcgttgtgc tggcaaatgc aggttcatcc 4440 tctgtctcta tcaatacggc aacaaaattg cctgatggca ggtatgacaa taaagctgga 4500 gcgggttcat ttcaagtgaa cgatggtaaa ctgacaggca cgatcaatgc caggtctgta 4560 gctgtgcttt atcctgatga tattgcaaaa gcgcctcatg ttttccttga gaattacaaa 4620 acaggtgtaa cacattcttt caatgatcaa ctgacgatta ccttgcgtgc agatgcgaat 4680 acaacaaaag ccgtttatca aatcaataat ggaccagaga cggcgtttaa ggatggagat 4740 caattcacaa tcggaaaagg agatccattt ggcaaaacat acaccatcat gttaaaagga 4800 acgaacagtg atggtgtaac gaggaccgag aaatacagtt ttgttaaaag agatccagcg 4860 tcggccaaaa ccatcggcta tcaaaatccg aatcattgga gccaggtaaa tgcttatatc 4920 tataaacatg atgggagccg agtaattgaa ttgaccggat cttggcctgg aaaaccaatg 4980 actaaaaatg cagacggaat ttacacgctg acgctgcctg cggacacgga tacaaccaac 5040 gcaaaagtga tttttaataa tggcagcgcc caagtgcccg gtcagaatca gcctggcttt 5100 gattacgtgc taaatggttt atataatgac tcgggcttaa gcggttctct tccccattg 5159 <210> 149 <211> 5075 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG10 EryR AmyE END operon <400> 149 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatgga 2340 gattaaggga gagagcatgc aaaagtcaaa gttcagacgc atttgtgtgt tttgcggttc 2400 atcacagggc aaaaagtctt catatcaaga tgctgcagtt gatctgggta acgaattagt 2460 aagcagaaac atcgatcttg tctacggcgg tggctctatt ggacttatgg gcttagtgtc 2520 tcaagcagtc catgacggcg gtagacatgt catcggcatt attcctaaaa cgttaatgcc 2580 gcgcgagctg acaggcgaaa cagtaggaga ggtaagagcg gtggccgaca tgcatcaaag 2640 aaaagcggaa atggccaaac acagcgacgc atttattgct ttaccgggcg gctacggaac 2700 actggaagaa cttcttgagg tcatcacgtg ggcccagctg ggcattcatg ataaaccagt 2760 gggactgctg aatgtggatg gctattataa tagcctgctg tcatttattg ataaagcggt 2820 tgaagaagga ttcatttcac cgacggcaag agaaatcatt gtttcagcgc ctacagctaa 2880 agaactggtt aaaaaactgg aagagtatgc gccgtgccat gaaagagttg ctacaaaact 2940 gtgttgggaa atggagagaa tcggatattc atcagaagaa taaattaatt ctagaaatta 3000 agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3060 ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3120 accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3180 acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3240 aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3300 aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3360 aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3420 ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3480 cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3540 agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3600 gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3660 cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3720 ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3780 tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 3840 tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 3900 gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 3960 taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 4020 tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4080 ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4140 gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4200 gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4260 cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4320 tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4380 aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4440 ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4500 gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4560 gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4620 aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4680 ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4740 accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4800 aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 4860 attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 4920 acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 4980 agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 5040 aatgactcgg gcttaagcgg ttctcttccc cattg 5075 <210> 150 <211> 5348 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT1 LOG11 EryR AmyE END operon <400> 150 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta aaaaagaggg gagggaaaca ttatgatggg 2340 tgtctcaatg ctggattctt cttggtcatt tcgcctttca agcaagatgt ctccaagccc 2400 gacgcaaaaa ttagccagct ctctgacaga acgcgatcca atcagcttaa atctgcgctt 2460 cgaccattca attagagcat atagcgcaag agctcttaag tgcagatctg tcaaatctga 2520 agatttcgtt gaaagatcat caccatttga agttaagaag gagctggaaa tttgctttga 2580 tcttgtccat agattaggta gaggcattgt ttaccttggc agcgctagaa ttccgccgaa 2640 ccacagccat tacctgcagg cacaggaatt atcaagagaa gcggcaacgt tacttgactg 2700 cacaacgtgg tcaggcgctg gacctggcct tatggatgcg gtgacggaag gtgcccttga 2760 ggcggaaaag ccggtaggtg gcatcaaaat tgaaaaagaa gcgggcgagt ggacggcgtc 2820 aaaattccac ccgtatttac ctccgcaaaa ttatcataca tgtagatttt tctcagcgag 2880 aaaacatggc cttgtcgatg ccgtaattag aaataatgtt tcagaaaaaa cagctatcat 2940 tgcactgccg ggcggcattg gaacattaga tgagatgttc gaaatcctgg ctctgattca 3000 actggagaga attggctcag ctctgccggt gccttttatc gtaatgaact acgacgcctt 3060 ttattcaaaa ctgctggaat ttatcgagac atgtgaaaat ctgggaacag tttcaaaagg 3120 agaagtgtca gcactgtgga aagtgtgtaa taacaacttt gaggccctga catatctggc 3180 ggaattttat gacctgcctg atggatcagc aaaactggag acagaactga gaaaaacaac 3240 acctacaaga ggataaatta attctagaaa ttaagaagga gggattcgtc atgttggtat 3300 tccaaatgcg ttatgtagat aaaacatcta ctgttttgaa acagactaaa aacagtgatt 3360 acgcagataa ataaatacgt tagattaatt cctaccagtg actaatctta tgacttttta 3420 aacagataac taaaattaca aacaaatcgt ttaacttctg tatttgttta tagatgtaat 3480 cacttcagga gtgattacat gaacaaaaat ataaaatatt ctcaaaactt tttaacgagt 3540 gaaaaagtac tcaaccaaat aataaaacaa ttgaatttaa aagaaaccga taccgtttac 3600 gaaattggaa caggtaaagg gcatttaacg acgaaactgg ctaaaataag taaacaggta 3660 acgtctattg aattagacag tcatctattc aacttatcgt cagaaaaatt aaaactgaac 3720 attcgtgtca ctttaattca ccaagatatt ctacagtttc aattccctaa caaacagagg 3780 tataaaattg ttgggaatat tccttaccat ttaagcacac aaattattaa aaaagtggtt 3840 tttgaaagcc atgcgtctga catctatctg attgttgaag aaggattcta caagcgtacc 3900 ttggatattc accgaacact agggttgctc ttgcacactc aagtctcgat tcagcaattg 3960 cttaagctgc cagcggaatg ctttcatcct aaaccaaaag taaacagtgt cttaataaaa 4020 cttacccgcc ataccacaga tgttccagat aaatattgga agctatatac gtactttgtt 4080 tcaaaatggg tcaatcgaga atatcgtcaa ctgtttacta aaaatcagtt tcatcaagca 4140 atgaaacacg ccaaagtaaa caatttaagt accgttactt atgagcaagt attgtctatt 4200 tttaatagtt atctattatt taacgggagg aaataattct atgagtcgct tttgtaaatt 4260 tggaaagtta cacgttacta aagggaatgt agatggatcc tgtatgccaa tgatgatgaa 4320 gagtcgacat ggatgagcga tgatgatatc cgtttaggct gggcggtgat agcttctcgt 4380 tcaggcagta cgcctctttt cttttccaga cctgagggag gcggaaatgg tgtgaggttc 4440 ccggggaaaa gccaaatagg cgatcgcggg agtgctttat ttgaagatca ggctatcact 4500 gcggtcaata gatttcacaa tgtgatggct ggacagcctg aggaactctc gaacccgaat 4560 ggaaacaacc agatatttat gaatcagcgc ggctcacatg gcgttgtgct ggcaaatgca 4620 ggttcatcct ctgtctctat caatacggca acaaaattgc ctgatggcag gtatgacaat 4680 aaagctggag cgggttcatt tcaagtgaac gatggtaaac tgacaggcac gatcaatgcc 4740 aggtctgtag ctgtgcttta tcctgatgat attgcaaaag cgcctcatgt tttccttgag 4800 aattacaaaa caggtgtaac acattctttc aatgatcaac tgacgattac cttgcgtgca 4860 gatgcgaata caacaaaagc cgtttatcaa atcaataatg gaccagagac ggcgtttaag 4920 gatggagatc aattcacaat cggaaaagga gatccatttg gcaaaacata caccatcatg 4980 ttaaaaggaa cgaacagtga tggtgtaacg aggaccgaga aatacagttt tgttaaaaga 5040 gatccagcgt cggccaaaac catcggctat caaaatccga atcattggag ccaggtaaat 5100 gcttatatct ataaacatga tgggagccga gtaattgaat tgaccggatc ttggcctgga 5160 aaaccaatga ctaaaaatgc agacggaatt tacacgctga cgctgcctgc ggacacggat 5220 acaaccaacg caaaagtgat ttttaataat ggcagcgccc aagtgcccgg tcagaatcag 5280 cctggctttg attacgtgct aaatggttta tataatgact cgggcttaag cggttctctt 5340 ccccattg 5348 <210> 151 <211> 842 <212> DNA <213> Artificial Sequence <220> <223> Fragment IPT6_ Bsu <400> 151 cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatga 60 tcctgcatct tatttatggt ccgacgtgca gcggcaaaac ggacatggcc attcagattg 120 cgcaggagac aggatggcca gtagtagctc tggatagagt ccagtgttgt ccacaaattg 180 ctacaggctc tggccgcccg ctggagtctg agttacagag cacacgcaga atctatctgg 240 atagcagacc actgacagaa ggtattctgg atgcagaatc agcacataga cgcttaatct 300 tcgaagtcga ttggagaaag tctgaggacg gacttattct tgaaggaggc tcaatttctc 360 ttttaaactg tatggcaaaa tcacctttct ggagatcagg ctttcagtgg cacgttaaaa 420 gattaagact tggcgactca gatgcgtttc tgacaagagc aaagcaaaga gttgcagaaa 480 tgtttgcgat tcgcgaggat agaccgtcac ttttagaaga actggcagaa ctgtggaact 540 atcctgccgc gcgccctatc ttagaagaca ttgatggata cagatgcgcc atcagatttg 600 ctagaaaaca cgatctggcc atttcacaac tgcctaatat cgacgccgga agacatgttg 660 aactgattga agcgatcgcg aatgaatatc tggaacatgc tctgtctcaa gaaagagatt 720 ttccgcaatg gccggaagat ggcgctggtc aacctgtgtg cccggtgaca ctgacaagaa 780 ttagataaaa aagaggggag ggaaacatta atgacgacct ggctaacgag tctcgccgat 840 ct 842 <210> 152 <211> 827 <212> DNA <213> Artificial Sequence <220> <223> Frgament IPT7_Bsu <400> 152 cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgc 60 cggtcagact gtatctgatt tggggcgcta caacaacggg caagacagca caatctgtgg 120 cactggctag atcagcaggt gctcctgtaa tttcactgga cagagttcaa tgttgccatg 180 aactggccgt tggttctggc cgcccatcac cgagcgagct gctgggaacg agaagagaat 240 atttatgtga gcgcgaagtg tcaagaggag tggttagcgc cgccgaagcg aatcagctgc 300 tgctggataa agtggcgcgc tatgccacac aggaacgcgc gctgattctt gaaggaggat 360 cagtctcact gatcaacgct atgatcagag atgcgagatg gagcgaaaga ggcgaatgga 420 tcttaagaag aatcccggtt ccgggcagag ccgcatttat ggccgccgcg agaaaaagag 480 ttcgcgaaat gcttgacccg cctccaggcc aggcaggaat tttagatgag cttcaaggtc 540 tttggggcta tccgagaaat cacgccgtct tagaggatat tgacggctac agacagatta 600 ttagatacgc caatgcatta caggtcccta tctgcagaat cacatctatt gaccctaacg 660 ccaaagctct gcttattgag cgcattgcac aggaatactg ggaacatgct ttatggcaag 720 agcaagagtt cctgggcatt ccggcaagct ggatgagagc tgatgatgcg taaaaaagag 780 gggagggaaa cattaatgac gacctggcta acgagtctcg ccgatct 827 <210> 153 <211> 842 <212> DNA <213> Artificial Sequence <220> <223> Fragment IPT9_Bsu <400> 153 cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60 tattacatct tatttacgga cctacatgtt caggaaaaac agacatggcc attcaaattg 120 ctcaagaaac gggatggccg gttgtggcgt tagacagagt acagtgctgc ccacagattg 180 caacgggctc aggtagaccg ttagaatctg agttacaatc aacaagaaga atctatctgg 240 attcacgccc actgacagag ggcatcctgg acgcagagag cgcgcaccgc cgccttatct 300 ttgaagtcga ttggcgcaaa tctgaggagg gccttatcct tgaaggagga agcattagcc 360 tgcttaattg tatggcaaaa tcaccgtttt ggagatctgg cttccagtgg cacgtaaaga 420 gactgagact tggcgattca gacgcatttc tgacaagagc aaaacagaga gtcgcagaaa 480 tgttcgcgat tagagaagac agaccaagcc tgctggagga attagctgaa ctgtggaact 540 atccggctgc gcgccctatt ctggaggata ttgatggtta tcgctgtgcg attagatttg 600 ctagaaagca tgatctggct atttcacaac tgcctaatat cgatgcggga agacatgttg 660 aactgattga agccatcgcc aacgaatacc tggaacatgc cctgtcacag gaaagagatt 720 ttcctcaatg gccggaagat ggtgccggcc aaccggtttg cccggtgaca ctgacaagaa 780 ttagataaaa aagaggggag ggaaacatta atgacgacct ggctaacgag tctcgccgat 840 ct 842 <210> 154 <211> 2365 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT6 <400> 154 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgatcctgca tcttatttat ggtccgacgt gcagcggcaa 1620 aacggacatg gccattcaga ttgcgcagga gacaggatgg ccagtagtag ctctggatag 1680 agtccagtgt tgtccacaaa ttgctacagg ctctggccgc ccgctggagt ctgagttaca 1740 gagcacacgc agaatctatc tggatagcag accactgaca gaaggtattc tggatgcaga 1800 atcagcacat agacgcttaa tcttcgaagt cgattggaga aagtctgagg acggacttat 1860 tcttgaagga ggctcaattt ctcttttaaa ctgtatggca aaatcacctt tctggagatc 1920 aggctttcag tggcacgtta aaagattaag acttggcgac tcagatgcgt ttctgacaag 1980 agcaaagcaa agagttgcag aaatgtttgc gattcgcgag gatagaccgt cacttttaga 2040 agaactggca gaactgtgga actatcctgc cgcgcgccct atcttagaag acattgatgg 2100 atacagatgc gccatcagat ttgctagaaa acacgatctg gccatttcac aactgcctaa 2160 tatcgacgcc ggaagacatg ttgaactgat tgaagcgatc gcgaatgaat atctggaaca 2220 tgctctgtct caagaaagag attttccgca atggccggaa gatggcgctg gtcaacctgt 2280 gtgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttaatgacga 2340 cctggctaac gagtctcgcc gatct 2365 <210> 155 <211> 2350 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT7 <400> 155 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgccggtcag actgtatctg atttggggcg ctacaacaac 1620 gggcaagaca gcacaatctg tggcactggc tagatcagca ggtgctcctg taatttcact 1680 ggacagagtt caatgttgcc atgaactggc cgttggttct ggccgcccat caccgagcga 1740 gctgctggga acgagaagag aatatttatg tgagcgcgaa gtgtcaagag gagtggttag 1800 cgccgccgaa gcgaatcagc tgctgctgga taaagtggcg cgctatgcca cacaggaacg 1860 cgcgctgatt cttgaaggag gatcagtctc actgatcaac gctatgatca gagatgcgag 1920 atggagcgaa agaggcgaat ggatcttaag aagaatcccg gttccgggca gagccgcatt 1980 tatggccgcc gcgagaaaaa gagttcgcga aatgcttgac ccgcctccag gccaggcagg 2040 aattttagat gagcttcaag gtctttgggg ctatccgaga aatcacgccg tcttagagga 2100 tattgacggc tacagacaga ttattagata cgccaatgca ttacaggtcc ctatctgcag 2160 aatcacatct attgacccta acgccaaagc tctgcttatt gagcgcattg cacaggaata 2220 ctgggaacat gctttatggc aagagcaaga gttcctgggc attccggcaa gctggatgag 2280 agctgatgat gcgtaaaaaa gaggggaggg aaacattaat gacgacctgg ctaacgagtc 2340 tcgccgatct 2350 <210> 156 <211> 2365 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT9 <400> 156 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca tcttatttac ggacctacat gttcaggaaa 1620 aacagacatg gccattcaaa ttgctcaaga aacgggatgg ccggttgtgg cgttagacag 1680 agtacagtgc tgcccacaga ttgcaacggg ctcaggtaga ccgttagaat ctgagttaca 1740 atcaacaaga agaatctatc tggattcacg cccactgaca gagggcatcc tggacgcaga 1800 gagcgcgcac cgccgcctta tctttgaagt cgattggcgc aaatctgagg agggccttat 1860 ccttgaagga ggaagcatta gcctgcttaa ttgtatggca aaatcaccgt tttggagatc 1920 tggcttccag tggcacgtaa agagactgag acttggcgat tcagacgcat ttctgacaag 1980 agcaaaacag agagtcgcag aaatgttcgc gattagagaa gacagaccaa gcctgctgga 2040 ggaattagct gaactgtgga actatccggc tgcgcgccct attctggagg atattgatgg 2100 ttatcgctgt gcgattagat ttgctagaaa gcatgatctg gctatttcac aactgcctaa 2160 tatcgatgcg ggaagacatg ttgaactgat tgaagccatc gccaacgaat acctggaaca 2220 tgccctgtca caggaaagag attttcctca atggccggaa gatggtgccg gccaaccggt 2280 ttgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttaatgacga 2340 cctggctaac gagtctcgcc gatct 2365 <210> 157 <211> 3218 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT6 + LOG8 <400> 157 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgatcctgca tcttatttat ggtccgacgt gcagcggcaa 1620 aacggacatg gccattcaga ttgcgcagga gacaggatgg ccagtagtag ctctggatag 1680 agtccagtgt tgtccacaaa ttgctacagg ctctggccgc ccgctggagt ctgagttaca 1740 gagcacacgc agaatctatc tggatagcag accactgaca gaaggtattc tggatgcaga 1800 atcagcacat agacgcttaa tcttcgaagt cgattggaga aagtctgagg acggacttat 1860 tcttgaagga ggctcaattt ctcttttaaa ctgtatggca aaatcacctt tctggagatc 1920 aggctttcag tggcacgtta aaagattaag acttggcgac tcagatgcgt ttctgacaag 1980 agcaaagcaa agagttgcag aaatgtttgc gattcgcgag gatagaccgt cacttttaga 2040 agaactggca gaactgtgga actatcctgc cgcgcgccct atcttagaag acattgatgg 2100 atacagatgc gccatcagat ttgctagaaa acacgatctg gccatttcac aactgcctaa 2160 tatcgacgcc ggaagacatg ttgaactgat tgaagcgatc gcgaatgaat atctggaaca 2220 tgctctgtct caagaaagag attttccgca atggccggaa gatggcgctg gtcaacctgt 2280 gtgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttatgatggc 2340 ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400 aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460 atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520 gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580 taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640 gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700 cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760 cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820 ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880 cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940 aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000 agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060 gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120 aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagagtcga 3180 tccccgggtt cgccagcaat gactaccggc agcccgcc 3218 <210> 158 <211> 3203 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT7 + LOG8 <400> 158 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgccggtcag actgtatctg atttggggcg ctacaacaac 1620 gggcaagaca gcacaatctg tggcactggc tagatcagca ggtgctcctg taatttcact 1680 ggacagagtt caatgttgcc atgaactggc cgttggttct ggccgcccat caccgagcga 1740 gctgctggga acgagaagag aatatttatg tgagcgcgaa gtgtcaagag gagtggttag 1800 cgccgccgaa gcgaatcagc tgctgctgga taaagtggcg cgctatgcca cacaggaacg 1860 cgcgctgatt cttgaaggag gatcagtctc actgatcaac gctatgatca gagatgcgag 1920 atggagcgaa agaggcgaat ggatcttaag aagaatcccg gttccgggca gagccgcatt 1980 tatggccgcc gcgagaaaaa gagttcgcga aatgcttgac ccgcctccag gccaggcagg 2040 aattttagat gagcttcaag gtctttgggg ctatccgaga aatcacgccg tcttagagga 2100 tattgacggc tacagacaga ttattagata cgccaatgca ttacaggtcc ctatctgcag 2160 aatcacatct attgacccta acgccaaagc tctgcttatt gagcgcattg cacaggaata 2220 ctgggaacat gctttatggc aagagcaaga gttcctgggc attccggcaa gctggatgag 2280 agctgatgat gcgtaaaaaa gaggggaggg aaacattatg atggcccctc ttcgctcaaa 2340 caaagatggc aaacctagag ttcctagaac gacggaaagc gccgaaacga atagaatgtt 2400 aagaggtccg atgttactga gaacagacgg aaatcagacg tcaacatacg atcaaagact 2460 tttagagtca ggcgcagatc acgcttggaa gcatgcagat ccgtggcgcg ttctgagaat 2520 ccagggagag ttcgtggcag gatttgatgc tctgagcgat ctgcctaagg cggttacggt 2580 atacggctca gccagaacaa aagaggacac accggaatat gcacagggca tcgatttagg 2640 tgcaaaatta gttgagcatg actacgctgt tgtgacaggc ggtggcccag gcatcatgga 2700 ggcggcgaat agaggcgcct atgaagctgg aggtctttct gtgggcctgg gcattgaact 2760 tccgtttgaa caaggtttaa acaaatatgt agatcttgga attaacttta gatacttttt 2820 cgcgagaaag acaatgttcc tgaaatattc acaggcgttt gtgtgcctgc cgggcggtat 2880 gggaacaatg gatgagctgt ttgaaatgct gtgtatggtg caaacaggaa aagtgacaaa 2940 ctatccgatt gtactgatcg gcacagaata ttggagcggc ctggtagaat ggatggctaa 3000 tacactggtc gccgaaggct acatcaatcc acaagatatg gatctgttcc tgctgacaga 3060 cagcgtcgac gaagccgtcg aacatattgt cgcggctcat aaagaaatga cagacgaaag 3120 agtctcaaga ctgaatcacg acgcataaat taattctaga gtcgatcccc gggttcgcca 3180 gcaatgacta ccggcagccc gcc 3203 <210> 159 <211> 3218 <212> DNA <213> Artificial Sequence <220> <223> operon AmyE 0 + IPT9 + LOG8 <400> 159 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca tcttatttac ggacctacat gttcaggaaa 1620 aacagacatg gccattcaaa ttgctcaaga aacgggatgg ccggttgtgg cgttagacag 1680 agtacagtgc tgcccacaga ttgcaacggg ctcaggtaga ccgttagaat ctgagttaca 1740 atcaacaaga agaatctatc tggattcacg cccactgaca gagggcatcc tggacgcaga 1800 gagcgcgcac cgccgcctta tctttgaagt cgattggcgc aaatctgagg agggccttat 1860 ccttgaagga ggaagcatta gcctgcttaa ttgtatggca aaatcaccgt tttggagatc 1920 tggcttccag tggcacgtaa agagactgag acttggcgat tcagacgcat ttctgacaag 1980 agcaaaacag agagtcgcag aaatgttcgc gattagagaa gacagaccaa gcctgctgga 2040 ggaattagct gaactgtgga actatccggc tgcgcgccct attctggagg atattgatgg 2100 ttatcgctgt gcgattagat ttgctagaaa gcatgatctg gctatttcac aactgcctaa 2160 tatcgatgcg ggaagacatg ttgaactgat tgaagccatc gccaacgaat acctggaaca 2220 tgccctgtca caggaaagag attttcctca atggccggaa gatggtgccg gccaaccggt 2280 ttgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttatgatggc 2340 ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400 aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460 atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520 gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580 taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640 gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700 cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760 cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820 ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880 cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940 aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000 agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060 gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120 aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagagtcga 3180 tccccgggtt cgccagcaat gactaccggc agcccgcc 3218 <210> 160 <211> 5255 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT6 LOG8 EryR AmyE END operon <400> 160 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgatcctgca tcttatttat ggtccgacgt gcagcggcaa 1620 aacggacatg gccattcaga ttgcgcagga gacaggatgg ccagtagtag ctctggatag 1680 agtccagtgt tgtccacaaa ttgctacagg ctctggccgc ccgctggagt ctgagttaca 1740 gagcacacgc agaatctatc tggatagcag accactgaca gaaggtattc tggatgcaga 1800 atcagcacat agacgcttaa tcttcgaagt cgattggaga aagtctgagg acggacttat 1860 tcttgaagga ggctcaattt ctcttttaaa ctgtatggca aaatcacctt tctggagatc 1920 aggctttcag tggcacgtta aaagattaag acttggcgac tcagatgcgt ttctgacaag 1980 agcaaagcaa agagttgcag aaatgtttgc gattcgcgag gatagaccgt cacttttaga 2040 agaactggca gaactgtgga actatcctgc cgcgcgccct atcttagaag acattgatgg 2100 atacagatgc gccatcagat ttgctagaaa acacgatctg gccatttcac aactgcctaa 2160 tatcgacgcc ggaagacatg ttgaactgat tgaagcgatc gcgaatgaat atctggaaca 2220 tgctctgtct caagaaagag attttccgca atggccggaa gatggcgctg gtcaacctgt 2280 gtgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttatgatggc 2340 ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400 aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460 atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520 gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580 taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640 gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700 cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760 cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820 ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880 cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940 aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000 agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060 gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120 aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagaaatta 3180 agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3240 ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3300 accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3360 acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3420 aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3480 aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3540 aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3600 ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3660 cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3720 agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3780 gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3840 cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3900 ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3960 tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 4020 tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 4080 gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 4140 taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 4200 tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4260 ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4320 gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4380 gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4440 cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4500 tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4560 aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4620 ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4680 gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4740 gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4800 aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4860 ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4920 accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4980 aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 5040 attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 5100 acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 5160 agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 5220 aatgactcgg gcttaagcgg ttctcttccc cattg 5255 <210> 161 <211> 5240 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT7 LOG8 EryR AmyE END operon <400> 161 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgccggtcag actgtatctg atttggggcg ctacaacaac 1620 gggcaagaca gcacaatctg tggcactggc tagatcagca ggtgctcctg taatttcact 1680 ggacagagtt caatgttgcc atgaactggc cgttggttct ggccgcccat caccgagcga 1740 gctgctggga acgagaagag aatatttatg tgagcgcgaa gtgtcaagag gagtggttag 1800 cgccgccgaa gcgaatcagc tgctgctgga taaagtggcg cgctatgcca cacaggaacg 1860 cgcgctgatt cttgaaggag gatcagtctc actgatcaac gctatgatca gagatgcgag 1920 atggagcgaa agaggcgaat ggatcttaag aagaatcccg gttccgggca gagccgcatt 1980 tatggccgcc gcgagaaaaa gagttcgcga aatgcttgac ccgcctccag gccaggcagg 2040 aattttagat gagcttcaag gtctttgggg ctatccgaga aatcacgccg tcttagagga 2100 tattgacggc tacagacaga ttattagata cgccaatgca ttacaggtcc ctatctgcag 2160 aatcacatct attgacccta acgccaaagc tctgcttatt gagcgcattg cacaggaata 2220 ctgggaacat gctttatggc aagagcaaga gttcctgggc attccggcaa gctggatgag 2280 agctgatgat gcgtaaaaaa gaggggaggg aaacattatg atggcccctc ttcgctcaaa 2340 caaagatggc aaacctagag ttcctagaac gacggaaagc gccgaaacga atagaatgtt 2400 aagaggtccg atgttactga gaacagacgg aaatcagacg tcaacatacg atcaaagact 2460 tttagagtca ggcgcagatc acgcttggaa gcatgcagat ccgtggcgcg ttctgagaat 2520 ccagggagag ttcgtggcag gatttgatgc tctgagcgat ctgcctaagg cggttacggt 2580 atacggctca gccagaacaa aagaggacac accggaatat gcacagggca tcgatttagg 2640 tgcaaaatta gttgagcatg actacgctgt tgtgacaggc ggtggcccag gcatcatgga 2700 ggcggcgaat agaggcgcct atgaagctgg aggtctttct gtgggcctgg gcattgaact 2760 tccgtttgaa caaggtttaa acaaatatgt agatcttgga attaacttta gatacttttt 2820 cgcgagaaag acaatgttcc tgaaatattc acaggcgttt gtgtgcctgc cgggcggtat 2880 gggaacaatg gatgagctgt ttgaaatgct gtgtatggtg caaacaggaa aagtgacaaa 2940 ctatccgatt gtactgatcg gcacagaata ttggagcggc ctggtagaat ggatggctaa 3000 tacactggtc gccgaaggct acatcaatcc acaagatatg gatctgttcc tgctgacaga 3060 cagcgtcgac gaagccgtcg aacatattgt cgcggctcat aaagaaatga cagacgaaag 3120 agtctcaaga ctgaatcacg acgcataaat taattctaga aattaagaag gagggattcg 3180 tcatgttggt attccaaatg cgttatgtag ataaaacatc tactgttttg aaacagacta 3240 aaaacagtga ttacgcagat aaataaatac gttagattaa ttcctaccag tgactaatct 3300 tatgactttt taaacagata actaaaatta caaacaaatc gtttaacttc tgtatttgtt 3360 tatagatgta atcacttcag gagtgattac atgaacaaaa atataaaata ttctcaaaac 3420 tttttaacga gtgaaaaagt actcaaccaa ataataaaac aattgaattt aaaagaaacc 3480 gataccgttt acgaaattgg aacaggtaaa gggcatttaa cgacgaaact ggctaaaata 3540 agtaaacagg taacgtctat tgaattagac agtcatctat tcaacttatc gtcagaaaaa 3600 ttaaaactga acattcgtgt cactttaatt caccaagata ttctacagtt tcaattccct 3660 aacaaacaga ggtataaaat tgttgggaat attccttacc atttaagcac acaaattatt 3720 aaaaaagtgg tttttgaaag ccatgcgtct gacatctatc tgattgttga agaaggattc 3780 tacaagcgta ccttggatat tcaccgaaca ctagggttgc tcttgcacac tcaagtctcg 3840 attcagcaat tgcttaagct gccagcggaa tgctttcatc ctaaaccaaa agtaaacagt 3900 gtcttaataa aacttacccg ccataccaca gatgttccag ataaatattg gaagctatat 3960 acgtactttg tttcaaaatg ggtcaatcga gaatatcgtc aactgtttac taaaaatcag 4020 tttcatcaag caatgaaaca cgccaaagta aacaatttaa gtaccgttac ttatgagcaa 4080 gtattgtcta tttttaatag ttatctatta tttaacggga ggaaataatt ctatgagtcg 4140 cttttgtaaa tttggaaagt tacacgttac taaagggaat gtagatggat cctgtatgcc 4200 aatgatgatg aagagtcgac atggatgagc gatgatgata tccgtttagg ctgggcggtg 4260 atagcttctc gttcaggcag tacgcctctt ttcttttcca gacctgaggg aggcggaaat 4320 ggtgtgaggt tcccggggaa aagccaaata ggcgatcgcg ggagtgcttt atttgaagat 4380 caggctatca ctgcggtcaa tagatttcac aatgtgatgg ctggacagcc tgaggaactc 4440 tcgaacccga atggaaacaa ccagatattt atgaatcagc gcggctcaca tggcgttgtg 4500 ctggcaaatg caggttcatc ctctgtctct atcaatacgg caacaaaatt gcctgatggc 4560 aggtatgaca ataaagctgg agcgggttca tttcaagtga acgatggtaa actgacaggc 4620 acgatcaatg ccaggtctgt agctgtgctt tatcctgatg atattgcaaa agcgcctcat 4680 gttttccttg agaattacaa aacaggtgta acacattctt tcaatgatca actgacgatt 4740 accttgcgtg cagatgcgaa tacaacaaaa gccgtttatc aaatcaataa tggaccagag 4800 acggcgttta aggatggaga tcaattcaca atcggaaaag gagatccatt tggcaaaaca 4860 tacaccatca tgttaaaagg aacgaacagt gatggtgtaa cgaggaccga gaaatacagt 4920 tttgttaaaa gagatccagc gtcggccaaa accatcggct atcaaaatcc gaatcattgg 4980 agccaggtaa atgcttatat ctataaacat gatgggagcc gagtaattga attgaccgga 5040 tcttggcctg gaaaaccaat gactaaaaat gcagacggaa tttacacgct gacgctgcct 5100 gcggacacgg atacaaccaa cgcaaaagtg atttttaata atggcagcgc ccaagtgccc 5160 ggtcagaatc agcctggctt tgattacgtg ctaaatggtt tatataatga ctcgggctta 5220 agcggttctc ttccccattg 5240 <210> 162 <211> 5255 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE 0 IPT9 LOG8 EryR AmyE END operon <400> 162 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca tcttatttac ggacctacat gttcaggaaa 1620 aacagacatg gccattcaaa ttgctcaaga aacgggatgg ccggttgtgg cgttagacag 1680 agtacagtgc tgcccacaga ttgcaacggg ctcaggtaga ccgttagaat ctgagttaca 1740 atcaacaaga agaatctatc tggattcacg cccactgaca gagggcatcc tggacgcaga 1800 gagcgcgcac cgccgcctta tctttgaagt cgattggcgc aaatctgagg agggccttat 1860 ccttgaagga ggaagcatta gcctgcttaa ttgtatggca aaatcaccgt tttggagatc 1920 tggcttccag tggcacgtaa agagactgag acttggcgat tcagacgcat ttctgacaag 1980 agcaaaacag agagtcgcag aaatgttcgc gattagagaa gacagaccaa gcctgctgga 2040 ggaattagct gaactgtgga actatccggc tgcgcgccct attctggagg atattgatgg 2100 ttatcgctgt gcgattagat ttgctagaaa gcatgatctg gctatttcac aactgcctaa 2160 tatcgatgcg ggaagacatg ttgaactgat tgaagccatc gccaacgaat acctggaaca 2220 tgccctgtca caggaaagag attttcctca atggccggaa gatggtgccg gccaaccggt 2280 ttgcccggtg acactgacaa gaattagata aaaaagaggg gagggaaaca ttatgatggc 2340 ccctcttcgc tcaaacaaag atggcaaacc tagagttcct agaacgacgg aaagcgccga 2400 aacgaataga atgttaagag gtccgatgtt actgagaaca gacggaaatc agacgtcaac 2460 atacgatcaa agacttttag agtcaggcgc agatcacgct tggaagcatg cagatccgtg 2520 gcgcgttctg agaatccagg gagagttcgt ggcaggattt gatgctctga gcgatctgcc 2580 taaggcggtt acggtatacg gctcagccag aacaaaagag gacacaccgg aatatgcaca 2640 gggcatcgat ttaggtgcaa aattagttga gcatgactac gctgttgtga caggcggtgg 2700 cccaggcatc atggaggcgg cgaatagagg cgcctatgaa gctggaggtc tttctgtggg 2760 cctgggcatt gaacttccgt ttgaacaagg tttaaacaaa tatgtagatc ttggaattaa 2820 ctttagatac tttttcgcga gaaagacaat gttcctgaaa tattcacagg cgtttgtgtg 2880 cctgccgggc ggtatgggaa caatggatga gctgtttgaa atgctgtgta tggtgcaaac 2940 aggaaaagtg acaaactatc cgattgtact gatcggcaca gaatattgga gcggcctggt 3000 agaatggatg gctaatacac tggtcgccga aggctacatc aatccacaag atatggatct 3060 gttcctgctg acagacagcg tcgacgaagc cgtcgaacat attgtcgcgg ctcataaaga 3120 aatgacagac gaaagagtct caagactgaa tcacgacgca taaattaatt ctagaaatta 3180 agaaggaggg attcgtcatg ttggtattcc aaatgcgtta tgtagataaa acatctactg 3240 ttttgaaaca gactaaaaac agtgattacg cagataaata aatacgttag attaattcct 3300 accagtgact aatcttatga ctttttaaac agataactaa aattacaaac aaatcgttta 3360 acttctgtat ttgtttatag atgtaatcac ttcaggagtg attacatgaa caaaaatata 3420 aaatattctc aaaacttttt aacgagtgaa aaagtactca accaaataat aaaacaattg 3480 aatttaaaag aaaccgatac cgtttacgaa attggaacag gtaaagggca tttaacgacg 3540 aaactggcta aaataagtaa acaggtaacg tctattgaat tagacagtca tctattcaac 3600 ttatcgtcag aaaaattaaa actgaacatt cgtgtcactt taattcacca agatattcta 3660 cagtttcaat tccctaacaa acagaggtat aaaattgttg ggaatattcc ttaccattta 3720 agcacacaaa ttattaaaaa agtggttttt gaaagccatg cgtctgacat ctatctgatt 3780 gttgaagaag gattctacaa gcgtaccttg gatattcacc gaacactagg gttgctcttg 3840 cacactcaag tctcgattca gcaattgctt aagctgccag cggaatgctt tcatcctaaa 3900 ccaaaagtaa acagtgtctt aataaaactt acccgccata ccacagatgt tccagataaa 3960 tattggaagc tatatacgta ctttgtttca aaatgggtca atcgagaata tcgtcaactg 4020 tttactaaaa atcagtttca tcaagcaatg aaacacgcca aagtaaacaa tttaagtacc 4080 gttacttatg agcaagtatt gtctattttt aatagttatc tattatttaa cgggaggaaa 4140 taattctatg agtcgctttt gtaaatttgg aaagttacac gttactaaag ggaatgtaga 4200 tggatcctgt atgccaatga tgatgaagag tcgacatgga tgagcgatga tgatatccgt 4260 ttaggctggg cggtgatagc ttctcgttca ggcagtacgc ctcttttctt ttccagacct 4320 gagggaggcg gaaatggtgt gaggttcccg gggaaaagcc aaataggcga tcgcgggagt 4380 gctttatttg aagatcaggc tatcactgcg gtcaatagat ttcacaatgt gatggctgga 4440 cagcctgagg aactctcgaa cccgaatgga aacaaccaga tatttatgaa tcagcgcggc 4500 tcacatggcg ttgtgctggc aaatgcaggt tcatcctctg tctctatcaa tacggcaaca 4560 aaattgcctg atggcaggta tgacaataaa gctggagcgg gttcatttca agtgaacgat 4620 ggtaaactga caggcacgat caatgccagg tctgtagctg tgctttatcc tgatgatatt 4680 gcaaaagcgc ctcatgtttt ccttgagaat tacaaaacag gtgtaacaca ttctttcaat 4740 gatcaactga cgattacctt gcgtgcagat gcgaatacaa caaaagccgt ttatcaaatc 4800 aataatggac cagagacggc gtttaaggat ggagatcaat tcacaatcgg aaaaggagat 4860 ccatttggca aaacatacac catcatgtta aaaggaacga acagtgatgg tgtaacgagg 4920 accgagaaat acagttttgt taaaagagat ccagcgtcgg ccaaaaccat cggctatcaa 4980 aatccgaatc attggagcca ggtaaatgct tatatctata aacatgatgg gagccgagta 5040 attgaattga ccggatcttg gcctggaaaa ccaatgacta aaaatgcaga cggaatttac 5100 acgctgacgc tgcctgcgga cacggataca accaacgcaa aagtgatttt taataatggc 5160 agcgcccaag tgcccggtca gaatcagcct ggctttgatt acgtgctaaa tggtttatat 5220 aatgactcgg gcttaagcgg ttctcttccc cattg 5255 <210> 163 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer ipt1_RBS_F (pBBR1) <400> 163 tttaagaagg agatatacat atgttattac acctgatcta cggtc 45 <210> 164 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> primer ipt1_RBS_R(pBBR1) <400> 164 tcatatgtat atctccttct tttaacggat tctcgttaag gtaaccgg 48 <210> 165 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> primer log1_RBS_F(pBBR1) <400> 165 taaaagaagg agatatacat atgacatcgc tttttgacgc gc 42 <210> 166 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer log1_RBS_R(pBBR1) <400> 166 ccttactcga gtttggatcc ttaccatttt ggggctggag 40 <210> 167 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer BB_pBBR1_F <400> 167 ggatccaaac tcgagtaagg 20 <210> 168 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer BB_pBBR1_R <400> 168 atgtatatct ccttcttaaa gttaaac 27 <210> 169 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> primer dxs_F(p15A) <400> 169 acaataataa tggagtcatg aacatatgga cttgttgtcc attcaagacc 50 <210> 170 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> primer dxs_R (p15A) <400> 170 gaaggtgagc cagtgtgact ctagtttatg agccgatgcc cttatgtgtc 50 <210> 171 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer BB_15a_R <400> 171 atgttcatga ctccattatt attgtac 27 <210> 172 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer BB_p15a_F <400> 172 actagagtca cactggctca ccttc 25 <210> 173 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> primer for IPT1 LOG1 amplification <400> 173 atggaattcg agctcggtac ccggggaaag gaggcccttc agatgttatt acacctgatc 60 tacggtc 67 <210> 174 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> primer for IPT1 LOG1 amplification <400> 174 gcatgcctgc aggtcgactc tagaggatct taccattttg gggctggag 49 <210> 175 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> atggaattcgagctcggtacccggggaAAGGAGGCCCTTCAGATGGACTTGTTGTCCATTCAAGA CC <400> 175 atggaattcg agctcggtac ccggggaaag gaggcccttc agatggactt gttgtccatt 60 caagacc 67 <210> 176 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> primer for dxs amplification <400> 176 gcatgcctgc aggtcgactc tagaggatct tatgagccga tgcccttatg tgtc 54 <210> 177 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> primer for IPT1 amplification <400> 177 gcatgcctgc aggtcgactc tagaggatct taacggattc tcgttaaggt aaccgg 56 <210> 178 <211> 1415 <212> DNA <213> Artificial Sequence <220> <223> IPT1-LOG1 Coryneb. <400> 178 atggaattcg agctcggtac ccggggaaag gaggcccttc agatgttatt acacctgatc 60 tacggtccta catgtagtgg taaaactgat atggctatac aaatcgcgca agaaacaggt 120 tggcccgtcg ttgctcttga tcgtgtgcag tgctgtccac agattgcgac aggatccggc 180 agacctctgg aaagcgagtt acaatctacc cggcggattt atttagactc acgccctttg 240 acagaaggca ttcttgacgc ggaatccgct catcgccgtc ttatattcga ggtagattgg 300 aggaaatcgg aagaaggctt aatcctcgaa ggagggtcca tctcgcttct aaattgtatg 360 gctaagtctc cattttggag atctggattc cagtggcacg tcaagcgcct gagacttggg 420 gattcagatg cgtttctgac gcgagcaaaa cagcgtgtgg ctgagatgtt tgctattaga 480 gaagatcggc caagtttatt ggaggagctc gccgagctgt ggaattaccc ggcagctcgc 540 ccgattttgg aagacattga cggctatcga tgtgccatta gatttgcaag gaaacacgat 600 ctcgccatat cacagctgcc gaacatcgat gccggccggc atgttgaact gatcgaagcc 660 attgcaaacg aatatcttga acatgcgcta agccaagaac gcgactttcc tcaatggccg 720 gaggacggcg caggacaacc agtatgcccg gttaccttaa cgagaatccg ttaaaaaaga 780 ggggagggaa acattatgat gacatcgctt tttgacgcgc ctacgcttca acgcgtaacg 840 gttttcactg ggagcgcctt gggctcctct agtctttata ctcaggctgc tcaaaccctg 900 gctaaaaccg cggtagaccg agggattgat ctggtttatg gcggtggaaa agtcggcctc 960 atgggtattg ttgctgatgc attccttgaa agcgggggtg aggcattcgg cgtgataaca 1020 gagtcactga tgaaaggaga attaggccat gagaaactga cggagttgga aatcgtgccc 1080 gacatgcata ttcgtaaaag gcggatggcg gaacttgggg atggattcat tgcgatgcct 1140 ggaggagccg gcaccctgga agaactgttt gaagtctgga catggcagca gttaggaatt 1200 catcaaaagc cggttgcact ctatgacgtc gatggcttct ggcaaccgtt attggaaatg 1260 ttggaacaaa tgacacagag aggatttatc aagagagatt tttttgaatg cctcatcgtc 1320 gaatcagatc cgcacgcatt attaaaggcc atgcagacat ggacacctcc agccccaaaa 1380 tggtaagatc ctctagagtc gacctgcagg catgc 1415 <210> 179 <211> 842 <212> DNA <213> Artificial Sequence <220> <223> Fragment IPT1 <400> 179 cgcagcatac gcagcgaaat cagcatcacc ggagaatccc aacgaagcca actagtatgt 60 tattacacct gatctacggt cctacatgta gtggtaaaac tgatatggct atacaaatcg 120 cgcaagaaac aggttggccc gtcgttgctc ttgatcgtgt gcagtgctgt ccacagattg 180 cgacaggatc cggcagacct ctggaaagcg agttacaatc tacccggcgg atttatttag 240 actcacgccc tttgacagaa ggcattcttg acgcggaatc cgctcatcgc cgtcttatat 300 tcgaggtaga ttggaggaaa tcggaagaag gcttaatcct cgaaggaggg tccatctcgc 360 ttctaaattg tatggctaag tctccatttt ggagatctgg attccagtgg cacgtcaagc 420 gcctgagact tggggattca gatgcgtttc tgacgcgagc aaaacagcgt gtggctgaga 480 tgtttgctat tagagaagat cggccaagtt tattggagga gctcgccgag ctgtggaatt 540 acccggcagc tcgcccgatt ttggaagaca ttgacggcta tcgatgtgcc attagatttg 600 caaggaaaca cgatctcgcc atatcacagc tgccgaacat cgatgccggc cggcatgttg 660 aactgatcga agccattgca aacgaatatc ttgaacatgc gctaagccaa gaacgcgact 720 ttcctcaatg gccggaggac ggcgcaggac aaccagtatg cccggttacc ttaacgagaa 780 tccgttgaaa aagaggggag ggaaacatta atgacgacct ggctaacgag tctcgccgat 840 ct 842 <210> 180 <211> 833 <212> DNA <213> Artificial Sequence <220> <223> IPT1 Coryneb. <400> 180 atggaattcg agctcggtac ccggggaaag gaggcccttc agatgttatt acacctgatc 60 tacggtccta catgtagtgg taaaactgat atggctatac aaatcgcgca agaaacaggt 120 tggcccgtcg ttgctcttga tcgtgtgcag tgctgtccac agattgcgac aggatccggc 180 agacctctgg aaagcgagtt acaatctacc cggcggattt atttagactc acgccctttg 240 acagaaggca ttcttgacgc ggaatccgct catcgccgtc ttatattcga ggtagattgg 300 aggaaatcgg aagaaggctt aatcctcgaa ggagggtcca tctcgcttct aaattgtatg 360 gctaagtctc cattttggag atctggattc cagtggcacg tcaagcgcct gagacttggg 420 gattcagatg cgtttctgac gcgagcaaaa cagcgtgtgg ctgagatgtt tgctattaga 480 gaagatcggc caagtttatt ggaggagctc gccgagctgt ggaattaccc ggcagctcgc 540 ccgattttgg aagacattga cggctatcga tgtgccatta gatttgcaag gaaacacgat 600 ctcgccatat cacagctgcc gaacatcgat gccggccggc atgttgaact gatcgaagcc 660 attgcaaacg aatatcttga acatgcgcta agccaagaac gcgactttcc tcaatggccg 720 gaggacggcg caggacaacc agtatgcccg gttaccttaa cgagaatccg ttaagatcct 780 ctagagtcga cctgcaggca tgccgagctc gaattcactg gccgtcgttt tac 833 <210> 181 <211> 1973 <212> DNA <213> Artificial Sequence <220> <223> DXS Coryneb. <400> 181 atggaattcg agctcggtac ccggggaaag gaggcccttc agatggactt gttgtccatt 60 caagacccgt ctttcctaaa gaatatgagc attgacgagc ttgaaaaatt gtccgatgag 120 atccgccaat ttctcatcac atctctatcg gcctcgggcg gacacattgg accgaatctg 180 ggggtcgtgg aactgacagt agccctccac aaggagttca actcacccaa agacaaattt 240 ctctgggacg tggggcacca aagctacgtt cataaattgc ttactggtcg tggcaaagag 300 ttcgccacat tgcgccagta caaaggactc tgcggattcc ctaaacgctc ggaatccgag 360 cacgatgtgt gggaaacagg tcattcttct acttctctca gcggcgccat gggaatggcc 420 gctgcacgag atattaaagg gactgatgag tacataatcc caataatagg tgacggcgct 480 ttaacaggag gaatggccct agaggccttg aaccacatag gggatgagaa gaaagatatg 540 atagtcattt tgaatgataa tgagatgtct attgctccca acgttggagc aatacatagc 600 atgttagggc ggttacgtac tgcaggaaag taccagtggg taaaagatga acttgaatac 660 ctcttcaaga agatacccgc tgtaggaggc aagcttgcag ccacggccga gagagtgaag 720 gattctctta aatatatgtt ggtttcaggg atgttctttg aagaattggg attcacgtac 780 cttggtccgg ttgacggcca ttcttaccac gagttaattg aaaatttaca atacgcgaaa 840 aaaacgaagg ggcctgttct gctgcacgtt attaccaaaa aaggaaaagg ttataaacct 900 gcggaaaccg atacaattgg cacgtggcac ggcaccgggc cttataaaat caacacgggg 960 gactttgtca agccgaaagc tgccgcgcct agttggtccg gcctggttag tgggacggta 1020 cagcgaatgg cccgggaaga tgggaggatt gtcgctatca caccggcaat gccagtaggt 1080 agcaagttag aaggttttgc gaaagaattt ccggatagga tgtttgacgt aggtattgct 1140 gagcagcatg cggcgacgat ggctgcggca atggcaatgc agggcatgaa gcctttttta 1200 gctatttatt caacatttct gcaaagagcg tatgaccaag tggtacatga catttgtcgg 1260 caaaatgcta atgtctttat tgggattgat cgcgcagggt tagtgggtgc agacggggaa 1320 acgcatcaag gagtgtttga catcgcgttt atgcgacata tcccaaatat ggtccttatg 1380 atgccaaaag acgaaaacga gggtcaacac atggtgcata cagctcttag ttatgacgaa 1440 ggacctatcg cgatgagatt tccgagaggg aatggattag gcgtcaaaat ggatgagcag 1500 cttaaaacaa ttccgattgg aacatgggaa gtcttacgtc caggaaatga cgcggttatc 1560 cttacatttg gcactaccat tgagatggcg attgaggcag cagaagaact ccagaaggag 1620 ggcctgtcag tccgtgttgt taatgcgaga tttattaaac cgattgacga aaagatgatg 1680 aaaagtatcc tgaaagaagg cctgccgata cttaccatcg aggaagctgt tctggaagga 1740 ggatttggct catcaatcct tgaatttgca catgatcagg gcgaatatca cacaccgatc 1800 gatcgaatgg gcatcccgga tcgatttatc gagcatggct ccgttacagc actgcttgaa 1860 gagatcggct taacgaaaca gcaggtggca aacagaatca ggttacttat gccgccgaag 1920 acacataagg gcatcggctc ataagatcct ctagagtcga cctgcaggca tgc 1973 <210> 182 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> primer ipt1_R(pBBR1) <400> 182 ccttactcga gtttggatcc ttaacggatt ctcgttaagg taaccgg 47 <210> 183 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer ipt1_R_XbaI <400> 183 atcattctag atcaacggat tctcgttaag gta 33 <210> 184 <211> 4397 <212> DNA <213> Artificial Sequence <220> <223> complete AmyE IPT1 EryR construct <400> 184 gcggtagtgg tgcttacgat gtacgacagg gggattcccc atacattctt cgcttggctg 60 aaaatgattc ttctttttat cgtctgcggc ggcgttctgt ttctgcttcg gtatgtgatt 120 gtgaagctgg cttacagaag agcggtaaaa gaagaaataa aaaagaaatc atcttttttg 180 tttggaaagc gagggaagcg ttcacagttt cgggcagctt tttttatagg aacattgatt 240 tgtattcact ctgccaagtt gttttgatag agtgattgtg ataattttaa atgtaagcgt 300 taacaaaatt ctccagtctt cacatcggtt tgaaaggagg aagcggaaga atgaagtaag 360 agggattttt gactccgaag taagtcttca aaaaatcaaa taaggagtgt caagaatgtt 420 tgcaaaacga ttcaaaacct ctttactgcc gttattcgct ggatttttat tgctgtttca 480 tttggttctg gcaggaccgg cggctgcgag tgctgaaacg gcgaacaaat cgaatgagct 540 tacagcaccg tcgatcaaaa gcggaaccat tcttcatgca tggaattggt cgttcaatac 600 gttaaaacac aatatgaagg atattcatga tgcaggatat acagccattc agacatctcc 660 gattaaccaa gtaaaggaag ggaatcaagg agataaaagc atgtcgaact ggtactggct 720 gtatcagccg acatcgtatc aaattggcaa ccgttactta ggtactgaac aagaatttaa 780 agaaatgtgt gcagccgctg aagaatatgg cataaaggtc attgttgacg cggtcatcaa 840 tcataccacc agtgattatg ccgcgatttc caatgaggtt aagagtattc caaactggac 900 acatggaaac acacaaatta aaaactggtc tgatcgatgg gatgtcacgc agaattcatt 960 gctcgggctg tatgactgga atacacaaaa tacacaagta cagtcctatc tgaaacggtt 1020 cttagacagg gcattgaatg acggggcaga cggttttcga tttgatgccg ccaaacatat 1080 agagcttcca gatgatggca gttacggcag tcaattttgg ccgaatatca caaatacatc 1140 tgcagagttc caatacggag aaatcctgca ggatagtgcc tccagagatg ctgcttatgc 1200 gaattatatg gatgtgacag cgtctaacta tgggcattcc ataaggtccg ctttaaagaa 1260 tcgtaatctg ggcgtgtcga atatctccca ctatgcatct gatgtgtctg cggacaagct 1320 agtgacatgg gtagagtcgc atgatacacg ggtgcgcatg atcgtatggt tcactgtcca 1380 ccaaccaaaa ctgtgctcag taccgccaat atttctccct tggggggtac aaagaggtgt 1440 ccctagaaga gatccacgct gtgtaaaaat tttacaaaaa ggtattgact ttccctacag 1500 ggtgtgtaat aatttaatta caggcggggg caaccccgct cagtacctag agcgtaaaag 1560 aggggaggga aacactagta tgttattaca cctgatctac ggtcctacat gtagtggtaa 1620 aactgatatg gctatacaaa tcgcgcaaga aacaggttgg cccgtcgttg ctcttgatcg 1680 tgtgcagtgc tgtccacaga ttgcgacagg atccggcaga cctctggaaa gcgagttaca 1740 atctacccgg cggatttatt tagactcacg ccctttgaca gaaggcattc ttgacgcgga 1800 atccgctcat cgccgtctta tattcgaggt agattggagg aaatcggaag aaggcttaat 1860 cctcgaagga gggtccatct cgcttctaaa ttgtatggct aagtctccat tttggagatc 1920 tggattccag tggcacgtca agcgcctgag acttggggat tcagatgcgt ttctgacgcg 1980 agcaaaacag cgtgtggctg agatgtttgc tattagagaa gatcggccaa gtttattgga 2040 ggagctcgcc gagctgtgga attacccggc agctcgcccg attttggaag acattgacgg 2100 ctatcgatgt gccattagat ttgcaaggaa acacgatctc gccatatcac agctgccgaa 2160 catcgatgcc ggccggcatg ttgaactgat cgaagccatt gcaaacgaat atcttgaaca 2220 tgcgctaagc caagaacgcg actttcctca atggccggag gacggcgcag gacaaccagt 2280 atgcccggtt accttaacga gaatccgtta atctagaaat taagaaggag ggattcgtca 2340 tgttggtatt ccaaatgcgt tatgtagata aaacatctac tgttttgaaa cagactaaaa 2400 acagtgatta cgcagataaa taaatacgtt agattaattc ctaccagtga ctaatcttat 2460 gactttttaa acagataact aaaattacaa acaaatcgtt taacttctgt atttgtttat 2520 agatgtaatc acttcaggag tgattacatg aacaaaaata taaaatattc tcaaaacttt 2580 ttaacgagtg aaaaagtact caaccaaata ataaaacaat tgaatttaaa agaaaccgat 2640 accgtttacg aaattggaac aggtaaaggg catttaacga cgaaactggc taaaataagt 2700 aaacaggtaa cgtctattga attagacagt catctattca acttatcgtc agaaaaatta 2760 aaactgaaca ttcgtgtcac tttaattcac caagatattc tacagtttca attccctaac 2820 aaacagaggt ataaaattgt tgggaatatt ccttaccatt taagcacaca aattattaaa 2880 aaagtggttt ttgaaagcca tgcgtctgac atctatctga ttgttgaaga aggattctac 2940 aagcgtacct tggatattca ccgaacacta gggttgctct tgcacactca agtctcgatt 3000 cagcaattgc ttaagctgcc agcggaatgc tttcatccta aaccaaaagt aaacagtgtc 3060 ttaataaaac ttacccgcca taccacagat gttccagata aatattggaa gctatatacg 3120 tactttgttt caaaatgggt caatcgagaa tatcgtcaac tgtttactaa aaatcagttt 3180 catcaagcaa tgaaacacgc caaagtaaac aatttaagta ccgttactta tgagcaagta 3240 ttgtctattt ttaatagtta tctattattt aacgggagga aataattcta tgagtcgctt 3300 ttgtaaattt ggaaagttac acgttactaa agggaatgta gatggatcct gtatgccaat 3360 gatgatgaag agtcgacatg gatgagcgat gatgatatcc gtttaggctg ggcggtgata 3420 gcttctcgtt caggcagtac gcctcttttc ttttccagac ctgagggagg cggaaatggt 3480 gtgaggttcc cggggaaaag ccaaataggc gatcgcggga gtgctttatt tgaagatcag 3540 gctatcactg cggtcaatag atttcacaat gtgatggctg gacagcctga ggaactctcg 3600 aacccgaatg gaaacaacca gatatttatg aatcagcgcg gctcacatgg cgttgtgctg 3660 gcaaatgcag gttcatcctc tgtctctatc aatacggcaa caaaattgcc tgatggcagg 3720 tatgacaata aagctggagc gggttcattt caagtgaacg atggtaaact gacaggcacg 3780 atcaatgcca ggtctgtagc tgtgctttat cctgatgata ttgcaaaagc gcctcatgtt 3840 ttccttgaga attacaaaac aggtgtaaca cattctttca atgatcaact gacgattacc 3900 ttgcgtgcag atgcgaatac aacaaaagcc gtttatcaaa tcaataatgg accagagacg 3960 gcgtttaagg atggagatca attcacaatc ggaaaaggag atccatttgg caaaacatac 4020 accatcatgt taaaaggaac gaacagtgat ggtgtaacga ggaccgagaa atacagtttt 4080 gttaaaagag atccagcgtc ggccaaaacc atcggctatc aaaatccgaa tcattggagc 4140 caggtaaatg cttatatcta taaacatgat gggagccgag taattgaatt gaccggatct 4200 tggcctggaa aaccaatgac taaaaatgca gacggaattt acacgctgac gctgcctgcg 4260 gacacggata caaccaacgc aaaagtgatt tttaataatg gcagcgccca agtgcccggt 4320 cagaatcagc ctggctttga ttacgtgcta aatggtttat ataatgactc gggcttaagc 4380 ggttctcttc cccattg 4397

Claims

아데닐레이트 아이소펜테닐 전이효소 활성이 있는 이종의 폴리펩타이드를 발현하는 그람-양성 세균.
제1항에 있어서, 상기 세균은 바실러스과(Bacillaceae) 및 코리네박테리움과(Corynebacteriaceae)로 이루어진 군으로부터 선택된 과(family)의 세균인, 그람-양성 세균.
제1항 또는 제2항에 있어서, 상기 세균은 바실러스과의 세균인, 그람-양성 세균.
제1항 또는 제2항에 있어서, 상기 세균은 코리네박테리움과의 세균인, 그람-양성 세균.
제1항 또는 제2항에 있어서, 상기 세균은 바실러스(Bacillus) 또는 코리네박테리움(Corynebacterium) 속의 세균인, 그람-양성 세균.
제1항 또는 제2항에 있어서, 상기 세균은 바실러스 속의 세균인, 그람-양성 세균.
제1항 또는 제2항에 있어서, 상기 세균은 코리네박테리움 속의 세균인, 그람-양성 세균.
제1항 또는 제2항에 있어서, 상기 세균은 바실러스 서브틸리스(Bacillus subtilis)인, 그람-양성 세균.
제1항 또는 제2항에 있어서, 상기 세균은 코리네박테리움 스테이셔니스(Corynebacterium stationis)인, 그람-양성 세균.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 33 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1 내지 10 중 임의의 하나의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 아데닐레이트 아이소펜테닐 전이효소 활성이 있는 폴리펩타이드는 i) 서열번호 1의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 1의 아미노산 서열과 적어도 약 50%, 예를 들어 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제1항 내지 제12항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 변형된, 그람-양성 세균.
제13항에 있어서, 상기 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 62 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제13항에 있어서, 상기 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34 내지 44 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제13항에 있어서, 상기 사이토키닌 리보사이드 5'-일인산 포스포리보하이드롤라제 활성이 있는 폴리펩타이드는 i) 서열번호 34의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 34의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제1항 내지 제16항 중 어느 한 항에 있어서, 상기 세균은 변형되지 않은 다른 동일한 세균과 비교하여 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 추가 변형된, 그람-양성 세균.
제17항에 있어서, 상기 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 70 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제17항에 있어서, 상기 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63 내지 65 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63 내지 65 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제17항에 있어서, 상기 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 63의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 63의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제17항에 있어서, 상기 1-데옥시-D-자일룰로스-5-인산 합성효소 활성이 있는 폴리펩타이드는 i) 서열번호 64의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 64의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
제1항 내지 제21항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소(예를 들어, 아데노신 일인산 생합성 경로에 관련된 적어도 하나의 효소)의 발현 및/또는 활성이 증가되도록 추가 변형된, 그람-양성 세균.
제22항에 있어서, 상기 퓨린 뉴클레오타이드 생합성 경로에 관련된 적어도 하나의 효소는 리보스-인산 다이포스포키나제 활성이 있는 효소, 아미도포스포리보실 전이효소 활성이 있는 효소, 포르밀테트라하이드로엽산 디포르밀라제 활성이 있는 효소, 아데닐로호박산 분해효소 활성이 있는 효소, 포스포리보실아미노이미다졸-카복사미드 포르밀 전이효소 활성이 있는 효소, 아데닐로호박산 합성효소 활성이 있는 효소 및 아데노신 키나제 활성이 있는 효소로 이루어진 군으로부터 선택된, 그람-양성 세균.
제1항 내지 제23항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 추가 변형된, 그람-양성 세균.
제24항에 있어서, 상기 퓨린 뉴클레오타이드 분해 경로에 관련된 적어도 하나의 내인성 효소는 퓨린 뉴클레오사이드 포스포릴라제 활성이 있는 효소 및 아데노신-포스포리보실 전이효소 활성이 있는 효소로 이루어진 군으로부터 선택된, 그람-양성 세균.
제1항 내지 제25항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소의 발현 및/또는 활성이 감소되도록 추가 변형된, 그람-양성 세균.
제26항에 있어서, 상기 구아노신 일인산 생합성 경로에 관련된 적어도 하나의 내인성 효소는 IMP 탈수소효소 활성이 있는 효소 및 GMP 합성효소 활성이 있는 효소로 이루어진 군으로부터 선택된, 그람-양성 세균.
제1항 내지 제27항 중 어느 한 항에 있어서, 변형되지 않은 다른 동일한 세균과 비교하여 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드의 단백질 발현이 증가되도록 추가 변형된, 그람-양성 세균.
제28항에 있어서, 상기 사이토크롬 P450 모노옥시게나제(CYP450) 활성이 있는 폴리펩타이드는 i) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열을 포함하는 폴리펩타이드; 및 ii) 서열번호 93 내지 95 중 임의의 하나의 아미노산 서열과 적어도 약 70%, 예를 들어 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 93%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드로 이루어진 군으로부터 선택된, 그람-양성 세균.
적합한 배양 배지에서 적합한 배양 조건 하에서 제1항 내지 제29항 중 어느 한 항에 따른 세균을 배양하는 단계를 포함하는, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.
제30항에 있어서, 상기 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 트랜스-제아틴(tZ), 트랜스-제아틴 리보사이드(tZR), N ⁶ -(D2-아이소펜테닐)아데닌(iP), N(6)-(다이메틸알릴)아데노신(iPR), 다이하이드로제아틴(DZ), 리보실 다이하이드로제아틴(DZR) 및 이들의 조합으로 이루어진 군으로부터 선택된, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.
제30항 또는 제31항에 있어서, 상기 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체는 각각 트랜스-제아틴(tZ) 및 트랜스-제아틴 리보사이드(tZR)인, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.
제30항에 있어서, 상기 방법은 트랜스-제아틴(tZ)을 생산하기 위한 방법인, 아이소프레노이드 사이토키닌 또는 이의 리보사이드 유도체를 생산하는 방법.